4 Minuter
Datacenter förändras sällan över en natt. Men när de gör det märker du surrandet. Racken blir tätare. Latensen sjunker. Kostnaderna omfördelas. Nvidia satsar på att det surrandet snart får ett nytt namn: Vera.
Nvidia säger att Vera levererar ungefär 1,8 gånger prestandan jämfört med ledande x86-chip. Det påståendet är rubriken. Hårdvaran bakom är samtalsämnet. Vera är CPU-delen av Vera Rubin-plattformen, som parar en ARM-baserad CPU med en Rubin-GPU för arbetsbelastningar som kräver enorm minnesbandbredd och nära CPU-GPU-samordning.
Varför Vera omformar tänkandet kring AI-servrar
Vera är byggd kring 88 Olympus-kärnor med Spatial Multithreading, vilket ger 176 trådar per sockel. Minne är inte en eftertanke: en enda CPU kan paras med upp till 1,5 terabyte LPDDR5X, vilket levererar ungefär 1,2 terabyte per sekund i bandbredd. För AI-inferens och agentmodeller som förbrukar kontext och vikter är den bandbredden måttet på överlevnad.

Tänk skala. Nvidia visade ett Vera CPU-rack som packar 256 CPU:er i ett enda chassi. Det motsvarar 22 528 kärnor och 45 056 trådar. Det är den typ av densitet molnleverantörer efterfrågar när de försöker flytta stora modeller från dyra GPU-enklaver och in i mer flexibla, CPU-framåtriktade arkitekturer.
Vera samarbetar också väl med Rubin-GPU:er. NVL72-konfigurationen parar 36 Vera-CPU:er med 72 Rubin-GPU:er, och Nvidia skryter med en NVLink-C2C-länk på 1,8 terabyte per sekund mellan dem. Poängen är inte att ersätta GPU:er utan att omarbeta värd-acceleratorrelationen så att data flyter snabbare och programvara stöter på färre flaskhalsar.
Användningsområdena är välkända men växande: agentbaserad AI, förstärkningsinlärning, tung analys och inferens i skala. Vera kan fungera som en fristående beräkningsnod för dessa uppgifter, eller som värd som håller Rubin-GPU:erna matade och synkroniserade.

Adoptionen är redan igång. Anthropic, OpenAI och SpaceXAI har förbundit sig till plattformen för sina modellarbetsbelastningar, och hyperscalers såsom ByteDance, CoreWeave och Oracle Cloud Infrastructure är med. På systemsidan kommer Dell, HP, Lenovo och Supermicro att erbjuda servrar baserade på Vera. Stora tillverkare inklusive Asus, Compal, Foxconn, Gigabyte, Pegatron, Quanta Cloud Technology, Wistron och Wiwynn kommer att producera hårdvara byggd kring chippet.
Även icke-traditionella kunder noterar det. New York Stock Exchange, som bearbetar ungefär 1,1 biljoner meddelanden per dag, utforskar Vera tillsammans med partnerna Redpanda och HP för att ompröva latenskänslig infrastruktur. Ett sådant intresse visar att plattformen utvärderas för mer än bara modellträning - den ses för realtids- och höggenomströmningstillämpningar där varje mikrosekund räknas.
För Nvidia förlänger Vera en välkänd spelplan: ta lärdomar från GPU-först AI-distributioner och tillämpa dem på CPU-design. Företaget har tidigare integrerat sitt AI-arbete i produkter som RTX Spark, som lyfte fram Grace-CPU:er och Blackwell-GPU:er med LPDDR5X-minne. Nu har samtalet skiftat från enskild nod-GPU-prestanda till systembalans och genomströmning.
Kommer Vera att slå ut x86 i datacentret? Inte över en natt. Men arkitekturen riktar sig mot specifika problem för AI-arbetsbelastningar: minnesbandbredd, trådtäthet och snabb CPU-GPU-länk. För ingenjörer och arkitekter som brottas med modellkostnader och genomströmning är det en praktisk början.
Källa: gsmarena
Lämna en kommentar