Nvidia Vera omformar AI-servrar med hög minnesbandbredd

4 Minuter

Datacenter förändras sällan över en natt. Men när de gör det märker du surrandet. Racken blir tätare. Latensen sjunker. Kostnaderna omfördelas. Nvidia satsar på att det surrandet snart får ett nytt namn: Vera.

Nvidia säger att Vera levererar ungefär 1,8 gånger prestandan jämfört med ledande x86-chip. Det påståendet är rubriken. Hårdvaran bakom är samtalsämnet. Vera är CPU-delen av Vera Rubin-plattformen, som parar en ARM-baserad CPU med en Rubin-GPU för arbetsbelastningar som kräver enorm minnesbandbredd och nära CPU-GPU-samordning.

Varför Vera omformar tänkandet kring AI-servrar

Vera är byggd kring 88 Olympus-kärnor med Spatial Multithreading, vilket ger 176 trådar per sockel. Minne är inte en eftertanke: en enda CPU kan paras med upp till 1,5 terabyte LPDDR5X, vilket levererar ungefär 1,2 terabyte per sekund i bandbredd. För AI-inferens och agentmodeller som förbrukar kontext och vikter är den bandbredden måttet på överlevnad.

Tänk skala. Nvidia visade ett Vera CPU-rack som packar 256 CPU:er i ett enda chassi. Det motsvarar 22 528 kärnor och 45 056 trådar. Det är den typ av densitet molnleverantörer efterfrågar när de försöker flytta stora modeller från dyra GPU-enklaver och in i mer flexibla, CPU-framåtriktade arkitekturer.

Vera samarbetar också väl med Rubin-GPU:er. NVL72-konfigurationen parar 36 Vera-CPU:er med 72 Rubin-GPU:er, och Nvidia skryter med en NVLink-C2C-länk på 1,8 terabyte per sekund mellan dem. Poängen är inte att ersätta GPU:er utan att omarbeta värd-acceleratorrelationen så att data flyter snabbare och programvara stöter på färre flaskhalsar.

Användningsområdena är välkända men växande: agentbaserad AI, förstärkningsinlärning, tung analys och inferens i skala. Vera kan fungera som en fristående beräkningsnod för dessa uppgifter, eller som värd som håller Rubin-GPU:erna matade och synkroniserade.

Adoptionen är redan igång. Anthropic, OpenAI och SpaceXAI har förbundit sig till plattformen för sina modellarbetsbelastningar, och hyperscalers såsom ByteDance, CoreWeave och Oracle Cloud Infrastructure är med. På systemsidan kommer Dell, HP, Lenovo och Supermicro att erbjuda servrar baserade på Vera. Stora tillverkare inklusive Asus, Compal, Foxconn, Gigabyte, Pegatron, Quanta Cloud Technology, Wistron och Wiwynn kommer att producera hårdvara byggd kring chippet.

Även icke-traditionella kunder noterar det. New York Stock Exchange, som bearbetar ungefär 1,1 biljoner meddelanden per dag, utforskar Vera tillsammans med partnerna Redpanda och HP för att ompröva latenskänslig infrastruktur. Ett sådant intresse visar att plattformen utvärderas för mer än bara modellträning - den ses för realtids- och höggenomströmningstillämpningar där varje mikrosekund räknas.

För Nvidia förlänger Vera en välkänd spelplan: ta lärdomar från GPU-först AI-distributioner och tillämpa dem på CPU-design. Företaget har tidigare integrerat sitt AI-arbete i produkter som RTX Spark, som lyfte fram Grace-CPU:er och Blackwell-GPU:er med LPDDR5X-minne. Nu har samtalet skiftat från enskild nod-GPU-prestanda till systembalans och genomströmning.

Kommer Vera att slå ut x86 i datacentret? Inte över en natt. Men arkitekturen riktar sig mot specifika problem för AI-arbetsbelastningar: minnesbandbredd, trådtäthet och snabb CPU-GPU-länk. För ingenjörer och arkitekter som brottas med modellkostnader och genomströmning är det en praktisk början.

Källa: gsmarena

Sara Nilsson

"Som teknikreporter skriver jag om digital kultur, sociala medier och människans relation till maskiner. Jag gillar när tekniken blir personlig."

Nvidia Vera omformar AI-servrar med hög minnesbandbredd

Varför Vera omformar tänkandet kring AI-servrar

Lämna en kommentar

Kommentarer

Relaterade inlägg

Prime Day i juni: Fyra dagar med stora rabatter och fynd

iPhone 18 Pro: regionala batteriskillnader som påverkar

Galaxy Z Fold8 sägs väga cirka 201 g, mer praktisk

Rykte: vivo X500 Ultra med inbyggd 10x periskopzoom

Motorola Edge 2026: kompakt med premiumprestanda idag

Samsung Galaxy Fit4: rykten om lansering i september

iPhone Ultra: Vaporkammare i tunt hopfällbart chassi

Asus Pad återvänder: kraftfull 12,2-tums OLED-tablet

Honor X7e: Budgettelefon med enorm batteritid och 45W

Xiaomi integrerar AirDrop i Quick Share för HyperOS-enheter

Google öppnar första fysiska butik utanför USA i Tokyo

Viktigt: iOS 26.5.1 och macOS 26.5.1 åtgärdar laddningsfel