3 Minuter
Föreställ dig ett serverrum tätt packat med kisel, där varje chip arbetar sig igenom ett berg av text. Det är bilden Huaweis forskargrupp målar upp efter att ha meddelat att de tränade DeepSeek V4-Pro, en modell med 1,6 biljoner parametrar, med ett kluster byggt runt minst tusen Ascend 910C-chip.
Berättelsen låter enkel: inhemskt producerad AI-kisel hanterar äntligen storskaliga modellarbetsbelastningar. Men verkligheten är mer nyanserad. Huawei uppger att teamet utförde fullständiga parameteruppdateringar, vilket innebär att varje vikt i modellen tränades i stället för att man enbart lade till ett tunt adapterlager, och att förträningen av V4-Pro behandlade ett häpnadsväckande korpus som enligt uppgift översteg 32 biljoner token. Förträning bygger modellens kärnkompetenser; den senare finjusteringsfasen formar beteendet genom instruktionsträning och säkerhetsanpassning.
Varför spelar det roll? För fullständig parameterträning är mycket mer krävande än lättare tekniker som bara justerar en liten del av ett nätverk. Det kräver långvarig genomströmning, stabila nätverksförbindelser och tajt orkestrering över chipen. Historiskt har kinesiska grupper haft svårt att flytta tunga träningsarbetsbelastningar bort från Nvidias hårdvara utan att stöta på flaskhalsar i prestanda och anslutningsstabilitet.

Huawei pekar på Ascend 910C:s dubbla designarkitektur som en vändpunkt. Oberoende tester från tidigare DeepSeek-experiment antydde att en Ascend-enhet kunde leverera ungefär 60% av inferensprestandan hos Nvidias H100, men det gällde inferens, inte storskalig, synkroniserad träning. Träningsarbetsbelastningar blottlägger andra svagheter: kollektiv kommunikation, minneshantering och programvaromognad blir alla avgörande.
Ändå har påståendet förbehåll. Forskarna rapporterade att fullständig parameterträning slutfördes, men gav inga rigorösa mätvärden: ingen väggklockstid, inga genomströmningsmått, ingen direkt jämförelse med H100-kluster och ingen detaljerad redovisning av effektförbrukning eller effektivitet. Utan dessa siffror framstår tillkännagivandet precis som vad det är, ett uppmuntrande tekniskt framsteg men ännu inget oberoende bevis för att Ascend-kluster matchar eller överträffar etablerade alternativ för ledande förträning.
Det finns skäl till försiktighet. Tidigare rapporter sa att försök att träna en annan modell, R2, på Huaweis kisel mötte instabilitet och långsamma chipförbindelser. Att gå från framgångsrika demonstrationer i inferens till pålitlig storskalig förträning är ett stort hopp. Företag kan ibland sätta ihop tillräckligt mycket ingenjörsarbete för att slutföra en enstaka körning samtidigt som de saknar den robusthet som krävs för rutinmässig modellutveckling i skala.
Vad är då slutsatsen för det bredare AI-ekosystemet? Om Huaweis redogörelse står sig vid granskning signalerar det en växande konkurrenskraft hos kinesisk AI-hårdvara och en mognande programvarustack som kan orkestrera träningsjobb på tusentals chip. Om den inte gör det understryker det att hypen fortfarande ligger före verifierbara framsteg. Hur som helst är nästa steg tydligt: oberoende mätningar och transparenta körningsdata.
Vi kommer att bevaka dessa siffror. Oberoende verifiering kommer att visa om detta är ett verkligt skifte i den globala AI-infrastrukturen eller helt enkelt ett ambitiöst konceptbevis.
Källa: smarti
Lämna en kommentar