Optiska AI-processorer: Neurophos banar väg för framtid

Optiska AI-processorer: Neurophos banar väg för framtid

Sara Nilsson Sara Nilsson . 2 Kommentarer

7 Minuter

En amerikansk startup, finansierad av Bill Gates Gates Frontier Fund, har presenterat en experimentell AI-processor som körs med ljus i stället för elektroner. Företaget Neurophos hävdar att deras optiska chip kan ge stora förbättringar i både prestanda och energieffektivitet, och erbjuder en alternativ väg för att skala artificiell intelligens bortom traditionella kisel-GPU:er. Denna typ av optisk processorteknik siktar på att kombinera fotonik och avancerad chipdesign för att möta stigande krav på beräkningskraft i datacenter och för stora neurala nätverk.

From electrons to photons: a different way to compute

I stället för att föra elektroner genom transistorer utför Neurophos design beräkningarna med fotoner. Ljus kan byta tillstånd snabbare och avger betydligt mindre värme än laddningar som rör sig genom kisel, vilket i teorin möjliggör mycket högre genomströmning och lägre effektförbrukning. Företaget uppger att de löst en stor teknisk tröskel för optisk beräkning genom att krympa optiska komponenter till en densitet som är kompatibel med befintliga chipfabriker. Genom att packa en enda, mycket stor optisk beräkningsmatris på ett chip – i stället för att förlita sig på många mindre elektroniska kärnor – hoppas de reducera behovet av omfattande on-chip-dataflytt och därigenom sänka latens och energiförbrukning.

Den optiska angreppssättet bygger på att representera numeriska värden och matrismultiplikationer med ljusintensiteter och fasförskjutningar i vågledare och interferometriska nätverk. Sådana fotoniska kretsar kan implementera stora delar av de matrisoperationer som är centrala för neurala nätverk, särskilt för inferens och vissa typer av träning. För att bli praktiskt användbart måste även periferale funktioner – adressering, minnesgränssnitt, digital-analog-omvandling, och felkorrigering – integreras i ett fungerande system, vilket Neurophos säger att de arbetar med i sina prototyper.

What this means compared with today's AI chips

Nvidia och andra GPU-tillverkare bygger fortfarande kärnberäkningarna för AI på elektroniska kretsar. Nvidia integrerar visserligen fotonik för att snabba upp kommunikationen mellan chip, men själva aritmetiken utförs av elektroner i transistorer. Neurophos strävar efter verklig optisk beräkning, där fotoner utför de centrala matrisoperationerna som används i neurala nätverk. Om detta lyckas kan det förändra de effekt–prestanda-avvägningar som datacenter i dag brottas med, särskilt för stora inferenskluster och specialiserade acceleratorer.

Jämfört med dagens AI-chip kan en optisk arkitektur potentiellt erbjuda flera konkurrensfördelar. Högre bandbredd och lägre energiförbrukning per operation kan dramatiskt minska driftskostnader för molnleverantörer och stora företag som kör storskalig maskininlärning. Samtidigt behöver dessa system fortfarande adressera frågeställningar kring precision, brus, temperaturberoenden och hur väl algoritmer kan mappas till en fotonisk beräkningsmodell. För vissa typer av arbetsbelastningar – till exempel storskaliga matris–vektor-multiplikationer vid inferens i transformerbaserade modeller – kan en optisk accelerator ge en kompenserande fördel vid hög parallellism och konstant modellarkitektur.

  • Snabbare växlingshastigheter: fotoner kan skifta tillstånd på betydligt snabbare tidsskalor än elektroner, vilket möjliggör högre effektiva klockliknande operationer för vissa typer av linjära algebra-beräkningar. Detta kan förbättra genomströmningen i matrisoperationer som är kritiska för djupa neurala nätverk och stora språkmodeller.
  • Lägre värmeutveckling: mindre spillvärme minskar kylbehovet och förbättrar energieffektiviteten i större inferens- eller träningssystem. Mindre värmeproduktion kan också förenkla serverdesign och minska kostnader för kylning i datacenter, vilket är viktigt för hållbarhetsmål och total ägandekostnad (TCO).
  • Tätare beräkningsstruktur: en enda, stor optisk matris kan förenkla on-chip-dataflöde jämfört med många distribuerade elektroniska kärnor, vilket potentiellt reducerar interna kommunikationsöverhead och latens. Det kan också göra det enklare att skala upp matrisstorlekar utan proportionellt ökat kopplingskomplexitet.

Reality check: big hurdles remain

Trots optimistiska uttalanden återstår år av ingenjörsarbete innan massproduktion är möjlig. Optiska komponenter beter sig fundamentalt annorlunda än transistorer; de är känsliga för fabrikationsvariationer, temperaturändringar och krav på precisa fasinställningar. Dessutom måste mjukvaruverktyg, kompilatorer, optimerare och valideringssuites bygga om eller anpassas för att effektivt utnyttja optiska beräkningsenheter. Det innebär arbete både på låg nivå, för att få rätt bit- och numerisk noggrannhet, och på högnivå, för att mappa existerande neurala nätverksramverk till fotoniska primitivelement.

Integration med befintliga datacenter-ekosystem — inklusive minneshierarki, nätverksstackar och molnplattformar — kräver också omfattande standardisering och kompatibilitetstestning. Tillförlitlighetstester i stor skala är inte triviala: att säkerställa att optiska moduler fungerar under åratal av kontinuerlig drift under varierande miljöförhållanden är både tidskrävande och kostsamt. Dessutom måste leveranskedjan för fotoniska komponenter och avancerade kapslingstekniker säkerställas, vilket kan innebära att nya underleverantörer eller ändrade tillverkningsprocesser behövs. Samtidigt finns en teknisk diskussion om hur väl vissa algoritmer och numeriska format lämpar sig för fotonisk implementering, och om hybridlösningar (optisk + elektronisk) blir den praktiska vägen framåt.

Ändå signalerar stöd från Gates Frontier Fund och samtal i branschen — först rapporterat av Tom's Hardware — en växande aptit för alternativ till kiselskalen. Föreställ dig energikrävande inferens-rack som ersätts av kompakt optisk modulära acceleratorer som skär ner elkostnader och värmeutsläpp: det kan låta futuristiskt, men startups som Neurophos trycker successivt den framtiden närmare verkligheten genom prototyper, samarbeten och tekniska iterationer.

Who wins the chip race?

Nvidia är fortfarande den dominerande aktören och kommer sannolikt att leda marknaden under flera år tack vare ett moget ekosystem, omfattande mjukvarustöd och stor produktionsskala. Deras ekosystem — inklusive cuDNN, CUDA och bred communitysupport — gör att nya arkitekturer måste erbjuda tydliga fördelar för att utmana den etablerade positionen. Samtidigt kan optisk beräkning bli en kraftfull kompletterande teknik: specialiserade optiska acceleratorer för inferens eller vissa stora matrisarbetslaster kan existera sida vid sida med elektroniska GPU:er som hanterar general-purpose träning och bred kompatibilitet.

Den verkliga frågan är mindre om Nvidia faller omedelbart och mer om hur AI-hårdvarulandskapet utvecklas — med fotonik som potentiellt omformar prestanda- och effektmått under det kommande decenniet. Vi kan se en heterogen framkant där molnleverantörer, hyperskalare datacenter och vertikala branscher väljer bland GPU:er, FPGA:er, ASIC:er och optiska acceleratorer beroende på arbetsbelastningens krav. För forskare och ingenjörer innebär detta nya möjligheter att optimera algoritmer för platsen där de körs, utveckla kodningsscheman för reducerad precision anpassade till fotoniska egenskaper, och skapa mellanlager som förenar optiska primitivalement med befintliga ramverk för maskininlärning.

Framtida utveckling kommer sannolikt att inkludera fler samarbeten mellan fotonik-startups och etablerade tillverkare, portning av verktygskedjor för att stödja optisk hårdvara, samt standardiseringsinitiativ som underlättar integration. För slutkunden kan detta innebära lägre driftskostnader, snabbare inferens för vissa applikationer och minskad miljöpåverkan för storskalig AI-drift. För investerare och teknologiledare gäller det att noggrant avgöra vilka arbetsbelastningar som gagnas mest av optik och att bevaka hur snabbt tekniska risker – som tillförlitlighet och tillverkbarhet – reduceras i takt med att prototyper utvecklas till kommersiella produkter.

Källa: gizmochina

"Som teknikreporter skriver jag om digital kultur, sociala medier och människans relation till maskiner. Jag gillar när tekniken blir personlig."

Lämna en kommentar

Kommentarer

labbcore

Wow, tänk om datacenter blev tystare och svalare! Blir helt pirrig, men man måste se bevis i drift. Startup hype + Gates backing = spännande mix.

Tomas

Spännande idé men, är det för bra för att vara sant? Hur löser de precisionen, temperaturdrift o fabrikationsvarianter? Låter lovande men tveksam, om det funkar i skala…