4 Minuter
Under flera år har telefonernas AI haft en liten mask på sig. Du frågar, den svarar, men någonstans i mitten skickas dina data till en fjärrserver, bearbetas och kommer tillbaka till dig. Denna dolda omväg har alltid varit priset man fått betala. Google vill nu kapa sladden, och Gemma 4 är det tydligaste tecknet hittills på att lokal AI på Android blir seriös.
Google DeepMind presenterade Gemma 4 förra veckan tillsammans med Arm, med ett tydligt mål: få avancerad AI att köras direkt på Arm-baserade Android-telefoner i stället för att förlita sig på molnet. Enligt Google är den nya modellfamiljen upp till fyra gånger snabbare än tidigare versioner och kan använda upp till 60% mindre batteri. De mindre varianterna E2B och E4B är byggda med telefoner i åtanke och kan hantera text, bilder och ljud utan att skicka en förfrågan över internet.
Varför Arm spelar roll här
Den tysta motorn bakom detta hopp är Arms SME2-instruktionsset, som ingår i nyare Armv9-chip. Enkelt uttryckt snabbar det upp den matrisberäkning som modern AI är beroende av. Arm säger att deras tidiga ingenjörstester visade i genomsnitt 5,5 gånger förbättrad bearbetning av användarinmatning, tillsammans med responsgenerering som var upp till 1,6 gånger snabbare på Gemma 4 E2B-modellen. Den intressanta delen? Utvecklare behöver inte skriva om sina appar för att ta del av vinsterna. Arms KleidiAI-mjukvarulager kopplar ihop med Googles befintliga runtime-bibliotek, så förbättringen kommer med mycket liten friktion.
Den typen av osynlig uppgradering är precis vad som kan föra lokal AI från en demo till något människor faktiskt använder varje dag. Snabbare. Lättare. Mindre beroende av en dataanslutning. Det är de tre saker mobil AI har eftertraktat från början.
Det tydligaste exemplet kommer från Envision, en tillgänglighetsapp utformad för blinda och personer med nedsatt syn. Hittills har scenförståelse ofta varit beroende av molntillgång. I ett prototypexempel som kör Gemma 4 lokalt på Arm-processorer kunde en användare ta ett foto och omedelbart få en detaljerad beskrivning av scenen, utan nätverk. För en sådan app är offline-stöd inte en bonusfunktion. Det är själva poängen.
Google lägger också grunden för nästa steg. Gemma 4 används som bas för Gemini Nano 4, den kommande modellen för körning på enheten i Android. Det innebär att utvecklare som bygger med Gemma 4 idag bör få kompatibilitet med Gemini Nano 4 när den dyker upp på flaggskeppsmodeller senare i år. Gemini Nano driver redan lokala funktioner som smarta svar och ljudsammanfattningar, och chipptillverkare som MediaTek har pressat hårt i samma riktning. Gemma 4 tillför mer till mixen, inklusive multimodalt stöd och inbyggda agentfunktioner.
För utvecklare är tillgången redan öppen. E2B- och E4B-modellerna finns tillgängliga via Google AI Edge Gallery på Android och iOS under en Apache 2.0-licens. Och det spelar roll eftersom kapplöpningen om användbar, privat och låglatens AI inte längre bara sker i molnet. Den flyttar in i telefonen i din hand.
Lämna en kommentar