Gemma 4: Lokal AI på Android tar ett stort kliv framåt

3 Minutes

Under flera år har telefonernas AI haft en liten mask på sig. Du frågar, den svarar, men någonstans i mitten skickas dina data till en fjärrserver, bearbetas och kommer tillbaka till dig. Denna dolda omväg har alltid varit priset man fått betala. Google vill nu kapa sladden, och Gemma 4 är det tydligaste tecknet hittills på att lokal AI på Android blir seriös.

Google DeepMind presenterade Gemma 4 förra veckan tillsammans med Arm, med ett tydligt mål: få avancerad AI att köras direkt på Arm-baserade Android-telefoner i stället för att förlita sig på molnet. Enligt Google är den nya modellfamiljen upp till fyra gånger snabbare än tidigare versioner och kan använda upp till 60% mindre batteri. De mindre varianterna E2B och E4B är byggda med telefoner i åtanke och kan hantera text, bilder och ljud utan att skicka en förfrågan över internet.

Varför Arm spelar roll här

Den tysta motorn bakom detta hopp är Arms SME2-instruktionsset, som ingår i nyare Armv9-chip. Enkelt uttryckt snabbar det upp den matrisberäkning som modern AI är beroende av. Arm säger att deras tidiga ingenjörstester visade i genomsnitt 5,5 gånger förbättrad bearbetning av användarinmatning, tillsammans med responsgenerering som var upp till 1,6 gånger snabbare på Gemma 4 E2B-modellen. Den intressanta delen? Utvecklare behöver inte skriva om sina appar för att ta del av vinsterna. Arms KleidiAI-mjukvarulager kopplar ihop med Googles befintliga runtime-bibliotek, så förbättringen kommer med mycket liten friktion.

Den typen av osynlig uppgradering är precis vad som kan föra lokal AI från en demo till något människor faktiskt använder varje dag. Snabbare. Lättare. Mindre beroende av en dataanslutning. Det är de tre saker mobil AI har eftertraktat från början.

Det tydligaste exemplet kommer från Envision, en tillgänglighetsapp utformad för blinda och personer med nedsatt syn. Hittills har scenförståelse ofta varit beroende av molntillgång. I ett prototypexempel som kör Gemma 4 lokalt på Arm-processorer kunde en användare ta ett foto och omedelbart få en detaljerad beskrivning av scenen, utan nätverk. För en sådan app är offline-stöd inte en bonusfunktion. Det är själva poängen.

Google lägger också grunden för nästa steg. Gemma 4 används som bas för Gemini Nano 4, den kommande modellen för körning på enheten i Android. Det innebär att utvecklare som bygger med Gemma 4 idag bör få kompatibilitet med Gemini Nano 4 när den dyker upp på flaggskeppsmodeller senare i år. Gemini Nano driver redan lokala funktioner som smarta svar och ljudsammanfattningar, och chipptillverkare som MediaTek har pressat hårt i samma riktning. Gemma 4 tillför mer till mixen, inklusive multimodalt stöd och inbyggda agentfunktioner.

För utvecklare är tillgången redan öppen. E2B- och E4B-modellerna finns tillgängliga via Google AI Edge Gallery på Android och iOS under en Apache 2.0-licens. Och det spelar roll eftersom kapplöpningen om användbar, privat och låglatens AI inte längre bara sker i molnet. Den flyttar in i telefonen i din hand.

Erik Blomqvist

"Jag har arbetat med speljournalistik i över femton år. För mig handlar spel inte bara om underhållning – det är en kulturform som speglar vår tid."

Comments

No comments yet.

Gemma 4: Lokal AI på Android tar ett stort kliv framåt

Google DeepMinds Gemma 4 möjliggör kraftfull lokal AI på Arm-baserade Androidtelefoner, snabbare och mer energieffektiv med multimodala funktioner. Modellerna E2B och E4B erbjuder offline-stöd för text, bild och ljud.

Varför Arm spelar roll här

Leave a Comment

Comments

Related Posts

Förberedelser inför AGI: Vad snabba genombrott innebär

Australiens AI-regler tvingar vatten- och upphovsskydd

DeepSik V4 Pro: Ny kinesisk AI som imponerar utvecklare

OpenAI varnar föräldrar när ChatGPT-konton stängs av

Alibaba släpper Qwen3.8: öppna vikter för storskalig AI

Japan och NVIDIA bygger nationellt AI-center för industri

SpaceXAI avslutar träning av två biljoner-parametersmodell

Pentagon överväger SpaceX som leverantör av AI-kapacitet

När AI-ilska blir verkligt hot: från nätet till gatan

Gemini 3.5 Pro-förseningen sänker Alphabets aktiepris

Google AI i skolor: risker för elevers säkerhet och lärande

Nvidia lanserar Cosmos 3 Edge för lokala världmodeller