Xiaomi öppnar OneVL: ny ram för självkörande AI plattform

Xiaomi öppnar OneVL: ny ram för självkörande AI plattform

Sara Nilsson Sara Nilsson . Kommentarer

4 Minuter

Xiaomi har kastat in en kraftig armbåge i racet om självkörning. Det nyligen släppta OneVL-ramverket är nu öppen källkod, och målsättningen är ambitiös: ge självkörande system ett bättre sätt att läsa vägen, hantera osäkerhet och förutse vad som händer härnäst.

Det spelar roll eftersom AI för självkörning länge har varit uppdelad mellan två olika skolor. Den ena sidan fokuserar på Vision Language Action-modeller, eller VLA-system, som tolkar trafikscener och översätter den förståelsen till körbeslut. Den andra förlitar sig på världsmodeller, utformade för att simulera hur en situation kan utvecklas under de kommande sekunderna. Xiaomi säger att OneVL förenar dessa två inriktningar i ett enda ramverk genom resonemang i latent rum, en metod avsedd att göra prediktion och beslutsfattande snabbare och mer effektivt.

Enkelt uttryckt försöker företaget lösa ett av de svåraste problemen inom självkörande teknik: inte bara att se vägen, utan att förstå orsak och verkan i realtid. En fotgängare kliver ut från trottoaren. En elscooter skär över en fil. En bil framför tvekar i en korsning. Detta är inte statiska bilder. Det är rörliga pussel. Xiaomi hävdar att OneVL är byggt för att hantera den röran med större precision än konventionella tillvägagångssätt.

Företaget säger att ramverket utökar resonemangsförmågan hos dess XLA-modell samtidigt som det höjer både inferenshastighet och noggrannhet. Det uppnår enligt uppgift starka resultat i vanliga jämförelsetester kopplade till uppfattning, resonemang och planering, tre områden som ligger i kärnan av programvara för autonoma fordon. Xiaomi går ännu längre och menar att OneVL kan överträffa uttryckligt tankekedjeresonemang i noggrannhet samtidigt som det behåller hastigheter nära de latenta inferenssystem som främst är optimerade för slutgiltiga svar.

Inte bara snabbare utan också lättare att lita på

En av de mer intressanta delarna av releasen är Xiaomis betoning på tolkbarhet. Inom självkörning är prestandasiffror bara en del av historien. Ingenjörer, tillsynsmyndigheter och till slut passagerare vill veta varför en maskin fattade ett beslut. Xiaomi säger att OneVL kan förklara sina handlingar både i naturligt språk och i visuell form, vilket i praktiken ger utvecklare en tydligare inblick i hur modellen nådde en slutsats och vad den förväntar sig ska hända härnäst på vägen.

Det kan visa sig användbart långt bortom forskningsdemos. Om ett system kan visa varför det valde att sakta ner, byta fil eller väja, blir det lättare att granska, förbättra och potentiellt validera i säkerhetskritiska miljöer. För en bransch som ofta kritiseras för beslut i svarta lådor är det ingen liten detalj.

Tidsaspekten är också talande. OneVL kommer strax efter att Xiaomi släppte Omnivoice som öppen källkod, deras modell för ljudgenerering, vilket tyder på att företaget satsar mer på öppen AI-utveckling över flera domäner. Det handlar inte bara om att publicera kod i goodwill. Det är en signal. Xiaomi vill ha en starkare röst i AI-debatten, och företaget ser tydligt smart mobilitet som ett av de områden det är värt att göra anspråk på.

Konkurrensen inom självkörning och kroppsbaserad AI blir hårdare för varje månad. Teknikjättar, biltillverkare och specialiserade startups jagar alla samma pris: system som kan förstå den fysiska världen tillräckligt väl för att agera säkert i den. Genom att göra OneVL öppen källkod deltar Xiaomi inte bara i tävlingen. Företaget försöker också forma villkoren för den.

"Som teknikreporter skriver jag om digital kultur, sociala medier och människans relation till maskiner. Jag gillar när tekniken blir personlig."

Lämna en kommentar

Kommentarer