DeepSeek-V4 Preview: Två modeller med 1 miljon tokens

DeepSeek-V4 Preview: Två modeller med 1 miljon tokens

Erik Blomqvist Erik Blomqvist . Kommentarer

3 Minuter

DeepSeek har dragit gardinen åt sidan för DeepSeek-V4 Preview, och siffrorna är svåra att ignorera. Det kinesiska AI-företaget erbjuder nu två nya modeller, V4 Pro och V4 Flash, båda konstruerade för en kontextlängd på en miljon tokens, en referenspunkt som sätter fokus på hantering av långa dokument, kodanalys och komplexa resonemang.

Modellerna finns redan tillgängliga via DeepSeeks webbplats i Instant-läge och Expert-läge, medan API:et också har uppdaterats och är live idag. På en marknad där kontextlängd blivit en av de hårdaste stridsfronterna inom AI gör DeepSeek ett mycket tydligt drag: erbjuda avancerade funktioner utan premiumprislappen.

Två modeller, ett mycket stort löfte

På pappret är skillnaden mellan de två varianterna markant. DeepSeek-V4 Pro har 1,6 biljoner totala parametrar med 49 miljarder aktiva parametrar, medan V4 Flash är slankare med 284 miljarder totala parametrar och 13 miljarder aktiva parametrar. Båda stödjer samma enorma kontextlängd på 1M, men de riktar sig tydligt till olika användare och budgetar.

DeepSeek säger att Pro-modellen är tungviktaren i familjen. Den är utformad med starkare agentiska förmågor, bredare allmänkunskap och avancerad resoneringsförmåga som företaget hävdar överträffar nuvarande öppna modeller inom matematik, STEM och kodning. DeepSeek säger också att Pro är konkurrenskraftig med ledande proprietära system, även om de varnar för att den fortfarande släpar efter Gemini 3.1 Pro på vissa områden.

Flash är i sin tur det skarpare värdealternativet. DeepSeek beskriver den som levererande resoneringsförmåga som kommer nära Pro, samtidigt som den matchar Pro på enklare agentuppgifter. Den verkliga fördelen är kostnaden. Flash positioneras som det mer prisvärda alternativet för utvecklare som vill ha långkontext-AI utan att spränga budgeten.

Prissättningen återspeglar den strategin. För Flash börjar inmatningskostnaden vid $0.028 vid cacheträff respektive vid utebliven cacheträff $0.14, medan utdata kostar $0.28. Pro ligger betydligt högre, med inmatningspriser på $0.145 eller $1.74 beroende på cachestatus, och utdata prissatt till $3.48.

För användare som vill testa modellerna omedelbart har DeepSeek öppnat tillgången på chat.deepseek.com. Företaget säger också att de öppna vikterna finns tillgängliga, tillsammans med en teknisk rapport för den som vill fördjupa sig i arkitektur, benchmarkresultat och träningsdetaljer.

Det är en djärv lansering och en som återigen driver diskussionen om långkontext framåt. DeepSeek jagar inte bara rubriksiffror. Företaget försöker bevisa att massiva AI-modeller fortfarande kan vara praktiska, tillgängliga och prisvärda.

"Jag har arbetat med speljournalistik i över femton år. För mig handlar spel inte bara om underhållning – det är en kulturform som speglar vår tid."

Lämna en kommentar

Kommentarer