KI-nyheter – uke 12

Denne uken har vi sett bemerkelsesverdig utvikling innen kunstig intelligens. Fra nye modeller med drastisk reduserte kostnader til innovative verktøy for kreativ utfoldelse – AI-teknologien fortsetter å utvikle seg i et forrykende tempo. Her er ukens viktigste nyheter fra AI-verdenen.

Googles innovasjoner: Canvas, NotebookLM og mer

Google har lansert flere imponerende nyheter denne uken. Den nye Canvas-funksjonen i Gemini gjør det enklere å arbeide med innhold og kode. Funksjonen inkluderer kodeforhåndsvisning og gir betydelig bedre muligheter for koding. Når man sammenligner samme oppgave på tvers av ulike plattformer, viser Gemini Canvas seg å være overlegen når det gjelder å lage funksjonelle nettsider. Det mest imponerende er at denne funksjonen er helt gratis.

I tillegg har Google oppdatert notebook LM med tankekart. Nå kan du laste inn flere kilder i notebook LM og visualisere hvordan alle ideene henger sammen med bare ett klikk. Dette er spesielt nyttig når du jobber med store datamengder eller prøver å forstå komplekse temaer.

Google har også lagt til en audio-oppsummering i både notebook LM og Gemini som gjør det mulig å generere podkast-lignende samtaler mellom to AI-stemmer. Last opp et dokument, og med ett klikk skapes en 6-minutters lydoversikt. Resultatet er to AI-stemmer som har en naturlig samtale om emnet. Dette er helt unikt for Googles økosystem akkurat nå – du kan ikke gjøre dette med Claude, ChatGPT eller Grok.

Gemini har i tillegg fått en ny tegnefunksjon som tar dine enkle skisser og forvandler dem til mer detaljert kunstverk. Dette er basert på Gemini 2.0s native bildegenerering og er veldig morsomt å leke med. Det flotte med dette er hvordan det forstår hva du prøver å tegne selv om ferdighetene dine er begrenset.

En av de mest imponerende demonstrasjonene av Gemini Canvas er dens evne til å lage interaktive spill med bare en enkel prompt. Med null kodeerfaring er det mulig å få et fungerende spill med riktig fysikk, lyd og poengberegning, alt fra en enkelt prompt.

Kinas AI-revolusjon: Baidu-modeller til 1% av OpenAIs kostnad

Baidu har lansert to nye modeller – Ernie 4.5 og Ernie X1. Ernie 4.5 er sammenlignbar med GPT-4.5, mens X1 er en tenkemodell lignende DeepSeek eller OpenAI O1 Mini. Det mest oppsiktsvekkende er at Ernie 4.5 yter på nivå med GPT-4.5, men til mindre enn 1% av prisen. Vi snakker om 55 cent per million input-tokens sammenlignet med OpenAIs $40, og $2,20 per million output-tokens. X1-modellen er til og med halv pris av DeepSeek R1, som allerede var mye billigere enn vestlige modeller.

Claude kan nå søke på nettet

Anthropic har endelig lansert nettverkssøk for Claude. Dette er en viktig oppdatering ettersom Claude tidligere var begrenset til informasjon opp til datoen for treningsavslutning. Det imponerende med Claudes implementering er at den utfører flere søk samtidig for å få mer omfattende resultater. Tester viser at Claude med nettverkssøk nå er kraftigere enn noensinne, og muligens bedre enn ChatGPT for nesten alt.

Mistral Small 3.1

Mistral, et fransk AI-selskap, har lansert Mistral Small 3.1 som overgår Googles Gemma 3 i ytelsestester, til tross for at den er designet for effektiv kjøring på enheter. Det som gjør dette imponerende er at den har et massivt 128k token kontekstvindu, er multimodal (kan håndtere tekst og bilder), og leverer 150 tokens per sekund. Den er også flerspråklig og god på programmering, resonnering og visuell forståelse. Det beste av alt er at den er åpen kildekode og kan kjøres lokalt.

Claude MCP-agenter

Claude har lansert MCP-servere som gjør det mulig å koble til applikasjoner uten å installere alt separat. Den normale måten å sette dette opp på er komplisert og teknisk, men det finnes nå en utrolig enkel måte å gjøre det på ved hjelp av Claude 3.7 Sonnet i Visual Studio Code. Alt du trenger å gjøre er å installere Visual Studio Code, legge til klientutvidelsen og plugge inn din Anthropic API-nøkkel. Deretter kan du gå til MCP Marketplace og installere servere for tjenester som Perplexity, Gmail, Google Drive, Airtable, Shopify og mer.

Roblox’ nye AI-system for 3D-modellgenerering

Roblox har introdusert et nytt AI-system kalt Cube som genererer 3D-modeller fra tekst- eller stemmekommandoer. Dette er første gang vi ser generative 3D-modeller integrert i en plattform med hundrevis av millioner brukere. Roblox har rundt 85 millioner daglige aktive brukere, hvorav 2,5 millioner er utviklere som skaper innhold innenfor spillet. I stedet for å lære kompleks 3D-modellering, kan brukere bare beskrive hva de ønsker, som «en rød buggy med knudrete dekk» eller «et grønt krystallsword med gulldetaljer», og AI-en genererer det umiddelbart.

Pika’s objektmanipulering for videoer

Pika ruller ut en imponerende ny funksjon som lar deg manipulere spesifikke objekter i en video samtidig som alt annet holdes nøyaktig det samme. Dette nivået av presisjonskontroll over videogenerering er noe vi ikke har sett før. Funksjonen er for øyeblikket kun tilgjengelig for deres Creative Partner Program, men viser hvor AI-video er på vei – mot mye mer presis kontroll snarere enn bare å generere hele scener fra bunnen av.

Hva dette betyr for fremtiden

Innovasjonstakten vi ser akkurat nå er absolutt svimlende.

Dette er ikke bare trinnvise forbedringer – vi ser fundamentale endringer i hva som er mulig og hvem som kan skape med disse verktøyene. Barrierene for kreativ utfoldelse faller raskt. Det mest spennende er hvordan disse verktøyene blir mer tilgjengelige. Det meste av det som er vist her er tilgjengelig gratis eller til en svært lav kostnad.

Vi nærmer oss en verden hvor alle med en idé kan bringe den til live, enten det er en nettside, et spill, en podkast eller en kompleks AI-agent som automatiserer deler av arbeidet ditt. Den begrensende faktoren er ikke lenger teknisk evne eller ressurser – det er bare fantasien.

Dette er utvilsomt en av de mest spennende ukene i AI-historien. Antallet banebrytende funksjoner og kapabiliteter som er lansert på bare noen få dager er helt uten sidestykke. Det er tydelig at vi ikke lenger er i potensiell-fasen av AI – vi er fast inne i den praktiske anvendelsesfasen.