Marble verdensmodell

Et paradigmeskifte er i ferd med å skje i verden av kunstig intelligens, og denne gangen handler det ikke om å forutsi neste ord i en setning. Vi er glade for å kunne dele nyheten om lanseringen av Marble fra World Labs – den første allment tilgjengelige, multimodale og fullt kontrollerbare «Frontier World Model».

Dette er ikke en språkmodell som GPT eller Gemini. Dette er en verdensmodell. Og du kan leke med den akkurat nå.

Dette representerer et enormt steg fremover, og vi i Data Sør mener dette er en utvikling alle i teknologibransjen bør følge nøye med på.

Språkmodeller vs. verdensmodeller: En fundamental forskjell

La oss stoppe opp et øyeblikk. Hva er egentlig forskjellen?

  • Store språkmodeller (LLMs), som vi kjenner godt, er trent til å forutsi det neste ordet i en tekst. De har en utrolig forståelse for språk, men en begrenset forståelse for den fysiske verdenen vi lever i.
  • Verdensmodeller har et helt annet mål: De prøver å forutsi hvordan verden ser ut og oppfører seg. De simulerer fysikk, lys, rom og interaksjoner. Målet er det forskerne kaller romlig intelligens (Spatial Intelligence).

Teamet bak Marble, ledet av den anerkjente KI-forskeren Dr. Fei-Fei Li, argumenterer for at verdensmodeller, ikke språkmodeller, er den virkelige veien mot generell kunstig intelligens (AGI). Menneskelig erfaring er multimodal – vi bruker syn, hørsel, berøring og språk for å bygge en mental modell av verden. Verdensmodeller etterligner denne tilnærmingen.

Møt Marble: Fra idé til interaktiv 3D-verden

Det som gjør Marble så revolusjonerende, er dens evne til å skape, gjenskape og simulere 3D-verdener som både mennesker og KI-agenter kan interagere med.

Her er noen av de utrolige egenskapene:

  1. Massivt Multimodal: Marble kan skape 3D-verdener basert på nesten hva som helst:
    • En enkel tekstbeskrivelse
    • Ett enkelt bilde
    • Flere bilder fra forskjellige vinkler
    • En video
  2. Fullt navigerbar: Når verdenen er skapt, er den ikke statisk. Du kan bevege deg fritt rundt i den, akkurat som i et videospill, og utforske den fra alle vinkler.
  3. Dynamisk redigering: Dette er kanskje det mest imponerende. Du kan redigere verdenen du har skapt med enkle tekstkommandoer, og modellen beholder konsistensen i scenen.
  4. Fleksibel eksport: Den ferdige verdenen kan eksporteres i flere formater, inkludert Gaussian Splatsvideo eller tradisjonelle meshes som kan brukes i verktøy som Blender eller Unreal Engine.

Hvorfor er dette et så stort steg?

Potensialet her er enormt og strekker seg langt utover kule demoer.

  • Trening av roboter (Embodied AI): Tenk deg å skulle trene en robot til å operere på et fabrikkgulv. I stedet for å bruke tid og ressurser på fysisk datainnsamling, kan man nå skape en digital tvilling av fabrikken. En virtuell robot kan deretter trene i dette simulerte miljøet i en nesten uendelig skalerbar prosess før den settes i arbeid i den virkelige verden. Se også: Slik skal Optimus lære av YouTube
  • Kreative industrier: For arkitekter, interiørdesignere, spillutviklere og filmskapere er dette en «game-changer». Vil du se hvordan kjøkkenet ditt ser ut med svarte benkeplater? Ta et bilde, last det opp, generer 3D-modellen og skriv: «Endre alle benkeplater til svart marmor.» Du får en hyperrealistisk og navigerbar visualisering på sekunder.
  • Simulering og planlegging: Fra byplanlegging til øvelser for nødetater – muligheten til å raskt generere og endre realistiske, interaktive miljøer åpner helt nye dører.

Prøv det selv!

Det beste av alt er at du ikke trenger å ta vårt ord for det. Marble er tilgjengelig for alle å prøve ut akkurat nå, og det er gratis å komme i gang.

Besøk marble.worldlabs.ai for å lage din første verden.

Fremtiden for kunstig intelligens er ikke bare tekstbasert – den er romlig, interaktiv og tredimensjonal. Hos Data Sør følger vi denne utviklingen med spenning, og vi er overbevist om at verdensmodeller vil forme neste generasjon av KI-applikasjoner.