I en uke preget av spennende nyheter innen kunstig intelligens, har både Google og OpenAI kommet med betydningsfulle lanseringer.
OpenAI integrerer GPT-4o bildegenerering i ChatGPT
OpenAI har nylig annonsert en betydelig oppgradering av ChatGPT ved å integrere GPT-4o, deres nyeste bildegenerasjonsmodell, direkte i chatgrensesnittet. Denne oppdateringen, som begynte å rulles ut 25. mars 2025, erstatter den tidligere DALL-E 3-integrasjonen og lover å levere mer konsistente resultater med færre innholdsbegrensninger.
Nye funksjoner og forbedringer
GPT-4o bringer flere avanserte funksjoner til ChatGPT:
- Håndtering av opptil 20 forskjellige objekter samtidig
- Forbedret kontekstuell bevissthet
- In-context læring for analyse og inkorporering av opplastede bilder
- Mer detaljerte og nøyaktige bildegenereringer

Tilgjengelighet og begrensninger
Funksjonen er nå tilgjengelig for brukere på ulike nivåer:
- Gratis brukere kan generere opptil 3 bilder per dag
- Plus, Pro og Team-abonnenter har ubegrenset tilgang
- Enterprise- og Education-brukere vil få tilgang snart
API-tilgang for utviklere er planlagt i de kommende ukene, noe som vil muliggjøre bredere implementering på tvers av plattformer.

DALL-E som separat alternativ
Til tross for integrasjonen av GPT-4o, vil DALL-E fortsatt være tilgjengelig som et separat alternativ gjennom en dedikert GPT. Dette gir brukere fleksibilitet til å velge mellom de to modellene basert på spesifikke behov og preferanser.
Denne oppdateringen representerer et betydelig skritt fremover i AI-drevet bildegenerering, og lover å forbedre både kreative og praktiske anvendelser av ChatGPT.

Googles Gemini 2.5 Pro: Et kraftig sprang fremover
Google har avduket sin mest avanserte AI-modell til nå, Gemini 2.5 Pro. Denne «tenkemodellen» er designet for å takle stadig mer komplekse problemer, og viser imponerende fremskritt innen resonnering og kodekapasiteter.
Nøkkelegenskaper ved Gemini 2.5 Pro inkluderer:
- En kontekstvindu på én million tokens, som snart skal dobles til to millioner
- Maksimal utdatakapasitet på 65 000 tokens
- Toppresultater på flere ledende AI-benchmarks
- Avanserte multimodeale evner, som kan håndtere tekst, bilder, lyd og video
Modellen er nå tilgjengelig via Google AI Studio og Gemini-appen for Gemini Advanced-abonnenter, med planer om utvidelse til Vertex AI for bedriftskunder.