Gemini tar over

Gemini tar over

Google har løftet sløret for en av de største oppgraderingene av Gemini så langt. På årets Google I/O presenterte selskapet en ny generasjon KI-funksjoner som gjør Gemini mer personlig, mer visuelt orientert og langt mer agentisk enn tidligere.

Gemini er ikke lenger bare en chatbot som svarer på spørsmål. Google vil gjøre den til en assistent som forstår kontekst, følger med på arbeidsflyten din og etter hvert kan utføre oppgaver på dine vegne.

Det skjer samtidig som bruken vokser kraftig. Ifølge Google har Gemini-appen nå passert 900 millioner månedlige brukere globalt, mer enn dobbelt så mange som på samme tid i fjor.

For alle som jobber med medier, kommunikasjon, design, video eller innholdsproduksjon, er dette en utvikling som er verdt å følge tett. Gemini beveger seg nå inn i et område der KI ikke bare skriver tekst, men også organiserer hverdagen, skaper visuelle fortellinger og fungerer som et aktivt produksjonsverktøy.

Fra idé til filmatisk video

Den mest visuelle nyheten er Gemini Omni. Google beskriver dette som en ny modell som kan skape innhold fra mange typer input samtidig. Tekst, bilder, video og instruksjoner kan kombineres på en mer flytende måte enn tidligere.

Poenget er at brukeren ikke lenger må tenke i separate bokser: tekst til bilde, bilde til tekst eller tekst til video. Med Gemini Omni skal man kunne arbeide mer som i en samtale. Man kan be modellen endre bakgrunn, legge til en filmatisk kamerabevegelse, justere uttrykk eller bygge videre på en eksisterende video, uten nødvendigvis å starte på nytt.

For film- og videobransjen peker dette mot en ny type previsualisering. Regissører, produsenter, reklamebyråer og innholdsprodusenter kan raskere teste stemninger, locations, visuelle konsepter og fortellergrep før man går inn i dyrere produksjonsledd.

Det betyr ikke at tradisjonell filmproduksjon blir overflødig. Men det betyr at terskelen for å visualisere en idé blir dramatisk lavere. Der man før trengte storyboards, moodboards, animatics og referanseklipp fra mange kilder, kan man i økende grad bygge et første visuelt uttrykk direkte i KI-verktøyet.

Det er her utviklingen blir interessant for norske produsenter. I et lite marked, der budsjettene ofte er presset, kan slike verktøy få betydning i utviklingsfasen. Ikke som erstatning for foto, regi, produksjonsdesign eller klipp, men som et nytt rom for å prøve ut ideer før man binder opp penger, stab og opptaksdager.

Gemini blir en agent

Google lanserer også Gemini Spark, en personlig KI-agent som skal kunne hjelpe brukeren med mer enn å svare på enkeltspørsmål. Spark er ment å kunne følge opp oppgaver, hente informasjon fra ulike kilder og sette sammen arbeidsflyter.

Eksemplene Google trekker frem, handler om alt fra å analysere månedlige kredittkortutskrifter til å følge med på e-poster, frister og dokumenter. For en travel produksjonsleder, redaktør eller prosjektleder er det lett å se hvor dette kan være nyttig.

I praksis peker dette mot en assistent som kan hjelpe med å holde orden i det digitale kaoset: møter, avtaler, e-poster, notater, oppgaver og dokumenter. Det er ikke vanskelig å forestille seg en Gemini-agent som samler møtereferater, trekker ut beslutninger, lager oppfølgingspunkter og minner deg på hva som faktisk må gjøres.

Google introduserer også Daily Brief, en daglig morgenoversikt som samler det viktigste fra kalender, e-post og oppgaver. I første omgang starter dette i USA, før funksjonene etter planen rulles ut bredere.

Dette er en viktig forskjell fra tidligere KI-assistenter. De gamle assistentene ventet på en kommando. De nye agentene skal i større grad forstå hva som skjer rundt deg, og foreslå neste steg.

Et nytt visuelt språk for KI

Gemini får samtidig et nytt design. Google kaller uttrykket Neural Expressive, og beskriver det som et mer levende, dynamisk og visuelt brukergrensesnitt.

Det handler ikke bare om kosmetikk. Google vil bort fra lange tekstblokker og over i svar som kan inneholde bilder, tidslinjer, interaktive elementer, forklarende visualiseringer og mer fortellende formater.

Gemini Live blir også tettere integrert, slik at brukeren kan veksle mellom å skrive korte spørsmål og gå over i mer naturlige samtaler med stemmen. Mikrofonfunksjonen er også redesignet for at man skal kunne snakke seg gjennom tanker og ideer i eget tempo.

Det er en tydelig retning: KI skal ikke bare være et tekstfelt. Den skal bli en arbeidsflate.

For mediebransjen er dette kanskje det viktigste signalet. Når KI-verktøyene blir mer visuelle, mer muntlige og mer integrert i daglige arbeidsprosesser, flytter de seg nærmere selve produksjonen. Ikke bare research, ikke bare manusutkast, men idéutvikling, planlegging, visualisering, presentasjon og oppfølging.

Google forsøker med andre ord å gjøre Gemini til en universell assistent for både privatliv og arbeidsliv. Det vil fortsatt være store spørsmål knyttet til opphavsrett, datasikkerhet, kildekritikk, personvern og kreativ kontroll. Men retningen er tydelig.

Gemini skal ikke lenger bare svare. Den skal forstå, skape og handle.

Har Norge internasjonal konkurransekraft ?

Har Norge internasjonal konkurransekraft ?

Panasonic kjøper HIVE

Panasonic kjøper HIVE