Etter at ChatGPT tok verden med storm sent i fjor, var det forfriskende å se at forrige ukes kunngjøring om den forestående ankomsten av chatbotens neste iterasjon fikk relativt beskjeden dekning.
Tysk publikasjon Heise siterte ledende medlemmer av Microsofts interne ledelse forrige uke som om de sa at GPT-4 ville ankomme denne uken.
Andreas Braun, teknologidirektør i Microsoft Tyskland, sa: «Vi introduserer GPT-4 neste uke, der vi vil ha multimodale modeller som tilbyr helt andre muligheter – for eksempel videoer», sa Braun. ChatGPT (eller GPT-3.5) ble lansert i desember 2022, mens GPT-3 ble lansert i 2020.
Både Braun og Marianne Janik, administrerende direktør i Microsoft Tyskland, understreket at selv om generativ AI var banebrytende, ville den ikke erstatte menneskelige jobber. Den viktigste lærdommen fra GPT-4-kunngjøringen var at den vil være «multimodal», som betyr at den vil kunne generere tekst, lyd, bilder og videoer.
Dette høres kanskje ut som en stor sak, men i virkeligheten er det bare en konsolidering av eksisterende AI-teknologier – inkludert OpenAis egen DALL-e-bildegenerator. Faktisk høres det ut som GPT-4 vil tråkke i tærne på en rekke tredjepartsprogramvare, inkludert MidJourney, ElevenLabels og D-ID, som til sammen kan lage en AI-animert avatar med voiceovers.





