Nachdem ChatGPT Ende letzten Jahres die Welt im Sturm erobert hatte, war es erfreulich zu sehen, dass die Ankündigung der bevorstehenden Veröffentlichung der nächsten Version des Chatbots in der vergangenen Woche vergleichsweise wenig Beachtung fand.
Deutsche Publikation Heise zitierte hochrangige Mitglieder der Microsoft-Führungsebene im jeweiligen Land letzte Woche hieß es noch, GPT-4 würde diese Woche eintreffen.
Andreas Braun, CTO von Microsoft Deutschland, erklärte: „Wir werden nächste Woche GPT-4 vorstellen. Dort werden wir multimodale Modelle einsetzen, die völlig neue Möglichkeiten bieten – beispielsweise Videos.“ ChatGPT (oder GPT-3.5) wurde im Dezember 2022 veröffentlicht, GPT-3 hingegen bereits 2020.
Sowohl Braun als auch Marianne Janik, CEO von Microsoft Deutschland, betonten, dass generative KI zwar bahnbrechend sei, aber keine menschlichen Arbeitsplätze ersetzen werde. Die wichtigste Erkenntnis aus der GPT-4-Ankündigung war die „Multimodalität“ des Systems, das heißt, es kann Texte, Audio, Bilder und Videos generieren.
Das mag nach einer großen Sache klingen, ist aber in Wirklichkeit lediglich eine Konsolidierung bereits bestehender KI-Technologien – darunter auch OpenAIs eigener Bildgenerator DALL-e. Tatsächlich dürfte GPT-4 mit einer Reihe von Drittanbieter-Softwarelösungen, wie MidJourney, ElevenLabels und D-ID, konkurrieren, die gemeinsam kann einen KI-animierten Avatar mit Sprachausgabe erstellen.





