Neues ChatGPT-Update: Emotional, blitzschnell und interaktiv

Emotionaler, schneller und mit simultaner Übersetzung: OpenAI hat ein bedeutendes Update für seinen Chatbot ChatGPT herausgebracht.

OpenAI hat ein bedeutendes Update für seinen Chatbot ChatGPT veröffentlicht. Das neue Modell, ChatGPT-4o, soll die Sprachinteraktion natürlicher und einfacher gestalten.

„4o“ steht für „omni“, was lateinisch für „alles“ bedeutet. Das Unternehmen erklärte in seinem „Spring Update“, dass der Chatbot nun Emotionen erkennen und simultan übersetzen könne. Auf seiner Webseite zeigt OpenAI kurze Demonstrationen dieser neuen Fähigkeiten. Der Chatbot erkennt nun auch die Umgebung und Menschen in Echtzeit und kann beispielsweise die Kleidung eines Menschen kommentieren.

Verbesserte Sprachinteraktion

Bisher konnten Nutzer bereits mit ChatGPT sprechen, jedoch mit längeren Pausen zur Datenverarbeitung. Das sorgte oft für Verzögerungen. OpenAI erklärt, dass für diese Funktion drei interne Anwendungen nötig waren: Transkription, Verarbeitung und Generierung sowie die Umwandlung der Antwort in Sprache. Diese Verzögerungen sollen nun behoben sein. Das neue Modell reagiert auf Audioeingaben in nur 232 Millisekunden und durchschnittlich in 320 Millisekunden. Das ähnelt der menschlichen Reaktionszeit in einem Gespräch.

Laut ZDF heute betont OpenAI, dass das Update von ChatGPT jetzt den Tonfall und das Sprechtempo variieren kann, von aufgeregt bis mitfühlend. Es soll auch fließend zwischen Englisch und Italienisch übersetzen können, sarkastisch antworten, beim Lernen einer Sprache helfen oder ein Gute-Nacht-Lied singen. Damit wird ChatGPT zu einem echten Konkurrenten für Sprachassistenten wie Amazons Alexa und Apples Siri.

Two GPT-4os interacting and singing pic.twitter.com/u9VuZoroxm
— OpenAI (@OpenAI) May 13, 2024

Neue Funktionen und Echtzeit-Reaktionen

Ein weiteres Highlight ist die Fähigkeit von ChatGPT, gleichzeitig mit gesprochenen Befehlen Informationen von einer Smartphone-Kamera zu verarbeiten. In einem Livestream zeigte OpenAI, wie das neue Modell helfen kann, eine Mathe-Gleichung zu lösen. Ein Mitarbeiter schrieb die Gleichung auf ein Blatt Papier und richtete die Smartphone-Kamera darauf. Der Chatbot gab per Stimme Ratschläge für den Rechenweg, ohne das Ergebnis zu verraten. Allerdings kam es zu einem kleinen Fehler: Der Chatbot behauptete zuerst, die Aufgabe zu sehen, bevor die Gleichung aufgeschrieben war. Der Chatbot entschuldigte sich daraufhin mit den Worten: „Oops, ich war zu aufgeregt.“

Math problems with GPT-4o and @khanacademy pic.twitter.com/RfKaYx5pTJ
— OpenAI (@OpenAI) May 13, 2024

Neue Weck-Funktion und kommerzielle Nutzung

Die Interaktionen beginnen mit dem Weck-Satz „Hey, ChatGPT“, ähnlich wie bei heutigen Sprachassistenten. Abo-Kunden von OpenAI sollen mehr Leistung aus dem Modell bekommen, und kommerzielle Nutzer erhalten günstigere Interaktionen. Sam Altman, CEO von OpenAI, schrieb dazu: „Man wird jede Menge Dinge finden, für die man Geld verlangen kann. Das wird OpenAI helfen, kostenlos hoffentlich Milliarden Menschen zu bedienen.“

Aktuell nutzen rund 100 Millionen Menschen ChatGPT. Es wird einige Wochen dauern, bis das neue Modell breit verfügbar ist. Wenige Stunden nach der Präsentation meldete OpenAI eine Störung, die jedoch schnell behoben wurde.

Wettbewerb mit Google

Der Zeitpunkt der Präsentation von OpenAI ist bemerkenswert. Am 14. Mai 2024 hält Google seine jährliche Entwicklerkonferenz ab, bei der auch Ankündigungen zu neuen Funktionen mit Künstlicher Intelligenz erwartet werden. Google zeigte bereits vor einigen Monaten, wie seine KI-Software Gemini gesprochene und visuelle Informationen verarbeiten kann.

Vor über einem Jahr löste ChatGPT den Hype um Künstliche Intelligenz aus. Solche KI-Chatbots werden mit gewaltigen Mengen an Informationen trainiert und können Texte auf dem sprachlichen Niveau eines Menschen formulieren, Software-Code schreiben und Informationen zusammenfassen. Das Prinzip dahinter ist, dass sie Wort für Wort abschätzen, wie ein Satz weitergehen sollte.

Was du dir merken solltest:

OpenAI hat ein Update für seinen Chatbot ChatGPT veröffentlicht: Das neue Modell ChatGPT-4o verbessert die Sprachinteraktion erheblich, indem es Emotionen erkennt, simultan übersetzt und Echtzeit-Kommentare zur Umgebung abgibt.
Mit Reaktionszeiten von nur 232 Millisekunden und der Fähigkeit, den Tonfall und das Sprechtempo zu variieren, wird ChatGPT-4o zu einem ernsthaften Konkurrenten für Sprachassistenten wie Alexa und Siri.
Das neue Modell kann visuelle Informationen von einer Smartphone-Kamera verarbeiten, und obwohl es noch kleine Fehler gibt, zeigt es großes Potenzial für den Einsatz in verschiedenen kommerziellen und alltäglichen Anwendungen.