KI-Revolution? ChatGPT-4o erkennt jetzt menschliche Emotionen

Ein Sprachassistent, mit dem man sich wie mit einem Menschen unterhalten kann, blieb bisher Science-Fiction. Nun kommt ChatGPT solchen Fähigkeiten näher.

Der bekannte Chatbot ChatGPT kann jetzt eine Unterhaltung mit Menschen führen und deren Emotionen erkennen. Mit der natürlichen Stimme und der kurzen Reaktionszeit erinnert das neue KI-Modell GPT-4o an Sprachassistenten aus Hollywoodfilmen. Die Entwicklerfirma OpenAI wird es auch Gratis-Nutzern zur Verfügung stellen. Wie gut die Software Deutsch sprechen kann, blieb nach der Präsentation allerdings offen.

Mit Nutzern sprechen konnte ChatGPT im Prinzip schon vorher – aber mit Pausen zur Verarbeitung der Daten. Jetzt zeigte OpenAI, wie die Software den Tonfall von aufgeregt bis mitfühlend variieren kann – und auch fließend zwischen Englisch und Italienisch übersetzt.

ChatGPT wird damit zu einem mächtigen Konkurrenten für die Sprachassistenten der Tech-Schwergewichte wie Amazons Alexa und Apples Siri, die im Vergleich dazu sehr schlicht wirken. Zuletzt gab es Medienberichte, Apple verhandele mit OpenAI über eine Integration von Technologie der Firma in seine Software.

Chatbot hilft bei Mathe-Gleichung

Weitere Neuerung: Gleichzeitig mit gesprochenen Befehlen kann ChatGPT auch Informationen von einer Smartphone-Kamera verarbeiten. In einem Livestream demonstrierte OpenAI unter anderem, wie das neue Modell dadurch helfen kann, eine Mathe-Gleichung zu lösen. ChatGPT gab per Stimme Ratschläge für den Rechenweg, ohne das Ergebnis zu verraten.

Ein Mitarbeiter von OpenAI schrieb dafür die Gleichung auf ein Blatt Papier und richtete die Smartphone-Kamera darauf. Fragen an ChatGPT stellte er mündlich – und die Software folgte per Kamera seinem Fortschritt. Einziger Patzer: Der Chatbot behauptete erst, er sehe die Aufgabe, noch bevor er die Gleichung aufschrieb. „Oops, ich war zu aufgeregt“, entschuldigte sich ChatGPT.

Auch bat ein OpenAI-Mitarbeiter den Chatbot, seine Laune an dem Gesichtsausdruck zu erkennen. Schwer machte er es ChatGPT mit einem breiten Grinsen allerdings nicht. Das gilt auch für andere Live-Demonstrationen am Montag: Sie funktionierten weitgehend reibungslos, aber man weiß nicht, wie gut die Software unter realen Alltagsbedingungen agiert. Alle Interaktionen wurden mit dem Weck-Satz „Hey, ChatGPT“ eingeleitet – ähnlich wie man es von heutigen Sprachassistenten kennt.

Gutenachtgeschichte erfinden und vorlesen lassen

In einer weiteren Demo erfand ChatGPT eine Gutenachtgeschichte und las sie vor. Dabei konnte man die Software unterbrechen und bitten, mehr Dramatik in die Stimme zu bringen oder wie ein Roboter zu sprechen. Den letzten Satz sang ChatGPT auf Wunsch sogar vor.

OpenAI-Chef Sam Altman schrieb nach der Präsentation, es sei die beste Art, einen Computer zu bedienen, die er je erlebt habe. „Es fühlt sich an wie die KI aus Kinofilmen. Und es überrascht mich immer noch ein wenig, dass es real ist.“ Altman verwies zuvor schon auf den rund ein Jahrzehnt alten Film „Her“, in dem sich der von Joaquin Phoenix gespielte Protagonist in eine KI-Assistenzsoftware verliebt. Die weibliche Stimme von ChatGPT in der Präsentation erinnerte tatsächlich an den Film.

Automatische Übersetzung für Betrugs-Anrufe

Zugleich warnte die IT-Sicherheitsexpertin Rachel Tobac umgehend, dass zum Beispiel Funktionen wie die automatische Übersetzung für Betrugs-Anrufe genutzt werden könne, die zuvor an Sprachbarrieren gescheitert war.

Abo-Kunden von OpenAI werden mehr Leistung in dem Modell bekommen. Zugleich machte OpenAI die Interaktionen für kommerzielle Nutzer günstiger. Man werde jede Menge Dinge finden, für die man Geld verlangen könne, schrieb Altman dazu. Und das werde OpenAI helfen, kostenlos hoffentlich Milliarden Menschen zu bedienen.

Nach bisherigen Angaben kommt ChatGPT auf rund 100 Millionen Nutzer. Es dürfte einige Wochen dauern, bis das neue Modell breit verfügbar ist. Wenige Stunden nach der Präsentation meldete OpenAI eine Störung bei dem Modell, die jedoch schnell wieder behoben wurde.

Google-Entwicklerkonferenz am Dienstag

Der Zeitpunkt der Präsentation ist interessant: Am Dienstag hält Google seine jährliche Entwicklerkonferenz ab, bei der auch Ankündigungen zu neuen Funktionen mit Künstlicher Intelligenz erwartet werden. Google zeigte bereits vor einigen Monaten, wie seine KI-Software Gemini gesprochene und visuelle Informationen verarbeiten kann.

Gerade angesagt

Olympische Spiele in Paris: Eröffnungszeremonie ist ein grandioses Fest der französischen Kultur und Vielfalt

Jugendhaftanstalt Hameln: Hier saß der „Göhrde-Mörder“ ein

Merz: „Wir haben ein Potenzial von 35 Prozent und mehr“

So sehen Sie die Olympischen Spiele 2024 in Paris im TV

Ist das Verschlucken eines Kaugummis schädlich?

Chatbot hilft bei Mathe-Gleichung

Gutenachtgeschichte erfinden und vorlesen lassen

Automatische Übersetzung für Betrugs-Anrufe

Google-Entwicklerkonferenz am Dienstag

Toniebox blinkt blau – so beheben Sie das Problem

SpaceX-Rakete könnte schon morgen wieder starten

Warum kann ich mein Amazon-Guthaben nicht verwenden?

Öl statt Blutvergießen: Action-Shooter-Spiel mal anders

Erstes EU-KI-Gesetz: Welche Technologien bald verboten sind und warum

Konkurrenz zu Google und Co.: OpenAI stellt KI-Suchmaschine vor

Jugendhaftanstalt Hameln: Hier saß der „Göhrde-Mörder“ ein

Merz: „Wir haben ein Potenzial von 35 Prozent und mehr“

So sehen Sie die Olympischen Spiele 2024 in Paris im TV

Ist das Verschlucken eines Kaugummis schädlich?

Wie die Weltbank Bosnien und Herzegowinas Wirtschaft unterstützt

Kaufhofgebäude gehört jetzt der Stadt

Heizung, Bafög, Ausbildung: Das ändert sich im August

Das kann die Elektrolimousine – und das sagt eine Tesla-Fahrerin

Gerade angesagt

KI-Revolution? ChatGPT-4o erkennt jetzt menschliche Emotionen

Chatbot hilft bei Mathe-Gleichung

Gutenachtgeschichte erfinden und vorlesen lassen

Automatische Übersetzung für Betrugs-Anrufe

Google-Entwicklerkonferenz am Dienstag

Ähnliche Neuigkeiten