OpenAI hat damit begonnen, den neuen erweiterten Audiomodus von ChatGPT für eine kleine Anzahl von Personen bereitzustellen, die ChatGPT Plus abonniert haben. Die Funktion, die OpenAI bei einer GPT-4o-Auftaktveranstaltung im Mai vorführte, wurde wegen ihrer Ähnlichkeit mit Scarlett Johanssons Stimme kritisiert und später aus Sicherheitsgründen verschoben.
Bei der OpenAI-Veranstaltung schien der neue Audiomodus deutlich leistungsfähiger zu sein als der aktuelle Audiomodus von ChatGPT. Auf der Bühne konnten OpenAI-Mitarbeiter den Chatbot unterbrechen und ihm Fragen stellen Eine Geschichte auf unterschiedliche Weise erzählenDer Chatbot verarbeitete ihre Unterbrechungen reibungslos und passte seine Antworten an.
Der erweiterte Modus sollte Ende Juni in der Alpha starten, aber OpenAI verzögerte die Einführung um einen Monat, um „die Startschwelle zu erreichen“. Im Rahmen dieser Verzögerung entschied das Unternehmen Er sagte, es sei so „Verbessern Sie die Fähigkeit des Modells, bestimmte Inhalte zu erkennen und abzulehnen.“ OpenAI-Sprecherin Taya Christianson sagt, das Unternehmen habe die Fähigkeiten des Sprachmodells mit mehr als 100 externen Red-Team-Mitgliedern getestet (Personen, die versuchen, Technologien anzugreifen, um Schwachstellen zu finden). Das Unternehmen war in letzter Zeit einer intensiven Prüfung seiner Sicherheitsrichtlinien ausgesetzt, daher war diese Pause vielleicht die richtige Entscheidung. OpenAI hat außerdem „neue Filter hinzugefügt, die bestimmte Anfragen zur Generierung von Musik oder anderen urheberrechtlich geschützten Audiodaten erkennen und blockieren“, sagt Christianson.
Während der OpenAI-Veranstaltung war einer der Hauptkritikpunkte am neuen Modus, wie ähnlich die Stimme auf der Bühne mit dem Spitznamen „Sky“ der von Johansson war, der die KI-Figur im Film spielte. Ha. Während vor der Frühjahrsdemo von OpenAI Audio in ChatGPT vorhanden war, zog das Unternehmen es zurück, kurz bevor Johansson bekannt gab, dass es Nachrichten an OpenAI gesendet hatte, in denen gefragt wurde, wie man Audio erstellt. Der neue Modus von ChatGPT werde nur vier vordefinierte Stimmen verwenden, die mit Synchronsprechern erstellt wurden, sagt Christianson und fügt hinzu: „Wir haben ihn ziemlich optimiert.“ ChatGPT ist nicht in der Lage, die Stimmen anderer Personen zu imitieren, seien es Einzelpersonen oder Persönlichkeiten des öffentlichen Lebens, und Ausgaben, die von einer dieser vordefinierten Stimmen abweichen, werden blockiert.
Laut Christianson plant OpenAI, den neuen Modus im Herbst allen ChatGPT Plus-Benutzern anzubieten.