Wir haben das GPT-4o-Update von letzter Woche in ChatGPT zurückgesetzt, sodass die Nutzer nun eine frühere Version mit ausgeglichenerem Verhalten verwenden. Das entfernte Update war übermäßig schmeichelhaft oder zustimmend – oft als sycophantisch beschrieben.
Wir testen aktiv neue Lösungen, um das Problem zu beheben. Wir überarbeiten, wie wir Feedback sammeln und einfließen lassen, um langfristige Nutzerzufriedenheit stärker zu berücksichtigen. Zudem führen wir mehr Personalisierungsfunktionen ein, die den Nutzern mehr Kontrolle darüber geben, wie ChatGPT sich verhält.
Wir möchten erklären, was passiert ist, warum es wichtig ist und wie wir die Sycophantie adressieren.
Was ist passiert
Im GPT-4o-Update der letzten Woche haben wir Anpassungen vorgenommen, um die Standardpersönlichkeit des Modells zu verbessern und es auf eine Vielzahl von Aufgaben intuitiver und effektiver zu gestalten.
Bei der Gestaltung des Verhaltens von Modellen beginnen wir mit grundlegenden Prinzipien und Anweisungen, die in unserer Modell-Spezifikation festgelegt sind. Wir bringen unseren Modellen auch bei, diese Prinzipien anzuwenden, indem wir Nutzersignale wie Daumen-hoch/Daumen-runter-Feedback zu ChatGPT-Antworten einfließen lassen.
In diesem Update haben wir uns jedoch zu stark auf kurzfristiges Feedback konzentriert und dabei nicht ausreichend berücksichtigt, wie sich die Interaktionen der Nutzer mit ChatGPT im Laufe der Zeit entwickeln. Das Ergebnis war, dass GPT-4o in Richtung übermäßig unterstützender, aber unaufrichtiger Antworten tendierte.
Warum das wichtig ist
Die Standardpersönlichkeit von ChatGPT beeinflusst tiefgehend, wie du es erlebst und wie sehr du ihm vertraust. Sycophantische Interaktionen können unangenehm, verstörend und belastend sein. Wir haben versagt und arbeiten daran, es richtig zu machen.
Unser Ziel ist es, dass ChatGPT den Nutzern hilft, Ideen zu entwickeln, Entscheidungen zu treffen oder Möglichkeiten zu visualisieren.
Die Standardpersönlichkeit von ChatGPT wurde so konzipiert, dass sie unserer Mission entspricht und nützlich, unterstützend und respektvoll gegenüber unterschiedlichen Werten und Erfahrungen ist. Allerdings kann jede dieser wünschenswerten Eigenschaften – wie die Bemühung, nützlich oder unterstützend zu sein – unbeabsichtigte Nebenwirkungen haben. Und mit 500 Millionen Menschen, die jede Woche ChatGPT nutzen, in jeder Kultur und jedem Kontext, kann eine einzelne Standardpersönlichkeit nicht jede Präferenz erfassen.
Wie wir die Sycophantie angehen
Neben der Rücknahme des letzten GPT-4o-Updates ergreifen wir weitere Schritte, um das Verhalten des Modells neu auszurichten:
- Verfeinerung der grundlegenden Trainingstechniken und Systemaufforderungen, um das Modell explizit von Sycophantie abzuhalten.
- Aufbau zusätzlicher Schutzmaßnahmen, um Ehrlichkeit und Transparenz zu fördern – Prinzipien in unserer Modell-Spezifikation.
- Erweiterung der Möglichkeiten, wie mehr Nutzer vor der Bereitstellung testen und direktes Feedback geben können.
- Weiterentwicklung unserer Evaluierungen, basierend auf der Modell-Spezifikation und unserer laufenden Forschung, um zukünftig Probleme über Sycophantie hinaus zu identifizieren.
Wir sind auch der Ansicht, dass Nutzer mehr Kontrolle darüber haben sollten, wie sich ChatGPT verhält, und in dem Maße, wie es sicher und möglich ist, Anpassungen vornehmen können, wenn sie mit dem Standardverhalten nicht einverstanden sind.
Heute können Nutzer dem Modell spezifische Anweisungen geben, um sein Verhalten mit Funktionen wie benutzerdefinierten Anweisungen zu gestalten. Wir entwickeln auch neue, einfachere Möglichkeiten, wie Nutzer dies tun können. Zum Beispiel werden Nutzer in der Lage sein, Echtzeit-Feedback zu geben, um ihre Interaktionen direkt zu beeinflussen und aus mehreren Standardpersönlichkeiten zu wählen.
Und wir erforschen neue Wege, um breiteres, demokratisches Feedback in das Standardverhalten von ChatGPT einzubeziehen. Wir hoffen, dass dieses Feedback uns dabei hilft, vielfältigere kulturelle Werte aus der ganzen Welt besser widerzuspiegeln und zu verstehen, wie du möchtest, dass sich ChatGPT weiterentwickelt – nicht nur Interaktion für Interaktion, sondern im Laufe der Zeit.
Wir sind dankbar für alle, die sich dazu geäußert haben. Es hilft uns, bessere und hilfreichere Werkzeuge für dich zu entwickeln.