Die nächste Generation der KI ist da
OpenAI stellt mit o3 und o4-mini seine bisher leistungsstärksten Modelle vor. Diese neuen Sprachmodelle der o-Serie wurden entwickelt, um länger zu denken, bevor sie antworten, und kombinieren fortschrittliche Schlussfolgerungen mit vollständigem Zugriff auf alle Tools in ChatGPT. Dazu zählen Websuche, Python-Analysen, visuelle Erkennung und sogar Bildgenerierung.
Dank ihrer Fähigkeit, selbstständig Tools zu kombinieren und strategisch einzusetzen, lösen o3 und o4-mini komplexe Probleme in weniger als einer Minute – ein entscheidender Schritt in Richtung einer agentischen KI.
Was ist neu bei OpenAI o3?
OpenAI o3 ist das fortschrittlichste Reasoning-Modell bisher. Es erzielt neue Bestwerte bei Benchmarks wie Codeforces, SWE-bench und MMMU – ganz ohne modellspezifische Anpassungen.
Highlights:
- Starke Leistung in Mathematik, Programmierung, Naturwissenschaften und visuellem Denken
- Herausragende Bildanalyse-Fähigkeiten
- 20 % weniger kritische Fehler als Vorgängermodell o1
- Ideal für komplexe Fragestellungen und kreative Aufgabenstellungen
In Tests von externen Experten überzeugte o3 besonders im Bereich Biologie, Ingenieurwesen und Geschäftsanalyse durch seine Fähigkeit, neue Hypothesen zu generieren und kritisch zu bewerten.
o4-mini: Effizienz trifft Intelligenz
o4-mini ist ein kleineres Modell, optimiert für kosteneffizientes Reasoning mit starker Leistung in Mathematik, Programmierung und visuellen Aufgaben.
Wichtige Fakten:
- Beste Ergebnisse bei AIME 2024 & 2025 (mit Toolnutzung)
- 99,5 % Bestehensquote (pass@1) bei AIME 2025 mit Python-Zugriff
- Höhere Nutzungsgrenzen im Vergleich zu o3
- Übertrifft o3-mini in STEM- und Non-STEM-Bereichen
Multimodales Denken mit Bildern
Erstmals können diese Modelle Bilder in ihren Denkprozess integrieren. Das ermöglicht völlig neue Arten der Problemlösung, z. B.:
- Interpretation unscharfer Whiteboard-Fotos oder Diagramme
- Visuelle Transformationen (z. B. Zoom, Rotation) zur Problemlösung
- Beste Ergebnisse in visuell-multimodalen Benchmarks
Agentische Tool-Nutzung in der Praxis
Mit vollem Toolzugriff agieren o3 und o4-mini selbstständig und strategisch. Ein Beispiel: Die Frage „Wie entwickelt sich der Energieverbrauch in Kalifornien im Sommer?“ kann wie folgt gelöst werden:
- Websuche nach aktuellen Versorgungsdaten
- Python-Prognosecode schreiben
- Grafiken erzeugen und erläutern
Die Modelle kombinieren Recherche, Analyse und Präsentation eigenständig und effizient.
Skalierung durch Reinforcement Learning
Die Trainingsmethode basiert auf großflächigem Reinforcement Learning. Mehr Rechenleistung bedeutet bei o3 und o4-mini auch bessere Ergebnisse – sowohl bei Benchmarks als auch in echten Anwendungen.
Beide Modelle wurden darauf trainiert, nicht nur Tools zu nutzen, sondern auch zu entscheiden, wann und wie diese Tools eingesetzt werden sollen.
Sicherheit und Verantwortung
Sicherheit steht an erster Stelle: Die Trainingsdaten wurden vollständig überarbeitet, inklusive neuer Verweigerungsprompts zu sensiblen Themen wie Biorisiken und Malware. Ein spezieller LLM-Monitor erkennt und blockiert riskante Anfragen mit einer Erkennungsrate von über 99 %.
In Übereinstimmung mit dem „Preparedness Framework“ wurden o3 und o4-mini in den Bereichen Biologie, Cybersicherheit und KI-Selbstverbesserung geprüft – mit der Einstufung unterhalb der Hochrisiko-Schwelle.
Codex CLI: Leistungsstarkes Reasoning im Terminal
Mit Codex CLI bringt OpenAI eine leichtgewichtige, quelloffene Schnittstelle ins Terminal. Sie nutzt die Stärken von o3 und o4-mini für Coding, Debugging und multimodale Analyse direkt am lokalen Rechner.
Gleichzeitig startet OpenAI ein 1-Million-Dollar-Förderprogramm für Projekte, die Codex CLI und OpenAI-Modelle innovativ nutzen.
Verfügbarkeit und Zugang
Ab sofort sind o3, o4-mini und o4-mini-high für Nutzer von ChatGPT Plus, Pro und Team verfügbar. Enterprise- und Edu-Nutzer erhalten in einer Woche Zugang. o4-mini ist auch für kostenlose Nutzer über die Option „Denken“ im Composer testbar.
Entwickler können beide Modelle über die Chat Completions API und die Responses API verwenden – mit neuen Funktionen wie integrierter Websuche und Dateianalyse in Vorbereitung.
Ausblick: Konvergenz von Dialog und Intelligenz
Die o-Serie entwickelt sich zur Verbindung von präzisem Reasoning und natürlicher Konversation. Zukünftige Modelle werden Tool-Nutzung, Dialog und Problemlösung nahtlos kombinieren – für intelligentere, persönlichere und nützlichere KI-Erfahrungen.