Codex ist ein cloudbasierter Softwareentwicklungsagent, der viele Aufgaben gleichzeitig übernehmen kann – von der Bugfixing-Automation bis hin zum Schreiben von Tests und Pull-Requests. Ab sofort für ChatGPT Pro, Team und Enterprise verfügbar – bald auch für Plus-Nutzer.
Was ist Codex?
Codex ist ein intelligenter Softwareentwicklungsagent, der auf dem leistungsstarken Modell codex-1 basiert – einer speziell auf Programmierung optimierten Version von OpenAI o3. Als cloudbasierte Lösung kann Codex verschiedene Entwicklungsaufgaben gleichzeitig in isolierten Sandbox-Umgebungen ausführen, die automatisch mit Ihrem Repository vorkonfiguriert sind.
Der Agent schreibt neue Features, analysiert Quellcode, behebt Fehler, erstellt Tests und schlägt Pull-Requests vor – alles in einem Workflow, der sich nahtlos in moderne Entwicklungsprozesse integrieren lässt.
So funktioniert Codex in der Praxis
Sie finden Codex direkt in der ChatGPT-Seitenleiste. Dort können Sie per Eingabeaufforderung neue Aufgaben starten („Code“) oder Fragen zu Ihrem Code stellen („Ask“). Jede Aufgabe wird unabhängig in einer geschützten Umgebung mit Zugriff auf Ihr Repository ausgeführt. Codex kann:
- Dateien lesen und bearbeiten
- Tests, Linter und Typechecker ausführen
- Aufgaben in 1 bis 30 Minuten abschließen – je nach Komplexität
Am Ende eines Tasks dokumentiert Codex jeden Schritt mit Terminal-Logs und Testergebnissen. Sie können Änderungen prüfen, Feedback geben oder direkt Pull-Requests erstellen – alles auf GitHub integrierbar.
AGENTS.md: Maßgeschneiderte Anleitungen für Ihre Projekte
Entwickler können Codex mit sogenannten AGENTS.md-Dateien gezielt steuern. Diese Textdateien enthalten projektspezifische Informationen wie Navigationshinweise, Testbefehle oder Codierstandards. Auch ohne AGENTS.md erzielt Codex-1 beeindruckende Ergebnisse – doch wie bei menschlichen Entwicklern verbessern klare Anweisungen und stabile Testumgebungen die Performance erheblich.
Sicherheit und Vertrauenswürdigkeit
Codex wird im Rahmen einer Forschungsvorschau veröffentlicht, in der Sicherheit, Transparenz und Nachvollziehbarkeit oberste Priorität haben:
- Alle Änderungen sind überprüfbar durch Log-Ausgaben
- Internetzugriff ist deaktiviert
- Ausführung nur in isolierten Cloud-Containern
- Schutzmaßnahmen gegen Missbrauch, z. B. bei Malware-Entwicklung
- Schutz vor Fehlverhalten durch abgestufte Richtlinien und regelmäßige Bewertungen
Codex in der Praxis: Anwendungsbeispiele
OpenAI nutzt Codex intern zur Automatisierung von Aufgaben wie Refactoring, Testgenerierung oder Bugfixing. Auch externe Partner berichten von produktiven Anwendungsfällen:
- Cisco: Innovation durch schnellere Feature-Entwicklung
- Temporal: Beschleunigte Iteration durch automatisierte Tests
- Superhuman: Testabdeckung erhöhen, Integrationsfehler beheben
- Kodiak: Entwicklung von Debugging-Tools für autonomes Fahren
Codex CLI und Codex-mini
Neben der ChatGPT-Integration gibt es Codex CLI – eine leichtgewichtige Kommandozeilenversion, die mit codex-mini-latest arbeitet, einer kleineren Variante von o4-mini. Vorteile:
- Schnelle Antworten auf Coding-Fragen
- Optimiert für lokale Workflows
- Geringe Latenz, hohe Genauigkeit
- Integration direkt im Terminal
- Kostenloses API-Guthaben für Pro- und Plus-Nutzer
Preise und Verfügbarkeit
Codex wird schrittweise für Pro-, Team- und Enterprise-Nutzer ausgerollt, bald auch für Plus- und Edu-Abos. Die Nutzung ist aktuell kostenlos, später folgt ein flexibles Preismodell mit nutzungsabhängiger Abrechnung.
API-Preise für codex-mini-latest:
- 1,50 $ pro 1M Eingabetokens
- 6 $ pro 1M Ausgabetokens
- 75 % Rabatt bei Prompt-Caching
Die Zukunft mit Codex: Zusammenarbeit mit KI-Agenten
OpenAI plant die Weiterentwicklung von Codex hin zu einer vollständigen Multi-Agenten-Architektur mit:
- Asynchroner Aufgabenverteilung
- Mid-Task-Kommunikation
- Nahtloser Integration in IDEs, CI/CD-Systeme und Issue Tracker
- Kombination aus Live-Zusammenarbeit und langfristiger Delegation
Ziel ist eine Entwicklerumgebung, in der Teams effizienter arbeiten, sich auf kreative Aufgaben konzentrieren und Routinearbeit an KI übergeben können – produktiv, sicher und skalierbar.