Neue Werkzeuge und Funktionen in der Responses API – Verbesserte Tools für Entwickler und Unternehmen

Responses API

OpenAI erweitert die Responses API, das zentrale API-Framework für die Entwicklung intelligenter Agentenanwendungen, um neue leistungsstarke Tools und Funktionen. Dazu gehören nun die Unterstützung für entfernte MCP-Server, Bildgenerierung, der Code Interpreter sowie Verbesserungen bei der Dateisuche. Diese Innovationen sind in den Modellen der GPT‑4o-Reihe, GPT‑4.1-Reihe und den OpenAI o-Serie Reasoning-Modellen verfügbar.

Unterstützung für entfernte MCP-Server: Mehr Flexibilität für Entwickler

Mit der neuen Integration können Entwickler entfernte MCP-Server (Model Context Protocol) nahtlos in ihre Anwendungen einbinden. MCP ist ein offenes Protokoll, das den standardisierten Kontextaustausch zwischen Anwendungen und großen Sprachmodellen (LLMs) ermöglicht. Durch die Unterstützung in der Responses API lassen sich Modelle jetzt mit Tools auf jedem MCP-Server verbinden – mit nur wenigen Codezeilen.

Beispiele für MCP-Server-Integration

Shopify

  • Shopify: Produkte können direkt zum Warenkorb hinzugefügt werden.
  • Twilio: Automatisiertes Versenden von Nachrichten mit aktuellen Informationen.
  • Stripe: Generierung von Zahlungslinks basierend auf Nutzungsdaten.
  • DeepWiki: Abrufen relevanter Wissensinhalte auf Anfrage.

Diese Flexibilität erleichtert Entwicklern die Erstellung hochfunktionaler Agenten, die bereits genutzte Tools und Datenquellen ihrer Nutzer einbinden können.

Neue Werkzeuge in der Responses API: Bildgenerierung, Code Interpreter und Dateisuche

Bildgenerierung als integriertes Tool

Neben der bestehenden Images API steht mit dem Modell gpt-image-1 nun ein Echtzeit-Bildgenerierungstool direkt in der Responses API zur Verfügung. Es unterstützt:

  • Streaming von Bildvorschauen: Entwickler sehen die Bildentstehung live.
  • Mehrstufige Bildbearbeitung: Schrittweise, gezielte Bildanpassungen durch Nutzer-Prompts.

Code Interpreter: Intelligente Analyse und Problemlösung

Der Code Interpreter hilft bei:

  • Datenanalysen und komplexen mathematischen Problemen.
  • Programmieraufgaben und tiefgreifendem Verständnis visueller Inhalte.

Modelle wie o3 und o4-mini nutzen den Code Interpreter in ihrem Denkprozess, was die Leistungsfähigkeit bei verschiedenen Benchmarks steigert.

Erweiterte Dateisuche

Die verbesserte Dateisuche ermöglicht es, gezielt relevante Dokumentteile aus mehreren Vektor-Datenbanken mit Attributfiltern abzurufen. So wird die Kontextualisierung von Nutzeranfragen noch präziser.

Neue Features für bessere Zuverlässigkeit, Sichtbarkeit und Datenschutz

API Responses

Hintergrundmodus für langwierige Aufgaben

Der Background Mode erlaubt das asynchrone Ausführen komplexer Berechnungen, ohne Verbindungsabbrüche oder Timeouts zu riskieren. Entwickler können entweder den Abschluss abfragen oder Ereignisse streamen, um immer auf dem neuesten Stand zu bleiben.

Automatische Zusammenfassungen des Denkprozesses

Die Responses API erstellt jetzt automatisch natürliche Sprachzusammenfassungen der internen Denkabläufe der Modelle. Das erleichtert Debugging, Auditierung und verbessert die Nutzererfahrung – ganz ohne Zusatzkosten.

Verschlüsselte Denkprozesse für mehr Datenschutz

Für Kunden mit Zero Data Retention (ZDR) sind verschlüsselte Denkprozesse verfügbar. Diese werden nicht auf OpenAI-Servern gespeichert, ermöglichen aber durch Wiederverwendung eine intelligente und kosteneffiziente Modellnutzung.

Einsatz und Erfolg der Responses API seit März 2025

Seit ihrer Einführung mit Websuche, Dateisuche und Computerfunktionalität wurde die Responses API von Hunderttausenden Entwicklern genutzt, die Billionen von Tokens verarbeitet haben. Bedeutende Anwendungen sind zum Beispiel:

  • Zencoder: Ein Coding-Agent für Entwickler.
  • Revi: Marktanalyse-Agent für Private Equity und Investmentbanking.
  • MagicSchool AI: Bildungshilfe mit aktuellen Webinformationen.

Mit den heutigen Neuerungen können Entwickler noch zuverlässigere und vielseitigere Agenten erschaffen.

Preise und Verfügbarkeit der neuen Funktionen

  • Bildgenerierung: 5 US-Dollar pro 1 Mio. Texteingabe-Tokens, 10 US-Dollar pro 1 Mio. Bildeingabe-Tokens, 40 US-Dollar pro 1 Mio. Bildausgabe-Tokens (75 % Rabatt auf gecachte Eingabetokens).
  • Code Interpreter: 0,03 US-Dollar pro Container.
  • Dateisuche: 0,10 US-Dollar pro GB Vektor-Speicher pro Tag, 2,50 US-Dollar pro 1000 Tool-Aufrufe.
  • Remote MCP-Server: Keine Zusatzkosten, Abrechnung nur nach Ausgabetokens.

Alle Funktionen sind für GPT‑4o-Serie, GPT‑4.1-Serie und OpenAI o-Serie Reasoning-Modelle verfügbar. Die Bildgenerierung ist exklusiv für das o3 Modell.

OpenAI freut sich auf die innovativen Anwendungen, die Entwickler mit diesen neuen Werkzeugen bauen werden!

Author

Leave a Reply

Your email address will not be published. Required fields are marked *