GPT-5 ist das fünfte und aktuelle Flaggschiff-Modell der generativen vortrainierten Transformer (GPT) von OpenAI. Es wurde am 7. August 2025 eingeführt und stellt eine Weiterentwicklung der Vorgängermodelle, einschließlich GPT-4 und seiner Varianten, dar. GPT-5 ist als multimodales großes Sprachmodell konzipiert, das Text, Bilder und Audioinhalte verarbeiten sowie generieren kann.
Definition und Architektur von GPT-5
GPT-5 ist ein umfassendes System, das darauf ausgelegt ist, sowohl rationale als auch nicht-rationale Funktionen unter einer einheitlichen Benutzeroberfläche zu integrieren. Eine zentrale Innovation ist der Echtzeit-Router, der automatisch entscheidet, ob ein schnelles, durchsatzstarkes Modell für Routineanfragen oder ein tiefergehendes “Denkmodell” für komplexe Denkprozesse eingesetzt werden soll. Dies eliminiert die Notwendigkeit für Benutzer, manuell zwischen spezialisierten Modellen zu wechseln.
Das Modell wurde von Grund auf als nativ multimodales System trainiert, was bedeutet, dass es gleichzeitig mit verschiedenen Datenmodalitäten wie Text und Bildern entwickelt wurde, anstatt auf bereits trainierte Sprach- oder Visionsmodelle aufzubauen. Der Trainingsprozess umfasste unüberwachtes Vortraining, überwachtes Fine-Tuning und Reinforcement Learning mittels menschlichem Feedback.
Schlüsselmerkmale und Leistungsfähigkeit
GPT-5 bietet eine Reihe signifikanter Verbesserungen und neuer Funktionen:
- Fortschrittliche Denkfähigkeiten: Das Modell zeigt eine deutlich verbesserte Fähigkeit, mehrstufige Probleme zu lösen, mehrdeutige Fragen zu interpretieren und detaillierte Begründungen für seine Antworten zu liefern. Es kann erweiterte logische Ketten durchführen und eigenständig entscheiden, wann schnelles Handeln oder tiefgreifendes Nachdenken erforderlich ist.
- Erweiterte Multimodalität: GPT-5 kann nicht nur Text, sondern auch Bilder und Audio als Eingabe verarbeiten und entsprechende Ausgaben generieren. Dies ermöglicht komplexere Interaktionen und Anwendungen.
- Reduzierte Halluzinationen: Im Vergleich zu früheren Modellen weist GPT-5 eine drastisch niedrigere Rate an Halluzinationen bei faktenbasierten Aufgaben auf. Bei aktivierter Web-Suche reduziert sich die Wahrscheinlichkeit faktischer Fehler um 45 % im Vergleich zu GPT-4o, und im Denkmodus sinken die Fehlerraten sogar um 80 % gegenüber früheren Denkmodellen.
- Längeres Kontextfenster: Für API-Anwender unterstützt GPT-5 eine kombinierte Eingabe- und Ausgabekontextlänge von bis zu 400.000 Tokens. Dies ermöglicht die Verarbeitung umfangreicherer Dokumente und längerer Konversationen.
- Verbesserte Programmierfähigkeiten: Das Modell erreicht auf Benchmarks wie SWE-bench Verified eine Leistung von 74,9 % und auf Aider Polyglot 88 %. Es ist effizienter als Vorgängermodelle und benötigt bei hoher Denkintensität 22 % weniger Ausgabetokens und 45 % weniger Tool-Aufrufe, um ähnliche Ergebnisse zu erzielen.
- Agentische Funktionen: GPT-5 kann selbstständig einen Desktop einrichten und einen Browser nutzen, um eigenständig relevante Quellen für eine Aufgabe zu recherchieren.
- Verfügbarkeit: GPT-5 ist für alle ChatGPT-Benutzer als Standardmodell verfügbar und über die OpenAI API für Entwickler zugänglich. Es existieren verschiedene Varianten wie
gpt-5,gpt-5-miniundgpt-5-nano, die für unterschiedliche Anforderungen an Geschwindigkeit, Kosten und Denktiefe optimiert sind.



