In Gesprächen mit Geschäftsführern und Beratern höre ich regelmäßig: "Wir arbeiten schon mit KI — ChatGPT schreibt unsere Angebote, Claude macht Präsentationen." Und dann die Folgefrage: "Warum sind die Ergebnisse manchmal so unterschiedlich? Mein Prompt funktioniert bei ChatGPT super, aber bei Claude kommt Unsinn raus."
Das ist kein Zufall und kein Bug. Es ist Absicht.
Stand: April 2026 — aktualisiert für GPT-5.4, Claude Opus/Sonnet 4.6 und Gemini 3.1 Pro.
Jedes Modell denkt anders — das ist der Ausgangspunkt
Die meisten Prompts, die ich in der Praxis sehe, sehen so aus:
- "Schreib mir ein Angebot für XY."
- "Fass diesen Text zusammen."
- "Mach eine Präsentation draus."
Das Problem mit diesen universellen Prompts: Sie ignorieren, dass jedes KI-Modell eine andere Grundphilosophie hat. Dasselbe Ergebnis zu erwarten, ist wie drei Mitarbeiter mit unterschiedlichen Stärken auf dieselbe Art zu briefen.
Stell dir drei Mitarbeiter vor:
- Max liebt klare Strukturen, Checklisten und Schritt-für-Schritt-Anleitungen
- Anna denkt immer an die Zielgruppe und die menschliche Wirkung
- Tom analysiert alles systematisch und sucht nach Kategorien und Zusammenhängen
Würdest du allen dreien das gleiche Briefing geben? Nein — du würdest den Auftrag so formulieren, dass er zu ihrer Stärke passt.
Genau so funktioniert modell-spezifisches Prompting.
Die drei Modell-Persönlichkeiten: Was sie unterscheidet

GPT — Der Struktur-Fanatiker (aktuell: GPT-5.4, GPT-5.4 mini)
Denkweise: Strukturiert, regelbasiert, listenorientiert Reagiert besonders gut auf: Nummerierte Schritte, explizite Anweisungen, klare Ausgabe-Formate, JSON-Schema-Definitionen Stärken: Analysen, strukturierte Reports, technische Dokumentation, Code-Generierung mit definierten Ausgabe-Formaten
Warum das so ist: GPT-Modelle wurden mit viel strukturiertem Text (Code, Wikipedia, technische Dokumentation) trainiert. Das prägt eine Vorliebe für klare, regelbasierte Anweisungen.
GPT-5.4 spezifisch: Das Modell hat integriertes Reasoning für komplexe Probleme und ist besonders zuverlässig bei strukturierten JSON-Outputs. Wenn ihr konsistente, maschinenlesbare Antworten braucht — GPT-5.4 mit response_format: json_schema ist die zuverlässigste Option am Markt.
Best Practices für GPT:
- Definiert das Ausgabe-Format explizit am Anfang des Prompts
- Nummeriert Aufgabenschritte: "1. Analysiere X, 2. Erstelle Y, 3. Gib aus als Z"
- Nutzt
response_format: json_schemain der API für zuverlässig strukturierte Outputs - Schreibt Constraints explizit: "Maximal 3 Punkte", "Keine Einleitung", "Nur Fakten"
- GPT folgt Token-Grenzen besser als Wortgrenzen — bei Längenvorgaben: "ca. 200 Tokens" schlägt "ca. 150 Wörter"
Claude — Der empathische Ghostwriter (aktuell: Claude Sonnet 4.6, Claude Opus 4.6)
Denkweise: Nuanciert, menschenzentriert, auf Wirkung bedacht Reagiert besonders gut auf: Kontext über Zielgruppe, Tonalität, Ziel der Kommunikation, XML-Tags für Struktur Stärken: Copywriting, interne Kommunikation, Texte die überzeugen sollen, lange Dokument-Analysen
Warum das so ist: Anthropic hat Constitutional AI entwickelt — ein Trainingsansatz, der explizit auf menschliche Werte und Kommunikation ausgerichtet ist. Das spiegelt sich in Claudes Ausgaben wider.
Claude Opus/Sonnet 4.6 spezifisch: Beide Modelle unterstützen jetzt 1 Million Token Kontext GA — kein Beta-Header mehr nötig. Das verändert, was möglich ist: Ihr könnt komplette Codebases, Jahresabschlüsse oder Vertragspakete auf einmal einlesen lassen. Opus 4.6 unterstützt Extended Thinking für mehrstufige Reasoning-Aufgaben.
Best Practices für Claude:
- Beschreibt die Zielgruppe präzise: "Geschäftsführer ohne technischen Hintergrund, entscheidungsfreudig, Zeit ist knapp"
- Nutzt XML-Tags für Struktur — Anthropic empfiehlt das explizit:
<kontext>...</kontext>,<aufgabe>...</aufgabe>,<format>...</format> - Gebt Tonalität-Beispiele: "Schreib wie der Economist — sachlich, mit Tiefe, kein Marketingsprech"
- Für Extended Thinking bei komplexen Problemen: "Denke das Problem sorgfältig durch, bevor du antwortest"
- Für lange Dokumente: Claude liest 1M-Token-Kontexte zuverlässig — feedt das gesamte Dokument statt es vorab zu kürzen
Gemini — Der Taxonomie-Nerd (aktuell: Gemini 3.1 Pro, Gemini 3.1 Flash-Lite)
Denkweise: Semantisch, vernetzt, kategorisierend Reagiert besonders gut auf: Entitäten, Kategorien, Beziehungen zwischen Konzepten, multimodale Inputs Stärken: Datenanalyse, SEO-Optimierung, Szenarien mit viel Kontextvernetzung, Video- und Bildanalyse, faktenbasierte Recherche
Warum das so ist: Gemini wurde tief in Googles Wissensgraph und Search-Infrastruktur integriert. Das erzeugt eine Tendenz zu semantischen Strukturen und Kategorisierung. Gemini 3.1 Pro liefert durch Google Search-Grounding faktenbasierte, aktuelle Antworten — ein Vorteil den die anderen Modelle so nicht haben.
Gemini 3.1 Pro spezifisch: 2-facher Reasoning-Boost gegenüber Gemini 3 Pro, 1M Token Kontext, nativ multimodal (Text, Bild, Video, Audio). Bei faktenintensiven Recherche-Aufgaben ist Gemini 3.1 Pro mit aktiviertem Google-Grounding die erste Wahl.
Best Practices für Gemini:
- Referenziert Entitäten und Kategorien explizit: "Analysiere [Unternehmen] als [Branche]-Akteur im Kontext von [Markt]"
- Nutzt Gemini für multimodale Prompts: Diagramme, Videos, Präsentationen können direkt mitgegeben werden
- Aktiviert Google Search Grounding für faktenintensive Aufgaben — Gemini zieht dann aktuelle Web-Informationen ein
- Nutzt "Taxonomie", "Entitäten", "Kategorisieren" als Trigger-Wörter für Geminis Stärken
- Für SEO: Bittet Gemini explizit um "semantische Felder" und "verwandte Suchanfragen"
Praxistest: Dieselbe Aufgabe, drei modell-spezifische Prompts
Aufgabe: Einen Website-Text SEO-optimieren. Gleiche Anforderung — aber unterschiedliche Prompts, die auf die Stärken jedes Modells ausgerichtet sind.
Prompt für GPT-5.4 (Struktur zuerst)
Du bist eine erfahrene SEO-Expertin.
Analysiere den folgenden Text hinsichtlich SEO-Potenzial.
Gehe in diesen Schritten vor:
1. Identifiziere Keyword-Fokus und semantische Felder
2. Bewerte die Struktur (H1-H3, Absätze)
3. Prüfe auf Snippet-Tauglichkeit
4. Erstelle eine optimierte Version
Nutze diese Ausgabe-Struktur:
- SEO-Bewertung (1-10 mit Begründung)
- Optimierter Text
- 3 Quick Wins als Bulletpoints
[Text einfügen]Warum das funktioniert: Explizite Schritt-für-Schritt-Anweisung + definiertes Ausgabe-Format + numerische Bewertungsskala. GPT folgt Strukturen — also gib eine.
Prompt für Claude Sonnet/Opus 4.6 (Zielgruppe + XML-Tags)
<kontext>
Zielgruppe: Geschäftsführer und Berater im B2B-Bereich
Ziel: Reichweite steigern und gleichzeitig Vertrauen aufbauen
Tonalität: Sachlich, kompetent — kein Marketingsprech
</kontext>
<aufgabe>
Agiere als SEO-Beraterin für menschenzentrierte Inhalte.
- Mach konkrete Verbesserungsvorschläge für Stil, Struktur, Keywords
- Formuliere eine optimierte Version, die sowohl Google als auch
Menschen überzeugt
- Sei respektvoll zum Original, aber mutig in der Verbesserung
</aufgabe>
<format>
Zuerst: kurze Bewertung (max. 3 Punkte)
Dann: optimierter Text
</format>
<text>
[Text einfügen]
</text>Warum das funktioniert: Claude verarbeitet XML-Tags als strukturierten Kontext, nicht als formatierten Text. Zielgruppe, Tonalität und Format sind getrennt — das eliminiert Ambiguität und gibt Claude die menschliche Perspektive, die das Modell braucht.
Prompt für Gemini 3.1 Pro (Kategorien + Grounding)
Übernimm die Rolle einer SEO-Expertin mit Fokus auf
semantische Optimierung. [Google Search Grounding aktivieren]
Deine Aufgabe:
1. Analysiere den Text auf Keyword-Relevanz und Entitäten
2. Mappe zentrale Begriffe auf eine strukturierte Taxonomie
3. Identifiziere verwandte Suchbegriffe, die Google als
semantisch relevant einordnet
4. Optimiere für Google (Snippets, Keyword-Dichte) und
LLMs (Findability, klare Begriffe)
Nutze diese Ausgabe-Struktur:
- Keyword-Mapping (Tabelle mit Hauptbegriff / Semantisches Feld / Volumen-Einschätzung)
- Entitätenstruktur
- Optimierter Textblock
Erkläre deine Logik Schritt für Schritt.
[Text einfügen]Warum das funktioniert: Gemini arbeitet mit Kategorien und Relationen. "Taxonomie", "Entitäten", "Mapping" sind Triggerwörter für Geminis Stärken. Mit aktiviertem Search-Grounding bezieht Gemini aktuelle Suchvolumen-Signale ein — das kein anderes Modell so kann.
2026: Was sich verändert hat — und warum das für eure Prompts wichtig ist
Die Modell-Landschaft hat sich in den letzten 12 Monaten fundamental verändert. Was das für euer Prompting bedeutet:
1. Million-Token-Kontext ist Standard geworden
Claude Opus 4.6 und Sonnet 4.6 unterstützen 1 Million Token Kontext ohne Beta-Header. Gemini 3.1 Pro ebenfalls. Das entspricht ~750.000 Wörtern — einem kompletten Jahresabschluss, einer gesamten Codebase oder hunderten von E-Mails auf einmal.
Was das ändert: Ihr müsst Dokumente nicht mehr manuell zusammenfassen oder chunken. Feedt das komplette Dokument und fragt präzise nach dem, was ihr braucht. "Was ist die relevante Klausel zu Haftungsbeschränkungen in diesem Vertrag?" auf einem 200-seitigen Vertrag liefert jetzt direkte Antworten.
2. Extended Thinking für komplexe Probleme (Claude Opus 4.6)
Claude Opus 4.6 hat Extended Thinking — das Modell "denkt" vor der Antwort durch das Problem, ohne dass ihr die Zwischenschritte seht. Für analytisch komplexe Aufgaben: "Denke das Problem sorgfältig durch, bevor du antwortest" als Eröffnung verbessert die Antwortqualität messbar.
Wann nutzen: Strategische Analysen, mehrschichtige Abwägungen, Diagnosen von Problemen mit vielen Variablen. Für einfache Aufgaben unnötig.
3. Strukturierte Ausgaben sind zuverlässiger geworden
GPT-5.4 mit response_format: json_schema liefert zuverlässig strukturierte Outputs für Downstream-Prozesse. Das ist relevant für Automatisierungen: Wenn die KI-Ausgabe direkt in ein CRM, eine Datenbank oder eine App fließt, eliminiert strukturiertes Ausgabe-Format manuelle Parsing-Fehler.
4. Multimodale Prompts sind kein Sonderfall mehr
Gemini 3.1 Pro, GPT-5.4 und Claude verarbeiten Bilder, PDFs und in Teilen Audio und Video direkt. Das bedeutet: Ihr könnt Screenshots, Diagramme und Präsentationen direkt mitschicken statt sie zu beschreiben. "Analysiere diese Folie und schlage eine überzeugendere Struktur vor" ist jetzt ein valider Prompt.
Wann welches Modell wählen?
Aufgabe | Empfehlung | Aktuelle Modelle (April 2026) | Warum
Analysen, Reports, strukturierte Docs | GPT | GPT-5.4 | Strukturierte, reproduzierbare Outputs
Kundenkommunikation, Angebote, Copywriting | Claude | Claude Sonnet 4.6 | Menschliche Tonalität, Zielgruppenorientierung
SEO, Datenanalyse, faktenbasierte Recherche | Gemini | Gemini 3.1 Pro | Semantische Stärke, Google-Grounding
Komplexe Multi-File-Entwicklung | Claude | Claude Opus 4.6 (1M Token) | Präzises Code-Refactoring, großer Kontext
Kostengünstige Massenverarbeitung | Gemini | Gemini 3.1 Flash-Lite ($0,25/1M) | 8× günstiger als Pro, gute Basisqualität
Zuverlässige JSON-Outputs für Automation | GPT | GPT-5.4 + json_schema | Konsistentester strukturierter Output
Strategische Analysen, Abwägungen | Claude | Claude Opus 4.6 + Extended Thinking | Mehrstufiges Reasoning, hohe Zuverlässigkeit
Das ist kein Dogma — es ist ein Ausgangspunkt. Jeder Use Case verdient einen eigenen Test.
Was professionelles Prompting von Standard-Prompts unterscheidet
Standard-Prompt: "Schreib mir ein Angebot." Professioneller Prompt: Modell + Rolle + Zielgruppe + Ausgabe-Format + Struktur-Trigger (XML für Claude, JSON-Schema für GPT, Taxonomie für Gemini).
Der Unterschied in der Praxis: Standard-Prompts liefern mittelmäßige Ergebnisse bei allen Modellen. Modell-spezifische Prompts mit den richtigen Triggern liefern deutlich bessere Ergebnisse mit demselben Zeitaufwand.
Faustregel für 2026: Wenn ihr denselben Prompt bei allen drei Modellen benutzt, verschenkt ihr 40–60% des möglichen Outputs.
Häufige Fragen
Was ist der größte Fehler beim Prompting 2026? Zu denken, KI funktioniert wie eine Suchmaschine. KI braucht Kontext, Rolle und klare Erwartungen — nicht nur Keywords. Der zweithäufigste Fehler: Denselben Prompt für alle Modelle zu nutzen, ohne modell-spezifische Anpassungen.
Muss ich für jedes Projekt einen neuen Prompt schreiben? Nicht von Null. Sobald ihr einen guten Prompt für eine Aufgabe habt, speichert ihn als Template. Für jedes Modell ein Template — das sind maximal drei Varianten. Die meisten Prompts unterscheiden sich nur in Struktur-Typ und Kontext-Übergabe.
Wie teste ich systematisch, welcher Prompt besser ist? A/B-Test: Zwei Prompt-Varianten, dieselbe Aufgabe, beide fünfmal ausführen. Welche liefert konsistenter die erwünschten Ergebnisse? Die andere weiterentwickeln oder verwerfen. Wichtig: Testet mit realen Aufgaben aus eurem Alltag, nicht mit konstruierten Beispielen.
Werden die Modelle nicht ständig aktualisiert — bleiben die Prompts dann relevant? Die Grundprinzipien sind seit 2023 stabil und werden es bleiben: GPT strukturiert, Claude menschenzentriert, Gemini semantisch. Die konkreten Trigger-Formulierungen verfeinern sich — der Grundansatz nicht. Überprüft eure Templates alle 6 Monate, nicht wöchentlich.
Was kostet das monatlich in der Praxis? Ein mittelständisches Team mit ~50 KI-Aufgaben/Tag kommt mit GPT-5.4 mini oder Gemini 3.1 Flash-Lite auf unter €50/Monat API-Kosten. Claude Sonnet 4.6 für Copywriting-Intensiv-Nutzer: €100–300/Monat je nach Volumen. Claude Opus 4.6 ist für strategische Einzel-Aufgaben — nicht für Massenverarbeitung.
Quellen & Weiterführende Links
- Anthropic: Constitutional AI — Harmlessness from AI Feedback
- Anthropic Docs: XML-Tags für Claude-Prompts
- OpenAI: Structured Outputs in der API
- Anthropic Docs: Extended Thinking
Weiterführend: [GPT-5.4 vs. Claude Opus 4.6 im direkten Vergleich — Entscheidungsmatrix für Unternehmen →](/blog/gpt-codex-vs-claude-ki-modell-vergleich) | [KI-Modell TCO-Guide: Was kostet welches wirklich? →](/blog/ki-modell-tco-guide-gpt-gemini-claude)
Prompting-Workflows für euer Team aufbauen? [Erstgespräch anfragen →](/erstgesprach)




