Zum Hauptinhalt springen

Warum derselbe Prompt bei ChatGPT, Claude und Gemini völlig unterschiedliche Ergebnisse liefert

ChatGPT, Claude und Gemini liefern auf denselben Prompt andere Ergebnisse. Modell-spezifische Prompting-Techniken für mehr Output — mit Best Practices 2026.

11 min readTill OberhummerTill Oberhummer
Warum derselbe Prompt bei ChatGPT, Claude und Gemini völlig unterschiedliche Ergebnisse liefert

In Gesprächen mit Geschäftsführern und Beratern höre ich regelmäßig: "Wir arbeiten schon mit KI — ChatGPT schreibt unsere Angebote, Claude macht Präsentationen." Und dann die Folgefrage: "Warum sind die Ergebnisse manchmal so unterschiedlich? Mein Prompt funktioniert bei ChatGPT super, aber bei Claude kommt Unsinn raus."

Das ist kein Zufall und kein Bug. Es ist Absicht.

Stand: Juni 2026 — aktuelle Modelle: GPT-5.5, Claude Opus 4.8 und Claude Sonnet 4.6, Gemini 3.1 Pro und 3.5 Flash. Die Prompting-Prinzipien gelten generationsübergreifend; nur die konkreten Versionen unten ändern sich.

Das Wichtigste in Kürze

Derselbe Prompt liefert bei ChatGPT, Claude und Gemini unterschiedliche Ergebnisse, weil jedes Modell anders trainiert ist. GPT braucht Struktur und nummerierte Schritte, Claude braucht Zielgruppen-Kontext und XML-Tags, Gemini braucht Kategorien und Entitäten. Wer für alle drei denselben Prompt nutzt, trifft jeweils nur zufällig die Stärke des Modells — und verschenkt einen Großteil des möglichen Outputs.

Warum liefert derselbe Prompt bei jedem Modell andere Ergebnisse?

Derselbe Prompt liefert bei ChatGPT, Claude und Gemini unterschiedliche Ergebnisse, weil die drei Modell-Familien auf unterschiedlichen Trainingsdaten und mit unterschiedlichen Grundphilosophien aufgebaut wurden. GPT ist auf strukturierten Text trainiert, Claude auf menschenzentrierte Kommunikation, Gemini auf semantische Vernetzung. Ein universeller Prompt trifft immer nur eine dieser Stärken — und das auch nur zufällig.

Die meisten Prompts, die ich in der Praxis sehe, sehen so aus:

  • "Schreib mir ein Angebot für XY."
  • "Fass diesen Text zusammen."
  • "Mach eine Präsentation draus."

Das Problem mit diesen universellen Prompts: Sie ignorieren, dass jedes KI-Modell eine andere Grundphilosophie hat. Dasselbe Ergebnis zu erwarten, ist wie drei Mitarbeiter mit unterschiedlichen Stärken auf dieselbe Art zu briefen.

Stell dir drei Mitarbeiter vor:

  • Max liebt klare Strukturen, Checklisten und Schritt-für-Schritt-Anleitungen
  • Anna denkt immer an die Zielgruppe und die menschliche Wirkung
  • Tom analysiert alles systematisch und sucht nach Kategorien und Zusammenhängen

Würdest du allen dreien das gleiche Briefing geben? Nein — du würdest den Auftrag so formulieren, dass er zu ihrer Stärke passt.

Genau so funktioniert modell-spezifisches Prompting.

Wie unterscheiden sich GPT, Claude und Gemini beim Prompting?

GPT, Claude und Gemini unterscheiden sich in drei prompting-relevanten Dimensionen: der bevorzugten Struktur, der Art der Kontext-Übergabe und den Trigger-Wörtern, auf die sie besonders gut reagieren. Hier die drei Modell-Profile im Detail.

GPT — Der Struktur-Fanatiker

Denkweise: Strukturiert, regelbasiert, listenorientiert Reagiert besonders gut auf: Nummerierte Schritte, explizite Anweisungen, klare Ausgabe-Formate, JSON-Schema-Definitionen Stärken: Analysen, strukturierte Reports, technische Dokumentation, Code-Generierung mit definierten Ausgabe-Formaten

Warum das so ist: GPT-Modelle wurden mit viel strukturiertem Text (Code, Wikipedia, technische Dokumentation) trainiert. Das prägt eine Vorliebe für klare, regelbasierte Anweisungen.

GPT-spezifisch: Das Modell hat integriertes Reasoning für komplexe Probleme und ist besonders zuverlässig bei strukturierten JSON-Outputs. Wenn ihr konsistente, maschinenlesbare Antworten braucht — GPT mit response_format: json_schema ist die zuverlässigste Option am Markt.

Best Practices für GPT:

  • Definiert das Ausgabe-Format explizit am Anfang des Prompts
  • Nummeriert Aufgabenschritte: "1. Analysiere X, 2. Erstelle Y, 3. Gib aus als Z"
  • Nutzt response_format: json_schema in der API für zuverlässig strukturierte Outputs
  • Schreibt Constraints explizit: "Maximal 3 Punkte", "Keine Einleitung", "Nur Fakten"
  • GPT folgt Token-Grenzen besser als Wortgrenzen — bei Längenvorgaben: "ca. 200 Tokens" schlägt "ca. 150 Wörter"

Claude — Der empathische Ghostwriter

Denkweise: Nuanciert, menschenzentriert, auf Wirkung bedacht Reagiert besonders gut auf: Kontext über Zielgruppe, Tonalität, Ziel der Kommunikation, XML-Tags für Struktur Stärken: Copywriting, interne Kommunikation, Texte die überzeugen sollen, lange Dokument-Analysen

Warum das so ist: Anthropic hat Constitutional AI entwickelt — ein Trainingsansatz, der explizit auf menschliche Werte und Kommunikation ausgerichtet ist. Das spiegelt sich in Claudes Ausgaben wider.

Claude-spezifisch: Die aktuellen Claude-Modelle unterstützen 1 Million Token Kontext — kein Beta-Header mehr nötig. Das verändert, was möglich ist: Ihr könnt komplette Codebases, Jahresabschlüsse oder Vertragspakete auf einmal einlesen lassen. Das Spitzenmodell der Claude-Reihe unterstützt zusätzlich Adaptive Thinking für mehrstufige Reasoning-Aufgaben.

Best Practices für Claude:

  • Beschreibt die Zielgruppe präzise: "Geschäftsführer ohne technischen Hintergrund, entscheidungsfreudig, Zeit ist knapp"
  • Nutzt XML-Tags für Struktur — Anthropic empfiehlt das explizit: <kontext>...</kontext>, <aufgabe>...</aufgabe>, <format>...</format>
  • Reihenfolge: Bei Claude zuerst die Anweisung, dann die Daten oder das lange Dokument
  • Gebt Tonalität-Beispiele: "Schreib wie der Economist — sachlich, mit Tiefe, kein Marketingsprech"
  • Für Adaptive Thinking bei komplexen Problemen: "Denke das Problem sorgfältig durch, bevor du antwortest"
  • Für lange Dokumente: Claude liest 1M-Token-Kontexte zuverlässig — feedt das gesamte Dokument statt es vorab zu kürzen

Gemini — Der Taxonomie-Nerd

Denkweise: Semantisch, vernetzt, kategorisierend Reagiert besonders gut auf: Entitäten, Kategorien, Beziehungen zwischen Konzepten, multimodale Inputs Stärken: Datenanalyse, SEO-Optimierung, Szenarien mit viel Kontextvernetzung, Video- und Bildanalyse, faktenbasierte Recherche

Warum das so ist: Gemini wurde tief in Googles Wissensgraph und Search-Infrastruktur integriert. Das erzeugt eine Tendenz zu semantischen Strukturen und Kategorisierung. Gemini liefert durch Google Search-Grounding faktenbasierte, aktuelle Antworten — ein Vorteil den die anderen Modelle so nicht haben.

Gemini-spezifisch: großer Kontext (Gemini 3.1 Pro reicht bis 1 Million Token, gleichauf mit Claude), nativ multimodal (Text, Bild, Video, Audio). Bei faktenintensiven Recherche-Aufgaben ist Gemini mit aktiviertem Google-Grounding die erste Wahl.

Best Practices für Gemini:

  • Referenziert Entitäten und Kategorien explizit: "Analysiere [Unternehmen] als [Branche]-Akteur im Kontext von [Markt]"
  • Reihenfolge: Anders als bei Claude — bei Gemini die Daten zuerst, die konkrete Anweisung zuletzt
  • Nutzt Gemini für multimodale Prompts: Diagramme, Videos, Präsentationen können direkt mitgegeben werden
  • Aktiviert Google Search Grounding für faktenintensive Aufgaben — Gemini zieht dann aktuelle Web-Informationen ein
  • Nutzt "Taxonomie", "Entitäten", "Kategorisieren" als Trigger-Wörter für Geminis Stärken
  • Für SEO: Bittet Gemini explizit um "semantische Felder" und "verwandte Suchanfragen"

Wie sieht ein modell-spezifischer Prompt in der Praxis aus?

Am besten zeigt es ein direkter Vergleich: dieselbe Aufgabe, drei Prompts — jeder auf die Stärke seines Modells ausgerichtet. Die Aufgabe: einen Website-Text SEO-optimieren.

Prompt für GPT (Struktur zuerst)

` Du bist eine erfahrene SEO-Expertin.

Analysiere den folgenden Text hinsichtlich SEO-Potenzial. Gehe in diesen Schritten vor:

  1. Identifiziere Keyword-Fokus und semantische Felder
  2. Bewerte die Struktur (H1-H3, Absätze)
  3. Prüfe auf Snippet-Tauglichkeit
  4. Erstelle eine optimierte Version

Nutze diese Ausgabe-Struktur:

  • SEO-Bewertung (1-10 mit Begründung)
  • Optimierter Text
  • 3 Quick Wins als Bulletpoints

[Text einfügen] `

Warum das funktioniert: Explizite Schritt-für-Schritt-Anweisung + definiertes Ausgabe-Format + numerische Bewertungsskala. GPT folgt Strukturen — also gib eine.

Prompt für Claude (Zielgruppe + XML-Tags)

`xml

Zielgruppe: Geschäftsführer und Berater im B2B-Bereich Ziel: Reichweite steigern und gleichzeitig Vertrauen aufbauen Tonalität: Sachlich, kompetent — kein Marketingsprech

Agiere als SEO-Beraterin für menschenzentrierte Inhalte.

  • Mach konkrete Verbesserungsvorschläge für Stil, Struktur, Keywords
  • Formuliere eine optimierte Version, die sowohl Google als auch

Menschen überzeugt

  • Sei respektvoll zum Original, aber mutig in der Verbesserung

Zuerst: kurze Bewertung (max. 3 Punkte) Dann: optimierter Text

[Text einfügen]

`

Warum das funktioniert: Claude verarbeitet XML-Tags als strukturierten Kontext, nicht als formatierten Text. Zielgruppe, Tonalität und Format sind getrennt — das eliminiert Ambiguität und gibt Claude die menschliche Perspektive, die das Modell braucht.

Prompt für Gemini (Kategorien + Grounding)

` Übernimm die Rolle einer SEO-Expertin mit Fokus auf semantische Optimierung. [Google Search Grounding aktivieren]

Deine Aufgabe:

  1. Analysiere den Text auf Keyword-Relevanz und Entitäten
  2. Mappe zentrale Begriffe auf eine strukturierte Taxonomie
  3. Identifiziere verwandte Suchbegriffe, die Google als

semantisch relevant einordnet

  1. Optimiere für Google (Snippets, Keyword-Dichte) und

LLMs (Findability, klare Begriffe)

Nutze diese Ausgabe-Struktur:

  • Keyword-Mapping (Tabelle mit Hauptbegriff / Semantisches Feld / Volumen-Einschätzung)
  • Entitätenstruktur
  • Optimierter Textblock

Erkläre deine Logik Schritt für Schritt.

[Text einfügen] `

Warum das funktioniert: Gemini arbeitet mit Kategorien und Relationen. "Taxonomie", "Entitäten", "Mapping" sind Triggerwörter für Geminis Stärken. Mit aktiviertem Search-Grounding bezieht Gemini aktuelle Suchvolumen-Signale ein — das kein anderes Modell so kann.

Was hat sich 2026 beim Prompting verändert?

Die Modell-Landschaft hat sich in den letzten 12 Monaten fundamental verändert — vier Entwicklungen verändern konkret, wie ihr eure Prompts schreiben solltet.

1. Million-Token-Kontext ist Standard geworden

Die aktuellen Claude-Modelle (Opus 4.8 und Sonnet 4.6) unterstützen 1 Million Token Kontext ohne Beta-Header. Gemini 3.1 Pro liegt ebenfalls bei 1 Million Token — die Zeiten des 2-Millionen-Vorsprungs sind vorbei. Eine Million Token entspricht ~750.000 Wörtern — einem kompletten Jahresabschluss, einer gesamten Codebase oder hunderten von E-Mails auf einmal.

Was das ändert: Ihr müsst Dokumente nicht mehr manuell zusammenfassen oder chunken. Feedt das komplette Dokument und fragt präzise nach dem, was ihr braucht. "Was ist die relevante Klausel zu Haftungsbeschränkungen in diesem Vertrag?" auf einem 200-seitigen Vertrag liefert jetzt direkte Antworten.

2. Adaptive Thinking für komplexe Probleme (Claude Opus 4.8)

Claude Opus 4.8 hat Adaptive Thinking — das Modell "denkt" vor der Antwort durch das Problem, ohne dass ihr die Zwischenschritte seht. Für analytisch komplexe Aufgaben: "Denke das Problem sorgfältig durch, bevor du antwortest" als Eröffnung verbessert die Antwortqualität messbar.

Wann nutzen: Strategische Analysen, mehrschichtige Abwägungen, Diagnosen von Problemen mit vielen Variablen. Für einfache Aufgaben unnötig.

3. Strukturierte Ausgaben sind zuverlässiger geworden

GPT-5.5 mit response_format: json_schema liefert zuverlässig strukturierte Outputs für Downstream-Prozesse. Das ist relevant für Automatisierungen: Wenn die KI-Ausgabe direkt in ein CRM, eine Datenbank oder eine App fließt, eliminiert strukturiertes Ausgabe-Format manuelle Parsing-Fehler.

4. Multimodale Prompts sind kein Sonderfall mehr

Gemini, GPT-5.5 und Claude verarbeiten Bilder, PDFs und in Teilen Audio und Video direkt. Das bedeutet: Ihr könnt Screenshots, Diagramme und Präsentationen direkt mitschicken statt sie zu beschreiben. "Analysiere diese Folie und schlage eine überzeugendere Struktur vor" ist jetzt ein valider Prompt.

Wann welches Modell wählen?

Kurzfassung: GPT für strukturierte, reproduzierbare Outputs, Claude für Kommunikation und große Kontexte, Gemini für faktenbasierte Recherche. Die Detailzuordnung nach Aufgabentyp:

AufgabeEmpfehlungAktuelle Modelle (Stand Juni 2026)Warum
Analysen, Reports, strukturierte DocsGPTGPT-5.5Strukturierte, reproduzierbare Outputs
Kundenkommunikation, Angebote, CopywritingClaudeClaude Sonnet 4.6Menschliche Tonalität, Zielgruppenorientierung
SEO, Datenanalyse, faktenbasierte RechercheGeminiGemini ProSemantische Stärke, Google-Grounding
Komplexe Multi-File-EntwicklungClaudeClaude Opus 4.8 (1M Token)Präzises Code-Refactoring, großer Kontext
Kostengünstige MassenverarbeitungGeminiGemini 3.5 FlashSchnell, rund 40% günstiger als die Pro-Modelle
Zuverlässige JSON-Outputs für AutomationGPTGPT-5.5 + json_schemaKonsistentester strukturierter Output
Strategische Analysen, AbwägungenClaudeClaude Opus 4.8 + Adaptive ThinkingMehrstufiges Reasoning, hohe Zuverlässigkeit

Das ist kein Dogma — es ist ein Ausgangspunkt. Jeder Use Case verdient einen eigenen Test.

Was unterscheidet professionelles Prompting von Standard-Prompts?

Der Unterschied ist Spezifität. Ein Standard-Prompt nennt nur die Aufgabe. Ein professioneller Prompt nennt Modell, Rolle, Zielgruppe, Ausgabe-Format und den modell-spezifischen Struktur-Trigger.

Standard-Prompt: "Schreib mir ein Angebot." Professioneller Prompt: Modell + Rolle + Zielgruppe + Ausgabe-Format + Struktur-Trigger (XML für Claude, JSON-Schema für GPT, Taxonomie für Gemini).

Der Unterschied in der Praxis: Standard-Prompts liefern mittelmäßige Ergebnisse bei allen Modellen. Modell-spezifische Prompts mit den richtigen Triggern liefern deutlich bessere Ergebnisse mit demselben Zeitaufwand.

Warnung

Faustregel für 2026: Wenn ihr denselben Prompt bei allen drei Modellen benutzt, verschenkt ihr 40–60% des möglichen Outputs.

Häufige Fragen zu Prompt Engineering

Was ist der größte Fehler beim Prompting 2026? Zu denken, KI funktioniert wie eine Suchmaschine. KI braucht Kontext, Rolle und klare Erwartungen — nicht nur Keywords. Der zweithäufigste Fehler: Denselben Prompt für alle Modelle zu nutzen, ohne modell-spezifische Anpassungen.

Muss ich für jedes Projekt einen neuen Prompt schreiben? Nicht von Null. Sobald ihr einen guten Prompt für eine Aufgabe habt, speichert ihn als Template. Für jedes Modell ein Template — das sind maximal drei Varianten. Die meisten Prompts unterscheiden sich nur in Struktur-Typ und Kontext-Übergabe.

Wie teste ich systematisch, welcher Prompt besser ist? A/B-Test: Zwei Prompt-Varianten, dieselbe Aufgabe, beide fünfmal ausführen. Welche liefert konsistenter die erwünschten Ergebnisse? Die andere weiterentwickeln oder verwerfen. Wichtig: Testet mit realen Aufgaben aus eurem Alltag, nicht mit konstruierten Beispielen.

Werden die Modelle nicht ständig aktualisiert — bleiben die Prompts dann relevant? Die Grundprinzipien sind seit 2023 stabil und werden es bleiben: GPT strukturiert, Claude menschenzentriert, Gemini semantisch. Die konkreten Modell-Versionen wechseln im Quartalsrhythmus — die Trigger-Logik bleibt. Überprüft eure Templates alle 6 Monate, nicht wöchentlich.

Was kostet das monatlich in der Praxis? Ein mittelständisches Team mit ~50 KI-Aufgaben/Tag kommt mit den günstigen Modell-Varianten (etwa Gemini 3.5 Flash) auf unter €50/Monat API-Kosten. Claude Sonnet 4.6 für Copywriting-Intensiv-Nutzer: €100–300/Monat je nach Volumen. Das Spitzenmodell Claude Opus 4.8 ist für strategische Einzel-Aufgaben gedacht — nicht für Massenverarbeitung.

Weiterführend: GPT vs. Claude im direkten Vergleich — Entscheidungsmatrix für Unternehmen → | KI-Modell TCO-Guide: Was kostet welches wirklich? →

Mehr zum Thema "KI-Tools & Modelle im Vergleich"

Kostenloser Test

Kundenchaos-Test

Finde in 2 Minuten heraus, wo in deinem Betrieb die meisten Stunden versickern — mit persönlicher Auswertung als PDF.

Engpass finden (2 Min) →

Cut the Prompt — Newsletter

Schließe dich 1.200 DACH-Geschäftsführer:innen an, die unseren KI-Newsletter lesen.

Jede Woche: 3 anonymisierte Beobachtungen aus echten KMU-Projekten, 1 Tool-Update aus unserem KI-Stack und 1 Idee zum Selber-Bauen. 5 Minuten Lesezeit. Kein Hype, kein Sales-Pitch.

Mit Eintragung Datenschutzerklärung akzeptiert. Abmeldung jederzeit per Link in jeder E-Mail.

1.200 lesen uns bereits auf LinkedIn — jetzt auch per E-Mail in deiner Inbox.

Erstgespräch

Willst du das für deinen Betrieb umsetzen?

In einem 30-Minuten-Gespräch analysieren wir deinen größten Zeitfresser und zeigen dir, was in deinem Betrieb sofort automatisiert werden kann.

Kostenloses Erstgespräch anfragen →

Passend dazu

Weitere Artikel