Google liefert: Gemini 3.5 Flash übertrifft Pro
20. Mai 2026 | Von: KI-Katalog Redaktion
Die Google I/O 2026 hat gehalten was sie versprochen hat — und in einem Punkt sogar überrascht: Gemini 3.5 Flash ist nicht nur das schnellste Frontier-Modell, es übertrifft auch den eigenen Vorgänger Gemini 3.1 Pro in Coding und Agenten-Aufgaben. Das ist bemerkenswert, weil Flash-Modelle eigentlich die "günstige, schnelle" Variante sein sollen.
Die Zahlen: Flash schlägt Pro
| Eigenschaft | Gemini 3.5 Flash | Gemini 3.1 Pro | Vergleich |
|---|---|---|---|
| Terminal-Bench 2.1 | 76,2% | ~72% | Flash gewinnt! |
| Kontextfenster | 1 Million Tokens | 1 Million Tokens | Gleich |
| Geschwindigkeit | 4x schneller als vergleichbare Frontier-Modelle | Standard | Flash gewinnt |
| Preis (Input) | $1,50 / 1M Tokens | ~$7 / 1M Tokens | Flash 4,7x günstiger |
| Preis (Output) | $9 / 1M Tokens | ~$21 / 1M Tokens | Flash 2,3x günstiger |
Das ist eine bemerkenswerte Entwicklung: Ein Flash-Modell das Pro-Level-Qualität bei einem Bruchteil der Kosten liefert. Für Entwickler die Gemini über die API nutzen, ist das eine signifikante Kostenreduktion.
Gemini Omni: Text, Bild und Video in einem
Die zweite große Ankündigung: Gemini Omni — ein einheitliches Modell, das Googles Reasoning-Fähigkeiten mit Inhaltserstellung kombiniert. Omni akzeptiert Text, Bild, Audio und Video als Input und kann Videos generieren, die auf realen Wissensquellen basieren.
Für Content-Creator bedeutet das: Ein einzelner Prompt kann ein erklärendes Video mit Voiceover und eingeblendeten Fakten generieren — ohne zwischen ChatGPT für Text, Midjourney für Bilder und Runway für Video wechseln zu müssen.
Managed Agents in der Gemini API
Für Entwickler besonders spannend: Managed Agents direkt über die Gemini API. Ein einzelner API-Call provisioniert eine komplette Linux-Umgebung, in der ein Gemini-Agent autonom Code ausführen, Dateien verwalten und im Web browsen kann. Das ist Googles Antwort auf Claude Code und Microsofts Computer-Using Agents.
Neue Preisstufen: AI Ultra für $100/Monat
Google hat die Abo-Struktur für Verbraucher überarbeitet:
| Plan | Preis | Was man bekommt |
|---|---|---|
| Google AI Pro | $19,99/Monat | Gemini 3.5 Flash, Standard-Limits |
| Google AI Ultra | $100/Monat | 5x mehr Nutzung, alle Modelle, Information Agents |
| Google AI Ultra (vorher $250) | $200/Monat | Gleiche Features wie zuvor, Preissenkung |
$100/Monat ist ein neues Segment zwischen dem $20-Standard und dem $200-Premium. Für professionelle Nutzer, denen der Pro-Plan zu begrenzt ist, aber $200 zu viel, ist das ein willkommener Mittelweg.
Was das für den KI-Markt bedeutet
Gemini 3.5 Flash ändert die Gleichung: Frontier-Qualität gibt es jetzt für unter $10/Million Output-Tokens. Das setzt OpenAI und Anthropic unter Preisdruck — und macht es für Unternehmen noch attraktiver, verschiedene Modelle für verschiedene Aufgaben zu kombinieren (unser KI-Tool-Stack Guide zeigt wie).
Für DSGVO-bewusste Nutzer bleibt der Vorteil: Google Cloud bietet EU-Datenresidenz, während Mistral Le Chat als europäische Alternative mit EU-Servern und dem neuen Medium 3.5 Modell konkurriert.
Gemini im KI-Katalog | Google I/O 2026 Zusammenfassung | Chatbot-Vergleich
---
Quellen: