Gemini 3.5 Flash ist da: 4x schneller, 1M Kontext und $100/Monat für Google AI Ultra

Gemini 3.5 Flash ist da: 4x schneller, 1M Kontext und $100/Monat für Google AI Ultra

Google liefert: Gemini 3.5 Flash übertrifft Pro

20. Mai 2026 | Von: KI-Katalog Redaktion

Die Google I/O 2026 hat gehalten was sie versprochen hat — und in einem Punkt sogar überrascht: Gemini 3.5 Flash ist nicht nur das schnellste Frontier-Modell, es übertrifft auch den eigenen Vorgänger Gemini 3.1 Pro in Coding und Agenten-Aufgaben. Das ist bemerkenswert, weil Flash-Modelle eigentlich die "günstige, schnelle" Variante sein sollen.

Die Zahlen: Flash schlägt Pro

EigenschaftGemini 3.5 FlashGemini 3.1 ProVergleich
Terminal-Bench 2.176,2%~72%Flash gewinnt!
Kontextfenster1 Million Tokens1 Million TokensGleich
Geschwindigkeit4x schneller als vergleichbare Frontier-ModelleStandardFlash gewinnt
Preis (Input)$1,50 / 1M Tokens~$7 / 1M TokensFlash 4,7x günstiger
Preis (Output)$9 / 1M Tokens~$21 / 1M TokensFlash 2,3x günstiger

Das ist eine bemerkenswerte Entwicklung: Ein Flash-Modell das Pro-Level-Qualität bei einem Bruchteil der Kosten liefert. Für Entwickler die Gemini über die API nutzen, ist das eine signifikante Kostenreduktion.

Gemini Omni: Text, Bild und Video in einem

Die zweite große Ankündigung: Gemini Omni — ein einheitliches Modell, das Googles Reasoning-Fähigkeiten mit Inhaltserstellung kombiniert. Omni akzeptiert Text, Bild, Audio und Video als Input und kann Videos generieren, die auf realen Wissensquellen basieren.

Für Content-Creator bedeutet das: Ein einzelner Prompt kann ein erklärendes Video mit Voiceover und eingeblendeten Fakten generieren — ohne zwischen ChatGPT für Text, Midjourney für Bilder und Runway für Video wechseln zu müssen.

Managed Agents in der Gemini API

Für Entwickler besonders spannend: Managed Agents direkt über die Gemini API. Ein einzelner API-Call provisioniert eine komplette Linux-Umgebung, in der ein Gemini-Agent autonom Code ausführen, Dateien verwalten und im Web browsen kann. Das ist Googles Antwort auf Claude Code und Microsofts Computer-Using Agents.

Neue Preisstufen: AI Ultra für $100/Monat

Google hat die Abo-Struktur für Verbraucher überarbeitet:

PlanPreisWas man bekommt
Google AI Pro$19,99/MonatGemini 3.5 Flash, Standard-Limits
Google AI Ultra$100/Monat5x mehr Nutzung, alle Modelle, Information Agents
Google AI Ultra (vorher $250)$200/MonatGleiche Features wie zuvor, Preissenkung

$100/Monat ist ein neues Segment zwischen dem $20-Standard und dem $200-Premium. Für professionelle Nutzer, denen der Pro-Plan zu begrenzt ist, aber $200 zu viel, ist das ein willkommener Mittelweg.

Was das für den KI-Markt bedeutet

Gemini 3.5 Flash ändert die Gleichung: Frontier-Qualität gibt es jetzt für unter $10/Million Output-Tokens. Das setzt OpenAI und Anthropic unter Preisdruck — und macht es für Unternehmen noch attraktiver, verschiedene Modelle für verschiedene Aufgaben zu kombinieren (unser KI-Tool-Stack Guide zeigt wie).

Für DSGVO-bewusste Nutzer bleibt der Vorteil: Google Cloud bietet EU-Datenresidenz, während Mistral Le Chat als europäische Alternative mit EU-Servern und dem neuen Medium 3.5 Modell konkurriert.

Gemini im KI-Katalog | Google I/O 2026 Zusammenfassung | Chatbot-Vergleich

---

Quellen: