Mistral Medium 3.5: Europas neues 128B-Flaggschiff schlägt GPT-5.5 beim Coding — und ist Open Source

Mistral Medium 3.5: Europas neues 128B-Flaggschiff schlägt GPT-5.5 beim Coding — und ist Open Source

Mistral Medium 3.5: Europa hat ein Flaggschiff

13. Mai 2026 | Von: KI-Katalog Redaktion

Während die KI-Welt auf OpenAI und Google schaut, hat Mistral aus Paris still und leise eines der beeindruckendsten Modelle des Jahres veröffentlicht: Mistral Medium 3.5, ein 128-Milliarden-Parameter-Modell mit Open Weights, das bei Coding-Benchmarks GPT-5.5 und Claude Sonnet 4 schlägt.

Die Zahlen

EigenschaftMistral Medium 3.5GPT-5.5Claude Sonnet 4
Parameter128B (dense)UnbekanntUnbekannt
Kontextfenster256.000 Tokens128.000200.000
SWE-Bench Verified77,6%~72%~75%
Open WeightsJa (MIT-Lizenz)NeinNein
ServerEU (Paris)USUS

77,6 Prozent auf SWE-Bench Verified — dem wichtigsten Benchmark für reale Coding-Aufgaben — ist ein herausragendes Ergebnis. Das bedeutet: Mistral Medium 3.5 kann mehr als drei Viertel aller echten GitHub-Issues lösen, die zum Test vorgelegt werden.

Was Mistral Medium 3.5 besonders macht

Ein Modell für alles

Statt wie Anthropic oder OpenAI verschiedene Modelle für verschiedene Aufgaben anzubieten (Haiku für Speed, Opus für Qualität), verfolgt Mistral einen anderen Ansatz: Ein einziges 128B-Modell, das Instruktionsbefolgung, Reasoning, Coding und Vision in einem vereint. Das vereinfacht die Tool-Auswahl erheblich — man muss nicht mehr zwischen Modellgrößen abwägen.

Open Weights unter MIT-Lizenz

Mistral veröffentlicht die Modellgewichte unter einer modifizierten MIT-Lizenz, die kommerzielle Nutzung erlaubt. Das bedeutet: Unternehmen können Mistral Medium 3.5 auf eigener Hardware betreiben — komplett lokal, ohne Daten an externe Server zu senden. Für deutsche Unternehmen mit strengen DSGVO-Anforderungen ist das ein Game-Changer.

Allerdings: Mit 128 Milliarden dichten Parametern braucht das Modell erhebliche Hardware. In Q4-Quantisierung sind mindestens 2x RTX 3090 (48 GB) nötig, für die volle Qualität eher 4x A100 oder vergleichbar.

256k Kontextfenster

Das Kontextfenster von 256.000 Tokens liegt zwischen Claude (200k) und Gemini (1M) und reicht für die allermeisten Anwendungsfälle: Ganze Codebases, umfangreiche Dokumentsammlungen oder lange Konversationsverläufe können verarbeitet werden.

Vibe: Remote Agents für asynchrones Coding

Zusammen mit dem Modell hat Mistral Vibe vorgestellt — eine Cloud-Plattform für asynchrones KI-Coding. Der Unterschied zu Cursor oder Claude Code: Bei Vibe gibt man eine Aufgabe ab und bekommt das Ergebnis später, statt synchron auf die Antwort zu warten.

Konkret: Man beschreibt ein Feature, startet einen Remote-Agent, und der arbeitet die Aufgabe im Hintergrund ab — testet, debuggt, iteriert. Man kann mehrere Agents parallel laufen lassen und die Ergebnisse einsammeln, wenn sie fertig sind.

Für Teams bedeutet das: Routineaufgaben wie Bug-Fixes, Test-Erstellung oder Dokumentation können an Remote-Agents delegiert werden, während Entwickler sich auf komplexere Architekturentscheidungen konzentrieren.

Le Chat Work-Modus

Der neue Work-Modus in Mistral Le Chat erweitert den Chatbot um agentenbasierte Fähigkeiten. Statt nur auf Fragen zu antworten, kann Le Chat im Work-Modus: