Qwen 3.6
von Alibaba Cloud (Qwen) · Lizenz: Apache 2.0 · Kommerziell nutzbar
Neuestes Open-Source-Modell für Agentic Coding mit 1M Kontext
Was ist Qwen 3.6?
Qwen 3.6 ist Alibabas neuestes Open-Source-Sprachmodell, veröffentlicht im April 2026, und markiert einen Durchbruch in der Effizienz: Das 27B-Dense-Modell schlägt das 14-mal größere Qwen 3.5-397B bei Coding-Benchmarks. Die Familie umfasst zwei Open-Weight-Varianten unter Apache 2.0: Das 35B-A3B MoE-Modell aktiviert nur 3 von 35 Milliarden Parametern pro Inferenz dank 256 Experten und erreicht damit SWE-bench Verified 73.4 Prozent und AIME 2026 92.7 Prozent. Das 27B Dense-Modell erreicht sogar SWE-bench 77.2 Prozent bei deutlich geringerem VRAM-Bedarf von nur 17 GB in Q4-Quantisierung — es läuft komfortabel auf einer einzelnen RTX 3090 mit 24 GB VRAM.
Die zentrale Architektur-Innovation ist Gated DeltaNet, eine hybride Attention-Architektur die Linear Attention mit Standard-Attention kombiniert und dadurch bis zu 1 Million Token Kontextfenster ermöglicht ohne explodierende Kosten. Pro Block werden drei DeltaNet-Layer mit einem klassischen Attention-Layer abgewechselt, was das Beste aus beiden Welten vereint: schnelle Verarbeitung langer Kontexte und präzises Retrieval bei kurzen Abfragen. Beide Modelle unterstützen 119 Sprachen inklusive Deutsch, natives Function Calling mit MCP-Support, Multimodal-Input für Text, Bilder und Video sowie einen Toggle zwischen Thinking Mode und Instruct Mode für verschiedene Aufgabentypen.
Die API-Version Qwen 3.6 Plus ist mit nur 0.29 USD pro Million Input-Tokens 17-mal günstiger als Claude Opus 4.6. Für deutsche Unternehmen besonders relevant: Die Apache 2.0 Lizenz erlaubt uneingeschränkte kommerzielle Nutzung, und der 100 Prozent lokale Betrieb über Ollama garantiert volle DSGVO-Konformität ohne Cloud-Abhängigkeit.
Fähigkeiten-Matrix
Was kann Qwen 3.6 — und was nicht?
Unterstützte Programmiersprachen: Python, JavaScript, TypeScript, Rust, Go, Java, C++, C#
Hardware-Anforderungen
| Größe | Min. RAM | Empf. VRAM | CPU möglich? | Quantisierung | Empfohlene GPU |
|---|---|---|---|---|---|
| ? | ? GB | ? GB | ✗ Nein | Q4_K_M | — |
Kompatibilität
Bewertung
Weitere Qwen 3.6-Modelle
Qwen 3.6 27B AWQ
Optimale Variante für 2x RTX 3090 — 100+ Token/s bei voller 27B-Qualität dank AWQ-Quantisierung
War diese Übersicht hilfreich?