100% Lokal · DSGVO

Qwen 3.6

von Alibaba Cloud (Qwen) · Lizenz: Apache 2.0 · Kommerziell nutzbar

Neuestes Open-Source-Modell für Agentic Coding mit 1M Kontext

5.0 Gesamt
Verfügbare Größen: 35B-A3B MoE 27B Dense

Was ist Qwen 3.6?

Qwen 3.6 ist Alibabas neuestes Open-Source-Sprachmodell, veröffentlicht im April 2026, und markiert einen Durchbruch in der Effizienz: Das 27B-Dense-Modell schlägt das 14-mal größere Qwen 3.5-397B bei Coding-Benchmarks. Die Familie umfasst zwei Open-Weight-Varianten unter Apache 2.0: Das 35B-A3B MoE-Modell aktiviert nur 3 von 35 Milliarden Parametern pro Inferenz dank 256 Experten und erreicht damit SWE-bench Verified 73.4 Prozent und AIME 2026 92.7 Prozent. Das 27B Dense-Modell erreicht sogar SWE-bench 77.2 Prozent bei deutlich geringerem VRAM-Bedarf von nur 17 GB in Q4-Quantisierung — es läuft komfortabel auf einer einzelnen RTX 3090 mit 24 GB VRAM.

Die zentrale Architektur-Innovation ist Gated DeltaNet, eine hybride Attention-Architektur die Linear Attention mit Standard-Attention kombiniert und dadurch bis zu 1 Million Token Kontextfenster ermöglicht ohne explodierende Kosten. Pro Block werden drei DeltaNet-Layer mit einem klassischen Attention-Layer abgewechselt, was das Beste aus beiden Welten vereint: schnelle Verarbeitung langer Kontexte und präzises Retrieval bei kurzen Abfragen. Beide Modelle unterstützen 119 Sprachen inklusive Deutsch, natives Function Calling mit MCP-Support, Multimodal-Input für Text, Bilder und Video sowie einen Toggle zwischen Thinking Mode und Instruct Mode für verschiedene Aufgabentypen.

Die API-Version Qwen 3.6 Plus ist mit nur 0.29 USD pro Million Input-Tokens 17-mal günstiger als Claude Opus 4.6. Für deutsche Unternehmen besonders relevant: Die Apache 2.0 Lizenz erlaubt uneingeschränkte kommerzielle Nutzung, und der 100 Prozent lokale Betrieb über Ollama garantiert volle DSGVO-Konformität ohne Cloud-Abhängigkeit.

Fähigkeiten-Matrix

Was kann Qwen 3.6 — und was nicht?

🇩🇪 Deutsch-Chat
4.0
🇬🇧 Englisch-Chat
5.0
🗣️ Multilingual
4.5
💻 Code-Generierung
5.0
🌍 Übersetzung
4.0
📋 Zusammenfassung
4.5
📄 RAG / Dokumente
4.5
🔧 Tool-Use / Function Calling
4.5
🌐 Browser-Automatisierung
3.5
👁️ Bildverständnis
4.0
🧮 Mathematik / Logik
5.0
✍️ Kreatives Schreiben
4.0

Unterstützte Programmiersprachen: Python, JavaScript, TypeScript, Rust, Go, Java, C++, C#

Hardware-Anforderungen

Größe Min. RAM Empf. VRAM CPU möglich? Quantisierung Empfohlene GPU
? ? GB ? GB ✗ Nein Q4_K_M

GPU-Kaufberatung mit aktuellen Preisen ansehen

Kompatibilität

Bewertung

Output-Qualität ★★★★★ 5.0/5
Inference-Speed ★★★★☆ 4.5/5
RAM/VRAM-Effizienz ★★★★★ 5.0/5

Weitere Qwen 3.6-Modelle

Qwen 3.6 27B AWQ

Optimale Variante für 2x RTX 3090 — 100+ Token/s bei voller 27B-Qualität dank AWQ-Quantisierung

27B AWQ INT4
Details ansehen

War diese Übersicht hilfreich?