100% Lokal · DSGVO

Qwen 3.6

von Alibaba Cloud (Qwen) · Lizenz: Apache 2.0 · Kommerziell nutzbar

Neuestes Open-Source-Modell für Agentic Coding mit 1M Kontext

5.0 Gesamt

Verfügbare Größen: 35B-A3B MoE 27B Dense

ollama run qwen3.6 Website HuggingFace

Was ist Qwen 3.6?

Qwen 3.6 ist Alibabas neuestes Open-Source-Sprachmodell, veröffentlicht im April 2026, und markiert einen Durchbruch in der Effizienz: Das 27B-Dense-Modell schlägt das 14-mal größere Qwen 3.5-397B bei Coding-Benchmarks. Die Familie umfasst zwei Open-Weight-Varianten unter Apache 2.0: Das 35B-A3B MoE-Modell aktiviert nur 3 von 35 Milliarden Parametern pro Inferenz dank 256 Experten und erreicht damit SWE-bench Verified 73.4 Prozent und AIME 2026 92.7 Prozent. Das 27B Dense-Modell erreicht sogar SWE-bench 77.2 Prozent bei deutlich geringerem VRAM-Bedarf von nur 17 GB in Q4-Quantisierung — es läuft komfortabel auf einer einzelnen RTX 3090 mit 24 GB VRAM.

Die zentrale Architektur-Innovation ist Gated DeltaNet, eine hybride Attention-Architektur die Linear Attention mit Standard-Attention kombiniert und dadurch bis zu 1 Million Token Kontextfenster ermöglicht ohne explodierende Kosten. Pro Block werden drei DeltaNet-Layer mit einem klassischen Attention-Layer abgewechselt, was das Beste aus beiden Welten vereint: schnelle Verarbeitung langer Kontexte und präzises Retrieval bei kurzen Abfragen. Beide Modelle unterstützen 119 Sprachen inklusive Deutsch, natives Function Calling mit MCP-Support, Multimodal-Input für Text, Bilder und Video sowie einen Toggle zwischen Thinking Mode und Instruct Mode für verschiedene Aufgabentypen.

Die API-Version Qwen 3.6 Plus ist mit nur 0.29 USD pro Million Input-Tokens 17-mal günstiger als Claude Opus 4.6. Für deutsche Unternehmen besonders relevant: Die Apache 2.0 Lizenz erlaubt uneingeschränkte kommerzielle Nutzung, und der 100 Prozent lokale Betrieb über Ollama garantiert volle DSGVO-Konformität ohne Cloud-Abhängigkeit.

Fähigkeiten-Matrix

Was kann Qwen 3.6 — und was nicht?

🇩🇪 Deutsch-Chat

4.0

🇬🇧 Englisch-Chat

5.0

🗣️ Multilingual

4.5

💻 Code-Generierung

5.0

🌍 Übersetzung

4.0

📋 Zusammenfassung

4.5

📄 RAG / Dokumente

4.5

🔧 Tool-Use / Function Calling

4.5

🌐 Browser-Automatisierung

3.5

👁️ Bildverständnis

4.0

🧮 Mathematik / Logik

5.0

✍️ Kreatives Schreiben

4.0

Unterstützte Programmiersprachen: Python, JavaScript, TypeScript, Rust, Go, Java, C++, C#

Hardware-Anforderungen

Größe	Min. RAM	Empf. VRAM	CPU möglich?	Quantisierung	Empfohlene GPU
?	? GB	? GB	✗ Nein	Q4_K_M	—

GPU-Kaufberatung mit aktuellen Preisen ansehen

Kompatibilität

✓ Ollama

✓ LM Studio

✓ llama.cpp

✓ vLLM

✓ Open WebUI

✓ Text Gen WebUI

✓ Jan.ai

Bewertung

Output-Qualität ★★★★★ 5.0/5

Inference-Speed ★★★★☆ 4.5/5

RAM/VRAM-Effizienz ★★★★★ 5.0/5

Weitere Qwen 3.6-Modelle

Qwen 3.6 27B AWQ

Optimale Variante für 2x RTX 3090 — 100+ Token/s bei voller 27B-Qualität dank AWQ-Quantisierung

27B AWQ INT4

Details ansehen

War diese Übersicht hilfreich?