100% Lokal · DSGVO

Qwen 3.5 27B

von Alibaba Cloud (Qwen) · Lizenz: Apache 2.0 · Kommerziell nutzbar

Multimodales Dense-Modell mit 262K Kontext und nativer Vision

4.5 Gesamt
Verfügbare Größen: 0.8B 2B 4B 9B 27B 35B MoE 122B MoE 397B MoE

Was ist Qwen 3.5 27B?

Qwen 3.5 27B ist das dichte Flaggschiff-Modell der Qwen-3.5-Generation von Alibaba Cloud und markiert einen bedeutenden Fortschritt in der Open-Source-KI. Mit 27 Milliarden Parametern und einer innovativen Hybrid-Attention-Architektur kombiniert es Gated Delta Networks mit klassischen Feed-Forward-Netzwerken für maximale Effizienz. Das Modell unterstützt nativ einen Kontext von 262.144 Tokens, erweiterbar auf bis zu 1 Million Tokens — damit lassen sich ganze Codebases oder umfangreiche Dokumente in einem Durchgang verarbeiten.

Besonders beeindruckend ist die native Multimodalität: Qwen 3.5 27B verarbeitet Text, Bilder und Video direkt, ohne separate Vision-Adapter. In Benchmarks erreicht es 86,1% auf MMLU-Pro und 85,5% auf GPQA Diamond — Werte, die deutlich über vergleichbaren Open-Source-Modellen liegen. Beim Coding erzielt es 72,4% auf SWE-bench Verified, was GPT-5 mini entspricht.

Bei Instruction Following schlägt es mit 76,5 auf IFBench sogar GPT-5.2 (75,4). Die Inferenzgeschwindigkeit ist mit etwa 35 Tokens pro Sekunde auf einer RTX 4090 mit Q4-Quantisierung hervorragend. Qwen 3.5 27B unterstützt über 201 Sprachen mit einem 250K-Vokabular, wobei Deutsch auf einem sehr hohen Niveau funktioniert.

Das Modell beherrscht hybrides Denken: Es kann zwischen einem schnellen Antwortmodus und einem tiefgehenden Chain-of-Thought-Reasoning-Modus umschalten. Function Calling und Tool Use werden nativ unterstützt. Die Apache-2.0-Lizenz erlaubt uneingeschränkte kommerzielle Nutzung.

Für den lokalen Betrieb mit Q4-Quantisierung werden etwa 16 GB VRAM benötigt — eine RTX 4090 oder ein Mac mit 24 GB+ reicht aus.

Fähigkeiten-Matrix

Was kann Qwen 3.5 27B — und was nicht?

🇩🇪 Deutsch-Chat
4.5
🇬🇧 Englisch-Chat
5.0
🗣️ Multilingual
5.0
💻 Code-Generierung
5.0
🌍 Übersetzung
4.5
📋 Zusammenfassung
4.5
📄 RAG / Dokumente
5.0
🔧 Tool-Use / Function Calling
4.5
🌐 Browser-Automatisierung
3.5
👁️ Bildverständnis
4.0
🧮 Mathematik / Logik
4.5
✍️ Kreatives Schreiben
4.0

Unterstützte Programmiersprachen: Python, JavaScript, TypeScript, Java, C++, Rust, Go, PHP, SQL, HTML/CSS

Hardware-Anforderungen

Größe Min. RAM Empf. VRAM CPU möglich? Quantisierung Empfohlene GPU
? ? GB ? GB ✗ Nein Q4_K_M
? ? GB ? GB ✗ Nein Q4_K_M
? ? GB ? GB ✗ Nein Q4_K_M

GPU-Kaufberatung mit aktuellen Preisen ansehen

Kompatibilität

Bewertung

Output-Qualität ★★★★★ 5.0/5
Inference-Speed ★★★★☆ 4.5/5
RAM/VRAM-Effizienz ★★★★☆ 4.0/5

Weitere Qwen 3.5-Modelle

Qwen 3.5 9B

Kompaktes multimodales Modell für Consumer-Hardware

0.8B 2B 4B 9B 27B 35B MoE 122B MoE 397B MoE
Details ansehen

Qwen 3.5 35B MoE

Effizientes Mixture-of-Experts-Modell mit nur 3B aktiven Parametern

35B-A3B MoE
Details ansehen

War diese Übersicht hilfreich?