100% Lokal · DSGVO

Qwen 3.5 27B

von Alibaba Cloud (Qwen) · Lizenz: Apache 2.0 · Kommerziell nutzbar

Multimodales Dense-Modell mit 262K Kontext und nativer Vision

4.5 Gesamt

Verfügbare Größen: 0.8B 2B 4B 9B 27B 35B MoE 122B MoE 397B MoE

ollama run qwen3.5:27b Website HuggingFace

Was ist Qwen 3.5 27B?

Qwen 3.5 27B ist das dichte Flaggschiff-Modell der Qwen-3.5-Generation von Alibaba Cloud und markiert einen bedeutenden Fortschritt in der Open-Source-KI. Mit 27 Milliarden Parametern und einer innovativen Hybrid-Attention-Architektur kombiniert es Gated Delta Networks mit klassischen Feed-Forward-Netzwerken für maximale Effizienz. Das Modell unterstützt nativ einen Kontext von 262.144 Tokens, erweiterbar auf bis zu 1 Million Tokens — damit lassen sich ganze Codebases oder umfangreiche Dokumente in einem Durchgang verarbeiten.

Besonders beeindruckend ist die native Multimodalität: Qwen 3.5 27B verarbeitet Text, Bilder und Video direkt, ohne separate Vision-Adapter. In Benchmarks erreicht es 86,1% auf MMLU-Pro und 85,5% auf GPQA Diamond — Werte, die deutlich über vergleichbaren Open-Source-Modellen liegen. Beim Coding erzielt es 72,4% auf SWE-bench Verified, was GPT-5 mini entspricht.

Bei Instruction Following schlägt es mit 76,5 auf IFBench sogar GPT-5.2 (75,4). Die Inferenzgeschwindigkeit ist mit etwa 35 Tokens pro Sekunde auf einer RTX 4090 mit Q4-Quantisierung hervorragend. Qwen 3.5 27B unterstützt über 201 Sprachen mit einem 250K-Vokabular, wobei Deutsch auf einem sehr hohen Niveau funktioniert.

Das Modell beherrscht hybrides Denken: Es kann zwischen einem schnellen Antwortmodus und einem tiefgehenden Chain-of-Thought-Reasoning-Modus umschalten. Function Calling und Tool Use werden nativ unterstützt. Die Apache-2.0-Lizenz erlaubt uneingeschränkte kommerzielle Nutzung.

Für den lokalen Betrieb mit Q4-Quantisierung werden etwa 16 GB VRAM benötigt — eine RTX 4090 oder ein Mac mit 24 GB+ reicht aus.

Fähigkeiten-Matrix

Was kann Qwen 3.5 27B — und was nicht?

🇩🇪 Deutsch-Chat

4.5

🇬🇧 Englisch-Chat

5.0

🗣️ Multilingual

5.0

💻 Code-Generierung

5.0

🌍 Übersetzung

4.5

📋 Zusammenfassung

4.5

📄 RAG / Dokumente

5.0

🔧 Tool-Use / Function Calling

4.5

🌐 Browser-Automatisierung

3.5

👁️ Bildverständnis

4.0

🧮 Mathematik / Logik

4.5

✍️ Kreatives Schreiben

4.0

Unterstützte Programmiersprachen: Python, JavaScript, TypeScript, Java, C++, Rust, Go, PHP, SQL, HTML/CSS

Hardware-Anforderungen

Größe	Min. RAM	Empf. VRAM	CPU möglich?	Quantisierung	Empfohlene GPU
?	? GB	? GB	✗ Nein	Q4_K_M	—
?	? GB	? GB	✗ Nein	Q4_K_M	—
?	? GB	? GB	✗ Nein	Q4_K_M	—

GPU-Kaufberatung mit aktuellen Preisen ansehen

Kompatibilität

✓ Ollama

✓ LM Studio

✓ llama.cpp

✓ vLLM

✓ Open WebUI

✓ Text Gen WebUI

✓ Jan.ai

Bewertung

Output-Qualität ★★★★★ 5.0/5

Inference-Speed ★★★★☆ 4.5/5

RAM/VRAM-Effizienz ★★★★☆ 4.0/5

Weitere Qwen 3.5-Modelle

Qwen 3.5 9B

Kompaktes multimodales Modell für Consumer-Hardware

0.8B 2B 4B 9B 27B 35B MoE 122B MoE 397B MoE

Details ansehen

Qwen 3.5 35B MoE

Effizientes Mixture-of-Experts-Modell mit nur 3B aktiven Parametern

35B-A3B MoE

Details ansehen

War diese Übersicht hilfreich?