100% Lokal · DSGVO

Qwen3

von Alibaba Cloud · Lizenz: apache-2.0 · Kommerziell nutzbar

Alibabas neuestes Sprachmodell mit hybrider Thinking-Architektur

4.5 Gesamt

Verfügbare Größen: 0.6B 1.7B 4B 8B 14B 30B 32B 235B MoE

ollama run qwen3:32b Website HuggingFace

Was ist Qwen3?

Qwen3 ist die neueste Generation der Qwen-Modellfamilie von Alibaba Cloud und bringt bedeutende Verbesserungen in nahezu allen Bereichen. Das Modell ist in verschiedenen Größen von 0,6B bis 235B Parametern verfügbar, wobei die größeren Varianten eine Mixture-of-Experts-Architektur nutzen. Besonders innovativ ist die hybride Thinking-Architektur: Qwen3 kann zwischen einem schnellen Antwortmodus und einem tiefgehenden Reasoning-Modus wechseln, ähnlich wie bei Modellen der o1-Klasse.

Im Thinking-Modus durchläuft das Modell einen strukturierten Denkprozess, bevor es antwortet, was die Qualität bei komplexen Aufgaben deutlich verbessert. Die multilinguale Unterstützung wurde massiv erweitert — Qwen3 unterstützt über 100 Sprachen, darunter Deutsch auf einem sehr hohen Niveau. In Benchmarks übertrifft Qwen3 sowohl DeepSeek R1 als auch Llama 4 Maverick in mehreren Kategorien, insbesondere bei Coding, Mathematik und multilingualen Aufgaben.

Die Coding-Fähigkeiten sind herausragend und unterstützen eine breite Palette von Programmiersprachen. Function Calling und Tool Use werden nativ unterstützt, was die Integration in Agenten-Systeme erleichtert. Für den lokalen Betrieb empfiehlt sich die 32B-Variante, die auf einer RTX 4090 mit Q4-Quantisierung flüssig läuft.

Die Apache-2.0-Lizenz erlaubt uneingeschränkte kommerzielle Nutzung. Ollama und LM Studio bieten bereits optimierte Versionen an, und die GGUF-Formate sind auf Hugging Face verfügbar.

Fähigkeiten-Matrix

Was kann Qwen3 — und was nicht?

🇩🇪 Deutsch-Chat

4.5

🇬🇧 Englisch-Chat

5.0

🗣️ Multilingual

4.5

💻 Code-Generierung

5.0

🌍 Übersetzung

4.5

📋 Zusammenfassung

4.5

📄 RAG / Dokumente

4.5

🔧 Tool-Use / Function Calling

4.5

🌐 Browser-Automatisierung

—

👁️ Bildverständnis

—

🧮 Mathematik / Logik

5.0

✍️ Kreatives Schreiben

4.0

Unterstützte Programmiersprachen: Python, JavaScript, TypeScript, Java, C++, Rust, Go, PHP, SQL, C#, Kotlin, Ruby

Hardware-Anforderungen

Größe	Min. RAM	Empf. VRAM	CPU möglich?	Quantisierung	Empfohlene GPU
32B	24 GB	24 GB	✗ Nein	Q4_K_M	RTX 4090 24GB
8B	8 GB	6 GB	✓ Ja (langsam)	Q4_K_M	RTX 3060 12GB

GPU-Kaufberatung mit aktuellen Preisen ansehen

Kompatibilität

✓ Ollama

✓ LM Studio

✓ llama.cpp

✓ vLLM

✓ Open WebUI

✓ Text Gen WebUI

✓ Jan.ai

Bewertung

Output-Qualität ★★★★★ 5.0/5

Inference-Speed ★★★★☆ 4.0/5

RAM/VRAM-Effizienz ★★★★☆ 4.0/5

Weitere Qwen-Modelle

Qwen 2.5

Chinas stärkstes Open-Source-Modell — Spitzenreiter bei Code und Mathematik

7B 32B 72B

Details ansehen

QwQ-32B

32B-Reasoning-Modell das mit DeepSeek-R1 und o1-mini konkurriert

32.5B

Details ansehen

Qwen 2.5 Coder

Spezialisierter Code-Assistent auf Basis von Qwen 2.5

7B 32B

Details ansehen

CodeQwen 1.5

Spezialisiertes Code-Modell der Qwen-Familie mit 92 Sprachen

Details ansehen

War diese Übersicht hilfreich?