100% Lokal · DSGVO

Qwen3

von Alibaba Cloud · Lizenz: apache-2.0 · Kommerziell nutzbar

Alibabas neuestes Sprachmodell mit hybrider Thinking-Architektur

5.0 Gesamt
Verfügbare Größen: 0.6B 1.7B 4B 8B 14B 30B 32B 235B MoE

Was ist Qwen3?

Qwen3 ist die neueste Generation der Qwen-Modellfamilie von Alibaba Cloud und bringt bedeutende Verbesserungen in nahezu allen Bereichen. Das Modell ist in verschiedenen Größen von 0,6B bis 235B Parametern verfügbar, wobei die größeren Varianten eine Mixture-of-Experts-Architektur nutzen. Besonders innovativ ist die hybride Thinking-Architektur: Qwen3 kann zwischen einem schnellen Antwortmodus und einem tiefgehenden Reasoning-Modus wechseln, ähnlich wie bei Modellen der o1-Klasse.

Im Thinking-Modus durchläuft das Modell einen strukturierten Denkprozess, bevor es antwortet, was die Qualität bei komplexen Aufgaben deutlich verbessert. Die multilinguale Unterstützung wurde massiv erweitert — Qwen3 unterstützt über 100 Sprachen, darunter Deutsch auf einem sehr hohen Niveau. In Benchmarks übertrifft Qwen3 sowohl DeepSeek R1 als auch Llama 4 Maverick in mehreren Kategorien, insbesondere bei Coding, Mathematik und multilingualen Aufgaben.

Die Coding-Fähigkeiten sind herausragend und unterstützen eine breite Palette von Programmiersprachen. Function Calling und Tool Use werden nativ unterstützt, was die Integration in Agenten-Systeme erleichtert. Für den lokalen Betrieb empfiehlt sich die 32B-Variante, die auf einer RTX 4090 mit Q4-Quantisierung flüssig läuft.

Die Apache-2.0-Lizenz erlaubt uneingeschränkte kommerzielle Nutzung. Ollama und LM Studio bieten bereits optimierte Versionen an, und die GGUF-Formate sind auf Hugging Face verfügbar.

Fähigkeiten-Matrix

Was kann Qwen3 — und was nicht?

🇩🇪 Deutsch-Chat
4.5
🇬🇧 Englisch-Chat
5.0
🗣️ Multilingual
5.0
💻 Code-Generierung
5.0
🌍 Übersetzung
4.5
📋 Zusammenfassung
5.0
📄 RAG / Dokumente
4.5
🔧 Tool-Use / Function Calling
5.0
🌐 Browser-Automatisierung
👁️ Bildverständnis
🧮 Mathematik / Logik
5.0
✍️ Kreatives Schreiben
4.5

Unterstützte Programmiersprachen: Python, JavaScript, TypeScript, Java, C++, Rust, Go, PHP, SQL, C#, Kotlin, Ruby

Hardware-Anforderungen

Größe Min. RAM Empf. VRAM CPU möglich? Quantisierung Empfohlene GPU
32B 24 GB 24 GB ✗ Nein Q4_K_M RTX 4090 24GB
8B 8 GB 6 GB ✓ Ja (langsam) Q4_K_M RTX 3060 12GB

GPU-Kaufberatung mit aktuellen Preisen ansehen

Kompatibilität

Bewertung

Output-Qualität ★★★★★ 5.0/5
Inference-Speed ★★★★☆ 4.0/5
RAM/VRAM-Effizienz ★★★★☆ 4.5/5

Weitere Qwen-Modelle

Qwen 2.5

Chinas stärkstes Open-Source-Modell — Spitzenreiter bei Code und Mathematik

7B 32B 72B
Details ansehen

QwQ-32B

32B-Reasoning-Modell das mit DeepSeek-R1 und o1-mini konkurriert

32.5B
Details ansehen

Qwen 2.5 Coder

Spezialisierter Code-Assistent auf Basis von Qwen 2.5

7B 32B
Details ansehen

War diese Übersicht hilfreich?