100% Lokal · DSGVO

ZAYA1-8B

von Zyphra · Lizenz: Apache 2.0 · Kommerziell nutzbar

Ultrakompaktes MoE-Reasoning-Modell mit nur 760M aktiven Parametern — läuft auf Smartphones

4.0 Gesamt

Verfügbare Größen: 8B (760M aktiv) MoE

ollama run zaya1 Website HuggingFace

Was ist ZAYA1-8B?

ZAYA1-8B von Zyphra ist ein bahnbrechendes Mixture-of-Experts Reasoning-Modell, das mit nur 760 Millionen aktiven Parametern pro Anfrage eine erstaunliche Intelligenz pro Parameter erreicht. Das Modell hat insgesamt 8 Milliarden Parameter, aktiviert aber pro Token nur einen Bruchteil davon — was es extrem effizient macht und den Betrieb auf Smartphones, Tablets und schwacher Hardware ermoeglicht. Das Besondere an ZAYA1 ist die End-to-End-Entwicklung auf AMD Instinct Hardware — ein Zeichen dafür, dass das NVIDIA-Monopol bei KI-Training bröckelt.

Zyphra hat damit bewiesen, dass Frontier-ähnliche Reasoning-Fähigkeiten auch auf alternativer Hardware und mit deutlich weniger Parametern erreichbar sind. In Benchmarks zeigt ZAYA1-8B überraschend starke Reasoning-Fähigkeiten fuer seine Groesse: Bei logischen Aufgaben und mathematischem Reasoning übertrifft es Modelle mit der dreifachen Parameterzahl. Die Qualitaet bei Textgenerierung und Creative Writing ist erwartungsgemaess schwächer — dafuer sind groessere Modelle besser geeignet.

Fuer den lokalen Einsatz ist ZAYA1 ideal als schneller Helfer fuer spezifische Aufgaben: Zusammenfassungen, Klassifizierung, einfache Frage-Antwort-Szenarien und als Reasoning-Komponente in Multi-Agenten-Setups, wo ein grosses Modell die schweren Aufgaben und ZAYA1 die schnellen Entscheidungen uebernimmt. Unter Apache 2.0 Lizenz ist die kommerzielle Nutzung uneingeschraenkt moeglich.

Fähigkeiten-Matrix

Was kann ZAYA1-8B — und was nicht?

🇩🇪 Deutsch-Chat

2.5

🇬🇧 Englisch-Chat

4.0

🗣️ Multilingual

3.0

💻 Code-Generierung

3.0

🌍 Übersetzung

2.0

📋 Zusammenfassung

3.5

📄 RAG / Dokumente

3.0

🔧 Tool-Use / Function Calling

2.5

🌐 Browser-Automatisierung

—

👁️ Bildverständnis

—

🧮 Mathematik / Logik

4.0

✍️ Kreatives Schreiben

2.5

Hardware-Anforderungen

Größe	Min. RAM	Empf. VRAM	CPU möglich?	Quantisierung	Empfohlene GPU
?	? GB	? GB	✗ Nein	Q4_K_M	—

GPU-Kaufberatung mit aktuellen Preisen ansehen

Kompatibilität

✓ Ollama

✓ LM Studio

✓ llama.cpp

✓ vLLM

✓ Open WebUI

✓ Text Gen WebUI

✓ Jan.ai

Bewertung

Output-Qualität ★★★☆☆ 3.5/5

Inference-Speed ★★★★★ 5.0/5

RAM/VRAM-Effizienz ★★★★★ 5.0/5

War diese Übersicht hilfreich?