100% Lokal · DSGVO

Command A

von Cohere · Lizenz: CC-BY-NC-4.0 · Eingeschränkte Lizenz

Enterprise-LLM mit starkem RAG und Tool-Nutzung

4.5 Gesamt

Verfügbare Größen: 111B (35B aktiv)

ollama run command-a Website HuggingFace

Was ist Command A?

Command A ist Coheres neuestes Enterprise-Sprachmodell, das speziell für den Einsatz in Unternehmensumgebungen optimiert wurde. Mit seinen 111 Milliarden Parametern in einer Mixture-of-Experts-Architektur (nur 35B aktiv) bietet es eine herausragende Balance zwischen Leistung und Effizienz. Das Modell glaenzt besonders bei Retrieval-Augmented Generation (RAG), Tool-Nutzung und strukturiertem Output - Kernkompetenzen, die in Business-Anwendungen unverzichtbar sind.

Command A unterstützt mehrere Sprachen, darunter Deutsch auf einem beachtlichen Niveau, und kann komplexe Anweisungen präzise befolgen. Die Architektur ermöglicht es, das Modell auf einer einzelnen High-End-GPU mit 80 GB VRAM oder quantisiert auf Consumer-GPUs mit 24 GB zu betreiben. Cohere hat das Modell unter der CC-BY-NC-Lizenz veröffentlicht, wobei kommerzielle Lizenzen separat erhältlich sind.

Besonders hervorzuheben ist die native Unterstützung für Function Calling und die Fähigkeit, mit externen APIs zu interagieren. Die GGUF-Varianten sind über Ollama und llama.cpp verfügbar und ermöglichen den lokalen Betrieb. Für Unternehmen, die eine selbst gehostete Alternative zu GPT-4 suchen, ist Command A eine der staerksten Open-Weight-Optionen auf dem Markt.

Die native Unterstützung für strukturierten JSON-Output macht Command A besonders geeignet für automatisierte Workflows und Datenextraktionspipelines in Unternehmen. Die aktive Community bei Hugging Face bietet zahlreiche quantisierte Varianten für verschiedene Hardware-Konfigurationen.

Fähigkeiten-Matrix

Was kann Command A — und was nicht?

🇩🇪 Deutsch-Chat

4.0

🇬🇧 Englisch-Chat

4.5

🗣️ Multilingual

4.0

💻 Code-Generierung

3.5

🌍 Übersetzung

3.5

📋 Zusammenfassung

4.5

📄 RAG / Dokumente

5.0

🔧 Tool-Use / Function Calling

5.0

🌐 Browser-Automatisierung

—

👁️ Bildverständnis

—

🧮 Mathematik / Logik

3.5

✍️ Kreatives Schreiben

3.5

Hardware-Anforderungen

Größe	Min. RAM	Empf. VRAM	CPU möglich?	Quantisierung	Empfohlene GPU
111B	48 GB	40 GB	✗ Nein	Q4_K_M	RTX 4090 24GB (Q3) oder A100 80GB

GPU-Kaufberatung mit aktuellen Preisen ansehen

Kompatibilität

✓ Ollama

✓ LM Studio

✓ llama.cpp

✓ vLLM

✓ Open WebUI

✓ Text Gen WebUI

✓ Jan.ai

Bewertung

Output-Qualität ★★★★☆ 4.5/5

Inference-Speed ★★★☆☆ 3.5/5

RAM/VRAM-Effizienz ★★★★☆ 4.0/5

War diese Übersicht hilfreich?