100% Lokal · DSGVO

Granite 3

von IBM · Lizenz: apache-2.0 · Kommerziell nutzbar

IBMs Enterprise-Modell mit Fokus auf RAG und Unternehmensanwendungen

3.5 Gesamt
Verfügbare Größen: 8B

Was ist Granite 3?

Granite 3 ist IBMs Open-Source-Sprachmodell, das speziell für den Unternehmenseinsatz entwickelt wurde. Mit 8 Milliarden Parametern ist es kompakt genug für den lokalen Betrieb auf Consumer-Hardware, bietet aber eine Qualität, die für viele Business-Anwendungen ausreicht. IBM hat bei der Entwicklung besonderen Wert auf Zuverlässigkeit, Faktentreue und die Minimierung von Halluzinationen gelegt — kritische Eigenschaften für den professionellen Einsatz.

Die RAG-Optimierung mit einer Bewertung von 4.0 macht Granite 3 zu einer guten Wahl für Wissensmanagementsysteme und Dokumentensuche in Unternehmen. IBM hat das Modell auf sorgfältig kuratierte, lizenzrechtlich einwandfreie Daten trainiert und bietet sogar eine IP-Absicherung für kommerzielle Nutzer. Die englische Chat-Qualität erreicht 4.0, Deutsch wird mit 3.0 grundlegend unterstützt.

Die Apache-2.0-Lizenz ermöglicht uneingeschränkte kommerzielle Nutzung, was zusammen mit IBMs Reputation für Enterprise-Software Vertrauen schafft. Hardware-seitig ist Granite 3 mit nur 6 GB VRAM sehr genügsam und läuft problemlos auf einer RTX 3060 oder vergleichbaren GPUs. Auch CPU-Betrieb ist möglich.

Für kleine und mittlere Unternehmen, die einen zuverlässigen lokalen KI-Assistenten ohne Cloud-Abhängigkeit benötigen, ist Granite 3 eine solide und sichere Wahl. Die Integration mit IBMs watsonx-Plattform bietet zusätzliche Möglichkeiten für Unternehmen, die bereits im IBM-Ökosystem arbeiten. IBMs langjährige Enterprise-Erfahrung spiegelt sich in der Robustheit und Vorhersagbarkeit des Modells wider.

Fähigkeiten-Matrix

Was kann Granite 3 — und was nicht?

🇩🇪 Deutsch-Chat
3.0
🇬🇧 Englisch-Chat
4.0
🗣️ Multilingual
3.0
💻 Code-Generierung
3.0
🌍 Übersetzung
2.5
📋 Zusammenfassung
4.0
📄 RAG / Dokumente
4.0
🔧 Tool-Use / Function Calling
3.0
🌐 Browser-Automatisierung
👁️ Bildverständnis
🧮 Mathematik / Logik
3.0
✍️ Kreatives Schreiben
2.5

Unterstützte Programmiersprachen: Python, JavaScript, Java, SQL, COBOL

Hardware-Anforderungen

Größe Min. RAM Empf. VRAM CPU möglich? Quantisierung Empfohlene GPU
8B 8 GB 6 GB ✓ Ja (langsam) Q4_K_M RTX 3060 12GB

GPU-Kaufberatung mit aktuellen Preisen ansehen

Kompatibilität

Bewertung

Output-Qualität ★★★☆☆ 3.5/5
Inference-Speed ★★★★☆ 4.5/5
RAM/VRAM-Effizienz ★★★★☆ 4.5/5

War diese Übersicht hilfreich?