100% Lokal · DSGVO

Nemotron 3 Nano

von NVIDIA · Lizenz: NVIDIA Open Model License · Kommerziell nutzbar

NVIDIAs effizientes 4B-Agentic-Modell für lokale KI-Aufgaben

3.5 Gesamt

Verfügbare Größen: 4B

ollama run nemotron-3-nano Website HuggingFace

Was ist Nemotron 3 Nano?

Nemotron 3 Nano ist NVIDIAs kompaktes Sprachmodell mit 4 Milliarden Parametern, das speziell für effiziente, agentenbasierte KI-Aufgaben auf lokaler Hardware entwickelt wurde. Als Teil der Nemotron-Familie stellt es den Einstiegspunkt in NVIDIAs offene Modell-Landschaft dar und ist für Inferenz auf NVIDIA-GPUs optimiert, profitiert aber auch auf AMD-GPUs und CPUs von guter Performance. Das Modell zeichnet sich durch starke Tool-Use- und Function-Calling-Fähigkeiten aus und eignet sich damit besonders für agentenbasierte Workflows, bei denen das Modell selbstständig APIs aufrufen und Werkzeuge nutzen muss.

Nemotron 3 Nano unterstützt mehrstufiges Reasoning und kann komplexe Aufgaben in Teilschritte zerlegen. Trotz seiner kompakten Größe zeigt das Modell solide Leistungen bei Chat, Code-Generierung und Textverarbeitung. Die Hardware-Anforderungen sind gering: Mit nur 4 GB VRAM oder 8 GB RAM läuft das Modell auf nahezu jedem modernen Rechner.

Die NVIDIA Open Model License erlaubt kommerzielle Nutzung, und das Modell ist über Ollama einfach installierbar. Nemotron 3 Nano eignet sich besonders für Entwickler, die lokale KI-Agenten bauen möchten, die auf beschränkter Hardware laufen. Das Modell profitiert von NVIDIAs TensorRT-Optimierungen für maximale Inferenzgeschwindigkeit auf NVIDIA-GPUs und bietet damit ein überzeugendes Gesamtpaket für Edge-AI-Anwendungen.

Fähigkeiten-Matrix

Was kann Nemotron 3 Nano — und was nicht?

🇩🇪 Deutsch-Chat

3.0

🇬🇧 Englisch-Chat

3.5

🗣️ Multilingual

3.0

💻 Code-Generierung

3.0

🌍 Übersetzung

2.0

📋 Zusammenfassung

3.0

📄 RAG / Dokumente

3.0

🔧 Tool-Use / Function Calling

4.0

🌐 Browser-Automatisierung

—

👁️ Bildverständnis

—

🧮 Mathematik / Logik

3.0

✍️ Kreatives Schreiben

2.5

Unterstützte Programmiersprachen: Python, JavaScript, TypeScript, C++

Hardware-Anforderungen

Größe	Min. RAM	Empf. VRAM	CPU möglich?	Quantisierung	Empfohlene GPU
4B	4 GB	4 GB	✓ Ja (langsam)	Q4_K_M	RTX 3060

GPU-Kaufberatung mit aktuellen Preisen ansehen

Kompatibilität

✓ Ollama

✓ LM Studio

✓ llama.cpp

✓ vLLM

✓ Open WebUI

✗ Text Gen WebUI

✗ Jan.ai

Bewertung

Output-Qualität ★★★☆☆ 3.5/5

Inference-Speed ★★★★☆ 4.5/5

RAM/VRAM-Effizienz ★★★★☆ 4.5/5

Weitere Nemotron-Modelle

Nemotron 4 340B

NVIDIAs größtes offenes Modell — spezialisiert auf synthetische Daten und Enterprise-Aufgaben

340B Instruct 340B Reward

Details ansehen

War diese Übersicht hilfreich?