Lokale KI-Modelle 2026 — Vergleich, Hardware & Installation

DeepSeek V3

DeepSeek

5.0

Gigantisches 671B MoE-Modell — eines der besten Open-Source-Modelle überhaupt

671B (37B aktiv)

🇩🇪 Deutsch-Chat · 🇬🇧 Englisch-Chat · 💻 Coding · 📄 RAG/Dokumente

✓ Kommerziell

DeepSeek V4

DeepSeek

5.0

Open-Source-Gigant mit 1,6 Billionen Parametern der geschlossene Modelle beim Coding herausfordert

1.6T (49B aktiv) V4 Pro 284B (13B aktiv) V4 Flash

🇩🇪 Deutsch-Chat · 🇬🇧 Englisch-Chat · 💻 Coding · 👁️ Bildverständnis

✓ Kommerziell

Gemma 4 31B

Google DeepMind

5.0

Googles leistungsstärkstes offenes Dense-Modell — Platz 3 weltweit unter allen Open-Weight-Modellen

30.7B

🇩🇪 Deutsch-Chat · 🇬🇧 Englisch-Chat · 💻 Coding · 👁️ Bildverständnis

✓ Kommerziell

Llama 4 Behemoth

Meta AI

5.0

Metas größtes Modell mit 2 Billionen Parametern — das mächtigste Open-Source-Modell aller Zeiten

2T (288B aktiv) MoE

🇩🇪 Deutsch-Chat · 🇬🇧 Englisch-Chat · 💻 Coding · 👁️ Bildverständnis

✓ Kommerziell

Llama 4 Maverick

Meta

5.0

Metas großes MoE-Flaggschiff mit 400B Parametern und 128 Experten

400B MoE (17B aktiv)

🇩🇪 Deutsch-Chat · 🇬🇧 Englisch-Chat · 💻 Coding · 👁️ Bildverständnis

✓ Kommerziell

Qwen 3.6

Alibaba Cloud (Qwen)

5.0

Neuestes Open-Source-Modell für Agentic Coding mit 1M Kontext

35B-A3B MoE 27B Dense

🇩🇪 Deutsch-Chat · 🇬🇧 Englisch-Chat · 💻 Coding · 👁️ Bildverständnis

✓ Kommerziell

Qwen 3.6 27B AWQ

Alibaba Cloud (Qwen)

5.0

Optimale Variante für 2x RTX 3090 — 100+ Token/s bei voller 27B-Qualität dank AWQ-Quantisierung

27B AWQ INT4

🇩🇪 Deutsch-Chat · 🇬🇧 Englisch-Chat · 💻 Coding · 📄 RAG/Dokumente

✓ Kommerziell

BGE-M3

BAAI (Beijing Academy of AI)

4.5

Mehrsprachiges Multi-Retrieval-Embedding mit 100+ Sprachen und 8K Kontext

568M

📄 RAG/Dokumente

✓ Kommerziell

Command A

Cohere

4.5

Enterprise-LLM mit starkem RAG und Tool-Nutzung

111B (35B aktiv)

🇩🇪 Deutsch-Chat · 🇬🇧 Englisch-Chat · 💻 Coding · 📄 RAG/Dokumente

⚠ Eingeschränkt

DeepSeek Coder V2

DeepSeek

4.5

MoE-Code-Modell mit 236B Parametern und 128K Kontextfenster

16B 236B

🇬🇧 Englisch-Chat · 💻 Coding · 📄 RAG/Dokumente · 🧮 Mathematik

✓ Kommerziell

DeepSeek R1

DeepSeek

4.5

Reasoning-Spezialist — denkt Schritt für Schritt wie ein Mensch

7B 14B 32B 70B 671B

🇩🇪 Deutsch-Chat · 🇬🇧 Englisch-Chat · 💻 Coding · 📄 RAG/Dokumente

✓ Kommerziell

Devstral

Mistral AI

4.5

Mistrals spezialisiertes Coding-Modell für agentenbasierte Entwicklung

24B

🇩🇪 Deutsch-Chat · 🇬🇧 Englisch-Chat · 💻 Coding · 📄 RAG/Dokumente

✓ Kommerziell

DreamShaper XL

Lykon (Community)

4.5

Vielseitiger SDXL-Finetune für Illustration und Fotorealismus

3.5B

✓ Kommerziell

E5-Mistral-7B

Intfloat / Microsoft

4.5

LLM-basiertes Embedding-Modell mit 7B Parametern

7B

📄 RAG/Dokumente

✓ Kommerziell

Faster Whisper

SYSTRAN / Guillaume Klein

4.5

Bis zu 4x schnellere Whisper-Transkription mit CTranslate2-Backend

39M 74M 244M 769M 1.55B

🌍 Übersetzung

✓ Kommerziell

FLUX.1

Black Forest Labs

4.5

12B-Parameter-Bildgenerierung mit herausragender Textwiedergabe

12B

👁️ Bildverständnis

⚠ Eingeschränkt

Gemma 4 26B MoE

Google DeepMind

4.5

Hocheffizientes Mixture-of-Experts-Modell mit nur 4B aktiven Parametern bei 26B Gesamtkapazität

25.2B gesamt / 3.8B aktiv (MoE)

🇩🇪 Deutsch-Chat · 🇬🇧 Englisch-Chat · 💻 Coding · 👁️ Bildverständnis

✓ Kommerziell

GLM-5.1

Z.ai (ehemals Zhipu AI)

4.5

Chinas 744B Open-Source-Gigant mit MIT-Lizenz — #1 auf SWE-Bench Pro

744B-A40B MoE

🇩🇪 Deutsch-Chat · 🇬🇧 Englisch-Chat · 💻 Coding · 📄 RAG/Dokumente

✓ Kommerziell

GLM-5.1 Chat

Zhipu AI (Tsinghua)

4.5

Chinesisches Open-Source-Modell mit exzellentem Tool-Calling und Agentic-AI-Fähigkeiten

9B 32B 130B

🇬🇧 Englisch-Chat · 💻 Coding · 👁️ Bildverständnis · 📄 RAG/Dokumente

✓ Kommerziell

GTE-Qwen2

Alibaba DAMO Academy

4.5

Effizientes mehrsprachiges Embedding-Modell auf Qwen2-Basis

1.5B 7B

📄 RAG/Dokumente

✓ Kommerziell

Jina Embeddings v3

Jina AI

4.5

Vielseitiges Embedding-Modell mit Task-spezifischen LoRA-Adaptern

572M

📄 RAG/Dokumente

⚠ Eingeschränkt

Juggernaut XL

KandooAI (Community)

4.5

Premiumqualität-SDXL-Finetune mit extremem Detailreichtum

3.5B

✓ Kommerziell

Llama 3.3

Meta

4.5

Metas bester Open-Source-Allrounder mit 70 Milliarden Parametern

70B

🇩🇪 Deutsch-Chat · 🇬🇧 Englisch-Chat · 💻 Coding · 📄 RAG/Dokumente

✓ Kommerziell

Llama 4 Scout

Meta

4.5

Metas effizientes MoE-Modell mit 109B Parametern und 16 Experten

109B MoE (17B aktiv)

🇩🇪 Deutsch-Chat · 🇬🇧 Englisch-Chat · 💻 Coding · 👁️ Bildverständnis

✓ Kommerziell

MiniCPM-V 2.6

OpenBMB / Tsinghua University

4.5

Kompaktes 8B-Vision-Modell mit GPT-4V-naher Leistung auf dem Handy

8B

🇩🇪 Deutsch-Chat · 🇬🇧 Englisch-Chat · 👁️ Bildverständnis

✓ Kommerziell

Mistral Large 2

Mistral AI

4.5

Europas stärkstes Open-Source-Modell mit 123 Milliarden Parametern

123B

🇩🇪 Deutsch-Chat · 🇬🇧 Englisch-Chat · 💻 Coding · 📄 RAG/Dokumente

✓ Kommerziell

Mistral Medium 3

Mistral AI

4.5

Mistrals ausgewogenes Mittelklasse-Modell mit starker Effizienz

24B

🇩🇪 Deutsch-Chat · 🇬🇧 Englisch-Chat · 💻 Coding · 📄 RAG/Dokumente

✓ Kommerziell

MusicGen

Meta AI

4.5

Hochwertige Musikgenerierung aus Text und Melodie

300M 1.5B 3.3B

⚠ Eingeschränkt

mxbai-embed-large

Mixedbread AI

4.5

Deutsches Embedding-Modell mit Spitzenleistung bei semantischer Suche

335M

📄 RAG/Dokumente

✓ Kommerziell

Nemotron 4 340B

NVIDIA

4.5

NVIDIAs größtes offenes Modell — spezialisiert auf synthetische Daten und Enterprise-Aufgaben

340B Instruct 340B Reward

🇩🇪 Deutsch-Chat · 🇬🇧 Englisch-Chat · 💻 Coding · 📄 RAG/Dokumente

✓ Kommerziell

PaddleOCR

Baidu / PaddlePaddle

4.5

Ultraleichtes multilinguales OCR-Toolkit mit 80+ Sprachen

4.4M (mobile) 15M (server)

👁️ Bildverständnis

✓ Kommerziell

Qwen 2.5

Alibaba

4.5

Chinas stärkstes Open-Source-Modell — Spitzenreiter bei Code und Mathematik

7B 32B 72B

🇩🇪 Deutsch-Chat · 🇬🇧 Englisch-Chat · 💻 Coding · 📄 RAG/Dokumente

✓ Kommerziell

Qwen 3.5 27B

Alibaba Cloud (Qwen)

4.5

Multimodales Dense-Modell mit 262K Kontext und nativer Vision

0.8B 2B 4B 9B 27B 35B MoE 122B MoE 397B MoE

🇩🇪 Deutsch-Chat · 🇬🇧 Englisch-Chat · 💻 Coding · 👁️ Bildverständnis

✓ Kommerziell

Qwen3

Alibaba Cloud

4.5

Alibabas neuestes Sprachmodell mit hybrider Thinking-Architektur

0.6B 1.7B 4B 8B 14B 30B 32B 235B MoE

🇩🇪 Deutsch-Chat · 🇬🇧 Englisch-Chat · 💻 Coding · 📄 RAG/Dokumente

✓ Kommerziell

QwQ-32B

Alibaba / Qwen Team

4.5

32B-Reasoning-Modell das mit DeepSeek-R1 und o1-mini konkurriert

32.5B

🇩🇪 Deutsch-Chat · 🇬🇧 Englisch-Chat · 💻 Coding · 📄 RAG/Dokumente

✓ Kommerziell

RealVisXL

SG161222 (Community)

4.5

Fotorealismus-Spezialist auf Stable Diffusion XL-Basis

3.5B

✓ Kommerziell

SeamlessM4T V2

Meta AI

4.5

Multimodaler Übersetzer für Sprache und Text in 100 Sprachen

2.3B

🌍 Übersetzung

⚠ Eingeschränkt

Stable Diffusion 3.5

Stability AI

4.5

Leistungsstarke lokale Bildgenerierung mit 8B-Parameter-Diffusion-Transformer

2.5B 8B

👁️ Bildverständnis

✓ Kommerziell

Stable Diffusion XL

Stability AI

4.5

Der bewährte Standard für lokale KI-Bildgenerierung

3.5B Base + 6.6B Refiner

👁️ Bildverständnis

✓ Kommerziell

Surya OCR

VikParuchuri

4.5

Mehrsprachige OCR mit Layout-Erkennung und Tabellen-Extraktion

~200M

👁️ Bildverständnis

⚠ Eingeschränkt

Whisper Large V3

OpenAI

4.5

Führendes lokales Spracherkennungsmodell mit 99 Sprachen

39M 74M 244M 769M 1.55B

🌍 Übersetzung

✓ Kommerziell

AnimateDiff

Shanghai AI Laboratory

4.0

Verwandle Stable-Diffusion-Bilder in animierte Videos

~100M (Motion-Modul)

👁️ Bildverständnis

✓ Kommerziell

Aya Expanse

Cohere For AI

4.0

Mehrsprachiges 8B/32B-Modell mit Unterstützung für 23 Sprachen

8B 32B

🇩🇪 Deutsch-Chat · 🇬🇧 Englisch-Chat · 📄 RAG/Dokumente · 🌍 Übersetzung

✓ Kommerziell

Bark

Suno AI

4.0

Expressives Text-to-Speech-Modell mit Emotionen und Soundeffekten

800M

✓ Kommerziell

BioMistral

BioMistral Team (Universität Toulouse)

4.0

Spezialisiertes medizinisches Sprachmodell auf Mistral-7B-Basis

7B

🇬🇧 Englisch-Chat · 📄 RAG/Dokumente

✓ Kommerziell

CodeQwen 1.5

Alibaba Cloud

4.0

Spezialisiertes Code-Modell der Qwen-Familie mit 92 Sprachen

7B

💻 Coding

✓ Kommerziell

Codestral

Mistral AI

4.0

Mistrals erstes dediziertes 22B-Code-Modell mit 80+ Sprachen

22B

🇬🇧 Englisch-Chat · 💻 Coding · 🧮 Mathematik

⚠ Eingeschränkt

CogVideoX

THUDM (Tsinghua University)

4.0

Leistungsstarkes Open-Source-Modell für lokale KI-Videogenerierung

2B 5B

👁️ Bildverständnis

✓ Kommerziell

Command R+

Cohere

4.0

RAG-Spezialist mit 104B Parametern — optimiert für Unternehmenssuche

104B

🇩🇪 Deutsch-Chat · 🇬🇧 Englisch-Chat · 📄 RAG/Dokumente · 🔧 Tool-Use

⚠ Eingeschränkt

Coqui XTTS V2

Coqui AI (Community)

4.0

Mehrsprachige Sprachsynthese mit Voice Cloning aus 6 Sekunden Audio

400M

✓ Kommerziell

DBRX

Databricks / Mosaic ML

4.0

132B-MoE-Modell von Databricks mit 36B aktiven Parametern

132B

🇬🇧 Englisch-Chat · 💻 Coding · 📄 RAG/Dokumente · 🧮 Mathematik

✓ Kommerziell

DocTR

Mindee

4.0

End-to-End-Dokumentenerkennung mit Deep Learning

~30M

👁️ Bildverständnis

✓ Kommerziell

F5-TTS

SWivid

4.0

Non-autoregressive Sprachsynthese mit Flow Matching und DiT-Architektur

300M

✓ Kommerziell

Gemma 4 E4B

Google DeepMind

4.0

Vielseitiges Edge-Modell mit multimodaler Intelligenz für Text, Bild und Audio

4.5B (8B mit Embeddings)

🇩🇪 Deutsch-Chat · 🇬🇧 Englisch-Chat · 💻 Coding · 👁️ Bildverständnis

✓ Kommerziell

GLM-4

Zhipu AI / THUDM

4.0

Chinesisches Open-Source-LLM mit starker mehrsprachiger Leistung

1.5B 4B 9B

🇬🇧 Englisch-Chat · 💻 Coding · 📄 RAG/Dokumente · 🔧 Tool-Use

✓ Kommerziell

Granite Code

IBM

4.0

IBMs Enterprise-taugliches Open-Source-Coding-Modell

3B 8B 20B 34B

🇬🇧 Englisch-Chat · 💻 Coding · 📄 RAG/Dokumente · 🧮 Mathematik

✓ Kommerziell

GTE-Large

Alibaba DAMO Academy

4.0

Kompaktes Embedding-Modell mit herausragendem Preis-Leistungs-Verhältnis

335M

📄 RAG/Dokumente

✓ Kommerziell

InstantMesh

TencentARC

4.0

Effiziente 3D-Mesh-Generierung aus einzelnen Bildern

~500M

👁️ Bildverständnis

✓ Kommerziell

Kolors

Kuaishou Technology

4.0

Chinesisches Bildmodell mit exzellenter Textverständnis-Fähigkeit

2.6B

👁️ Bildverständnis

✓ Kommerziell

Llama 3.2 Vision

Meta

4.0

Multimodales Open-Source-Modell mit Bildverständnis von Meta

11B 90B

🇩🇪 Deutsch-Chat · 🇬🇧 Englisch-Chat · 👁️ Bildverständnis · 📄 RAG/Dokumente

✓ Kommerziell

LLaVA 1.6

LLaVA Team (Microsoft/Wisconsin)

4.0

Open-Source Vision-Language-Modell für Bildanalyse und visuelles Reasoning

7B 13B 34B

🇬🇧 Englisch-Chat · 👁️ Bildverständnis

✓ Kommerziell

Mistral 3 14B

Mistral AI

4.0

Europas führendes Open-Weight-Modell mit EU AI Act Compliance

3B 8B 14B

🇩🇪 Deutsch-Chat · 🇬🇧 Englisch-Chat · 💻 Coding · 📄 RAG/Dokumente

✓ Kommerziell

Mistral Nemo

Mistral AI

4.0

Kompaktes 12B-Modell aus Europa — der beste seiner Größenklasse

12B

🇩🇪 Deutsch-Chat · 🇬🇧 Englisch-Chat · 💻 Coding · 📄 RAG/Dokumente

✓ Kommerziell

Mistral Small

Mistral AI

4.0

Effizienter 24B-Allrounder aus Frankreich für lokale Nutzung

24B

🇩🇪 Deutsch-Chat · 🇬🇧 Englisch-Chat · 💻 Coding · 📄 RAG/Dokumente

✓ Kommerziell

NLLB-200

Meta AI

4.0

Übersetzung zwischen 200 Sprachen — auch seltene und bedrohte Sprachen

600M 1.3B 3.3B 54.5B

🌍 Übersetzung

⚠ Eingeschränkt

Nomic Embed Text V2

Nomic AI

4.0

Erstes MoE-Embedding-Modell für mehrsprachige semantische Suche

475M

📄 RAG/Dokumente

✓ Kommerziell

Nougat

Meta AI

4.0

Akademische PDF-Dokumente in maschinenlesbares Markdown umwandeln

350M

👁️ Bildverständnis

⚠ Eingeschränkt

Nous Hermes 3

NousResearch

4.0

Community-getunte Llama-Variante für präzise Instruktionsbefolgung

8B 70B

🇩🇪 Deutsch-Chat · 🇬🇧 Englisch-Chat · 💻 Coding · 📄 RAG/Dokumente

✓ Kommerziell

OpenChat 3.5

Tsinghua University / OpenChat Team

4.0

Open-Source-Chat-Modell das GPT-3.5 auf Benchmarks schlaegt

7B

🇬🇧 Englisch-Chat · 💻 Coding · 📄 RAG/Dokumente · 🧮 Mathematik

✓ Kommerziell

OpenCoder

INFLY (INF Institute)

4.0

Vollständig offenes Coding-Modell mit transparentem Trainingsansatz

1.5B 8B

🇬🇧 Englisch-Chat · 💻 Coding · 🧮 Mathematik

✓ Kommerziell

Parler-TTS

Hugging Face

4.0

Promptgesteuerte Sprachsynthese mit natürlichen Stimmenbeschreibungen

600M Mini 2.2B

✓ Kommerziell

Phi-4

Microsoft

4.0

Microsofts kompaktes 14B-Kraftpaket für Mathematik und Reasoning

14B

🇬🇧 Englisch-Chat · 💻 Coding · 🧮 Mathematik

✓ Kommerziell

Phi-4 Mini

Microsoft

4.0

Kompaktes 3.8B-Sprachmodell mit erstaunlicher Leistung

3.8B

🇬🇧 Englisch-Chat · 💻 Coding · 🧮 Mathematik

✓ Kommerziell

Piper TTS

Rhasspy / Michael Hansen

4.0

Natürlich klingende lokale Sprachsynthese für über 30 Sprachen

15M 60M

✓ Kommerziell

PixArt-Sigma

PixArt-alpha

4.0

Effizientes Transformer-Bildmodell mit 4K-Auflösung

600M

👁️ Bildverständnis

✓ Kommerziell

Qwen 2.5 Coder

Alibaba

4.0

Spezialisierter Code-Assistent auf Basis von Qwen 2.5

7B 32B

💻 Coding · 🧮 Mathematik

✓ Kommerziell

Qwen 3.5 35B MoE

Alibaba Cloud (Qwen)

4.0

Effizientes Mixture-of-Experts-Modell mit nur 3B aktiven Parametern

35B-A3B MoE

🇩🇪 Deutsch-Chat · 🇬🇧 Englisch-Chat · 💻 Coding · 👁️ Bildverständnis

✓ Kommerziell

Qwen 3.5 9B

Alibaba Cloud (Qwen)

4.0

Kompaktes multimodales Modell für Consumer-Hardware

0.8B 2B 4B 9B 27B 35B MoE 122B MoE 397B MoE

🇩🇪 Deutsch-Chat · 🇬🇧 Englisch-Chat · 💻 Coding · 👁️ Bildverständnis

✓ Kommerziell

SauerkrautLM

VAGO Solutions

4.0

Deutschlands bestes deutschsprachiges Open-Source-LLM

7B 14B 70B

🇩🇪 Deutsch-Chat · 🇬🇧 Englisch-Chat · 💻 Coding · 📄 RAG/Dokumente

✓ Kommerziell

Stable Audio Open

Stability AI

4.0

Open-Source-Audiogenerierung für Musik und Soundeffekte

1.2B

✓ Kommerziell

Stable Video Diffusion

Stability AI

4.0

Hochwertige Bild-zu-Video-Generierung von Stability AI

1.5B

👁️ Bildverständnis

✓ Kommerziell

StyleTTS 2

Columbia University NLP Lab

4.0

Diffusionsbasierte Sprachsynthese mit menschenähnlicher Qualität

~30M

✓ Kommerziell

TripoSR

Stability AI / Tripo AI

4.0

Schnelle Bild-zu-3D-Rekonstruktion in unter einer Sekunde

~300M

👁️ Bildverständnis

✓ Kommerziell

ZAYA1-8B

Zyphra

4.0

Ultrakompaktes MoE-Reasoning-Modell mit nur 760M aktiven Parametern — läuft auf Smartphones

8B (760M aktiv) MoE

🇬🇧 Englisch-Chat · 🧮 Mathematik

✓ Kommerziell

Zephyr

Hugging Face

4.0

DPO-optimiertes Chat-Modell mit herausragender Alignment-Qualität

7B

🇬🇧 Englisch-Chat · 📄 RAG/Dokumente

✓ Kommerziell

CodeLlama

Meta

3.5

Metas spezialisierter Code-Assistent auf Llama-Basis

7B 34B 70B

💻 Coding

✓ Kommerziell

CogVLM2

Tsinghua University / Zhipu AI

3.5

Leistungsstarkes Vision-Language-Modell mit Video-Verständnis

19B

🇬🇧 Englisch-Chat · 👁️ Bildverständnis

✓ Kommerziell

Command R7B

Cohere

3.5

Kompaktes Enterprise-Sprachmodell mit RAG-Optimierung von Cohere

7B

🇩🇪 Deutsch-Chat · 🇬🇧 Englisch-Chat · 📄 RAG/Dokumente · 🔧 Tool-Use

⚠ Eingeschränkt

DeepFloyd IF

DeepFloyd / Stability AI

3.5

Mehrstufiges Pixel-Diffusionsmodell mit herausragender Textwiedergabe

400M 900M 4.3B

👁️ Bildverständnis

⚠ Eingeschränkt

DiscoLM German

DiscoResearch

3.5

Deutsches Community-LLM mit starker Anweisungsbefolgung

8x7B

🇩🇪 Deutsch-Chat · 🇬🇧 Englisch-Chat · 📄 RAG/Dokumente · 🌍 Übersetzung

✓ Kommerziell

Dolphin Mixtral

Eric Hartford

3.5

Unzensiertes MoE-Modell ohne eingebaute Guardrails

46.7B (12.9B aktiv)

🇬🇧 Englisch-Chat · 💻 Coding

✓ Kommerziell

EM German

Jan Philipp Harries / Ellamind

3.5

Professionelles deutsches Sprachmodell in mehreren Varianten

7B 13B 70B

🇩🇪 Deutsch-Chat · 🌍 Übersetzung

✓ Kommerziell

Gemma 2

Google

3.5

Googles Open-Source-Modell — solider Allrounder in 9B und 27B

9B 27B

🇩🇪 Deutsch-Chat · 🇬🇧 Englisch-Chat · 💻 Coding · 📄 RAG/Dokumente

✓ Kommerziell

Gemma 4 E2B

Google DeepMind

3.5

Kompaktes multimodales Edge-Modell mit Text-, Bild- und Audio-Verständnis

2.3B (5.1B mit Embeddings)

🇬🇧 Englisch-Chat · 👁️ Bildverständnis

✓ Kommerziell

Granite 3

IBM

3.5

IBMs Enterprise-Modell mit Fokus auf RAG und Unternehmensanwendungen

8B

🇬🇧 Englisch-Chat · 📄 RAG/Dokumente

✓ Kommerziell

InternLM 2.5

Shanghai AI Lab

3.5

Chinesisches Forschungsmodell mit starkem Tool-Use und Reasoning

7B 20B

🇬🇧 Englisch-Chat · 💻 Coding · 📄 RAG/Dokumente · 🔧 Tool-Use

✓ Kommerziell

Kandinsky 3

Sber AI

3.5

Russisches Open-Source-Bildgenerierungsmodell mit 12B Parametern

12B

👁️ Bildverständnis

✓ Kommerziell

Magicoder

IIIS, Tsinghua University

3.5

OSS-Instruct-trainiertes Code-Modell mit einzigartiger Datenqualität

7B

💻 Coding

✓ Kommerziell

Marco-o1

MarcoPolo Team (Alibaba)

3.5

Open-Source-Reasoning-Modell mit Chain-of-Thought

7B

🇬🇧 Englisch-Chat · 💻 Coding · 🧮 Mathematik

✓ Kommerziell

MetaVoice-1B

MetaVoice

3.5

Zero-Shot-Voice-Cloning-TTS mit nur wenigen Sekunden Referenzaudio

1.2B

✓ Kommerziell

Mixtral 8x7B

Mistral AI

3.5

Erstes Open-Source Mixture-of-Experts-Modell mit effizienter Architektur

46.7B (12.9B aktiv)

🇩🇪 Deutsch-Chat · 🇬🇧 Englisch-Chat · 💻 Coding · 📄 RAG/Dokumente

✓ Kommerziell

Moondream 2

vikhyatk

3.5

Winziges Vision-Language-Modell für Bildbeschreibung auf Edge-Geräten

1.86B

👁️ Bildverständnis

✓ Kommerziell

Nemotron 3 Nano

NVIDIA

3.5

NVIDIAs effizientes 4B-Agentic-Modell für lokale KI-Aufgaben

4B

🇬🇧 Englisch-Chat · 🔧 Tool-Use

✓ Kommerziell

OLMo 2

Allen Institute for AI (AI2)

3.5

Vollständig offenes LLM — Modell, Daten, Training und Code transparent

7B 13B

🇬🇧 Englisch-Chat · 📄 RAG/Dokumente

✓ Kommerziell

Open-Sora

HPC-AI Tech

3.5

Open-Source-Videogenerierung inspiriert von OpenAIs Sora

1.1B

👁️ Bildverständnis

✓ Kommerziell

Orca 2

Microsoft Research

3.5

Kompaktes Reasoning-Modell mit ausgeklügelten Denkstrategien

7B 13B

🇬🇧 Englisch-Chat · 📄 RAG/Dokumente · 🧮 Mathematik

⚠ Eingeschränkt

Riffusion

Riffusion (Seth Forsgren & Hayk Martiros)

3.5

Musik aus Text via Spektrogramm-Diffusion

~860M

✓ Kommerziell

Shap-E

OpenAI

3.5

3D-Objektgenerierung aus Text oder Bildern

300M

👁️ Bildverständnis

✓ Kommerziell

SmolLM2

Hugging Face

3.5

State-of-the-Art kompaktes Modell für On-Device-KI mit 1.7B Parametern

135M 360M 1.7B

🇬🇧 Englisch-Chat

✓ Kommerziell

Vosk

Alpha Cephei

3.5

Ultraleichte Offline-Spracherkennung für Embedded und Mobile

50M 300M

✓ Kommerziell

WizardCoder

WizardLM Team

3.5

Evol-Instruct-optimiertes Code-Modell mit starker Benchmark-Leistung

7B 13B 34B

💻 Coding · 🧮 Mathematik

✓ Kommerziell

WizardLM 2

Microsoft

3.5

Instruktions-optimiertes Modell mit herausragender Anweisungsbefolgung

7B 8x22B

🇬🇧 Englisch-Chat · 💻 Coding

✓ Kommerziell

Yi-1.5

01.AI

3.5

Starkes bilinguales Modell von Kai-Fu Lees KI-Startup 01.AI

34B

🇬🇧 Englisch-Chat · 💻 Coding · 🧮 Mathematik · 🌍 Übersetzung

✓ Kommerziell

Bunny

BAAI

3.0

Kompaktes Vision-Language-Modell mit effizientem Training

3B 4B 8B

👁️ Bildverständnis

✓ Kommerziell

Falcon 2

Technology Innovation Institute (TII)

3.0

Multilingales Modell aus den VAE — besonders stark in Arabisch

11B

🇬🇧 Englisch-Chat · 🌍 Übersetzung

✓ Kommerziell

Fuyu-8B

Adept AI

3.0

Multimodales Modell für Bild-zu-Text ohne separate Vision-Encoder

8B

👁️ Bildverständnis

⚠ Eingeschränkt

LeoLM

LAION / Björn Plüster

3.0

Erstes dediziertes deutsches Open-Source-Sprachmodell

7B 13B

🇩🇪 Deutsch-Chat · 🌍 Übersetzung

✓ Kommerziell

Llama 3.2

Meta

3.0

Kompakte Sprachmodelle für schwache Hardware und Edge-Geräte

1B 3B

🇬🇧 Englisch-Chat

✓ Kommerziell

Ministral 3B

Mistral AI

3.0

Ultraleichtes Edge-Modell von Mistral für Smartphones und IoT

3B

🇬🇧 Englisch-Chat

✓ Kommerziell

Solar

Upstage

3.0

Koreanisches 10.7B-Modell mit innovativer Depth-Upscaling-Technologie

10.7B

🇬🇧 Englisch-Chat

⚠ Eingeschränkt

Stable LM 2

Stability AI

3.0

Stabilitys kompaktes 12B-Sprachmodell für lokale Nutzung

12B

🇬🇧 Englisch-Chat

⚠ Eingeschränkt

StarCoder 2

BigCode / Hugging Face

3.0

Open-Source Code-Modell für über 600 Programmiersprachen

15B

💻 Coding

✓ Kommerziell

TinyLlama

Zhang Peiyuan

3.0

Kompaktes 1.1B-Sprachmodell trainiert auf 3 Billionen Token

1.1B

✓ Kommerziell

Vicuna

LMSYS

3.0

Pionier der Open-Source-Chatbots — feinabgestimmtes Llama-Modell

7B 13B

🇬🇧 Englisch-Chat

✓ Kommerziell

Alpaca

Stanford University

2.5

Stanfords wegweisendes Instruction-Following-Modell auf Llama-Basis

7B

⚠ Eingeschränkt

Lokale KI-Modelle im Vergleich

DeepSeek V3

DeepSeek V4

Gemma 4 31B

Llama 4 Behemoth

Llama 4 Maverick

Qwen 3.6

Qwen 3.6 27B AWQ

BGE-M3

Command A

DeepSeek Coder V2

DeepSeek R1

Devstral

DreamShaper XL

E5-Mistral-7B

Faster Whisper

FLUX.1

Gemma 4 26B MoE

GLM-5.1

GLM-5.1 Chat

GTE-Qwen2

Jina Embeddings v3

Juggernaut XL

Llama 3.3

Llama 4 Scout

MiniCPM-V 2.6

Mistral Large 2

Mistral Medium 3

MusicGen

mxbai-embed-large

Nemotron 4 340B

PaddleOCR

Qwen 2.5

Qwen 3.5 27B

Qwen3

QwQ-32B

RealVisXL

SeamlessM4T V2

Stable Diffusion 3.5

Stable Diffusion XL

Surya OCR

Whisper Large V3

AnimateDiff

Aya Expanse

Bark

BioMistral

CodeQwen 1.5

Codestral

CogVideoX

Command R+

Coqui XTTS V2

DBRX

DocTR

F5-TTS

Gemma 4 E4B

GLM-4

Granite Code

GTE-Large

InstantMesh

Kolors

Llama 3.2 Vision

LLaVA 1.6

Mistral 3 14B

Mistral Nemo

Mistral Small

NLLB-200

Nomic Embed Text V2

Nougat

Nous Hermes 3

OpenChat 3.5

OpenCoder

Parler-TTS

Phi-4

Phi-4 Mini

Piper TTS

PixArt-Sigma

Qwen 2.5 Coder

Qwen 3.5 35B MoE

Qwen 3.5 9B

SauerkrautLM