Lokale KI-Modelle im Vergleich
124 Modelle mit Hardware-Anforderungen, Fähigkeiten-Matrix und Installations-Tipps. Alle laufen auf deinem Rechner — keine Cloud, keine Verträge, keine Daten die dein Haus verlassen.
DeepSeek V3
DeepSeekGigantisches 671B MoE-Modell — eines der besten Open-Source-Modelle überhaupt
DeepSeek V4
DeepSeekOpen-Source-Gigant mit 1,6 Billionen Parametern der geschlossene Modelle beim Coding herausfordert
Gemma 4 31B
Google DeepMindGoogles leistungsstärkstes offenes Dense-Modell — Platz 3 weltweit unter allen Open-Weight-Modellen
Llama 4 Behemoth
Meta AIMetas größtes Modell mit 2 Billionen Parametern — das mächtigste Open-Source-Modell aller Zeiten
Llama 4 Maverick
MetaMetas großes MoE-Flaggschiff mit 400B Parametern und 128 Experten
Qwen 3.6
Alibaba Cloud (Qwen)Neuestes Open-Source-Modell für Agentic Coding mit 1M Kontext
Qwen 3.6 27B AWQ
Alibaba Cloud (Qwen)Optimale Variante für 2x RTX 3090 — 100+ Token/s bei voller 27B-Qualität dank AWQ-Quantisierung
BGE-M3
BAAI (Beijing Academy of AI)Mehrsprachiges Multi-Retrieval-Embedding mit 100+ Sprachen und 8K Kontext
Command A
CohereEnterprise-LLM mit starkem RAG und Tool-Nutzung
DeepSeek Coder V2
DeepSeekMoE-Code-Modell mit 236B Parametern und 128K Kontextfenster
DeepSeek R1
DeepSeekReasoning-Spezialist — denkt Schritt für Schritt wie ein Mensch
Devstral
Mistral AIMistrals spezialisiertes Coding-Modell für agentenbasierte Entwicklung
DreamShaper XL
Lykon (Community)Vielseitiger SDXL-Finetune für Illustration und Fotorealismus
E5-Mistral-7B
Intfloat / MicrosoftLLM-basiertes Embedding-Modell mit 7B Parametern
Faster Whisper
SYSTRAN / Guillaume KleinBis zu 4x schnellere Whisper-Transkription mit CTranslate2-Backend
FLUX.1
Black Forest Labs12B-Parameter-Bildgenerierung mit herausragender Textwiedergabe
Gemma 4 26B MoE
Google DeepMindHocheffizientes Mixture-of-Experts-Modell mit nur 4B aktiven Parametern bei 26B Gesamtkapazität
GLM-5.1
Z.ai (ehemals Zhipu AI)Chinas 744B Open-Source-Gigant mit MIT-Lizenz — #1 auf SWE-Bench Pro
GLM-5.1 Chat
Zhipu AI (Tsinghua)Chinesisches Open-Source-Modell mit exzellentem Tool-Calling und Agentic-AI-Fähigkeiten
GTE-Qwen2
Alibaba DAMO AcademyEffizientes mehrsprachiges Embedding-Modell auf Qwen2-Basis
Jina Embeddings v3
Jina AIVielseitiges Embedding-Modell mit Task-spezifischen LoRA-Adaptern
Juggernaut XL
KandooAI (Community)Premiumqualität-SDXL-Finetune mit extremem Detailreichtum
Llama 3.3
MetaMetas bester Open-Source-Allrounder mit 70 Milliarden Parametern
Llama 4 Scout
MetaMetas effizientes MoE-Modell mit 109B Parametern und 16 Experten
MiniCPM-V 2.6
OpenBMB / Tsinghua UniversityKompaktes 8B-Vision-Modell mit GPT-4V-naher Leistung auf dem Handy
Mistral Large 2
Mistral AIEuropas stärkstes Open-Source-Modell mit 123 Milliarden Parametern
Mistral Medium 3
Mistral AIMistrals ausgewogenes Mittelklasse-Modell mit starker Effizienz
MusicGen
Meta AIHochwertige Musikgenerierung aus Text und Melodie
mxbai-embed-large
Mixedbread AIDeutsches Embedding-Modell mit Spitzenleistung bei semantischer Suche
Nemotron 4 340B
NVIDIANVIDIAs größtes offenes Modell — spezialisiert auf synthetische Daten und Enterprise-Aufgaben
PaddleOCR
Baidu / PaddlePaddleUltraleichtes multilinguales OCR-Toolkit mit 80+ Sprachen
Qwen 2.5
AlibabaChinas stärkstes Open-Source-Modell — Spitzenreiter bei Code und Mathematik
Qwen 3.5 27B
Alibaba Cloud (Qwen)Multimodales Dense-Modell mit 262K Kontext und nativer Vision
Qwen3
Alibaba CloudAlibabas neuestes Sprachmodell mit hybrider Thinking-Architektur
QwQ-32B
Alibaba / Qwen Team32B-Reasoning-Modell das mit DeepSeek-R1 und o1-mini konkurriert
RealVisXL
SG161222 (Community)Fotorealismus-Spezialist auf Stable Diffusion XL-Basis
SeamlessM4T V2
Meta AIMultimodaler Übersetzer für Sprache und Text in 100 Sprachen
Stable Diffusion 3.5
Stability AILeistungsstarke lokale Bildgenerierung mit 8B-Parameter-Diffusion-Transformer
Stable Diffusion XL
Stability AIDer bewährte Standard für lokale KI-Bildgenerierung
Surya OCR
VikParuchuriMehrsprachige OCR mit Layout-Erkennung und Tabellen-Extraktion
Whisper Large V3
OpenAIFührendes lokales Spracherkennungsmodell mit 99 Sprachen
AnimateDiff
Shanghai AI LaboratoryVerwandle Stable-Diffusion-Bilder in animierte Videos
Aya Expanse
Cohere For AIMehrsprachiges 8B/32B-Modell mit Unterstützung für 23 Sprachen
Bark
Suno AIExpressives Text-to-Speech-Modell mit Emotionen und Soundeffekten
BioMistral
BioMistral Team (Universität Toulouse)Spezialisiertes medizinisches Sprachmodell auf Mistral-7B-Basis
CodeQwen 1.5
Alibaba CloudSpezialisiertes Code-Modell der Qwen-Familie mit 92 Sprachen
Codestral
Mistral AIMistrals erstes dediziertes 22B-Code-Modell mit 80+ Sprachen
CogVideoX
THUDM (Tsinghua University)Leistungsstarkes Open-Source-Modell für lokale KI-Videogenerierung
Command R+
CohereRAG-Spezialist mit 104B Parametern — optimiert für Unternehmenssuche
Coqui XTTS V2
Coqui AI (Community)Mehrsprachige Sprachsynthese mit Voice Cloning aus 6 Sekunden Audio
DBRX
Databricks / Mosaic ML132B-MoE-Modell von Databricks mit 36B aktiven Parametern
DocTR
MindeeEnd-to-End-Dokumentenerkennung mit Deep Learning
F5-TTS
SWividNon-autoregressive Sprachsynthese mit Flow Matching und DiT-Architektur
Gemma 4 E4B
Google DeepMindVielseitiges Edge-Modell mit multimodaler Intelligenz für Text, Bild und Audio
GLM-4
Zhipu AI / THUDMChinesisches Open-Source-LLM mit starker mehrsprachiger Leistung
Granite Code
IBMIBMs Enterprise-taugliches Open-Source-Coding-Modell
GTE-Large
Alibaba DAMO AcademyKompaktes Embedding-Modell mit herausragendem Preis-Leistungs-Verhältnis
InstantMesh
TencentARCEffiziente 3D-Mesh-Generierung aus einzelnen Bildern
Kolors
Kuaishou TechnologyChinesisches Bildmodell mit exzellenter Textverständnis-Fähigkeit
Llama 3.2 Vision
MetaMultimodales Open-Source-Modell mit Bildverständnis von Meta
LLaVA 1.6
LLaVA Team (Microsoft/Wisconsin)Open-Source Vision-Language-Modell für Bildanalyse und visuelles Reasoning
Mistral 3 14B
Mistral AIEuropas führendes Open-Weight-Modell mit EU AI Act Compliance
Mistral Nemo
Mistral AIKompaktes 12B-Modell aus Europa — der beste seiner Größenklasse
Mistral Small
Mistral AIEffizienter 24B-Allrounder aus Frankreich für lokale Nutzung
NLLB-200
Meta AIÜbersetzung zwischen 200 Sprachen — auch seltene und bedrohte Sprachen
Nomic Embed Text V2
Nomic AIErstes MoE-Embedding-Modell für mehrsprachige semantische Suche
Nougat
Meta AIAkademische PDF-Dokumente in maschinenlesbares Markdown umwandeln
Nous Hermes 3
NousResearchCommunity-getunte Llama-Variante für präzise Instruktionsbefolgung
OpenChat 3.5
Tsinghua University / OpenChat TeamOpen-Source-Chat-Modell das GPT-3.5 auf Benchmarks schlaegt
OpenCoder
INFLY (INF Institute)Vollständig offenes Coding-Modell mit transparentem Trainingsansatz
Parler-TTS
Hugging FacePromptgesteuerte Sprachsynthese mit natürlichen Stimmenbeschreibungen
Phi-4
MicrosoftMicrosofts kompaktes 14B-Kraftpaket für Mathematik und Reasoning
Phi-4 Mini
MicrosoftKompaktes 3.8B-Sprachmodell mit erstaunlicher Leistung
Piper TTS
Rhasspy / Michael HansenNatürlich klingende lokale Sprachsynthese für über 30 Sprachen
PixArt-Sigma
PixArt-alphaEffizientes Transformer-Bildmodell mit 4K-Auflösung
Qwen 2.5 Coder
AlibabaSpezialisierter Code-Assistent auf Basis von Qwen 2.5
Qwen 3.5 35B MoE
Alibaba Cloud (Qwen)Effizientes Mixture-of-Experts-Modell mit nur 3B aktiven Parametern
Qwen 3.5 9B
Alibaba Cloud (Qwen)Kompaktes multimodales Modell für Consumer-Hardware
SauerkrautLM
VAGO SolutionsDeutschlands bestes deutschsprachiges Open-Source-LLM
Stable Audio Open
Stability AIOpen-Source-Audiogenerierung für Musik und Soundeffekte
Stable Video Diffusion
Stability AIHochwertige Bild-zu-Video-Generierung von Stability AI
StyleTTS 2
Columbia University NLP LabDiffusionsbasierte Sprachsynthese mit menschenähnlicher Qualität
TripoSR
Stability AI / Tripo AISchnelle Bild-zu-3D-Rekonstruktion in unter einer Sekunde
Zephyr
Hugging FaceDPO-optimiertes Chat-Modell mit herausragender Alignment-Qualität
CodeLlama
MetaMetas spezialisierter Code-Assistent auf Llama-Basis
CogVLM2
Tsinghua University / Zhipu AILeistungsstarkes Vision-Language-Modell mit Video-Verständnis
Command R7B
CohereKompaktes Enterprise-Sprachmodell mit RAG-Optimierung von Cohere
DeepFloyd IF
DeepFloyd / Stability AIMehrstufiges Pixel-Diffusionsmodell mit herausragender Textwiedergabe
DiscoLM German
DiscoResearchDeutsches Community-LLM mit starker Anweisungsbefolgung
Dolphin Mixtral
Eric HartfordUnzensiertes MoE-Modell ohne eingebaute Guardrails
EM German
Jan Philipp Harries / EllamindProfessionelles deutsches Sprachmodell in mehreren Varianten
Gemma 2
GoogleGoogles Open-Source-Modell — solider Allrounder in 9B und 27B
Gemma 4 E2B
Google DeepMindKompaktes multimodales Edge-Modell mit Text-, Bild- und Audio-Verständnis
Granite 3
IBMIBMs Enterprise-Modell mit Fokus auf RAG und Unternehmensanwendungen
InternLM 2.5
Shanghai AI LabChinesisches Forschungsmodell mit starkem Tool-Use und Reasoning
Kandinsky 3
Sber AIRussisches Open-Source-Bildgenerierungsmodell mit 12B Parametern
Magicoder
IIIS, Tsinghua UniversityOSS-Instruct-trainiertes Code-Modell mit einzigartiger Datenqualität
Marco-o1
MarcoPolo Team (Alibaba)Open-Source-Reasoning-Modell mit Chain-of-Thought
MetaVoice-1B
MetaVoiceZero-Shot-Voice-Cloning-TTS mit nur wenigen Sekunden Referenzaudio
Mixtral 8x7B
Mistral AIErstes Open-Source Mixture-of-Experts-Modell mit effizienter Architektur
Moondream 2
vikhyatkWinziges Vision-Language-Modell für Bildbeschreibung auf Edge-Geräten
Nemotron 3 Nano
NVIDIANVIDIAs effizientes 4B-Agentic-Modell für lokale KI-Aufgaben
OLMo 2
Allen Institute for AI (AI2)Vollständig offenes LLM — Modell, Daten, Training und Code transparent
Open-Sora
HPC-AI TechOpen-Source-Videogenerierung inspiriert von OpenAIs Sora
Orca 2
Microsoft ResearchKompaktes Reasoning-Modell mit ausgeklügelten Denkstrategien
Riffusion
Riffusion (Seth Forsgren & Hayk Martiros)Musik aus Text via Spektrogramm-Diffusion
Shap-E
OpenAI3D-Objektgenerierung aus Text oder Bildern
SmolLM2
Hugging FaceState-of-the-Art kompaktes Modell für On-Device-KI mit 1.7B Parametern
Vosk
Alpha CepheiUltraleichte Offline-Spracherkennung für Embedded und Mobile
WizardCoder
WizardLM TeamEvol-Instruct-optimiertes Code-Modell mit starker Benchmark-Leistung
WizardLM 2
MicrosoftInstruktions-optimiertes Modell mit herausragender Anweisungsbefolgung
Yi-1.5
01.AIStarkes bilinguales Modell von Kai-Fu Lees KI-Startup 01.AI
Bunny
BAAIKompaktes Vision-Language-Modell mit effizientem Training
Falcon 2
Technology Innovation Institute (TII)Multilingales Modell aus den VAE — besonders stark in Arabisch
Fuyu-8B
Adept AIMultimodales Modell für Bild-zu-Text ohne separate Vision-Encoder
LeoLM
LAION / Björn PlüsterErstes dediziertes deutsches Open-Source-Sprachmodell
Llama 3.2
MetaKompakte Sprachmodelle für schwache Hardware und Edge-Geräte
Ministral 3B
Mistral AIUltraleichtes Edge-Modell von Mistral für Smartphones und IoT
Solar
UpstageKoreanisches 10.7B-Modell mit innovativer Depth-Upscaling-Technologie
Stable LM 2
Stability AIStabilitys kompaktes 12B-Sprachmodell für lokale Nutzung
StarCoder 2
BigCode / Hugging FaceOpen-Source Code-Modell für über 600 Programmiersprachen
TinyLlama
Zhang PeiyuanKompaktes 1.1B-Sprachmodell trainiert auf 3 Billionen Token
Vicuna
LMSYSPionier der Open-Source-Chatbots — feinabgestimmtes Llama-Modell
Alpaca
Stanford UniversityStanfords wegweisendes Instruction-Following-Modell auf Llama-Basis