100% Lokal · DSGVO

Stable Diffusion XL

von Stability AI · Lizenz: creativeml-openrail-m · Kommerziell nutzbar

Der bewährte Standard für lokale KI-Bildgenerierung

4.5 Gesamt
Verfügbare Größen: 3.5B Base + 6.6B Refiner

Was ist Stable Diffusion XL?

Stable Diffusion XL (SDXL) ist eines der am weitesten verbreiteten Open-Source-Modelle für KI-Bildgenerierung und gilt als der bewährte Standard für lokale Bildproduktion. Mit seiner Dual-Encoder-Architektur, die OpenCLIP ViT-bigG und CLIP ViT-L kombiniert, erzeugt SDXL hochwertige Bilder mit einer nativen Auflösung von 1024x1024 Pixeln — eine deutliche Verbesserung gegenüber dem Vorgänger SD 1.5. Das Modell besteht aus einem Base-Modell mit 3,5 Milliarden Parametern und einem optionalen Refiner-Modell, das die Bildqualität weiter verbessert.

Besonders hervorzuheben ist das riesige Ökosystem an Erweiterungen: Tausende von LoRA-Adaptoren, ControlNet-Modellen und Community-Finetunings sind auf Civitai und Hugging Face verfügbar. SDXL unterstützt Img2Img, Inpainting und Outpainting und lässt sich nahtlos in kreative Workflows integrieren. Die Hardware-Anforderungen sind moderat — eine GPU mit 8 GB VRAM reicht für grundlegende Bildgenerierung aus, wobei 12 GB oder mehr für höhere Auflösungen und schnellere Generierung empfehlenswert sind.

Tools wie ComfyUI, Automatic1111 und InvokeAI bieten benutzerfreundliche Oberflächen für die lokale Nutzung. Die CreativeML-Open-RAIL-M-Lizenz erlaubt kommerzielle Nutzung mit wenigen Einschränkungen. Für Anwender, die ein ausgereiftes, gut dokumentiertes und vielseitig erweiterbares Bildgenerierungsmodell suchen, ist SDXL nach wie vor eine hervorragende Wahl — insbesondere dank der unübertroffenen Community-Unterstützung.

Fähigkeiten-Matrix

Was kann Stable Diffusion XL — und was nicht?

🇩🇪 Deutsch-Chat
🇬🇧 Englisch-Chat
🗣️ Multilingual
💻 Code-Generierung
🌍 Übersetzung
📋 Zusammenfassung
📄 RAG / Dokumente
🔧 Tool-Use / Function Calling
🌐 Browser-Automatisierung
👁️ Bildverständnis
5.0
🧮 Mathematik / Logik
✍️ Kreatives Schreiben
5.0

Hardware-Anforderungen

Größe Min. RAM Empf. VRAM CPU möglich? Quantisierung Empfohlene GPU
Base 12 GB 8 GB ✗ Nein FP16 RTX 3060 12GB oder RTX 4060 8GB

GPU-Kaufberatung mit aktuellen Preisen ansehen

Kompatibilität

Ollama
LM Studio
llama.cpp
vLLM
Open WebUI
Text Gen WebUI
Jan.ai

Bewertung

Output-Qualität ★★★★☆ 4.5/5
Inference-Speed ★★★★☆ 4.0/5
RAM/VRAM-Effizienz ★★★★☆ 4.5/5

Weitere Stable-diffusion-Modelle

Stable Diffusion 3.5

Leistungsstarke lokale Bildgenerierung mit 8B-Parameter-Diffusion-Transformer

2.5B 8B
Details ansehen

War diese Übersicht hilfreich?