100% Lokal · DSGVO

Stable Diffusion XL

von Stability AI · Lizenz: creativeml-openrail-m · Kommerziell nutzbar

Der bewährte Standard für lokale KI-Bildgenerierung

4.5 Gesamt

Verfügbare Größen: 3.5B Base + 6.6B Refiner

Website HuggingFace

Was ist Stable Diffusion XL?

Stable Diffusion XL (SDXL) ist eines der am weitesten verbreiteten Open-Source-Modelle für KI-Bildgenerierung und gilt als der bewährte Standard für lokale Bildproduktion. Mit seiner Dual-Encoder-Architektur, die OpenCLIP ViT-bigG und CLIP ViT-L kombiniert, erzeugt SDXL hochwertige Bilder mit einer nativen Auflösung von 1024x1024 Pixeln — eine deutliche Verbesserung gegenüber dem Vorgänger SD 1.5. Das Modell besteht aus einem Base-Modell mit 3,5 Milliarden Parametern und einem optionalen Refiner-Modell, das die Bildqualität weiter verbessert.

Besonders hervorzuheben ist das riesige Ökosystem an Erweiterungen: Tausende von LoRA-Adaptoren, ControlNet-Modellen und Community-Finetunings sind auf Civitai und Hugging Face verfügbar. SDXL unterstützt Img2Img, Inpainting und Outpainting und lässt sich nahtlos in kreative Workflows integrieren. Die Hardware-Anforderungen sind moderat — eine GPU mit 8 GB VRAM reicht für grundlegende Bildgenerierung aus, wobei 12 GB oder mehr für höhere Auflösungen und schnellere Generierung empfehlenswert sind.

Tools wie ComfyUI, Automatic1111 und InvokeAI bieten benutzerfreundliche Oberflächen für die lokale Nutzung. Die CreativeML-Open-RAIL-M-Lizenz erlaubt kommerzielle Nutzung mit wenigen Einschränkungen. Für Anwender, die ein ausgereiftes, gut dokumentiertes und vielseitig erweiterbares Bildgenerierungsmodell suchen, ist SDXL nach wie vor eine hervorragende Wahl — insbesondere dank der unübertroffenen Community-Unterstützung.

Fähigkeiten-Matrix

Was kann Stable Diffusion XL — und was nicht?

🇩🇪 Deutsch-Chat

—

🇬🇧 Englisch-Chat

—

🗣️ Multilingual

—

💻 Code-Generierung

—

🌍 Übersetzung

—

📋 Zusammenfassung

—

📄 RAG / Dokumente

—

🔧 Tool-Use / Function Calling

—

🌐 Browser-Automatisierung

—

👁️ Bildverständnis

5.0

🧮 Mathematik / Logik

—

✍️ Kreatives Schreiben

5.0

Hardware-Anforderungen

Größe	Min. RAM	Empf. VRAM	CPU möglich?	Quantisierung	Empfohlene GPU
Base	12 GB	8 GB	✗ Nein	FP16	RTX 3060 12GB oder RTX 4060 8GB

GPU-Kaufberatung mit aktuellen Preisen ansehen

Kompatibilität

✗ Ollama

✗ LM Studio

✗ llama.cpp

✗ vLLM

✗ Open WebUI

✗ Text Gen WebUI

✗ Jan.ai

Bewertung

Output-Qualität ★★★★☆ 4.5/5

Inference-Speed ★★★★☆ 4.0/5

RAM/VRAM-Effizienz ★★★★☆ 4.5/5

Weitere Stable-diffusion-Modelle

Stable Diffusion 3.5

Leistungsstarke lokale Bildgenerierung mit 8B-Parameter-Diffusion-Transformer

2.5B 8B

Details ansehen

War diese Übersicht hilfreich?