DeepSeek V4
von DeepSeek · Lizenz: MIT · Kommerziell nutzbar
Open-Source-Gigant mit 1,6 Billionen Parametern der geschlossene Modelle beim Coding herausfordert
Was ist DeepSeek V4?
DeepSeek V4 Pro ist das bisher leistungsstärkste Open-Source-Sprachmodell und der erste echte Herausforderer für GPT-5.5 und Claude Opus 4.7 aus dem Open-Source-Lager. Mit 1,6 Billionen Gesamtparametern (49 Milliarden aktiv pro Anfrage) und einem Kontextfenster von einer Million Tokens setzt DeepSeek V4 neue Maßstäbe für effiziente Mixture-of-Experts-Architekturen. Die Performance-Zahlen sprechen für sich: Bei Coding-Benchmarks schlägt DeepSeek V4 Pro GPT-5.5, bei Mathematik und STEM-Aufgaben liegt es gleichauf mit den besten geschlossenen Modellen.
Die innovative Hybrid-Attention-Architektur (Compressed Sparse Attention + Heavily Compressed Attention) reduziert die Rechenkosten für lange Kontexte um 73 Prozent gegenüber dem Vorgänger V3. Für lokale Nutzung existiert neben dem riesigen V4 Pro auch DeepSeek V4 Flash mit 284 Milliarden Parametern (13 Milliarden aktiv), das auch auf Consumer-Hardware mit 2x RTX 3090 betreibbar ist. Beide Modelle unterstützen einen Thinking-Modus für verbessertes Reasoning und einen Non-Thinking-Modus für schnelle Antworten.
Die Apache-2.0-Lizenz erlaubt uneingeschränkte kommerzielle Nutzung.
Fähigkeiten-Matrix
Was kann DeepSeek V4 — und was nicht?
Hardware-Anforderungen
| Größe | Min. RAM | Empf. VRAM | CPU möglich? | Quantisierung | Empfohlene GPU |
|---|---|---|---|---|---|
| ? | ? GB | ? GB | ✗ Nein | Q4_K_M | — |
Kompatibilität
Bewertung
War diese Übersicht hilfreich?