Auf TikTok geht ein Clip viral: NVIDIA habe einen Wunder-Chip mit 128 GB RAM, CPU und GPU auf einem Chip entwickelt, der zusammen mit Microsoft den PC-Markt revolutionieren soll. Klingt zu gut, um wahr zu sein? Hier ist, was wirklich dahintersteckt — und wo der Hype übertreibt.
Was ist der NVIDIA RTX Spark?
Am 31. Mai 2026 hat NVIDIA auf der Computex in Taiwan den RTX Spark vorgestellt — eine komplett neue Plattform für Windows-PCs. Das Herzstück ist der GB10 Grace Blackwell Superchip, der tatsächlich CPU und GPU in einem Package vereint:
- CPU: 20 ARM-Kerne (v9.2, entwickelt mit MediaTek) — 10 Hochleistungs- und 10 Effizienzkerne
- GPU: Blackwell-Architektur mit 6.144 CUDA-Kernen und Tensor Cores der 5. Generation
- Speicher: Bis zu 128 GB unified LPDDR5X-9400 — CPU und GPU teilen sich den gesamten RAM
- KI-Leistung: 1 Petaflop (FP4), also 1.000 TOPS
- Gaming: AAA-Spiele bei 1440p mit 100+ FPS, vergleichbar mit einer RTX 5070 Laptop-GPU
- Fertigung: TSMC 3nm
- Windows on ARM wird speziell für RTX Spark optimiert
- Microsoft Surface Laptop Ultra — das erste Surface mit RTX Spark-Chip
- Surface RTX Spark Dev Box — ein kompakter Entwickler-PC
- NVIDIA OpenShell Runtime: Neue Sicherheits-Sandbox für lokale KI-Agenten auf Windows
- N1-Laptops (Basismodell, 64 GB): ab ca. 1.700 Euro
- N1X-Laptops (Vollversion, 128 GB möglich): ab ca. 2.750 Euro
- DGX Spark (Linux-Desktop, 128 GB): 4.400 Euro
- Top-Konfigurationen mit 128 GB: über 5.000 Euro
- Llama 3.1 70B (Q4): ~40 GB — läuft locker
- Mixtral 8x22B: ~80 GB — passt
- Llama 3.1 405B (Q2): ~120 GB — gerade noch möglich
- Qwen 2.5 72B: ~45 GB — kein Problem
- KI-Entwickler: Lokale Modelle entwickeln und testen, voller CUDA-Stack, alle KI-Coding-Tools nativ
- Kreative: KI-Bildgenerierung und Videobearbeitung auf einem Gerät
- Unternehmen mit DSGVO-Anforderungen: Sensible Daten bleiben lokal, keine Cloud nötig — relevant für den EU AI Act
- Gamer, die auch KI nutzen: RTX-Gaming bei 1440p plus lokale KI-Modelle im selben Gerät
- 2026: RTX Spark (Blackwell)
- 2027-2028: Vera Rubin Spark (LPDDR6)
- 2029-2030: Rosa Feynman Spark
Die Besonderheit: Durch den Unified Memory können KI-Modelle den gesamten Speicher nutzen. Ein 70-Milliarden-Parameter-Modell wie Llama 3.1 70B passt komplett in die 128 GB — ohne externe Grafikkarte, ohne Server.
Die Microsoft-Partnerschaft ist real — und groß
NVIDIA und Microsoft haben eine tiefgreifende Zusammenarbeit angekündigt:
Microsoft-CEO Satya Nadella: „RTX Spark marks a real breakthrough towards delivering unmetered intelligence to every home and desk with Windows."
OEM-Partner wie ASUS, Dell, HP, Lenovo und MSI bauen ebenfalls RTX Spark-Laptops.
Wo der TikTok-Hype übertreibt
| TikTok-Behauptung | Realität |
|---|---|
| „128 GB RAM auf einem Chip" | 128 GB unified RAM stimmt, aber der Speicher sitzt neben dem Chip (on-package), nicht auf dem Chip selbst |
| „CPU und GPU auf einem Chip" | Zwei separate Dies (MediaTek-CPU + NVIDIA-GPU) über NVLink verbunden — ein Package, nicht ein monolithischer Chip |
| „Revolutioniert den PC-Markt" | Premium-Produkt ab 1.700 Euro — kein Massenmarkt-Gerät |
| „Völlig neuer Chip" | Die Linux-Version (DGX Spark) gibt es seit Oktober 2025 für 4.699 Dollar. Neu ist die Windows-Version |
Was kostet das Ganze?
RTX Spark-Geräte sind nicht billig:
Zum Vergleich: Ein Apple Mac Studio mit M4 Ultra und 128 GB kostet 4.600 Euro. Eine Desktop-RTX 5090 mit 32 GB liegt bei rund 2.200 Euro — hat aber nur ein Viertel des Speichers.
Warum 128 GB RAM ein Gamechanger für lokale KI sind
Hier wird es für KI-Enthusiasten spannend. Mit 128 GB Unified Memory können Sie auf einem Laptop Modelle laufen lassen, die bisher einen Server brauchten:
In unserem Lokale-KI-Verzeichnis zeigen wir, welche Modelle auf welcher Hardware laufen. Der RTX Spark mit 128 GB würde die meisten aktuellen Open-Source-Modelle ohne Cloud-Abhängigkeit ermöglichen.
Ein wichtiger Haken: Die Speicherbandbreite liegt bei 301 GB/s — ein Apple M4 Ultra schafft 819 GB/s. Das bedeutet: Beim Generieren von Text (Token für Token) ist Apple deutlich schneller. Der NVIDIA-Vorteil liegt beim Training und bei KI-Inferenz mit CUDA, wo die 6.144 GPU-Kerne und der volle Tensor-Core-Support zählen.
Für wen lohnt sich der RTX Spark?
Für wen nicht: Wer einfach nur ChatGPT im Browser nutzt, braucht keinen 2.000-Euro-Chip dafür. Und wer maximale Token-Geschwindigkeit will, fährt mit einem Mac Studio M4 Ultra besser.
Verfügbarkeit
Die RTX Spark Windows-Laptops kommen im Herbst 2026. Die Linux-Version (DGX Spark) ist bereits jetzt erhältlich. NVIDIA hat außerdem eine Roadmap bis 2030 veröffentlicht:
Fazit: Real, aber kein Wunder
Der NVIDIA RTX Spark ist ein beeindruckendes Stück Technik — 128 GB Unified Memory, CPU und GPU in einem Package, voller CUDA-Stack, echtes Gaming. Die Microsoft-Partnerschaft ist real und tiefgreifend. Aber es ist kein 500-Euro-Chip für jedermann, sondern ein Premium-Produkt für Power-User.
Der TikTok-Hype übertreibt wie üblich. Die Wahrheit ist spannend genug: Ab Herbst 2026 können Sie ein 70-Milliarden-Parameter-KI-Modell auf Ihrem Laptop laufen lassen — ohne Internet, ohne Cloud, ohne Abo. Das ist die eigentliche Revolution.
Alle lokalen KI-Modelle, die auf dem RTX Spark laufen werden, finden Sie in unserem Lokale-KI-Verzeichnis mit über 120 Modellen. Und welche Hardware Sie jetzt schon brauchen, zeigt unser GPU-Kaufberater.
Quellen: NVIDIA Newsroom, Tom's Hardware, IT Boltwise, Microsoft Blog