Das Ende der Flatrate: Copilot wird zum Zähler
1. Juni 2026 | Von: KI-Katalog Redaktion
Ab heute, dem 1. Juni 2026, stellt GitHub Copilot sein Abrechnungsmodell um: Statt einer festen monatlichen Gebühr für unbegrenzte Nutzung zahlen Entwickler jetzt nach verbrauchten Tokens. Die Grundgebühr bleibt gleich ($19/Monat Individual), aber sie beschreibt jetzt ein enthaltenes Token-Kontingent — wer mehr verbraucht, zahlt drauf.
Die Reaktion der Community? TechCrunch titelt: "What a joke."
Was sich konkret ändert
Vorher (bis 31. Mai)
- $19/Monat: Unbegrenzte Code-Completions + Chat
- Bei Erschöpfung der Premium-Requests: Automatischer Fallback auf günstigeres Modell
- Vorhersehbare Kosten
- $19/Monat: Enthaltenes Token-Kontingent
- Darüber hinaus: Abrechnung pro Token
- Kein automatischer Fallback mehr — wer das Kontingent aufbraucht, muss nachkaufen oder warten
- Code-Completions (Tab-Taste) bleiben inklusive
- Betroffen: Copilot Chat, Agents, Code Review, große Kontextfenster
- Ein Entwickler schätzt: Von $29/Monat auf $750/Monat bei normaler Chat-Nutzung
- Ein anderer: Von $50 auf $3.000 bei intensiver Agent-Nutzung
- Microsoft sagt: "Die meisten Nutzer werden unter ihrem Kontingent bleiben"
- TechCrunch: GitHub Copilot's new token-based billing spurs consternation
- GitHub Blog: Copilot is moving to usage-based billing
- Dataconomy: GitHub Copilot Token Pricing Backlash
- Visual Studio Magazine: You Will Get Less, but Pay the Same Price
Ab 1. Juni
Die Horror-Szenarien
Auf Reddit und X kursieren Hochrechnungen:
Die Wahrheit liegt wahrscheinlich dazwischen. Wer Copilot hauptsächlich für Tab-Completions nutzt, wird wenig Unterschied merken. Wer täglich Copilot Chat, Code Review oder Copilot Workspace nutzt, muss genau hinschauen.
Warum Microsoft das macht
Die Erklärung ist wirtschaftlich: Jeder Copilot-Nutzer kostete Microsoft mehr an Inferenz-Kosten als die $19 Abo-Gebühr einbrachten. Mit Token-Billing wird die Last auf die Power-User verteilt, die die teuersten Modelle am intensivsten nutzen.
Das ist das gleiche Muster wie bei Cloud-Services: Zuerst Flatrate zum Kundenaufbau, dann nutzungsbasierte Abrechnung wenn die Nutzerbasis groß genug ist.
Die Alternativen
Für Entwickler, die vorhersehbare Kosten wollen, gibt es jetzt stärkere Gründe denn je, Alternativen zu prüfen:
| Tool | Preis | Modell | Vorteil |
|---|---|---|---|
| Cursor Pro | $20/Monat | Flatrate (500 Premium) | Unbegrenzte Completions, festes Limit |
| Windsurf Pro | $15/Monat | Flatrate | Günstiger als Copilot |
| Claude Code | Verbrauch (~$15-30) | Token-basiert | Aber transparenter und oft günstiger |
| Continue + Ollama | $0 | Lokal | Keine laufenden Kosten, volle Kontrolle |
| Kilo Code + API | ~$2-5/Mo | Eigene API-Wahl | Maximale Flexibilität |
Unser ausführlicher Vergleich von Copilot-Alternativen zeigt die Details.
Was Entwickler jetzt tun sollten
1. Token-Verbrauch beobachten: In den ersten Wochen genau tracken, wie viele Tokens man tatsächlich verbraucht 2. Chat-Nutzung reduzieren: Einfache Fragen an kostenlose Tools delegieren (Mistral Le Chat, Perplexity) 3. Alternativen testen: Cursor und Windsurf bieten kostenlose Pläne zum Ausprobieren 4. Lokale Modelle aufsetzen: Ollama + Qwen Coder für offline Coding ohne laufende Kosten — unser Setup-Guide zeigt wie
Fazit
Die Token-Billing-Umstellung ist der deutlichste Hinweis darauf, dass das "KI für $20/Monat unbegrenzt"-Zeitalter endet. Die Inferenzkosten für leistungsstarke Modelle sind real, und irgendwann muss jemand sie bezahlen. Für Gelegenheitsnutzer ändert sich wenig — für Power-User ist es der richtige Moment, den eigenen KI-Tool-Stack zu diversifizieren.
GitHub Copilot im KI-Katalog | 5 kostenlose Copilot-Alternativen | Coding-Tools Praxistest
---
Quellen: