KI die sieht, klickt und tippt — wie ein Kollege am Bildschirm
28. Mai 2026 | Von: KI-Katalog Redaktion
Am 26. Mai 2026 hat Microsoft eine Funktion allgemein verfügbar gemacht, die die Automatisierung in Unternehmen grundlegend verändern wird: Computer-Using Agents in Copilot Studio. Diese KI-Agenten können Bildschirme sehen, Websites navigieren, Formulare ausfüllen und Anwendungen bedienen — genau wie ein menschlicher Mitarbeiter.
Was Computer-Using Agents können
Bisherige Automatisierung (RPA, Skripte, Macros) basierte auf festen Regeln: "Klicke auf den Button mit ID #submit". Wenn sich das Interface ändert, bricht die Automatisierung. Computer-Using Agents arbeiten anders: Sie sehen den Bildschirm, verstehen was darauf passiert und entscheiden, was als nächstes zu tun ist.
Konkret bedeutet das:
- Ein Agent kann eine Webseite öffnen, ein Formular finden, es ausfüllen und absenden — ohne dass die Webseite eine API haben muss
- Wenn sich das Layout der Webseite ändert, passt sich der Agent automatisch an
- Der Agent kann zwischen verschiedenen Anwendungen wechseln — Browser, Excel, E-Mail
- Azure Key Vault für sichere Credential-Verwaltung
- Microsoft Purview Audit-Logging für Compliance
- Human-in-the-Loop — konfigurierbar, wann ein Mensch eingreifen muss
- Multi-Step-Workflows — Computer-Using Agents können in größere Automatisierungen eingebettet werden
- Microsoft Copilot Blog: Computer-Using Agents — May 2026 Updates
- Microsoft Tech Community: Computer-Using Agents GA
- Enterprise DNA: Microsoft Makes AI Agents That Can Use Any Software
- TechTimes: Claude Checks GPT Work, Screen Agents Go Live
Praktisches Beispiel
Ein Versicherungsunternehmen hat Schadensmeldungen, die per E-Mail als PDF ankommen. Der Computer-Using Agent: 1. Öffnet die E-Mail und den PDF-Anhang 2. Liest die Schadensmeldung und extrahiert die relevanten Daten 3. Öffnet das interne Schadensbearbeitungssystem (eine alte Web-Anwendung ohne API) 4. Füllt die Felder aus und erstellt den Fall 5. Sendet eine Bestätigungsmail an den KundenVorher: 15 Minuten manuelle Arbeit pro Fall. Nachher: 2 Minuten, davon 30 Sekunden menschliche Prüfung.
Die Technik dahinter
Microsoft nutzt für Computer-Using Agents eine Kombination aus OpenAI CUA (Computer Use Agent) und Claude Sonnet 4.5 als KI-Modelle. Ja, richtig gelesen: Microsoft verwendet neben seinem eigenen OpenAI-Modell auch Anthropics Claude — Claude prüft die Arbeit von GPT. Das zeigt: Selbst Microsoft vertraut nicht einem einzelnen Modell für kritische Aufgaben.
Enterprise-Features
Für wen ist das relevant?
| Branche | Anwendungsfall | Zeitersparnis |
|---|---|---|
| Versicherung | Schadensmeldungen verarbeiten | 80% |
| Buchhaltung | Rechnungen in Legacy-Systeme einpflegen | 70% |
| HR | Bewerberdaten aus E-Mails in ATS übertragen | 60% |
| Verwaltung | Formulare zwischen Systemen übertragen | 75% |
| Vertrieb | Leads aus LinkedIn in CRM übernehmen | 50% |
Besonders wertvoll ist die Technologie für Unternehmen mit alten Systemen ohne API — und das sind in Deutschland die meisten. Statt eine teure SAP-Integration zu bauen, kann ein Computer-Using Agent die bestehende Oberfläche nutzen.
DSGVO und Sicherheit
Microsoft bietet Computer-Using Agents über die Azure-Cloud an, mit der Möglichkeit, EU-Datenresidenz zu wählen. Der AVV ist über den Microsoft Enterprise Agreement abgedeckt. Für deutsche Unternehmen bedeutet das: Die Technologie ist DSGVO-konform einsetzbar — vorausgesetzt, die Datenverarbeitung wird auf EU-Region konfiguriert.
Die Credential-Verwaltung über Azure Key Vault stellt sicher, dass der Agent Zugangsdaten nutzen kann, ohne sie im Klartext zu sehen. Das ist ein wichtiger Sicherheitsaspekt, denn ein Agent der sich in Systeme einloggt, braucht Passwörter — die dürfen nicht im KI-Modell landen.
Vergleich mit der Konkurrenz
| Feature | Microsoft Copilot Studio | Anthropic Claude Computer Use | Google Gemini |
|---|---|---|---|
| Status | GA (allgemein verfügbar) | Beta (API) | Angekündigt |
| Modelle | OpenAI CUA + Claude Sonnet 4.5 | Claude Sonnet 4 | Gemini 3.5 |
| Enterprise-Features | Vollständig (Purview, Key Vault) | Eingeschränkt | In Entwicklung |
| Preis | Copilot Studio Lizenz | API-basiert | Noch unbekannt |
| EU-Datenresidenz | Ja | Nein | Ja (Google Cloud) |
Microsoft hat hier einen klaren First-Mover-Vorteil: Es ist die erste Enterprise-fähige Lösung für Computer-Using Agents mit vollständigem Compliance-Stack.
Fazit
Computer-Using Agents sind der nächste große Schritt in der KI-Automatisierung. Statt APIs zu bauen und Systeme zu integrieren, können KI-Agenten jetzt bestehende Oberflächen nutzen — wie ein neuer Mitarbeiter, der am ersten Tag den Bildschirm erklärt bekommt. Für Unternehmen mit Legacy-Systemen und manuellen Prozessen ist das potenziell transformativ.
Die Technologie ist real und verfügbar — nicht als Forschungspreview, sondern als GA-Produkt. Wer repetitive Bildschirmarbeit in seinem Unternehmen hat, sollte sich Computer-Using Agents jetzt ansehen.
Alle Automatisierungs-Tools im KI-Katalog | KI-Agenten: 7 Workflows für Unternehmen | n8n als Alternative
---
Quellen: