gerlinger.ai
Über unsInvestition
KI-Readiness-Check
Assessment2 Min.

KI-Readiness-Check

KI-ROI-Rechner
Kalkulator2 Min.

KI-ROI-Rechner

DSGVO-KI-Check
Checkliste4 Min.

DSGVO-KI-Check

KI-Lösungsfinder
Quiz2 Min.

KI-Lösungsfinder

KI-Kosten-Vergleichsrechner
Kalkulator2 Min.

KI-Kosten-Vergleichsrechner

Prompt-Bibliothek
RessourceUnbegrenzt

Prompt-Bibliothek

Nano Banana 2 Prompt Builder
GeneratorUnbegrenzt

Nano Banana 2 Prompt Builder

Kostenlose Tools

KI-Readiness-Check
Assessment2 Min.

KI-Readiness-Check

KI-ROI-Rechner
Kalkulator2 Min.

KI-ROI-Rechner

DSGVO-KI-Check
Checkliste4 Min.

DSGVO-KI-Check

KI-Lösungsfinder
Quiz2 Min.

KI-Lösungsfinder

KI-Kosten-Vergleichsrechner
Kalkulator2 Min.

KI-Kosten-Vergleichsrechner

Prompt-Bibliothek
RessourceUnbegrenzt

Prompt-Bibliothek

Nano Banana 2 Prompt Builder
GeneratorUnbegrenzt

Nano Banana 2 Prompt Builder

Neueste Artikel

KI-Agenten im Google Workspace: Dein digitaler Assistent
ki-im-mittelstand

KI-Agenten im Google Workspace: Dein digitaler Assistent

Echtzeit-Dashboards: Daten bündeln, besser planen
praxisbeispiele

Echtzeit-Dashboards: Daten bündeln, besser planen

Claude Code im B2B: Warum Unternehmen umsteigen
wissen

Claude Code im B2B: Warum Unternehmen umsteigen

KI am Arbeitsplatz: Wenn der Algorithmus Excel bedient
automatisierung

KI am Arbeitsplatz: Wenn der Algorithmus Excel bedient

Compliance-Schulungen mit KI automatisieren
automatisierung

Compliance-Schulungen mit KI automatisieren

Apple M5 Chip: Lokale KI ohne teure Server
ki-im-mittelstand

Apple M5 Chip: Lokale KI ohne teure Server

gerlinger.ai
5.0
TÜV-zertifiziert in Verkaufspsychologie
Intelligente WebsitesAutomatisierungKI-TelefonassistentChatbotsInterne WissensdatenbankDeine eigene Firmen-KIIndividuelle Software
Intelligente WebsitesAutomatisierungKI-TelefonassistentChatbotsInterne WissensdatenbankDeine eigene Firmen-KIIndividuelle Software
Top 10 KI-ToolsBlogKI-LexikonFAQKI-Einführungs-ChecklisteDSGVO-Vorlagen-Paket
KI-Readiness-CheckKI-ROI-RechnerDSGVO-KI-CheckKI-LösungsfinderKostenvergleichsrechnerPrompt-Bibliothek
Kontaktformularhallo@gerlinger.aiLinkedIn

© 2026 JANGER GmbH. Alle Rechte vorbehalten.

ImpressumDatenschutzAGB
  1. Blog
  2. KI am Arbeitsplatz: Wenn der Algorithmus Excel bedient

KI am Arbeitsplatz: Wenn der Algorithmus Excel bedient

Computer Use macht KI vom Chatbot zum digitalen Sachbearbeiter. GPT-5.4 übertrifft Menschen bei Desktop-Aufgaben. So profitieren KMUs davon.

Jannis Gerlinger

Jannis Gerlinger

10. März 2026·8 Min. Lesezeit
KI bedient eigenständig eine Tabellenkalkulationssoftware auf einem Desktop-Monitor in einem modernen Büro
Teilen:

Das Wichtigste in Kürze

  • Computer Use ist die Fähigkeit von KI-Modellen, Desktop-Programme eigenständig per Maus und Tastatur zu bedienen
  • GPT-5.4 erreicht 75 % im OSWorld-Benchmark und übertrifft damit erstmals die menschliche Erfolgsrate von 72,4 %
  • Im GDPval-Benchmark schneidet GPT-5.4 in 83 % der Vergleiche mit Fachleuten aus 44 Berufsfeldern gleichwertig oder besser ab
  • Für KMUs bedeutet das: klassische Klick-Arbeit in Excel, CRM und ERP lässt sich ohne API-Programmierung automatisieren
  • Human-in-the-Loop bleibt Pflicht, die KI bereitet vor, der Mensch prüft und gibt frei

KI kann jetzt klicken, tippen und navigieren

Lange war KI ein besserer Textgenerator. Du stellst eine Frage, die KI antwortet. Nützlich, aber begrenzt. Denn die meiste Büroarbeit besteht nicht aus Texten schreiben. Sie besteht aus Klicken, Kopieren, Einfügen, Wechseln zwischen Programmen, Ausfüllen von Formularen.

Genau das ändert sich gerade grundlegend. Moderne KI-Modelle können Programme eigenständig bedienen. Sie sehen den Bildschirm, bewegen die Maus, tippen in Felder und navigieren durch Menüs. Diese Fähigkeit heißt Computer Use.

Am 5. März 2026 hat OpenAI mit GPT-5.4 ein Modell veröffentlicht, das bei Desktop-Aufgaben erstmals besser abschneidet als menschliche Experten (Quelle: OpenAI, März 2026). Das ist kein Laborexperiment. Es betrifft reale Arbeitsabläufe in echten Programmen.

Für KMUs bedeutet das: Die Automatisierung von Büroarbeit braucht keine teure API-Entwicklung mehr. Die KI bedient deine bestehende Software so, wie es ein Mitarbeiter tun würde.

Abgrenzung: In unserem Artikel über KI-Agenten im Büro geht es um die verschiedenen Technologien und Anbieter. Dieser Artikel fokussiert sich auf Computer Use als Paradigmenwechsel und die aktuellen Benchmark-Ergebnisse von März 2026.

KI erkennt Bildschirminhalte und steuert Desktop-Anwendungen visuell

Was Computer Use von bisheriger KI unterscheidet

Bisherige KI-Automatisierung lief über zwei Wege: Entweder du nutzt eine API-Schnittstelle, die Daten zwischen Systemen überträgt. Oder du setzt RPA-Bots ein, die fest programmierte Klickpfade abarbeiten. Beide Ansätze haben Grenzen.

APIs existieren nicht für jede Software. Gerade im Mittelstand laufen oft Systeme, die 10 oder 15 Jahre alt sind. RPA wiederum bricht ab, sobald sich ein Button um wenige Pixel verschiebt oder ein Dialog unerwartet auftaucht.

Computer Use löst beide Probleme. Die KI arbeitet visuell: Sie macht einen Screenshot, analysiert den Bildschirminhalt und entscheidet dann, was zu tun ist. Ein verschobener Button? Kein Problem, die KI erkennt ihn trotzdem. Ein unerwartetes Pop-up? Die KI liest es und reagiert.

Drei Fähigkeiten machen Computer Use so wirkungsvoll:

  • Visuelles Erkennen: Die KI versteht, was auf dem Bildschirm zu sehen ist, Buttons, Tabellen, Dropdown-Menüs, Fehlermeldungen
  • Kontextverständnis: Sie weiß, was der nächste logische Schritt in einem Workflow ist
  • Adaptives Handeln: Sie passt sich an veränderte Oberflächen an, statt an festen Skripten zu scheitern

Der Vergleich zu klassischer Automatisierung macht den Unterschied deutlich: Wo RPA eine exakte Anleitung braucht, reicht Computer Use eine Aufgabenbeschreibung.

Wie automatisierungsreif ist dein Unternehmen? Unser KI-Readiness-Check zeigt dir in 2 Minuten, wo der größte Hebel liegt.

Benchmark-Ergebnisse: KI-Performance im Vergleich zu menschlichen Experten

Die Benchmark-Ergebnisse: KI übertrifft Fachleute

Zwei Benchmarks zeigen, wie leistungsfähig Computer Use inzwischen ist.

OSWorld: Desktop-Aufgaben schneller als Menschen

OSWorld testet, ob eine KI reale Desktop-Aufgaben erledigen kann. Dazu gehören: Dateien organisieren, in Tabellenkalkulationen arbeiten, mehrstufige Formulare ausfüllen, zwischen Programmen wechseln.

GPT-5.4 erreicht 75,0 % auf der verifizierten Variante des Benchmarks. Die menschliche Baseline liegt bei 72,4 % (Quelle: OpenAI, März 2026). Damit übertrifft erstmals ein KI-Modell menschliche Experten bei autonomen Desktop-Aufgaben.

Zum Vergleich: GPT-5.2 lag noch bei 47,3 %. GPT-5.3 Codex schaffte 64,7 %. Der Sprung auf 75 % in wenigen Monaten zeigt, wie schnell sich diese Technologie entwickelt.

Anthropics Claude Sonnet 4.6 erreicht 72,5 % und liegt damit auf Augenhöhe mit der menschlichen Baseline (Quelle: aiagentstore.ai).

GDPval: 44 Berufsfelder im Test

GDPval geht einen Schritt weiter. Der Benchmark misst, ob KI wirtschaftlich relevante Arbeitsprodukte erstellen kann. Er umfasst 1.320 Aufgaben aus 44 Berufsfeldern der neun umsatzstärksten US-Branchen. Die Aufgaben stammen von Fachleuten mit durchschnittlich 14 Jahren Berufserfahrung (Quelle: OpenAI GDPval).

Was wird getestet? Echte Arbeitsprodukte: Vertriebspräsentationen erstellen, Buchhaltungstabellen modellieren, Dienstpläne für eine Notaufnahme planen, Fertigungsdiagramme zeichnen.

Die Ergebnisse sind bemerkenswert:

  • GPT-5.4 liegt in 83,0 % der Vergleiche gleichauf oder über dem Niveau der Fachleute
  • Bei Spreadsheet-Modellierung (internes Benchmark) erreicht es 87,3 % (GPT-5.2: 68,4 %)
  • Der Vorgänger GPT-5.2 schaffte nur 70,9 % Gesamtvergleichsrate

Wirtschaftsprofessor Ethan Mollick von der Wharton School bezeichnete GDPval als "wahrscheinlich die ökonomisch relevanteste Messung von KI-Fähigkeiten" (Quelle: Ethan Mollick, X/Twitter).

Auftragsbearbeitung: KI übernimmt Dateneingabe im ERP-System

Was das für die tägliche Büroarbeit bedeutet

Benchmarks klingen abstrakt. Deshalb ein konkretes Gedankenexperiment.

Stell dir eine typische Auftragsbearbeitung vor

Ein Kunde schickt eine Bestellung per E-Mail. Ein Sachbearbeiter muss:

  1. Die E-Mail öffnen und die Bestelldaten lesen
  2. Im ERP-System prüfen, ob der Artikel verfügbar ist
  3. Den Auftrag im System anlegen
  4. Die Auftragsbestätigung als PDF erstellen
  5. Die Bestätigung per E-Mail an den Kunden senden

Dieser Prozess dauert je nach System 8 bis 15 Minuten. Bei 50 Bestellungen am Tag sind das 7 bis 12 Stunden reine Sachbearbeitung.

Mit Computer Use kann eine KI diese Schritte übernehmen. Sie öffnet die E-Mail, liest die Bestelldaten, wechselt ins ERP, legt den Auftrag an und erstellt die Bestätigung. Der Sachbearbeiter prüft das Ergebnis und gibt mit einem Klick frei.

Mögliche Zeitersparnis: schätzungsweise 60 bis 70 Prozent der bisherigen Bearbeitungszeit, abhängig vom konkreten Prozess. Die freigewordene Zeit fließt in Kundenberatung, Reklamationsbearbeitung oder strategische Planung.

Weitere Einsatzfelder für KMUs

  • Rechnungseingangsprüfung: KI öffnet Anhänge, gleicht Beträge mit Bestellungen ab, trägt Daten in die Buchhaltung ein
  • Reporting: Daten aus CRM, ERP und Webanalyse zusammenführen, Dashboards aktualisieren, Berichte exportieren
  • Personalverwaltung: Urlaubsanträge bearbeiten, Zeiterfassung prüfen, Onboarding-Schritte in mehreren Systemen abarbeiten
  • Angebotserstellung: Kundenanfragen analysieren, Produktdaten aus dem Katalog ziehen, individuelle Angebote zusammenstellen

Mehr Beispiele für KI-Anwendungen im Mittelstand findest du in unserem Überblicksartikel.

GPT-5.4 vs. Claude: Zwei Ansätze im Vergleich

Aktuell bieten vor allem zwei Anbieter Computer Use auf hohem Niveau an: OpenAI mit GPT-5.4 und Anthropic mit Claude.

OpenAI GPT-5.4 kombiniert Computer Use mit einem Kontextfenster von bis zu 1 Million Tokens (via API). Das Modell kann komplexe Workflows über lange Zeiträume planen und ausführen. Es nutzt dabei sowohl Screenshot-Analyse als auch Code-Ausführung (z.B. über Playwright) zur Steuerung von Anwendungen. GPT-5.4 bietet mit der Tool-Search-Funktion bis zu 47 % weniger Token-Verbrauch bei Aufgaben mit vielen verfügbaren Tools.

Anthropic Claude setzt stärker auf die direkte Desktop-Steuerung. Claude Computer Use kann beliebige Desktop-Anwendungen bedienen, nicht nur Browser. Das ist besonders für Unternehmen mit lokaler Software relevant. Im OSWorld-Benchmark liegt Claude Sonnet 4.6 mit 72,5 % knapp unter GPT-5.4.

OpenAIs CUA (Computer Using Agent) im Vergleich ist primär auf Browser-Aufgaben spezialisiert. Wer vor allem Web-Anwendungen automatisieren will, findet hier einen niedrigschwelligen Einstieg. Für komplexe Desktop-Workflows ist die volle Computer-Use-Variante besser geeignet.

Welcher Ansatz für dein Unternehmen passt, hängt von deiner Software-Landschaft ab. Reine Web-Anwendungen? Dann reicht oft ein Browser-Agent. Legacy-Desktop-Software? Dann brauchst du die volle Desktop-Steuerung.

Warum Computer Use kein Selbstläufer ist

Die Benchmark-Ergebnisse sind beeindruckend. Trotzdem wäre es fahrlässig, die KI einfach laufen zu lassen. Drei Punkte sind entscheidend.

1. Human-in-the-Loop ist Pflicht

Computer Use bedeutet, dass eine KI aktiv in deinen Systemen arbeitet. Sie kann Daten ändern, Aufträge anlegen, E-Mails versenden. Ein Fehler hat sofort reale Konsequenzen.

Deshalb gilt: Die KI bereitet vor, der Mensch prüft und gibt frei. Besonders bei finanziellen Transaktionen, Vertragsänderungen oder personenbezogenen Daten ist ein Human-in-the-Loop-Ansatz nicht optional, sondern Pflicht.

2. Datenschutz beachten

Bei Cloud-basierten Lösungen werden Screenshots deines Bildschirms an externe Server gesendet. Diese Screenshots können Kundendaten, Finanzzahlen oder Personalinformationen enthalten. Ohne Auftragsverarbeitungsvertrag und Datenschutz-Folgenabschätzung besteht ein erhebliches Risiko eines DSGVO-Verstoßes.

Die Alternative: Lokale Modelle, die auf deiner eigenen Hardware laufen. Open-Source-Lösungen wie Browser Use mit Ollama ermöglichen Computer Use ohne Datenabfluss.

3. Schrittweise einführen

Starte nicht mit dem komplexesten Prozess. Wähle eine klar definierte, repetitive Aufgabe mit geringem Fehlerrisiko. Lass die KI eine Woche parallel zum Mitarbeiter laufen. Vergleiche die Ergebnisse. Erst wenn die Qualität stimmt, übergibst du schrittweise.

Nicht vergessen: Computer Use befindet sich noch in einer frühen Phase. Benchmarks messen Durchschnittsleistung. Bei einzelnen Aufgaben kann die KI versagen. Plane immer eine menschliche Fallback-Option ein.

Schritt-für-Schritt-Plan für den Einstieg in Computer Use

So startest du mit Computer Use in deinem Unternehmen

Schritt 1: Prozess auswählen

Identifiziere eine Aufgabe, die folgende Kriterien erfüllt:

  • Repetitiv (mindestens 10x pro Woche)
  • Regelbasiert (klarer Ablauf mit wenigen Ausnahmen)
  • Bildschirmbasiert (Arbeit in Software-Oberflächen)
  • Geringes Risiko (keine Überweisungen, keine Verträge im Erstversuch)

Schritt 2: Technologie testen

Für einen ersten Test eignet sich GPT-5.4 über die API oder ChatGPT Pro. Lass die KI eine einfache Desktop-Aufgabe ausführen und beobachte, wie sie vorgeht. So bekommst du ein Gefühl für die Möglichkeiten und Grenzen.

Schritt 3: Pilotprojekt aufsetzen

Definiere klare Erfolgskriterien: Zeitersparnis pro Vorgang, Fehlerquote, Mitarbeiterzufriedenheit. Lass die KI vier Wochen parallel zum bestehenden Prozess laufen. Dokumentiere die Ergebnisse.

Schritt 4: Skalieren oder anpassen

Wenn das Pilotprojekt funktioniert, weite Computer Use auf weitere Prozesse aus. Wenn nicht, analysiere die Schwachstellen. Oft reicht eine bessere Aufgabenbeschreibung oder eine Anpassung des Workflows.

Laut Gartner werden bis Ende 2026 40 % der Unternehmensanwendungen aufgabenspezifische KI-Agenten enthalten, gegenüber weniger als 5 % in 2025 (Quelle: Gartner, August 2025). Wer jetzt startet, hat einen Vorsprung.

Computer Use ist der Anfang, nicht das Ende

Computer Use verändert die Rolle der KI grundlegend. Sie wird vom Gesprächspartner zum Sachbearbeiter. Vom Textgenerator zum digitalen Kollegen, der deine Software genauso bedient wie du selbst.

Die Benchmark-Ergebnisse von GPT-5.4 zeigen: Die Technologie ist reif genug für erste produktive Einsätze. Nicht für alles. Nicht ohne menschliche Kontrolle. Aber für die repetitive Klick-Arbeit, die in jedem Büro Stunden frisst.

Der nächste logische Schritt: Evaluiere, welche deiner täglichen Bildschirmaufgaben für Computer Use geeignet sind. Starte klein, miss die Ergebnisse und skaliere, was funktioniert.

Du willst wissen, welche Prozesse in deinem Unternehmen für Computer Use geeignet sind? Lass uns in einem kostenlosen Erstgespräch dein Automatisierungspotenzial bewerten.

Häufig gestellte Fragen

Teilen:
Jannis Gerlinger

Über den Autor

Jannis Gerlinger

Geschäftsführer, JANGER GmbH

Jannis Gerlinger ist Geschäftsführer der JANGER GmbH. Seit über 15 Jahren entwickelt er digitale Lösungen, erst im UX/UI Design und E-Commerce, heute mit dem Fokus auf sichere KI-Systeme für den Mittelstand. Mit seiner TÜV-Zertifizierung in Verkaufspsychologie verbindet er technisches Know-how mit einem tiefen Verständnis für Geschäftsprozesse.

Verwandte Begriffe im KI-Lexikon

AutomatisierungKünstliche IntelligenzRPA (Robotic Process Automation)Workflow-AutomatisierungHuman-in-the-Loop

KI-Praxistipps per E-Mail

Die neuesten Praxis-Tipps zur KI-Einführung direkt in dein Postfach. Kein Spam, jederzeit abbestellbar.

Bereit für KI in deinem Unternehmen?

Kostenloses Erstgespräch: Wir zeigen dir, wie KI konkret in deinem Unternehmen aussehen kann.

Weitere Artikel

Mitarbeiterin bereitet Compliance-Schulung am Laptop vor, violettes Licht auf dem Bildschirm
9. März 2026·8 Min.

Compliance-Schulungen mit KI automatisieren

So automatisierst du Pflichtschulungen und Wissensmanagement mit KI-Tools wie NotebookLM. Weniger Aufwand, bessere Ergebnisse für KMUs.

Weiterlesen
KI-Agent arbeitet im Google Workspace: Automatisierte Workflows zwischen Gmail, Drive und Docs
KI im Mittelstand
13. März 2026·8 Min.

KI-Agenten im Google Workspace: Dein digitaler Assistent

Google Workspace CLI und Workspace Studio bringen KI-Agenten direkt in Gmail, Drive und Docs. So profitieren KMUs von Automatisierung ohne neue Software.

Weiterlesen
Mitarbeiter analysiert Echtzeit-Dashboard mit gebündelten Datenquellen auf einem großen Monitor
12. März 2026·8 Min.

Echtzeit-Dashboards: Daten bündeln, besser planen

Echtzeit-Dashboards bündeln verstreute Datenquellen auf einen Blick. So optimierst du Ressourcenplanung und Logistik im KMU, DSGVO-konform.

Weiterlesen

Bereit, dein erstes KI-System zu sehen?

Kostenloses Erstgespräch, keine Vorabkosten, keine Verpflichtung.