
Fall ’25 Release! Die neue, intelligente Art zu arbeiten – für Einkauf, Reisen, Spesen & Zahlungen – einfacher & schneller
Hier ist eine Version mit verbessertem Lesefluss und eleganterer Formulierung:
Laut MIT erzielen 95 % der GenAI-Pilotprojekte in Unternehmen keinen ROI. Google hingegen berichtet, dass die meisten Produktionsanwender bereits einen spürbaren Mehrwert erkennen. Beide Aussagen sind korrekt — sie beziehen sich lediglich auf unterschiedliche Welten. Die Lücke zwischen Pilotprojekten und produktivem Einsatz erklärt den Unterschied.
Durch das Absenden dieses Formulars erklären Sie sich damit einverstanden, E-Mails zu unseren Produkten und Dienstleistungen gemäß unserer Datenschutzrichtlinie zu erhalten. Sie können sich jederzeit abmelden.
Wer diesen Sommer die KI-News verfolgt hat, dürfte sich wie auf einer Achterbahnfahrt gefühlt haben. Auf der einen Seite zeigt MITs Projekt NANDA, dass erstaunliche 95 % der GenAI-Initiativen in Unternehmen keinen messbaren Gewinn bringen – trotz Ausgaben in Milliardenhöhe. Auf der anderen Seite berichtet Googles aktuelle globale ROI-Studie, dass die meisten Produktionsanwender bereits klaren Mehrwert sehen und dass agentische KI diesen sogar beschleunigt. Beide Aussagen können nur dann zutreffen, wenn sie unterschiedliche Welten betrachten. Genau das tun sie. Die Lücke zwischen diesen Welten erklärt, warum viele Pilotprojekte ins Stocken geraten, während einige wenige erfolgreich voranschreiten.
Die MIT-Perspektive zeigt das chaotische Mittelfeld der Unternehmens-KI: Experimente, Proof-of-Concepts und „Pilotinseln“, die nie in reale Systeme integriert werden. Die zentrale Erkenntnis ist eindeutig: 30–40 Mrd. $ werden in Unternehmens-GenAI investiert, 95 % davon bringen keinen P&L-Impact; nur 5 % der integrierten Piloten liefern echten Wert. Der Bericht nennt dies den GenAI Divide – eine wachsende Kluft zwischen Unternehmen, die KI erfolgreich in ihre Arbeit einbinden, und denen, die es nicht schaffen. Es ist nicht anti-KI, sondern anti-PowerPoint. Der Unterschied liegt in der produktiven Nutzung, nicht im Potenzial.
Im Gegensatz dazu hat Google nicht nur auf Experimente geschaut, sondern gezielt Organisationen untersucht, die GenAI bereits produktiv einsetzen. Innerhalb dieser Gruppe geben 74 % an, in mindestens einem Anwendungsfall einen ROI zu sehen; bei frühen Agentenanwendern steigt dieser Anteil sogar auf 88 %. Das widerspricht MIT nicht – es zeigt einfach die andere Seite: Was passiert, wenn man den Sprung von chatty Demos zu Systemen macht, die planen, Tools aufrufen und Prozesse abschließen.
Agentische KI – die nüchterne Definition, nicht der Hype – bezeichnet Software, die selbst Entscheidungen treffen und Aufgaben ausführen kann: Ziele analysieren, Schritte orchestrieren, auf Unternehmens-APIs zugreifen und unter menschlicher Aufsicht Aufgaben weitergeben oder eskalieren. Google berichtet, dass über die Hälfte (52 %) der GenAI-Anwender auch Agenten einsetzen, 39 % haben mehr als zehn Agenten produktiv im Einsatz. Das zeigt: ROI entsteht nicht durch Prompts, sondern durch Prozesse.
Die entscheidende Frage lautet daher nicht: „Ist KI überbewertet?“ sondern: „Was trennt die 5 % von den 95 %?“ Drei Muster zeigen sich in beiden Studien und in realen Implementierungen:
Piloten, die nie auf die „Source-of-Truth“-Systeme (ERP, Ticketing, CRM, Policy-Engines) zugreifen, können keine Ergebnisse liefern, die die Finanzabteilung anerkennt. Googles Methodik macht dies deutlich: Ihr Datensatz basiert auf produktiven Anwendern, daher sind messbare Erträge selbstverständlich. MIT betrachtet hingegen die Flut an Experimenten, die nie eine Chance hatten, Wert zu erzeugen. Wer CFO-taugliche Ergebnisse will, muss Agenten in den bestehenden Stack integrieren.
ROI entsteht, wenn Agenten auf Tools und Daten zugreifen können – unter Governance: Fälle öffnen, Buchungen vornehmen, Tickets erstellen, Datensätze aktualisieren, Richtlinien einhalten. Googles Empfehlungen betonen: Zuerst sichere Systemzugriffe und Governance, dann Leistung. Die MIT-5 % sind genau jene, die dies erfolgreich umgesetzt haben.
Unternehmen mit nachweisbarem ROI verfügen über starke C-Level-Unterstützung und klar definierte Werttreiber – Geschwindigkeit, Genauigkeit, Kostenersparnis oder Umsatz – die im Voraus gemessen werden. Organisationen mit umfassender Führungsausrichtung sehen deutlich häufiger ROI. Kein Klischee, sondern der Unterschied zwischen einer Wissenschaftsmesse und einer Fabrik.
Die „KI-Blase“-Diskussion verfehlt den Punkt. Die Daten sagen nicht „KI funktioniert nicht“, sondern: KI, die nicht in Arbeitsprozesse eingebunden ist, funktioniert nicht. Wer Sprachmodelle nur als Wissensspielzeug betrachtet, erhält Spielzeugergebnisse. Wer Agenten als echte Prozessakteure behandelt – mit Identität, Richtlinien und Verantwortlichkeiten – erzielt operativen Hebel.
Finanzprozesse sind ein Lehrstück: strukturiert, regelbasiert und bereits kontrolliert – perfekte Voraussetzungen für agentische Systeme, um Mehrwert zu beweisen, ohne Risiko einzugehen. Erste Muster zeigen sich in vier typischen Workflows:
Diese Prozesse sind keine futuristischen Visionen, sondern messbar, eng umrissen und prüfbar – genau deshalb wirken sie auf das P&L.
Budgets konzentrieren sich zunehmend auf funktionierende Anwendungen. Während die Kosten für KI-Infrastruktur fallen, steigt der Gesamtaufwand weiter, oft durch Umschichtung bestehender Budgets: durchschnittlich 26 % der IT-Ausgaben fließen mittlerweile in KI. Dieses Kapital wird weiterhin use cases verfolgen, die ROI liefern, also agentische Automatisierungen in governance-gesteuerten Systemen.
Das falsche Maß ist „Anzahl der Proof-of-Concepts“. Das richtige Maß: „Anzahl der abgeschlossenen, regelkonformen Automationen pro Quartal inklusive finanzieller Wirkung“. So lässt sich die Lücke zwischen MITs Realität und Googles Optimismus schließen.
Sie benötigen ein Runbook: klare Intent-Definition (menschliche Anfragen in unmissverständliche, policy-konforme Pläne übersetzen), idempotente Aktionen (sichere Wiederholungen ohne Doppelbuchungen), Rollback-Mechanismen (Fehler ausgleichen) und Observability (jede Entscheidung und Tool-Aktion nachvollziehbar). Große „KI-Strategien“ kommen später – zuerst müssen Sie einen Agenten ausliefern, messen und ggf. zurückrollen können. Googles Rat ist eindeutig: Agenten frühzeitig reguliert auf Unternehmenssysteme zugreifen lassen und Regeln festlegen. ROI verankern Sie in den Prozessen, nicht in der Vorstellungskraft.
Google zeigt, dass ROI besonders in fünf Bereichen entsteht: Produktivität, Kundenerfahrung, Geschäftswachstum, Marketing und Sicherheit – und dass sich der Wert schnell realisieren lässt, wenn Anwendungsfälle wiederholbar und Daten verfügbar sind. Sicherheit entwickelt sich sogar zu einem eigenständigen Anwendungsbereich für Agenten: ereignisgetrieben, tool-intensive Arbeit – unspektakulär, aber profitabel.
Wenn der Vorstand MITs 95 % zitiert, fragen Sie: „Wie viele dieser Projekte waren wirklich produktiv?“ Wenn ein Anbieter 74 % ROI angibt: „Wurden auch Nicht-Produktivnutzer einbezogen?“ Diese Unterschiede sind entscheidend. Googles Zahlen stammen ausschließlich von produktiven GenAI-Nutzern – daher die positivere Darstellung. Beide Aussagen sind wahr; Ihre Aufgabe ist es, vom einen Sample zum anderen zu gelangen.
Kurz gesagt: Das Paradoxon löst sich, wenn man die Trennlinie erkennt. Die meisten Piloten scheitern; viele produktive Einsätze bringen Gewinn. Der Weg von der einen zur anderen Seite besteht nicht aus Magie, sondern aus Systemengineering und Governance. Das wissen die 5 %, die 95 % müssen es schnell lernen.
Die Medien werden weiter zwischen „KI-Boom“ und „KI-Bust“ schwanken – weil einfache Headlines besser funktionieren. Für Entscheider lautet die Kernbotschaft: KI-Rendite entsteht durch Agenten und Integration. Können Ihre Agenten keine Systeme ansteuern, die Geld bewegen, Risiken steuern oder Kunden bedienen, bringen sie nichts. Können sie es, liefern sie Mehrwert.
Führungskräfte brauchen keine Debatte über Hype. Sie brauchen eine „Fabrik“, die Absichten in Aktionen umsetzt – und ein P&L, das es bemerkt. Wer das aufbaut, muss sich weder mit MIT noch mit Google streiten: Er lebt bereits in der erfolgreichen Datenwelt.
Georgi Ivanov ist ein ehemaliger CFO, der sich zum Experten für Marketing und Kommunikation entwickelt hat. Bei Payhawk verantwortet er die Markenstrategie und die Rolle als Vordenker im Bereich Künstliche Intelligenz. Dabei vereint er sein fundiertes Finanzwissen mit modernem, zukunftsorientiertem Storytelling.