Skip to main content

KI im Unternehmen: Warum 95 % der Pilotprojekte scheitern – und nur 5 % erfolgreich sind

Georgi Ivanov - Senior Communications Manager - Payhawk
AutorGeorgi Ivanov
Read time
4 Minuten
VeröffentlichtSep 17, 2025
Zuletzt aktualisiertSep 26, 2025
Zwei Frauen stehen zusammen am Whiteboard, diskutieren die neuesten GenAI-Ergebnisse.
Zusammenfassung

Laut MIT erzielen 95 % der GenAI-Pilotprojekte in Unternehmen keinen ROI. Google hingegen berichtet, dass die meisten Produktionsanwender bereits einen spürbaren Mehrwert erkennen. Beide Aussagen sind korrekt — sie beziehen sich lediglich auf unterschiedliche Welten. Die Lücke zwischen Pilotprojekten und produktivem Einsatz erklärt den Unterschied.

Demo buchen
Payhawk - G2 4.6 rating (600+ reviews)
Erhalten Sie jeden Monat frische Einblicke in Finanzen und Künstliche Intelligenz.

Durch das Absenden dieses Formulars erklären Sie sich damit einverstanden, E-Mails zu unseren Produkten und Dienstleistungen gemäß unserer Datenschutzrichtlinie zu erhalten. Sie können sich jederzeit abmelden.

Wer diesen Sommer die News bezüglich künstlicher Intelligenz verfolgt hat, dürfte sich wie auf einer Achterbahnfahrt gefühlt haben. Auf der einen Seite zeigt das Projekt NANDA des MIT (Massachusetts Institute of Technology), dass erstaunliche 95 % der GenAI-Initiativen (Projekte, die generative KI einsetzen) in Unternehmen keinen messbaren Gewinn bringen – trotz Ausgaben in Milliardenhöhe. Auf der anderen Seite steht in der aktuellen ROI-Studie von Google, dass die meisten Produktionsanwender bereits klaren Mehrwert sehen und dass AI-Agents diesen sogar beschleunigt. Beide Aussagen können nur dann zutreffen, wenn sie unterschiedliche Welten betrachten. Und genau das tun sie. Die Lücke zwischen diesen Welten erklärt, warum viele Pilotprojekte ins Stocken geraten, während einige wenige erfolgreich voranschreiten.

Die MIT-Perspektive zeigt die Grauzone der Unternehmens-KI: Experimente, Proof-of-Concepts und „Pilotinseln“, die nie in reale Systeme integriert werden. Die zentrale Erkenntnis ist klar: 30–40 Mrd. € fließen in Unternehmens-GenAI, doch 95 % dieser Investitionen haben keinen P&L-Impact (Einfluss auf Gewinn und Verlust eines Unternehmens); nur 5 % der integrierten Piloten liefern echten Wert. Der Bericht nennt dies den GenAI Divide – eine wachsende Kluft zwischen Unternehmen, die KI erfolgreich einsetzen, und denen, die es nicht schaffen. Es geht nicht gegen KI, sondern gegen Pilotprojekte auf dem Papier: Der Unterschied liegt in der echten Nutzung, nicht im Potenzial.

Automatisieren Sie mit unseren AI-Agents 90 % Ihrer Aufgaben

Im Gegensatz dazu hat Google nicht nur auf Experimente geschaut, sondern gezielt Organisationen untersucht, die GenAI bereits produktiv einsetzen. Innerhalb dieser Gruppe geben 74 % an, in mindestens einem Anwendungsfall einen ROI zu sehen; bei denjenigen Nutzern, die AI-Agents in einer frühen Phase ausprobieren, steigt dieser Anteil sogar auf 88 %. Das widerspricht dem MIT nicht – es zeigt nur eine andere Sichtweise: Was passiert, wenn man von Prototypen zu Systemen übergeht, die Aufgaben organisieren, Hilfsmittel einsetzen und ganze Abläufe eigenständig erledigen können.

Bei AI-Agents handelt es sich um Software, die selbst Entscheidungen trifft und Aufgaben ausführt: Ziele analysieren, Schritte orchestrieren, auf Unternehmens-APIs zugreifen und unter menschlicher Aufsicht Aufgaben weitergeben oder eskalieren. Google berichtet, dass über die Hälfte (52 %) der GenAI-Anwender auch Agenten einsetzen, 39 % haben mehr als zehn Agenten produktiv im Einsatz. Das zeigt: ROI entsteht nicht durch Prompts, sondern durch Prozesse.

Die entscheidende Frage lautet daher nicht: „Ist KI überbewertet?“ sondern: „Was trennt die 5 % von den 95 %?“ Drei Muster zeigen sich in beiden Studien und in praxisnahen Anwendungen:

1) Produktion, nicht Pilotprojekte

Piloten, die nie auf die „Source-of-Truth“-Systeme (ERP, Ticketing, CRM, Policy-Engines) zugreifen, können keine Ergebnisse liefern, die die Finanzabteilung anerkennt. Googles Methodik macht dies deutlich: Ihr Datensatz basiert auf produktiven Anwendern, daher sind messbare Erträge selbstverständlich. Das MIT betrachtet hingegen die Flut an Experimenten, die nie eine Chance hatten, Wert zu erzeugen. Wer CFO-taugliche Ergebnisse will, muss Agenten in den bestehenden Stack integrieren.

2) Tool-fähige Agenten statt reiner Chatbots

ROI entsteht, wenn Agenten auf Tools und Daten zugreifen können – unter Governance: Buchungen vornehmen, Tickets erstellen, Datensätze aktualisieren, Richtlinien einhalten. Googles Empfehlungen betonen: Zuerst sichere Systemzugriffe und Governance, dann Leistung. Die 5 % laut MIT sind diejenigen, die das erfolgreich umgesetzt haben.

3) Unterstützung durch Führung und Veränderungskompetenz

Unternehmen mit messbarem ROI haben starke Unterstützung auf C-Level und klar definierte Werttreiber – wie Geschwindigkeit, Genauigkeit, Kostenersparnis oder Umsatz – die vorher bewertet werden. Organisationen mit klarer Führung erzielen deutlich öfter ROI. Kein Klischee, sondern der Unterschied zwischen Theorie und Praxis.

Die „KI-Blase“-Diskussion verfehlt den Punkt. Die Daten sagen nicht „KI funktioniert nicht“, sondern: KI, die nicht in Arbeitsprozesse eingebunden ist, funktioniert nicht. Wer Sprachmodelle nur als Wissensspielzeug betrachtet, erhält Spielzeugergebnisse. Wer AI-Agents als echte Prozessakteure behandelt – mit Identität, Richtlinien und Verantwortlichkeiten – erzielt operativen Hebel.

Finanzprozesse sind ein Lehrstück: strukturiert, regelbasiert und bereits kontrolliert – perfekte Voraussetzungen für agentische Systeme, um Mehrwert zu beweisen, ohne Risiko einzugehen. Erste Muster zeigen sich in vier typischen Workflows:

  • Unterstützung beim Monatsabschluss: Fehlende Belege erfassen, Ausgaben codieren, Anomalien markieren, eskalieren. Ein Agent kann dies kontinuierlich erledigen und automatisch ins System zurückschreiben.
  • Procurement: Eine vage Anfrage in eine regelkonforme, budgetbewusste Bestellung umwandeln; an die richtigen Genehmiger weiterleiten; Karte oder Purchase Order erstellen. Mitarbeiter formulieren die Anfrage in Slack oder Teams, der Agent erledigt die Strukturarbeit.
  • Dienstreisen: Buchungen innerhalb der Richtlinien, Reiseberichte automatisch erstellen, Ausgaben für One-Click-Freigabe und ERP exportieren.
  • Zahlungsunterstützung: Sofortige Antworten auf Fragen wie „Warum wurde die Transaktion abgelehnt?“ oder „Status meiner Rückerstattung?“ und Vorschläge für regelkonforme nächste Schritte – ohne die Finanzabteilung zum Helpdesk zu machen.

Diese Prozesse sind keine futuristischen Visionen, sondern messbar, eng umrissen und prüfbar – genau deshalb wirken sie auf die Gewinn- und Verlustrechnung.

Budgets konzentrieren sich zunehmend auf funktionierende Anwendungen. Während die Kosten für KI-Infrastruktur fallen, steigt der Gesamtaufwand weiter, oft durch Umschichtung bestehender Budgets: durchschnittlich 26 % der IT-Ausgaben fließen mittlerweile in KI. Dieses Kapital wird weiterhin use cases verfolgen, die ROI liefern, also agentische Automatisierungen in governance-gesteuerten Systemen.

Schluss mit der Zählerei von Pilotprojekten – Agenten richtig einsetzen

Falsch ist, nur die „Anzahl der Proof-of-Concepts“ zu zählen. Richtig ist: „Anzahl der abgeschlossenen, regelkonformen Automationen pro Quartal mit messbarem finanziellen Nutzen“. So lässt sich die Lücke zwischen MITs Realität und Googles Optimismus schließen.

Behandeln Sie „Agent Ops“ wie DevOps

Sie brauchen ein klares Vorgehen: menschliche Anfragen müssen in eindeutige, regelkonforme Pläne übersetzt werden, Aktionen sollten so gestaltet sein, dass sie mehrfach ausgeführt werden können, ohne Fehler oder Doppelbuchungen zu verursachen, und es müssen Mechanismen vorhanden sein, um Probleme rückgängig zu machen. Außerdem muss jede Entscheidung und jede Aktion nachvollziehbar dokumentiert sein.

Große KI-Strategien kommen später. Wichtig ist zuerst, einen Agenten bereitzustellen, seine Leistung zu messen und ihn bei Bedarf zurückzunehmen. Googles Empfehlung lautet: Agenten frühzeitig reguliert auf Unternehmenssysteme zugreifen lassen und klare Regeln einhalten. Den ROI verankern Sie in den Prozessen, nicht in der Vorstellung.

Laut Google entsteht der ROI vor allem in den Bereichen Produktivität, Kundenerfahrung, Geschäftswachstum, Marketing und Sicherheit – und lässt sich schnell realisieren, wenn Anwendungsfälle wiederholbar und Daten verfügbar sind. Sicherheit entwickelt sich dabei zu einem eigenständigen Einsatzgebiet: ereignisgesteuerte, tool-intensive Aufgaben, die unspektakulär, aber profitabel sind.

Achten Sie auf die Stichprobe, nicht nur auf die Statistik

Wenn das MIT von 95 % spricht, sollten Sie fragen: „Wie viele Projekte waren wirklich produktiv?“ Und bei 74 % ROI eines Anbieters: „Wurden auch nicht-produktive Nutzer berücksichtigt?“ Diese Unterschiede sind entscheidend. Googles Zahlen beziehen sich nur auf produktive GenAI-Nutzer, daher wirken sie positiver. Beide Aussagen stimmen – entscheidend ist, vom einen Sample zum anderen zu vergleichen.

Kurz gesagt: Das Paradoxon löst sich, wenn man die Trennlinie erkennt. Die meisten Piloten scheitern, aber viele produktive Einsätze bringen Gewinn. Der Weg von der einen zur anderen Seite funktioniert nicht durch Magie, sondern durch solides Systemengineering und Governance. Das wissen die 5 %, die 95 % müssen es schnell lernen.

Die Medien werden weiterhin zwischen „KI-Boom“ und „KI-Bust“ schwanken, weil einfache Schlagzeilen besser funktionieren. Für Entscheider lautet die Kernbotschaft: KI-Rendite entsteht durch Agenten und deren Integration. Können Ihre Agenten keine Systeme ansteuern, die Geld bewegen, Risiken steuern oder Kunden bedienen, bringen sie nichts. Können sie es, liefern sie echten Mehrwert.

Führungskräfte brauchen keinen Hype, sondern ein System, das Pläne in Taten umsetzt – und eine Gewinn- und Verlustrechnung, die das sichtbar macht. Wer das schafft, ist bereits erfolgreich.

Georgi Ivanov - Senior Communications Manager - Payhawk
Georgi Ivanov
Senior Communications Manager
LinkedIn
Alle Artikel von Georgi

Georgi Ivanov ist ein ehemaliger CFO, der sich zum Experten für Marketing und Kommunikation entwickelt hat. Bei Payhawk verantwortet er die Markenstrategie und die Rolle als Vordenker im Bereich Künstliche Intelligenz. Dabei vereint er sein fundiertes Finanzwissen mit modernem, zukunftsorientiertem Storytelling.

Alle Artikel von Georgi

Ähnliche Artikel