Viele Finanzunternehmen experimentieren mit KI, doch nur wenige erzielen echten Mehrwert. Der Erfolg hängt weniger vom Modell selbst ab, sondern vielmehr von soliden Prozessen, klaren Richtlinien, nachvollziehbaren Abläufen und der richtigen organisatorischen Struktur. Indem Sie sich auf messbare Aufgaben wie Rechnungsverarbeitung, Abstimmungen und Spesenmanagement konzentrieren – und Compliance von Anfang an integrieren – lassen sich KI-Pilotprojekte endlich in greifbare Gewinne verwandeln.
Wenn man mit Führungsgremien spricht, heißt es überall, man „macht KI“. Blickt man jedoch auf die Gewinn- und Verlustrechnungen, zeigt sich ein anderes Bild: Kaum jemand erzielt tatsächlich Ergebnisse. Diese Diskrepanz – hohe Ambitionen, geringe Wirkung – bildete den Rahmen eines Financial Times Webinars (in Zusammenarbeit mit Payhawk), das weniger wie eine weitere Hype-Session wirkte, sondern eher wie ein Praxisleitfaden, um aus der Pilotstarre auszubrechen. Der Moderator machte gleich zu Beginn klar: Während 82 % der Finanzverantwortlichen KI gegenüber offen sind, haben nur etwa 20 % der Unternehmen den Schritt über den Proof-of-Concept (PoC) hinaus geschafft, um echten Mehrwert zu erzielen.
Besonders wertvoll war, dass die Diskussion nicht um das „Modell der Woche“ kreiste. Die Panelteilnehmer konzentrierten sich auf die operative Realität – Richtlinien, Architekturen, Anreizsysteme und die praktische Arbeit, die Finanzprozesse tatsächlich neu zu gestalten.
Enterprise-Strukturen entscheiden über Erfolg oder Risiko
Payhawk-Mitgründer und CEO Hristo Borisov brachte auf den Punkt, was viele Käufer nur hinter vorgehaltener Hand sagen: Pilotprojekte scheitern, wenn glänzende Tools die Unternehmensanforderungen nicht erfüllen. In einer Zeit, in der Software eigenständig handeln kann, sind klar definierte Berechtigungen, abgegrenzte Workflows und unveränderliche Audit-Trails keine optionalen Extras, sondern entscheidend für den produktiven Einsatz. „Nicht aufregend“, gab er zu, „aber ohne sie bleibt die Lücke zwischen Absicht und Wirkung bestehen, und PoCs schaffen es nicht in den Alltag.“
Gaurav Sawhney von Barclays ergänzte dies mit einer praktischen „Autonomie-Leiter“ – Mensch in Kontrolle → Mensch in der Schleife → Mensch über der Schleife – und warnte: In autonomen Abläufen verbreiten sich Fehler schnell, wenn keine sorgfältigen Entscheidungsprotokolle vorhanden sind. Die Finanzabteilung muss von Anfang an Nachvollziehbarkeit, Erklärbarkeit, Zuverlässigkeit und Wiederholbarkeit sicherstellen. Anders gesagt: Governance ist ein Produkt.

Es geht nicht nur um technische Altlasten, sondern auch um Menschen und Prozesse
Lilia Christofi von PwC kritisierte die Branche dafür, dass sie oft nur um der Experimentierfreude willen KI-Projekte startet. Ihrer Einschätzung nach haben nur „vielleicht ein Prozent“ der Unternehmen die Reife, KI im großen Maßstab zu betreiben. Erfolg erfordere eine Neuorganisation von Kultur, Aufbau und Betriebsmodellen, nicht nur das Einführen neuer Modelle. Für viele Unternehmen sei derzeit ein zentralisierter KI-Stack sinnvoll, der Konsistenz und Kontrolle gewährleistet; langfristig könne er dann auch föderiert werden.
Diese Zentralisierung ist jedoch nicht starr. Christofi beschrieb einen modularen Ansatz: Ein „Agent“ ist eigentlich ein System von Agenten – bestehend aus Aufgabenlogik, Prompts, Richtlinien – ergänzt durch Validierungs- und Prüfungsagenten, die sich gegenseitig kontrollieren. Entscheidend ist, wie weit Komponenten für die Wiederverwendung in Bereichen wie Beschaffung oder Recht aufgeteilt werden sollten. Unabhängig davon benötigen Unternehmen Tool-Orchestrierung und die Disziplin, kontinuierliche F&E zu finanzieren, nicht nur Demo-Projekte.
Plattformen schlagen Einzelmodelle
Ermir Qeli von Swiss Re berichtete aus der Versicherungswelt – einem der wenigen Finanzbereiche, die möglicherweise schon über den PoC-Status hinaus sind. Sein Team ist „über die Pilotphase hinaus“ bei Anwendungsfällen im unstrukturierten Finanzdatendschungel, etwa bei Schadensprüfungen, Betrugserkennung und Vertragsanalysen. Die wichtigste Erkenntnis: Es geht nicht darum, „Modell X“ zu wählen, sondern eine KI-Plattform zu bauen, auf der Modelle wechseln können, ohne Governance, Prozesse oder Messgrößen zu gefährden. So lässt sich die Komplexität einer sich wöchentlich verändernden Landschaft managen.
Qeli machte zudem einen subtileren Punkt: Basis-Modelle verstehen Ihr Geschäft nicht. Kein Modell kann Risiken selbständig bewerten oder Ansprüche vollständig abwickeln. Das ist eine Chance für etablierte Unternehmen – vorausgesetzt, sie besetzen „Translator“-Rollen, die Fachwissen und KI-Kompetenz verbinden und Projekte an den Geschäftszielen ausrichten. So gelingt der Schritt „weg vom Experimentieren hin zu echtem Impact“.
Regulierer sind nicht das Problem, Unklarheit schon
Ja, die Regulierungen unterscheiden sich: EU AI Act mit Risikostufen, UK Sandbox, US sektorspezifisches Patchwork. Das Panel empfahl jedoch einen pragmatischen Ansatz: Den EU AI Act als Säule eines globalen Rahmens nutzen und dann flexibel für APAC und die USA anpassen; davon ausgehen, dass Regulierer Klarheit und Korrekturmaßnahmen verlangen, nicht nur Datensammlung; und erwarten, dass Betrugsrisiken durch KI zunehmen, was klare Kontrollen über Datenzugriff und -flüsse erfordert. „Mit dem vorbereiten, was man weiß, ist besser, als auf perfekte Harmonisierung zu warten.“
Was jetzt wirklich Wirkung zeigt
Die Diskussion kehrte immer wieder zu klar abgegrenzten Finanzaufgaben mit geschlossenen Schleifen zurück, bei denen der Wert messbar und schnell ist: Spesen und Belege prüfen, Rechnungsdaten extrahieren, Transaktionen ERP-tauglich aufbereiten, Abstimmungsprozesse abschließen. Wer gesparte Stunden/FTE, verkürzte Durchlaufzeiten und automatische Abstimmungsquoten quantifizieren kann, wird die Aufmerksamkeit der CFOs gewinnen. Wer nicht, verliert sie. Payhawk strukturiert sein „AI Office of the CFO“ gezielt um solche messbaren Ergebnisse.
Produktion zuerst – oder gar nicht
Christofis nüchterne Bilanz der letzten 18 Monate – „teures Experimentieren“ – traf den Nerv, weil sie den Erfahrungen der Käufer entsprach. Ihr Lob für Payhawks Ansatz („nicht nur PoC, sondern alles strukturiert in Produktion bringen“) mag keine Vendor-Battles entscheiden, liefert aber eine wichtige Lektion für das gesamte Ökosystem: Produktion ist eine Produktentscheidung. Teams, die diesen Schritt gehen, sprechen nicht länger über KI-Strategien, sondern berichten über KI-Umsätze.
Spickzettel für CFOs: sechs Wege aus der PoC-Falle
- Richtlinien zuerst implementieren: Überwachen Sie den Anteil der KI-Aktionen mit vollständigen, unveränderlichen Audit-Trails und innerhalb definierter Berechtigungen. Liegen diese Werte niedrig, wird Ihr Risikoteam den Einsatz stoppen.
- Abgeschlossene Anwendungsfälle wählen: Messen Sie gesparte Stunden/FTE, verkürzte Durchlaufzeiten, automatische Abstimmungsquoten – nicht nur Bauchgefühl. Klare Aufgaben mit messbaren Baselines machen die ROI-Story wasserdicht.
- Plattform für wechselbare Modelle aufbauen: Messen Sie die Zeit für Modellwechsel/-upgrades, gemeinsame Orchestrierung und Regressionstests nach Änderungen. Ihr Vorteil liegt in stabiler Orchestrierung und Testing, nicht Vendor-Lock-in.
- Mehr als nur Kostenreduktion messen: Für Serviceprozesse: CSAT, First-Contact-Resolution, Bearbeitungszeit. Für Risiko: Erkennungsrate, False Positives/Negatives. Für Umsatz: Konversion oder Upsell durch KI-Erkenntnisse. Entscheider wollen profitables Wachstum, keine Demo-Kennzahlen.
- Autonomie-Leiter festlegen: Dokumentieren Sie den Anteil der Flüsse nach Autonomielevel (in Kontrolle / in Schleife / über der Schleife) und MTTR (Mean Time to Resolution) bei menschlichem Eingriff. Ohne klare Erklärung, wann Menschen das Steuer übernehmen, skalieren Agenten nicht.
- Compliance als Designelement behandeln: Globale Rahmenwerke aufbauen, EU AI Act als Säule, plus Playbooks für UK/US/APAC. Zeit bis zur regulatorischen Nachweisführung und Abschluss von Audit-Feststellungen tracken. Regulierung ist Einschränkung, kein Blocker.
Das große Bild ist positiv: Die Finanzwelt bewegt sich vom assistiven UI-Mehrwert hin zu auditierbaren Aktionen. Wettbewerbsvorteil entsteht nicht durch Modellauswahl, sondern durch operative Disziplin – die Fähigkeit, Modelloutputs in finanzielle Ergebnisse zu verwandeln. Nach einem Jahr voller KI-Demos hat sich die Messlatte verschoben. Die entscheidende Frage lautet nun: Wo zeigt sich der Gewinn?
Georgi Ivanov ist ein ehemaliger CFO, der sich zum Experten für Marketing und Kommunikation entwickelt hat. Bei Payhawk verantwortet er die Markenstrategie und die Rolle als Vordenker im Bereich Künstliche Intelligenz. Dabei vereint er sein fundiertes Finanzwissen mit modernem, zukunftsorientiertem Storytelling.