Fall ’25 release! De nieuwe manier van werken met AI — van inkoop tot betalingen.

Lees meer

AI-ROI uitgelegd: MIT’s marktrealiteit en Google’s productieblik

Georgi Ivanov - Senior Communications Manager at Payhawk
AuthorGeorgi Ivanov
Read time
Leestijd: 3 min
PublishedSep 17, 2025
Last updateSep 18, 2025
Finance professionals in gesprek over AI
Samenvatting

MIT stelt dat 95% van de enterprise GenAI-pilots geen ROI oplevert. Google zegt dat de meeste productiegebruikers al waarde zien. Allebei hebben ze gelijk, omdat ze verschillende werelden meten. Het verschil tussen pilots en productie verklaart de kloof.

Request a demo
Payhawk - G2 4.6 rating (600+ reviews)
Ontvang maandelijks slimme finance & AI-tips

Door je aan te melden, ga je akkoord met het ontvangen van e-mails over onze producten en diensten, zoals beschreven in onze privacyverklaring. Afmelden kan altijd.

Als je deze zomer het AI-nieuws hebt gevolgd, voelde het waarschijnlijk als een achtbaan. Aan de ene kant stelt MIT’s Project NANDA dat maar liefst 95% van de enterprise GenAI-initiatieven geen meetbaar P&L-resultaat oplevert, ondanks tientallen miljarden aan investeringen. Aan de andere kant meldt Google’s nieuwste wereldwijde ROI van AI-onderzoek dat de meeste productiegebruikers wél al ROI zien, en dat agentic AI de waarde versnelt. Beide kunnen niet tegelijk waar zijn, tenzij ze naar verschillende werelden kijken. En dat doen ze. Het verschil tussen die werelden verklaart waarom zoveel pilots vastlopen terwijl een minderheid hard vooruitgaat.

MIT’s wereld is de rommelige middenfase van enterprise AI: experimenten, proofs of concept en “pilot-eilanden” die nooit echte systemen raken. De belangrijkste bevinding is scherp: 30–40 miljard dollar in enterprise GenAI, 95% zonder enig P&L-effect, slechts 5% van de geïntegreerde pilots levert betekenisvolle waarde op. Het rapport noemt dit de GenAI Divide, een groeiende kloof tussen bedrijven die AI in hun werk kunnen inbedden en bedrijven die dat niet kunnen. Het is geen anti-AI-verhaal, het is anti-PowerPoint. Het verschil zit in productie, niet in potentie.

Slimmer groeien met AI Agents

Google onderzocht daarentegen de groep die GenAI al in productie gebruikt, niet alleen experimenteert. Binnen die populatie zegt 74% ROI te zien op minstens één use case. Bij agentic early adopters loopt dat zelfs op tot 88%. Dit is geen tegenspraak van MIT, maar de keerzijde: wat er gebeurt zodra je de kloof overbrugt van demo’s naar systemen die plannen, tools aanroepen en processen sluiten.

Agentic AI in de saaie definitie, niet de hype, betekent software die kan beslissen én uitvoeren: redeneren over doelen, stappen coördineren, enterprise-API’s aanroepen en overdragen of escaleren onder menselijke guardrails. Google meldt dat inmiddels meer dan de helft (52%) van de organisaties die GenAI gebruiken ook agents inzetten, en dat 39% er zelfs meer dan 10 in productie hebben. Dat laat zien waar de ROI zit: niet in prompts, maar in processen.

De echte discussie zou dus niet moeten zijn “Is AI overhyped?” maar “Wat onderscheidt de 5% van de 95%?” Uit beide onderzoeken en praktijkvoorbeelden komen drie patronen naar voren:

1) Productie, niet pilots

Pilots die nooit gekoppeld worden aan brondata of kernsystemen (ERP, ticketing, CRM, beleidsengines) kunnen geen resultaten leveren die finance herkent. Google’s methode maakt dit duidelijk: hun dataset bestaat uit productiegebruikers, wat vanzelf leidt tot meetbare waarde. MIT’s blik omvat juist de moerassige laag van experimenten die nooit kans hadden. Wie CFO-waardig bewijs wil, moet agents koppelen aan de systemen die al worden gecontroleerd.

2) Agents met tools, niet chat met “vibes”

Waar ROI zichtbaar wordt, hebben agents toegang tot tools en data onder governance: ze openen cases, boeken journaalposten, maken tickets aan, updaten records en volgen beleid. Google benadrukt in “wat werkt”-secties dat veilige toegang en governance altijd eerst komen, performance volgt daarna. MIT’s 5% zijn in feite precies die bedrijven die dit hebben gedaan.

3) Executive sponsorship en "change muscle"

Bedrijven die resultaten rapporteren hebben vaak sterke steun vanuit de boardroom en een duidelijke definitie van waarde, zoals snelheid, nauwkeurigheid, kosten of omzet, vooraf meetbaar gemaakt. Organisaties met volledige executive alignment zien veel vaker ROI. Dat is het verschil tussen een wetenschapsproject en een fabriek.

Daarom mist het frame van een “AI-bubbel” de kern. De data zeggen niet “AI werkt niet.” Ze zeggen: AI die niet ingebouwd is in werk, werkt niet. Als je taalmodellen beoordeelt als speeltjes, krijg je speeltjesresultaten. Als je agents behandelt als deelnemers in transacties, met identiteit, beleid en verantwoordelijkheden, krijg je operationele slagkracht.

Finance operations zijn daarbij een perfect voorbeeld. Ze zijn gestructureerd, zwaar beleidsgedreven en al ingericht op controles. Ideaal terrein dus voor agentic systemen om zich te bewijzen zonder groot risico. In de praktijk ontstaan de eerste patronen in vier dagelijkse workflows:

  • Support bij de maandafsluiting. Ontbrekende bonnetjes en documenten verzamelen, uitgaven coderen, afwijkingen signaleren en escaleren richting afsluiting. Een agent kan dit continu uitvoeren binnen bestaande rechten en terugschrijven naar het ERP.
  • Inkoop. Een vage “we hebben X nodig” vertalen naar een compliant, budgetbewuste aanvraag. Deze wordt naar de juiste approvers gerouteerd, waarna een kaart of inkooporder wordt aangemaakt. Medewerkers doen een simpele aanvraag in Slack of Teams; de agent doet de rest.
  • Zakelijk reizen. Reizen boeken binnen beleid op basis van voorkeuren van de reiziger. Daarna automatisch een reisrapport samenstellen en uitgaven groeperen voor éénklik-approval en ERP-export.
  • Ondersteuning bij betalingen. Vragen als “waarom is mijn kaart geblokkeerd?” of “wat is de status van mijn terugbetaling?” direct beantwoorden en compliant vervolgstappen voorstellen, zonder finance te veranderen in een helpdesk.

Dit zijn geen moonshots. Ze zijn smal, meetbaar en controleerbaar, en juist daarom verplaatsen ze de P&L.

Intussen concentreren budgetten zich op wat werkt. Terwijl AI-infrastructuur goedkoper wordt, stijgt de totale AI-uitgave, vaak door herallocatie vanuit niet-AI-budgetten. Gemiddeld gaat nu 26% van de totale IT-uitgaven naar AI. Dat kapitaal zal blijven stromen naar use cases die ROI opleveren, dus agentic automatiseringen die gekoppeld zijn aan gecontroleerde systemen.

Stop met pilots tellen, begin met agents meten

De verkeerde metric is “aantal proofs of concept.” De juiste metric is “aantal closed-loop automatiseringen per kwartaal die beleid volgen en audit doorstaan,” plus de daarbij behorende euro’s. Zo overbrug je de vermeende kloof tussen MIT’s realiteitscheck en Google’s optimisme.

Behandel “agent ops” zoals DevOps

Je hebt een runbook nodig: intent hardening (menselijke verzoeken vertalen naar ondubbelzinnige, beleidsbewuste plannen), idempotente acties (veilige herhalingen zonder dubbel te boeken), rollback-semantiek (compensaties om verkeerde stappen terug te draaien) en observability (elk toolverzoek en elke beslissing traceerbaar maken). Maak je nog niet druk om grote “AI-strategieën” voordat je een agent kunt uitrollen, terugdraaien en meten zoals je met een microservice doet. (Google’s advies is hier duidelijk: geef agents gecontroleerde toegang tot enterprise-systemen en leg de regels vroeg vast.) Richt ROI op operaties, niet op verbeelding.

Google’s data laat zien dat ROI zich concentreert rond vijf domeinen: productiviteit, klantervaring, groei, marketing en security. Vooral security ontwikkelt zich tot een belangrijk agentic domein omdat het werk event-driven en tool-heavy is. Misschien niet sexy, maar wel betrouwbaar.

Let op de steekproef, niet alleen de statistiek

Als je board MIT’s 95% aanhaalt, vraag: “Hoeveel van die initiatieven draaiden écht in productie?” Als je leverancier 74% ROI noemt, vraag: “Zaten niet-productiegebruikers in de data?” Dit zijn geen details, maar totaal verschillende universums. Google’s eigen methode beperkt claims tot organisaties die GenAI in productie gebruiken, en daarom zijn hun cijfers optimistischer. Beide waarheden kunnen naast elkaar bestaan; jouw taak is van het ene universum naar het andere te bewegen.

Kortom, de paradox verdwijnt zodra je de scheidslijn ziet. De meeste pilots falen, veel productie-initiatieven leveren op. De stap van het eerste naar het tweede draait niet om modelmagie maar om systeemengineering plus governance. Dat is wat de 5% al weten, en wat de 95% snel moeten leren.

De media zullen blijven hameren op het binaire frame: “AI-boom!” versus “AI-bust!”, omdat dat goede headlines oplevert. De betere headline voor operators is dit: AI-resultaten hangen af van agency en integratie. Als je agents geen toegang hebben tot de systemen die geld bewegen, risico’s beheren of klanten bedienen, kunnen ze je cijfers niet beïnvloeden. Als ze dat wel kunnen, dan doen ze dat.

Leiders hebben geen nieuw debat over hype nodig. Ze hebben een fabriek nodig die intenties omzet in acties en een P&L die het verschil laat zien. Bouw dat, en je hoeft niet te discussiëren met welk rapport dan ook. Je bevindt je dan simpelweg in de dataset die wint.

Georgi Ivanov - Senior Communications Manager at Payhawk
Georgi Ivanov
Senior Communications Manager
LinkedIn
Bekijk alle artikelen van Georgi

Georgi Ivanov is een voormalig CFO die nu marketing- en communicatiestrateeg is. Hij leidt de merkstrategie en AI-thought leadership bij Payhawk, waar hij zijn financiële kennis combineert met een vooruitstrevende manier van vertellen.

Gerelateerde artikelen