
De mythe van de procurement agent: gesprekken vervangen geen processen



Iedereen verkoopt nu “agents” alsof autonomie de doorbraak is. In procurement is dat niet zo. De echte vooruitgang zit in delegeren binnen kaders: werk opdelen in stappen die je kunt volgen, controleren en auditen.
Project Vend is het duidelijkste publieke voorbeeld van hoe “agents in de echte economie” eruitzien. Het is een experiment waarin Anthropic een AI-agent wekenlang een kleine kantoorwinkel liet runnen. In fase twee werd de winkel beter, maar niet omdat “autonomie eindelijk werkte”. Het ging beter omdat Anthropic de agent minder liet improviseren en juist strakke procedures afdwong.
Door je aan te melden, ga je akkoord met het ontvangen van e-mails over onze producten en diensten, zoals beschreven in onze privacyverklaring. Afmelden kan altijd.
## Fase één: capabel, maar niet operationeel
In fase één gaven Anthropic en Andon Labs "Claude Sonnet 3.7" de leiding over een echte kantoorwinkel. De agent, met de bijnaam Claudius, kon het web browsen, mensen berichten sturen via Slack en Andon Labs vragen om voorraad aan te vullen. Hij mocht prijzen bepalen, het assortiment kiezen en klanten helpen.
Een deel ervan werkte: Het vond snel leveranciers, behandelde verzoeken en weigerde enkele duidelijk "schadelijke" vragen van interne testers.
Maar het faalde op de manier waarop agents meestal falen wanneer ze met echte bedrijfsactiviteiten in aanraking komen: Het negeerde duidelijke winstkansen, hallucineerde kritieke details zoals waar betalingen naartoe moesten worden gestuurd, prijsde producten zonder onderzoek en verkocht met verlies. Het liet zich ook overhalen tot kortingscodes en weggeefacties, en het leerde niet consequent van zijn eigen fouten.
Als je in procurement werkt, zou dit niets moeten verbazen.
Inkoop is een controlesysteem dat bestaat om drie uitkomsten te voorkomen: Het verkeerde kopen, het op de verkeerde manier kopen, of het tegen de verkeerde prijs kopen. Dit betekent dat een "behulpzame" assistent die in realtime improviseert, nooit door die controles kan komen.

Fase twee: de echte verandering
Fase twee bracht een nieuwer Sonnet-model en een aangepaste omgeving. Dat hielp, maar de grootste verandering was structureel: meer tools, strakkere instructies en meer verplichte procedures.
Anthropic gaf de agent een CRM om klanten, leveranciers, leveringen en bestellingen bij te houden. Ze verbeterden voorraadbeheer, zodat de agent kon zien wat er daadwerkelijk voor producten werd betaald. Ze breidden web browsing uit voor diepgaander leveranciers- en prijsonderzoek. Ze voegden basis-ops-hulpmiddelen toe, zoals feedbackformulieren, betaallinks en reminders. En ze hielden één belangrijke grens overeind: geen directe betaalinterface. Aankopen vereisten nog steeds menselijke goedkeuring.
Die opzet stabiliseerde de prestaties. Claudius werd beter in normale zakelijke interacties, het sourcen van producten, het vaststellen van prijzen met marge en het uitvoeren van verkopen.
Wat werkte: afgedwongen procedures
Het meest veelzeggende onderdeel van fase twee is wat Anthropic zelf aanwijst als doorslaggevend: Claudius dwingen om stappen te volgen. Wanneer er een verzoek binnenkwam, mocht de agent niet langer meteen een lage prijs en een optimistische levertijd noemen. Hij moest eerst feiten controleren met behulp van tools. Prijzen gingen omhoog, leverbeloftes werden conservatiever en de output werd realistischer.
Anthropic zegt hier ook hardop wat vaak impliciet blijft: bureaucratie doet ertoe. Procedures en checklists bestaan omdat ze institutioneel geheugen vastleggen en veelgemaakte fouten voorkomen.
Dat is de kern van de strategische les uit de evolutie van Project Vend. De weg van “leuke demo” naar iets dat je echt kunt draaien, loopt niet alleen via een groter model. Het gaat om werk vertalen naar stappen die een agent niet kan overslaan, ondersteund door tools die die stappen makkelijk te volgen en moeilijk te omzeilen maken.
Waarom de meeste “procurement agents” in productie tegenvallen
Dit is precies waarom zoveel procurement agents er geweldig uitzien in een demo en vervolgens uit elkaar vallen in productie. Ze behandelen procurement als een gesprek. Maar procurement vraagt om verplichte velden, routing, goedkeuringen en een audit trail. Het gesprek is hooguit de interface.
Project Vend laat ook zien wat níet werkt als shortcut. Anthropic introduceerde een AI-“CEO”, Seymour Cash, om de winkelier te pushen richting minder slechte beslissingen. Dat hielp op sommige punten, zoals het terugdringen van kortingen, maar creëerde nieuwe problemen. De CEO verruilde kortingen voor refunds en winkeltegoed, wat nog steeds omzet kost. Het systeem raakte verstrikt in vreemde loops. Een deel daarvan werd later gepatcht met agressievere prompting.
De conclusie is eenvoudig: governance krijg je niet door er nog een agent bovenop te zetten. Als de “manager-agent” uit hetzelfde materiaal bestaat als de “worker-agent”, krijg je dezelfde fouten, maar dan dubbel. Governance komt voort uit beleid, rol- en rechtenstructuur en harde poorten in het proces.
Daartegenover stond een specialistische agent in fase twee, Clothius, gericht op custom merchandise. Die werkte beter, vooral omdat de rol smal en duidelijk was. Dat gaf Claudius ruimte om zich te focussen op het runnen van de winkel.
Dat vertaalt zich direct naar procurement. Wat schaalbaar is, is niet één algemene agent die “procurement runt”, maar specialisten die werken binnen gedefinieerde workflows met duidelijke grenzen.
Zelfs na deze aanpassingen werd fase twee geen “autonome commerce”. Anthropic is daar duidelijk over: er blijft een grote kloof tussen “capabel” en “consistent veilig”. De agent bleef gevoelig voor naïeve beslissingen en social engineering.
Het experiment vereiste nog steeds aanzienlijke menselijke ondersteuning, zowel voor fysieke taken als om agents weer vlot te trekken wanneer ze vastliepen.
Wat dit betekent voor agentic procurement
Een gelikte chat-UX is makkelijk te kopiëren. Het echte voordeel ligt bij teams die beleid vertalen naar afgedwongen workflows, zodat een agent zich consistent gedraagt binnen echte controles.
Dat is de filosofie achter Payhawk’s Procurement Agent. Het doel is niet om “AI” toe te voegen aan intake. Het doel is om een procurementprocedure end-to-end te laten draaien, binnen de tools die mensen al gebruiken, met ingebouwde controles.
In Payhawk helpt de Procurement AI Agent medewerkers om aanvragen aan te maken en te beheren in Slack, én in het Payhawk webportaal of de mobiele app. De agent begeleidt gebruikers stap voor stap en is gebouwd om aanvragen binnen de ingestelde workflows van het bedrijf te houden, in plaats van te vertrouwen op ad-hoc oordeel. Via notificaties en opvolging in Slack helpt hij ook om aanvragen in beweging te houden, zodat werk niet blijft liggen.
Let op wat hier ontbreekt. Het is niet: “de agent koopt dingen”. Het is: “de agent helpt de organisatie om procurement netjes te laten verlopen”. Dat is wat delegeren mogelijk maakt.
Hoe je procurement agents beoordeelt na Vend 2
Wil je procurement agents praktisch evalueren na Project Vend 2, vraag dan niet om een demo van “wat het model kan”. Vraag hoe het systeem procedures afdwingt.
Vragen die ertoe doen:
- Kan het rommelige chat omzetten in een gestructureerde aanvraag met verplichte velden, elke keer opnieuw, zonder dat iemand alles moet overtypen?
- Kan het goedkeuringen routen op basis van categorie, drempels en beleid, zonder te gokken wie moet goedkeuren?
- Voert het checks uit vóór commitment, zoals budget, leveranciersstatus en basale prijslogica?
- Gaat het realistisch om met uitzonderingen, zoals nieuwe leveranciers, buiten-beleid aankopen, spoed of ontbrekende informatie, en bundelt het die tot een korte escalatie waar een goedkeurder echt een beslissing op kan nemen?
- Kan het een audit trail opleveren die uitlegt wat er is gebeurd en waarom, zonder dat je Slack-threads hoeft te reconstrueren?
Project Vend 2 herinnert ons eraan dat gepolijste output makkelijk is. De moeilijke kant is operationele betrouwbaarheid: expliciete procedures, gekoppelde tools en afgedwongen controlepunten die het model laten opereren als een stabiele medewerker.
De beste systemen voelen simpel voor medewerkers: “Ik stuur een bericht in Slack en het wordt geregeld.” Maar onder de motorkap zijn ze streng. Dat is wat procurement nodig heeft en waar finance zijn handtekening onder kan zetten.
Project Vend liet niet zien dat agents klaar zijn om zelfstandig bedrijven te runnen. Het liet iets nuttigers zien: de weg naar betrouwbare agents in finance is geplaveid met het saaie werk — procedures, checklists, kostenzichtbaarheid, routeringslogica en audit trails.
Boek een demo met Payhawk en zie hoe procurementworkflows end-to-end draaien binnen Slack en Payhawk, met procedures, controles en auditbaarheid vanaf dag één ingebouwd.
Georgi Ivanov is een voormalig CFO die nu marketing- en communicatiestrateeg is. Hij leidt de merkstrategie en AI-thought leadership bij Payhawk, waar hij zijn financiële kennis combineert met een vooruitstrevende manier van vertellen.
Gerelateerde artikelen


