Der Mythos des Procurement-Agenten: Warum chatbasierte Konversation keinen strukturierten Prozess ersetzt

4 Minuten

Georgi Ivanov - Senior Communications Manager - Payhawk

AutorGeorgi Ivanov

Read time

4 Minuten

VeröffentlichtJan 27, 2026

Zuletzt aktualisiertJan 30, 2026

Ein CFO nutzt KI-gestützte Einkaufssoftware, um Ausgaben, Freigaben und Compliance in Echtzeit zu prüfen.

Zusammenfassung

Derzeit verkaufen alle „AI-Agenten“ und stellen deren Autonomie als entscheidenden Durchbruch dar. Im Procurement ist sie das jedoch nicht. Der eigentliche Fortschritt liegt in der Delegation innerhalb klarer Kontrollen. Arbeit wird in nachvollziehbare Schritte zerlegt, die befolgt, überprüft und sauber auditiert werden können.

Project Vend ist bislang das deutlichste Beispiel dafür, wie „Agenten in der realen Wirtschaft“ tatsächlich funktionieren. Anthropic ließ dafür einen KI-Agenten mehrere Wochen lang einen kleinen Shop im eigenen Büro betreiben. In der zweiten Phase wurde der Shop spürbar besser – nicht, weil plötzlich mehr Autonomie entstanden wäre, sondern weil Anthropic dem Agenten weniger Raum für Improvisation ließ und stattdessen konsequent feste Prozesse einführte.

Demo buchen

Erhalten Sie jeden Monat frische Einblicke in Finanzen und Künstliche Intelligenz.

Durch das Absenden dieses Formulars erklären Sie sich damit einverstanden, E-Mails zu unseren Produkten und Dienstleistungen gemäß unserer Datenschutzrichtlinie zu erhalten. Sie können sich jederzeit abmelden.

Phase eins: leistungsfähig, aber nicht operativ

In Phase eins übertrugen Anthropic und Andon Labs Claude Sonnet 3.7 die Verantwortung für einen echten Büroshop. Der Agent mit dem Spitznamen Claudius konnte im Web recherchieren, über Slack mit Mitarbeitenden kommunizieren und Andon Labs um Nachschub bitten. Er durfte Preise festlegen, das Sortiment bestimmen und mit Kundinnen und Kunden interagieren.

Ein Teil davon funktionierte. Der Agent fand Lieferanten schnell, bearbeitete Anfragen zuverlässig und lehnte einige offensichtlich problematische Anforderungen interner Tester korrekt ab.

Gleichzeitig scheiterte der Agent genau auf die Weise, in der Agenten typischerweise scheitern, sobald sie reale Abläufe berühren. Er übersah klare Gewinnchancen, halluzinierte kritische Details wie Zahlungsziele, setzte Preise ohne ausreichende Recherche fest und verkaufte teilweise mit Verlust. Zudem ließ er sich zu Rabattcodes und Gratisaktionen überreden – und lernte nicht zuverlässig aus eigenen Fehlern.

Wenn Sie im Procurement arbeiten, dürfte Sie das kaum überraschen.

Procurement ist ein Kontrollsystem. Es existiert, um drei Dinge zu verhindern: das falsche Produkt zu kaufen, es auf die falsche Weise zu beschaffen oder den falschen Preis zu zahlen. Genau deshalb kann ein „hilfsbereiter“ Assistent, der in Echtzeit improvisiert, diese Prüfungen nicht zuverlässig bestehen.

Automatisieren Sie mit unseren AI-Agents 90 % Ihrer Aufgaben

Mehr erfahren

AI-Controller-Benutzeroberfläche – BildAI-Controller-Benutzeroberfläche – Bild

Phase zwei: Die eigentliche Veränderung

Phase zwei brachte ein neueres Sonnet-Modell und ein verändertes Setup. Das half. Der entscheidende Unterschied war jedoch struktureller Natur. Mehr Werkzeuge, klarere Anweisungen und verpflichtende Abläufe.

Anthropic stattete den Agenten mit einem CRM aus, um Kundinnen und Kunden, Lieferanten, Lieferungen und Bestellungen sauber zu erfassen. Zudem wurde das Bestandsmanagement verbessert, sodass transparent war, zu welchen Preisen Artikel eingekauft wurden. Die Webrecherche wurde erweitert, um fundiertere Lieferanten- und Preisvergleiche zu ermöglichen. Ergänzt wurde dies durch operative Hilfsmittel wie Feedbackformulare, Zahlungslinks und Erinnerungen. Eine zentrale Grenze blieb jedoch bestehen: keine direkte Zahlungsschnittstelle. Einkäufe erforderten weiterhin eine menschliche Freigabe.

Dieses Setup stabilisierte die Leistung. Claudius wurde sicherer im Tagesgeschäft, in der Beschaffung von Artikeln, in der Preisgestaltung mit tragfähigen Margen und in der verlässlichen Abwicklung von Verkäufen.

Was funktionierte: klare Prozesse

Der aufschlussreichste Aspekt von Phase zwei ist das, was Anthropic selbst als entscheidend hervorhebt: Claudius musste klar definierten Abläufen folgen. Ging eine Anfrage ein, durfte der Agent nicht mehr sofort einen niedrigen Preis und einen optimistischen Liefertermin nennen. Stattdessen prüfte er zunächst die relevanten Fakten mithilfe der verfügbaren Tools. Die Preise stiegen, Lieferzusagen wurden vorsichtiger – und die Ergebnisse insgesamt realistischer.

Anthropic spricht dabei einen oft unausgesprochenen Punkt offen an: Bürokratie ist wichtig. Prozesse und Checklisten existieren, weil sie institutionelles Wissen sichern und wiederkehrende Fehler verhindern.

Genau darin liegt die zentrale strategische Erkenntnis aus der Entwicklung von Project Vend. Der Weg von einer „beeindruckenden Demo“ zu einem belastbaren System führt nicht allein über leistungsfähigere Modelle. Entscheidend ist, Arbeit in Schritte zu übersetzen, die ein Agent nicht überspringen kann – unterstützt durch Werkzeuge, die diese Schritte leicht nachvollziehbar und schwer manipulierbar machen.

Warum die meisten Procurement Agents im Produktivbetrieb enttäuschen

Deshalb wirken viele Procurement Agents in Demos überzeugend und scheitern im Alltag. Sie behandeln Einkauf als Konversation. Tatsächlich braucht Einkauf Pflichtfelder, Routing, Freigaben und eine saubere Audit-Spur. Die Konversation ist lediglich die Oberfläche.

Project Vend zeigt auch, welche Abkürzungen nicht funktionieren. Anthropic führte einen KI-„CEO“ namens Seymour Cash ein, der den Shop-Betreiber zu besseren Entscheidungen drängen sollte. Das half punktuell, etwa bei der Reduzierung von Rabatten, schuf jedoch neue Probleme. Der CEO ersetzte Rabatte durch Rückerstattungen und Guthaben, die ebenfalls Umsatz kosten. Zudem driftete das System in merkwürdige Schleifen ab, die erst durch schärfere Prompts teilweise entschärft wurden.

Die Erkenntnis ist eindeutig: Governance entsteht nicht durch einen zusätzlichen Agenten. Wenn „Manager-Agent“ und „Worker-Agent“ auf derselben Logik beruhen, entstehen dieselben Fehler – nur in größerem Umfang. Steuerung entsteht durch Richtlinien, Rollen- und Berechtigungskonzepte sowie feste Kontrollpunkte.

Im Gegensatz dazu funktionierte ein spezialisierter Agent in Phase zwei deutlich besser. Clothius, zuständig für individualisierte Merch-Artikel, arbeitete stabiler, weil die Rolle klar abgegrenzt war und Claudius sich auf den Betrieb des Shops konzentrieren konnte.

Das lässt sich direkt auf den Einkauf übertragen. Skalierbar ist nicht ein einzelner Allzweckagent, der „den Einkauf übernimmt“, sondern das Zusammenspiel spezialisierter Agenten innerhalb klar definierter Workflows und Grenzen.

Auch nach diesen Anpassungen wurde Phase zwei nicht zu „autonomem Handel“. Anthropic betont ausdrücklich, dass weiterhin eine erhebliche Lücke zwischen „leistungsfähig“ und „dauerhaft sicher“ besteht. Der Agent blieb anfällig für naive Entscheidungen und Social Engineering.

Das Experiment erforderte weiterhin beträchtliche menschliche Unterstützung – sowohl bei physischen Aufgaben als auch dabei, Agenten aus festgefahrenen Situationen zu befreien.

Was das für das Procurement bedeutet

Eine beeindruckende Chat-UX lässt sich leicht kopieren. Der entscheidende Vorteil liegt bei Teams, die Richtlinien in verbindliche Workflows übersetzen, sodass Agenten konsistent innerhalb realer Kontrollen agieren können.

Genau diesem Ansatz folgt der Procurement Agent von Payhawk. Ziel ist nicht, der Bedarfserfassung einfach „KI“ hinzuzufügen. Ziel ist es, den Einkaufsprozess Ende zu Ende abzubilden – in den Tools, die Mitarbeitende ohnehin nutzen, und mit eingebauten Kontrollen.

In Payhawk unterstützt der Procurement AI Agent Mitarbeitende dabei, Anfragen in Slack sowie im Payhawk-Webportal oder in der mobilen App zu erstellen und zu verwalten. Er führt Schritt für Schritt durch den Prozess und stellt sicher, dass Anfragen innerhalb der unternehmensweit definierten Workflows bleiben, statt auf spontane Einzelfallentscheidungen zu setzen. Zusätzlich sorgen Benachrichtigungen und Follow-ups in Slack dafür, dass Vorgänge nicht liegen bleiben.

Auffällig ist, was fehlt. Es geht nicht darum, dass „der Agent Dinge einkauft“. Es geht darum, dass der Agent die Organisation dabei unterstützt, Einkauf sauber und regelkonform abzuwickeln. Das ist die Voraussetzung für echte Delegation.

Wie Procurement Agents nach Vend 2 bewertet werden sollten

Wenn Sie Procurement Agents nach Project Vend 2 bewerten möchten, fragen Sie nicht nach einer Demo, „was das Modell kann“. Fragen Sie danach, wie das System Prozesse erzwingt.

Entscheidende Fragen sind:

Kann es ungeordnete Chat-Nachrichten zuverlässig in strukturierte Anfragen mit Pflichtfeldern überführen, ohne manuelle Nacharbeit?
Kann es Freigaben nach Kategorien, Schwellenwerten und Richtlinien steuern, ohne zu raten, wer zuständig ist?
Führt es Prüfungen vor einer Verpflichtung durch, etwa zu Budget, Lieferantenstatus und grundlegender Preisplausibilität?
Behandelt es Ausnahmen als echten Prozesspfad, etwa bei neuen Lieferanten, Richtlinienabweichungen, dringenden Käufen oder fehlenden Informationen, und bereitet diese so auf, dass Entscheider fundiert entscheiden können?
Kann es eine nachvollziehbare Audit-Spur erzeugen, die erklärt, was passiert ist und warum, ohne die Geschichte aus Slack-Threads rekonstruieren zu müssen?

Project Vend 2 zeigt: Polierte Antworten zu erzeugen ist einfach. Die eigentliche Herausforderung ist die operative Verlässlichkeit. Sie entsteht durch klare Prozesse, integrierte Tools und erzwungene Kontrollpunkte, die das Modell zu einem stabilen Akteur machen.

Die besten Systeme fühlen sich für Mitarbeitende einfach an: „Nachricht in Slack senden – und es läuft.“ Unter der Oberfläche sind sie jedoch strikt geregelt. Genau das braucht das Procurement – und genau das kann Finance verantworten.

Project Vend hat nicht gezeigt, dass Agenten bereit sind, Unternehmen allein zu führen. Es hat etwas Wertvolleres gezeigt: Der Weg zu vertrauenswürdigen Agenten im Finanzumfeld führt über die unspektakulären Dinge. Prozesse, Checklisten, Kostentransparenz, Routing-Logik und Audit-Trails.

Buchen Sie noch heute eine Demo mit Payhawk und erleben Sie, wie Einkaufsworkflows End-to-End in Slack und Payhawk ablaufen – mit Prozessen, Kontrollen und Auditierbarkeit - von Anfang an.

Georgi Ivanov

Senior Communications Manager

Alle Artikel von Georgi

Georgi Ivanov ist ein ehemaliger CFO, der sich zum Experten für Marketing und Kommunikation entwickelt hat. Bei Payhawk verantwortet er die Markenstrategie und die Rolle als Vordenker im Bereich Künstliche Intelligenz. Dabei vereint er sein fundiertes Finanzwissen mit modernem, zukunftsorientiertem Storytelling.

Alle Artikel von Georgi

Der Mythos des Procurement-Agenten: Warum chatbasierte Konversation keinen strukturierten Prozess ersetzt

Inhaltsverzeichnis

Phase eins: leistungsfähig, aber nicht operativ

Phase zwei: Die eigentliche Veränderung

Was funktionierte: klare Prozesse

Warum die meisten Procurement Agents im Produktivbetrieb enttäuschen

Was das für das Procurement bedeutet

Wie Procurement Agents nach Vend 2 bewertet werden sollten

Ähnliche Artikel

Payhawks verifizierte KI-Agenten erfassen Rechnungen - und sparen Nutzern so vier Jahre manuelle Arbeit

Geschäftsreisen neu gedacht: Warum das klassische Reisemanagement für Finanzteams nicht mehr funktioniert

Studie: Viele Finanzteams weltweit stecken bei der Umsetzung von KI-Lösungen auf halbem Weg fest