
Der Mythos des Procurement-Agenten: Warum Konversation keinen strukturierten Prozess ersetzt



Alle verkaufen derzeit „AI Agenten“, als wäre Autonomie der entscheidende Durchbruch. Im Procurement ist sie es nicht. Der wirkliche Fortschritt liegt in Delegation innerhalb klarer Kontrollen. Arbeit wird in nachvollziehbare Schritte zerlegt. Diese Schritte können befolgt, überprüft und sauber auditiert werden.
Project Vend ist das bislang deutlichste öffentliche Beispiel dafür, wie „Agenten in der realen Wirtschaft“ tatsächlich funktionieren. Anthropic hat dafür einen KI-Agenten mehrere Wochen lang einen kleinen Shop im eigenen Büro betreiben lassen. In Phase zwei wurde der Shop spürbar besser. Nicht, weil plötzlich Autonomie entstanden wäre. Sondern weil Anthropic dem Agenten weniger Freiraum zum Improvisieren ließ und stattdessen konsequent feste Prozesse eingeführt hat.
Durch das Absenden dieses Formulars erklären Sie sich damit einverstanden, E-Mails zu unseren Produkten und Dienstleistungen gemäß unserer Datenschutzrichtlinie zu erhalten. Sie können sich jederzeit abmelden.
Phase eins: leistungsfähig, aber nicht operativ
In Phase eins übertrugen Anthropic und Andon Labs Claude Sonnet 3.7 die Verantwortung für einen echten Büroshop. Der Agent mit dem Spitznamen Claudius konnte im Web recherchieren, über Slack mit Mitarbeitenden kommunizieren und Andon Labs um Nachschub bitten. Er durfte Preise festlegen, das Sortiment bestimmen und mit Kundinnen und Kunden interagieren.
Ein Teil davon funktionierte. Der Agent fand Lieferanten schnell, bearbeitete Anfragen zuverlässig und lehnte einige offensichtlich problematische Anforderungen interner Tester korrekt ab.
Gleichzeitig scheiterte er auf die Weise, in der Agenten typischerweise scheitern, sobald sie reale Abläufe berühren. Er übersah klare Gewinnchancen, halluzinierte kritische Details wie Zahlungsziele, setzte Preise ohne ausreichende Recherche fest und verkaufte teilweise mit Verlust. Zudem ließ er sich zu Rabattcodes und Gratisaktionen überreden und lernte nicht zuverlässig aus eigenen Fehlern.
Wenn Sie im Einkauf arbeiten, dürfte Sie das kaum überraschen.
Einkauf ist ein Kontrollsystem. Es existiert, um drei Dinge zu verhindern: das falsche Produkt zu kaufen, es auf die falsche Weise zu beschaffen oder den falschen Preis zu zahlen. Genau deshalb kann ein „hilfsbereiter“ Assistent, der in Echtzeit improvisiert, diese Prüfungen nicht bestehen.
Automatisieren Sie mit unseren AI-Agents 90 % Ihrer Aufgaben

Phase zwei: Die eigentliche Veränderung
Phase zwei brachte ein neueres Sonnet-Modell und ein verändertes Setup. Das half. Der entscheidende Unterschied war jedoch struktureller Natur. Mehr Werkzeuge, klarere Anweisungen und verpflichtende Abläufe.
Anthropic stattete den Agenten mit einem CRM aus, um Kundinnen und Kunden, Lieferanten, Lieferungen und Bestellungen sauber zu erfassen. Das Bestandsmanagement wurde verbessert, sodass ersichtlich war, zu welchen Preisen Artikel eingekauft wurden. Die Webrecherche wurde erweitert, um fundiertere Lieferanten- und Preisvergleiche zu ermöglichen. Hinzu kamen operative Hilfsmittel wie Feedbackformulare, Zahlungslinks und Erinnerungen. Eine zentrale Grenze blieb bestehen: keine direkte Zahlungsschnittstelle. Einkäufe erforderten weiterhin eine menschliche Freigabe.
Dieses Setup stabilisierte die Leistung. Claudius wurde sicherer im Tagesgeschäft, in der Beschaffung von Artikeln, in der Preisgestaltung mit tragfähigen Margen und in der verlässlichen Abwicklung von Verkäufen.
Was funktionierte: erzwungene Prozesse
Der aufschlussreichste Aspekt von Phase zwei ist das, was Anthropic selbst als ausschlaggebend benennt: Claudius musste festen Abläufen folgen. Ging eine Anfrage ein, durfte der Agent nicht mehr sofort einen niedrigen Preis und einen optimistischen Liefertermin nennen. Stattdessen musste er zunächst Fakten mithilfe der verfügbaren Tools prüfen. Die Preise stiegen, Lieferzusagen wurden vorsichtiger, und die Ergebnisse wurden realistischer.
Anthropic spricht dabei einen oft unausgesprochenen Punkt offen an: Bürokratie ist wichtig. Prozesse und Checklisten existieren, weil sie institutionelles Wissen sichern und wiederkehrende Fehler verhindern.
Genau darin liegt die zentrale strategische Erkenntnis aus der Entwicklung von Project Vend. Der Weg von einer „beeindruckenden Demo“ zu einem belastbaren System führt nicht allein über leistungsfähigere Modelle. Entscheidend ist, Arbeit in Schritte zu übersetzen, die ein Agent nicht überspringen kann, unterstützt durch Werkzeuge, die diese Schritte leicht nachvollziehbar und schwer manipulierbar machen.
Warum die meisten „Procurement Agents“ im Produktivbetrieb enttäuschen
Deshalb wirken so viele Procurement Agents in Demos überzeugend und scheitern im Alltag. Sie behandeln Einkauf als Konversation. Tatsächlich braucht Einkauf Pflichtfelder, Routing, Freigaben und eine saubere Audit-Spur. Die Konversation ist lediglich die Oberfläche.
Project Vend zeigt auch, was nicht als Abkürzung funktioniert. Anthropic führte einen KI-„CEO“ namens Seymour Cash ein, der den Shop-Betreiber zu weniger Fehlentscheidungen drängen sollte. Das half in einzelnen Bereichen, etwa bei der Reduzierung von Rabatten, schuf aber neue Probleme. Der CEO ersetzte Rabatte durch Rückerstattungen und Guthaben, die ebenfalls Umsatz kosten. Zudem driftete das System in merkwürdige Schleifen ab. Ein Teil davon wurde später durch schärfere Prompts entschärft.
Die Erkenntnis ist eindeutig: Governance entsteht nicht durch einen zusätzlichen Agenten. Wenn „Manager-Agent“ und „Worker-Agent“ aus derselben Logik bestehen, entstehen dieselben Fehler, nur in größerem Umfang. Steuerung entsteht durch Richtlinien, Rollen- und Berechtigungskonzepte sowie feste Kontrollpunkte.
Im Gegensatz dazu funktionierte ein spezialisierter Agent in Phase zwei besser. Clothius, zuständig für individualisierte Merch-Artikel, arbeitete stabiler, weil die Rolle klar abgegrenzt war und Claudius sich auf den Betrieb des Shops konzentrieren konnte.
Das lässt sich direkt auf den Einkauf übertragen. Skalierbar ist nicht ein einzelner Allzweckagent, der „den Einkauf übernimmt“, sondern ein Zusammenspiel spezialisierter Agenten innerhalb klar definierter Workflows und Grenzen.
Auch nach diesen Anpassungen wurde Phase zwei nicht zu „autonomem Handel“. Anthropic betont ausdrücklich, dass weiterhin eine große Lücke zwischen „leistungsfähig“ und „dauerhaft sicher“ besteht. Der Agent blieb anfällig für naive Entscheidungen und Social Engineering.
Das Experiment erforderte weiterhin erhebliche menschliche Unterstützung, sowohl bei physischen Aufgaben als auch dabei, die Agenten aus festgefahrenen Situationen zu befreien.
Was das für agentischen Einkauf bedeutet
Eine glänzende Chat-UX lässt sich leicht kopieren. Der entscheidende Vorteil liegt bei Teams, die Richtlinien in verbindliche Workflows übersetzen, sodass Agenten konsistent innerhalb realer Kontrollen agieren.
Genau dieser Ansatz steht hinter dem Procurement Agent von Payhawk. Ziel ist nicht, der Bedarfserfassung einfach „KI“ hinzuzufügen. Ziel ist es, einen Einkaufsprozess Ende-zu-Ende abzubilden, in den Tools, die Mitarbeitende ohnehin nutzen, und mit eingebauten Kontrollen.
In Payhawk unterstützt der Procurement AI Agent Mitarbeitende dabei, Anfragen in Slack sowie im Payhawk-Webportal oder in der mobilen App zu erstellen und zu verwalten. Er führt Schritt für Schritt durch den Prozess und stellt sicher, dass Anfragen innerhalb der unternehmensweit definierten Workflows bleiben, statt auf spontane Einzelfallentscheidungen zu setzen. Zusätzlich sorgt er mit Benachrichtigungen und Follow-ups in Slack dafür, dass Vorgänge nicht liegen bleiben.
Auffällig ist, was fehlt. Es geht nicht darum, dass „der Agent Dinge einkauft“. Es geht darum, dass der Agent die Organisation dabei unterstützt, Einkauf sauber und regelkonform abzuwickeln. Das ist die Grundlage für echte Delegation.
Wie Procurement Agents nach Vend 2 bewertet werden sollten
Wenn Sie Procurement Agents nach Project Vend 2 bewerten möchten, fragen Sie nicht nach einer Demo dessen, „was das Modell kann“. Fragen Sie danach, wie das System Prozesse erzwingt.
Entscheidende Fragen sind:
- Kann es ungeordnete Chat-Nachrichten zuverlässig in strukturierte Anfragen mit Pflichtfeldern überführen, ohne manuelle Nacharbeit?
- Kann es Freigaben nach Kategorien, Schwellenwerten und Richtlinien steuern, ohne zu raten, wer zuständig ist?
- Führt es Prüfungen vor einer Verpflichtung durch, etwa zu Budget, Lieferantenstatus und grundlegender Preisplausibilität?
- Behandelt es Ausnahmen als echten Prozesspfad, etwa bei neuen Lieferanten, Richtlinienabweichungen, dringenden Käufen oder fehlenden Informationen, und bereitet diese so auf, dass Entscheider fundiert entscheiden können?
- Kann es eine nachvollziehbare Audit-Spur erzeugen, die erklärt, was passiert ist und warum, ohne die Geschichte aus Slack-Threads rekonstruieren zu müssen?
Project Vend 2 zeigt: Polierte Antworten zu erzeugen ist einfach. Die eigentliche Herausforderung ist operative Verlässlichkeit. Sie entsteht durch klare Prozesse, integrierte Tools und erzwungene Kontrollpunkte, die das Modell zu einem stabilen Akteur machen.
Die besten Systeme fühlen sich für Mitarbeitende einfach an: „Nachricht in Slack senden und es läuft.“ Unter der Oberfläche sind sie jedoch strikt geregelt. Genau das braucht der Einkauf und genau das kann Finance verantworten.
Project Vend hat nicht gezeigt, dass Agenten bereit sind, Unternehmen allein zu führen. Es hat etwas Wertvolleres gezeigt: Der Weg zu vertrauenswürdigen Agenten im Finanzumfeld führt über die unspektakulären Dinge. Prozesse, Checklisten, Kostentransparenz, Routing-Logik und Audit-Trails.
Buchen Sie eine Demo mit Payhawk und erleben Sie, wie Einkaufsworkflows Ende-zu-Ende in Slack und Payhawk ablaufen – mit Prozessen, Kontrollen und Auditierbarkeit von Anfang an.
Georgi Ivanov ist ein ehemaliger CFO, der sich zum Experten für Marketing und Kommunikation entwickelt hat. Bei Payhawk verantwortet er die Markenstrategie und die Rolle als Vordenker im Bereich Künstliche Intelligenz. Dabei vereint er sein fundiertes Finanzwissen mit modernem, zukunftsorientiertem Storytelling.
Ähnliche Artikel


Von der Anfrage bis zur Zahlung: Gestalten Sie Ihren gesamten Einkaufsprozess neu – mit dem KI-gestützten Procurement Agent von Payhawk

