Im KI-Diskurs hat sich eine Unterscheidung etabliert, die inzwischen auch die großen Beratungshäuser quantifizieren — und sie verschiebt die Investitionsthese. Sie verläuft zwischen KI als Werkzeug (man fragt, sie antwortet) und KI als Arbeitskraft (man beauftragt, sie führt aus). Die erste Kategorie — Chatbots, Copilots, Suchassistenten — bindet heute den Großteil der KI-Ausgaben in Unternehmen. Die zweite Kategorie — Agenten, die über mehrstufige Workflows hinweg planen, ausführen und sich anpassen — ist dort, wo sich die Wertkurve gerade neu zeichnet.

Boston Consulting Group beziffert im AI Radar 2025, dass Agentic AI rund 17 % des KI-Unternehmenswerts ausmacht, und erwartet bis 2028 einen Anstieg auf 29 %. In derselben Projektion verschiebt sich die Zusammensetzung des KI-Werts von etwa 45 % generativer, 38 % prädiktiver und 17 % agentischer KI heute auf 38 / 35 / 29 % bis 2028 — Agenten sind also nicht die ganze Geschichte, aber die einzige der drei Kategorien, deren Anteil deutlich wächst. McKinsey wiederum beziffert das gesamtwirtschaftliche Potenzial generativer KI auf 2,6 bis 4,4 Billionen Dollar an jährlichem Unternehmensgewinn über alle Funktionen hinweg. Diese Zahl ist kein Agenten-Budget, sondern die Obergrenze des Spielfelds, auf dem Agenten einen wachsenden Anteil holen.

Die Richtung ist klar. Die Einsatzbereitschaft ist es nicht — und genau diese Lücke entscheidet, ob ein Mittelständler aus Agentic AI Wert oder Verlust zieht.

Was Agentic AI in der Praxis tatsächlich bedeutet

Der Wandel vom Werkzeug zur Arbeitskraft ist nicht metaphorisch. Ein Copilot schlägt Änderungen an einem Dokument vor. Ein Agent erstellt das Dokument, prüft es gegen Freigaberegeln, leitet es zur Genehmigung weiter, hakt nach, wenn diese stockt, und überarbeitet es auf Basis von Feedback — ohne zwischen den Schritten zum Menschen zurückzukehren. Ein Copilot beantwortet eine Frage zur Lieferkette. Ein Agent überwacht Lagerbestände, erkennt Nachbestellauslöser, legt Bestellungen an, prüft sie gegen vertraglich vereinbarte Konditionen und eskaliert nur dann an einen menschlichen Einkäufer, wenn ein Vorgang außerhalb voreingestellter Parameter liegt. Der Unterschied ist nicht Geschwindigkeit. Der Unterschied ist, dass im zweiten Fall ein Prozessschritt vollständig delegiert wird — mitsamt der Entscheidung, wann nicht delegiert werden darf.

Das ist die Grenze zwischen Augmentierung und Autonomie. Im Drei-Level-Framework sitzen Copilots auf Level 1 (Assistenz) — sie steigern individuelle Produktivität innerhalb bestehender Workflows. Agenten mit menschlicher Aufsicht sitzen auf Level 2 (Augmentierung) — sie führen ganze Workflow-Segmente aus, während Menschen die Ergebnisse überwachen und Ausnahmen behandeln. Agent-zu-Agent-Orchestrierung, bei der sich mehrere Agenten koordinieren, um ganze Prozesse mit minimaler menschlicher Intervention zu betreiben, gehört auf Level 3 (Autonomie).

Die ökonomische Unterscheidung zählt, weil die Wertkurven auseinanderlaufen. Level 1 erzeugt lineare Gewinne: ein Copilot, ein Nutzer, eine Produktivitätssteigerung. Verzehnfachen Sie die Lizenzen, verzehnfachen Sie bestenfalls den Effekt. Level 2 erzeugt Gewinne auf Workflow-Ebene: ein Agent bearbeitet einen Prozess End-to-End und verbessert den Durchsatz für die gesamte Funktion, nicht nur für eine Person. Level 3 erzeugt systemische Gewinne, weil vernetzte Agenten funktionsübergreifend optimieren. Für die meisten Mittelständler ist Level 2 das realistische und lohnende Ziel der nächsten 24 Monate — Level 3 ist heute eher Architekturvision als Betriebsrealität.

Wo der Wert sich konzentriert — und wie weit die Adoption wirklich ist

Agenten zahlen sich dort aus, wo Prozesse hohes Volumen, klare Entscheidungspunkte und messbare Ergebnisse haben. Kundenservice, Lieferketten- und Bestandsmanagement, Wissensarbeit über verteilte Dokumentenbestände, Teile des Vertriebs-Backoffice. Das ist kein Zufall: Es sind dieselben Domänen, in denen klassische Workflow-Automatisierung seit Jahren den stärksten ROI liefert. Agentic AI erweitert diese Logik um Fälle, die zu unstrukturiert für regelbasierte Automatisierung und zu repetitiv für teure Fachkräftezeit waren — der mittlere Bereich, in dem ein Sachbearbeiter heute Urteilsvermögen anwendet, das sich beschreiben, aber bisher nicht regelbasiert abbilden ließ.

Die Adoption beschleunigt sich, bleibt aber dünn. In McKinseys State-of-AI-Erhebung 2025 berichten 23 % der Befragten, dass sie ein agentisches System irgendwo im Unternehmen skalieren; weitere 39 % experimentieren. Entscheidend ist die Tiefe: In keiner einzelnen Geschäftsfunktion geben mehr als 10 % der Befragten an, Agenten zu skalieren — und wer skaliert, tut es meist in nur ein oder zwei Funktionen. Das Muster ist aus der generativen Welle bekannt: breites Pilotieren, schmaler Produktivbetrieb. Dieselbe Skalierungslücke, die generative KI 2023 und 2024 prägte, zeigt sich nun eine Ebene höher.

Die ökonomische Spreizung zwischen Vorreitern und Nachzüglern ist real und gemessen. Bain stellt im Technology Report 2025 fest, dass KI-Vorreiter den Sprung von Piloten zu Profitabilität geschafft haben und durch das Skalieren von KI über Kernprozesse hinweg 10 bis 25 % EBITDA-Verbesserung erzielen. Das sind keine Modellprognosen, sondern Ergebnisse von Unternehmen, die die Schwelle vom Werkzeugeinsatz zum Arbeitskraft-Deployment überschritten haben. Der Treiber dieser Spreizung ist nicht die Raffinesse des Modells — die ist für alle dieselbe und über die Cloud abrufbar. Der Treiber ist die organisatorische Fähigkeit, Workflows neu zu gestalten, Daten gezielt zu kuratieren und autonome Systeme zu steuern. Für den DACH-Mittelstand ist das die eigentlich gute Nachricht: Der Hebel liegt nicht im Kapital für Frontier-Modelle, sondern in Disziplin bei Prozess, Daten und Governance — und damit in Reichweite.

Der Engpass ist nicht die Technologie

An diesem Punkt konvergieren die Beratungshäuser. Die Modelle sind leistungsfähig, die Infrastruktur reift, die Agent-Frameworks existieren und sind über jeden Hyperscaler verfügbar. Was Organisationen, die Agentenwert abschöpfen, von solchen unterscheidet, die teuer scheitern, ist organisatorische Bereitschaft. Bain bringt es auf einige wiederkehrende Punkte: Ziele top-down setzen und an Geschäftsergebnisse binden statt an Adoptionsmetriken; ganze Workflows neu gestalten, statt Agenten in bestehende Prozessschritte einzusetzen; Daten pragmatisch dort kuratieren, wo der Agent tatsächlich arbeitet, statt auf den perfekten Data Lake zu warten; und Build-Buy-Partner-Entscheidungen bewusst danach treffen, wo der eigene Wettbewerbsvorteil liegt. Für einen Mittelständler heißt das in der Praxis: nicht eigene Agenten-Plattformen bauen, sondern verfügbare Bausteine entlang eines neu gedachten Prozesses orchestrieren.

Die dominierende Barriere ist Governance, nicht Rechenleistung. Fast zwei Drittel der von McKinsey Befragten nennen Sicherheit und Risiko als größtes Hindernis für die Skalierung von Agentic AI — vor regulatorischer Unsicherheit und vor technischen Grenzen. Das ist bemerkenswert, weil es eben keine Technologiebarriere ist. Ein autonom operierender Agent braucht Leitplanken: Welche Entscheidungen darf er treffen, welche Schwellenwerte lösen eine menschliche Prüfung aus, was passiert in Grenzfällen, und wer haftet, wenn er irrt. Den meisten Organisationen fehlen die Frameworks, um diese Fragen zu beantworten — und damit fehlt die Voraussetzung, Agenten überhaupt verantwortbar einzusetzen.

Für DACH kommt eine regulatorische Dimension hinzu, die in den globalen Reports oft untergeht. Der EU AI Act ist seit August 2024 in Kraft und tritt gestaffelt in Anwendung; die Pflichten für Hochrisiko-Systeme greifen ab 2026/2027. Ein Agent, der autonom Entscheidungen mit Außenwirkung trifft — Kreditvorprüfung, Bewerbungsvorauswahl, Schadenregulierung — kann je nach Einsatz in den Hochrisiko-Bereich fallen und löst dann Anforderungen an Risikomanagement, Protokollierung, menschliche Aufsicht und technische Dokumentation aus. Genau jene Audit-Trails und Eskalationspfade, die gute Agenten-Governance ohnehin verlangt, sind hier nicht Kür, sondern Nachweispflicht. Wer Governance von Anfang an mitdenkt, baut Compliance nicht nachträglich an, sondern ein.

Warum Agenten scheitern: die Anti-Patterns

Der teuerste Fehler ist das Deployment ohne Workflow-Redesign. Ein Agent, der in einen bestehenden Prozess eingesetzt wird, erbt dessen Ineffizienzen. Ein Schadenbearbeitungs-Agent, der dieselben Schritte wie ein menschlicher Sachbearbeiter durchläuft — nur schneller — schöpft einen Bruchteil des verfügbaren Werts. Derselbe Agent in einem neu gedachten Workflow, in dem Klassifikation, Routing, Prüfung und Regulierungsempfehlung als koordinierte autonome Schritte ablaufen, schöpft ein Vielfaches. Die Evidenz zum Workflow-Redesign ist in den Konsequenzen eindeutig: Der Engpass ist selten das Modell, fast immer der Prozess drumherum.

Der zweite Fehler ist unzureichende Datenarchitektur. Agenten konsumieren und produzieren kontinuierlich Daten. Sie brauchen Zugriff auf operative Daten nahezu in Echtzeit, sie müssen ihre Entscheidungen und Begründungen für Audit-Trails festhalten, und sie brauchen Feedback-Schleifen, die anschlagen, wenn ihr Output von erwarteten Parametern abweicht. Die meisten Unternehmensdatenarchitekturen sind aber für menschlichen Konsum gebaut — Dashboards, Reports, Batch-Exporte. Agentengerechte Architektur verlangt maschinenlesbare, latenzarme, sauber gesteuerte Pipelines. Das ist unspektakuläre Infrastrukturarbeit, und sie ist nicht verhandelbar.

Der dritte Fehler ist das Governance-Vakuum. Ein Agent ohne klare Betriebsgrenzen ist ein Risiko. Er trifft in Grenzfällen Entscheidungen, für die er nie ausgelegt war. Er handelt lokal optimal, aber global schädlich. Er akkumuliert Fehler, die niemand bemerkt, weil niemand überwacht. Die Vorreiter mit zweistelliger EBITDA-Wirkung haben vor der Skalierung in Governance investiert — Entscheidungsgrenzen definiert, Monitoring aufgebaut, Eskalationsprotokolle etabliert und Verantwortlichkeiten geklärt. Governance ist hier kein Bremsklotz, sondern die Bedingung, unter der sich Autonomie überhaupt verantworten lässt.

Agentenbereitschaft im Drei-Level-Modell

Das Drei-Level-Framework liefert eine direkte Bereitschaftsbewertung. Operiert eine Organisation auf Level 1 — KI als individuelle Werkzeuge, Chatbots, Copilots —, ist sie für Agenten noch nicht bereit. Die Grundlagen fehlen: Workflows sind nicht neu gedacht, Pipelines nicht produktionsreif, Governance-Frameworks nicht vorhanden. Der ehrlichste Befund für viele Mittelständler lautet deshalb: nicht „welchen Agenten kaufen wir", sondern „welche zwei oder drei Prozesse machen wir agentenfähig".

Level 2 ist die Deployment-Zone. Hier hat eine Organisation Workflows für die Mensch-KI-Zusammenarbeit neu gestaltet, Monitoring und Governance etabliert und die operative Fähigkeit entwickelt, KI-Systeme im Produktivbetrieb zu führen. Agenten arbeiten autonom, aber innerhalb definierter Grenzen, mit menschlicher Prüfung der Ergebnisse und Eingriff bei Ausnahmen. Hier wird der heutige 17-%-Wertanteil aus BCGs Zahl überwiegend generiert — und hier liegt das erreichbare Ziel für den DACH-Mittelstand.

Level 3 ist die Frontier. Agent-zu-Agent-Orchestrierung, bei der mehrere autonome Systeme funktionsübergreifend koordinieren, ist dort, wo die Wertkurve steiler wird — und wo die Governance-Anforderungen überproportional wachsen. Die Kommunikationsprotokolle dafür, allen voran das Model Context Protocol (MCP) und Agent-zu-Agent-Standards, erreichen laut Bain gerade ihren Adoptions-Kipppunkt, ohne dass sich ein einzelner Standard universell durchsetzt. Die Infrastruktur für Level 3 entsteht also — aber sehr wenige Unternehmen sind heute operativ bereit, sie zu nutzen.

Die strategische Implikation

Die Beratungshäuser sind sich in einem Punkt einig: Agentic AI ist kein Feature, das man aktiviert, sondern ein Betriebsmodell, auf das man hinarbeitet. Das von McKinsey skizzierte Wertpotenzial von 2,6 bis 4,4 Billionen Dollar ist kein Topf, den man durch den Kauf der richtigen Werkzeuge abschöpft. Es ist eine Wertschöpfungsebene, die aus neu gestalteten Workflows, belastbarer Datenarchitektur, robuster Governance und der organisatorischen Bereitschaft entsteht, Entscheidungen an autonome Systeme zu delegieren — und zu wissen, wann nicht.

Die 17 %, die Agenten heute am KI-Wert ausmachen, wachsen Richtung 29 %. Die Frage für die Geschäftsführung lautet nicht, ob in Agentic AI investiert werden sollte, sondern ob die eigene Organisation die Grundlagen hat, diesen Wert zu realisieren — oder ob sie zur Mehrheit gehören wird, die Agenten verfrüht ausrollt und lernt, dass ein autonomes System ohne Leitplanken teurer ist als gar keines.

Ein Fit Call bewertet, wo Ihre Organisation im Drei-Level-Modell steht und welche konkreten Schritte nötig sind, damit Agentic AI bei Ihnen Wert statt Risiko erzeugt. Kein Pitch. Eine ehrliche Bereitschaftsbewertung — bevor Sie das erste Budget binden.

Fit Call buchen →


Referenzen: Boston Consulting Group, „AI Radar 2025: From Potential to Profit" (bcg.com/publications/2025/closing-the-ai-impact-gap); McKinsey & Company, „The State of AI in 2025: Agents, Innovation, and Transformation", November 2025 (mckinsey.com/capabilities/quantumblack/our-insights/the-state-of-ai); Bain & Company, „Technology Report 2025" (bain.com/insights/topics/technology-report); McKinsey Global Institute, „The Economic Potential of Generative AI: The Next Productivity Frontier" (mckinsey.com).