KI-Investitionen steigen rasant. Die Renditen nicht. Was fünf globale Studien zeigen.

Die Adoption ist gewonnen. Fast jedes Unternehmen mit einer IT-Abteilung nutzt heute generative KI in irgendeiner Form — als Assistenten, als Pilot, als Experiment in einer Fachabteilung. Was nicht gewonnen ist, ist die Rendite. Die Investitionen haben ein historisches Niveau erreicht, aber der messbare Wert konzentriert sich auf eine schmale Minderheit von Organisationen. Der Rest gibt mehr aus, setzt mehr ein, präsentiert mehr Use Cases im Lenkungskreis — und findet die Wirkung trotzdem nicht in der Gewinn- und Verlustrechnung wieder.

Das ist kein Eindruck, sondern ein Befund, den mehrere unabhängige Datensätze decken: McKinseys globale State-of-AI-Umfrage 2025, BCGs Studie zur sich öffnenden Wertlücke vom September 2025 und eine vielzitierte MIT-Untersuchung zum Stand der KI in der Wirtschaft. Unterschiedliche Methoden, unterschiedliche Stichproben, dieselbe Diagnose. Dieser Artikel verdichtet, was sie gemeinsam zeigen — und übersetzt es in die Realität des DACH-Mittelstands, der die Lücke unter verschärften regulatorischen Bedingungen schließen muss.

Das Ausmaß der Lücke

McKinsey beziffert den Abstand zwischen Potenzial und Praxis. Die viel zitierte Schätzung des McKinsey Global Institute von 2,6 bis 4,4 Billionen Dollar jährlichem Wertpotenzial über 63 analysierte Use Cases markiert die Obergrenze dessen, was generative KI volkswirtschaftlich leisten könnte. Die State-of-AI-Umfrage 2025 zeigt die nüchterne Untergrenze dessen, was sie heute leistet: Von knapp 2.000 befragten Organisationen führen nur 109 — rund sechs Prozent — mehr als fünf Prozent ihres EBIT auf den Einsatz von KI zurück. Die übrige Mehrheit, einschließlich vieler Unternehmen mit erheblichen Investitionen, meldet Effekte, die sich auf Unternehmensebene nicht nennenswert in der Bilanz niederschlagen. McKinseys eigene Erklärung dafür ist unmissverständlich: KI sei „20 Prozent Algorithmen und 80 Prozent organisatorische Neuverkabelung", und das Redesign von Workflows habe den größten Einzeleffekt auf die Frage, ob ein Unternehmen EBIT-Wirkung sieht oder nicht.

BCG zieht mit anderen Daten dieselbe Grenze. BCGs Untersuchung unter mehr als 1.250 Unternehmen weltweit kommt zu einer fast deckungsgleichen Zahl: Nur etwa fünf Prozent qualifizieren sich als „future-built" — Organisationen, die KI-Fähigkeiten systematisch über Funktionen hinweg aufgebaut und in ihr Betriebsmodell integriert haben. Am anderen Ende des Spektrums erzielen rund 60 Prozent trotz substanzieller Ausgaben keinen materiellen Wert: minimale Umsatz- und Kosteneffekte bei realen Budgets. BCGs Kernaussage zur Trennlinie ist dieselbe wie bei McKinsey — der Wert wird von jenen gehoben, die über das Ausrollen von Tools hinausgehen und ganze Workflows neu gestalten, nicht von jenen, die Software lizenzieren und an bestehende Prozesse anhängen. Das BCG-Reifegrad-Blueprint schlüsselt die Fähigkeitsarchitektur auf, die diese Stufen trennt.

Eine MIT-Untersuchung beziffert das Scheitern auf Projektebene. Eine 2025 breit rezipierte Studie aus dem MIT-Umfeld (Project NANDA, „The GenAI Divide: State of AI in Business") schätzt, dass rund 95 Prozent der untersuchten generativen KI-Pilotprojekte keinen messbaren Ergebnisbeitrag liefern — bei einem geschätzten Investitionsvolumen von 30 bis 40 Milliarden Dollar. Die Studie führt das nicht auf fehlende Modelle, fehlende Infrastruktur oder Regulierung zurück, sondern auf brüchige Workflows, schwache kontextuelle Einbettung und die Diskrepanz zwischen Pilot und Tagesgeschäft. Es sind Erhebungen mit unterschiedlichem Anspruch und unterschiedlicher Härte — eine Befragung, eine Pilot-Analyse —, doch ihre Richtung ist identisch: Breite Nutzung, schmale Wirkung.

Was die wenigen anders machen

Der gemeinsame Nenner ist nicht die Höhe der Ausgaben. Wäre er es, müsste sich die Lücke mit steigenden Budgets schließen. Sie tut es nicht — sie öffnet sich weiter. Der gemeinsame Nenner ist strukturelle Transformation, und die Datensätze beschreiben sie in bemerkenswert ähnlichen Begriffen, obwohl sie unterschiedliche Frameworks verwenden. Drei Unterscheidungen tragen den Befund.

Workflow-Redesign statt Tool-Deployment. Bei McKinsey ist die Neugestaltung von Arbeitsabläufen der Faktor mit der größten EBIT-Wirkung. BCGs „future-built"-Unternehmen verlagern sich von einzelnen Flaggschiff-Workflows zur Neugestaltung ganzer Funktionen mit einem „AI-first"-Betriebsmodell. Die MIT-Untersuchung verortet das Scheitern genau dort, wo KI an unveränderte Prozesse angeheftet wird. Das Vokabular unterscheidet sich, der Befund ist derselbe: Wer KI auf einen bestehenden Prozess aufsetzt, bekommt im besten Fall individuelle Produktivitätsgewinne, die auf Unternehmensebene verpuffen. Wer den Prozess um die KI-Fähigkeit herum neu denkt, verändert die Ökonomie der Arbeit selbst.

Geschäftsverantwortung statt IT-Verantwortung. Wo KI an die IT berichtet, optimiert sie Technologie. Wo sie an die Geschäftsführung berichtet, optimiert sie Ergebnisse. Die Spitzengruppe behandelt KI nicht als Technologieprojekt mit Budget und Roadmap, sondern als Frage des Betriebsmodells, für die ein ergebnisverantwortlicher Leader geradesteht. Das ist die unscheinbarste und folgenreichste Differenz: Ein KI-Programm, das niemand mit P&L-Verantwortung besitzt, wird an Akzeptanzquoten und Lizenzkosten gemessen statt an Marge, Durchlaufzeit oder Kundenergebnis — und liefert entsprechend.

Fähigkeitsaufbau statt Tool-Einkauf. Tools sind Softwareprodukte, die einzelne Mitarbeiter nutzen. Fähigkeiten sind organisatorische Muskeln: Dateninfrastruktur, die Unternehmenswissen für KI-Systeme zugänglich macht; Evaluierungs-Frameworks, die KI-Leistung an Geschäftsergebnissen messen statt an Demo-Eindrücken; Feedback-Loops, die Systeme auf Basis von Produktionsdaten verbessern; und Menschen, die KI-Workflows entwerfen und verantworten, nicht nur Interfaces bedienen. Diese Fähigkeiten kauft man nicht ein. Man baut sie — und genau das erklärt, warum sich der Abstand vergrößert statt verkleinert.

Warum sich die Lücke vergrößert

Strukturelle Vorteile verzinsen sich. Der Abstand zwischen Spitzengruppe und Rest ist kein Einjahres-Vorsprung, sondern ein Kumulationseffekt. Jeder neu gestaltete Workflow erzeugt Daten, die den nächsten verbessern; jedes erfolgreiche Deployment baut Routine auf, die das nächste beschleunigt; jede realisierte Rendite finanziert die nächste Investition. Die wenigen, die die strukturelle Schwelle überschritten haben, beschleunigen. Der Rest iteriert an Piloten und finanziert Lizenzen, die sich nicht verzinsen.

Der Talentmarkt verstärkt die Kluft. Talent folgt der Wirkung. Organisationen, die sich früh transformiert haben, ziehen die Menschen an, die weitere Transformation ermöglichen — KI-Engineering, Datenarchitektur, KI-Produktmanagement. Wer zögert, konkurriert auf einem Markt, auf dem genau diese Profile knapp und teuer sind, ohne den Track Record, der sie anzieht. Für den Mittelstand, der ohnehin selten gegen die Gehälter und Sichtbarkeit großer Plattformanbieter ankommt, ist das ein doppelter Nachteil.

Governance skaliert nichtlinear. Mit jedem zusätzlichen produktiven KI-System multiplizieren sich die Governance-Anforderungen: Jedes System braucht Monitoring, jeder delegierte Workflow Delegationsregeln, jedes Modell-Update eine Validierung. Wer Governance früh als Teil der ersten Deployments aufgebaut hat, besitzt ein skalierbares Fundament. Wer zuerst ausgerollt hat und nun nachrüstet, sieht sich exponentiell wachsender Komplexität gegenüber. Die Kostenstrukturanalyse zeigt, wie diese Kosten kumulieren, wenn Governance als Nachtrag behandelt wird.

Was das für den DACH-Mittelstand bedeutet

Die Wertlücke ist kein amerikanisches Phänomen, das man aus der Distanz beobachtet. DACH-Unternehmen stehen vor derselben Dynamik — mit zwei zusätzlichen Faktoren. Der erste ist regulatorisch und terminiert. Seit dem 2. August 2025 gelten die Pflichten für Anbieter von KI-Modellen mit allgemeinem Verwendungszweck (GPAI) nach dem EU AI Act; ab dem 2. August 2026 greifen die Kernpflichten für Hochrisiko-Systeme nach Anhang III — etwa in Personalauswahl oder Kreditvergabe — und die Durchsetzungsbefugnisse der Kommission gegenüber GPAI-Anbietern. Wer KI in regulierte Entscheidungen einbettet, baut Governance damit nicht optional, sondern gegen eine feste Frist. Das ist kein Nachteil, sondern ein Vorzieheffekt: Die Architektur, die ohnehin über Wert oder Wirkungslosigkeit entscheidet, muss hier früher stehen.

Der zweite Faktor ist kulturell. Die traditionelle Stärke des Mittelstands — operative Exzellenz innerhalb etablierter, über Jahre optimierter Prozesse — wird zur Belastung, sobald genau diese Prozesse nicht optimiert, sondern umgestaltet werden müssen. Ein Unternehmen, das stolz auf seine eingespielten Abläufe ist, hat die größte Hemmschwelle gegenüber der einen Maßnahme, die laut allen Datensätzen den Wert hebt: den Ablauf neu zu denken, statt KI hineinzukleben.

Der Weg von der Mehrheit zur Spitzengruppe führt nicht über mehr KI. Er führt über ein anderes Betriebsmodell für KI. Die Befunde konvergieren auf wenige, unbequeme Anforderungen: Workflows, die um KI-Fähigkeiten herum neu gestaltet werden, statt sie mit Tools zu ergänzen; ein ergebnisverantwortlicher Geschäftsführer, der KI-Ergebnisse besitzt, statt eines Technologieverantwortlichen, der KI-Infrastruktur verwaltet; eine Governance-Architektur, die Skalierung trägt, statt Policy-Dokumenten, die sie bremsen; und Fähigkeitsaufbau, der organisatorische Muskeln schafft, statt Beschaffung, die Lizenzen produziert.

Die Frage ist deshalb nicht mehr, ob man in KI investiert — diese Entscheidung ist gefallen. Die Frage ist, ob die Investition strukturell oder inkrementell ist. Inkrementelle Investition fügt KI zu bestehenden Prozessen hinzu und hofft, dass sich individuelle Produktivitätsgewinne von selbst zu finanziellem Ergebnis aggregieren. Mehrere unabhängige Untersuchungen über zehntausende Organisationen hinweg zeigen, dass genau das nicht geschieht. Das BCG-Reifegrad-Framework und die Kostenstrukturanalyse in dieser Serie schlüsseln auf, woran man die eine Variante von der anderen erkennt.

Ein Fit Call klärt, ob Ihr KI-Ansatz strukturell oder inkrementell ist — bevor weitere Budgets in Lizenzen fließen, die sich nicht verzinsen. Wir bewerten Ihr aktuelles Investitionsmuster entlang der vier Trennlinien — Workflow-Design, Ownership-Modell, Governance-Architektur und Fähigkeitsfundament — und benennen die konkreten strukturellen Lücken, die darüber entscheiden, ob Ihre KI-Ausgaben kumulieren oder ein Plateau erreichen.

Fit Call buchen →

Referenzen: McKinsey & Company, „The State of AI: How Organizations Are Rewiring to Capture Value", Global Survey, 2025 (mckinsey.com/capabilities/quantumblack/our-insights/the-state-of-ai); McKinsey Global Institute, „The Economic Potential of Generative AI", 2023; BCG, „The Widening AI Value Gap / Build for the Future", September 2025 (bcg.com/publications/2025/are-you-generating-value-from-ai-the-widening-gap); MIT Project NANDA, „The GenAI Divide: State of AI in Business 2025"; Europäische Kommission, „Regulatory framework on AI" / EU AI Act, Anwendungsfristen 2. August 2025 und 2. August 2026 (digital-strategy.ec.europa.eu/en/policies/regulatory-framework-ai).

KI-Investitionen steigen rasant. Die Renditen nicht. Was fünf globale Studien zeigen.

Das Ausmaß der Lücke

Was die wenigen anders machen

Warum sich die Lücke vergrößert

Was das für den DACH-Mittelstand bedeutet

Related articles

88 % führen ein, 6 % gewinnen: McKinseys Daten zeigen, warum KI im Unternehmen nicht skaliert

Die 5-%-Blaupause: Was BCGs „Future-Built”-Unternehmen anders machen

Die KI-Transformationsprämie: Warum transformierte Unternehmen um 37 Prozentpunkte besser abschneiden

Ready for the next step?