Sie haben vermutlich schon eines gesehen. Ein 40-seitiges KI-Readiness-Assessment, erstellt nach acht Wochen Interviews und Workshops, geliefert als PDF mit farbcodierten Reifegraden und einer „empfohlenen Roadmap". Es liegt im SharePoint-Ordner, wird gelegentlich in einer Vorstandspräsentation zitiert und hat null operativen Einfluss darauf, ob Ihr erster KI-Workflow je die Produktion erreicht.

Das ist kein Zufall, sondern ein Konstruktionsfehler. Die meisten Assessments messen die falschen Dinge, liefern das falsche Ergebnis und arbeiten im falschen Takt. Der Befund deckt sich mit dem, was McKinsey im „State of AI 2025" über alle Branchen hinweg dokumentiert: 88 Prozent der Unternehmen nutzen KI inzwischen regelmäßig in mindestens einer Funktion, aber nur rund ein Drittel skaliert sie unternehmensweit, und gerade einmal eine kleine Minderheit verzeichnet einen spürbaren Effekt auf das EBIT. Die Lücke zwischen Aktivität und Wirkung ist real — und Assessments, die Aktivität bewerten statt Umsetzungsfähigkeit, vergrößern sie eher, als sie zu schließen. DACH-Mittelständler, wo Ressourcen endlich und die Geduld kürzer ist, zahlen den höchsten Preis für diese Fehlkonstruktion.

Fehlermuster 1: Inputs messen statt Umsetzungskapazität

Das typische KI-Readiness-Assessment bewertet Ihre Inputs. Wie viele Data Scientists beschäftigen Sie? Wie reif ist Ihre Cloud? Existiert eine KI-Governance-Richtlinie? Gibt es ein Center of Excellence? Das sind Bestandsfragen. Sie erfassen, was Sie haben — nicht, ob Sie umsetzen können.

Der Unterschied entscheidet über alles. Ein Unternehmen ohne eigene Data Scientists, mit solider Standard-Cloud und ohne formale Governance-Richtlinie kann einen produktiven KI-Workflow in einem Quartal in Betrieb nehmen — vorausgesetzt, es hat einen sauber geschnittenen Workflow, einen Sponsor mit Budgethoheit, zugängliche Daten und ein Team mit echter Bandbreite. Umgekehrt scheitert ein Unternehmen mit fünf Data Scientists, einer modernen Datenplattform und einer publizierten KI-Strategie unter Umständen zwei Jahre lang daran, einen einzigen Workflow in Produktion zu bringen — weil die Use Cases nie auf konkrete Prozesse heruntergebrochen werden, das Sponsorship diffus bleibt und die Data Scientists Proofs of Concept bauen, die das Labor nie verlassen. Genau dieses Muster — viel KI-Aktivität, wenig Produktion — beschreibt McKinsey als den zentralen Engpass: Die Hochleister sind nicht die mit den meisten Assets, sondern die, die Arbeitsabläufe tatsächlich neu zuschneiden.

Inputs sagen keine Kapazität voraus. Kapazität sagt Deployment voraus. Jedes Assessment, das Ersteres statt Letzterem misst, misst das Falsche.

Wie kapazitätsbasiertes Assessment klingt. Statt „Was haben Sie?" fragt es „Was können Sie diese Woche tun?". Können Sie einen Workflow mit messbarem Volumen benennen — nicht bloß einen Use-Case-Backlog vorweisen? Kann jemand kurzfristig 50.000 Euro freigeben, ohne Vorstandseskalation, statt nur abstrakt ein „KI-Budget" zu haben? Können Sie die relevanten Daten innerhalb von drei Wochen bereitstellen, nicht nur auf eine Datenplattform verweisen? Kann ein konkret benanntes Teammitglied vier Stunden pro Woche für Validierung reservieren, statt dass das Unternehmen pauschal „KI-Talent" beansprucht? Diese Fragen sind unbequem, weil sie Spezifität verlangen. Genau das ist ihr Zweck.

Fehlermuster 2: Score-basiert statt handlungsleitend

Das zweite strukturelle Versagen betrifft das Ergebnisformat. Die meisten Assessments produzieren einen Reifegrad — eine Zahl oder einen Farbcode auf einer Skala. „Ihre Organisation erreicht 2,3 von 5 bei der Daten-Readiness." „Ihre Governance-Position ist gelb." Solche Scores erzeugen die Illusion von Präzision. Sie fühlen sich rigoros an. Und sie sind operativ nutzlos.

Was bedeutet eine 2,3? Was genau sollten Sie morgen anders machen? Welchen Workflow zuerst deployen, wer sponsert ihn, wie hoch ist das Budget, was ist der Zeitrahmen? Ein Score beantwortet keine dieser Fragen. Er beschreibt eine Position auf einem Spektrum. Geschäftsführung und CFO können nicht auf einer Position handeln — sie handeln auf einem Plan.

Wie ein handlungsleitendes Ergebnis aussieht. Es ist kein Score, sondern ein Deployment-Plan. Für Workflow eins — etwa die Klassifizierung eingehender Schadenmeldungen — steht darin der Sponsor (Leiter Schaden), das geschnittene Budget, der bestätigte Datenzugang mit Frist bis zur Extraktion, die Compliance-Position inklusive der Frage, ob eine DSGVO-Datenschutz-Folgenabschätzung nötig ist, und ein realistischer Zeitrahmen bis Produktion. Daneben der eine Blocker, der die Sache ins Stocken bringen kann — fehlende Team-Bandbreite bis ins dritte Quartal etwa — mit der konkreten Gegenmaßnahme, hier eine befristete Analystenrolle für die Build-Phase. Und ein Kandidat für Workflow zwei, dessen Datenzugang noch zu validieren ist. Das ist handlungsfähig. Die Geschäftsführung liest es und entscheidet in derselben Sitzung. Niemand muss abstrakte Scores erst in konkrete Maßnahmen übersetzen.

Fehlermuster 3: Einmal-Snapshot statt eingebauter Takt

Das dritte Versagen ist zeitlicher Natur. Die meisten Assessments laufen genau einmal — ein abgegrenztes Projekt mit Start, Ende und finaler Lieferung. Sie erfassen eine Momentaufnahme zu einem Zeitpunkt, dann sind sie abgeschlossen. Readiness aber ist nicht statisch. Sie verschiebt sich, wenn die Organisation lernt, wenn Personal wechselt, wenn Daten zugänglicher oder unzugänglicher werden, wenn regulatorische Anforderungen scharf gestellt werden. Ein Assessment aus dem Januar kann im Juni bedeutungslos sein — nicht weil sich das Unternehmen dramatisch verändert hat, sondern weil sich die spezifischen Bedingungen für den spezifischen Workflow verschoben haben.

Die Regulatorik macht das gerade besonders greifbar. Der EU AI Act wird am 2. August 2026 weitgehend anwendbar; die Pflichten für Hochrisiko-Systeme nach Anhang III sind an dieses Datum geknüpft, auch wenn der derzeit diskutierte „Digital Omnibus" Teile davon nach hinten verschieben könnte. Für ein Unternehmen heißt das: Ein Workflow, der heute als „klar einsatzbereit" gilt, kann morgen in eine Hochrisiko-Kategorie mit Konformitätsbewertung, Logging und menschlicher Aufsicht rutschen — oder eben nicht, je nach finalem Rechtsstand. Ein Assessment, das diese Position einmalig festschreibt, ist binnen Monaten überholt. Genauso ist es operativ: Ein Schadentriage-Workflow, der im Januar als „nicht bereit" galt, weil Daten in einem Legacy-System lagen, kann im April voll einsatzbereit sein, weil die IT die Migration abgeschlossen hat. Ein Einkaufs-Workflow, der im Februar „bereit" war, kann im Mai blockiert sein, weil der Sponsor die Rolle gewechselt hat.

Wie iteratives Assessment aussieht. Nützliches Assessment ist kein Projekt, sondern eine Fähigkeit — ein schlanker, wiederholbarer Check, den die Organisation vor jeder Initiative durchführt und in definierten Intervallen während des Builds wiederholt. Im Rahmen des KI-Betriebssystems ist dieser Check in den operativen Takt eingebettet: vor der Initiative ein Sechs-Dimensionen-Readiness-Check für den Kandidaten-Workflow, der zwei Tage dauert statt acht Wochen; in Woche vier ein Re-Check der beiden Dimensionen, die sich in der frühen Build-Phase am häufigsten verschieben, nämlich Datenzugang und Team-Kapazität; und nach dem Deployment ein Review, das festhält, was die Organisation über ihre eigenen Readiness-Muster gelernt hat — Erkenntnisse, die direkt in die Bewertung des nächsten Workflows fließen. Dieser Takt produziert kontinuierlich aktuelle Intelligenz statt eines veralteten PDFs, zu einem Bruchteil der Zeit und des Budgets eines einmaligen Assessment-Projekts.

Warum das Beratungsmodell den falschen Ansatz belohnt

Die drei Fehlermuster sind keine Versehen. Sie sind Merkmale eines Geschäftsmodells. Inputs statt Kapazität zu messen erfordert mehr Interviews, mehr Workshops, mehr Analystentage — also größere Projekte. Score-basierte Ergebnisse leben von proprietären Frameworks und Benchmarks, die geistige Eigentumsbarrieren errichten und Premium-Honorare rechtfertigen. Und der Einmal-Snapshot erzeugt ein natürliches Folgemandat, sobald das Assessment unvermeidlich veraltet.

Nichts daran ist verschwörerisch — es ist strukturell. Die Anreize des Assessment-Anbieters sind nicht auf die Ergebnisse des Mittelständlers ausgerichtet. Der Anbieter optimiert auf Projektumfang; das Unternehmen braucht eine Deployment-Entscheidung. Diese Fehlausrichtung ist der Grund, warum wir unsere Diagnose als schlanke Alternative gebaut haben — nicht weil Assessments unnötig wären, sondern weil die meisten für die Entscheidung, die sie stützen sollen, schlicht überdimensioniert sind.

Der Remote-Native-Ansatz: sechs Dimensionen, kapazitätsfokussiert

Unsere Diagnose bewertet dieselben sechs Dimensionen wie das vollständige KI-Readiness-Framework, unterscheidet sich aber in drei Designentscheidungen.

Kapazität statt Inputs. Jede Frage zielt auf die Fähigkeit zur Umsetzung, nicht auf das Vorhandensein von Assets — „Können Sie die Daten innerhalb von drei Wochen bereitstellen?" statt „Haben Sie eine Datenplattform?".

Plan statt Score. Das Ergebnis ist eine Deployment-Empfehlung — konkreter Workflow, benannter Sponsor, geschnittenes Budget, geschätzter Zeitrahmen — und kein Reifegrad.

Iterativ statt Snapshot. Die Diagnose ist auf Wiederholung ausgelegt: für den ersten Workflow, für den zweiten, für jede folgende Initiative. Jeder Durchlauf ist schneller, weil die Organisation ihre eigenen Muster inzwischen kennt.

Die Diagnose ist kostenfrei, erfordert ein strukturiertes Gespräch statt eines Acht-Wochen-Mandats und liefert ein Ergebnis, auf das die Geschäftsführung sofort handeln kann.

Was tun, wenn Sie bereits ein Assessment beauftragt haben?

Hat Ihre Organisation schon in ein klassisches KI-Readiness-Assessment investiert, ist das Dokument nicht wertlos. Es enthält brauchbare Informationen über Ihre Datenlandschaft, Ihre Infrastruktur, Ihr Talent-Profil. Diese Informationen haben als Kontext Wert. Was das Assessment mit hoher Wahrscheinlichkeit nicht getan hat, ist die operative Frage zu beantworten: Sind wir für diesen konkreten Workflow bereit zu deployen?

Nehmen Sie die Erkenntnisse als Hintergrund und stellen Sie dann die sechs Readiness-Fragen für Ihren prioritären Workflow. Ist er benannt und sauber geschnitten? Ist ein Sponsor mit Budgethoheit identifiziert? Sind die Daten innerhalb von Wochen zugänglich? Hat das Team Kapazität eingeplant? Ist die Compliance-Position geklärt — gerade mit Blick auf den EU AI Act? Und ist klar, wer den Workflow nach der Produktivstellung betreibt? Werden mindestens vier dieser sechs Fragen mit Ja beantwortet, deployen Sie — die verbleibenden Lücken schließen sich während der Build-Phase. Liegen weniger als drei vor, adressieren Sie genau die Lücken, die das klassische Assessment vermutlich identifiziert hat, auch wenn es sie nicht als Deployment-Voraussetzungen gerahmt hat.

Starten Sie mit dem richtigen Assessment

Das richtige Assessment für Ihre erste KI-Initiative ist nicht größer. Es ist kleiner, schneller und auf eine einzige Frage fokussiert: Bekommen wir diesen Workflow in Produktion?

Eine Diagnose bildet Ihren konkreten Workflow gegen die sechs Readiness-Dimensionen ab und liefert eine Deployment-Empfehlung statt eines Reifegrads — bevor Sie acht Wochen und ein fünfstelliges Honorar in ein PDF investieren, das niemand operativ nutzt.

Diagnose starten →


Quellen: McKinsey & Company, „The State of AI in 2025: How organizations are rewiring to capture value", 2025 (mckinsey.com/capabilities/quantumblack/our-insights/the-state-of-ai); Europäische Kommission, „Regulatory framework on AI" / AI Act, Anwendbarkeit ab 2. August 2026 (digital-strategy.ec.europa.eu/en/policies/regulatory-framework-ai).