Das teuerste KI-Projekt ist dasjenige, das den falschen Workflow adressiert. Sie investieren drei Monate in Modellbau, Infrastruktur-Deployment und Teamschulung — und stellen fest, dass der automatisierte Prozess 80 Fälle pro Monat bearbeitet, nicht 800. Die Wirtschaftlichkeit war nie gegeben. Das Projekt wird still beerdigt.

Das passiert häufiger, als irgendjemand zugibt. Und die Ursache ist immer dieselbe: Das Unternehmen hat bei der Lösung angefangen („Wir setzen KI ein") statt beim Problem („Welche Workflows haben die Eigenschaften, die KI wertvoll machen?").

Process Mining beantwortet die zweite Frage. Es ist die Disziplin, operative Daten — Event Logs, Transaktionsdatensätze, System-Zeitstempel — zu analysieren, um zu verstehen, wie Workflows tatsächlich funktionieren, wo die Engpässe liegen und welche Prozesse das Volumen, die Musterdichte und die Messbarkeit mitbringen, um ein KI-Investment zu rechtfertigen.

Warum Bauchgefühl versagt

Die meisten KI-Kandidaten werden im Besprechungsraum ausgewählt. Der Geschäftsführer schlägt den Kundenservice vor. Der CFO die Rechnungsverarbeitung. Die COO die Qualitätskontrolle. Jeder hat gute Gründe. Keiner hat Daten.

Das Problem mit dem Bauchgefühl: Es gravitiert zu sichtbaren Schmerzpunkten statt zu adressierbaren. Kundenservice fühlt sich schmerzhaft an, weil Beschwerden laut sind. Aber der Prozess könnte niedrigvolumig sein (200 Tickets pro Monat), hochvariabel (jedes Ticket ist anders) und schlecht gemessen (keine Baseline für Lösungszeit oder Genauigkeit). Das ist ein schlechter KI-Kandidat.

Gleichzeitig verarbeitet die Kreditorenbuchhaltung 3.000 Rechnungen monatlich gegen einen festen Satz Validierungsregeln, mit einer bekannten Fehlerquote von 3,8 % und klaren Kosten pro Fehler. Niemand im Besprechungsraum hat sie erwähnt, weil der Prozess nicht dringend wirkt. Aber er ist ein hervorragender KI-Kandidat.

Process Mining ersetzt Bauchgefühl durch Evidenz.

Das Drei-Filter-Framework

Wir bewerten KI-Kandidaten durch drei Filter. Ein Workflow muss alle drei passieren, um die Investition zu rechtfertigen.

Filter 1: Volumenschwelle

Der Workflow muss genügend Transaktionen verarbeiten, um Implementierungskosten und Betriebsaufwand zu rechtfertigen. Für die meisten Mittelständler liegt die praktische Schwelle bei rund 500+ Transaktionen pro Monat oder dem Äquivalent von mindestens einer Vollzeitkraft, die dem Prozess gewidmet ist.

Unterhalb dieser Schwelle funktioniert die Rechnung selten. Ein Modell, das 10 Minuten pro Fall spart, aber nur 50 Fälle monatlich verarbeitet, spart 8 Stunden — rund 400 EUR an Personalkosten. Das deckt nicht die Kosten für Aufbau, Deployment und Wartung eines KI-Workflows.

Volumen ist nicht nur der Ist-Zustand. Berücksichtigen Sie die Wachstumskurve. Ein Prozess mit 300 Fällen heute, der quartalsweise um 15 % wächst, überschreitet die Schwelle innerhalb von zwei Quartalen — und eine KI-Infrastruktur, die dann bereitsteht, schafft einen strategischen Vorteil.

Filter 2: Musterdichte

KI lernt aus Mustern. Ein Workflow mit hoher Musterdichte — in dem 60–80 % der Fälle erkennbaren, wiederholbaren Strukturen folgen — ist ein starker Kandidat. Ein Workflow, in dem jeder Fall neuartig ist, ist ein schwacher.

Wie Sie Musterdichte ohne Modellbau bewerten: Nehmen Sie eine Stichprobe von 100 aktuellen Fällen und klassifizieren Sie diese manuell. Wie viele verschiedene Typen ergeben sich? Welcher Prozentsatz der Fälle fällt in die fünf häufigsten Typen? Wenn 70 %+ der Fälle in weniger als 10 Typen clustern, ist die Musterdichte hoch. Wenn jeder Fall individuelle Bearbeitung erfordert, ist sie niedrig.

Schadentriage in Versicherungen zeigt typischerweise hohe Musterdichte — Leitungswasser, Sturm, Einbruch und Kfz-Schäden machen die große Mehrheit der Schäden aus, und jeder Typ folgt einem vorhersehbaren Bewertungspfad. Strategische Beratungsanfragen zeigen niedrige Musterdichte — jedes Engagement ist einzigartig.

Filter 3: Messbarkeit

Sie brauchen drei Messungen: eine klare Definition des korrekten Outputs, eine verlässliche Baseline der aktuellen Performance und eine Methode zur laufenden Messung nach dem Deployment.

Ohne Output-Definition kein Modelltraining und keine Evaluation. Ohne Baseline keine Verbesserungsrechnung. Ohne laufende Messung keine Drift-Erkennung.

Die häufigste Messbarkeitslücke, die wir antreffen: Unternehmen kennen ihren Durchsatz (Fälle pro Woche), aber nicht ihre Genauigkeit (Prozentsatz korrekt beim ersten Anlauf). Das ist entscheidend, weil ein KI-System, das Fälle schneller, aber mit mehr Fehlern verarbeitet, mehr Arbeit schafft — nicht weniger.

Praktisches Process Mining: So gehen Sie vor

Sie brauchen keine Process-Mining-Plattform, um KI-Kandidaten zu identifizieren. Sie brauchen strukturierte Datenanalyse.

Schritt 1: Hochvolumige Workflows kartieren. Listen Sie jeden wiederkehrenden Prozess auf, der mehr als eine Person oder ein System involviert. Schätzen Sie für jeden das monatliche Transaktionsvolumen und den FTE-Einsatz. Das lässt sich an einem Nachmittag in einer Tabellenkalkulation erledigen.

Schritt 2: Musterdichte bewerten. Für die Top-10-Workflows nach Volumen ziehen Sie eine Stichprobe von 50–100 Fällen. Klassifizieren Sie diese manuell in Typen. Berechnen Sie die Konzentrationsrate — welcher Prozentsatz der Fälle fällt in die fünf häufigsten Typen?

Schritt 3: Messbarkeit prüfen. Für Workflows, die die ersten beiden Filter passieren, fragen Sie: Können wir definieren, wie ein korrekter Output aussieht? Kennen wir unsere aktuelle Fehlerquote, Durchlaufzeit und Kosten pro Transaktion? Können wir diese auch nach dem Deployment weiter messen?

Schritt 4: Rangfolge und Auswahl. Die Workflows, die über alle drei Filter am höchsten scoren, sind Ihre KI-Kandidaten. Nach unserer Erfahrung identifiziert ein typischer Mittelständler mit 500+ Mitarbeitenden 3–5 starke Kandidaten.

Häufige Fehler bei der Kandidatenauswahl

Den komplexesten Prozess wählen. Komplexität korreliert nicht mit KI-Wertschöpfung. Oft ist der wertvollste Kandidat ein einfacher, hochvolumiger Prozess — nicht der komplexe, den die Geschäftsführung intellektuell interessant findet.

Den menschlichen Faktor ignorieren. Ein Workflow kann bei Volumen, Musterdichte und Messbarkeit hervorragend abschneiden — aber das verantwortliche Team steht KI ablehnend gegenüber, der Prozesseigentümer hat keine Budgethoheit, oder Compliance-Anforderungen machen das Deployment unpraktikabel. Operative Bereitschaft zählt genauso wie technische Eignung.

Auswahl anhand von Vendor-Demos. KI-Anbieter demonstrieren ihre Technologie an idealen Anwendungsfällen. Ihre Prozesse sind keine idealen Anwendungsfälle. Bewerten Sie Kandidaten auf Basis Ihrer Daten, Ihrer Volumina und Ihrer Rahmenbedingungen — nicht dessen, was in einer Verkaufsdemo beeindruckend aussah.

Vom Kandidaten zum ersten Workflow

Wenn Sie Ihren Top-Kandidaten identifiziert haben, ist der nächste Schritt nicht Bauen — sondern Validieren. Können Sie tatsächlich auf die Daten zugreifen? Steht der Prozesseigentümer hinter der Initiative? Sind die Compliance-Anforderungen klar?

Genau dafür ist Discovery konzipiert: ein zweiwöchiges Engagement, das einen vielversprechenden KI-Kandidaten nimmt und validiert, ob er zum Produktiv-Workflow werden kann — technisch, operativ und organisatorisch. Dabei wird auch die Baseline für die spätere Impact-Messung erhoben (mehr dazu in Operativen KI-Impact messen).

Für eine selbstgesteuerte Bewertung Ihrer KI-Kandidaten führt unsere KI-Betriebsdiagnostik Sie in etwa 10 Minuten durch das Drei-Filter-Framework.

Wenn Sie bereits starke Kandidaten identifiziert haben und diese mit unserem Team validieren möchten, buchen Sie ein Erstgespräch. Wir geben Ihnen eine ehrliche Einschätzung, ob Ihre Kandidaten bereit für die Implementierung sind oder noch Vorarbeit brauchen.


Dieser Artikel ist Teil der Reihe KI im Betrieb. Für die vollständige operative KI-Methodik siehe Das KI-Betriebssystem von Andreas Anding.