Process Mining für KI: Wie Sie die Workflows finden, die wirklich von KI profitieren

Das teuerste KI-Projekt ist dasjenige, das den falschen Workflow adressiert. Sie investieren ein Quartal in Modellanbindung, Infrastruktur und Teamschulung — und stellen fest, dass der automatisierte Prozess 80 Fälle im Monat bearbeitet, nicht 800. Die Wirtschaftlichkeit war nie gegeben. Das Projekt wird still beerdigt, und in der nächsten Vorstandssitzung steht „KI" unausgesprochen unter Generalverdacht.

Das passiert häufiger, als irgendjemand zugibt. Die Ursache ist fast immer dieselbe: Das Unternehmen hat bei der Lösung angefangen („Wir setzen jetzt KI ein") statt bei der Frage, die zählt — welche Workflows haben überhaupt die Eigenschaften, die KI wertvoll machen? Process Mining beantwortet genau diese Frage. Es ist die Disziplin, operative Spuren — Event Logs, Transaktionsdatensätze, System-Zeitstempel — auszuwerten, um zu verstehen, wie Prozesse tatsächlich laufen statt wie das Organigramm behauptet, und wo Volumen, Wiederholbarkeit und Messbarkeit zusammenkommen.

Warum Bauchgefühl bei der Kandidatenauswahl versagt

Die meisten KI-Kandidaten werden im Besprechungsraum ausgewählt. Die Geschäftsführung schlägt den Kundenservice vor, die Leitung Finanzen die Rechnungsverarbeitung, die Produktion die Qualitätskontrolle. Jeder hat gute Gründe. Keiner hat Daten.

Das Problem mit dem Bauchgefühl: Es gravitiert zu sichtbaren Schmerzpunkten statt zu adressierbaren. Kundenservice fühlt sich schmerzhaft an, weil Beschwerden laut sind. Aber der Prozess ist womöglich niedrigvolumig, hochvariabel — jedes Ticket anders — und schlecht gemessen, ohne Baseline für Lösungszeit oder Erstlösungsquote. Das ist ein schwacher KI-Kandidat, egal wie laut er ruft. Gleichzeitig verarbeitet die Kreditorenbuchhaltung Tausende Rechnungen im Monat gegen einen festen Satz Validierungsregeln, mit einer bekannten Fehlerquote und klaren Kosten pro Fehler. Niemand im Besprechungsraum erwähnt sie, weil der Prozess nicht dringend wirkt. Genau deshalb ist er oft der bessere Kandidat. Process Mining ersetzt diesen Reflex durch Evidenz.

Der Begriff stammt aus der Forschung von Wil van der Aalst, der ihn Ende der 1990er Jahre prägte und Process Mining als „Brücke zwischen Data Science und Process Science" beschreibt. Das technische Fundament ist erfreulich nüchtern: Drei Felder genügen pro Ereignis — eine Case ID (welcher Vorgang?), eine Activity (welcher Schritt?) und ein Timestamp (wann?). Diese drei Spalten liegen in nahezu jedem ERP-, CRM- oder Ticketsystem bereits vor. Sie brauchen für die Kandidatensuche keine sechsstellige Plattformlizenz; Sie brauchen Zugriff auf diese Spalten und die Disziplin, sie ehrlich zu lesen.

Drei Filter, die ein Workflow alle passieren muss

Wir bewerten KI-Kandidaten durch drei Filter. Ein Workflow muss alle drei bestehen — nicht zwei von drei.

Filter 1: Volumenschwelle. Der Prozess muss genug Transaktionen verarbeiten, um Aufbau-, Deployment- und Wartungskosten zu tragen. Als praktische Faustregel für den DACH-Mittelstand setzen wir rund 500 Transaktionen pro Monat an oder das Äquivalent von mindestens einer Vollzeitkraft, die fest an dem Prozess hängt. Unterhalb dieser Schwelle geht die Rechnung selten auf: Ein Modell, das zehn Minuten pro Fall spart, aber nur 50 Fälle im Monat berührt, spart gut acht Stunden — wenige hundert Euro Personalkosten im Monat. Das trägt keinen produktiven KI-Workflow inklusive Wartung, Monitoring und gelegentlichem Nachtraining. Lesen Sie das Volumen aber nicht nur als Ist-Stand. Ein Prozess mit 300 Fällen, der pro Quartal zweistellig wächst, überschreitet die Schwelle absehbar — und eine Infrastruktur, die dann schon steht, ist ein Vorsprung statt eine Baustelle.

Filter 2: Musterdichte. KI lernt aus Wiederholung. Ein Workflow, in dem die deutliche Mehrheit der Fälle erkennbaren, wiederkehrenden Mustern folgt, ist ein starker Kandidat; einer, in dem jeder Fall neuartig ist, ein schwacher. Das lässt sich ohne jeden Modellbau abschätzen: Ziehen Sie eine Stichprobe von 100 echten Fällen und klassifizieren Sie sie von Hand. In wie viele Typen zerfallen sie? Welcher Anteil entfällt auf die fünf häufigsten? Konzentriert sich die große Mehrheit auf eine Handvoll Typen, ist die Musterdichte hoch. Die Schadentriage in der Versicherung zeigt das Muster idealtypisch — Leitungswasser, Sturm, Einbruch und Kfz-Schäden machen den Löwenanteil aus, und jeder Typ folgt einem vorhersehbaren Bewertungspfad. Strategische Beratungsanfragen sind das Gegenteil: Jedes Engagement ist ein Unikat.

Filter 3: Messbarkeit. Sie brauchen drei Dinge: eine klare Definition des korrekten Outputs, eine verlässliche Baseline der heutigen Leistung und eine Methode, nach dem Go-live weiterzumessen. Ohne Output-Definition gibt es weder Training noch Evaluation. Ohne Baseline lässt sich keine Verbesserung beziffern. Ohne laufende Messung bleibt Drift unsichtbar, bis sie teuer wird. Die häufigste Lücke, die uns begegnet: Unternehmen kennen ihren Durchsatz — Fälle pro Woche —, aber nicht ihre Genauigkeit — Anteil beim ersten Anlauf korrekt. Das ist die gefährlichste Lücke überhaupt, denn ein System, das Fälle schneller, aber fehlerhafter abarbeitet, erzeugt mehr Nacharbeit, nicht weniger. Schneller falsch ist teurer als langsam richtig.

Der Filter, der heute über Filter eins entscheidet: Regulierung

Hier liegt die unbequeme Pointe, und sie ist neu. Genau die Workflows, die unsere drei Filter am besten bestehen — hohes Volumen, klare Muster, harte Entscheidungen — sind oft jene, die der EU AI Act als Hochrisiko einstuft. Die Verordnung benennt in Anhang III ausdrücklich KI zur Sichtung und Bewertung von Bewerbungen und zur Leistungsbeurteilung von Beschäftigten, zur Bewertung der Kreditwürdigkeit sowie zur Risikobewertung und Preisbildung in der Lebens- und Krankenversicherung. Das sind keine Randfälle — das sind die Vorzeige-Kandidaten aus HR, Finanzen und Versicherung, die in jedem Workshop zuerst auf dem Whiteboard stehen.

Für diese Hochrisiko-Systeme greifen ab dem 2. August 2026 verbindliche Pflichten: ein Risikomanagement über den Lebenszyklus, Data Governance für repräsentative Trainings- und Testdaten, in die Architektur eingebaute menschliche Aufsicht und nachweisbare Genauigkeit und Robustheit. Verstöße gegen die Kernpflichten der Verordnung sind mit Geldbußen von bis zu 15 Millionen Euro oder 3 % des weltweiten Jahresumsatzes bedroht — je nachdem, welcher Betrag höher ist. Das verschiebt die Kandidatenrechnung: Ein Workflow kann bei Volumen, Mustern und Messbarkeit glänzen und trotzdem der teuerste Erststart sein, wenn er Sie unvorbereitet in die Hochrisiko-Konformität zwingt. Für viele Mittelständler ist der klügste erste Produktiv-Workflow deshalb einer, der außerhalb von Anhang III liegt — interne Dokumentenklassifikation, Lieferantenstammdaten, Triage im technischen Support — wo Sie Kompetenz aufbauen, ohne im ersten Quartal CE-Kennzeichnung und Konformitätsbewertung stemmen zu müssen.

Praktisches Vorgehen: vier Schritte bis zur Shortlist

Sie brauchen keine Process-Mining-Plattform, um anzufangen. Sie brauchen strukturierte Datenanalyse und einen Nachmittag Ehrlichkeit.

Erstens, hochvolumige Workflows kartieren. Listen Sie jeden wiederkehrenden Prozess auf, der mehr als eine Person oder ein System berührt. Schätzen Sie je Prozess das monatliche Transaktionsvolumen und den FTE-Einsatz. Wo Event Logs mit Case ID, Activity und Timestamp vorliegen, ersetzen Sie die Schätzung durch die echte Zahl — und überraschen sich regelmäßig, wie weit Annahme und Realität auseinanderliegen. Zweitens, Musterdichte bewerten. Für die Top-10 nach Volumen ziehen Sie je 50 bis 100 Fälle, klassifizieren von Hand und berechnen die Konzentration auf die fünf häufigsten Typen. Drittens, Messbarkeit prüfen. Für die Workflows, die Filter eins und zwei bestehen: Können Sie definieren, wie korrekt aussieht? Kennen Sie Fehlerquote, Durchlaufzeit und Kosten pro Vorgang heute? Lässt sich das nach dem Go-live weitermessen? Viertens, Regulierung und Rangfolge. Markieren Sie, welche Kandidaten unter Anhang III fallen, und gewichten Sie den Konformitätsaufwand mit ein. Die Workflows, die über alle Filter am höchsten scoren und Sie nicht in unnötige Hochrisiko-Pflichten zwingen, sind Ihre Shortlist. Nach unserer Erfahrung bleiben bei einem typischen Mittelständler drei bis fünf belastbare Kandidaten übrig — nicht zwanzig.

Die Fehler, die diese Auswahl teuer machen

Den komplexesten Prozess wählen. Komplexität korreliert nicht mit Wertschöpfung. Der wertvollste Kandidat ist häufig der schlichte, hochvolumige Prozess — nicht der, den die Geschäftsführung intellektuell spannend findet. Den menschlichen Faktor ignorieren. Ein Workflow kann bei Volumen, Mustern und Messbarkeit brillieren — aber wenn das verantwortliche Team KI ablehnt, der Prozesseigentümer keine Budgethoheit hat oder die menschliche Aufsicht nach AI Act nicht sauber abbildbar ist, scheitert das Projekt nicht an der Technik, sondern an der Organisation. Operative Bereitschaft zählt so viel wie technische Eignung. Anhand von Vendor-Demos entscheiden. Anbieter zeigen ihre Technik am Idealfall. Ihre Prozesse sind keine Idealfälle. Bewerten Sie Kandidaten an Ihren Daten, Ihren Volumina und Ihren regulatorischen Rahmenbedingungen — nicht an dem, was in einer Verkaufsdemo beeindruckte.

Vom Kandidaten zum ersten produktiven Workflow

Wenn die Shortlist steht, ist der nächste Schritt nicht Bauen, sondern Validieren. Kommen Sie tatsächlich an die Daten? Trägt der Prozesseigentümer die Initiative? Fällt der Workflow unter Anhang III — und falls ja, ist der Konformitätspfad realistisch? Genau dafür ist Discovery gemacht: ein zweiwöchiges Engagement, das einen vielversprechenden Kandidaten technisch, operativ und regulatorisch durchleuchtet und dabei zugleich die Baseline für die spätere Wirkungsmessung erhebt — mehr dazu in Operativen KI-Impact messen.

Eine KI-Betriebsdiagnostik führt Sie in rund zehn Minuten durch genau dieses Drei-Filter-Framework — bevor Sie ein Quartal in den falschen Workflow investieren.

Jetzt KI-Kandidaten bewerten →

References: Wil van der Aalst, „Process Mining: Data Science in Action", Springer, 2016, https://link.springer.com/book/10.1007/978-3-662-49851-4; European Union, „Regulation (EU) 2024/1689 (AI Act)", Annex III & high-level summary, 2024, https://artificialintelligenceact.eu/high-level-summary/; European Commission, „AI Act — Regulatory framework", https://digital-strategy.ec.europa.eu/en/policies/regulatory-framework-ai.

Process Mining für KI: Wie Sie die Workflows finden, die wirklich von KI profitieren

Warum Bauchgefühl bei der Kandidatenauswahl versagt

Drei Filter, die ein Workflow alle passieren muss

Der Filter, der heute über Filter eins entscheidet: Regulierung

Praktisches Vorgehen: vier Schritte bis zur Shortlist

Die Fehler, die diese Auswahl teuer machen

Vom Kandidaten zum ersten produktiven Workflow

Related articles

KI im Betrieb: Vom Process Mining zum produktiven Workflow

Automatisierung vs. Augmentierung: Wann KI Aufgaben ersetzen und wann sie Menschen unterstützen sollte

Operativen KI-Impact messen: Jenseits von Accuracy zu Business Outcomes

Check your AI operating maturity