Jeder KI-Workflow trifft Entscheidungen. Das ist der Sinn der Sache. Die Frage ist nicht, ob KI entscheiden soll — sondern welche Entscheidungen, unter welchen Bedingungen, mit welcher Autorität und mit welchem Fallback, wenn sie falsch liegt.
Die meisten Unternehmen machen es in eine von zwei Richtungen falsch. Sie über-automatisieren — lassen KI Entscheidungen treffen, die menschliches Urteilsvermögen erfordern, schaffen Compliance-Risiken und erodieren Vertrauen. Oder sie unter-delegieren — fordern menschliche Freigabe für jeden Output, was den größten Teil der operativen Hebelwirkung eliminiert, die die Investition rechtfertigte.
Entscheidungsarchitektur ist die dritte Komponente des KI-Betriebssystems. Sie sitzt zwischen dem Kontext-Layer (der definiert, was die KI weiß) und dem Workflow-Design (das definiert, was die KI tut). Ihre Aufgabe: festlegen, wer was entscheidet.
Das Entscheidungsspektrum
Entscheidungen in einem KI-Workflow existieren auf einem Spektrum. Der Fehler ist, sie als binär zu behandeln — entweder der Mensch entscheidet oder die KI entscheidet. In der Praxis gibt es fünf unterschiedliche Konfigurationen:
Vollautomatisiert. Die KI entscheidet und handelt ohne menschliche Beteiligung. Der Output wird geliefert, die Aktion ausgeführt, der Vorgang protokolliert. Menschen überwachen aggregierte Performance-Metriken, nicht einzelne Entscheidungen. Beispiel: Eingehende Support-E-Mails nach Kategorie klassifizieren und in die richtige Queue routen.
KI handelt, Mensch wird benachrichtigt. Die KI entscheidet und handelt, aber ein Mensch erhält eine Benachrichtigung über jede Entscheidung. Der Mensch kann retroaktiv eingreifen, wenn etwas falsch ist, muss aber nicht jede Entscheidung vorab freigeben. Beispiel: Spesenabrechnungen unter 500 € auto-genehmigen mit Benachrichtigung an das Finanzteam.
KI empfiehlt, Mensch entscheidet. Die KI analysiert die Inputs und präsentiert eine Empfehlung mit unterstützender Evidenz. Der Mensch trifft die finale Entscheidung. Beispiel: Schadentriage, bei der die KI Genehmigung oder weitere Prüfung empfiehlt und der Schadenbearbeiter den Beschluss fasst.
KI bereitet vor, Mensch entscheidet. Die KI strukturiert und fasst Informationen zusammen, gibt aber keine Empfehlung ab. Der Mensch erhält ein organisiertes Briefing statt Rohdaten. Beispiel: Due-Diligence-Zusammenfassungen für M&A-Transaktionen, bei denen die KI Daten kompiliert und strukturiert, aber das Investmentkomitee die Beurteilung vornimmt.
Nur Mensch. Die KI ist an der Entscheidung nicht beteiligt. Manche Entscheidungen sollten vollständig menschlich bleiben — nicht weil die KI die Inputs nicht verarbeiten kann, sondern weil die Konsequenzen eines Fehlers, die Notwendigkeit von Empathie oder regulatorische Anforderungen menschliches Urteilsvermögen unverhandelbar machen. Beispiel: Kündigungsentscheidungen.
Entscheidungen dem richtigen Level zuordnen
Die richtige Position auf dem Spektrum wird durch drei Faktoren bestimmt: Konsequenzschwere, Entscheidungsstruktur und regulatorische Anforderungen.
Konsequenzschwere
Was passiert, wenn die Entscheidung falsch ist? Wenn eine falsch klassifizierte E-Mail in die falsche Support-Queue geht, ist die Konsequenz eine geringe Verzögerung. Wenn ein betrügerischer Versicherungsschaden auto-genehmigt wird, ist die Konsequenz finanzieller Verlust und potenzielles regulatorisches Exposure.
Entscheidungen mit niedrigen Konsequenzen können Richtung Vollautomatisierung geschoben werden. Entscheidungen mit hohen Konsequenzen brauchen menschliche Beteiligung — aber das bedeutet nicht „nur Mensch". Oft bedeutet es: KI empfiehlt, Mensch entscheidet.
Entscheidungsstruktur
Wie regelbasiert ist die Entscheidung? Wenn die Entscheidung vollständig als Entscheidungsbaum ausgedrückt werden kann — wenn Bedingung A und Bedingung B und nicht Bedingung C, dann genehmigen — ist sie ein Kandidat für Vollautomatisierung, unabhängig von der Konsequenzschwere, weil die Entscheidungslogik erschöpfend validiert werden kann.
Wenn die Entscheidung das Abwägen mehrdeutiger Evidenz erfordert, Kontext berücksichtigen muss, der schwer zu formalisieren ist, oder Urteilsvermögen verlangt, das erfahrene Fachleute über Jahre entwickeln — braucht sie menschliche Beteiligung. Die KI kann dennoch Wert schaffen, indem sie die Evidenz strukturiert und relevante Faktoren hervorhebt, aber die Beurteilung bleibt menschlich.
Regulatorische Anforderungen
Der EU AI Act und sektorspezifische Regulierungen stellen explizite Anforderungen an bestimmte Entscheidungskategorien. Hochrisiko-KI-Systeme — einschließlich solcher in der Versicherungs-Underwriting, Kreditbewertung und bei Beschäftigungsentscheidungen — erfordern menschliche Aufsicht per Gesetz. Das ist keine Design-Entscheidung. Es ist eine Compliance-Anforderung.
Für DACH-Unternehmen bedeutet das: Bestimmte Entscheidungen müssen „KI empfiehlt, Mensch entscheidet" sein, unabhängig davon, was die technische Fähigkeit erlauben würde. Das von Tag eins in die Architektur einbauen, nicht als nachträglichen Compliance-Fix.
Das Confidence-Threshold-Modell
Eines der effektivsten Muster, das wir einsetzen, ist das Confidence-Threshold-Modell. Statt jede Instanz eines Entscheidungstyps derselben Position auf dem Spektrum zuzuordnen, routet das System einzelne Entscheidungen basierend auf der Konfidenz der KI in ihren Output.
So funktioniert es für einen Versicherungs-Claims-Triage-Workflow:
Über 95 % Konfidenz, unter 2.000 € Schadenwert: Vollautomatisiert. Die KI klassifiziert den Schaden, bestimmt den zuständigen Bearbeiter und routet. Der Schadenbearbeiter sieht einen vorklassifizierten, vorgerouteten Schaden.
Zwischen 80 % und 95 % Konfidenz, oder 2.000–10.000 € Schadenwert: KI empfiehlt, Mensch entscheidet. Die KI präsentiert ihre Klassifikation mit Konfidenzwert und der genutzten Evidenz. Der Schadenbearbeiter prüft und bestätigt oder überschreibt.
Unter 80 % Konfidenz, oder über 10.000 € Schadenwert: KI bereitet vor, Mensch entscheidet. Die KI strukturiert die verfügbaren Informationen, gibt aber keine Empfehlung ab. Der Schadenbearbeiter prüft den vollständigen Fall.
Betrugsindikatoren vorhanden: Nur Mensch, markiert für Spezialistenprüfung. Die KI markiert die Indikatoren, nimmt aber keine Klassifikationshandlung vor.
Dieses Modell erreicht zwei Dinge gleichzeitig. Es erfasst die Effizienzgewinne der Automatisierung für unkomplizierte Fälle — die die Mehrheit darstellen. Und es bewahrt menschliches Urteilsvermögen für Fälle, die es brauchen — ohne Menschen mit der Prüfung jeder Routineentscheidung zu belasten.
Die Schwellenwerte werden nicht einmal gesetzt und vergessen. Sie werden während des Deployments kalibriert und auf Basis von Ergebnisdaten verfeinert. Wenn die auto-genehmigten Schäden unter 2.000 € nach 90 Tagen eine akzeptable Fehlerquote zeigen, könnte der Schwellenwert auf 3.000 € angehoben werden. Wenn das 80–95 %-Konfidenzband zu viele Überschreibungen zeigt, könnte der untere Schwellenwert auf 85 % angehoben werden. Diese Kalibrierung ist Teil des Review-Zyklus.
Entscheidungsarchitektur in der Praxis: DACH-Beispiele
Versicherung: Schadenbearbeitung
Eine deutsche Versicherungsgruppe verarbeitet 4.000 Sachschäden pro Monat. Vor Implementierung der Entscheidungsarchitektur wurde jeder Schaden von einem menschlichen Bearbeiter geprüft — egal ob 200-Euro-Glasbruch oder 50.000-Euro-Wasserschaden.
Die Entscheidungsarchitektur:
- Schäden unter 1.000 € mit klarer Schadenkategorie, hoher Konfidenz bei Standardreparaturkosten und ohne Betrugsindikatoren: auto-genehmigt und zur Zahlungsabwicklung geroutet. Mensch benachrichtigt.
- Schäden 1.000–10.000 € mit Standardschadenmustern: KI empfiehlt Genehmigungsbetrag, Bearbeiter prüft. Genehmigungsrate der KI-Empfehlungen: 89 %.
- Schäden über 10.000 € oder mit ungewöhnlichen Mustern: KI bereitet eine strukturierte Fallzusammenfassung vor. Bearbeiter entscheidet von Grund auf mit angereicherten Informationen.
- Jeder Schaden mit Betrugsindikatoren: markiert für Spezialistenprüfung. Keine KI-Empfehlung.
Ergebnis: 45 % der Schäden werden auto-verarbeitet. Die durchschnittliche Bearbeitungszeit für die verbleibenden 55 % sank um 35 %, weil Bearbeiter vorstrukturierte Informationen erhalten. Die Gesamt-Schadenkapazität stieg um 40 % ohne zusätzliche Headcount.
Industrie: Auftragseingangsbearbeitung
Ein Fertigungsunternehmen in Baden-Württemberg empfängt 200 Bestellungen pro Tag über E-Mail, Fax (ja, Fax) und das Webportal. Die Auftragsbearbeitung umfasst Klassifizierung, Bestandsprüfung, Lieferterminbestätigung und Weiterleitung an die Produktionsplanung.
Die Entscheidungsarchitektur:
- Standardkatalogartikel, Bestand verfügbar, Standardlieferbedingungen: auto-bestätigt. Kunde erhält Bestätigung innerhalb von 2 Stunden statt 48.
- Standardartikel, aber Bestand unter Schwellenwert oder Lieferterminkonflikt: KI empfiehlt Alternativen (Ersatzprodukt, angepasster Liefertermin). Vertrieb bestätigt oder modifiziert.
- Sonderspezifikationen, Volumen über Schwellenwert oder Neukunde: KI bereitet Auftragszusammenfassung mit Kundenhistorie und Margenberechnung vor. Key Account Manager entscheidet.
Ergebnis: 60 % der Aufträge werden auto-bestätigt. Das Vertriebsteam konzentriert sich auf die hochwertigen 40 %, die tatsächlich ihre Expertise erfordern. Die Auftrags-zu-Bestätigung-Zeit sank von durchschnittlich 2 Tagen auf 4 Stunden über alle Aufträge.
Handel: Preisentscheidungen
Ein E-Commerce-Händler mit 15.000 SKUs passt Preise basierend auf Wettbewerbsdaten, Lagerbeständen und Margenzielen an.
Die Entscheidungsarchitektur:
- Commodity-Produkte mit klaren Wettbewerbs-Benchmarks und stabilen Margen: automatisierte Preisanpassung innerhalb definierter Korridore (nie unter Floor, nie über Ceiling). Category Manager prüft wöchentliche Aggregate.
- Saisonprodukte oder Produkte mit volatiler Nachfrage: KI empfiehlt Preisanpassungen mit unterstützenden Daten. Category Manager genehmigt oder modifiziert täglich.
- Strategische Produkte (markenprägend, Loss Leader, Neueinführungen): rein menschliche Preisentscheidungen mit KI-gestützter Wettbewerbsintelligenz.
Häufige Fehler
Fehler 1: Einheitliche Entscheidungsautorität
Dasselbe Level an menschlicher Aufsicht auf jede Entscheidung in einem Workflow anwenden. Wenn ein Mensch jede klassifizierte E-Mail prüfen muss, haben Sie die Zeitersparnis eliminiert. Wenn kein Mensch irgendeine Schadenentscheidung prüft, haben Sie ein Risiko akzeptiert, das Regulierer nicht tolerieren werden.
Die Lösung ist granulare Autoritätszuweisung. Verschiedene Entscheidungen innerhalb desselben Workflows können und sollten an verschiedenen Positionen auf dem Spektrum sitzen.
Fehler 2: Statische Schwellenwerte
Konfidenz-Schwellenwerte und Autoritätslevel beim Deployment setzen und nie wieder anschauen. Die richtigen Schwellenwerte sind empirisch — sie hängen von tatsächlichen Fehlerquoten, tatsächlichen Konsequenzmustern und tatsächlicher Teamkapazität ab. Sie sollten quartalsweise auf Basis von Ergebnisdaten kalibriert werden.
Fehler 3: Transparenz mit Autorität verwechseln
Manche Organisationen reagieren auf Bedenken bezüglich KI-Entscheidungen, indem sie die Argumentation der KI für Menschen sichtbar machen — ohne zu ändern, wer die Entscheidung trifft. Transparenz ist wichtig, aber nicht dasselbe wie menschliche Autorität. Wenn vom Menschen erwartet wird, die KI-Argumentation zu prüfen und jede Entscheidung freizugeben, ist das „KI empfiehlt, Mensch entscheidet." Wenn der Mensch die Argumentation sieht, aber nicht eingreifen soll, ist das „KI handelt, Mensch wird benachrichtigt." Das sind verschiedene Konfigurationen mit verschiedenen Ressourcenimplikationen.
Fehler 4: Die Kosten menschlicher Prüfung ignorieren
Jeder menschliche Prüfschritt hat Zeitkosten. Wenn ein KI-Workflow 500 Items pro Tag verarbeitet und jede menschliche Prüfung 3 Minuten dauert, sind das 25 Personenstunden pro Tag an Prüfaufwand. Bevor Sie menschliche Prüfung vorschreiben, berechnen Sie die Kosten und vergleichen Sie sie mit dem Risiko der Alternative. Manchmal übersteigen die Kosten der Prüfung jeder Entscheidung die erwarteten Kosten der Fehler, die die Prüfung verhindern würde.
Entscheidungsarchitektur und der EU AI Act
Der EU AI Act schreibt menschliche Aufsicht für Hochrisiko-KI-Systeme vor. Das ist für DACH-Unternehmen nicht optional. Aber der Act schreibt keine spezifische Implementierung vor. Er fordert, dass Menschen die Outputs der KI verstehen, sich entscheiden können, das System nicht zu nutzen, in Echtzeit eingreifen oder das System stoppen können und den Output der KI überschreiben können.
Das Confidence-Threshold-Modell erfüllt diese Anforderungen bei korrekter Implementierung. Der Mensch kann die Klassifikation und den Konfidenzwert der KI sehen (Verständnis). Der Mensch kann jede einzelne Entscheidung überschreiben (Intervention). Das System kann jederzeit gestoppt oder umgangen werden (Stoppen). Und die Schwellenwerte können angepasst werden, um mehr Entscheidungen in die menschliche Prüfung zu verschieben (Überschreibung).
Der Schlüssel ist, diese Fähigkeiten von Anfang an in die Architektur einzubauen, nicht als nachträgliche Compliance-Schicht. Entscheidungsarchitektur, die mit regulatorischen Anforderungen im Blick entworfen wird, ist sowohl konformer als auch effizienter als Architektur, die Compliance als Nachgedanken behandelt.
Ihre Entscheidungsarchitektur aufbauen
Beginnen Sie mit einem einzelnen Workflow. Listen Sie jeden Entscheidungspunkt in diesem Workflow auf. Bewerten Sie für jeden Entscheidungspunkt Konsequenzschwere, Entscheidungsstruktur und regulatorische Anforderungen. Weisen Sie eine initiale Position auf dem Spektrum zu. Definieren Sie die Konfidenz-Schwellenwerte, falls zutreffend. Dokumentieren Sie den Eskalationspfad für Fälle, die außerhalb der definierten Parameter fallen.
Dann deployen, messen und kalibrieren. Die initiale Architektur ist eine Hypothese. Die Produktionsarchitektur ist das, was nach 90 Tagen Ergebnisdaten entsteht.
Das vollständige Framework zum Design der Entscheidungsarchitektur, inklusive Konsequenz-Struktur-Matrix und Schwellenwert-Kalibrierungsmethodik, finden Sie in Kapitel 05 von The AI Operating System. Zur verwandten Frage, wann automatisiert vs. augmentiert werden soll, siehe Automatisierung vs. Augmentierung.
Für ein Gespräch über die Gestaltung der Entscheidungsarchitektur für Ihre KI-Workflows vereinbaren Sie ein Erstgespräch.