Die erste Frage, die die meisten Geschäftsführer bei Enterprise-KI stellen: „Sollten wir eigene Modelle bauen?" Es ist die falsche Frage. Die richtige lautet: „Wo liegt unser Wettbewerbsvorteil tatsächlich — im Modell oder im Workflow?"

Für die große Mehrheit der DACH-Mittelständler ist die Antwort eindeutig. Das Modell ist ein Standardprodukt. Die Workflow-Integration ist das Asset. Und trotzdem verbringen erstaunlich viele Organisationen sechs bis zwölf Monate und erhebliche Budgets mit dem Bau eigener Modelle, obwohl sie in acht Wochen mit einem kommerziellen Modell und maßgeschneiderter Integration in Produktion sein könnten.

Das Build-vs-Buy-Framing ist überholt

Die klassische Build-vs-Buy-Entscheidung geht davon aus, dass man zwischen zwei vergleichbaren Wegen zum selben Ergebnis wählt. Eigenentwicklung dauert länger und kostet mehr, dafür besitzt man das Ergebnis. Zukauf ist schneller und günstiger, dafür besteht Abhängigkeit. Für Enterprise-KI in 2026 verfehlt dieses Framing den Punkt vollständig.

„Bauen" ist nicht eine Sache — es sind drei strukturell verschiedene Entscheidungen. Erstens: das Modell selbst, also die KI, die Klassifikation, Generierung, Extraktion oder Prognose durchführt. Zweitens: die Integration, also wie das Modell mit Ihren Daten, Prozessen und Systemen verbunden wird. Drittens: das Betriebsmodell, also wie Menschen und KI im veränderten Workflow tatsächlich zusammenarbeiten. Die meisten Unternehmen, die „bauen", bauen alle drei von Grund auf. Die meisten Unternehmen, die erfolgreich in Produktion gehen, haben die erste Komponente gekauft und die zweite und dritte gebaut.

Gartner prognostiziert, dass bis 2026 bereits 40 % der Enterprise-Applikationen aufgabenspezifische KI-Agenten enthalten werden — ausgehend von unter 5 % noch 2025. Dieser Wandel vollzieht sich nicht über proprietäre Grundlagenmodelle, sondern über Integration. Die Unternehmen, die vorankommen, lösen kein Modellproblem. Sie lösen ein Workflow-Problem.

Warum Custom-Modellentwicklung für den Mittelstand selten sinnvoll ist

Custom-Modellentwicklung — das Fine-Tuning von Foundation Models auf proprietären Daten oder das Training von Modellen von Grund auf — hat einen spezifischen und engen Anwendungsbereich, in dem sie gerechtfertigt ist. Sie verfügen über einen genuinen proprietären Datensatz, der nachweislich Wettbewerbsvorteil schafft. Kommerzielle Modelle erreichen die nötige Genauigkeit für Ihre Domäne nicht. Oder regulatorische Anforderungen erzwingen, dass Modelle on-premise trainiert und gehostet werden. Für die meisten DACH-Mittelständler trifft keine dieser Bedingungen zu — zumindest nicht bei ihrer ersten oder zweiten KI-Initiative.

Die Kostenstruktur ist ernüchternd. Für ein Custom-Modell mittlerer Komplexität liegen allein die Cloud-Infrastrukturkosten bei umgerechnet etwa 3.800–12.000 Euro pro Monat für Training-Instanzen, zuzüglich laufender Inference-Kosten. Dazu kommen Datenlabeling-Aufwände: ein Trainingsdatensatz von 100.000 gelabelten Beispielen kostet bei einem moderaten Stundensatz leicht 40.000–50.000 Euro — und das ist der Anfang, nicht das Ende. Rund 55 % aller ML-Modelle in Produktion müssen innerhalb von 90 Tagen nachtrainiert werden, weil sich die Realwelt-Datenverteilung verschiebt. Das ist eine Verpflichtung auf Jahre, keine einmalige Investition.

Ein kommerzielles Sprachmodell mit gut entworfenen Prompts und sauberer Integration dagegen bringt ein Unternehmen in sechs bis zehn Wochen in Produktion. Die laufenden Kosten skalieren mit der Nutzung, nicht mit der Teamgröße. Und die Inference-Kosten für kommerzielle Frontier-Modelle sinken strukturell: Gartner prognostiziert, dass die Kosten für LLM-Inference bis 2030 um über 90 % fallen werden — ein weiteres Argument dafür, die Fixkosten eigener Modellinfrastruktur zu vermeiden, solange kein zwingender Grund vorliegt.

Die Kostendifferenz ist erheblich, aber die Zeitdifferenz ist entscheidend. In der Zeit, die der Bau eines Custom-Modells beansprucht, kann ein Unternehmen mit kommerziellen Modellen drei bis vier produktive Workflows ausrollen, aus realem Einsatz lernen und die operative Fähigkeit für Level-2-Integration aufbauen.

Wo der echte Wert liegt

Der Wert bei Enterprise-KI liegt fast nie im Modell. Er liegt an drei anderen Stellen — und keine davon hat ein Anbieter für Sie gelöst.

Workflow-Design ist die entscheidende Variable. Welcher Prozess bekommt KI? Wie ist er abgegrenzt? Was ist ein guter Output, und wer bestimmt das? Diese Entscheidungen determinieren den Großteil des ROI. Stimmt der Workflow nicht, rettet kein Modell — weder custom noch kommerziell — die Initiative. Das ist nicht Technologie, das ist Organisationsdesign.

Datenintegration ist das eigentliche Engineering-Problem. Die richtigen Daten zum Modell zu bringen und den Output des Modells zurück in Ihre Systeme zu führen, ist spezifisch für Ihre Organisation: Ihr ERP, Ihr Dokumentenmanagement, Ihre Freigabe-Workflows, Ihre Datenqualität. Kein Anbieter kennt diese Landschaft. Hier bauen Sie — und hier entscheidet sich, ob der Workflow im Alltag hält, was er im Piloten versprochen hat.

Das Betriebsmodell ist am häufigsten unterschätzt. Wie arbeitet das Team mit KI-Output? Was wird automatisch freigegeben? Was bekommt eine menschliche Prüfung? Wie werden Grenzfälle und Ausnahmen behandelt? Wie lernt die Organisation aus Fehlern des Systems? Das sind Governance-Fragen, keine Technologiefragen — und sie bestimmen, ob das Deployment nach sechs Monaten noch genutzt wird oder still in der Schublade verschwindet.

Custom-Modelltraining adressiert nichts davon. Es ist eine Technologieinvestition, die ein Problem löst, das die meisten Mittelständler nicht haben.

Die Compliance-Dimension: EU AI Act schafft neue Abhängigkeiten

Ein Argument, das für Custom-Modelle und On-Premise-Hosting immer wieder angeführt wird, ist Compliance — insbesondere im Kontext des EU AI Act. Das ist teilweise berechtigt, wird aber regelmäßig überdehnt.

Ab dem 2. August 2026 greifen die vollen Pflichten für Hochrisiko-KI-Systeme unter dem EU AI Act (Artikel 9–17 für Anbieter, Artikel 26 für Deployer). Hochrisiko-Systeme umfassen laut Annex III unter anderem KI in der Personalentscheidung, Kreditbewertung und im Bereich kritischer Infrastruktur — Bereiche, die durchaus DACH-Mittelständler berühren können. Deployer von Hochrisiko-Systemen müssen menschliche Überwachung sicherstellen, automatisierte Logs mindestens sechs Monate aufbewahren und bei Bedarf Fundamental Rights Impact Assessments durchführen. Verstöße werden mit bis zu 15 Millionen Euro oder 3 % des globalen Jahresumsatzes geahndet.

Der entscheidende Punkt: Diese Anforderungen betreffen überwiegend Governance und Dokumentation, nicht die Frage, ob das Modell selbst on-premise trainiert werden muss. Viele Compliance-Argumente für Custom-Modelle verwechseln Datenresidenz — also wo Inferenz-Daten verarbeitet werden — mit Modelltraining. Für die meisten Use Cases im Mittelstand lässt sich Datenresidenz mit kommerziellen Modellen lösen: Anbieter wie Microsoft Azure OpenAI, Google Vertex oder AWS Bedrock bieten EU-Regionen, Datenschutzverträge und DSGVO-konforme Verarbeitungsvereinbarungen. Das ist keine Custom-Modell-Frage, sondern eine Vendor-Auswahl-Frage. Mehr dazu unter KI-Vendor-Auswahl.

Die Integrationsschicht ist Ihr Burggraben

Wenn das Modell ein Standardprodukt ist — und für die meisten Use Cases ist es das —, dann kommt Ihr Wettbewerbsvorteil daher, wie gut Sie es in Ihre spezifischen Workflows integrieren: mit Ihren spezifischen Daten, unter Ihren spezifischen Compliance-Anforderungen, eingebettet in Ihre spezifischen Freigabe- und Kontrollmechanismen.

Diese Integrationsschicht ist inhärent individuell. Keine zwei Organisationen haben dieselbe ERP-Konfiguration, dieselben Prozesse oder dieselben regulatorischen Randbedingungen. Wer diese Schicht gut baut, hat einen Vorsprung, den ein Wettbewerber nicht durch den Kauf desselben Grundlagenmodells einholen kann — weil das Modell für beide identisch verfügbar ist. Der Vorsprung liegt in der Tiefe der Integration, der Qualität des Betriebsmodells und der organisatorischen Fähigkeit, beides weiterzuentwickeln.

Wann Custom-Modelle dennoch sinnvoll sind

Es gibt legitime Szenarien für Custom-Modellentwicklung. Ein Medizintechnikhersteller, der spezifische Defekttypen aus industriellen Aufnahmen klassifiziert, braucht möglicherweise ein Custom-Vision-Modell, das auf proprietären Produktionsdaten trainiert wurde — nicht weil kommerzielle Modelle generell schlechter sind, sondern weil die Domäne eng genug ist, dass proprietäre Daten tatsächlich Wettbewerbsvorteil schaffen. Bei performancekritischen Anwendungen, bei denen der Unterschied zwischen 94 % und 98 % Genauigkeit erheblichen finanziellen Impact hat — etwa bei bestimmten Formen der Anomalieerkennung in der Fertigung —, kann der Aufwand gerechtfertigt sein. Und wenn regulatorische Vorgaben im konkreten Einzelfall nachweislich On-Premise-Training erfordern, ist das ein valider Grund.

Selbst in diesen Szenarien gilt: Starten Sie mit einem kommerziellen Modell, beweisen Sie, dass der Workflow grundsätzlich funktioniert, und investieren Sie dann in Custom-Entwicklung, wenn der bewiesene Workflow es verlangt. Erst Wert beweisen, dann optimieren. Die Reihenfolge ist nicht akademisch — sie verhindert, dass sechs Monate Modelltraining in ein Deployment fließen, das am Betriebsmodell scheitert.

Ein Entscheidungsrahmen

Für jede KI-Initiative lohnen vier Fragen in dieser Reihenfolge. Erstens: Kann ein kommerzielles Modell ausreichende Genauigkeit für diesen Workflow erreichen? Testen Sie es. Die meisten Organisationen nehmen an, dass sie Custom-Modelle brauchen, ohne kommerzielle Alternativen ernsthaft zu evaluieren. Zweitens: Was kostet die Zeitdifferenz? Wenn ein Custom-Modell neun Monate und ein kommerzielles neun Wochen bis zur Produktion braucht — was kosten sieben Monate verzögerter operativer Hebel? Das ist eine Zahl, die sich rechnen lässt. Drittens: Wo ist Ihre Engineering-Kapazität besser eingesetzt? Jede Stunde, die in Modelltraining fließt, fehlt bei Workflow-Integration, Datenpipelines und Betriebsmodell-Design. Viertens: Wie hoch sind die Wechselkosten, wenn Sie kommerziell starten? Fast immer niedrig. Gut entworfene Integrationen abstrahieren das Modell hinter einer Schnittstelle. Der Wechsel von einem kommerziellen Modell zu einem anderen — oder von kommerziell zu custom — ist eine Angelegenheit von Wochen, kein monatelanger Umbau.

Der Mittelstands-Vorteil

Die typischen Mittelstands-Constraints — begrenzte KI-Talente, pragmatische Budgets, kurze Entscheidungswege — sind in der Build-vs-Buy-Frage tatsächlich ein struktureller Vorteil. Wer sich kein neunmonatiges Custom-Modell-Projekt leisten kann, wird in den schnelleren, pragmatischeren Pfad gezwungen: Modelle kaufen, Integration bauen, in Produktion gehen, aus realem Einsatz lernen. Dieser Pfad erzeugt mehr operativen Hebel pro investiertem Euro. Und er baut die organisatorische Fähigkeit auf — die sechs Dimensionen des KI-Betriebssystems —, die Level-2- und Level-3-Deployments erreichbar macht.

Große Konzerne mit dedizierten KI-Labs und eigenen Foundation-Model-Teams haben hier keinen Vorteil, den Sie nachbauen sollten. Ihr Vorteil ist Geschwindigkeit und Nähe zum Prozess. Nutzen Sie ihn.


Ein Fit Call klärt in 30 Minuten, ob Ihre nächste KI-Initiative auf das Modell oder auf die Integration setzen sollte — bevor Sie ein Budget für das Falsche freigeben.

Fit Call buchen →


Quellen: EU AI Act (Verordnung (EU) 2024/1689), Annex III und Artikel 26 — artificialintelligenceact.eu; Gartner, „Gartner Predicts 40% of Enterprise Apps Will Feature Task-Specific AI Agents by 2026," August 2025 — gartner.com; Gartner, „LLM Inference Costs to Fall Over 90% by 2030," März 2026 — gartner.com.