Zweiundfünfzig Prozent der westeuropäischen Unternehmen erwarten laut Deloittes „State of AI 2026"-Studie eine beschleunigte Investition in Datensouveränitätsinitiativen. Siebenundvierzig Prozent überprüfen aktiv ihre Abhängigkeiten von nicht-europäischen Cloud-Anbietern. Nahezu drei von fünf bauen KI-Stacks primär mit lokalen Anbietern auf, und 77 Prozent beziehen das Herkunftsland eines Vendors in ihre Auswahlkriterien ein.
Das sind keine Absichtserklärungen, die in einem Strategiepapier verstauben. Es sind Beschaffungsentscheidungen, die grundlegend verändern, wie europäische Unternehmen KI-Infrastruktur einkaufen, aufbauen und betreiben. Die Frage ist nicht mehr, ob Souveränität relevant ist — diese Debatte endete irgendwo zwischen dem dritten Schrems-Urteil und der ersten CLOUD Act-Vorladung. Die Frage ist, wie man für Souveränität designt, ohne die Performance- und Kostenvorteile aufzugeben, die Hyperscaler tatsächlich bieten.
Der Souveränitätsimperativ: Warum „EU-Region" nicht genügt
Das gefährlichste Missverständnis im Enterprise Cloud Computing ist die Annahme, dass die Auswahl einer europäischen Region bei AWS, Azure oder Google Cloud Daten souverän macht. Das tut sie nicht. Sie macht Daten resident — eine schwächere Eigenschaft, die Geografie adressiert, ohne Jurisdiktion zu adressieren.
Die Unterscheidung ist relevant wegen des US CLOUD Act, der 2018 in Kraft trat. Gemäß dieser Gesetzgebung können US-Behörden jedes US-amerikanische Unternehmen zwingen, weltweit gespeicherte Daten herauszugeben — unabhängig davon, in welchem Rechenzentrum die Server stehen. Wenn ein DACH-Unternehmen sensible KI-Trainingsdaten oder Kundenakten in Azures Region Frankfurt speichert, befinden sich diese Daten geografisch in Deutschland, sind aber jurisdiktionell für US-Strafverfolgungsbehörden zugänglich. Microsoft, Amazon und Google sind alle US-amerikanische Unternehmen. Ihre vertraglichen Zusicherungen zur EU-Datenresidenz setzen einen rechtmäßigen US-Regierungsanspruch nicht außer Kraft.
Das ist kein theoretisches Szenario. Der Rechtsmechanismus ist etabliert und wurde bereits angewandt. Für Unternehmen in regulierten Sektoren — Finanzdienstleistungen unter BaFin-Aufsicht, Gesundheitswesen unter Patientendatenschutz, Versicherungen, Energie oder kritische Infrastruktur — erzeugt die jurisdiktionelle Exponierung ein Compliance-Risiko, das keine Vertragsklausel eliminieren kann. Das Vendor-Evaluierungsframework behandelt Souveränität aus genau diesem Grund als erstrangiges Auswahlkriterium.
Der regulatorische Druck verschärft sich auch von europäischer Seite. Der EU AI Act — mit der nahenden Durchsetzung für Hochrisikosysteme — sieht Strafen von bis zu 7 Prozent des weltweiten Jahresumsatzes bei Nichteinhaltung vor. Der deutsch-französische Gipfel zur europäischen digitalen Souveränität im November 2025 hat eine gemeinsame Taskforce initiiert, die speziell souveräne KI-Infrastrukturstandards entwickeln soll, mit erwarteten Ergebnissen im Laufe des Jahres 2026. Und die 83 Prozent der Unternehmen, die Deloitte als strategisch an souveräner KI interessiert identifiziert, reagieren nicht auf abstraktes geopolitisches Risiko — sie reagieren auf konkrete regulatorische Verpflichtungen und Bedenken auf Vorstandsebene hinsichtlich operativer Kontrolle.
Was Souveränität tatsächlich bedeutet: drei Eigenschaften, nicht eine
Die Branche verwendet „souveräne KI" so unscharf, dass der Begriff begonnen hat, alles und damit nichts zu bedeuten. Eine belastbare Definition erfordert Präzision. Echte Souveränität in der KI-Infrastruktur beruht auf drei Eigenschaften, die gleichzeitig erfüllt sein müssen.
Architektonische Kontrolle bedeutet keine externen Abhängigkeiten von nicht-souveränen Entitäten für Kernoperationen. Das erfordert nicht, alles von Grund auf selbst zu bauen. Es bedeutet, dass jede Komponente im KI-Stack — Model Hosting, Datenspeicherung, Retrieval-Pipelines, Orchestrierungsschichten — entweder auf Infrastruktur läuft, die man selbst kontrolliert, oder auf Infrastruktur, die von Entitäten betrieben wird, die keinen ausländischen Jurisdiktionsansprüchen unterliegen. Ein KI-System, das Daten durch eine Kette von sechs Microservices verarbeitet, ist nur so souverän wie sein schwächstes Glied.
Operationelle Unabhängigkeit bedeutet, dass Policies mit Workloads mitwandern. Wenn Ihre Data-Governance-Regeln, Zugriffskontrollen und Audit-Trails in einer Plattform implementiert sind, die Sie nicht kontrollieren, sind Sie operationell abhängig — unabhängig davon, wo die Daten liegen. Unabhängigkeit bedeutet, dass Ihre Governance bei einer Migration eines Workloads von einem Anbieter zu einem anderen oder von der Cloud zu On-Premise mitreist. Das erfordert Policies, die als Konfiguration kodiert sind, nicht als plattformspezifische Einstellungen, die bei einer Migration verschwinden.
Exit-Fähigkeit bedeutet die Möglichkeit, jeden Anbieter zu verlassen, ohne den Stack umzuschreiben. Das ist die Souveränitätseigenschaft, die die meisten Unternehmen vernachlässigen. Ein System ist nicht souverän, wenn der Abschied vom aktuellen Anbieter sechs Monate Re-Engineering erfordert. Echte Souveränität schließt die architektonische Disziplin ein, Wechselkosten beherrschbar zu halten — Abstraktionsschichten auf Modellebene, Standarddatenformate auf Speicherebene und portable Orchestrierung auf Workflow-Ebene. Das Self-Hosting-Entscheidungsframework beleuchtet diese Portabilitätsdimension im Detail.
Die gängigen Missverständnisse konzentrieren sich auf die erste Eigenschaft und ignorieren die beiden anderen. Unternehmen, die Modelle bei einem deutschen Cloud-Anbieter hosten, aber ihre gesamte Orchestrierungsschicht auf den proprietären Tools dieses Anbieters aufbauen, haben Datenresidenz erreicht, nicht Souveränität. In dem Moment, in dem sie umziehen müssen, stellen sie fest, dass ihre „souveräne" Infrastruktur genauso fest gebunden ist wie das Hyperscaler-Deployment, das sie ersetzt hat.
Die hybride Architektur-Realität
Die unbequeme Wahrheit über souveräne KI ist, dass volle Souveränität für jeden Workload weder praktikabel noch ökonomisch rational ist. Hyperscaler bieten Fähigkeiten — globale Edge-Netzwerke, Managed Kubernetes im großen Maßstab, vortrainierte Foundation-Model-APIs — die kein europäischer souveräner Cloud-Anbieter heute matcht. So zu tun als ob, ist Ideologie, nicht Architektur.
Die praktische Antwort ist Workload-basierte Segmentierung. Nicht jedes Datenelement in einer Organisation hat denselben Souveränitätsbedarf. Interne Besprechungszusammenfassungen benötigen nicht denselben Schutz wie Finanzakten von Kunden. Eine Produktempfehlungs-Engine, die anonymisierte Verhaltensdaten verarbeitet, trägt nicht dasselbe jurisdiktionelle Risiko wie ein Schadensregulierungssystem, das persönliche Gesundheitsinformationen verarbeitet.
Die Architektur, die für die meisten DACH-Unternehmen 2026 funktioniert, ist ein gestuftes Modell. Souveräne Infrastruktur übernimmt sensible Daten-Workloads — alles, was personenbezogene Daten unter DSGVO-Regelung betrifft, regulierte Daten, die branchenspezifischen Anforderungen unterliegen, und proprietäres geistiges Eigentum, das einen Wettbewerbsvorteil darstellt. Hyperscaler-Infrastruktur übernimmt alles andere — Entwicklungsumgebungen, nicht-sensible Analysen, öffentlich zugängliche Dienste, bei denen Datensouveränität keine Einschränkung darstellt, und Workloads, bei denen die globale Skalierung des Hyperscalers echte Performance-Vorteile liefert.
Die Grenze zwischen den Stufen ist keine Technologieentscheidung. Sie ist eine Datenklassifizierungsentscheidung. Unternehmen, die keine rigorose Datenklassifizierung abgeschlossen haben — und nach unserer Erfahrung haben die meisten das nicht — können keine sinnvolle Souveränität umsetzen, weil sie nicht wissen, welche Workloads Souveränitätsanforderungen mit sich bringen. Das Assessment zu Datenqualität und Governance bildet das Fundament, auf dem Souveränitätsarchitektur aufbaut.
Souveränes RAG: der neue Standard für Unternehmens-Wissenssysteme
Retrieval-Augmented Generation hat sich zur dominierenden Architektur für KI-Systeme in Unternehmen entwickelt, die über proprietäre Daten schlussfolgern müssen. Und souveränes RAG — bei dem Retrieval-Pipeline, Vektordatenbank und Generierungsmodell vollständig innerhalb souveräner Infrastruktur operieren — wird rasch zum Standardmuster für regulierte DACH-Unternehmen.
Die Logik ist geradlinig. In einem RAG-System ist die sensibelste Komponente nicht das Sprachmodell selbst, sondern die Retrieval-Schicht, denn sie enthält indexierte Repräsentationen Ihrer proprietären Dokumente, Verträge, Kundenakten und operativen Wissensbasis. Wenn diese Retrieval-Schicht auf einer nicht-souveränen Plattform liegt, setzt jede Abfrage den indexierten Inhalt potenziell einem ausländischen Jurisdiktionszugriff aus. Das Modell kann generisch sein. Die Wissensbasis nicht.
Souveräne RAG-Implementierungen setzen typischerweise ein Open-Source- oder europäisches Sprachmodell ein — Mistral, das sich USD 830 Millionen an Fremdfinanzierung explizit für den Aufbau souveräner KI-Infrastruktur einschließlich eines großen Rechenzentrums bei Paris gesichert hat, ist das prominenteste Beispiel — auf souveräner Cloud-Infrastruktur oder On-Premise-Hardware. Die Vektordatenbank läuft auf derselben Infrastruktur. Die Retrieval-Pipeline indexiert Dokumente, ohne Inhalte an einen nicht-souveränen Dienst zu senden. Die gesamte Kette von der Dokumentenaufnahme bis zur Antwortgenerierung verbleibt innerhalb souveräner Grenzen.
Dieses Muster funktioniert, weil RAG die allgemeine Fähigkeit (das Sprachmodell) von dem spezifischen Wissen (dem Retrieval-Index) trennt. Man kann ein kleineres, lokal gehostetes Modell für die Generierung verwenden — ein 7B- oder 13B-Parametermodell auf moderater GPU-Hardware — und die Wissensbasis vollständig souverän halten. Der Performance-Trade-off gegenüber einem Frontier-Modell auf einer Hyperscaler-API ist real, aber enger als die meisten Unternehmen erwarten, insbesondere bei domänenspezifischen Aufgaben, bei denen die Retrieval-Qualität wichtiger ist als die allgemeine Schlussfolgerungsfähigkeit des Modells. Die Analyse der Inferenzkosten quantifiziert, wie sich dieser Trade-off über verschiedene Deployment-Architekturen auswirkt.
Infrastrukturoptionen: Was der Markt heute bietet
Die souveräne KI-Infrastrukturlandschaft in Europa hat sich erheblich weiterentwickelt. Deutsche Telekoms T-Systems startete im Februar 2026 seine Industrial AI Cloud in München — eine Enterprise-taugliche souveräne KI-Infrastruktur, die unter europäischer Jurisdiktion ohne US-Muttergesellschaft in der rechtlichen Kette aufgebaut ist. Das ist kein Nischenangebot — es ist ein europäischer Tier-1-Telekommunikationskonzern, der strategisches Kapital in souveränes Computing investiert, weil seine Unternehmenskunden es einfordern.
Telefonicas EURO-3C-Projekt hat mehr als 70 Organisationen versammelt, die souveräne Infrastruktur quer durch Europa aufbauen, und schafft ein föderiertes Compute-Netzwerk, das Unternehmen ermöglicht, Workloads über souveräne Knoten zu betreiben, ohne dass Daten europäische Jurisdiktionsgrenzen verlassen. OVHcloud, Scaleway und STACKIT (Cloud-Tochtergesellschaft der Schwarz Gruppe) bieten souveräne Cloud-Plattformen, die vollständig innerhalb der EU-Jurisdiktion aufgebaut und betrieben werden.
Auf der Hardwareseite hat sich die Ökonomie von On-Premise-GPU-Deployments für souveränitätsmotivierte Käufer günstiger entwickelt. Wie die Analyse der GPU-Infrastruktur-Ökonomie im Detail zeigt, sind die Preise für leistungsfähige Inferenz-Hardware deutlich gefallen, und für Unternehmen, die bereits Rechenzentrumskapazität betreiben, sind die Gesamtbetriebskosten über drei Jahre für On-Premise-GPU-Infrastruktur bei moderater bis hoher Auslastung wettbewerbsfähig mit Cloud-Alternativen.
Die verbleibende Lücke liegt bei Managed Services. Hyperscaler bieten eine Tiefe an verwalteten Tools — automatisierte Skalierung, integriertes Monitoring, One-Click-Deployment-Pipelines — die souveräne Anbieter noch aufbauen. Unternehmen, die auf souveräne Infrastruktur umstellen, sollten erwarten, während der Übergangsphase mehr in operationelles Engineering zu investieren, oder mit Implementierungspartnern zusammenarbeiten, die die Tooling-Lücke überbrücken können. Das ist kein Grund, souveräne Infrastruktur zu meiden. Es ist ein Faktor in realistischer Migrationsplanung.
Der Kosten-Trade-off: Souveränität ist nicht kostenlos, aber Nicht-Souveränität ist nicht billig
Souveränität bringt einen Kostenaufschlag mit sich. Souveräne Cloud-Anbieter berechnen typischerweise 20 bis 40 Prozent mehr als vergleichbare Hyperscaler-Dienste. On-Premise-Infrastruktur erfordert Investitionsausgaben und operationelles Engineering, die Cloud-Verbrauchsmodelle eliminieren. Kleinere Modell-Deployments opfern möglicherweise etwas Genauigkeit im Vergleich zu Frontier-Modellen, die über Hyperscaler-APIs zugänglich sind.
Diese Kosten sind real und sollten ehrlich modelliert werden. Jeder Souveränitäts-Verfechter, der behauptet, die Umstellung sei kostenneutral, verkauft etwas.
Aber die Analyse ist unvollständig ohne die Kosten der Nicht-Souveränität. Eine durch den CLOUD Act ausgelöste Datenoffenlegung, die Kundenakten in einer regulierten Branche betrifft, hat keine vorhersehbare Kostenobergrenze. EU AI Act-Strafen bei Nichteinhaltung erreichen 7 Prozent des weltweiten Jahresumsatzes — für ein Unternehmen mit EUR 500 Millionen Umsatz sind das EUR 35 Millionen. Ein Sicherheitsvorfall in souveräner Infrastruktur, der auf eine Komponente unter ausländischer Jurisdiktion zurückzuführen ist, erzeugt regulatorische Haftung, Vertrauensverlust bei Kunden und Behebungskosten, die den Souveränitätsaufschlag um ein Vielfaches übersteigen.
Die Rahmung sollte nicht „Souveränität kostet mehr" sein, sondern „Was sind die erwarteten Kosten jeder Option über einen Fünf-Jahres-Horizont, einschließlich regulatorischem Risiko?" Für die meisten regulierten DACH-Unternehmen liegen die risikoadjustierten Kosten souveräner Infrastruktur unter den risikoadjustierten Kosten vollständiger Hyperscaler-Abhängigkeit. Die Analyse der Vertrauensinfrastruktur argumentiert parallel: Vertrauen ist kein weicher Vorteil, sondern eine harte Voraussetzung für die Skalierung von KI in hochwertige Anwendungen, und Souveränität ist ein struktureller Bestandteil dieses Vertrauens.
Für Unternehmen mit signifikanten Inferenzvolumina verbessert sich das Kostenbild weiter. Self-Hosted Inference auf souveräner On-Premise-Hardware wird ab etwa 200 Millionen Token pro Tag kostenwettbewerbsfähig, und der Souveränitätsvorteil entsteht als strukturelles Nebenprodukt des Infrastruktur-Eigentums und nicht als zusätzliche Kostenschicht.
Das Entscheidungsframework: Welche Workloads wohin gehören
Nicht jeder KI-Workload muss souverän sein. Maximale Souveränität auf jedes System anzuwenden ist teuer und operationell belastend. Das folgende Framework bietet ein praktisches Allokationsmodell.
Souveräne Infrastruktur (On-Premise oder souveräne Cloud) für Workloads, die personenbezogene Daten verarbeiten, die der DSGVO ohne adäquate Anonymisierung unterliegen, in Sektoren mit expliziten Datenlokalisierungsanforderungen operieren (BaFin-regulierte Finanzdienstleistungen, Gesundheitswesen, kritische Infrastruktur), proprietäres geistiges Eigentum handhaben — Geschäftsgeheimnisse, proprietäre Algorithmen, Wettbewerbs-Intelligence — das strategischen Wert darstellt, oder unter die Hochrisiko-Klassifizierung des EU AI Act fallen und vollständige Audit-Trail-Kontrolle erfordern. Diese Workloads rechtfertigen den Souveränitätsaufschlag, weil die Kosten eines jurisdiktionellen oder regulatorischen Vorfalls die Infrastrukturkosten um Größenordnungen übersteigen.
Hyperscaler-Infrastruktur für Workloads, die anonymisierte oder synthetische Daten verarbeiten, bei denen das Risiko einer Re-Identifikation vernachlässigbar ist, öffentlich zugängliche Funktionen bedienen, bei denen die Daten bereits öffentlich verfügbar sind, Fähigkeiten erfordern — globale Edge-Verteilung, massiv-parallele Verarbeitung, spezialisierte Hardware — bei denen souveräne Alternativen noch nicht die Hyperscaler-Performance erreichen, oder in nicht-regulierten Kontexten operieren, in denen die jurisdiktionelle Exponierung kein wesentliches Risiko erzeugt. Hyperscaler-Infrastruktur für diese Workloads zu nutzen ist kein Souveränitätskompromiss. Es ist rationale Ressourcenallokation.
Die Grauzone — und jedes Unternehmen hat eine — besteht aus Workloads, bei denen die Souveränitätsanforderung ambivalent ist. Die Daten sind etwas sensibel, aber nicht explizit reguliert. Die regulatorische Exponierung ist möglich, aber nicht sicher. Das Wettbewerbsrisiko einer Offenlegung ist real, aber schwer zu quantifizieren. Für diese Workloads sollte die Entscheidung bei moderatem Kostenaufschlag zur Souveränität tendieren und bei großer Performance- oder Fähigkeitslücke zur Hyperscaler-Infrastruktur. Die Analyse der Sicherheits-Angriffsflächen hilft, die Risikodimension dieser Grauzone-Allokation zu quantifizieren.
Die Allokation ist nicht statisch. Je weiter souveräne Infrastruktur reift und die Fähigkeitslücke zu Hyperscalern sich schließt, desto mehr Workloads sollten in Richtung souveränes Deployment migrieren. Je strenger die regulatorischen Anforderungen werden — und die Richtung unter dem EU AI Act ist eindeutig hin zu strengeren Anforderungen, wie die Digital-Omnibus-Analyse dokumentiert — desto kleiner wird die Grauzone und desto größer die Kategorie der souveränitätspflichtigen Workloads.
Die Souveränitäts-Roadmap
Souveränität ist kein Wochenend-Migrationsprojekt. Es ist eine mehrstufige Infrastrukturevolution über mehrere Quartale, die Datenklassifizierung, Vendor-Beziehungen, Deployment-Architektur und operationelle Prozesse berührt.
Beginnen Sie mit der Datenklassifizierung. Souveräne Infrastruktur lässt sich nicht aufbauen, ohne zu wissen, welche Daten Souveränität erfordern. Klassifizieren Sie Ihre KI-relevanten Datenbestände nach Sensibilitätsstufe, regulatorischer Exponierung und Wettbewerbswert. Diese Klassifizierung wird zum Input für jede folgende Infrastruktur-Allokationsentscheidung.
Prüfen Sie Ihre aktuelle jurisdiktionelle Exponierung. Ordnen Sie jeden KI-Workload seinem Infrastruktur-Stack zu. Identifizieren Sie für jede Komponente die rechtliche Jurisdiktion der betreibenden Entität. Wo ein US-amerikanisches Unternehmen irgendwo in der Kette sitzt, markieren Sie die Exponierung.
Entwerfen Sie die Zielarchitektur. Definieren Sie auf Basis Ihrer Datenklassifizierung, wo jeder Workload laufen soll. Das ist eine technische Architekturübung, getrieben von der Datenklassifizierung, nicht von Technologiepräferenzen.
Migrieren Sie inkrementell. Beginnen Sie mit den Workloads mit dem höchsten Risiko — jenen, bei denen ein jurisdiktioneller Vorfall den größten Schaden anrichten würde. Migrieren Sie diese zuerst auf souveräne Infrastruktur. Bauen Sie operationelles Vertrauen auf. Dann erweitern Sie. Eine gleichzeitige Migration des gesamten Bestands ist der Weg, auf dem Souveränitätsprojekte scheitern.
Bauen Sie von Tag eins auf Portabilität. Jede Komponente, die Sie deployen — auf souveräner oder Hyperscaler-Infrastruktur — sollte portabel sein. Nutzen Sie Abstraktionsschichten. Vermeiden Sie proprietäres Tooling-Lock-in. Stellen Sie sicher, dass Ihre Souveränitätsarchitektur nicht einfach eine Abhängigkeit durch eine andere ersetzt.
Die 52 Prozent der europäischen Unternehmen, die ihre Souveränitätsinvestitionen beschleunigen, reagieren nicht auf einen Trend. Sie reagieren auf eine strukturelle Verschiebung in der Art und Weise, wie KI-Infrastruktur gestaltet werden muss, wenn die Daten, die sie verarbeitet, regulatorische, wettbewerbliche und jurisdiktionelle Konsequenzen tragen. Die Unternehmen, die Souveränität als Architekturdisziplin behandeln — nicht als Checkbox, nicht als Vendor-Marketing-Behauptung — werden KI-Infrastruktur aufbauen, die sowohl compliant als auch resilient ist. Die übrigen werden, wahrscheinlich im denkbar ungünstigsten Moment, feststellen, dass „EU-Region" nie genug war.
Buchen Sie einen Fit Call, um Ihre souveräne KI-Architektur zu gestalten. Wir bewerten Ihre Datenklassifizierung, regulatorische Exponierung und bestehenden Infrastrukturabhängigkeiten — und entwerfen dann die Workload-Allokation und den Migrationspfad, der echte Souveränität erreicht, ohne zu überbauen oder die Fähigkeiten zu opfern, die Ihre Teams benötigen. Fit Call buchen →
References: Deloitte, "State of AI in the Enterprise," 2026 edition; US Clarifying Lawful Overseas Use of Data (CLOUD) Act, 2018; Franco-German Summit on European Digital Sovereignty, joint communique, November 2025; Deutsche Telekom / T-Systems, "Industrial AI Cloud" launch announcement, February 2026; Mistral AI, debt financing announcement (USD 830M), March 2026; Telefonica EURO-3C project documentation, 2025--2026; EU AI Act, Regulation (EU) 2024/1689; EU Digital Omnibus on AI, provisional agreement, May 2026.