Die KI-Skalierungslücke ist kein Technologieproblem. Was die Allianz mit 600 skalierten KI-Anwendungen vorgemacht hat
89 % der KI-Anwendungen in DACH-Versicherern erreichen nie den Produktivbetrieb. Bäte hat auf der Allianz-HV gezeigt, woran das liegt und woran nicht: nicht an der Technologie. An der Zählweise im Vorstand.
Auf der Allianz-Hauptversammlung am 7. Mai 2026 hat Oliver Bäte einen Satz gesagt, der die KI-Steuerung in DACH-Versicherern neu sortiert. Er sprach von „über 600 skalierbaren KI Anwendungen" — und ausdrücklich nicht von Use Cases. Den Anstoß zu dieser Beobachtung gab Max Hempel im Versicherungstech Magazin KI-Newsletter, der die Begriffsverschiebung als Erster aufgegriffen hat.
Die meisten KI-Anwendungen in DACH-Versicherern erreichen nie den Produktivbetrieb. Bäte hat signalisiert, dass es anders geht und woran es liegt. Wer KI als Use Cases zählt, optimiert seine Organisation auf Pilot-Produktion. Wer skalierte Anwendungen mit vierteljährlicher Wirkungskennzahl zählt, optimiert auf wirtschaftliche Wirkung. Die Zählweise ist die Steuerungslogik. Hier entscheidet sich, ob KI im Konzern Wirkung erzeugt oder Folien.
Use Case ist eine Idee. Skalierte Anwendung ist ein Ergebnis.
Ein Use Case ist ein dokumentierter Anwendungsfall: Idee, Konzept oder Implementierung. Eine skalierte Anwendung erfüllt drei Kriterien gleichzeitig, die wir im VTM aus Bätes Logik ableiten: produktiv im Live-Betrieb, ausgerollt über die Pilot-Region hinaus, vierteljährlich gegen eine harte Wirkungskennzahl gemessen. Was diese drei Bedingungen nicht erfüllt, ist ein Pilotprojekt; auch wenn es seit Jahren läuft. Eine Gartner-Analyse zeigt, dass nur elf Prozent der Enterprise-KI-Prototypen jemals den vollen Produktivbetrieb erreichen. Die übrigen 89 Prozent stehen auf Use-Case-Listen.
Die Steuerungslogik baut die Organisation. Nicht umgekehrt.
Peter Drucker hat das Prinzip vor fünfzig Jahren formuliert: What gets measured, gets managed. Was im Vorstand gemessen wird, wird gesteuert — und prägt, welche Organisation wächst. Wenn der Vorstand Use Cases zählt, wachsen Innovationsabteilungen, Pilot-Backlogs und Vendor-Demos. Die Organisation baut sich um die Innovations-Show. GuV-Effekte bleiben dabei strukturell aus.
Wenn der Vorstand skalierte Anwendungen mit Wirkungskennzahlen zählt, wachsen Linienverantwortung, Plattform-Disziplin und Rollout-Kapazität. Die Organisation baut sich um messbare Wirkung. Zwei verschiedene Organisationen, gebaut aus zwei verschiedenen Kennzahlen. Bätes Sprache auf der Hauptversammlung macht das Prinzip sichtbar: KI-Anwendungen werden in den einzelnen Geschäftsbereichen entwickelt und dann für den ganzen Konzern nutzbar gemacht.
Das ist Plattformlogik, keine Pilotlogik. Genau diese Logik schließt die Skalierungslücke, an der 89 Prozent der Branche scheitern. Nicht über Technologie, sondern über Steuerung.
Drei Steuerungsdimensionen entscheiden, welche KI-Organisation Sie morgen führen.

Wer wird gemessen. Use-Case-Listen entstehen in Innovationsabteilungen und beweisen Aktivität. Skalierte Anwendungen liegen in der Linie und beweisen Wirkung. Allianz liefert das HV-Beispiel: In der Tierkrankenversicherung der Allianz Versicherungs-AG werden bereits über die Hälfte der Schadenfälle vollständig automatisiert bearbeitet, im Schadenmanagement ist die Produktivität um 30 Prozent gestiegen. Das sind keine Innovationspunkte. Das sind GuV-Effekte, abgebildet in der Combined Ratio.
Was wird belohnt. ERGO investiert substanziell in KI-Plattformen. Die GenAI-Plattform hat bereits über acht Millionen Dokumente analysiert; zwischen 2025 und 2030 fließen mehr als 130 Millionen Euro in die Plattform. Hinzu kommen ERGO GPT und eine zentrale AI Factory, die seit 2016 betrieben wird. Was fehlt, ist eine kommunizierte Skalierungszahl analog zur Allianz. Nicht weil ERGO nichts liefert, sondern weil die Zählweise auf Vorstandsebene dort in Plattform-Investition geführt wird, nicht in skalierten Anwendungen mit Wirkungskennzahl.
Was wird ausgebaut. Plattformlogik statt Pilotlogik, das ist der konkrete Arbeitsauftrag. MLOps (Machine Learning Operations) bildet dabei das operative Rückgrat: die Infrastruktur, die Modelle vom Labor in den Live-Betrieb bringt, ihre Performance laufend überwacht und automatisch erkennt, wenn ein Modell an Genauigkeit verliert. Hinzu kommen ein zentrales Modellregister, das Transparenz über Versionsstand und Rollout-Status liefert, sowie wiederverwendbare Datenmerkmale, die mehrere Anwendungen gleichzeitig versorgen.
Allianz zeigt das Prinzip am Sprachbot „Eric" — ein KI-Assistent, der theoretisch hunderte Anrufe parallel in über 20 Sprachen bearbeiten kann. Eine Anwendung. Beliebig viele Märkte.
📎 Weiterführend im VTM: → Von der Pilot-Ecke in die Produktion – Wie Versicherer KI jetzt rentabel skalieren → Die Ironie der Automatisierung: Warum KI Ihre besten Leute noch wichtiger macht
Die Roadmap, mit der die KI-Skalierungslücke schließt.
Die Skalierungslücke schließt sich nicht durch Ankündigungen. Sie schließt sich durch eine veränderte Zählweise.
Sofortmaßnahmen (0–30 Tage). Lassen Sie Ihre aktuelle Liste der KI-Anwendungen durch die drei Kriterien laufen: produktiv, skaliert, vierteljährlich gegen eine Wirkungskennzahl gemessen. Was nicht alle drei erfüllt, wird ab sofort als Pilot geführt. Verlangen Sie pro skalierter Anwendung eine GuV-anschlussfähige Kennzahl: Produktivitätsgewinn, Combined-Ratio-Beitrag, NPS, Automatisierungsgrad oder Bearbeitungszeit. Eine Anwendung ohne Wirkungskennzahl ist eine Behauptung, kein Ergebnis.
Mittelfristig (30–90 Tage). Verschieben Sie die Verantwortung für die Zählung von der Innovationsabteilung in die Linie. Wer die Wirkung verantwortet, führt die Zahl. Bauen Sie Plattformkapazität auf, die Anwendungen aus einem Geschäftsbereich konzernweit nutzbar macht. Bätes Beispiel zeigt: Das ist machbar, nicht visionär.
Fallstrick: Die Versuchung, Use Cases durch reine Umbenennung in „Anwendungen" weiterzuführen. Definition ohne Härte ist Kosmetik. Der vierteljährliche Wirkungs-Check ist die Härte. Ohne ihn wird die neue Sprache zur alten Zählweise.
KPI: Verhältnis skalierter Anwendungen zu Piloten, quartalsweise an den Vorstand berichtet. Diese eine Zahl ersetzt die Use-Case-Liste.
Die Skalierungslücke schließt sich nicht. Sie weitet sich.
In drei Jahren werden zwei Gruppen von DACH-Versicherern erkennbar sein. Die einen werden auf Hauptversammlungen und in Vorstandsberichten die Zahl ihrer skalierten KI-Anwendungen kommunizieren, mit angeschlossenen Wirkungskennzahlen. Die anderen werden weiterhin Use-Case-Listen vorlegen, in denen Pilotprojekte aus 2024 noch immer auftauchen.
Die Lücke zwischen beiden Gruppen wird sich nicht über Technologie schließen. Sie wird sich über Steuerungslogik schließen — oder eben nicht. Allianz hat das Prinzip vorgemacht. Die offene Frage ist nicht mehr ob, sondern wer als nächster nachzieht.
Ihre Frage fürs nächste Meeting: Welche Ihrer aktuell gezählten KI-Anwendungen würden die drei Kriterien überstehen — und welche heißen ab morgen wieder Pilot?
Quellen
- Bericht des Vorstandsvorsitzenden Oliver Bäte, Allianz SE Hauptversammlung 2026 – allianz.com (07.05.2026)
- Max Hempel, VTM KI-Newsletter – LinkedIn (Mai 2026)
- Allianz Hauptversammlung 2026 — Rekorde, Vergütungsstreit und Bäte-Nachfolge – ftd.de (07.05.2026)
- Allianz: Wie der Versicherer zum Tech-Konzern werden will – handelsblatt.com (17.07.2025)
- Ergo steht im regelmäßigen Austausch mit Meta, Google und Amazon – versicherungsbote.de
- From PoC to Production: Why Enterprise AI Fails at Scale (Gartner-Daten 2024) – 47billion.com (Mai 2026)
Kooperationspartner werden
Erreichen Sie IT- und Innovations-Entscheider der DACH-Versicherungswirtschaft. Sponsored Articles, Jahrespartnerschaften und insureNXT-Pakete.
Kommentare ()