Live

Das KI-ROI-Paradoxon: Warum die Branche KI an der falschen Zahl misst - und welche Vorindikatoren wirklich zählen

KI-Initiativen lassen sich nicht mit Bilanz-Kennzahlen steuern — diese kommen zu spät. Wer KI führen statt nur abrechnen will, braucht Frühindikatoren: Kennzahlen, die Wochen früher zeigen, ob eine Initiative trägt. Vier davon machen KI im Versicherungsbetrieb endlich managebar.

Das KI-ROI-Paradoxon: Warum die Branche KI an der falschen Zahl misst - und welche Vorindikatoren wirklich zählen
Die Branche misst KI an Zahlen, die den Erfolg bestätigen — statt an Zahlen, die ihn ankündigen, solange wir ihn noch beeinflussen können. Google Gemini Illustration.

Die meistzitierte KI-Erfolgszahl der deutschen Assekuranz steht im Effizienzprogramm „Ambition 2030" von Munich Re: rund 600 Millionen Euro jährliche Einsparungen, bei der Erstversicherungstochter ERGO der Abbau von etwa 1.000 Stellen bis 2030, getragen von über 300 identifizierten oder gestarteten KI- und Automatisierungsprojekten. Es ist eine beeindruckende Zahl. Zum Steuern taugt sie trotzdem nur halb.

Nicht, weil sie unwahr wäre. Sondern weil Steuern bedeutet, eingreifen zu können, solange etwas noch im Fluss ist. Genau das leisten Kostenersparnis, Stellenabbau und Combined Ratio nicht: Diese Spätindikatoren melden das Ergebnis erst, wenn die Periode gelaufen ist — korrekt, aber zu spät für jede Korrektur. Sie eignen sich zur Bilanzierung, nicht zur Führung. Daraus folgt eine Frage, der sich bislang kaum ein Vorstand stellt: Wie wollen wir KI-Investitionen überhaupt steuern und nachjustieren, wenn unsere einzigen Kennzahlen erst dann anschlagen, wenn das Geld längst ausgegeben und die Wirkung längst eingetreten ist? Wer KI führen will, statt sie nur abzurechnen, braucht Kennzahlen, die früher sprechen.


Spitzenreiter bei der Nutzung. Schlusslicht beim Ertrag.

Ausgerechnet Deutschland zeigt, wie teuer dieser Reflex ist. Das Land nutzt KI intensiver als jedes andere der aktuellen Deloitte-Studie „The ROI of AI" (German Cut, März 2026) — und schöpft daraus am wenigsten strategisches Kapital. Befragt wurden ausschließlich Unternehmen, die KI bereits im Tagesgeschäft oder in Pilotprojekten nutzen. Von diesen erwarten neun von zehn in Deutschland, dass die Technologie ihr Geschäftsmodell bis 2028 grundlegend verändert. Doch nur fünf Prozent setzen KI bereits gezielt für die strukturelle Weiterentwicklung ihres Geschäfts ein — etwa über KI-Agenten. In Großbritannien sind es 13, in Irland 11 Prozent. Wir sind die fleißigsten Anwender — und die zögerlichsten Gestalter. Der Befund gilt gesamtwirtschaftlich, nicht nur für Versicherer. Aber die Assekuranz lebt ihn besonders sichtbar.

Denn die Aufsicht selbst benennt das Muster. In ihrer Orientierungshilfe zu IKT-Risiken beim KI-Einsatz vom Dezember 2025 stellt die BaFin nüchtern fest: KI-Anwendungen dominieren derzeit dort, wo die größten Effizienzsteigerungen erzielbar sind — Kundenkommunikation, Schadenmanagement, Betrugserkennung. Effizienz ist der erste, sichtbare Nutzen — und ein echter. Sie zeigt aber nur, dass KI heute Aufgaben übernimmt, nicht, ob daraus morgen ein struktureller Vorteil wird. Genau diesen Unterschied messen Effizienzkennzahlen nicht.


Die Lieblingszahl der Branche versagt an der Natur der Technologie

Klassische Investitionsrechnung — Net Present Value, Amortisationsdauer, Break-Even-Analyse — unterstellt vorhersagbare, lineare Rückflüsse und verlangt sie typischerweise innerhalb von drei bis fünf Jahren. KI folgt dieser Logik nicht. Ein Underwriting-Modell spart im ersten Monat nichts; sein Produktivitätsbeitrag setzt erst mit erheblicher Verzögerung spürbar ein — und steigt danach überproportional, je mehr Daten das Modell sieht und je besser die Risikoselektion und damit die Schadenquote wird. Der entscheidende Effekt fällt also genau dann an, wenn das übliche Bewertungsfenster bereits schließt. Eine Amortisations- oder Break-Even-Rechnung erfasst ihn schlicht nicht — sie bestraft die Projekte, deren Wert in der Lernkurve liegt. Wer KI an dieser Mechanik misst, optimiert systematisch das Falsche: die schnelle, sichtbare Einsparung über den langsamen, exponentiellen Aufbau.

Munich Re nennt die Lösung unfreiwillig selbst. Der Konzern hat betont, Stellen fielen erst weg, wenn die KI-Systeme zuverlässig funktionieren. Genau diese Zuverlässigkeit ist messbar — aber sie taucht im Effizienz-Reporting nicht auf. Sie ist ein Vorindikator. Und sie entscheidet, ob die 600-Millionen-Zahl je Realität wird.


Drei Zahlen, die den Erfolg ankündigen, bevor die Bilanz ihn meldet

Time-to-Draft misst, wie schnell ein erster brauchbarer Entwurf entsteht — für ein Kundenschreiben, eine Deckungsanalyse, ein Produktkonzept. Munich Re zeigt mit der Plattform REALYTIX ZERO, deren KI-Assistent Underwriter und Produktdesigner unterstützt, dass die Gestaltung von Versicherungs- und Rückversicherungsprodukten nach Unternehmensangaben in Stunden statt Wochen erfolgen kann; drei ERGO-Bereiche in Deutschland nutzen die Plattform bereits. Time-to-Draft sinkt, lange bevor sich daraus eine Kostenquote ableiten lässt.

Time-to-Quote misst, wie schnell ein belastbares Angebot entsteht — und wie oft es beim ersten Wurf trägt. Gerade im Industrie-Underwriting ist das der Engpass: Komplexe Gewerberisiken erfordern manuell die Sichtung hunderter Datenpunkte, bevor eine Quote steht. Bei der Allianz unterstützt generative KI Underwriter inzwischen dabei, in dieser Komplexität schneller und treffsicherer zu entscheiden. Der Vorindikator ist dabei doppelt: Geschwindigkeit entscheidet, ob man im Bieterprozess überhaupt zum Zug kommt — Treffsicherheit, ob das gewonnene Geschäft profitabel ist. Eine sinkende Time-to-Quote bei stabiler Quote-Qualität ist ein Vorbote für Abschlussquote und Schadenquote zugleich.

First-Time-Right misst, wie oft ein Vorgang beim ersten Durchlauf korrekt abgeschlossen wird — ohne Nacharbeit, ohne Eskalation. Die Leistungsprüfungslösung CLARA von Munich Re verkürzt nach Unternehmensangaben die Bearbeitungszeit um bis zu 50 Prozent. Der strategische Wert liegt nicht in der Geschwindigkeit, sondern in dem, was sie vorwegnimmt: Eine steigende First-Time-Right-Quote ist ein Vorbote sinkender Bearbeitungskosten und höherer Kundenbindung — beides Spätindikatoren, die erst Quartale später in der Bilanz erscheinen. Wer First-Time-Right misst, sieht den Erfolg kommen. Wer nur die Combined Ratio misst, sieht ihn erst, wenn er da ist.


Die Kennzahl, die über alle anderen entscheidet

Adoptionsrate ist der Vorindikator, der über die drei anderen bestimmt. Time-to-Draft, Time-to-Quote und First-Time-Right messen Wirkung — aber Wirkung entsteht nur, wenn die Werkzeuge genutzt werden. ERGO macht das messbar: Über 60 Prozent der Belegschaft nutzen ERGO GPT regelmäßig und haben mehr als 2,5 Millionen Prompts eingegeben — begleitet von gezielten Befähigungsmaßnahmen wie Workshops und Prompting-Wettbewerben. Die Allianz betreibt mit AllianzGPT ein konzernweites Pendant, das seit 2023 über 60.000 aktive Nutzer zählt. Diese Zahlen sind kein Selbstzweck: Eine niedrige Adoptionsrate erklärt enttäuschende ROI-Zahlen lange, bevor das Controlling sie sieht.

📎 Weiterführend im VTM:

→ Von der Pilot-Ecke in die Produktion – Wie Versicherer KI jetzt rentabel skalieren → Wie KI-Agenten Versicherern helfen, manuelle Vorgänge zu automatisieren – ohne Chatbot-Hype

Roadmap: Vom Effizienz-Dashboard zum Vorindikator-Cockpit

Sofortmaßnahmen (0–30 Tage)

  • Inventarisieren Sie Ihr KI-Erfolgs-Reporting: Welche Kennzahlen sind Spät- (Kosten, FTE, Combined Ratio), welche Vorindikatoren (Time-to-Draft, Time-to-Quote, First-Time-Right, Adoptionsrate)? In den meisten Häusern liegt das Verhältnis bei nahezu 100 zu 0.
  • Definieren Sie für die zwei größten laufenden KI-Projekte je einen Vorindikator mit Baseline — vor dem nächsten Lenkungsausschuss.

Mittelfristige Schritte (30–90 Tage)

  • Verankern Sie die Vorindikatoren im Vorstands-Dashboard, nicht im IT-Reporting. Die Steuerungslogik ändert sich nur, wenn die Kennzahl auf Vorstandsebene sichtbar ist.
  • Differenzieren Sie nach Fachbereich, statt zentral zu mitteln. Ein Konzern-Durchschnitt bei Adoptionsrate oder First-Time-Right verdeckt genau das, was zählt: dass ein Bereich das Werkzeug lebt und der nächste es ignoriert. Die Steuerung beginnt dort, wo die Streuung sichtbar wird.

Typische Fallstricke

Erstens: Vorindikatoren werden als „weiche" Kennzahlen abgetan und im Reporting den harten Eurozahlen untergeordnet. Lösung: Jeden Vorindikator explizit mit dem Spätindikator verknüpfen, den er prognostiziert.

Zweitens: KI-Erfolg wird zentral gemessen, aber dezentral erzeugt — ohne Aufschlüsselung je Bereich steuert der Vorstand einen Durchschnitt, der die entscheidenden Unterschiede verdeckt.

KPI zur Erfolgsmessung

First-Time-Right-Quote je Sparte und Time-to-Quote im Industriegeschäft, beide gegen eine Baseline vor Rollout. Sie messen, ob KI die Organisation handlungsfähiger macht — nicht nur schlanker.


Wer den Erfolg erst in der Bilanz sieht, kann ihn nicht mehr steuern

Die BaFin hat die Letztverantwortung für KI eindeutig bei der Geschäftsleitung verortet — ein Vorstand kann sich nicht mehr auf Unwissenheit berufen. Dieselbe Klarheit ist eine Chance: Wer KI an Vorindikatoren steuert, liest sie nicht mehr im Rückspiegel der Quartalsbilanz, sondern im Cockpit der laufenden Operation. Time-to-Draft, Time-to-Quote, First-Time-Right und Adoptionsrate machen sichtbar, ob KI trägt — Wochen, bevor die Combined Ratio es bestätigt. Das ist kein weicheres Steuern, sondern ein früheres. Und früher heißt: Sie können noch eingreifen. Ihre Frage fürs nächste Führungsteam-Meeting: An welcher unserer KI-Kennzahlen erkennen wir den Erfolg, solange wir ihn noch beeinflussen können — und welche bestätigt ihn nur?


Quellen

  • Deloitte: „The ROI of AI: The paradox of rising investment and elusive returns – German Cut", Februar 2026 — deloitte.com
  • BaFin: „Orientierungshilfe zu IKT-Risiken beim Einsatz von KI in Finanzunternehmen", 18.12.2025 — bafin.de
  • Munich Re „Ambition 2030" / Effizienzziele und KI-Projekte, 18.05.2026 — finanztrends.de
  • ERGO/Munich Re Tech Trend Radar 2026, CLARA und REALYTIX ZERO, 20.04.2026 — versicherungsmagazin.de
  • ERGO GPT: Adoption und Nutzung (Interview Antonia Schiller) — ergo.com
  • KI bei der Allianz im Underwriting — allianz.com

Kooperationspartner werden

Erreichen Sie IT- und Innovations-Entscheider der DACH-Versicherungswirtschaft. Sponsored Articles, Jahrespartnerschaften und insureNXT-Pakete.

Mediadaten anfragen →

Willkommen beim

VersicherungsTech Magazin

Technologie verstehen. Versicherung verändern.
VersicherungsTech Magazin

VersicherungsTech Magazin

Technologie verstehen. Versicherung verändern.