Komplettguide zur
Versicherungsschaden-Datenextraktion (2026)
Ein einziger Autounfall-Schaden erzeugt ein ACORD-2-Formular des Geschädigten, einen Polizeibericht der Einsatzkräfte, einen Reparaturkostenvoranschlag der Werkstatt, medizinische Aufnahmeformulare bei Verletzungen und Fotos von drei Smartphones. Jedes Dokument kommt in einem anderen Format, von einer anderen Quelle, mit einem anderen Layout – und der Sachbearbeiter benötigt die strukturierten Daten aus allen, verknüpft mit demselben Schadenfall. Das ist die eigentliche Herausforderung der Datenextraktion aus Versicherungsschäden, und die meisten Extraktionstools wurden nicht dafür entwickelt.
Was ist die Extraktion von Versicherungsanspruchsdaten?
Die Extraktion von Versicherungsanspruchsdaten ist der automatisierte Prozess, bei dem Schlüsselfelder aus anspruchsbezogenen Dokumenten gelesen werden – ACORD-Schadenmeldungen, Polizeiberichte, Reparaturkostenvoranschläge, medizinische Unterlagen und andere unterstützende Anhänge – und in strukturierte Daten umgewandelt werden, die von einer Tabellenkalkulation, einem Schadenmanagementsystem oder einer Analyseplattform verarbeitet werden können. Im Gegensatz zur Standard-Extraktion von Rechnungen oder Belegen, die auf einen einzigen Dokumententyp abzielt, muss die Anspruchsextraktion ein Multi-Dokumenten-Paket verarbeiten, bei dem jede Komponente ihr eigenes Format, ihre eigenen Schlüsselfelder und ihre eigenen Extraktionsanforderungen hat.
Der Umfang geht über die Ersterstmeldung des Schadens hinaus. Eine vollständige Strategie zur Anspruchsextraktion umfasst jedes Dokument, das von der Aufnahme bis zur Regulierung in die Schadenakte gelangt: das anfängliche ACORD-Formular (ob für Kfz, Sachwerte, allgemeine Haftpflicht oder Arbeiterunfallversicherung), die unterstützenden Anhänge, die den Schaden belegen, sowie die laufende Korrespondenz und Abrechnungsdokumente, die im Laufe des Schadens anfallen. Eine detaillierte Aufschlüsselung auf Feldebene darüber, was KI aus den spezifischen ACORD-Formularen extrahieren kann und was nicht, finden Sie in unserem Begleitartikel Kann KI Versicherungsanspruchs-FNOL-Formulare lesen?
Was diese Kategorie von anderen Dokumentextraktionsaufgaben unterscheidet, ist die geschichtete Struktur eines Anspruchspakets. Die strukturierten Kopffelder des ACORD-Formulars – Policennummer, Schadensdatum, Name des Versicherten, Schadensort – folgen einem vorhersehbaren Muster und lassen sich zuverlässig extrahieren. Der Freitext im Abschnitt zur Schadensbeschreibung hingegen nicht. Die unterstützenden Dokumente – ein Polizeibericht aus einer Gerichtsbarkeit, ein Reparaturkostenvoranschlag aus einem anderen Softwaresystem, medizinische Unterlagen von einem dritten – erfordern jeweils eine separate Extraktionsstrategie. Ein vollständiger Ansatz berücksichtigt alle drei Ebenen, nicht nur die bequemste.
Warum manuelle Schadensdateneingabe teurer ist als gedacht
Die sichtbaren Kosten der manuellen Schadensdateneingabe sind klar: Ein Datenerfasser oder Sachbearbeiter tippt Feldwerte aus jedem Dokument in ein Schadenssystem ein, Zeichen für Zeichen. McKinsey schätzt, dass Automatisierung die Schadensbearbeitungszeit um bis zu 50 % verkürzen und die Kosten pro Schadenfall um bis zu 30 % senken kann. Doch diese aggregierten Zahlen unterschätzen, was manuelle Bearbeitung einen Betrieb tatsächlich kostet, denn die wahren Ausgaben treten über vier verschiedene Kanäle auf, die in den meisten Unternehmen in getrennten Budgets geführt werden.
Direkte Erfassungsarbeit. Ein Sachbearbeiter, der einen einzelnen Schadenssatz bearbeitet – ACORD-Formular plus zwei oder drei Begleitdokumente – benötigt allein für die Dateneingabe etwa 20 bis 30 Minuten. Bei 50 Schäden pro Woche sind das 17 bis 25 Stunden reine Tipparbeit. Bei einem Stundensatz von 35–45 € für einen erfahrenen Schadensbearbeiter entspricht das 600–1.100 € pro Woche an Arbeitszeit, die keinen Beurteilungswert zum Schaden beiträgt.
Die Fehlersteuer. Die manuelle Dateneingabe von Versicherungsdokumenten weist eine geschätzte Fehlerrate von 3–5 % auf Feldebene auf. Bei einem Schadenssatz mit 25–40 extrahierbaren Feldern im ACORD-Formular und den Anhängen bedeutet das ein bis zwei Fehler pro Schaden. Eine falsch getippte Policennummer verzögert die Deckungsprüfung. Ein falsches Schadensdatum löst ein Rückruf beim Versicherungsnehmer aus. Ein vertauschter Betrag im Reparaturkostenvoranschlag führt zu einer Reservenabweichung, deren Abstimmung Zeit kostet. Branchenbenchmarks gehen davon aus, dass die Korrektur eines Dateneingabefehlers pro Schaden 15–30 € kostet – und diese Kosten vervielfachen sich, wenn Fehler erst später im Prozess entdeckt werden.
Die Opportunitätskosten der Sachbearbeiterzeit. McKinsey-Studien zeigen, dass Underwriter und Schadensregulierer 30–40 % ihrer Zeit mit administrativen Aufgaben verbringen, darunter Dateneingabe und Dokumentenbeschaffung. Für einen erfahrenen Sachbearbeiter mit 100–150 offenen Schäden bedeutet das 12 bis 20 Stunden pro Woche, die mit Tippen statt mit Deckungsprüfung, Vergleichsverhandlungen oder der Bearbeitung komplexer Fälle verbracht werden. Die monetären Kosten dieser Zeit sind das volle Gehalt des Sachbearbeiters. Die Opportunitätskosten sind die Schadensbearbeitungsgeschwindigkeit – und die Kundenzufriedenheit – die diese Stunden bei einer Verlagerung auf Beurteilungsarbeit hätten erzielen können.
Verlängerte Durchlaufzeiten. Jeder manuelle Schritt zwischen Dokumenteneingang und Datenverfügbarkeit verlängert den Schadenslebenszyklus um Stunden. In Schadensabteilungen mit hohem Volumen – TPAs mit über 200 Schäden pro Tag, Katastrophenteams mit Spitzenlasten – summieren sich diese Stunden zu Tagen. Die Zufriedenheitsstudien von J.D. Power zeigen durchgängig, dass die Geschwindigkeit der Schadensmeldung einer der stärksten Treiber der Kundenzufriedenheit ist. Jeder zusätzliche Tag manueller Bearbeitung verschlechtert das Kundenerlebnis und erhöht die Wahrscheinlichkeit von Rechtsstreitigkeiten, Regulierungsbeschwerden und Eskalationen.
Die vier Kostenarten addieren sich, sie schließen sich nicht aus. Ein Betrieb, der 2.500 € pro Monat für die direkte Schadensdateneingabe ausgibt, hat wahrscheinlich einen ähnlichen Betrag für Fehlerkorrektur, verlorene Sachbearbeiterproduktivität und verlängerte Durchlaufzeiten zu tragen. Die tatsächlichen Kosten der manuellen Schadensdateneingabe sind etwa doppelt so hoch wie der sichtbare Arbeitsaufwandsposten – und sie sind über Budgets verteilt, in denen kein einzelner Bericht jemals die Gesamtsumme offenlegt.
Was die Extraktion von Versicherungsschäden von anderen Dokumenttypen unterscheidet
Die Extraktion von Versicherungsschäden teilt sich technisch die Grundlage mit der Rechnungs- oder Belegextraktion – dieselben Vision-Language-Modelle, derselbe Ansatz mit benutzerdefinierten Spalten –, doch drei strukturelle Faktoren machen sie zu einem grundlegend schwierigeren Problem.
1. Formatvarianz je nach Versicherer und Sparte. Ein ACORD 1 (Property Loss Notice) und ein ACORD 2 (Automobile Loss Notice) sehen unterschiedlich aus, da sie unterschiedliche Informationen erfassen. Aber derselbe ACORD 1, ausgefüllt über ein Applied Epic-Agenturverwaltungssystem, sieht anders aus als einer aus Vertafore AMS360, und wieder anders als ein handschriftlich auf einem Papierformular ausgefüllter. ACORD unterhält über 800 standardisierte Formulartypen. Die rund 39.000 unabhängigen Sach- und Haftpflichtversicherungsagenturen in den USA erstellen diese Formulare mit jeweils eigenen Systemkonfigurationen, Druckeinstellungen und Ausfüllgewohnheiten. Die vorlagenbasierte Extraktion, die auf festen Feldkoordinaten beruht, versagt, sobald sich das Layout ändert. Die semantische Extraktion, die Feldbeschriftungen liest, um Werte zu lokalisieren, bewältigt diese Varianz ohne Konfiguration pro Versicherer. Wir haben diesen Unterschied in unserem Erklärstück zu traditioneller OCR im Vergleich zu KI-gesteuerter Extraktion ausführlicher behandelt.
2. Das aus mehreren Dokumenten bestehende Schadenspaket. Ein Rechnungsextraktionstool verarbeitet eine Rechnung. Ein Schadensextraktions-Workflow verarbeitet einen Ordner: ein ACORD-Formular, einen Polizeibericht, einen Reparaturkostenvoranschlag, medizinische Aufnahmeprotokolle, Fotos und manchmal einen Abschleppbeleg oder Mietwagenvertrag. Jeder Dokumenttyp hat seine eigenen Standardfelder, Layoutkonventionen und Extraktionsspaltendefinitionen. Die Herausforderung liegt nicht in der Extraktion eines einzelnen Dokuments – sondern darin, alle in einem kohärenten Workflow zu extrahieren, der die Ausgaben mit demselben Schadensdatensatz verknüpft.
3. Strukturierte Felder und Freitext in einem Dokument. Das ACORD-Formular ist einzigartig darin, beide Modi auf einer einzigen Seite zu vereinen. Der Kopfbereich enthält klar beschriftete Kurztextfelder, die KI mit hoher Genauigkeit extrahiert. Der Abschnitt „Schadensbeschreibung“ ist ein leeres Feld für erzählenden Prosa – 50 Wörter oder 500, handschriftlich oder getippt, fokussiert oder abschweifend. Diese beiden Modi koexistieren im selben Dokument und erfordern grundlegend unterschiedliche Behandlung.
Die strukturierten Felder: Was Sie zuverlässig extrahieren können
Die strukturierten Kopfzeilenfelder auf ACORD-Formularen sind der Bereich, in dem die KI-Extraktion den größten Mehrwert bietet. Diese Felder haben gedruckte Bezeichnungen, begrenzte Wertebereiche und konsistente semantische Muster – ideale Bedingungen für ein Vision-Language-Modell. Nachfolgend sind die wichtigsten Felder aufgeschlüsselt nach den vier wichtigsten ACORD-FNOL-Formulartypen, die die überwiegende Mehrheit der Sach- und Haftpflichtschadenmeldungen abdecken.
ACORD 1 — Sachschadenanzeige
| Feld | Format | Realistische Genauigkeit |
|---|---|---|
| Polizzennummer | Alphanumerisch, 8–15 Zeichen | 95%+ |
| Versicherter Name & Kontakt | Name + Adresse + Telefon | 95%+ |
| Datum & Uhrzeit des Schadens | Datum + Uhrzeit | 95%+ |
| Schadensort | Adresse oder Kreuzung | 90%+ |
| Schadensart (Checkboxen) | Checkbox: Feuer/Sturm/Hagel/Wasser/Diebstahl | 85–90% |
| NAIC-Versicherungscode | 5-stellig numerisch | 95%+ |
| Geschätzte Schadenshöhe | Währung | 90%+ |
| Selbstbehalt der Police | Währung | 90%+ |
| Hypothekengläubiger / Pfandgläubiger | Name + Adresse | 85%+ |
| Polizeiberichtnummer | Alphanumerisch | 80%+ (oft leer) |
ACORD 2 — Kfz-Schadenmeldung
| Feld | Format | Realistische Genauigkeit |
|---|---|---|
| Polizzennummer | Alphanumerisch | 95 %+ |
| Versicherter Name & Kontakt | Name + Adresse + Telefon | 95 %+ |
| Fahrer-/Anspruchstellerangaben | Name + Adresse + Telefon + FS-Nr. | 90 %+ |
| Fahrzeuginformationen | FIN + Baujahr + Marke + Modell | 85–90 % (handschriftliche FIN am schwierigsten) |
| Datum, Uhrzeit & Ort des Schadens | Datum + Uhrzeit + Adresse | 95 %+ |
| Unfallart | Checkbox: Kollision/Diebstahl/Vandalismus | 85 %+ |
| Schadensbeschreibung | Checkbox-Bereich: Vorne/Hinten/Seite/Oben | 85–90 % |
| Geschätzte Schadenshöhe | Währung | 90 %+ |
| Zeugenangaben | Name + Telefon | 85 %+ |
| Polizeibericht-Nr. & Behörde | Alphanumerisch + Dienststellenname | 80 %+ |
ACORD 3 — Allgemeine Haftpflicht-Schadenmeldung
| Feld | Format | Realistische Genauigkeit |
|---|---|---|
| Polizzennummer | Alphanumerisch | 95%+ |
| Versicherter Name & Kontakt | Name + Adresse | 95%+ |
| Geschädigter Name & Kontakt | Name + Adresse + Telefon | 90%+ |
| Datum, Uhrzeit & Ort des Vorfalls | Datum + Uhrzeit + Adresse | 95%+ |
| Art des Vorfalls | Checkbox: Grundstück/Betrieb/Produkt | 85–90% |
| Verletzungsbeschreibung | Checkbox + Text (Art der Verletzung) | 85%+ |
| Angefallene Arztkosten | Währung | 90%+ |
| Zeugenangaben | Name + Telefon | 85%+ |
Das Muster ist bei allen drei Formulartypen einheitlich: beschriftete Felder mit kurzen Werten werden unabhängig von der Eingabeart (getippt oder handschriftlich) zu 85–95%+ extrahiert. Die Abweichungen resultieren aus der Lesbarkeit der Handschrift (eine hastige „5" wird als „S" bei einer Fahrgestellnummer gelesen) und der Qualität der Markierungen (ein heller Bleistifthaken wird als nicht gesetzt gelesen) – nicht aus der Unfähigkeit der KI, das Feld auf der Seite zu lokalisieren. Da die semantische Extraktion Feldbezeichnungen liest und nicht auf feste Koordinaten angewiesen ist, funktioniert dieselbe Spaltendefinition für „Polizzennummer" sowohl auf einem ACORD 1 aus einem PDF des Versichererportals als auch auf einem am Straßenrand fotografierten ACORD 2 – ohne Vorlagen oder konfiguration pro Versicherer.
Die Freitext-Schilderung: Eine andere Strategie
Der Abschnitt „Schadensbeschreibung“ im ACORD-Formular ist der Punkt, an dem die KI-Extraktion an eine strukturelle Grenze stößt. Dieser Abschnitt enthält die eigene Schilderung des Geschädigten – eine Erzählung in Prosa, meist 200 bis 500 Wörter lang – die keinem extrahierbaren Muster folgt. Eine Unfallbeschreibung könnte lauten: „Ich hielt an der Ampel auf der Hauptstraße. Ein Lkw fuhr mir von hinten auf.“ Eine Sachschadensbeschreibung: „Gegen 15 Uhr bemerkte ich Wasser auf dem Küchenboden. Ich ging auf den Dachboden und fand ein geplatztes Rohr.“ Derselbe Unfallhergang kann von drei verschiedenen Geschädigten auf drei unterschiedliche Arten beschrieben werden – mit jeweils anderem Satzbau, Wortwahl und Detailgrad.
Moderne visuelle KI kann den Text dieser Schilderung mit hoher Genauigkeit extrahieren – handschriftliche oder getippte Wörter von der Seite lesen und als Textblock in einer Tabellenzelle darstellen. Dieser Teil funktioniert zuverlässig. Was nicht funktioniert, ist der Schritt, den sich die meisten Schadensabteilungen eigentlich wünschen: diese Schilderung automatisch in strukturierte Felder wie „Schadensursachenkategorie“, „Verursacher“ oder „Verletzungsschwere“ einzuordnen. Sprachmodelle, die diese Klassifizierung versuchen, erzielen Fehlerraten von 25–30 %, was für jeden nachgelagerten Prozess, der auf korrekte Ergebnisse angewiesen ist, zu hoch ist.
Der empfohlene Ansatz für die Schadensbearbeitung ist, die Schilderung als Rohtext in ein einzelnes Feld zu extrahieren. Der Sachbearbeiter liest dieses Feld – genau wie er es auf dem Papierformular lesen würde – während die strukturierten Felder (Policeinnummer, Schadensdatum, Beträge, Fahrzeugdetails) bereits in der Tabelle ausgefüllt sind. Die Zeitersparnis ergibt sich daraus, dass diese strukturierten Felder nicht neu eingegeben werden müssen, nicht aus dem Versuch, die Schilderung in eine Klassifizierung zu zwingen, die sie nicht hergibt.
Begleitdokumente: Ein Schadenfall, mehrere Extraktionsstrategien
Ein Schadenspaket besteht in der Praxis selten nur aus dem ACORD-Formular. Begleitdokumente überwiegen das primäre Formular im Verhältnis von zwei zu eins oder drei zu eins, und jeder Typ erfordert sein eigenes Extraktionsprofil. Hier ist, wie die häufigsten Anhänge der Extraktionsstrategie zugeordnet werden.
Polizeiberichte
Polizeiberichte sind die am häufigsten beigefügten Belege. Sie enthalten wichtige strukturierte Daten – Name und Dienstnummer des ermittelnden Beamten, Berichtsnummer, Datum und Uhrzeit der Aufnahme, Angabe zum Unfallverursacher, Bußgeldinformationen, Hinweise zu Wetter und Straßenzustand sowie einen erzählenden Abschnitt, der oft das wiederholt oder ergänzt, was der Geschädigte im ACORD-Formular angegeben hat. Die Herausforderung bei der Extraktion von Polizeiberichten liegt nicht in der Komplexität der Felder, sondern in der Formatvielfalt. In den USA gibt es rund 18.000 Strafverfolgungsbehörden, jede mit eigenem Berichtslayout. Manche verwenden den standardisierten NHTSA-Modellbericht für Verkehrsunfälle. Andere nutzen länderspezifische Formulare (das kalifornische CHP 555, das texanische CR-3). Viele setzen auf kundenspezifische Berichtsformate aus ihrem Vorgangsverwaltungssystem. Ein vorlagenbasierter Ansatz würde für jede Behörde eine eigene Vorlage erfordern. Die semantische Extraktion bewältigt alle mit einer einzigen Spaltendefinition, da sie die Bezeichnungen im Bericht liest – „Name des Beamten", „Berichtsnummer", „Unfallverursacher" – unabhängig von deren Position auf der Seite.
Reparaturkostenvoranschläge
Reparaturkostenvoranschläge von Karosseriewerkstätten und Handwerkern enthalten Einzelposten, die für die Rückstellungsbildung und Vergleichsverhandlungen unerlässlich sind. Zu den wichtigsten extrahierbaren Feldern gehören: Name und Kontaktdaten der Werkstatt oder des Handwerkers, Datum des Kostenvoranschlags, Fahrzeug- oder Objektkennung, Arbeitsstunden und Stundensatz pro Position, Teilekosten (OEM vs. Nachbau vs. Gebraucht), Lack und Materialien, Zwischensumme, Steuer und Gesamtsumme. Kostenvoranschläge sind am wertvollsten, wenn sie als Tabelle mit einer Zeile pro Position extrahiert werden – sodass der geschätzte Gesamtschaden aus der Summe aller Positionen berechnet werden kann, anstatt sich auf eine handschriftliche Gesamtsumme zu verlassen, die bestimmte Kostenarten auslassen könnte. Der Kostenvoranschlag muss außerdem mit dem zugehörigen Schadensdatensatz verknüpft werden, was bedeutet, dass der Extraktionsworkflow die auf dem Kostenvoranschlag erscheinende Schadens- oder Policennummer erfassen muss, selbst wenn sie handschriftlich am Rand notiert ist.
Krankenakten & Aufnahmeformulare
Bei Schadensfällen mit Verletzungen – Autounfälle, Arbeitsunfälle, Haftpflichtfälle – gelangen medizinische Unterlagen schnell in die Schadensakte. Notaufnahmeformulare, Einsatzprotokolle des Rettungsdienstes, Anordnungen für bildgebende Diagnostik und erste Behandlungsnotizen enthalten alle strukturierte Felder (Patientenname, Behandlungsdatum, NPI des Leistungserbringers, Diagnosecodes, Abrechnungscodes) gemischt mit klinischen Notizen. Die Extraktionsstrategie spiegelt den ACORD-Ansatz wider: Extrahieren Sie die strukturierten Felder (Daten, Codes, Identitäten der Leistungserbringer, abgerechnete Beträge) mit Spaltendefinitionen und behalten Sie klinische Notizen als Freitext zur Prüfung durch den Sachbearbeiter oder Pflegefallmanager bei.
Fotos
Schadensfotos – Kollisionsfotos von Fahrzeugen, Brandschäden, Wasserschäden, defekte Geräte – können im herkömmlichen Sinne nicht für strukturierte Daten extrahiert werden. Aus einem Foto lässt sich kein „Geldbetrag“ ablesen. Computervision-Modelle können jedoch Schadenstypen identifizieren und klassifizieren (z. B. „Frontalkollision“, „Hagelschaden am Dach“, „Wasserfleck an der Decke“), sofern der Schadensbetrieb einen Anwendungsfall für die automatisierte Schadenscodierung hat. Für die meisten Schadenteams besteht der praktische Ansatz darin, Fotos als unterstützende Beweise zu behandeln, die das Schadenerfassungssystem erhält und mit dem Schadensdatensatz verknüpft, ohne eine strukturierte Extraktion zu versuchen.
Die wichtigste betriebliche Erkenntnis für alle unterstützenden Dokumenttypen: Jeder benötigt seine eigene Extraktionsspaltendefinition, und der Workflow muss sicherstellen, dass die Ausgaben aller Dokumente mit demselben Schadensdatensatz verknüpft bleiben. Dies ist kein einzelnes Extraktionsproblem. Es ist eine Familie von Extraktionsproblemen, die um ein einziges Schadensereignis herum organisiert sind.
Traditionelle Methoden vs. KI-gestützte Extraktion
Der konventionelle Ansatz zur Datenerfassung von Versicherungsschäden hat zwei Varianten: manuelle Eingabe und templatebasierte OCR. Beide teilen dieselbe grundlegende Einschränkung – sie behandeln jedes Schadensdokument so, als ob sein Layout vorhersagbar wäre, was es in der realen Schadenerfassung nicht ist.
| Dimension | Manuelle Eingabe | Template-OCR | Semantische KI-Extraktion |
|---|---|---|---|
| Einrichtung pro Spediteur-Formulartyp | Keine (Mensch passt an) | Template pro Formular × Agentursystem-Kombination | Null — eine Spaltendefinition pro Feld |
| Gemischter Spediteur-Batch | Nacheinander, eins nach dem anderen | Nur Formulare mit gleichem Layout | Gemischte Spediteure, gemischte Formulartypen |
| Begleitdokumente | Liest jeden Dokumententyp separat | Template pro Dokumententyp × Layout | Ein Spaltensatz pro Dokumententyp |
| Handschrift auf strukturierten Feldern | Liest die meisten Handschriften | Scheitert bei den meisten Handschriften | 85–95 % bei strukturierten Feldern |
| Widerstandsfähigkeit bei Formatänderungen | N/V — Mensch passt an | Bricht, bis Template aktualisiert wird | Verarbeitet neue Layouts automatisch |
| Zeit pro Schadenspaket | 20–30 Min. | 5–10 Min. (falls Templates vorhanden) | 5–10 Sekunden |
| Fehlerrate auf Feldebene (strukturiert) | 3–5 % | 5–8 % bei Nicht-Template-Formaten | Unter 2 % bei gekennzeichneten Feldern |
Der semantische KI-Ansatz — vorlagenfreie Dokumentenextraktion — ist für Schadensfälle wichtiger als für jede andere Dokumentenkategorie, aufgrund der schieren Formatvielfalt bei der realen Schadenserfassung. Ein ACORD 2, der als sauberes PDF aus einem Spediteurportal eingeht, und dasselbe Formular als gefaxte Kopie mit handschriftlichen Feldern in den Rändern sind derselbe Dokumententyp, der dieselben Spalten erfordert, aber ein templatebasiertes System bräuchte zwei Konfigurationen. Ein semantisches System verarbeitet beide mit einer.
Stapelverarbeitung von Schadensformularen mit mehreren Versicherern
Der praktische Workflow für Schadensabteilungen, die 50–200 Schadensfälle pro Tag bearbeiten, ist die Stapelverarbeitung: Hochladen eines Ordners mit Schadensunterlagen, Extrahieren der strukturierten Felder aus jedem enthaltenen Dokument und Exportieren aller Daten in eine einheitliche Tabelle mit einem Schadensnummernschlüssel, der die Zeilen der einzelnen Dokumenttypen verknüpft.
Ein typischer Stapel-Workflow sieht so aus:
Die stapelorientierte Verarbeitung ist für Schadensabteilungen kein nachträglicher Einfall. Sie ist der einzige Workflow, der skaliert, wenn ein TPA Schadensfälle von 50 verschiedenen Versicherern bearbeitet, die jeweils eine andere ACORD-Darstellung verwenden, und Begleitdokumente über ein Dutzend verschiedene Eingangskanäle eingehen.
So wählen Sie ein Tool zur Schadendatenextraktion aus
Nicht jedes Extraktionstool eignet sich für Versicherungsschäden. Die Dokumentenmischung – strukturierte Formulare, Freitextberichte, mehrseitige Anhänge – erfordert spezifische Fähigkeiten, die allgemeine OCR-Tools oft nicht bieten. Hier sind die Kriterien, die speziell für die Schadenbearbeitung entscheidend sind.
Vorlagenfrei oder vorlagenbasiert. Dies ist die folgenreichste Entscheidung. Wenn das Tool für jeden Versicherer, jeden Formulartyp und jeden Eingangskanal Vorlagen erstellen und pflegen muss, wird es der Formatvielfalt der realen Schadeneingänge nicht standhalten. Ein vorlagenfreier Ansatz – bei dem Spaltendefinitionen über Formulartypen, Versicherer und Layouts hinweg funktionieren – beseitigt den Konfigurationsaufwand, der dazu führt, dass Automatisierungspiloten nach der Proof-of-Concept-Phase ins Stocken geraten.
Unterstützung mehrerer Dokumenttypen. Das Tool muss ACORD-Formulare, Polizeiberichte, Reparaturkostenvoranschläge und Arztberichte als separate Dokumenttypen mit eigenen Spaltendefinitionen verarbeiten – und nicht alles als „ein Dokument" behandeln.
Handschrifterkennung. Ein erheblicher Teil der Schadenformulare wird handschriftlich ausgefüllt – am Straßenrand, im Krankenhaus, auf einem Klemmbrett. Liegt die Handschrifterkennung bei strukturierten Feldern unter 85 %, scheitert die strukturierte Feldautomatisierung, weil zu viele Ausgaben korrigiert werden müssen.
Stapel-Export in Tabellenkalkulation oder Schadensystem. Die Ausgabe sollte eine strukturierte Datei (Excel, CSV) sein, die ohne manuelle Neuformatierung in Guidewire ClaimCenter, Duck Creek Claims oder jede andere Schadenmanagement-Plattform geladen werden kann.
Kein Training erforderlich. Schadenteams haben nicht das Volumen, um benutzerdefinierte Modelle zu trainieren. Ein Tool, das 10–50 Beispieldokumente pro Formulartyp benötigt, um Ihre Schadenformate zu „lernen", ist für den Versicherungseingangsfall nicht geeignet, da regelmäßig neue Versichererformate und Varianten von Belegdokumenten auftauchen.
Häufig gestellte Fragen
Welche Dokumenttypen sind in der Datenextraktion von Versicherungsschadensfällen enthalten?
Die Schadensextraktion umfasst das gesamte Schadenspaket: ACORD-Verlustmeldungen (ACORD 1 für Sachschäden, ACORD 2 für Kfz, ACORD 3 für allgemeine Haftpflicht, ACORD 4 für Arbeiterunfallversicherung), Polizeiberichte, Reparaturkostenvoranschläge für Kfz und Gebäude, medizinische Aufnahmeunterlagen und Rechnungen sowie begleitende Korrespondenz. Jeder Dokumenttyp erfordert eine eigene Extraktionsspaltendefinition, aber alle Ausgaben werden zur konsolidierten Verarbeitung über die Schadens- oder Policennummer verknüpft.
Wie genau ist die KI-Extraktion bei Versicherungsschadensformularen im Vergleich zur manuellen Eingabe?
Bei den strukturierten Kopffeldern – Policennummer, Name des Versicherten, Datum und Ort des Schadens, Beträge – erreicht die KI-Extraktion eine Genauigkeit von 90–95 %+, was messbar besser ist als die feldbezogene Fehlerrate von 3–5 % bei der manuellen Dateneingabe. Die verbleibenden Fehler konzentrieren sich auf bestimmte Feldtypen (handschriftliche Fahrzeug-Identifikationsnummern, teilweise angekreuzte Kästchen) und sind vorhersagbar genug, um einen gezielten Stichproben-Workflow zu erstellen. Manuelle Fehler hingegen sind zufällig – jedes Feld kann aus beliebigem Grund falsch sein –, was sie ohne vollständiges erneutes Lesen jedes Dokuments schwerer zu erkennen macht.
Kann KI die narrative Schadenschilderung aus einem Schadensformular extrahieren?
Sie kann den Text der Schilderung mit hoher Genauigkeit extrahieren – handschriftliche oder getippte Wörter lesen und als Textblock in einer Tabellenzelle darstellen. Sie kann diese Schilderung jedoch nicht zuverlässig in strukturierte Felder wie „Schadensursache“ oder „Schuldiger“ kategorisieren. Sprachmodelle, die eine Klassifizierung der Schilderung versuchen, weisen eine Fehlerrate von 25–30 % auf, was die Ausgabe für Deckungs- oder Haftungsentscheidungen unzuverlässig macht. Der empfohlene Workflow besteht darin, die Schilderung als Rohtext zu extrahieren und den Sachbearbeiter direkt lesen zu lassen, während die strukturierten Felder – die den Großteil des Dateneingabeaufwands ausmachen – automatisiert werden.
Funktioniert die KI-Extraktion auch mit Polizeiberichten aus verschiedenen Zuständigkeitsbereichen?
Ja – und genau hier hat die vorlagenfreie Extraktion einen entscheidenden Vorteil gegenüber herkömmlicher OCR. In den USA gibt es rund 18.000 Strafverfolgungsbehörden, jede mit einem eigenen Berichtsformat. Vorlagenbasierte OCR würde für jede Behörde eine separate Vorlage erfordern. Die semantische Extraktion liest die Feldbezeichnungen auf jedem Bericht – „Name des Beamten", „Berichtsnummer", „Unfallverursacher" – um die Werte zu lokalisieren, sodass eine einzige Spaltendefinition für alle Behördenformate ausreicht. Das gleiche Prinzip gilt für Reparaturkostenvoranschläge, die je nach Schätzsoftware (CCC, Mitchell, Audatex) variieren.
Wie gut verarbeitet KI handschriftliche Schadensformulare?
Bei strukturierten Feldern mit klaren Feldbezeichnungen erreicht die Extraktion handschriftlicher Formulare bei den meisten Handschriftqualitäten eine Genauigkeit von 85–90 %. Die häufigste Fehlerquelle sind einzelne Zeichenfehler – eine handschriftliche „5" wird als „S" gelesen, eine „0" als „O" – und nicht das vollständige Verfehlen eines Feldes. Schadensformulare, die unter widrigen Bedingungen ausgefüllt werden (am Straßenrand nach einem Unfall, in einem schwach beleuchteten Raum), weisen tendenziell eine hastigere Handschrift auf, die die Genauigkeit in den unteren Bereich dieser Spanne drückt. Ein praktischer Schadensbearbeitungs-Workflow umfasst einen 1–2-minütigen Validierungsschritt, um die 2–3 kritischsten Felder jedes Schadensformulars stichprobenartig zu prüfen.
Können extrahierte Schadensdaten direkt in Guidewire oder Duck Creek exportiert werden?
Ja. Das Extraktionsergebnis ist eine strukturierte Datei – Excel, CSV oder JSON – die in jedes Schadensmanagementsystem importiert werden kann, das Batch-Daten-Uploads akzeptiert. Die Spaltenüberschriften entsprechen den von Ihnen bei der Extraktionseinrichtung definierten Feldnamen, sodass die Daten in den richtigen Systemfeldern landen. Für Teams mit hohem Bearbeitungsvolumen kann der Batch-Export auch so konfiguriert werden, dass für jeden Dokumenttyp (ACORD-Felder, Polizeiberichtsfelder, Kostenvoranschlagsfelder) separate Blätter oder Dateien erstellt werden, die über die Schadens- oder Policennummer verknüpft sind.
Funktioniert das auch für Formulare zur Arbeitsunfallanzeige?
Ja. Formulare zur Arbeitsunfallanzeige (FNOL) haben denselben Aufbau wie andere ACORD-basierte Schadenmeldungen: eine Reihe von beschrifteten Kopfzeilenfeldern (Name des Arbeitgebers, Name des Arbeitnehmers, Unfalldatum, Art der Verletzung, betroffener Körperteil, behandelnder Arzt) sowie eine Freitextbeschreibung des Unfalls. Die strukturierten Felder werden mit derselben Genauigkeit extrahiert wie bei Sach- und Kfz-Schäden. Bei Arbeitsunfällen fallen zudem weitere Begleitdokumente an – ärztlicher Erstbericht, Formulare zur Wiedereingliederung, Lohnabrechnungen – die jeweils mit einem eigenen Extraktionsspaltensatz verarbeitet werden können.
Kann KI Daten aus Fotos von Fahrzeugschäden extrahieren?
Nicht im herkömmlichen Sinne strukturierte Daten. Computervisionsmodelle können Schadensarten (Frontalaufprall, Hagelschaden, Brandschaden) klassifizieren und Schweregrade schätzen, aber sie können allein aus einem Foto keinen Geldwert oder eine Teileliste ausgeben. Fotos eignen sich am besten als Beleg, der mit dem Schadensdatensatz verknüpft wird, während strukturierte Kostenvoranschläge von Werkstätten oder Gutachtern die Daten liefern, die in die Rückstellungen und Abrechnungen einfließen.
Wie viele Schadenformulare können in einem Durchgang verarbeitet werden?
Es gibt praktisch keine Obergrenze für die Stapelgröße bei der KI-Extraktion. Schadenteams verarbeiten routinemäßig 100–200 Schadenmeldungen in einem Durchgang – gemischt aus ACORD-Formularen verschiedener Versicherer, Polizeiberichten unterschiedlicher Behörden und Reparaturkostenvoranschlägen diverser Werkstätten. Die Verarbeitungszeit skaliert linear mit der Dokumentenanzahl und beträgt durchschnittlich 5–10 Sekunden pro Dokument, unabhängig von Format oder Versicherer. Für höhere Volumen unterstützt der Stapelworkflow die parallele Verarbeitung über Teampläne.
Wie beginne ich mit dem Testen der KI-Extraktion für meine eigenen Schadenformulare?
Laden Sie ein gescanntes ACORD-Formular hoch – für Sach-, Kfz- oder Betriebshaftpflichtschäden – oder ein Foto eines ausgefüllten Schadenformulars. Für den ersten Test ist keine Registrierung erforderlich. Definieren Sie die Spalten, die Ihr Schadensystem benötigt: Police-Nummer, Schadensdatum, Versicherungsnehmer, Schadensort, Geschätzte Schadenshöhe, Schadensart. Sehen Sie die Extraktionsergebnisse in Sekundenschnelle. Eine vollständige Anleitung zur Stapelverarbeitung von Formularen mehrerer Versicherer und Begleitdokumenten finden Sie in unseren Schritt-für-Schritt-Anleitungen für bestimmte Schadendokumenttypen.
Der Vorteil der semantischen Extraktion für Schadenfälle liegt darin, dass sie sich an die Formatvielfalt anpasst, die Sie bereits manuell bewältigen – ohne dass Sie für jeden Versicherer, Formulartyp oder Eingangskanal Vorlagen erstellen müssen. Die strukturierten Felder auf ACORD-Formularen, Polizeiberichten und Reparaturkostenvoranschlägen sind dieselben, unabhängig davon, ob das Dokument als Portal-PDF, Faxkopie oder Smartphone-Foto eingeht. Definieren Sie Ihre Spalten einmal, und die KI findet die Werte, wo immer die Bezeichnungen auftauchen.
Jetzt mit eigenen Schadendokumenten testen