Was ist COI-Datenextraktion?
ACORD-Formulare in strukturierte Daten umwandeln
Die COI-Datenextraktion (Certificate of Insurance) ist der automatisierte Prozess, bei dem wichtige Versicherungsfelder – wie Policennummer, Versicherungsnehmer, Deckungsarten, -summen, Beginn- und Ablaufdaten sowie Status als zusätzlicher Versicherter – aus einem gescannten oder als PDF vorliegenden COI-Formular ausgelesen und als strukturierte Daten für das Compliance-Tracking ausgegeben werden. Statt dass eine Person jedes ACORD-25-Zertifikat öffnet und manuell Versicherernamen und Deckungssummen Zelle für Zelle in eine Tabelle eintippt, übernimmt die Extraktionssoftware das Lesen und die Dateneingabe in Sekunden.
Wichtige Erkenntnisse
- Die meisten COI-Extraktionstools zeichnen ein Kästchen um die Stelle, an der sich jedes Feld befinden sollte – und lesen stillschweigend den falschen Text, wenn das Formular der nächsten Agentur um einen halben Zentimeter verschoben ist.
- Hinter einer einzigen falsch eingegebenen Deckungssumme auf dem COI eines Subunternehmers verbirgt sich eine Haftungslücke im siebenstelligen Bereich – und vorlagenbasierte Tools produzieren diese Fehler immer dann, wenn eine Agentur ihr Formularlayout ändert.
- Eine Extraktion, die Felder nach Bedeutung statt nach Position liest, verarbeitet jedes Agenturformat ohne Einrichtung – und die eigentliche Veränderung ist nicht der Geschwindigkeitsgewinn, sondern dass Übertragungsfehler nicht mehr Teil Ihrer Compliance-Gleichung sind.
Was COI-Datenextraktion eigentlich bedeutet
COI-Datenextraktion ist nicht dasselbe wie das Scannen eines Zertifikats oder die Anwendung von OCR. Scannen liefert ein Bild des Formulars. OCR wandelt das Bild in lesbaren Text um – eine undifferenzierte Zeichenwand. Die Extraktion geht weiter: Sie identifiziert, welcher Text die Policennummer ist, welcher die Summe der allgemeinen Haftpflichtversicherung, welcher das Ablaufdatum, und ordnet jeden Wert einer beschrifteten Spalte in einer Tabelle zu. Das Ergebnis ist keine Textdatei. Es sind strukturierte, filterbare, sortierbare Daten.
Das Standardmedium für diese Daten ist das ACORD 25 – „Certificate of Liability Insurance“ – das am weitesten verbreitete COI-Formular auf dem US-amerikanischen Gewerbeversicherungsmarkt. Entwickelt von der Association for Cooperative Operations Research and Development (ACORD), fasst dieses einseitige Formular Deckungsdetails aus einer über 100-seitigen Police in einem standardisierten Raster zusammen. Doch für die Extraktion ist Folgendes entscheidend: Fast jede Versicherungsagentur modifiziert das Standard-ACORD-Layout. Manche fügen eigene Kopf- und Fußzeilen hinzu. Manche ordnen die Deckungsabschnitte neu an. Manche verwenden elektronische Ausfüllhilfen, die Feldpositionen verschieben. Manche geben noch immer mit Schreibmaschine ausgefüllte Papierformulare aus, die mit leichter Schieflage gescannt werden. Das Formular ist nur dem Namen nach standardisiert.
Die Felder, die typischerweise aus einem ACORD-25-COI extrahiert werden, lassen sich in drei Gruppen einteilen:
Policenidentität
- Versicherter
- Policennummer
- Versicherer
- NAIC-Nummer
- Vermittler / Agentur
Deckung & Limits
- Allgemeine Haftpflicht (je Schadensfall / Jahresgesamt)
- Kfz-Haftpflicht
- Arbeitsunfallversicherung
- Dach-/Exzedentenhaftpflicht
- Berufshaftpflicht (falls zutreffend)
Daten & Parteien
- Versicherungsbeginn
- Versicherungsablauf
- Zertifikatsinhaber
- Mitversicherter
- Beschreibung der Tätigkeiten
Die korrekte Erfassung der Deckungssummenzeilen ist der Punkt, an dem sich Extraktion von OCR unterscheidet. Der Abschnitt zur allgemeinen Haftpflicht allein umfasst bis zu fünf Unterlimits – je Schadensfall, Schäden an gemieteten Räumlichkeiten, Arztkosten, Personen- und Werbeschäden sowie Jahresgesamt – die oft in einem kompakten Raster dargestellt werden, bei dem die Spaltenausrichtung zwischen den Agenturen variieren kann. Ein Tool, das Bedeutung statt Position liest, kann „1.000.000 $“ als Limit pro Schadensfall identifizieren, selbst wenn die Beschriftung darüber bei einer Agentur „JE SCHADENSFALL“ und bei einer anderen „PRO SCHADEN“ lautet.
COI-Datenextraktion vs. COI-Tracking-Software vs. manuelle Prüfung
Diese drei Begriffe werden in der Baubranche oft synonym verwendet, bezeichnen aber unterschiedliche Ebenen desselben Problems – und ihre Vermischung führt dazu, dass man eine Plattform kauft, die ein Problem löst, das man gar nicht hat, oder schlimmer noch, die Komponente übersieht, die man tatsächlich braucht.
Manuelle COI-Prüfung ist die Basis: Jemand öffnet jedes PDF-Zertifikat, liest den Versicherungsnehmer, die Police-Nummer, Deckungssummen und das Ablaufdatum und trägt diese Werte in eine Tracking-Tabelle ein. So arbeiten die meisten kleinen und mittleren Generalunternehmer. Die Tabelle dient dann als Compliance-Nachweis – sortiert nach Ablaufdatum, gefiltert nach Projekt, manuelle Kennzeichnung von Lücken. Der Dateneingabeschritt dauert 5-10 Minuten pro Zertifikat. Bei 40 Subunternehmern sind das 3-7 Stunden pro Verlängerungszyklus. Bei 200 ist es ein Vollzeitjob ohne Ende.
COI-Datenextraktion automatisiert nur den Dateneingabeschritt. Sie sendet keine Verlängerungserinnerungen, pflegt kein Lieferantenportal, vergleicht keine extrahierten Grenzen mit vertraglichen Anforderungen – sie liest das Zertifikat und gibt strukturierte Daten aus. Sie entscheiden weiterhin, wohin diese Daten gehen und was damit geschieht. Für einen Generalunternehmer, der bereits einen funktionierenden tabellenbasierten Compliance-Prozess hat, beseitigt die Extraktion den Engpass, ohne eine Workflow-Änderung zu erzwingen.
COI-Tracking-Software – Plattformen wie myCOI (umbenannt in illumend), TrustLayer, bcs und Jones – automatisiert den gesamten Compliance-Workflow: automatisierte Verlängerungsanfragen an Subunternehmer, Lieferantenportale für direkten Upload, Kennzeichnung von Deckungslücken gemäß Projektanforderungen, prüfungsbereite Berichte und Integrationen mit Procore oder CMiC. Diese Plattformen beginnen bei 200-500 $ pro Monat und sind für Organisationen konzipiert, bei denen die COI-Compliance von Subunternehmern eine Abteilungsfunktion ist. Der Extraktionsschritt ist eine Komponente darin – aber gebündelt mit Workflow-Management, das Sie vielleicht brauchen oder auch nicht.
Die Unterscheidung ist wichtig, weil ein Generalunternehmer mit 30 Subunternehmern nicht dasselbe Problem hat wie ein nationaler Auftragnehmer mit 300. Bei 30 Subunternehmern ist der Engpass die Dateneingabe – das fehlerfreie Erfassen von 30 ACORD-Formularen. Bei 300 Subunternehmern ist der Engpass der Workflow – das Verfolgen von Verlängerungen über Hunderte von Ablaufdaten hinweg ohne System. Extraktion löst Ersteres. Tracking-Plattformen lösen Letzteres. Zu verstehen, welche Ebene zu Ihrer Größe passt, ist die entscheidende Frage.
So funktioniert die COI-Datenextraktion
Der Mechanismus moderner COI-Extraktion unterscheidet sich grundlegend von der Dokumentenverarbeitung vor einem Jahrzehnt. Dieses Verständnis erklärt, warum die Extraktionsgenauigkeit bei Versicherungszertifikaten in den letzten drei Jahren von unzuverlässig auf produktionsreif gestiegen ist.
Positionsbasiert (Template-OCR)
Zeichnet ein Begrenzungsrechteck um die Stelle, an der "Police-Nummer" auf der Seite erscheinen sollte. Extrahiert den Text innerhalb dieses Rechtecks. Verschiebt die nächste Agentur das ACORD-25-Feld um einen halben Zoll – andere Schriftart, andere Ränder, andere Software – erfasst das Rechteck den falschen Text oder gar nichts. Jede Formatvariation erfordert eine neue Vorlage.
Semantisch (KI-Extraktion)
Liest die gesamte Seite und versteht, was jede Information bedeutet. Erkennt, dass "GEN'L AGGREGATE LIMIT" und "GENERAL AGGREGATE" dasselbe meinen – unabhängig von Abkürzung, Schriftart oder Position. Findet die Police-Nummer durch Erkennung des Musters einer Polizeikennung – nicht durch Suche an einer festen Koordinate. Ein Setup funktioniert mit jeder Agenturversion des ACORD-Formulars.
Dieser Wandel von positionsbasierter zu semantischer Extraktion ermöglicht es einem Tool, COIs verschiedener Versicherungsagenturen im selben Batch ohne Konfigurationsänderungen zu verarbeiten. Eine Agentur in Texas platziert den Zertifikatsinhaber-Block vielleicht unten links mit 10pt-Schrift. Eine Agentur in Kalifornien platziert ihn unten mittig mit 8pt. Ein vorlagenbasiertes Tool benötigt zwei separate Vorlagen – und beide versagen, wenn eine Agentur ihre Formularsoftware ändert. Semantische Extraktion verarbeitet beides ohne Einrichtung, da sie nicht auf Koordinaten achtet. Sie sucht nach einem Feld namens "Zertifikatsinhaber" und dem dazugehörigen Namen.
Der Extraktionsworkflow selbst ist unabhängig von der zugrunde liegenden Technologie unkompliziert:
COI hochladen
PDF oder gescanntes Bild des Zertifikats ablegen. Standard-ACORD-25-Formulare und die meisten ausstellenden Versicherer werden unterstützt.
Extraktionsziele definieren
Geben Sie die benötigten Spaltennamen ein – "Police-Nummer", "GL Each Occurrence Limit", "Ablaufdatum". Die KI liest das Dokument und findet jeden Wert anhand der Bedeutung, nicht der Position. Dies ist die benutzerdefinierte Spaltenextraktion: Sie definieren die Ausgabespalten, die KI lokalisiert passende Daten, wo immer sie im Formular erscheinen.
Prüfen und exportieren
Extrahierte Felder erscheinen in einer strukturierten Tabelle. Überprüfen Sie die Ausgabe – insbesondere zusätzliche Versichertenklauseln und Deckungssummen – und exportieren Sie nach Excel, CSV oder direkt in ein Google Sheet.
Dateien werden sicher verarbeitet und nicht gespeichert.
Die KI liest die auf dem Zertifikatsformular aufgedruckten Felder – sie liest nicht die gesamte Versicherungspolice dahinter und bewertet nicht, ob eine zusätzliche Versichertenklausel (z. B. CG 20 10 vs. CG 20 37) Ihren vertraglichen Anforderungen entspricht. Die Extraktion sagt Ihnen, was auf dem Zertifikat steht. Ein Compliance-Experte stellt fest, ob das, was dort steht, Ihren Standards genügt.
Wann Sie COI-Datenextraktion benötigen
COI-Extraktion ist kein universelles Bedürfnis. Für ein Unternehmen, das drei Zertifikate pro Jahr erhält, ist die manuelle Eingabe schneller als die Einrichtung eines Tools. Es gibt jedoch spezifische Szenarien, in denen Umfang und Wiederkehr der COI-Verarbeitung die Extraktion zum Unterschied zwischen einem beherrschbaren Prozess und einem Compliance-Risiko machen.
Compliance von Nachunternehmern für Generalunternehmer
Der dominierende Anwendungsfall. Ein mittelgroßer Generalunternehmer mit 40–80 Nachunternehmern auf mehreren aktiven Baustellen erhält fortlaufend COIs – neue Subunternehmer kommen hinzu, bestehende verlängern ihre Policen mitten im Projekt, Deckungsänderungen nach Schadensfällen. Jede Bescheinigung erfordert die Extraktion derselben Felder und den Abgleich mit denselben Projektanforderungen. Bei 5–10 Minuten manueller Prüfung pro Bescheinigung verschlingt allein die Dateneingabe 3–7 Stunden pro Verlängerungszyklus. Die Extraktion reduziert dies auf unter eine Minute pro Bescheinigung. Der Zeitgewinn ist nicht der entscheidende Vorteil – die Vermeidung von Übertragungsfehlern bei Deckungssummen ist es. Ein falsch eingegebener Aggregatgrenzwert in einer COI eines Subunternehmers bedeutet eine Haftungslücke in Millionenhöhe, die niemand bemerkt, bis ein Schaden abgelehnt wird.
Lieferanten- und Anbieter-Onboarding
Große Immobilienverwalter, Gesundheitsnetzwerke und Fertigungsbetriebe nehmen jährlich hunderte Lieferanten auf – jeder benötigt einen Versicherungsnachweis, bevor er das Gelände betritt. Die COIs treffen während der Onboarding-Saison in einer Flut und das ganze Jahr über in einem Rinnsal ein. Manuelle Prüfung in diesem Umfang führt zu Rückständen, bei denen Lieferanten tagelang auf die Compliance-Freigabe warten. Die Extraktion verkürzt den Dateneingabeschritt auf Sekunden, sodass die Prüfzeit für die Beurteilung bleibt – ob die zusätzliche Versichertenklausel korrekt ist, ob die Deckungssummen dem Vertrag entsprechen – statt für den Übertragungsschritt.
Mieter-COIs in der Immobilienverwaltung
Gewerbliche Immobilienverwalter verlangen von jedem Mieter COIs als Mietbedingung. Ein einziges Bürogebäude mit 50 Mietern bedeutet 50 zu verfolgende Bescheinigungen, jede mit einem anderen Verlängerungsdatum. Die Extraktion ist repetitiv und ganzjährig – gleiche Felder, unterschiedliche Verlängerungsdaten, unterschiedliche Versicherernamen. Verwaltungsmitarbeiter, die Mieter-COIs bearbeiten, sind keine Versicherungsexperten; die Extraktion nimmt ihnen die Dateneingabelast, sodass sie sich darauf konzentrieren können, Auffälligkeiten zu markieren, anstatt einzutippen, was sie sehen.
Jährliche Versicherungsaudits
Ob intern oder extern – ein jährliches Compliance-Audit erfordert strukturierte Daten aus jeder aktiven COI-Akte. Liegen Ihre COIs als PDFs in einem gemeinsamen Laufwerk ohne durchsuchbaren Index, müssen Sie für das Audit jede Datei erneut öffnen und jedes Feld von Hand prüfen. Haben Sie dagegen das ganze Jahr über COI-Daten in eine Tabelle oder Datenbank extrahiert, existiert der auditbereite Datensatz bereits – sortierbar nach Ablaufdatum, filterbar nach Projekt, mit einem Klick exportierbar. COI-Non-Compliance-Kosten im Baugewerbe potenzieren sich, wenn die zum Nachweis der Compliance benötigten Daten über Posteingänge und Netzwerkordner verstreut sind.
Worauf Sie bei einem COI-Datenextraktionstool achten sollten
Nicht jedes Extraktionstool verarbeitet ACORD-Zertifikate gut. Das dichte Deckungsraster, die unterschiedlichen Formatierungen der Versicherungsmakler und die compliance-kritische Natur der Daten erfordern spezifische Fähigkeiten – nicht irgendein Dokumentextraktionsprodukt, das „COI“ in seiner Liste unterstützter Formate führt.
Vorlagenfreie Felderkennung. Dies ist das absolute Muss. Wenn das Tool verlangt, dass Sie Zonen zeichnen oder für jede Version des ACORD 25 einer Versicherungsagentur eine Vorlage erstellen, lassen Sie es bleiben. Der Sinn der Sache ist, dass Sie nicht wissen müssen, wie jede Agentur ihr Formular gestaltet. Eine semantische Extraktions-Engine – eine, die nach Feldbedeutung statt nach Feldposition liest – ist der Unterschied zwischen einem Tool, das ab Tag eins funktioniert, und einem, das ständige Wartung erfordert. KI-gestützte Dokumentenextraktion, die erkennt, wie eine Policennummer aussieht, egal wo sie auf der Seite steht, ist der Mechanismus, der dies ermöglicht.
Stapelverarbeitung. Eine einzelne COI ist eine Aufgabe von einer Minute. Fünfzig COIs von vierzig Subunternehmern nach einem vierteljährlichen Erneuerungsschub – dann zeigt die Extraktion ihren Wert. Das Tool sollte Ihnen erlauben, mehrere Zertifikate auf einmal hochzuladen und die extrahierten Daten in einer einzigen Tabelle zusammenzuführen – eine Zeile pro COI, Spalten für jedes von Ihnen benannte Feld.
Verarbeitung der Deckungstabelle. Der Abschnitt zur Betriebshaftpflicht auf einem ACORD 25 ist kein einzelner Wert – es ist ein Raster von Sublimits: je Schadensfall, Schäden an gemieteten Räumlichkeiten, ärztliche Kosten, Personen- und Sachschäden sowie Jahreshöchstgrenze. Ein Extraktionstool, das „1.000.000 $“ ausgibt, ohne zu kennzeichnen, zu welchem Sublimit es gehört, liefert unbrauchbare Daten. Das Tool sollte die Beziehung zwischen jedem Limittyp und seinem Dollarwert erhalten.
Tabellenformat als Ausgabe. Extrahierte COI-Daten landen dort, wo das Compliance-Tracking stattfindet – in einer Tabelle. Der Export nach Excel oder die direkte Einfügung in Google Sheets per Add-on eliminiert den Zwischenschritt Exportieren-dann-Importieren, der Reibung und eine weitere Fehlerquelle darstellt.
Verarbeitung nicht standardisierter Zertifikate. Nicht jede COI ist ein sauberes ACORD-25-PDF eines großen Versicherers. Kleinere Agenturen stellen Zertifikate auf eigenem Briefbogen aus. Subunternehmer reichen manchmal fotografierte Papierzertifikate aus einem Baucontainer ein. Das Extraktionstool sollte diese Randfälle verarbeiten – PDFs, Bilder und Nicht-ACORD-Layouts – ohne für jedes Format einen anderen Workflow zu erfordern.
FAQ
Was ist der Unterschied zwischen COI-Extraktion und COI-Tracking?
Die COI-Extraktion ist der Datenerfassungsschritt – Felder aus einem Zertifikat auslesen und als strukturierte Daten ausgeben. COI-Tracking ist der vollständige Compliance-Workflow – automatisierte Verlängerungserinnerungen, Erkennung von Deckungslücken, Lieferantenportale, Prüfberichte. Die Extraktion beantwortet „Was sagt dieses Zertifikat?“, das Tracking beantwortet „Ist jeder Subunternehmer in diesem Projekt aktuell compliant?“. Die meisten Tracking-Plattformen enthalten eine Extraktion, aber Extraktionstools enthalten kein Workflow-Management. Wenn Ihr aktueller Tabellenprozess funktioniert und der einzige Engpass das Abtippen von Daten aus PDFs ist, löst die reine Extraktion Ihr Problem.
Funktioniert die COI-Extraktion auch mit handschriftlichen Zertifikaten?
Das hängt von der Lesbarkeit der Handschrift ab. Moderne KI-Extraktion kann sauber gedruckte Handschrift auf ACORD-Formularen mit brauchbarer Genauigkeit lesen – insbesondere bei numerischen Feldern wie Policennummern und Geldbeträgen, die meist sorgfältiger geschrieben werden als Fließtext. Stark verschnörkelte oder blasse handschriftliche Zertifikate liefern eine geringere Genauigkeit und erfordern möglicherweise eine manuelle Überprüfung. Der beste Ansatz ist, mit Ihren tatsächlichen Dokumenten zu testen: Laden Sie eine Probe hoch und vergleichen Sie die extrahierten Felder mit dem Original. Für Subunternehmer, die regelmäßig handschriftliche Zertifikate einreichen, ist die Anforderung eines digital ausgestellten Ersatzes bei deren Versicherungsvertreter der zuverlässigere Weg.
Kann die COI-Extraktion erkennen, ob die Deckungssummen meinen Anforderungen entsprechen?
Nein. Die Extraktion liest aus, was das Zertifikat angibt. Sie vergleicht die extrahierten Werte nicht mit Ihren vertraglichen Mindestdeckungssummen. Dieser Vergleich – „Erfüllt die Betriebshaftpflicht von 500.000 $ dieses Subunternehmers unsere Anforderung von 1.000.000 $?“ – ist eine Compliance-Bewertung, keine Extraktionsaufgabe. Einige COI-Tracking-Plattformen automatisieren diesen Vergleich. Eigenständige Extraktionstools liefern Ihnen die Daten; Sie wenden die Regeln an.
Was ist ein ACORD-25-Formular und warum ist es für die Extraktion wichtig?
Das ACORD 25 – „Certificate of Liability Insurance“ – ist das in der US-amerikanischen Gewerbeversicherungsbranche standardisierte COI-Formular. Es wurde von ACORD (Association for Cooperative Operations Research and Development) entwickelt, einer gemeinnützigen Normungsorganisation, die seit den 1970er Jahren für die Versicherungsbranche tätig ist. Das Formular ist für die Extraktion wichtig, da es eine standardisierte Feldstruktur vorgibt – versicherte Person, Policennummer, Deckungsarten und -summen, Gültigkeits-/Ablaufdaten, Zertifikatsinhaber, zusätzliche Versicherte – auf die jedes Extraktionstool abzielt. Allerdings ändern einzelne Agenturen das Layout, weshalb die vorlagenbasierte Extraktion scheitert und eine semantische Extraktion erforderlich ist.
Wie genau ist die COI-Datenextraktion?
Bei sauberen, digital erstellten ACORD-25-PDFs erreicht moderne KI-Extraktion 95-99 % Genauigkeit für strukturierte Felder – Policennummern, Geldbeträge, Daten, benannte Entitäten. Die Genauigkeit sinkt bei fotografierten Papierzertifikaten (Schräglage, Beleuchtung, Auflösung), handschriftlichen Formularen und nicht standardisierten Layouts. Kein Extraktionstool erreicht 100 % Genauigkeit bei jedem Zertifikat, daher sollte die Ausgabe vor compliance-relevanten Entscheidungen geprüft werden. Das Wertversprechen ist nicht „Null Prüfung“, sondern der Ersatz von 5–10 Minuten manueller Transkription durch 10–20 Sekunden Prüfung.
Kann ich COI-Daten aus Zertifikaten verschiedener Versicherungsagenturen in einem Batch extrahieren?
Ja – und genau hier übertrifft die semantische Extraktion vorlagenbasierte Tools. Da die semantische Extraktion nach Feldbedeutung statt nach fester Position liest, können Sie COIs von fünf verschiedenen Agenturen in einem Batch hochladen und aus allen dieselben Felder extrahieren. Die KI findet die „Policennummer“, egal ob sie oben rechts auf dem Formular einer Agentur oder mittig links auf dem einer anderen steht. Batch-Subunternehmer-COI-Tracking wird praktikabel, wenn Sie Zertifikate verschiedener Agenturen gemeinsam verarbeiten können.
Ist COI-Extraktion dasselbe wie OCR?
Nein. OCR (Optical Character Recognition) wandelt ein Textbild in maschinenlesbare Zeichen um – es beantwortet „Welche Zeichen sind auf dieser Seite?“, aber nicht „Welche dieser Zeichenfolgen ist die Policennummer?“ COI-Extraktion ist der nächste Schritt nach der OCR: Sie identifiziert, welcher Text zu welchem Versicherungsfeld gehört, und strukturiert die Ausgabe in beschriftete Spalten. OCR liefert einen undifferenzierten Textdump. Extraktion liefert eine compliance-fähige Tabelle. Ein OCR-Tool, das auf ein ACORD 25 gerichtet ist, produziert jedes Wort des Formulars in einem Block. Ein Extraktionstool produziert eine Tabelle mit einer Spalte „Policennummer“, einer Spalte „GL-Aggregatgrenze“ und einer Spalte „Ablaufdatum“ – jede enthält genau einen Wert.