Qu'est-ce que l'extraction de données COI ?
Transformez les formulaires ACORD en données structurées
L'extraction de données des certificats d'assurance (COI) est le processus automatisé de lecture des champs clés d'assurance — comme le numéro de police, l'assuré désigné, les types de couverture, les plafonds, les dates d'effet et d'expiration, et le statut d'assuré supplémentaire — à partir d'un formulaire COI scanné ou PDF, et leur restitution sous forme de données structurées pour le suivi de conformité. Au lieu qu'une personne ouvre chaque certificat ACORD 25 et saisisse manuellement les noms des assureurs et les plafonds de police dans un tableau cellule par cellule, le logiciel d'extraction effectue la lecture et la saisie des données en quelques secondes.
Points clés à retenir
- La plupart des outils d'extraction COI dessinent un cadre autour de chaque champ — et lisent silencieusement le mauvais texte lorsque le formulaire de l'agence suivante se décale d'un centimètre.
- Un passif à sept chiffres se cache derrière une seule limite de couverture mal saisie sur le COI d'un sous-traitant — et les outils basés sur des modèles produisent ces erreurs dès qu'une agence modifie la mise en page de son formulaire.
- L'extraction qui lit les champs par leur sens plutôt que par leur position gère n'importe quel format d'agence sans configuration préalable — et la véritable transformation n'est pas le gain de vitesse, c'est que les erreurs de transcription cessent de faire partie de votre équation de conformité.
Ce qu'est réellement l'extraction de données COI
L'extraction de données COI ne se résume pas à numériser un certificat ou à y appliquer une OCR. Numériser donne une image du formulaire. L'OCR convertit l'image en texte lisible — un mur de caractères indifférenciés. L'extraction va plus loin : elle identifie quel texte correspond au numéro de police, quel texte correspond à la limite globale de responsabilité générale, quel texte correspond à la date d'expiration, et place chaque valeur dans une colonne étiquetée d'un tableur. Le résultat n'est pas un fichier texte. Ce sont des données structurées, filtrables et triables.
Le support standard de ces données est le formulaire ACORD 25 — « Certificat d'assurance responsabilité civile » — le formulaire COI le plus utilisé sur le marché de l'assurance commerciale aux États-Unis. Développé par l'Association for Cooperative Operations Research and Development (ACORD), ce formulaire d'une page condense les détails de couverture d'une police de plus de 100 pages dans un tableau standardisé. Mais voici ce qui compte pour l'extraction : presque chaque agence d'assurance modifie la disposition standard de l'ACORD. Certaines ajoutent leurs propres en-têtes et pieds de page. D'autres réorganisent les sections de couverture. Certaines utilisent un remplissage électronique qui déplace les positions des champs. D'autres encore émettent des formulaires papier remplis à la machine à écrire qui sont numérisés avec un léger décalage. Le formulaire n'est standardisé que de nom.
Les champs généralement extraits d'un formulaire COI ACORD 25 se répartissent en trois groupes :
Identité de la police
- Assuré désigné
- Numéro de police
- Assureur
- Numéro NAIC
- Producteur / Agence
Couverture et limites
- Responsabilité générale (par sinistre / cumul)
- Responsabilité automobile
- Accidents du travail
- Responsabilité parapluie / excédentaire
- Responsabilité professionnelle (le cas échéant)
Dates et parties
- Date d'effet de la police
- Date d'expiration de la police
- Détenteur du certificat
- Assuré supplémentaire
- Description des opérations
Bien saisir les lignes de limites de couverture est ce qui distingue l'extraction de l'OCR. La seule section responsabilité générale comporte jusqu'à cinq sous-limites — par sinistre, dommages aux locaux loués, frais médicaux, dommages corporels et publicitaires, et cumul général — souvent affichées dans un tableau compact où l'alignement des colonnes peut varier d'une agence à l'autre. Un outil qui lit le sens plutôt que la position peut identifier « 1 000 000 $ » comme la limite par sinistre, même si l'étiquette au-dessus indique « PAR SINISTRE » pour une agence et « PAR OCC » pour une autre.
Extraction de données COI vs Logiciel de suivi COI vs Révision manuelle
Ces trois termes sont souvent utilisés de manière interchangeable dans les discussions sur la conformité en construction, mais ils désignent différents niveaux d'un même problème — les confondre peut conduire à acheter une plateforme qui résout un problème que vous n'avez pas, ou pire, à passer à côté de l'élément dont vous avez réellement besoin.
La révision manuelle des COI est la base : quelqu'un ouvre chaque certificat PDF, lit le nom de l'assuré, le numéro de police, les limites de couverture et la date d'expiration, puis saisit ces valeurs dans un tableur de suivi. C'est ce que font la plupart des petites et moyennes entreprises générales. Le tableur sert ensuite de registre de conformité — tri par date d'expiration, filtrage par projet, signalement manuel des lacunes. La saisie des données prend 5 à 10 minutes par certificat. Pour 40 sous-traitants, cela représente 3 à 7 heures par cycle de renouvellement. Pour 200, c'est un travail à temps plein qui ne s'arrête jamais.
L'extraction de données COI n'automatise que l'étape de saisie des données. Elle n'envoie pas de rappels de renouvellement, ne gère pas de portail fournisseur, ne compare pas les limites extraites aux exigences contractuelles — elle lit le certificat et produit des données structurées. Vous décidez toujours où ces données vont et quoi en faire. Pour une entreprise générale qui a déjà un processus de conformité basé sur un tableur qui fonctionne, l'extraction supprime le goulot d'étranglement sans imposer un changement de flux de travail.
Le logiciel de suivi COI — des plateformes comme myCOI (rebaptisé illumend), TrustLayer, bcs et Jones — automatise l'ensemble du flux de travail de conformité : demandes de renouvellement automatisées aux sous-traitants, portails fournisseurs pour le téléchargement direct, signalement des lacunes de couverture par rapport aux exigences du projet, rapports prêts pour l'audit et intégrations avec Procore ou CMiC. Ces plateformes commencent à 200-500 $ par mois et sont conçues pour les organisations où la conformité COI des sous-traitants est une fonction au niveau départemental. L'étape d'extraction n'en est qu'un composant — mais regroupée avec une gestion de flux de travail dont vous n'avez peut-être pas besoin.
La distinction est importante car une entreprise générale gérant 30 sous-traitants n'a pas le même problème qu'un entrepreneur national gérant 300 sous-traitants. Pour 30 sous-traitants, le goulot d'étranglement est la saisie des données — lire 30 formulaires ACORD sans erreurs de transcription. Pour 300 sous-traitants, le goulot d'étranglement est le flux de travail — relancer les renouvellements sur des centaines de dates d'expiration sans système. L'extraction résout le premier. Les plateformes de suivi résolvent le second. Comprendre quel niveau correspond à votre échelle est la décision qui compte.
Comment fonctionne l'extraction des données COI
Le mécanisme qui rend l'extraction moderne des COI efficace est fondamentalement différent de celui qui alimentait le traitement de documents il y a dix ans. Comprendre cette différence explique pourquoi la précision de l'extraction sur les certificats d'assurance est passée d'incertaine à qualité production au cours des trois dernières années.
Basé sur la position (OCR par modèle)
Dessine une boîte englobante autour de l'endroit où « Numéro de police » devrait apparaître sur la page. Extrait le texte qui se trouve dans cette boîte. Lorsque le formulaire ACORD 25 de l'agence suivante décale le champ d'un demi-pouce — police, marges ou logiciel différents — la boîte capture le mauvais texte ou rien du tout. Chaque variation de format nécessite un nouveau modèle.
Basé sur la sémantique (extraction IA)
Lit l'intégralité de la page et comprend ce que chaque information signifie. Il sait que « LIMITE GÉNÉRALE AGGREGAT » et « AGGREGAT GÉNÉRAL » désignent la même chose, indépendamment de l'abréviation, de la police ou de la position. Il trouve le numéro de police en reconnaissant le motif d'un identifiant de police — pas en le cherchant à une coordonnée fixe. Une seule configuration fonctionne sur toutes les versions du formulaire ACORD de chaque agence.
Ce passage de l'extraction basée sur la position à l'extraction basée sur la sémantique explique pourquoi un outil peut traiter des COI de différentes agences d'assurance dans le même lot sans modification de configuration. Une agence au Texas peut placer le bloc du titulaire du certificat en bas à gauche avec une police 10pt. Une agence en Californie peut le placer en bas au centre avec une police 8pt. Un outil basé sur des modèles nécessite deux modèles distincts — et les deux échouent lorsqu'une agence change son logiciel de formulaire. L'extraction sémantique gère les deux sans aucune configuration car elle ne regarde pas les coordonnées. Elle cherche un champ appelé « Titulaire du certificat » et le nom à côté.
Le flux de travail d'extraction lui-même est simple, quelle que soit la technologie sous-jacente :
Téléchargez le COI
Déposez un PDF ou une image scannée du certificat. Les formulaires ACORD 25 standard et la plupart des certificats émis par les assureurs sont pris en charge.
Définissez ce que vous voulez extraire
Saisissez les noms de colonnes dont vous avez besoin — « Numéro de police », « Limite par sinistre GL », « Date d'expiration ». L'IA lit le document pour trouver chaque valeur par son sens, pas par sa position. C'est l'Extraction de colonnes personnalisées : vous définissez les colonnes de sortie, l'IA localise les données correspondantes où qu'elles apparaissent sur le formulaire.
Vérifiez et exportez
Les champs extraits apparaissent dans un tableau structuré. Vérifiez la sortie — en particulier le libellé des assurés supplémentaires et les valeurs des limites de couverture — puis exportez vers Excel, CSV ou directement dans une feuille Google Sheet.
Les fichiers sont traités de manière sécurisée et ne sont pas conservés.
L'IA lit les champs imprimés sur le formulaire d'attestation — elle ne lit pas la police d'assurance complète sous-jacente, et elle n'interprète pas si une clause d'assuré supplémentaire (ex. CG 20 10 vs CG 20 37) répond à vos exigences contractuelles. L'extraction vous indique ce que dit l'attestation. Un professionnel de la conformité détermine si ce contenu répond à vos normes.
Quand recourir à l'extraction de données COI
L'extraction COI n'est pas un besoin universel. Pour une entreprise qui reçoit trois attestations par an, la saisie manuelle est plus rapide que la mise en place d'un outil. Mais il existe des scénarios spécifiques où le volume et la récurrence du traitement des COI font de l'extraction la différence entre un processus gérable et un risque de non-conformité.
Conformité des sous-traitants pour entrepreneurs généraux
Le cas d'usage principal. Un entrepreneur général de taille moyenne gérant 40 à 80 sous-traitants sur plusieurs chantiers reçoit des attestations d'assurance en continu — nouveaux sous-traitants arrivant sur le chantier, renouvellements de polices en cours de projet, changements de couverture après sinistres. Chaque attestation nécessite l'extraction des mêmes champs et leur comparaison avec les mêmes exigences du projet. À raison de 5 à 10 minutes par vérification manuelle, la saisie seule consomme 3 à 7 heures par cycle de renouvellement. L'extraction réduit cela à moins d'une minute par attestation. Le gain de temps n'est pas l'avantage principal — c'est l'élimination des erreurs de transcription dans les montants des limites de couverture qui l'est. Une limite globale mal saisie sur l'attestation d'un sous-traitant représente un trou de responsabilité à sept chiffres que personne ne remarque jusqu'au refus d'indemnisation.
Intégration des fournisseurs et prestataires
Les grands gestionnaires immobiliers, réseaux de santé et sites industriels intègrent des centaines de fournisseurs chaque année — chacun devant fournir une preuve d'assurance avant d'accéder aux lieux. Les attestations arrivent en masse pendant la saison d'intégration et au compte-gouttes le reste de l'année. La vérification manuelle à ce volume crée un retard où les fournisseurs attendent des jours pour obtenir leur conformité. L'extraction réduit la saisie à quelques secondes, permettant au vérificateur de consacrer son temps aux décisions critiques — vérifier si la clause d'assuré supplémentaire est correcte, si les limites correspondent au contrat — plutôt qu'à la transcription.
Attestations des locataires en gestion immobilière
Les gestionnaires d'immeubles commerciaux exigent des attestations d'assurance de chaque locataire comme condition du bail. Un seul immeuble de bureaux avec 50 locataires représente 50 attestations à suivre, chacune renouvelant à une date anniversaire différente. L'extraction est une tâche répétitive et continue — mêmes champs, dates de renouvellement et noms d'assureurs différents. Le personnel administratif qui traite ces attestations n'est pas expert en assurance ; l'extraction supprime la charge de saisie pour qu'ils puissent se concentrer sur le signalement des anomalies plutôt que sur la recopie de ce qu'ils voient.
Audits d'assurance annuels
Qu'il soit interne ou externe, un audit annuel de conformité des assurances nécessite d'extraire des données structurées de chaque attestation d'assurance (COI) active. Si vos COI sont des PDF dans un drive partagé sans index, l'audit implique de rouvrir chaque fichier et de relire chaque champ. Si vous avez extrait les données COI dans un tableur ou une base de données toute l'année, l'enregistrement prêt pour l'audit existe déjà — triable par date d'expiration, filtrable par projet, exportable en un clic. Le coût de la non-conformité COI dans la construction s'aggrave quand les données nécessaires pour prouver la conformité sont dispersées dans les boîtes mail et les dossiers réseau.
Que rechercher dans un outil d'extraction de données COI
Tous les outils d'extraction ne gèrent pas bien les certificats ACORD. La grille de couverture dense, les variations de formatage des agences et la nature critique des données pour la conformité exigent des capacités spécifiques — pas simplement un produit d'extraction de documents avec « COI » dans sa liste de formats pris en charge.
Reconnaissance de champs sans modèle. C'est le prérequis absolu. Si l'outil nécessite de délimiter des zones ou de créer un modèle pour chaque version du formulaire ACORD 25 de chaque agence, passez votre chemin. L'intérêt est de ne pas avoir à connaître la mise en page de chaque agence. Un moteur d'extraction sémantique — qui lit par signification du champ plutôt que par position — fait la différence entre un outil opérationnel dès le premier jour et un outil nécessitant une maintenance perpétuelle. L'extraction de documents par IA qui reconnaît un numéro de police, où qu'il se trouve sur la page, est le mécanisme qui rend cela possible.
Traitement par lots. Une COI unique est une tâche d'une minute. Cinquante COI de quarante sous-traitants après un renouvellement trimestriel, c'est là que l'extraction montre sa valeur. L'outil doit permettre de télécharger plusieurs certificats à la fois et de fusionner les données extraites dans un seul tableur — une ligne par COI, des colonnes pour chaque champ nommé.
Gestion du tableau de couverture. La section responsabilité civile générale d'un ACORD 25 n'est pas une valeur unique — c'est une grille de sous-limites : chaque sinistre, dommages aux locaux, frais médicaux, préjudice personnel, et cumul. Un outil d'extraction qui récupère « 1 000 000 $ » sans préciser à quelle sous-limite il appartient produit des données inutilisables. L'outil doit préserver la relation entre chaque type de limite et son montant.
Sortie native pour tableur. Les données COI extraites atterrissent là où se fait le suivi de conformité — dans un tableur. L'export vers Excel ou l'insertion directe dans Google Sheets via un add-on élimine l'étape intermédiaire d'export puis import qui ajoute des frictions et un risque d'erreur supplémentaire.
Gère les certificats non standard. Toutes les COI ne sont pas des PDF ACORD 25 parfaits d'un grand assureur. Les petites agences émettent des certificats sur leur propre papier à en-tête. Les sous-traitants soumettent parfois des photos de certificats papier prises sur un chantier. L'outil d'extraction doit gérer ces cas particuliers — PDF, images, et formats non ACORD — sans nécessiter un flux de travail différent pour chaque format.
FAQ
Quelle est la différence entre l'extraction et le suivi des COI ?
L'extraction de COI est l'étape de saisie des données — lire les champs d'un certificat et les restituer sous forme de données structurées. Le suivi des COI est le workflow complet de conformité — rappels de renouvellement automatisés, détection des lacunes de couverture, portails fournisseurs, rapports d'audit. L'extraction répond à la question « que dit ce certificat ? ». Le suivi répond à « chaque sous-traitant de ce projet est-il conforme en ce moment ? ». La plupart des plateformes de suivi incluent l'extraction, mais les outils d'extraction seuls n'incluent pas la gestion des workflows. Si votre processus actuel avec tableur fonctionne et que le seul goulot d'étranglement est la saisie manuelle des PDF, l'extraction seule résout votre problème.
L'extraction de COI fonctionne-t-elle avec les certificats manuscrits ?
Cela dépend de la qualité de l'écriture. L'IA moderne peut lire une écriture manuscrite claire sur les formulaires ACORD avec une précision utile — en particulier pour les champs numériques comme les numéros de police et les montants, généralement écrits plus soigneusement que le texte narratif. Les certificats très cursifs ou pâles donneront une précision moindre et pourront nécessiter une vérification manuelle. La meilleure approche est de tester avec vos documents réels : téléchargez un échantillon et vérifiez les champs extraits par rapport à l'original. Pour les sous-traitants qui soumettent systématiquement des certificats manuscrits, demander un remplacement numérique à leur agent d'assurance est la voie la plus fiable.
L'extraction de COI peut-elle détecter si les limites de couverture répondent à mes exigences ?
Non. L'extraction lit et restitue ce que le certificat indique. Elle ne compare pas les valeurs extraites à vos minimums de couverture contractuels. Cette comparaison — « la limite de responsabilité générale de 500 000 $ de ce sous-traitant répond-elle à notre exigence de 1 000 000 $ ? » — est un jugement de conformité, pas une tâche d'extraction. Certaines plateformes de suivi des COI automatisent cette comparaison. Les outils d'extraction autonomes vous donnent les données ; vous appliquez les règles.
Qu'est-ce qu'un formulaire ACORD 25 et pourquoi est-il important pour l'extraction ?
L'ACORD 25 — « Certificat d'assurance responsabilité civile » — est le formulaire COI standard utilisé dans l'industrie américaine de l'assurance commerciale. Il a été développé par ACORD (Association for Cooperative Operations Research and Development), un organisme de normalisation à but non lucratif au service du secteur depuis les années 1970. Ce formulaire est important pour l'extraction car il fournit une structure de champs standardisée — assuré désigné, numéro de police, types et limites de couverture, dates d'effet/d'expiration, bénéficiaire du certificat, assuré supplémentaire — que tout outil d'extraction cible. Cependant, les agences individuelles modifient la mise en page, c'est pourquoi l'extraction basée sur des modèles échoue et une extraction sémantique est nécessaire.
Quelle est la précision de l'extraction des données COI ?
Sur des PDF ACORD 25 propres et générés numériquement, l'extraction par IA moderne atteint 95 à 99 % de précision pour les champs structurés — numéros de police, montants, dates, entités nommées. La précision diminue sur les certificats papier photographiés (inclinaison, éclairage, résolution), les formulaires manuscrits et les mises en page non standard. Aucun outil d'extraction n'atteint 100 % de précision sur chaque certificat, c'est pourquoi le résultat doit être vérifié avant d'être utilisé pour des décisions de conformité. La proposition de valeur n'est pas une vérification zéro — elle remplace 5 à 10 minutes de saisie manuelle par 10 à 20 secondes de relecture.
Puis-je extraire les données COI de certificats émis par différentes agences d'assurance en un seul lot ?
Oui — et c'est le scénario où l'extraction sémantique surpasse les outils basés sur des modèles. Comme l'extraction sémantique lit par signification du champ plutôt que par position fixe, vous pouvez télécharger des COI de cinq agences différentes en un seul lot et extraire les mêmes champs de tous. L'IA localise le « Numéro de police » qu'il apparaisse en haut à droite sur le formulaire d'une agence ou au milieu à gauche sur celui d'une autre. Le suivi des COI des sous-traitants par lot devient pratique lorsque vous pouvez traiter ensemble des certificats d'agences mixtes.
L'extraction COI est-elle la même chose que l'OCR ?
Non. L'OCR (Reconnaissance Optique de Caractères) convertit une image de texte en caractères lisibles par machine — elle répond à « quels caractères sont sur cette page ? » mais pas à « laquelle de ces chaînes est le numéro de police ? » L'extraction COI est l'étape suivante après l'OCR : elle identifie quel texte correspond à quel champ d'assurance et structure la sortie en colonnes étiquetées. L'OCR vous donne un vidage de texte indifférencié. L'extraction vous donne un tableur prêt pour la conformité. Un outil OCR pointé sur un ACORD 25 produit chaque mot du formulaire en un seul bloc. Un outil d'extraction produit un tableau avec une colonne « Numéro de police », une colonne « Limite globale RC » et une colonne « Date d'expiration » — chacune contenant exactement une valeur.