IA pode ler documentos de COI?
Sim — de formulários ACORD a dados de conformidade
Sim. A IA consegue ler e extrair dados de formulários ACORD 25 de Certificado de Seguro — incluindo números de apólices, tipos de cobertura, limites, datas de vigência e vencimento, e status de segurado adicional. A IA lida com COIs digitais e digitalizados de qualquer seguradora, mesmo quando as agências modificam o layout padrão do ACORD. A precisão em certificados digitais limpos chega a 95-99% para campos estruturados. Formulários preenchidos à mão e certificados antigos de máquina de escrever são onde a precisão cai — mas para os COIs que chegam na maioria das caixas de entrada de construção e administração de imóveis hoje, a IA está pronta para produção.
Principais conclusões
- Vinte horas por mês redigitando dados de COI de subcontratados faz você se perguntar se o trabalho de conformidade é apenas digitação cara.
- Ferramentas de COI baseadas em posição leem silenciosamente limites de cobertura errados quando uma seguradora diferente formata seu formulário ACORD 25 de outro jeito, e um único limite agregado digitado errado em 200 certificados vira uma lacuna de responsabilidade de sete dígitos que ninguém percebeu.
- Elimine a transcrição completamente e seu trabalho passa de redigitar números para verificá-los — dez segundos de revisão de conformidade por certificado onde você gastava cinco minutos de entrada de dados.
Como a IA lê documentos de COI hoje
O ACORD 25 — "Certificado de Seguro de Responsabilidade Civil" — é o formulário padrão usado no seguro comercial dos EUA. Ele condensa todos os detalhes de cobertura de uma apólice em uma única página: números de apólice, cinco sub-limites de responsabilidade geral, responsabilidade automóvel, seguro de acidentes de trabalho, cobertura guarda-chuva e as partes envolvidas — titular do certificado, segurado adicional, corretor, seguradora. Para um gerente de obra verificando a conformidade de subcontratados, cada um desses campos importa. Um limite agregado digitado errado é uma lacuna de responsabilidade de sete dígitos.
A IA lida bem com a estrutura do ACORD 25 porque o formulário é denso, mas previsível. Cada certificado traz as mesmas categorias de campo em aproximadamente o mesmo arranjo — mesmo quando agências individuais alteram margens, mudam fontes ou adicionam seus próprios cabeçalhos. É aqui que o mecanismo por trás da extração importa. Ferramentas baseadas em posição que desenham caixas delimitadoras ao redor de locais esperados de campos quebram no momento em que uma agência usa um software de formulário diferente. Os campos se deslocam alguns centímetros e a ferramenta lê o texto errado.
A extração semântica — a abordagem por trás da leitura moderna de documentos por IA — funciona de forma diferente. Em vez de olhar onde um campo está na página, ela lê o documento inteiro e identifica cada valor pelo que ele significa. Ela sabe que "LIMITE AGREGADO GERAL" de uma agência e "AGREGADO GERAL" de outra se referem ao mesmo tipo de cobertura — independentemente de abreviação, posição ou tamanho da fonte. Isso é a Extração Personalizada de Colunas: você define as colunas de saída necessárias ("Número da Apólice", "Limite por Ocorrência de RG", "Data de Vencimento"), e a IA localiza cada valor entendendo o conteúdo do documento — não combinando coordenadas. Para um olhar mais aprofundado sobre como esse mecanismo se compara a abordagens mais antigas, veja como funciona a extração de dados de COI.
A grade de cobertura em um ACORD 25 merece atenção especial porque é onde a maioria das ferramentas de extração tropeça. A seção de responsabilidade geral sozinha contém até cinco sub-limites exibidos em uma tabela compacta:
| Sub-Limite | Variações Comuns de Rótulo | Precisão da Extração por IA (PDF Digital) |
|---|---|---|
| Por Ocorrência | POR OCORRÊNCIA, CADA OCORR, POR OC | 96–99% |
| Danos a Imóveis Alugados | DANOS A IMÓVEIS ALUGADOS, DANOS POR INCÊNDIO, IMÓVEIS ALUGADOS | 94–98% |
| Despesas Médicas | DESP MÉDICAS, PAGAMENTOS MÉDICOS, DESP MÉD (Qualquer pessoa) | 95–98% |
| Lesão Publicitária e Pessoal | LES PUBL E PESSOAL, LESÃO PESSOAL, LP | 93–97% |
| Agregado Geral | AGREGADO GERAL, AGREGADO GERAL, AGREG PROD-COMP/OP | 96–99% |
Os números de precisão acima se aplicam a PDFs ACORD 25 limpos e gerados digitalmente — o formato que domina a produção moderna de agências de seguros. Quando o alinhamento das colunas varia entre agências — uma coloca "Por Ocorrência" alinhado à esquerda, outra centraliza todos os rótulos de sub-limite — uma ferramenta baseada em posição lê valores em dólares da linha errada. A extração semântica evita isso porque lê a relação rótulo-valor pelo significado: "$1.000.000" ao lado de um rótulo que significa "por ocorrência" é atribuído corretamente independentemente do alinhamento da grade.
Os arquivos são processados com segurança e não são armazenados.
O que a IA acerta em documentos COI
PDFs ACORD 25 digitais de grandes seguradoras. Este é o caso básico e onde a IA tem seu melhor desempenho. Quando uma corretora gera um certificado a partir de seu sistema de gestão — seja Applied Epic, Vertafore ou outra plataforma — o resultado é um PDF limpo, gerado por máquina, com fontes consistentes, limites de campo claros e posicionamento previsível dos dados. A IA lê esses dados com 95-99% de precisão para os campos estruturados que orientam decisões de conformidade: números de apólice, valores, datas e entidades nomeadas. Os 1-5% restantes são casos extremos, como números NAIC formatados de forma incomum ou abreviações específicas de corretoras que fogem aos padrões comuns.
COIs escaneados enviados por subcontratados. Na construção civil, os subcontratados raramente enviam certificados digitais originais. Eles enviam cópias escaneadas — às vezes digitalizações planas e limpas, às vezes fotos de celular tiradas no canteiro de obras. A IA lida bem com digitalizações limpas, com perda mínima de precisão (2-5 pontos percentuais). O modelo de visão compensa pequenas distorções e variações de resolução da mesma forma que lida com formatos de diferentes corretoras — lendo semanticamente, em vez de depender de alinhamento perfeito de pixels.
Processamento em lote de diferentes corretoras. Uma construtora que gerencia 40 subcontratados recebe COIs de uma dúzia de corretoras diferentes, cada uma com suas peculiaridades de formatação do ACORD 25. Como a extração semântica não depende de modelos por corretora, você pode colocar todos os certificados em um único lote — PDFs da State Farm, Liberty Mutual, Travelers e seguradoras regionais — e extrair os mesmos campos de todos eles em uma única execução. O resultado é uma planilha com uma linha por COI, independentemente de como cada corretora organizou seu formulário. O rastreamento em lote de COIs de subcontratados só se torna prático quando a camada de extração lida com variações de formato sem necessidade de configuração.
Identificação de segurado adicional e do titular do certificado. A seção inferior de um ACORD 25 — nome do titular do certificado, status de segurado adicional, descrição das operações — é densa em texto e varia mais entre corretoras do que a grade de coberturas. A IA lida com esta seção interpretando-a como linguagem natural, em vez de um campo de posição fixa. Quer o segurado adicional seja listado como "XYZ General Contractors, Inc." ou "XYZ GC" com uma referência de endosso CG 20 10, a IA extrai o nome da entidade e quaisquer códigos de endosso anexados. O que ela não faz — e nenhuma ferramenta de extração afirma fazer — é avaliar se o texto do endosso listado atende aos seus requisitos contratuais. Isso é um julgamento de um profissional de conformidade.
Onde a IA Ainda Enfrenta Dificuldades na Leitura de COIs
Os três cenários em que a precisão da IA cai significativamente compartilham uma causa raiz: qualidade visual degradada que torna os caracteres ambíguos até mesmo para um leitor humano.
Formulários ACORD de papel preenchidos à mão. Antes da emissão digital de certificados se tornar padrão, corretores de seguros preenchiam formulários físicos ACORD 25 à mão — caneta esferográfica em papel carbono. Esses formulários ainda circulam, especialmente de agências regionais menores e para apólices mais antigas. O problema é composto: a caligrafia reduz a precisão do reconhecimento de caracteres, e a degradação do papel carbono (desbotamento, borrões, vazamento da cópia inferior) adiciona ruído visual. Em um COI preenchido à mão com caligrafia mediana, espere 70-80% de precisão em nível de campo — útil para acelerar a entrada de dados, mas exigindo revisão sistemática de cada valor extraído. Em caligrafia confusa com cópias carbono desbotadas, a precisão cai abaixo de 70%, e a redigitação manual pode ser mais rápida que a verificação.
Certificados de máquina de escrever com décadas de idade. COIs datilografados apresentam um desafio diferente. Os caracteres são impressos, não escritos à mão — mas formulários antigos têm pressão de digitação irregular, linhas desalinhadas e tinta que desbotou de forma desigual ao longo de 15-20 anos. A IA lê a maioria dos caracteres, mas erra letras individuais onde a digitação foi leve. Um "3" com o topo fraco vira um caractere ambíguo que o modelo pode adivinhar errado. Esses formulários também tendem a ser digitalizados em equipamentos antigos e baixa resolução, agravando o problema de legibilidade.
Layouts não padronizados de agências com muitas alterações. Algumas agências emitem certificados em seu próprio papel timbrado, em vez do formulário ACORD 25 padrão — especialmente para coberturas de nicho como responsabilidade profissional ou poluição. Esses certificados não padronizados mantêm as mesmas categorias de dados (número da apólice, limites, datas, partes), mas as reorganizam em layouts específicos da agência com cabeçalhos de seção personalizados. A IA ainda os lê — essa é a vantagem da extração semântica — mas a precisão cai de 3 a 8 pontos percentuais porque a distribuição de treinamento do modelo é ponderada para a estrutura ACORD padrão. Se seu grupo de subcontratados incluir muitas agências pequenas emitindo certificados não padronizados, teste uma amostra para calibrar as expectativas.
Certificados de papel fotografados em canteiros de obras. Um subcontratado tira uma foto do COI no painel do caminhão e a envia por mensagem para o gerente do projeto. A foto está torta, mal iluminada, tirada em ângulo e em baixa resolução. A IA ainda pode tentar extrair — e modelos modernos de visão corrigem distorção moderada e variação de iluminação — mas a precisão em fotos de campo cai para 60-75%. A solução é processual, não técnica: exija que os subcontratados enviem cópias digitais ou digitalizações planas e limpas como condição de conformidade contratual.
A IA lê o que o certificado diz — não o que a apólice de seguro subjacente contém. Ela extrai números de apólice e limites de cobertura do próprio formulário ACORD. Ela não verifica se a apólice realmente existe, se os limites estão atualizados ou se a endosso de segurado adicional atende aos requisitos de sua linguagem contratual. A extração é um acelerador de entrada de dados, não um substituto para auditoria de conformidade.
Como obter os melhores resultados da leitura de COI com IA
1. Solicite formulários ACORD 25 digitais dos subcontratados. A ação de maior impacto que você pode tomar é processual: inclua uma cláusula em seus contratos com subcontratados exigindo que os certificados de seguro sejam enviados como PDFs gerados digitalmente, não como formulários de papel fotografados. A maioria das corretoras de seguros emite certificados digitais como prática padrão desde meados dos anos 2010. Se um subcontratado ainda envia formulários de papel preenchidos à mão, o corretor dele pode gerar uma versão digital em menos de cinco minutos. Esse único requisito eleva sua precisão de extração de 70-80% para 95%+.
2. Defina nomes de colunas específicos que correspondam à estrutura de campos do COI. A IA lê por correspondência semântica — o nome da coluna que você digita orienta o que ela procura. "Número da Apólice" é mais preciso que "Info da Apólice". "Limite GL por Ocorrência" é mais preciso que "Limite de Responsabilidade". Para a grade densa de coberturas, nomeie cada sub-limite como uma coluna separada: "GL por Ocorrência", "GL Danos a Propriedades", "GL Despesas Médicas", "GL Danos Pessoais", "GL Agregado Geral". A IA usa o nome da coluna como uma consulta semântica ao documento — quanto mais específica a consulta, mais precisa a correspondência.
3. Agrupe COIs do mesmo ciclo de renovação. COIs chegam em levas — 40 subcontratados renovando após um impulso trimestral, 15 novos subs entrando em um projeto. Processá-los em lotes que reflitam esses agrupamentos naturais mantém os dados extraídos organizados: um lote por projeto ou por ciclo de renovação, uma planilha por lote, uma linha por COI. A IA processa todos os certificados em paralelo dentro de um lote, e a saída mesclada significa que você está verificando uma tabela em vez de 40 extrações individuais.
4. Sempre revise os limites de cobertura antes que eles orientem decisões de conformidade. Mesmo com 99% de precisão em formulários digitais, um limite agregado digitado errado em 200 certificados é uma lacuna de responsabilidade. O fluxo de trabalho que faz sentido para extração de COI é: IA extrai todos os campos → você verifica limites de cobertura e linguagem de segurado adicional → dados vão para a planilha de conformidade. A economia de tempo vem da eliminação da transcrição — você revisa de 10 a 20 segundos por certificado em vez de digitar por 5 a 10 minutos. Os custos de não conformidade com COI na construção são altos demais para pular a verificação completamente.
5. Use uma ferramenta que exporte diretamente para sua planilha de rastreamento. Quanto menos etapas entre a extração e seu registro de conformidade, menor a chance de erros de copiar e colar. Se seu rastreamento de conformidade está no Excel ou Google Sheets, escolha uma ferramenta de extração que exporte diretamente para esse formato — sem download intermediário de CSV, sem etapa de reimportação. Cada transferência entre ferramentas é uma oportunidade para os dados trocarem de coluna ou perderem formatação. Para um passo a passo prático, experimente extrair dados de COI para o Excel com seus próprios certificados.
Exemplos Reais: Onde a Leitura de COI por IA Faz a Diferença
Rastreamento de COI de Subempreiteiros na Construção Civil
Uma construtora de médio porte que gerencia 50 subempreiteiros ativos em três projetos recebe COIs continuamente — novos subs entrando, subs existentes renovando, mudanças de cobertura após sinistros. Cada certificado exige a extração dos mesmos 12 a 15 campos: segurado nomeado, número da apólice, seguradora, cinco sublimites de RL, responsabilidade civil automóvel, seguro de acidentes de trabalho, guarda-chuva, data de vigência, data de vencimento, tomador do seguro, segurado adicional. A inserção manual leva de 5 a 10 minutos por certificado. Com 50 subs renovando trimestralmente, são 200 COIs por ano — de 16 a 33 horas de pura digitação.
A extração por IA reduz a etapa de inserção de dados para menos de um minuto por certificado. O gerente de projeto carrega 50 COIs de 12 agências diferentes em um único lote, define as colunas de extração uma vez e recebe uma planilha estruturada com todos os campos preenchidos. A verificação substitui a transcrição: 45 minutos de revisão em vez de 4 horas de digitação. O ganho real não é o tempo — é a eliminação de erros de transcrição nos valores dos limites de cobertura que ninguém percebe até que um sinistro seja negado. Para o desafio relacionado de extrair dados de documentos de faturamento de subempreiteiros, veja extração de faturas da construção civil.
Verificação de Conformidade de Fornecedores e Vendedores
Uma fábrica integra mais de 200 fornecedores anualmente, cada um exigindo comprovante de seguro de responsabilidade civil geral antes de entrar nas instalações. Os COIs chegam em avalanche durante a temporada de integração. Dois funcionários administrativos passam duas semanas inserindo manualmente os dados dos certificados em uma planilha de conformidade — números de apólice, nomes de seguradoras, datas de vigência, datas de vencimento, limites de cobertura. Os fornecedores aguardam liberação enquanto seus COIs ficam na fila.
A extração por IA processa todo o lote de integração em menos de uma hora. O papel da equipe de conformidade muda de inserção de dados para tratamento de exceções — revisando certificados sinalizados cujos limites estejam abaixo dos patamares, acompanhando campos ausentes, verificando endossos de segurado adicional. O fluxo de trabalho se torna: IA lê tudo → equipe revisa os casos excepcionais → fornecedores em conformidade são liberados, fornecedores não conformes recebem uma solicitação específica de cobertura atualizada. O gargalo sai do lote inteiro e vai para os 5 a 10% dos certificados que realmente precisam de atenção humana.
Verificação de Seguro de Inquilinos para Administradores de Propriedades
Um administrador de propriedades comerciais que supervisiona 80 inquilinos em quatro prédios precisa verificar se cada inquilino mantém a cobertura de responsabilidade civil geral exigida pelo contrato — normalmente US$ 1.000.000 por ocorrência e US$ 2.000.000 agregados. O COI de cada inquilino renova em uma data diferente. A equipe administrativa do administrador gasta uma semana por mês digitando dados de certificados de renovação em uma planilha de acompanhamento e, em seguida, classificando por data de vencimento para identificar possíveis lapsos.
A extração por IA lida com o fluxo contínuo: à medida que as renovações chegam por e-mail ao longo do mês, cada certificado é extraído imediatamente. A equipe revisa limites e datas de vencimento em relação aos requisitos do contrato em segundos por certificado, em vez de minutos. A planilha sempre atualizada significa que o administrador pode responder "quais inquilinos têm cobertura vencendo este mês?" filtrando uma coluna, em vez de procurar em uma unidade compartilhada de PDFs.
Perguntas Frequentes
A IA consegue ler documentos COI de diferentes agências de seguros em um único lote?
Sim. É aqui que a extração semântica supera as ferramentas baseadas em modelos. Como a IA lê pelo significado do campo, em vez de posição fixa, você pode enviar COIs de cinco agências diferentes — cada uma com sua própria formatação ACORD 25 — e extrair os mesmos campos de todas elas em um único lote. A IA localiza "Número da Apólice" quer apareça no canto superior direito de um formulário ou no meio esquerdo de outro.
A IA entende a diferença entre os limites "Por Ocorrência" e "Agregado Geral"?
Sim. Modelos modernos de IA entendem que "POR OCORRÊNCIA", "POR OC" e "POR OCOR" se referem ao mesmo sublimite de cobertura, e que o valor em dólar ao lado de cada rótulo é o limite correspondente — não algum outro número na página. Esta é a principal vantagem da extração semântica sobre o OCR baseado em modelo: o modelo entende o que cada rótulo de campo significa, para que possa atribuir valores corretamente mesmo quando o alinhamento das colunas varia entre as agências.
IA consegue ler formulários de COI manuscritos?
Parcialmente. Em letras de forma claras com tinta escura em papel limpo, a IA extrai com 75-85% de precisão. Em letra cursiva bagunçada ou cópias carbono desbotadas, a precisão cai abaixo de 70% — ponto em que a digitação manual pode ser mais eficiente que a verificação. Para subcontratados que enviam certificados manuscritos com frequência, solicitar uma substituição digital gerada pelo corretor de seguros é o caminho mais confiável. A maioria das agências consegue emitir um ACORD 25 digital em menos de cinco minutos.
Qual a precisão em formulários de COI ACORD 25 digitais?
Em PDFs ACORD 25 limpos e gerados digitalmente por grandes seguradoras, a extração moderna por IA alcança 95-99% de precisão em nível de campo para campos estruturados — números de apólice, valores monetários, datas, segurado nomeado, nome da seguradora. A precisão nos sublimites da grade de cobertura é ligeiramente menor (93-98%) devido a abreviações ambíguas entre agências. A precisão em campos de texto livre, como descrição das operações, fica entre 90-95%. Nenhuma ferramenta de extração atinge 100% em todos os campos, por isso limites de cobertura e texto de segurado adicional devem ser verificados antes de decisões de compliance.
IA consegue detectar se os limites de cobertura atendem aos requisitos do meu contrato?
Não. A extração por IA lê o que o certificado diz — "Responsabilidade Civil Geral: US$ 1.000.000 por Ocorrência" — e gera esse valor como dado estruturado. Ela não compara os valores extraídos com seus mínimos contratuais. A comparação ("o agregado de US$ 500.000 deste sub atende ao nosso requisito de US$ 2.000.000?") é uma decisão de compliance, não uma tarefa de extração de dados. Algumas plataformas de rastreamento de COI automatizam essa comparação como parte do fluxo de trabalho. Ferramentas de extração isoladas fornecem os dados; você aplica as regras.
Extração de COI é a mesma coisa que OCR?
Não. OCR converte uma imagem do certificado em caracteres legíveis por máquina — responde "qual texto está nesta página?" A extração de COI vai além: identifica qual texto é o número da apólice, qual é o limite agregado de responsabilidade civil geral, qual é a data de validade, e coloca cada valor em uma coluna rotulada em uma planilha. OCR fornece o certificado inteiro como um bloco de texto indiferenciado. A extração fornece uma tabela pronta para compliance com uma coluna "Número da Apólice", uma coluna "Limite Agregado de RC" e uma coluna "Data de Validade" — cada uma contendo exatamente um valor.
Quais campos a IA pode extrair de um documento de COI?
O conjunto padrão inclui: segurado nomeado, número da apólice, seguradora, número NAIC, produtor/corretora, todos os sublímites de responsabilidade geral (por ocorrência, danos a imóveis alugados, despesas médicas, danos pessoais e publicitários, agregado geral), limites de responsabilidade automóvel, limites de responsabilidade guarda-chuva/excessiva, limites de compensação trabalhista, data de vigência da apólice, data de expiração da apólice, nome e endereço do titular do certificado, nome do segurado adicional e descrição das operações. Você define qual subconjunto precisa — a IA extrai apenas essas colunas.