O que é Extração de Dados de COI?Transforme Formulários ACORD em Dados Estruturados

A extração de dados de Certificado de Seguro (COI) é o processo automatizado de ler campos-chave de seguros — como número da apólice, nome do segurado, tipos de cobertura, limites, datas de vigência e vencimento, e status de segurado adicional — de um formulário COI escaneado ou em PDF e gerá-los como dados estruturados para rastreamento de conformidade. Em vez de uma pessoa abrir cada certificado ACORD 25 e digitar manualmente nomes de seguradoras e limites de apólice célula por célula em uma planilha, o software de extração faz a leitura e a entrada de dados em segundos.

Pare de digitar dados — deixe a IA ler por você
Envie uma imagem ou PDF — dados estruturados em 10 segundos
Experimente agora
Sem cadastro · Sem cartão · Resultados em 10 segundos
Extração de dados de Certificado de Seguro — convertendo formulários COI ACORD em dados estruturados de planilha para rastreamento de conformidade

Principais Conclusões

  1. A maioria das ferramentas de extração de COI desenha uma caixa ao redor de onde cada campo deveria estar — e silenciosamente lê o texto errado quando o formulário da próxima corretora muda meia polegada.
  2. Uma lacuna de responsabilidade de sete dígitos se esconde atrás de um único limite de cobertura digitado errado no COI de um subcontratado — e ferramentas baseadas em modelos produzem esses erros sempre que uma corretora altera o layout do formulário.
  3. A extração que lê campos pelo significado em vez da posição lida com qualquer formato de corretora sem configuração — e a verdadeira transformação não é o ganho de velocidade, mas sim que erros de transcrição deixam de fazer parte da sua equação de conformidade.

O que realmente é a extração de dados de COI

A extração de dados de COI não é o mesmo que escanear um certificado ou aplicar OCR nele. Escanear gera uma imagem do formulário. O OCR converte a imagem em texto legível — uma parede de caracteres indiferenciados. A extração vai além: ela identifica qual texto é o número da apólice, qual é o limite agregado de responsabilidade geral, qual é a data de vencimento, e coloca cada valor em uma coluna rotulada em uma planilha. O resultado não é um arquivo de texto. São dados estruturados, filtráveis e ordenáveis.

O veículo padrão para esses dados é o ACORD 25 — "Certificado de Seguro de Responsabilidade Civil" — o formulário de COI mais usado no mercado de seguros comerciais dos EUA. Desenvolvido pela Association for Cooperative Operations Research and Development (ACORD), este formulário de uma página condensa os detalhes de cobertura de uma apólice de mais de 100 páginas em uma grade padronizada. Mas o que importa para a extração é: quase todas as corretoras de seguros modificam o layout padrão do ACORD. Algumas adicionam cabeçalhos e rodapés próprios. Algumas reorganizam as seções de cobertura. Algumas usam preenchimento eletrônico que desloca as posições dos campos. Outras ainda emitem formulários de papel preenchidos à máquina de escrever, que são escaneados com leve desalinhamento. O formulário é padronizado apenas no nome.

Os campos normalmente extraídos de um COI ACORD 25 se dividem em três grupos:

Identificação da Apólice

  • Segurado Nomeado
  • Número da Apólice
  • Seguradora
  • Número NAIC
  • Produtor / Corretora

Coberturas e Limites

  • Responsabilidade Geral (por ocorrência / agregado)
  • Responsabilidade Civil Automóvel
  • Acidentes de Trabalho
  • Responsabilidade Guarda-Chuva / Excesso
  • Responsabilidade Profissional (quando aplicável)

Datas e Partes

  • Data de Início da Apólice
  • Data de Vencimento da Apólice
  • Detentor do Certificado
  • Segurado Adicional
  • Descrição das Operações

Acertar as linhas de limites de cobertura é onde a extração se diferencia do OCR. A seção de responsabilidade geral sozinha tem até cinco sub-limites — cada ocorrência, danos a imóveis alugados, despesas médicas, danos pessoais e publicitários, e agregado geral — geralmente exibidos em uma grade compacta onde o alinhamento das colunas pode variar entre corretoras. Uma ferramenta que lê o significado em vez da posição consegue distinguir "$1.000.000" como o limite por ocorrência mesmo quando o rótulo acima diz "CADA OCORRÊNCIA" para uma corretora e "POR OC" para outra.

Extração de Dados de COI vs Software de Rastreamento de COI vs Revisão Manual

Esses três termos são usados de forma intercambiável em conversas sobre conformidade na construção civil, mas referem-se a diferentes camadas do mesmo problema — e confundi-los leva à compra de uma plataforma que resolve um problema que você não tem, ou pior, a perder a peça que você realmente precisa.

Revisão manual de COI é o básico: alguém abre cada certificado PDF, lê o segurado nomeado, número da apólice, limites de cobertura e data de vencimento, e digita esses valores em uma planilha de rastreamento. É o que a maioria das pequenas e médias construtoras faz. A planilha então serve como registro de conformidade — ordenando por data de vencimento, filtrando por projeto, sinalizando lacunas manualmente. A etapa de digitação leva de 5 a 10 minutos por certificado. Com 40 subcontratados, são de 3 a 7 horas por ciclo de renovação. Com 200, é um trabalho em tempo integral que nunca acaba.

Extração de dados de COI automatiza apenas a etapa de digitação. Ela não envia lembretes de renovação, não mantém um portal do fornecedor, não compara os limites extraídos com os requisitos contratuais — ela lê o certificado e gera dados estruturados. Você ainda decide para onde esses dados vão e o que fazer com eles. Para uma construtora que já tem um processo de conformidade baseado em planilhas que funciona, a extração remove o gargalo sem forçar uma mudança no fluxo de trabalho.

Software de rastreamento de COI — plataformas como myCOI (reformulada como illumend), TrustLayer, bcs e Jones — automatiza todo o fluxo de trabalho de conformidade: solicitações automáticas de renovação para subcontratados, portais do fornecedor para upload direto, sinalização de lacunas de cobertura contra requisitos do projeto, relatórios prontos para auditoria e integrações com Procore ou CMiC. Essas plataformas começam em US$ 200-500 por mês e são criadas para organizações onde a conformidade de COI de subcontratados é uma função de nível departamental. A etapa de extração é um componente dentro delas — mas agrupada com gerenciamento de fluxo de trabalho que você pode ou não precisar.

A distinção é importante porque uma construtora gerenciando 30 subcontratados não tem o mesmo problema que uma empreiteira nacional gerenciando 300. Para 30 subcontratados, o gargalo é a digitação — ler 30 formulários ACORD sem erros de transcrição. Para 300 subcontratados, o gargalo é o fluxo de trabalho — correr atrás de renovações em centenas de datas de vencimento sem um sistema. A extração resolve o primeiro. As plataformas de rastreamento resolvem o segundo. Entender qual camada se adequa à sua escala é a decisão que importa.

Como funciona a extração de dados de COI

O mecanismo que viabiliza a extração moderna de COI é fundamentalmente diferente do que impulsionava o processamento de documentos há uma década. Entender essa diferença explica por que a precisão da extração em certificados de seguro saltou de não confiável para nível de produção nos últimos três anos.

Baseado em posição (OCR por template)

Desenha uma caixa delimitadora onde "Número da Apólice" deve aparecer na página. Extrai qualquer texto dentro daquela caixa. Quando a ACORD 25 de outra agência desloca o campo em meio centímetro — fonte diferente, margens diferentes, software diferente — a caixa captura o texto errado ou nada. Cada variação de formato exige um novo template.

Baseado em semântica (extração por IA)

Lê a página inteira e entende o que cada informação significa. Sabe que "LIMITE AGREGADO GERAL" e "AGREGADO GERAL" se referem à mesma coisa, independentemente de abreviação, fonte ou posição. Encontra o número da apólice reconhecendo o padrão de um identificador — não procurando em uma coordenada fixa. Uma única configuração funciona em todas as versões do formulário ACORD de qualquer agência.

Essa mudança da extração baseada em posição para a baseada em semântica é o motivo pelo qual uma ferramenta pode processar COIs de diferentes seguradoras no mesmo lote sem ajustes de configuração. Uma agência no Texas pode colocar o bloco do titular do certificado no canto inferior esquerdo com fonte 10pt. Uma agência na Califórnia pode colocá-lo no centro inferior com 8pt. Uma ferramenta baseada em template precisa de dois templates separados — e ambos quebram quando qualquer agência muda seu software de formulário. A extração semântica lida com ambos sem configuração, porque não olha para coordenadas. Ela procura um campo chamado "Titular do Certificado" e o nome ao lado dele.

O fluxo de extração em si é direto, independentemente da tecnologia subjacente:

1

Faça upload do COI

Arraste um PDF ou imagem digitalizada do certificado. Formulários ACORD 25 padrão e a maioria dos certificados emitidos por seguradoras são compatíveis.

2

Defina o que extrair

Digite os nomes das colunas necessárias — "Número da Apólice", "Limite GL por Ocorrência", "Data de Vencimento". A IA lê o documento para encontrar cada valor pelo significado, não pela posição. Isso é a Extração de Colunas Personalizadas: você define as colunas de saída, a IA localiza os dados correspondentes onde quer que apareçam no formulário.

3

Revise e exporte

Os campos extraídos aparecem em uma tabela estruturada. Verifique a saída — especialmente a linguagem do segurado adicional e os valores dos limites de cobertura — e exporte para Excel, CSV ou diretamente para uma planilha do Google.

JPG/PNG/PDF Extração por IA

Arquivos são processados com segurança e não são armazenados.

A IA lê os campos impressos no certificado — ela não lê a apólice de seguro completa por trás dele, nem interpreta se uma cláusula de segurado adicional (ex.: CG 20 10 vs CG 20 37) atende aos seus requisitos contratuais. A extração informa o que o certificado diz. Um profissional de compliance determina se o que está escrito atende aos seus padrões.

Quando Você Precisa da Extração de Dados de COI

A extração de COI não é uma necessidade universal. Para uma empresa que recebe três certificados por ano, a entrada manual é mais rápida do que configurar qualquer ferramenta. Mas existem cenários específicos onde o volume e a recorrência do processamento de COI fazem da extração a diferença entre um processo gerenciável e um passivo de compliance.

Conformidade de Subcontratados para Empreiteiros Gerais

O caso de uso predominante. Um empreiteiro geral de médio porte gerenciando de 40 a 80 subcontratados em vários projetos ativos recebe COIs continuamente — novos subcontratados entrando no trabalho, subcontratados existentes renovando apólices no meio do projeto, mudanças de cobertura após sinistros. Cada certificado precisa ter os mesmos campos extraídos e comparados com os mesmos requisitos do projeto. Com 5 a 10 minutos por revisão manual, a entrada de dados sozinha consome de 3 a 7 horas por ciclo de renovação. A extração reduz isso para menos de um minuto por certificado. O tempo economizado não é a vitória — a eliminação de erros de transcrição nos valores dos limites de cobertura é. Um limite agregado digitado incorretamente no COI de um subcontratado é uma lacuna de responsabilidade de sete dígitos que ninguém percebe até que um sinistro seja negado.

Integração de Fornecedores e Vendedores

Grandes administradoras de imóveis, redes de saúde e instalações industriais integram centenas de vendedores anualmente — cada um exigindo comprovante de seguro antes de entrar nas instalações. Os COIs chegam em avalanche durante a temporada de integração e em fluxo constante durante o resto do ano. A revisão manual nesse volume cria um acúmulo onde os vendedores esperam dias pela aprovação de conformidade. A extração transforma a etapa de entrada de dados em segundos, para que o tempo do revisor seja dedicado aos julgamentos — se a linguagem do segurado adicional está correta, se os limites de cobertura correspondem ao contrato — em vez da etapa de transcrição.

COIs de Inquilinos para Administração de Imóveis

Administradoras de imóveis comerciais exigem COIs de cada inquilino como condição do contrato de locação. Um único edifício comercial com 50 inquilinos significa 50 certificados para rastrear, cada um renovando em uma data de aniversário diferente. A tarefa de extração é repetitiva e contínua — mesmos campos, datas de renovação diferentes, nomes de seguradoras diferentes. A equipe administrativa que processa COIs de inquilinos não é especialista em seguros; a extração remove o fardo da entrada de dados para que eles possam se concentrar em sinalizar o que parece errado, em vez de digitar o que veem.

Auditorias Anuais de Seguros

Seja interna ou externa, uma auditoria anual de conformidade de seguros exige a extração de dados estruturados de todos os COIs ativos em arquivo. Se seus COIs estão em PDFs em uma unidade compartilhada sem índice pesquisável, a auditoria significa reabrir cada arquivo e reler cada campo. Se você vem extraindo dados de COIs para uma planilha ou banco de dados o ano todo, o registro pronto para auditoria já existe — classificável por data de vencimento, filtrável por projeto, exportável com um clique. Os custos da não conformidade de COIs na construção se acumulam quando os dados necessários para comprovar a conformidade estão espalhados por caixas de entrada e pastas de rede.

O Que Procurar em uma Ferramenta de Extração de Dados de COI

Nem toda ferramenta de extração lida bem com certificados ACORD. A grade de cobertura densa, as variações na formatação das agências e a natureza crítica dos dados para conformidade exigem capacidades específicas — não apenas qualquer produto de extração de documentos com "COI" marcado em sua lista de formatos suportados.

Reconhecimento de campos sem modelo. Isso é inegociável. Se a ferramenta exigir que você desenhe zonas ou crie um modelo para cada versão do ACORD 25 de cada agência de seguros, passe adiante. A ideia é que você não precise saber como cada agência organiza seu formulário. Um mecanismo de extração semântica — que lê pelo significado do campo, não pela posição — é a diferença entre uma ferramenta que funciona no primeiro dia e uma que exige manutenção perpétua. A extração de documentos por IA que entende a aparência de um número de apólice, independentemente de onde ele está na página, é o mecanismo que torna isso possível.

Processamento em lote. Um único COI é uma tarefa de um minuto. Cinquenta COIs de quarenta subcontratados após um puxão de renovação trimestral é quando a extração mostra seu valor. A ferramenta deve permitir o upload de vários certificados de uma vez e mesclar os dados extraídos em uma única planilha — uma linha por COI, colunas para cada campo que você nomeou.

Manipulação da tabela de cobertura. A seção de responsabilidade geral em um ACORD 25 não é um valor único — é uma grade de sublímites: cada ocorrência, danos a propriedades, despesas médicas, danos pessoais e agregado. Uma ferramenta de extração que puxa "$1.000.000" sem rotular a qual sublímite pertence está produzindo dados inutilizáveis. A ferramenta deve preservar a relação entre cada tipo de limite e seu valor em dólar.

Saída nativa para planilha. Os dados extraídos do COI vão parar onde o acompanhamento de conformidade acontece — em uma planilha. A exportação para Excel ou inserção direta no Google Sheets via um complemento elimina a etapa intermediária de exportar e depois importar, que adiciona atrito e outra chance de erro.

Lida com certificados não padronizados. Nem todo COI é um PDF ACORD 25 limpo de uma grande seguradora. Agências menores emitem certificados em seu próprio papel timbrado. Subcontratados às vezes enviam certificados em papel fotografados de um trailer no canteiro de obras. A ferramenta de extração deve lidar com esses casos extremos — PDFs, imagens e layouts não ACORD — sem exigir um fluxo de trabalho diferente para cada formato.

Perguntas Frequentes

Qual é a diferença entre extração de COI e rastreamento de COI?

A extração de COI é a etapa de entrada de dados — ler campos de um certificado e gerá-los como dados estruturados. O rastreamento de COI é o fluxo de trabalho completo de conformidade — lembretes automáticos de renovação, detecção de lacunas de cobertura, portais de fornecedores, relatórios de auditoria. A extração responde "o que este certificado diz?" O rastreamento responde "todo subcontratado neste projeto está em conformidade agora?" A maioria das plataformas de rastreamento inclui extração, mas ferramentas de extração não incluem gerenciamento de fluxo de trabalho. Se seu processo atual de planilhas funciona e o único gargalo é digitar dados de PDFs, a extração por si só resolve seu problema.

A extração de COI funciona com certificados manuscritos?

Depende da qualidade da caligrafia. A extração moderna por IA pode ler caligrafia claramente impressa em formulários ACORD com precisão útil — especialmente para campos numéricos como números de apólice e valores em dinheiro, que tendem a ser escritos com mais cuidado do que texto narrativo. Certificados manuscritos com caligrafia muito cursiva ou desbotada produzirão menor precisão e podem exigir revisão manual. A melhor abordagem é testar com seus documentos reais: carregue uma amostra e verifique os campos extraídos em relação ao original. Para subcontratados que enviam consistentemente certificados manuscritos, solicitar uma substituição emitida digitalmente do corretor de seguros deles é o caminho mais confiável.

A extração de COI pode detectar se os limites de cobertura atendem aos meus requisitos?

Não. A extração lê e gera o que o certificado declara. Ela não compara os valores extraídos com os mínimos de cobertura contratuais. Essa comparação — "o limite de responsabilidade geral de R$ 500.000 deste subcontratado atende ao nosso requisito de R$ 1.000.000?" — é um julgamento de conformidade, não uma tarefa de extração. Algumas plataformas de rastreamento de COI automatizam essa comparação. Ferramentas de extração independentes fornecem os dados; você aplica as regras.

O que é um formulário ACORD 25 e por que ele é importante para a extração?

O ACORD 25 — "Certificado de Seguro de Responsabilidade Civil" — é o formulário padrão de COI usado em toda a indústria de seguros comerciais dos EUA. Foi desenvolvido pela ACORD (Associação para Pesquisa e Desenvolvimento de Operações Cooperativas), uma entidade normativa sem fins lucrativos que atende a indústria de seguros desde os anos 1970. O formulário é importante para a extração porque fornece uma estrutura de campos padronizada — segurado nomeado, número da apólice, tipos e limites de cobertura, datas de vigência/vencimento, titular do certificado, segurado adicional — que toda ferramenta de extração visa. No entanto, agências individuais modificam o layout, razão pela qual a extração baseada em modelos falha e a extração semântica é necessária.

Qual a precisão da extração de dados de COI?

Em PDFs ACORD 25 limpos e gerados digitalmente, a extração moderna por IA atinge 95-99% de precisão para campos estruturados — números de apólice, valores em dólar, datas, entidades nomeadas. A precisão cai em certificados de papel fotografados (distorção, iluminação, resolução), formulários preenchidos à mão e layouts não padronizados. Nenhuma ferramenta de extração atinge 100% de precisão em todos os certificados, por isso o resultado deve ser revisado antes de orientar decisões de conformidade. A proposta de valor não é zero revisão — é substituir 5 a 10 minutos de transcrição manual por 10 a 20 segundos de revisão.

Posso extrair dados de COI de certificados emitidos por diferentes corretoras em um único lote?

Sim — e este é o cenário onde a extração semântica supera as ferramentas baseadas em modelo. Como a extração semântica lê pelo significado do campo, e não por posição fixa, você pode enviar COIs de cinco corretoras diferentes em um único lote e extrair os mesmos campos de todas elas. A IA localiza o "Número da Apólice" quer ele apareça no canto superior direito de um formulário de uma corretora ou no meio esquerdo de outra. O rastreamento em lote de COIs de subcontratados se torna prático quando você pode processar certificados de corretoras mistas juntos.

Extração de COI é a mesma coisa que OCR?

Não. OCR (Reconhecimento Óptico de Caracteres) converte uma imagem de texto em caracteres legíveis por máquina — ele responde "quais caracteres estão nesta página?" mas não "qual destas strings é o número da apólice?" A extração de COI é a etapa seguinte ao OCR: ela identifica qual texto corresponde a qual campo de seguro e estrutura a saída em colunas rotuladas. O OCR fornece um despejo de texto indiferenciado. A extração fornece uma planilha pronta para conformidade. Uma ferramenta de OCR apontada para um ACORD 25 produz cada palavra do formulário em um bloco. Uma ferramenta de extração produz uma tabela com uma coluna "Número da Apólice", uma coluna "Limite Agregado de RL" e uma coluna "Data de Vencimento" — cada uma contendo exatamente um valor.

📮 contact email: [email protected]