Como Extrair Formulários de Sinistro (FNOL)
para Planilhas
Padronização não é automação. A Association for Cooperative Operations Research and Development (ACORD) fornece ao setor de seguros mais de 800 formulários padronizados desde 1970 — uma linguagem comum para dados de sinistros entre dezenas de milhares de seguradoras, corretoras e MGAs. Mas uma linguagem comum para papel ainda é papel. Quando um Primeiro Aviso de Sinistro (FNOL) chega em um formulário ACORD 1, 2 ou 3, seus campos ainda precisam ser lidos de um PDF escaneado ou de uma foto de cópia carbono e digitados no Guidewire ClaimCenter, Duck Creek Claims ou Origami Risk por alguém que poderia estar fazendo um trabalho de maior valor agregado. O formulário é padronizado. A redigitação não é.
Principais Conclusões
- A inserção manual de dados FNOL custa às seguradoras US$ 40–60 por sinistro, com uma taxa de erro de transcrição de 3–5% embutida em cada valor antes mesmo de um ajustador ver o arquivo.
- Cada formulário de sinistro recebido traz uma Descrição da Perda de 200 palavras escrita à mão por um reclamante estressado dentro de um carro estacionado — e nenhuma IA no mercado atual consegue dividir essa história de forma confiável em campos estruturados de causa e culpa.
- Extraia automaticamente os 80–85% de campos estruturados, deixe a narrativa como texto bruto para seu ajustador ler e reduza os custos por sinistro pela metade sem construir dados nos quais você não pode confiar.
O que é um Primeiro Aviso de Sinistro
Um Primeiro Aviso de Sinistro é o documento formal que inicia toda reclamação de seguro. É o primeiro relato que um segurado faz à sua seguradora — ou o documento que um corretor registra em seu nome — descrevendo um incidente que pode acionar a cobertura. No seguro de propriedades e acidentes (P&C), o FNOL determina tudo o que vem a seguir: designação do ajustador, investigação de cobertura, definição de reservas e, por fim, a liquidação. Um sinistro que chega com dados limpos e completos pode passar da triagem à designação do ajustador em horas. Um sinistro com campos ausentes ou ilegíveis pode ficar em uma fila de "pendência de entrada de dados" por dias, prolongando o ciclo de vida do sinistro e aumentando o risco de insatisfação do segurado — o que, segundo o estudo de 2024 da J.D. Power, está correlacionado a pontuações de satisfação 136 pontos menores para segurados cuja primeira interação envolve atrito.
O FNOL pode chegar de várias formas. Um segurado liga para seu corretor após um acidente de carro, e o corretor preenche um ACORD 2 (Aviso de Sinistro Automotivo). Um gerente de propriedade comercial envia fotos de danos causados por água por e-mail para seu corretor, que preenche um ACORD 1 (Aviso de Sinistro de Propriedade). Um escorregão e queda em um estabelecimento comercial gera um ACORD 3 (Aviso de Ocorrência/Sinistro de Responsabilidade Geral). Esses três formulários ACORD — 1, 2 e 3 — cobrem a grande maioria dos sinistros de primeira e terceira parte do ramo P&C que fluem pelo sistema de seguros dos EUA. Eles são padronizados em formato, mas chegam por canais extremamente diversos: PDFs digitalizados de portais de agências, fotos tiradas por segurados em seus celulares, faxes de administradoras terceirizadas e, às vezes, o formulário de papel original enfiado em um envelope.
A consequência operacional é direta. Uma seguradora regional ou MGA processando 80 FNOLs por dia — típico para uma operação de P&C de médio porte — recebe esses 80 sinistros por pelo menos quatro canais de entrada, em formulários de dezenas de agências diferentes, cada um preenchido com caligrafia que varia de letra de forma cuidadosa a cursiva apressada escrita em um carro estacionado após um turno de 12 horas. Cada um desses 80 sinistros exige que alguém olhe para o formulário e digite os mesmos campos em um sistema de gestão de sinistros antes que um ajustador possa tocá-lo.
Os Três Formulários ACORD Que Transportam Seus FNOLs
A ACORD mantém mais de 800 variantes de formulários, mas para o processamento de FNOL, três formulários carregam a grande maioria do volume diário de entrada. Saber quais campos cada formulário captura — e como eles se mapeiam para seu sistema de gerenciamento de sinistros — é o pré-requisito para construir um fluxo de extração que realmente economize tempo.
| Formulário | Nome | Quando é Usado | Campos Principais |
|---|---|---|---|
| ACORD 1 | Aviso de Perda Patrimonial | Danos materiais (incêndio, água, vento, roubo, inundação) | Nome do segurado, número da apólice, data/hora da perda, local da perda, descrição da perda, valor provável, informações do credor hipotecário, contato com polícia/corpo de bombeiros |
| ACORD 2 | Aviso de Perda Automotiva | Acidentes automobilísticos (pessoais e comerciais) | Nome do motorista, nome do segurado, VIN/ano/marca/modelo do veículo, placa, data/hora/local do acidente, descrição do acidente, feridos, testemunhas, número do boletim de ocorrência, informações do outro veículo/propriedade |
| ACORD 3 | Aviso de Ocorrência/Sinistro de Responsabilidade Geral | Queda, responsabilidade pelo produto, responsabilidade pelas instalações | Nome do segurado, número da apólice, local do acidente, descrição do acidente, nome/informações da parte lesionada, natureza da lesão, testemunhas, descrição do dano material, valor estimado |
A estrutura de campos nos três formulários é notavelmente consistente — número da apólice, informações do reclamante/segurado, data e local da perda, descrição do incidente, detalhes das partes. Essa consistência é o que a padronização ACORD proporciona. Mas o formato de entrega — a caligrafia, a qualidade da digitalização, a degradação da cópia carbono — varia enormemente, e é essa variação que as ferramentas de extração baseadas em modelos têm dificuldade em lidar. Uma ferramenta que espera que o campo do número da apólice esteja nas coordenadas (X=200, Y=450) na página falha quando o mesmo formulário chega como uma foto de celular rotacionada em vez de uma digitalização plana.
A padronização resolve o "o quê" — não o "como". Os formulários ACORD garantem que cada seguradora peça os mesmos campos na mesma estrutura. Mas saber que o número da apólice vai no campo 18 não ajuda a extraí-lo de uma foto granulada de um formulário carbono de terceira via. Essa lacuna é onde a extração baseada em modelos falha e a extração semântica é bem-sucedida.
O que extrair de um formulário FNOL — campo por campo
Nem todo campo de um formulário FNOL é igualmente extraível. A distinção prática está entre campos que contêm dados previsíveis e estruturados e campos que contêm narrativa livre. Entender essa distinção evita tanto prometer demais sobre automação quanto investir menos do que o necessário no que é realmente viável.
Aqui está a divisão de campos para um ACORD 1 típico (Notificação de Perda Patrimonial), mapeada para estratégia de extração e precisão esperada com uma abordagem de IA semântica e sem modelos fixos:
| Campo | Formato | Estratégia de Extração | Precisão Esperada |
|---|---|---|---|
| Número da Apólice | Alfanumérico, 8-15 caracteres | Extração direta — localizar pelo contexto semântico próximo ao rótulo "Número da Apólice" | Alta (95%+) |
| Nome do Segurado | Texto | Extração direta — próximo a "Nome do Segurado" | Alta (95%+) |
| Data do Sinistro | Data (DD/MM/AAAA) | Extração direta + normalização do formato da data | Alta (95%+) |
| Local do Sinistro | Endereço / texto | Extração direta — próximo a "Local do Sinistro" | Alta (90%+) |
| Código NAIC / Código da Seguradora | Código numérico | Extração direta — campo impresso no cabeçalho do formulário | Alta (95%+) |
| Tipo de Perda (caixa de seleção) | Caixa de seleção (Incêndio/Vento/Granizo/Roubo/Inundação) | Detecção de caixa de seleção — modelo visual identifica a caixa marcada | Média-Alta (85-90%) |
| Valor Provável | Valor monetário | Extração direta — próximo a "Valor Provável da Perda Total" | Alta (90%+) |
| Informações da Testemunha | Nome + telefone, semiestruturado | Extração direta — localizar bloco de testemunha no formulário | Média-Alta (85%+) |
| Número do Boletim de Ocorrência | Alfanumérico | Extração direta — próximo a "Polícia ou Corpo de Bombeiros ao qual foi comunicado" | Média (80%+) — frequentemente em branco ou manuscrito |
| Descrição do Sinistro | Narrativa livre (200-500 palavras) | Extrair como texto em uma única célula — não tente categorização estruturada | Extração de texto: Alta. Categorização estruturada: Baixa (veja abaixo) |
| Assinatura do Segurado | Assinatura manuscrita | Detecção de assinatura (sim/não) + salvar como referência de imagem | Média-Alta (85%+) |
O título: aproximadamente 80-85% dos campos de um formulário ACORD FNOL padrão podem ser extraídos diretamente como dados estruturados com uma abordagem moderna de IA de visão — incluindo campos manuscritos, seleções de caixas de seleção e blocos de testemunhas semiestruturados. Os 15-20% restantes se enquadram na categoria narrativa, e lidar com eles honestamente é a diferença entre um fluxo de extração realista e uma promessa de automação enganosa.
A Limitação da Narrativa: O Que a Extração Não Consegue Fazer
O campo "Descrição do Sinistro" em um ACORD 1, 2 ou 3 não é um campo de dados. É um parágrafo narrativo de 200 a 500 palavras no qual um segurado — muitas vezes ainda estressado com o incidente — descreve o que aconteceu: "Eu estava saindo de ré da minha garagem quando ouvi um som de raspagem no lado do passageiro. Saí e vi que tinha batido no poste da caixa de correio. A porta traseira do passageiro tem um amassado de cerca de 45 centímetros..." Este texto contém informações que um ajustador precisa para avaliar cobertura e responsabilidade. Mas não são dados estruturados, e nenhuma ferramenta de extração — independentemente do quão avançado seja seu modelo de linguagem — pode categorizar isso de forma confiável em campos estruturados como "causa do sinistro", "parte responsável" ou "grau de culpa" sem uma taxa de erro inaceitavelmente alta.
Esta é a limitação que a maioria dos fornecedores de extração ignora. Eles mostram uma demonstração onde uma descrição bem digitada é analisada em colunas organizadas e afirmam ter "compreensão total da narrativa". Em produção, com uma descrição manuscrita de um segurado estressado escrita em um estacionamento mal iluminado, a mesma ferramenta produz resultados imprevisíveis — e o ajustador não pode confiar em nenhum campo derivado dela.
A abordagem honesta: Extrair a descrição narrativa como texto bruto em uma única célula de planilha. O ajustador a lê diretamente — da mesma forma que leria no formulário de papel — mas sem ter que redigitar o número da apólice, data do sinistro e informações de contato da testemunha que a IA extraiu dos outros campos. O tempo economizado está nos campos estruturados, não na narrativa. Para uma operação de sinistros processando 80 FNOLs por dia, economizar 2 a 3 minutos por sinistro apenas na entrada de campos estruturados recupera de 2,5 a 4 horas de tempo do ajustador diariamente — e isso sem considerar a redução nos erros de transcrição.
Erros de transcrição em dados FNOL inseridos manualmente ocorrem em 3-5% dos campos. Para um sinistro com 15 pontos de dados, isso significa um erro em aproximadamente a cada segundo ou terceiro sinistro. A extração por IA com uma etapa de revisão humana reduz isso para abaixo de 0,5% — porque o humano está validando, não redigitando.
Outra dimensão que a maioria das discussões sobre automação ignora: variação na qualidade da caligrafia. Um formulário ACORD pode ser preenchido por um assistente de sinistros em uma mesa (letra legível), por um segurado em um hospital (cursiva trêmula) ou por um policial no local do acidente (anotações rápidas e abreviadas). O OCR tradicional — que compara formas de caracteres com um dicionário — falha quando as formas dos caracteres são inconsistentes. Uma IA de visão que lê entendendo o contexto visual em vez de comparar modelos de caracteres lida com essa variação porque interpreta o documento como um humano faria: reconhecendo que uma marca rabiscada no campo "data do sinistro" que contém um "0" e um "5" separados por uma barra é provavelmente "15/05/2026", mesmo que os dígitos individuais estejam malformados.
Do FNOL digitalizado para linhas de planilha: o fluxo prático
Implementar a extração de dados de FNOL não exige substituir seu sistema de gestão de sinistros nem implantar uma plataforma corporativa de processamento de documentos. O fluxo principal cabe em um único processo que qualquer operação de sinistros pode testar e adotar de forma incremental.
Defina suas colunas de extração
Liste os campos que seu sistema de sinistros precisa para criar um novo sinistro: Número da Apólice, Nome do Segurado, Data do Sinistro, Local do Sinistro, Tipo de Sinistro, Valor Provável, Nome da Testemunha, Número do Boletim de Ocorrência. Eles se tornam os cabeçalhos das colunas da sua planilha e as instruções que a IA usa para encontrar cada valor no formulário.
Carregue os formulários FNOL
Carregue formulários ACORD digitalizados, fotos de formulários de sinistro tiradas com celular ou PDFs recebidos de portais de corretoras. Uma foto tirada com smartphone em iluminação normal é suficiente — não é necessário scanner de mesa. A IA lê os rótulos dos campos no formulário e localiza os valores correspondentes por compreensão semântica, não por correspondência de coordenadas.
Processe e revise
A IA extrai os campos estruturados e preenche a planilha. A revisão leva de 2 a 3 minutos por sinistro — focada na descrição narrativa (que você lê como está) e na verificação pontual de números de apólice e datas extraídos. Um protocolo estruturado de verificação pontual captura os 1-2% de campos em que a IA pode ter lido incorretamente um caractere manuscrito.
Exporte para seu sistema de sinistros
Exporte a planilha preenchida como CSV ou Excel. Importe para Guidewire ClaimCenter, Duck Creek Claims, Origami Risk ou seu sistema de gestão de sinistros atual — as colunas estruturadas mapeiam diretamente para os campos do sistema. Os sinistros chegam com dados limpos, e os ajustadores passam direto para a investigação, sem precisar limpar dados.
Este fluxo usa a Extração Personalizada de Colunas — uma mudança de paradigma da extração baseada em posição (onde você desenha caixas em um modelo de formulário) para a extração baseada em intenção (onde você nomeia os campos desejados e a IA os encontra pelo significado). Você define a saída; a IA se adapta à entrada, independentemente do layout do formulário, qualidade da digitalização ou variação da caligrafia. Para um mergulho mais profundo em como isso funciona em vários tipos de documentos, veja o guia completo para extração de documentos por IA sem modelo.
Você pode testar este fluxo você mesmo com seus próprios formulários FNOL — sem configuração, sem necessidade de registro. A demonstração abaixo permite carregar um formulário ACORD digitalizado ou uma foto de um formulário de sinistro e ver os campos extraídos aparecerem em uma tabela estruturada:
Os arquivos são processados com segurança e não são armazenados.
Quando Sua Mesa Recebe 30 Sinistros de Uma Vez: Processamento em Lote de FNOLs
O fluxo acima funciona para o recebimento diário estável — os 10 a 20 FNOLs que chegam em uma terça-feira normal. Mas as operações de sinistros enfrentam um segundo padrão, mais estressante: o pico de catástrofe. Após uma tempestade de granizo no Meio-Oeste, um incêndio florestal na Califórnia ou uma geada no Texas, o volume de FNOLs pode disparar de 5 a 10 vezes em 48 horas. O processamento manual, que já era insustentável com 80 sinistros por dia, colapsa completamente com 400 sinistros por dia.
É aí que o processamento em lote se torna uma necessidade operacional, e não apenas uma melhoria de eficiência. Processar 30 formulários ACORD 1 do mesmo evento climático não é 30 vezes o trabalho de processar um — é um lote de trabalho que deve compartilhar uma única revisão. A IA extrai todos os 30 formulários usando as mesmas definições de colunas, consolida os resultados em uma planilha, e a equipe de sinistros revisa o lote como um conjunto — sinalizando anomalias, verificando uma amostra e importando as linhas estruturadas para o sistema de sinistros em uma única operação.
A alternativa — contratar processadores temporários durante eventos de catástrofe — é estruturalmente cara. Cada processador temporário requer treinamento nos formulários e fluxos de trabalho específicos da seguradora, produz taxas de erro mais altas durante a curva de aprendizado e contribui para a inflação de custos de processamento de sinistros, que eleva o custo base por sinistro de US$ 40-60 para valores significativamente maiores durante períodos de pico.
A extração em lote não elimina a necessidade de reguladores experientes durante uma catástrofe — ela garante que os reguladores em campo gastem seu tempo investigando sinistros e gerenciando acordos, em vez de digitar números de apólice em uma fila do sistema.
A Variável da Caligrafia: Formulários ACORD Preenchidos no Local
Uma porcentagem significativa dos formulários FNOL não é preenchida em um escritório. Um ACORD 2 (Aviso de Perda Automotiva) é frequentemente preenchido à beira da estrada, com o formulário apoiado em uma prancheta ou no capô de um carro. Um ACORD 3 (Aviso de Responsabilidade Geral) pode ser preenchido por um gerente de loja após um incidente, com uma caligrafia que varia de letra de forma cuidadosa à cursiva apressada de alguém gerenciando uma cena. As caixas de seleção — Incêndio, Vento, Granizo, Roubo, Inundação em um ACORD 1 — são marcadas com um traço de caneta que pode ser um visto, um X, um círculo ou um rabisco que mal toca a caixa.
Ferramentas tradicionais de OCR, que segmentam caracteres comparando formas com uma biblioteca de referência, falham nessa entrada porque não há uma forma de referência para corresponder. Uma caixa de seleção parcialmente preenchida — onde a caneta começou dentro da caixa, mas foi levantada antes de cruzá-la completamente — é lida como "não marcada" por um detector baseado em limite. Um "5" manuscrito que parece um "S" é lido como uma letra. Estes não são casos extremos; são a maioria dos dados em nível de campo em FNOLs preenchidos em campo.
A Visão AI lida com isso de forma diferente. Um modelo multimodal — do tipo que pode olhar para um documento da mesma forma que uma pessoa — interpreta a caixa de seleção não medindo a escuridão do pixel em uma coordenada, mas entendendo o contexto visual: a caixa faz parte de uma seção "Tipo de Perda", a caixa adjacente também está parcialmente preenchida, mas com pressão de caneta mais leve, a marca está mais próxima de "Roubo". Esse entendimento contextual é a diferença entre um OCR que precisa de condições perfeitas e uma extração que funciona nos documentos que sua operação realmente recebe.
Perguntas Frequentes
Qual taxa de precisão posso esperar ao extrair dados de formulários FNOL?
Para campos estruturados — número da apólice, data da perda, nome do segurado, local da perda, valores — espere 90-95%+ de precisão em campos impressos e 85-90%+ em campos claramente manuscritos com uma Visão AI moderna. A detecção de caixas de seleção geralmente atinge 85-90% de precisão, dependendo da qualidade da marca. Sempre reserve tempo para uma passagem de validação: 2-3 minutos de revisão por sinistro capturam os erros restantes antes que entrem em seu sistema de sinistros. A melhoria em relação à entrada manual (que carrega 3-5% de erros de transcrição) é substancial.
Preciso criar um modelo para cada tipo de formulário ACORD?
Não. A extração semântica — onde você define os campos desejados pelo nome e a IA os localiza entendendo os rótulos e o layout do formulário — funciona nos formulários ACORD 1, 2 e 3 usando as mesmas definições de coluna. Uma coluna "Número da Apólice" extrai dados dos três formulários sem modelos separados, porque a IA lê o rótulo "Número da Apólice" onde quer que ele apareça na página. Essa é a diferença fundamental entre extração sem modelo e o OCR tradicional por zona.
A IA consegue extrair e categorizar a descrição narrativa de um formulário FNOL?
A IA consegue extrair o texto completo da descrição narrativa de forma confiável — como um bloco de texto. O que ela não consegue fazer de forma confiável é categorizar essa narrativa em campos estruturados como "categoria da causa da perda", "parte culpada" ou "nível de gravidade". A linguagem nas descrições dos sinistrantes é muito variável, muito emocional e frequentemente incompleta. A abordagem honesta é extrair a narrativa como texto bruto em uma célula e deixar que o ajustador leia e interprete, economizando tempo nos 80-85% dos campos estruturados que podem ser automatizados.
Como os dados FNOL extraídos chegam ao meu sistema de gerenciamento de sinistros?
Os dados extraídos são gerados como uma planilha estruturada (Excel ou CSV) que pode ser importada para Guidewire ClaimCenter, Duck Creek Claims, Origami Risk, Snapsheet, ClaimVantage ou qualquer sistema que aceite importação CSV. Os cabeçalhos das colunas na sua planilha são mapeados para os campos do seu sistema de sinistros. Para operações que usam o Google Sheets, o complemento ImageToTable.ai para Google Sheets grava os resultados da extração diretamente na planilha ativa, sem necessidade de exportação de arquivos intermediários.
Posso extrair dados de fotos de formulários FNOL tiradas pelo celular?
Sim — fotos tiradas com iluminação normal, com o formulário razoavelmente plano e sem obstruções, são suficientes. Você não precisa de um scanner. Um segurado que envia uma foto do formulário ACORD preenchido pelo celular pode passar pelo mesmo processo de extração que um PDF escaneado. A IA de visão ajusta distorções de perspectiva, sombras e reflexos moderados — problemas comuns em fotos de documentos capturadas por celular.
Qual é o ROI da automação da extração de dados FNOL?
Dados do setor mostram que o registro manual de FNOL custa de US$ 40 a US$ 60 por sinistro, considerando mão de obra, correção de erros e retrabalho downstream. A extração automatizada com revisão humana reduz esse custo para menos de US$ 20 por sinistro. Para uma seguradora regional que processa 80 FNOLs por dia (aproximadamente 20.000 sinistros por ano), a economia anual varia de US$ 400.000 a US$ 800.000. Os ajustadores também relatam recuperar de 30% a 40% do seu dia de trabalho — tempo que antes era gasto com entrada de dados e agora está disponível para investigação de sinistros e interação com o cliente.