Verifique dados extraídos por IA:
Um checklist de 7 pontos para QA em planilhas
Você acabou de extrair 300 faturas. A planilha está aberta — colunas preenchidas, linhas populadas, totais à direita. Antes de encaminhá-la para a contabilidade ou importá-la para seu ERP, há uma etapa que a maioria dos guias de extração de faturas ignora completamente: a verificação de qualidade da saída. Aqui está o checklist de sete pontos que leva 12 minutos e captura os erros que se transformam em pagamentos errados, despesas mal categorizadas e declarações fiscais que você precisa retificar.
Principais conclusões
- Uma casa decimal que você não percebeu transformou uma fatura de R$ 295 em um pagamento de R$ 2.950 — e a ferramenta de extração que a produziu ainda relata 99% de precisão.
- Erros de extração não são aleatórios — eles seguem padrões, e uma configuração de deslocamento de coluna corrompe silenciosamente todas as linhas daquele formato de documento.
- Uma verificação de planilha de 12 minutos captura esses erros de padrão antes que se tornem declarações fiscais retificadas — e, após o primeiro lote, as fórmulas são executadas automaticamente.
Toda ferramenta de extração eventualmente retorna algo errado — até mesmo aquelas que relatam 99% de precisão em suas páginas de marketing. Uma casa decimal deslocada. Uma data apontando para a data de entrega em vez da data da fatura. Um campo de ID fiscal deixado vazio porque a IA não conseguiu encontrá-lo na página 3. Como nosso guia prático para testar a precisão da extração explica, "99%" é um número sem definição consensual — o que importa é se você detecta erros antes que os dados saiam da sua planilha.
Esta lista de verificação foi criada para o momento após a extração ser concluída e antes que qualquer outra pessoa toque no arquivo. Cada verificação é independente — você pode executá-las em qualquer ordem — mas juntas formam uma barreira completa. Execute todas em um lote novo e você encontrará pelo menos uma coisa que teria passado despercebida.
Verificação 1: Alinhamento de Colunas — Os Dados Foram Parar no Lugar Certo?
A maneira mais rápida de detectar um problema sistêmico de extração é escanear as colunas verticalmente. Quando a extração falha no nível da coluna, tende a falhar em lotes inteiros — um campo mal interpretado desloca todos os valores uma coluna para a esquerda, ou uma confusão de delimitador coloca o nome do fornecedor onde deveria estar o endereço.
O que fazer: Leia cada coluna de cima para baixo, não cada linha da esquerda para a direita. A leitura linha por linha é lenta e seu cérebro começa a buscar padrões — você para de ver os dados. A leitura por coluna, por outro lado, faz com que valores atípicos saltem aos olhos. Um endereço na coluna "Valor" é impossível de ignorar quando você lê verticalmente.
- Campos de texto: Cada célula na coluna Nome do Fornecedor contém algo que parece um nome — não um endereço, não um número de telefone, não uma data?
- Campos numéricos: Se você tem uma coluna Valor e uma coluna Imposto lado a lado, as magnitudes fazem sentido? O imposto deve ser aproximadamente 5-25% do Valor. Se o Imposto mostra R$ 2.495,00 e o Valor mostra R$ 2,50, eles estão trocados.
- Campos de identificador: Números de nota fiscal, números de pedido, códigos de referência — todos seguem um padrão reconhecível, ou uma linha recebeu um número de telefone no lugar?
Esta verificação leva 90 segundos para uma planilha de 200 linhas. Se você encontrar um deslocamento de coluna, provavelmente encontrou um viés que afeta todos os documentos daquele formato de origem — corrija o mapeamento de colunas e reextraia em vez de corrigir linhas uma a uma.
Verificação 2: Contagem de Linhas vs. Arquivos — Perdemos Algum Documento?
Nada compromete uma extração em lote mais rápido do que um documento faltando. Você encaminhou 12 notas fiscais para a contabilidade, mas apenas 11 linhas chegaram ao sistema deles — o 12º fornecedor envia um lembrete de atraso e você gasta 40 minutos rastreando o que aconteceu.
O que fazer: Três verificações rápidas de sanidade na contagem de linhas:
- Arquivos enviados vs. linhas da planilha: Se você enviou 47 arquivos e a planilha tem 44 linhas de dados (mais um cabeçalho), três documentos não geraram saída. O log de status da ferramenta de extração informará quais falharam e por quê — mas você não pode agir sobre uma falha que desconhece.
- Linhas em branco: Selecione todo o intervalo de dados, classifique por qualquer coluna de texto em ordem crescente. Linhas em branco aparecem no topo. Uma linha totalmente em branco geralmente significa que o documento foi processado, mas nenhum campo correspondeu — vale a pena verificar o motivo.
- Linhas duplicadas: Execute
=CONT.SE(A:A; A2)em uma coluna de identificador como Número da Nota Fiscal. Um valor de 2+ significa que o mesmo documento gerou duas linhas — seja um envio duplicado ou um PDF de várias páginas que deveria ter sido mesclado em uma única linha.
Essas verificações levam dois minutos no total. A incompatibilidade na contagem de linhas — arquivos enviados menos linhas produzidas — é a verificação de maior impacto que a maioria das pessoas ignora por presumir que a ferramenta cuidou disso.
A verificação da contagem de linhas é particularmente importante ao usar a extração em lote — o modo onde você envia vários arquivos de uma vez e exporta uma planilha mesclada. Um único arquivo que falha silenciosamente em um lote de 50 é difícil de notar a menos que você conte. No ImageToTable.ai, o painel de status do lote mostra a conclusão por arquivo — verde para concluído, vermelho para falha — então a incompatibilidade na contagem de linhas fica visível antes de você exportar.
Verificação 3: Validação Numérica — Os Números Fecham?
Números são onde erros de extração causam danos financeiros mensuráveis. Uma leitura errada de decimal transforma uma nota fiscal de R$ 295,00 em um passivo de R$ 2.950,00 em seus registros. Um subtotal lido como total significa que você aprova um pagamento com R$ 400,00 a menos. As relações aritméticas incorporadas ao documento são uma camada de verificação gratuita — você só precisa usá-las.
O que fazer: Adicione três colunas calculadas à sua planilha de saída:
| Verificação | Fórmula | Esperado |
|---|---|---|
| Subtotal + Imposto vs. Total | =ARRED(Subtotal + Imposto - Total; 2) | 0,00 |
| Soma dos itens vs. Subtotal | =ARRED(SOMA(ColItens) - Subtotal; 2) | 0,00 |
| Qtd × Preço Unitário vs. Total do Item | =ARRED(Qtd * PrecoUnit - TotalItem; 2) | 0,00 |
Qualquer linha onde o resultado não seja zero precisa de revisão. Na prática, um resultado diferente de zero geralmente aponta para uma de três coisas: uma leitura errada do separador decimal (o problema da vírgula vs. ponto em notas fiscais europeias), a linha errada sendo lida como total (a ferramenta pegou o subtotal de uma seção e aplicou à nota fiscal inteira) ou um campo de quantidade lido incorretamente (50 em vez de 15).
Se sua ferramenta de extração suportar colunas calculadas, você pode incorporar essas validações aritméticas na própria etapa de extração — a ferramenta realiza o cálculo durante a leitura do documento e sinaliza a linha antes mesmo dela chegar à sua planilha. Isso move a verificação de uma fórmula pós-extração no Excel para uma barreira sempre ativa.
Arquivos são processados com segurança e não são armazenados.
Verificação 4: Validação de Data — Formato Consistente, Intervalo Razoável
Um campo de data que mostra "01/03/2026" está correto no formato DD/MM/AAAA. No formato MM/DD/AAAA, a mesma string significa 3 de janeiro — três meses antes. Ambas são datas de calendário válidas. Apenas uma corresponde ao que o documento realmente diz. A ambiguidade de formato é o erro de extração de data mais comum e é invisível a uma inspeção casual.
O que fazer: Três verificações de data, ordenadas pela rapidez com que detectam erros:
- Consistência de formato: Selecione a coluna de data, aplique uma regra de formatação condicional que destaque qualquer célula onde o ano não tenha quatro dígitos, ou o mês exceda 12, ou o dia exceda 31. Uma data como "2026-15-03" (mês 15) é um erro de extração inequívoco — o modelo alucinou um valor de mês.
- Sanidade do intervalo de datas: Adicione
=MIN(ColData)e=MAX(ColData)no topo da planilha. Se o seu lote for de faturas de junho de 2026 e o mínimo for 01/01/2019 ou o máximo for 15/12/2028, algo está errado. Datas fora do intervalo geralmente vêm da IA lendo uma data diferente no documento — a data de pagamento em vez da data da fatura, ou uma data de uma seção completamente diferente. - Data da fatura vs. data de vencimento: Se ambos os campos foram extraídos, adicione uma coluna de verificação simples:
=DataFatura <= DataVencimento. Uma data de vencimento anterior à data da fatura é quase sempre um erro de extração — a IA trocou os dois campos.
A verificação de intervalo de datas captura os erros mais caros. Uma única fatura extraída com 15/03/2027 em vez de 15/03/2026 move €4.500 de despesa para o ano fiscal errado. Um auditor encontra. Você corrige. Mas a correção custa horas de explicação e declarações revisadas que teriam sido evitadas com uma verificação de 30 segundos com =MAX().
Verificação 5: Auditoria de Campos Ausentes — Quais Campos Retornaram Vazios?
Nem todas as células em branco são erros — alguns documentos realmente não possuem determinados campos. Mas você precisa saber quais campos foram extraídos com 0% em todo o lote, porque uma coluna universalmente em branco é quase sempre um problema de configuração, não uma característica do documento.
O que fazer: Para cada coluna solicitada, conte quantas linhas têm dados versus quantas estão em branco. No Excel, selecione a coluna e verifique a barra de status para a contagem (células em branco são excluídas da CONTAGEM, então o número exibido é sua taxa de preenchimento). Ou use =CONT.VALORES(IntervaloColuna) / CONT.VALORES(A:A) para obter uma porcentagem.
Guia de interpretação para taxas de preenchimento:
- 90-100% preenchido: Normal. Alguns documentos realmente não possuem aquele campo — um fornecedor que não imprime números de IVA, uma fatura sem referência de pedido de compra.
- 40-90% preenchido: Vale a pena investigar. O campo existe na maioria dos documentos, mas o mecanismo de extração não o encontra de forma confiável. Verifique se o nome da coluna que você especificou corresponde à terminologia do documento — "Fornecedor" vs "Vendedor" vs "Emitente" pode produzir taxas de acerto diferentes entre formatos de documento.
- 0-40% preenchido: Provavelmente um problema de configuração. O nome da coluna pode ser muito específico ("Referência de Aviso de Remessa" quando os documentos usam "Ref. Pagamento"), ou o campo pode não ser um candidato a extração direta — ele requer extração inferida, onde a IA deduz o valor do contexto em vez de lê-lo de um campo rotulado.
Uma coluna com 5% de preenchimento que você esperava em 95% significa uma de duas coisas: os documentos não contêm o que você solicitou (verifique uma amostra), ou a ferramenta de extração não está mapeando o nome da coluna para o campo correto do documento (ajuste o nome da coluna e extraia novamente). De qualquer forma, descobrir isso antes que os dados sigam adiante evita o e-mail "por que esta coluna está vazia?" da contabilidade três dias depois.
Verificação 6: Lógica entre Campos — Relações que Precisam ser Válidas
A validação de campo único (Verificação 3 cobriu aritmética; Verificação 4 cobriu datas) captura erros individuais. A lógica entre campos captura erros onde cada campo parece plausível isoladamente, mas o relacionamento entre eles é impossível. Esses são os erros mais difíceis de detectar visualmente e os mais fáceis de capturar com uma fórmula.
O que fazer: Crie algumas regras lógicas específicas para seu tipo de documento. Comece com estas verificações intersetoriais e adicione as suas:
| Tipo de Documento | Regra Lógica | Esqueleto da Fórmula |
|---|---|---|
| Fatura | Data da fatura ≤ Data de vencimento | =InvoiceDate <= DueDate |
| Fatura / Pedido | Total da linha = Qtd × Preço unitário | =ROUND(Qty * UnitPrice - LineTotal, 2)=0 |
| Fatura | Valor do imposto ≈ Alíquota × Valor líquido | =ABS(Tax / NetAmount - TaxRate) < 0.02 |
| Recibo / Despesa | Data dentro do período de relatório | =AND(Date >= PeriodStart, Date <= PeriodEnd) |
| Folha de ponto | Hora final > Hora inicial | =EndTime > StartTime |
| Extrato bancário | Saldo final = Saldo inicial + Σ transações | =ROUND(Opening + SUM(TxnRange) - Closing, 2)=0 |
Cada regra produz uma coluna VERDADEIRO/FALSO. Qualquer linha FALSA precisa de revisão manual. Em um lote de 200 documentos, você normalmente sinalizará de 2 a 5 linhas — isso significa de 2 a 5 erros de extração que podem ser corrigidos antes de se tornarem erros contábeis. A alternativa é encontrá-los durante a conciliação de final de mês, o que custa muito mais tempo e gera pressão que leva a correções apressadas.
Para um guia mais detalhado sobre como a aritmética entre campos detecta erros disfarçados, veja nosso artigo sobre verificação de resultados de extração com uma estrutura de verificação pontual em camadas, que cobre as quatro verificações aritméticas em detalhes com diagnóstico por tipo de erro.
Verificação 7: Verificações Pontuais — Escolha 3 Linhas, Compare com o Original
As verificações automatizadas (Verificações 1 a 6) capturam erros estruturais — aqueles que seguem padrões. Mas nem todos os erros seguem padrões. Uma leitura incorreta isolada em um único documento — a IA confundindo dois itens de linha semelhantes, ou extraindo 15 em vez de 5 para uma quantidade em um escaneamento desbotado — passa pela maioria dos filtros baseados em fórmulas porque o número parece razoável e a aritmética fecha. Um humano olhando o documento fonte percebe isso em 20 segundos.
O que fazer: Escolha 3 linhas aleatórias da planilha. Abra os documentos originais dessas linhas lado a lado. Verifique cada campo. Você está procurando qualquer coisa que não corresponda — um dígito errado, um campo trocado, um item de linha faltando. Não se trata de cobertura. Trata-se de capturar o tipo de erro que a amostragem estatística e a validação por fórmula não enxergam.
Quais 3 linhas? Não escolha as três primeiras — geralmente são os documentos que você verificou ao configurar a extração. Não escolha valores discrepantes óbvios — as verificações automatizadas já os sinalizaram. Use =ALEATÓRIOENTRE(2; CONT.VALORES(A:A)) três vezes e verifique essas linhas. Se todas as três estiverem corretas, você tem uma confiança razoável de que o lote está saudável. Se uma ou mais tiverem erros, aumente para 10 linhas aleatórias. Se encontrar erros em 10, o lote precisa de uma revisão mais aprofundada.
A verificação pontual descobre se as barreiras automatizadas estão realmente funcionando. Se a Verificação 3 disse "todos os números fecham", mas sua linha aleatória tem um subtotal que não é igual à soma dos itens de linha, sua fórmula aritmética tem um bug — e você acabou de pegá-lo antes de processar 200 linhas com uma verificação quebrada.
Quando Reextrair vs. Quando Corrigir Manualmente
Executar esta lista de verificação revelará problemas. A próxima decisão é se deve corrigir células individuais ou reexecutar a extração. A regra é simples: se o mesmo erro aparecer em três ou mais documentos, a causa raiz está na configuração da extração — corrija os nomes das colunas, ajuste a especificação de formato e reextraia. Se o erro for isolado a um único documento com formatação incomum, corrija a célula e siga em frente.
Três sinais de que você deve reextrair em vez de corrigir manualmente:
- O mesmo campo está errado em várias linhas. Se 15 faturas têm o total errado, a ferramenta de extração está lendo consistentemente a linha errada naquele formato de documento. Ajustar a especificação da coluna — por exemplo, mudar de "Total" para "Total Geral" — corrige todas as 15 de uma vez.
- Uma coluna está completamente vazia ou consistentemente errada. Isso é uma incompatibilidade de nome de coluna. A saída não tem sentido e a correção manual significaria digitar cada valor do zero — o que anula o propósito de usar a extração.
- As datas estão no formato errado em todo o lote. Um ajuste na especificação de formato (DD/MM/AAAA vs MM/DD/AAAA) corrige todo o lote no momento da extração. Corrigir datas uma a uma após a exportação é a atividade pós-extração mais tediosa e a mais propensa a erros.
A correção manual é a escolha certa quando o erro é específico de um documento — um escaneamento borrado, uma anotação manuscrita que a IA interpretou mal, um layout não padrão de um fornecedor específico. Abra a fonte, leia o valor, digite-o. Uma edição, pronto.
Incorporando Esta Lista de Verificação ao Seu Fluxo de Trabalho
Na primeira vez que você executar esta lista de verificação, pode levar 20 minutos — você está construindo as fórmulas, descobrindo qual coluna é qual, aprendendo onde os erros tendem a se agrupar. Na terceira leva, leva 12 minutos. Na décima, você tem uma planilha modelo com todas as fórmulas pré-construídas — você cola os dados extraídos, as verificações acendem, e gasta 5 minutos nas linhas sinalizadas e nas 3 verificações pontuais.
Pense nesta lista de verificação como os engenheiros de QA pensam em suítes de teste: o investimento inicial está em construir as verificações, e cada lote subsequente te recompensa ao capturar erros antes que saiam da sua máquina. Uma fatura de R$ 250.000 paga com um total lido incorretamente custa muito mais do que os 12 minutos que leva para verificá-la.
Perguntas Frequentes
Quanto tempo realmente leva esta lista de verificação de 7 pontos?
Para um lote de 200 documentos de um formato familiar: 12 minutos. Detalhamento: Verificações 1-2 (varredura de colunas + contagem de linhas) — 3 minutos. Verificações 3-6 (fórmulas) — 5 minutos para configurar uma vez, 2 minutos para revisar linhas sinalizadas. Verificação 7 (verificações pontuais) — 5 minutos para abrir 3 documentos e comparar. Após o primeiro lote, a reutilização do modelo reduz o total para menos de 10 minutos.
Preciso executar todas as 7 verificações em cada lote?
Verificações 1-2 e 7 em cada lote — são os portões de maior rendimento e menor esforço. Verificações 3-6 você configura uma vez como modelos de planilha e elas são executadas automaticamente quando você cola novos dados. A pergunta não é "devo executá-las" — uma vez construídas, elas se executam sozinhas. A pergunta é "devo revisar as linhas sinalizadas", e a resposta é sempre sim.
E se a ferramenta de extração tiver validação integrada — ainda preciso disso?
A validação integrada normalmente cobre verificações de nível de formato: "este valor não é uma data válida" ou "esta célula está vazia". As verificações neste artigo cobrem validação de nível de relacionamento que nenhuma ferramenta de extração pode automatizar completamente sem conhecer seu contexto de negócios. A ferramenta não sabe que a Data da Fatura deve ser anterior à Data de Vencimento para os seus acordos com fornecedores. Ela não sabe as datas do seu período de relatório. Essas regras vivem na sua planilha, e valem os cinco minutos que leva para construí-las.
Posso pular a verificação pontual se todas as verificações automáticas passarem?
Não. A verificação pontual (Verificação 7) não é redundante em relação às verificações automáticas — ela tem um propósito diferente. As verificações automáticas validam se os números seguem as regras que você codificou. A verificação pontual valida se as regras que você codificou são as certas e se estão funcionando corretamente. Uma fórmula que retorna silenciosamente zero devido a um erro de referência lhe dá uma falsa confiança. A verificação pontual mantém sua automação honesta.
Qual é o erro mais comum em todas as 7 verificações?
Desalinhamento de coluna (Verificação 1) é o mais comum e o mais rápido de detectar. Em aproximadamente um a cada 15 lotes, pelo menos um campo acaba na coluna errada — geralmente porque dois campos adjacentes têm valores de aparência semelhante. Um valor e um valor de imposto alinhados lado a lado, ambos numéricos, ambos em uma faixa plausível. Você só percebe lendo a coluna verticalmente e notando que valores de "imposto" na coluna de valor parecem suspeitamente com 15-20% dos valores reais.
Verificação é a lacuna entre "usei a ferramenta pela primeira vez" e "confio no resultado". Não se trata de duvidar do mecanismo de extração — trata-se de respeitar as consequências downstream se algo passar sem verificação. Doze minutos por lote, sete verificações, confiança para fechar o arquivo e seguir em frente.
Execute esta lista de verificação no seu próximo lote de documentos extraídos. Abra a planilha, percorra as Verificações 1 a 7 em ordem e veja o que aparece. Na primeira vez que você detectar um deslocamento decimal antes que ele se torne um erro de pagamento, os 12 minutos se pagam. Carregue um lote e execute você mesmo a lista de verificação.
Sem cadastro · Funciona com JPG, PNG e PDF