Extração de Documentos no Brasil:
Uma Ferramenta de Orçamento ou Várias?
Uma pequena clínica médica em Belo Horizonte com 12 funcionários recebe cerca de 25 notas fiscais NF-e de fornecedores, 18 documentos NFS-e de prestadores de serviço e 12 holerites em PDF por mês. Três tipos de documento, três regimes regulatórios, três processos manuais separados. Se a clínica comprar uma ferramenta dedicada para cada tipo de documento, o custo anual combinado chega a R$ 5.000–11.000. Se usar uma única ferramenta de extração por IA para todos os três, o custo cai para aproximadamente R$ 1.200. A diferença não está em quais ferramentas existem no Brasil — está em se a etapa de extração precisa ficar dentro de três plataformas separadas.
Principais Conclusões
- Pequenas empresas brasileiras compram ferramentas separadas para cada domínio regulatório — um ERP para NF-e fiscal, digitação manual para NFS-e municipal e um sistema de DP para holerite trabalhista — porque as ferramentas espelham os silos governamentais que as criaram.
- Uma construtora de 25 funcionários em Curitiba gasta R$ 7.788 por ano com essa pilha de múltiplas ferramentas, e dois terços desse custo são trabalho manual de entrada de dados que as ferramentas deveriam lidar, mas não lidam.
- ImageToTable.ai por R$ 1.200/ano lê NF-e, NFS-e e holerites em PDF com uma definição de coluna por tipo de documento — em vez de dados espalhados por três sistemas separados, seu contador recebe um único arquivo Excel com todos os três tipos de documento em colunas estruturadas.
A Pilha de Documentos de uma Pequena Empresa Brasileira
Percorra a caixa de entrada de documentos de uma típica PME brasileira com 10 a 50 funcionários e o padrão se repete em todos os setores. Uma pequena construtora em Curitiba recebe notas fiscais eletrônicas (NF-e) de seus fornecedores de materiais de construção — cimento, vergalhão, componentes elétricos — cada uma com detalhamento de ICMS (12% ou 18%, dependendo se a mercadoria cruza fronteiras estaduais). Recebe NFS-e (Nota Fiscal de Serviço Eletrônica) de eletricistas e encanadores subcontratados, cada uma com ISS (Imposto Sobre Serviços) à alíquota do município — de 2% a 5%, dependendo da cidade. E recebe PDFs de Holerite do seu contador ou sistema de DP (Departamento Pessoal), cada um com o salário base do funcionário, contribuição ao INSS, retenção de IRRF, depósito de FGTS e eventuais horas extras ou adicionais.
Três tipos de documento. Três arcabouços regulatórios distintos — a NF-e é regulada pelas SEFAZ estaduais sob o Ajuste SINIEF 07/2005, a NFS-e está unificada nacionalmente desde janeiro de 2026 pela Lei Complementar 214/2024, mas ainda com alíquotas de ISS por município, e o Holerite vive sob a CLT (Consolidação das Leis do Trabalho) com dados que devem ser reportados via eSocial (evento S-1210) ao governo federal. Três conjuntos de campos obrigatórios. Três fluxos de trabalho diferentes para digitação manual de dados. E, na maioria das pequenas empresas brasileiras, as mesmas uma ou duas pessoas cuidando de tudo.
O volume mensal de documentos para uma empresa típica de 20 funcionários se divide aproximadamente em: 40 a 120 NF-e (notas fiscais de fornecedores de mercadorias), 15 a 50 NFS-e (notas fiscais de prestadores de serviço) e 10 a 25 Holerites (contracheques de funcionários). Isso representa de 65 a 195 documentos por mês em que alguém abre um PDF e redigita números. A 5 minutos por documento — conservador para NF-e com seus detalhamentos de ICMS em várias linhas — o custo de mão de obra manual varia de R$ 135 a R$ 406 por mês, a R$ 25/hora. O valor anualizado: de R$ 1.620 a R$ 4.872 gastos lendo PDFs e apertando teclas, para uma empresa que talvez não tenha R$ 5.000 de orçamento anual de software.
O problema estrutural não é que as pequenas empresas brasileiras carecem de ferramentas para cada tipo de documento. É que as ferramentas são segmentadas por domínio regulatório — fiscal, municipal, trabalhista — e cada ferramenta de domínio custa de R$ 100 a R$ 400/mês. Quando todas as três são necessárias, o custo combinado inviabiliza o caso de negócio para automação.
NF-e, NFS-e e Holerite: Três Documentos, Três Mundos Separados
O motivo pelo qual as ferramentas de documentos brasileiros vêm em silos separados remonta a como a infraestrutura regulatória foi construída.
NF-e (fiscal, estadual). Regulamentada pela SEFAZ em cada um dos 26 estados brasileiros mais o Distrito Federal. Para uma empresa recebedora, a NF-e contém CNPJ do fornecedor, CFOP (Código Fiscal de Operações e Prestações) classificando a transação, códigos NCM dos produtos, base e alíquota do ICMS — tipicamente 4%, 7%, 12% ou 18% dependendo do tipo de produto e se interestadual ou intraestadual — junto com PIS, COFINS e IPI quando aplicável. O ecossistema de ferramentas para NF-e de entrada consiste em ERPs completos (Omie, Conta Azul, Bling) que capturam o XML da NF-e por meio de integração com certificado digital, e plataformas empresariais como Qive (antiga Arquivei) que automatizam downloads de XML da SEFAZ. Pequenas empresas que não usam essas ferramentas processam DANFE em PDF manualmente. Para um mergulho profundo especificamente no problema de extração de NF-e, veja nosso guia para extração de NF-e de baixo custo para pequenas empresas brasileiras.
NFS-e (imposto sobre serviços, municipal). Desde 1º de janeiro de 2026, o sistema nacional unificado de NFS-e sob a Lei Complementar 214/2024 é obrigatório em todo o país, substituindo o que era um cenário fragmentado de mais de 5.500 municípios, cada um com seu próprio formato e portal web de NFS-e. Mais de 1.280 municípios, cobrindo 70% da receita de serviços, haviam aderido ao sistema nacional até meados de 2025, e os restantes foram obrigados a adotá-lo até o prazo de janeiro de 2026. A NFS-e carrega ISS com alíquotas entre 2% e 5%, dependendo do município e tipo de serviço, junto com PIS/COFINS quando aplicável. A maioria dos ERPs brasileiros (Omie, Conta Azul) inclui módulos de emissão de NFS-e, mas a NFS-e de entrada recebida como PDF de um prestador de serviços segue o mesmo padrão de digitação manual da NF-e: o PDF chega, e alguém digita.
Holerite (trabalhista, federal). Sob o Art. 464 da CLT, todo empregador brasileiro deve fornecer um contracheque detalhado mostrando componentes salariais, deduções e salário líquido. O Holerite carrega campos específicos determinados pelo Ministério do Trabalho e Emprego: salário base, horas extras com o adicional mínimo de 50%, contribuição ao INSS (8%, 9% ou 11% com base na faixa salarial — a tabela progressiva de 2026), IRRF (Imposto de Renda Retido na Fonte, calculado contra a tabela progressiva do imposto de renda), depósito de FGTS (8% do salário bruto), e quaisquer adicionais como adicional noturno (mínimo de 20%) ou periculosidade (30%). Todos esses dados devem ser reportados mensalmente através do evento S-1210 do eSocial. As ferramentas que lidam com dados de Holerite — Domínio Sistemas, Senior, Totvs RM, ADP Brasil, Pontomais — são sistemas de DP (Departamento Pessoal), completamente separados das ferramentas de ERP que lidam com NF-e e NFS-e.
Essa separação regulatória cria uma separação de ferramentas. Uma clínica em Belo Horizonte compra Omie (ou Conta Azul) para gestão de NF-e e NFS-e, usa um sistema de DP separado para folha de pagamento, e ainda digita dados de NFS-e de prestadores de serviços médicos subcontratados no Excel porque o módulo de NFS-e no ERP é feito para emissão, não para recebimento. O resultado: duas ou três assinaturas de software, duas ou três curvas de aprendizado, e dados que vivem em três lugares diferentes.
Quanto Três Ferramentas Separadas Custam por Ano
Vamos montar a conta anual de uma pequena empresa que compra uma ferramenta diferente para cada tipo de documento — a abordagem "best of breed" que a maioria dos guias de recomendação de software defende.
| Tipo de Documento | Categoria da Ferramenta | Exemplo de Ferramenta | Custo Mensal | Custo Anual | O Que Cobre |
|---|---|---|---|---|---|
| NF-e (notas fiscais de mercadorias) | ERP / Plataforma NF-e | Omie, Conta Azul ou Qive | R$99–400 | R$1.188–4.800 | Emissão e/ou captura de NF-e; estoque; financeiro; integração com contador |
| NFS-e (notas fiscais de serviços) | Incluso no ERP acima, ou manual | NFS-e de entrada geralmente é digitada manualmente mesmo com ERP | R$0 (apenas mão de obra) | R$1.560–3.120 | Custo de mão de obra a R$25/h para digitação manual de 15–50 NFS-e/mês |
| Holerite (contracheques) | Sistema DP / Folha de Pagamento | Domínio, Senior, Pontomais ou Convenia | R$100–400 | R$1.200–4.800 | Processamento da folha; geração de holerites; relatórios eSocial; cálculo de FGTS/INSS/IRRF |
| Custo Anual Total (Pilha de Múltiplas Ferramentas) | R$3.948–12.720 | Varia conforme planos e substituição de trabalho manual | |||
O custo da pilha de múltiplas ferramentas tem um piso e um teto. O piso (R$3.948/ano) considera: Omie Entry a R$99/mês para NF-e + digitação manual de NFS-e a R$1.560/ano em mão de obra + um sistema DP básico a R$100/mês. O teto (R$12.720/ano) considera: Conta Azul Avançado a R$400/mês + digitação manual de NFS-e em alto volume + um pacote DP completo a R$400/mês. Nenhum cenário é incomum para uma empresa de 20 a 50 funcionários em uma cidade brasileira de médio porte.
Mas a tabela esconde o verdadeiro gerador de custo: o trabalho manual para extração de NFS-e e holerites. Mesmo com um ERP capturando XML de NF-e, os PDFs de NFS-e dos prestadores de serviço e os PDFs de holerites do contador ainda caem na caixa de entrada de alguém. O ERP não os lê. O sistema DP gera holerites, mas não extrai dados deles. A lacuna de extração é mais crítica para NFS-e — o tipo de documento que nenhuma ferramenta de extração dedicada no Brasil tem como alvo específico.
Uma Ferramenta, Três Tipos de Documento: A Abordagem da Camada de Extração
A arquitetura alternativa é separar a etapa de extração do sistema de gestão que ela alimenta. Em vez de comprar três ferramentas que lidam com um tipo de documento do início ao fim, você compra uma ferramenta que cuida da extração para todos os três e alimenta os dados extraídos em qualquer sistema downstream que já usa: Excel para o contador, ERP para a contabilidade ou sistema de DP para conciliação da folha de pagamento.
O ImageToTable.ai funciona assim. Ele lê o conteúdo visual de um documento — PDF DANFE NF-e, PDF NFS-e de um prestador de serviço, PDF Holerite do contador, foto de um Holerite em papel, print do WhatsApp de uma DANFE — e gera dados estruturados em Excel. O mecanismo é o mesmo para todos os tipos de documento: Extração Personalizada de Colunas, onde você digita os nomes dos campos desejados e a IA encontra cada valor entendendo o que ele significa, não onde está na página. Para uma NF-e, a definição de coluna pode ser "CNPJ emitente, CFOP, Valor Total, Base ICMS, Valor ICMS". Para uma NFS-e de um subcontratado, pode ser "CNPJ prestador, Número NFS-e, Valor serviço, ISS retido, Base ISS, Alíquota ISS". Para um Holerite, pode ser "Nome funcionário, Salário base, INSS, IRRF, FGTS, Horas extras, Líquido a receber".
As definições de coluna mudam por tipo de documento. A ferramenta não. O preço também não. O mesmo plano Basic de $9/mês (150 páginas, ~R$50) ou Pro de $19/mês (400 páginas, ~R$100) cobre todos os três tipos de documento dentro da mesma cota de páginas. Se você processar 40 DANFEs NF-e, 20 PDFs NFS-e e 15 Holerites em um mês, são 75 páginas — metade da cota do plano Basic, deixando espaço para crescer antes de atingir o próximo nível.
Arquivos são processados com segurança e não são armazenados.
Comparação Anual de Custos: Pilha de Múltiplas Ferramentas vs. Camada Única de Extração
Aqui está a comparação completa em três cenários de volume de documentos para uma pequena empresa brasileira:
| Cenário | Documentos Mensais (NF-e + NFS-e + Holerite) | Pilha de Múltiplas Ferramentas Custo Anual | Camada Única de Extração Custo Anual | Economia Anual |
|---|---|---|---|---|
| Pequena clínica, 12 funcionários, Belo Horizonte | 40 NF-e + 18 NFS-e + 12 Holerite = 70 docs | R$5.148 Omie R$99/mês + trabalho manual NFS-e R$1.560/ano + sistema DP R$200/mês | R$600 Plano básico $9/mês (~R$50/mês × 12, 150 pg/mês cobre 70 docs) | R$4.548 |
| Construtora, 25 funcionários, Curitiba | 75 NF-e + 30 NFS-e + 25 Holerite = 130 docs | R$7.788 Omie R$99/mês + trabalho manual NFS-e R$2.400/ano + sistema DP R$350/mês | R$1.200 Plano Pro $19/mês (~R$100/mês × 12, 400 pg/mês cobre 130 docs + margem) | R$6.588 |
| Distribuidora de alimentos, 45 funcionários, interior SP | 120 NF-e + 40 NFS-e + 30 Holerite + 60 notas de entrega = 250 docs | R$11.388 Conta Azul R$310/mês + trabalho NFS-e R$3.120/ano + DP R$400/mês + notas de entrega manuais R$2.400/ano | R$3.648 Plano Max $59/mês (~R$304/mês × 12, 1.500 pg/mês cobre todos os quatro tipos de doc) | R$7.740 |
Três observações da tabela. Primeiro, o custo da pilha de múltiplas ferramentas é dominado pelo sistema DP e trabalho manual para NFS-e — as ferramentas que lidam com NF-e (o ERP) são apenas uma fração do total. Segundo, a camada de extração substitui não apenas assinaturas de ferramentas, mas também trabalho manual, que é o maior custo oculto na coluna de múltiplas ferramentas. Terceiro, em volumes maiores, o plano Max a R$304/mês lida não apenas com NF-e, NFS-e e Holerite, mas também com tipos secundários de documentos, como notas de entrega e recibos de despesas — tipos de documentos que adicionariam uma quarta ou quinta ferramenta na abordagem de múltiplas ferramentas.
Para contexto sobre onde esses números se situam no panorama global de preços de extração, veja a visão geral de 2026 sobre preços de extração de documentos com IA em todos os níveis. A comparação que importa especificamente para o mercado brasileiro é a que esta tabela faz: custo por documento entregue em reais, nos três tipos de documento que toda pequena empresa brasileira realmente processa. Para uma visão mais granular de como funciona o preço da camada de extração em diferentes volumes, veja o ranking das ferramentas de extração com IA mais acessíveis em 2026.
A camada única de extração não substitui o ERP nem o sistema de DP. Ela os alimenta. O ERP ainda gerencia o estoque e emite suas próprias NF-e. O sistema de DP ainda calcula a folha de pagamento, retém INSS e IRRF e envia o eSocial. A camada de extração fica antes de ambos: recebe os PDFs, extrai os dados e exporta uma planilha que é importada no sistema que gerencia o fluxo. Você não está substituindo três ferramentas por uma. Você está substituindo a digitação manual nas três por uma ferramenta que custa R$50–304/mês.
Quando Múltiplas Ferramentas Ainda Fazem Sentido
Esta comparação defende que uma camada única de extração custa menos que um conjunto de múltiplas ferramentas para a maioria das pequenas empresas brasileiras. Mas o argumento não é universal. Três cenários onde a abordagem de múltiplas ferramentas é a escolha certa:
Você emite suas próprias NF-e regularmente. Se sua empresa emite mais do que algumas NF-e por mês para seus próprios clientes, você precisa de um ERP ou provedor de API de NF-e com capacidade de emissão (NFe.io, Focus NFe ou um ERP com módulos de NF-e como Omie). A camada de extração cuida do lado do recebimento. O lado da emissão exige uma ferramenta que gere XMLs e os envie à SEFAZ. Nesse caso, você não está escolhendo entre o ERP e a ferramenta de extração — você precisa de ambos. A ferramenta de extração processa DANFEs recebidos; o ERP lida com NF-e emitidas. A questão é se o módulo de captura de entrada do ERP (que exige configuração de certificado digital) vale o custo adicional em comparação com processar DANFEs recebidos pela camada de extração.
Seu contador exige um ERP específico. Muitos escritórios de contabilidade brasileiros padronizaram no Omie, Conta Azul ou Domínio e exigem que seus clientes usem a mesma plataforma para integração. Se seu contador disser "use este ERP ou não podemos atendê-lo", a decisão da ferramenta está tomada. A camada de extração ainda pode agregar valor aqui, alimentando os dados extraídos no ERP exigido — ela não conflita com o ERP, fica antes dele. Mas se a captura de entrada do ERP funciona bem para seu volume e mix de fornecedores, a ferramenta de extração independente adiciona uma etapa extra de exportação-importação que pode não se justificar.
Você processa mais de 500 documentos por mês de um único tipo. Com 500+ NF-e por mês, plataformas empresariais como Qive (antigo Arquivei) se justificam pelo custo-benefício através da automação de XML da SEFAZ, efeitos de rede de fornecedores e recursos de fluxo de AP que uma ferramenta de extração de uso geral não oferece. A camada de extração é melhor para 50–500 documentos por mês de múltiplos tipos — a faixa de volume onde a digitação manual dói, mas o preço empresarial por documento não compensa. Para o extremo específico de notas fiscais dessa faixa, o processamento em lote de notas fiscais para Excel lida com extração em massa, e para fluxos estruturados de notas fiscais, o processamento de notas fiscais cobre o fluxo completo.
E a Volatilidade Cambial?
Uma ferramenta de extração de documentos precificada em dólar introduz uma variável cambial que o software brasileiro precificado em reais não carrega. A taxa USD/BRL oscilou de R$5,06 a R$5,17 apenas nas duas primeiras semanas de junho de 2026, e de aproximadamente R$4,87 a R$5,50 nos últimos 12 meses. Um plano Pro de US$19/mês custa R$98 a R$5,15 e R$104 a R$5,50 — uma diferença de R$6 por mês, R$72 por ano. Não é um impeditivo para uma assinatura única, mas vale modelar se você está orçando em reais por 12 meses.
Três formas de gerenciar isso. Primeiro, compre o plano anual se disponível — você trava a taxa de câmbio na compra e elimina flutuações mensais. Segundo, use o pacote PAYG (pague conforme usar) Starter (US$6 por 50 imagens, ~R$31) como amortecedor durante picos cambiais: compre créditos quando o real estiver mais forte, consuma-os quando estiver mais fraco. Terceiro, compare o custo da ferramenta em reais com o custo da mão de obra que está substituindo, que também é denominado em reais e inflaciona com a mesma taxa de câmbio — se o real se desvalorizar e a ferramenta em dólar custar mais em reais, a mão de obra brasileira que você pagaria também custa mais em termos de poder de compra, e a taxa de economia relativa permanece direcionalmente similar.
O risco cambial na extração de documentos é pequeno em termos absolutos porque o preço da ferramenta em dólar é baixo: US$9 a US$59/mês. O risco cambial em plataformas de gestão documental empresarial compradas de fornecedores dos EUA a US$500+, onde uma oscilação de R$0,50 na taxa de câmbio adiciona R$250/mês à conta, é uma conversa totalmente diferente.
Perguntas Frequentes
O ImageToTable.ai consegue processar Holerites em PDF de sistemas de folha de pagamento brasileiros?
Sim. Se o Holerite é gerado pelo Domínio, Senior, ADP Brasil ou exportado como PDF do sistema do contador, a IA lê o conteúdo visual e extrai os campos que você define. Um Holerite típico mostra: nome do funcionário, salário base, contribuição INSS, retenção IRRF, depósito FGTS, horas extras e adicional, adicional noturno (20% mínimo), adicional de periculosidade (30%) quando aplicável, outros descontos (vale-transporte, vale-refeição, plano de saúde) e líquido a receber. Você define as colunas uma vez e as reutiliza para todos os Holerites do mesmo lote. A saída da extração é uma planilha Excel com uma linha por funcionário — útil para conciliação da folha, alocação por centro de custo ou alimentação de uma ferramenta de BI que acompanha custos de mão de obra entre departamentos.
A ferramenta lida com NFS-e de diferentes municípios com layouts diferentes?
Sim. Embora a NFS-e agora siga um padrão XML nacional unificado pela Lei Complementar 214/2024, a representação visual em PDF ainda varia por município e emissor. A extração semântica lê os valores dos campos pelo significado, não pela posição, então "CNPJ prestador" em uma NFS-e de São Paulo e "CNPJ do prestador" em uma NFS-e de Curitiba mapeiam para a mesma coluna extraída. O padrão nacional unificado importa mais para a infraestrutura XML do que para o layout visual — da perspectiva da ferramenta de extração, os nomes dos campos são similares o suficiente para que a mesma definição de coluna funcione em diferentes municípios.
Como a camada de extração funciona com minha configuração contábil atual?
O fluxo típico: você recebe DANFEs de NF-e, PDFs de NFS-e e PDFs de Holerite por e-mail ou WhatsApp ao longo do mês. Você os envia para o ImageToTable.ai, define as colunas necessárias para cada tipo de documento (ou as salva como predefinições para reuso) e baixa os arquivos Excel extraídos. Depois, envia os arquivos Excel para seu contador, que os importa para o sistema contábil que usam — Omie, Conta Azul, Domínio ou conciliação baseada em Excel. O fluxo de trabalho do contador não muda, exceto que eles recebem dados estruturados em vez de PDFs para redigitar. Se o contador exigir dados em um formato específico, você pode configurar os nomes das colunas de extração para corresponder ao modelo de importação deles.
E quanto ao CT-e (Conhecimento de Transporte Eletrônico) e outros tipos de documentos?
A mesma abordagem de extração funciona para CT-e (documentos de transporte de cargas), MDF-e (Manifesto Eletrônico de Documentos Fiscais) e boletos bancários — qualquer documento com conteúdo visual de texto pode ser lido. As definições de coluna mudam por tipo de documento, mas a ferramenta e o custo por página não. É por isso que o plano Max com 1.500 páginas/mês é precificado para cobrir não apenas os três tipos principais de documentos, mas também tipos secundários que aparecem no mesmo fluxo mensal, sem te levar a uma quinta assinatura de ferramenta.
A contagem de páginas é por documento ou por página em um documento com várias páginas?
Por página. Um DANFE de NF-e de 3 páginas de um grande fornecedor industrial usa 3 créditos. Um Holerite de 1 página usa 1. Se seu documento médio tem 1 a 2 páginas (típico para a maioria dos DANFEs de NF-e, NFS-e e Holerites de página única), o plano Básico com 150 páginas cobre cerca de 75 a 150 documentos por mês. NF-e com várias páginas de fornecedores industriais complexos, com muitos itens detalhados, consumirão páginas mais rapidamente — leve isso em conta ao escolher seu plano se sua base de fornecedores tende a faturas detalhadas.
O problema da extração de documentos brasileiros nunca foi a falta de ferramentas. Foi uma arquitetura de ferramentas que espelha os silos regulatórios: uma ferramenta para o fiscal, uma para o municipal, uma para o trabalhista. Essa arquitetura fazia sentido quando cada ferramenta era um escritório físico. Faz menos sentido quando a etapa de extração — ler um PDF e colocar números em colunas — é a mesma operação, independentemente de qual órgão governamental regula o documento. Teste com sua própria mistura de DANFEs NF-e, PDFs NFS-e e holerites. Veja se uma definição de coluna por tipo de documento substitui três processos manuais separados.