Como Extrair Dados do Holerite Brasileiro
para Excel — Com INSS e IRRF
O artigo 464 da CLT determina que todo empregador forneça ao trabalhador um comprovante detalhado de pagamento — e, até 2025, esse documento deve conter quatro deduções separadas (INSS, IRRF, FGTS e contribuições opcionais como vale-transporte ou sindical) distribuídas em três faixas progressivas de imposto que mudam anualmente. No entanto, a ferramenta mais usada pelas equipes de RH para analisar ou consolidar esses dados entre meses e funcionários ainda é a digitação manual no Excel — um holerite (contracheque) por vez.
Principais Conclusões
- Digitar 1.200 holerites no Excel são 40 horas não faturáveis por mês — e o único dígito que você erra repercute simultaneamente na obrigação do INSS, na retenção do IRRF e no acúmulo do FGTS.
- Uma única classificação errada de faixa se agrava, nos termos do artigo 467 da CLT, para o dobro do valor não pago na rescisão — e o OCR genérico não consegue detectar isso, pois falha assim que seu provedor de folha altera o layout do holerite.
- O ImageToTable.ai encontra "Salário Bruto" e "Desconto INSS" entendendo o significado do rótulo — para que você pare de copiar números e comece a auditar a folha de pagamento contra a tabela progressiva da Receita Federal.
Por que os Holerites Brasileiros São Mais Difíceis de Automatizar do que Parecem
A dificuldade não está na quantidade de números na página — mas no fato de que cada holerite (contracheque) carrega uma cadeia de cálculos dependentes, onde um único dígito lido errado se propaga simultaneamente pela contribuição ao INSS, pela retenção do IRRF e pelo recolhimento do FGTS.
A maioria dos softwares de folha de pagamento no Brasil — TOTVS, ADP Brasil, Senior Sistemas, SAP SuccessFactors — exporta holerites em PDF perfeitamente estruturados. Mas, uma vez que esses PDFs saem do sistema de folha, eles se tornam inertes. Um gestor de RH que precisa responder "qual foi a dedução média de INSS de todos os funcionários do escritório de São Paulo no último trimestre" não tem um caminho legível por máquina para essa resposta. Os dados existem em cada holerite individual, mas estão trancados dentro de um layout de PDF que varia entre empregadores, provedores de folha e até mesmo entre meses para o mesmo funcionário, à medida que novas categorias de dedução aparecem (13º salário, abono de férias, horas extras, PLR).
O que torna isso pior do que a extração genérica de documentos é que os holerites brasileiros carregam deduções regidas por tabelas progressivas que mudam anualmente. A alíquota de contribuição ao INSS (previdência social) usa quatro faixas progressivas: 7,5% até R$ 1.518,00, 9% de R$ 1.518,01 a R$ 2.793,88, 12% de R$ 2.793,89 a R$ 4.190,83 e 14% de R$ 4.190,84 até o teto do INSS de R$ 8.157,41. A retenção do IRRF (imposto de renda retido na fonte) tem cinco faixas — de isento até R$ 2.428,80, até 27,5% acima de R$ 4.664,68, com uma dedução mensal por dependente de R$ 189,59 — regida pela tabela do IRRF 2025 da Receita Federal conforme a Lei nº 15.191/2025. Sobre isso, incide o depósito do FGTS (Fundo de Garantia do Tempo de Serviço) — 8% do salário bruto, pago pelo empregador sob a Lei nº 8.036/1990 — que aparece no holerite mesmo que o trabalhador nunca o receba diretamente.
Quando essas alíquotas mudam — como ocorreu entre janeiro-abril e maio de 2025, quando o limite de isenção do IRRF passou de R$ 2.259,20 para R$ 2.428,80 — um modelo de Excel mantido manualmente com fórmulas fixas torna-se instantaneamente desatualizado. O problema não é extrair números. É extrair os números certos sob as regras certas para o período certo.
Passo a Passo — Extraindo Dados do Holerite/Contracheque para o Excel
Diferente das ferramentas de OCR baseadas em modelos, que exigem que você desenhe caixas ao redor de cada campo no holerite — e quebram completamente quando uma nova linha de desconto aparece ou o layout muda entre períodos de pagamento — a Extração de Colunas Personalizadas funciona de outra forma: você digita os nomes dos campos desejados (como "Contribuição INSS", "IRRF Retido", "Salário Líquido") e a IA localiza cada valor em qualquer lugar da página, entendendo o significado do rótulo, não sua posição no layout.
Arquivos são processados com segurança e não são armazenados.
Verificando INSS e IRRF — Garantindo que os Números Fecham
Ao parar de digitar dados do holerite manualmente, você também deixa de perceber quando o sistema de folha cometeu um erro — e erros na folha de pagamento no Brasil, quando envolvem recolhimentos incorretos de INSS ou IRRF, geram responsabilidade tanto para o empregador quanto para o empregado.
Por isso, extrair não é o suficiente. A extração te dá os dados no Excel. A verificação te dá confiança. E a forma mais rápida de verificar é cruzar os valores extraídos de INSS e IRRF com as tabelas progressivas oficiais.
Aqui está a estrutura de alíquotas de referência que você precisa para qualquer verificação de holerite brasileiro. Use o salário bruto do holerite, encontre a faixa correspondente e confirme se o desconto segue a fórmula:
| Faixa de INSS | Alíquota | Salário de Contribuição |
|---|---|---|
| 1ª faixa | 7,5% | Até R$ 1.518,00 |
| 2ª faixa | 9% | De R$ 1.518,01 a R$ 2.793,88 |
| 3ª faixa | 12% | De R$ 2.793,89 a R$ 4.190,83 |
| 4ª faixa | 14% | De R$ 4.190,84 a R$ 8.157,41 (teto) |
O INSS é calculado de forma progressiva — cada alíquota é aplicada apenas sobre a parte do salário dentro daquela faixa, e depois somada. O teto é de R$ 8.157,41 em 2025.
| Faixa Mensal do IRRF (a partir de maio/2025) | Alíquota | Parcela a Deduzir |
|---|---|---|
| Até R$ 2.428,80 | Isento | — |
| De R$ 2.428,81 a R$ 2.826,65 | 7,5% | R$ 182,16 |
| De R$ 2.826,66 a R$ 3.751,05 | 15% | R$ 394,16 |
| De R$ 3.751,06 a R$ 4.664,68 | 22,5% | R$ 675,49 |
| Acima de R$ 4.664,68 | 27,5% | R$ 908,73 |
Fonte: Receita Federal — Tabelas IRPF 2025, Lei nº 15.191/2025. Dedução por dependente: R$ 189,59/mês.
Com os dados do holerite na sua planilha Excel, adicione uma coluna de verificação ao lado do valor do INSS extraído, com uma fórmula de consulta baseada nessas faixas. Se o valor extraído e o valor esperado divergirem, você identificou um erro de configuração no sistema de folha ou um problema na extração — e, de qualquer forma, detectou o problema antes que ele chegasse ao seu sistema contábil ou ao funcionário.
Erros na folha de pagamento no Brasil têm consequências graves. De acordo com o artigo 467 da CLT, o pagamento a menor de salários — incluindo cálculos incorretos de descontos — dá ao empregado o direito de receber o dobro do valor não pago, se não for corrigido no momento da rescisão. Uma única classificação errada de faixa ao longo de um ano de holerites mensais pode se acumular em um passivo substancial que surge durante uma fiscalização trabalhista ou numa rescisão contratual.
Processamento em Lote — Quando Você Tem 100 Holerites de 12 Empresas
O fluxo de um único holerite responde à pergunta do funcionário individual. Mas o cenário de volume — onde atuam escritórios de contabilidade, provedores de terceirização de folha e departamentos de RH de múltiplas subsidiárias — introduz um atrito composto que uma abordagem um a um não consegue suportar.
Um escritório de contabilidade que atende 30 empresas-clientes, cada uma com média de 40 funcionários, lida com cerca de 1.200 holerites por mês. Se cada holerite leva 2 minutos para verificar campos-chave — INSS, IRRF, FGTS, salário líquido — e cruzar com as transmissões do eSocial, são 40 horas por mês gastas apenas numa dupla verificação de conformidade. Cada hora disso não é cobrada de ninguém.
O processamento em lote muda a equação. Carregue todos os 1.200 holerites — mesmo de 12 sistemas de folha diferentes gerando 12 layouts de PDF distintos — em um único lote. Defina as colunas uma vez. A IA processa tudo junto e gera um único arquivo Excel com 1.200 linhas, cada uma representando um funcionário-mês. A estrutura das colunas é uniforme, independentemente de qual software de folha gerou cada holerite original.
Para casos de uso contábil com múltiplas empresas, isso significa que você pode criar abas do Excel por cliente a partir de uma única execução em lote, ou manter tudo numa planilha mestra com uma coluna "Nome da Empresa" ou "CNPJ" para filtragem. O formato de saída é padrão, mesmo que os formatos de entrada não fossem — e essa é a proposta de valor central para qualquer empresa que lida com folha de pagamento brasileira em escala. Para mais informações sobre a abordagem em lote em diferentes tipos de documentos, veja nosso guia sobre extração de dados de notas fiscais eletrônicas (NF-e), que aplica o mesmo princípio a fluxos de compra a pagamento.
Do Holerite ao eSocial — Onde Isso se Encaixa no Fluxo de Conformidade Brasileiro
Extrair dados do holerite para o Excel resolve o problema de análise da equipe de RH. Mas no Brasil, cada contracheque tem uma segunda vida como artefato de conformidade. Desde a introdução do eSocial (Sistema de Escrituração Digital das Obrigações Fiscais, Previdenciárias e Trabalhistas) pelo Decreto nº 8.373/2014, os empregadores devem reportar eletronicamente eventos trabalhistas — incluindo remuneração (evento S-1200), pagamentos (S-1210) e fechamentos periódicos (S-1299) — por meio de uma plataforma governamental unificada. O holerite gerado pelo seu software de folha de pagamento é o resumo voltado ao funcionário dos mesmos dados que alimentam o eSocial.
Quando uma auditoria do eSocial sinaliza uma discrepância entre a remuneração reportada e os depósitos reais, o holerite se torna sua principal evidência — e se seus dados de holerite não estiverem prontamente acessíveis em um formato analisável, reconstruir essa evidência vira uma caça aos documentos por meses de arquivos PDF.
Ter extraído dados do holerite para o Excel permite duas coisas que o armazenamento puro em PDF não consegue: (1) validação cruzada com o eSocial — compare os valores de INSS/IRRF/FGTS extraídos com os valores enviados no evento S-1200 para detectar divergências antes que a Receita Federal o faça, e (2) resposta rápida a auditorias — quando o Ministério do Trabalho solicita registros de folha de um funcionário específico em um período específico (algo comum no ambiente trabalhista brasileiro, onde as empresas devem reter registros por no mínimo 5 anos), você pode filtrar, exportar e responder em minutos, não em horas.
Perguntas Frequentes
Funciona com contracheques ou recibos manuscritos?
Sim. O modelo de visão do ImageToTable.ai lê texto manuscrito — incluindo letra cursiva — e pode extrair campos de holerites fotografados ou escaneados que foram impressos, escritos à mão ou carimbados. Para empregadores que ainda emitem contracheques manuais (comum em pequenas empresas brasileiras ou arranjos informais de trabalho), a ferramenta lida com a variedade visual sem exigir PDFs digitais limpos.
Consegue processar holerites da TOTVS, ADP ou Senior Sistemas?
Sim. A IA extrai dados semanticamente — ela procura por rótulos como "INSS" ou "IRRF", independentemente de onde aparecem na página ou de como o sistema de folha formata o holerite. Não há modelo a configurar, então mudar de um fornecedor de folha para outro (ou processar holerites de múltiplos sistemas simultaneamente) não exige alteração na configuração.
E se meu holerite usar abreviações ou campos apenas em português?
A IA entende rótulos em português — "Salário Bruto", "Desconto INSS", "IRRF Retido", "FGTS do Mês", "Líquido a Receber" — e os mapeia para os nomes de colunas em inglês que você definiu. Esta é uma área onde a extração semântica (baseada em significado) supera o OCR por modelo: um modelo espera uma string de rótulo específica, enquanto a IA entende que "FGTS do Mês" e "Depósito FGTS" significam a mesma coisa.
Consigo extrair dados de 13º salário e abono de férias?
Sim. Defina colunas como "13º Salário — 1ª Parcela" e "Abono de Férias (1/3)" no seu conjunto de colunas. Quando esses itens aparecem no holerite de um determinado mês, a IA extrai os valores. Quando não aparecem (ou seja, meses sem pagamento de 13º ou férias), essas células ficam em branco — seu arquivo Excel reflete naturalmente a presença ou ausência desses pagamentos sazonais ao longo dos meses, sem necessidade de filtragem manual.
A ferramenta calcula INSS ou IRRF, ou apenas extrai o que está impresso?
Por padrão, ela extrai o que aparece no documento. Mas as Colunas Calculadas permitem definir cálculos que rodam durante a extração — por exemplo, uma coluna chamada "Verificação IRRF (Bruto × Alíquota − Dedução)" pode calcular o IRRF esperado a partir do salário bruto extraído e compará-lo com o que o sistema de folha imprimiu. Isso transforma a extração em uma auditoria automatizada.
Dados de Holerite Que Respondem Perguntas, Não Apenas Arquivos PDF
Uma pasta com 500 PDFs de holerites não lhe diz nada — é apenas armazenamento bruto. Uma planilha com 500 linhas, cada uma com data, CPF, salário bruto, contribuição INSS, retenção IRRF, depósito FGTS e salário líquido, lhe diz a carga média de INSS por faixa salarial, o mês em que sua retenção de IRRF disparou, quais funcionários ultrapassaram o limite de isenção e se seu fornecedor de folha alterou uma regra de desconto sem avisar. Essa é a diferença entre ter documentos e ter dados.
A folha de pagamento brasileira carrega mais complexidade regulatória por holerite do que a maioria dos países administra em uma declaração fiscal anual inteira. Extrair sem a capacidade de verificar contra tabelas progressivas não é automação — é apenas copiar mais rápido. Extrair colocando cada linha de INSS e cada faixa de IRRF em uma estrutura onde você pode conferir os cálculos, comparar entre períodos e reconciliar com as entregas do eSocial transforma o holerite de um comprovante de conformidade em um conjunto de dados operacionais.