Como Extrair Dados do Holerite Francêspara o Excel

Quando um escritório de contabilidade francês (cabinet d'expertise comptable) assume a folha de pagamento de um novo cliente, o primeiro documento solicitado não é o razão geral. São 12 meses de bulletins de paie (holerites) de cada funcionário. Cada PDF é um espelho da DSN (Déclaration Sociale Nominative) mensal — a declaração eletrônica única transmitida à URSSAF, CNAV, CPAM e Pôle Emploi desde janeiro de 2017, conforme o Décret n°2016-611. Se o salário bruto no holerite de dezembro não corresponder ao total da DSN, a discrepância deve ser localizada e explicada antes que a empresa possa certificar os livros (arrêter les comptes). O gargalo não é ler os holerites. São os 3 minutos por boletim gastos digitando manualmente Gros (salário bruto), CSG dedutível (contribuição social dedutível) e Valor líquido a receber (net pay) em uma linha de planilha — e depois repetindo o processo para mais 49 funcionários, ao longo de 12 meses.

Extração de dados do holerite francês bulletin de paie para planilha Excel

Principais Conclusões

  1. A três minutos por bulletin de paie, uma empresa de 50 funcionários gasta 30 horas por ano digitando os dezesseis campos obrigatórios por lei no Excel — antes mesmo de qualquer verificação começar.
  2. 30 horas de digitação, e o contador ainda não pode assinar — porque a conciliação da DSN exige que o Salário Bruto, CSG dedutível e Valor Líquido Tributável correspondam entre o PDF do holerite e a declaração eletrônica, e uma contribuição mal classificada quebra todo o mês.
  3. Uma coluna calculada — Verificação CSG = Bruto × 98,25% × 9,2% − CSG extraída — permite que o ImageToTable.ai sinalize linhas acima de ±€1 durante a extração, transformando uma planilha de 600 linhas em uma lista de investigação de três linhas.

O que torna o Bulletin de Paie francês um dos documentos mais complexos da Europa para extração

O holerite francês não foi criado para ferramentas de extração de dados. Ele foi criado para conformidade — e o sistema de proteção social da França, financiado por algumas das maiores taxas de contribuição patronal da Europa, exige que cada euro de contribuição seja rastreado. Dezesseis campos são obrigatórios de acordo com o Artigo R3243-1 do Código do Trabalho. Outras cinco linhas são proibidas pelo Artigo R3243-4 — um empregador não pode exibir horas de greve como tal, nem distinguir entre horas trabalhadas e tempo de representação sindical. Um bulletin de paie não conforme acarreta multa de até €450 por documento.

Essa densidade legal cria três camadas de dificuldade de extração que ferramentas OCR genéricas — projetadas para holerites em inglês com poucas linhas de dedução — não conseguem lidar:

  • O layout de três seções. Um bulletin de paie francês divide-se em topo (identidade do empregador e empregado — SIRET, código NAF, convenção coletiva), corpo (rendimentos brutos → contribuições → líquido) e rodapé (acumulados anuais, saldos de férias, valor social líquido). Cada seção usa convenções tipográficas diferentes, e o mesmo nome de campo — "Total" — aparece no corpo como subtotal, no rodapé como cumul annuel (total anual) e no cabeçalho como número de referência. Um modelo baseado em coordenadas que capta "o segundo Total" do topo obterá o número errado em um PDF gerado pelo Silae versus um do PayFit.
  • Cinco grupos obrigatórios de cotisation. A reforma de simplificação de 2018 agrupou as cerca de 50 linhas de contribuições sociais em cinco categorias: Santé (saúde), Accidents du travail (acidentes de trabalho), Retraite (previdência — sécurité sociale plafonnée, sécurité sociale déplafonnée e complémentaire AGIRC-ARRCO), Famille (família) e Chômage (desemprego). Mas cada grupo ainda contém uma part salariale (parte do empregado) e uma part patronale (parte do empregador), exibidas em colunas separadas. A CSG (Contribuição Social Generalizada) e a CRDS (Contribuição para o Pagamento da Dívida Social) ficam em sua própria seção com sua própria base de cálculo — 98,25% do salário bruto, não 100%. Uma extração que trata todas as linhas de "cotisation" como uma única coluna de imposto misturará contribuições do empregado e do empregador em um número que não significa nada para nenhuma das partes.
  • Net imposable ≠ Net à payer. O valor que aparece na declaração anual de imposto do empregado (net imposable — líquido tributável) não é o valor transferido para sua conta bancária (net à payer — líquido a pagar). Net imposable = salaire brut − cotisations sociales déductibles + CSG non déductible (parcela de 2,4%) + CRDS (0,5%). Net à payer = net imposable − impôt sur le revenu prélevé à la source (imposto de renda retido na fonte, ou PAS) + reembolsos (transporte, vale-refeição). Uma extração genérica que gera uma coluna "Salário Líquido" colapsa dois valores legalmente distintos. Essa distinção é importante porque a DSN usa o net imposable, enquanto o extrato bancário do empregado reflete o net à payer.

Estes não são casos extremos. Eles são a anatomia padrão de todo bulletin de paie emitido por um empregador francês desde janeiro de 2018, quando o formato bulletin de paie clarifié (holerite simplificado) se tornou obrigatório para todas as empresas. A reforma tornou os holerites mais curtos — de ~50 linhas para ~20 — mas não os tornou mais simples de extrair. Agrupar as contribuições sob cinco títulos reorganizou o layout sem padronizá-lo entre os provedores de software de folha de pagamento.

Os Dezesseis Campos Obrigatórios do Artigo R3243-1 — Mapeamento de Cada Um para as Colunas da Sua Planilha

Antes de criar as colunas de extração, você precisa do inventário legal. O Artigo R3243-1 lista exatamente o que deve constar em todo boletim de pagamento. Cada item abaixo corresponde a um nome de coluna que você definirá no seu fluxo de extração:

Item R3243-1CampoNome de Coluna RecomendadoFunção na Verificação da DSN
Nome e endereço do empregadorNome do EmpregadorDeve corresponder ao cadastro SIRET
Código NAF/APE + SIRETSIRETIdentificador principal do empregador na DSN
Convenção coletivaConvenção ColetivaDetermina as alíquotas de contribuição
Nome e cargo do empregadoNome do EmpregadoDeve corresponder ao NIR (CPF)
Número de inscrição social (NIR)NIRIdentificador do bloco do empregado na DSN
Nível de classificação (coeficiente)Classificação (Coeficiente)Determina a grade salarial base
Período de pagamento e horas trabalhadasPeríodo de Pagamento, Horas TrabalhadasDSN: horas para cálculo de contribuições
Horas extras + taxas de adicionalHoras Extras, Taxa de AdicionalIsenção fiscal sobre horas extras
Salário brutoSalário BrutoBase de todos os cálculos de contribuição da DSN
10°Natureza e valor dos acessórios salariaisAcessórios SalariaisBônus, comissões, benefícios em espécie
11°Contribuições do empregado por grupoContribuições do EmpregadoBloco de contribuições do empregado na DSN
12°Contribuições do empregador por grupoContribuições do EmpregadorBloco de contribuições do empregador na DSN
13°Líquido tributávelLíquido TributávelAlimentação anual da DGFiP (autoridade fiscal)
14°Líquido a pagar ao empregadoLíquido a PagarPonto de verificação final de reconciliação da DSN
15°Retenção na fonte (PAS) — alíquota e valorAlíquota PAS, Valor PASAlíquota individualizada da DGFiP
16°Data do pagamentoData de PagamentoReferência do período mensal da DSN

Para um escritório de contabilidade que reconcilia a folha de pagamento de um ano inteiro, esses dezesseis campos formam 600 linhas de dados para 50 funcionários — 9.600 pontos de dados. Um SIRET incompatível ou uma única coluna de Contribuições do Empregado desalinhada gera horas de correção manual. A ferramenta de extração precisa capturar cada campo pelo que ele significa, não por onde ele está na página.

Cinco campos adicionais são expressamente proibidos pelo Artigo R3243-4: qualquer menção a greve, qualquer distinção entre horas trabalhadas e horas de representante sindical, e qualquer referência ao direito do empregado de se desconectar ou ao exercício de outros direitos sociais. Essas proibições não afetam a extração diretamente, mas significam que um bulletin de paie em conformidade usará rótulos neutros como "Absence non rémunérée" (ausência não remunerada) em vez de "Grève" (greve) — o que altera o texto que a IA vê no PDF.

O Panorama dos Softwares de Folha de Pagamento — Por que Silae, PayFit e ADP Geram PDFs Estruturalmente Diferentes

O Artigo R3243-1 determina o que deve constar, não como deve ser disposto. Não existe um modelo governamental obrigatório — e cinco fornecedores dominam o mercado francês de software de folha de pagamento, cada um com seu próprio mecanismo de renderização de PDF.

SoftwarePosição no MercadoFormato de Exportação PDFDesafio de Extração
SilaeLíder — usado por contadores para mais de 30% da folha de pagamento do setor privado francêsLayout compacto de 2 colunas, agrupamento densoCotações mescladas em um único bloco; CSG e CRDS compartilham um rótulo de linha que varia conforme a convenção coletiva
PayFitSaaS moderno para PMEs, design responsivo de coluna únicaColuna única, espaçamento amplo, renderização de fonte webValor social líquido posicionado em uma coluna lateral que ferramentas de template ignoram; linha PAS às vezes em página separada
Sage PaiePMEs no ecossistema Sage (Sage 50, Sage 100), forte no varejo e serviçosMulti-seção com cabeçalhos seccionais, layout tabular convencionalCotações patronais renderizadas abaixo da tabela principal em uma seção que alguns mecanismos de OCR ignoram como "conteúdo de rodapé"
ADPGrandes empresas e multinacionaisDetalhamento em várias páginas, anexos separados para regimes específicosRendimento tributável e valor líquido a pagar frequentemente em páginas diferentes; páginas suplementares para grupos específicos de funcionários (cadres vs non-cadres)
Cegid RHMédio mercado com ambição de HRIS completoBlocos padronizados, consistentes entre versões do produto CegidTabelas de saldo de férias inseridas entre o corpo e o rodapé, quebrando o fluxo vertical que o OCR linear depende

A consequência operacional: um escritório de contabilidade que atende 10 clientes, cada um usando um provedor de folha de pagamento diferente — ou o mesmo provedor com configuração diferente — não pode criar um template por software e esperar que ele sobreviva a uma atualização de versão. Silae, PayFit e Sage alteram periodicamente o layout de seus PDFs. A extração baseada em template falha. A extração semântica — onde a IA procura por "Salaire Brut" pelo significado do rótulo, não por coordenadas de pixel — não falha.

Este é o mesmo desafio que torna a extração de holerites coreanos difícil: a lei define o conteúdo, mas Douzone, ECOUNT e PAYZON o renderizam de forma diferente. A situação da França é mais grave porque a DSN adiciona uma camada de verificação — os dados extraídos devem ser reconciliados com uma declaração eletrônica mensal que foi transmitida a cinco agências governamentais.

Passo a Passo: Extraindo Dados do Holerite Francês para um Arquivo Excel Verificável

Este fluxo de trabalho é construído em torno de uma premissa: a extração não termina quando você tem colunas. Ela termina quando as colunas podem ser verificadas em relação à DSN. As etapas abaixo pressupõem que você tenha uma pasta de PDFs de bulletin de paie — exportados do Silae, PayFit, Sage, ADP ou Cegid — e sua planilha precisa ser estruturada para que um contador possa verificar, não apenas ler.

JPG/PNG/PDF Extração por IA

Os arquivos são processados com segurança e não são armazenados.

1

Faça upload dos boletins de pagamento — Lote é o padrão

Arraste e solte todos os PDFs — sejam 12 boletins mensais de um funcionário ou 50 boletins mensais de toda a equipe. A ferramenta aceita PDF, JPG e PNG. Para um escritório de contabilidade realizando uma revisão anual da folha de pagamento, o upload típico é de 600 arquivos (50 funcionários × 12 meses). Cada um é processado individualmente, mas exportado para uma única planilha — uma linha por boletim.

2

Defina as colunas que correspondem à estrutura da DSN

Digite os nomes das colunas conforme aparecem na sua lista de verificação. Para verificação DSN, o conjunto mínimo é: Nome do Funcionário, SIRET, Salário Bruto, Total de Contribuições do Empregado, Total de Contribuições do Empregador, CSG Dedutível, CSG Não Dedutível, CRDS, Líquido Tributável, Líquido a Pagar, Taxa PAS, Valor PAS. Essas doze colunas fornecem sinal suficiente para verificar qualquer bloco mensal da DSN. A ferramenta lê cada nome de coluna pelo seu significado semântico — "Salário Bruto" encontra o campo de salário bruto independentemente de o Silae tê-lo colocado no canto superior esquerdo ou o PayFit no centro.

3

Adicione uma coluna de verificação calculada

Crie uma coluna chamada Verificação CSG (Bruto × 98,25% × 9,2% − CSG Extraída). Esta é uma coluna calculada — a ferramenta executa o cálculo durante a extração e gera a diferença entre o valor esperado de CSG e o valor extraído. Um resultado dentro de ±€1 por boletim indica que tanto a extração do bruto quanto a da CSG estão provavelmente corretas. Um resultado acima de €5 sinaliza um erro de extração, um erro de entrada na DSN ou um caso excepcional (isenção, ajuste de convenção coletiva específica). Colunas calculadas transformam a extração de uma tarefa de captura de dados em uma tarefa de verificação de dados na mesma etapa.

4

Exporte e cruze com a DSN

Exporte para Excel (XLSX). A planilha agora contém uma linha por boletim de pagamento com colunas que espelham a estrutura da DSN. Importe a exportação mensal da DSN do software de folha de pagamento ou do Net-entreprises.fr. Cruze as informações: o Salário Bruto no boletim deve corresponder ao bruto do bloco do funcionário na DSN; o Líquido Tributável no boletim deve corresponder ao líquido fiscal da DSN; o Valor PAS deve corresponder ao bloco PAS da DSN. Qualquer linha onde a coluna Verificação CSG desvie mais de €1 é sua lista de prioridades para investigação manual — antes de certificar as contas anuais.

Da Extração à Verificação — Usando as Taxas CSG, CRDS e PAS para Detectar Discrepâncias na DSN

A etapa de extração fornece os dados. A etapa de verificação fornece confiança. A legislação trabalhista francesa — especificamente as taxas de CSG e CRDS publicadas anualmente pela URSSAF — oferece fórmulas de verificação integradas que convertem a extração bruta em um resultado auditável.

Aqui estão os três índices de verificação que toda planilha de reconciliação de folha de pagamento deve conter, com a fórmula da coluna calculada que você pode configurar:

VerificaçãoFórmulaDesvio AceitávelO que um Desvio Indica
CSG totalBruto × 98,25% × 9,2%±€1Erro na extração do bruto, exoneração não contabilizada ou cálculo incorreto da base
Divisão da CSG dedutívelCSG Total × (6,8/9,2)±€1Classificação incorreta entre CSG dedutível e não dedutível — afeta diretamente o Rendimento Líquido Tributável
CRDSBruto × 98,25% × 0,5%±€0,50Erro de cálculo da CRDS ou extração capturou uma linha de contribuição diferente com nome semelhante

O fator de 98,25% não é arbitrário — é a assiette CSG (base de cálculo da CSG), definida por lei francesa para excluir as contribuições patronais para seguro saúde complementar (mutuelle) e previdência (prévoyance) que ficam abaixo do limite de isenção. Para um salário bruto de €3.000, a base da CSG é €2.947,50. CSG a 9,2% = €271,17. Se a CSG extraída for €245, a discrepância de €26 indica que algo está errado — ou o Bruto extraído está incorreto, o funcionário tem uma exoneração específica, ou o lançamento na DSN foi calculado errado. Você sabe que existe um problema antes de saber qual é o problema. Essa é a diferença entre extração e verificação.

Essas verificações calculadas são o equivalente na folha de pagamento do que os contadores fazem ao extrair faturas francesas (factures): cruzar as taxas de IVA com os totais dos itens para confirmar que a extração capturou a correta discriminação de impostos, e não apenas um total genérico.

O Fluxo de Conciliação DSN-Folha de Pagamento Que os Escritórios de Contabilidade Realmente Usam

Assim que a extração é concluída e as colunas de verificação estão no lugar, a planilha se torna um documento de trabalho — não uma resposta final, mas uma comparação estruturada entre duas fontes de dados (PDF do boletim de pagamento e exportação DSN). Este é o fluxo de conciliação que os escritórios de contabilidade franceses seguem:

1

Exportar Dados da DSN do Software de Folha de Pagamento

Toda plataforma de folha de pagamento francesa compatível — Silae, PayFit, Sage Paie, ADP, Cegid — pode exportar um extrato de dados DSN. Esse extrato contém, por funcionário e por mês, os mesmos campos que aparecem no boletim de pagamento. Exporte como CSV e abra junto com sua planilha de extração.

2

Corresponder Linhas por NIR do Funcionário + Período de Pagamento

O número de segurança social (NIR, Numéro d'Inscription au Répertoire) é a chave única. Corresponda cada linha do boletim de pagamento à sua linha DSN correspondente usando o NIR e o período de pagamento (période de paie). Se um boletim não tiver uma linha DSN correspondente para um determinado mês, isso é um sinal de alerta — ou a DSN não foi transmitida (penalidade: 5% das contribuições devidas por mês de atraso) ou o boletim é de um período diferente.

3

Sinalizar Desvios Acima de €1

Compare Salário Bruto, Contribuições do Empregado, Rendimento Líquido Tributável e Líquido a Pagar entre as colunas do boletim e da DSN. Sinalize qualquer desvio acima de €1. Classifique a planilha pela coluna calculada de Verificação CSG (decrescente por diferença absoluta). As linhas no topo são sua lista de investigação. Na maioria dos meses, a lista estará vazia — e esse silêncio é o objetivo. Uma lista de desvios vazia significa que o contador pode aprovar a conciliação da folha de pagamento em minutos, em vez de horas.

A Obrigação de Retenção de Cinco Anos — e Por Que o Excel Estruturado Supera uma Pasta de PDFs

De acordo com o Artigo L3243-4 do Código do Trabalho, o empregador deve conservar uma cópia de cada contracheque por cinco anos. Para uma empresa de 50 funcionários, são 3.000 PDFs. Uma pasta com 3.000 PDFs tem zero capacidade de pesquisa. Um arquivo Excel com 3.000 linhas — extraídas desses mesmos PDFs — é pesquisável, ordenável, auditável e filtrável por data, funcionário ou grupo de contribuição.

É aqui que a extração serve a um propósito além da conciliação. Quando um ex-funcionário de 2022 solicita o cumul annuel para verificação de pensão (reconstitution de carrière), o RH não vasculha um arquivo de PDFs. Eles filtram a planilha pelo NIR, verificam a linha de dezembro para os totais anuais de 2022 e respondem em menos de um minuto. A planilha de extração se torna o registro digital de contracheques da empresa — estruturado, pesquisável e em conformidade com a obrigação de retenção de cinco anos em um formato realmente utilizável para recuperação de dados.

Perguntas Frequentes — Extração de Dados de Contracheques Franceses

A extração por IA consegue lidar tanto com o formato antigo detalhado quanto com o formato simplificado de 2018?

Sim. O formato bulletin de paie clarifié, introduzido em janeiro de 2018, agrupou as contribuições em cinco categorias — Santé, Accidents du travail, Retraite, Famille, Chômage — mas os rótulos dos campos subjacentes (Salaire Brut, Net Imposable, Net à Payer) são os mesmos em ambos os formatos. Uma ferramenta de extração semântica que lê os rótulos dos campos pelo significado, e não pela posição, funciona em ambos os formatos. O formato detalhado anterior a 2018, com cerca de 50 linhas de contribuição individuais, na verdade fornece dados mais granulares para extração — a reforma de simplificação reduziu a poluição visual para os funcionários, mas não removeu os dados que a DSN já transmite.

A extração funciona com contracheques que incluem o valor social líquido (montant net social)?

Sim. Desde julho de 2023, os contracheques franceses devem exibir o valor social líquido — o valor de referência usado para determinar a elegibilidade para benefícios sociais como o RSA (Revenu de Solidarité Active) e a prime d'activité. Esse valor fica entre o net imposable e o net à payer no contracheque. A ferramenta de extração o captura como um campo distinto se você definir uma coluna para ele. O valor social líquido não é usado na verificação da DSN — ele serve a um propósito administrativo separado — mas capturá-lo na mesma linha da planilha mantém todos os dados do contracheque em um só lugar para referência futura.

Posso extrair apenas meses específicos — por exemplo, apenas os contracheques de dezembro para os cumuls anuais?

Sim. Se seu objetivo é a conciliação anual, você só precisa do contracheque de dezembro — que lista todos os cumuls anuais (cumul annuel) no final. Carregue apenas os arquivos de dezembro e defina colunas para os campos de cumul: Cumul Brut, Cumul Net Imposable, Cumul Heures, Cumul PAS. Isso fornece os totais do ano inteiro em uma única linha por funcionário, sem processar 12 meses de dados.

E quanto aos regimes específicos de funcionários — cadres (executivos), VRP (representantes comerciais) ou apprentis (aprendizes)?

A folha de pagamento francesa possui regimes de contribuição distintos para cadres (contribuições adicionais AGIRC-ARRCO tranche B, taxas diferentes de prévoyance), VRP (código de risco URSSAF específico 511TG) e apprentis (isenções na maioria das contribuições). Se sua extração abranger várias categorias de funcionários, defina colunas separadas para campos específicos de cadres — por exemplo, Cadre Retraite Complementaire Tranche B — e deixe essas células vazias para funcionários não-cadres. A ferramenta de extração só preencherá uma célula quando encontrar o campo correspondente no holerite. Células em branco não são erros; elas refletem com precisão a ausência daquela categoria de contribuição.

Isso funciona para holerites manuscritos ou digitalizados — não apenas PDFs nativos?

Sim — a IA lê o layout visual, não as camadas de texto incorporadas. Um bulletin de paie digitalizado (impresso e redigitalizado), uma foto tirada com smartphone ou uma captura de tela JPEG de um portal de folha de pagamento passam pelo mesmo pipeline de extração semântica. Anotações manuscritas em um holerite impresso — como uma anotação do gerente — adicionam ruído visual, mas não impedem a IA de encontrar os rótulos dos campos impressos. No entanto, digitalizações muito degradadas (papel amassado, inclinação extrema, danos causados por água) reduzem a precisão. O mesmo princípio se aplica à extração de holerites de qualquer provedor de folha de pagamento — o formato importa menos que a legibilidade.

Como a extração se compara à exportação de um registro de folha de pagamento diretamente do Silae ou PayFit?

Uma exportação de registro de folha de pagamento do Silae ou PayFit contém os dados dentro do software. Mas essa exportação reflete o que o software calculou — não necessariamente o que o holerite em PDF do funcionário mostra fisicamente. Eles podem divergir: um ajuste manual feito após a geração do holerite, uma correção aplicada em um mês subsequente ou uma discrepância de versão entre o banco de dados da folha de pagamento e o arquivo PDF. Extrair dados diretamente dos boletins de pagamento em PDF fornece o documento que foi efetivamente entregue ao funcionário — que é o registro legal sob o Artigo L3243-1. A exportação do software é o cálculo; o holerite em PDF é a evidência. Para extração de registro de folha de pagamento, a mesma lógica de verificação se aplica — o registro é o agregado, os holerites são a prova.

Um holerite francês contém mais de 30 pontos de dados exigidos por um dos sistemas de folha de pagamento mais regulamentados do mundo. A extração fornece os dados. Colunas de verificação calculadas — ancoradas nas taxas da URSSAF — informam se estão corretos. Ambos pertencem ao mesmo fluxo de trabalho.

Experimente em um Bulletin de Paie
📮 contact email: [email protected]