Extração de Documentos Franceses
Opções Acessíveis para TPE e PME
A França está a três meses da maior mudança em sua infraestrutura de faturamento em uma geração. Em 1º de setembro de 2026, toda empresa registrada no IVA deve ser capaz de receber faturas eletrônicas por meio de uma Plataforma Aprovada (PA) ou do Portal Público de Faturamento (PPF). A reforma — formalizada no Artigo 91 da Lei Financeira de 2024 — exigirá que todas as empresas emitam faturas eletrônicas até setembro de 2027. Mas a discussão sobre a obrigatoriedade tem se concentrado quase exclusivamente na conformidade: qual PA escolher, como é o formato Factur-X, como se conectar ao Chorus Pro. O que não foi abordado é o problema de extração que antecede a conformidade: como as empresas francesas obtêm dados dos documentos que já possuem.
Principais Conclusões
- "OCR incluso" em softwares de contabilidade franceses por €14/mês significa recibos — as notas de entrega e orçamentos de fornecedores que preenchem metade da sua pilha de documentos ficam na sua mesa.
- As ferramentas que lidam com a mistura completa de documentos franceses começam em €499/mês — 60x o preço pela mesma classe de IA lendo o mesmo "Valor Total com IVA" da mesma fatura.
- ImageToTable.ai por €8,30/mês lê todos os tipos de documentos franceses com as mesmas definições de coluna — porque a IA semântica encontra "Número da Fatura" pelo significado, não pela posição no modelo.
O problema dos documentos franceses vai muito além da fatura eletrônica
Uma TPE ou PME francesa não recebe um único tipo de documento. Ela recebe faturas de 15 a 40 fornecedores, cada uma com um layout diferente. Emite orçamentos para clientes e depois converte os aceitos em faturas. Recebe notas de entrega do Métro, Réseau Pro ou Point.P — documentos que confirmam o que foi enviado, mas muitas vezes sem formato padrão, sem nome do fornecedor no cabeçalho e sem um campo que você reconheceria como identificador de tipo de documento. Recebe orçamentos de fornecedores para pedidos em grande quantidade, extratos bancários do Crédit Agricole ou BNP Paribas com seus próprios layouts em PDF, notas de despesas de funcionários e pedidos de compra.
Nenhum desses documentos é coberto pela obrigatoriedade da fatura eletrônica, exceto a própria fatura. E para a fatura, a obrigatoriedade cobre apenas o formato de transmissão — não cobre a extração de dados. Uma fatura Factur-X que chega por meio de um PA está em conformidade. Os 13 campos obrigatórios do Artigo 242 nonies A do Anexo II do CGI estão presentes. Mas até que alguém extraia esses campos para uma planilha ou lançamento contábil, os dados permanecem no documento, não nos seus livros. A etapa de extração é o gargalo que a obrigatoriedade nunca foi projetada para resolver.
Toda empresa francesa processa pelo menos cinco tipos de documentos além da fatura. A obrigatoriedade da fatura eletrônica padroniza um deles — o formato de transmissão da fatura. Os outros quatro permanecem não estruturados, não padronizados e não extraídos. Este é o problema documental que nenhum PA resolve.
O panorama do software de contabilidade francês: o que o OCR realmente cobre
A França tem um dos mercados de software de contabilidade mais competitivos da Europa. Quase todos os produtos incluem alguma forma de OCR. A questão não é se o OCR existe, mas o que ele realmente extrai e em qual nível de custo.
| Ferramenta | Preço Mensal (HT) | OCR para Faturas | OCR para Outros Docs | Gestão de Vários Fornecedores | Exportação para Contabilidade |
|---|---|---|---|---|---|
| Pennylane Basique | €14 | Básico, layouts padrão | Apenas recibos | Limitado; piora em formatos não padrão | Nativo |
| Pennylane Premium | €79 | Avançado, entrada automatizada com regras | Recibos, alguns boletos de entrega | Bom após configurar regras | Nativo + EDI |
| Indy | €12–25 | Foco em recibos; fatura básica | Recibos, quilômetros | Feito para volume de freelancer | Exportação |
| Tiime | Grátis–€25 | Contabilidade automática com extração básica | Extratos bancários | Apenas layouts simples e recorrentes | Parcial |
| EBP | €15–60 | OCR baseado em modelos nos planos superiores | Limitado | Manutenção de modelo para cada fornecedor | Exportação |
| Sage / Cegid | €30–100+ | Módulos OCR completos | Existem alguns módulos para pedidos/boletos | Projetado para AP empresarial, não para variedade de TPE | Nativo |
O padrão é consistente: o OCR que lida com vários tipos de documentos e layouts de fornecedores está no plano acima de €60. Abaixo disso, você obtém digitalização de recibos e reconhecimento básico de faturas. E mesmo no nível superior, o OCR é projetado para os documentos que o módulo contábil espera — faturas e recibos — não a variedade completa de documentos que uma empresa francesa realmente lida. Um boleto de entrega da Point.P ou um orçamento de fornecedor da Frans Bonhomme fica totalmente fora do treinamento de OCR do software contábil.
Ferramentas Autônomas de Extração de Documentos Disponíveis na França
Independentemente dos pacotes contábeis, uma segunda categoria de ferramentas surgiu: produtos de extração dedicados que leem documentos e geram dados, sem tentar substituir sua contabilidade. Essas ferramentas funcionam com vários tipos de documentos, pois não se importam com o que acontece com os dados após a extração. A contrapartida: menos recursos específicos de contabilidade, mas uma fração do custo e nenhuma dependência de plataforma.
| Ferramenta | Custo Mensal | Páginas Incluídas | Tipos de Documentos Abrangidos | Idioma / Formato Francês | Para Quem É |
|---|---|---|---|---|---|
| ImageToTable.ai Basic | $9 (≈ €8,30) | 150 páginas | Todos: faturas, notas de entrega, orçamentos, recibos, extratos bancários, pedidos de compra | IA semântica lê campos franceses em qualquer layout; entende divisões de TVA, números SIREN, formatos de data | MEI com 20-100 docs/mês |
| ImageToTable.ai Pro | $19 (≈ €17,50) | 400 páginas | Todos; mais colunas calculadas (ex.: cálculo de TVA a partir do HT) | Mesmo; Formato de Regra para lógica francesa complexa | MEI/PME com 50-300 docs/mês |
| ImageToTable.ai Max | $59 (≈ €54) | 1.500 páginas | Todos; mais compartilhamento em equipe, processamento prioritário | Mesmo | PME com 200-1.000+ docs/mês |
| Dext | €24+ | Varia conforme o plano | Faturas, recibos, extratos bancários | Bom reconhecimento de recibos e faturas franceses; aprendizado de regras do fornecedor ao longo do tempo | MEI/PME com fluxo intenso de recibos |
| Parseur | $39+ (≈ €36) | Varia | Faturas, e-mails, PDFs; análise baseada em modelo + GPT | Biblioteca de modelos franceses disponível; extração via GPT lida com campos franceses | PME que desejam automação de e-mail para dados |
| Google Document AI | Pagamento por uso | ~$0,08–0,65/página | Faturas, recibos, formulários, passaportes | Modelo de idioma francês disponível; preço por página aumenta rapidamente | Desenvolvedores, fluxos de trabalho integrados |
| Nanonets | $499+ | 5.000+ páginas | Faturas, recibos, pedidos de compra e modelos personalizados | Treinamento de modelo francês requer documentos de amostra; nível empresarial, mas preço empresarial | PME/ETI com 1.000+ docs/mês e equipe de contas a pagar dedicada |
A diferença entre ImageToTable.ai a €8,30/mês e Nanonets a €499+/mês é onde a maioria das MEI e PME francesas se encontra. Os €490 de diferença compram recursos empresariais — conectores ERP, fluxos de aprovação, suporte dedicado — que uma empresa processando 100 documentos por mês não precisa. O que não compra é uma extração materialmente melhor em formatos de documentos franceses. Uma IA semântica lê "Montant TTC" em uma fatura francesa da mesma forma a €8,30 que a €499. Para uma visão completa de como esses níveis de preço funcionam no mercado global, veja o hub de preços de extração de documentos com IA 2026.
Preço por Documento em Volumes Mensais Comuns
Os preços de assinatura mensal são enganosos porque o número de páginas incluídas varia drasticamente entre as ferramentas. Um plano de €24/mês que cobre 100 páginas e um plano de €17,50/mês que cobre 400 páginas têm economias por documento muito diferentes. Veja abaixo o custo real de cada ferramenta por documento em três volumes comuns de negócios franceses.
| Ferramenta (Plano) | 50 docs/mês | 200 docs/mês | 500 docs/mês |
|---|---|---|---|
| ImageToTable.ai Basic | €0,17/doc | Excede limite de 150 páginas | N/D |
| ImageToTable.ai Pro | €0,35/doc | €0,09/doc | Excede limite de 400 páginas |
| ImageToTable.ai Max | €1,08/doc | €0,27/doc | €0,11/doc |
| Dext (plano €24, ~150 páginas) | €0,48/doc | Excede limite de páginas | N/D |
| Parseur (plano $39, ~300 docs) | €0,72/doc | €0,18/doc | Excede o plano |
| Google Document AI | €3–33 | €13–130 | €33–325 |
| Nanonets | €10,00/doc | €2,50/doc | €1,00/doc |
A 200 documentos por mês — volume típico para uma PME com 30 funcionários, um pequeno escritório de contabilidade ou uma TPE em crescimento no setor de logística — o ImageToTable.ai Pro oferece extração a €0,09 por documento. O plano inicial do Dext não atinge esse volume sem um upgrade. O custo por documento do Parseur é o dobro. O preço imprevisível por página do Google Document AI dificulta o orçamento para um usuário não técnico. E o Nanonets nesse volume custa 28x mais por documento para uma qualidade de extração comparável, não superior.
O padrão econômico se repete em todas as faixas de volume: as ferramentas com preços visíveis e limites fixos de páginas oferecem custos previsíveis por documento para os volumes que as TPE e PME francesas realmente processam. As ferramentas que dizem "fale conosco" ou cobram por página são projetadas para ciclos de compras empresariais onde a previsibilidade importa menos que os recursos. Para uma análise detalhada dos preços de nível básico versus empresarial no mercado de extração, veja o ranking das ferramentas de extração de documentos por IA mais acessíveis.
Tipos de Documentos Franceses que Quebram Ferramentas Baseadas em Modelos
Todo país tem peculiaridades documentais que ferramentas OCR genéricas, treinadas em layouts dos EUA ou Reino Unido, interpretam errado. A França tem mais que a maioria.
Faturas híbridas Factur-X. Um arquivo Factur-X é um PDF com XML embutido. O OCR baseado em modelo lê a camada visual do PDF e ignora completamente a camada XML estruturada. A extração semântica lê a camada visual, mas não depende dela — a IA processa o que vê, não o que o modelo espera. Uma fatura Factur-X de um grande cliente e um PDF simples de um artesão local chegam nas mesmas definições de coluna, sem configuração alguma.
Faturas com múltiplas alíquotas de IVA. Faturas francesas frequentemente dividem itens em três alíquotas de IVA em uma única página. A alíquota padrão (20%, taux normal), a intermediária (10%, para restaurantes, transporte e algumas reformas) e a reduzida (5,5%, para alimentos, energia e livros). Um OCR baseado em modelo que gera uma única coluna de "imposto" não consegue distinguir qual valor se aplica a qual alíquota — e a declaração CA3 de IVA exige cada alíquota em uma linha separada. A extração semântica com colunas nomeadas ("IVA 20%", "IVA 10%", "IVA 5,5%") divide os valores ao ler o rótulo da alíquota ao lado de cada item.
Bons de entrega sem cabeçalhos padrão. Notas de entrega francesas de fornecedores de materiais de construção (negociantes em materiais) como Point.P e Chausson Matériaux frequentemente omitem o nome do fornecedor no cabeçalho e o colocam em um pequeno bloco no rodapé. A identificação do documento — "BON DE LIVRAISON" — pode estar em maiúsculas, no meio da página, em uma fonte na qual o modelo não foi treinado. Um modelo que busca o nome do fornecedor no cabeçalho retorna nada. A extração semântica lê o conteúdo da página e localiza o nome do fornecedor onde quer que apareça. Isso não é um caso extremo teórico — é o formato padrão de um dos maiores distribuidores de materiais de construção da França.
Anotações manuscritas em orçamentos. Um artesão francês envia um devis a um cliente, o cliente escreve "OK para 1500€" na margem e assina, e o devis se torna um quase-contrato. A anotação manuscrita contém o preço acordado, mas está fora dos campos digitados. A extração semântica lê escrita à mão — incluindo a caligrafia cursiva comum na correspondência comercial francesa — e a extrai junto com os dados digitados. O OCR baseado em modelo ignora completamente a margem.
Para as TPE e PME que processam esses documentos, o problema de "quebra em formatos franceses" não é um custo único de configuração. É um atrito recorrente que se acumula a cada novo fornecedor, a cada novo tipo de documento e a cada formato não padrão. Esta é a razão estrutural pela qual a extração semântica vence na mistura documental francesa: ela não precisa saber antecipadamente a aparência do documento para extrair o que ele contém.
Os arquivos são processados com segurança e não são armazenados. Teste qualquer tipo de documento — sem limites predefinidos para extração.
Para Decisões Específicas de Faturas, Comece com a Análise Detalhada de Faturas
Este artigo aborda o mercado francês de extração de documentos em todos os tipos de documentos. Se sua principal preocupação é especificamente a extração de faturas — o fluxo de trabalho de faturas, divisões de IVA, verificação SIREN e a matemática de custos para 20, 50 ou 120 faturas por mês — temos uma análise dedicada: extração de faturas econômica para TPE francesas antes da obrigatoriedade de 2026. Esse artigo detalha a tabela de preços de softwares contábeis, os campos obrigatórios da fatura e o modelo de custo por fatura com o mesmo nível de detalhe, mas focado exclusivamente no problema de extração de faturas.
A conclusão geral é a mesma em ambos os artigos: o mercado francês de extração de documentos tem ferramentas em todas as faixas de preço, mas as ferramentas que realmente lidam com a variedade de documentos franceses nos volumes de TPE e PME são as que precificam para isso. Uma ferramenta de extração de €8,30/mês e uma plataforma empresarial de €499/mês leem a mesma fatura francesa com a mesma classe de IA. A diferença de €490 financia um ciclo de vendas empresarial, não uma extração melhor. Para a análise comparativa do mercado alemão de extração de documentos, veja a visão geral de preços de extração de documentos para KMU alemãs — a mesma lacuna estrutural se repete com nomes de software e códigos tributários diferentes.
Perguntas Frequentes
Essas ferramentas conseguem processar documentos totalmente em francês?
Sim. Ferramentas de extração semântica como ImageToTable.ai processam documentos em francês nativamente — a IA lê o texto em francês na página e o associa aos nomes de colunas que você define. Campos como "Número da Fatura", "Valor Total com IVA", "Data de Vencimento" e "Taxa de IVA" são lidos e interpretados pelo significado, não por treinamento em palavras-chave em inglês. Ferramentas baseadas em modelos que foram treinadas principalmente em layouts de faturas em inglês podem reconhecer termos franceses comuns, mas perdem qualidade em nomes de campos menos comuns ou formatos regionais. Para obter os melhores resultados com documentos em francês, teste a ferramenta com sua própria mistura de documentos antes de se comprometer.
E quanto a documentos do PPF ou de uma PA?
Documentos recebidos pelo PPF (Portal Público de Faturamento) ou por uma PA (Plataforma Aprovada) já estão em formato eletrônico estruturado — normalmente Factur-X, UBL ou CII. Esses formatos contêm dados legíveis por máquina e não exigem extração no sentido tradicional. No entanto, muitas empresas francesas continuarão a receber faturas em PDF de fornecedores menores que ainda não são obrigados a emitir faturas eletrônicas (o prazo de 2027 para emissão por MEIs significa que alguns fornecedores só migrarão no último momento possível). A camada de extração lida com os PDFs e documentos digitalizados que compõem a parte não estruturada da sua mistura de documentos. As faturas estruturadas ignoram completamente a extração.
Posso usar essas ferramentas com meu software de contabilidade francês atual?
Sim. Toda ferramenta de extração independente exporta para Excel (XLSX) ou CSV, que qualquer software de contabilidade francês — Pennylane, EBP, Sage, Cegid, Tiime, Indy — pode importar. Você define as colunas uma vez, a ferramenta extrai os dados nessas colunas, e a planilha resultante é importada para seu software de contabilidade em uma única etapa. O fluxo de trabalho não exige integração de API ou migração de plataforma. A estrutura existente do seu contador permanece intacta.
Que volumes de documentos justificam uma ferramenta de extração paga?
O ponto de equilíbrio depende de quem faz a digitação manual e do custo dessa pessoa. A €40/hora (taxa típica de assistente interno numa TPE francesa) e 5 minutos por documento de digitação manual, um plano Básico de €8,30/mês se paga com cerca de 8 documentos por mês. Um plano Pro de €17,50/mês se paga com cerca de 13 documentos. Se o seu contador fizer a digitação a €60–70/hora, o ponto de equilíbrio cai para 5 a 7 documentos. Abaixo desses volumes, a digitação manual custa menos que a ferramenta. Acima deles, a ferramenta economiza dinheiro real todo mês. Para um cálculo detalhado do ponto de equilíbrio com volumes de fatura de TPE francesa, consulte o guia específico para faturas.
Essas ferramentas estão em conformidade com o GDPR para empresas francesas?
O ImageToTable.ai processa documentos na memória e não os retém após a extração. Sem armazenamento de documentos, não há risco de retenção de dados pessoais sob o GDPR. Para ferramentas que armazenam documentos para treinamento de modelo ou arquivamento, verifique o acordo de processamento de dados do fornecedor e se os servidores estão localizados na UE. Empresas francesas sob jurisdição da CNIL devem verificar se qualquer ferramenta de extração que usam atende aos requisitos do GDPR para processamento de dados, especialmente se os documentos contiverem dados pessoais como nomes de clientes, endereços ou números SIREN.
O mercado de extração de documentos franceses em 2026 está dividido entre ferramentas que precificam para volumes de TPE e ferramentas que precificam para ciclos de compras empresariais. A diferença na qualidade da extração entre os dois níveis é marginal. A diferença de custo é de 10x a 50x. Antes que a obrigatoriedade da fatura eletrônica reformule como toda empresa francesa envia e recebe documentos, o problema de extração já presente em sua caixa de entrada é solucionável a um preço que corresponde ao volume que você realmente processa.