Comment extraire une facture française(Facture) vers Excel

La plupart des outils d'extraction trouvent un « montant total » sur un PDF. Mais quand une facture fournisseur française arrive d'un grossiste à Lyon — affichant trois taux de TVA sur différentes lignes, un SIREN caché dans le pied de page, et une TVA intracommunautaire qui se termine par « FR » suivi d'une clé de contrôle à deux chiffres — la colonne « taxe » unique d'un outil générique transforme votre travail en quelque chose que votre comptable vous renvoie pour correction manuelle. Le problème d'extraction n'est pas d'obtenir des données dans un tableur. Il s'agit d'obtenir les bonnes données dans les colonnes qui correspondent à la structure comptable française — celle que votre déclaration CA3 et votre logiciel attendent.

Extraction de données de facture française vers un tableur Excel avec calculatrice

Points clés à retenir

  1. La plupart des outils d'extraction produisent une colonne « Taxe » et supposent un seul taux — mais une facture fournisseur française standard comporte trois pourcentages de TVA différents et 13 champs légalement obligatoires.
  2. Fusionner trois taux de TVA en une seule colonne « Taxe » transforme la déclaration de TVA CA3 en un rapprochement manuel que votre comptable vous renvoie — à 15 € par élément manquant ou incorrect selon le Code Général des Impôts.
  3. ImageToTable.ai nomme chaque colonne pour correspondre à ce que la comptabilité française attend — l'identifiant de l'entreprise (SIREN), le numéro de TVA intracommunautaire (TVA Intracommunautaire), et une colonne TVA distincte par taux — afin que le tableur s'intègre directement dans Pennylane ou Sage sans aucune correction manuelle.

Ce qui rend une facture française différente pour l'extraction de données

Une facture française n'est pas une facture US traduite avec une étiquette « français ». C'est un document juridique régi par deux textes : l'article L441-9 du Code de commerce, qui liste les mentions obligatoires pour toutes les factures commerciales entre professionnels, et l'article 289 du Code Général des Impôts (CGI), qui ajoute des exigences spécifiques à la TVA — le tout détaillé à l'article 242 nonies A de l'annexe II du CGI. Un champ manquant n'est pas un simple désagrément. Selon l'article 1737 du CGI, l'amende est de 15 € par mention manquante ou erronée, plafonnée au quart du montant de la facture.

Ce cadre juridique crée des défis d'extraction que les outils OCR génériques de factures — conçus pour des mises en page anglaises avec un taux de taxe unique et un nom de fournisseur simple — ne peuvent pas gérer :

  • SIREN vs. TVA intracommunautaire. Un fournisseur français affiche deux numéros d'identification. Le SIREN (9 chiffres, identifiant unique de l'entreprise dans le registre Sirene) et la TVA intracommunautaire (FR suivi d'une clé de contrôle à 2 chiffres et du SIREN). L'outil d'extraction doit capturer les deux, et ils appartiennent à des colonnes de tableur différentes pour des obligations de conformité distinctes.
  • TVA à taux multiples sur une seule facture. Une facture Metro d'un restaurant peut afficher des aliments à 5,5 % de TVA, des boissons non alcoolisées à 10 %, et un équipement de cuisine à 20 %. Une extraction générique qui produit une seule colonne « taxe » fusionne trois bases de TVA distinctes en un nombre que votre comptable ne peut pas imputer aux bons comptes.
  • Date de facturation vs. date de livraison. La date de la facture (date d'émission du document) et la date de livraison ou de prestation (date de la transaction) peuvent différer et ont toutes deux une importance juridique selon l'article 289 du CGI.

Ce ne sont pas des cas marginaux. Ce sont des éléments standard sur toute facture d'un fournisseur professionnel français à une autre entreprise française.

Les mentions obligatoires qui définissent vos colonnes d'extraction

Avant de concevoir vos colonnes d'extraction, vous devez connaître les exigences légales de toute facture française. Selon l'article L441-9 du Code de commerce et l'article 242 nonies A de l'annexe II du CGI, une facture valide doit comporter ces mentions obligatoires. Chacune correspond à une colonne que vous configurerez dans votre tableur d'extraction :

#Champ obligatoireNom de la colonne d'extractionObjectif
1Numéro de factureInvoice NumberUnique, séquentiel, sans trou. Référence pour la piste d'audit et la détection des doublons.
2Date d'émissionInvoice DateDétermine la période fiscale pour la déduction de TVA (compte 44566).
3Date de la livraison / prestationService DatePeut différer de la date de facture. Obligatoire si distincte.
4Identité du vendeur (dénomination sociale, adresse)Supplier NameNom légal et adresse du siège social du fournisseur.
5Numéro SIREN/SIRET du vendeurSupplier SIRENNuméro d'identification unique à 9 chiffres. Le SIRET ajoute 5 chiffres pour l'établissement. Les deux figurent sur la facture.
6N° TVA intracommunautaireSupplier VAT IDFormat : FR + clé à 2 chiffres + SIREN (ex. FR12 345 678 901). Obligatoire pour les transactions intra-UE et la validation de la déduction de TVA.
7Identité de l'acheteur (dénomination sociale, adresse)Buyer NameNom légal et adresse de votre entreprise. Depuis juillet 2024, le SIREN de l'acheteur est également requis sur les factures B2B selon la réforme de la facturation électronique.
8Désignation des biens ou servicesDescriptionDescription précise — nature, quantité, unité de chaque bien ou service.
9Prix unitaire HTUnit Price (excl. tax)Prix unitaire hors taxes. Les remises, rabais ou déductions doivent figurer explicitement.
10Taux de TVA applicableVAT Rate (%)Si plusieurs taux s'appliquent (20 %, 10 %, 5,5 %, 2,1 %), chaque base imposable et son montant de taxe correspondant doivent apparaître séparément.
11Montant total HTSubtotal (excl. tax)Total avant taxes. Permet d'imputer la dépense au compte de charges approprié (compte de classe 6).
12Montant total TVATotal VATMontant total de la TVA. S'impute au compte 44566 (TVA déductible sur autres biens et services) pour la TVA déductible.
13Montant total TTCTotal (incl. tax)Total toutes taxes comprises — le montant réellement payé. S'impute au compte 401 (fournisseurs).

Le tableau ci-dessus représente le minimum légal. En pratique, vous voudrez aussi extraire les conditions de paiement, l'IBAN/BIC pour le règlement, et les pénalités de retard, obligatoires sur les factures professionnelles françaises selon l'article L441-10 du Code de commerce.

Cette liste montre aussi pourquoi les outils sont importants. Une extraction de facture par champ qui vous permet de définir exactement les colonnes à capturer — plutôt que de sortir chaque jeton trouvé — produit un tableau que votre comptable peut saisir sans retouche. Quand vous définissez « SIREN fournisseur » comme colonne, l'outil d'extraction doit renvoyer le SIREN à 9 chiffres de la facture, pas le numéro de TVA intracommunautaire, pas le numéro RCS, et pas chaque nombre à 9 chiffres qu'il rencontre sur la page.

Gérer plusieurs taux de TVA sur une même facture

La principale source d'erreurs d'extraction sur les factures françaises est la TVA à taux multiples. Une seule facture d'un grossiste alimentaire comme Metro ou Transgourmet comporte couramment trois taux de TVA — 5,5 % pour les produits de base, 10 % pour les plats préparés ou boissons non alcoolisées, et 20 % pour l'équipement ou les articles non alimentaires. Pour compliquer les choses, les fournisseurs affichent la ventilation de la TVA différemment : certains utilisent un bloc récapitulatif en bas, d'autres intègrent le taux à côté de chaque ligne, d'autres encore présentent une annexe TVA séparée.

La bonne approche consiste à extraire au niveau des lignes avec taux de TVA par ligne :

DescriptionQtéPrix unitaire HTTaux TVAMontant TVATotal ligne TTC
Filet de poulet (kg)108,505,5 %4,6889,68
Eau minérale 1,5 L (pack de 6)43,205,5 %0,7013,50
Soda cola 33 cl (carton de 24)29,9010 %1,9821,78
Film alimentaire professionnel145,0020 %9,0054,00

Cette approche par ligne présente un avantage en aval qui accélère la fin de mois de votre comptable. Chaque ligne porte indépendamment son propre taux et montant de TVA. Quand les données entrent dans votre logiciel comptable — que ce soit Pennylane, EBP Comptabilité, Cegid ou Sage — le logiciel impute le total de la TVA déductible au compte 44566 (TVA déductible sur autres biens et services) et la base HT au compte de charges approprié (compte 607 pour les achats alimentaires, compte 602 pour les fournitures consommables). L'alternative — extraire une seule ligne de TVA totale puis reconstituer quels articles relevaient de quel taux — est exactement le genre de retouche de tableur que l'extraction est censée éliminer.

Si votre facture fournisseur comporte aussi des articles au taux de 2,1 % (applicable à certains médicaments et publications de presse) ou des articles exonérés de TVA (comme certains services financiers ou éducatifs), le même principe s'applique : chaque ligne porte son propre taux. Une extraction correctement structurée ne nécessite aucun recalcul manuel en fin de mois.

Pour les opérations traitant des dizaines ou centaines de factures fournisseurs par période, un workflow d'extraction par lot applique la même structure de colonnes à chaque facture d'un dossier, produisant un tableur consolidé avec des colonnes TVA cohérentes, quelle que soit la mise en forme de chaque fournisseur.

Étape par étape : extraire les données des factures françaises dans Excel

Voici le workflow d'extraction d'une facture fournisseur PDF vers un tableur prêt pour la comptabilité. Chaque étape répond à une exigence spécifique des factures françaises identifiée dans les sections ci-dessus.

1
Importez votre facture fournisseur française. Formats acceptés : PDF, JPG ou PNG — qu'il s'agisse d'une facture numérique propre d'un grossiste, d'un tirage photo d'un petit artisan, ou d'une facture papier scannée. Ce dernier cas est fréquent chez les petits fournisseurs français n'ayant pas encore adopté la facturation électronique.
2
Définissez vos colonnes d'extraction. Saisissez les noms des colonnes correspondant aux champs souhaités — « Numéro de facture », « Date de facture », « Nom du fournisseur », « SIREN fournisseur », « Numéro de TVA intracommunautaire », « Sous-total HT », « Total TVA », « Total TTC ». Ajoutez des colonnes de lignes si vous avez besoin de détails par article : « Description », « Quantité », « Prix unitaire HT », « Taux de TVA », « Montant TVA », « Total ligne TTC ». Chaque nom de colonne saisi devient l'en-tête de votre tableur final.
3
Traitez et vérifiez. L'IA lit la facture, localise chaque champ en comprenant son sens — sans chercher une position fixe sur la page — et remplit les colonnes correspondantes. Cette approche sémantique, appelée Extraction par colonnes personnalisées, permet à la même définition de colonne de fonctionner sur des factures de tous les fournisseurs, quelle que soit leur mise en page. Un fournisseur peut placer le numéro de facture en haut à droite ; un autre au centre sous le logo. L'IA le trouve dans les deux cas.
4
Exportez vers Excel (XLSX). Téléchargez le tableur structuré. Chaque colonne est remplie avec les valeurs extraites, les dates sont normalisées et les formats numériques sont cohérents — prêt à être importé dans Pennylane, EBP, Cegid, Sage ou tout logiciel comptable acceptant les imports Excel structurés.

L'extraction ci-dessous traite les factures au niveau document — en capturant les champs d'en-tête listés dans le tableau des champs obligatoires ci-dessus. Essayez avec une facture française :

JPG/PNG/PDF Extraction IA

Les fichiers sont traités de manière sécurisée et non conservés.

Pour une extraction ligne par ligne — où chaque ligne d'une facture doit être convertie en une ligne de tableur avec ses propres taux de TVA — définissez « Description », « Quantité », « Prix unitaire HT », « Taux TVA », « Montant TVA » et « Total TTC ligne » comme noms de colonnes, en plus des champs d'en-tête. Le résultat est un fichier d'importation prêt pour la comptabilité.

Où vont les données extraites : Correspondance avec les écritures comptables françaises

L'extraction n'a d'intérêt que si les données alimentent votre comptabilité sans retouche. Voici comment les colonnes du tableur correspondent aux écritures du Plan Comptable Général (PCG) que votre logiciel comptable va passer :

Colonne extraiteCompte PCGIntitulé du compteType d'écriture
Total (TTC)401FournisseursCrédit (ce que vous devez au fournisseur)
Sous-total (HT)607 / 602 / 606*Achats de marchandises / fournitures consommables / services extérieursDébit (charge, le compte varie selon le type d'achat)
TVA totale44566TVA déductible sur autres biens et servicesDébit (TVA récupérable sur achats)
Date de prestationDétermine la période fiscale de déduction de la TVA
SIREN fournisseurValidation de la déduction de TVA (contrôle VIES)

* Le compte de charge de la classe 6 varie selon la nature de l'achat. Matières premières alimentaires → compte 601. Fournitures consommables → compte 602. Sous-traitance → compte 604. Services extérieurs → compte 606. Fournitures de bureau → compte 6063. Votre plan comptable détermine le mappage précis.

Cette structure permet d'alimenter directement la déclaration de TVA CA3 en fin de période. Le total de la colonne compte 44566 pour toutes les factures fournisseurs devient le montant de TVA déductible sur le formulaire CA3. Les totaux HT par catégorie de dépenses déterminent la base imposable. Un seul processus d'extraction, appliqué systématiquement à toutes les factures fournisseurs entrantes, remplace la saisie manuelle de chaque facture dans des écrans comptables distincts.

Pour les équipes utilisant déjà un logiciel comptable français, la dernière étape est simple. Pennylane accepte les importations de données structurées. EBP Comptabilité importe des fichiers Excel dans son journal d'achats. Cegid et Sage prennent en charge les importations CSV/Excel pour les factures fournisseurs. La clé est que les colonnes du tableur soient nommées et formatées de manière cohérente — ce qu'un processus de traitement structuré des factures garantit.

La réforme de la facturation électronique de 2026 et son impact sur votre processus d'extraction

La réforme de la facturation électronique, formalisée par l'article 91 de la loi de finances 2024 et le Décret n°2024-266 du 25 mars 2024, introduit deux obligations échelonnées. Au 1er septembre 2026 : toute entreprise assujettie à la TVA en France doit pouvoir recevoir des factures électroniques de ses fournisseurs — via une Plateforme de Dématérialisation Partenaire (PDP) ou le Portail Public de Facturation (PPF). Au 1er septembre 2027 : les TPE et micro-entreprises doivent également commencer à émettre des factures électroniques.

L'impact sur votre processus d'extraction dépend de votre mix fournisseurs. Les grands fournisseurs et les entités publiques — qui utilisent déjà Chorus Pro pour les factures B2G — basculeront tôt, vous envoyant des Factur-X hybrides (PDF/A-3 avec XML intégré) ou des factures structurées UBL/CII via une PDP. Les petits artisans et micro-entreprises continueront d'envoyer des PDF standard jusqu'en 2027 et au-delà. Votre système d'extraction doit gérer les deux : les données structurées pré-extraites d'une PDP, et les PDF non structurés nécessitant une extraction par IA.

Recevoir une facture électronique est une obligation de conformité. Extraire ses données structurées vers votre logiciel comptable — dans des colonnes exploitables par votre comptable — reste votre défi. La réforme résout le canal de transmission. Elle ne résout pas l'intégration.

C'est pourquoi investir dans une couche d'extraction entre la réception des factures et le logiciel comptable est structurellement pertinent. Une PDP achemine la facture vers votre boîte de réception. Un outil d'IA lit la facture — qu'elle arrive en Factur-X, en PDF standard ou en copie papier photographiée — et place les données dans votre tableur. Votre logiciel comptable importe le tableur. Aucun de ces trois composants n'a besoin de changer quand les deux autres évoluent. Vous pouvez en savoir plus sur la gestion rentable de cette transition pour une petite entreprise française.

FAQ

L'IA peut-elle extraire des données de factures françaises manuscrites ?

Oui — dans une certaine mesure. ImageToTable.ai peut lire le texte imprimé et manuscrit sur les factures françaises grâce à un modèle d'IA de vision, y compris les montants manuscrits et les notes griffonnées des fournisseurs qui apparaissent sur les petites factures d'artisans. La précision sur l'écriture manuscrite est inférieure à celle du texte imprimé. Si une facture est entièrement manuscrite en écriture cursive française, attendez-vous à une fidélité moindre que sur une facture Metro ou Transgourmet imprimée. L'outil fonctionne en comprenant le sens des champs, et non en faisant correspondre des modèles de caractères, il peut donc identifier un « Montant total » manuscrit même si l'écriture varie. Mais il ne remplace pas la demande d'une facture lisible à votre fournisseur.

L'extraction gère-t-elle les lignes de facture ou seulement les champs d'en-tête ?

Les deux. Vous définissez les colonnes. Pour une extraction simple des en-têtes, listez des champs comme « Numéro de facture », « Nom du fournisseur », « Sous-total HT », « Total TVA », « Total TTC ». Pour une extraction des lignes, ajoutez « Description », « Quantité », « Prix unitaire HT », « Taux de TVA », « Montant TVA » et « Total ligne TTC ». L'outil reconnaît les lignes comme des structures de données répétitives dans la facture et remplit une ligne de tableur par ligne, avec les champs d'en-tête répétés pour chaque ligne.

Peut-il valider le format du numéro de TVA intracommunautaire ?

ImageToTable.ai extrait le numéro de TVA tel qu'il apparaît sur la facture — par exemple, « FR12 345 678 901 ». Il n'effectue pas de validation VIES (Système d'échange d'informations sur la TVA) en temps réel dans l'interface d'extraction. Cependant, une fois les données dans votre tableur, vous pouvez effectuer une vérification VIES via le service de validation de la Commission européenne ou la validation intégrée de votre logiciel comptable. L'étape d'extraction vous fournit les données structurées à valider ; l'étape de validation se fait dans votre flux de travail comptable.

Comment l'outil gère-t-il les différents taux de TVA français sur une même facture ?

Lorsque vous définissez une structure de colonnes pour les lignes — avec une colonne dédiée « Taux de TVA » — l'IA lit le taux de TVA par article et le renseigne pour chaque ligne, en distinguant les taux de 20 %, 10 %, 5,5 % et 2,1 % sur la même facture. Pour les factures qui n'affichent qu'un bloc récapitulatif de TVA (par exemple, « TVA 5,5 % : 23,40 €, TVA 20 % : 45,00 € »), définissez des colonnes comme « Total HT à 5,5 % », « TVA 5,5 % », « Total HT à 20 % », « TVA 20 % », et l'outil extraira les sous-totaux par taux. C'est plus manuel que l'extraction par lignes, mais cela gère correctement les factures fournisseurs au format récapitulatif.

Et si mes fournisseurs français envoient des factures dans différents formats — PDF, scan papier, corps d'email ?

ImageToTable.ai accepte les formats PDF, JPG, PNG, WebP et AVIF. Pour les factures dans le corps d'un email, enregistrez l'email en PDF ou faites une capture d'écran et importez-la. L'outil n'exige pas de formatage uniforme ni de modèle par fournisseur — il lit chaque facture en comprenant la signification des champs, sans chercher à reconnaître une mise en page. Si vous avez une variété de formats fournisseurs, la même définition de colonnes produit des résultats cohérents pour tous.

Qu'en est-il des factures Chorus Pro — l'outil peut-il en extraire les données ?

Les factures Chorus Pro destinées au secteur public (B2G) sont généralement disponibles en PDF téléchargeable depuis le portail Chorus Pro. Importez ces PDF dans ImageToTable.ai et extrayez les champs comme pour toute autre facture. L'outil ne se connecte pas directement à l'API Chorus Pro. Pour un traitement B2G à grand volume, la plupart des organisations utilisent l'intégration de leur PDP pour acheminer les données vers leur logiciel comptable. ImageToTable.ai comble le vide lorsque cette intégration n'est pas disponible ou que vous avez besoin d'une extraction rapide d'une facture Chorus Pro ponctuelle.

Un tableur que votre comptable peut vraiment utiliser

La différence entre une extraction générique et une extraction conçue pour les factures françaises se voit dans le tableur lui-même. Un outil générique produit des colonnes nommées « Tax » et « Vendor » — obligeant votre comptable à décider quelle valeur d'une facture à 13 champs va où. Une extraction adaptée à la France produit « SIREN fournisseur », « TVA Intracommunautaire », « Sous-total (HT) », « TVA 20% », « TVA 10% », « TVA 5,5% » — des colonnes qui correspondent directement aux comptes PCG et aux lignes de déclaration CA3 attendues par votre logiciel comptable. L'étape d'extraction reste le même clic. C'est le travail de reprise de fin de mois qui disparaît.

Importez une facture française et voyez ce qui en ressort. Pas de connexion, pas de configuration — trois minutes pour un tableur que votre comptable ne vous renverra pas.

📮 contact email: [email protected]