Pourquoi une facture XMLne met pas fin à la saisie manuelle des données AP

En Belgique, plus d'un million d'entreprises se sont inscrites sur le réseau Peppol dans les premières semaines de 2026. La Croatie a traité quatre millions de factures électroniques en vingt-huit jours. Treize pays de l'UE imposent désormais la facturation électronique obligatoire, et sept autres les rejoindront avant fin 2027. Le discours accompagnant ces déploiements a été constant : les factures XML structurées élimineront la saisie manuelle, réduiront les erreurs et permettront un traitement direct. Mais quand Ardent Partners a interrogé 204 organisations AP pour son rapport 2025 State of ePayables, les chiffres racontaient une autre histoire. Seulement 51,4 % des factures arrivaient par voie électronique. À peine 35,4 % étaient traitées directement sans intervention humaine. Et 66 % des équipes AP saisissaient encore manuellement les données des factures dans leur ERP — un chiffre en hausse par rapport à l'année précédente, pas en baisse. Cet article examine l'écart entre ce que la facturation électronique promettait et ce que les équipes AP vivent réellement, et pourquoi cet écart est structurel, pas transitoire.

Factures XML et PDF côte à côte sur un bureau, illustrant la réalité des formats mixtes dans le traitement moderne des comptes fournisseurs

Points clés à retenir

  1. Les obligations de facturation électronique promettent de mettre fin à la saisie manuelle — mais 66 % des équipes AP (comptes fournisseurs) saisissent encore les données des factures à la main dans leur ERP, et ce chiffre a augmenté en 2025.
  2. Quatre schémas XML structurellement différents peuvent atterrir dans la même boîte de réception et tous être conformes à la norme EN 16931 — car la norme a été rédigée pour l'interopérabilité des autorités fiscales, pas pour ce que votre ERP attend réellement.
  3. Un seul pipeline d'extraction par lecture de contenu transforme la XRechnung allemande, la Factur-X française, la FatturaPA italienne et les PDF reçus par e-mail dans les mêmes six colonnes — aucun mappage XML par pays n'est nécessaire, et ImageToTable.ai traite l'ensemble du lot de formats mixtes en une seule exécution.

La boîte noire : ce qui se passe après qu'une facture XML atterrit dans votre boîte mail

Une facture électronique n'est pas qu'un simple document numérique. C'est un flux de données — un fichier XML ou UBL structuré contenant les informations de facturation dans des champs lisibles par machine, conformément à la norme européenne EN 16931, publiée en 2017 par le Comité européen de normalisation (CEN/TC 434). Cette norme définit plus de 160 champs de données sémantiques : numéro de facture, date d'émission, identifiants fiscaux du vendeur et de l'acheteur, quantités par ligne, prix unitaires, catégories de TVA, conditions de paiement, adresses de livraison, etc. En théorie, ce flux structuré devrait passer directement du système du fournisseur à l'ERP de l'acheteur — sans intervention humaine, sans clavier, sans copier-coller.

La théorie s'effondre dès la première étape : votre ERP.

La plupart des ERP — SAP, Oracle NetSuite, Microsoft Dynamics 365, Workday — n'ingèrent pas nativement le XML brut EN 16931. Ils attendent des données de facturation dans leur propre format interne, mappées à leurs propres noms de champs, via leur propre API ou modèle d'importation. Une facture Peppol BIS 3.0 arrive sous forme de XML UBL 2.1 avec une structure de balise comme <cbc:InvoiceTypeCode>380</cbc:InvoiceTypeCode>. Votre ERP attend un champ nommé Type de facture avec la valeur Facture commerciale. Quelqu'un — ou quelque chose — doit traduire. Cette couche de traduction est ce que le discours sur la facturation électronique présente comme un problème résolu. Pour de nombreuses équipes comptables fournisseurs, ce n'est pas résolu. C'est là que le travail manuel se déplace, pas là où il s'arrête.

Selon le rapport de marché Billentis/EESPA couvrant 2019-2025, moins de 20 % des entreprises envoient des factures électroniques structurées via EDI ou réseaux équivalents. Environ deux tiers émettent des factures PDF par e-mail. Même parmi les entreprises qui reçoivent des factures XML, les données atteignent rarement l'ERP sans une étape intermédiaire : une plateforme middleware, un point d'accès Peppol, une couche d'intégration, ou — dans le cas des 66 % des équipes comptables fournisseurs qui saisissent encore manuellement — une paire d'yeux humains lisant une représentation visuelle du XML et tapant sur un écran. La facture électronique est structurée. Le dernier kilomètre ne l'est pas.

Une facture électronique est conçue pour être lisible par machine. Votre ERP est conçu pour être lisible par machine. Le problème est qu'ils n'ont pas été conçus pour se lire mutuellement. Entre eux se trouve une couche d'intégration que quelqu'un doit construire, configurer et maintenir — et pour un nombre surprenant d'équipes comptables fournisseurs, cette couche est encore une personne.

Une facture, 164 champs, 6 vraiment utiles

La norme EN 16931 définit ce qu'une facture électronique doit ou peut contenir, et la liste est longue : entités juridiques du vendeur et de l'acheteur, représentant fiscal, bénéficiaire, informations de livraison, instructions de paiement, détails des remises et frais, ventilation de la TVA par ligne, période de facturation, référence de commande, référence de contrat, référence de projet, etc. Une facture EN 16931 complète contient bien plus de 100 points de données distincts répartis sur plusieurs niveaux hiérarchiques.

Votre équipe comptabilité fournisseurs n'en a besoin que de six.

Les champs réellement nécessaires à votre ERP pour la comptabilisation — nom du fournisseur, numéro de facture, date de facture, montant net, montant de TVA, date d'échéance — ne représentent qu'une petite partie du contenu XML. Les 150 autres champs sont du bruit. Ils servent à la validation par l'administration fiscale, à la logique de routage du réseau Peppol, à la conformité archivistique du fournisseur. Ils ne sont pas là pour vous. Pourtant, toute intégration qui importe le XML complet les récupère tous, et quelqu'un doit mapper, valider et maintenir ces correspondances pour chaque fournisseur, chaque pays et chaque variante de schéma XML.

Cette réalité révèle un problème économique contre-intuitif que la plupart des modèles de ROI de la facturation électronique ignorent. Le coût de mise en place et de maintenance des correspondances complètes de schémas XML pour des dizaines ou centaines de fournisseurs peut dépasser le coût de la simple extraction des six champs dont vous avez besoin, quel que soit le format du document — XML, PDF ou image. L'infrastructure de facturation électronique a été conçue pour combler le déficit d'information de l'administration fiscale. Elle n'a pas été conçue pour combler le déficit d'extraction de données de votre équipe comptabilité. Ce sont deux problèmes différents, et résoudre le premier ne résout pas automatiquement le second.

Le rapport de recherche 2025 de Vertex sur la facturation électronique, qui a interrogé des entreprises sur des marchés soumis à obligation, révèle que l'intégration technologique est la principale difficulté pour 55 % des répondants, et ce chiffre monte à 63 % parmi les entreprises opérant dans plusieurs pays. La moitié des répondants ont signalé la gouvernance des données comme une préoccupation majeure. Il ne s'agit pas d'entreprises qui n'ont pas adopté la facturation électronique. Ce sont des entreprises qui l'ont adoptée et qui en gèrent désormais les conséquences.

Le nombre de champs dans une facture électronique dont votre équipe comptabilité n'a pas besoin n'est pas une simple curiosité technique. C'est la raison pour laquelle l'import XML complet est souvent plus coûteux qu'une extraction sélective. Chaque champ inutile est un champ que vous payez pour mapper, valider et maintenir — pour chaque fournisseur, chaque schéma et chaque cycle de mise à jour de votre ERP.

Quatre pays, quatre dialectes XML, une seule boîte de réception AP

EN 16931 est une norme, pas un format. Elle définit la signification sémantique des champs de facture et autorise deux syntaxes : UBL 2.1 et UN/CEFACT Cross Industry Invoice (CII). Chaque pays publie ensuite un CIUS — un cahier des charges d'usage de facture de base — qui adapte la norme aux règles fiscales nationales, en ajoutant ou en renforçant les exigences sur les champs. Il en résulte un paysage où quatre schémas XML structurellement différents peuvent arriver dans la même boîte de réception et tous être « conformes à EN 16931 » tout en étant incompatibles avec les mappings d'importation des autres.

PaysSchéma / FormatSyntaxe de baseConteneurCe qui le rend différent
AllemagneXRechnungUBL 2.1 ou CIIXML purPas de couche visuelle. Obligatoire pour le B2G, en expansion vers le B2B d'ici 2028. Le champ de la date de prestation n'est pas explicitement obligatoire, mais le destinataire doit le valider conformément au §14 UStG (loi allemande sur la TVA) — une lacune de conformité qui empêche le traitement sans intervention.
Allemagne & FranceZUGFeRD / Factur-XCII D22BPDF/A-3 avec XML intégréFormat hybride. Cinq profils de MINIMUM (données d'en-tête uniquement) à EXTENDED (détail complet des lignes). Les écarts entre la couche visuelle PDF et le XML intégré constituent un risque opérationnel documenté.
ItalieFatturaPAXML personnaliséXML pur via SdIAntérieur à EN 16931. Obligatoire depuis 2019 pour tous les B2B, B2C, B2G. Utilise son propre schéma XML avec des champs spécifiques à l'Italie (codes CIG, CUP pour les marchés publics) qui n'ont pas d'équivalent dans les autres schémas nationaux.
PologneKSeF FA(3)XML propriétaireXML pur via plateforme nationaleModèle de validation en temps réel. L'administration fiscale valide chaque facture avant sa livraison. Le schéma XML est le format FA(3) — successeur de FA(2) — et n'est pas aligné sur la syntaxe UBL ou CII.

Si votre entreprise opère en Allemagne, en France, en Italie et en Pologne — un périmètre qui décrit des milliers d'entreprises européennes de taille moyenne — votre boîte de réception AP reçoit quatre schémas XML structurellement différents qui se présentent tous comme des factures électroniques. Vous avez besoin de quatre mappings d'importation distincts, de quatre ensembles de règles de validation et de quatre pipelines de maintenance qui se brisent chaque fois qu'une administration fiscale nationale met à jour son schéma. Le rythme des mises à jour n'est pas théorique. La migration du KSeF polonais de FA(2) à FA(3) a obligé chaque système intégré à remapper ses définitions de champs. La France a mis à jour ses exigences PPF entre la phase pilote de 2025 et la mise en production de 2026. La spécification XRechnung allemande en est à la version 3.0.1 début 2026.

Ceci n'est pas un argument contre la facturation électronique. C'est un argument contre l'idée que recevoir des données structurées signifie recevoir des données dans votre structure. La norme EN 16931 a été conçue pour l'interopérabilité entre administrations fiscales, pas entre l'ERP de votre fournisseur et le vôtre. La couche CIUS nationale existe précisément parce que le code fiscal de chaque pays exige des champs, des codes et des validations différents. L'interopérabilité au niveau fiscal ne garantit pas l'interopérabilité au niveau du workflow AP — et l'écart entre ces deux réalités est ce que les équipes AP vivent au quotidien.

Si vous construisez un pipeline d'import XML distinct pour chaque pays où vos fournisseurs opèrent, vous résolvez un problème qui se multiplie à chaque nouveau mandat. L'alternative — lire ce qui figure réellement sur la facture plutôt que le schéma qui l'a générée — réduit les quatre pays à un seul pipeline d'extraction.

Le PDF qui ne disparaîtra pas

Le calendrier des mandats de facturation électronique s'accélère. La Belgique est entrée en vigueur en janvier 2026 avec un champ d'application quasi universel. La Pologne a suivi en février pour les grandes entreprises. La France active le système en septembre 2026 pour les grandes et moyennes entreprises. Le mandat B2B allemand se déploie progressivement jusqu'en 2028. Pour une analyse détaillée de chaque échéance et de son fondement juridique, consultez notre calendrier des mandats de facturation électronique en Europe.

Mais chaque mandat comporte des exclusions, et ces exclusions produisent un résidu de PDF qu'aucune échéance à venir n'éliminera. Le schéma est cohérent d'une juridiction à l'autre :

  • Les fournisseurs transfrontaliers sont exonérés. Une entreprise allemande qui reçoit des factures d'un fournisseur américain ou chinois n'est couverte par aucun mandat de facturation électronique de l'UE. Ces fournisseurs continueront à envoyer des PDF, des pièces jointes par courriel et des factures papier indéfiniment.
  • Les transactions B2C sont exclues. Les factures, reçus et transactions de détail destinés aux consommateurs sont totalement exclus du champ d'application de la facturation électronique structurée — et pourtant, ces documents atterrissent fréquemment dans les workflows AP pour le rapprochement des dépenses.
  • Les petites entreprises bénéficient de délais prolongés ou d'exemptions permanentes. La France reporte les obligations d'émission pour les micro-entreprises à septembre 2027. Le déploiement progressif basé sur des seuils en Allemagne signifie que les entreprises en dessous de certains niveaux de chiffre d'affaires n'ont aucune obligation. Ce sont souvent exactement les fournisseurs de la longue traîne dont les factures prennent déjà le plus de temps de traitement.
  • Les relations fournisseurs existantes ne se convertissent pas du jour au lendemain. Un fournisseur intégré pour l'EDI en 2015 peut n'avoir aucune incitation à migrer vers Peppol BIS 3.0. Son workflow PDF fonctionne. Votre mandat ne change pas ses systèmes — il change votre obligation de déclaration, pas son obligation de format.

Les données d'Ardent Partners confirment l'ampleur : seulement 51,4 % des factures arrivent par voie électronique, et ce chiffre reflète deux décennies de progrès en matière de facturation électronique. Les 48,6 % restants — pièces jointes PDF, papier scanné, corps de courriels, télécopies — représentent une moitié structurelle du volume de factures qu'aucun calendrier de mandat ne ramènera à zéro. Même en Italie, où le système SdI est obligatoire depuis 2019 et traite plus de 2 milliards de factures électroniques par an, les factures PDF transfrontalières continuent d'arriver quotidiennement. Le mandat garantit la déclaration aux autorités. Il ne garantit pas une boîte de réception AP propre.

Le rapport 2026 de Gennai sur l'état de l'automatisation des factures situe le taux d'automatisation complète à 8 % des équipes financières. Huit pour cent. Après deux décennies de développement de la facturation électronique, après des milliards d'investissements sur le marché, après treize mandats européens en vigueur. L'écart n'est pas un inconvénient transitoire. C'est la condition opérationnelle permanente d'une fonction AP mondiale.

Les obligations de facturation électronique comblent le déficit d'information des autorités fiscales. Mais l'écart d'extraction de données de votre équipe AP persiste via un tout autre ensemble de canaux — commerce transfrontalier, débordement B2C, inertie des fournisseurs et la longue traîne des entreprises non couvertes par votre obligation. Ces canaux ne se ferment pas. Ce sont des caractéristiques structurelles du commerce mondial.

Un seul pipeline pour les deux mondes

Si votre équipe AP utilise un workflow pour les factures XML et un autre pour les factures PDF, vous n'avez pas automatisé le traitement des factures. Vous avez doublé le nombre de workflows à maintenir, chacun avec ses propres points de rupture, sa propre surface d'intégration, ses propres besoins de formation. L'alternative n'est pas d'abandonner la conformité à la facturation électronique. C'est d'utiliser un pipeline d'extraction unique qui traite à la fois le XML structuré et le PDF non structuré avec la même logique, produisant le même schéma de sortie quel que soit le format reçu.

C'est l'approche pour laquelle le modèle d'extraction par nom de colonne a été conçu. Au lieu de construire des correspondances de schémas XML par pays, vous définissez une fois les champs dont votre ERP a réellement besoin — Fournisseur, Facture n°, Date, Net, TVA, Échéance. Ces six noms de colonne deviennent la cible d'extraction pour chaque document entrant dans le pipeline, qu'il s'agisse d'un XML Peppol BIS 3.0 d'un fournisseur belge, d'un PDF hybride Factur-X d'un vendeur français, d'une facture papier scannée d'un fabricant chinois, ou d'un PDF envoyé par email d'une PME nationale non encore couverte par l'obligation.

Le mécanisme compte. Contrairement à l'import basé sur un schéma, qui nécessite une connaissance précise de chaque structure de balise XML, l'extraction personnalisée par colonne lit le contenu du document — les données réelles de la facture — et localise les valeurs qui correspondent à vos définitions de colonne en comprenant ce que chaque champ signifie, et non où il se trouve dans une hiérarchie XML. Une facture UBL qui écrit le numéro de facture sous la forme <cbc:ID>INV-2026-0451</cbc:ID> et un PDF qui imprime « Facture INV-2026-0451 » dans le coin supérieur droit produisent le même résultat d'extraction dans votre colonne Facture n°. Aucun mappage de schéma. Aucune configuration par pays. Un seul pipeline.

Pour un aperçu plus détaillé du fonctionnement de cette approche avec différents formats de facture, langues et conventions numériques, consultez notre guide sur l'extraction de données de factures de différents formats dans un tableau unifié.

JPG/PNG/PDF Extraction IA

Les fichiers sont traités de manière sécurisée et ne sont pas stockés.

FAQ

La facturation électronique ne supprime-t-elle pas totalement le besoin d'extraction de données ?

Elle supprime une catégorie d'extraction de données — celle où un humain lit un PDF et saisit des valeurs dans un ERP. Elle ne supprime pas le besoin d'une couche de traduction de données entre le schéma XML du fournisseur et la structure de champs de votre ERP. Pour les entreprises qui ont construit et maintiennent cette couche de traduction pour tous leurs fournisseurs et tous leurs pays d'activité, la facturation électronique permet un traitement direct. Les données d'Ardent Partners montrent que seulement 8 % des équipes financières ont atteint cet état. Pour les 92 % restants, une couche d'extraction qui lit à la fois le XML et le PDF via le même mécanisme remplace deux flux de travail manuels distincts par un seul automatisé.

Ne puis-je pas simplement créer des correspondances d'import XML une fois par pays et en finir ?

Vous le pouvez, et certaines organisations le font. Le coût de maintenance est ce que la plupart des estimations initiales sous-estiment. Les autorités fiscales nationales mettent à jour leurs schémas — la Pologne est passée de FA(2) à FA(3), la spécification XRechnung de l'Allemagne est en version 3.0.1, les exigences PPF de la France ont évolué entre le pilote et la mise en production. Chaque changement nécessite des tests de régression sur l'ensemble des fournisseurs. Pour une entreprise opérant dans quatre pays avec 200 fournisseurs, le programme de maintenance des correspondances est une dépense opérationnelle récurrente, pas un projet IT ponctuel. Une approche d'extraction visuelle contourne ce problème en ne dépendant d'aucune structure de balise XML — elle lit les données elles-mêmes, pas le schéma qui les a livrées.

Qu'en est-il des fournisseurs qui envoient à la fois des versions XML et PDF de la même facture ?

C'est courant avec les formats hybrides ZUGFeRD/Factur-X, qui intègrent une couche de données XML dans un conteneur PDF/A-3. La couche PDF et la couche XML peuvent diverger — le PDF peut contenir une ventilation complète des lignes tandis que le XML est un profil MINIMUM sans lignes, ou le XML peut refléter une version corrigée tandis que le PDF montre l'original. Une approche d'extraction visuelle lit le contenu réel rendu, qui est la version que votre équipe AP verrait et vérifierait. Elle détecte également les écarts qu'une importation XML aveugle manquerait.

Comment fonctionne le traitement par lots avec un mélange de factures XML et PDF ?

Avec un pipeline d'extraction unifié, le traitement par lots considère les XML et les PDF comme deux formats d'entrée pour une même tâche. Importez un dossier contenant 20 XML Peppol de fournisseurs belges, 15 PDF reçus par e-mail de fournisseurs locaux et 5 factures papier scannées de fournisseurs transfrontaliers — définissez vos colonnes une fois, traitez l'ensemble du lot en une seule exécution, et recevez un tableur unique avec les 40 factures dans des colonnes cohérentes. Pas de tri préalable par format, pas de flux séparés, pas de ressaisie manuelle pour la partie PDF du lot.

Cette approche fonctionne-t-elle spécifiquement avec Peppol ?

Oui. Peppol est un réseau de transport, pas un format de facture. Le format de fichier réel est le XML UBL 2.1 structuré selon Peppol BIS Billing 3.0. Une approche d'extraction visuelle lit les données de la facture depuis la couche de contenu, qu'elle soit arrivée via Peppol, e-mail, portail fournisseur ou tout autre canal. Le réseau Peppol résout le problème de livraison — faire parvenir la facture du fournisseur à vous. La couche d'extraction résout le problème de données — intégrer les données de la facture dans votre ERP dans la structure attendue par votre ERP.

La métrique qui compte

Le secteur de la facturation électronique mesure le progrès par la couverture des obligations : combien de pays, combien d'entreprises, combien de factures transitent par les plateformes gouvernementales. Ces métriques mesurent la conformité fiscale — un objectif légitime et important. Elles ne mesurent pas ce qui importe aux équipes AP : combien de factures ont été comptabilisées dans l'ERP aujourd'hui sans qu'un humain n'ait touché un clavier.

Si ce second chiffre est inférieur à vos attentes après votre investissement dans la facturation électronique, le problème n'est pas d'avoir choisi la mauvaise plateforme. C'est que les plateformes de facturation électronique ont été conçues pour résoudre un problème différent. Le vôtre n'est pas l'écart entre le papier et le numérique. C'est l'écart entre « arrivé au bon format » et « arrivé dans les bons champs ». Ce sont deux écarts distincts. Combler le premier n'a jamais comblé le second.

La couche d'extraction située entre votre plateforme de facturation électronique et votre ERP n'est pas un pont temporaire vers un avenir entièrement automatisé. C'est l'infrastructure permanente d'un monde où les factures fournisseurs arrivent dans plusieurs formats, depuis plusieurs juridictions, sous plusieurs régimes réglementaires — et ce sera toujours le cas. La question est de savoir si cette couche d'extraction est une personne, un ensemble de mappages XML fragiles par pays, ou un pipeline unique qui lit ce qui est sur la facture, peu importe comment elle y est arrivée.

Testez-le sur vos propres factures. XML et PDF, dans le même lot, selon les colonnes dont votre ERP a réellement besoin. Voyez si l'écart entre « reçu » et « comptabilisé » se réduit à ce que l'obligation de facturation électronique a toujours laissé entendre.

📮 contact email: [email protected]