L'IA peut-elle extraire les données des demandes d'achat ?
L'extraction des DA n'est pas celle des BC
Oui. L'IA peut extraire les données des demandes d'achat — mais l'extraction des DA est fondamentalement différente de celle des BC, car la chaîne d'approbation et les codes articles spécifiques au département exigent une compréhension au niveau du champ, pas seulement une lecture de texte. Une demande d'achat est un document interne : elle demande l'approbation de dépenser de l'argent. Un bon de commande est un document externe : il ordonne à un fournisseur de livrer des biens. L'outil d'extraction qui gère les deux doit comprendre quel document il lit, car un même nom de champ a une signification différente selon le contexte.
Ce qui différencie une demande d'achat d'un bon de commande
L'erreur la plus fréquente en extraction de DA est de la traiter comme un problème d'extraction de BC. Les noms de champs se ressemblent — numéro de document, date, demandeur, fournisseur, articles, quantités, totaux — mais l'objectif et la structure diffèrent suffisamment pour qu'un outil conçu pour les BC interprète mal une demande d'achat sans s'en rendre compte.
Un bon de commande est un contrat destiné au fournisseur. Il communique les quantités commandées, les prix convenus, les dates de livraison et les conditions de paiement. Ses champs sont relativement standardisés car les fournisseurs doivent les lire et les exécuter. Les formats de numéros de BC varient, mais le concept de numéro de BC est universel chez tous les fournisseurs, dans tous les secteurs.
Une demande d'achat est une demande d'approbation interne. Elle signifie « Je dois acheter ceci — veuillez approuver la dépense. » Ses champs reflètent la structure interne de l'entreprise : codes de service, centres de coûts, numéros de comptes budgétaires, hiérarchies d'approbation, notes de justification, suggestions de fournisseurs préférés. Aucun de ces champs n'apparaît sur un BC. Et contrairement aux BC, généralement générés par un système, les DA arrivent encore sous forme de formulaires papier remplis à la main, de feuilles Excel imprimées et signées, ou de pièces jointes d'e-mails libres — des formats sans aucune standardisation. Pour une vue d'ensemble des différences d'approche selon les types de documents, consultez notre guide sur ce qu'est réellement l'extraction de données de BC.
La conséquence pratique : si vous déployez un outil d'extraction de BC sur des demandes d'achat, il trouvera systématiquement le numéro de document et la date — puis manquera ou classera mal tous les champs importants pour le flux d'approbation. Le champ « Service » devient « Livrer à », le code budgétaire est ignoré, et les signatures d'approbation ne sont pas capturées car l'outil ne les cherchait pas.
Les documents internes sont moins standardisés que les documents externes. Une facture fournisseur suit suffisamment de conventions pour qu'un outil sans modèle trouve fiablement le total. Un formulaire de DA interne d'un service peut être totalement différent de celui d'un autre service dans la même entreprise — car chaque service a conçu son propre formulaire avec le logiciel dont il disposait.
Où vivent les données des DA : formulaires manuscrits, exports Excel et papiers scannés
Contrairement aux bons de commande, que la plupart des entreprises génèrent via leur ERP, les demandes d'achat proviennent encore de sources diverses — et beaucoup ne sont pas nativement numériques.
Formulaires de DA manuscrits. Dans la fabrication, la construction et les opérations terrain, les demandes sont remplies à la main — un superviseur de maintenance note des références, estime les coûts de mémoire et soumet le formulaire papier aux achats. Ces DA manuscrites contiennent des abréviations, des codes pièces notés de mémoire et des estimations manuelles. L'IA qui repose sur du texte tapé n'en tire rien d'utile. L'extraction visuelle lit l'écriture manuscrite comme partie intégrante de l'image du document, identifiant « Qté : 5 » en comprenant le contexte du champ même si l'écriture est brouillonne.
DA imprimées depuis Excel et scannées. De nombreux services utilisent des modèles Excel comme formulaires de demande — et chaque service a son propre modèle. Les positions des colonnes changent, des en-têtes fusionnés apparaissent à des endroits inattendus, et la cellule « Total » peut être à la ligne 25 sur un formulaire et à la ligne 40 sur un autre. La ROC basée sur des modèles échoue car deux DA imprimées depuis Excel n'ont jamais la même mise en page. L'extraction sémantique lit les valeurs par leurs étiquettes de colonnes, pas par leurs positions, donc « Description » dans la colonne C d'un formulaire et dans la colonne E d'un autre est reconnue comme le même champ. Même les entreprises qui génèrent les DA numériquement les impriment souvent pour signature, puis scannent la copie signée — le PDF obtenu est une image sans texte sélectionnable. Pour en savoir plus sur la façon dont l'IA traite les documents sans couche texte, consultez notre guide sur la capacité de l'IA à extraire des données de PDF scannés.
Le problème de la chaîne d'approbation : signatures, circuit et statut
C'est le défi d'extraction qui n'a pas d'équivalent dans le traitement des BC. Une demande d'achat n'est pas un simple enregistrement de données — c'est un document avec un cycle de vie. Les signatures d'approbation, les dates et les décisions de routage sont des points de données que l'extraction de DA doit capturer pour que le document soit exploitable.
Une chaîne d'approbation typique sur une demande peut ressembler à ceci :
Niveau demandeur
- Nom du demandeur
- Service / Centre de coût
- Date de la demande
- Justification / Notes
Approbation manager
- Signature du manager
- Date d'approbation
- Vérification du code budgétaire
- Approbation de la catégorie de dépense
Achats / Finance
- Approbation achats
- Numéro de BC attribué
- Visa code finance
- Date d'approbation finale
Chacun de ces blocs de signature est une cible d'extraction distincte. Le nom du demandeur apparaît en haut. Le visa du manager apparaît au milieu — parfois avec une case à cocher « Approuvé » ou « Refusé ». L'approbation finale de l'acheteur apparaît en bas, souvent avec le numéro de BC généré à partir de la DA approuvée. Un outil d'extraction doit distinguer « date de la demande » de « date d'approbation » — deux dates différentes sur la même page — et attribuer chacune à la bonne colonne.
C'est là que l'extraction basée sur la position échoue le plus souvent. Sur le formulaire d'un service, la zone de signature du responsable se trouve en bas à droite. Sur celui d'un autre service, elle est dans une barre latérale à gauche. Sur un troisième, elle est intégrée dans une ligne de tableau à côté des articles. L'extraction sémantique gère cela en recherchant la combinaison des libellés « Approbation du responsable » ou « Approuvé par » et d'une signature ou d'une date : elle identifie le bloc d'approbation par le sens, pas par l'emplacement.
Les champs importants dans l'extraction des demandes d'achat
Les demandes d'achat comportent un ensemble spécifique de champs qui diffèrent des bons de commande. Une extraction complète d'une DA doit capturer à la fois les informations de demande au niveau de l'en-tête et les détails des lignes d'article :
Champs d'en-tête de la DA
- Numéro de DA / ID de demande
- Date de demande
- Nom du demandeur et service
- Centre de coût / Code budgétaire
- Lieu de livraison / Service
- Date de livraison souhaitée
- Total estimé (budgétaire)
- Justification / Besoin métier
- Statut d'approbation (En attente/Approuvé/Refusé)
- Noms des approbateurs et dates d'approbation
- Numéro de BC converti (si approuvé)
Lignes d'article de la DA
- Description de l'article
- Code article interne / SKU
- Quantité demandée
- Unité de mesure
- Coût unitaire estimé
- Total ligne estimé
- Fournisseur préféré (si spécifié)
- Compte comptable / Code d'imputation
- Numéro de projet / d'ordre de travail
Le champ « Code article interne » mérite une attention particulière. Contrairement aux BC, où les codes articles proviennent du catalogue du fournisseur, les DA internes utilisent des systèmes de numérotation propres à chaque service : la maintenance utilise des codes équipement, l'informatique des étiquettes d'actif, l'ingénierie des numéros de plan. Une extraction IA qui lit ces codes avec précision, sans nécessiter une table de correspondance pour chaque système de service, évite les corrections manuelles lors de la création du BC.
De même, le coût estimé sur une DA est une vérification budgétaire, pas un prix ferme. L'outil d'extraction doit capturer « Coût estimé » ou « Prix unitaire estimé » comme une estimation, sans le confondre avec un prix confirmé. L'extraction sémantique gère cela car elle lit le libellé qualifiant du champ plutôt que de simplement récupérer le nombre le plus proche.
Comment l'IA traite l'extraction des DRP différemment
Le mécanisme central — l'extraction sémantique par vision IA — est la même technologie qui gère les factures et les bons de commande, mais les documents DRP l'orientent dans des directions différentes.
La diversité des formats est plus large. Une facture suit suffisamment de conventions pour qu'une seule configuration couvre la plupart des fournisseurs. Une demande de réquisition d'achat n'a pas de conventions — chaque entreprise, et souvent chaque service, conçoit son propre formulaire. L'extraction sémantique gère cela car elle lit le sens des champs plutôt que de faire correspondre les mises en page. Vous définissez les colonnes une fois — « N° DRP », « Service », « Description de l'article », « Coût estimé », « Approuvé par » — et l'IA localise ces valeurs n'importe où sur le formulaire de n'importe quel service. C'est l'Extraction de colonnes personnalisées : vous saisissez les noms des champs, et l'IA trouve les données correspondantes en comprenant ce que chaque texte représente.
L'écriture manuscrite est la norme, pas l'exception. Dans de nombreux services achats, plus de la moitié des réquisitions entrantes contiennent des éléments manuscrits — quantités modifiées à la main, signatures d'approbation, notes griffonnées dans les marges. L'IA basée sur la vision les lit comme faisant partie du document visuel. Pour les codes articles et quantités manuscrits, la précision dépend de la lisibilité, mais le contexte sémantique aide : une IA cherchant « Quantité » est plus susceptible de lire correctement un « 5 » manuscrit près de « pcs » que le même caractère isolé. Pour en savoir plus, consultez notre guide sur la reconnaissance d'écriture manuscrite par IA.
Les signatures d'approbation sont des données, pas une décoration. Dans l'extraction de BC, les signatures sont généralement sans importance. Dans l'extraction de DRP, elles sont cruciales : qui a approuvé, quand et à quel niveau. L'IA qui capture le nom du signataire, la date et le statut d'approbation transforme le suivi manuel du circuit en données analysables. Pour une démonstration pratique, consultez notre guide sur l'extraction de données à partir de PDF de demande de réquisition d'achat.
Questions fréquentes
L'IA peut-elle extraire des données de bons de commande manuscrits ?
Oui. L'IA basée sur la vision lit les champs manuscrits — quantités, références, noms des approbateurs — directement sur l'image du document. Une écriture en script clair sur un scan bien éclairé atteint une précision de 85 à 95 %. L'écriture cursive dense ou les scans à faible contraste (copies carbone) donnent des résultats inférieurs. L'avantage par rapport à la saisie manuelle est de capturer les 80 % de champs tapés ou clairement imprimés, puis de signaler les écritures incertaines pour vérification, sans nécessiter une ressaisie complète.
En quoi l'extraction des BDC diffère-t-elle de celle des BDA ?
Trois différences clés. Premièrement, les BDC contiennent des champs absents des BDA : centres de coûts, codes budgétaires, notes de justification, données de circuit d'approbation et prix estimatifs. Deuxièmement, les BDC se présentent dans des formats plus variés — formulaires manuscrits, impressions Excel, papier scanné — tandis que les BDA sont généralement des PDF générés par système. Troisièmement, l'extraction des BDC doit capturer la chaîne d'approbation : qui a signé, quand et à quel niveau. Un outil d'extraction de BDA qui ignore les signatures d'approbation et les codes de centre de coûts produira des résultats incomplets sur un BDC. Pour en savoir plus, consultez notre guide sur l'extraction de données des BDA.
Puis-je extraire à la fois les en-têtes et les lignes d'un BDC en une seule passe ?
Oui. Définissez des colonnes pour les champs d'en-tête (N° BDC, Service, Centre de coût) et les champs de lignes (Description, Quantité, Coût unitaire estimé). L'IA extrait les valeurs d'en-tête une fois et les répète sur chaque ligne d'article. Un bon de commande de 12 lignes produit 12 lignes de sortie, chacune avec le contexte complet de l'en-tête — compatible avec l'import ERP et les tableaux croisés Excel.
L'outil nécessite-t-il un modèle distinct pour chaque formulaire de BDC de chaque service ?
Non. C'est l'avantage central de l'extraction sémantique par rapport à l'OCR basée sur des modèles. Définissez les noms de colonnes une fois — « N° BDC », « Description article », « Coût estimé » — et l'IA localise les données correspondantes sur n'importe quel formulaire de service en comprenant la signification de chaque champ. Le formulaire SAP de l'ingénierie, la feuille Excel du marketing et la demande manuscrite d'un responsable d'entrepôt sont traités avec la même définition de colonne. Pour une explication complète, voir comment l'IA extrait des données sans modèles.
Quels formats de fichiers puis-je utiliser pour l'extraction des BDC ?
Les outils modernes d'extraction par IA acceptent le PDF (numérique et scanné), le JPG, le PNG et le WebP. Le PDF scanné est le plus courant pour les BDC — documents imprimés, signés et scannés. Les photos de BDC papier prises avec un téléphone fonctionnent tant que l'image est nette. Les PDF générés par Excel (imprimés à partir de modèles de feuilles de calcul) fonctionnent également. Pour le traitement par lots, téléchargez les BDC de différents services en une seule exécution et obtenez un tableau unifié avec tous les documents fusionnés.
Puis-je exporter les résultats d'extraction des BDC directement vers mon ERP ou mon logiciel comptable ?
La plupart des outils d'extraction produisent des fichiers Excel (XLSX), CSV ou JSON — des formats que tout ERP peut importer. Le flux de travail standard : extraire les données du BDC → vérifier les écritures manuscrites ou les champs d'estimation signalés → importer dans votre système d'approvisionnement (SAP, Oracle, Coupa, QuickBooks, NetSuite). Les données arrivent pré-structurées avec les numéros de BDC comme identifiants et les lignes d'articles en lignes plates, prêtes pour le rapprochement budgétaire. Pour les utilisateurs de Google Sheets, les résultats peuvent être écrits directement dans une feuille de calcul via le module complémentaire Google Sheets, éliminant ainsi l'étape d'export-import.
Lancer l'extraction des données de demande d'achat
L'extraction des demandes d'achat se situe au croisement de deux réalités que la plupart des services achats acceptent comme inévitables : l'absence de standardisation des formulaires internes et le coût du traitement manuel des DA qui s'accumule à chaque service et niveau d'approbation. L'extraction par IA change la donne en traitant chaque DA comme un document visuel qu'elle comprend en le lisant, sans chercher à faire correspondre des modèles. La même définition de colonne fonctionne pour les demandes de maintenance manuscrites, les demandes d'ingénierie imprimées depuis Excel et les bons de commande d'entrepôt scannés.
La question fondamentale n'est pas « l'IA peut-elle extraire les demandes d'achat ? » — la réponse est oui. La question est de savoir si l'outil d'extraction fait la différence entre une demande d'approbation interne et un bon de commande fournisseur. Cette distinction détermine si votre résultat est complet ou s'il manque la moitié des champs importants.
Téléchargez un exemple de demande d'achat — quel que soit le format ou le service — et voyez comment il traite vos propres documents.