Comment extraire les données d'une facture fiscale coréennevers Excel

Le Service national des impôts de Corée du Sud traite plus de 600 millions de factures fiscales électroniques par an — soit 99 % de toutes les factures émises dans le pays. Pourtant, pour les équipes financières qui reçoivent ces factures, l'extraction reste obstinément manuelle : recopier les numéros d'enregistrement (사업자등록번호), les montants hors taxe (공급가액) et la TVA (세액) un champ à la fois, depuis un PDF ou une impression vers un tableur. Ce guide présente les champs obligatoires d'une facture fiscale coréenne (세금계산서), pourquoi les outils OCR classiques butent dessus, et comment extraire les données réellement utiles dans Excel — prêtes pour la déclaration de TVA trimestrielle.

Extraction de données de facture fiscale coréenne vers un tableur Excel

Points clés

  1. 99 % des factures coréennes sont déjà électroniques — pourtant, le comptable fournisseurs qui recopie manuellement la TVA (공급가액) dans Excel ne ressent aucun progrès.
  2. Sept champs obligatoires, des dizaines de formats fournisseurs : HomeTax, Popbill, Barobill et Douzone placent chacun le numéro de registre du commerce et le montant de TVA à des endroits différents, obligeant les outils basés sur des modèles à une nouvelle configuration par fournisseur.
  3. ImageToTable.ai lit la TVA comme un concept, pas comme une coordonnée de pixel — une seule définition de colonne extrait toutes les factures fournisseurs dans le même tableur, sans configuration par fournisseur.

Facture fiscale coréenne vs. facture standard : les 7 champs obligatoires qui définissent la facture fiscale coréenne

Une facture fiscale coréenne (세금계산서) n'est pas une simple facture commerciale avec une ligne de TVA ajoutée. Il s'agit d'un format de document juridiquement prescrit défini par l'article 32 de la loi coréenne sur la TVA, et chaque champ a un objectif de conformité spécifique. Si vous extrayez des données de factures de fournisseurs coréens vers Excel — que ce soit pour le traitement des comptes fournisseurs, la préparation de déclarations de TVA ou l'importation ERP — comprendre ces champs obligatoires est un prérequis.

Selon l'article 32, une facture fiscale doit contenir les informations suivantes. L'absence de l'un de ces champs sur la facture émise expose le fournisseur à une pénalité pouvant atteindre 2 % de la valeur de la fourniture :

#Champ (EN)Champ (KO)Importance pour l'extraction
1Numéro d'enregistrement du fournisseur공급자 등록번호Numéro d'enregistrement d'entreprise à 10 chiffres (사업자등록번호) (format : XXX-XX-XXXXX). Clé primaire pour l'appariement des fournisseurs dans l'ERP.
2Nom du fournisseur et représentant상호 / 성명Nom de l'entreprise + nom du représentant. Souvent imprimé dans des tailles de police différentes.
3Numéro d'enregistrement de l'acheteur공급받는자 등록번호Votre propre numéro d'enregistrement d'entreprise — doit être vérifié par rapport à vos enregistrements pour le rapprochement.
4Montant de la fourniture공급가액Montant net avant TVA. Le nombre de base pour le calcul de votre déclaration de TVA.
5Montant de la TVA세액10 % du montant de la fourniture. Doit être exactement égal au montant de la fourniture × 10 % — toute discordance signale une erreur.
6Date d'émission작성일자Détermine la période de TVA trimestrielle à laquelle la facture appartient.
7Lignes d'articles (description, quantité, prix unitaire)품목 / 수량 / 단가Détail au niveau de l'article. Optionnel sur les factures simplifiées mais standard sur les factures fiscales complètes.

Au-delà de ces sept champs obligatoires, les factures électroniques émises via le système NTS HomeTax (홈택스) portent un numéro d'approbation NTS (국세청승인번호) — un identifiant unique attribué par l'administration fiscale confirmant la bonne transmission de la facture. Depuis juillet 2023, toute entreprise dont le chiffre d'affaires annuel dépasse 100 millions KRW doit émettre des factures électroniques, donc la plupart des factures que vous rencontrerez porteront ce numéro.

Conséquence pratique pour l'extraction de données : une facture contient au minimum 7 données distinctes à répartir dans des colonnes Excel séparées, les deux numéros d'enregistrement suivant un format strict et la valeur de la fourniture/TVA nécessitant une validation arithmétique. Voici la structure documentaire avec laquelle vous travaillez — ce qui explique pourquoi une approche générique de « numérisation et extraction » produit rarement un résultat exploitable.

Comprendre les champs est la première étape. La question suivante est de savoir pourquoi les en extraire proprement est plus difficile qu'il n'y paraît.

Pourquoi le copier-coller et l'OCR standard échouent sur les factures coréennes

Les factures coréennes (세금계산서) présentent trois difficultés spécifiques que les outils OCR génériques et les copier-coller manuels gèrent mal — et ces difficultés se cumulent lorsque vous traitez des factures de plusieurs fournisseurs.

Défi 1 : Mélange de coréen et de chiffres. Une facture type contient des caractères coréens (noms d'entreprise, descriptions d'articles), des chiffres arabes (numéros d'enregistrement, montants) et parfois des abréviations anglaises — tout cela dans la même zone visuelle. Les moteurs OCR standard optimisés pour les documents monolingues lisent souvent mal les caractères coréens proches des chiffres, produisant un texte déformé en confondant des caractères similaires ou en interprétant mal les montants coréens séparés par des virgules.

Défi 2 : Absence de positions standardisées. Si le contenu d'une facture est standardisé par la loi, sa mise en page ne l'est pas. Une facture électronique émise via HomeTax suit une structure reconnaissable à deux panneaux (fournisseur à gauche, acheteur à droite). Mais les factures émises via des services ASP tiers — Popbill (팝빌), Barobill (바로빌), ou les factures générées par ERP de Douzone Bizon (더존비즈온) — peuvent disposer les mêmes champs à des positions, tailles de police et structures de tableau différentes. L'OCR basé sur des modèles, qui s'appuie sur des zones prédéfinies pour localiser les champs, nécessite un modèle distinct pour chaque variante de mise en page.

Défi 3 : Le piège de la validation du montant de la fourniture / de la TVA / du montant total. Sur une facture fiscale correctement émise, les trois chiffres finaux respectent une relation stricte : montant total (합계금액) = montant de la fourniture (공급가액) + montant de la TVA (세액). Lorsqu'une saisie manuelle introduit une transposition d'un seul chiffre — 3 004 000 ₩ copié en 3 040 000 ₩ — l'erreur se propage silencieusement dans votre déclaration de TVA. Vous ne la détecterez peut-être qu'au moment où le NTS recoupera votre déclaration avec les données transmises par le fournisseur, ce qui peut déclencher une enquête ou un avis de rectification.

Selon les données du NTS, l'émission électronique a réduit les coûts de conformité des factures papier d'environ 900 milliards de ₩ par an. Mais le problème du dernier kilomètre — extraire les données de ces factures électroniques dans vos propres systèmes — reste sur le bureau du comptable fournisseurs.

C'est là que la distinction entre l'extraction basée sur des modèles et l'extraction sémantique prend tout son sens. Les outils basés sur des modèles vous demandent de dessiner des rectangles autour de chaque champ et d'enregistrer les coordonnées — cela fonctionne si toutes vos factures proviennent d'un seul fournisseur dans un seul format, mais c'est peu pratique lorsque vous recevez des factures fiscales de dizaines de fournisseurs. L'extraction sémantique — l'approche utilisée par les modèles de vision-langage — lit le document comme le ferait un humain : elle comprend que le nombre à côté de l'étiquette du montant de la fourniture est le montant de la fourniture, quel que soit l'endroit où il apparaît sur la page.

Les défis étant définis, voici le flux de travail d'extraction réel.

Étape par étape : extraire les champs d'une facture fiscale vers Excel

ImageToTable.ai utilise l'extraction de colonnes personnalisées pour récupérer des champs spécifiques depuis n'importe quel format de document. Le principe : au lieu de mapper les coordonnées des champs sur un modèle, vous saisissez les noms des colonnes souhaitées — en coréen ou en anglais — et l'IA localise les valeurs correspondantes en comprenant la signification de chaque libellé, et non sa position sur la page. Les noms de colonnes que vous entrez deviennent les en-têtes exacts de votre fichier Excel.

1

Importez vos fichiers de factures fiscales

Importez un ou plusieurs fichiers de factures fiscales — exportations PDF depuis HomeTax, factures papier scannées (JPG/PNG), ou captures d'écran de vos e-mails. L'outil accepte les formats PDF, JPG, PNG et WebP. Pour un traitement par lots, importez tous les fichiers en une fois ; les résultats sont fusionnés en un seul tableur avec une ligne par facture.

2

Définissez vos colonnes d'extraction

Saisissez les noms de champs correspondant à ce dont vous avez besoin dans votre tableur. Vous pouvez utiliser des libellés en coréen, en anglais, ou un mélange des deux — l'IA comprend les deux. Pour une extraction standard de facture fiscale, un ensemble de colonnes pratique est :

  • 작성일자 — Date d'émission
  • 공급자 사업자등록번호 — N° d'enregistrement du fournisseur
  • 공급자 상호 — Nom de l'entreprise fournisseur
  • 공급받는자 사업자등록번호 — N° d'enregistrement de l'acheteur
  • 공급가액 — Valeur nette (hors TVA)
  • 세액 — Montant de la TVA
  • 합계금액 — Montant total
  • 국세청승인번호 — N° d'approbation NTS (pour les factures fiscales électroniques)
3

Générez et téléchargez votre Excel

Cliquez sur Extraire. Chaque facture génère une ligne dans le fichier de sortie, avec vos noms de colonnes comme en-têtes. Une facture fiscale d'une page se traite généralement en 5 à 10 secondes. Le résultat est téléchargé au format XLSX, CSV ou JSON — prêt à être importé dans votre logiciel comptable ou analysé dans Excel. Pour un guide détaillé sur l'extraction des champs de factures au-delà des factures fiscales coréennes, consultez comment extraire les champs d'une facture vers un tableur.

Deux fonctionnalités sont particulièrement utiles pour les factures fiscales coréennes. Premièrement, les colonnes déduites vous permettent d'ajouter des colonnes pour des données non explicitement imprimées sur la facture. Par exemple, ajouter une colonne nommée Période TVA (options : T1/T2/T3/T4) amènera l'IA à lire la date d'émission (작성일자), déterminer le trimestre de TVA correspondant (janv-mars = T1, avr-juin = T2, juil-sept = T3, oct-déc = T4), et renseigner le libellé de la période — vous évitant ainsi une étape de RECHERCHEV manuelle dans Excel. Deuxièmement, les colonnes calculées peuvent valider l'arithmétique : une colonne nommée Vérif TVA (montant HT × 0,1 = TVA ?) affichera « OK » ou le montant de l'écart, signalant les factures dont les chiffres ne concordent pas avant qu'elles n'atteignent votre déclaration de TVA.

Testez-la sur votre propre facture fiscale ci-dessous — sans connexion requise :

JPG/PNG/PDF Extraction IA

Fichiers traités en toute sécurité, jamais stockés.

Une facture, c'est simple. Le vrai défi, c'est d'en traiter un lot avant la date limite de déclaration de TVA.

Gérer des centaines de factures fiscales avant les échéances trimestrielles de TVA

Les déclarations de TVA coréennes sont déposées chaque trimestre, avec une date limite au 25 du mois suivant la fin du trimestre : 25 janvier (T4), 25 avril (T1), 25 juillet (T2) et 25 octobre (T3). Dans les semaines précédant chaque échéance, les équipes comptables des entreprises coréennes de taille moyenne — notamment celles qui travaillent avec des cabinets d'expertise comptable externe (세무사) — doivent consolider toutes les factures fournisseurs en un seul jeu de données, en les rapprochant des enregistrements de factures électroniques du NTS.

Le volume n'est pas négligeable. Une entreprise avec 30 à 50 fournisseurs actifs recevant des factures mensuelles accumule 90 à 150 factures par trimestre. Une entreprise de construction ou de négoce travaillant avec des sous-traitants et des fournisseurs de matériaux peut facilement atteindre 300 à 500 factures. À raison de 3 minutes par facture pour une saisie manuelle, 300 factures représentent 15 heures de travail de saisie concentré — généralement dans la dernière semaine avant la date limite de dépôt.

Le traitement par lots change cette donne. Importez toutes les factures en une seule fois — qu'il s'agisse de téléchargements PDF depuis HomeTax, de pièces jointes par e-mail de différents fournisseurs, ou de copies papier scannées. La même définition de colonne s'applique à tous les fichiers. Les résultats sont fusionnés dans un seul fichier Excel, une ligne par facture, triés par ordre chronologique. À raison de 5 à 10 secondes par page, 300 factures sont traitées en moins d'une heure, sans ressaisie manuelle.

C'est là que l'approche d'extraction sémantique prouve sa valeur par rapport aux modèles. Vos 300 factures proviennent probablement de dizaines de fournisseurs, chacun utilisant une mise en page légèrement différente — certaines émises via HomeTax, d'autres via Popbill ou Barobill, ou encore via leur propre ERP Douzone. Un outil basé sur des modèles nécessiterait une configuration distincte pour chaque mise en page. L'extraction personnalisée de colonnes utilise les mêmes noms de colonnes pour toutes les variantes, car elle lit les libellés des champs (valeur de la prestation, montant de la TVA, numéro d'enregistrement de l'entreprise) plutôt que les coordonnées des pixels.

Un conseil pratique pour les exécutions par lots : ajoutez une colonne Nom du fichier. L'outil la remplit automatiquement avec le nom du fichier source pour chaque ligne, ce qui facilite le traçage de toute valeur extraite vers le document d'origine si un nombre semble erroné lors de la vérification. Pour une traçabilité plus poussée, découvrez également des approches plus larges pour l'extraction de données de factures par lots.

D'Excel à Douzone, ECOUNT ou SAP Corée

Extraire les données des factures fiscales dans Excel n'est rarement l'étape finale. Pour la plupart des entreprises coréennes, ces données doivent alimenter un ERP ou un système comptable — et le marché coréen possède un paysage logiciel distinct, dominé par des éditeurs locaux.

Douzone Bizon (더존비즈온) est la principale plateforme ERP et comptable nationale en Corée du Sud, avec la plus grande part de marché dans les segments PME et comptabilité fiscale. Ses produits — WEHAGO pour les PME cloud, iCUBE pour les entreprises de taille moyenne, et Smart A pour les cabinets comptables — attendent tous des fichiers d'import structurés avec des colonnes spécifiques. L'Excel extrait par ImageToTable.ai peut être reformaté pour correspondre au modèle d'import de Douzone : généralement le numéro d'enregistrement de l'entreprise comme clé fournisseur principale, le montant hors taxe et la TVA dans des colonnes numériques séparées, et la date d'émission au format AAAA-MM-JJ.

ECOUNT ERP est populaire auprès des PME coréennes et prend en charge les imports CSV/Excel pour les transactions fournisseurs. Son format d'import attend le numéro d'enregistrement du fournisseur, la date de facture, la description, le montant et la TVA dans des colonnes distinctes — ce qui correspond directement aux colonnes d'extraction décrites dans ce guide.

SAP Corée sert les grandes entreprises et nécessite généralement un mappage des données via son module FI (Financial Accounting). L'Excel extrait peut servir de fichier intermédiaire avant le chargement par lots via les outils LSMW ou BDC de SAP.

Quel que soit le système utilisé, le principe reste le même : définissez vos colonnes d'extraction pour qu'elles correspondent dès le départ aux champs d'import attendus par votre ERP. Si votre modèle d'import Douzone attend une colonne nommée 거래처코드 (code fournisseur) plutôt que 사업자등록번호, nommez votre colonne d'extraction en conséquence. L'IA extrait la valeur en fonction de ce que le champ représente sur le document, et non du nom que vous donnez à la colonne — votre résultat est donc déjà formaté pour l'import, sans étape de mappage supplémentaire.

Pour une vue d'ensemble de l'extraction de factures dans les workflows d'automatisation AP, consultez le guide complet sur l'extraction de données de factures.

Foire aux questions

L'outil peut-il lire les factures électroniques et papier ?

Oui. Les factures électroniques (전자세금계산서) téléchargées au format PDF depuis HomeTax et les factures papier numérisées en JPG ou PNG sont toutes deux prises en charge. L'IA lit le contenu visuel du document, quelle que soit sa méthode de création. Les documents numérisés avec une impression nette offrent la même précision d'extraction que les PDF natifs. Jusqu'à 99 % de précision pour les données de tableaux imprimés dans des conditions de numérisation normales.

Extrait-il les lignes de détail ou seulement les totaux de la facture ?

Les deux. Si vous définissez des colonnes pour les champs de ligne — 품목 (description de l'article), 수량 (quantité), 단가 (prix unitaire), 공급가액 (valeur de la ligne) — l'outil crée une ligne par article. Si vous définissez uniquement des champs au niveau de la facture (valeur totale, montant de la TVA, montant total), vous obtenez une ligne par facture. Le choix dépend de votre besoin : détail par article pour la comptabilité analytique ou simples totaux pour la déclaration de TVA.

Comment gère-t-il le format du numéro d'immatriculation (XXX-XX-XXXXX) ?

Le numéro d'immatriculation à 10 chiffres (사업자등록번호) est extrait tel quel, en conservant le format avec tirets. Si votre import ERP nécessite le numéro sans tirets, vous pouvez ajouter une colonne calculée avec une règle pour supprimer le formatage — ou simplement utiliser la fonction SUBSTITUTE d'Excel sur le résultat pour supprimer les tirets en une seule étape.

Qu'en est-il du numéro d'approbation NTS ?

Le numéro d'approbation NTS (국세청승인번호) apparaît sur les factures électroniques sous la forme d'un long code alphanumérique (généralement au format XXXXXXXX-XXXXXXXX). Ajoutez-le comme nom de colonne et il sera extrait avec les autres champs. Ce numéro est utile pour recouper vos enregistrements HomeTax et confirmer qu'une facture donnée a bien été transmise au NTS.

Puis-je traiter des factures en coréen et dans d'autres langues dans le même lot ?

Oui. Si votre entreprise reçoit à la fois des factures fiscales coréennes et des factures de fournisseurs étrangers (par exemple, en anglais, japonais ou chinois), vous pouvez les inclure dans le même lot. L'IA traite nativement plus de 200 langues. Les noms de colonnes en coréen correspondront aux champs en coréen ; pour les factures non coréennes du même lot, l'IA associe les concepts de champs équivalents (par exemple, « Valeur de la fourniture » correspond au champ de valeur de fourniture). Pour des guides spécifiques par pays, consultez l'extraction de factures qualifiées japonaises, l'extraction de factures allemandes ou l'extraction de CFDI mexicains.

Les données extraites sont-elles suffisantes pour déclarer la TVA ?

Le fichier Excel extrait fournit les données brutes — valeur des fournitures, montant de la TVA, numéros d'enregistrement des fournisseurs/acheteurs et dates — qui alimentent la préparation de la déclaration de TVA. Cependant, la déclaration effective de la TVA en Corée s'effectue via HomeTax ou par l'intermédiaire de votre comptable/logiciel comptable (Douzone, ECOUNT, etc.). Le résultat de l'extraction sert d'entrée structurée pour ce processus de déclaration, et non de soumission directe au NTS. Pour les entreprises traitant des formulaires fiscaux américains parallèlement aux factures coréennes, consultez notre guide sur l'extraction des données des formulaires fiscaux W-2 et 1099.

Découvrez à quoi pourrait ressembler votre prochaine préparation de déclaration de TVA

L'écart entre la réception des factures fiscales et l'obtention de données propres et structurées dans votre ERP est l'endroit où des heures disparaissent chaque trimestre. Que vous traitiez 30 ou 300 factures, l'étape d'extraction devrait prendre des minutes, pas des jours. Téléchargez une facture fiscale — réelle ou exemple — et voyez les champs atterrir dans les bonnes colonnes dès le premier passage.

Essayez sur votre facture fiscale — Gratuit, sans inscription

📮 contact email: [email protected]