Koreanische Steuerrechnungsdatennach Excel exportieren

Der südkoreanische National Tax Service verarbeitet jährlich über 600 Millionen elektronische Steuerrechnungen – 99 % aller im Land ausgestellten Rechnungen. Dennoch bleibt die Datenextraktion für die zuständigen Finanzteams mühsame Handarbeit: Unternehmensregistrierungsnummern (사업자등록번호), Nettobeträge (공급가액) und Umsatzsteuerbeträge (세액) werden einzeln aus PDF oder Ausdruck in eine Tabelle übertragen. Diese Anleitung erläutert die Pflichtfelder einer koreanischen Steuerrechnung (세금계산서), warum herkömmliche OCR-Tools daran scheitern und wie Sie die benötigten Daten direkt nach Excel extrahieren – bereit für die vierteljährliche Umsatzsteuermeldung.

Extraktion koreanischer Steuerrechnungsdaten in eine Excel-Tabelle

Wichtige Erkenntnisse

  1. 99 % der koreanischen Rechnungen sind bereits elektronisch – doch der Kreditorenbuchhalter, der den Rechnungsbetrag (공급가액) manuell in Excel überträgt, spürt nichts von diesem Fortschritt.
  2. Sieben Pflichtfelder, Dutzende Lieferanten-Layouts: HomeTax, Popbill, Barobill und Douzone platzieren Unternehmensregisternummern und Umsatzsteuerbeträge an unterschiedlichen Stellen – daher benötigen vorlagenbasierte Tools für jeden Lieferanten eine neue Konfiguration.
  3. ImageToTable.ai erfasst den Rechnungsbetrag als Konzept, nicht als Pixelkoordinate – eine einzige Spaltendefinition extrahiert die Steuerrechnung jedes Lieferanten in dieselbe Tabelle, ohne anbieterspezifische Einrichtung.

Koreanische Steuerrechnung vs. Standardrechnung: Die 7 Pflichtfelder einer koreanischen Steuerrechnung

Eine koreanische Steuerrechnung (세금계산서) ist keine gewöhnliche Handelsrechnung mit einer zusätzlichen Mehrwertsteuerzeile. Es handelt sich um ein gesetzlich vorgeschriebenes Dokumentenformat gemäß Artikel 32 des koreanischen Mehrwertsteuergesetzes, bei dem jedes Feld einem bestimmten Compliance-Zweck dient. Wenn Sie Daten von koreanischen Lieferantenrechnungen in Excel extrahieren – sei es für die Kreditorenbuchhaltung, die Vorbereitung der Mehrwertsteuererklärung oder den ERP-Import – ist das Verständnis dieser Pflichtfelder die Grundvoraussetzung.

Gemäß Artikel 32 muss eine Steuerrechnung folgende Angaben enthalten. Fehlt eines dieser Felder auf der ausgestellten Rechnung, droht dem Lieferanten eine Strafe von bis zu 2 % des Lieferwerts:

#Feld (EN)Feld (KO)Bedeutung für die Extraktion
1Lieferantenregistriernummer공급자 등록번호10-stellige Unternehmensregistriernummer (사업자등록번호) (Format: XXX-XX-XXXXX). Primärschlüssel für den Lieferantenabgleich im ERP.
2Lieferantenname & Vertreter상호 / 성명Firmenname + Name des Vertreters. Oft in unterschiedlichen Schriftgrößen gedruckt.
3Käuferregistriernummer공급받는자 등록번호Ihre eigene Unternehmensregistriernummer – muss für den Abgleich mit Ihren Aufzeichnungen verifiziert werden.
4Nettobetrag공급가액Nettobetrag vor Mehrwertsteuer. Die Basis für Ihre Umsatzsteuervoranmeldung.
5Mehrwertsteuerbetrag세액10 % des Nettobetrags. Muss exakt Nettobetrag × 10 % entsprechen – jede Abweichung zeigt einen Fehler an.
6Ausstellungsdatum작성일자Bestimmt, in welchen vierteljährlichen Umsatzsteuerzeitraum die Rechnung fällt.
7Positionen (Beschreibung, Menge, Einzelpreis)품목 / 수량 / 단가Detail auf Positionsebene. Bei vereinfachten Rechnungen optional, bei vollständigen Steuerrechnungen Standard.

Über diese sieben Kernfelder hinaus enthalten elektronische Steuerrechnungen, die über das NTS HomeTax (홈택스)-System ausgestellt werden, eine zusätzliche NTS-Zulassungsnummer (국세청승인번호) – eine eindeutige Kennung der Steuerbehörde, die bestätigt, dass die Rechnung ordnungsgemäß übermittelt wurde. Seit Juli 2023 sind alle Unternehmen mit einem Jahresumsatz über 100 Millionen KRW zur elektronischen Ausstellung verpflichtet, sodass die meisten Rechnungen, auf die Sie stoßen, diese Nummer tragen.

Die praktische Konsequenz für die Datenextraktion: Eine einzelne Steuerrechnung enthält mindestens 7 verschiedene Datenpunkte, die in separaten Excel-Spalten landen müssen, wobei die beiden Registrierungsnummern einem strengen Format folgen und der Lieferwert / die Umsatzsteuer einer rechnerischen Prüfung bedürfen. Dies ist die Dokumentenstruktur, mit der Sie arbeiten – und sie erklärt, warum ein generischer „Scannen und Auslesen“-Ansatz selten brauchbare Ergebnisse liefert.

Die Felder zu verstehen ist der erste Schritt. Die nächste Frage ist, warum es schwieriger ist, sie sauber aus dem Dokument zu extrahieren, als es aussieht.

Warum Copy-Paste und Standard-OCR bei koreanischen Steuerrechnungen versagen

Koreanische Steuerrechnungen (세금계산서) stellen drei spezifische Herausforderungen dar, die generische OCR-Tools und manuelle Copy-Paste-Workflows nur unzureichend bewältigen – und diese Herausforderungen potenzieren sich, wenn Sie Rechnungen von mehreren Lieferanten verarbeiten.

Herausforderung 1: Gemischter koreanischer und numerischer Text. Eine typische Steuerrechnung enthält koreanische Zeichen (Firmennamen, Artikelbeschreibungen), arabische Ziffern (Registrierungsnummern, Beträge) und manchmal englische Abkürzungen – alles im selben visuellen Bereich. Standard-OCR-Engines, die für einsprachige Dokumente optimiert sind, lesen koreanische Zeichen in unmittelbarer Nähe zu Zahlen oft falsch und produzieren verstümmelte Ausgaben, indem sie ähnlich aussehende Zeichen verwechseln oder durch Kommas getrennte koreanische Beträge falsch interpretieren.

Herausforderung 2: Keine standardisierten Feldpositionen. Während der Inhalt einer Steuerrechnung gesetzlich normiert ist, gilt dies nicht für das Layout. Eine über HomeTax ausgestellte elektronische Steuerrechnung folgt einer erkennbaren Zweifeldstruktur (Lieferant links, Käufer rechts). Aber Rechnungen, die über Drittanbieter-ASP-Dienste – Popbill (팝빌), Barobill (바로빌) – oder ERP-generierte Rechnungen von Douzone Bizon (더존비즈온) ausgestellt werden, können dieselben Felder in unterschiedlichen Positionen, Schriftgrößen und Tabellenstrukturen anordnen. Template-basierte OCR, die auf vordefinierte Zonen zur Feldlokalisierung angewiesen ist, benötigt für jede Layoutvariante eine separate Vorlage.

Herausforderung 3: Die Falle der Prüfung von Nettobetrag / Umsatzsteuer / Gesamtbetrag. Bei einer korrekt ausgestellten Steuerrechnung stehen die drei Endbeträge in einem strengen Verhältnis: Gesamtbetrag (합계금액) = Nettobetrag (공급가액) + Umsatzsteuer (세액). Bei manueller Eingabe führt eine einzelne Ziffernvertauschung – ₩3.004.000 als ₩3.040.000 erfasst – dazu, dass sich der Fehler unbemerkt in Ihre Umsatzsteuervoranmeldung einschleicht. Sie bemerken ihn möglicherweise erst, wenn das NTS Ihre Meldung mit den übermittelten Daten des Lieferanten abgleicht, was eine Prüfung oder einen Änderungsbescheid auslösen kann.

Laut NTS-Daten hat die elektronische Ausstellung die Compliance-Kosten für Papierrechnungen um schätzungsweise 900 Milliarden ₩ pro Jahr gesenkt. Das Problem der letzten Meile – die Daten aus diesen elektronischen Rechnungen in die eigenen Systeme zu übertragen – bleibt jedoch auf dem Schreibtisch des Kreditorenbuchhalters liegen.

Hier zeigt sich der Unterschied zwischen vorlagenbasierter und semantischer Extraktion. Vorlagenbasierte Tools verlangen, dass Sie Rechtecke um jedes Feld ziehen und die Koordinaten speichern – praktikabel, wenn alle Ihre Rechnungen von einem Lieferanten in einem Format stammen, aber unpraktisch, wenn Sie Steuerrechnungen von Dutzenden Anbietern erhalten. Die semantische Extraktion – der Ansatz von Vision-Language-Modellen – liest das Dokument wie ein Mensch: Sie versteht, dass die Zahl neben der Bezeichnung „Nettobetrag“ der Nettobetrag ist, unabhängig davon, wo auf der Seite sie erscheint.

Nachdem die Herausforderungen definiert sind, folgt nun der eigentliche Extraktions-Workflow.

Schritt für Schritt: Steuerrechnungsfelder in Excel extrahieren

ImageToTable.ai nutzt die benutzerdefinierte Spaltenextraktion, um bestimmte Felder aus jedem Dokumentlayout zu ziehen. Die Kernidee: Statt Feldkoordinaten auf einer Vorlage zuzuordnen, geben Sie die gewünschten Spaltennamen ein – auf Koreanisch oder Englisch – und die KI findet die entsprechenden Werte, indem sie versteht, was jedes Feldlabel bedeutet, nicht wo es auf der Seite sitzt. Die eingegebenen Spaltennamen werden zu den exakten Kopfzeilen Ihrer Ausgabetabelle.

1

Rechnungsdateien hochladen

Laden Sie eine oder mehrere Rechnungsdateien hoch – PDF-Exporte aus HomeTax, gescannte Papierrechnungen (JPG/PNG) oder Screenshots aus Ihrer E-Mail. Das Tool akzeptiert PDF, JPG, PNG und WebP. Für die Stapelverarbeitung laden Sie alle Dateien auf einmal hoch; die Ergebnisse werden in einer einzigen Tabelle mit einer Zeile pro Rechnung zusammengeführt.

2

Extraktionsspalten festlegen

Geben Sie die Feldnamen ein, die Ihren Anforderungen in der Tabelle entsprechen. Sie können koreanische, englische oder gemischte Bezeichnungen verwenden – die KI versteht beide. Für eine Standard-Rechnungsextraktion ist ein praktischer Spaltensatz:

  • 작성일자 — Ausstellungsdatum
  • 공급자 사업자등록번호 — Lieferanten-Registriernummer
  • 공급자 상호 — Firmenname des Lieferanten
  • 공급받는자 사업자등록번호 — Käufer-Registriernummer
  • 공급가액 — Nettobetrag (vor MwSt.)
  • 세액 — MwSt.-Betrag
  • 합계금액 — Gesamtbetrag
  • 국세청승인번호 — NTS-Genehmigungsnummer (für elektronische Rechnungen)
3

Excel generieren und herunterladen

Auf „Extrahieren“ klicken. Jede Rechnung erzeugt eine Zeile in der Ausgabetabelle, mit Ihren Spaltennamen als Kopfzeilen. Eine einseitige Steuerrechnung wird in der Regel in 5–10 Sekunden verarbeitet. Der Export erfolgt als XLSX, CSV oder JSON – bereit für den Import in Ihre Buchhaltungssoftware oder zur weiteren Analyse in Excel. Eine detaillierte Anleitung zur feldspezifischen Rechnungsextraktion über koreanische Steuerrechnungen hinaus finden Sie unter Rechnungsfelder in eine Tabelle extrahieren.

Zwei Funktionen sind besonders nützlich für koreanische Steuerrechnungen. Erstens: Abgeleitete Spalten ermöglichen es Ihnen, Spalten für Daten hinzuzufügen, die nicht explizit auf der Rechnung gedruckt sind. Wenn Sie beispielsweise eine Spalte namens VAT-Zeitraum (Optionen: Q1/Q2/Q3/Q4) hinzufügen, liest die KI das Ausstellungsdatum (작성일자), bestimmt, in welches Quartal es fällt (Jan–Mär = Q1, Apr–Jun = Q2, Jul–Sep = Q3, Okt–Dez = Q4), und füllt die Zeitraumbezeichnung aus – das spart Ihnen einen manuellen VLOOKUP-Schritt in Excel. Zweitens: Berechnete Spalten können die Arithmetik prüfen: Eine Spalte namens VAT-Prüfung (공급가액 × 0,1 = 세액?) gibt "OK" oder den Abweichungsbetrag aus und markiert Rechnungen, bei denen die Zahlen nicht stimmen, bevor sie in Ihre VAT-Meldung gelangen.

Testen Sie es unten mit Ihrer eigenen Steuerrechnung – ohne Anmeldung:

JPG/PNG/PDF KI-Extraktion

Dateien werden sicher verarbeitet und nicht gespeichert.

Eine einzelne Rechnung ist einfach. Die eigentliche Herausforderung ist die Stapelverarbeitung vor der Umsatzsteuer-Frist.

Hunderte Steuerrechnungen vor den vierteljährlichen Umsatzsteuerfristen verarbeiten

Koreanische Umsatzsteuervoranmeldungen werden vierteljährlich eingereicht, jeweils fällig bis zum 25. des Monats nach Quartalsende: 25. Januar (Q4), 25. April (Q1), 25. Juli (Q2) und 25. Oktober (Q3). In den Wochen vor jeder Frist stehen die AP-Teams mittelständischer koreanischer Unternehmen – insbesondere jene, die mit externen Steuerberatern (세무사) zusammenarbeiten – unter Zeitdruck, um alle Lieferantenrechnungen in einem einzigen Datensatz zusammenzuführen, der mit den NTS-E-Rechnungsdaten abgeglichen wird.

Die Menge ist nicht trivial. Ein Unternehmen mit 30–50 aktiven Lieferanten, die monatliche Rechnungen erhalten, sammelt pro Quartal 90–150 Steuerrechnungen an. Ein Bauunternehmen oder Handelshaus, das mit Subunternehmern und Materiallieferanten arbeitet, kommt leicht auf 300–500. Bei 3 Minuten pro Rechnung für die manuelle Erfassung verschlingen 300 Rechnungen 15 Stunden konzentrierte Dateneingabe – typischerweise in der letzten Woche vor der Abgabefrist.

Die Stapelverarbeitung ändert diese Rechnung. Laden Sie alle Steuerrechnungen auf einmal hoch – ob PDF-Downloads von HomeTax, E-Mail-Anhänge verschiedener Lieferanten oder gescannte Papierkopien. Dieselbe Spaltendefinition gilt für alle Dateien. Die Ergebnisse werden in einer einzigen Excel-Datei zusammengeführt, eine Zeile pro Rechnung, chronologisch sortiert. Bei 5–10 Sekunden pro Seite werden 300 Rechnungen in unter einer Stunde verarbeitet – ohne manuelles Neuabtippen.

Hier zeigt die semantische Extraktion ihren Vorteil gegenüber Vorlagen. Ihre 300 Rechnungen stammen wahrscheinlich von Dutzenden Lieferanten, die jeweils ein leicht unterschiedliches Layout verwenden – einige über HomeTax, andere über Popbill oder Barobill, wieder andere über ihr eigenes Douzone-ERP. Ein vorlagenbasiertes Tool würde für jedes Layout eine separate Konfiguration erfordern. Die benutzerdefinierte Spaltenextraktion verwendet dieselben Spaltennamen für alle Varianten, da sie die Feldbezeichnungen (Nettobetrag, Umsatzsteuerbetrag, Steuernummer) liest – nicht die Pixelkoordinaten.

Ein praktischer Tipp für Batch-Läufe: Fügen Sie eine Spalte Dateiname hinzu. Das Tool füllt sie automatisch mit dem Quell-Dateinamen jeder Zeile, sodass Sie bei der Prüfung jeden extrahierten Wert leicht zum Originaldokument zurückverfolgen können, falls eine Zahl unplausibel erscheint. Für eine noch tiefere Rückverfolgbarkeit erfahren Sie mehr über umfassende Ansätze zur Batch-Rechnungsdatenextraktion.

Von Excel zu Douzone, ECOUNT oder SAP Korea

Das Extrahieren von Steuerrechnungsdaten in Excel ist selten der letzte Schritt. Für die meisten koreanischen Unternehmen müssen die Daten in ein ERP- oder Buchhaltungssystem fließen – und der koreanische Markt hat eine eigene Softwarelandschaft, die von lokalen Anbietern dominiert wird.

Douzone Bizon (더존비즈온) ist die führende inländische ERP- und Buchhaltungsplattform in Südkorea mit dem größten Marktanteil im KMU- und Steuerbuchhaltungssegment. Ihre Produkte – WEHAGO für cloudbasierte KMU, iCUBE für mittelständische Unternehmen und Smart A für Steuerberatungskanzleien – erwarten alle strukturierte Importdateien mit bestimmten Spaltenzuordnungen. Das extrahierte Excel von ImageToTable.ai kann so formatiert werden, dass es der Importvorlage von Douzone entspricht: typischerweise die Geschäftsregisternummer als primärer Lieferantenschlüssel, Nettobetrag und Umsatzsteuerbetrag in separaten numerischen Spalten und das Ausstellungsdatum im Format JJJJ-MM-TT.

ECOUNT ERP ist bei koreanischen KMU beliebt und unterstützt CSV/Excel-Importe für Kreditorenbuchungen. Das Importformat erwartet Lieferantenregisternummer, Rechnungsdatum, Beschreibung, Betrag und Umsatzsteuer als separate Spalten – was direkt dem in diesem Leitfaden beschriebenen Extraktionsspaltensatz entspricht.

SAP Korea bedient größere Unternehmen und erfordert in der Regel eine Datenzuordnung über das FI-Modul (Financial Accounting). Das extrahierte Excel kann als Zwischenstaging-Datei vor dem Batch-Upload über SAPs LSMW- oder BDC-Tools dienen.

Unabhängig vom verwendeten System bleibt das Prinzip gleich: Definieren Sie Ihre Extraktionsspalten von Anfang an passend zu den erwarteten Importfeldern Ihres ERP. Wenn Ihre Douzone-Importvorlage eine Spalte namens 거래처코드 (Lieferantencode) statt 사업자등록번호 erwartet, benennen Sie Ihre Extraktionsspalte entsprechend. Die KI extrahiert den Wert basierend darauf, was das Feld im Dokument darstellt – nicht darauf, wie Sie die Spalte nennen. So ist Ihre Ausgabe bereits ohne zusätzlichen Zuordnungsschritt importbereit.

Für einen umfassenderen Überblick, wie die Rechnungsextraktion in AP-Automatisierungsworkflows passt, lesen Sie die vollständige Anleitung zur Rechnungsdatenextraktion.

Häufig gestellte Fragen

Kann das Tool sowohl elektronische als auch Papierrechnungen lesen?

Ja. Elektronische Steuerrechnungen (전자세금계산서), die als PDF von HomeTax heruntergeladen wurden, sowie eingescannte Papierrechnungen als JPG oder PNG werden unterstützt. Die KI liest den visuellen Inhalt des Dokuments, unabhängig davon, wie es ursprünglich erstellt wurde. Bei eingescannten Dokumenten mit guter Druckqualität wird die gleiche Extraktionsgenauigkeit wie bei digitalen PDFs erzielt. Bis zu 99 % Genauigkeit bei gedruckten Tabellendaten unter normalen Scanbedingungen.

Extrahiert es Einzelposten oder nur Rechnungssummen?

Beides. Wenn Sie Spalten für Einzelpostenfelder definieren — 품목 (Artikelbeschreibung), 수량 (Menge), 단가 (Einzelpreis), 공급가액 (Nettobetrag pro Zeile) — erstellt das Tool eine Zeile pro Einzelposten. Wenn Sie nur rechnungsbezogene Felder definieren (Gesamtnettobetrag, Umsatzsteuerbetrag, Gesamtbetrag), erhalten Sie eine Zeile pro Rechnung. Die Wahl hängt davon ab, ob Sie für die Kostenrechnung Details auf Einzelpostenebene benötigen oder nur die Summen für die Umsatzsteuermeldung.

Wie wird das Format der Unternehmensregistrierungsnummer (XXX-XX-XXXXX) verarbeitet?

Die 10-stellige Unternehmensregistrierungsnummer (사업자등록번호) wird unverändert übernommen, wobei das durch Bindestriche getrennte Format erhalten bleibt. Falls Ihr ERP-Import die Nummer ohne Bindestriche erfordert, können Sie eine berechnete Spalte mit einer Regel zum Entfernen der Formatierung hinzufügen – oder einfach die SUBSTITUTE-Funktion von Excel auf die Ausgabe anwenden, um die Bindestriche in einem Schritt zu entfernen.

Was ist mit der NTS-Genehmigungsnummer?

Die NTS-Genehmigungsnummer (국세청승인번호) erscheint auf elektronischen Steuerrechnungen als langer alphanumerischer Code (normalerweise im Format XXXXXXXX-XXXXXXXX). Fügen Sie ihn als Spaltennamen hinzu, und er wird zusammen mit den anderen Feldern extrahiert. Diese Nummer ist nützlich, um sie mit Ihren HomeTax-Aufzeichnungen abzugleichen und zu bestätigen, dass eine bestimmte Rechnung ordnungsgemäß an das NTS übermittelt wurde.

Können Rechnungen auf Koreanisch und anderen Sprachen im selben Batch verarbeitet werden?

Ja. Wenn Ihr Unternehmen sowohl koreanische Steuerrechnungen als auch Rechnungen von ausländischen Lieferanten (z. B. auf Englisch, Japanisch oder Chinesisch) erhält, können diese im selben Batch verarbeitet werden. Die KI verarbeitet nativ über 200 Sprachen. Spaltennamen auf Koreanisch entsprechen koreanischen Feldern; bei nicht-koreanischen Rechnungen im selben Batch ordnet die KI entsprechende Feldkonzepte zu (z. B. entspricht „Supply Value“ dem Feld für den Lieferwert). Länderspezifische Anleitungen finden Sie unter Extraktion japanischer qualifizierter Rechnungen, Extraktion deutscher Rechnungen oder Extraktion mexikanischer CFDI.

Reichen die extrahierten Daten für die Umsatzsteuervoranmeldung?

Die extrahierte Excel-Datei liefert die Rohdaten – Lieferwert, Umsatzsteuerbetrag, Steuernummern von Lieferant/Käufer und Daten – die in die Vorbereitung der Umsatzsteuervoranmeldung einfließen. Die eigentliche Abgabe der Umsatzsteuervoranmeldung in Korea erfolgt jedoch über HomeTax oder Ihren Steuerberater/Ihre Buchhaltungssoftware (Douzone, ECOUNT usw.). Der Extraktionsoutput dient als strukturierte Eingabe für diesen Abgabeprozess, nicht als direkte Übermittlung an das NTS. Für Unternehmen, die neben koreanischen Rechnungen auch mit US-Steuerformularen umgehen, finden Sie in unserem Leitfaden zum Extrahieren von W-2- und 1099-Steuerformulardaten weitere Informationen.

So könnte Ihre nächste Umsatzsteuer-Voranmeldung aussehen

Die Lücke zwischen dem Erhalt von Steuerrechnungen und sauberen, strukturierten Daten in Ihrem ERP-System ist der Ort, an dem jedes Quartal Stunden verloren gehen. Ob Sie 30 oder 300 Rechnungen verarbeiten – der Extraktionsschritt sollte Minuten dauern, nicht Tage. Laden Sie eine Steuerrechnung hoch – echt oder als Muster – und sehen Sie, wie die Felder beim ersten Durchlauf in den richtigen Spalten landen.

Testen Sie es mit Ihrer Steuerrechnung – kostenlos, ohne Anmeldung

📮 contact email: [email protected]