50 koreanische Lieferbelege, eine Tabelle: Stapelverarbeitung ohne Abtippen

Jedes koreanische ERP kann aus einem Verkaufsdatensatz mit einem Klick einen Transaktionsbeleg (거래명세서) erstellen. Aber kein einziges kann einen zurücklesen. Das Dokument, das jede physische Lieferung zwischen koreanischen Unternehmen begleitet – mit Artikeln, Mengen, Stückpreisen und Lieferwerten – gelangt über die Tastatur in Ihren Beschaffungsworkflow, ein Feld nach dem anderen. Wenn Sie am Monatsende fünfzig davon von fünfzehn Lieferanten erhalten, wird diese Asymmetrie von einer Kuriosität zum Grund dafür, dass Ihr Wareneingangsteam um 22 Uhr immer noch im Büro sitzt.

Wenn Sie neu bei koreanischen Transaktionsauszügen sind, beginnen Sie mit unserem Leitfaden zum Extrahieren koreanischer Transaktionsdaten in Excel, der Feldstruktur, 3-Wege-Abgleich und das Problem fehlgeschlagener Vorlagen behandelt. Dieser Artikel konzentriert sich darauf, was sich ändert, wenn Sie von einem Dokument auf fünfzig skalieren – von einem Lieferantenformat auf fünfzehn.

Was Batch-Verarbeitung für den koreanischen Einkauf wirklich bedeutet

Der Unterschied zwischen der Verarbeitung eines Transaktionsauszugs (거래명세서) und fünfzig ist nicht nur eine Frage der Zeit. Es geht um eine völlig andere Problemklasse.

Verarbeiten Sie einen einzelnen 거래명세서 – ein Lieferant, eine Lieferung, ein Dokument – und Ihr Arbeitsablauf ist unkompliziert. Öffnen Sie das PDF. Lesen Sie den Lieferantennamen (공급자), das Transaktionsdatum (거래일자) und die Artikeltabelle. Geben Sie für jede Zeile den Artikelnamen (품목명), die Menge (수량), den Einzelpreis (단가) und den Zeilenbetrag (금액) in Ihre Eingangstabelle ein. Kopieren Sie den Nettobetrag (공급가액) und den Mehrwertsteuerbetrag (세액) in Ihre Abstimmungsdatei. Fertig. Drei Minuten pro Dokument, vielleicht fünf, wenn das Layout des Lieferanten dicht ist oder die Scanqualität schlecht.

Machen Sie das jetzt fünfzig Mal – von fünfzehn verschiedenen Lieferanten, jeder mit eigenem Layout, eigenem Artikelcodesystem, eigener Druckqualität. Die Probleme, die im großen Maßstab auftauchen, sind bei der Einzeldokumentverarbeitung unsichtbar:

Formatvielfalt. Der 거래명세서 von Lieferant A ist ein klares PDF, generiert von Douzone iCUBE, mit der Artikeltabelle in einem Standardraster. Der von Lieferant B ist ein Handyfoto eines handschriftlichen Formulars, mit Mengenangaben am Rand. Der von Lieferant C ist ein in Excel gedrucktes Dokument mit verbundenen Zellen. Ein Ansatz, der für Dokument 1 funktioniert, scheitert bei Dokument 2. Bei Dokument 50 haben Sie jede Formatvariante erlebt, die die koreanische B2B-Lieferkette zu bieten hat – und alles manuell abgetippt.
Benennungskonventionen. Sie müssen wissen, welche Zeile aus welcher Datei stammt. "거래명세서_20260430.pdf" verrät Ihnen nichts über den Lieferanten. Wenn Sie drei Rechnungen vom selben Lieferanten im Laufe des Monats erhalten, müssen Sie jede Position bis zum Originaldokument zurückverfolgen können – und Dateinamen allein können diese Rückverfolgbarkeit nicht leisten.
Ausnahmebehandlung. In 50 Dokumenten werden Sie auf leere Felder stoßen. Ein Lieferant hat vergessen, den Einzelpreis zu drucken. Ein anderer hat das Mehrwertsteuerfeld leer gelassen. Ein Handyfoto hat die unteren Zeilen der Artikeltabelle abgeschnitten. Bei der Einzeldokumentverarbeitung fallen Ihnen diese sofort auf und Sie beheben sie. Bei der Batch-Verarbeitung sind die Ausnahmen im Stapel vergraben – und sie zu finden erfordert das Scannen jeder ausgefüllten Zeile.
Ausgabezusammenführung. Selbst wenn Sie jedes Dokument perfekt extrahieren könnten, hätten Sie fünfzig separate Tabellenblätter. Das eigentliche Ergebnis – das, was Ihr Wareneingangsteam braucht – ist eine einzige Tabelle mit allen Positionen aller Lieferanten, sortierbar und filterbar nach Datum, Lieferant und Bestellnummer.

Einzeldokumentverarbeitung testet Ihre Tippgeschwindigkeit. Batch-Verarbeitung testet Ihr Systemdesign. Der Engpass verschiebt sich von „Wie schnell kann ich tippen?" zu „Wie verarbeite ich alle Dokumente gleichzeitig, ohne den Überblick zu verlieren, was woher kommt?" – und das ist eine grundlegend andere Frage.

Warum Douzone, ECOUNT und iQuest das Problem der eingehenden Belegerfassung nicht lösen

Der koreanische ERP-Markt hat Jahrzehnte in die Perfektionierung der ausgehenden Belegerstellung investiert. Die Ergebnisse sind beeindruckend. Douzone Bizon (더존비즈온) – Koreas größter ERP-Anbieter, 2025 vom schwedischen PE-Unternehmen EQT für 1,3 Billionen KRW übernommen – ermöglicht seinen rund 20.000 Firmenkunden, 거래명세서 mit einem Klick aus Verkaufsdaten zu generieren, Lieferanten- und Käuferfelder automatisch aus der Kundendatenbank zu befüllen und hunderte Belege über WEHAGO und iCUBE im Stapel zu drucken oder zu mailen.

ECOUNT (이카운트) mit über 80.000 Firmenkunden zum Pauschalpreis von 40.000 KRW/Monat folgt dem gleichen Modell: Verkaufserfassung → automatische 거래명세서-Generierung → Mehrkanal-Versand (E-Mail, KakaoTalk, SMS, Fax). Das Einkaufsmodul erfasst eingehende Kaufdaten – jedoch manuell. Es gibt keinen Weg „Dokument hochladen → Felder automatisch extrahieren" für erhaltene Belege.

iQuest (아이퀘스트), Hersteller von 얼마에요 ERP, ist der einzige große koreanische Anbieter mit OCR-basierter 거래명세서-Datenextraktion: Foto eines erhaltenen 거래명세서 mit der App, KI extrahiert Lieferantendaten und Artikelpositionen ins ERP. Das ist ein echter Fortschritt und in gewisser Weise die lokal nächste Analogie zu dem, was ImageToTable.ai für einzelne Dokumente leistet. Aber das Design setzt auf Einzelbelege: fotografieren, KI-Ergebnis prüfen, Fehler korrigieren, bestätigen, wiederholen. Für einen Außendienstler, der eine Quittung vom Mittagessen erfasst, funktioniert das. Für ein Einkaufsteam, das am Monatsende fünfzig 거래명세서 von fünfzehn Lieferanten erhält, nicht – denn der Engpass ist nicht die Extraktionsgenauigkeit pro Beleg, sondern der manuelle Prüfschritt pro Beleg, der echte Stapelverarbeitung verhindert.

경리나라 und 경영이지 – bei kleineren koreanischen Firmen wegen ihrer Einfachheit beliebt – beherrschen die 거래명세서-Ausstellung, bieten aber keinerlei Eingangsextraktion. Gleiches gilt für die großen ASP-Plattformen: Popbill (팝빌) mit über 373.000 registrierten Unternehmen und über 324 Millionen kumulierten Dokumenten sowie Barobill (바로빌) bieten APIs für Massenausstellung und HomeTax-Integration, aber ihre Abruffunktionen ziehen Daten aus Ihren eigenen ausgestellten Belegen – nicht strukturierte Daten aus erhaltenen Lieferantenbelegen im PDF-, Scan- oder Fotoformat.

Das Muster zieht sich durch alle koreanischen ERP- und Buchhaltungsplattformen: Ausgehende Automatisierung ist gelöst. Eingehende Datenextraktion steht nicht einmal auf der Produkt-Roadmap. Die Annahme – implizit, aber einheitlich – ist, dass der Käufer die Daten eintippt.

Die Monatsend-Realität: Warum dieses Problem eine Frist hat

Koreanische B2B-Zahlungszyklen verstärken den Stapelverarbeitungsdruck. Zwei Abrechnungsmuster dominieren: 월말결제, bei dem die Zahlung am Ende des Monats der Warenlieferung erfolgt, und 익월결제, bei dem die Zahlung am Ende des Folgemonats erfolgt. In beiden Fällen stapeln sich die im Monat eingegangenen 거래명세서 zu einem Stapel, der vor der Zahlungsfreigabe abgeglichen werden muss.

Für einen mittelständischen koreanischen Hersteller oder Händler mit 10–30 aktiven Lieferanten fallen in einem typischen Monat 50–200 eingehende Transaktionsbelege an. Diese treffen über den Monat verteilt ein – ein paar pro Tag – aber der Abgleich erfolgt in einem komprimierten Zeitfenster: den letzten 3–5 Arbeitstagen vor der Zahlungsfreigabe. Die Wareneingangsabteilung benötigt jede Position jedes 거래명세서 im System, um sie mit den Bestellungen abzugleichen und den Zahlungsplan für die Finanzabteilung vorzubereiten.

Die Rechnung für dieses Zeitfenster, bei einem konservativen Stapel von 50 Belegen:

Aufgabe	Pro Beleg	× 50 Belege
Öffnen und Lesen der Lieferanten-/Käufer-Kopffelder	1 Min.	50 Min.
Positionen extrahieren (durchschnittlich 8 Zeilen pro Beleg)	3 Min.	2,5 Std.
Lieferwert mit Bestellung abgleichen	1 Min.	50 Min.
Mit Steuerrechnung (세금계산서) abgleichen	1 Min.	50 Min.
Manuelle Bearbeitung gesamt		~5,5 Std.

Fünf einhalb Stunden sind fast ein ganzer Arbeitstag – und das unter der Annahme, dass jeder Beleg als sauberes, lesbares PDF eintrifft. In der Praxis enthält der Stapel ERP-generierte PDFs auf Standard-A4, handschriftliche Formulare von kleineren Familienbetrieben, die nie Rechnungssoftware genutzt haben, per KakaoTalk gesendete Handyfotos von Lieferfahrern und schief eingescannte Kopien. Jede Formatvariante erhöht die Reibung – und die Reibung potenziert sich, wenn man gegen eine Frist arbeitet.

Deshalb ist „Tipp einfach schneller" ab etwa Beleg Nummer zwanzig keine Antwort mehr. Die eigentliche Frage ist nicht, wie schnell Sie einzelne Felder eingeben können – sondern wie Sie jeden Beleg auf einmal bearbeiten, in einem Workflow, mit einer Ausgabe und einer klaren Prüfspur zurück zu jeder Quelldatei.

So funktioniert die Stapelverarbeitung: Eine Spaltendefinition für alle Lieferanten

Das Kernprinzip, das die Stapelverarbeitung von 거래명세서 ermöglicht, ist die spaltennamenbasierte Extraktion: Statt einem Tool mitzuteilen, wo sich ein Feld auf einem Dokument befindet (durch Einzeichnen von Rechtecken oder Training eines Modells anhand von Layouts), teilen Sie ihm mit, was es suchen soll – indem Sie die gewünschten Feldnamen eingeben. Die KI liest das Dokument visuell, findet jeden Wert, indem sie die Bedeutung des Feldnamens semantisch versteht, und befüllt die Ausgabetabelle – unabhängig davon, wo der Lieferant das Feld auf der Seite platziert hat.

Dieser Unterschied zwischen koordinatenbasierter und semantischer Extraktion macht die Stapelverarbeitung erst praktikabel. Ein koordinatenbasiertes Tool benötigt für jedes Lieferantenlayout eine separate Vorlage – denn das Feld „Menge" von Lieferant A liegt bei Pixelposition (400, 320), während es bei Lieferant B bei (380, 450) liegt. Bei fünfzig Dokumenten von fünfzehn Lieferanten bräuchten Sie fünfzehn Vorlagen, und jede Vorlage ist unbrauchbar, sobald ein Lieferant sein Layout ändert. Ein semantisches Extraktionstool benötigt eine einzige Spaltendefinition – eine Liste von Feldnamen wie „Lieferantenname", „Transaktionsdatum", „Artikelname", „Menge", „Einzelpreis", „Nettowert" – und wendet dieselbe Definition auf jedes Dokument im Stapel an, unabhängig vom Layout.

Die Stapelverarbeitung in ImageToTable.ai funktioniert nach diesem Prinzip. Sie laden alle fünfzig 거래명세서-Dateien auf einmal hoch – PDFs, JPG-Scans, PNG-Screenshots, WebP-Fotos, alles in einem Upload. Sie definieren die Spalten, die in Ihre Ausgabetabelle extrahiert werden sollen. Die KI liest jedes Dokument, findet jedes Feld anhand seiner Bedeutung statt seiner Position und fasst alle Ergebnisse in einer einzigen Excel-Tabelle zusammen. Jedes Dokument wird zu einer Zeile (oder mehreren Zeilen, wenn es eine mehrzeilige Artikeltabelle enthält), jedes angeforderte Feld wird zu einer Spalte, und Sie laden eine einzige Tabelle herunter – nicht fünfzig einzelne.

JPG/PNG/PDF KI-Extraktion

Dateien werden sicher verarbeitet und nicht gespeichert.

Der Effizienzgewinn entsteht durch den Wegfall der dokumentenspezifischen Einrichtung. Sie konfigurieren nichts pro Lieferant. Sie erstellen keine Vorlagen. Sie trainieren keine Modelle. Sie definieren Ihre Spalten einmal – „Lieferantenname (공급자)", „Umsatzsteuer-ID (사업자등록번호)", „Transaktionsdatum (거래일자)", „Artikelname (품목명)", „Spezifikation (규격)", „Menge (수량)", „Einzelpreis (단가)", „Zeilenbetrag (금액)", „Nettowert (공급가액)", „Umsatzsteuerbetrag (세액)", „Bestellreferenznummer" – und derselbe Spaltensatz verarbeitet jeden 거래명세서 von jedem Lieferanten. Fünfzig Dateien, fünfzehn Lieferanten, eine Ausgabe.

Bei 5–10 Sekunden pro Seite gegenüber 3 Minuten manueller Erfassung pro Beleg komprimiert der Batch-Workflow 5,5 Stunden Tipparbeit auf etwa 15 Minuten Verarbeitungszeit – ein Effizienzgewinn von 18×. Der eigentliche Vorteil liegt jedoch nicht in der Zeitersparnis, sondern darin, dass die Ausgabe als eine einzige zusammengeführte Tabelle vorliegt, in der jede Position bis zum Quelldokument zurückverfolgt werden kann – bereit für den 3-Wege-Abgleich mit Bestellungen und Steuerrechnungen.

3-Wege-Abgleich im großen Maßstab: Bestellung → Transaktionsbeleg → Steuerrechnung (세금계산서)

Für koreanische Beschaffungsteams ist die Extraktion von Transaktionsbelegdaten in eine Tabelle nicht das Endziel – sie ist der Zwischenschritt. Das eigentliche Ergebnis ist der 3-Wege-Abgleich: Bestellung (발주서) → Transaktionsbeleg (거래명세서) → Steuerrechnung (세금계산서).

Im koreanischen Mehrwertsteuersystem ist die Steuerrechnung (세금계산서) das gesetzlich geregelte Dokument – geregelt durch Artikel 32 des MwSt.-Gesetzes, mit Pflichtfeldern wie Lieferanten- und Käufer-Umsatzsteuer-Identifikationsnummer, Lieferwert, MwSt.-Betrag und Ausstellungsdatum. Sie berechtigt den Käufer zum Vorsteuerabzug (매입세액 공제) und muss korrekt in den vierteljährlichen MwSt.-Voranmeldungen (fällig am 25. Januar, 25. April, 25. Juli, 25. Oktober) ausgewiesen werden. Der Transaktionsbeleg hat kein solches rechtliches Gewicht – er ist ein privater Nachweis (사적 증빙), nicht steuerabzugsfähig – aber er ist das Dokument, das tatsächlich mit der Ware eintrifft und die positionsgenauen Details enthält, die die Steuerrechnung oft auslässt.

Der 3-Wege-Abgleich im großen Maßstab:

Bestellung → Transaktionsbeleg: Prüfen, ob die gelieferte Ware der Bestellung entspricht

Vergleichen Sie die Artikel, Mengen und Stückpreise auf dem Transaktionsbeleg jedes Lieferanten mit der ursprünglichen Bestellung. Abweichungen – eine Mengendifferenz, ein nicht genehmigter Ersatzartikel, ein falscher Stückpreis – müssen markiert und geklärt werden, bevor die Steuerrechnung überhaupt bearbeitet wird. Extrahieren Sie die Daten des Transaktionsbelegs in eine Spaltenstruktur, die für jede Position die Bestellnummer enthält.

Transaktionsbeleg → Steuerrechnung: Prüfen, ob die berechneten Beträge den gelieferten Mengen entsprechen

Die Steuerrechnung kommt separat – oft Tage nach der Ware, manchmal als Teil einer monatlichen Sammelabrechnung. Ihr Lieferwert (공급가액) und der MwSt.-Betrag (세액) müssen mit den Summen des Transaktionsbelegs übereinstimmen. Hier zeigt sich der Vorteil der zusammengeführten Tabelle: eine Spalte aus der Transaktionsbeleg-Extraktion, eine Spalte aus der Steuerrechnungs-Extraktion – ein einfacher Seitenvergleich ersetzt das manuelle Abgleichen über mehrere Dokumente hinweg.

Steuerrechnung → NTS-Meldung: Prüfen der MwSt.-Meldegenauigkeit

Die Daten der Steuerrechnung – nach Prüfung gegen den Transaktionsbeleg – fließen in die vierteljährliche MwSt.-Meldung ein. Eine Abweichung zwischen den bei der NTS hinterlegten Daten aus der elektronischen Meldung des Lieferanten und Ihrer eigenen Meldung löst eine Kreuzvergleichsprüfung aus. Der 3-Wege-Abgleich ist Ihr Prüfpfad: Er belegt, dass das, was Sie bezahlt haben, dem entspricht, was Sie erhalten haben und was der Lieferant gemeldet hat.

Die Kombination aus Transaktionsbeleg-Extraktion und Steuerrechnungs-Extraktion macht dies zu einem vollständigen Beschaffungsabgleichssystem. Jeder Dokumententyp enthält andere Felder, dient einem anderen Zweck und kommt über einen anderen Kanal. Aber beide speisen dieselbe Tabelle – und beide müssen übereinstimmen.

Schluss mit manueller Dateneingabe – lassen Sie KI die Arbeit machen

Laden Sie ein Bild oder PDF hoch – strukturierte Tabellendaten in 10 Sekunden

Jetzt testen →

Keine Anmeldung · Keine Kreditkarte · Ergebnis in 10 Sekunden

Das Namensproblem: Warum Batch-Verarbeitung Quellenrückverfolgung braucht

Es gibt ein Problem, das bei der Einzelverarbeitung nicht existiert und bei Batch-Workflows kritisch wird: zu wissen, welche extrahierte Zeile aus welcher Datei stammt.

Ein typischer Monatsabschluss-Batch könnte diese Dateien enthalten:

거래명세서_20260430.pdf — von Donghae Steel, ERP-generiert
거래명세서_20260430.pdf — von einem anderen Lieferanten, gleicher Dateiname, anderer Ordner
KakaoTalk_20260502_143021.jpg — Foto einer handschriftlichen 거래명세서, Lieferant allein aus Dateinamen nicht erkennbar
scan001.pdf — gescanntes Papierformular, Lieferantenname im Bild, nicht im Dateinamen
2026-04-30_거래명세표_대한포장.pdf — sauberer, identifizierbarer Dateiname – die Ausnahme, nicht die Regel

Wenn fünfzig extrahierte Zeilen in Ihrer Ausgabetabelle landen, müssen Sie wissen, welche Zeile zu welchem Originaldokument des Lieferanten gehört. Ohne diese Rückverfolgbarkeit können Sie eine Mengenabweichung nicht klären – Sie können nicht zum Quelldokument zurückgehen, um zu prüfen, ob die Extraktion korrekt war oder der Lieferant einen Fehler gemacht hat.

Der Batch-Extraktions-Workflow in ImageToTable.ai bewahrt diese Rückverfolgbarkeit, indem er den Quelldateinamen als Spalte in der Ausgabe einfügt. Jede extrahierte Zeile trägt den ursprünglichen Dateinamen, sodass Sie jeden Datenpunkt sofort zu seinem Quelldokument zurückverfolgen können. Bei Dokumenten mit mehrdeutigen Dateinamen wie KakaoTalk_20260502_143021.jpg benennen Sie sie vor dem Hochladen um – selbst ein einfaches Präfix wie DonghaeSteel_20260430.pdf liefert die benötigte Rückverfolgbarkeit.

Dies ist eine dieser Batch-spezifischen Herausforderungen, die Einzeldokument-Tutorials nie erwähnen. Wenn Sie ein Dokument verarbeiten, wissen Sie, woher die Daten stammen, weil Sie es gerade angesehen haben. Wenn Sie fünfzig verarbeiten, muss das System sich erinnern, damit Sie es nicht müssen.

Die Namenskonvention, die Sie vor dem Hochladen festlegen, ist Ihr Prüfpfad. Ein konsistentes Muster – [LieferantenCode]_[Datum]_[Dokumenttyp].pdf – kostet zehn Sekunden pro Datei und spart Stunden forensischer Dateinamen-Untersuchung, wenn beim Abgleich eine Abweichung auftaucht.

Umgang mit Formatvielfalt: Von Handschrift bis ERP-Export

Das Problem der Formatvielfalt im koreanischen B2B-Einkauf hängt von Größe und Branche des Lieferanten ab. Ein großer Chemielieferant in Ulsan versendet Waren mit einem Douzone-iCUBE-PDF – professionell formatiert, jedes Feld in einem vorhersagbaren Raster. Ein kleiner Verpackungslieferant in Incheon schreibt eine 거래명세서 von Hand auf ein vorgedrucktes Kohlepapier-Formular, reißt die blaue Käuferkopie (공급받는자용) ab und übergibt sie dem Fahrer. Ein mittelständischer Lebensmittelhändler nutzt eine Excel-Vorlage, die am Bildschirm professionell wirkt, aber beim Drucken mit verbundenen Zellen die Feldgrenzen überschreitet.

Herkömmliche OCR – die Text an vorhersagbaren Positionen erwartet – scheitert an der zweiten und dritten Kategorie. Handgeschriebene koreanische Zeichen auf Kohlepapier-Formularen haben bereits einen geringen Kontrast, bevor die Handschrift des Fahrers hinzukommt. Excel-gedruckte Formulare mit verbundenen Zellen erzeugen Textblöcke, bei denen Feldbezeichnungen und Werte ineinander übergehen. Vorlagenbasierte Systeme erfordern eine separate Vorlage für jedes Format – und bei fünfzehn Lieferanten mit fünf verschiedenen Formattypen wird allein die Vorlagenpflege zur Daueraufgabe.

Die Spaltennamenextraktion bewältigt Formatvielfalt von Natur aus – weil sie nicht vom Layout abhängt. Ob „Menge (수량)“ in der dritten Spalte einer Tabelle in einem PDF, am Rand eines handgeschriebenen Formulars gekritzelt oder in einer verbundenen Excel-Zelle eingebettet ist – die KI findet es, indem sie das Dokument wie ein Mensch liest: nach semantischer Bedeutung suchend, nicht nach Pixelkoordinaten. Dieselbe Spaltendefinition, die auf dem Douzone-PDF funktioniert, funktioniert auch auf der handgeschriebenen Kohlepapier-Kopie und dem Excel-Ausdruck.

Es gibt eine praktische Grenze: Ein so unscharfes Foto, dass ein Mensch den Text nicht lesen kann, wird auch für die KI scheitern. Aber die Hürde für „lesbar“ liegt deutlich niedriger als das, was vorlagenbasierte OCR erfordert – denn unscharfer, aber lesbarer Text ist semantisch immer noch lesbar, selbst wenn seine Pixelkoordinaten für eine Vorlage zu ungenau sind.

Umgang mit Ausnahmen in einem Batch von fünfzig Dokumenten

In jedem Batch von fünfzig Dokumenten gibt es einige mit Problemen. Ein Lieferant hat das Feld für die Umsatzsteuer leer gelassen, weil er ein Kleinunternehmer (간이과세자) ist und keine Umsatzsteuer separat berechnet. Ein anderer hat den Lieferwert in die falsche Zelle eingegeben, sodass die Extraktion eine unerwartete Zahl zurückgibt. Ein Handyfoto hat die letzten beiden Zeilen einer Tabelle mit zehn Positionen abgeschnitten.

Bei der Einzeldokumentverarbeitung fallen Ihnen diese Fehler sofort auf – weil Sie das Dokument und die Daten gleichzeitig betrachten. Bei der Batchverarbeitung sind das Dokument und die extrahierten Daten durch den Extraktionsschritt getrennt, und die Ausnahmen können sich in einer zusammengeführten Tabelle mit 400 Zeilen verstecken.

Der Workflow für den Umgang mit Ausnahmen im Batch-Modus:

Auf Leerstellen in Pflichtfeldern prüfen

Filtern Sie nach der Extraktion die Ausgabetabelle nach leeren Zellen in kritischen Spalten – Lieferantenname, Lieferwert, Menge. Eine leere Menge bedeutet meist, dass entweder die Positionszeile übersehen wurde oder das Dokument kein Mengenfeld enthielt. In beiden Fällen müssen Sie Bescheid wissen.

Summen mit Dokumentensummen stichprobenartig prüfen

Der Lieferwert (공급가액) auf dem 거래명세서 ist die Summe aller Positionsbeträge. Wenn Ihre extrahierten Positionsbeträge nicht mit dem extrahierten Lieferwert übereinstimmen, wurde entweder eine Position übersehen oder der Lieferwert falsch gelesen. Diese Querprüfung deckt Extraktionslücken auf, ohne dass Sie jedes Dokument erneut lesen müssen.

Einzelne Problemdokumente erneut verarbeiten

Wenn ein bestimmtes Dokument unzuverlässige Ergebnisse geliefert hat – erkennbar an leeren Pflichtfeldern oder einer Summenabweichung – laden Sie es einzeln für einen zweiten Extraktionsdurchlauf hoch. Der Batch-Workflow zwingt Sie nicht, den gesamten Batch erneut zu verarbeiten, um die Fehler eines Dokuments zu beheben.

Die entscheidende Erkenntnis: Die Batchverarbeitung beseitigt Ausnahmen nicht – sie verändert, wie Sie sie finden. Anstatt Fehler Dokument für Dokument beim Tippen zu entdecken, führen Sie strukturierte Prüfungen der Gesamtausgabe durch und isolieren die Problemdokumente. Der Wechsel von reaktiver Fehlererkennung (Fehler beim Erstellen finden) zu proaktiver Fehlererkennung (Gesamtausgabe auf Anomalien scannen) macht die Batchverarbeitung nicht nur schneller, sondern auch zuverlässiger.

Integration der Batch-Extraktion in Ihren bestehenden Beschaffungsworkflow

Die Batch-Extraktion von Transaktionsbelegen ersetzt nicht Ihr ERP — und das sollte sie auch nicht. Das ERP verwaltet Verkaufsaufzeichnungen, die Erstellung von Ausgangsrechnungen, die NTS-Übermittlung und die Finanzberichterstattung. Die Batch-Extraktion übernimmt den Schritt der Datenerfassung, den das ERP Ihrer Tastatur überlässt.

Die Schnittstelle ist die Excel-Ausgabe. Extrahieren Sie alle eingehenden Transaktionsbelegdaten in eine Tabelle, gleichen Sie sie mit Bestellungen und Steuerrechnungen ab und importieren Sie die verifizierten Daten dann über die standardmäßige Excel-Importfunktion in Ihr ERP. Jedes große koreanische ERP unterstützt dies: Douzones Smart A und iCUBE bieten einen Excel-Batch-Import für Einkaufsdatensätze. ECOUNT bietet einen Excel-Massenimport für Transaktionsbelege und andere Belege. iQuest Eolmaeyo unterstützt den Excel-Upload für Einkaufstransaktionsbelegdaten. Die extrahierte Tabelle wird zur Importquelle – sauber, strukturiert und verifiziert, bevor sie Ihr ERP überhaupt berührt.

Für Teams, die auch Dokumente von Überseelieferanten verarbeiten, gilt derselbe Workflow. Ein Lieferschein eines chinesischen Komponentenlieferanten oder eine Packliste eines europäischen Ausrüstungsanbieters folgt derselben Extraktionslogik – Spalten definieren, hochladen, eine Tabelle erhalten. Die Dokumentsprache und das Format ändern sich, aber das Prinzip der Spaltennamensextraktion nicht.

Dies unterscheidet sich grundlegend vom All-in-One-ERP-Versprechen. Sie ersetzen nicht Ihr Finanzsystem. Sie schließen die eine Lücke, die jedes koreanische ERP offen lässt: den Moment, in dem ein Lieferantendokument – in welchem Format auch immer es eintrifft – zu einer Zeile in Ihrer Tabelle werden muss, bevor es zu einem Datensatz in Ihrem ERP werden kann.

FAQ

Kann die Batch-Verarbeitung sowohl handschriftliche als auch gedruckte Transaktionsbelege (거래명세서) im selben Upload verarbeiten?

Ja. Die KI liest jedes Dokument unabhängig und erkennt handschriftliche koreanische Zeichen (einschließlich unterschiedlicher Handschriftqualität) und gedruckten Text mit derselben semantischen Extraktionslogik. Dieselbe Spaltendefinition verarbeitet beide Formate. Die praktische Grenze ist die Lesbarkeit: Wenn ein Mensch die Handschrift nicht lesen kann, kann die KI es wahrscheinlich auch nicht.

Was passiert, wenn die Transaktionsbelege (거래명세서) eines Lieferanten nicht standardisierte Feldnamen verwenden?

Die Spaltenextraktion gleicht keine Textzeichenfolgen ab – sie erfasst Werte durch semantisches Verständnis. Ein Lieferant, dessen Formular das Mengenfeld als „출하수량“ (Versandmenge) statt „수량“ (Menge) bezeichnet, wird dennoch korrekt extrahiert, da die KI erkennt, dass beide Bezeichnungen dasselbe Konzept meinen. Dies ist der grundlegende Unterschied zwischen Vorlagenabgleich (der fehlschlagen würde) und semantischer Extraktion (die sich anpasst).

Wie verarbeitet das System mehrseitige Transaktionsbelege (거래명세서) mit Artikeltabellen, die sich über mehrere Seiten erstrecken?

Mehrseitige PDFs werden als ein einziges Dokument verarbeitet. Die KI liest alle Seiten und extrahiert sämtliche Positionen aus der Artikeltabelle, unabhängig von Seitenumbrüchen. Die Ausgabe fasst alle Zeilen aller Seiten im selben Datensatz des Dokuments in der Tabelle zusammen.

Kann ich nur bestimmte Positionen extrahieren – zum Beispiel nur Artikel, die zu einer bestimmten Bestellnummer gehören?

Der Extraktionsschritt erfasst alle Daten aus allen Dokumenten. Das Filtern nach Bestellnummer, Lieferant, Datumsbereich oder einem anderen Kriterium erfolgt nach der Extraktion in der Ausgabetabelle – so haben Sie den vollständigen Datensatz zur Bearbeitung und können nach Bedarf filtern, anstatt die Extraktion von vornherein auf eine Teilmenge zu beschränken.

Ist die Datenextraktion aus Transaktionsbelegen (거래명세서) konform mit den koreanischen Steueraufbewahrungspflichten?

Der 거래명세서 selbst ist ein privates Verifikationsdokument (사적 증빙) – er hat kein gesetzlich vorgeschriebenes Format und wird bei keiner Behörde eingereicht. Es gibt keine spezifischen Compliance-Anforderungen, die die Extraktion oder Speicherung seiner Daten regeln. Die Steuerrechnung (세금계산서), geregelt durch Artikel 32 des Mehrwertsteuergesetzes, ist das Dokument mit rechtlichen Compliance-Verpflichtungen – und wird separat behandelt. Zur Extraktion von Steuerrechnungen siehe die Anleitung zur Stapelverarbeitung von Steuerrechnungen. In der Praxis empfiehlt Artikel 85-3 des Rahmengesetzes über nationale Steuern (국세기본법), Transaktionsaufzeichnungen fünf Jahre lang aufzubewahren – und eine strukturierte Excel-Datei mit Rückverfolgbarkeit der Quelldateinamen erfüllt diesen Zweck besser als ein Stapel Papierformulare.

Funktioniert das auch für koreanische Steuerrechnungen (세금계산서) in Stapeln?

Ja – derselbe Stapelverarbeitungs-Workflow gilt. Für die Stapelverarbeitung von Steuerrechnungen definieren Sie Spalten wie Unternehmensregistrierungsnummer (사업자등록번호), Lieferwert (공급가액), Steuerbetrag (세액) und Genehmigungsnummer (승인번호) und verarbeiten 100–200 Steuerrechnungen in einem Upload. Das Extraktionsprinzip ist identisch; nur die Feldnamen ändern sich.

Jedes koreanische ERP kann aus einem Verkaufsdatensatz einen Transaktionsbeleg erstellen. Die Lücke – und die Chance – liegt auf der Empfängerseite. Die Stapelverarbeitung schließt sie mit einer Spaltendefinition, einem Upload und einer Tabelle. Probieren Sie es bei Ihrem nächsten Monatsabschluss aus. Sehen Sie, ob aus 5,5 Stunden Tipparbeit 15 Minuten Prüfung werden.