50 koreanische Lieferscheine,
eine Tabelle: Stapelverarbeitung ohne Tipparbeit
Jedes koreanische ERP kann mit einem Klick aus einem Verkaufsbeleg einen Transaktionsbeleg (거래명세서) erstellen. Aber keines kann einen solchen Beleg zurücklesen. Das Dokument, das jede physische Lieferung zwischen koreanischen Unternehmen begleitet – mit Artikeln, Mengen, Einzelpreisen und Warenwerten – gelangt über die Tastatur in Ihren Beschaffungsworkflow, Feld für Feld. Wenn Sie am Monatsende fünfzig solcher Belege von fünfzehn Lieferanten erhalten, wird aus dieser Asymmetrie kein Kuriosum mehr, sondern der Grund, warum Ihr Wareneingangsteam um 22 Uhr immer noch im Büro sitzt.
Kernerkenntnisse
- Jedes koreanische ERP kann mit einem Klick einen 거래명세서 aus einem Verkaufsbeleg erstellen – und genau keines kann einen zurücklesen. Deshalb tippt Ihr Wareneingangsteam noch um 22 Uhr.
- Fünfzig 거래명세서 von fünfzehn Lieferanten bedeuten 5,5 Stunden manuelle Erfassung. Das eigentliche Problem ist aber nicht Ihre Tippgeschwindigkeit – sondern dass die Branche jahrzehntelang die ausgehende Automatisierung perfektioniert und die eingehende Extraktion Ihrer Tastatur überlassen hat.
- ImageToTable.ai verarbeitet alle fünfzig Dokumente mit einer einzigen Spaltendefinition – keine pro Lieferant angepassten Vorlagen, kein Prüfschleife pro Dokument – und liefert eine einzige Tabelle, in der jede Position auf ihre Quelldatei zurückverfolgbar ist.
Wenn Sie neu bei koreanischen Transaktionsauszügen sind, beginnen Sie mit unserem Leitfaden zum Extrahieren koreanischer Transaktionsdaten in Excel, der Feldstruktur, 3-Wege-Abgleich und das Problem der Vorlagenfehler behandelt. Dieser Artikel konzentriert sich darauf, was sich ändert, wenn Sie von einem Dokument auf fünfzig skalieren – von einem Lieferantenformat auf fünfzehn.
Was Batch-Verarbeitung für den koreanischen Einkauf bedeutet
Der Unterschied zwischen der Verarbeitung eines Transaktionsauszugs (거래명세서) und fünfzig ist nicht nur eine Frage der Zeit. Es geht um eine völlig andere Problemklasse.
Verarbeiten Sie einen einzelnen 거래명세서 – ein Lieferant, eine Lieferung, ein Dokument – und Ihr Arbeitsablauf ist unkompliziert. Öffnen Sie das PDF. Lesen Sie den Lieferantennamen (공급자), das Transaktionsdatum (거래일자) und die Artikeltabelle aus. Geben Sie für jede Zeile den Artikelnamen (품목명), die Menge (수량), den Einzelpreis (단가) und den Zeilenbetrag (금액) in Ihre Eingangstabelle ein. Kopieren Sie den Nettobetrag (공급가액) und den Mehrwertsteuerbetrag (세액) in Ihre Abstimmungsdatei. Fertig. Drei Minuten pro Dokument, vielleicht fünf, wenn das Layout des Lieferanten dicht ist oder die Scanqualität schlecht.
Machen Sie das jetzt fünfzig Mal – von fünfzehn verschiedenen Lieferanten, jeder mit eigenem Layout, eigenem Artikelnummernsystem, eigener Druckqualität. Die Probleme, die im großen Maßstab auftauchen, sind bei der Einzeldokumentverarbeitung unsichtbar:
- Formatvielfalt. Der 거래명세서 von Lieferant A ist ein gestochen scharfes PDF, generiert von Douzone iCUBE, mit der Artikeltabelle in einem Standard-Rasterlayout. Der von Lieferant B ist ein Handyfoto eines handschriftlichen Formulars, mit Mengen, die in den Rand gekritzelt sind. Der von Lieferant C ist ein aus Excel gedrucktes Dokument mit verbundenen Zellen. Ein Extraktionsansatz, der für Dokument 1 funktioniert, scheitert bei Dokument 2. Bei Dokument 50 sind Sie auf jede Formatvariante gestoßen, die die koreanische B2B-Lieferkette zu bieten hat – und Sie haben alle manuell abgetippt.
- Benennungskonventionen. Sie müssen wissen, welche Zeile von welcher Datei stammt. "거래명세서_20260430.pdf" verrät Ihnen nichts über den Lieferanten. Wenn Sie drei Rechnungen vom selben Lieferanten im Laufe des Monats erhalten, müssen Sie jede Position bis zu ihrem Originaldokument zurückverfolgen können – und Dateinamen allein können diese Rückverfolgbarkeit nicht leisten.
- Ausnahmebehandlung. In 50 Dokumenten werden Sie auf leere Felder stoßen. Ein Lieferant hat vergessen, den Einzelpreis zu drucken. Ein anderer hat die MwSt.-Zelle leer gelassen. Ein Handyfoto hat die unteren Zeilen der Artikeltabelle abgeschnitten. Bei der Einzeldokumentverarbeitung fallen Ihnen diese sofort auf und Sie lösen sie. Bei der Batch-Verarbeitung sind die Ausnahmen in einem Stapel vergraben – und sie zu finden erfordert das Scannen jeder ausgefüllten Zeile.
- Ausgabezusammenführung. Selbst wenn Sie jedes Dokument perfekt extrahieren könnten, hätten Sie fünfzig separate Tabellenkalkulationen. Das eigentliche Ergebnis – das, was Ihr Wareneingangsteam braucht – ist eine einzige Tabelle mit allen Positionen aller Lieferanten, sortierbar und filterbar nach Datum, Lieferant und Bestellnummer.
Einzeldokumentverarbeitung testet Ihre Tippgeschwindigkeit. Batch-Verarbeitung testet Ihr Systemdesign. Der Engpass verschiebt sich von „Wie schnell kann ich tippen" zu „Wie verarbeite ich alle Dokumente auf einmal, ohne den Überblick zu verlieren, was woher kam" – und das ist eine grundlegend andere Frage.
Warum Douzone, ECOUNT und iQuest das Problem der eingehenden Belegerfassung nicht lösen
Der koreanische ERP-Markt hat Jahrzehnte in die Perfektionierung der ausgehenden Belegerstellung investiert. Die Ergebnisse sind beeindruckend. Douzone Bizon (더존비즈온) — Koreas größter ERP-Anbieter, 2025 vom schwedischen PE-Unternehmen EQT für 1,3 Billionen KRW übernommen — ermöglicht seinen rund 20.000 Firmenkunden, 거래명세서 mit einem Klick aus Verkaufsdaten zu generieren, Lieferanten- und Käuferfelder automatisch aus der Kundendatenbank zu befüllen und hunderte Belege über WEHAGO und iCUBE stapelweise zu drucken oder zu mailen.
ECOUNT (이카운트), das über 80.000 Firmenkunden zu einem Pauschalpreis von 40.000 KRW/Monat bedient, folgt dem gleichen Modell: Verkaufserfassung → automatische 거래명세서-Generierung → Multi-Channel-Versand (E-Mail, KakaoTalk, SMS, Fax). Das Einkaufsmodul erlaubt die Erfassung eingehender Kaufdaten – jedoch manuell. Es gibt keinen Weg „Dokument hochladen → Felder automatisch extrahieren" für empfangene Belege.
iQuest (아이퀘스트), Hersteller von 얼마에요 ERP, ist der einzige große koreanische Anbieter mit OCR-basierter 거래명세서-Datenextraktion: Foto eines erhaltenen 거래명세서 mit der App machen, KI extrahiert Lieferantendaten und Artikelübersicht ins ERP. Das ist ein echter Fortschritt und in gewisser Weise die lokal nächste Analogie zu dem, was ImageToTable.ai für einzelne Dokumente leistet. Aber die Designannahme ist: ein Dokument nach dem anderen – fotografieren, KI-Ergebnis prüfen, Fehler korrigieren, bestätigen, wiederholen. Für einen Außendienstmitarbeiter, der eine Quittung von einem Mittagessen erfasst, funktioniert das. Für ein Einkaufsteam, das am letzten Monatstag fünfzig 거래명세서 von fünfzehn Lieferanten erhält, nicht – denn der Engpass ist nicht die Extraktionsgenauigkeit pro Dokument, sondern der manuelle Prüfschritt pro Dokument, der echte Stapelverarbeitung verhindert.
경리나라 und 경영이지 – bei kleineren koreanischen Unternehmen wegen ihrer Einfachheit beliebt – beherrschen die Ausstellung von 거래명세서, bieten aber keinerlei Erfassung eingehender Belege. Gleiches gilt für die großen ASP-Plattformen: Popbill (팝빌) mit über 373.000 registrierten Unternehmen und über 324 Millionen kumulierten Dokumenten sowie Barobill (바로빌) bieten APIs für Massenausstellung und HomeTax-Integration, aber ihre Abruffunktionen ziehen Daten aus Ihren eigenen ausgestellten Dokumenten – nicht strukturierte Daten aus Lieferantenbelegen, die Sie als PDF, Scan oder Foto erhalten haben.
Das Muster ist bei allen koreanischen ERP- und Buchhaltungsplattformen gleich: Ausgehende Automatisierung ist ein gelöstes Problem. Die Erfassung eingehender Daten steht nicht einmal auf der Produkt-Roadmap. Die Annahme – implizit, aber einheitlich – ist, dass der Käufer die Daten selbst eintippt.
Die Monatsend-Realität: Warum dieses Problem eine Deadline hat
Koreanische B2B-Zahlungszyklen verstärken den Stapelverarbeitungsdruck. Zwei Abrechnungsmuster dominieren: 월말결제, bei dem die Zahlung am Ende des Liefermonats erfolgt, und 익월결제, bei dem die Zahlung am Ende des Folgemonats erfolgt. In beiden Fällen stapeln sich die im Monat eingegangenen 거래명세서 zu einem Stapel, der vor der Zahlungsfreigabe abgeglichen werden muss.
Für einen mittelständischen koreanischen Hersteller oder Händler mit 10–30 aktiven Lieferanten fallen in einem typischen Monat 50–200 eingehende Transaktionsbelege an. Diese treffen über den Monat verteilt ein – ein paar pro Tag – aber der Abgleich erfolgt in einem komprimierten Zeitfenster: den letzten 3–5 Arbeitstagen vor der Zahlungsfreigabe. Die Wareneingangsabteilung benötigt jede Position jedes 거래명세서 im System, um sie mit den Bestellungen abzugleichen und den Zahlungsplan für die Finanzabteilung vorzubereiten.
Die Rechnung für dieses Zeitfenster, bei einem konservativen Stapel von 50 Belegen:
| Aufgabe | Pro Beleg | × 50 Belege |
|---|---|---|
| Öffnen und Lesen der Lieferanten-/Käufer-Kopffelder | 1 Min. | 50 Min. |
| Positionen extrahieren (durchschnittlich 8 Zeilen pro Beleg) | 3 Min. | 2,5 Std. |
| Lieferwert mit Bestellung abgleichen | 1 Min. | 50 Min. |
| Mit Steuerrechnung (세금계산서) abgleichen | 1 Min. | 50 Min. |
| Manuelle Bearbeitung gesamt | ~5,5 Std. |
Fünf einhalb Stunden sind fast ein ganzer Arbeitstag – und das unter der Annahme, dass jeder Beleg als sauberes, lesbares PDF eintrifft. In der Praxis enthält der Stapel ERP-generierte PDFs auf Standard-A4, handschriftliche Formulare von kleineren Familienlieferanten, die nie Rechnungssoftware genutzt haben, per KakaoTalk gesendete Handyfotos von Zustellfahrern und schief eingescannte Kopien. Jede Formatvariante erhöht die Reibung – und die Reibung potenziert sich, wenn man gegen eine Deadline arbeitet.
Deshalb ist „einfach schneller tippen" ab etwa Beleg Nummer zwanzig keine Antwort mehr. Die eigentliche Frage ist nicht, wie schnell Sie einzelne Felder eingeben können – sondern wie Sie jeden Beleg auf einmal bearbeiten, in einem Workflow, mit einer Ausgabe und einer klaren Prüfspur zurück zu jeder Quelldatei.
So funktioniert die Stapelverarbeitung: Eine Spaltendefinition für alle Lieferanten
Das Kernprinzip, das die Stapelverarbeitung von 거래명세서 ermöglicht, ist die spaltennamenbasierte Extraktion: Statt einem Tool mitzuteilen, wo sich ein Feld auf einem Dokument befindet (durch Einzeichnen von Rechtecken oder Training eines Modells anhand von Layouts), teilen Sie ihm mit, was es suchen soll – indem Sie die gewünschten Feldnamen eingeben. Die KI liest das Dokument visuell, findet jeden Wert, indem sie die semantische Bedeutung des Feldnamens versteht, und füllt die Ausgabetabelle – unabhängig davon, wo der Lieferant das Feld auf der Seite platziert hat.
Dieser Unterschied zwischen koordinatenbasierter und semantischer Extraktion macht die Stapelverarbeitung erst praktikabel. Ein koordinatenbasiertes Tool benötigt für jedes Lieferantenlayout eine separate Vorlage – denn das Feld „Menge" von Lieferant A liegt an Pixelposition (400, 320), während es bei Lieferant B bei (380, 450) liegt. Bei fünfzig Dokumenten von fünfzehn Lieferanten bräuchten Sie fünfzehn Vorlagen, und jede Vorlage ist unbrauchbar, sobald ein Lieferant sein Layout ändert. Ein semantisches Extraktionstool benötigt eine einzige Spaltendefinition – eine Liste von Feldnamen wie „Lieferantenname", „Transaktionsdatum", „Artikelname", „Menge", „Einzelpreis", „Nettowert" – und wendet dieselbe Definition auf jedes Dokument im Stapel an, unabhängig vom Layout.
Die Stapelverarbeitung in ImageToTable.ai funktioniert nach diesem Prinzip. Sie laden alle fünfzig 거래명세서-Dateien auf einmal hoch – PDFs, JPG-Scans, PNG-Screenshots, WebP-Fotos, alles in einem Upload. Sie definieren die Spalten, die in Ihre Ausgabetabelle extrahiert werden sollen. Die KI liest jedes Dokument, findet jedes Feld anhand seiner Bedeutung statt seiner Position und fasst alle Ergebnisse in einer einzigen Excel-Tabelle zusammen. Jedes Dokument wird zu einer Zeile (oder mehreren Zeilen, wenn es eine mehrzeilige Artikeltabelle enthält), jedes angeforderte Feld wird zu einer Spalte, und Sie laden eine einzige Tabelle herunter – nicht fünfzig einzelne.
Dateien werden sicher verarbeitet und nicht gespeichert.
Der Effizienzgewinn entsteht durch den Wegfall der dokumentenspezifischen Einrichtung. Sie konfigurieren nichts pro Lieferant. Sie erstellen keine Vorlagen. Sie trainieren keine Modelle. Sie definieren Ihre Spalten einmal – „Lieferantenname (공급자)", „Umsatzsteuer-ID (사업자등록번호)", „Transaktionsdatum (거래일자)", „Artikelname (품목명)", „Spezifikation (규격)", „Menge (수량)", „Einzelpreis (단가)", „Zeilenbetrag (금액)", „Nettowert (공급가액)", „Umsatzsteuerbetrag (세액)", „Bestellnummer" – und derselbe Spaltensatz verarbeitet jeden 거래명세서 von jedem Lieferanten. Fünfzig Dateien, fünfzehn Lieferanten, eine Ausgabe.
Bei 5–10 Sekunden pro Seite gegenüber 3 Minuten manueller Erfassung pro Beleg reduziert der Batch-Workflow 5,5 Stunden Tipparbeit auf rund 15 Minuten Verarbeitungszeit – ein Effizienzgewinn um das 18-Fache – doch der eigentliche Gewinn ist nicht die Zeitersparnis. Sondern dass die Ausgabe als eine einzige zusammengeführte Tabelle vorliegt, in der jede Zeile bis zum Ursprungsbeleg zurückverfolgt werden kann, bereit für den 3-Wege-Abgleich mit Bestellungen und Steuerrechnungen.
Drei-Wege-Abgleich im großen Stil: Bestellung → 거래명세서 → Steuerrechnung
Für koreanische Beschaffungsteams ist das Extrahieren von 거래명세서-Daten in eine Tabelle nicht das Endziel – sondern der Zwischenschritt. Das eigentliche Ergebnis ist der Drei-Wege-Abgleich: Bestellung (발주서) → Transaktionsbeleg (거래명세서) → Steuerrechnung (세금계산서).
Im koreanischen Mehrwertsteuersystem ist die Steuerrechnung (세금계산서) das gesetzlich geregelte Dokument – geregelt durch §32 Umsatzsteuergesetz, mit Pflichtfeldern wie Lieferanten- und Käuferregistriernummer, Nettowert, Umsatzsteuerbetrag und Ausstellungsdatum. Sie berechtigt den Käufer zum Vorsteuerabzug (매입세액 공제) und muss korrekt in den vierteljährlichen Umsatzsteuervoranmeldungen (fällig am 25. Januar, 25. April, 25. Juli, 25. Oktober) ausgewiesen werden. Der Transaktionsbeleg hat kein solches rechtliches Gewicht – er ist ein privates Prüfdokument (사적 증빙), nicht zum Steuerabzug berechtigt – aber er ist das Dokument, das tatsächlich mit der Ware eintrifft und die positionsgenauen Details enthält, die die Steuerrechnung oft auslässt.
Der Drei-Wege-Abgleich im großen Stil:
Bestellung → Lieferschein: Prüfen, ob die Lieferung der Bestellung entspricht
Vergleichen Sie die Artikel, Mengen und Einzelpreise auf jedem Lieferschein des Lieferanten mit der ursprünglichen Bestellung. Abweichungen – eine Mengendifferenz, ein nicht genehmigter Ersatzartikel, ein falscher Einzelpreis – müssen markiert und geklärt werden, bevor die Steuerrechnung überhaupt bearbeitet wird. Extrahieren Sie die Lieferscheindaten in eine Spaltenstruktur, die für jede Position die Bestellnummer enthält.
Lieferschein → Steuerrechnung: Prüfen, ob die berechneten Beträge den gelieferten entsprechen
Die Steuerrechnung kommt separat – oft Tage nach der Ware, manchmal als Teil einer monatlichen Sammelabrechnung. Ihr Nettobetrag (공급가액) und die Umsatzsteuer (세액) müssen mit den Summen auf dem Lieferschein übereinstimmen. Hier zeigt sich der Vorteil der zusammengeführten Tabelle: eine Spalte aus der Lieferscheinextraktion, eine Spalte aus der Steuerrechnungsextraktion – ein einfacher Seitenvergleich ersetzt das manuelle Abgleichen über verschiedene Dokumente hinweg.
Steuerrechnung → NTS-Meldung: Prüfen der Umsatzsteuer-Meldegenauigkeit
Die Steuerrechnungsdaten – nach Prüfung gegen den Lieferschein – fließen in die vierteljährliche Umsatzsteuervoranmeldung. Eine Abweichung zwischen den beim NTS gespeicherten Daten aus der elektronischen Meldung des Lieferanten und Ihrer Meldung löst eine Cross-Check-Markierung aus. Der 3-Wege-Abgleich ist Ihr Prüfpfad: Er belegt, dass Ihre Zahlung mit der Lieferung und der Meldung des Lieferanten übereinstimmt.
Die Kombination aus Lieferscheinextraktion und Steuerrechnungsextraktion macht dies zu einem vollständigen Beschaffungsabgleichssystem. Jeder Dokumententyp enthält andere Felder, dient einem anderen Zweck und kommt über einen anderen Kanal. Aber beide speisen dieselbe Tabelle – und beide müssen übereinstimmen.
Das Benennungsproblem: Warum Batch-Verarbeitung Quellenrückverfolgung braucht
Es gibt ein Problem, das bei der Einzeldokumentverarbeitung nicht existiert und bei Batch-Workflows kritisch wird: zu wissen, welche extrahierte Zeile aus welcher Datei stammt.
Ein typischer Monatsabschluss-Batch könnte diese Dateien enthalten:
거래명세서_20260430.pdf— von Donghae Steel, ERP-generiert거래명세서_20260430.pdf— von einem anderen Lieferanten, gleicher Dateiname, anderer OrdnerKakaoTalk_20260502_143021.jpg— Foto einer handschriftlichen 거래명세서, Lieferant allein aus Dateinamen nicht erkennbarscan001.pdf— gescanntes Papierformular, Lieferantenname im Bild eingebettet, nicht im Dateinamen2026-04-30_거래명세표_대한포장.pdf— sauberer, identifizierbarer Dateiname — die Ausnahme, nicht die Regel
Wenn fünfzig extrahierte Zeilen in Ihrer Ausgabetabelle landen, müssen Sie wissen, welche Zeile zu welchem Originaldokument des Lieferanten gehört. Ohne diese Rückverfolgbarkeit können Sie keine Mengenabweichung klären — Sie können nicht zum Quelldokument zurückgehen, um zu prüfen, ob die Extraktion korrekt war oder der Lieferant einen Fehler gemacht hat.
Der Batch-Extraktions-Workflow in ImageToTable.ai bewahrt diese Rückverfolgbarkeit, indem er den Quelldateinamen als Spalte in der Ausgabe einfügt. Jede extrahierte Zeile trägt den Originaldateinamen, sodass Sie jeden Datenpunkt sofort zu seinem Quelldokument zurückverfolgen können. Bei Dokumenten mit mehrdeutigen Dateinamen wie KakaoTalk_20260502_143021.jpg benennen Sie diese vor dem Hochladen um — selbst ein einfaches Präfix wie DonghaeSteel_20260430.pdf liefert die benötigte Rückverfolgbarkeit.
Dies ist eine dieser Batch-spezifischen Herausforderungen, die Einzeldokument-Tutorials nie erwähnen. Wenn Sie ein Dokument verarbeiten, wissen Sie, woher die Daten stammen, weil Sie es gerade angesehen haben. Wenn Sie fünfzig verarbeiten, muss das System sich erinnern, damit Sie es nicht müssen.
Die Namenskonvention, die Sie vor dem Hochladen festlegen, ist Ihr Prüfpfad. Ein konsistentes Muster — [LieferantenCode]_[Datum]_[Dokumenttyp].pdf — kostet zehn Sekunden pro Datei und spart Stunden forensischer Dateinamen-Untersuchung, wenn beim Abgleich eine Abweichung auftaucht.
Umgang mit Formatvielfalt: Von Handschrift bis ERP-Export
Das Problem der Formatvielfalt im koreanischen B2B-Einkauf hängt von Größe und Branche des Lieferanten ab. Ein großer Chemielieferant in Ulsan versendet Waren mit einem Douzone-iCUBE-PDF – professionell formatiert, jedes Feld in einem vorhersagbaren Raster. Ein kleiner Verpackungslieferant in Incheon schreibt eine 거래명세서 von Hand auf ein vorgedrucktes Kohlepapier-Formular, reißt die blaue Käuferkopie (공급받는자용) ab und übergibt sie dem Fahrer. Ein mittelständischer Lebensmittelhändler nutzt eine Excel-Vorlage, die am Bildschirm professionell wirkt, aber beim Drucken mit verbundenen Zellen die Feldgrenzen überschreitet.
Herkömmliche OCR – die Text an vorhersagbaren Positionen erwartet – scheitert an der zweiten und dritten Kategorie. Handgeschriebene koreanische Zeichen auf Kohlepapier-Formularen haben bereits einen geringen Kontrast, bevor die Handschrift des Fahrers hinzukommt. Excel-gedruckte Formulare mit verbundenen Zellen erzeugen Textblöcke, bei denen Feldbezeichnungen und Werte ineinander übergehen. Vorlagenbasierte Systeme erfordern eine separate Vorlage für jedes Format – und bei fünfzehn Lieferanten mit fünf verschiedenen Formattypen wird allein die Vorlagenpflege zur Daueraufgabe.
Spaltennamensextraktion bewältigt Formatvielfalt von Natur aus – weil sie nicht vom Layout abhängt. Ob „Menge (수량)“ in der dritten Spalte einer Tabelle in einem PDF, am Rand eines handschriftlichen Formulars gekritzelt oder in einer verbundenen Excel-Zelle eingebettet ist – die KI findet es, indem sie das Dokument wie ein Mensch liest: nach semantischer Bedeutung suchend, nicht nach Pixelkoordinaten. Dieselbe Spaltendefinition, die auf dem Douzone-PDF funktioniert, funktioniert auch auf der handschriftlichen Kohlepapier-Kopie und dem Excel-Ausdruck.
Es gibt eine praktische Grenze: Ein so unscharfes Foto, dass ein Mensch den Text nicht lesen kann, wird auch für die KI scheitern. Aber die Hürde für „lesbar“ liegt deutlich niedriger als das, was vorlagenbasierte OCR erfordert – denn unscharfer, aber lesbarer Text ist semantisch immer noch lesbar, selbst wenn seine Pixelkoordinaten für eine Vorlage zu ungenau sind.
Umgang mit Ausnahmen in einem Batch von fünfzig Dokumenten
In jedem Batch von fünfzig Dokumenten gibt es einige mit Problemen. Ein Lieferant hat das Feld für die Umsatzsteuer leer gelassen, weil es sich um ein Kleinunternehmen (간이과세자) handelt, das keine Umsatzsteuer separat ausweist. Ein anderer hat den Rechnungswert in die falsche Zelle eingegeben, sodass die Extraktion eine unerwartete Zahl liefert. Ein Handyfoto hat die letzten beiden Zeilen einer Tabelle mit zehn Positionen abgeschnitten.
Bei der Einzeldokumentverarbeitung fallen Ihnen diese Fehler sofort auf – weil Sie das Dokument und die Daten gleichzeitig betrachten. Bei der Batchverarbeitung sind das Dokument und die extrahierten Daten durch den Extraktionsschritt getrennt, und die Ausnahmen können sich in einer zusammengeführten Tabelle mit 400 Zeilen verstecken.
Der Arbeitsablauf für die Behandlung von Ausnahmen im Batch-Modus:
Leerstellen in Pflichtfeldern suchen
Filtern Sie nach der Extraktion die Ausgabetabelle nach leeren Zellen in kritischen Spalten – Lieferantenname, Rechnungswert, Menge. Eine leere Menge bedeutet meist, dass entweder die Positionszeile übersehen wurde oder das Dokument kein Mengenfeld enthielt. In beiden Fällen müssen Sie Bescheid wissen.
Summen mit Dokumenten-Gesamtwerten abgleichen
Der Rechnungswert (공급가액) auf der 거래명세서 ist die Summe aller Positionsbeträge. Wenn Ihre extrahierten Positionsbeträge nicht mit dem extrahierten Rechnungswert übereinstimmen, wurde entweder eine Position übersehen oder der Rechnungswert falsch erfasst. Diese Gegenprüfung deckt Extraktionslücken auf, ohne dass Sie jedes Dokument erneut lesen müssen.
Einzelne Problemdokumente erneut verarbeiten
Wenn ein bestimmtes Dokument unzuverlässige Ergebnisse liefert – erkennbar an leeren Pflichtfeldern oder einer Summenabweichung – laden Sie es einzeln für einen zweiten Extraktionsdurchlauf hoch. Der Batch-Workflow zwingt Sie nicht, den gesamten Batch erneut zu verarbeiten, um die Fehler eines Dokuments zu beheben.
Die entscheidende Erkenntnis: Die Batchverarbeitung beseitigt Ausnahmen nicht – sie verändert, wie Sie sie finden. Anstatt Fehler Dokument für Dokument während der Eingabe zu entdecken, führen Sie strukturierte Prüfungen der Gesamtausgabe durch und isolieren die Problemdokumente. Der Wechsel von reaktiver Fehlersuche (Fehler beim Erstellen finden) zu proaktiver Fehlererkennung (Gesamtausgabe auf Anomalien scannen) macht die Batchverarbeitung nicht nur schneller, sondern auch zuverlässiger.
Integration der Batch-Extraktion in Ihren bestehenden Beschaffungsworkflow
Die Batch-Extraktion von 거래명세서 ersetzt nicht Ihr ERP — und soll das auch nicht. Das ERP verwaltet Verkaufsaufzeichnungen, die Erstellung von Ausgangsrechnungen, die NTS-Übermittlung und die Finanzberichterstattung. Die Batch-Extraktion übernimmt den Datenerfassungsschritt, den das ERP Ihrer Tastatur überlässt.
Die Schnittstelle ist der Excel-Export. Extrahieren Sie alle eingehenden 거래명세서-Daten in eine Tabelle, gleichen Sie sie mit Bestellungen und Steuerrechnungen ab und importieren Sie die verifizierten Daten dann über die standardmäßige Excel-Importfunktion in Ihr ERP. Jedes große koreanische ERP unterstützt dies: Douzones Smart A und iCUBE bieten einen Batch-Import für Einkaufsdatensätze. ECOUNT bietet Excel-Massenimport für 거래명세서 und andere Belege. iQuest 얼마에요 unterstützt den Excel-Upload für 매입거래명세표-Daten. Die extrahierte Tabelle wird zur Importquelle – sauber, strukturiert und verifiziert, bevor sie Ihr ERP erreicht.
Für Teams, die auch Dokumente von Überseelieferanten verarbeiten, gilt derselbe Workflow. Ein Lieferschein eines chinesischen Komponentenlieferanten oder eine Packliste eines europäischen Ausrüstungsanbieters folgt derselben Extraktionslogik – Spalten definieren, hochladen, Tabelle erhalten. Dokumentensprache und -format ändern sich, das Prinzip der Spaltennamensextraktion jedoch nicht.
Dies unterscheidet sich grundlegend vom All-in-One-ERP-Versprechen. Sie ersetzen nicht Ihr Finanzsystem. Sie schließen die eine Lücke, die jedes koreanische ERP offen lässt: den Moment, in dem ein Lieferantendokument – in welchem Format auch immer es eintrifft – zu einer Zeile in Ihrer Tabelle werden muss, bevor es zu einem Datensatz in Ihrem ERP werden kann.
FAQ
Kann die Batch-Verarbeitung sowohl handschriftliche als auch gedruckte 거래명세서 im selben Upload verarbeiten?
Ja. Die KI liest jedes Dokument unabhängig und erkennt handschriftliche koreanische Zeichen (einschließlich unterschiedlicher Handschriftqualität) und gedruckten Text mit derselben semantischen Extraktionslogik. Dieselbe Spaltendefinition verarbeitet beide Formate. Die praktische Grenze ist die Lesbarkeit: Wenn ein Mensch die Handschrift nicht lesen kann, kann die KI es wahrscheinlich auch nicht.
Was passiert, wenn die 거래명세서 eines Lieferanten nicht standardisierte Feldnamen verwendet?
Die Spaltennamensextraktion erfolgt nicht durch Textabgleich, sondern durch semantisches Verständnis. Wenn ein Lieferant das Mengenfeld als "출하수량" (Versandmenge) statt "수량" (Menge) bezeichnet, wird es dennoch korrekt extrahiert, da die KI erkennt, dass beide Begriffe dasselbe Konzept meinen. Dies ist der grundlegende Unterschied zwischen Vorlagenabgleich (der fehlschlagen würde) und semantischer Extraktion (die sich anpasst).
Wie verarbeitet das System mehrseitige 거래명세서 mit artikelübergreifenden Tabellen?
Mehrseitige PDFs werden als ein einziges Dokument verarbeitet. Die KI liest alle Seiten und extrahiert sämtliche Positionen aus der Artikeltabelle, unabhängig von Seitenumbrüchen. Die Ausgabe fasst alle Zeilen aller Seiten im selben Dokumenteneintrag der Tabelle zusammen.
Kann ich nur bestimmte Positionen extrahieren – z. B. nur Artikel, die zu einer bestimmten Bestellnummer gehören?
Der Extraktionsschritt erfasst alle Daten aus allen Dokumenten. Die Filterung nach Bestellnummer, Lieferant, Datumsbereich oder anderen Kriterien erfolgt nach der Extraktion in der Ausgabetabelle – so haben Sie den vollständigen Datensatz zur Verfügung und können nach Bedarf filtern, anstatt die Extraktion von vornherein einzuschränken.
Ist die Extraktion von 거래명세서-Daten konform mit den koreanischen Aufbewahrungspflichten für Steuerunterlagen?
Die 거래명세서 selbst ist ein privates Belegdokument (사적 증빙) – es hat kein gesetzlich vorgeschriebenes Format und wird bei keiner Behörde eingereicht. Es gibt keine spezifischen Compliance-Anforderungen für die Extraktion oder Speicherung seiner Daten. Die Steuerrechnung (세금계산서), geregelt durch Artikel 32 des Umsatzsteuergesetzes, ist das Dokument mit rechtlichen Compliance-Pflichten – und wird separat behandelt. Zur Extraktion von Steuerrechnungen siehe die Anleitung zur Stapelverarbeitung von Steuerrechnungen. Als praktische Empfehlung: Das Rahmengesetz über nationale Steuern (국세기본법) Artikel 85-3 empfiehlt die Aufbewahrung von Transaktionsaufzeichnungen für fünf Jahre – und eine strukturierte Excel-Datei mit Nachverfolgbarkeit der Quelldatei erfüllt diesen Zweck besser als ein Stapel Papierformulare.
Funktioniert das auch für koreanische Steuerrechnungen (세금계산서) in Stapeln?
Ja — derselbe Stapelverarbeitungs-Workflow gilt. Für die Stapelverarbeitung von Steuerrechnungen definieren Sie Spalten wie Unternehmensregistrierungsnummer (사업자등록번호), Lieferwert (공급가액), Mehrwertsteuerbetrag (세액) und Genehmigungsnummer (승인번호) und verarbeiten 100–200 Steuerrechnungen in einem Upload. Das Extraktionsprinzip ist identisch; nur die Feldnamen ändern sich.
Jedes koreanische ERP kann aus einem Verkaufsdatensatz einen Transaktionsbeleg erstellen. Die Lücke — und die Chance — liegt auf der Empfängerseite. Die Stapelverarbeitung schließt sie mit einer Spaltendefinition, einem Upload und einer Tabelle. Probieren Sie es bei Ihrem nächsten Monatsabschluss aus. Sehen Sie, ob aus 5,5 Stunden Tipparbeit 15 Minuten Prüfung werden.