Daten aus deutschen Lieferscheinen in Excel extrahieren – über mehrere Lieferantenformate hinweg
Deutsche Lieferscheine variieren je nach Lieferant. KI-Extraktion liest alle Formate ohne Vorlagen, überträgt Artikelnummern, Mengen und Liefertermine in Excel.
Was ein deutscher Lieferschein enthält – und warum er keine Rechnung ist
Ein deutscher Lieferschein – je nach Lieferant als Lieferschein oder Warenbegleitschein bezeichnet – unterscheidet sich grundlegend von einer Rechnung. Ein Lieferschein listet auf, was versendet wurde. Eine Rechnung listet auf, was bezahlt werden muss. Wer einen Lieferschein wie eine Rechnung behandelt – also nur die Betragsfelder extrahiert –, erhält keinen Nachweis über die empfangenen Mengen, keine positionsgenauen Details und keine Vermerke des Warenempfängers, die sowohl die Buchhaltung als auch die Betriebsabläufe benötigen.
Kopfbereich. Jeder Lieferschein beginnt mit Absender- und Empfängerangaben: Absender (Lieferant) – Firmenname, Adresse und oft eine Lieferantennummer – sowie Empfänger mit Lieferadresse. Darunter verankern drei Identifikationsfelder das Dokument: Lieferscheinnummer (eine vom Lieferanten vergebene eindeutige Kennung), Lieferdatum (Versand- oder Wareneingangsdatum) und Bestellnummer (Ihre interne Bestellreferenz). Manche Lieferscheine enthalten zudem eine Kundennummer und eine Auftragsnummer, die sich von der Bestellnummer unterscheidet – die Kenntnis der Unterschiede verhindert spätere Abstimmungsfehler.
Positionstabelle. Der Kern des Dokuments. Jede Zeile enthält typischerweise: Positionsnummer, Artikelnummer (SKU), Artikelbezeichnung, Menge (gelieferte Stückzahl) und Einheit (Stück, kg, m, l, Karton, Palette). Manche Lieferanten ergänzen Chargennummer (für rückverfolgbare Waren), Gewicht (in kg) oder Packstücke (Anzahl der Gebinde pro Position). Bei Palettenlieferungen kann eine Spalte Packstücknummer erscheinen, die Positionen bestimmten Paletten zuordnet.
Fußbereich und Unterschriften. Der untere Teil des Lieferscheins zeigt üblicherweise Gesamtmenge, Anzahl Packstücke und ein Unterschriftsfeld, in dem der Empfänger die Annahme bestätigt. Handschriftliche Vermerke in diesem Bereich – „2 Kartons beschädigt“, „Nachlieferung folgt“, „1 Palette fehlt“ – enthalten betriebliche Informationen, die Ihre Tabelle erfassen muss.
Im Gegensatz zu Rechnungen haben Lieferscheine keine gesetzlich vorgeschriebenen Pflichtfelder. Das deutsche Recht schreibt einen Lieferschein überhaupt nicht vor – anders als Rechnungen, die nach §14 UStG geregelt sind. Der Lieferschein ist eine Branchenkonvention, keine rechtliche Verpflichtung. Daher variieren die Lieferantenformate so stark: Ohne staatlich vorgegebenes Feldlayout gestaltet jedes ERP-System und jeder Lieferant seinen eigenen. Ein SAP-Lieferschein eines großen Automobilzulieferers sieht völlig anders aus als ein Lexware-Lieferschein eines regionalen Baustoffhändlers. Wenn Ihr Extraktionsansatz standardisierte Formatierung voraussetzt, scheitert er bereits beim Wareneingang.
Warum die Variabilität der Lieferantenformate die meisten Extraktionsansätze scheitern lässt
Die vorlagenbasierte OCR – die gängigste Methode zur Dokumentenextraktion – wird auf einem Dokumentenlayout trainiert und versucht dann, dieses Layout auf jedes nachfolgende Dokument anzuwenden. Sie zeichnen ein Begrenzungsrechteck um "Lieferscheinnummer" an den Koordinaten (x=140, y=95) in einem SAP-generierten PDF, und das System sucht danach an genau diesen Pixelkoordinaten nach Text. Das funktioniert bei standardisierten Behördenformularen. Bei deutschen Lieferscheinen funktioniert es nicht, weil:
Ein SAP S/4HANA Lieferschein eines mittelständischen Herstellers platziert den Kopfblock oben links in einem dichten Raster, die Positionstabelle erstreckt sich über die gesamte Seitenbreite mit 8+ Spalten, und die Fußzeile sitzt unten rechts. Ein Lexware Faktura Lieferschein eines kleinen Handwerksbetriebs stapelt alles vertikal – Absender oben links, Empfänger oben rechts, Positionen in einer einfachen 4-Spalten-Tabelle (Pos., Artikel, Menge, Einheit), Summen unten. Ein sevDesk Lieferschein hat ein breiteres Layout mit gebrandetem Kopf, vertikal gestapeltem Adressblock und einer sauberen 5-Spalten-Positionstabelle. Ein Papier-Lieferschein eines noch nicht digitalisierten Lieferanten – vielleicht eines kleinen Spediteurs mit einem Durchschreibesatz – kann die Lieferscheinnummer handschriftlich oben rechts, Positionen in einer handgezeichneten Tabelle und eine Unterschrift quer unten haben. Vier Formate, null gemeinsame Koordinaten.
KI-basierte Extraktion löst dies anders. Statt Pixelkoordinaten abzugleichen, liest ein visuelles Sprachmodell das Dokument, indem es versteht, was jeder Textabschnitt im Kontext bedeutet. Sie definieren Spaltennamen – die gewünschten Datenfelder wie "Lieferscheinnummer", "Lieferdatum", "Artikel", "Menge" – und die KI lokalisiert den entsprechenden Wert in jedem Dokument, indem sie die Semantik des Feldes erkennt (eine Lieferscheinnummer oben im Dokument, ein Datum im deutschen Format neben einer Bezeichnung wie "Lieferdatum" oder "Datum"), nicht seine Position auf der Seite. Dies ist die benutzerdefinierte Spaltenextraktion: Sie geben die gewünschten Feldnamen ein, und die KI ordnet jeden dem korrekten Wert zu, unabhängig vom Layout.
Dieser Ansatz bewältigt auch die Namensvariabilität, an der Vorlagensysteme scheitern. Ein Lieferant bezeichnet das Lieferdatum als "Lieferdatum", ein anderer schreibt "Versanddatum", ein dritter verwendet "Datum". Ein Lieferant verwendet "Pos." als Spaltenkopf für die Positionsnummer, ein anderer schreibt "Nr.", ein dritter "Position". Wenn Ihre Extraktion versteht, dass sich alle drei auf dasselbe Konzept beziehen, erhalten Sie eine einheitliche Spalte in Ihrer Ausgabe. Keine lieferantenspezifische Zuordnung erforderlich.
Das GoBD- und HGB-Rahmenwerk: Warum präzise Extraktion über Effizienz hinausgeht
Die Extraktion von Lieferscheindaten dient nicht nur der Zeitersparnis. Das deutsche Handels- und Steuerrecht schafft strukturelle Gründe, warum Lieferscheindaten strukturiert, durchsuchbar und archiviert sein müssen.
Nach dem Handelsgesetzbuch (HGB), insbesondere §408, muss ein Frachtbrief Angaben zu Absender und Empfänger, Anzahl der Packstücke, Gesamtgewicht, Übergabe- oder Versanddatum sowie eine Lieferschein- oder Bestellnummer enthalten. Obwohl §408 HGB den Frachtvertrag und nicht direkt den Lieferschein regelt, definiert er den Informationsstandard, dem Lieferscheine in der deutschen Logistik üblicherweise folgen.
Operativ relevanter sind die GoBD (Grundsätze zur ordnungsmäßigen Führung und Aufbewahrung von Büchern, Aufzeichnungen und Unterlagen in elektronischer Form) — die deutschen Grundsätze für ordnungsgemäße elektronische Buchführung und Aufbewahrung, herausgegeben vom Bundesministerium der Finanzen (BMF). Nach GoBD gelten Lieferscheine als Geschäftsbriefe und müssen 6 Jahre lang in unveränderbarer, nachvollziehbarer Form aufbewahrt werden. Wenn Sie Lieferscheine als PDFs erhalten, müssen Sie diese als PDFs archivieren. Wenn Sie deren Daten extrahieren, müssen die extrahierten Daten auf das Originaldokument zurückführbar sein. Ein strukturiertes Excel-Archiv aller Lieferscheine — durchsuchbar nach Lieferscheinnummer, Lieferdatum oder Lieferant — erfüllt Prüfungsanforderungen weit besser als ein Ordner mit umbenannten PDFs.
GS1 Germany, die Normungsorganisation hinter Barcode- und Lieferkettenstandards in Deutschland, hat eine digitale Lieferschein (dLS)-Spezifikation veröffentlicht — ein PDF/A-3-Format mit eingebettetem maschinenlesbarem XML (analog zu ZUGFeRD für Rechnungen). Der dLS-Standard definiert ein strukturiertes Datenmodell mit über 30 Feldern, von Lieferscheinnummer und Bestellnummer bis zu Packstückdetails und Fahrerinformationen. Die Nutzung wächst bei großen Einzelhändlern und ihren FMCG-Lieferanten, aber die überwältigende Mehrheit der deutschen Lieferanten — insbesondere KMU — stellt weiterhin PDF- oder Papierlieferscheine aus. Die praktische Realität für die meisten Wareneingangsteams ist eine Mischung: strukturierte DESADV-EDI-Nachrichten von Großlieferanten, unstrukturierte PDFs von mittelständischen Lieferanten und Papierbelege von kleinen Handwerksbetrieben. Eine Extraktion, die über alle drei Formate hinweg funktioniert, ist die Brücke zwischen dem heutigen Format-Chaos und dem standardisierten digitalen Lieferschein von morgen.
Schritt für Schritt: Vom PDF-Lieferschein zur strukturierten Excel-Tabelle
Dieses Vorgehen setzt voraus, dass Sie einen Stapel deutscher Lieferscheine als PDF haben – aus SAP, Lexware, sevDesk, DATEV oder als gescanntes Papier – und daraus eine Excel-Datei mit einer Zeile pro Lieferscheinposition und einheitlichen Spalten über alle Lieferanten hinweg erstellen möchten.
Schritt 1: Definieren Sie Ihre Extraktionsspalten. Die von Ihnen eingegebenen Spaltennamen werden zu den Überschriften Ihrer Ausgabetabelle. Für eine umfassende Extraktion deutscher Lieferscheine beginnen Sie mit diesen:
| Spaltenname | Bezeichnung auf dem Lieferschein | Erfasster Inhalt |
|---|---|---|
| Lieferscheinnummer | Lieferscheinnummer / Lieferschein-Nr. | Eindeutige Kennung des Lieferscheins |
| Lieferdatum | Lieferdatum / Versanddatum / Datum | Datum der Lieferung oder des Versands |
| Bestellnummer | Bestellnummer / Ihre Bestell-Nr. / PO-Nr. | Ihre Bestellnummer |
| Absender | Absender / Lieferant / Versender | Name des Lieferanten/Absenders |
| Positionsnummer | Pos. / Position / Nr. | Positionsnummer in der Lieferung |
| Artikelnummer | Artikel-Nr. / Art.-Nr. / SKU | Artikel-/SKU-Code |
| Artikelbezeichnung | Artikel / Bezeichnung / Artikeltext | Artikelbeschreibung |
| Menge | Menge / gelieferte Menge / Stück | Gelieferte Menge |
| Einheit | Einheit / ME / Maßeinheit | Maßeinheit (Stk, kg, m, l, Ktn.) |
| Packstücke | Packstücke / Kolli / Pakete | Anzahl der Packstücke/Paletten |
Die Spaltennamen sind auf Deutsch, da sie so auf dem Dokument erscheinen. Die KI liest „Lieferscheinnummer“ auf dem PDF und ordnet es Ihrer Spalte „Lieferscheinnummer“ zu – die Semantik stimmt überein. Wenn Sie in Ihrer Ausgabe englische Spaltenüberschriften bevorzugen (z. B. „Delivery Note Number“), können Sie diese stattdessen eingeben. Die KI findet das entsprechende deutsche Feld auf dem Dokument trotzdem, da sie versteht, dass „Delivery Note Number“ und „Lieferscheinnummer“ dasselbe Konzept bezeichnen.
Schritt 2: Fügen Sie berechnete Spalten für die sofortige Abweichungsprüfung hinzu. Sobald Sie die Rohfelder haben, können Sie Spalten definieren, die während der Extraktion Ergebnisse berechnen – Sie müssen später keine Formeln in Excel erstellen. Zum Beispiel:
- Differenz (Bestellt − Geliefert) – zieht die gelieferte Menge von der in Ihrer Bestellnummer hinterlegten Bestellmenge ab. Nützlich, wenn Ihr Lieferschein eine Spalte „bestellte Menge“ enthält.
- Lieferstatus – eine abgeleitete Spalte mit Optionen (Vollständig, Teillieferung, Überlieferung), die jede Lieferung anhand der bestellten vs. gelieferten Mengen klassifiziert.
- MHD-Status – kennzeichnet bei Lebensmittel-/Pharmalieferungen Artikel, deren Mindesthaltbarkeitsdatum erreicht oder überschritten ist, sofern der Lieferschein dieses enthält.
Das ist es, was berechnete Spalten leisten: Statt Rohzahlen zu extrahieren und dann Excel-Formeln anzuwenden, definieren Sie die Logik einmal als Spaltendefinition, und die KI führt den Vergleich während der Extraktion durch. Sie erhalten eine fertige Tabelle mit bereits gekennzeichneten Abweichungen.
Schritt 3: Alle Lieferscheine auf einmal hochladen. Ziehen Sie Ihre PDFs in den Upload-Bereich – SAP-Lieferscheine von Großlieferanten, Lexware-Lieferscheine von Handwerksbetrieben, sevDesk-Lieferscheine von Online-Händlern, gescannte Papierkopien von Lieferanten ohne Digitalisierung. Die KI liest jedes Dokument einzeln und befüllt unabhängig vom Ursprungsprogramm stets dieselben Spalten.
Dateien werden sicher verarbeitet und nicht gespeichert.
Schritt 4: Nach Excel exportieren. Das Ergebnis ist eine strukturierte Tabelle – eine Zeile pro Position über alle Lieferscheine hinweg, wobei die Lieferscheinnummer in jeder Zeile wiederholt wird, damit jede Position ihrem Quelldokument zugeordnet werden kann. Alle Beträge und Mengen in einheitlichem Format, alle Daten auf einen Standard normalisiert – bereit für den WMS-Import, den Dreiecksabgleich mit Bestellungen und Rechnungen oder die GoBD-konforme Archivierung.
Eine Lieferschein-Tabelle, in der jede Zeile die Lieferscheinnummer und die Bestellreferenz enthält, ermöglicht das Filtern nach Lieferant, Datum oder Auftrag – und jede Zelle ist bis zu ihrer exakten Position im Original-PDF zurückverfolgbar.
Umgang mit handschriftlichen Anmerkungen, mehrseitigen Lieferscheinen und Teillieferungen
In der deutschen Logistik treten immer wieder Sonderfälle auf, die einen einfachen Ansatz des „Extrahiere die gedruckten Felder“ sprengen. Jeder Fall erfordert eine eigene Strategie.
Handschriftliche Anmerkungen und Unterschriften. Lieferscheine kommen häufig mit handschriftlichen Ergänzungen: Ein Lagerarbeiter kreist eine beschädigte Menge ein und schreibt „beschädigt“, ein Fahrer notiert „2 Kartons fehlen“ am Rand, ein Warenempfänger unterschreibt und datiert unten. Diese Anmerkungen haben betriebliche Bedeutung. Die KI liest Handschrift – ein gut beleuchtetes Foto des beschrifteten Lieferscheins funktioniert im Wesentlichen so gut wie das Original –, aber die Genauigkeit bei Handschrift ist von Natur aus geringer als bei gedrucktem Text. Bei den Kerndruckfeldern (Lieferscheinnummer, Artikel, Menge) entspricht die Genauigkeit bei einem klaren PDF oder Foto dem Standard für gedruckte Dokumente. Bei hingekritzelten Randnotizen ist mit geringeren, aber noch brauchbaren Ergebnissen zu rechnen. Wenn Ihr Workflow auf handschriftliche Anmerkungen angewiesen ist, sollten Sie eine eigene Spalte für „Anmerkungen“ hinzufügen und diese Zeilen manuell prüfen.
Mehrseitige Lieferscheine. Eine Lieferung mit 40 Positionen passt nicht auf eine A4-Seite. Der Lieferschein erstreckt sich über 2, 3 oder mehr Seiten, wobei der Kopf nur auf Seite 1 steht und die Positionstabelle über die Seiten fortgesetzt wird. Die KI liest das gesamte Dokument als logische Einheit – die Lieferscheinnummer von Seite 1 wird den Positionen auf Seite 2 und 3 zugeordnet. Die Ausgabe wiederholt die Kopffelder korrekt in jeder Positionszeile, auch wenn diese Kopffelder physisch nur einmal vorkommen.
Teillieferungen. Ein Lieferant kann einen Teil einer Bestellung jetzt und den Rest später versenden und stellt zwei Lieferscheine für eine Bestellnummer aus. Der erste Lieferschein kann den Vermerk „1. Teillieferung“ oder „Rest folgt“ tragen. Diese Vermerke liefern, wenn sie in Ihre Tabelle extrahiert werden, den notwendigen Kontext, um Doppelzählungen zu vermeiden oder eine Bestellung nicht fälschlich als vollständig zu markieren, bevor alle Teillieferungen eingetroffen sind.
Wenn Ihre Lieferscheine von internationalen Lieferanten stammen, die in Deutschland tätig sind, aber Englisch, Französisch oder andere Sprachen für Feldbezeichnungen verwenden, verarbeitet die KI auch mehrsprachige Dokumente – „delivery note number“, „numéro de bon de livraison“ und „Lieferscheinnummer“ werden alle demselben Feld zugeordnet, wenn Sie die Spalte in Ihrer bevorzugten Sprache definieren. Weitere Informationen zu den wiederkehrenden Dokumenttypen in deutschen Lieferketten finden Sie in unserem Leitfaden Warum inkonsistente Packlistenformate den Wareneingang im Lager stören.
FAQ: Datenextraktion aus deutschen Lieferscheinen
Funktioniert die KI-Extraktion auch mit handschriftlichen Lieferscheinen oder abfotografierten Papierkopien?
Ja, bei guter Eingabequalität. Die KI liest Text aus Bildern, daher funktioniert ein gut beleuchtetes Foto eines gedruckten Lieferscheins praktisch genauso gut wie das Original-PDF. Handschriftliche Ergänzungen – eine Randnotiz des Fahrers, die Unterschrift des Warenempfängers, eine manuell korrigierte Menge – können extrahiert werden, aber die Genauigkeit bei Handschrift ist grundsätzlich geringer als bei gedrucktem Text. Bei den Kernfeldern (Lieferscheinnummer, Artikel, Menge) ist die gleiche Genauigkeit wie bei PDF zu erwarten. Bei dichten handschriftlichen Anmerkungen sind die Ergebnisse geringer, aber nutzbar. Überprüfen Sie handschriftliche Felder stets stichprobenartig am Original.
Kann das Tool Lieferscheine von SAP, Lexware, sevDesk und Papier – alle im selben Batch – verarbeiten?
Ja. Da die Extraktion semantisch und nicht vorlagenbasiert erfolgt, findet derselbe Satz an Spaltennamen (Lieferscheinnummer, Lieferdatum, Artikel, Menge) die korrekten Werte, unabhängig davon, welche Software das Dokument erstellt hat. Sie laden alle Lieferscheine in einem Batch hoch – 5 von SAP-Lieferanten, 8 von Lexware-Nutzern, 3 von sevDesk, 2 gescannte Papierdokumente – und die Ausgabe ist eine einheitliche Excel-Datei mit konsistenten Spalten über alle Quellen hinweg. Keine lieferantenspezifische Konfiguration, kein Vorlagenwechsel.
Welche Felder sollte ich immer in meine Extraktionsspalten aufnehmen?
Mindestens: Lieferscheinnummer (verknüpft jede Zeile mit dem Originaldokument), Lieferdatum (Wareneingangsdatum für die Zeitverfolgung), Bestellnummer (Ihre PO-Referenz für den Dreifachabgleich), Artikelnummer und Artikelbezeichnung (was geliefert wurde) und Menge (wie viel). Wenn Sie rückverfolgbare Waren verwalten, fügen Sie Chargennummer und MHD hinzu. Wenn Sie gegen Bestellungen abgleichen, fügen Sie die bestellte Menge hinzu, sofern der Lieferschein diese enthält, und nutzen Sie dann eine berechnete Spalte, um Abweichungen automatisch zu kennzeichnen.
Welche Genauigkeit ist bei der Extraktion deutscher Lieferscheine zu erwarten?
Bei gedruckten, gut lesbaren PDFs erreichen Kernfelder (Lieferscheinnummer, Lieferdatum, Bestellnummer) und Zahlenfelder (Menge, Einheit) typischerweise über 95 % Genauigkeit. Artikelbeschreibungen, insbesondere lange deutsche Komposita in kleiner Schrift, können etwas ungenauer sein. Handschriftliche Anmerkungen haben die geringste Genauigkeit. Die ehrliche Empfehlung: Überprüfen Sie den ersten Extraktionsdurchlauf stichprobenartig anhand der Originaldokumente, insbesondere bei Lieferscheinnummer und Menge – Ihren beiden Abstimmungsankern – und korrigieren Sie etwaige Fehler in der Ausgabe. Eine korrigierte Zelle hat keine Auswirkungen auf andere Felder desselben Dokuments oder innerhalb des Stapels.
Wie verarbeitet die Extraktion Teillieferungen derselben Bestellung?
Jede Teillieferung hat eine eigene Lieferscheinnummer. Verweisen beide Lieferscheine auf dieselbe Bestellnummer, gruppiert die Spalte Bestellnummer diese in Ihrer Tabelle. Sie können nach Bestellnummer filtern, um alle Teillieferungen dieser Bestellung anzuzeigen, und eine berechnete Spalte kann die gelieferte Menge zeilenübergreifend summieren, um zu prüfen, ob die Gesamtlieferung der Bestellmenge entspricht. Die KI führt Teillieferungen nicht zusammen – Sie sehen genau, was jeder Lieferschein enthält –, aber die strukturierte Tabelle macht die Aggregation trivial.
Ist die Extraktion von Lieferscheindaten in Excel mit den GoBD-Archivierungsanforderungen konform?
Extrahierte Daten ersetzen nicht die Archivierung des Original-PDFs. Nach GoBD müssen Sie den Original-Lieferschein in dem Format aufbewahren, in dem Sie ihn erhalten haben (PDF, Scan, Papier). Die extrahierte Excel-Datei ist eine ergänzende Arbeitskopie. Ein strukturiertes Excel-Archiv – durchsuchbar nach Lieferscheinnummer, Lieferdatum und Lieferant – verbessert jedoch erheblich Ihre Fähigkeit, Originaldokumente während einer Betriebsprüfung zu finden und abzurufen. Der Extraktionsprozess ersetzt nicht die Archivierung; er macht archivierte Dokumente nutzbar.