독일 납품서(Lieferschein) 데이터를 여러 공급업체 형식에서 Excel로 추출하는 방법
독일 납품서(Lieferschein)는 공급업체마다 형식이 다릅니다. AI 추출은 템플릿 설정 없이 모든 형식을 읽어 품목 코드, 수량, 납품일자를 Excel로 가져옵니다.
독일 납품서에 포함된 내용 — 인보이스와의 차이점
독일 납품서는 공급업체에 따라 Lieferschein(납품서) 또는 Warenbegleitschein(상품 동봉 문서)으로 표시되며, 인보이스(Rechnung)와 근본적으로 다릅니다. Lieferschein은 배송된 품목을 나열하고, 인보이스는 지불해야 할 금액을 나열합니다. Lieferschein을 인보이스처럼 취급하여 금액 필드만 추출하면, 재무 부서와 운영 부서 모두에게 필요한 수량, 품목별 세부 정보, 수령 측 메모 기록이 누락됩니다.
헤더 섹션. 모든 Lieferschein은 발신자와 수신자 정보로 시작합니다: Absender(발신자/공급업체) — 회사명, 주소, 종종 Lieferantennummer(공급업체 번호) — 그리고 Empfänger(수신자)와 Lieferadresse(배송 주소). 그 아래 세 가지 식별 필드가 문서를 구성합니다: Lieferscheinnummer(납품서 번호, 공급업체가 할당한 고유 식별자), Lieferdatum(배송일 — 상품이 발송되거나 도착한 날짜), Bestellnummer(구매 주문 번호, 내부 PO 참조). 일부 Lieferschein에는 Kundennummer(고객 번호)와 Bestellnummer와 다른 Auftragsnummer(주문 번호)도 포함될 수 있습니다. 이를 정확히 구분해야 후속 조정 오류를 방지할 수 있습니다.
품목 테이블. 문서의 핵심입니다. 각 행에는 일반적으로 다음이 포함됩니다: Positionsnummer(라인 항목 번호), Artikelnummer(품목/SKU 번호), Artikelbezeichnung(품목 설명), Menge(배송 수량), Einheit(단위 — Stück/개, kg, m, l, Karton/상자, Palette/팔레트). 일부 공급업체는 추적 가능한 상품을 위해 Chargennummer(배치/로트 번호), Gewicht(kg 단위 중량), 또는 Packstücke(라인 항목당 패키지 수)를 추가합니다. 다중 팔레트 배송의 경우, 특정 팔레트에 품목을 매핑하는 Packstücknummer(패키지 번호) 열이 표시될 수 있습니다.
바닥글 및 서명. Lieferschein 하단에는 일반적으로 Gesamtmenge(총 수량), Anzahl Packstücke(총 패키지/팔레트 수), 그리고 수령인이 수령을 확인하는 Unterschriftsfeld(서명란)가 표시됩니다. 이 영역의 수기 메모 — "2 Kartons beschädigt/상자 2개 손상," "Nachlieferung folgt/후속 배송 예정," "1 Palette fehlt/팔레트 1개 누락" — 는 스프레드시트에 기록해야 하는 운영 정보를 담고 있습니다.
인보이스와 달리 Lieferschein에는 법정 필수 항목이 없습니다. 독일 법률은 Lieferschein을 전혀 요구하지 않습니다. 반면 인보이스는 §14 UStG(부가가치세법)의 적용을 받습니다. Lieferschein은 법적 의무가 아닌 업계 관행입니다. 이것이 공급업체 형식이 매우 다양한 이유입니다. 정부가 정한 필드 레이아웃이 없기 때문에 모든 ERP 시스템과 모든 공급업체가 자체적으로 설계합니다. 대형 자동차 공급업체의 SAP 생성 Lieferschein은 지역 건자재 판매상의 Lexware 생성 Lieferschein과 전혀 다릅니다. 추출 방식이 표준화된 형식을 가정한다면, 현장에서 바로 실패합니다.
공급업체 서식 차이로 인해 대부분의 추출 방식이 실패하는 이유
템플릿 기반 OCR(가장 일반적인 문서 추출 방식)은 하나의 문서 레이아웃을 학습한 후, 이후 모든 문서에서 해당 레이아웃을 일치시키려고 합니다. SAP에서 생성된 PDF의 (x=140, y=95) 좌표에 있는 "Lieferscheinnummer" 주위에 경계 상자를 그리면, 시스템은 이후 해당 정확한 픽셀 위치에서 텍스트를 찾습니다. 이는 표준화된 정부 양식에서는 작동하지만, 독일 Lieferschein(배송 명세서)에서는 다음과 같은 이유로 작동하지 않습니다.
중견 제조업체의 SAP S/4HANA Lieferschein은 헤더 블록이 왼쪽 상단에 조밀한 그리드로 배치되고, 품목 테이블은 8개 이상의 열로 전체 페이지 너비를 차지하며, 바닥글은 오른쪽 하단에 위치합니다. 소규모 수공업체의 Lexware Faktura Lieferschein은 모든 것을 세로로 쌓습니다(발신자 왼쪽 상단, 수신자 오른쪽 상단, 간단한 4열 테이블(Pos., Artikel, Menge, Einheit)의 품목, 하단의 합계). sevDesk Lieferschein은 브랜드 헤더, 세로로 쌓인 주소 블록, 깔끔한 5열 품목 테이블로 더 넓은 레이아웃을 사용합니다. 아직 디지털화되지 않은 공급업체의 종이 Lieferschein(예: Durchschreibesatz(카본 카피 세트)를 사용하는 소규모 운송업체)은 Lieferscheinnummer가 오른쪽 상단 모서리에 손으로 쓰여 있고, 품목은 손으로 그린 테이블에 있으며, 서명은 하단에 휘갈겨져 있을 수 있습니다. 네 가지 형식, 공유 좌표는 전혀 없습니다.
AI 기반 추출은 이 문제를 다르게 해결합니다. 픽셀 좌표를 일치시키는 대신, 비전 언어 모델은 각 텍스트 조각이 문맥에서 의미하는 바를 이해하여 문서를 읽습니다. "Lieferscheinnummer", "Lieferdatum", "Artikel", "Menge"와 같이 원하는 데이터 필드인 열 이름을 정의하면, AI는 필드의 의미(문서 상단 근처의 배송 명세서 번호, "Lieferdatum" 또는 "Datum"이라는 레이블 근처의 독일 형식 날짜)를 인식하여 각 문서에서 해당 값을 찾습니다. 페이지에서의 위치가 아닙니다. 이것이 사용자 정의 열 추출입니다: 원하는 필드 이름을 입력하면, AI가 레이아웃에 관계없이 각각을 올바른 값에 일치시킵니다.
이 접근 방식은 템플릿 시스템을 어렵게 만드는 명명 변동성도 처리합니다. 한 공급업체는 배송 날짜를 "Lieferdatum"으로 표시하고, 다른 업체는 "Versanddatum"이라고 쓰며, 세 번째 업체는 "Datum"을 사용합니다. 한 공급업체는 라인 항목 번호의 열 헤더로 "Pos."를 사용하고, 다른 업체는 "Nr."라고 쓰며, 세 번째 업체는 "Position"이라고 씁니다. 추출 방식이 이 세 가지 모두가 동일한 개념을 참조한다는 것을 이해한다면, 출력에서 하나의 통합된 열을 얻을 수 있습니다. 공급업체별 매핑이 필요하지 않습니다.
GoBD 및 HGB 프레임워크: 효율성을 넘어 정확한 추출이 중요한 이유
Lieferschein 데이터 추출의 필요성은 단순히 시간 절약에 그치지 않습니다. 독일 상법 및 세법은 납품서 데이터를 구조화하고, 검색 가능하게 하며, 보관해야 하는 구조적 이유를 제시합니다.
독일 상법(HGB) 제408조에 따라 화물 명세서에는 발송인과 수취인 식별 정보, 패키지 수량, 총 중량, 인도 또는 발송일, 납품서 또는 주문 번호가 포함되어야 합니다. 제408조 HGB는 Lieferschein 자체보다는 운송 계약(Frachtvertrag)을 규율하지만, 독일 물류에서 Lieferschein이 일반적으로 따르는 정보 표준을 정의합니다.
운영상 더 중요한 것은 GoBD(전자적 형태의 장부, 기록 및 문서의 적절한 관리 및 보관 원칙)입니다. 이는 연방 재무부(BMF)가 발행한 독일의 전자 장부 기록 및 보관 원칙입니다. GoBD에 따라 납품서는 상업 서신(Geschäftsbriefe)에 해당하며, 변경 불가능하고 추적 가능한 형식으로 6년간 보관해야 합니다. Lieferschein을 PDF로 받은 경우 PDF로 보관해야 합니다. 데이터를 추출한 경우 추출된 데이터는 원본 문서로 추적 가능해야 합니다. 모든 Lieferschein의 구조화된 Excel 아카이브(Lieferscheinnummer, Lieferdatum 또는 공급업체로 검색 가능)는 이름이 변경된 PDF 폴더보다 감사 요구 사항을 훨씬 잘 충족합니다.
독일의 바코드 및 공급망 표준 기관인 GS1 Germany는 디지털 납품서(dLS) 사양(PDF/A-3 형식, 기계 판독 가능한 XML 포함, ZUGFeRD와 유사)을 발표했습니다. dLS 표준은 Lieferscheinnummer, Bestellnummer부터 Packstück 수준 세부 정보 및 Fahrer(운전자) 정보에 이르기까지 30개 이상의 필드로 구성된 구조화된 데이터 모델을 정의합니다. 대형 소매업체와 FMCG 공급업체 사이에서 채택이 증가하고 있지만, 대다수의 독일 공급업체(특히 중소기업)는 여전히 PDF 또는 종이 Lieferschein을 발행합니다. 대부분의 수령 팀에게 현실은 혼합되어 있습니다. 대형 공급업체의 구조화된 DESADV EDI 메시지, 중간 규모 공급업체의 비정형 PDF, 소규모 수공업체(Handwerksbetriebe)의 종이 전표입니다. 세 가지 모두에서 작동하는 추출이 오늘날의 형식 혼란과 내일의 표준화된 디지털 납품서 사이의 다리입니다.
단계별 가이드: PDF 납품서(Lieferschein)에서 구조화된 엑셀로
이 워크플로는 SAP, Lexware, sevDesk, DATEV 또는 스캔된 종이 문서에서 생성된 독일어 납품서 PDF 더미가 있고, 모든 공급업체에 걸쳐 일관된 열 구조로 납품서 라인 항목당 한 행씩 구성된 단일 엑셀 파일을 원한다고 가정합니다.
1단계: 추출할 열을 정의하세요. 입력한 열 이름이 출력 스프레드시트의 헤더가 됩니다. 포괄적인 독일어 납품서(Lieferschein) 추출을 위해 다음 항목으로 시작하세요:
| 열 이름 | 독일어 납품서 라벨 | 추출 내용 |
|---|---|---|
| Lieferscheinnummer | Lieferscheinnummer / Lieferschein-Nr. | 고유 납품서 식별자 |
| Lieferdatum | Lieferdatum / Versanddatum / Datum | 납품 또는 발송일 |
| Bestellnummer | Bestellnummer / Ihre Bestell-Nr. / PO-Nr. | 구매 주문 번호 |
| Absender | Absender / Lieferant / Versender | 공급업체/발송자 회사명 |
| Positionsnummer | Pos. / Position / Nr. | 납품 내 라인 항목 번호 |
| Artikelnummer | Artikel-Nr. / Art.-Nr. / SKU | 품목/SKU 코드 |
| Artikelbezeichnung | Artikel / Bezeichnung / Artikeltext | 품목 설명 |
| Menge | Menge / gelieferte Menge / Stück | 납품 수량 |
| Einheit | Einheit / ME / Maßeinheit | 측정 단위 (개, kg, m, l, 상자) |
| Packstücke | Packstücke / Kolli / Pakete | 포장/팔레트 수 |
열 이름은 문서에 표시된 대로 독일어로 되어 있습니다. AI는 PDF에서 "Lieferscheinnummer"를 읽고 사용자의 "Lieferscheinnummer" 열에 매핑합니다. 의미가 일치하기 때문입니다. 출력에서 영어 열 헤더(예: "Delivery Note Number")를 선호하는 경우 대신 입력할 수 있습니다. AI는 "Delivery Note Number"와 "Lieferscheinnummer"가 동일한 개념을 나타낸다는 것을 이해하므로 문서에서 해당 독일어 필드를 계속 찾을 수 있습니다.
2단계: 즉시 차이 확인을 위한 계산 열을 추가하세요. 원시 필드를 확보한 후 추출 중에 결과를 계산하는 열을 정의할 수 있습니다. 나중에 엑셀에서 수식을 만들 필요가 없습니다. 예를 들어:
- Differenz (주문 − 납품) — Bestellnummer 참조에 저장된 PO 수량에서 납품 수량을 뺍니다. 납품서에 "bestellte Menge"(주문 수량) 열이 포함된 경우 유용합니다.
- Lieferstatus — 옵션(완전 납품, 부분 납품, 초과 납품)을 사용하는 추론 열로, 주문 수량 대비 납품 수량을 기준으로 각 납품을 분류합니다.
- MHD-Status — 식품/의약품 납품의 경우, 납품서에 포함된 경우 유통기한(Mindesthaltbarkeitsdatum)이 임박했거나 지난 품목에 플래그를 지정합니다.
이것이 바로 계산 열(Computed Columns)의 기능입니다. 원시 숫자를 추출한 다음 엑셀 수식을 실행하는 대신, 열 정의로 로직을 한 번 정의하면 AI가 추출 중에 비교를 수행합니다. 차이점이 이미 표시된 완성된 스프레드시트를 얻을 수 있습니다.
3단계: 모든 Lieferscheine를 한 번에 업로드하세요. 업로드 영역에 PDF를 드래그하세요 — 대형 공급업체의 SAP Lieferscheine, 수공업체의 Lexware Lieferscheine, 온라인 소매업체의 sevDesk Lieferscheine, 디지털화되지 않은 공급업체의 스캔한 종이 사본까지. AI가 각 문서를 개별적으로 읽고, 어떤 소프트웨어가 PDF를 생성했든 동일한 열 집합을 채웁니다.
파일은 안전하게 처리되며 저장되지 않습니다.
4단계: Excel로 내보내기. 출력은 하나의 구조화된 스프레드시트입니다 — 모든 Lieferscheine의 각 라인 항목당 한 행씩, 각 라인 항목을 원본 문서에 추적 가능하도록 Lieferscheinnummer가 각 행에 반복됩니다. 모든 금액과 수량은 일관된 형식으로, 모든 날짜는 단일 표준으로 정규화되어 WMS 가져오기, 구매 주문서 및 송장과의 3방향 매칭, 또는 GoBD 준수 보관에 바로 사용할 수 있습니다.
각 행에 납품서 번호와 구매 주문 참조가 포함된 Lieferschein 스프레드시트를 사용하면 공급업체, 날짜 또는 주문별로 필터링할 수 있으며, 모든 셀은 원본 PDF의 정확한 위치까지 추적 가능합니다.
수기 메모, 다중 페이지 Lieferschein, 부분 납품 처리
독일 물류에서는 단순히 "인쇄된 필드를 추출"하는 방식으로는 해결되지 않는 몇 가지 반복적인 예외 상황이 발생합니다. 각 상황에 맞는 처리 전략이 필요합니다.
수기 메모와 서명. Lieferschein에는 자주 수기로 추가된 내용이 있습니다. 창고 직원이 손상된 수량에 동그라미를 치고 "beschädigt"(손상됨)라고 쓰거나, 운전기사가 여백에 "2 Kartons fehlen"(상자 2개 누락)이라고 적거나, 접수 담당자가 하단에 서명과 날짜를 기입합니다. 이러한 메모는 운영상 중요한 의미를 갖습니다. AI는 필기체를 읽습니다. 메모가 적힌 Lieferschein을 잘 촬영한 사진은 원본과 거의 동일하게 작동하지만, 필기체 인식 정확도는 인쇄된 텍스트보다 본질적으로 낮습니다. 핵심 인쇄 필드(Lieferscheinnummer, Artikel, Menge)의 경우, 선명한 PDF나 사진에서 인쇄 문서 수준의 정확도를 제공합니다. 휘갈겨 쓴 여백 메모의 경우 정확도는 낮아지지만 여전히 사용 가능한 결과를 기대할 수 있습니다. 수기 메모가 워크플로우에 중요한 경우, "Anmerkungen"(비고) 전용 열을 추가하고 해당 행을 수동으로 검토하는 것을 고려하세요.
다중 페이지 Lieferschein. 40개의 품목이 있는 납품은 한 장의 A4 용지에 들어가지 않습니다. Lieferschein은 2페이지, 3페이지 또는 그 이상으로 이어지며, 헤더는 1페이지에만 있고 품목 표는 여러 페이지에 걸쳐 계속됩니다. AI는 전체 문서를 하나의 논리적 단위로 읽습니다. 1페이지의 Lieferscheinnummer는 2페이지와 3페이지의 품목과 연결됩니다. 출력은 헤더 필드가 물리적으로 한 번만 나타나더라도 모든 품목 행에 헤더 필드를 올바르게 반복합니다.
부분 납품(Teillieferungen). 공급업체가 주문의 일부를 먼저 배송하고 나머지는 나중에 배송하면서 하나의 Bestellnummer에 대해 두 개의 Lieferschein을 발행할 수 있습니다. 첫 번째 Lieferschein에는 "1. Teillieferung"(첫 번째 부분 납품) 또는 "Rest folgt"(나머지 추후 배송)이라는 메모가 있을 수 있습니다. 이러한 메모를 스프레드시트에 추출하면, 모든 부분 납품이 도착하기 전에 주문을 이중으로 계산하거나 완료로 잘못 표시하는 것을 방지하는 데 필요한 맥락을 제공합니다.
독일에서 운영되지만 영문, 프랑스어 또는 기타 언어로 필드 레이블을 사용하는 국제 공급업체의 Lieferschein을 처리하는 경우, AI는 다국어 문서도 처리할 수 있습니다. "delivery note number", "numéro de bon de livraison", "Lieferscheinnummer"는 모두 사용자가 선호하는 언어로 열을 정의할 때 동일한 필드로 매핑됩니다. 독일 공급망에서 반복적으로 발생하는 문서 유형에 대한 자세한 내용은 포장 명세서 형식 불일치가 창고 입고를 방해하는 이유에 대한 가이드를 참조하세요.
FAQ: 독일 납품서 데이터 추출
AI 추출이 손으로 작성된 Lieferschein이나 사진으로 촬영된 종이 사본에서도 작동하나요?
네, 입력 품질이 적절하다면 가능합니다. AI는 이미지에서 텍스트를 읽으므로, 조명이 적절한 인쇄된 Lieferschein 사진은 원본 PDF와 거의 동일하게 작동합니다. 운전기사의 메모, 접수 담당자의 서명, 수기로 수정된 수량 등 손으로 추가된 내용도 추출할 수 있지만, 필기체의 정확도는 인쇄된 텍스트보다 본질적으로 낮습니다. 핵심 인쇄 필드(Lieferscheinnummer, Artikel, Menge)의 경우 PDF와 동일한 정확도를 기대할 수 있습니다. 필기체 주석이 많은 경우 정확도는 낮아지지만 사용 가능한 결과를 얻을 수 있습니다. 필기체 필드는 항상 원본과 대조하여 확인하세요.
이 도구가 SAP, Lexware, sevDesk 및 종이 문서의 Lieferschein을 모두 동일한 배치에서 처리할 수 있나요?
네, 가능합니다. 추출이 템플릿 기반이 아닌 의미 기반이기 때문에, 동일한 열 이름 세트(Lieferscheinnummer, Lieferdatum, Artikel, Menge)가 문서를 생성한 소프트웨어에 관계없이 올바른 값을 찾습니다. 모든 Lieferschein을 하나의 배치로 업로드하면(SAP 공급업체 5개, Lexware 사용자 8개, sevDesk 3개, 스캔한 종이 2개) 모든 소스에서 일관된 열을 가진 통합 Excel 파일이 출력됩니다. 공급업체별 설정이나 템플릿 전환이 필요하지 않습니다.
추출 열에 항상 포함해야 하는 필드는 무엇인가요?
최소한 다음 필드는 포함하세요: Lieferscheinnummer(각 행을 원본 문서에 연결), Lieferdatum(타임라인 추적을 위한 수령일), Bestellnummer(3방향 매칭을 위한 구매 주문 참조), Artikelnummer 및 Artikelbezeichnung(배송된 품목), Menge(수량). 추적 가능한 상품을 취급하는 경우 Chargennummer(로트 번호)와 MHD(유통기한)를 추가하세요. PO와 대조하는 경우 Lieferschein에 포함되어 있을 때 bestellte Menge(주문 수량)를 추가하고, 계산된 열을 사용하여 자동으로 불일치를 표시할 수 있습니다.
독일 납품서 추출 시 예상 정확도는?
인쇄되어 선명하게 읽을 수 있는 PDF의 경우, 핵심 식별 필드(납품서 번호, 납품일자, 주문 번호)와 숫자 필드(수량, 단위)는 일반적으로 95% 이상의 정확도를 보입니다. 품목 설명, 특히 작은 글꼴의 긴 독일어 복합어는 정확도가 다소 낮을 수 있습니다. 수기로 작성된 주석은 정확도가 가장 낮습니다. 솔직한 권장사항: 첫 번째 추출 실행 결과를 원본 문서와 대조하여, 특히 납품서 번호와 수량(두 가지 조정 기준)을 확인하고 출력물의 오류를 수정하십시오. 하나의 셀을 수정해도 동일 문서나 배치 내 다른 필드에는 영향을 미치지 않습니다.
동일 주문의 부분 납품(Teillieferungen)은 어떻게 처리되나요?
각 부분 납품에는 고유한 납품서 번호가 있습니다. 두 납품서가 동일한 주문 번호를 참조하는 경우, 주문 번호 열이 스프레드시트에서 이를 그룹화합니다. 주문 번호로 필터링하여 해당 주문의 모든 부분 납품을 확인할 수 있으며, 계산 열을 사용하여 행 전체의 납품 수량을 합산하여 총 납품량이 전체 주문 수량과 일치하는지 확인할 수 있습니다. AI는 부분 납품을 병합하지 않습니다. 각 납품서의 내용을 그대로 확인할 수 있으며, 구조화된 스프레드시트 덕분에 집계가 간편합니다.
납품서 데이터를 Excel로 추출하는 것이 GoBD 보관 요구사항을 준수하나요?
추출된 데이터는 원본 PDF 보관을 대체하지 않습니다. GoBD에 따라 원본 납품서를 수령한 형식(PDF, 스캔, 종이) 그대로 보관해야 합니다. 추출된 Excel은 보조 작업용 사본입니다. 그러나 납품서 번호, 납품일자, 공급업체로 검색 가능한 구조화된 Excel 아카이브는 세무 조사(Betriebsprüfung) 시 원본 문서를 찾고 검색하는 능력을 크게 향상시킵니다. 추출 프로세스는 보관을 대체하지 않으며, 보관된 문서를 실용적으로 만듭니다.