반송된 납품서에서 인쇄된 출하 데이터와 수기 수령 확인 정보 추출 방법
납품서는 인쇄된 출하 정보와 수기 수령 표시가 혼합된 문서입니다. AI 추출이 두 계층을 한 번에 처리하는 방법을 알아보세요.
서명된 납품서가 하나의 문서에 두 가지 정보를 담는 이유
공급업체 창고에서 출고되는 납품서에는 한 세트의 데이터(품목 코드, 출고 수량, 구매 주문 번호, 운송사, 출고일)가 포함됩니다. 이는 공급업체가 발송한 내역을 기록한 것입니다. 문서는 화물과 함께 이동하며, 수령 측 도크에 도착하면 두 번째 데이터 계층(수령인의 수기 메모)이 추가됩니다.
이러한 메모는 단순한 낙서가 아닙니다. 이는 수령 팀의 운영상 판단이며 법적 효력을 지닙니다. 통일상법전(UCC 제2조)에 따라, 서명되고 이의가 기재된 납품서는 선적물이 완전히 인수되지 않았음을 입증하는 문서화된 증거가 됩니다. 메모가 없으면 증거도 없습니다. 수령인이 골판지 상자 2개가 찌그러졌거나 50개 품목 중 15개가 누락되었다는 사실을 기재하지 않고 서명했다면, 공급업체는 상품이 완전하게 인수되었다고 주장할 수 있습니다.
문제는 절차적이 아니라 구조적입니다. 인쇄된 데이터는 본질적으로 기계가 읽을 수 있도록 설계되었습니다. 그러나 수기로 작성된 수령 확인(서명, 손상 코드, 수량 수정, 운전자 ID 메모)은 그렇지 않습니다. 이들은 종이 위에 존재하여 사람의 눈에는 보이지만 WMS나 ERP 시스템에는 보이지 않습니다. 수령 팀이 당일 업무를 마감할 때, 이러한 메모는 물리적 사본에 남습니다. 디지털 기록에는 공급업체의 버전만 있습니다. 진실은 종이 위에 있습니다.
이것이 바로 두 계층 문제입니다. 하나의 납품서, 두 개의 데이터 시스템, 그러나 오직 하나만 디지털화됩니다.
인쇄된 계층만 읽을 때 놓치는 것
공급업체가 발송한 것과 수령인이 수기로 기록한 것 사이의 차이는 이론적이지 않습니다. 다음은 팀이 인쇄된 필드만 추출할 때 사라지는 네 가지 유형의 수령 메모입니다:
수량 수정
품목 표 옆에 "SKU 8842 3개 부족"이라고 적혀 있습니다. 공급업체의 인쇄된 수량은 25개가 발송되었다고 표시합니다. 수령인은 22개를 세었습니다. 이 수기 메모가 시스템에 입력되지 않으면, 구매 주문서, 납품서, 공급업체 송장을 비교하는 3자 매칭 과정에서 송장이 25개에 대한 전액 지불로 처리됩니다. 지급 담당 팀은 지불을 보류할 근거가 없습니다.
손상 표기
페이지 상단에 "골판지 상자 2개 찌그러짐 — 왼쪽 모서리"라고 쓰여 있습니다. 이는 공급업체가 손상 클레임에 이의를 제기할 때 필요한 증거입니다. 이것이 디지털 형태로 존재하지 않으면, 클레임은 문서 증거가 없는 전화 통화에 불과합니다.
수령 시각 및 서명
수기로 작성된 날짜, 시간, 수령인 이름은 선적물이 언제, 누구에 의해 인수되었는지를 확인합니다. 배송이 계약된 시간 내에 도착했는지에 대한 분쟁에서 이것이 주요 기록입니다. 이것이 종이에만 남아 있으면 디지털 감사에서는 쓸모가 없습니다.
운송사 및 운전자 메모
"운전자: Mike, 트럭 42, 오후 2:15" — 도크와 보관 구역 사이에서 상품이 분실될 경우 추적에 중요합니다.
이 계층을 잃는 비용은 누적됩니다. 단 한 번의 손상 메모 누락으로 판매할 수 없는 상품에 대해 200달러를 지불해야 할 수도 있습니다. 중간 규모 창고의 일반적인 물량인 하루 50건의 납품서를 기준으로 하면, 기록되지 않은 수령 예외 사항으로 인한 월간 노출 위험은 다섯 자리 수에 달할 수 있습니다. 그리고 이는 우리가 알고 있는 사고만을 기준으로 한 것입니다.
AI 추출이 두 계층을 동시에 읽는 방법
기존 OCR은 납품서를 필드-위치 문제로 취급합니다. 좌표 X에서 구매 주문 번호를 찾고, 좌표 Y에서 선적일을 찾는 방식입니다. 이 접근 방식은 공급업체가 레이아웃을 변경하거나 누군가 인쇄된 텍스트 위에 필기하는 순간 무너집니다.
비전-언어 모델(VLM)은 이 문제를 다르게 접근합니다. 고정된 좌표에서 텍스트를 찾는 대신, 전체 문서를 하나의 시각적 장면으로 읽습니다. 수량 열에 인쇄된 "12"와 그 옆에 적힌 필기 "10 ✓"가 동일한 데이터 포인트에 대한 서로 다른 두 주장임을 이해하고, 두 값을 별도의 열로 추출할 수 있습니다.
이것이 사용자 정의 열 추출의 메커니즘입니다. "구매 주문 번호", "SKU", "선적 수량", "수령 수량", "손상 메모", "수령인" 등 원하는 열을 정의하면, AI가 위치가 아닌 의미를 이해하여 페이지 어디에서든 각 값을 찾아냅니다. 인쇄된 필드는 공급업체 템플릿에서, 필기 필드는 수령인의 주석에서 가져옵니다. 이들은 단일 스프레드시트의 같은 행에 배치됩니다.
핵심 변화: 더 이상 필기를 추출의 장애물로 보지 않습니다. 인쇄된 필드와 마찬가지로, 레이아웃 위치가 아닌 콘텐츠로 식별되는 추출 대상 데이터 필드로 취급합니다.
단계별 가이드: 인쇄 및 필기 필드를 한 번에 추출
서명된 납품서 더미를 선적된 품목과 수령된 품목이 모두 포함된 단일 스프레드시트로 변환하는 워크플로우입니다.
파일은 안전하게 처리되며 저장되지 않습니다.
입고장에서 서명된 납품서 수거
각 운전기사 인계 후, 입고 담당자는 주석이 추가된 사본을 보관해야 합니다. 현장에서 종이 납품서를 스캔하세요(300 DPI로 휴대폰 촬영도 가능). 또는 공급업체가 발송 후 이메일로 보낸 PDF 버전을 수집하세요. 핵심은 서명된 종이 사본을 서랍에 넣어두지 말고 업로드하는 것입니다.
두 데이터 계층에 대한 추출 열 정의
여기서 2계층 접근 방식이 구체화됩니다. 인쇄 계층 열: PO 번호, SKU, 품목 설명, 발송 수량, 발송일, 운송사, 공급업체. 필기 계층 열: 수령 수량, 손상 메모(텍스트 필드), 수령자, 수령 일시, 서명 상태(있음/없음). 추출 인터페이스에 열 이름으로 입력하면, AI가 필기 메모가 인쇄 텍스트와 상대적 위치에 관계없이 문서의 해당 부분에서 각 항목을 채웁니다.
배치 업로드 후 AI가 두 계층 처리
오전 납품서 전체를 한 배치로 업로드하세요(공급업체 포털의 PDF, 현장 스캔 종이 사본, 입고팀 촬영 사진). AI는 각 문서를 열 정의에 따라 읽습니다. 인쇄 필드는 공급업체 레이아웃에서 추출되고, 필기 필드는 수령자의 주석에서 추출됩니다. 두 데이터는 동일한 구조화된 테이블에 행별로 정렬되어 저장됩니다.
모든 필드가 아닌 예외 사항만 검토
출력 스프레드시트는 발송 수량(인쇄)과 수령 수량(필기)을 나란히 보여줍니다. 수령자의 수량이 공급업체와 다른 불일치 항목은 즉시 확인 가능합니다. 불일치 항목을 필터링하여 해당 행을 공급업체 클레임 프로세스로 전달하세요. 일치하는 항목은 추가 조치가 필요 없습니다. 50건의 납품서를 수동으로 대조하던 작업이 이제 5분짜리 필터 및 검토 과정으로 바뀌었습니다.
출력 스프레드시트 구조
병합된 출력은 각 라인 항목당 한 행씩, 두 데이터 계층에 걸친 열을 제공합니다. 구조는 다음과 같습니다:
| PO 번호 | SKU | 발송 수량 | 수령 수량 | 손상 메모 | 수령자 | 수령일 | 상태 |
|---|---|---|---|---|---|---|---|
| PO-8842 | VT-334 | 50 | 47 | 3개 손상 — 상자 모서리 찌그러짐 | M. Chen | 2026-06-15 | 불일치 |
| PO-8842 | VT-338 | 100 | 100 | — | M. Chen | 2026-06-15 | 정상 |
| PO-8912 | SP-401 | 30 | 30 | — | J. Rivera | 2026-06-15 | 정상 |
상태 열은 추론 열을 통해 자동 생성할 수 있습니다: 상태 (옵션: 정상/불일치)와 같은 열을 정의하면 AI가 손상 메모와 수량 불일치를 읽어 올바른 값을 결정합니다 — 단일 패스로 추출 및 분류를 수행합니다. 일반적인 경우 별도의 검토 단계가 필요하지 않습니다.
다운스트림 통합을 위해 이 테이블은 3자 매칭 워크플로우에 직접 공급됩니다. 지급 계정 팀은 이제 송장 승인 전에 공급업체가 발송했다고 주장한 것이 아니라 실제로 수령한 내용의 디지털 기록을 보유하게 됩니다. PO는 공급업체의 주장과 일치합니다. 배송 메모 추출은 도착한 내용과 일치합니다. 이들이 일치하지 않으면 문서화된 증거와 함께 지급이 보류됩니다.
자주 묻는 질문
빽빽한 메모가 있는 납품서의 필기 인식 정확도는 어느 정도인가요?
정확도는 필체의 가독성에 따라 달라집니다. 동그라미 친 수량, "3개 부족", 기재된 이름 등 명확한 필기 수정 사항은 안정적으로 추출됩니다. 인쇄된 텍스트 위에 빽빽하게 써 내려간 글씨, 심하게 번진 카본지, 또는 물에 손상된 문서는 정확도가 떨어집니다. 실제로 이 워크플로우는 모든 필드를 검토하는 대신 플래그가 지정된 예외 사항만 확인하도록 설계되었습니다. AI가 인쇄층과 필기층 모두에서 추출 가능한 정보를 가져오고, 사람이 해석해야 하는 예외적인 경우는 검토 단계에서 걸러냅니다. 이는 모든 필드를 수동으로 처음부터 입력하는 것보다 훨씬 빠릅니다.
필기 메모의 언어가 인쇄된 텍스트와 다른 경우에도 작동하나요?
네, 그렇습니다. 비전-언어 모델은 인쇄된 언어와 관계없이 필기를 읽습니다. 납품서가 영어로 인쇄되었지만 접수 담당자가 스페인어나 프랑스어로 메모를 남긴 경우, AI는 두 언어를 모두 추출합니다. 사용자가 정의한 열 이름은 의미론적 기대치를 설정합니다. 예를 들어 "수취 수량" 열은 주변 텍스트의 언어와 관계없이 인쇄된 수량 필드 근처에서 숫자 메모를 찾도록 모델에 지시합니다.
출력 결과에서 다양한 유형의 필기 메모를 구분할 수 있나요?
수취 수량, 손상 메모, 수취인 등 각 메모 유형에 대해 별도의 열을 정의하면 AI가 각 정보를 해당 필드로 추출하도록 지시할 수 있습니다. AI는 위치뿐만 아니라 의미론적 맥락을 기반으로 숫자 수정, 텍스트 손상 메모, 서명을 구분합니다. 메모가 모호한 경우 해당 출력 필드는 비어 있거나 불확실함으로 표시되어 검토 중에 쉽게 식별할 수 있습니다.
수취인이 아무런 메모도 남기지 않고 납품서에 서명만 한 경우는 어떻게 되나요?
이 경우 필기층 열(손상 메모, 수취 수량 조정)은 비어 있고, 상태 열은 기본적으로 '정상'으로 설정됩니다. 예외 사항 없이 서명된 납품서는 승인으로 간주됩니다. 이는 수동 프로세스에서와 동일하게 해석됩니다. 차이점은 디지털 기록에 접수 과정에서 어떠한 예외 사항도 기록되지 않았음을 공식적으로 문서화한다는 점이며, 이는 "종이를 분실했습니다"라는 변명보다 훨씬 강력한 증거가 됩니다.
납품서 외에 어떤 문서를 처리할 수 있나요?
동일한 이중 계층 추출 방식은 인쇄된 데이터와 필기 메모가 공존하는 모든 문서에 적용됩니다. 예를 들어, 수기로 확인 표시가 된 포장 명세서, 운전자 메모가 있는 배송 증명서, 검사관 메모가 있는 입고 확인서, 인쇄된 양식 위에 현장 소견이 기록된 검사 보고서 등이 있습니다. 추출 메커니즘은 템플릿 기반이 아닌 콘텐츠 기반이므로 문서 간 형식이 변경되어도 워크플로우가 중단되지 않습니다.
공급업체가 선적한 것과 창고에서 실제로 수취한 것 사이의 차이는 항상 존재해 왔습니다. 이제 달라진 점은 납품서의 어느 한쪽 면만 디지털화해야 하는 선택을 하지 않아도 된다는 것입니다. 인쇄된 선적 데이터와 필기된 수취 확인 정보를 모두 하나의 구조화된 기록으로 추출하여, 증거가 종이에만 남아 있어 분쟁에서 지는 일이 없도록 합니다.