소규모 공급업체 및 틈새 벤더 조달을 위한 수기 발주서 데이터 추출 방법

소규모 및 틈새 공급업체는 여전히 수기로 발주서를 작성합니다. AI 추출이 불규칙한 레이아웃, 약식 부품 번호, 다양한 필체를 처리하는 방법을 알아보세요.

소규모 공급업체 및 틈새 벤더 조달을 위한 수기 발주서 데이터 추출 방법

소규모 전문 공급업체가 여전히 수기 발주서를 보내는 이유

일반적인 통념은 조달이 디지털화되고 있다는 것입니다. SAP Ariba, Coupa, 전자 발주서가 공급업체 포털을 통해 흐르고 있습니다. 그리고 물량 기준으로 회사 공급업체 기반의 상위 70%에게는 사실입니다. 하지만 물량이 곧 숫자와 같지는 않습니다. 모든 조달 운영의 긴 꼬리, 즉 지역 도금 공장, 특수 오링 제조업체, 직원 9명의 산업용 가스 공급업체는 다른 차원에서 운영됩니다. 그들은 ERP가 없습니다. 2014년의 정적 페이지 이상의 웹사이트가 없을 수도 있습니다. 그들의 구매 발주 시스템은 인쇄된 카본 카피 용지와 펜입니다.

이것은 기술 도입의 실패가 아닙니다. 공급업체 경제학의 문제입니다. 연간 4만 달러 규모의 거래를 하는 공급업체가 여러분의 삶을 편하게 하기 위해 EDI로 전환하지 않을 것입니다. 그리고 여러분은 그들을 대체할 여유가 없습니다. 왜냐하면 그들이 조립 라인이 의존하는 맞춤 가공 부싱의 유일한 공급원이기 때문입니다. 비즈니스 관계가 데이터 형식보다 더 중요합니다. 그래서 수기 발주서는 계속 도착합니다. 팩스로, 스캔되어, 또는 공급업체 카운터의 영업 담당자가 사진으로 찍어서 보냅니다.

이러한 형식 격차의 비용은 집중되어 있습니다. APQC 벤치마킹 데이터에 따르면 단일 수동 구매 발주서를 처리하는 중간 비용은 업종과 복잡성에 따라 35달러에서 95달러 사이입니다. 그리고 이는 데이터를 이미 읽을 수 있는 인쇄된 발주서의 경우입니다. 수기 발주서는 재판독 시간, 필기 모호성, 그리고 두 번째 확인 과정을 추가하여 발주서당 비용을 더 높입니다. 일주일에 15건의 수기 발주서를 처리하는 회사의 경우, 조달 시스템 비용 외에 데이터 입력 인건비만으로 연간 약 27,000달러에서 74,000달러에 달합니다.

수기 발주서는 공급업체 디지털화가 해결할 일시적인 문제가 아닙니다. 소규모 공급업체를 종이에 머물게 하는 경제학(낮은 마진, 낮은 거래량, 시스템 변경에 대한 높은 전환 비용)은 구조적입니다. 해결책은 종이가 사라지기를 기다리는 것이 아니라 종이와 함께 작동해야 합니다.

수기 주문서와 인쇄 주문서의 차이점

인쇄된 ERP 생성 주문서의 경우 데이터 추출은 이미 해결된 문제입니다. Docparser, Parseur, Rossum 같은 도구가 처리하며, 공급업체별로 레이아웃을 한 번 템플릿화하면 이후 해당 공급업체의 모든 주문서가 자동으로 추출됩니다. 하지만 수기 주문서는 템플릿 도구가 애초에 처리하도록 설계되지 않은 세 가지 방식으로 이 모델을 무너뜨립니다.

첫째, 수기 주문서는 레이아웃이 제각각입니다. 같은 공급업체라도 오늘 주문서를 작성하는 사람이 날짜를 오른쪽 상단에 넣을 수 있고, 내일은 회사 레터헤드 아래에 넣을 수도 있습니다. 오늘 한 페이지에 들어맞던 품목이 다음 주에는 두 페이지로 넘어가 모든 필드 위치가 바뀔 수 있습니다. 월요일 주문서 레이아웃으로 학습된 템플릿 도구는 좌표가 일치하지 않아 화요일 변형 버전에서는 실패합니다.

둘째, 필체는 작성자, 펜, 종이 품질에 따라 달라집니다. 흰색 카본지에 파란 볼펜으로 작성된 주문서가 하나의 입력이라면, 같은 공급업체가 가는 펜으로 노란색 복사지에 작성하면 획 굵기, 대비, 글자의 연결 상태가 모두 달라집니다. 템플릿 OCR 도구는 기계 인쇄체(균일한 문자 형태, 일정한 간격, 예측 가능한 글꼴 크기)에 맞춰 제작되었습니다. 수기는 이러한 모든 가정을 깨뜨립니다. 인쇄 주문서를 98% 정확도로 추출하는 동일한 도구가 수기 주문서에서는 60% 미만으로 떨어지는데, 이는 훈련받지 않은 문자를 매칭하려 하기 때문입니다.

셋째, 수기 주문서에는 위치 기반 추출을 혼란스럽게 하는 구조적 요소가 자주 포함됩니다. 손으로 그린 표선, 여백 메모, 동그라미 친 수량, 체크 표시, 취소선 등은 사람이 읽을 때 구조로 인식하는 데이터이지 내용이 아닙니다. 템플릿 도구는 이를 좌표 격자상의 추가 표시, 즉 필드 감지를 방해하는 노이즈로 봅니다. 위치로 필드를 찾는 추출 방식은 도구가 데이터 행을 예상하는 위치에 손으로 그린 표 테두리가 있으면 이를 품목으로 인식할 수 있습니다.

이 세 가지 과제를 해결 가능하게 만드는 것은 위치 기반에서 의미 기반 추출로의 전환입니다. 도구에 "좌표 (450, 720)에서 합계를 찾아라"라고 지시하는 대신, "페이지 어디에 있든 총 금액을 찾아라"라고 지시하는 것입니다. AI는 사람처럼 문서를 읽습니다. 픽셀 좌표를 매칭하는 대신 의미를 찾아 스캔합니다. "합계:" 또는 "$"가 앞에 있고 품목 금액 열의 오른쪽에 정렬된 숫자는 페이지의 어느 모서리에 있든 합계입니다. 이것이 AI 기반 추출과 템플릿 OCR의 근본적인 차이점입니다 — 그리고 위치가 본질적으로 예측 불가능한 수기 문서를 다룰 수 있게 만드는 이유입니다.

컬럼 기반 AI 추출로 수기 발주서 데이터를 추출하는 방법

이 워크플로는 기존 조달 시스템을 포기하지 않고도 수동 입력을 대체합니다. 단계는 다음과 같습니다: 필요한 항목 정의 → 발주서 캡처 → AI 추출 → 검토 → ERP 또는 스프레드시트로 내보내기. 자세한 내용은 아래와 같습니다.

1단계: 추출 컬럼을 한 번 정의하세요

발주서를 처리하기 전에 조달 스프레드시트나 ERP에 필요한 필드를 지정하세요. 이 단계는 한 번만 수행하면 됩니다. 입력한 컬럼 이름은 추출 지침이자 출력 스프레드시트의 헤더가 됩니다. 구매 발주서의 표준 세트는 다음과 같습니다:

발주 번호 — 문서상의 발주 참조 번호
공급업체명 — 공급업체 또는 회사명
발주일자 — 발주서가 발행된 날짜
품목 설명 — 주문된 각 품목 또는 서비스
수량 — 라인별 주문 단위
단가 — 단위당 가격
라인 합계 — 라인별 수량 × 단가
발주 총액 — 전체 주문 금액
납기일 — 예상 납품 또는 선적일
배송 주소 — 주문이 배송될 주소

이는 템플릿이 아닙니다. 샘플 발주서의 필드 주위에 상자를 그리는 것이 아닙니다. AI에게 어디서 찾을지가 아니라 무엇을 찾을지 알려주는 것입니다. 이 차이 덕분에 동일한 컬럼 정의가 전자 문서든 수기 문서든 모든 공급업체에서 공급업체별 유지보수 없이 작동합니다. 나중에 다섯 가지 다른 형식을 사용하는 다섯 공급업체의 발주서 배치를 처리할 때 AI는 각각에 동일한 컬럼 규칙을 독립적으로 적용하여 모든 페이지에서 "공급업체명"의 의미적 일치를 검색합니다.

ImageToTable.ai 사용자라면 이 컬럼 세트를 재사용 가능한 템플릿(프리셋이라고 함)으로 저장할 수 있습니다. 다음에 발주서 배치를 처리할 때 프리셋 목록에서 "구매 발주서"를 선택하면 컬럼 정의가 즉시 로드됩니다. 컬럼 이름을 다시 입력할 필요가 없습니다. 추출 로직이 위치 기반이 아닌 의미 기반이므로 동일한 프리셋이 인쇄된 발주서와 수기 발주서 모두에서 작동합니다.

JPG/PNG/PDF AI 추출

파일은 안전하게 처리되며 저장되지 않습니다.

2단계: 수기 구매 주문서 캡처

팩스, 이메일로 스캔된 PDF, 또는 공급업체 현장에서 구매자가 보낸 사진 등으로 수기 구매 주문서를 받습니다. 업로드하세요. 도구는 JPG, PNG, PDF를 지원합니다. 주문서가 카본지(얇은 노란색 또는 분홍색 용지)에 작성된 경우, 텍스트와 배경 간 대비가 흰색 원본보다 본질적으로 낮습니다. 다음 두 가지 캡처 방법을 사용하면 대비가 낮은 입력에서 추출 성능을 개선할 수 있습니다.

어두운 표면에서 촬영하세요. 카본지는 반투명합니다. 어두운 책상이나 검은 종이를 아래에 깔면 주문서 뒤의 내용이 비치는 것을 방지하고 AI가 인식하는 유효 대비를 높여줍니다. 한계가 있는 문서의 경우 10~15% 포인트 차이가 날 수 있습니다.

종이를 평평하게 하고 조명을 충분히 확보하세요. 구김이나 주름은 펜 자국처럼 보이는 그림자를 만듭니다. 형광등 빛이 광택 있는 카본지에 반사되면 소수점과 달러 기호 같은 미세한 세부 정보가 사라집니다. 이 두 문자는 추출 오류 시 금전적 영향이 가장 큽니다. 간접 자연광이나 확산된 인공 조명이 가장 좋습니다. 종이가 구겨진 경우, 촬영 전 10분간 책 아래에 눌러 펴주세요. AI는 필기체를 잘 읽지만, 사진 노이즈에 묻힌 필기체는 잘 읽지 못합니다.

3단계: 추출 및 검증

처리를 시작하세요. AI가 수기 문서를 읽고, 1단계에서 정의한 각 열을 찾아 출력 스프레드시트를 채웁니다. 일반적인 한 페이지 분량의 수기 발주서(8~12개 라인 항목)의 경우 처리 시간은 약 5~10초입니다. 결과는 구조화된 테이블로, 모든 발주서 필드가 올바른 열에, 각 라인 항목이 행으로 표시됩니다.

그런 다음 검토하세요. 모든 발주서의 모든 필드를 검토하는 것은 목적에 어긋납니다. 정확성이 가장 중요한 필드, 즉 단가, 수량, 라인 합계를 검토하세요. 이 필드들은 추출 오류가 연쇄적으로 발생하는 곳입니다. $47.50를 $475.00로 잘못 읽으면 주문 불일치가 발생하고, 이는 이후 송장 불일치로 이어집니다. 이 열들을 빠르게 스캔하면 발주서당 1~3개의 필드 중 재확인이 필요한 항목을 식별할 수 있습니다. 날짜, 공급업체명, 설명과 같이 스캔하는 열 이름은 거의 수정이 필요 없습니다. AI가 사람처럼 문맥 속에서 문자 모양을 이해하여 수기 텍스트를 읽기 때문입니다. "2026년 1월 15일"은 필체가 지저분해도 모호하지 않습니다. 1월은 J-A-N으로 시작하는 유일한 달이기 때문입니다. AI는 사람이 사용하는 것과 동일한 문맥 단서를 활용합니다.

4단계: 조달 시스템으로 내보내기

검증된 스프레드시트를 Excel 또는 CSV로 내보냅니다. 열 헤더는 1단계에서 정의한 대로 ERP의 발주서 가져오기 형식과 일치합니다. 이 파일을 SAP, Coupa, QuickBooks 등 구매-지급 파이프라인을 운영하는 시스템에 공급하세요. 이제 수기 발주서는 구조화된 기록이 되어, 대규모 공급업체로부터 들어오는 전자 발주서와 구별할 수 없게 됩니다. 누구도 단일 필드를 수동으로 입력할 필요 없이 말이죠.

주당 20~50건의 소규모 공급업체 발주서를 관리하는 조달 팀의 경우, 이 워크플로우는 수기 발주서당 처리 시간을 대략 수동 입력 3~5분에서 검토 30초 미만으로 단축합니다. 인건비는 발주서당 $35~95 범위에서 한 자릿수로 떨어집니다. 또한 Levvel Research가 추정한 수동 입력 시 필드당 1~2%의 오류율은 AI 출력을 처음부터 생성하는 대신 검증하기 때문에 감소합니다.

소규모 공급업체 PO 처리의 숨겨진 비용은 수집 단계입니다. 손으로 쓴 PO가 팩스, 이메일 첨부파일, 현장 구매자의 문자 사진으로 도착합니다. 팀원이 첨부파일을 다운로드하고, 폴더에 저장한 후, 추출 도구에 업로드합니다. 주당 50건의 PO라면, 추출이 시작되기도 전에 50번의 수집 단계가 발생합니다.

ImageToTable.ai의 수집 링크가 이 단계를 없앱니다. 고유한 URL(예: /c/abc123)을 생성하여 공급업체(전문 패스너 상점, 지역 화학 혼합 업체, 산업용 가스 회사)와 공유합니다. 공급업체가 PO를 보내야 할 때 링크를 열고, 짧은 인증 코드를 입력한 후, 문서를 직접 업로드합니다. 파일은 자동으로 처리 대기열에 들어갑니다. 공급업체는 계정이 필요 없고, 로그인할 필요 없으며, 조달 시스템에 대해 알 필요도 없습니다. 손으로 쓴 PO를 사진으로 찍어 업로드하기만 하면 됩니다.

공급업체 입장에서는 팩스보다 실제로 더 쉽습니다. 휴대폰 사진과 링크 하나면 끝입니다. 사용자 입장에서는 추출이 시작되기도 전에 PO당 몇 분씩 소모되던 다운로드-저장-업로드 과정이 사라집니다. 위의 추출 워크플로우와 결합하면, 공급업체에서 ERP까지의 전체 파이프라인은 다음과 같아집니다: 공급업체가 PO 사진 촬영 → 수집 링크로 업로드 → AI가 스프레드시트로 추출 → 검토 후 가져오기. 유일한 사람의 접점은 검증뿐입니다.

손글씨 PO 추출이 잘 작동하는 경우와 그렇지 않은 경우

AI는 표준 볼펜과 젤펜 필기에서 높은 정확도로 손글씨를 읽습니다. 깨끗하고 조명이 좋은 이미지에서 필드 수준 정확도는 95% 이상으로 측정됩니다. 하지만 추출 품질은 모든 필기 조건에서 동일하지 않으며, 한계점이 어디인지 이해하는 것이 중요합니다.

잘 작동하는 경우: 흰색 또는 연한 색조의 종이에 검정 또는 진한 파랑 볼펜으로 표준 필기체 또는 인쇄체로 쓰여지고, 문자 사이에 적당한 간격이 있는 경우. 카본 사본 원본(노란색/분홍색 사본이 아닌 흰색 상단 시트)이 이 범주에 속합니다. "품목", "수량", "단가", "합계"와 같은 명확한 섹션 레이블이 있는 PO 형식은 AI에 의미적 기준점을 제공하여 필드 수준 정확도를 더욱 향상시킵니다.

정확도가 떨어지는 경우: 얇은 종이에 연한 연필 필기 — 회색 흑연과 종이 사이의 낮은 대비는 문자 인식 신뢰도를 떨어뜨립니다. 문자가 서로 겹쳐지는 극도로 좁은 필기("I36" 대 "136"). 여러 세대에 걸친 복사본의 복사본은 각 세대마다 흐림이 발생하고 배경이 어두워집니다. 카본 사본 사본(패드의 세 번째 또는 네 번째 시트)으로, 인상이 너무 연해서 사람이 읽을 때도 눈을 가늘게 뜨게 만듭니다.

실패하는 경우 — 수동 검토가 필요합니다: 심하게 손상된 문서 — 데이터 필드를 통한 찢어진 가장자리, 페이지 전체로 번진 물에 젖은 잉크, 또는 사람의 눈으로도 필기가 거의 보이지 않을 정도로 희미한 카본 사본. 경험상의 법칙: 필드를 읽기 위해 종이를 빛에 비추고 돌려야 한다면, AI도 놓칠 가능성이 높습니다. 이러한 경우에도 AI는 명확하게 읽을 수 있는 모든 것을 추출하고, 원본 문서에서 누락된 필드를 채웁니다. 추출은 최악의 상태 문서에서도 타이핑 작업량을 100%에서 약 10~15%로 줄여줍니다. 읽을 수 있는 필드는 여전히 캡처되기 때문입니다.

동일한 AI가 인쇄된 PO와 수기 PO를 모드 전환 없이 처리합니다. 대부분 인쇄되었지만 여백에 수기 주석이 있는 PO(사전 인쇄된 양식을 사용하지만 수량과 가격은 손으로 기입하는 공급업체의 일반적인 패턴)는 특별한 처리 없이 단일 문서로 추출됩니다. AI는 페이지를 시각적 전체로 처리하기 때문에 동일한 페이지에서 기계 인쇄와 필기를 모두 읽으며, OCR 엔진 간 전환을 하지 않습니다.

자주 묻는 질문

AI가 기존 OCR보다 필기를 더 잘 읽을 수 있나요?

네, 하지만 더 나은 OCR이기 때문이 아닙니다. 전혀 OCR처럼 작동하지 않기 때문입니다. 기존 OCR은 각 문자 모양을 알려진 문자 데이터베이스와 일치시키려고 합니다. 이 접근 방식은 균일한 기계 인쇄에는 효과적이지만, 사람마다 글자 형태가 다르기 때문에 필기에는 실패합니다. AI 기반 추출, 특히 비전 언어 모델은 사람이 하는 것처럼 시각적 맥락을 이해하여 필기를 읽습니다. 문서 상단 근처에 "3/15/26"처럼 보이는 일련의 문자를 보고 각 숫자를 개별적으로 일치시키려고 하지 않고 날짜로 해석합니다. 이러한 의미론적 접근 방식은 각 사람의 필체를 배울 필요 없이 필기 변형을 처리합니다.

이 도구가 제 ERP나 조달 시스템을 대체하나요?

아니요. 이 도구는 수기 PO의 데이터를 구조화된 스프레드시트로 추출합니다. 그런 다음 해당 스프레드시트를 SAP, Coupa, Oracle, QuickBooks, Excel 등 기존 조달 시스템으로 가져옵니다. 이는 데이터 브리지이지 대체품이 아닙니다. 가치는 전자 공급업체뿐만 아니라 모든 공급업체의 완전한 PO 데이터를 ERP가 보유하게 된다는 점입니다.

수기 표 행과 서식은 어떻게 처리하나요?

수기 PO의 손으로 그린 선, 상자 및 그리드 구분선은 텍스트 내용이 아닌 시각적 구조로 처리됩니다. AI는 품목 행을 구분하는 손으로 그린 가로선과 품목 행 자체의 텍스트를 구분합니다. 이는 많은 수기 PO에 사람이 직관적으로 무시하지만 위치 기반 OCR이 문자로 읽으려고 시도할 수 있는 손으로 그린 열이 있기 때문에 중요합니다.

필체가 정말 엉망이면 어떻게 되나요?

사람이 읽기 어려운 필체를 마주했을 때와 같은 일이 발생합니다. 일부 항목은 올바르게 읽히고, 일부는 그렇지 않습니다. 차이점은 AI가 불확실한 항목을 표시하여 구매 발주서 전체를 다시 입력할 필요 없이 검토할 항목만 목록으로 제공한다는 점입니다. 추출이 완벽할 필요는 없습니다. 부분 추출만으로도 수동 입력의 대부분을 없애 처리 시간을 80~90% 단축할 수 있기 때문입니다.

수기와 인쇄된 구매 발주서를 같은 배치에서 처리할 수 있나요?

네. 설정한 열 정의(공급업체명, 구매 발주 번호, 라인 항목 등)는 문서가 ERP의 PDF, 인쇄된 양식의 스캔본, 또는 수기 카본 사본 사진인지에 관계없이 동일하게 적용됩니다. 세 가지 유형을 모두 하나의 배치에 업로드하면 AI가 각각을 독립적으로 처리하여 모든 결과를 단일 통합 스프레드시트로 출력합니다. 전체 워크플로는 배치 구매 발주 처리 가이드를 참조하세요.

종이를 사용하는 소규모 공급업체는 사라지지 않습니다. 그들을 그 자리에 머물게 하는 경제적 요인(낮은 거래량, 전문 제품, 확고한 고객 관계)은 디지털 전환의 타당성보다 더 강력합니다. 번창하는 조달 팀은 종이가 사라지길 기다리기보다 종이 공급업체로 연결되는 데이터 브리지를 구축하는 팀입니다. 처리에 30초밖에 걸리지 않는 수기 구매 발주서는 더 이상 병목 현상이 아닙니다. 그저 하나의 구매 발주서일 뿐입니다.

직접 워크플로를 테스트해보세요. 가장 까다로운 공급업체(필체를 보기만 해도 두려웠던 그곳)의 수기 구매 발주서를 가져와 실행해보십시오. "구매 발주서당 3분"이 "두 번째 확인이 필요할 수 있는 한 항목을 위해 출력물을 10초 동안 스캔하는 것"으로 바뀌는지 확인해보세요. 그 하나에서 작동한다면, 모든 곳에서 작동합니다.

📮 contact email: [email protected]