AI가 구매 요청 데이터를 추출할 수 있을까?
PR 추출은 PO 추출과 다릅니다
네. AI가 구매 요청 데이터를 추출할 수 있습니다. 하지만 PR 추출은 PO 추출과 근본적으로 다릅니다. 승인 체인과 부서별 품목 코드는 단순한 텍스트 스캔이 아닌 필드 수준의 이해가 필요하기 때문입니다. 구매 요청은 내부 문서입니다. 지출 승인을 요청하는 문서입니다. 구매 주문은 외부 문서입니다. 공급업체에 상품 인도를 지시하는 문서입니다. 두 가지를 모두 처리하는 추출 도구는 현재 읽고 있는 문서가 무엇인지 이해해야 합니다. 동일한 필드 이름이라도 문맥에 따라 의미가 다르기 때문입니다.
구매 요청서와 구매 주문서의 차이점
PR(구매 요청서) 데이터 추출에서 가장 흔한 실수는 이를 PO(구매 주문서) 추출 문제와 동일하게 취급하는 것입니다. 두 문서는 문서 번호, 날짜, 요청자, 공급업체, 품목, 수량, 합계 등 유사한 필드 이름을 공유하지만, 목적과 구조가 충분히 달라 PO 중심 도구는 요청서를 조용히 잘못 해석합니다.
구매 주문서(PO)는 공급업체를 대상으로 한 계약서입니다. 주문 수량, 합의된 가격, 납품일, 결제 조건을 공급업체에 전달합니다. 공급업체가 읽고 이행해야 하므로 필드가 비교적 표준화되어 있습니다. PO 번호 형식은 다양할 수 있지만, PO 번호라는 개념은 모든 산업의 모든 공급업체에서 보편적입니다.
구매 요청서(PR)는 내부 승인 요청입니다. "이것을 구매해야 합니다 — 지출을 승인해 주세요"라는 의미를 담고 있습니다. 필드는 부서 코드, 비용 센터, 예산 계정 번호, 승인 체계, 사유서, 선호 공급업체 제안 등 내부 비즈니스 구조를 반영합니다. 이러한 필드는 PO에는 나타나지 않습니다. 또한 일반적으로 시스템에서 생성되는 PO와 달리, PR은 여전히 수기로 작성된 종이 양식, 출력되어 서명된 Excel 스프레드시트, 또는 자유 형식의 이메일 첨부 파일로 유입되며 — 본질적으로 표준화가 거의 없는 형식입니다. 다양한 문서 유형에 따라 다른 추출 접근 방식이 필요한 방법에 대한 자세한 내용은 PO 데이터 추출의 실제 의미에 대한 가이드를 참조하세요.
실제 결과: 구매 요청서에 PO 추출 도구를 적용하면 문서 번호와 날짜는 안정적으로 찾지만, 승인 워크플로에 중요한 모든 필드는 놓치거나 잘못 분류합니다. 부서 필드는 "배송지"로, 예산 코드는 무시되며, 도구가 찾도록 설계되지 않았기 때문에 승인 서명도 캡처되지 않습니다.
내부 문서는 외부 문서보다 레이아웃 표준화가 덜 되어 있습니다. 공급업체 송장은 템플릿 없는 도구가 합계를 안정적으로 찾을 수 있을 정도로 규칙을 따릅니다. 한 부서의 내부 PR 양식은 같은 회사의 다른 부서 양식과 완전히 다르게 보일 수 있습니다 — 각 부서가 사용 가능한 소프트웨어로 자체 양식을 설계했기 때문입니다.
구매요청 데이터가 있는 곳: 수기 양식, 엑셀 출력물, 스캔 종이
대부분의 기업이 ERP를 통해 생성하는 구매오더와 달리, 구매요청서는 여전히 다양한 출처에서 유입되며, 그중 상당수는 디지털 기반이 아닙니다.
수기 구매요청서. 제조, 건설, 현장 운영에서는 요청서를 손으로 작성합니다. 유지보수 책임자가 부품 번호를 적고, 기억에 의존해 비용을 추정한 후 종이 양식을 구매 부서에 제출합니다. 이러한 수기 PR에는 약어, 기억에서 적은 부품 코드, 수동 비용 추정치가 포함됩니다. 타이핑된 텍스트에 의존하는 AI는 여기서 유용한 결과를 얻지 못합니다. 비전 기반 추출은 문서 이미지의 일부로 필기를 읽어, 글씨가 엉성하더라도 필드 컨텍스트를 이해하여 "수량: 5"를 식별합니다.
엑셀 출력 및 스캔 PR. 많은 부서가 요청서 양식으로 엑셀 템플릿을 사용하며, 부서마다 템플릿이 다릅니다. 열 위치가 바뀌고, 병합된 헤더가 예상치 못한 곳에 나타나며, "합계" 셀이 한 양식에서는 25행, 다른 양식에서는 40행에 있을 수 있습니다. 템플릿 기반 OCR은 두 개의 엑셀 출력 PR이 동일한 레이아웃을 공유하지 않기 때문에 실패합니다. 의미 기반 추출은 위치가 아닌 열 레이블로 값을 읽으므로, 한 양식의 C열에 있는 "설명"과 다른 양식의 E열에 있는 "설명"이 동일한 필드로 인식됩니다. 디지털 방식으로 PR을 생성하는 기업도 서명을 위해 인쇄한 후 서명된 사본을 스캔하는 경우가 많습니다. 결과 PDF는 선택 가능한 텍스트가 없는 이미지입니다. 텍스트 레이어가 없는 문서를 AI가 처리하는 방법에 대한 자세한 내용은 AI가 스캔된 PDF에서 데이터를 추출할 수 있는지에 대한 가이드를 참조하세요.
승인 체인 문제: 서명, 라우팅, 상태
이는 PO 처리에는 없는 추출 과제입니다. 구매요청서는 단일 데이터 레코드가 아니라 수명 주기를 가진 문서입니다. 승인 서명, 날짜, 라우팅 결정은 PR 추출이 문서를 사용 가능하게 만들기 위해 반드시 캡처해야 하는 데이터 포인트입니다.
요청서의 일반적인 승인 체인은 다음과 같습니다:
요청자 수준
- 요청자 이름
- 부서 / 비용 센터
- 요청일
- 사유 / 비고
관리자 승인
- 관리자 서명
- 승인일
- 예산 코드 확인
- 지출 카테고리 승인
구매 / 재무
- 구매 승인
- PO 번호 할당
- 재무 코드 서명
- 최종 승인일
이러한 각 서명 블록은 별도의 추출 대상입니다. 요청자 이름은 상단에 나타납니다. 관리자의 서명은 중간에 나타나며, 때로는 "승인" 또는 "거부" 체크박스가 함께 있습니다. 구매 담당자의 최종 승인은 하단에 나타나며, 승인된 PR에서 생성된 PO 번호가 함께 있는 경우가 많습니다. 추출 도구는 "요청일"과 "승인일"을 구분해야 합니다. 이는 동일한 페이지에 있는 두 개의 다른 날짜이며, 각각을 올바른 열에 할당해야 합니다.
위치 기반 추출이 가장 극명하게 실패하는 지점입니다. 한 부서 양식에서는 관리자 서명란이 오른쪽 하단에 있고, 다른 부서 양식에서는 왼쪽 사이드바에 있으며, 또 다른 부서 양식에서는 라인 항목 옆 테이블 행에 포함되어 있습니다. 의미 기반 추출은 "관리자 승인" 또는 "승인자" 레이블과 서명 또는 날짜의 조합을 찾아 처리합니다. 즉, 위치가 아닌 의미로 승인 블록을 식별합니다.
구매 요청 추출에서 중요한 필드
구매 요청(PR)에는 구매 주문(PO)과 다른 특정 필드 세트가 있습니다. 완전한 PR 추출은 헤더 수준의 요청 정보와 라인 항목 세부 정보를 모두 캡처해야 합니다.
PR 헤더 필드
- PR 번호 / 요청 ID
- 요청일
- 요청자 이름 및 부서
- 코스트 센터 / 예산 코드
- 배송 위치 / 부서
- 요청 배송일
- 예상 총액 (예산)
- 사유 / 업무 필요성
- 승인 상태 (대기/승인/거부)
- 승인자 이름 및 승인일
- 변환된 PO 번호 (승인된 경우)
PR 라인 항목
- 품목 설명
- 부서 품목 코드 / SKU
- 요청 수량
- 측정 단위
- 예상 단가
- 예상 라인 합계
- 선호 공급업체 (지정된 경우)
- GL 계정 / 청구 코드
- 프로젝트 / 작업 지시 번호
"부서 품목 코드" 필드는 특별히 주목할 필요가 있습니다. PO가 공급업체 카탈로그의 품목 코드를 사용하는 것과 달리, 내부 PR은 부서별 번호 체계를 사용합니다. 유지보수는 장비 코드, IT는 자산 태그, 엔지니어링은 도면 번호를 사용합니다. 이러한 코드를 모든 부서 시스템의 조회 테이블 없이 정확하게 읽는 AI 추출은 PO 생성 단계에서 수동 수정이 필요하지 않도록 방지합니다.
마찬가지로 PR의 예상 비용은 예산 확인용이지 확정 가격이 아닙니다. 추출 도구는 "예상 비용" 또는 "예상 단가"를 추정치로 캡처해야 하며, 확정 가격과 혼동해서는 안 됩니다. 의미 기반 추출은 가장 가까운 숫자를 가져오는 대신 한정하는 필드 레이블을 읽기 때문에 이를 처리합니다.
AI가 구매요청서 데이터 추출을 처리하는 방식
핵심 메커니즘인 비전 AI 기반 의미 추출은 송장이나 구매 주문서를 처리할 때와 동일한 기술이지만, 구매요청서 문서는 다른 방향으로 접근해야 합니다.
서식의 다양성이 훨씬 큽니다. 송장은 어느 정도 표준 규칙을 따르기 때문에 하나의 설정으로 대부분의 공급업체를 처리할 수 있습니다. 반면 구매요청서는 표준 규칙이 없습니다. 회사마다, 부서마다 제각각의 서식을 사용합니다. 의미 추출은 레이아웃을 맞추는 대신 필드의 의미를 읽기 때문에 이러한 다양성을 처리할 수 있습니다. "구매요청번호", "부서", "품목 설명", "예상 비용", "승인자"와 같은 열을 한 번만 정의하면 AI가 모든 부서 서식에서 해당 값을 찾아냅니다. 이것이 바로 사용자 정의 열 추출입니다. 필드 이름을 입력하면 AI가 각 텍스트 조각이 나타내는 의미를 이해하여 일치하는 데이터를 찾습니다.
손글씨는 예외가 아니라 일반적인 상황입니다. 많은 조달 부서에서 접수되는 요청서의 절반 이상에 손글씨 요소(수기로 조정된 수량, 승인 서명, 여백에 적힌 메모 등)가 포함되어 있습니다. 비전 기반 AI는 이를 시각적 문서의 일부로 읽습니다. 손글씨 품목 코드와 수량의 정확도는 가독성에 따라 달라지지만, 의미적 맥락이 도움이 됩니다. "수량"을 찾는 AI는 "pcs" 근처에 손글씨로 적힌 "5"를 단독으로 적힌 동일한 문자보다 더 정확하게 읽을 가능성이 높습니다. 자세한 내용은 AI 손글씨 인식 가이드를 참조하세요.
승인 서명은 장식이 아닌 데이터입니다. 구매 주문서 추출에서 서명은 대개 중요하지 않습니다. 하지만 구매요청서 추출에서는 누가, 언제, 어떤 수준에서 승인했는지가 매우 중요합니다. 서명자 이름, 날짜, 승인 상태를 캡처하는 AI는 수동 라우팅 추적을 분석 가능한 데이터로 전환합니다. 실제 워크스루는 구매요청서 PDF에서 데이터 추출 가이드를 참조하세요.
자주 묻는 질문
AI가 수기 구매 요청서에서 데이터를 추출할 수 있나요?
네, 가능합니다. 비전 기반 AI는 문서 이미지의 일부로 수량, 부품 번호, 승인자 이름 등 수기 입력 필드를 읽습니다. 조명이 밝은 스캔본에서 깔끔한 인쇄체 필기는 85~95% 정확도로 추출됩니다. 복잡한 필기체나 대비가 낮은 스캔(카본 사본)은 정확도가 낮아집니다. 수동 입력보다 장점은 입력되거나 명확히 인쇄된 80%의 필드를 처리하고, 불확실한 필기 부분은 검토용으로 표시하여 전체를 수동으로 다시 입력할 필요가 없다는 점입니다.
PR 추출과 PO 추출은 어떻게 다른가요?
세 가지 주요 차이점이 있습니다. 첫째, PR에는 PO에는 없는 필드(비용 센터, 예산 코드, 사유서, 승인 라우팅 데이터, 예상 가격)가 포함됩니다. 둘째, PR은 수기 양식, Excel 출력물, 스캔 종이 등 더 다양한 형식으로 제공되는 반면, PO는 일반적으로 시스템에서 생성된 PDF입니다. 셋째, PR 추출은 승인 체인(누가, 언제, 어떤 수준에서 서명했는지)을 포착해야 합니다. 승인 서명과 비용 센터 코드를 놓치는 PO 추출 도구는 PR에서 불완전한 결과를 생성합니다. 자세한 내용은 PO 데이터 추출 가이드를 참조하세요.
한 번에 PR의 헤더 필드와 라인 항목을 모두 추출할 수 있나요?
네, 가능합니다. 헤더 필드(PR 번호, 부서, 비용 센터)와 라인 항목 필드(설명, 수량, 예상 단가)에 대한 열을 정의하세요. AI는 헤더 값을 한 번 추출하여 모든 라인 항목 행에 반복합니다. 12개의 라인 항목이 있는 요청서는 각각 전체 헤더 컨텍스트를 포함하는 12개의 출력 행을 생성하며, 이는 ERP 가져오기 및 Excel 피벗 테이블과 호환됩니다.
각 부서의 PR 양식에 대해 별도의 템플릿이 필요한가요?
아니요, 필요하지 않습니다. 이것이 템플릿 기반 OCR보다 의미론적 추출의 핵심 장점입니다. "PR 번호", "품목 설명", "예상 비용"과 같은 열 이름을 한 번 정의하면 AI가 각 필드의 의미를 이해하여 모든 부서 양식에서 일치하는 데이터를 찾습니다. 엔지니어링의 SAP 양식, 마케팅의 Excel 시트, 창고 관리자의 수기 요청서가 동일한 열 정의로 처리됩니다. 자세한 설명은 템플릿 없이 AI가 데이터를 추출하는 방법을 참조하세요.
PR 추출에 어떤 파일 형식을 사용할 수 있나요?
최신 AI 추출 도구는 PDF(디지털 및 스캔), JPG, PNG, WebP를 지원합니다. 스캔된 PDF는 인쇄, 서명, 스캔된 문서인 PR에 가장 일반적입니다. 종이 PR의 휴대폰 사진도 이미지가 선명하면 작동합니다. Excel 생성 PDF(스프레드시트 템플릿에서 인쇄)도 작동합니다. 일괄 처리를 위해 여러 부서의 PR을 한 번에 업로드하고 모든 문서가 병합된 통합 스프레드시트를 얻을 수 있습니다.
PR 추출 결과를 ERP나 회계 소프트웨어로 직접 내보낼 수 있나요?
대부분의 추출 도구는 모든 ERP에서 가져올 수 있는 Excel(XLSX), CSV 또는 JSON 형식으로 출력합니다. 표준 워크플로는 PR 데이터 추출 → 플래그가 지정된 필기 또는 예상 필드 검토 → 조달 시스템(SAP, Oracle, Coupa, QuickBooks, NetSuite)으로 가져오기입니다. 데이터는 PR 번호를 식별자로, 라인 항목을 예산 조정에 바로 사용할 수 있는 평면 행으로 미리 구조화되어 제공됩니다. Google Sheets 사용자의 경우 Google Sheets 애드온을 통해 결과를 스프레드시트에 직접 작성하여 내보내기-가져오기 단계를 없앨 수 있습니다.
구매 요청 데이터 추출 시작하기
구매 요청 추출은 대부분의 조달 부서가 불가피하게 받아들이는 두 가지 현실이 교차하는 지점에 있습니다. 내부 양식에는 표준화가 없고, 수동 PR 처리 비용은 모든 부서와 승인 단계에 걸쳐 누적됩니다. AI 추출은 템플릿을 매칭하는 대신 읽어서 이해하는 시각적 문서로 각 PR을 처리함으로써 이를 변화시킵니다. 동일한 열 정의가 수기로 작성된 유지보수 요청, Excel로 출력된 엔지니어링 요청, 스캔된 창고 공급 주문서에 모두 적용됩니다.
핵심 질문은 "AI가 구매 요청을 추출할 수 있는가"가 아닙니다. 답은 '가능하다'입니다. 중요한 것은 추출 도구가 내부 승인 요청과 공급업체 구매 주문의 차이를 이해하는지 여부입니다. 그 차이가 출력 결과가 완전한지, 아니면 중요한 필드의 절반이 누락되었는지를 결정합니다.
샘플 구매 요청서를 업로드하세요. 형식이나 부서에 관계없이, AI가 귀사의 문서를 어떻게 처리하는지 직접 확인해보십시오.