선하증권 데이터 추출
완벽 가이드
선하증권은 하나의 문서가 아닙니다. 직선 BOL, 해상 BOL, 복합운송 BOL, 마스터 BOL, 하우스 BOL 등 법적으로 구분되는 여러 문서 유형으로 구성되며, 각각 필드, 발행처, 데이터 도착지가 다릅니다. 하루에 100건의 BOL을 처리하는 포워더는 점심 전에 5개 운송사의 8가지 다른 문서 레이아웃을 접할 수 있습니다. 한 BOL 유형에서는 작동하다가 다음 유형에서 실패하는 추출은 추출이 아닌, 수동 대체가 필요한 부분적 해결책에 불과합니다. 이 가이드는 모든 유형, 모든 운송사, TMS가 요구하는 모든 표준 코드에서 BOL 데이터를 안정적으로 추출하기 위해 실제로 알아야 할 내용을 다룹니다.
핵심 요약
- 선하증권용 템플릿 기반 추출은 50개 운송사에 대해 750개의 좌표 사각형을 유지해야 함을 의미합니다. 그리고 Maersk가 컨테이너 번호를 오른쪽 상단에서 페이지 중간으로 옮기면, 누군가 템플릿을 수정할 때까지 그들이 보내는 모든 BOL에서 빈 필드가 생성됩니다.
- 문제는 유지보수 부담뿐만이 아닙니다. 템플릿 변경 시마다 잘못 읽힌 컨테이너 ID가 TMS, 고객 추적 포털, 또는 세관 신고에 도달할 새로운 기회가 생기며, 누군가 컨테이너가 3일째 사라진 것을 알아차리기 전까지 아무도 눈치채지 못합니다.
- 단일 의미론적 컬럼 정의가 750개 템플릿을 모두 대체하고, 추출 중에 ISO 6346 체크 디짓에 대해 컨테이너 번호를 검증합니다. 체선료 시계가 돌기 시작한 후가 아니라, 추출 계층을 떠나기 전에 잘못 입력된 숫자를 잡아냅니다.
BOL 추출이 다른 문서 추출과 다른 점
대부분의 문서 추출 관련 글은 선하증권을 배가 실린 송장처럼 취급합니다. 이러한 가정은 데모에서는 작동하지만 실제 운영에서는 실패하는 도구를 만듭니다. BOL이 다른 문서와 구조적으로 다른 이유는 다음과 같습니다.
법적으로 구분되는 다섯 가지 문서 유형, 하나의 추출 파이프라인. 직선 선하증권(양도 불가)은 특정 수하인을 지정하며 양도할 수 없습니다. LTL 트럭 운송에서 흔히 볼 수 있는 가장 간단한 형태입니다. 해상 선하증권은 양도 가능하며 헤이그-비스비 규칙에 따라 권리증서 역할을 합니다. 원본을 소지한 사람이 화물을 청구할 수 있습니다. 복합운송 BOL(결합운송 BOL이라고도 함)은 UNCTAD/ICC 복합운송 문서 규칙의 적용을 받는 단일 문서로 해상, 철도, 트럭 구간을 포함합니다. 그 다음으로 모든 포워더가 매일 처리하는 분할이 있습니다: 운송사가 포워더에게 발행하는 마스터 선하증권(MBL)과 포워더가 화주에게 발행하는 하우스 선하증권(HBL)입니다. 동일한 선적에 대해 컨테이너 번호와 항구 같은 필드는 공유하지만, 발행인 이름, 참조 번호, 운임 지불 조건은 다릅니다.
각 유형은 필드 배열이 다릅니다. 머스크 해상 BOL은 컨테이너 번호를 선박명 옆 오른쪽 상단 사분면에 배치합니다. MSC BOL은 화물 설명 그리드 위 페이지 중간에 배치합니다. 하우스 BOL에는 마스터 BOL을 상호 참조하는 HBL 참조 번호가 추가됩니다. 이는 직선 BOL에는 전혀 없는 필드입니다. 유형별 구성 없이 다섯 가지 유형을 모두 처리할 수 없는 추출 도구는 화물을 이동시키는 대신 템플릿을 유지 관리하는 데 시간을 낭비하게 만듭니다.
데이터는 단순히 읽기만 해서는 안 됩니다. 변환되어야 합니다. BOL에는 선적항이 "CNSHA", "Shanghai" 또는 "Port of Shanghai, CN"으로 표시될 수 있습니다. TMS는 1981년부터 유엔 유럽 경제 위원회(UNECE)가 관리하는 249개국 100,000개 이상의 위치를 포괄하는 5자리 UN/LOCODE인 CN SHA를 기대합니다. BOL에는 운송사 이름이 "Maersk Line"으로 인쇄될 수 있지만 TMS는 NMFTA가 관리하는 SCAC 코드(표준 운송사 알파 코드) MAEU를 요구합니다. 상품에는 200개 이상의 국가에서 사용하는 세계 관세 기구(WCO)가 관리하는 HS 코드가 필요하며, "woven polypropylene bulk bags"와 같은 자연어 화물 설명을 6305.33에 매핑해야 합니다. 일반 텍스트를 출력하는 BOL 추출 도구는 완성된 것이 아닙니다. 표준화된 코드를 출력하는 도구가 완성된 것입니다.
이것이 BOL 추출을 송장 추출이나 영수증 추출과 다른 문제로 만드는 핵심 과제입니다. BOL 데이터 추출의 전체 정의와 TMS 데이터 입력과 같은 관련 개념과의 차이점은 BOL 데이터 추출이란 무엇인가 가이드를 참조하십시오.
전통적인 OCR과 템플릿 기반 방식이 BOL에서 실패하는 이유
템플릿 기반 OCR은 레이아웃이 통제된 문서(자체 송장, 구매 주문서, 직접 설계한 양식)를 위해 설계되었습니다. 선하증권(BOL)은 모든 수준에서 그 가정을 깨뜨립니다.
다중 운송사 형식의 폭발적 증가. 하루에 100건의 BOL을 처리하는 화물 중개인은 자사 화주가 어떤 운송사를 이용했는지 통제할 수 없습니다. 해당 BOL은 머스크(MAEU), MSC(MSCU), CMA CGM(CMDU), 하팍로이드(HLCU), COSCO(COSU), ONE(ONEY), 에버그린(EMCU) 및 수십 개의 지역 트럭킹 회사 각각의 고유한 형식으로 도착합니다. 템플릿 기반 OCR은 운송사 형식별로 각 필드 주변에 경계 상자를 그려야 합니다. 50개 운송사와 BOL당 15개 필드의 경우, 정의하고 유지 관리해야 할 좌표 사각형이 750개입니다. 어떤 운송사가 양식을 업데이트하면(그리고 실제로 업데이트합니다) 해당 템플릿은 조용히 깨져서, 누군가 세관의 B/L 수정 수수료 패턴을 알아차릴 때까지 올바른 열에 잘못된 데이터를 생성합니다.
손글씨, 도장, 카본 카피는 예외 사항이 아닙니다. 적재장에서 작성된 BOL은 깨끗한 디지털 PDF가 아닙니다. 수하인 이름은 펜으로 휘갈겨 썼습니다. 개수는 빨간색 잉크로 도장이 찍혔습니다. 운임 조건("PREPAID")은 마커로 동그라미 쳤습니다. 스캔본은 3세대 카본 카피로, 원본의 텍스트가 화물 설명 필드로 번져 보입니다. 전통적인 OCR은 도장을 노이즈로, 카본 번짐을 추가 문자로, 90 DPI 미만의 손글씨를 읽을 수 없는 것으로 처리합니다. 그러나 BOL에서 이러한 "노이즈" 요소는 운송사 송장 분쟁을 가장 자주 유발하는 세 가지 데이터 포인트(손으로 쓴 개수, 도장 찍힌 중량, 표시된 운임 조건)를 전달합니다.
NMFC 화물 등급은 의미론적 이해를 필요로 합니다. 전미 자동차 화물 분류(NMFC) 시스템은 밀도, 적재 용이성, 취급 및 책임에 따라 18개의 화물 등급(50~500)을 정의합니다. BOL에는 상품 설명 "목재 가구, KD" 옆에 "Class 70"이 나열되거나, 등급 없이 상품만 나열되어 운송사가 적용하도록 할 수 있습니다. 템플릿 OCR은 둘 다 동일한 상자의 텍스트 문자열로 읽습니다. 의미론적 추출은 "Class 70"이 "목재 가구"를 수식하며 화물 등급 열에 속하고 상품 설명 열에 속하지 않음을 이해합니다. 이 구분은 운임 청구서의 정확성 여부를 결정하며, 3주 후에 300달러의 재분류 수수료가 발생하는지를 결정합니다.
이 세 가지 실패 모드는 복합적으로 작용합니다. 운송사별 템플릿이 필요하고, 손글씨를 읽을 수 없으며, 화물 등급과 상품 설명을 구분하지 못하는 도구는 인건비를 절감하는 것이 아니라 원래 데이터 입력 작업만큼 큰 검토 대기열을 생성하는 것입니다.
최신 AI 추출이 선하증권을 읽는 방법
수동 BOL 데이터 입력을 대체하는 파이프라인은 5단계로 구성됩니다. 이 과정을 이해하면 템플릿 OCR로는 불가능했던 다중 운송사 BOL 처리를 의미 기반 추출이 어떻게 해내는지 명확해집니다.
이 파이프라인과 기존 방식의 근본적 차이는 위치 기반 추출에서 의미 기반 추출로의 전환에서 드러납니다. 템플릿 OCR은 "데이터가 어디 있나"를 묻고 위치가 바뀌면 작동을 멈춥니다. 의미 기반 추출은 "이 데이터가 무엇인가"를 묻고 레이아웃이 변경되어도 적응합니다. 다양한 운송사를 오가며 BOL을 처리하는 물류 팀에게 이 차이는 자동화 파이프라인과 템플릿 유지보수 작업의 차이입니다.
핵심 BOL 필드와 이를 검증하는 표준
모든 BOL 추출 프로젝트는 어떤 필드가 중요한지 정의하는 것에서 시작합니다. 아래 표는 모든 물류 운영에 필요한 5개 그룹, 각 그룹의 세부 필드, 그리고 추출된 값이 단순히 존재하는 것뿐만 아니라 올바른지 판단하는 검증 기준을 보여줍니다.
| 필드 그룹 | 추출할 필드 | 검증 기준 | 중요성 |
|---|---|---|---|
| 당사자 | 송하인 이름 및 주소, 수하인, 통지처, 운송사/SCAC 코드 | SCAC (NMFTA): 2-4자리 운송사 코드; EU 관세용 EORI 번호 | 잘못된 배송은 하루 $100~500의 체선료 발생; 잘못된 통지처는 선적 도착을 놓치게 함 |
| 경로 | 적재항, 양륙항, 인수지, 인도지, 선박/항차, 컨테이너 번호, 봉인 번호 | UN/LOCODE (UNECE): 5자리 코드 (예: CN SHA, NL RTM); ISO 6346: 컨테이너 검증 숫자 | ISF 신고는 적재 24시간 전 정확한 항만 코드 필요; 컨테이너 ID 불일치는 세관 보류 초래 |
| 화물 | 품목 설명, 개수 및 포장 유형, 총중량 (kg/lbs), 순중량, 부피/치수, 운임 등급, NMFC 코드, HS 코드 | NMFC: 18개 운임 등급 (50–500); HS: 6자리 국제 코드 + 국가별 확장; SOLAS VGM: 2016년 7월부터 컨테이너 검증 총중량 필수 | 운임 등급 재분류 시 건당 $150~300 비용; HS 코드 오류 시 미납 관세의 최대 10배 벌금 |
| 요금 및 조건 | 운임 조건 (선불/착불), 해상 운임, 벙커 할증료, 터미널 처리비, 추가 요금 | Incoterms 2020: 비용/위험 이전 시점 정의 | 잘못된 운임 지급 조건은 엉뚱한 당사자에 청구하고 이미 포워더에게 지불한 고객에게 비용 회수 시도 |
| 참조 | BOL 번호, HBL/MBL 상호 참조, 예약 번호, PO/상업송장 참조, 픽업일, 인도일/ETA | 형식은 운송사별 상이; 두 가지를 모두 처리하는 포워더의 HBL과 MBL 간 상호 참조 검증 | TMS에서 BOL 번호 없이 선적 추적 불가; 인도 기한을 놓치면 서비스 수준 약속 위반 |
컨테이너 번호의 체크 디지트는 특히 유용한 검증 수단입니다. ISO 6346에 따라 각 컨테이너 식별자는 세 글자 소유자 코드(예: 머스크의 MSK), 한 글자 장비 범주 식별자(U는 화물 컨테이너), 여섯 자리 일련번호, 그리고 앞 문자들로 계산된 체크 디지트로 구성됩니다. 추출 결과가 MSKU 907082 3을 출력했지만 실제 컨테이너가 MSKU 907082 8이라면, 체크 디지트 불일치가 즉시 오류를 알려줍니다. 그 컨테이너 번호가 TMS, 고객 추적 포털, 또는 세관 신고에 도달하기 전에 말이죠. 추출 중 이 검증을 수행하는 도구는 컨테이너가 터미널에서 분실될 때까지 살아남을 오류를 잡아냅니다.
화물 그룹(품목 설명, 중량, 운임 등급, HS 코드)은 BOL에서 데이터 밀도가 가장 높고 오류 가능성도 가장 큰 부분입니다. 또한 운송사별로 가장 크게 달라지는 부분이기도 합니다. 어떤 BOL은 개별 중량과 묶음 운임 등급으로 다섯 개의 품목 라인을 나열하고, 다른 BOL은 모든 것을 "FAK"(혼합 화물) 한 줄로 통합합니다. 또 다른 BOL은 화주가 손으로 여백에 HS 코드를 추가합니다. BOL 추출 도구는 운송사별 레이아웃을 알 필요가 없습니다. 운송사와 화주가 데이터를 표현하는 모든 다양한 방식을 통해 각 데이터 유형이 어떻게 생겼는지 알아야 합니다.
일괄 처리: 다중 운송사 BOL, 하나의 스프레드시트
BOL 추출은 일괄 처리할 때 진정한 가치를 발휘합니다. 한 번에 하나의 문서가 아니라 수십 또는 수백 개를 한 번에 처리하는 것입니다. 여기서 일괄 우선 처리 설계 가정이 중요해집니다.
아침 이메일에서 80개의 BOL을 처리하는 포워더를 생각해보세요. 이 80개 문서는 12개 운송사에서 올 수 있고, 네 가지 BOL 유형(해상, 하우스, 마스터, 직선)에 걸쳐 있으며, 깨끗한 디지털 PDF와 지역 트럭킹 회사의 스캔된 카본 카피가 섞여 있습니다. 확장 가능한 워크플로우는 다음과 같습니다:
1. 모든 BOL을 한 번에 업로드합니다. 운송사별로 분류하거나 BOL 유형별로 사전 분류할 필요가 없습니다. 배치는 PDF, JPG, PNG 및 여러 페이지 문서를 가리지 않고 받아들입니다.
2. 열을 한 번 정의합니다. 동일한 15~20개 열 이름이 배치의 모든 BOL에 적용됩니다. AI가 매핑을 처리합니다. 직선 BOL(HBL/MBL 상호 참조 없음)을 만나면 해당 열을 비워둡니다. 여러 줄 화물 그리드가 있는 해상 BOL을 만나면 품목 라인별로 별도 행으로 확장합니다. 문서별 설정이 필요 없습니다.
3. 예외 사항만 검토합니다. AI가 높은 신뢰도로 추출한 필드는 자동으로 통과됩니다. 신뢰도가 낮은 필드(희미한 카본 카피 중량, 번진 봉인 번호)는 사람 검토를 위해 표시됩니다. 물류 담당자는 80개 문서 배치당 5~10개의 표시된 필드를 확인하며, 1,200개 필드를 수동으로 입력하지 않습니다. 이것이 데이터 입력 노동을 대체하는 것과 단순히 "데이터 검토"로 이름만 바꾸는 것의 차이입니다.
4. 하나의 출력 파일. 결과는 단일 Excel 스프레드시트입니다. BOL당 한 행(또는 여러 줄 선적의 경우 품목 라인당 한 행)이며, 정의한 필드와 일치하는 열이 있습니다. 이 출력은 스프레드시트 네이티브입니다. Excel 또는 Google Sheets에 바로 들어가 TMS 가져오기 준비가 됩니다. Google Sheets를 사용하는 팀의 경우 BOL-to-TMS 워크플로우는 사이드바 애드온을 통해 스프레드시트 내에서 추출을 실행하여 파일 전달 단계를 완전히 없앨 수 있습니다. 통합 오버헤드 없이 일괄 처리를 확장하는 방법에 대한 자세한 내용은 다중 운송사 배치 BOL 추출을 참조하세요.
내보내기 옵션: 추출된 데이터를 필요한 곳으로 전송하기
추출된 BOL 데이터의 목적은 단 하나, 다른 시스템에 입력하는 것입니다. 어떤 시스템이냐는 운영 방식에 따라 다릅니다. 선택한 내보내기 경로에 따라 추출과 워크플로우 사이에 남아 있는 수동 작업의 양이 결정됩니다.
Excel / CSV 내보내기
대상: 파일 업로드로 TMS에 데이터를 가져오는 팀
추출된 BOL 데이터를 XLSX 또는 CSV로 다운로드하세요. 열을 TMS 가져오기 템플릿(CargoWise, Descartes, McLeod 등 CSV 가져오기 지원)에 매핑하세요. 파일 하나, 가져오기 한 번, 타이핑 불필요.
Google Sheets 애드온
대상: 스프레드시트로 운영하는 팀
Google Sheets 사이드바 애드온을 사용하면 추적 스프레드시트를 떠나지 않고 BOL을 업로드하고, 추출 열을 정의하며, 구조화된 데이터를 현재 시트에 직접 추가할 수 있습니다. 팀이 이미 사용하는 도구 내에서 추출이 이루어집니다.
API 통합
대상: 자체 시스템을 사용하는 대량 운영
REST API가 BOL 파일을 수신하고 프로그래밍 방식으로 구조화된 데이터(필드별 신뢰도 점수가 포함된 JSON 또는 CSV)를 반환합니다. 시스템은 신뢰도가 낮은 추출을 자동으로 사람 검토로 보내고, 신뢰도가 높은 결과는 TMS에 직접 푸시할 수 있습니다.
올바른 내보내기 경로는 볼륨과 기술 리소스에 따라 달라집니다. 하루 50건의 BOL이라면 Excel 내보내기 + TMS 가져오기로 충분합니다. 하루 500건이 되면 수동 파일 전달이 새로운 병목 현상이 됩니다. 대부분의 팀은 Excel 내보내기로 시작하고, 볼륨이 개발 작업을 정당화할 때 API 통합으로 전환합니다. 추출 엔진은 두 경로를 모두 지원해야 내보내기 방법을 변경할 때 도구를 바꾸지 않아도 됩니다.
BOL 추출 도구 선택 방법
다섯 가지 기준이 실제 업무용 BOL 볼륨을 처리하는 도구와 깨끗한 디지털 문서를 가끔 사용하는 도구를 구분합니다.
1. 운송사별 설정 없이 다중 운송사 처리. 핵심 테스트: Maersk 해상 BOL, MSC 해상 BOL, Old Dominion 직송 BOL, 지역 LTL 운송사의 스캔된 카본 사본을 동일한 배치, 동일한 열 정의로 처리하고 단일 템플릿도 생성하지 않아야 합니다. 도구가 운송사별로 필드 위치를 정의하도록 요구한다면, 추출 도구가 아닌 템플릿 유지보수 작업을 구매하는 것입니다.
2. 표준 코드 검증 및 정규화. 도구는 컨테이너 번호를 ISO 6346 체크 디지트 규칙에 따라 검증하고, 항구 이름을 표준 형식(이상적으로는 UN/LOCODE)으로 정규화하며, "Maersk", "MAERSK LINE", "MAEU"가 동일한 운송사를 의미함을 인식해야 합니다. 이 계층이 없으면 수동 입력을 수동 데이터 정리로 대체하는 것일 뿐, 동일한 노동력에 다른 단계일 뿐입니다.
3. 다중 페이지 및 라인 항목 수준 추출. 컨테이너 화물이 포함된 해상 BOL은 종종 3~5페이지에 달합니다. 상품 설명, 컨테이너 번호, 봉인 번호, 패키지 수량이 계속 페이지에 걸쳐 분산됩니다. 첫 페이지만 읽는 도구는 데이터의 절반을 추출하지 못합니다. 각 상품 행이 별도의 데이터 행이 되는 라인 항목 지원은 통관 분류 및 재고 조정에 필수적입니다.
4. 필드 수준 신뢰도 점수. 실제 물류 운영에서 받는 다양한 문서 품질에 대해 100% 완전 자동 처리를 달성하는 추출 도구는 없습니다. 중요한 것은 도구가 어떤 필드를 확신하지 못하는지 알려준다는 점입니다. 추출된 각 필드별 신뢰도 표시기(높음/중간/낮음)를 통해 팀은 불확실한 추출(일반적으로 필드의 5~10%)만 검토하고 나머지는 하위 시스템으로 직접 흐르도록 신뢰할 수 있습니다.
5. 일괄 처리 우선 설계 및 통합 출력. 하루 5건의 선적에서는 BOL을 하나씩 처리해도 괜찮습니다. 50건에서는 배치 업로드, 배치 처리, 단일 통합 출력(하나의 스프레드시트, BOL당 한 행, 한 번의 내보내기 단계)이 필요합니다. 도구는 처음부터 배치 워크플로우를 위해 설계되어야 하며, 다중 선택 대화상자 뒤에서 문서를 순차적으로 처리하는 "배치 모드"를 나중에 추가한 것이 아니어야 합니다.
실제로 받는 BOL, 실제로 거래하는 운송사의 문서로 이 기준을 테스트하십시오. 단일 운송사의 깨끗한 디지털 BOL 데모는 화요일 아침 15개 운송사에서 온 40개의 BOL 배치를 도구가 어떻게 처리하는지에 대해 아무것도 증명하지 않습니다.
자주 묻는 질문
AI 추출이 처리할 수 있는 BOL 유형은 무엇인가요?
템플릿 없는 AI 추출 도구는 동일한 설정으로 모든 주요 BOL 유형(직선 BOL, 해상 BOL, 복합/복합운송 BOL, 마스터 BOL(MBL), 하우스 BOL(HBL))을 처리합니다. AI는 템플릿 위치가 아닌 의미를 기준으로 필드를 식별하므로, 트럭 운송 회사의 직선 BOL과 머스크의 해상 BOL이 동일한 열 정의를 통해 처리됩니다. BOL 유형별 필드(예: 마스터 BOL을 참조하는 HBL 교차 참조 번호)가 있는 문서의 경우, 모든 문서 유형에 필요한 필드의 합집합을 정의하면 도구가 특정 문서에 없는 필드는 비워둡니다.
BOL 추출 시 ISO 6346에 따라 컨테이너 번호를 검증할 수 있나요?
일부 도구는 가능하지만, 모든 도구가 그렇지는 않습니다. ISO 6346 컨테이너 번호 검증(소유자 코드와 일련번호에서 체크 디지트를 계산하여 추출된 디지트와 비교)은 추출 후 검증 계층으로, 전사 오류가 TMS에 도달하기 전에 포착합니다. 컨테이너 검증이 워크플로에 중요하다면(해상 화물을 처리하는 경우 중요해야 함), 공급업체에 추출 파이프라인에 이 단계가 포함되어 있는지 확인하세요. 추출된 체크 디지트와 계산된 체크 디지트가 일치하지 않으면 해당 필드에 사람의 검토가 필요함을 표시해야 합니다.
BOL 추출이 필기 입력과 독(dock) 수준 BOL을 처리할 수 있나요?
네, 한계는 있습니다. 최신 비전 AI 모델은 판독 가능한 필기(인쇄된 블록체, 대부분의 필기체, 운전기사가 일반적으로 명확하게 작성하는 BOL 번호 및 개수와 같은 표준화된 필드)에서 BOL 필드를 높은 정확도로 읽을 수 있습니다. 그러나 심하게 바랜 카본지, 필기 위에 겹쳐진 스탬프, 또는 스캔 가능한 표시를 생성하기에는 펜 압력이 너무 약한 문서에서는 정확도가 떨어집니다. 이러한 경우, 잘 설계된 추출 도구는 추측을 출력하는 대신 낮은 신뢰도 점수로 필드를 표시하여 사람이 검토하도록 합니다.
추출 시스템은 화물 세부 정보가 계속 페이지에 있는 다중 페이지 BOL을 어떻게 처리하나요?
최신 추출 시스템은 다중 페이지 BOL의 모든 페이지를 단일 문서로 수집하고 추출된 필드를 하나의 출력 레코드로 병합합니다. 당사자 정보(송하인, 수하인, 통지 당사자)는 일반적으로 1페이지에 있습니다. 화물 세부 정보, 컨테이너 번호, 봉인 번호 및 패키지 수는 종종 계속 페이지에 나타납니다. 도구는 이들이 동일한 선적에 속한다는 것을 인식하고 결합합니다. 여러 줄의 화물 설명의 경우 각 상품 라인은 헤더 필드(BOL 번호, 송하인, 항구)가 반복된 별도의 출력 행이 됩니다. 이는 TMS가 라인 항목 수준 데이터에 대해 기대하는 형식입니다.
AI가 하우스 BOL과 마스터 BOL을 구분할 수 있나요?
네. 하우스 BOL과 마스터 BOL은 발행자 정보가 구조적으로 다릅니다. HBL은 포워더(일반적으로 포워더의 로고와 연락처 세부 정보 포함)가 발행하고, MBL은 선사가 발행합니다. AI는 이러한 구조적 차이를 인식하고 동일한 배치에서 두 유형을 모두 추출하여 공통 필드(항구, 컨테이너 번호, 송하인, 수하인)를 동일한 열에 매핑하면서 HBL 참조 번호나 선사 예약 번호와 같은 유형별 필드는 별도로 처리합니다.
선사가 동일한 BOL 필드에 다른 이름을 사용하면 어떻게 되나요?
이것이 바로 의미론적 추출이 템플릿 기반 접근 방식보다 확실히 우세한 부분입니다. 선사 A가 필드를 "Shipper"로, 선사 B가 "Shipper/Exporter"로, 선사 C가 "Consignor"로 표시할 때 AI는 이 세 가지 모두 동일한 주체, 즉 운송을 위해 화물을 제공하는 당사자를 의미한다는 것을 이해합니다. 출력 열을 "송하인 이름"으로 한 번 정의하면 AI가 각 선사의 변형을 해당 열에 자동으로 매핑합니다. 선사별 필드 매핑, 변환 테이블 또는 "선사가 Maersk이면 A열, 선사가 MSC이면 B열"과 같은 로직이 필요하지 않습니다.
추출된 BOL 데이터를 TMS에 직접 입력할 수 있나요?
대부분의 추출 도구는 Excel 또는 CSV로 내보내며, 이를 플랫폼의 표준 가져오기 기능을 통해 TMS로 가져올 수 있습니다. CargoWise, Descartes, Turvo, McLeod와 같은 플랫폼은 구조화된 파일 가져오기를 지원합니다. 추출 결과를 내보내고 열을 TMS 가져오기 템플릿에 매핑한 후 업로드하면 됩니다. 파일 전달 없이 직접 푸시하려면 REST API가 있는 도구를 프로그래밍 방식으로 통합할 수 있습니다. 팀이 Google Sheets를 통해 운영을 실행하는 경우 사이드바 애드온 접근 방식을 사용하면 TMS 가져오기에 사용되는 스프레드시트에 BOL 데이터를 직접 추출할 수 있습니다. 파일 다운로드 및 업로드 주기가 필요 없습니다.
각 선사별 BOL에서 기대할 수 있는 정확도는 어느 정도인가요?
최신 AI 추출 기술은 주요 선사(Maersk, MSC, CMA CGM, Hapag-Lloyd, COSCO, ONE, Evergreen)의 깨끗한 디지털 BOL에서 95~99%의 필드 수준 정확도를 달성합니다. 저해상도 스캔본, 심한 카본지 훼손, 또는 수기로 작성된 독(Dock) BOL의 경우 정확도는 떨어지지만, 동일 문서에 대한 템플릿 OCR 방식보다는 여전히 훨씬 우수합니다. 중요한 지표는 단순 정확도가 아닌 신뢰할 수 있는 처리량입니다. 즉, 수동 개입 없이 통과되는 BOL의 양을 의미합니다. 신뢰도 점수와 함께 95%의 필드 수준 정확도를 확보하면, 약 5%의 필드만 검토하면 됩니다. 20개 필드 추출 기준으로 BOL 한 건당 대략 한 개의 필드만 확인하면 되는 셈입니다. 이는 80건의 문서 배치에서 80개 필드를 검토하는 것과 1,600개 필드를 수동으로 입력하는 것의 차이입니다.
BOL 추출이 관세사를 대체하나요?
아닙니다. BOL 추출은 데이터 입력 단계, 즉 BOL에서 필드를 읽어 구조화된 형식으로 변환하는 작업을 자동화합니다. 이는 면허를 소지한 관세사가 제공하는 규제 판단(HS 코드 분류 결정, 관세 평가, 자유무역협정(FTA) 자격 판단, 수입 신고 전략 수립)을 대체하지 않습니다. 추출은 타이핑 작업을 없애주어, 관세사가 전문성이 필요한 분류 및 규정 준수 결정에 시간을 집중할 수 있게 합니다. 추출이 광범위한 물류 문서 환경에서 어떻게 활용되는지에 대한 자세한 내용은 BOL 추출이란 무엇인가에 대한 가이드를 참조하십시오.
선적 데이터 확보를 위한 BOL 추출과 EDI의 차이점은 무엇인가요?
EDI(전자 데이터 교환)는 선사로부터 직접 구조화된 선적 데이터를 제공하므로 추출이 필요 없습니다. 그러나 EDI는 선사별 설정, 테스트, 지속적인 유지보수가 필요하며, 많은 중소 선사와 포워더는 이를 지원하지 않습니다. 실제로 대부분의 물류 운영은 주요 선사와의 정규 항로에는 EDI를, 나머지 업체로부터는 PDF BOL을 받는 혼합 방식을 사용합니다. BOL 추출은 PDF 측면을 처리합니다. 두 접근 방식은 경쟁 관계가 아니라 상호 보완적입니다. 전체 비교를 보려면 EDI와 AI BOL 추출 비교를 참조하십시오.
선하증권(BOL) 추출은 느린 데이터 입력 프로세스를 빠르게 만드는 것이 아닙니다. 그 단계 자체를 없애는 것입니다. 즉, 작업자가 자신이 만들지 않은 문서에서 필드를 옮겨 적고, 외워야 했던 선사 약어를 사용하며, 오타가 있는지 알 수 없는 TMS에 입력하는 단계를 제거하는 것입니다. BOL이 수신함과 TMS 사이에 머무는 모든 시간은 고객이 화물을 추적할 수 없고, 세관 신고가 시작되지 않았으며, 실제 접수된 화물에 대한 운송업체 청구서를 확인할 수 없는 시간입니다. 추출은 그 시간을 단 몇 초로 단축합니다. 되찾은 시간을 어떻게 사용할지는 여러분의 몫입니다.