일본 납품서(納品書) 데이터를 엑셀로 추출하는 방법 — 다양한 공급업체 형식 대응

일본 납품서(納品書 nōsho)는 공급업체마다 형식이 다릅니다. AI 추출이 공급업체별 템플릿 설정 없이 다양한 형식의 납품서 데이터를 처리하는 방법을 알아보세요.

일본 납품서(納品書) 데이터를 엑셀로 추출하는 방법 — 다양한 공급업체 형식 대응

テンプレートベースのOCRが日本語の納品書で失敗する理由

テンプレートベースのOCRは、画面上のフィールドの位置を記憶することで機能します。仕入先Aの納品書レイアウト(納期は右上、注文番号はヘッダーの下、明細テーブルは12行目から)で学習すると、仕入先Aからの将来のすべての納品書からこれらのフィールドを正しく抽出します。ところが、仕入先Bから届いた納品書は、納期が左下、注文番号が参照行に埋め込まれ、明細テーブルが縦型レイアウトです。テンプレートは機能しません。30の仕入先を処理するには30のテンプレートが必要であり、仕入先がERPを更新してレイアウトが予告なく変更されるたびに、そのうちの1つが壊れます。

日本語の納品書は、西洋形式向けに作られた汎用的な納品書ツールでは対応できない3つの点で、テンプレート問題を増幅させます。複数の消費税率により、ツールが認識しない2つの税区分に金額が分割されます。日付は、西洋式の日付パーサーが誤読する和暦(令和)で表記されます。そして、日本のフォーマットの多様性は極めて高いです。弥生販売、freee、Money Forward、楽々シリーズ、カスタムERPエクスポートなど、異なる会計・販売管理システムで生成された納品書には共通のレイアウトがなく、さらに、手書きのカーボンコピー納品書(修理サービス、建設資材業者、中小規模の業者で今も広く使われています)は、ほとんどのOCRツールが学習していない日本語文字の手書き認識という課題をもたらします。

核心的な問題はOCRの精度ではありません。最新のAI-OCRエンジンは、きれいに印刷された納品書の個々の文字を高い信頼度で読み取ることができます。問題は、ツールがどのテキストがどのフィールドに対応するかを知らないことです。「令和7年6月10日」「T1234567890123」「¥140,000」をテキスト文字列として認識しても、各フィールドの意味を理解していなければ、「納期」「適格請求書発行事業者登録番号」「合計金額(10%課税)」にマッピングできません。これがOCRとカスタム列抽出の違いです。カスタム列抽出は、「納期」「注文番号」「仕入先名」といった意味に基づいて抽出したい列を定義し、AIが前回の位置を記憶するのではなく、その値が何を表すかを理解することで、画面上のどこにあっても対応する値を見つけ出すアプローチです。

수급·입고 업무에 중요한 納品書 필드

납품서 데이터를 Excel로 추출하기 전에 어떤 필드를 추출할지 결정해야 합니다. 일본 납품서(納品書)는 입고, 재고 전기, 3방 매칭(three-way matching)에 필요한 8~14개 필드를 포함하며, 인보이스 제도에 따라 적격 청구서 역할을 하는지에 따라 필드 수가 달라집니다.

일본의 납품서는 법적으로 정해진 형식이 없습니다. 국세청(NTA)은 세무 문서 목적으로 5가지 필수 항목을 정의하며, 2023년 10월부터 시행된 적격 청구서 제도(インボイス制度)는 납품서가 적격 청구서 역할을 할 때 3가지 항목을 추가로 요구합니다. 하지만 조달팀은 세무 최소 요건 이상이 필요합니다. 창고 관리 시스템, ERP의 입고 모듈, 구매 주문 정산 워크플로우에 필요한 필드가 있어야 합니다.

일본 입고 현장을 위한 최소 추출 컬럼 세트:

필드 (영문)일본어 라벨 예시후속 용도
공급업체명発行者名, 会社名, 納入元공급업체 마스터 레코드와 매칭; PO 발행자 확인
납품서 번호納品書番号, 伝票番号, No.입고 기록의 기본 키; 감사 추적
납품일納品日, 発行日, 取引年月日입고 로그; 해당 회계 기간 결정
구매 주문 참조発注番号, 注文番号, ご注文番号미결 PO와 3방 매칭
품목명 / 설명品名, 商品名, 品目재고 전기; PO 라인 항목 확인
수량数量, 個数재고 업데이트; 초과/부족 납품 감지
단가 (표시 시)単価가격 확인; 일부 납품서는 생략
라인별 금액 (표시 시)金額, 税抜金額입고 총액 집계; 일부 납품서는 합계만 표시
등록 번호 (적격 청구서)登録番号, T+13桁매입 세액 공제를 위한 적격 청구서 발행자 확인
세금 내역 (적격 청구서)10%対象, 8%対象, 消費税額소비세 신고를 위한 10% 및 8% 과세 금액 분리
수취인명宛名, 納品先, 御中올바른 법인으로 납품 확인; 비용 센터 배정

납품서가 적격 청구서(適格請求書) 역할을 하는 경우, 등록 번호(登録番号)세율별 소비세액(税率ごとの消費税額)은 선택 사항이 아닙니다. 누락 시 구매자는 해당 구매에 대한 매입 세액 공제를 청구할 수 없습니다.

適格請求書制度が納品書データ抽出に与えた影響

2023年10月以前は、納品書データの抽出は純粋な効率化手段でした。手入力の手間を省き、時間を節約できたのです。しかし2023年10月以降、適格請求書制度(インボイス制度)の導入により、納品書データ抽出にはコンプライアンスという新たな側面が加わりました。多くの抽出ツールは、この変化にまだ追いついていません。

旧制度の区分記載請求書等保存方式では、納品書に必要な基本項目は5つでした:発行者の名称、取引年月日、取引内容(軽減税率の対象品目である旨の表示)、税率ごとに区分した合計金額、および宛名。新しい適格請求書制度では、さらに3つの項目が追加されました:適格請求書発行事業者の登録番号(Tから始まる13桁)、区分ごとの適用税率、および税率ごとの消費税額。適格請求書として機能する納品書にはこれらすべての記載が必要であり、買い手は消費税法第30条に基づく仕入税額控除を受けるために、これを7年間保存しなければなりません。

つまり、抽出ツールは数年前までは任意だった項目を取得する必要に迫られています。さらに重要なのは、10%の標準税率と、飲食料品や新聞に適用される8%の軽減税率という二重税率構造です。そのため、1枚の納品書に、それぞれ異なる課税標準額と税額を持つ2つの税区分別小計が含まれる可能性があります。合計額を単一の数値として読み取り、税率ごとに区分しない抽出ツールが生成するスプレッドシートは、消費税申告には対応できません。

国税庁は、納品書と請求書を組み合わせて1つの適格請求書として扱うことを明示的に認めています。日本税理士会連合会のガイドラインによれば、明瞭な相互参照が行われている複数の書類(例:明細を記載した納品書と税額内訳を記載した請求書)は、まとめて適格請求書の要件を満たすことができます。つまり、納品書からの抽出結果は、後工程で請求書データと紐付けられるように構造化されていなければなりません。共通キーのない2つのスプレッドシートは無意味です。

適格請求書制度が購買業務全体の文書処理にどのような影響を与えるかについては、日本の適格請求書制度におけるデータ抽出ガイドをご参照ください。

複数サプライヤー形式の納品書データ抽出:ステップバイステップワークフロー

ここから理論から実践へとアプローチが変わります。弥生販売のエクスポート、freee生成PDF、マネーフォワードの印刷物、手書きのカーボンコピー、そしてサプライヤー内部システムが生成する独自フォーマットまで、様々な納品書を扱うことになります。抽出方法は1つのカラム定義ですべてに対応する必要があります。30ものテンプレートを管理するのは自動化の目的に反するからです。

1

추출할 열을 한 번만 정의하세요

픽셀 위치가 아닌 의미로 필요한 필드 이름을 지정하세요. "납품일(納品日)"은 AI가 페이지 내 어디에 있든 납품일을 찾도록 합니다. "품목명(品名)"은 테이블, 세로 목록, 바코드 옆 등 모든 라인 항목 설명을 찾습니다. "발주번호(発注番号)"는 공급업체가 "ご注文番号" 또는 "注文番号"로 표기해도 참조 번호를 찾습니다. 입력한 열 이름이 출력 스프레드시트의 헤더가 됩니다. 이 열 세트를 템플릿으로 저장하면 한 번 정의해 모든 공급업체에 사용할 수 있습니다.

2

하루치 납품서를 한 번에 업로드하세요

입고장에서 종이 납품서를 스캔하세요. 이메일 첨부 파일에서 공급업체 PDF를 업로드하세요. 트럭 문에서 스마트폰으로 카본지 납품서를 촬영하세요. 모든 것을 한 배치에 넣으세요. AI가 PDF, 스마트폰 카메라 JPEG, 스캔 이미지를 동시에 처리합니다. 혼합 형식, 혼합 공급업체, 한 번의 업로드.

3

AI가 필드 위치가 아닌 의미로 각 납품서를 읽습니다

각 문서에 대해 AI가 전체 페이지를 읽고, 각 열 정의에 해당하는 텍스트를 식별하여 값을 추출합니다. 헤더 수준 필드(공급업체명, 납품서 번호, 납품일)는 모든 라인 항목 행에 반복되어 스프레드시트가 관계형을 유지합니다. 라인 항목 필드(품목명, 수량, 단가)는 문서가 사용하는 테이블 또는 목록 구조에서 행별로 추출됩니다. 6열 테이블의 弥生 형식도 세로 목록의 세 필드가 있는 수기 납품서도 동일하게 작동합니다.

4

검토 후 Excel로 내보내기

출력은 구조화된 테이블로 표시됩니다. 라인 항목당 한 행, 헤더 필드가 반복되고 모든 값이 표준 형식입니다. 경계 사례를 검토하세요: 모호한 수기 수량, AI가 수동 확인을 요청한 날짜 등. 확인 후 XLSX로 내보내세요. 파일은 WMS, ERP에 가져오거나 스프레드시트에서 구매 주문서와 대조할 준비가 됩니다. 시스템이 CSV를 수락하면 대신 내보내세요. 형식 변환, 수동 재입력이 필요 없습니다.

この方法が機能するのは、AIがテンプレートではなく意味を照合しているからです。弥生販売の納品書でヘッダーに「納品日」とあるものも、freeeのものでフッターに「発行日」とあるものも、どちらも納品日を含んでいます。「納品日」列は、ツールにページ上のどこを探すかを指示しなくても、両方を見つけ出します。バッチ処理による納品書処理の詳細な手順については、納品書と配送伝票を1つの受領スプレッドシートにまとめるガイドをご覧ください。

JPG/PNG/PDF AI抽出

ファイルは安全に処理され、保存されることはありません。

日本特有の抽出課題への対応

日本の納品書には、汎用ツールでは対応できない4つの抽出課題があります。これはOCRの精度の問題ではなく、ツールが読み取った内容を解釈するための日本特有のコンテキストが不足しているためです。

和暦の日付

令和7年6月10日と記載された納品書は、西暦2025年6月10日です。令和は2019年5月から始まりました。その前は平成(1989年1月~2019年4月)、さらにその前は昭和(1926年12月~1989年1月)です。長年の取引先からの納品書には、テンプレート作成時期に応じていずれかの元号が使われている場合があります。「令和7年6月10日」をそのままテキスト抽出するツールでは、ユーザーが手作業で日付を変換する必要があります。日本対応の抽出ツールは元号を認識し、自動で変換して標準的な日付形式(2025-06-10またはJune 10, 2025)を出力します。手動で行うと1枚あたり30秒かかり、100枚の納品書では日付だけで50分の作業になります。

複数税率

2019年10月以降、日本では標準税率10%と、飲食料品(酒類・外食を除く)および定期購読新聞等に対する軽減税率8%が適用されています。食品卸売業者の納品書1枚に、野菜箱(8%)と清掃用品(10%)のように両方の税率が混在することがあります。納品書には税率区分ごとに小計と税額が記載されています。すべてを1つの「合計」列にまとめて抽出するツールでは税区分が失われ、消費税申告に使えなくなります。列定義には「10%対象」「8%対象」「10%消費税」「8%消費税」のように区分を設ける必要があります。

手書き・複写式納品書

日本では現在も、修理業者、建材業者、小規模メーカー、個人事業主などが手書き納品書をよく使います。複写式納品書は複数の層からなり、1枚目は受取人、2枚目は発行元が保管します。倉庫に届く頃には、3世代目のカーボン複写で文字がかすれ、インクがにじみ、印鑑が文字の上に押されていることもあります。欧米のきれいなレイアウトで学習した一般的なOCRでは、不規則な手書き文字、劣化したカーボン転写、赤インクの印鑑の重なりという3つの課題に対応できません。文書全体を画像として読み取り、文字を孤立したグリッドではなく文書コンテキストの一部として理解するビジュアルAIモデルなら、これらの項目を抽出できます。手書き日本語の精度は印刷文字より低いため、手書き納品書には簡単な確認工程を設けてください。しかし、「AIが80%正しく読み取り、残り20%を修正する」のと、「ゼロからすべて手入力する」のとでは、その差が重要です。手書き文書の処理については、手書き納品書をExcelに抽出する方法のガイドをご参照ください。

회사 인감 및 도장 (印鑑 / 角印)

대부분의 일본 납품서에는 회사 인감(보통 角印(kakuin)이라는 사각형 도장)이 빨간색 잉크로 발행자 이름과 주소 위에 찍혀 있습니다. 이 도장은 진위를 증명하는 표시일 뿐 데이터 필드가 아니지만, 빨간색 잉크 오버레이로 인해 OCR 엔진이 그 아래 텍스트를 읽는 데 혼란을 줍니다. 더 나쁜 경우, 일부 공급업체는 납품일이나 총 금액 줄(가장 필요한 필드) 위에 도장을 찍기도 합니다. 문서 구조를 학습한 시각적 AI 모델은 오버레이된 인감과 그 아래 텍스트를 구분하여 인감을 무시하고 원본 텍스트를 추출할 수 있습니다. 이 기능은 일본 문서 추출의 기본 요건이며, 도구가 印鑑을 처리할 수 없다면 일본 납품서를 처리할 수 없습니다.

일본 문서 처리 생태계가 이러한 과제를 어떻게 해결하는지, freee의 내장 OCR부터 전용 AI 추출 서비스까지 비용 비교를 포함한 자세한 내용은 일본 중소기업을 위한 저렴한 추출 옵션 분석을 참조하세요.

FAQ

손으로 작성된 일본 납품서도 처리할 수 있나요?

네 — 컬럼명 추출의 기반이 되는 시각적 AI 모델은 인쇄된 일본어 텍스트와 필기체(혼합된 한자/가나 포함)를 모두 읽습니다. 필기체 필드의 정확도는 인쇄된 텍스트와 동일하지 않으며, 특히 획이 많은 복잡한 한자나 심하게 훼손된 카본 사본의 경우 그렇습니다. 하지만 검토 단계에서 완전한 수동 재입력 대신 예외 사례를 처리합니다. 납품서가 완전히 필기체인 경우, 출력 결과를 맹신하지 말고 확인하는 것이 좋습니다.

일본 연호(令和/平成/昭和) 날짜를 처리할 수 있나요?

네. "납품일 (納品日)"과 같은 컬럼을 정의하면 AI가 연호 기반 날짜를 인식하여 출력 시 서양력으로 변환합니다. 令和7年6月10일은 사용자가 선호하는 형식에 따라 June 10, 2025 또는 2025-06-10이 됩니다. 이 변환은 추출 중 자동으로 이루어지며, 이후 Excel에서 수동으로 날짜를 수정할 필요가 없습니다.

一部の納品書に金額が表示され、他の納品書には表示されないのはなぜですか?

日本の調達業務では、納品書に価格の記載は必須ではありません。単価や行ごとの金額を含める仕入先もいれば、特に月次で合計請求書を発行する仕入先は、価格を完全に省略し、品名と数量のみを記載します。列定義に「単価」や「金額」などのフィールドを含めることができ、AIはそれらが存在する場合は抽出し、存在しない場合はセルを空のままにします。スプレッドシートは一貫性を保ち、価格の照合は後工程で請求書に対して行われます。

適格請求書としても機能する納品書からデータを抽出できますか?

はい。適格請求書の登録番号、10%税区分(10%対象額、10%消費税額)、および8%税区分(8%対象額、8%消費税額)の列を定義してください。AIはすべてのフィールドを同じスプレッドシート行に抽出します。納品書に適格請求書のフィールドがない場合、それらの列は空のままになります。抽出機能は、別々のテンプレートを必要とせずに、両方のタイプの納品書を同じバッチで処理します。

縦書きの納品書も抽出できますか?

一部の日本の納品書、特に伝統的な形式のものは、右側に受取人情報、左側に発行元情報を配置し、テキストを縦書きで配置します。AIのビジュアル言語モデルは、文書を画像として読み取り、テキストの流れの方向だけでなく、レイアウト構造を理解します。そのため、向きに関係なく、フィールドをその意味的な役割に基づいて特定します。ただし、横書きのレイアウトの方が精度は高くなります。仕入先が一貫して縦書き形式を使用する場合は、最初のテストバッチにいくつかのサンプルを含めて、その仕入先の特定のレイアウトに対する精度を評価してください。

freeeやMoney Forwardに組み込まれているOCRと比較してどうですか?

freee、Money Forward、弥生に組み込まれているOCRエンジンは、主にレシート(短く、単一形式で、既知の構造を持つ感熱紙の伝票)向けに設計されています。コンビニのレシートを読み取り、経費を自動分類するのは得意です。しかし、複数形式の仕入先納品書、特に明細行テーブル、複数の税率、横書き・縦書きが混在するレイアウトのものは、根本的に異なる文書です。組み込みのOCRは一部のフィールドを正しく抽出するかもしれませんが、明細行テーブルの構造、和暦の変換、税率の分割では通常失敗します。文書テンプレートではなくフィールドの意味で読み取る専用の納品書抽出は、まさにこのシナリオのために設計されています。

Excel 출력물을 가져올 수 있는 WMS 또는 ERP 시스템은 무엇인가요?

XLSX 또는 CSV 출력물은 입고 기록을 위한 스프레드시트 가져오기를 지원하는 모든 시스템(예: SAP, Sage, Microsoft Dynamics)과 일본 조달에서 널리 사용되는 弥生販売, freee, Money Forward, 楽々シリー즈 등 일본 특화 플랫폼으로 가져올 수 있습니다. 시스템이 수령 기록을 위한 CSV 가져오기를 지원한다면, 추가 변환 없이 출력물을 바로 사용할 수 있습니다.

일본식 납품서는 다른 납품서보다 읽기 어렵지 않습니다. 어려운 점은 대부분의 추출 도구가 납품서의 모양, 날짜 형식, 페이지에 포함된 세금 정보에 대해 다른 가정을 기반으로 학습되었다는 데 있습니다. 도구가 필드 위치 대신 필드 의미로 읽을 때, 이러한 가정은 더 이상 중요하지 않습니다. 弥生販売 PDF에서 데이터를 추출하는 동일한 열 정의가 freee 출력물, Money Forward 내보내기 파일, 그리고 여전히 회사 도장과 만년필을 사용하는 공급업체의 수기 카본 사본에서도 작동합니다. 스프레드시트가 먼저입니다. 수동 입력은 중단됩니다. 삼자 매칭이 시작됩니다.

📮 contact email: [email protected]