複数の仕入先からの納品書を一括処理して1つの受入台帳にまとめる方法

複数の日本の仕入先から届く1日分の納品書を、仕入先ごとにテンプレートを設定することなく、1つの受入台帳に一括処理します。

複数の仕入先からの納品書を一括処理して1つの受入台帳にまとめる方法

なぜ日本の入荷ドックは手作業のデータ入力に頼っているのか

製造業、小売業、Eコマースなど、さまざまな業界の物流を支える日本の3PL市場は、2031年までに483億8000万米ドルに達すると予測されています。しかし、トラックに何が積まれていたかを証明する書類は、今も30年前と同じ方法で処理されています。誰かがそれを読み、データを入力し、数字を打ち間違えていないことを願うだけです。

日本の倉庫管理システムは、ほぼすべての物理的なプロセスを自動化してきました。 ドックドアのバーコードスキャナーがパレットIDを読み取り、RFIDタグが在庫の位置をリアルタイムで追跡し、無人搬送車が人の介入なしにゾーン間で商品を移動させます。国内最大手の3PLである日本通運(NXグループ)は、入荷、保管、ピッキングをミリ秒単位で統制するWMSプラットフォームを運用しています。しかし、これらのシステムにはすべて同じ依存関係があります。つまり、動作を開始するために構造化データが必要なのです。WMSはデジタルトランザクションを受け取ると在庫レベルを更新できますが、そのトランザクションは、誰かが納品書を読み、データを入力した後にしか作成できません。

これは、日本の物流技術の失敗ではありません。これは、データ入力の問題を装った、書式の問題です。納品書は、2023年10月からインボイス制度によって標準化が進められている請求書とは異なり、日本の商法上、法的に必須の書類ではありません。納品書には、必須のフォーマットも必須項目もなく、PeppolやFactur-Xに相当するデジタル標準もありません。各サプライヤーは、自社のバックオフィスで作成される方法で、納品書を印刷、タイプ、または手書きしています。

日本の物流技術は、モノの移動を自動化しました。しかし、それらのモノを識別する書類を読み取ることは自動化していません。パレットのバーコードと、そのパレットがどの発注書に属するかをシステムに伝える納品書データとの間のギャップは、今も人間とキーボードによって埋められています。

なぜWMSはパレットを認識できても納品書を認識できないのか

このギャップがなぜ続くのかを理解するには、実際に日本の受け入れ現場に届くものを考えてみるとよいでしょう。

佐川急便が関西のメーカーからの出荷を届けます。納品書は印刷されたPDFで届きます—きれいなレイアウト、複数列の表、品目コードと数量が明確に表示されています。しかし、フィールド名は日本語(品名/数量/単位)、日付は和暦(令和8年6月16日)、仕入先名はヘッダーに「仕入先」という明示的なラベルなしで記載されています。

ヤマト運輸が北海道の食品サプライヤーからの出荷を運びます。納品書はヤマトの物流センターで発行された感熱紙の伝票で—レイアウト、フィールドラベル、列の順序がすべて異なります。埼玉の中小メーカーを担当する地元の運送会社は、手書きのカーボン複写の納品書とともに3つの箱を届けます。文字は走り書きで、数量は単位ではなく箱単位、仕入先名は印鑑で、印刷されたテキストではありません。

これら3つの書類—同じ30分の間に到着—は、まったく異なるフォーマットです。テンプレートベースのOCRツールでは、3つの異なるレイアウトに対して3つの別々のテンプレートが必要になります。来週、別のフォーマットの4社目のサプライヤーが現れれば、システムは再トレーニングが必要です。佐川急便が1月に納品書のテンプレートを変更した場合(実際にあります)、古いテンプレートは使えなくなります。これが、ほとんどの日本の物流企業が納品書の自動抽出に着手しない理由です:テンプレートのメンテナンスコストが、排除しようとしているデータ入力コストを上回るからです。

ボトルネックは、納品書のデータが複雑なことではありません。同じフィールド—仕入先名、納品日、発注番号、品目コード、数量—が、書類ごとに異なる場所に異なるラベルで表示されることです。従来の自動化の答え—フォーマットごとに1つのテンプレート—は、フォーマットの多様性の前で崩壊します。

日本の納品書のデータフィールドは驚くほど一貫しています。easymakedocsの納品書ガイドによると、標準的な要素は:書類タイトル(納品書)、納品書番号、納品日、顧客情報、仕入先情報、品目詳細(名称、数量、仕様、任意の単価)、および仕入先印鑑です。バリエーションは内容ではなくレイアウトから生じます。ヤマト運輸の納品書には、地元の運送会社の手書き伝票と同じ概念的なフィールドが含まれています—違いは、それらのフィールドがページ上のどこにあり、どのようにラベル付けされているかです。抽出の課題は、情報が異なることではありません。フォーマット間でそれらを見つけるには、フィールドがどこにあるかではなく、何を意味するかを理解する必要があることです。

バッチ処理:30枚の書類から1つの構造化された入庫記録へ

ここが、セマンティックな列名ベースの抽出がテンプレートOCRと異なる点です。サプライヤーAのレイアウトとサプライヤーBのレイアウトでフィールドの位置を認識するようにツールを訓練する代わりに、取得したいフィールドを一度だけ定義します。フィールドが何を表すかによって定義し、抽出エンジンはその意味を理解することで、バッチ内のすべての書類から各値を特定します。

ImageToTable.aiはカスタム列抽出を使用します。最終的な入庫記録に必要な列ヘッダー(「仕入先名」「納入日」「PO番号」「品目コード」「品目説明」「納入数量」「単位」)を入力すると、AIがバッチ内の各納品書を読み取り、ページ上のどこに表示されているかに関係なく各フィールドを特定し、対応する列に入力します。「仕入先名」という列は、ヘッダーに「株式会社〇〇」と印刷されていても、印鑑で押されていても、「納入元」とラベル付けされていても、仕入先を見つけます。抽出は位置ベースではなく、セマンティックだからです。

JPG/PNG/PDF AI抽出

ファイルは安全に処理され、保存されることはありません。

日本の物流入庫チームのワークフロー:

1
当日の入荷シフト分の納品書をすべて集めます。佐川の印刷PDF、ヤマトの感熱伝票、地元運送会社の手書きカーボンコピー、小規模業者からの配送書類のスマホ写真など、あらゆる納品書を1つのアップロードバッチにまとめます。フォーマットや運送会社、仕入先ごとに仕分ける必要はありません。
2
入荷記録の列を一度だけ定義します。日々の入荷記録に必要な列見出しを入力します:仕入先名、納品日、発注番号、運送会社、品番、品名、納品数量、単位。これらの列が出力の構造となり、各仕入先の書式にかかわらず、バッチ内のすべての納品書に適用されます。
3
確認するだけで、再入力は不要です。抽出は全書類に対して同時に実行されます。出力は1ページあたり5~10秒で生成され、全納品書の明細行が1行ずつ並んだ1つのExcelファイルになります。チームの作業はデータ入力からデータ検証に変わります:フラグが立った値を確認し、信頼度の低いエントリーを確認し、完成した入荷記録をエクスポートします。以前は手入力に2時間以上かかっていた30件のバッチ処理が、今では数分の確認作業で完了します。

効率化の効果は明確です。1ページの納品書の抽出処理は5~10秒で完了し、平均3分の手入力と比較して18倍の改善です。しかし、より重要なのはエラー削減効果です。1日30件の納品書、平均5明細の場合、手入力では約150のデータポイントが発生します。控えめに見積もっても1%の転記ミス率で、1日あたり1~2件のエラー(品番の桁違い、数量の小数点誤りなど)が発生します。これが1ヶ月で30~60件のエラーとなり、WMS、三者照合システム、買掛金ワークフローに波及します。バッチ抽出は確認作業を不要にするわけではありませんが、転記作業から確認作業へと変えることで、格段に速く、エラーも起こりにくくなります。

受領ログから3Wayマッチと電子帳簿保存法対応へ

受領ログは終着点ではありません。それは、日本の物流企業が正確に支払いを受け、監査対応を維持するために不可欠な、2つの重要な下流プロセスへの上流インプットです。

日本の電子帳簿保存法では、電子的に保存されたすべての取引書類は、取引年月日、取引金額、取引先の3つの基準で検索可能でなければなりません。年商5,000万円超の事業者にとって、これらの検索要件は必須です。

サプライヤーが任意に命名した30件のPDF納品書 — 「納品書_20260616.pdf」「delivery_sagawa.pdf」「Scan001.pdf」など — は、検索可能性のテストに不合格です。一方、サプライヤー名、納品日、発注番号、キャリア、品目コード、納品数量を各行に含む構造化されたスプレッドシートは、自動的に合格します。法律で検索が求められるすべての基準が、スプレッドシートの列になります。日付範囲フィルタリング、金額フィルタリング、取引先検索 — すべてがネイティブなスプレッドシート操作となり、手作業でのファイル単位の探索は不要です。

これは、文書自動化の議論で見落とされがちなバッチ抽出の副次的な利点です。納品書から構造化データを抽出する行為は、同時に日本の電子保存コンプライアンスを満たします。元のPDFは法定保存期間(消費税法上の取引書類は7年、会社法上の商業帳簿は10年)保持する必要がありますが、税務調査中の迅速な検索には、抽出されたスプレッドシートがチームが実際に使用するツールです。

受領ログはまた、サプライヤー支払いを承認する3Wayマッチプロセスに直接供給されます。標準的な日本の購買慣行では、納品書の数量と品目が発注書と請求書の両方に対して確認されるまで、請求書は承認されるべきではありません。これが発注書 → 納品書 → 請求書の検証チェーンです。しかし、3Wayマッチは、3つの文書すべてが構造化データである場合にのみ自動化できます。

1
発注書はERPまたはWMSに存在。 構造化されている。発注書には品目コード、数量、単価、納期スケジュールが含まれ、データベースフィールドで照合可能。
2
請求書の標準化が進展。 インボイス制度によりフォーマットが収束 — T+13桁の登録番号、軽減8%・標準10%の二税率区分、適格請求書には構造化された明細行。
3
納品書が欠落したリンク。 PDF・写真・手書き伝票など非構造化のままでは、三者照合に手作業が必須。経理は倉庫に確認を取るか、PDFから手入力するか、納品確認を省略して請求書を信頼する。最後の選択肢では、発注・納品・請求の差異が見逃される。

バッチ抽出でExcelやCSVに出力された構造化入庫記録が、三者照合のループを閉じる橋渡しとなる。抽出データはfreee、マネーフォワード クラウド、弥生、または自社WMSに直接インポート可能。SAPジャパン、GLOVIA smart(富士通)、EXPLANNER(NEC)を利用する企業では、CSV出力が標準の入庫トランザクション取込フォーマットに対応。三者照合は、書類ごとの手作業照合から、発注数量≠入庫数量の行のみを確認する体系的な例外レビューへと移行する。

主要キャリア(NX、佐川、ヤマト)と地場運送会社が混在する環境で、1日30件の仕入先納品を処理する物流企業にとって、構造化された入庫記録と非構造化の差は、2.5時間の手入力と5分のスプレッドシートレビューの差である。月20営業日換算で50時間の削減 — フルタイム相当以上 — を例外調査や運送会社との連絡など、キーボードでは自動化できない業務に充てられる。

よくある質問

大手キャリアと中小運送会社の両方の配送伝票に対応できますか?

はい。意味理解型の抽出は、各フィールドの意味を理解するため、画面上の位置に依存しません。「仕入先名」という列があれば、佐川急便のPDFのヘッダーに印刷されていても、カーボン複写伝票の印鑑として押されていても、地場運送会社の伝票に手書きされていても、仕入先を特定します。これが、レイアウトごとにテンプレートが必要なテンプレート型OCRとの根本的な違いです。入庫記録の列定義は一度行うだけで、すべての仕入先フォーマット(未見のものも含む)で機能します。

配送伝票が和暦(令和)を使用している場合はどうなりますか?

抽出結果は元の和暦形式を保持することも、エクスポート時に自動変換することも可能です。下流システム(例:ERPインポート)で西暦が必要な場合、ツールの後処理層がエクスポート時に「令和8年6月16日」を「2026-06-16」に変換します。「納品日」として列を定義し、出力形式を制御するだけです。手動での日付変換は不要です。

既存のWMS(SAP、GLOVIA、freee、MoneyForward)との連携は?

抽出結果(ExcelファイルまたはCSV)は、CSVインポートに対応するあらゆるWMSやERPに取り込めます。freeeやMoneyForwardはCSVベースの仕訳インポートに対応しています。SAPジャパンやオラクル・ジャパンもCSVベースの入庫トランザクション読み込みに対応しています。抽出工程とインポート工程は分離されており、データのシステムへの取り込み方法とタイミングを制御できます。日本の配送伝票抽出ワークフローについては、日本の配送伝票データをExcelに抽出するガイドをご参照ください。

手書きの日本語配送伝票は読み取れますか?

はい。ビジョンモデルは手書き文字を処理可能で、地場運送会社のカーボン複写伝票の日本語文字も対象です。手書きの精度は印刷文字より低くなります。特に、乱雑な筆跡、にじみ、コントラストの低い文字は注意が必要です。そのため、手書きフィールドは確認工程での簡易的な目視チェックが推奨されます。本ツールは低品質な入力に対して過度な信頼感を与えず、推測ではなく不確実性を提示します。30枚の配送伝票のうち3~5枚が手書きの場合、確認工程はそれら数枚に集中し、残りの25枚以上の印刷PDFはほぼ完全な精度で処理されます。

バッチ抽出は電子帳簿保存法に対応していますか?

バッチ抽出で作成される構造化されたスプレッドシートは、取引日・取引金額・取引先という3つの検索要件を満たします。スプレッドシートのフィルタ機能により、範囲指定や複合検索もネイティブで実行可能です。ただし、法律では原本の納品書ファイル(PDF、スキャン、写真)を法定保存期間中保管することが依然として義務付けられています。抽出されたスプレッドシートは検索可能な索引兼作業記録であり、原本ファイルが法的な保存資料です。両方の保存が必要です。検索要件の詳細については、国税庁の電子帳簿保存に関するガイドラインをご参照ください。

納品書兼請求書の場合はどうなりますか?

日本の一部の仕入先、特にB2B製造業では、納品書と請求書を兼ねた書類(納品書兼請求書)を発行します。これらの書類には、納品データ(品目説明、数量)と請求データ(単価、税内訳、支払条件)の両方が含まれています。複合書類をバッチ処理する場合、納品フィールドと請求フィールドの両方の列を定義することで、1回の処理で両方のデータセットを抽出できます。出力されるスプレッドシートでは、書類1件につき1行に全データが格納されるため、後続の入庫業務や買掛金業務のワークフローに合わせて列を分割・フィルタリングできます。

日本の物流企業はすべて、モノの移動を自動化しています。しかし、何が動いたかを証明する書類、すなわち納品書は、いまだに手作業で処理されている最後の紙書類です。バッチ抽出により、2.5時間かかっていたタイピング作業が5分のスプレッドシートレビューに変わります。そして生成されるデータは時間節約だけでなく、三者照合への対応、電子帳簿保存法の遵守、そして構造化されたデータ入力を待っていたすべての下流システムへの入庫記録の連携を実現します。

📮 contact email: [email protected]