返送された納品書から印字された出荷データと手書きの受領確認を抽出する方法

納品書は、印字された出荷詳細と手書きの受領印が混在するハイブリッド文書です。AI抽出が両方のレイヤーを一度に処理する方法をご紹介します。

なぜ署名入り納品書は「2つの文書」なのか

サプライヤーの倉庫を出る納品書には、品目コード、出荷数量、注文番号、運送会社、出荷日という一つのデータセットが記載されています。これはサプライヤーが出荷したものの記録です。この書類は貨物とともに移動し、受け入れドックに到着すると、受取側の手書き注釈という第二のデータ層が追加されます。

これらの注釈はノイズではありません。受入チームによる運用上の判断であり、法的な重みを持ちます。統一商事法典（UCC第2条）の下では、例外事項を記載した署名入り納品書は、出荷が完全に受け入れられなかったことを示す文書証拠となります。注釈がなければ証拠はありません。受取人が、段ボール2箱が潰れていたことや、50ユニットのラインアイテムのうち15ユニットが不足していたことを記さずに署名した場合、サプライヤーは商品が完全な状態で受け入れられたと主張することができます。

課題は手順ではなく構造にあります。印刷データは設計上、機械で読み取れます。一方、手書きの受入確認情報（署名、破損コード、数量訂正、運転手IDメモ）は読み取れません。それらは紙の上にあり、人間の目には見えても、WMSやERPには見えません。受入チームがその日の業務を終えるとき、これらの注釈は物理的なコピーに残ります。デジタル記録にはサプライヤーのバージョンがあります。真実は紙の上にあるのです。

これが2層問題です。1枚の納品書、2つのデータシステム、そしてデジタル化されるのは片方だけ。

印刷層だけを読むと何が失われるのか

サプライヤーが出荷したものと、受取人が手書きで記録したものとの間のギャップは理論上の話ではありません。以下は、チームが印刷フィールドのみを抽出するときに消えてしまう4種類の受入注釈です。

数量訂正

明細行の横に「SKU 8842 3個不足」と走り書き。サプライヤーの印刷数量は25ユニット出荷と表示。受取人は22ユニットと数えた。この手書きメモがシステムに入力されなければ、発注書、納品書、サプライヤー請求書を照合するスリーマッチは、25ユニット分の全額支払いに対して請求書をフラグ付けします。買掛金チームには差し止める根拠がありません。

破損の記載

ページ上部に「段ボール2箱へこみ — 左隅」と書き込み。これは、サプライヤーが破損クレームを争う際に必要となる証拠です。デジタル化されていなければ、クレームは証跡のない電話連絡になってしまいます。

受領日時と署名

手書きの日付、時刻、受取人氏名は、出荷がいつ、誰によって受け入れられたかを確定します。納品が契約期間内に行われたかどうかの紛争において、これが主要な記録です。紙のままでは、デジタル監査では役に立ちません。

運送会社と運転手のメモ

「運転手：マイク、トラック42、午後2時15分」 — ドックと保管場所の間で商品が紛失した場合のトレーサビリティに不可欠です。

この層を失うコストは雪だるま式に膨らみます。たった一つの破損メモを見逃すだけで、売れない商品に200ドル支払うことになりかねません。中規模倉庫の標準的な量である1日50枚の納品書では、記録されていない受入例外による月間エクスポージャーは5桁に達する可能性があります。そして、それはあなたが知っているインシデントに過ぎません。

AIが両方のレイヤーを同時に読み取る仕組み

従来のOCRは、納品書を「フィールドの位置特定問題」として扱います。PO番号は座標X、出荷日は座標Yというように。しかし、サプライヤーがレイアウトを変更したり、印字された文字の上に手書きで書き込まれたりすると、その方法はすぐに破綻します。

Vision-Language Model（VLM）は、この問題に異なるアプローチで取り組みます。固定された座標でテキストを探す代わりに、文書全体を視覚的なシーンとして読み取ります。数量欄に印字された「12」と、その横に走り書きされた手書きの「10 ✓」が、同じデータポイントに関する異なる2つの主張であることを理解し、両方を別々の列に抽出できます。

これがカスタム列抽出の仕組みです。「PO番号」「SKU」「出荷数」「受領数」「破損メモ」「受領者」など、必要な列を定義するだけで、AIは各値をページ上のどこからでも、その「位置」ではなく「意味」を理解して見つけ出します。印字されたフィールドはサプライヤーのテンプレートから、手書きのフィールドは受領者の注釈から取得され、1つのスプレッドシートの同じ行に配置されます。

重要な転換点：手書きの記入を抽出の障害物として扱うのではなく、印字されたデータと同様に、レイアウト上の位置ではなく内容によって識別される、抽出すべきデータフィールドとして扱うことです。

手入力をやめよう — AIに読み取らせるだけ

画像やPDFをアップロード — 10秒で構造化データに

今すぐ試す →

登録不要 · カード不要 · 10秒で結果

ステップバイステップ：印字と手書きのフィールドを一度に抽出

署名済みの納品書の束を、出荷されたものと受領されたものの両方が含まれる1つのスプレッドシートに変換するワークフローは次のとおりです。

JPG/PNG/PDF AI抽出

ファイルは安全に処理され、保存されることはありません。

受け取りドックで署名済み納品書を回収する

ドライバーとの受け渡し後、受付担当者は注釈入りの控えを保管します。ドックで紙の納品書をスキャン（スマホ撮影でも300DPIで十分）、またはサプライヤーが出荷後にメールするPDFを収集します。重要なのは、署名済みの紙を引き出しにしまわないこと。アップロードしてください。

2つのデータ層の抽出列を定義する

ここで2層アプローチが具体化します。印刷層の列：PO番号、SKU、品目説明、出荷数量、出荷日、運送会社、サプライヤー。手書き層の列：受領数量、損傷メモ（テキストフィールド）、受領者、受領日時、署名ステータス（あり/なし）。これらを抽出インターフェースの列名として入力すると、AIが手書きの位置に関係なく、文書の該当部分からデータを自動入力します。

バッチをアップロードし、AIが両層を処理

朝の納品書をすべて1つのバッチでアップロードします（サプライヤーポータルからのPDF、ドックでスキャンした紙、受付チームが撮影した写真）。AIは各文書を列定義に照らして読み取り、印刷フィールドはサプライヤーのレイアウトから、手書きフィールドは受領者の注釈から抽出します。両方とも同じ構造化テーブルに行単位で整列されます。

例外のみ確認、全フィールドは不要

出力スプレッドシートでは、出荷数量（印刷）と受領数量（手書き）が並べて表示されます。受領者の数値がサプライヤーと異なる不一致は即座に確認可能。差異でフィルタリングし、該当行をサプライヤー請求プロセスに転送します。一致するものは追加対応不要です。50件の納品書の手動照合が、5分のフィルタ＆レビュー作業に変わります。

出力スプレッドシートの見た目

マージされた出力は、明細行ごとに1行で、両方のデータレイヤーにまたがる列が含まれます。構造は以下の通りです。

PO番号	SKU	出荷数	受領数	破損備考	受領者	受領日	ステータス
PO-8842	VT-334	50	47	3ユニット破損 — 箱の角が潰れている	M. Chen	2026-06-15	不一致
PO-8842	VT-338	100	100	—	M. Chen	2026-06-15	OK
PO-8912	SP-401	30	30	—	J. Rivera	2026-06-15	OK

ステータス列は推論列で自動生成できます。ステータス (選択肢: OK/不一致)のような列を定義すると、AIが破損備考と数量不一致を読み取り、正しい値を判定します。抽出と分類を1回のパスで実行するため、標準的なケースでは別途レビューステップは不要です。

下流システムとの連携では、このテーブルは3者照合ワークフローに直接投入されます。買掛金チームは、請求書を承認する前に、サプライヤーが出荷したと主張する数量ではなく、実際に受領したもののデジタル記録を入手できます。POはサプライヤーの主張と一致します。配送伝票の抽出結果は実際に到着したものと一致します。これらが一致しない場合、証拠書類とともに入金が保留されます。

よくある質問

納品書に手書きの注釈が密集している場合、手書き文字の抽出精度はどのくらいですか？

精度は読みやすさに依存します。丸で囲まれた数量、「ショート3」、署名など、明確な手書きの修正は確実に抽出されます。印刷文字の上に重ね書きされた密集した走り書き、ひどく擦れたカーボンコピー、水濡れした書類では精度が低下します。実際には、このワークフローはすべての項目を確認するのではなく、フラグが立った例外のみをレビューするように設計されています。AIは両方のレイヤーから可能な限り情報を抽出し、人間の解釈が必要な境界事例はレビューステップで捕捉します。それでも、すべての項目を手動で入力するよりはるかに高速です。

手書きの注釈が印刷テキストと異なる言語の場合でも機能しますか？

はい。視覚言語モデルは、印刷言語に関係なく手書き文字を読み取ります。納品書が英語で印刷されていても、受領担当者がスペイン語やフランス語で注釈を付けていても、AIは両方を抽出します。定義する列名が意味的な期待値を設定します。「受領数量」は、周囲のテキストの言語に関係なく、印刷された数量フィールドの近くにある数値の注釈を探すようにモデルに指示します。

出力で、異なる種類の手書き注釈を区別できますか？

受領数量、破損メモ、受領者など、注釈の種類ごとに個別の列を定義することで、各情報をそれぞれのフィールドに抽出するようAIに指示します。AIは、位置だけでなく、意味的なコンテキストに基づいて、数値の修正、テキストの破損メモ、署名を区別します。注釈が曖昧な場合、出力フィールドは空白または「不明」となり、レビュー時に簡単に識別できます。

受取人が何も注釈を付けず、納品書に署名だけがある場合はどうなりますか？

その場合、手書きレイヤーの列（破損メモ、受領数量調整）は空になり、ステータス列はデフォルトで「OK」になります。例外のない署名済み納品書は受領と見なされます。これは手動プロセスでもまったく同じ解釈です。違いは、デジタル記録によって、ドックで例外が記録されなかったことが正式に文書化される点です。これは「紙のコピーを紛失した」という証拠よりも強力です。

納品書以外に処理できる書類はありますか？

同じ2層抽出アプローチは、印刷データと手書き注釈が共存するあらゆる書類に適用できます。例えば、手書きの確認チェックマークが付いた梱包明細書、ドライバーメモ付きの配送証明書、検査官の注釈付きの入庫伝票、印刷テンプレートに現場所見が書き込まれた検査レポートなどです。抽出メカニズムはテンプレートベースではなくコンテンツベースであるため、書類間でフォーマットが変わってもワークフローが中断されることはありません。

サプライヤーが出荷したものと倉庫が受け取ったものとの間には、常にギャップが存在します。今や、納品書のどちらの面をデジタル化するかを選ぶ必要はありません。印刷された出荷データと手書きの受領確認の両方を抽出し、1つの構造化レコードに統合します。証拠が紙のままだという理由で紛争に負けることはもうありません。

署名済み配送伝票で試す