配送・貨物書類データ抽出
完全ガイド
1回の国際貨物輸送には、船荷証券、貨物マニフェスト、パッキングリスト、商業送り状、原産地証明書、貨物運送状、場合によっては配送証明書——5~7種類もの書類が付随します。各書類は異なる当事者(運送会社、フォワーダー、倉庫、輸出者)によって、異なる目的(運送契約、貨物在庫、税関評価、請求)で作成されています。しかし、データ抽出の段階では、これらの情報を整合させる必要があります。パッキングリストの個数は船荷証券の個数と一致し、商業送り状のHSコードはマニフェストの申告内容と合致し、すべての書類に記載されたコンテナ番号は同一でなければなりません。これこそが貨物書類データ抽出の本質的な課題です——単一の書類を読み取ることではなく、すべての書類を同時に読み取り、共通項目を一致させることです。本ガイドでは、各貨物書類が保持するデータ、他の書類との重複箇所、そして書類一式を統合データセットとして抽出する方法を解説します。
船積書類エコシステム — 5つの書類、1つの貨物
データ抽出を始める前に、物流チームは抽出対象と書類間の関係を把握する必要があります。一般的なFCL(コンテナ一貫輸送)の海上貨物では、以下の5つの主要書類が作成されます。
| 書類 | 発行者 | 主な目的 | 共通の主要項目 |
|---|---|---|---|
| 船荷証券(BOL) | 運送人またはフォワーダー | 運送契約+権原証券 | コンテナ番号、港コード、荷送人/荷受人、重量、個数 |
| カーゴマニフェスト | 運送人または船舶代理店 | 航海における全貨物の目録 | BOL番号、コンテナ番号、HSコード、総重量、梱包数 |
| パッキングリスト | 荷送人/輸出者 | 貨物の品目別明細 | コンテナ番号、PO番号、品目説明、数量、正味/総重量、寸法 |
| 商業送り状 | 輸出者/売主 | 税関評価+支払記録 | HSコード、インコタームズ、総額、原産国、出荷参照番号 |
| 運賃請求書 | 運送人 | 運送サービスの請求 | BOL番号、コンテナ番号、料金、付帯サービス、支払条件 |
共通項目の問題は一目瞭然です。コンテナ番号はBOL、マニフェスト、パッキングリスト、運賃請求書に記載されます。BOL番号はマニフェスト、商業送り状、運賃請求書を結び付けます。総重量はBOL、マニフェスト、パッキングリストに記載されますが、単位が統一されていないことがほとんどです(BOLはキログラム、パッキングリストはポンド、マニフェストはメトリックトンで表示される場合があります)。各書類を個別に読み取る抽出プロセスでは、一致しない5つのデータセットが生成されます。一方、船積書類一式をまとめて読み取るように設計された抽出プロセスでは、それらの差異を検出できます。
セマンティックAI抽出がこれらの書類を従来のOCRとどのように異なる方法で処理するかについては、物流向けOCRガイドおよびAI OCRの基礎をご参照ください。
船荷証券 — マスタードキュメント
船荷証券は、輸送書類の中でも最も法的に複雑な書類です。これは同時に、貨物の受領証、運送契約、そして譲渡可能な形式では権原証書としての役割を果たします。フィールド数だけを見ても、ここでの抽出が容易でない理由がわかります。一般的な海上BOLは、複数の国際規格に準拠し、3〜5ページにわたって30〜40のデータフィールドを持ちます。
BOLの種類(ストレート、海上、マルチモーダル、マスター、ハウス)、抽出パイプライン、検証について詳しく解説したBOLデータ抽出の完全ガイドを公開しています。ここでは、クロスドキュメントパケットにおいて重要な、他のすべての輸送書類が参照するフィールドに焦点を当てます。
| フィールド | 例 | 検証基準 | 併記される書類 |
|---|---|---|---|
| コンテナ番号 | MSCU 234781 6 | ISO 6346 — 英字4桁+数字7桁、11桁目はチェックデジット | マニフェスト、パッキングリスト、運送請求書 |
| シール番号 | SH-789012 | 世界共通規格なし。船会社/ターミナルが付番 | マニフェスト、パッキングリスト |
| 積港/揚港 | CN SHA / NL RTM | UN/LOCODE — 5文字(国コード2文字+地点コード3文字) | マニフェスト、商業送り状(ルーティング欄) |
| SCACコード | MAEU(マースク) | NMFTA — 2〜4文字の船会社識別子 | マニフェスト(米国向けACE申告の場合) |
| 総重量 | 15,420 KGS | SOLAS第VI章規則2に基づくVGM(検証済総重量) | マニフェスト、パッキングリスト |
| 個数/梱包形態 | 500 CTNS on 10 PLTs | NMFC/業界慣行 | マニフェスト、パッキングリスト |
| HSコード(品目) | 6305.33 | 世界税関機構 — 最低6桁、米国輸入は10桁 | 商業送り状、マニフェスト |
SCACコードは、物流において最も誤抽出されやすいフィールドであるため、詳しく見る価値があります。BOLには船会社名が「Maersk Line」と印刷されていても、TMSはMAEUを期待する場合があります。別の船会社が、参照番号のように見えるSCACを自社名と併記することもあります。セマンティックAI抽出は、標準的なコードパターン(2〜4文字の大文字英字、多くの場合船会社名またはSCACラベルの近くにある)を認識し、船会社名全体とは別のフィールドとして抽出することでこれを処理します。しかし、すべての抽出ツールがSCACコードを探すように設計されているわけではありません。多くのツールは船会社フィールドを自由テキストとして扱い、システムがMAEUを必要としているにもかかわらず「Maersk Line」を出力します。
配送ラベルとそのデータポイントのフィールドレベルの精度分析については、関連記事AIは配送ラベルとマニフェストデータを抽出できるか?をご覧ください。
カーゴマニフェスト — 船積みレベルの在庫リスト
カーゴマニフェストとは、船舶、トラック、航空機、列車などの輸送手段に積載された全貨物の完全なリストです。個別の船積み契約であるBOLとは異なり、マニフェストは複数貨物の在庫リストであり、主に税関当局、港湾運営者、ターミナルハンドラーによって使用されます。
海上マニフェストは通常、船舶上のBOLごとに1行が割り当てられ、以下の主要な列で構成されます:
- マスターBOL番号 — 混載貨物をカバーする運送会社発行のBOL
- ハウスBOL番号 — 該当する場合、各荷主向けにフォワーダーが発行したBOL
- コンテナ番号 — 各BOLに関連するすべてのコンテナ
- 商品説明 — 多くの場合、省略またはグループ化(例:混載コンテナの「百貨店雑貨」)
- HSコード — 税関用の6~10桁の分類コード
- 総重量と容積 — BOLごとの合計
- 積港と揚港 — UN/LOCODE形式
- 荷主と荷受人 — 名称と住所
- 船舶名と航海番号 — 海上マニフェスト用
マニフェストの形式上の課題は、根本的に異なる2つの構造が存在することです。米国向け貨物のCBP準拠ACEマニフェストは、CBP 1301(入国カーゴマニフェスト)またはCBP 1302(出国)形式に従い、ISF申告に必要な特定のフィールドがあります。フォワーダーが内部で使用する商業マニフェストは、まったく異なるレイアウトを使用し、BOL単位ではなくコンテナ単位でフィールドをグループ化する場合があります。航空貨物マニフェスト(AWBマニフェスト)は、海上マニフェストとは異なるヘッダー構造(船舶名の代わりにフライト番号、MBL/HBLの代わりにMAWB/HAWB)を使用します。
抽出の課題は、マニフェストデータがコンテナレベルでBOLデータと整合する必要があることです。マニフェストにコンテナ MSCU 234781 6 が500カートンを運ぶと記載され、BOLが480カートンと記載されている場合、その20カートンの差はマニフェストの入力エラーかBOLのエラーのいずれかであり、税関または荷受人によって指摘されます。両方の文書を読み取り、処理中に共通フィールドを比較するセマンティック抽出により、この不一致が税関保留になる前に検出されます。
パッキングリスト — 品目レベルの明細
パッキングリストは、出荷書類の中で最も詳細な書類です。船荷証券(BOL)が総重量と総個数を示すのに対し、パッキングリストは各パッケージの中身をカートン単位、パレット単位で明らかにします。LCL(コンテナ未満混載)貨物の場合、パッキングリストはフォワーダーが複数の荷主からの貨物をどのように混載するかを示す書類です。
標準的なパッキングリストの項目は以下の通りです。
| フィールドグループ | フィールド | 抽出時の注意点 |
|---|---|---|
| 出荷識別子 | パッキングリスト番号、PO番号、インボイス番号、BOL番号、コンテナ番号 | PO番号は重要です。パッキングリストと注文書、商業送り状を結びつけるクロスリファレンスキーです |
| 当事者情報 | 荷主、荷受人、通知先、輸出者 | BOLと一致する必要があります。不一致は出荷途中のフォワーディング指示変更を示唆します |
| パッケージレベルの詳細 | カートン/パレットのマークと番号、パッケージタイプ(CTN、PLT、BNDL)、パッケージ数 | パッケージマークは手書きやスタンプの場合が多く、パッキングリスト抽出で最もエラー率の高いフィールドです |
| 品目レベルの詳細 | 品目説明、HSコード、パッケージあたり数量、単位(PCS、KGS、LBS)、正味重量、パッケージあたり総重量 | パッキングリストの品目説明はBOLよりも詳細です。「婦人用綿ニットセーター、色混在」とBOLの略称「婦人用セーター」の違いなど |
| 寸法 | パッケージあたりの縦×横×高さ、総容積 | 形式は様々です。「48x40x36 in」「120x100x90 cm」、または単一のCBM数値。容積重量計算(国内はDIM係数139、国際は6000)は正確な値に依存します |
パッキングリストは品目レベルの真実の書類として、出荷における最も重要なクロスドキュメントチェックの一つ、数量照合の基盤となります。商業送り状には2,000個、単価12.50ドルと記載されています。パッキングリストには2,000個、50個入りカートン40箱と記載されています。BOLにはカートン40箱と記載されています。これらの数値が一致しない場合、税関ブローカーはどの書類を信頼するか判断しなければなりません。3つの書類すべてを読み取る抽出ツールは、単一の照合列で不一致をフラグできます。
パッキングリストの形式は驚くほど多様です。メーカーのパッキングリストは、コンテナあたり50行の品目がある複数ページのExcelエクスポートの場合があります。フォワーダーのハウスパッキングリストは、同じ情報を商品ごとに1行にまとめる場合があります。混載コンテナのパッキングリストは、複数の注文書を1つのコンテナにマッピングする必要があります。これは、明細行の境界がPOの境界をまたぐため、従来のOCRツールでは困難な形式です。
商業送り状 — 税関評価書類
商業送り状は、税関が関税や税金を評価するために使用する書類です。梱包明細書(物理的な貨物に焦点を当てる)や船荷証券(運送に焦点を当てる)とは異なり、商業送り状は価値に関するものです。つまり、何が、いくらで、どのような取引条件で、どこで原産されたかが記載されます。
項目構成は標準的な売上請求書に近いですが、国際取引に特化した追加項目があります。
- 売り手と買い手 — 名称と住所(第三者物流業者が関与する場合、船荷証券の荷送人/荷受人と異なることがあります)
- 送り状番号と日付 — 輸出者の参照番号で、梱包明細書と相互参照されることが多い
- 出荷参照情報 — 注文番号、船荷証券番号、コンテナ番号、ブッキング番号
- 明細行 — 品名、HSコード、数量、単価、行ごとの合計金額
- インコタームズ — 運送料、保険料、関税の支払い責任者を決定する取引条件(FOB上海、CIFロッテルダム、EXW工場渡し、DDP買い手倉庫渡し)
- 原産国 — 商品が製造された国、または実質的な加工が行われた国
- 申告総額 — 関税計算の基準
- 通貨と支払条件 — USD、EUR、JPY;Net 30、T/T、L/C
商業送り状からのHSコード抽出は特に注意が必要です。なぜなら、これが誤っていると税関手続きの遅延を引き起こす最も可能性の高い項目だからです。6桁のHSコード(国際統一システムの最小単位)は、製品を特定の類、項、号に分類します。HSコードが誤っていると、誤った関税率が適用されたり、さらに悪い場合には、コードが品名と一致しないために貨物が検査対象としてフラグが立てられる可能性があります。HSコードを単なる英数字フィールドとして扱う抽出ツールは、WCO分類の最初の6桁に対して検証する機会を逃しています。HSコードのパターン(XXXX.XXまたはXXXXXX.XX)を認識し、それを商品の品名と相互検証する意味論的な抽出設定は、税関ブローカーが確認する前にこの問題を捕捉します。
商業送り状には、書類間で最も重要な参照フィールドであるインコタームも含まれています。インコタームは、船荷証券上の運送料が前払いか着払いか、誰が保険を手配するか、そして売り手から買い手へのリスクの移転地点を決定します。商業送り状から「FOB上海」を読み取り、船荷証券から「運送料着払い」を読み取りながら、その矛盾(ほとんどの運送会社の解釈ではFOBは着払い)をフラグ付けしない抽出は、税関で時間を浪費する調整を見逃すことになります。
運送請求書と配送ラベル
出荷書類一式を完成させる、さらに2つの書類があります。
運送請求書は、運送会社が発行する輸送サービスの請求書です。BOL番号とコンテナ番号を参照し、ライン haul 料金、燃料サーチャージ、シャーシレンタル、滞船料、滞留料、集荷・配送料、付帯サービス料など、料金の内訳が記載されています。運送請求書のデータ抽出における課題は、料金を読み取ることではなく、各料金を正しいBOLに紐付け、契約通りかどうかを確認することです。運送会社が、依頼していないリフトゲートサービスに対して250ドルを請求する場合もあります。運送請求書のデータ抽出では、買掛金チームがレート確認書や予約情報と照合できるよう、十分な参照データ(BOL番号、コンテナ番号、日付)を保持する必要があります。抽出設定に計算列を追加し、ライン haul 料金を既知の契約レートと比較して5%以上の差異をフラグ付けすることで、受動的な抽出結果を能動的な監査ツールに変えることができます。
配送ラベルは、ラストマイルの接点です。運送会社が印刷したラベルには、追跡番号、バーコード、送り主と受取人の住所、サービスレベル、荷物の重量、参照フィールドが記載されています。サーマルラベル、インクジェットラベル、手書き修正それぞれのフィールド別精度については、配送ラベルとマニフェストのデータ抽出に関する記事で詳しく解説しています。書類一式の抽出における重要なポイントは、配送ラベルの追跡番号がBOL番号またはマニフェスト内の相互参照と一致することです。一致しない場合、その出荷のラストマイル追跡は機能しません。
出荷書類一式のバッチ処理
1枚のBOLやパッキングリストを読み取ることは最低条件です。効率性の向上は、出荷書類一式(5種類以上の書類)を1回の操作でバッチ処理し、文書間のフィールドを同じ出力列にマッピングすることで実現します。
典型的な出荷書類一式のバッチ処理ワークフローは次のようになります。
重量一致?列や、ピース数を相互参照する数量一致?列などです。結果は単なる抽出データではなく、事前監査済みの出荷記録となります。このワークフローこそ、バッチファースト処理の設計思想です。5~15件の混在フォーマット書類をアップロードし、カラムスキーマを一度定義するだけで、検証済み・相互参照済みの単一の出力テーブルを得られます。キャリアごとのテンプレート設定や、書類タイプごとの再構成は不要です。
ファイルは安全に処理され、保存されることはありません。
フィールド検証 — 生テキストからTMS対応データへ
有用な抽出結果と単なるテキストダンプの違いは、検証レイヤーにあります。出荷書類は組み込みの検証ルールを持つコード体系を使用しており、これらのルールを適用する抽出ツールは、TMSや通関申告に到達する前にエラーを捕捉します。
| コード体系 | フォーマットパターン | 検証ルール | 誤りがあった場合の影響 |
|---|---|---|---|
| コンテナ番号(ISO 6346) | AAAA-NNNNNN-N英字4文字、数字6桁、チェックデジット1桁 | チェックデジットアルゴリズム:オーナーコード×位置重み、mod 11 | 運送会社の追跡システムが番号を拒否。3日間「コンテナが見つからない」状態となり、その間誰かが正しい数字を再入力する |
| UN/LOCODE | XX-YYY国コード2文字+地点コード3文字 | 国コードはISO 3166準拠、地点コードはUNECEマスターデータベースに存在する必要あり | "USNYC"は解決されるが、"USNYD"(文字入れ替え)はフォーマットチェックは通るものの、別の地点に解決されるか、まったく解決されない |
| SCACコード | AAAA英大文字2~4文字 | NMFTAに登録済みであること。アクティブな運送会社データベースと照合 | ACE eManifest申請が却下。CBPシステムで運送会社を特定できない |
| HSコード(統一システム) | XXXX.XX または XXXX.XX.XXXX | 最初の6桁はWCO分類に一致。7~10桁目は国別 | 誤った関税率が適用。税関検査が発生。貨物は再分類のため保留 |
| 日付(各種形式) | 06/30/2026、30-JUN-2026、2026-06-30 | ISO 8601に正規化。ありえない日付(月>12、出発日が未来など)を検出 | TMSが日付フィールドを拒否。日付形式の修正中に貨物のリリースが遅延 |
抽出時にこれらのルールを適用する検証パイプラインは、単にエラーを検出するだけではありません。手動でのクリーンアップを必要とせず、下流システムでそのまま使用できるデータセットを構築します。ISO 6346のチェックデジット検証を通過したコンテナ番号は、運送会社の追跡APIに直接送信できます。UNECEルックアップを通過したUN/LOCODEは、TMSのルーティングテーブルに読み込めます。商品説明と一致するHSコードは、自信を持って税関に提出できます。
検証なしでは、抽出は一見正しく見える生テキストのスプレッドシートを生成します。しかし、7桁目と11桁目が入れ替わっていたために運送会社の追跡APIが「コンテナが見つからない」と返すまで、その誤りに気づきません。この遅延により、1日あたり100~500ドルのデマレージ(延滞料)が発生します。これが、コスト削減につながる抽出と、別の種類のコストを生み出す抽出との違いです。
エクスポート戦略 — 最終スプレッドシートに含まれるもの
船積書類のデータ抽出は、データが使用可能な形式になるまで完了しません。出力戦略は、誰が使用し、どのシステムに取り込むかによって異なります。
文書単位の行。 パケット内の各文書が1行の出力行を生成します。BOL行にはすべてのBOLフィールドが含まれます。パッキングリスト行にはすべてのパッキングリストフィールドが含まれます。これにより各文書の詳細が完全に保持されますが、行を手動で相互参照する必要があります。各文書を個別に監査する必要があるチームに最適です。
出荷単位の統合行。 出荷ごとに1行で、列はソース文書ごとにグループ化されます:BOL_Container_Number、Manifest_Container_Number、PL_Container_Number、その後に照合列が続きます。これはAPチームや通関業者が好む形式です — 出荷のすべてのデータが1か所にあり、不一致が一目でわかります。
明細単位の行。 パッキングリストまたは商業送り状の明細ごとに1行で、出荷レベルのフィールド(コンテナ番号、BOL番号、港コード)が各行に繰り返されます。これは、明細レベルの詳細を必要とする在庫管理システムや関税計算エンジン向けの形式です。
ImageToTable.aiは、バッチ処理パイプラインを介してこれら3つの出力形式すべてをサポートしています。エクスポートトークンシステムを使用すると、Excelファイルをオンデマンドで生成し、アカウントを持たないチームメンバーと共有できます — 受信者はリンクを開いて出力をダウンロードします。これは、ツール自体へのアクセス権を各クライアントに与えることなく、出荷データをクライアントと共有する必要があるフォワーダーにとって特に便利です。
船積書類抽出におけるよくある落とし穴
適切なアプローチでも、船積書類抽出には自動処理に不慣れな物流チームを悩ませる罠があります。
すべてのBOLを同じ文書として扱うこと。 ストレートBOL、オーシャンBOL、マルチモーダルBOL、ハウスBOL、マスターBOLは名前は同じでも、フィールド構造と法的効力が異なります。ストレートBOL(荷主1、荷受人1、単純なルート)で機能する抽出設定では、ハウスBOLのHBL参照番号やマルチモーダルBOLの以降の運送条件を見逃します。解決策は、遭遇する最も複雑な文書タイプに合わせて列スキーマを設計し、より単純な文書はより少ないフィールドを入力させることです。
統合レイヤーを無視すること。 フォワーダーが5人の荷主からの出荷を1つのコンテナに統合する場合、パッキングリストは単一の文書ではなく、荷主レベルのパッキングリストと統合マニフェストの集合です。抽出設定は、コンテナ MSCU 234781 6 に5つの輸出業者からの15の個別の発注書が含まれ、それぞれに独自のPO番号、HSコード、原産国があることを理解する必要があります。コンテナごとに1行を出力するツールは、税関が必要とする明細レベルの詳細をすべて見逃します。
重量の正規化をスキップすること。 BOLに15,420 KGSと表示されている場合があります。マニフェストには34,000 LBS。パッキングリストには340 CWT(ハンドレッドウェイト)。これらは異なる単位での同じ重量ですが、生のテキスト抽出では3つの異なる数値として出力されます。すべての重量を単一の単位(キログラム)に正規化し、(単位換算後に)実際の不一致にフラグを立てる計算列により、重量関連の税関保留や運送会社の請求書紛争を防ぐことができます。
抽出時にコードを検証しないこと。 コンテナのチェックデジットが無効、存在しないUN/LOCODE、HSコードの不一致など、抽出時に検出されたエラーは修正にコストがかかりません。同じエラーが48時間後、ISF申告が提出され、貨物が積み込まれた後に発覚すると、米国税関国境警備局(CBP)の規制(19 CFR 149.3)に基づき、5,000ドルの修正罰金が科せられます。リアルタイム検証なしの抽出は、抽出ではなく、ただの高速入力です。
よくある質問
1つの抽出ツールで、すべての種類の船積書類(BOL、マニフェスト、パッキングリスト、商業送り状)を処理できますか?
はい、ただしツールがテンプレートベースのOCRではなく、セマンティック抽出を使用している場合に限ります。テンプレートツールでは、書類の種類とキャリアのフォーマットごとに個別の設定が必要であり、50以上のテンプレートを管理することになります。セマンティック抽出は、フィールドの位置ではなく意味に基づいて識別するため、「コンテナ番号」という同じ列定義が、フォーマットごとの設定なしに、マースクのBOL、MSCのマニフェスト、荷主のパッキングリストで機能します。重要な前提条件は、ツールのAIモデルが物流書類で学習されていることです。請求書のみで学習された汎用的な書類抽出モデルでは、SCACコードやコンテナ番号のパターンを見逃します。
レイアウトが異なる複数のキャリアの書類をどのように処理しますか?
セマンティックAI抽出により、キャリアごとのテンプレート問題は完全に解消されます。各キャリア(マースク、MSC、CMA CGM、COSCO、ハパックロイド)のBOLにバウンディングボックスを描く代わりに、「コンテナ番号」「積出港」「SCACコード」といったフィールドの意味で列を定義します。AIは、船積書類上のフィールドラベルとデータ値の意味的な関係を理解することで、あらゆるキャリアのレイアウト上の各値を特定します。キャリアが帳票を再設計しても、テンプレートを更新することなく抽出は新しいレイアウトで機能します。
AIは手書きのパッキングリストやBOLの手書きフィールドを読み取れますか?
最新のビジョンAIは、適切な品質の画像に対して85~95%の精度で手書き文字を読み取ります。これは、同じ手書き入力に対する従来のOCRの50~70%の範囲よりも大幅に高い精度です。ただし、精度はフィールドの種類によって異なります。構造化された手書きの数字(個数、重量、日付)は、筆記体の荷受人名よりも信頼性が高くなります。特に船積書類では、パッキングリストの手書きの荷印や、BOLの手書きの個数修正が最も一般的な手書き文字の課題であり、これらはキャリアの請求書紛争の原因となるフィールドであるため、正確に処理することが最も重要です。実用的なアプローチは、信頼度スコアが低い手書きフィールドを盲目的に信頼するのではなく、手動レビュー用にフラグを立てることです。
5ページの海上BOLのように、明細が2~4ページにまたがる複数ページの書類はどのように処理しますか?
適切に設計された抽出パイプラインは、複数ページの書類を1つの論理単位として扱います。AIは全ページを順次読み取り、出荷レベルのコンテキスト(1ページ目のBOL番号、荷主、船名)を明細ページに引き継ぎます。2ページ目から始まり3~4ページに続く貨物記述テーブルは、4つの個別の抽出ジョブに分割されることなく、1つの出力ブロックに統合されます。これには、書類とページの関係を理解するツールが必要です。これはすべての抽出ツールがサポートする機能ではなく、物流チームがBOLに請求書向けツールを使用する際の主な失敗要因の1つです。
運送書類抽出の標準的な出力形式は、Excel、CSV、JSONのどれですか?
物流チームにとって最も一般的な出力形式はExcel(.xlsx)です。計算列(照合数式)、複数シートのワークブック(書類タイプごとに1シート)をサポートし、ほとんどのTMSやERPシステムに直接インポートできるためです。CSVは軽量な代替形式で、EDIフィードやレガシーシステムへのインポートに適しています。JSONは、抽出データがAPIやカスタムアプリケーションに供給される場合に推奨されます。最適な抽出ツールは3つの形式すべてをサポートし、バッチごとに選択できます。このガイドで説明する出荷単位のワークフローでは、計算照合列を含むExcelが推奨形式です。
抽出時にコンテナ番号を検証するにはどうすればよいですか?
コンテナ番号はISO 6346形式に従います。大文字4文字(所有者コード+カテゴリ識別子)の後に7桁の数字が続き、7桁目は特定のアルゴリズムで計算されたチェックデジットです。検証パイプラインは、抽出されたすべてのコンテナ番号にチェックデジットアルゴリズムを適用します。計算されたチェックデジットが抽出されたチェックデジットと一致しない場合、その値は検証警告付きでフラグが立てられます。これにより、最も一般的なコンテナ番号入力エラー(数字の転記ミス)がTMSに到達する前に捕捉されます。チェックデジット検証に合格したコンテナ番号が正しいとは限りません(誤った所有者コードでも有効なチェックデジットが存在する可能性があります)が、入力エラーの95%以上を排除できます。
反復可能な出荷書類ワークフローの構築
出荷書類の抽出は、一度限りのデジタル化プロジェクトではありません。それは反復可能な運用プロセスです。毎日、船荷証券、マニフェスト、パッキングリスト、商業送り状、運送状がPDFや画像として届き、毎日、そのデータを手動入力なしでTMS、通関業者、買掛金システムに届ける必要があります。機能する抽出と新たな作業を生み出す抽出の違いは、ツールが書類一式全体を処理できるかどうかにあります。つまり、書類間のフィールドマッピング、コード検証、バッチエクスポートを備えているか、それとも書類の種類ごとに個別に抽出し、手作業で結果を結合する必要があるかです。
船荷証券を読み取って停止するツールは、マニフェスト、パッキングリスト、書類間の照合を行う前に、1つの書類を読んだに過ぎません。出荷を処理したことにはなりません。完全な抽出とは、書類一式を取得し、共有フィールドを検証し、不一致がすでにフラグ付けされ、コードが標準化されたデータセットを出力することです。これが、書類読み取りツールと出荷書類ワークフローの違いです。