スペインの納品書(Albaranes)から
Excelへデータを抽出する方法
ほとんどの文書抽出ツールは、すべての納品書を同じように扱います。しかし、スペインのアルバラン(納品書)は、バルセロナ、バレンシア、サラゴサの受入ドックで運用する際に重要な3つの点で、その前提を覆します。一般的な納品書テンプレートでは認識できない項目(例:8桁+1文字のパターンに従いチェック文字付きのNIF形式の税ID)があること、受領者による手書きの注釈がびっしりと記入されて戻ってくること、そしてスペイン商法では税務書類ではなく法的な納品証明として機能することです。この記事では、スペインのアルバランの全項目を解説し、なぜフォーマットの断片化がスペインの倉庫で特に深刻な問題となるのかを説明し、手作業によるキー入力なしで、クリーンで照合済みの納品データをスプレッドシートに取り込む方法をご紹介します。
重要ポイント
- スペインのアルバランは納品書のように見えますが、独自の法的な重みを持っています。141年の歴史を持つ商法(Código de Comercio)に基づき、倉庫から印刷されて出て行き、受領者の手書き注釈が付されて納品証明として戻ってくる唯一のサプライチェーン文書です。
- テンプレートベースの抽出ツールは、アルバランの2層構造に対応できません。手書きの修正をノイズとして破棄するか、印刷データと混在させてしまい、発注書、納品書、請求書の三者照合を破綻させる数量を生成します。
- カラム名ベースの抽出は、両方の層を意味で読み取ります。「出荷数量」と「受領数量」を一度定義すれば、ImageToTable.aiはサプライヤーごとのレイアウトに関係なく、すべてのフォーマットから各値を検出します。フォーマットごとに個別のテンプレートは不要です。
スペインの納品書には、一般的な納品書にはない法的な重みと、汎用テンプレートでは認識できない項目があります。
ヨーロッパのほとんどの国では、納品書は単なる出荷書類です。箱の中身を記載し、運転手が渡し、受取担当者が注文書と照合します。弁護士が目を通すことはまずありません。しかしスペインでは、アルバラン(納品書)は異なる位置づけにあります。商法典(1885年8月22日勅令)に基づき、アルバランは売買契約における引渡し(traditio)の証拠書類として機能します。税務上の書類ではなく、IVA(付加価値税)額も記載されません。しかし、商品の受け渡しが行われたことを法的に証明する書類なのです。
アルバランは、欧州のサプライチェーンにおいて、法的な受領証でありながら返送書類としても機能する唯一の出荷書類です。 サプライヤーが印刷し、商品と共に運ばれ、受取人が記入し、署名された控えがサプライヤーに返送されて証拠となります。ウィキペディアのアルバランの項目では、「注文の運送と引渡しを証明する商業文書」と明確に定義されています。受取側は、正しく受領したことを確認するために署名する必要があります。この署名により、単なる梱包明細書から法的記録へと変わります。
この法的な役割により、スペインのアルバランと一般的な納品書には構造的な違いが生じます。スペインのサプライヤー(バレンシア近郊のメルカドナの物流センターであれ、RSコンポーネンツ・エスパーニャのような産業用ディストリビューターであれ)からのアルバランには、英国のデスパッチノートやドイツのリーファーシャインにはない項目が通常含まれています。税IDはNIF(納税者識別番号)形式で表示されます。個人は8桁+チェック文字1文字、法人は1文字+7桁+チェック文字1文字です。サプライヤーと買い手の両方のNIFが書類に記載されます。納品書番号はサプライヤー固有の内部採番に従い、サプライヤー間で共通の基準はありません。そして重要なのは、アルバランは請求書に先行するため、納品書番号は後日、それを参照するファクトゥラ(請求書)と照合され、注文書との三者照合が可能になることです。
スペインのアルバランは、「いくつかの項目が追加された納品書」ではありません。 140年前の商法典、複数段階の照合ワークフロー、そして印刷されて倉庫を出て手書きデータと共に戻ってくるという物理的な旅路によって形成された書類カテゴリーです。一般的な納品書のレイアウトで学習された抽出ツールでは、NIFのチェック文字を見逃し、納品書番号をPO番号や運送会社の追跡番号と混同し、受取人の手書き注釈を完全に無視することになります。
すべてのアラバランには、倉庫受入に必要な10~14の項目が含まれています。項目ラベルはサプライヤーによって異なります。
スペインの倉庫で出荷を受け取る際、受入担当者はアラバランからデータを抽出し、在庫計上のためのWMS(倉庫管理システム)または発注書照合用のERPに入力する必要があります。スペインで受入処理に使用されるソフトウェアとしては、SAP Business One、Sage 200(スペインの中小企業で広く採用されているSage Muranoを含む)、Microsoft Dynamics NAV / Business Central、またはスペイン製のSaaS ERPであるHoldedが一般的です。倉庫固有の業務には、バルセロナのイントラロジスティクスグループMecaluxが提供するスペイン製WMSであるMecalux Easy WMSが中規模から大規模の倉庫でよく使用されています。WMSは構造化データを必要としますが、アラバランはそうではありません。
スペインの倉庫が各アラバランから通常抽出する項目と、それぞれの下流での使用先は以下の通りです。
| アラバランの項目 | 一般的なサプライヤーラベル | 使用先 |
|---|---|---|
| 納品書番号 | "Albarán N.º", "Nº Albarán", "Delivery Note Ref" | 入庫記録、三者照合キー |
| 発注書参照 | "Su Pedido", "Pedido N.º", "PO Ref." | ERPでの発注書照合 |
| サプライヤー名とNIF | "Proveedor", "Razón Social", "NIF/CIF" | サプライヤーマスタデータ検証 |
| 購入者NIF | "Cliente", "Destinatario", "NIF" | 内部コストセンタールーティング |
| 納品日 | "Fecha", "Fecha de Entrega" | 受入ログ、運送業者SLA追跡 |
| 製品コード / SKU | "Código", "Referencia", "Artículo" | 在庫計上(PGCグループ3 在庫資産) |
| 品目説明 | "Descripción", "Concepto" | 発注書明細に対する受入検証 |
| 出荷数量 | "Cantidad", "Uds.", "Unidades" | スペイン会計における在庫(3xx)借方計上 |
| 受入数量 | 手書き注釈 | 差異フラグ、買掛金保留 |
| 受領者署名 | "Recibí conforme", "Firma" | 納品の法的証明、サプライヤー確認 |
| 例外/損傷メモ | 手書きの余白メモ | 不適合報告書、サプライヤークレーム |
スペインのPlan General de Contabilidad(PGC)は、このデータの計上先を決定します。商品がアラバランに対して受け入れられると、会計仕訳ではGrupo 3(在庫、通常は商品購入のcuenta 600または原材料のcuenta 601)を借方に、cuenta 400(仕入先)を貸方に記入します。アラバラン番号は、請求書が届く前に、物理的な受領と会計仕訳を結びつける参照情報です。アラバラン番号が誤って入力されると、発注書、納品書、請求書の三者照合が会計レベルで破綻します。
スペインの倉庫も、他の受入ドックと同様のフォーマット断片化に直面しています。しかし、スペインの規制の空白がそれを恒久的なものにしています。
スペインには、標準的なアラバラン形式を義務付ける法律はありません。商法(Código de Comercio)は文書の機能を説明していますが、そのレイアウトを規定してはいません。スペインのGS1標準化団体であり、35,000社以上の会員企業を持つAECOC(製造業者・流通業者協会)は、AECOC EDIおよびAECOC TRANSPプラットフォームを通じて、電子納品書の標準を開発しました。しかし、スペインの物流におけるEDI導入は他国と同様のパターンをたどっています。Mercadona、Carrefour Spain、El Corte Inglésのような大規模小売業者は、Tier 1サプライヤーにEDIを義務付けていますが、ミッドマーケット(地域の流通業者、産業用サプライヤー、地元メーカー)は、サプライヤーが使用しているERPから印刷された紙のアラバランを引き続き出荷しています。
その結果、ドイツやフランスの倉庫の受入担当者が直面するのと同じ視覚的な混乱が生じますが、さらに複雑な点があります。スペインのサプライヤーは、カーボンコピーのアラバラン帳を頻繁に使用します。一番上の控えは買い手に、二枚目は運転手に、三枚目はサプライヤーの帳簿に残ります。買い手の控えがデータ入力デスクに届く頃には、二世代目または三世代目のカーボン紙で、文字が徐々に薄れている可能性があります。さらに、受入担当者がドックで追加した手書きの注釈(数量訂正、破損メモ、署名)が加わり、1枚の用紙に異なる可読性レベルの3層の情報が載ることになります。
350以上の物流事業者および運送会社を代表するスペインの主要物流業界団体であるUNO Logísticaは、文書ワークフローのデジタル化をセクターアジェンダの中核的優先事項として位置付けています。しかし、同協会はまた、サプライチェーン全体における文書フォーマットの断片化、特にEDIを使用する大規模小売業者と紙を使用するミッドマーケットサプライヤー間の断片化が、構造的な障壁であり続けていると指摘しています。1978年以来スペイン最大の物流専門家コミュニティであるCentro Español de Logística(CEL)は、サプライチェーンデジタル化ワーキンググループにおいて、文書標準化の課題について発表しています。コンセンサスは、標準化はまず高ボリュームの回廊で進むが、ミッドマーケットサプライヤーのロングテールは、今後何年も異種混在の紙およびPDFのアラバランを生産し続けるだろうというものです。
スペインにおけるフォーマットの断片化は、標準的な納品書と同様のインセンティブ構造によって強化されています。 サプライヤーが自社のアルバラン形式を変更するコストを負担する一方で、効率化による利益は一切得られず、その利益はすべて受け取り側の倉庫に還元されます。Sage Muranoからアルバランを印刷している中小のスペインの製造業者には、顧客のWMSがより速く読み取れるように出力テンプレートを再設計する動機がまったくありません。標準化の経済性が恒常的にミスマッチを起こしているため、フォーマットは断片化したままです。
サプライヤーごとにテンプレートは不要。列を一度定義すれば、AIが各フィールドの意味から自動で見つけ出します。
スペインのアルバランデータを抽出する標準的なアプローチ、つまり各サプライヤーの独自レイアウトからすべてのフィールドを手入力でExcelスプレッドシートに打ち込む方法は、業界ベンチマークによると、1ページのアルバランあたり約3分かかります。1日30件の出荷を受け入れる倉庫では、純粋なデータ入力に90分を要します。テンプレートベースのOCRのようなツールが提供する代替手段は、スペインの状況ではさらに悪質です。なぜなら、サプライヤーのレイアウトごとに個別の抽出テンプレートを作成する必要があるからです。そしてスペインのサプライヤーは、フォーマット標準化がより進んでいるドイツやフランスのサプライヤーとは異なり、極端なばらつきを示します。カタルーニャの産業用サプライヤーからのアルバランと、アンダルシアの食品流通業者からのアルバランは、同じ法的機能を持ちながら、視覚的な類似性はほとんどありません。
代わりに有効なのは カスタム列抽出 です。これは、「納品書番号」「発注書参照」「サプライヤーNIF」「製品コード」「出荷数量」「受取人署名」など、必要なフィールド名を入力する方法です。AIは、固定されたピクセル位置に一致させるのではなく、各フィールド名の意味を意味論的に理解することで、各ドキュメントを読み取り、それらの値を特定します。入力した列名が、出力スプレッドシートのヘッダーになります。AIが人間と同じようにドキュメントを読み取り、画面上の座標ではなく各フィールドの意味を探すため、1つの列定義がすべてのサプライヤーで機能します。
以下は、複数のスペインサプライヤーからのアルバランのバッチを使用した、エンドツーエンドのワークフローです。
アルバランをアップロード — PDF、スキャン、写真
仕入先ポータルからアルバランPDF、受入ドックでスキャンしたカーボンコピー、納品時に撮影した写真を一括でドロップ。デジタルPDFとスキャン紙を同じアップロードに混在できます。仕入先やドライバーが直接アルバランを送信する場合、コレクションリンク機能で共有可能なアップロードページを生成 — 送信者のログイン不要 — メール添付やWhatsApp写真なしで、アルバランが自動的に処理キューに届きます。
全アルバランに必要な列を定義
受入ワークフローとERPに必要なフィールド名を入力:アルバラン番号 | 発注書参照 | 仕入先名 | 仕入先NIF | 納品日 | 製品コード | 品目説明 | 出荷数量 | 受入数量 | 例外備考 | 受領者署名。照合自動化のために、計算列(例:数量差異(出荷数量 - 受入数量))を追加すると、AIが抽出時に差を計算 — WMSやAPシステムにデータが届く前に不一致をフラグ付け。推論列(例:納品状態(選択肢:完全/一部/破損))も定義可能で、AIがアルバラン内容を評価して正しいステータスを割り当てます。
構造化されたスプレッドシートをダウンロード
XLSX、CSV、JSONにエクスポート。各アルバランが出力テーブルの1行になります。納品書番号、仕入先NIF、製品コード、出荷数量、受入数量、受領者署名ステータスが隣接列に表示 — WMS入庫計上、SageやSAP Business Oneでの発注書照合、仕入先請求書との三者照合にすぐに使用可能。処理速度は1ページあたり5〜10秒。Google Sheetsユーザーはサイドバーアドオンで、スプレッドシートから離れずに結果をアクティブシートに直接抽出できます。
以下でサンプルアルバランをお試しください。デモではプリセット — 標準的な納品書/梱包明細書の構造に合わせた事前設定済み列名 — を使用するため、列名を入力せずにすぐに抽出結果を確認できます。「処理」をクリックすると、AIが印刷された出荷データとページ上の手書きの受入注釈の両方を読み取ります。
ファイルは安全に処理され、保存されることはありません。
アルバランは、倉庫から印刷されて出荷され、手書きデータが追加されて戻ってくる唯一の物流書類です。抽出機能は両方を読み取る必要があります。
配送用封筒に入っている他の書類で往復するものはありません。注文書は買い手が保管します。請求書は納品後に発行されます。船荷証券は運送業者と共に移動しますが、注釈が付けられて供給元に戻ることはありません。アルバランは独特です。供給元が印刷し、商品と共に移動し、受取人がそれに書き込みます(破損した箱を丸で囲む、「solo 8 uds recibidas」(8ユニットのみ受領)と10と書かれた行の横に書き込む、下部に署名するなど)。そして注釈が入ったコピーは、納品状態の証明として供給元に戻ります。
この往復の性質により、ほとんどの抽出ツールがうまく処理できない2層構造の書類問題が発生します。テンプレートベースのOCRツールは印刷された層(供給元のフィールド、出荷数量、参照番号)を読み取ります。手書きの層(修正、状態メモ、署名)はノイズとして無視されるか、印刷されたテキストストリームに混ざり、「10 unidades」と「8 uds」が同じセルに出力されてしまいます。
ピクセルブロックを照合するのではなく、フィールドの意味を理解するセマンティックリーダーは、2つの層を別々の列に分離できます。出荷数量を定義すると、AIは供給元の明細テーブルから印刷された数量を読み取ります。同じ列設定で受領数量を定義すると、AIは受取人がその横に書いた手書きの修正を読み取ります。例外メモを定義すると、「caja dañada」(破損箱)、「embalaje roto」(包装破れ)、「falta 2」(2個不足)といった手書きの余白コメントが無視されることなく構造化テキストとして抽出されます。受取人署名を「有/無」のような形式ヒント付きで定義すると、AIはページ上のどこにあっても、文書に署名が含まれているかどうかを検出します。
アルバランの手書き層はノイズではありません。それは、本来あるべき数量に対して実際に到着した数量の、フィールドレベルの唯一の記録です。これを無視すると、WMSは誤った数量を受け取り、請求書照合段階で三者照合が失敗します。そこでは、請求書の数量(出荷ベース)を実際の受領数量と照合する必要があるのです。
抽出したアラバラン情報がスペイン会計に直接連携 — 各フィールドはPGC勘定科目コードまたはWMS取引に対応。
抽出で得られた出力スプレッドシートは最終目的地ではありません。これはアラバランとそのデータを必要とするシステムをつなぐ中間形式です。Sage 200やSAP Business Oneを運用するスペインの倉庫では、抽出されたフィールドは以下のような下流の経路をたどります。
| 抽出フィールド | 送信先システム | PGC / 取引 |
|---|---|---|
| 製品コード、受入数量 | WMS 入庫 | 借方 (3xx) 在庫 / 貸方 (400) 仕入先 |
| 納品書番号、発注書参照 | ERP 発注モジュール | 発注ステータス: 一部受入 / 全部受入 |
| 仕入先NIF、納品日 | ERP 仕入先元帳 | 勘定科目400(仕入先)補助元帳転記 |
| 数量差異、例外メモ | 買掛金保留 / 不適合管理 | 勘定科目606(早期支払割引)または仕入先貸方票 |
| 受領者署名 | 文書保管 / 法務 | 仕入先との紛争時の納品証明 |
重要なのはアラバラン番号です。スペインの商慣行では、仕入先は後日、同じアラバラン番号を参照するファクトゥラ(請求書)を発行します。発注書、アラバラン(入庫)、ファクトゥラ(請求書)の三者照合は、アラバラン番号と納入数量がERPで正しいことに依存します。手入力でアラバラン番号に誤り(桁の入れ替え、文字欠落)があると、その後のファクトゥラ照合が失敗し、担当者は紙の記録を遡って正しい番号を探さなければなりません。アラバラン番号を文書から直接抽出することで、最も一般的な照合失敗の原因を排除できます。
固定の受入ドックではなく、現場スタッフやドライバーからアラバランを受け取るチームには、コレクションリンク機能が書類受入のギャップを解消します。共有可能なリンクを生成し、ドライバーや遠隔地の倉庫スタッフに送信するだけで、アラバランが直接処理キューに届きます。メール添付、WhatsApp写真、送信者の登録は不要です。これは、複数拠点で納品が行われたり、第三者の運送会社が物理的な配送を担当する一方で、受入データを中央の買掛金管理チームや在庫管理チームに届ける必要があるスペインの物流業務において特に有用です。
よくある質問
カーボン紙のアルバラン(デジタルPDF以外)でも使えますか?
はい、ただし注意点があります。1~2世代目のカーボンコピーは、標準スキャン品質(300dpi以上)であれば、印字されたフィールドや読みやすい手書き文字は問題なく抽出できます。3~4世代目(インクの圧力が著しく薄くなったもの)では、参照番号などの細かい文字の精度が低下します。最良の結果を得るには、1枚目または2枚目のコピーをスキャンしてください。AIは薄い文字にも抽出を試みますが、信頼度の低い値にはフラグを付けます。スペインの一部の宅配業者が使用する感熱紙のアルバランは、新しいうちは良好に動作しますが、6~12ヶ月以上経過したものは濃淡が不均一になりやすいため、抽出値のスポットチェックをお勧めします。
同じヘッダーブロックにNIFとアルバラン番号の両方がある場合、ツールはそれらを区別できますか?
はい。AIはフィールドラベルを読み取り、テキストの位置ではなく意味的なコンテキストを理解します。仕入先NIFという列を定義すると、納品書番号と区別するための8桁+チェック文字の形式を認識し、納税者番号を具体的に検索します。また、アルバラン番号を発注書番号や、近くに表示される可能性のある運送伝票番号からも区別します。各識別子はレイアウトに関係なく正しい列に配置されます。これは三者照合に不可欠であり、仕入先元帳のNIFが一致しないと、解決に何時間もかかる照合エラーが発生します。
20社の異なるスペイン仕入先からのアルバランを、20個のテンプレートを作成せずに一括処理できますか?
はい。これが列名抽出とテンプレートベースOCRの本質的な違いです。列を一度定義するだけで済みます — アルバラン番号 | 発注書番号 | 仕入先NIF | 製品コード | 出荷数量 | 受領数量 | 例外メモ | 受領者署名 — AIは列名の意味を理解することで、すべての仕入先のアルバランから各値を検索します。Mercadonaの物流センターのアルバラン、RS Components Españaの納品書、地元アンダルシアの製造業者の手書きアルバラン帳のページも、同じ列定義から同じ構造化出力を生成します。それらを単一のバッチでアップロードすれば、統合された1つのExcel出力、1ドキュメントにつき1行が生成されます。
抽出データは、スペインの書類に必要な複数税率のIVA内訳に対応していますか?
アルバラン自体にはIVA金額は含まれません。それはファクトゥラの役割です。スペインのアルバランは商業書類であり、税務書類ではありません。アルバランから抽出するデータは、参照番号、製品コード、数量、状態情報などの非財務データです。IVAの内訳(21%、10%、4%の各税率と、それぞれの課税標準および税額)は、アルバランではなくファクトゥラに記載されます。スペインのファクトゥラからIVAデータを抽出する必要がある場合は、スペインの請求書抽出ガイドをご参照ください。ここで説明するアルバラン抽出はスリーウェイマッチの入庫側を、ファクトゥラ抽出は請求書側をそれぞれ担当します。
受取人がアルバランにスペイン語で書き込んだ場合、AIは手書きのスペイン語メモを読み取れますか?
はい。AIは言語に関係なく手書き文字を読み取ります。「recibido conforme」(正常に受領)、「falta 1 caja」(1箱不足)、「producto dañado」(商品破損)などのスペイン語の注釈は、書かれた言語のまま構造化テキストとして抽出されます。お客様が定義する列名(例:例外メモ)がAIの検出対象を決定し、手書き内容の言語は抽出ロジックに影響しません。標準的なブロック体の手書きは確実に抽出できます。ドックで走り書きされた配送ドライバーのメモによく見られる、非常に乱暴な筆記体の場合は、全文文字起こしに手動確認が必要になることがありますが、「署名の有無:あり/なし」のような構造化検出は、乱暴な手書きでも信頼性を維持します。
スペインのアルバラン(納品書)には、140年の歴史を持つ商法、各仕入先のERP出力の多様性、そして実際にドックに到着した物理的な証拠が凝縮されています。データ抽出の問題は処理速度ではなく、受入担当者が筋肉記憶を構築できないことです。なぜなら、すべてのアルバランのレイアウトが初見の読み物だからです。列名抽出が状況を変えます:必要なものを一度定義すれば、フォーマットの違いは無意味になります。
関連: 梱包明細書・納品書を一括抽出してExcelに出力 · 倉庫受入における手動抽出とAI抽出の比較 · あらゆる形式の梱包明細書からフィールドを抽出してExcelへ · 納品書をExcelに変換