仕入先請求書からデータを抽出する方法EコマースSKUマージンのために

r/AmazonSellerで、あるFBAセラーがCOGSのワークフローをこう語っています。「VLOOKUPなどを使ってExcelファイルを月内更新し、月末にCOGS計算に3~4時間かかっています。」50~200SKUを扱うEコマースセラーの間では、これは例外ではなく標準です。ボトルネックは計算ではなく、まず仕入先請求書から数値を抽出することにあります。Alibabaは12品目の中国語・英語の貿易保証請求書(PDF)を送り、1688の仕入先は手書きのプロフォーマをWhatsAppでスクリーンショット送信し、工場はカートンごとに送料を明記した複数ページの商業送り状をメールで送ります。各フォーマットは同じデータ(SKU、単価、数量、運送料)を異なるレイアウトで提供するため、スプレッドシートを開く前に誰かがそれを抽出しなければなりません。

仕入先請求書から製品・価格データを抽出し、Eコマースマージンスプレッドシートに入力

重要ポイント

  1. 月に3~4時間、タイピングやVLOOKUP、タブ切り替えといった目に見える作業が、手動仕入先請求書入力の最も安価なコストです。
  2. 高くつくのは目に見えない部分です。4つの別々の書類からの運賃・関税・手数料がSKUごとに配分されないと、記録上の製品原価と実際のランディングコストの差は46%に達し、その後のすべての価格決定に誤差が生じます。
  3. ImageToTable.aiは、AlibabaのPDF、WhatsAppのスクリーンショット、工場のプロフォーマなど、あらゆる仕入先フォーマットを1つの列定義で読み取り、抽出時にSKUごとのランディングコストを自動計算。仕入先ごとのテンプレートは不要です。

なぜECサプライヤー請求書は通常の買掛金請求書と異なるのか

買掛金チームは請求書を処理して支払いを行います。重要な項目(請求書番号、取引先名、合計金額、支払期日)は普遍的です。しかし、EC事業者がサプライヤー請求書を見るとき、最初に考えるのは支払いではありません。彼らが考えるのは、この商品の実際の原価はいくらかです。

ECビジネスがサプライヤー請求書から必要とするデータは、支払い項目よりも深いものです。必要なのはSKUコードです。これはサプライヤーの内部コード、自社のSKU、またはASINの場合もあります。単価あたりの卸売原価が必要です。これは「FOB価格」「EXW単価」、または単に「单价」(中国語で単価)と表示されることがあります。記載があれば希望小売価格(MSRP)も必要です。また、最低注文数量(MOQ)も必要で、実際に意味のある数量帯で購入したかを追跡します。リードタイム(注文から納品までの日数)も必要です。30日と見積もって45日で納品するサプライヤーは、静かに運転資金を食いつぶしています。そして、これらすべての情報を、取引先ごと、SKUごと、注文ごとに必要とします。

買掛金管理ソフトウェアは最初の問題(適切な金額を適切な取引先に支払ったか)のために作られています。その問いは請求書合計で完結します。ECの利益率に関する問いは明細項目から始まり、さらに続いていきます。

Ecommerce商品原価トラッカーに必要なフィールド

抽出ワークフローを設定する前に、何を抽出するかを決めてください。以下の列リストは、AP請求書処理ではなく、Ecommerceの原価追跡用に設計されています。これらはSKUレベルのマージンシートに反映されるフィールドです。

列名仕入先請求書上の表示箇所マージン分析で重要な理由
SKU / 商品コード仕入先の品番、ASIN、社内SKU — 「Item No」「货号」「Model #」、または商品説明に埋め込まれている場合ありこの請求書明細を在庫・販売データに紐づけるキー
商品名中国語のみ(「不锈钢水瓶500ml」)、中日英併記、英語のみの場合ありSKUが正しい実商品に対応していることを確認
卸単価「FOB Price」「EXW Unit Price」「单价」「Unit Price」— 米ドル、人民元、仕入先現地通貨の場合ありすべての利益計算の基準。通貨の明記が必要
メーカー希望小売価格記載がない場合あり。ある場合は「MSRP」「Retail Price」「建议零售价」と表記自社価格の簡易チェック — メーカー推奨価格に対して競争力があるか?
注文数量「Qty」「Order Qty」「数量」仕入先が注文通りの数量を出荷したか確認
受領数量請求書には常に記載されず、梱包明細書や納品書のみの場合もある発注数と受領数に差異がある場合、原価調整のトリガーとなる
最小発注数量「MOQ」「Minimum Order」「起訂量」— 見積書にはSKUごとに記載されるが、請求書には毎回あるとは限らない最適な数量で購入しているかを追跡。MOQ未満のSKU購入には通常、ペナルティ価格が適用される
リードタイム(日数)「Lead Time」「交货期」、または注文日と出荷日から計算サプライヤーの信頼性指標。複数注文でリードタイムが短縮すると、発注点の調整をトリガーする
サプライヤー名請求書ヘッダーに記載の会社名。中国のサプライヤーはAlibabaストア名とは異なる法人名を使用することが多いサプライヤー別に原価データをグループ化し、ベンダー間のパフォーマンスを比較するために重要
運送費/貨物運賃「運送費」「貨物運賃」「运费」— 請求書単位の合計、ケース単位の料金、明細行に含まれる場合あり陸揚原価の構成要素の一つ。個別SKUに配分する必要あり
輸入関税・諸費用サプライヤー請求書に記載されることは稀で、通常は通関業者やフォワーダーの別請求書に記載抽出後に単価に加算すべき、もう一つの陸揚原価構成要素
注文日「請求日」「注文日」「日期」トレンド分析が可能に — 同一SKUのコストは時間とともに上昇しているか?
支払条件「条件」「支払」「付款条件」— 30%前金/70%出荷前払い、Net 30などキャッシュフロー計画 — サプライヤーが30/70から50/50に変更すると、運転資本のタイムラインが変わる

すべての請求書にすべてのフィールドが必要なわけではありません。重要なのは、マージン計算式に反映されるフィールドです。在庫を一切扱わないドロップシッパーには「受領数量」は不要です。深圳からコンテナを輸入するFBAセラーには、上記すべてに加え、通関業者の請求書データも必要です。自社の原価構造に合った列を定義し、抽出ツールに残りを任せましょう。

調達から陸揚原価まで:Eコマース会計における欠落したリンク

Eコマースビジネスで日常的に発生するシナリオをご紹介します。あるFBAセラーが、深センのサプライヤーからステンレス製ウォーターボトル1,000個をFOB $3.50で注文したとします。彼らは$3,500を製品原価として記録します。3週間後、運送会社から海上運賃$850の請求書が届きます。通関業者からは、申告額の7.5%にあたる$262.50の関税請求書が届きます。その貨物は3PLの受け入れセンターで2週間保管され、1個あたり$0.30の費用がかかりました。セラーのスプレッドシートには製品原価が$3.50と記載されています。実際の製品原価は$5.12でした — 46%もの乖離です。

これが陸揚原価であり、IRS Publication 334によれば、運送費、輸入関税、および取扱費用は在庫に資産計上しなければなりません — これらは個別の営業費用ではなく、売上原価の一部です。IRSの統一資本化ルール(Pub 334, Section on Uniform Capitalization Rules)では、これらの間接費を転売目的で取得した資産の基準価額に含めることを義務付けています。これらの費用は、商品が販売された時点で売上原価を通じて回収されます — そもそも記録していればの話ですが。

陸揚原価の計算式はシンプルです:

1個あたりの陸揚原価 = (卸売価格 + 運賃 + 関税 + 保険料 + 検査料 + 取扱費 + 倉庫保管料) ÷ 貨物の総個数

計算自体は難しくない。問題は、数字を一箇所に集めることだ。仕入先請求書には卸売原価、フォワーダー請求書には輸送費、通関業者請求書には関税、3PL請求書には倉庫費用が載っている。4つの書類、4つの形式、3つの異なる会社——それらすべてを、計算式を適用する前に同じスプレッドシートの行に揃えなければならない。多くのEコマース販売者は、4つの別々のPDFから手作業で数字を1つのExcel行に転記している。1出荷につき、1SKUあたり。四半期に20出荷、平均8SKUとすると、それは160行の手動データ入力だ。毎四半期。 r/FulfillmentByAmazonコミュニティのあるEコマース販売者は、現実をこう語る。「SKUが数個を超えると、本当の製品原価が分からなくなる」。混乱は概念的なものではない——販売者はランディングコストを理解している。混乱は手続き上のものだ:数字が別々の書類に散らばっており、一箇所に集めるには手入力が必要なのだ。 AIで仕入先請求書データを抽出する際、計算列を使って抽出中にランディングコスト計算を実行できる——AIが仕入先請求書から卸売価格を読み取り、パラメータとして入力した運送費を加算し、関税率を適用して、1単位あたりのランディングコストを直接出力する。別途スプレッドシートの手順は不要だ。出力列には「単位あたりランディングコスト」と表示され、その下の数字はすぐに粗利率の計算式に使える。抽出の基本を詳しく知りたい方は、請求書データ抽出の完全ガイドをご覧ください。

抽出ワークフローの仕組み

サプライヤー請求書のフォルダからマージンスプレッドシートを作成するためのステップバイステップのプロセスです(AP自動化の導入ではなく)。目的は、混在フォーマットの書類群を1回のセッションで1つのExcelファイルに変換することです。

JPG/PNG/PDF AI抽出

ファイルは安全に処理され、保存されません。

1
仕入先請求書をまとめてアップロード

AlibabaのPDF貿易保証請求書、WeChatで受け取った1688のスクリーンショット、工場のプロフォーマ請求書(PDFスキャン)、フォワーダー請求書、通関業者の明細書など、あらゆる形式に対応。PDF、JPG、PNGを一度にまとめてアップロード可能。AIが各書類を個別に読み取るため、仕入先ごとに異なる請求書形式でも問題ありません。4社の仕入先から30SKUを管理する販売者は、四半期分の請求書を一度にアップロードできます。ワークフローを試す場合は、Alibaba PDFと工場プロフォーマの2社分の請求書から始めると、1つのリストに両方のデータが統合される様子を確認できます。

2
列名の定義は一度だけ。サプライヤーごとに設定する必要なし。

これが、セマンティックAI抽出とテンプレートベースのOCRの違いです。各サプライヤーの請求書レイアウトにフィールドの枠を描く代わりに、必要な列名を入力するだけ — 「SKU」「商品名」「卸売単価」「注文数」「サプライヤー」「注文日」「運送費」。AIはフィールドの意味を理解して各値を特定します。SKUコードは、Alibabaの請求書では「Item No」、1688のスクリーンショットでは「货号」、工場のプロフォーマでは商品説明行に埋め込まれているかもしれません。3つの異なる位置、3つの異なるラベル — 1つの列定義で全てをカバーします。これがカスタム列抽出です。列名を入力するだけで、AIが任意のドキュメント内の一致する値を探し出し、行を自動入力します — テンプレート不要、サプライヤーごとの設定不要、レイアウト依存のルールも不要です。

3
抽出時に陸揚原価の計算列を追加する

「ユニットあたり陸揚原価(ユニットあたり卸売原価 +(運送費 / 注文数量)+(ユニットあたり卸売原価 × 0.075))」のような計算列を定義します。実際の関税率に置き換えてください。AIが卸売価格を抽出し、運送費の配分を読み取り、処理中に計算を実行します。出力ファイルを開くと、陸揚原価の列がすでに入力されており、後処理の数式は不要です。サプライヤー請求書で異なる通貨コードが使用されている場合は、推論列を使用することもできます。単一の通貨で出力するように列を設定し、正しい換算を適用するルールを追加します。

4
Excelファイルをダウンロード — 1つのスプレッドシートに全サプライヤー、全SKU。

XLSX形式でダウンロード。各請求書行の列構成は、AlibabaのトレードアシュアランスPDF、工場のプロフォーマスキャン、1688サプライヤーからのWhatsAppスクリーンショットのいずれをソースにしても同一です。サプライヤー別ファイルの統合やスプレッドシート間のコピペは不要。1つの出力ファイルで、すぐにマージン分析が可能です。大量の場合は、バッチ請求書抽出で同じ列定義のまま数百の文書を処理し、1ページあたり5〜10秒で処理します — 手動入力と比較して約18倍の速度です。

仕入先請求書フォーマットが特別な問題である理由

テンプレートベースのOCRツールは、文書を既知のレイアウトと照合することで機能します。「このPDFの請求書番号は常に右上隅にある」とツールに学習させます。これは毎月同じ仕入先から請求書を処理する場合に有効です。しかし、ECの仕入先関係はそうではありません:

  • Alibaba Trade Assurance請求書は、Alibaba独自のフォーマットテンプレートに従い、商品詳細、配送、支払い保護のセクションが分かれています。整っていますが、他の仕入先のレイアウトとは異なります。
  • 1688仕入先のスクリーンショットは、多くの場合、1688の注文画面をスマートフォンで撮影したもので、商品名は中国語、単価は人民元、注文数量が表示されています。人間には読めますが、構造化されたPDFは存在しません。
  • 工場のプロフォーマ請求書は工場によって異なります。正式なテンプレートに会社のレターヘッド、インコタームズ、銀行詳細が記載されているものもあれば、Word文書の表をPDFにエクスポートしただけのもの、手書きで撮影されたものもあります。
  • フォワーダー請求書はSKU単位ではなく出荷単位で請求され、仕入先請求書データと統合する必要があります。運送費はその出荷のSKUに配分されなければなりません。
  • ドロップシッピング仕入先請求書(AliExpressやSHEIN連携の仕入先から)は、商品名が英語と中国語の混在(「チャングリッシュ」)で記載されたスクリーンショットとして届くことが多く、人間は解析できますが、キーワードベースのOCRツールは誤読します。

テンプレートベースのツールでは、レイアウトごとに個別のテンプレートが必要です。仕入先が4社あれば4つのテンプレート。新しい仕入先を追加すれば、新しいテンプレート。仕入先が請求書のフォーマットを変更すれば、テンプレートは壊れ、誰かが気づくまで不完全な抽出を黙って続けます。成長中のEコマースストアで一般的な8~10社のアクティブな仕入先を抱えると、テンプレートのメンテナンス負担は自動化で節約できる時間を上回ります。

セマンティック抽出はこれを完全に回避します。AIは購買管理者と同じように請求書を読み取ります。つまり、製品、価格、数量、日付が記載されたドキュメントとして認識します。座標やラベルの一致に依存しません。「单价 ¥23.50」と書かれた1688のスクリーンショットと、「Unit Price $3.50」と書かれたAlibabaの請求書が、言語も位置も異なるものの、同じフィールドであることを理解します。このアプローチにより、単一の列名セットがすべての仕入先で機能し、フォーマットを超えた統一抽出が仕入先ごとの設定なしで可能になります。

重要な違い:テンプレートベースの抽出は、新しい仕入先ごとに設定作業が増加します。AIベースの抽出は設定を一定に保ちます。年間2~3社の新規仕入先を追加するEコマースストアにとって、これはスケールするワークフローと、結局は手動入力に戻ってしまうワークフローの分かれ目です。

スプレッドシートからマージンダッシュボードへ

仕入先請求書データを構造化されたスプレッドシートに取り込めば、これまで四半期ごとに推測していたマージン分析が、生きたデータセットに変わります。実際のイメージは次の通りです。

SKUごとの粗利率は、毎月手動で再計算する数値ではなく、セルから自動で算出される計算式になります。販売価格から単位あたりのランディングコストを差し引き、販売価格で割ります。卸売原価が3.50ドルで利益が出ているように見えたSKUも、ランディングコストが5.12ドルに達すると、実際の粗利率は12%に。これは、Amazon手数料をカバーするためにほとんどのFBAセラーが目標とする最低ライン15~20%を下回ります。データ抽出がなければ、この計算は思い出したときに手動で一度行うだけです。抽出すれば、スプレッドシートを更新するたびに常に最新の値が反映されます。あるAmazonセラーのCFOがRedditで指摘しているように:「SKUが数個を超えると、実際の製品原価は混乱します。」抽出こそ、その混乱を解消する方法です。

Amazon FBA出品者には、商品原価とフルフィルメント費用を分離できるという追加のメリットがあります。Amazonは紹介料(通常15%)、FBAフルフィルメント手数料、保管料、広告費を請求しますが、これらは仕入先の請求書には一切記載されません。SKU単位の抽出スプレッドシートでは、仕入先側のコスト(卸値、運送費、関税)を一連の列にまとめ、Amazon側のコストを別の列に追加できます。これにより、商品マージン(販売価格からランディングコストを差し引いたもの)と、Amazon手数料を差し引いた純マージンの2段階で利益率を確認できます。FBA手数料後に商品マージン40%でも純マージン8%の商品と、商品マージン25%でも純マージン18%の商品では、全く異なる状況を示しています。抽出ステップで正確なランディングコストデータを入力しなければ、どちらの商品も「3.50ドル」に見え、実際の利益率の実態は決して明らかになりません。

仕入先のパフォーマンス追跡は、同じデータセットから得られる副産物です。リードタイムの傾向 — 仕入先Aの平均納期が30日から38日に延びていないか? コストの傾向 — 仕入先Bの単価がカテゴリ平均より速く上昇していないか? 最小発注数量(MOQ)の遵守 — あるSKUを誤って最小数量以下で発注し、気づかないうちに割高な価格を支払っていないか? これらの疑問は、個々の請求書からは答えが出せません。しかし、発注のたびに更新される構造化されたスプレッドシートからは簡単に答えが出せます。

そして、関税率が変更された場合 — 2025年から2026年にかけて、米国統一関税表(HTS)の関税率が製品カテゴリ間で変動し、繰り返し変更されてきました — ランディングコストデータがすでに構造化されていれば、関税部分を再計算し、どのSKUが最も影響を受けるかを即座に確認できます。その構造がなければ、すべての仕入先請求書をフォルダから取り出し、手作業で再計算する必要があります。

よくある質問

中国語の仕入先請求書でも使えますか?

はい。AIは中国語、英語、混合言語の文書を読み取ります。商品名が中国語(「不锈钢保温杯」)、価格が人民元、数量がアラビア数字で書かれた1688の仕入先スクリーンショットも、英語のアリババ・トレードアシュアランス請求書と同じように処理されます。お客様が英語で定義した列名(「SKU」「商品名」「卸売原価」)がヘッダーとなり、AIは元の言語に関係なく対応する値を抽出します。中国語の請求書に「¥23.50」と価格が記載されていれば、AIはそれが「卸売原価」列の値であると認識し、抽出します。

PDFだけでなく、スクリーンショットからもデータを抽出できますか?

はい。本ツールはJPG、PNG、PDFの入力に対応しています。1688の仕入先が注文確認書を画像で送ってくる場合によくある、WhatsAppやWeChatのスマホスクリーンショットも、スキャンしたPDFと同様に処理されます。AIは画像の視覚的な内容を読み取るため(埋め込まれたテキストレイヤーは対象外)、仕入先の内部システムを映したPC画面の写真でも機能します。画質は重要で、480pのぼやけたスクリーンショットよりも、1080pの鮮明なスクリーンショットの方が抽出精度が高くなります。圧縮率の高い画像については、低解像度抽出戦略が役立つ場合があります。

送料をSKUごとに按分するには?請求書には合計金額しかありません。

ほとんどのフォワーダー請求書は、SKUごとの内訳ではなく、出荷全体の合計金額のみを表示します。以下の3つの方法があります。(1) 計算列を使用して、送料合計を出荷内の全SKUの総注文数量で割り、均等な単価按分を行う。(2) 重量で按分 — フォワーダー請求書に総重量が記載されている場合、各SKUの単重×数量に基づいて送料負担分を計算する計算列を作成する。(3) 金額で按分 — 高額SKUほど送料負担を大きくする。どの方法を選ぶかは送料体系次第です。海上輸送(コンテナ/重量単位)では重量按分、航空輸送(kg単価+価格割増)では金額按分が適しています。抽出ツールはルールを定義すれば計算を自動処理します。フォワーダーがSKUごとに明細化する必要はありません。

関税はどうですか?後日別の請求書が届くものですが。

これは実際に問題です。フォワーダーや通関業者から関税の請求書が届くのは、通関から3~6週間後になることがよくあります。在庫を販売して売上原価を計上した後になることもあります。正しいアプローチは、今すぐ仕入先の請求書データを抽出し、卸売原価と運賃をスプレッドシートに入力することです。通関業者の請求書が届いたら、「出荷ID」「支払関税」「日付」などの列を使って別のタブに抽出します。VLOOKUPやINDEX-MATCHを使用して、元の出荷のランディングコスト列に関税額を取得します。これにより、後から届くコストが発生しても、抽出プロセスを何週間も待つことなく、正確なマージンデータを維持できます。発生主義会計を使用している場合、IRS Publication 334では、受領時に推定ランディングコストを見越し計上し、実際の請求書が届いた時点で調整することを想定しています。

QuickBooksやXeroと連携できますか?

本ツールはExcel(XLSX)、CSV、JSON形式で出力します。抽出したデータをダウンロードし、QuickBooks、Xero、またはファイルインポートに対応する会計プラットフォームに取り込めます。直接のAPI連携はありません。A2XなどのツールでAmazon決済をQuickBooksに連携しているEC販売者にとって、本ツールで抽出した仕入先コストデータは、それらのツールでは取得できないCOGS(売上原価)の入力値となります。抽出した仕入先請求書スプレッドシートを仕訳帳や在庫原価の更新としてインポートしてください。コスト管理にGoogleスプレッドシートを使用している販売者は、Googleスプレッドシートアドオンを使うと、Googleスプレッドシートから離れることなく、仕入先請求書データを直接トラッキングシートに抽出できます。

一度に処理できる請求書の数は?

複数の請求書を一度にアップロードできます。ツールは1ページあたり5〜10秒で処理します。バッチサイズに厳密な上限はありませんが、処理時間はページ数に比例して増加します。平均2ページの請求書20件(合計40ページ)のバッチは、約3〜7分で処理されます。実際の制約はツールの容量ではなく、バッチ内の全仕入先にわたって必要なフィールドをすべてカバーする列名を定義しているかどうかです。大規模な四半期バッチ処理には、バッチ抽出が大量のデータを効率的に処理します。

スプレッドシートは簡単な部分にすぎない

ほとんどのEコマース販売者はマージン計算を理解している。彼らはランディングコスト=卸値+運賃+関税+手数料であることを知っている。SKUごとに追跡すべきこともわかっている。連鎖の断絶は知識ではなく、データが十数もの異なるサプライヤーからのPDFやスクリーンショットに埋もれており、それをスプレッドシートに落とし込むには手入力が必要なことだ。ランディングコスト計算に関する記事は、このステップを飛ばす。計算式を示し、数字がすでに列にあると仮定する。

実際はそうではない。データはAlibabaのトレードアシュアランスPDF、1688のスクリーンショット、運送業者の請求書という3つの異なる形式で存在する。抽出こそが計算式を使えるものにするステップだ。サプライヤーごとにテンプレートを作成せずに、請求書データを構造化されたスプレッドシートに取り込めるようになれば、マージン分析は四半期ごとのプロジェクトから、毎回の出荷後に数分で更新できるものへと変わる。

自社のサプライヤー請求書で試す

サインアップ不要。請求書をアップロードして列を定義するだけ。

📮 contact email: [email protected]