CFDIデータ抽出:メキシコ電子請求書完全ガイド

CFDIは読む書類ではなく、正しく解析すべき税務記録です。2014年からSATが義務化したメキシコの電子請求書システムでは、36桁のUUID、取引先RFC、税制コード、そして取引種別に応じた構造化補完データ(支払、給与、通関情報など)を含むXMLファイルとして請求書が届きます。これをスプレッドシートに抽出するには、人間の可読性ではなく政府のリアルタイム検証を前提とした文書構造を理解する必要があります。本ガイドでは、6種類のCFDI文書タイプ、補完システム、あらゆる抽出方法、そしてメキシコのチームが既に使っている会計ソフトとの連携方法を網羅します。

手入力をやめよう — AIに読み取らせるだけ
画像やPDFをアップロード — 10秒で構造化データに
今すぐ試す
登録不要 · カード不要 · 10秒で結果
メキシコCFDI電子請求書データ抽出 — 机上のビジネス書類と構造化税務文書処理

CFDIが他の請求書と決定的に異なる理由

米国、欧州、アジアのサプライヤーからこれまで処理してきたすべての請求書は、同じ基本パターンに従っています。サプライヤーが文書を発行し、あなたがそれを受け取り、請求書番号、日付、金額、税金といったデータは文書自体に記載されています。文書が情報の源泉です。CFDIはこのモデルを完全に覆します。

CFDI(Comprobante Fiscal Digital por Internet)は、法的に有効となる前に、政府公認のPAC(Proveedor Autorizado de Certificación)によって検証され、スタンプが押される必要があるXML文書です。これはクリアランスモデルと呼ばれます。発行者がXMLを生成し、PACに提出すると、PACは構造と電子署名を検証し、timbre fiscal(電子スタンプ)を適用し、メキシコの税務当局であるSATにリアルタイムでコピーを転送します。この三者間のやり取りが完了して初めて、請求書は法的文書として存在します。その時点でSATによって割り当てられたUUID(Folio Fiscal)が、その取引をその後のすべての監査、支払い、税務申告に結びつける恒久的な識別子となります。

これには、初めてメキシコのサプライヤーを扱うAPチームを驚かせる実際的な結果があります。XMLファイルが法的に有効な請求書であるということです。同じメールに添付されて届くPDFは装飾的な印刷物であり、人間が確認するのには役立ちますが、法的な効力はありません。CFF第30条に基づき、発行者と受領者の両方は、元のCFDI XMLを少なくとも5年間保管しなければなりません。XMLを廃棄してPDFのみを保持することは、SATが記録を要求したときに初めて多くのチームが気付く監査上のリスクを生み出します。

現行バージョンであるCFDI 4.0は、2023年4月から必須となっています。これにより、受領者の検証がより厳格になりました。受領者のRFC、法人名、税務上の住所の郵便番号は、SATの納税者登録簿と完全に一致する必要があります。バージョン3.3の請求書はもはや受け付けられません。CFDI抽出ワークフローを構築する場合、扱うすべての文書が4.0スキーマに従っていることを意味します。これは抽出のための一貫したターゲットですが、以前のバージョンよりも必須フィールドが多くなっています。

CFDI抽出における核心的な問題は、データが欠落していることではありません。データが、スプレッドシートで消費するためではなく、政府のクリアランス用に設計された形式で存在していること、そしてその2つの間の橋渡しを構築することに、ほとんどのチームが苦労しているのです。

6種類のCFDI文書タイプ — それぞれの利用シーン

CFDIは単一の文書タイプではありません。SATは6つの異なるcomprobanteタイプを定義しており、それぞれに独自のスキーマルール、必須項目、抽出要件があります。メキシコのサプライヤーを複数社扱う場合、ほとんどのタイプに遭遇することになります。

タイプコード利用シーン抽出の複雑さ
IngresoI標準的な売上請求書 — 商品・サービスの収入。受領するCFDIの約85%を占める。基本スキーマ。IVA内訳、UsoCFDI必須。
EgresoEクレジットノート、返金、割引 — 発行済みIngreso請求書の減額。元のUUID参照必須。文書間の突き合わせが必要。
PagoP支払受領書 — PPD請求書が一部または全額決済された際に発行。高。支払ごとのUUID参照を含むComplemento de Pagoを伴う。
NóminaN給与支払明細書 — 従業員への支払いごとに必須。SATはこれを用いて所得税と社会保険料をクロスチェックする。高。IMSS、INFONAVIT、SARなど50以上のフィールドからなる補完情報。
TrasladoT移送文書 — 販売を伴わない商品の移動(在庫移動、委託、Carta Porte)。中。貨物移動にはCarta Porte補完が必要。
RetencionesR源泉徴収文書 — 第三者への支払いから源泉徴収された税金(ISR、IVA)を報告。別のXSDを使用。基本CFDIスキーマには含まれない。

実際に抽出作業で最も摩擦を生むタイプはPagoです。仕入先がPPD支払条件で請求書を発行する場合、請求書自体には明細と合計額は記載されますが、支払情報は含まれません。買い手が支払いを行うたびに、仕入先は別途Pago CFDIを発行し、その中にComplemento de Pagoを含めて、どのUUIDが、いくらの金額で、いつ、どの支払方法で支払われたかを明示します。40件のPPD請求書を処理するAPチームは、60~80件のCFDIを照合する必要があり、それぞれでIngresoとその支払補完情報との間でUUIDの相互参照が必要になります。

主要フィールド、SATカタログ、そして各項目がスプレッドシートに与える影響

どのフィールドを抽出するかを理解することは、単なる技術的な問題ではありません。DIOT申告、IVA控除の調整、税務調査への対応において、出力結果が実用的かどうかを左右します。CFDIの各フィールドはSATカタログコードに対応しており、同じフィールドでも選択されたコードによって税務上の影響が異なります。

ヘッダーレベルのフィールド(Comprobanteノード)

フィールドXPath(簡略化)重要性
UUID(税務伝票番号)/cfdi:Comprobante/Complemento/TimbreFiscalDigital/UUID全取引の主キー。支払照合、取消追跡、監査証跡に使用。
発行者/受取人 RFC/cfdi:Comprobante/Emisor/@Rfc, /Receptor/@Rfc双方の納税者番号。1文字の誤りで経費の税額控除が無効に。
税制区分(発行者)/cfdi:Comprobante/Emisor/@RegimenFiscal供給者に適用される税法を決定。個人 vs 法人、RESICO vs 一般制度。
発行日/cfdi:Comprobante/@FechaISO 8601形式のタイムスタンプ。SATが税務期間の割り当てに使用。
シリーズ + 連番/cfdi:Comprobante/@Serie, @Folio供給者内部の請求書番号。供給者明細との照合に有用。
小計 / 合計/cfdi:Comprobante/@SubTotal, @Total税抜金額と最終金額。合計 = 小計 + 転嫁IVA − 源泉IVA。
通貨 + 為替レート/cfdi:Comprobante/@Moneda, @TipoCambio通貨コード(MXN、USD、EUR)とメキシコペソ以外の場合の為替レート。
支払方法 / 支払形態/cfdi:Comprobante/@MetodoPago, @FormaPagoPUE(一括)vs PPD(分割)。支払補足文書の要否を決定。
CFDI用途/cfdi:Comprobante/@UsoCFDI受取人の用途コード。G01(取得)、G03(経費)、D01(自動車)、P01(PPD)。IVA控除資格に影響。
輸出区分/cfdi:Comprobante/@ExportacionCFDI 4.0必須項目。01=国内、02=確定輸出。DIOT報告用に請求書を区分。

税金の内訳:IVA、源泉徴収、IEPS

CFDIの税構造は、明細(Concepto)レベルより下、各Conceptoの中にネストされています。つまり、IVAの税率と金額は明細ごとに設定されており、請求書全体の集計値ではありません。出力で請求書ごとに1行の税情報が必要な場合は、抽出時にこれらを合計する必要がありますが、元データは細分化されています。

  • IVA 16% — ほとんどの商品・サービスに適用される標準税率。国境地域(北部・南部)では、一定の条件下で軽減税率8%が適用されます。
  • IVA 0% — 輸出(Exportación=02/03)や、特定の基礎食料品、医薬品、農業用資材に適用されます。
  • IVA Retenido(IVA源泉徴収) — 受取人がIVAの3分の2を源泉徴収し、SATに直接納付する必要がある場合があります。CFDIにはImpuestosTrasladados(仕入先が請求するIVA)とImpuestosRetenidos(買い手が源泉徴収するIVA)の両方が表示されます。
  • ISR Retenido(ISR源泉徴収) — 個人が提供する役務に対する10%、一般課税事業者からの購入に対する1.67%、利子支払に対する20%の源泉徴収。これらは毎月のDIOTで報告する必要があります。
  • IEPS — アルコール、タバコ、ガソリン、清涼飲料水などの特定商品に対する物品税。製品カテゴリごとに異なるIEPS税率(3%~160%)が適用されます。

抽出において重要な点は、1つのCFDIが異なる明細間で複数の税の組み合わせを持つ可能性があることです。標準品(IVA 16%)とIEPS対象品の両方を販売する卸売業者からの1枚の請求書には、16%の品目、16%+IEPSの品目、そして0%の品目が混在する可能性があります。抽出出力では、明細レベルの税詳細を保持するか、税率ごとに正しく集計する必要があります。

コンプレメント層:ほとんどの抽出ガイドが止まるところ

コンプレメントとは、特定の取引タイプに対して基本のCFDIスキーマを拡張する構造化XML付録です。基本CFDIは請求書ヘッダーと明細行をカバーします。それ以外のすべて(支払詳細、給与明細、税関データ、輸送情報)はコンプレメントに格納されます。メキシコの請求書を処理するAPチームにとって、重要なコンプレメントは3つです。

Complemento de Pago(支払コンプレメント)

すべてのPago CFDIに添付されるこのコンプレメントは、実際のメキシコAPにおける抽出の最大の複雑要因です。サプライヤーがPPD条件(MétodoPago=PPD)で請求書を発行する場合、元のIngreso請求書には支払データが含まれません。買い手が全額、分割、または後払いで支払うたびに、サプライヤーはPago CFDIを発行し、そのComplemento de Pagoには以下が記録されます:

  • 支払対象の元Ingreso請求書のUUID
  • そのUUIDに適用された支払金額
  • 支払日と支払方法(振込、小切手、現金、カード)
  • 支払時の通貨と為替レート(元の請求書がUSDの場合に重要)
  • 今回の支払後の未払残高(saldo insoluto)

1つのIngreso請求書が複数のPago CFDIで決済される場合があります。それぞれが同じUUIDを異なる支払金額で参照します。抽出の課題は技術的なものではなく(UUIDは常に存在)、手続き上のものです。ほとんどのAPチームはComplemento de Pagoをまったく抽出せず、支払データを元の請求書とワークフローで結びつかない別の文書に残したままにします。

請求書ヘッダーで止まりコンプレメントに手をつけないCFDI明細行抽出では、APチームが実際に必要とするデータの約60%しか取得できません。

Complemento de Nómina(給与コンプレメント)

メキシコの雇用主は、従業員へのすべての支払い(給与、賞与、歩合、休暇割増、退職金、クリスマスボーナス(aguinaldo))に対してNómina CFDIを発行する必要があります。Complemento de NóminaはCFDIシステムで最もフィールド数の多い文書の1つであり、50以上の構造化フィールドが含まれます:

  • 従業員のCURPとIMSS社会保険番号
  • 基本給と日給(Salario Base de Cotización)
  • 種類コード別に分類された通常収入(percepciones)— Sueldos、Aguinaldo、Prima Vacacional、PTU
  • 控除(deducciones)— 源泉徴収されたISR、IMSS拠出金、INFONAVITローン返済、SAR/Afore、年金ローン
  • 時間外労働時間(Horas Extra)と時間区分および割合
  • 正味支払総額

複数法人の雇用主の場合、給与抽出は各支払サイクルで数百のNómina CFDIを処理することを意味します。従業員ごとに支払いごとに1つのCFDIが発行され、それぞれのコンプレメントフィールドをHRまたは給与報告用のスプレッドシートにフラット化する必要があります。

コメルシオ・エクステリア補完(外国貿易補完)

輸出区分が02(A1税関コードによる確定輸出)または03(A2コードによる確定輸出)の場合に必須です。この補完には、国境を越える取引に関する税関側のデータが含まれます:

  • ペディメント番号(税関申告ID)
  • 輸出者のRFCと完全な住所
  • 受取人の外国税ID
  • インコタームズコード
  • 明細ごとの詳細:関税分類(fracción arancelaria)、税関単位、商品の米ドル価格
  • 原産国と仕向国

この補完のバージョン2.0は、2024年1月からCFDI 4.0に統合されています。メキシコから商品を輸出する企業にとって、基本CFDIフィールドと外国貿易補完データの両方を抽出することは、運送請求書と税関申告の照合に不可欠です。

PACごとにPDFレイアウトが異なる理由

すべてのCFDIは同じXMLスキーマ(SAT公開のXSDで定義されたAnexo 20バージョン4.0)から生成されます。XMLはどのPACがスタンプしても一貫しています。しかし、多くのAPチームが実際に確認するPDF表現は、各PACがXMLをどのように視覚形式にレンダリングするかに完全に依存します。

実際には、FinkokがスタンプしたCFDI PDFは、SW sapienDigifactFacturAPI、またはSATの無料ツールがスタンプしたものとは異なる視覚的な順序でフィールドを配置します。データは同一ですが、レイアウトは異なります。固定位置の抽出ゾーンに依存するテンプレートベースのOCRツールでは、PACごとに個別のテンプレートが必要です。8つの異なるPACを使用する20のサプライヤーから請求書を受け取る企業は、8つの抽出テンプレートが必要になり、まだ設定していない9番目のPACからの請求書を見逃すことになります。

ここで、セマンティック抽出(AIが各フィールドの位置ではなく意味を理解して文書を読み取る技術)がCFDI処理の経済性を変えます。UUIDとRFCの違いを認識するセマンティック抽出ツールは、PACがフィールドをページの上部、左、右、下部、または枠線付きボックス内のどこに配置しても、両方のフィールドを見つけることができます。PACのレイアウトは無関係になり、単一の抽出設定でポートフォリオ内のすべてのサプライヤーとすべてのPACをカバーできます。

抽出方法の比較:あなたのCFDIワークフローに最適なアプローチは?

チームによって、ドキュメントの量、フォーマットの多様性、技術力、予算に基づいて、CFDI抽出に異なるアプローチを選択します。以下の表は、メキシコの請求書処理に重要な要素に沿って、4つの主要な方法をマッピングしたものです。

項目手動入力XML解析(スクリプト)テンプレートOCRAI意味抽出
セットアップ時間不要1~3日(スクリプト作成・テスト)PACレイアウトごとに1~2時間約15分
全PACレイアウト対応可(目視)不可(XML処理)不可(レイアウトごとにテンプレートが必要)可(レイアウト非依存)
スキャン・写真対応不可一部可(品質低下で精度低下)
補完書類対応ユーザーが確認すれば可可(スクリプト作成時)不可(PDFに補完書類なし)可(両方のソース処理可能な場合)
CFDI 50件あたりの時間約3~4時間約2分(一括処理)約15分+修正約2~5分
エラー率(フィールド単位)約3~5%(誤字・転記ミス)約1%(スキーマ不一致)約8~15%(レイアウト不一致)約1~3%
必要な技術スキル不要Python/XPath/XML中程度(ゾーン設定)不要
月500件以上の拡張性⚠️

XML解析とAIセマンティック抽出のどちらを選ぶかは、常に明確とは限りません。すべてのサプライヤーが生のCFDI XMLを送信し、チームにスクリプト作成能力があれば、PythonのlxmlのようなライブラリやXPathを使用したXML解析により、構造化データからクリーンで直接的なフィールド抽出が可能です。ただし、XML解析ではスキャンされた請求書を読み取ることができず、XMLが添付されていない場合の視覚的なPDF表現を解釈できず、SATがスキーマを更新した際(3.3→4.0移行時のように)にアクティブなメンテナンスが必要です。

対照的に、AIセマンティック抽出は、PDF、スキャン画像、スマートフォン写真など、あらゆる視覚的なドキュメントから機能し、構造化されたXML入力を必要としません。何千もの請求書レイアウトでトレーニングされた最新のビジョンモデルは、ドキュメント内のどこに表示されていても、ラベルの意味を理解することで、UUID、RFC、IVAフィールドを特定できます。XMLなしのPDF添付ファイルとスキャン文書が混在するチームにとって、これが唯一のスケーラブルなオプションです。

JPG/PNG/PDF AI抽出 XML対応

ファイルは安全に処理され、保存されることはありません。実際のCFDI PDFまたはXMLでお試しください。

AI抽出がCFDI文書を処理する方法 — 3つのフォーマットすべてに対応

多くのAPチームにとって最も現実的なシナリオは、異なるPACを使用する様々なサプライヤーから、XMLファイル、PDF添付ファイル、スキャン文書が混在して届くことです。フォーマットごとに個別のワークフローを構築すると、メンテナンスの負荷が増え、処理に抜けが生じます。3つすべてを入力ソースとして扱い、単一のフィールド定義で処理するAI抽出アプローチにより、これを劇的に簡素化できます。

ImageToTable.aiはカスタム列抽出パラダイムを通じてCFDI抽出を処理します。出力に必要な列を定義すると、AIはフィールドがページ上のどこにあるかではなく、その意味を理解して各値を特定します。CFDIのワークフローは次のとおりです。

1
アップロード — CFDIのPDF、XMLファイル、または写真をアップロードキューにドロップします。1回の操作で50件以上の文書を一括アップロードできます。
2
列を定義 — 必要なフィールド名を入力します: UUID (Folio Fiscal)RFC EmisorRFC ReceptorSubTotalIVA TasaIVA MontoTotalUsoCFDIMétodoPagoMoneda。PPD請求書の場合は、UUID PagadoMonto del Pagoを追加してComplemento de Pagoフィールドを取得します。
3
処理 — AIがバッチ内のすべての文書からフィールドを抽出します。XMLファイルはXML構造から直接解析し、PDFやスキャン画像はビジョンベースの意味理解を使用します。XMLフィールドはAnexo 20スキーマから直接解析され、PDFや画像のフィールドは意味的マッチングによって視覚的に特定されます。米国の請求書で請求書番号を読み取るのと同じAIが、CFDIでUUIDやRFCを読み取ります。
4
エクスポート — 統合された出力をExcel、CSV、またはJSONとしてダウンロードします。すべてのサプライヤー、すべてのPAC、すべてのフォーマットが、一貫した列ヘッダーを持つ単一のスプレッドシートに集約されます。各行が1つのCFDI、各列が定義した1つのフィールドです。

このアプローチにより、PACのレイアウト問題は自動的に解決されます。AIはフィールドの固定位置に依存しないため、Finkok(UUIDが2ページ目の右上隅)でレンダリングされたCFDIと、FacturAPI(UUIDが左下フッター)でレンダリングされたCFDIの両方から、同じ構造化出力が生成されます。

特に補完情報(コンプレメント)の抽出について、XMLファイルを直接処理する場合、AIは階層構造をナビゲートできます。Pago CFDIの/Complemento/Pagosノードから参照UUID、支払金額、日付を抽出します。同じPago CFDIのPDF表現の場合、AIはPACが視覚文書上で表示した場所から補完フィールドを読み取ります。

CFDIデータとメキシコ会計ソフトの連携

抽出したCFDIデータは、経理チームが実際に使用するシステムに届いて初めて役立ちます。メキシコの会計ソフトウェア環境は米国や欧州とは大きく異なり、主要な製品は国産で、それぞれに固有のデータインポート要件があります。

CONTPAQi

CONTPAQiはメキシコで最も広く使われている会計・業務管理スイートで、会計(Contabilidad)、電子請求書(Factura Electrónica)、給与(Nóminas)、営業(Comercial)をカバーします。CONTPAQiはCFDI XMLを検証用にネイティブインポートできますが、大量データ分析(仕入先請求書200件と予算コードの照合、UsoCFDIカテゴリ別の支出レポート作成、DIOT入力データ準備)には、CONTPAQiの勘定科目表に対応するExcel形式のデータが必要です。抽出されたRFC、UUID、IVA額などの列は、一括仕訳としてインポートすると、CONTPAQiの補助元帳に直接反映されます。

Aspel SAE / COI / NOI

Aspelはメキシコの中小企業で2番目に多い会計プラットフォームで、SAE(業務管理)、COI(会計)、NOI(給与)のモジュールがあります。CONTPAQiと同様に、Aspelは個別請求書検証用にCFDI XMLを処理できますが、レポート機能を最大限活用するには、Aspelのインポートテンプレートに合わせたExcelテーブルにCFDIデータを事前にまとめる必要があります。メキシコの経理担当者の間では、補助的なCFDI台帳をExcelで管理するのが一般的です(1行=1請求書、RFC、UUID、伝票番号、IVA率、源泉徴収額の列)。これをAspelの元帳と毎月照合します。自動抽出により、この補助台帳は手作業での入力から直接エクスポートへと変わります。

SAPおよびOracle NetSuite

メキシコで事業を展開する大企業は通常、CFDIコンプライアンスに対応したローカライズ版のSAPまたはOracle NetSuiteを利用しています。これらのシステムは、組み込みのCFDIモジュールを通じてXML検証とPAC送信を自動的に処理します。しかし、課題はコンプライアンスから照合に移ります。購買部門と買掛金部門は、抽出されたCFDIデータを発注書、入荷伝票、仕入先契約条件と照合する必要があります。UUID、RFC、明細品目コード(c_ClaveProdServ)、税額明細を含む構造化された行としてCFDIデータを出力するAI抽出ワークフローは、SAPのMIRO(物流請求書検証)やNetSuiteの買掛金一括インポート処理に直接取り込めます。

よくある質問

AIはCFDI XMLファイルからデータを抽出できますか?

はい。最新のAI抽出ツールはCFDI XMLファイルを直接解析し、Anexo 20スキーマの構造化フィールドを読み取ることができます。すべてのフィールドにXPathクエリが必要な純粋なXML解析スクリプトとは異なり、AIベースの抽出はスキーマのバリエーションを処理し、ソースがXML、PDF、スキャン画像のいずれであっても、定義した同じ列構造にデータを出力できます。これは、一部のサプライヤーがXML添付ファイルを送信し、他のサプライヤーがPDFを送信するハイブリッドバッチで特に有用です。

DIOT申告のためにCFDIから抽出すべきフィールドは?

毎月のDIOT(第三者取引情報申告書)には、最低限以下が必要です:サプライヤーのRFC、UUID、SubTotal、IVA(税率別内訳 — 16%、8%、0%)、源泉徴収IVA、源泉徴収ISR、UsoCFDI。DIOTではIVAを税率レベルで報告する必要があるため、抽出出力では単一の合計ではなく、税率コードごとにIVAを分離する必要があります。Exportaciónフィールドは取引が国内か輸出かを決定します — DIOTではこれらのカテゴリを分けて報告します。

PDFのみ入手可能な場合、PPD請求書をどう処理すればよいですか?

元のIngreso CFDIがPPDで発行され、PDFのみしかない場合、請求書データ(明細、合計、IVA)はPDFから読み取れますが、支払詳細は読み取れません — これらは別途発行されるPago CFDIに含まれています。支払い照合を完了するには、元のXMLファイルまたはPago CFDIのPDFが必要です。PDF請求書とPago CFDI文書の両方を処理するAI抽出ツールは、Complemento de Pagoフィールドの列を含めれば、支払UUIDの相互参照を一度のステップで出力できます。

CFDI抽出は異なるPACのPDFレイアウトを自動的に処理しますか?

テンプレートベースのOCRツールでは、PACレイアウトごとに個別のテンプレートが必要です — Finkok、SW sapien、Digifact、FacturAPI、SATの無料ツールは、同じXMLデータから視覚的に異なるPDFを生成します。フィールドの位置ではなく意味を理解して文書を読み取るAIセマンティック抽出ツールは、PACごとの設定なしですべてのPACレイアウトを自動的に処理します。FinkokスタンプのCFDIで機能する抽出設定は、他のPACでスタンプされたものにもそのまま機能します。

PDF表現は抽出目的で法的に有効ですか?

APワークフローや照合目的では、PDFからのデータ抽出で実務上十分です。PDFにはXMLと同じ請求書データが含まれています。ただし、メキシコ税法(CFF第30条)では、XMLのみが法的に有効な文書です。監査保存のためには、日常的なデータ抽出にどの形式を使用する場合でも、元のXMLファイルを保持する必要があります。実用的なワークフローとしては、受領した形式(最も一般的なPDF)から抽出しつつ、NOM-151-SCFI-2016に基づく法定保存期間5年間、XMLを構造化リポジトリにアーカイブすることをお勧めします。

同じツールでNómina(給与)CFDIからデータを抽出できますか?

はい、抽出ツールが給与明細に表示される内容と一致するフィールドレベルの列名をサポートしていれば可能です。Complemento de Nóminaには、総収入、総控除、源泉所得税(ISR)、IMSS、INFONAVIT、個別の所得・控除タイプコードなど、50以上のフィールドがあります。文書を意味的に読み取るAIツールは、必要な給与データポイントに合わせて列に名前を付ければ、これらのフィールドを抽出できます。ただし、手書きの給与記録よりも印刷されたNómina PDFの方が精度は高く、またNómina補完の階層構造(例:Percepciones/Percepcion/TipoPercepcionのような深くネストされたフィールド)では、視覚的なPDF版よりもXML版の方が一般的に信頼性の高い結果が得られます。

CFDIが取消された場合、再抽出が必要ですか?

CFDIの取消は受領者同意モデルに従います。仕入先が請求書を取り消す場合(理由コード01~04)、受領者は72時間以内に取消を承諾または拒否する必要があります。承諾された場合、元のCFDIは無効となり、代替品が発行された場合(理由コード01)は新しいUUIDが割り当てられます。抽出ワークフローはこのライフサイクルを処理する必要があります。具体的には、データベースで取消済みUUIDにフラグを立てて代替品をインポートするか、SATの取消フィードを確認して更新される「CFDIステータス」列(有効/取消)を維持します。処理履歴を保持する自動抽出ツールは、代替CFDIを再取り込みし、元のものを置き換え済みとしてフラグ付けできますが、これには元のXMLまたは以前に抽出されたUUIDの永続的なデータベースが必要です。

出力のComplemento de Pagoフィールドはどう扱えばよいですか?

Complemento de Pagoフィールド(参照UUID、支払金額、支払日、未収残高)は、Ingreso請求書データと同じスプレッドシートに抽出する必要があります。推奨される方法は、バッチ出力に追加の列として含めることです。PPD請求書の場合、抽出では基本請求書データとPago CFDIの支払いフィールドの両方が返されます。その後、VLOOKUP(または同等の関数)を使用してPago UUID参照を元のIngreso UUIDと照合し、完全に決済された請求書と未処理の請求書を確認できます。これにより、毎月のCFDI照合で最も時間がかかる手動の相互参照手順が不要になります。

「CFDI文書はある」と「会計システムにデータが入っている」の間にあるのは、技術のギャップではなく、フォーマット変換のギャップです。適切な抽出ワークフローを使えば、そのギャップは数時間ではなく数分で埋まります。

CFDIデータの抽出は、本質的に難しいわけではありません。XMLは構造化されており、PDFも同じデータを持ち、補完情報(complementos)はSATが公開するXSDで定義されています。実際に難しいのは、フォーマットの多様性、PACごとのレイアウトのばらつき、税情報や補完データの階層的な入れ子構造、そしてほとんどの抽出ワークフローが毎回同じ見た目のフラットな定型文書向けに設計されていることです。各フィールドが「どこにあるか」ではなく「何であるか」を理解して文書を読み取るセマンティックなアプローチなら、単一のフィールド定義でこれらすべての複雑さを処理できます。列を定義すれば、AIがデータを見つけ出し、フォーマットは無関係になります。

現在、メキシコのサプライヤー請求書を処理していて、データの移動に時間を費やし、そのデータを活用できていないなら、次のステップは明白です。手持ちのあらゆるフォーマットのCFDIファイルを10~20件サンプルとして、AI抽出ワークフローにかけてみてください。「文書はある」と「スプレッドシートにデータが入っている」の間のギャップは、手作業で感じるほど大きくはありません。

手入力をやめよう — AIに読み取らせるだけ
画像やPDFをアップロード — 10秒で構造化データに
今すぐ試す
登録不要 · カード不要 · 10秒で結果

この記事は、ImageToTable.aiの請求書データ抽出ガイドシリーズの一部です。概要については、請求書データ抽出とはおよびOCRとはをご覧ください。CFDIの初心者向け入門書は、CFDIとはをお読みください。各CFDIフォーマットを網羅した実践的な抽出チュートリアルは、メキシコCFDI請求書データのExcelへの抽出をご覧ください。CFDI処理が従来の買掛金ワークフローをなぜ困難にするのか、より深く知りたい方は、メキシコのCFDI請求書処理がほとんどのチームの想定より難しい理由をお読みください。

📮 contact email: [email protected]