スペイン請求書(Facturas)からデータを抽出する方法
Excelへ
スペインの請求書(factura)は一見、標準的なEUの請求書と変わりません。仕入先名、日付、明細、合計金額が並んでいます。しかし、3つの項目がドイツ、フランス、イタリアの請求書とは構造的に異なります。それは、数字8桁+チェック文字というNIF形式の納税者番号、同一ページに最大3つのIVA税率(21%、10%、4%)を記載する税額内訳、そして合計から差し引かれるIRPF源泉徴収欄です。これらの項目を手動でExcelに入力すると、フォーマットの違いが毎回の作業で障壁となります。汎用的なEU請求書レイアウトを前提としたテンプレートベースの抽出ツールを使うと、NIFの検証に失敗し、IVAの内訳が誤った列に配置され、IRPF欄はまったく認識されません。この記事では、スペイン請求書の各項目を解説し、それぞれの抽出上の意味を説明し、手入力なしでクリーンなデータをスプレッドシートに取り込む方法を紹介します。
重要ポイント
- ドイツやイタリアの請求書では完璧に動作する抽出ツールも、スペインのfacturaでは気付かずに誤った合計を出力します。
- 同一ページに3つのIVA税率(21%、10%、4%)が存在するため、1行のVATを想定するテンプレートベースのツールは破綻し、合計から差し引く税項目であるIRPF源泉徴収はまったく認識されません。
- ImageToTable.aiのようなセマンティックリーダーは、レイアウトに関係なくすべてのIVA税率、IRPF源泉徴収、NIFチェック文字を抽出するため、1つの照合式(合計=課税標準+ΣIVA-IRPF)でスプレッドシート内の不一致行をすべて検出できます。
スペインの請求書が他のEUフォーマットと異なる点
EUのVAT指令(2006/112/EC)は、全加盟国に共通する請求書の枠組みを定めています。すべてのEU請求書には、事業者のVAT番号、日付、明細、VAT額の記載が必須です。この最低限の基準はリスボンからヘルシンキまで同じです。スペインの請求書が異なるのは、その上に追加される要件にあります。
スペインの請求義務はReal Decreto 1619/2012で定められており、EUの最低要件を超える必須項目が規定されています。スペイン税務庁(AEAT)は、四半期ごとの税務申告を通じてこれらのルールを執行します。必須項目が欠けた請求書は、受取人のIVA(VAT)控除を阻害し、取引額の1~2%の罰金が科される可能性があります。
スペインの請求書(factura)を一般的なEUテンプレートと区別する、4つの構造的な違いがあります。
| 項目 | 一般的なEU請求書 | スペインの請求書(Factura) |
|---|---|---|
| 税ID形式 | VAT番号(国コード+英数字、可変長) | NIF/CIF(納税者番号):個人は数字8桁+チェック文字1桁、法人は文字1桁+数字7桁+チェック文字1桁 |
| VAT税率 | 通常1~2種類(標準+軽減) | 同一請求書に最大3つのIVA税率:21%(一般)、10%(軽減)、4%(超軽減)— それぞれに課税標準(Base Imponible)と税額(Cuota)が必要 |
| 所得税源泉徴収 | ほとんどのEU請求書にはなし | IRPF(個人所得税)の源泉徴収 — 通常15%または7%を総額から控除。マイナスの税額行として表示 |
| 請求書番号 | 連番、シリーズの要件なし | シリーズ+番号:請求書は名前付きシリーズ(例:2026-F-0001)で管理。訂正請求書(Rectificativas)は別途必須シリーズ |
これらは表面的な違いではありません。請求書あたり単一のVAT税率を想定したテンプレートベースの抽出ツールは、スペインの請求書における21%と10%のIVA行を2つの別々の行に分割するか、さらに悪いことに、どの税率がどの課税標準に対応するかを保持せずに1つの列に統合してしまいます。ドイツや英国の請求書レイアウトで訓練されたツールは、源泉徴収行の概念を持ちません。なぜなら、それらの市場では請求書の合計は単に正味額+VATだからです。スペインの請求書では、合計は多くの場合、正味額+IVA-IRPFであり、計算を誤ると抽出された金額が実際の支払額と一致しなくなります。
抽出の課題は、スペインの請求書が読みにくいからではありません。ほとんどの抽出ツールが認識するように設計されていないデータカテゴリが含まれているからです。それらのカテゴリが何かを理解すれば、抽出ステップは予測可能になります。
スペイン請求書の必須項目とその意味
Real Decreto 1619/2012第6条に基づき、完全な請求書(factura completa)には最低11のデータ項目が必要です。簡易請求書(factura simplificada)は、400ユーロ未満の金額や、ホスピタリティ・運輸などの業種で使用され、受取人のNIFや住所が省略されます。抽出時には両方のバリエーションを考慮する必要があります。30件の仕入先請求書のバッチには、ほぼ確実に両方が混在します。
| 項目(スペイン語名) | 内容 | 抽出時の注意点 |
|---|---|---|
| Número y Serie(番号とシリーズ) | シリーズ内の連番請求書番号。例:2026-F-000123 または R-2026-045 | シリーズ接頭辞で種類を識別(F=請求書、R=訂正票)。両方を別々の列として抽出し、シリーズの連続性を追跡 |
| Fecha de Expedición(発行日) | 請求書発行日。B2Bの場合、サービス提供月の翌月16日以内である必要あり | スペインの日付形式はDD/MM/YYYY。AI抽出で自動的にロケールに合わせて正規化 |
| Fecha de Operación(取引日) | 商品・サービスの提供日(発行日と異なる場合) | 約40%の請求書に記載。空欄の場合は取引日=発行日 |
| NIF/CIF Emisor(発行者の納税者番号) | 供給者の納税者番号。個人:数字8桁+英字1文字(例:12345678Z)。法人:英字1文字+数字7桁+チェックデジット1文字(例:B12345678) | 末尾の英字は数字部分から計算されるチェックデジット。無効な場合は入力ミスまたは不正請求書の可能性 |
| Razón Social(法人名) | 発行者と受取者の正式な登記上の事業者名 | 商号と異なる場合あり。ロゴのブランド名ではなく、常にRazón Socialを抽出 |
| Dirección Fiscal(税務住所) | 両当事者の登記上の税務住所 | 完全請求書では必須。簡易請求書では受取人の記載なし |
| Descripción(説明) | 商品・サービスの説明(数量、単価を含む) | 取引を特定できる十分な詳細が必要。曖昧な説明は監査リスク増加 |
| Base Imponible(課税標準額) | 税抜き正味金額。適用されるIVA税率ごとに内訳 | 1枚の請求書に複数の課税標準行が存在可能(IVA率ごと+非課税取引用) |
| Tipo de IVA(IVA税率)+ Cuota IVA(IVA額) | パーセンテージ(21%、10%、4%)と各税率に対応するユーロ額 | ペアで抽出:各税率はその課税標準と金額に紐付けて保持 |
| Retención IRPF(IRPF源泉徴収) | パーセンテージ(15%または7%)と源泉徴収額(ユーロ)。個人事業主(autónomos)からのB2Bサービス請求書のみ | これはマイナス行。支払総額=課税標準+IVA-IRPF。テンプレートベースのツールではマイナス税額行の解析に失敗することが多い |
| Importe Total(合計金額) | 税金と源泉徴収を含む最終支払額 | IRPFがある場合、合計は課税標準+IVAと一致しない。検算:合計=課税標準+IVA-IRPF |
最も多い抽出ミスは、Importe Total(合計金額)を「Base Imponible(課税標準)+IVA」とだけ捉え、IRPF控除を無視することです。1,000ユーロのサービス請求書でIVA 21%、IRPF 15%の場合、合計は1,060ユーロであり、1,210ユーロではありません。IRPFを加算するツールは、請求書1枚あたり150ユーロ多く計上します。月30枚の請求書では、買掛金元帳に月額4,500ユーロの差異が生じます。
IVA内訳の問題:1枚の請求書に3つの税率が存在する理由
スペインでは、Ley 37/1992(LIVA)に基づき、一般21%、軽減10%、超軽減4%の3つのIVA税率が適用されます。10%税率は食品、旅客輸送、飲食業、特定の専門サービスに適用されます。4%税率はパン、牛乳、書籍、医薬品などの生活必需品に適用されます。食品卸売業者からの1枚の請求書には、10%対象品(調理済み食品)と4%対象品(基礎的食品)に加え、包装や配送料に21%が含まれる場合があります。
この場合、請求書は各税率を個別の行に、それぞれ別のBase Imponible(課税標準)とCuota(税額)を記載する必要があります。異なる税率をまとめて記載することは、Real Decreto 1619/2012に基づき不適合となります。抽出においては、1枚の請求書から複数の税行が生成されることを意味します。
| IVA税率 | Base Imponible | Cuota IVA | 該当カテゴリ |
|---|---|---|---|
| 21%(一般) | 200.00ユーロ | 42.00ユーロ | 包装、配送、非食品 |
| 10%(軽減) | 500.00ユーロ | 50.00ユーロ | 調理済み食品、輸送 |
| 4%(超軽減) | 300.00ユーロ | 12.00ユーロ | パン、牛乳、基礎的食品 |
| 合計 | 1,000.00ユーロ | 104.00ユーロ |
一般的な請求書抽出ツールの多くは、この処理が不得意です。最初のIVA行のみを取得して残りを無視するか、またはすべてのIVA金額を1つの列に合計し、税率別の内訳を保持しません。この内訳の欠落は重要です。Modelo 303(四半期IVA申告書)を提出する際、AEATはIVA soportado(仕入税額控除)を税率カテゴリ別に報告することを要求します。抽出結果が104.00ユーロのIVAを税率属性なしで表示する場合、申告書のボックス28~31を正しく記入できません。
ここで抽出方法が重要になります。テンプレートベースのOCRツールは「VAT」のようなラベルを探し、その隣の数値を取得します。3つのIVA行があるスペインの請求書では、「VAT」が3つの異なる数値とともに3回出現します。各税率の意味を理解するセマンティック抽出アプローチは、3つの税率すべてを、その課税標準と金額を保持した個別のデータポイントとして取得します。「Base Imponible 21%」「Cuota IVA 21%」「Base Imponible 10%」などの列を定義します。AIがページ全体を読み取り、各IVAブロックを識別し、レイアウトに関係なく正しい値を各列に配置します。
AEATがModelo 303を仕入先請求書と照合する際、最初にチェックするのはIVA内訳です。報告された仕入税額控除と文書化されたIVA(税率別)の不一致は、他のどの不一致よりも早く調査の引き金となる危険信号です。
IRPF源泉徴収(Retención IRPF):合計が合わなくなる原因の項目
IRPF源泉徴収は、スペイン国外の方にとってスペインの請求書で最も混乱しやすい項目です。これは売上税ではなく、所得税の前払いです。個人事業主(autónomo)がスペインの事業者にサービスを請求する際、顧客は課税対象額の一定割合を差し引き、事業者に代わって直接AEATに納付します。事業者は源泉徴収後の正味額を受け取り、年間のIRPF申告(Modelo 100またはDeclaración de la Renta)時に差し引かれた額を回収します。
源泉徴収率はIRPF法第101条で定められています:
| 税率 | 適用対象 | 期間 |
|---|---|---|
| 15% | 専門サービス(コンサルタント、弁護士、建築家、IT、デザイナー)— 標準税率 | 活動開始から3暦年目以降 |
| 7% | 活動開始から3暦年以内の新規事業者 | 登録年とその後2年間 |
| 19% | 知的財産権使用料および特定の芸術収入 | 継続 |
| 0% | 農業・畜産業;個人または非居住者顧客への請求書;企業(S.L./S.A.)間の請求書 | 継続 — 企業間請求書にはIRPFは適用されません |
請求書上では、IRPFはIVA計算の下にマイナスの明細として表示されます。一般的なレイアウト:
Base Imponible: €1,000.00
IVA(21%): +€210.00
IRPF(15%): −€150.00
Total a Pagar: €1,060.00
データ抽出において、IRPFの行は特有の課題を提示します:割引のように見えますが、税のように振る舞います。請求書によっては「Retención IRPF」と記載されるものもあれば、「IRPF」や「Ret. IRPF」と略されるものもあります。税率と金額が同じ行に表示される場合も、2行に分かれる場合もあります。すべての金額フィールドが正の値であることを前提とするテンプレートでは、−150を150と誤読し、合計が€1,060ではなく€1,360になってしまいます。
検算は簡単です:抽出後、Importe Total = Base Imponible + ∑Cuota IVA − Retención IRPF を確認してください。数値が一致しない場合、IVA税率またはIRPFの行のいずれかが抽出で見落とされています。
請求書番号のルールとデータ照合における重要性
スペインの請求書番号は、Real Decreto 1619/2012に基づき、「シリーズ+番号」の構造をとります。シリーズとは、通常請求書用の「2026-F」や訂正請求書用の「R-2026」のような名前付きプレフィックスであり、番号はそのシリーズ内で連番となり、欠番は許されません。このシリーズ制度は、スペイン法が請求書の種類(通常請求書、簡易請求書、訂正請求書(facturas rectificativas))ごとに別々の番号体系を義務付けているために存在します。
訂正請求書(factura rectificativa)は、単に元の請求書を取消すものではありません。元の請求書の番号と日付を参照し、訂正理由を記載し、元の金額と訂正後の金額の差額を示します。訂正額はプラス(請求漏れがあった場合)にもマイナス(過大請求や顧客からの返品があった場合)にもなります。Real Decreto 1619/2012に基づく監査ルールでは、訂正請求書は元の請求書の税発生日から4年以内に発行する必要があります。4年を過ぎると、訂正請求書による修正はできなくなります。
データ照合において、シリーズプレフィックスは文書タイプの分類子として機能します。Fシリーズ(標準)とRシリーズ(訂正)が混在する請求書のバッチは、異なる処理が必要です。Rシリーズの請求書は新たな支払債務を表すのではなく、既存のものを調整します。これらを区別しないと、同じ費用を二重計上したり、マイナスの訂正請求書の場合には存在しない支払債務を照合してしまうことになります。
抽出戦略:「請求書シリーズ」と「請求書番号」の2つの列を定義し、それぞれ独立して抽出します。次に、Rシリーズのプレフィックスを手動レビュー用にフラグ付けする計算列またはExcel数式を設定します。AIは、「2026-F-000123」「R-2026/045」「REC-001」など、印刷された通りのシリーズプレフィックスを読み取ります。
ステップバイステップ:スペイン請求書データのExcelへの抽出
以下は、一連のスペイン請求書(facturas)から単一のExcelスプレッドシートにデータを抽出するワークフローです。このアプローチでは、セマンティックAI抽出を使用します。ツールは、各フィールドがページ上のどこにあるかではなく、その意味を理解することで請求書を読み取ります。これは、異なる供給元からのスペイン請求書が同じフィールドをまったく異なる位置に配置する可能性があるため重要です。ある供給元はNIFを右上隅に配置し、別の供給元は明細行の下のフッターブロックに配置し、さらに別の供給元はQRコードに埋め込む場合があります。レイアウトが変わると位置ベースの抽出は機能しなくなりますが、セマンティック抽出は機能します。
スペイン語の請求書をアップロード
PDF、スキャン画像、または請求書のスクリーンショットをアップロードエリアにドラッグ&ドロップ。PDF、JPG、PNG、Webスクリーンショットに対応。10枚、50枚、それ以上の請求書を一度に一括アップロード可能。仕入先やフォーマット、請求書の種類ごとに事前に仕分ける必要はありません。
抽出する列を定義
必要なスペイン語請求書フィールドに合わせて列名を入力:「NIF Emisor」「Razón Social」「Número de Factura」「Serie」「Fecha de Expedición」「Base Imponible 21%」「Cuota IVA 21%」「Base Imponible 10%」「Cuota IVA 10%」「Retención IRPF (%)」「Retención IRPF (€)」「Importe Total」。入力した列名が出力スプレッドシートのヘッダーになります。計算列も追加可能。例:「検証(Base Imponible 21% + Base Imponible 10% + IVA − IRPF = Importe TotalならOK、それ以外はDIFF)」と入力すれば、自動で照合エラーをフラグ付けします。
処理して確認
「処理」をクリック。AIが各請求書を読み取り、画素位置ではなく意味を理解して各フィールドを特定し、出力テーブルにデータを入力。ブラウザ上で結果を確認。検証列でIVA内訳とIRPFが一致しない請求書が自動でマークされるので、まずはそれらを重点的にチェック。処理時間は1ページあたり5〜10秒です。
Excelにエクスポートして照合
完全なデータセットをXLSXファイルとしてダウンロード。各行が1つの請求書、各列が1つのフィールドに対応。データは事前に正規化済み:日付は統一フォーマット、金額は数値(テキスト文字列ではない)、検証列は事前計算済み。このスプレッドシートを会計ソフト、Modelo 303の準備、買掛金照合ワークフローにそのまま取り込めます。
ファイルは安全に処理され、保存されません。
フォーマットの種類:正規請求書、簡易請求書、修正請求書、見積請求書
スペインの取引先から届く請求書が、11の必須項目すべてを備えた正規請求書(factura completa)とは限りません。スペインの税法では複数の請求書タイプが認められており、買掛金管理の受信箱には様々な種類が混在します。
| 請求書タイプ | 用途 | 抽出時の主な違い |
|---|---|---|
| 正規請求書(通常) | 標準的なB2B請求書。必須項目はすべて記載。 | 全項目抽出可能:11項目すべて利用可。発行元と受取人のNIF、完全な住所、税額内訳が含まれる。 |
| 簡易請求書 | 400ユーロ未満、またはホスピタリティ・運輸・駐車場では3,000ユーロまでの取引。B2C取引。 | 受取人のNIFと住所が欠落。IVA税率は必要だが、税率ごとの課税標準額(Base Imponible)の内訳は不要。総額にIVAを含めればよい。受取人は仕入税額控除に使用不可。 |
| 修正請求書 | 過去に発行した請求書の訂正用。元の請求書を参照し、訂正理由を明記する必要あり。 | 固有のシリーズ接頭辞(R-またはREC-)が付く。訂正後のデータと元の値の2組の数値を含む。抽出時は参照元の請求書番号と差分を取得する必要あり。 |
| 一括請求書 | 同一顧客への複数取引を1つの月次請求書にまとめたもの。 | 異なる日付や異なるIVA税率の明細行を含む場合あり。各行に独自の税務処理が必要。 |
| 見積請求書 | 仮請求書であり、税務文書ではない。見積書や前金請求に使用。 | 有効な税務請求書ではない。「Proforma」の表示を目立つように記載する必要あり。IVA申告には含めない。参照用としてのみ抽出。 |
抽出戦略は、受信箱に届く請求書の種類に応じて適応します。受取人NIFがない簡易請求書の場合、NIF列は空白のままで行は有効とします。修正請求書の場合、シリーズ接頭辞が手動レビューフラグをトリガーします。AIは固定スキーマを期待するのではなく、ページ上の情報を読み取ります。
1枚の請求書を超えて:その先のステップ
1枚のスペイン語請求書をExcelに抽出すれば、その書類のデータ入力問題は解決します。しかし、より大きな業務上の課題——30枚、50枚、200枚もの仕入先請求書を一括処理し、すべてのIVAを統合してModelo 303に対応し、IRPF源泉徴収額を集計してModelo 111と照合する——については、スペイン語の仕入先請求書を一括処理して買掛金スプレッドシートに変換する方法で、複数仕入先のワークフローと四半期ごとの税額統合について解説しています。
スペイン語の請求書と他国の請求書を併用する企業でも、同じ抽出アプローチが様々な形式で機能します。XMLを解析するのではなく、ページを視覚的に読み取るツールは、スペインのfactura、メキシコのCFDI、フランスのfactureのいずれであっても、人間と同じように数字やラベルを読み取ります。スペイン語圏市場における抽出コストの比較については、予算重視のスペイン語圏市場向け文書抽出およびメキシコの小規模事業者向け低コストCFDI抽出をご覧ください。
よくある質問
AI抽出は手書きのスペイン語請求書でも機能しますか?
はい。手書き文字認識は、印刷されたスペイン語請求書と手書きのもの(筆記体を含む)の両方に対応しています。同じ列名アプローチが有効で、AIは「NIF」や「Base Imponible」を、タイプ文字か手書きかに関わらず意味的に識別します。明瞭な手書き文字では印刷文字と同等の精度ですが、装飾が強い文字や薄い文字は目視確認が必要な場合があります。
このツールはFacturaE XMLファイルにも対応しますか?それともPDFのみですか?
抽出ツールは文書の視覚レイヤー(PDF、画像、スクリーンショット)を読み取ります。XMLを直接解析することはありません。FacturaE XMLファイルをお持ちの場合、データはすでに構造化され機械可読な状態ですので、抽出は不要です。このツールは、はるかに一般的なシナリオ——仕入先がXMLではなくPDF版の請求書を送ってきて、その視覚表現からデータを取得する必要がある場合——向けに設計されています。
IVA税率が変更されたり、新しい税率が導入されたらどうなりますか?
テンプレートベースではなくセマンティックに抽出するため、請求書に印刷されたあらゆるIVA税率に自動対応します。スペイン政府が新税率を導入したり既存税率を変更しても、AIはページに表示された税率をそのまま読み取ります。テンプレートの更新や再学習は不要です。IRPF税率の変更についても同様です。
リバースチャージIVAが適用されるEU域外のスペイン企業向け請求書はどう処理されますか?
スペイン企業が他のEU加盟国からリバースチャージメカニズム(inversión del sujeto pasivo)で請求書を受け取った場合、請求書には「IVA: Inversión del sujeto pasivo」または「0% IVA — Art. 84 LIVA」と表示され、税額は記載されません。AIは0% IVAの表記と該当する法律条文を抽出します。リバースチャージIVAは受領者側で自己申告するもの(供給者が課税するものではない)であるため、抽出データはこの請求書の仕入IVAがゼロであることを正確に反映します。EU域内取引の報告には、Modelo 303ではなくModelo 349が使用されます。
複数ページのスペイン請求書でも抽出精度は変わりませんか?
AIは複数ページの文書全体を1つの単位として処理します。複数ページにまたがる明細行も順番に取得されます。ヘッダー、フッター、ページ番号は繰り返し要素として認識され、出力で重複することはありません。複数ページの請求書でも、単一ページの文書と同等の精度です。
スペイン請求書に本当に必要な抽出ステップ
スペインの請求書は、他のEU諸国のものよりも構造が複雑です。複数税率のIVA、通常の税計算を逆転させるIRPF控除、そして訂正用に別系統を持つシリーズベースの番号体系があります。ほとんどの抽出ツールはよりシンプルな請求書モデル向けに作られているため、データが不完全(IVA税率やIRPFが欠落)になったり、合計額が実際の支払額と一致しない(IRPF控除が無視される)という問題が生じます。セマンティック抽出は、スペインの会計士のように請求書を読み取ることで状況を変えます。つまり、テンプレートが期待する位置ではなく、各フィールドの意味に基づいて識別します。出力は、Base Imponible 21%が1列、Base Imponible 10%が別の列、IRPFが独自の列に配置され、合計額が一致するクリーンなスプレッドシートです。