ポルトガル請求書データ抽出:
経理チームが本当に必要とするもの
ほとんどの請求書抽出アドバイスは、1文書あたり1つの税率を前提としています。しかし、ポルトガルの請求書(ファトゥーラ)には23%、13%、6%の3つの税率が存在し、それぞれに専用の列が必要です。ATCUDコードを分離し、IVAを税率ごとに区分し、NIFはそのまま保持します。スプレッドシートの構造を誤ると、四半期ごとのVAT申告も誤りになります。正しい構造であれば、残りの作業は迅速に進みます。
重要ポイント
- ほとんどの抽出ツールは、税額列が1つだけの世界を想定して設計されています。
- ポルトガルのファトゥーラには3つのIVA税率が含まれており、VAT申告ではそれぞれを独立した列に要求します。
- 列名はフィールドの意味に基づいて命名すれば、1つの構造で毎月のすべての仕入先請求書に対応できます。
ポルトガルの請求書(ファトゥーラ)が他と違う点
ポルトガルの請求書(ファトゥーラ)はEUの請求書基準に従いつつ、一般的な抽出ツールでは想定されていない国内コンプライアンスの層が追加されています。抽出ワークフローを構築する上で重要な3つの違いがあります。
ポルトガルの請求書にはすべて、納税者番号(NIF)、固有文書コード(ATCUD)、主要な税務項目をエンコードしたQRコードが含まれています。これらはすべてDecreto-Lei n.º 28/2019およびPortaria n.º 195/2020で義務付けられています。「VAT番号」と「合計」だけを抽出する一般的な請求書ワークフローでは、ポルトガル税法で追跡可能な文書とするためのデータが欠落します。
NIFはVAT番号ではありません。ポルトガルのNIFは、すべての課税事業体(個人、企業、ポルトガルに納税義務のある非居住者)に発行される9桁の税務識別子です。VAT登録番号と一般税務IDの両方の役割を果たすため、同一請求書上で供給者識別子、顧客識別子、場合によっては支払参照として複数の役割で表示されます。これは、ドイツのようにUSt-IdNr.とSteuernummerが別目的の別識別子である管轄区域とは異なります。形式は1つ、番号は1つですが、文脈がその意味を決定します。
IVA税率は3段階です。ポルトガル本土では、標準税率(taxa normal)は23%、中間税率(taxa intermédia)は13%、軽減税率(taxa reduzida)は6%です。1枚の請求書に異なる税率の品目が含まれることがよくあります。レストランの仕入注文では、食品が13%、備品が23%で同じ文書に記載される場合があります。抽出結果に「税額」列が1つしかない場合、手動で再分割しなければdeclaração periódica de IVA(定期VAT申告)を提出できません。税務当局(Autoridade Tributária e Aduaneira, AT)は税率ごとの個別報告を要求します。
ATCUDは検証の要です。2023年1月以降、すべての請求書にATCUDの記載が必須です。これは、ATが供給者に発行する検証コードから生成される一意の英数字識別子です。付随するQRコードには、供給者NIF、ATCUD、税率ごとの課税標準、税率ごとの税額など、同じデータが標準化された形式でエンコードされています。これらは装飾ではなく、ATのデータベースに対して請求書を独立して検証可能にします。抽出の文脈では、ATCUDを取得することで、スプレッドシートの各行から法的に登録された文書への直接リンクが得られます。
ポルトガルの供給者請求書を処理する財務チームにとって、抽出の問題は単に「PDFを読み取る」ことではありません。それは「監査時にATが証拠として受け入れるスプレッドシートを生成できる方法でPDFを読み取る」ことです。これは、ほとんどの一般的な請求書OCRツールが想定するよりも高いハードルです。
VAT申告に本当に必要なスプレッドシートの構造
抽出作業の前に、出力形式を決めておきましょう。ポルトガルでは、「日付」「仕入先」「合計」だけの仕入先請求書スプレッドシートは中途半端です。支払いスケジュール管理には役立ちますが、税務申告には使えません。以下に示す構造は、contabilista certificado(公認会計士)がe-Faturaとの照合、定期VAT申告の作成、会計ソフトへのインポートを行うために必要なものです。
絶対に欠かせない項目:仕入先のNIF、請求書番号、発行日、VAT税率ごとの課税標準、VAT税率(%)、税率ごとのVAT額、請求書合計額。1つの列にすべての税情報を詰め込もうとすると、VAT申告期間ごとに手作業でやり直すことになります。
| 列 | ポルトガルで重要な理由 |
|---|---|
| 仕入先NIF | ポルトガルの課税事業者を一意に識別する番号。e-Faturaの照合や、仕入先がATに登録されているかの確認に必要。 |
| 仕入先名 | 請求書に記載された正式な法人名(商号ではない)。NIFと照合し、仕入先マスタデータを検証する。 |
| 請求書番号 | 仕入先ごとに一意。仕入先NIFと組み合わせて、e-Faturaの記録と照合するための複合キーとなる。 |
| 発行日 | 請求書が属する月次のVAT申告期間を決定。形式:YYYY-MM-DD。 |
| 支払期日 | 資金管理と買掛金の経過期間分析に使用。ATへの申告は不要だが、支払計画に不可欠。 |
| 課税標準 — 23% | 標準税率のIVA適用前の正味金額。定期VAT申告書の該当フィールドに直接入力する。 |
| 課税標準 — 13% | 中間税率のIVA適用前の正味金額。 |
| 課税標準 — 6% | 軽減税率のIVA適用前の正味金額。 |
| IVA額 — 23% | 標準税率での税額。この区分における控除対象IVA額。 |
| IVA額 — 13% | 中間税率での税額。 |
| IVA額 — 6% | 軽減税率での税額。 |
| 合計 | 請求書の総額(税込)。迅速な照合と、課税標準+IVA=合計のクロスチェックに使用。 |
| ATCUD | 一意の文書コード。これを取得することで、各行がATに登録された文書に直接遡れる監査証跡となる。任意だが、コンプライアンス上、価値が高い。 |
| ソースファイル/ページ | 元のPDFとページ番号の参照。監査対応には必須。検査官は必ず各行を元の文書に遡るよう求める。 |
月次の仕入先請求書バッチのほとんどは、請求書ごとに1行(ヘッダーレベルの抽出)で十分です。品目ごとの原価分析やコストセンター配分が必要な場合は、明細レベルに落とし込みます。各請求明細が1行になり、請求書番号とNIFが繰り返されます。列構造は同じで、粒度のみが変わります。
混合税率の請求書は特別な処理が必要です。 1枚の請求書に異なるIVA税率の品目が含まれる場合(飲食、食品流通、建設資材でよく見られます)、すべての税を1行にまとめると税率の内訳が失われます。最もクリーンな解決策は、請求書を複数のヘッダー行に分割するか(税率ごとに1行、請求書番号とNIFを繰り返す)、各行が独自の税率を継承する明細行抽出に直接進むことです。
ポルトガルの請求書データをExcelに抽出する方法
列構造が定義されていれば、抽出自体は簡単です。ここで説明する方法では、カスタム列抽出を使用します。「仕入先NIF」「課税標準23%」「ATCUD」など、必要なフィールド名を入力すると、AIが各請求書を読み取り、対応する値を見つけて列に入力します。各仕入先のレイアウトに合わせてフィールドごとにバウンディングボックスを描画する必要があるテンプレートベースのOCRとは異なり、事前設定なしで任意の請求書形式で機能します。
仕入先請求書を収集
対象期間のすべての仕入先請求書(faturas)を集めてください。ネイティブPDF、スキャン文書、スマートフォンで撮影した写真など、形式は問いません。ポルトガルの仕入先は様々です。大規模な販売代理店はPrimaveraやPHCなどの認定ソフトウェアからネイティブPDFを送信するのが一般的ですが、小規模な仕入先は紙の請求書をスキャンしてメールで送信したり、印刷された書類をWhatsAppで写真送信することもあります。優れた抽出ツールは、形式ごとに事前に仕分けする必要なく、これらすべての形式に対応できる必要があります。
抽出列を定義
このステップで出力の実用性が決まります。上記の構造から列名を入力してください:「仕入先NIF(納税者番号)」、「仕入先名」、「請求書番号」、「発行日」、「期日」、「課税ベース 23%」、「課税ベース 13%」、「課税ベース 6%」、「IVA額 23%」、「IVA額 13%」、「IVA額 6%」、「合計」、「ATCUD」。また、推論列として「IVA税率区分(23% / 13% / 6%)」を追加すれば、AIが抽出された各行を自動的に分類します。
バッチをアップロードして処理
すべての請求書を一度にアップロードします。AIが各文書を並行処理し、通常1ページあたり5~10秒かかります。50枚の単一ページ請求書のバッチの場合、結果は2~3分で得られます。出力は、定義した列を持つ構造化されたスプレッドシートで、請求書ごと(または選択した粒度に応じて明細行ごと)に1行が割り当てられます。
確認と検証
サンプルをスポットチェックします。5~10件の請求書で「課税ベース + IVA = 合計」を検証し、NIFが9桁であることを確認し、複数税率の請求書で正しい内訳が表示されているか確認します。ソースファイル/ページ列を使用すると、疑わしい行から元のPDFに直接ジャンプできます。100件の請求書バッチに対する10分間のレビューで、通常、体系的な問題をすべて発見できます。これは手動でデータを入力する時間よりもはるかに短時間です。
ファイルは安全に処理され、保存されません。
上記のプロセスでほとんどの請求書は問題なく処理できますが、様々な形式の請求書を扱う際には、以下の3つのエッジケースに注意が必要です:
- 免税請求書とリバースチャージ。CIVA第9条に基づく免税、またはリバースチャージ(建設業の下請けやEU域内取得で一般的なautoliquidação)の対象となる請求書は、IVA税率は0%ですが、特定の法的記載が必要です。「IVA区分/法的根拠」列を追加し、AIに免税またはリバースチャージの表記を正確に抽出するよう指示してください。これがないと、会計士はIVAが単に省略された請求書と免税請求書を区別できません。
- 複数請求書を含むマルチページPDF。一部の供給業者は複数の請求書を1つのPDFに連結します。抽出ツールは文書の境界を検出し、ファイルごとではなく請求書ごとに個別の行を作成する必要があります。表紙や配送確認書などのページは自動的に無視されるべきです。
- 手書きまたは撮影された請求書。ポルトガルの小規模供給業者(地元の職人、独立農家、小規模サービス事業者など)は、手書きの請求書を発行し、それをスマートフォンで撮影することがよくあります。最新のAI抽出は手書き文字や低品質の携帯写真もかなりの精度で処理できますが、手書き文書を1ヶ月分まとめて処理する前に、これらの供給業者からのサンプルバッチでテストすることをお勧めします。
抽出データをポルトガルの会計ソフトに取り込む
データ抽出は作業の半分に過ぎません。残りの半分は、そのスプレッドシートを会計士が使用するソフトウェアに取り込むことです。ポルトガルでは、そのソフトウェアはAT(税関)の認証を受ける必要があります。主要なプラットフォームはすべてCSVまたはExcelのインポートに対応していますが、それぞれに独自の列マッピング要件があります。
| ソフトウェア | インポート形式 | 注意点 |
|---|---|---|
| Primavera BSS / Jasmin | 「Importar Documentos」によるCSV、Excelインポート | 各行に勘定科目コード(conta SNC)が必要。インポート前にVLOOKUPで仕入先NIFを勘定科目コードにマッピング。Jasmin Expressは年商3万ユーロまで無料。 |
| PHC Software (CS / GO) | Excel、XMLインポート | 各IVA税率の課税ベースと金額を別々の列で指定。抽出データに既に3つのIVA税率列があれば、インポート前の再加工は不要。 |
| Sage Portugal | CSV、Excelインポート | 日付形式はYYYY-MM-DD、小数点はピリオド。Sage Portugalはインポート時にNIFの桁数を検証。9桁のNIFは通過、それ以外は拒否。 |
| TOConline | Excel (.xlsx) | OCC(公認会計士協会)が会員に提供。SAF-T PTエクスポート機能を内蔵。列の順序が重要。インポートテンプレートに正確に合わせる必要あり。 |
| InvoiceXpress / Moloni | CSVインポート | 主に売上(発行)ソフトウェアとして設計されているが、両方とも仕入台帳管理のための仕入先請求書インポートに対応。ERPグレードのソフトウェアよりシンプルなインポートテンプレート。 |
共通点:新規インポートには勘定科目コードのマッピングが必要。 ほとんどのポルトガルの会計プラットフォームでは、インポートするすべての行にconta SNC(勘定科目コード)が必要です。このマッピングは仕入先ごとに一度作成します。別のルックアップテーブルとして、またはNIFを勘定科目コードにマッピングする推論列を使用して抽出列定義に直接組み込むことで、以降の月の抽出データは自動的に継承されます。
複数の国の請求書を処理するチームの場合、ポルトガルデータを受け取るプラットフォームがポルトガル製でない可能性があります。共有サービスセンターがSAP、Oracle NetSuite、Microsoft Dynamicsを使用している場合でも、前述の列構造は適用されます。IVA税率列をERPのインポートテンプレートの対応する税コードフィールドにマッピングするだけです。構造的な作業(1つの税列ではなく3つの税列)は同じで、変更されるのは宛先フィールド名のみです。
抽出結果をe-FaturaおよびATCUDで検証する
ポルトガルのe-Faturaシステムは、財務チームに組み込みの照合メカニズムを提供します。毎月、サプライヤーはSAF-T PTの請求書要件に従い、翌月の第5営業日までに請求書データをATに提出します。買い手であるあなたの仕事は、抽出したデータがサプライヤーの報告内容と一致するかを確認することです。一致しない場合、ATは不一致を検出し、その請求書は控除対象IVAから除外される可能性があります。
ATCUDコードが橋渡し役となります。処理中にATCUDを抽出していれば、スプレッドシートの各行をサプライヤーの登録済み文書に直接照合できます。サプライヤーが番号体系を再利用する場合でも、「Fornecedor X」からの「Fatura 2026/0047」が正しいものか、手作業で検索したり推測したりする必要はありません。
抽出完了後の検証ワークフローは以下の通りです:
- スプレッドシートをエクスポート — NIF、請求書番号、日付、合計金額、ATCUDの列を含めます。
- e-Faturaポータルにログインし、処理した期間でフィルタリングします。ポータルには、あなたのNIFが買い手として登録されているすべての請求書が表示されます。
- NIFと請求書番号で相互参照します。 両方のリストをサプライヤーNIF、次に請求書番号で並べ替えます。不一致(あなたのシートにはあるがe-Faturaにはない請求書、またはその逆)がすぐに明らかになります。
- 不一致をフラグ付けして調査します。 e-Faturaに請求書がない場合は、サプライヤーが提出していないことを意味します — 報告期限前に連絡してください。合計金額の不一致は、サプライヤーが異なる金額を報告したことを示します。
- ATCUD対応の行については、 QRコードデータ(抽出した場合)またはATCUD自体を使用して、ATの検証サービスを通じて文書の真正性を確認します。
この照合作業は、かつてポルトガルでの月次決算で最も時間のかかる部分でした — 各PDFを個別に開き、e-Faturaポータルと1文書ずつ照合する必要がありました。構造化された抽出出力があれば、これはスプレッドシート操作になります:並べ替え、フィルタリング、例外の特定、該当箇所のみの修正。 同じ原則は、定期的な規制データセットとの照合が必要な あらゆる文書タイプに適用できます。
よくある質問
AI抽出ツールでポルトガル語の請求書のQRコードを読み取れますか?
ツールによります。ポルトガルのQRコードには、Portaria 195/2020で規定された形式で、構造化された税データ(供給者NIF、ATCUD、税率ごとの課税標準、税額)がエンコードされています。QRコードをデコードできるツールは、この構造化データを直接抽出できるため、該当フィールドのOCRが不要になります。QRコードをデコードしないツールでも、請求書の表示テキストを読み取ることで同じデータを抽出可能です。QRコードは、相互検証のための機械可読な第二の情報源を提供するものです。
すべての請求書でATCUDを抽出する必要がありますか?
買い手に法的義務はありませんが、監査対応において最も有用な項目です。ATCUDはAT(税務当局)のシステム内で文書を一意に識別します。監査人がスプレッドシートの任意の行について原本の提示を求めた場合、ATCUDがあれば即座に検索できます。ATCUDがない場合は、供給者名と日付範囲で検索することになります。コンプライアンス重視の財務チームにとっては、列を追加する価値があります。
IVA税率が異なるマデイラ諸島やアゾレス諸島の請求書はどう扱えばよいですか?
自治地域では独自の税率が適用されます。マデイラ諸島は22%(標準)、12%(中間)、5%(軽減)、アゾレス諸島は16%、9%、4%です。これらの地域の供給者からの請求書を受け取る場合は、抽出テンプレートに地域別の税率用の列ペアを追加してください。税率自体が発行元を示します。ポルトガルの請求書で22%の税率は、ほぼ確実にマデイラ諸島発行です。
PDF請求書からの抽出と、SAF-T PT XMLファイルの解析の違いは何ですか?
SAF-T PTは、供給者が認定された請求ソフトウェアからエクスポートし、ATに提出するXML監査ファイルです。直接解析可能な構造化データが含まれています。しかし、買い手であるあなたが供給者のSAF-Tファイルにアクセスすることはほとんどありません。手元にあるのは、供給者から送られてきたPDFの請求書です。抽出ツールはこのギャップを埋めます。PDFを読み取り、供給者が内部のXMLエクスポートを共有しなくても、SAF-Tファイルに含まれるであろうデータと同等の構造化データを生成します。
ポルトガル語の請求書でIVA税率が混在する場合、AI抽出の精度はどの程度ですか?
最新のAI抽出ツールを使用した場合、ヘッダーデータ(NIF、請求書番号、日付、合計金額)のフィールド精度は通常95%を超えます。税率混在の請求書における明細行の精度はやや低く、各明細を正しいIVA税率に割り当てる精度は約85~90%です。これは、印刷密度の高い請求書の税率列の視覚的な違いが微妙なためです。実用的なアプローチとしては、バッチを処理した後、税率混在の請求書を重点的にスポットチェックすることです。手動修正が必要な5~10件の請求書は、100件すべてを手動入力するよりもはるかに少ない負担です。
毎月の手間から毎月のエクスポートへ
ポルトガルの仕入先請求書は、単に読むだけの書類ではなく、法的な重みを持つ構造化された税務記録です。これを汎用的なPDFとしてOCR処理することは、税務申告書を写真に撮るための紙切れとして扱うようなものです。下流のシステム(e-Fatura、定期VAT申告、会計ソフトへのインポート)はすべて、特定の形式のデータを期待しているため、構造が重要です。
今月定義する抽出列の構造は、毎月使用する構造になります。列が正しく設定されれば(3つのIVA税率ペア、NIF、ATCUD、ソース参照)、プロセスは機械的になります。バッチをアップロードし、スプレッドシートをエクスポートし、e-Faturaと照合し、会計プラットフォームにインポートするだけです。知的作業は、スプレッドシートの形式を決めた時点で完了しています。
サンプルのポルトガル語請求書で抽出をテストする。 現在のプロセス(請求書1件あたり3分の手動入力)が、e-Faturaと自動照合されるバッチ処理で請求書1件あたり10秒になるかどうかをご確認ください。