カナダのバイリンガル請求書の抽出方法
州別のGST/HST/QST
「フランス語憲章」(CQLR c C-11, s.51–52)に基づき、ケベック州で発行されるすべての商業文書はフランス語で作成されなければなりません。連邦政府の公用語バイリンガリズム政策により、ケベック州外の多くの供給業者は請求書を英語とフランス語の両方で印刷します。その結果、カナダの事業主が仕入先請求書を収集すると、同じ項目が2つの言語で表示される書類が頻繁に届きます。あるページでは「Invoice No」、次のページでは「N° de facture」、「Date」と「Date de facturation」が並んで表示されます。フィールドの位置に枠を描く位置ベースの抽出ツールは、バンクーバーの供給業者からモントリオールの供給業者に切り替えた瞬間に機能しなくなります。さらに、GST34申告書のためにGST、HST、QST、PSTを州ごとに分ける必要がある場合、汎用の請求書ツールでは対応できない複雑な問題に発展します。
重要ポイント
- 位置ベースの抽出では、「Invoice #」と「N° de facture」はまったく同じデータを取得するにもかかわらず、別々のテンプレートが必要な異なるフィールドとして扱われます。
- カナダには州ごとに4つの税制がありますが、ほとんどの抽出ツールはすべての税額を1つの列にまとめてしまうため、すべての請求書を手動で確認しなければ、CRA向けのGSTとRevenu Québec向けのQSTを分けることができません。
- セマンティック抽出は、TPSをGST、TVQをQSTとして両言語で読み取り、AIが推論した管轄列が各請求書を申告先ごとに分類します。スプレッドシートは、確認する前に2つの異なる政府用フォームに事前分類された状態で届きます。
同じ項目、二つの言語 — カナダの請求書が汎用抽出を困難にする理由
位置ベースの抽出ツールで、BC州の仕入先レイアウトの「Invoice Date」に矩形を設定しても、ケベック州の仕入先請求書にある「Date de facturation」は見つけられません。両者はまったく同じデータ項目を表しているにもかかわらずです。
汎用請求書抽出ツールは、ほとんどの単一言語市場で成り立つ前提に基づいています。ある仕入先の請求書に表示される項目ラベルは、多少の書式の違いはあれ、すべての仕入先の請求書に表示されるという前提です。「Invoice Number」は「Invoice #」や「Inv No.」になることはあっても、まったく別の言語の単語になることはありません。ツールはラベルのパターンセットを学習し、それらを抽出フィールドにマッピングできます。これは十分な学習データで解決可能なパターンマッチングの問題です。
カナダのバイリンガル請求書は、その前提を根本から覆します。ケベック州の仕入先は「N° de facture」と印刷し、オンタリオ州の仕入先は「Invoice #」と印刷します。ニューブランズウィック州の仕入先は「Invoice No / N° de facture」と両方を印刷するかもしれません。連邦規制下の仕入先は、顧客の州に応じて言語を切り替えることもあります。位置ベースやラベルマッチングの抽出システムにとって、これらはまったく異なる三つの入力であり、意味的には単一のデータフィールドであるにもかかわらず、構築・維持すべき三つの個別テンプレートとなります。
これは単なるローカライゼーション機能ではありません。法的要件です。ケベック州のフランス語憲章では、ケベック州の事業者が発行する請求書や領収書を含むすべての文書はフランス語でなければなりません(CQLR c C-11, ss.51–52)。連邦の公用語法(RSC 1985, c 31)は、連邦機関および Crown 法人に対し、両公用語でのサービス提供を義務付けており、これは請求書発行にも及びます。一方、アルバータ州やBC州の仕入先には言語義務はなく、英語のみの文書を発行します。バイリンガリズムは仕入先間で一貫しておらず、州、仕入先の方針、そして時にはその月にたまたま使用している文書生成システムによって異なります。
これを処理する抽出パラダイムは、位置ベースやラベルベースの抽出ではなく、セマンティックベースの抽出です。セマンティックシステムでは、抽出したい列(例:「Invoice Number」)を定義すると、AIはフィールドがどこにあるかやどのラベルを持つかではなく、何を表しているかを理解することで対応する値を見つけます。「N° de facture」「Invoice #」「Facture n°」「Numéro de facture」はすべて同じ概念にマッピングされます。セマンティック抽出エンジンは、言語や仕入先フォーマットごとに個別のテンプレートを必要とせず、これらすべてを同じ列として認識します。これにより、バンクーバーの英語専用卸売業者からモントリオールのフランス語優先メーカーまで、仕入先スタック内のすべてのバイリンガル請求書で、単一の列定義セットが機能するようになります。
この機能は、単一言語内のフォーマットバリエーション問題も解決します。建設資材仕入先が、ある文書では「INV-2026-0472」と印刷し、システムアップグレード後の次の文書では「472/2026」と印刷するかもしれません。セマンティック抽出は両方を処理します。パターンにマッチングするのではなく、「この文書上で請求書識別子として機能するフィールド」を特定するからです。フォーマット非依存性が文書タイプ間でなぜ重要なのかについて詳しくは、請求書データ抽出の完全ガイドをご覧ください。
カナダの請求書には3つの税制が混在する
「カナダの税率」はひとつではありません。オンタリオ州の供給業者は13%のHSTを請求し、ケベック州の業者は5%のGSTと9.975%のQSTを、BC州の業者は5%のGSTと7%のPSTをそれぞれ請求します。抽出ツールは、これら4つの制度を手作業で仕分けすることなく、自動で識別・処理できなければなりません。
カナダのGST/HST制度は連邦付加価値税の枠組みであり、4つの異なる運用モードがあります。それぞれ供給業者の請求書に異なる税項目を生成します。
| 制度 | 州・準州 | 請求書上の税金 | 表示される税項目ラベル | 合計税率 |
|---|---|---|---|---|
| GSTのみ | AB、NT、NU、YT | 連邦GSTのみ | 「GST」「GST 5%」「TPS」 | 5% |
| HST | ON(13%)、NB NL NS PEI(15%) | 単一の調和税 | 「HST」「HST 13%」「TVH」 | 13%または15% |
| GST + PST | BC(7%)、SK(6%)、MB(7%) | 連邦GST + 州PST(別々) | 「GST」/「PST」— 2つの別個の明細 | 5% + 6~7% |
| GST + QST | QCのみ | 連邦GST + ケベック州QST(別法に基づく) | 「TPS」/「TVQ」— ケベック州歳入庁管轄 | 5% + 9.975% |
HST州とケベック州の法的な違いは、税率だけではありません。HSTは物品税法(R.S.C., 1985, c. E-15)第IX部に基づき徴収され、CRA(カナダ歳入庁)が管轄します。QSTはケベック州売上税法(CQLR c T-0.1)に基づき徴収され、ケベック州歳入庁が管轄します。GST34申告書を提出する際、HST額はGSTと同じ欄に記入します。これは同一の課税ベースが調和されているためです。QST額は、ケベック州歳入庁に提出する別のFPZ-500申告書に記入します。抽出ツールがすべての税額を単一の「税」列にまとめてしまうと、どの政府にどの書類を提出するかを決定する管轄区分が失われます。
実際のケベック州の請求書では、通常「TPS 5%」(GST、フランス語表記)と「TVQ 9.975%」(QST)の2つの税明細が表示されます。オンタリオ州の請求書には「HST 13%」という単一の明細が表示されます。BC州の請求書には「GST 5%」と「PST 7%」が別々の金額として表示されます。サスカチュワン州の供給業者は「GST 5%」と「PST 6%」を追加します。税ラベル、税明細の数、それぞれの背後にある政府機関はすべて異なります。たとえすべての請求書が「カナダの請求書」であってもです。
次に、州をまたぐシナリオを考えてみましょう。オタワ(オンタリオ州)の小さな建設会社がガティノー(ケベック州)の供給業者から木材を購入した場合、請求書はフランス語で届き、TPS/TVQの明細が記載されています。同じ会社がトロント(オンタリオ州)の供給業者から金物を購入した場合、請求書にはHSTの単一明細が記載されています。さらに、カルガリー(アルバータ州)の供給業者から機器をレンタルした場合、請求書にはGSTのみが表示されます。1か月の間に、3つの供給業者、3つの州、4つの異なる税明細構成の請求書が発生し、それらすべてを管轄ごとに正しく申告する必要があります。各税種を専用の列に抽出するスプレッドシート(汎用的な「税」の一括列ではない)を使用すれば、抽出後に税管轄ごとにフィルタリング、集計、並べ替えが可能になり、各請求書を手作業で確認して税制を判断する必要がなくなります。
ステップバイステップ:カナダ請求書データの税区分抽出
カナダのバイリンガル請求書の抽出ワークフローは、通常のセマンティック抽出と同じパターンに従います。違いは、複数税制の問題に対応するための列設計と推論フィールドの追加にあります。
仕入先請求書をアップロード
仕入先からの写真、スキャン、PDFをドラッグ&ドロップ — ケベック州、オンタリオ州、BC州の業者ごとにまとめてアップロード。対応形式はJPG、PNG、WebP、PDF。言語や州ごとの事前仕分けは不要です。
抽出列を定義
出力スプレッドシートに必要な列名を入力します。カナダのバイリンガル請求書の場合、推奨セットは以下の通りです:
| 列名 | 抽出モード | 取得内容 |
|---|---|---|
Invoice Number | 直接 | "INV-2026-0472" または "Facture n° 0472" — AIは両方を同一フィールドとして認識 |
Invoice Date | 直接 | "Date" "Date de facturation" "Date de facture" のいずれの表記でも発行日を取得 |
Supplier Name | 直接 | 請求書ヘッダーに印刷された仕入先の法人名または商号 |
Supplier GST/HST Reg No | 直接 | 仕入先の9桁のBN+サフィックス(例:"123456789 RT0001")またはQST登録番号(10桁のNEQ+TQサフィックス) |
Subtotal | 直接 | 税抜き正味金額 — "Subtotal" "Sous-total" "Net" "Montant avant taxes" のいずれの表記でも取得 |
GST Amount | 直接 | 連邦GST分。ケベック州の請求書では "TPS" 行に該当 |
HST Amount | 直接 | ON/NB/NL/NS/PEI州の請求書のHST額。GST+PSTまたはGST+QSTの請求書では空白 |
QST Amount | 直接 | ケベック州消費税("TVQ")額。ケベック州以外の請求書では空白 |
PST Amount | 直接 | BC/SK/MB州の州消費税額。HSTまたはGSTのみの請求書では空白 |
Total | 直接 | 全税込みの請求書合計 — "Total" "Montant total" "Total TTC" |
Tax Jurisdiction | 推測 | AIが文書の税フィールドと仕入先情報から税制を判定:"HST Province" "Quebec (GST+QST)" "GST+PST Province" "GST Only" |
GST Amount、HST Amount、QST Amount、PST Amountの各列は意図的に分離されています — 各請求書は、発行州に応じてこれらのうち正確に1つまたは2つの列に値が入ります。この分離により、抽出後に税種別でフィルタリングや集計が可能になり、GST34やFPZ-500申告書の作成に必要な処理を正確に行えます。
税務管轄の推論列を追加する
上記の税務管轄列は推論列です。これは、AIに分類オプションのセットを指定し、請求書上に明示的に「税務管轄」とラベルされた項目がなくても、AIが請求書を読み取って該当するものを判断する列です。税務管轄(オプション:GSTのみ/HST州/ケベック州(GST+QST)/GST+PST州)を定義すると、AIは各請求書の税明細を精査します。「TVQ」や「TPS」のラベルがあればケベック州、「HST」の明細が1つだけあればHST州、といった具合に分類します。これにより、どの請求書のどの税金がどの政府に支払われるかを、手動でタグ付けすることなく、フィルタリング可能な列として把握できます。
バッチを処理してスプレッドシートをダウンロードする
列定義を確認したら、AIがアップロードされたすべての請求書を読み取り、各列を埋めていきます。結果として、各請求書が1行になり、税種ごとに列が設けられ、税務管轄列で各行がどの申告区分に属するかが一目でわかる単一のスプレッドシートが生成されます。5州からの50件の請求書バッチの場合、アップロードからダウンロードまで1分もかかりません。これに代わる手動データ入力では2~3時間かかっていた作業です。
ファイルは安全に処理され、保存されることはありません。
セマンティック抽出アプローチでは、列を一度定義すれば、サプライヤーの言語や請求書の形式、最新の会計システムからの鮮明なPDFか、金物店の感熱紙レシートのスマホ写真かにかかわらず、すべてのカナダ請求書バッチで再利用できます。抽出ツールとアプローチの広範な比較については、2026年における最高の請求書抽出ソフトウェアのまとめをご覧ください。
各抽出で得られるべき3種類のコンプライアンス証明
CRAが求めているのは税額だけではありません。ETA第169条(4)および(5)に基づき、仕入税額控除の申請には、供給者の身元、課税額、事業目的という3つの証拠カテゴリーが必要です。抽出スプレッドシートは、手作業による再構築なしでこれら3つすべてを提供する必要があります。
カナダの請求書抽出に関する議論のほとんどは、税額を正確に取得することに焦点を当てています。これは最も目に見える要件です。しかし、物品税法のITC規則(第IX編、第I章)では、正しい金額だけでなく、それ以上のものが求められます。CRA監査人がGST34申告書を審査する際、各ITC申請について以下の3点を確認します。
1. 供給者の身元 — 誰が税金を課したか。 請求書には、供給者の法的名称または商号、およびGST/HST登録番号(9桁の事業者番号にRT接尾辞を付けたもの、例:「123456789 RT0001」)が記載されている必要があります。ケベック州の供給者の場合は、QST登録番号(10桁のNEQ(ケベック州事業者番号)にTQ接尾辞を付けたもの、例:「1234567890 TQ0001」)も必要です。抽出列には、供給者名と登録番号の両方を別々のフィールドとして取得する必要があります。これにより、ITCを申請したすべての供給者のフィルタリング可能で検索可能な記録が作成され、監査人が正確に求めるものとなります。
2. 課税額 — 金額と税率。 請求書には、課税された税額の合計、または総対価と税込みである旨の記載が必要です。しかし、「税額 = $47.32」と単に取得するだけでは、その$47.32がGST(連邦ITC)、HST(連邦ITC)、QST(ケベック州ITR)、PST(ほとんどの場合、GST/HSTメカニズムでは回収不可)のいずれであるかを区別できなければ不十分です。そのため、ステップ2の列設計では、GST、HST、QST、PSTを別々の列に保持しています。スプレッドシートを税管轄区域「HST州」でフィルタリングすると、HST金額列の合計がその請求書グループの連邦ITCになります。「ケベック州(GST+QST)」でフィルタリングすると、GST金額列がGST34に、QST金額列がFPZ-500に入力されます。この分離がコンプライアンスの層です。
3. 事業目的 — 供給が商業活動のために使用されたこと。 これは最も自動化が難しく、最も重要なチェックです。CRAは、各ITC申請が「商業活動の過程での消費、使用、または供給のために」取得された供給であることを要求します(ETA第169条(1))。請求書自体は事業目的を証明しませんが、抽出ワークフローはその関連性を裏付ける十分なデータを取得する必要があります。供給者名は監査人に誰との取引かを示し、請求書日付は報告期間に結び付け、抽出された小計は供給の価値を示します。複数目的の費用(例:事業用60%で使用する車両)の場合は、按分を手動で適用する必要があります。請求書データのみから事業使用割合を決定できる抽出ツールはありません。
GST ITC申請は、ETA第225条(4)に基づき、請求書日付から4年以内に行う必要があります。QST ITR申請の期限は異なり、請求書を受け取った年の翌年から4年目の12月31日です(ケベック州売上税法第206条)。正確に抽出された請求書日付列を使用すると、申請時に期限切れ間近の申請をフィルタリングできます。各請求書の日付を現在の申請年度と手動で照合する必要はありません。
CRA最低基準を超えて:適切にフォーマットされた抽出ログ
CRAの最低要件を満たす抽出スプレッドシートは、毎月実際に使いたいと思うような抽出ログとは異なります。いくつかのフォーマット追加(そのほとんどは抽出ツールの後処理で自動的に行われます)により、コンプライアンスチェックリストが真に有用なサプライヤーベンダーデータベースに変わります。
日付の標準化。カナダの請求書では複数の日付形式が使用されています。「2026-06-15」(ISO)、「15/06/2026」(DD/MM/YYYY、ケベック州やフランス語文書で一般的)、「06/15/2026」(MM/DD/YYYY、米国発行または英語優先のサプライヤーからのバイリンガル請求書で一般的)。抽出ツールのデータ後処理により、すべての日付形式が選択した単一の形式に統一されるため、各行を手動で再フォーマットすることなく、日付で並べ替え、月でフィルタリングし、期限切れ間近のITCクレームを特定できます。
サプライヤー名の正規化。同じサプライヤーでも、請求書によって名前が微妙に異なることがよくあります。「Matériaux Bouchard Ltée」、「Bouchard Materials」、「Matériaux Bouchard (2020) Inc.」など。抽出列には印刷された通りの内容が取り込まれるため、監査証跡が保持されます。自分用の作業コピーには、サプライヤー名を正規のリストにマッピングする計算列を追加できます。これは抽出後にExcelで行うことも可能で、サプライヤーマスターリストの維持は請求書ごとの作業ではなく、一度限りの設定タスクです。
税管轄区域フィルタリング。推測された税管轄区域の列を配置することで、申告時に簡単なワークフローが可能になります。「HST州」でフィルタリング → HST金額列を合計 → これが調整対象州からの連邦ITCです。「GSTのみ」でフィルタリング → GST金額列を合計 → これが非HST州からの連邦ITCです。「ケベック(GST+QST)」でフィルタリング → GST金額列を合計してGST34に、QST金額列を別途合計してFPZ-500に使用します。「GST+PST州」でフィルタリング → GST金額列を合計してGST34に。PST額は州税であり、州のルールに従います(BC州のPSTは一般的にITCとして回収できませんが、事業経費として控除できる場合があります)。
複数州対応の報告。オンタリオ州、ケベック州、ニューブランズウィック州でプロジェクトを手掛ける建設会社など、複数の州で事業を展開している場合、州固有の税額列を使用することで、サプライヤーの住所や郵便番号を照合することなく、州ごとの税額サマリーを作成できます。すべての行には、適切な管轄区域の適切な税額列に、すでに正しい金額が入力されています。
これらのフォーマット作業に、請求書ごとの手作業は必要ありません。抽出は一度行われ、列は自動的に入力され、後処理による標準化は出力に組み込まれています。ダウンロードするスプレッドシートは、申告ワークフロー用にすでに構造化されており、2回目の手動クリーンアップが必要な生のデータダンプではありません。
よくある質問
AI抽出ツールはフランス語の請求書と英語の請求書を区別できますか?
区別する必要はありません。それが意味抽出のポイントです。請求書を言語ごとに分類して言語固有のルールを適用するのではなく、AIが文書を読み取り、各フィールドがどの言語で書かれていてもその意味を理解します。「N° de facture」も「Invoice #」も同じ概念(請求書識別子)として扱われるため、ラベルの言語に関わらず抽出結果は同じです。AIは二言語使用をデータ表示上の詳細として捉え、抽出の課題とはみなしません。
ケベック州の請求書でQST額が別途記載されていない場合は?
ほとんどのケベック州の仕入先請求書では、TPS(GST)とTVQ(QST)が別々の明細行で表示されます。これは各税金が異なる政府に納められるため標準的な慣行です。ケベック州の請求書に税込み総額のみが表示されている場合は、計算列を使用してQST額を導き出すことができます。「QST額 = (合計 − 小計) × (9.975 / 14.975)」のような計算式で列を定義します。これはケベック州の請求書におけるQSTの総税額に対する比率(9.975% QST ÷ 14.975% 合計 = 66.6%)を利用します。AIは抽出時にこの計算を実行し、導出された値を直接スプレッドシートに出力します。計算列は税率比率、通貨換算、数量×単価の算術など、測定可能な関係に適用でき、抽出処理中に実行されるため、出力には生の入力値ではなく答えが含まれます。
スキャンした紙の請求書でも使えますか?それともデジタルPDFのみですか?
両方に対応しています。AIは文書の視覚的な内容を読み取ります。つまり、ページに表示されている内容を処理するのであって、PDFレイヤーから埋め込みテキストを抽出するわけではありません。スマートフォンで撮影した紙の請求書の写真、デスクトップスキャナーでスキャンしたPDF、デジタル生成された請求書PDFはすべて、同じ視覚理解エンジンで処理されます。スキャンの品質は結果に影響します。ぼやけた低解像度の写真は、鮮明な300 DPIスキャンよりも精度が低下しますが、基本的な抽出メカニズムはすべての入力形式で同じです。
どの税区分で申告すればいいか分からない場合や、間違えたらどうなりますか?
税の種類を個別の列(GST額、HST額、QST額、PST額)と、推測される税管轄区域の列に分けることで、二重チェックが可能です。税管轄区域の列は、その請求書がどの制度に属するかを示します。各税額の列には実際の金額が表示されます。税管轄区域が「HST州」で、HST額の列に値があり、QST額の列が空白の場合、申告方法は明確です。HST額はGST34に記入します。税管轄区域が「ケベック州(GST+QST)」で、GST額とQST額の両方に値がある場合は、GSTをGST34に、QSTをFPZ-500に分けて記入します。特定の請求書について不明な場合は、推測するのではなく、会計士に確認するのが最善の方法です。クリーンな抽出ワークフローの一部は、曖昧なケースを完全に排除するのではなく、見つけやすくすることです。
明細レベルの詳細を抽出できますか、それとも請求書の概要のみですか?
両方可能です。ステップ2で示した列設定では、請求書レベルのフィールド(合計、税額、仕入先情報)を取得します。明細の説明、明細の数量、明細の単価、明細の合計などの列を追加することで、明細レベルの詳細を取得するように列リストを拡張できます。抽出された各行は、1つの請求書の1つの明細を表し、その請求書の明細間で請求書レベルのフィールド(仕入先、日付、請求書番号)が繰り返されます。これは、在庫照合、ジョブ原価計算、または各明細の税額がその仕入先の州の税率と一致することを確認するのに役立ちます。
BC州とサスカチュワン州の請求書のPSTは還付可能ですか?
州売上税(PST)は、一般的に連邦のGST/HST ITCメカニズムでは還付できません。BC州のPST(7%)、サスカチュワン州のPST(6%)、マニトバ州のRST(7%)は、それぞれ独自のルールを持つ州税であり、ほとんどの場合、企業はこれらをGST34の仕入税額控除として請求できません。PST額は通常、購入した商品やサービスの原価の一部として扱われます。そのため、PSTを独自の列に保持することが重要です。ITCとして還付可能な連邦GST額から分離できるからです。一部の州では、特定の業種や設備の種類に対して限定的なPST免除を提供しています。状況に応じて、会計士または州税務当局に確認してください。抽出ツールは数値を分離し、その処理方法については会計士がアドバイスします。
これはQuickBooksカナダの内蔵税機能とどう違うのですか?
QuickBooksカナダとSage 50カナダは、発行する請求書の税率計算を処理します。つまり、顧客向けに請求書を作成する際に、適切なGST、HST、QST税率を適用します。しかし、仕入先からPDFやスキャン、写真で受け取った請求書からデータを抽出することはできません。受け取った仕入先請求書については、ほとんどの会計ソフトでは手作業が基本です。PDFを開き、仕入先名、日付、正味金額、税額を、購入入力画面に一つずつ入力します。セマンティック抽出はそのギャップを埋めます。仕入先の請求書を読み取り、インポートや入力にすぐ使える構造化された行を出力するため、手入力の手間が省けます。この2つのツールは機能が異なります。QuickBooksは帳簿管理を行い、セマンティック抽出は紙やPDFを帳簿で使えるデータに変換します。
仕入先のGST/HST登録番号が請求書にない場合はどうすればいいですか?
CRAのルールでは、仕入先請求書に有効なGST/HST登録番号があることが、ITCを請求するための要件です。登録番号のない請求書を受け取った場合は、申告前に仕入先に連絡して修正済み請求書を依頼してください。抽出ツールは文書に存在する情報を取得します。存在しない登録番号を作り出すことはできません。抽出後に登録番号フィールドが空欄で返ってきたら、それが仕入先に確認すべき合図です。クリーンな抽出結果により、不足フィールドがすぐにわかるため、監査中に欠落に気づくよりはるかに良い状況です。