請求書データ抽出方法
ドイツのVAT事前申告(UVA)向け
ドイツのVAT登録事業者は、毎月または四半期ごとにUmsatzsteuervoranmeldung(付加価値税事前申告)を報告期間の翌月10日までに提出する義務があります。しかし、ボトルネックはELSTERフォームへの記入ではなく、その前に各仕入先請求書から正しい数値を抽出することにあります。
重要ポイント
- ドイツのUVA提出期限(10日)は一見プレッシャーに見えますが、実際のボトルネックはその上流、つまり数十のPDFに異なる形式で閉じ込められた請求書データの抽出にあります。
- 月50件の請求書を手動で処理すると、期間あたり約6件のデータ入力ミスが発生します。税務当局はタイプミスと過少申告の意図を区別せず、どちらも同じ税務調査の対象となります。
- ImageToTable.aiは、画面上の位置ではなく意味に基づいて請求書項目を読み取るため、Nettobetrag、Vorsteuer、Steuersatzが請求書ごとに左上や右下など異なる位置にあっても、同じ構造化された列に自動マッピングされます。
UVAに実際に必要なインボイスの情報
報告期間終了からUVA期限までの10日間の提出期間が本当のプレッシャーポイントではありません。その大部分を消費するのは、上流のデータ収集です。
Umsatzsteuervoranmeldung(付加価値税予備申告、略称UVAまたはUStVA)は、ドイツ付加価値税法(Umsatzsteuergesetz — UStG)第18条に基づく定期申告です。 報告するのは、販売時に課した付加価値税 — Umsatzsteuer(売上税、標準19%または軽減税率7%)、事業用購入時に支払った付加価値税 — Vorsteuer(仕入税額控除)、およびEU加盟国からの国境を越えた購入であるinnergemeinschaftliche Erwerbe(域内取得)の3つの主要カテゴリです。
計算は単純です。UmsatzsteuerからVorsteuerを差し引いた額が納付税額、または仕入税額が売上税を上回る場合は還付金(Vorsteuerüberhang)となります。複雑なのは計算ではなく、その計算に必要な数値をどこから見つけ出すかです。
ほとんどの中小ドイツ企業にとって、UVAに必要なデータは一箇所にまとまっていません。数十、時には数百ものサプライヤーインボイスに散在しており、それぞれレイアウトや形式が異なります。
月次申告(前年の付加価値税負担額が9,000ユーロを超える場合に義務)または四半期申告(2,000〜9,000ユーロ)のどちらであっても、リズムは同じです。期間中にインボイスが到着し、提出期限までに主要なデータポイントを会計システムに集計する必要があります。設立から2年以内の新規事業では、月次申告がデフォルトです。電子申告プラットフォームELSTER(ドイツ公式税務申告ポータル)は、適切に構造化されたデータのみを受け付けます。PDFの山では対応できません。
各レヒヌングから抽出すべきデータ項目
ドイツのVATインボイス(レヒヌング)には、§14 UStGに基づき14の必須項目(Pflichtangaben)が必要です。UVAの目的では14項目すべては不要ですが、税額計算に直接影響するものは必要です。
各入金インボイス(Eingangsrechnung)からUVA申告に直接マッピングされる項目は次のとおりです。
| インボイス項目(ドイツ語) | 英語 | UVA行へのマッピング | 重要性 |
|---|---|---|---|
| Nettobetrag | 正味金額 | 売上税/前払税計算の基礎 | 税率(19%と7%)が混在する場合は税率別に分ける必要あり |
| Umsatzsteuersatz / Steuersatz | VAT税率(19%または7%) | 使用する税コード(Steuerschlüssel)を決定 | 税率誤り=税額誤り=UVA却下または監査フラグ |
| Umsatzsteuerbetrag / Vorsteuerbetrag | VAT/前払税額(ユーロ) | UVAの前払税行 | 税務署が期待する実際の数値。正味×税率=この金額と一致する必要あり |
| Bruttobetrag | 総額 | クロスチェック:正味+VAT=総額 | 検証用。不一致はデータ入力エラーの兆候 |
| Rechnungsnummer | インボイス番号 | 営業監査(Betriebsprüfung)の監査証跡 | UVA用紙自体には不要だが、年間調整のために税理士(Steuerberater)には必須 |
| Rechnungsdatum & Leistungsdatum | インボイス日付とサービス日付 | 正しい申告期間の割り当て | 12月の作業に対する1月のインボイスは12月申告に属する。期間誤りはよくあるミス |
| Lieferant (Name + USt-IdNr) | 仕入先名とVAT ID | EU取引の要約報告(Zusammenfassende Meldung — ZM) | 仕入先が他のEU加盟国で逆課税(§13b UStG)を適用する場合、別途ZM申告のためにUSt-IdNr(VAT識別番号)が必要 |
事業を通過するすべてのインボイス(入金・出金)には、UVAに反映すべきデータポイントが少なくとも5つ含まれています。 月50件のインボイスなら、抽出・検証・転記すべきデータポイントは250件になります。
インボイスからELSTERへのデータの流れ
ドイツの標準的な会計データパイプラインには3つの引き継ぎポイントがあり、それぞれでエラーが蓄積されます。
データの流れを理解することが重要なのは、UVA申告のエラーのほとんどがELSTER自体に起因するものではないからです。 エラーは上流、つまりインボイスから数値を読み取り、画面に入力し、誤ったSteuerschlüsselにマッピングする段階で発生します。
インボイス到着
PDF、スキャンした紙、または電子インボイス(XRechnung / ZUGFeRD)。データは存在しますが、会計システムで利用できる構造化された形式ではありません。
データ抽出と転記
インボイスからフィールドを読み取り、DATEV、Lexware、sevDesk、SAPなどの会計ソフトウェアに入力します。ここでSteuerschlüsselの割り当てが行われます。
ELSTER送信
ソフトウェア(または税理士)が、集計されたUVAデータをELSTERポータル経由で税務署に送信します。ステップ2でエラーがあれば、ステップ3でそのエラーが引き継がれます。
Steuerschlüssel(税キー)システムは特に注意が必要です。SKR03またはSKR04の勘定科目表(Kontenrahmen)を使用するDATEV会計フレームワークでは、すべての仕訳行に、システムが税をどのように処理するかを指示するSteuerschlüsselが必要です。一般的なコード:3(19%の売上税)、9(19%の仕入税)、2(7%の売上税)、8(7%の仕入税)。DATEVにデータをインポートする際(CSVまたはDATEV形式インターフェース経由)、各行に正しいSteuerschlüsselを割り当てる必要があります。コードを間違えると、税が誤ったUVA行に計上されます。
リバースチャージ方式(§13b UStG)に基づくEU域内の国境を越えた取引では、ロジックが逆転します。Steuerschlüssel 91/94は、出力税と入力税の両方を同時に捕捉し、UVA上で取引を税中立にします。ただし、Zusammenfassende Meldung(ZM)で個別に報告する必要があります。ZMから§13b取引を漏らすことは、別のコンプライアンス違反となります。
手動抽出と自動抽出の比較:UVA申告における違い
手動と自動の違いは単なる速度ではありません。50件以上の異なるレイアウトの請求書が一度に届いたとき、規模が拡大した際に何が起こるかが鍵です。
手動抽出は決まった手順を踏みます:PDFを開き、正味金額を探し、DATEVやLexwareに入力し、VAT税率を確認し、VAT額を入力し、計算を検証し、Steuerschlüsselを割り当て、これを繰り返します。慣れれば1件あたり2~3分。50件なら100~150分の純粋なデータ入力作業です。しかも、これは照合作業の前の話です。
エラー率は量に比例して増加するのではなく、ある閾値を超えると急増します。2016年のAPAによるデータ入力精度に関する研究では、経験豊富なオペレーターでも反復的な手動転記作業のエラー率が2.5%に達することが示されています。これは不注意ではなく、持続的な注意力には生理的限界があるためです。250データポイント(50件×5項目)の場合、申告期間あたり約6件のエラーが発生します。各エラーはUVA修正、税務署からの問い合わせ、あるいは過少申告による延滞税の原因となります。
税務署は「入力ミス」と「過少申告の意図」を区別しません。どちらも同じ修正手続きを引き起こします。
自動抽出の鍵は、単に速いことではなく、テンプレート照合ではなく意味理解に基づいて動作することです。仕組みは次の通りです。従来のOCRシステムは固定テンプレートに依存します。つまり、ページ上のゾーン(請求書番号は常に座標X:Y)を定義し、そこに表示されたテキストを読み取ります。問題は、サプライヤーごとに請求書のフォーマットが異なることです。サプライヤーA用のテンプレートはサプライヤーBでは機能しません。
最新のAI抽出ツールはカスタム列抽出を使用します。ピクセル座標を定義する代わりに、データをその意味で指定します。「Nettobetrag」「Vorsteuerbetrag」「USt-Satz」「Rechnungsdatum」などの列を定義すると、AIが各請求書を読み取り、ページ上のどこにあってもそれらの値を特定し、表の構造化された行として出力します。AIは、「MwSt」の横にある「19%」と、明細行の税額列にある「19.00%」が、位置や表記が異なっていても同じ税率を表すことを理解します。
ファイルは安全に処理され、保存されることはありません。
UVA申告において、このアプローチには構造上の利点があります。列スキーマ(上表のフィールド)を一度定義すれば、フォーマットに関係なくすべての請求書が同じ列にマッピングされます。出力は1つのスプレッドシートで、各行が1つの請求書、各列が会計ソフトのインポートインターフェースに直接対応します。DATEVワークフローの場合、税理士は正しいSteuerschlüsselがすでに割り当てられた構造化CSVを受け取ることになり、再入力が必要なPDFの山を受け取ることはありません。
同一報告期間の複数請求書の処理
UVAは期間内の全請求書の数値を集計します。請求書1枚の抽出では問題の半分しか解決できません。時間節約が真価を発揮するのはバッチ処理です。
バッチ処理では、報告期間の全請求書を一度にアップロードします(月次申告なら30PDF、四半期申告なら100以上)。ツールはすべての書類から同時に同じフィールドを抽出します。出力は全請求書が行に並んだ1つのExcelファイルで、税率ごとに集計できます。これにより、請求書を1枚ずつ開いて抽出して閉じる作業が不要になります。
税理士と連携するワークフローでは、このバッチ処理により状況が大きく変わります。税理士チームが請求書データをDATEVに手入力する時間(およびその請求時間)を費やす代わりに、構造化データファイルを提供します。税理士はそれをインポートし、税務ロジックを確認してUVAを提出します。会計事務所はデータ入力ではなく、税務アドバイスとコンプライアンスレビューという専門知識を活かす業務に集中できます。
UVAデータ抽出のよくある落とし穴
明確な抽出プロセスがあっても、ドイツの企業を悩ませる落とし穴がいくつかあります。
- 報告期間の混同。 6月30日付だが7月に計上された請求書は、請求日基準(Sollbesteuerung)の場合、6月のUVAに属します。現金基準(Istbesteuerung)では支払日を使用しますが、この方法を使用するには税務署(Finanzamt)からの承認申請と取得が必要です(§20 UStG)。
- 混合税率請求書の誤ったSteuerschlüssel。 設備に19% VAT、食品に7% VATの外食業者請求書は、異なるコードで2行の抽出が必要です。DATEVでは、一方をSteuerschlüssel 9、もう一方をSteuerschlüssel 8で計上します。
- EU仕入先請求書のUSt-IdNrの見落とし。 フランスやオランダの仕入先からVAT ID付きでVATが課されていない請求書を受け取った場合、これは逆課税取引の可能性があります。UVAおよび別途ZMに記載する必要があります。UVA自体が正しくても、ZMから漏れると報告義務違反になります。
- Nullmeldungの未提出。 期間内に収入も支出もゼロでも、ゼロ申告(Nullmeldung)を提出する必要があります。税務署は毎期の申告を期待しています。未提出は自動的にフラグが立てられます。
抽出データをDATEV、Lexware、税理士へ引き渡す
抽出で得た構造化されたスプレッドシートは最終目的地ではなく、会計ソフトへの入力形式です。この引き継ぎを適切に行うことで、手戻りを防げます。
DATEVユーザー向け: DATEV Kanzlei-Rechnungswesenは、Buchungsdatenschnittstelle(仕訳データインターフェース)を介してCSVまたはASCII形式のインポートを受け付けます。抽出データには、Belegdatum、Buchungstext、Buchungsbetrag、Sollkonto、Habenkonto、Steuerschlüsselなどのフィールドを含める必要があります。税理士がDATEV側を管理している場合は、希望するインポートテンプレートを確認してください。ほとんどの事務所で標準的なマッピングが使用されています。重要なのは、抽出データに請求書ごとのSteuerschlüsselがすでに割り当てられているため、インポートは再分類ではなく確認作業になる点です。
Lexware Officeユーザー向け: Lexwareには、一部の転記を自動化するBelegerkennung(領収書認識)機能が組み込まれています。しかし、取引量が多い期間や、LexwareのOCRでは確実に読み取れない請求書(スキャンした紙、特殊なレイアウト)については、別途バッチ抽出を行い構造化されたExcelファイルを作成することで、インポートや手動転記に適したクリーンなデータが得られます。LexwareのDATEV互換エクスポート機能を使用する場合も、Steuerschlüsselのマッピングが重要です。
sevDesk、FastBill、その他のクラウド会計ツールユーザー向け: これらのプラットフォームのほとんどはCSVまたはExcelをインポートできます。重要な列は税率またはSteuerschlüsselです。これがないと、ソフトウェアは金額がどのUVAボックスに属するかを判断できません。
Dauerfristverlängerungが抽出スケジュールに与える影響
§18(6) UStGに基づくDauerfristverlängerung(恒久的な納期延長)の承認を受けた場合、UVAの提出期限は1ヶ月延長されます。月次申告の場合、1月分のUVAは2月10日ではなく3月10日が期限となります。四半期申告の場合、第1四半期は4月10日ではなく5月10日が期限です。
この延長によりデータ抽出の期間は変わりますが、データ量は変わりません。 請求書の数が減るわけではなく、単にカレンダー上の余裕が増えるだけです。リスクとしては、余分な時間が油断を生み、抽出作業が延長期限の数日前まで先延ばしにされ、同じ時間的プレッシャーが再現されることです。延長期間を活用して、期間全体を通じてバッチ処理を行い、全工程を期限直前まで遅らせないようにしましょう。
Dauerfristverlängerungには、前年度のVAT負担額の1/11に相当するSondervorauszahlung(特別前払金)が必要であり、2月10日までに支払う必要があります。四半期申告の場合は、代わりにゼロ申告を提出します。
よくある質問
すべての請求書からデータを抽出する必要がありますか?
はい、報告期間中の VAT 対象となるすべての入金・出金請求書は UVA で計上する必要があります。少額請求書を免除する最低基準額はありません。税務署は Umsatzsteuer-Sonderprüfung(付加価値税特別監査)の際に、対象の請求書の提出を求めることができます。
仕入先の請求書に誤った VAT 税率が記載されている場合はどうすればよいですか?
仕入先が請求していない税率での前払い税(Vorsteuer)は請求できません。たとえ正しい税率が異なると考えても同様です。仕入先が 19% を請求したが、7% であるべきと考える場合、請求書に記載された税率に基づいて前払い税を請求できます。ただし、その旨を税理士に報告してください。後日の監査で、税率が客観的に誤っていた場合、控除が疑問視される可能性があります。
外貨建ての請求書はどのように処理しますか?
UVA では金額をユーロで記載する必要があります。外貨建ての請求書は、請求書の発行日(または税務署が承認した月間平均レート)の為替レートを使用して換算する必要があります。AI 抽出ツールは元の通貨額を抽出できますが、ユーロへの換算と正しいレートでの計上は、手動または半手動のステップとして残ります。
スキャンした紙の請求書からデータを抽出できますか?それともデジタル PDF のみですか?
最新の AI 抽出ツールは両方に対応しています。スキャン画像(JPG、PNG)や PDF(何年も前にスキャンされた古い紙の請求書を含む)を読み取ります。ビジュアルモデルが画像表面からテキストを読み取るため、元の形式(デジタル生成かスキャンか)は抽出可能性を左右しません。手書き文字や低解像度のスキャンは、他のシステムと同様に精度を低下させます。
自動抽出は XRechnung や ZUGFeRD の電子請求書でも機能しますか?
XRechnung(純粋な XML)および ZUGFeRD(XML が埋め込まれたハイブリッド PDF)の場合、抽出方法が異なります。構造化データは視覚レイヤーではなく XML レイヤーにあります。一部の AI ツールは、埋め込まれた XML を直接解析し、視覚的な抽出を完全にバイパスできます。XML がないか不完全な場合は、PDF レンダリングからの視覚的な抽出がフォールバックとして機能します。