韓国税務インボイスの
Excelデータ抽出
韓国国税庁は年間6億件以上の電子税務インボイスを処理しており、これは国内発行インボイスの99%に相当します。しかし、それらのインボイスを受け取る経理チームにとって、データ抽出の問題は依然として手作業に依存しています。事業者登録番号(사업자등록번호)、供給価額(공급가액)、付加価値税額(세액)を、PDFや印刷物から一つずつスプレッドシートにコピーする作業です。このガイドでは、韓国税務インボイス(세금계산서)の必須項目、標準的なOCRツールがなぜそれらでつまずくのか、そして実際に必要なデータをExcelに抽出し、四半期ごとのVAT申告に備える方法を解説します。
重要ポイント
- 韓国の請求書の99%はすでに電子化されているが、買掛金担当者が手作業で供給価額(공급가액)をExcelに転記している限り、その進歩は実感できない。
- 必須項目は7つ、ベンダーごとにレイアウトは様々。HomeTax、Popbill、Barobill、Douzoneでは事業者登録番号や付加価値税額の位置が異なるため、テンプレート型ツールではサプライヤーごとに設定が必要。
- ImageToTable.aiは供給価額をピクセル座標ではなく概念として読み取る。1つの列定義で全ベンダーの税額請求書を同一スプレッドシートに抽出でき、サプライヤーごとの設定は不要。
韓国税額計算書と標準インボイスの違い:韓国税額計算書に必須の7項目
韓国の税額計算書(세금계산서)は、単にVAT行を追加した一般的な商業送り状ではありません。これは韓国付加価値税法第32条で定められた法的に規定された文書形式であり、各項目は特定のコンプライアンス目的を果たします。韓国の仕入先請求書からデータをExcelに抽出する場合(買掛金処理、VAT申告書作成、ERPインポートのいずれの場合でも)、これらの必須項目を理解することが前提条件です。
第32条に基づき、税額計算書には以下の情報を含める必要があります。発行された請求書にこれらのいずれかが欠けている場合、供給者は供給額の最大2%の罰金にさらされます。
| # | フィールド(英) | フィールド(韓) | 抽出に重要な理由 |
|---|---|---|---|
| 1 | 供給者登録番号 | 공급자 등록번호 | 10桁の事業者登録番号(사업자등록번호)(形式:XXX-XX-XXXXX)。ERPでの供給者照合の主キー。 |
| 2 | 供給者名・代表者 | 상호 / 성명 | 会社名+代表者名。多くの場合、異なるフォントサイズで印刷。 |
| 3 | 購入者登録番号 | 공급받는자 등록번호 | 自社の事業者登録番号。照合のため自社記録と一致確認必須。 |
| 4 | 供給価額 | 공급가액 | VAT前の正味金額。付加価値税申告計算の基礎数値。 |
| 5 | 税額 | 세액 | 供給価額の10%。供給価額×10%と完全一致必須。不一致はエラー。 |
| 6 | 作成日 | 작성일자 | 請求書が属する四半期VAT期間を決定。 |
| 7 | 明細(品目、数量、単価) | 품목 / 수량 / 단가 | 品目レベルの詳細。簡易請求書では任意、正式税額請求書では標準。 |
これら7つの基本項目に加えて、NTSホームタックス(홈택스)システムを通じて発行される電子税額計算書には、税務当局が発行を確認した固有の識別番号であるNTS承認番号(국세청승인번호)が付与されます。2023年7月以降、年間売上高が1億ウォンを超えるすべての事業者は電子発行が義務化されているため、通常目にするほとんどの税額計算書にはこの番号が記載されています。
データ抽出における実際の影響:1枚の税額計算書には、最低7つの異なるデータ項目が含まれており、それぞれを別々のExcel列に格納する必要があります。2つの登録番号は厳格な形式に従い、供給価額と付加価値税は算術検証が必要です。これがあなたが扱う書類の構造であり、一般的な「スキャンしてそのまま出力」する方法では、実用的な結果が得られにくい理由でもあります。
項目を理解するのは第一歩です。次の課題は、それらを書類から正確に抽出することが、見た目以上に難しい理由を理解することです。
韓国領収書でコピペや標準OCRが使えない理由
韓国の領収書(세금계산서)には、一般的なOCRツールや手動コピペではうまく処理できない3つの課題があります。これらの課題は、複数の発行元から領収書を処理する際にさらに複雑になります。
課題1:ハングルと数字の混在。 一般的な領収書には、ハングル(会社名、品目説明)、アラビア数字(登録番号、金額)、場合によっては英語の略語が同じ領域に混在しています。単一言語向けに最適化された標準OCRエンジンは、数字の近くにあるハングル文字を誤認識しやすく、似た文字を混同したり、カンマ区切りのハングル金額を誤って解釈したりするなど、文字化けした出力を生成します。
課題2:フィールド位置が標準化されていない。 領収書の内容は法律で標準化されていますが、レイアウトは標準化されていません。HomeTaxを通じて発行された電子領収書は、認識可能な2パネル構造(左側に供給者、右側に購入者)に従います。しかし、サードパーティのASPサービス(Popbill(팝빌)、Barobill(바로빌))や、Douzone Bizon(더존비즈온)のERPで生成された領収書では、同じフィールドが異なる位置、フォントサイズ、表構造で配置される場合があります。テンプレートベースのOCRは、フィールドを特定するために事前定義されたゾーンに依存するため、レイアウトのバリエーションごとに個別のテンプレートが必要です。
課題3: 供給価額・付加価値税額・合計金額の検証トラップ。適正に発行された税額計算書では、3つの最終行の数値は厳密な関係に従います。合計金額 = 供給価額 + 付加価値税額です。手入力で一桁の転記ミス(例: ₩3,004,000 を ₩3,040,000 と入力)が発生すると、その誤りは VAT 申告にそのまま反映されます。国税庁が申告内容と供給者の送信データを照合するまで気づかず、調査や修正通知の原因となる可能性があります。
国税庁のデータによると、電子発行により紙の請求書のコンプライアンスコストは年間約9,000億ウォン削減されました。しかし、電子請求書から自社システムへデータを取り込む「ラストワンマイル」の問題は、今も経理担当者の机の上に残っています。
ここで、テンプレートベースの抽出とセマンティック抽出の違いが重要になります。テンプレートベースのツールは、各フィールドの周りに矩形を描き、座標を保存するよう求めます。これは、すべての請求書が1つの供給者から1つの形式で届く場合には機能しますが、数十の取引先から税額計算書を受け取る場合には非現実的です。セマンティック抽出(視覚言語モデルが使用するアプローチ)は、人間と同じように文書を読み取ります。つまり、供給価額ラベルの隣にある数値が、ページ上のどこにあっても供給価額であることを理解します。
課題を明確にしたところで、実際の抽出ワークフローをご紹介します。
ステップバイステップ:税額計算書のフィールドをExcelに抽出する方法
ImageToTable.aiはカスタム列抽出機能を使用して、あらゆる文書レイアウトから特定のフィールドを抽出します。核となる考え方は、テンプレート上でフィールドの座標をマッピングする代わりに、取得したい列名を韓国語または英語で入力するだけです。AIは各フィールドラベルの意味を理解し、画面上の位置ではなく意味に基づいて対応する値を特定します。入力した列名がそのまま出力スプレッドシートのヘッダーになります。
税務インボイスファイルをアップロード
HomeTaxからのPDFエクスポート、スキャンした紙のインボイス(JPG/PNG)、メールのスクリーンショットなど、1つまたは複数の税務インボイスファイルをアップロードしてください。対応形式はPDF、JPG、PNG、WebPです。一括処理の場合、すべてのファイルを一度にアップロードすると、結果が1つのスプレッドシートに統合され、インボイスごとに1行が作成されます。
抽出する列を定義
スプレッドシートに必要なフィールド名を入力します。韓国語ラベル、英語ラベル、またはその両方を使用できます。AIは両方を理解します。標準的な税務インボイス抽出の場合、実用的な列セットは次のとおりです。
작성일자— 発行日공급자 사업자등록번호— 供給者登録番号공급자 상호— 供給者会社名공급받는자 사업자등록번호— 購入者登録番号공급가액— 供給価額(VAT前の正味額)세액— VAT額합계금액— 合計金額국세청승인번호— 国税庁承認番号(電子税務インボイスの場合)
Excelを生成してダウンロード
「抽出」をクリック。各インボイスが出力スプレッドシートの1行になり、列名がヘッダーになります。1ページの税インボイスは通常5~10秒で処理されます。出力はXLSX、CSV、JSONでダウンロード可能で、会計システムへのインポートやExcelでの詳細分析にすぐに使えます。韓国税インボイス以外のフィールドレベルのインボイス抽出の詳細な手順については、インボイスフィールドをスプレッドシートに抽出する方法をご覧ください。
韓国の税額計算書に特に役立つ機能が2つあります。まず、推論列では、請求書に明示的に印刷されていないデータの列を追加できます。例えば、VAT期間(オプション:Q1/Q2/Q3/Q4)という列名を追加すると、AIが発行日(작성일자)を読み取り、該当する四半期のVAT期間(1月~3月=Q1、4月~6月=Q2、7月~9月=Q3、10月~12月=Q4)を判断して期間ラベルを自動入力します。これにより、Excelでの手動VLOOKUP作業が不要になります。次に、計算列で計算の検証が可能です。VATチェック(공급가액 × 0.1 = 세액?)という列名を設定すると、「OK」または差異額が出力され、VAT申告前に数字が合わない請求書を警告します。
以下の税額計算書で実際にお試しください。ログインは不要です:
ファイルは安全に処理され、保存されません。
1枚の請求書は簡単です。本当の試練は、VAT申告期限前に一括処理することです。
四半期ごとのVAT申告期限前に大量の税務請求書を処理する
韓国のVAT申告は四半期ごとに行われ、各申告期限は四半期終了後の翌月25日です(1月25日(第4四半期)、4月25日(第1四半期)、7月25日(第2四半期)、10月25日(第3四半期))。各期限の数週間前、中堅韓国企業の経理チーム(特に外部税理士(세무사)事務所を利用している場合)は、すべての仕入先税務請求書を統合し、国税庁(NTS)の電子請求書データと照合するための単一データセットにまとめるという、限られた時間の中で作業を行う必要があります。
その量は決して少なくありません。毎月請求書を受け取る取引先が30~50社ある企業の場合、四半期ごとに90~150枚の税務請求書が発生します。下請け業者や資材サプライヤーと取引のある建設会社や商社では、300~500枚に達することも珍しくありません。手動入力で1枚あたり3分かかるとすると、300枚で15時間の集中的なデータ入力作業が必要となり、通常は申告期限前の最終週に集中します。
バッチ処理により、この計算は変わります。HomeTaxからのPDFダウンロード、各取引先からのメール添付ファイル、スキャンした紙のコピーなど、すべての税務請求書を一度にアップロードします。同じ列定義がすべてのファイルに適用されます。結果は1つのExcelファイルに統合され、請求書ごとに1行、時系列で並べられます。1ページあたり5~10秒で処理されるため、300枚の請求書は手動での再入力なしで1時間以内に処理できます。
ここで、テンプレートよりもセマンティック抽出アプローチの価値が発揮されます。300枚の請求書は、おそらく数十の取引先から送られてきており、それぞれがわずかに異なるレイアウトを使用しています。HomeTax経由で発行されたもの、PopbillやBarobill経由のもの、自社のDouzone ERP経由のものなどがあります。テンプレートベースのツールでは、レイアウトごとに個別の設定が必要になります。カスタム列抽出では、フィールドラベル(供給価額、VAT金額、事業者登録番号)を読み取るため、すべてのバリエーションで同じ列名を使用します。ピクセル座標は使用しません。
バッチ処理の実用的なヒント:ファイル名列を追加してください。各行に元のファイル名が自動入力されるため、レビュー時に数値が不自然でも、抽出値を元の文書に簡単に追跡できます。さらに追跡性を高めるには、請求書データの一括抽出の広範なアプローチもご確認ください。
Excelから더존・이카운트・SAP Koreaへ
税額計算書データをExcelに抽出するだけでは不十分です。韓国のほとんどの企業では、このデータをERPや会計システムに取り込む必要があり、韓国市場には独自のソフトウェア環境が存在します。
더존비즈온は、韓国における国内ERP・会計プラットフォームのリーダーで、中小企業および税務会計分野で最大のシェアを誇ります。クラウド型中小企業向けのWEHAGO、中堅企業向けのiCUBE、税務会計事務所向けのSmart Aなど、各製品は特定の列マッピングを持つ構造化インポートファイルを必要とします。ImageToTable.aiで抽出したExcelは、더존のインポートテンプレートに合わせて再フォーマットできます。具体的には、事業者登録番号を主要仕入先キー、供給価額と付加価値税額を別々の数値列、発行日をYYYY-MM-DD形式にします。
이카운트 ERPは韓国の中小企業に広く利用されており、買掛金取引のCSV/Excelインポートに対応しています。そのインポート形式は、仕入先登録番号、請求書日付、説明、金額、付加価値税を個別の列として要求します。これは、本ガイドで説明する抽出列セットに直接対応します。
SAP Koreaは大企業向けで、通常、FI(財務会計)モジュールを介したデータマッピングが必要です。抽出したExcelは、SAPのLSMWやBDCツールによる一括アップロード前の中間ステージングファイルとして利用できます。
どのシステムを使う場合でも、基本原則は同じです。最初からERPのインポートフィールドに合わせて抽出列を定義してください。Douzoneのインポートテンプレートで사업자등록번호ではなく거래처코드(取引先コード)という列が必要な場合は、抽出列もそれに合わせて命名します。AIは列名ではなく、書類上のフィールドが表す内容に基づいて値を抽出するため、マッピングの手間をかけずにインポート可能な形式で出力されます。
請求書抽出がAP自動化ワークフローにどのように組み込まれるかについては、請求書データ抽出の完全ガイドをご覧ください。
よくある質問
電子請求書と紙の請求書の両方に対応していますか?
はい。ホームタックスからPDFでダウンロードした電子請求書(전자세금계산서)と、JPGまたはPNGでスキャンした紙の請求書の両方に対応しています。AIは文書の視覚的な内容を読み取るため、元の生成方法に関係なく処理可能です。鮮明な印刷品質のスキャン文書は、デジタル生成のPDFと同等の抽出精度を実現します。通常のスキャン条件下で、印刷された表データに対して最大99%の精度を提供します。
明細行まで抽出できますか、それとも請求書レベルの合計のみですか?
両方可能です。明細行フィールド(품목(品目説明)、수량(数量)、단가(単価)、공급가액(明細供給額))の列を定義すると、明細行ごとに1行が作成されます。請求書レベルのフィールド(供給額合計、消費税額、請求額合計)のみを定義した場合は、請求書ごとに1行が作成されます。原価計算に明細レベルの詳細が必要か、付加価値税申告に合計のみが必要かによって選択してください。
事業者登録番号の形式(XXX-XX-XXXXX)はどのように処理されますか?
10桁の事業者登録番号(사업자등록번호)は、ハイフン区切りの形式を保持したまま抽出されます。ERPへのインポートでハイフンなしの番号が必要な場合は、計算列を追加して書式を除去するルールを設定するか、出力に対してExcelのSUBSTITUTE関数を使用して一度にダッシュを削除することもできます。
NTS 승인번호について
NTS 승인번호(국세청승인번호)は、電子税額計算書に長い英数字コード(通常XXXXXXXX-XXXXXXXX形式)として表示されます。これを列名として追加すると、他のフィールドと一緒に抽出されます。この番号は、特定の請求書がNTSに正しく送信されたことを確認するために、HomeTaxの記録と照合する際に役立ちます。
同じバッチで韓国語や他の言語の請求書を処理できますか?
はい。韓国の税額請求書と海外の仕入先からの請求書(例:英語、日本語、中国語)を同じバッチに含めることができます。AIは200以上の言語をネイティブに処理します。列名は韓国語のフィールドに一致します。同じバッチ内の非韓国語の請求書については、AIが同等のフィールド概念(例:「供給価額」は供給価額フィールドに一致)をマッピングします。各国別ガイドについては、日本の適格請求書の抽出、ドイツのレヒヌングの抽出、またはメキシコのCFDIの抽出をご参照ください。
抽出データは付加価値税申告に十分ですか?
抽出されたExcelは、供給価格、付加価値税額、売り手・買い手の事業者登録番号、日付など、付加価値税申告書作成に必要な生データを提供します。ただし、韓国での実際の付加価値税申告は、ホームタックスまたは税理士・会計ソフト(더존、이카운트など)を通じて行います。抽出結果は、国税庁への直接提出ではなく、その申告プロセスへの構造化された入力として機能します。韓国のインボイスと併せて米国の税務フォームを扱う企業は、W-2および1099税務フォームデータの抽出ガイドをご参照ください。
次のVAT申告期限の準備を確認
税務請求書を受け取ってから、ERPにクリーンで構造化されたデータが入るまでのギャップに、毎四半期何時間も費やしていませんか。30件でも300件でも、抽出作業は数分で終わるべきです。実際の請求書でもサンプルでも構いません。アップロードすれば、初回から正しい列にデータが反映されます。