英国P60データ抽出完全ガイド給与チーム向け

「P60データ抽出」を検索すると、結果は二つに分かれます。P60を読み取れると謳う抽出ツールの製品ページと、P60の概要や各ボックスの説明をする一般的な解説記事です。その中間はありません。「3つの給与ソフトで150枚のP60 PDFが生成された」状態から、「すべての項目が1つのスプレッドシートにまとまり、年度末のFull Payment Submissionと照合され、買収先企業の退職者証明書も含まれている」状態に導くガイドは存在しません。これがそのガイドです。

手入力をやめよう — AIに読み取らせるだけ
画像やPDFをアップロード — 10秒で構造化データに
今すぐ試す
登録不要 · カード不要 · 10秒で結果
英国P60年度末証明書のデータ抽出 — Sage、Xero、BrightPayの従業員税証明書を給与スプレッドシートに変換

重要ポイント

  1. Sage P60とBrightPay P60は、同じ法定項目を互換性のないレイアウトで保持している。HMRCはデータを義務付けるが、デザインは自由であり、主要6つの給与ソフトはこの自由度を利用して根本的に異なる印刷形式を採用している。
  2. ある給与ソフトのレイアウトで動作するテンプレートベースのOCRは、他の5つでは静かに失敗する。空のセルや誤った値が生成され、元の証明書と各行を比較するまで警告は出ない。
  3. AIセマンティック抽出は、「この雇用における給与」というラベルの意味を、ページ上の位置ではなく理解して読み取る。1つの列定義で、すべての給与ソフトのP60と、退職者の前職からの紙の証明書のスマホ写真までも抽出できる。

P60データ抽出とは

P60データ抽出とは、年末証明書(End of Year Certificate)上の法定項目(従業員のNINO、雇用主のPAYE参照番号、当該雇用における給与額、控除済み税額、国民保険料、最終税コード)を読み取り、従業員ごと・課税年度ごとに1行として、スプレッドシートの構造化された列に変換するプロセスです。証明書自体はHMRC仕様RD1に準拠し、代替P60が必ず含むべき全項目を規定していますが、視覚的なレイアウトは給与ソフトウェアプロバイダーの裁量に委ねられています。

この「データは必須、レイアウトは自由」という区別こそが、抽出が独立したカテゴリーとして存在する理由です。もしすべてのP60が同一の外観であれば、テンプレートベースのOCRツールでBox 1からBox 6を固定座標から読み取れます。しかし、Sage 50cloudはNINOを右上、PAYE参照番号を雇用主名の下に太字で左下に印刷するかもしれません。BrightPayはそれらを枠線付きセクションに並べて配置するかもしれません。IRIS Staffologyはすべてを縦に積み重ねるかもしれません。これら3つの証明書はすべてHMRCに準拠しており、すべて同じ法定項目を含んでいます。そして、いずれか1つのために作られたテンプレートでは、どれも処理できません。

カスタム列抽出 — スプレッドシートに必要な出力列(「NINO」「当該雇用における給与額」「控除済み税額」「NIカテゴリ文字」)を定義し、AIが各P60上の値を、その位置ではなくフィールドラベルの意味を理解して特定する方法 — こそが、給与プロバイダーごとの設定なしに抽出を機能させます。同じ列定義で、Sage P60、Xero P60、BrightPay P60、そして2023年に管理下に入った雇用主からのスキャン紙P60も読み取れます。AIはテンプレートではなく、意味で読み取ります。

核心的な転換: P60抽出は、ロジックを「このフィールドはページのどこにあるか」から「このフィールドは税証明書の文脈で何を意味するか」へと移行させます。123/AB456という形式のPAYE参照番号は、ヘッダー、フッター、専用参照ブロックのどこに表示されても同じデータです。この区別を理解する抽出システムこそが、すべての給与プロバイダーのレイアウトを、それぞれに個別のテンプレートを必要とせずに処理できるのです。

P60データ抽出が重要な理由

2003年所得税(PAYE)規則第67条に基づき、英国の全雇用主は4月5日時点で給与計算対象となる従業員全員にP60を交付しなければなりません。法定期限は5月31日です。証明書を生成した給与計算ソフトにとって、ここでワークフローは終了します。しかし給与計算チームにとっては、ここから3つの下流ワークフローが始まります。いずれも給与計算ソフトのP60生成機能では対応できません。

年末調整:FPSとの給与照合

複数の雇用主クライアントの年末調整を担当する給与計算代行機関は、全従業員のP60の数字が、Real Time Information(RTI)システムを通じてHMRCに送信された年末のFull Payment Submission(FPS)合計と一致することを確認する必要があります。照合作業は雇用主ごとに実施します。雇用主Aの全P60をスプレッドシートに抽出し、給与・税額の合計を代行機関自身のFPS抽出データと比較し、1ポンド単位で一致しない行を調査します。5社のクライアントで従業員150人の場合、750件のP60対FPSの比較が必要となり、1行の転記ミスが数カ月後にHMRCのコンプライアンスチェックで指摘される不一致を生み出します。このワークフローの詳細な手順については、英国P60データをExcelに抽出して給与照合する方法をご参照ください。

確定申告準備(1月期限、5月収集期間)

個人クライアントを担当する会計事務所は、1月31日の確定申告期限に向けて、銀行取引明細書、配当金支払証明書、P11DフォームとともにP60を受け取ります。同一課税年度に2つの雇用を同時に持つクライアントは、それぞれに雇用主のPAYE参照番号と「本雇用における給与額」が記載された2行のP60を提出します。これらはSA100税務申告書の雇用ページに直接対応し、雇用主Aの給与額が誤って雇用主Bの行に転記されるミスは、SA302照会の最も一般的な原因の一つです。英国給与計算の5月問題は、この転記作業が、会計士が全クライアントの年末書類で多忙を極める時期に集中することです。

収入確認の大規模対応

住宅ローン提供会社、賃貸業者、雇用審査会社、移民アドバイザーは、前年度の収入証明としてP60を日常的に要求します。確認作業は大量かつ限定的な項目(氏名、NINO、雇用主のPAYE参照番号、年間総支給額)に集中します。P60は申請者の雇用主が使用する給与計算プロバイダーから提供されるため、確認側はその形式を制御できません。そのため、抽出ツールが事前設定なしで任意のレイアウトを処理できるかどうかが、確認パイプラインの自動化の可否、つまり誰かが各PDFを開いて手動で数字を入力するかどうかを決定します。

P60抽出特有の課題

P60は給与明細や税務フォームと共通する抽出課題(形式の多様性、ラベルの不統一、スキャン文書とデジタル文書の品質差)を持ちますが、他の文書タイプではほとんど見られない3つの構造的問題も抱えています。抽出ワークフローを設定する前にこれらを理解しておくことで、6月に手動修正の二次対応が必要になるのを防げます。

複数の給与計算プロバイダー形式と単一の法定仕様

HMRCのRD1仕様書は、代替P60について「形式とレイアウトのバリエーション」を明示的に許可しています。Sageは法定証明書セクションを左揃えブロックで印刷し、PAYE参照番号を雇用主名の下に太字で表示します。BrightPayはNI詳細を枠線付きテーブルで区切ります。XeroはNINOを従業員住所ブロックの上に配置します。QuickBooks Onlineは税コードとNIカテゴリ文字を上部4分の1に横一列で表示します。Moorepayは3列グリッドを使用します。これら6つのレイアウトはすべて準拠していますが、テンプレートを共有するものはありません。

これは仕様の欠陥ではありません。英国の雇用主が何十年も異なる給与計算ソフトウェア(それぞれ独自の印刷エンジンを持つ)を使用してきたためであり、HMRCの規制姿勢はデータ内容を義務付け、視覚的レイアウトは義務付けないというものです。抽出における実際の影響は、Sage生成のP60で機能するテンプレートベースのアプローチが、BrightPayのP60では無意味な結果を生むことです。セマンティック抽出アプローチ(ピクセル座標ではなくフィールドの意味で読み取る)は、「この雇用における支給額」がページ上のどこに表示されても同じ意味を持つことを理解するため、単一の列定義ですべてのプロバイダーを処理できます。

退職者のP60:給与年度末に潜むエッジケース

2026年2月に退職した従業員が、同年4月5日時点で給与計算対象だった場合、退職時期にかかわらず、元雇用主はその従業員が働いた年度分のP60を発行する必要があります。元の会社がSageを使用し、転職先がXeroを使用している場合、新しい給与部門は普段扱わない形式のP60を管理することになります。さらに、前の雇用主がまだ紙の証明書を発行している場合(HMRCの規則で認められている介護・支援事業者や一部の免税団体)、P60は物理的な書類として届きます。それを誰かがスマートフォンで撮影し、給与部門にメールで送信します。その写真は、自社の給与システムから出力されたクリーンなデジタルP60と並んで、抽出処理の対象となります。

退職者のP60には年度をまたぐ影響もあります。2025年4月から2026年2月まで雇用主Aで働き、その後2026年2月から4月まで雇用主Bで働いた従業員は、同じ課税年度をカバーする2枚のP60を保有します。その年の課税所得総額は、両方の「この雇用での給与」の合計ですが、どちらのP60にもその合計は表示されません。計算は抽出後のスプレッドシートで行われ、両方のP60が正確に同じワークブックに抽出されることが前提です。どちらかの行で1桁の入力ミスがあれば、確定申告で最終的に発覚する誤った合計額が生じます。

年度をまたぐデータ:NIカテゴリ文字の問題

従業員の国民保険カテゴリ文字が年度途中で変更された場合(最も一般的なのは、年金受給年齢到達によるAからCへの変更)、P60には2つの異なるカテゴリ文字の下に2つの別々のNI行が表示されます。各行には独自の所得区分(LEL、LEL~PT、PT~UEL、UEL超)と従業員負担額があります。Sageでは、左側に文字ラベルを付けて2行を隣接表示します。Xeroでは、文字をセクションヘッダーとして別々のテーブルセクションに表示します。両方の行を単一の「NI合計」にまとめてしまう抽出システム(給与明細用に設計され、P60に後付けされたツールによく見られる)は、雇用主がRTI提出と照合するために必要なカテゴリ文字の内訳を失います。

NIカテゴリ文字のセットは限られています:A、B、C、F、H、I、J、L、M、S、V、X、Z。抽出されたスプレッドシートでこのセット以外の値があれば、転記ミスか抽出エラーです。ほとんどのP60が文字A(標準税率)を使用するため、NIカテゴリ列に「D」や「K」が混入した場合、簡単なExcel検証ルールで検出可能です。ただし、この検出は、抽出で文字が専用列に保持されている場合にのみ機能し、両方のNI行が1行に統合されて負担額が合計されている場合は機能しません。

従来手法 vs AI搭載P60データ抽出

P60データをスプレッドシートに取り込む方法は3つあり、その選択によって5月の給与処理期間がタイピング作業になるか、ファイルアップロードとエクスポートで完了するかが決まります。

手法仕組み速度(P60あたり)複数の給与プロバイダー形式に対応NIカテゴリ変更に対応
手動入力P60 PDFを開き、各法定項目を確認してスプレッドシートのセルに値を入力約2分対応(人間が視覚的に適応)対応(人間が文脈を解釈)
テンプレート / ゾーンOCR給与プロバイダーごとに座標ゾーンを定義し、各ゾーン内のテキストをOCRで読み取り約10秒非対応 — プロバイダーごとに個別テンプレートが必要。新しい形式は既存テンプレートを破壊非対応 — テキスト抽出はするが、NI行が2行ある場合にどのカテゴリ文字に属するかは判別不可
AI意味抽出Vision AIがピクセル位置ではなく、フィールドの意味と文書構造を理解して読み取り約5~10秒対応 — レイアウト非依存。1つの列定義でSage、Xero、BrightPay、QuickBooks、IRIS、Moorepay、スキャンした紙のP60に対応対応 — 年度途中でカテゴリ文字が変わった場合も両方のNI行を保持し、正しいカテゴリラベルとともに各行に出力

テンプレートベースのOCRは、従来の文書処理ツールで使われる手法で、文書画像上に矩形ゾーンを定義し、各ゾーン内でOCRを実行します。Sage P60で従業員のNINOがA4ページの座標(530, 280, 700, 300)にある場合、テンプレートはその矩形内のテキストを読み取ります。BrightPay P60でNINOが座標(400, 190, 600, 210)にある場合、空のセルか誤ったフィールド値が生成されます。英国の給与プロバイダーは根本的に異なるP60レイアウトを使用するため、テンプレートシステムはプロバイダーごとに1つのテンプレートと、デジタルレイアウトに一致しないスキャン紙P60用のフォールバックが必要です。さらに、プロバイダーが印刷形式を更新するたびに、テンプレートは静かに破綻します。

AI意味抽出はこのロジックを逆転させます。データがページ上のどこにあるかを定義する代わりに、スプレッドシートに必要な列名を入力することで何のデータが必要かを定義します。AIは文書全体を読み取り、税証明書構造内での意味的役割に基づいて各フィールドを識別し、ピクセル位置に関係なく対応する列に値を入力します。SageのP60、BrightPayのP60、退職者の以前の雇用主からの紙のP60の電話写真もすべて、同じスプレッドシートにデータ行が生成されます。これは、AIが座標ではなく意味でマッチングするためです。これが、位置ベース抽出から意味ベース抽出への根本的なシフトです。

効率の差は量が増えるほど顕著になります。手動入力でP60あたり2分の場合、150人の従業員で5時間の集中転記作業が必要です。これは、給与チームが最終EPSの処理、P32の調整、月末までに取締役会が期待するレポートの準備も同時に行う5月の期間においてです。AI抽出では、同じ150件のP60を合計約15~25分で処理します。手動アプローチの詳細な比較については、P60データ入力の隠れたコストをご覧ください。

JPG/PNG/PDF AI抽出

同じ抽出メカニズムはSage、Xero、BrightPayなど、あらゆる給与ソフトのP60で動作します。列名を指定するだけで、AIがテンプレート位置ではなくフィールドの意味に基づいて読み取ります。

抽出すべき主要P60フィールド

P60には、ほとんどの抽出ワークフローで必要とされる以上のフィールドが含まれています。どのフィールドを抽出するかは、スプレッドシートが何に使われるかによって決まります。しかし、フィールド自体はHMRCのRD1仕様で定義されており、各フィールドの目的を理解することで、出力が後続タスクを解決するのか、新たな調整問題を生み出すのかが決まります。

本人確認・参照項目

  • 従業員NINO — 国民保険番号(英字2文字、数字6桁、末尾英字1文字、例:QQ 12 34 56 C)。HMRCがRTIデータと照合するための従業員識別キー。
  • 雇用主PAYE参照番号 — 形式 NNN/AAAAAAAA(税務署番号3桁、スラッシュ、英数字最大10文字)。各P60行を正しい雇用主エンティティに紐づけるために必須。同一従業員が同一課税年度に複数の雇用主から複数のP60を受け取る場合に特に重要。
  • 事業所/給与番号 — 社内従業員識別子。任意項目だが、同名従業員がいる場合に有用。

給与・税額

  • 本雇用における給与 — 当該雇用主から支払われた課税年度分の総課税給与。SA100確定申告書の雇用ページに対応。
  • 控除済み税額 — 控除されたPAYE所得税総額。FPS年度末集計と直接照合。
  • 年間総給与・年間総税額 — 同一課税年度に複数の雇用があった場合、過去および現在の雇用を合算。本雇用の値とは異なり、合計値を示す。
  • 最終税コード — 例:1257L。年度末に適用された緊急課税措置を示すWeek 1(W1)またはMonth 1(M1)の接尾辞が付く場合あり。

国民保険詳細

  • NIカテゴリ文字 — A、B、C、F、H、I、J、L、M、S、V、X、Zのいずれか1文字。拠出率を決定し、年度途中で文字が変更された場合は別途保持する必要あり。
  • 所得帯 — 下限所得限度(LEL)以下、LEL〜一次閾値(PT)、PT〜上限所得限度(UEL)、UEL超の各所得。NIカテゴリ文字ごとに表示。
  • 従業員NI拠出額 — PT超の所得から実際に控除されたNI。雇用主のP32支払計算と照合。

法定給付・控除

  • 法定給付 — SMP、SPP、ShPP、SAP、SPBP、SNCPをそれぞれ個別に表示。従業員が受給した場合のみ表示され、空白は「該当なし」を意味し、「該当するが0円」とは区別。
  • 学生ローン控除 — プラン1、プラン2、またはプラン4の返済額(ポンド単位)。
  • 大学院ローン控除 — 学部学生ローンとは別枠で、異なる閾値で控除。

スプレッドシート上では、150名の従業員に対する完全なP60抽出により、すべてのNI帯域の内訳を含めると約150行、20〜25列になります。列定義は課税年度をまたいで再利用可能です。HMRCの法定フィールドセットは法改正時にのみ変更され(2025-26年度仕様への法定新生児ケア給付の追加など)、その際は残りの部分を再構築せずに新しい列を追加するだけで対応できます。

P60の一括バッチ処理

P60を1枚処理するのは問題ではありません。1枚のP60からExcelにフィールドを抽出するには、自動化ではなく注意力が必要です。問題は規模が大きくなったときに発生します — 従業員100名、3つの給与計算プロバイダー、買収した会社の退職者から入手したスキャン済み紙のP60が数枚 — この規模になると、構造上の課題は「このフィールドを読み取れるか」から「このスプレッドシートのすべての行が、1つのソース文書と1つの税年度に確実にトレースできるか」に変わります。

バッチ処理により、複数ファイルのワークフローは単一のアップロード&エクスポート手順に集約されます。Sage印刷、Xero印刷、スキャン紙、スマホ写真など、すべてのP60 PDFを1つのバッチにドロップし、列名を一度定義すれば、各行が1枚のP60に対応する統合スプレッドシートが出力されます。5月31日締切前に100枚以上のP60をバッチ処理することで、抽出が「1枚単位の便利機能」から「給与計算チームのワークフロー」へと変わります。

150枚のP60を一度に処理する前に、バッチ処理特有の3つの注意点を確認しておきましょう。

監査に対応できる行のトレーサビリティ

出力スプレッドシートのすべての行は、1つのソースファイルと1つの税年度にトレース可能でなければなりません。出力に「年間総支給額」の列があり、横に£38,450と表示されていても、その金額を生み出した従業員とP60を特定する列がなければ、そのスプレッドシートは監査上の資産ではなく、負債です。HMRCのコンプライアンスチェックでは、調整表の任意の数値の根拠となるソースP60の提出を求められることがあります。抽出時にソースファイル名を出力の列として埋め込めれば、この確認は簡単ですが、そうでなければ手動でのクロスリファレンス作業が発生し、元のバッチ処理よりも時間がかかります。

デジタルとスキャン入力の混在

100枚のP60バッチには、少なくとも3~5件のエッジケースが含まれます。従業員の前職からのスキャン紙P60、原本を紛失した従業員がスマホで撮影した証明書の写真、前年度の数字を示すHMRCポータルのスクリーンショットなどです。これらは解像度、照明、傾き角度が異なり、画質はデジタル生成PDFよりも低くなります。抽出システムは、これらを同じバッチで処理できる必要があります — 「スキャン」文書と「デジタル」文書で別々のワークフローを必要としない — なぜなら現実には両方のタイプを受け取り、それらを同じスプレッドシートにまとめる必要があるからです。

単一バッチ内での複数税年度対応

3年分のP60(2023-24、2024-25、2025-26)を保有するクライアントの確定申告データを処理する給与計算事務局は、3つの別々の抽出ジョブではなく、1つのワークシートに全3年分を必要とします。抽出では税年度を出力の列として含め、年度ごとに行をフィルタリングできるようにする必要があります。列定義(NINO、雇用主PAYE参照番号、給与、税、NI)は年度間で同じです。RD1法定フィールドセットは安定しており、印刷される税年度表示のみが変わるからです。

抽出したP60データのエクスポートと活用

抽出結果は、ダウンストリームのワークフローに合わせて出力する必要があります。P60データの主な出力先は3つあり、それぞれに異なる形式要件があります。

  • Excel(XLSX) — 給与照合の標準形式。適切な列ヘッダー、標準化された日付形式(税年度は「2025-26」と表記)、数値として書式設定された数値フィールドで抽出データが届くため、P60抽出ハウツーガイドで紹介している検証用数式を、テキストとして保存された通貨値や結合セルに分割されたNINOを再フォーマットすることなく、すぐに適用できます。
  • CSV — 給与ソフト、会計システム、または事務所独自の照合ツールへの一括インポート用。ほとんどの給与プラットフォームは報酬データのCSVインポートに対応しており、抽出でクリーンなCSVが得られれば、インポート前に手動でスプレッドシートをフォーマットする中間ステップを省略できます。
  • JSON — カスタム統合、API駆動の検証パイプライン、またはRTI提出データ抽出との自動クロスチェック用。

Googleスプレッドシートで照合を行うチーム向けには、Googleスプレッドシートサイドバーアドオンが、エクスポートと再インポートのループを経ずに、抽出したP60フィールドをアクティブシートに直接書き込みます。スプレッドシート内からP60のPDFをアップロードし、列名を定義すれば、データは次の空行に配置されます。

P60データ抽出アプローチの選び方

P60抽出に重要な機能は、請求書抽出やレシートスキャンに重要な機能とは異なります。月に10,000件の請求書を処理するツールが、150件のP60にはまったく適さない場合があります。なぜなら、P60の構造(法定フィールド、NIカテゴリ文字の分割、離職者のエッジケース、年度跨ぎデータ)は、汎用抽出ツールが想定していない要求を生み出すからです。評価すべき観点は以下の通りです。

評価軸P60に固有の重要性テスト内容
テンプレート不要の運用給与計算事業者ごとにP60のレイアウトが異なります。事業者ごとにテンプレートが必要なツールでは、自動化のメリットよりも設定の負担が大きくなります。Sage P60とBrightPay P60を同じ列定義でアップロードし、再設定なしで両方とも正しくデータが抽出されることを確認する。
カスタム列定義業務によって必要な項目は異なります。収入確認には6項目、給与照合には20項目が必要です。固定の項目セットしか抽出できないツールでは、そのツールの前提に縛られます。NINO、PAYE参照番号、雇用先での給与額、控除済み税額、NIカテゴリ文字、学生ローン控除額の列を定義し、P60をアップロードして全列にデータが入ることを確認する。
NIカテゴリ文字の保持年度途中でカテゴリ文字が変わった場合、P60にはNIの行が2行表示されます。これを1行にまとめてしまう抽出ツールでは、雇用主側の照合に必要なデータが失われます。可能であれば、年度途中でNIカテゴリが変更されたP60をアップロードし、正しいカテゴリ文字とそれぞれの拠出額が別々の行で出力されることを確認する。
一括処理と統合出力単一書類の抽出はスポット確認には有効ですが、5月に150件のP60を処理する給与部門にとっては、全行を1つのスプレッドシートにまとめて出力できる一括処理が不可欠です。異なる給与計算事業者のP60を5件アップロードし、1つのスプレッドシートに5行のデータが出力され、各行に元ファイル名がトレース可能な状態で表示されることを確認する。
スキャン・撮影されたP60への対応前職の退職時P60は紙のスキャンや、照明むらや傾きのあるスマホ写真で届くことがあります。きれいなデジタルPDFでしか動作しないツールでは、実際のP60業務に対応できません。印刷したP60を一般的なオフィスデスク品質で撮影し、きれいなデジタルP60と一緒にアップロードする。全項目の手動確認が必要になるほど抽出精度が低下しないことを確認する。
出力列としての課税年度複数の課税年度のP60を一括処理する場合、各行に課税年度の識別子が必要です。これがないと、年度でフィルタリングしたり、2024-25年度と2025-26年度の数値を区別したりできません。抽出列に「課税年度」を含め、異なる年度のP60で正しくデータが入ることを確認する。
データセキュリティと保持期間P60にはNINO、給与額、雇用主参照番号が含まれ、これらはすべて英国GDPR上の個人データです。抽出プラットフォームは、暗号化、データ保持期間、モデル学習に関する方針を明示すべきです。プラットフォームのセキュリティページと利用規約を確認する。アップロードされた書類が暗号化され、AI学習に使用されず、定められた期間内に削除されることを確認する。

これらの評価軸はP60抽出に固有のものです。請求書処理に優れたツールでも、NIカテゴリ文字のテストで不合格になる可能性があります。給与明細を得意とするツールでも、退職者P60のエッジケースで苦戦するかもしれません。実際の書類(不完全なものも含む)を使ってテストし、本番ワークフローに導入する前に、ツールがあなたのチームが実際に受け取るP60業務(理想的なバージョンではなく)に対応できることを確認することが唯一の方法です。

よくある質問

スマホで撮影した紙のP60からデータを抽出できますか?

はい、抽出ツールがテンプレートOCRではなくAIベースの意味読み取りを使用している場合に限ります。スマホ写真は照明ムラ、わずかな傾き、デジタルPDFより低い解像度を伴います。これらはすべて、きれいなピクセル位置合わせに依存するテンプレートベースのOCRの精度を低下させます。セマンティックAI抽出は、テキストが人間の目で判読可能である限り、撮影された書類を処理できます。最良の結果を得るには、P60を平らな面に置き、均一な照明の下で撮影し、証明書に影がかからないようにしてください。撮影されたP60が退職者の以前の雇用主からの唯一のコピーである場合、精度が多少低下しても抽出する価値はあります。代替手段は数字を手動で入力することであり、それにも独自のエラー率があります。

同じ課税年度に従業員が複数の雇用主からP60を持っている場合はどうなりますか?

各P60は、出力スプレッドシートの個別の行になります。2つの仕事を持つ従業員は、雇用主ごとに1行ずつ、合計2行を生成します。雇用主PAYE参照列は、どの行がどの雇用主からのものかを区別します。この雇用における給与および控除済み税額は、その特定の雇用主からの金額のみを報告します。各P60の年間総給与および年間総税額の列には、すべての雇用を合計した合計額が含まれます。抽出は、HMRCが設計した構造(雇用ごとに個別の証明書)を保持し、行をマージしようとはしません。確定申告や収入確認のためにマージが必要な場合は、抽出後にスプレッドシートでNINOをグループ化キーとして使用して行います。

年度途中のNIカテゴリ文字変更はどのように処理されますか?

課税年度中にNIカテゴリ文字が変更された場合(最も一般的なのは、年金受給開始年齢に達したことによるAからCへの変更)、P60には異なるカテゴリ文字の下に2つの個別のNI行が表示され、それぞれに独自の所得区分の内訳と拠出額が示されます。セマンティック抽出は両方の行を保持します。NIカテゴリ文字列には各行の正しい文字が含まれ、所得区分列には分割された金額が個別に表示されます。これは正しい動作です。両方の行を単一のNI総額にまとめると、RTI調整に必要な内訳が失われます。抽出ツールが従業員ごとに1つのNI行のみを生成する場合、それはP60固有のテストに不合格であり、給与調整のためにデータに依存する前に、マージされた行がカテゴリ文字間で拠出金を混同していないことを確認する必要があります。

同じ列定義は異なる課税年度でも使えますか?

はい。HMRCの法定P60フィールドセットは課税年度間で安定しており、2018-19年度から2025-26年度までのすべてのP60に同じフィールドが表示されます。近年の唯一の追加は、2025-26年度の仕様に追加された法定新生児ケア給付金(SNCP)です。現在の課税年度用に作成された列定義は、過去年度のP60でも機能し、既存の列セットを再構築することなく、新しい法定フィールドの列を追加することで将来の年度に適応できます。複数の年度を一括処理する場合は、「課税年度」を専用の抽出列として含めてください。

P60抽出の精度は手動入力と比べてどの程度ですか?

主要な給与計算プロバイダーからのクリーンなデジタル生成P60に対するAI抽出の精度は、標準フィールド(NINO、給与、税、NI拠出金)で通常98%を超えます。スキャンまたは撮影されたP60の精度は低く、画質にもよりますが約90~95%です。これは、低解像度、歪み、影によって曖昧さが生じ、クリーンなデジタル文書と同じ信頼度でAIが解決できないためです。手動入力にも独自のエラー率があります。米国給与協会は、手動プロセスに依存する企業では給与総額の1~8%にエラーが含まれると推定しており、NINOやPAYE参照番号の入力ミスは、形式検証フラグを生成する抽出の不一致よりも検出が困難です。実用的な推奨事項は、最初に抽出し、次に列レベルの検証チェック(NINO形式、NIカテゴリ文字の所属、税対給与の比例性)を実行し、フラグが立った行のみを手動で確認することです。これにより、抽出のスピードとコンプライアンスに重要な検証を組み合わせることができます。

従業員のP60データは抽出中に安全ですか?

P60には、NINO、総支給額、控除された税、雇用主のPAYE参照番号が含まれており、これらはすべて英国GDPRの下で個人データ、特定の状況では特別カテゴリデータに該当します。責任ある抽出プラットフォームは、転送中(TLS)および保存中のファイルを暗号化し、アップロードされた文書をAIモデルのトレーニングに使用せず、処理完了後、定義された保存期間内にソースファイルを自動的に削除します。従業員のP60を抽出プラットフォームにアップロードする前に、プラットフォームのプライバシーポリシーと利用規約でこれらの確約を確認してください。モデルトレーニングやデータ保持に関するプラットフォームのポリシーが曖昧な場合は、危険信号として扱い、明示的な書面による確認が得られるまで従業員の税務書類をアップロードしないでください。

AIで抽出したP60データは、HMRCのコンプライアンス上、有効なものとして認められますか?

抽出ツールはデータ処理ユーティリティであり、P60証明書から情報を読み取り、構造化された形式で出力します。データを生成、認証、またはHMRCに提出することはありません。抽出されたデータのコンプライアンスは、読み取り元のソース文書に依存します。元のP60がHMRC認定の給与計算ソフトウェアで生成され、抽出が正確であれば、抽出された数値は証明書の数値と同一です。コンプライアンスの対象となるのは抽出ツールではなく、証明書そのものです。HMRCのコンプライアンスチェックはP60自体を参照します。抽出は単に証明書からデータを移動し、大規模な照合、監査、報告を可能にする形式に変換するだけです。

従業員やクライアントからP60を収集する際、PDFをメールでやり取りせずに行うにはどうすればよいですか?

コレクションリンク — 抽出ツールアカウントから生成される共有可能なURL — を使用すると、P60を提出する必要がある任意の相手にリンクを送信できます。受信者はリンクを開き、あなたが設定した確認コードを入力し、シンプルなWebページから書類をアップロードします。ファイルは自動的にあなたの処理キューに届きます。アカウント作成、ログイン、メール添付は不要です。これは、雇用主クライアントからP60を収集する給与計算事務所、確定申告クライアントから書類を集める会計士、新入社員から以前の雇用主のP60を収集する人事チームに役立ちます。

P60抽出は、結局のところ5月の問題です。給与チームが月末の最終週に証明書のフィールドを手作業でスプレッドシートに打ち込んでいるのは、競合他社がすでに自動化している時間を費やしていることになります。列を一度定義し、P60を一括アップロードすれば、照合用スプレッドシートが従業員の行を自動で埋め、確認が必要なものだけをチェックすればよくなります。

初めてのP60バッチ抽出を試す

サンプルファイルでのテストはサインアップ不要。ファイルは処理後自動削除され、安全に取り扱われます。

📮 contact email: [email protected]