フランスの給与明細データをExcelに抽出する方法

会計事務所(cabinet d'expertise comptable)が新規クライアントの給与計算を引き継ぐ際、最初に要求する書類は総勘定元帳ではありません。それは、全従業員の12ヶ月分のブルトン・ドゥ・ペ(給与明細書)です。各PDFは、毎月のDSN(名目社会保険申告書)を反映したものです。DSNは、2017年1月以降、Décret n°2016-611に基づき、URSSAF、CNAV、CPAM、Pôle Emploiに送信される単一の電子申告です。12月の明細書の総支給額(salaire brut)がDSNの合計と一致しない場合、会計事務所が帳簿を確定(arrêter les comptes)する前に、その差異を特定し説明する必要があります。ボトルネックは給与明細を読むことではありません。1枚の明細書につき3分かけて、総支給額(Gros)、控除対象CSG(CSG deductible)、手取り額(Net à payer)を手作業でスプレッドシートの行に入力し、それをさらに49人の従業員、12ヶ月分繰り返すことです。

フランスの給与明細(ブルトン・ドゥ・ペ)データをExcelスプレッドシートに抽出

重要ポイント

  1. 1枚の明細書あたり3分として、50人の従業員がいる企業は、法律で定められた16の項目をExcelに入力するだけで毎年30時間を費やしており、検証作業はまだ始まっていません。
  2. 30時間の入力作業を経ても、会計士はまだ承認できません。DSNの照合では、明細書PDFと電子申告の間で総支給額(Salaire Brut)、控除対象CSG、課税対象額(Net Imposable)が一致する必要があり、1つの社会保険料の分類ミスが月全体を狂わせるからです。
  3. 計算列「CSGチェック = 総支給額 × 98.25% × 9.2% − 抽出CSG」を1つ追加するだけで、ImageToTable.aiは抽出時に±1ユーロを超える行をフラグ付けし、600行のスプレッドシートを3行の調査リストに変えます。

フランスの給与明細書(Bulletin de Paie)が欧州で最もデータ抽出が難しい書類の一つである理由

フランスの給与明細書は、データ抽出ツール向けに設計されていません。コンプライアンスのために設計されています。そして、欧州でも最高水準の事業主負担率で賄われるフランスの社会保障制度では、拠出金の1ユーロ単位の追跡が求められます。労働法典第R3243-1条に基づき、16項目の記載が義務付けられています。さらに、同第R3243-4条により、別の5行の記載が禁止されています。雇用主はストライキ時間をそのまま表示したり、労働時間と労働組合活動時間を区別して表示することはできません。違反した給与明細書1枚につき、最大450ユーロの罰金が科せられます。

この法的な密度の高さが、英語圏の給与明細書(控除項目が少ない)向けに設計された汎用OCRツールでは対応できない、3つの抽出上の難しさを生み出しています。

  • 3セクション構成。フランスの給与明細書は、上部(雇用主と従業員の情報:SIRET、NAFコード、適用協約)、中央部(総支給額 → 社会保険料 → 差引支給額)、下部(年間累計、休暇残高、ネット社会的金額)に分かれています。各セクションで異なる書体が使用され、同じフィールド名「合計」が、中央部では小計、下部では年間累計、ヘッダーでは参照番号として登場します。「上から2番目の合計」を拾う座標ベースのテンプレートでは、Silaeで生成されたPDFとPayFitで生成されたPDFで、異なる数値を取得してしまいます。
  • 5つの必須社会保険料グループ。2018年の簡素化改革により、それまで約50行あった社会保険料の内訳は、健康、労災、年金(一般制度の上限あり・上限なし、AGIRC-ARRCO補完制度)、家族、失業の5つのカテゴリに統合されました。しかし、各グループには依然として従業員負担分と事業主負担分の両方が含まれており、別々の列に表示されます。CSG(一般社会貢献税)とCRDS(社会債務返済税)は、独自の計算ベース(総給与の98.25%、100%ではない)を持つ別セクションにあります。すべての「社会保険料」行を単一の税額列として扱う抽出では、従業員負担と事業主負担が混ざり合い、どちらの立場にとっても意味のない数字になってしまいます。
  • 課税対象額 ≠ 差引支給額。従業員の年間確定申告書に表示される金額(課税対象額)は、銀行口座に振り込まれる金額(差引支給額)とは異なります。課税対象額 = 総給与 − 控除対象社会保険料 + 非控除対象CSG(2.4%部分)+ CRDS(0.5%)。差引支給額 = 課税対象額 − 源泉徴収所得税 + 払い戻し金(交通費、食事券)。1つの「差引支給額」列を出力する汎用的な抽出では、法的に異なる2つの数値が混同されます。この区別は、DSN(名目社会データ申告)が課税対象額を使用する一方、従業員の銀行取引明細書には差引支給額が反映されるため、重要です。

これらは例外的なケースではありません。2018年1月以降、すべての企業で簡素化された給与明細書(bulletin de paie clarifié)形式が義務化されて以来、フランスの雇用主が発行するすべての給与明細書の標準的な構造です。この改革により、給与明細書は約50行から約20行へと短くなりましたが、抽出が容易になったわけではありません。社会保険料を5つの見出しにグループ化したことで、レイアウトは変更されましたが、給与計算ソフトウェアベンダー間で標準化されることはありませんでした。

R3243-1条が定める16の必須項目 — 各項目をスプレッドシートの列にマッピング

抽出用の列を設定する前に、法的なインベントリを把握する必要があります。R3243-1条には、すべての給与明細に必ず記載すべき項目が列挙されています。以下の各項目は、抽出ワークフローで定義する列名に対応します。

R3243-1 項目フィールド推奨列名DSN検証での役割
事業所名および住所Employer Name (Nom Employeur)SIRET登録と一致する必要あり
NAF/APEコード + SIRETSIRETDSNの事業所識別子(基本)
適用される協約(Convention collective)Convention Collective保険料率の決定に使用
従業員名および職位Employee Name (Nom Salarié)NIR(社会保障番号)と一致する必要あり
社会保障番号(NIR)NIRDSNの従業員ブロック識別子
等級(係数)Classification (Coefficient)基本給テーブルの決定に使用
支給期間および労働時間Pay Period (Periode), Hours Worked (Heures Travaillees)DSN:拠出金計算のための時間数
時間外労働時間 + 割増率Overtime Hours (Heures Sup), Overtime Rate (Taux Majore)時間外労働に対する税制優遇措置
総支給額(salaire brut)Salaire BrutすべてのDSN拠出金計算の基礎
10°給与付加手当の種類と金額Accessories (Accessoires Salaire)賞与、歩合、現物給与など
11°被雇用者負担の社会保険料(区分別)Cotisations SalarialesDSNの被雇用者拠出ブロック
12°事業主負担の社会保険料(区分別)Cotisations PatronalesDSNの事業主拠出ブロック
13°課税対象純額(net imposable)Net ImposableDGFiP(税務当局)への年次報告
14°差引支給額(net à payer)Net a PayerDSN最終調整の確認ポイント
15°源泉徴収(PAS)— 税率と金額PAS Rate (Taux PAS), PAS Amount (Montant PAS)DGFiPからの個別税率
16°支払日Payment Date (Date Paiement)DSN月次期間の参照

会計事務所が年間の給与を照合する場合、これら16項目は従業員50名で600行のデータ、つまり9,600のデータポイントを形成します。SIRETが1つでも一致しなかったり、Cotisations Salarialesの列が1つでもずれたりすると、何時間もの手作業による修正が必要になります。抽出ツールは、各フィールドを画面上の位置ではなく、その意味に基づいて取得する必要があります。

第R3243-4条により、以下の5項目の明示が禁止されています:ストライキ活動に関する記載、労働時間と組合代表時間の区別、従業員の切断する権利やその他の社会的権利の行使に関する言及。これらの禁止事項は直接抽出に影響しませんが、準拠した給与明細書では「Grève(ストライキ)」ではなく「Absence non rémunérée(無給欠勤)」のような中立的なラベルが使用されることを意味します。これにより、AIがPDF上で認識するテキスト文字列が変わります。

給与計算ソフトウェアの状況 — Silae、PayFit、ADPが構造的に異なるPDFを生成する理由

第R3243-1条は何を表示すべきかを定めていますが、レイアウト方法は定めていません。政府が定めたテンプレートは存在せず、フランスの給与計算ソフトウェア市場では5つのベンダーが支配的であり、それぞれ独自のPDFレンダリングエンジンを使用しています。

ソフトウェア市場での位置づけPDF出力形式抽出の課題
Silaeリーダー — フランス民間部門の給与計算の30%以上で公認会計士が使用コンパクトな2段組レイアウト、密集したグループ化社会保険料が1つのブロックに統合。CSGとCRDSは業界団体協約(convention collective)によって異なる行ラベルを共有
PayFit中小企業向けの最新SaaS、シングルカラムのレスポンシブデザインシングルカラム、広い間隔、Webフォントレンダリングネットソーシャル額がテンプレートツールが見逃すサイドバー列に配置。PAS行が別ページになる場合あり
Sage PaieSageエコシステム(Sage 50、Sage 100)の中小企業、小売・サービス業で強いセクションヘッダー付きのマルチセクション、従来の表形式レイアウト雇用主負担の社会保険料がメイン表の下のセクションに表示され、一部のOCRエンジンが「フッターコンテンツ」としてスキップ
ADP大企業および多国籍企業複数ページの詳細内訳、特定の制度向けの別紙付き課税対象純額と手取り額が異なるページに表示されることが多い。特定の従業員グループ(管理職 vs 非管理職)向けの補足ページ
Cegid RHミッドマーケット向け、完全なHRISを目指す標準化されたブロック、Cegid製品バージョン間で一貫性あり休暇残高表が本文とフッターセクションの間に挿入され、線形OCRが依存する垂直方向の流れを断ち切る

運用上の結果:10社のクライアントを持ち、それぞれが異なる給与計算プロバイダーを使用している(または同じプロバイダーでも異なる設定を使用している)会計事務所は、ソフトウェアごとに1つのテンプレートを作成しても、バージョンアップに耐えられるとは期待できません。Silae、PayFit、Sageはそれぞれ定期的にPDFレイアウトを変更します。テンプレートベースの抽出は機能しなくなります。AIが「Salaire Brut」をピクセル座標ではなくラベルの意味で探すセマンティック抽出は、機能し続けます。

これは、韓国の給与明細抽出を困難にしているのと同じ課題です。法律が内容を定めているにもかかわらず、Douzone、ECOUNT、PAYZONでそれぞれ表示形式が異なります。フランスの状況はさらに深刻で、DSN(月次電子申告)による検証レイヤーが追加されるため、抽出データは5つの政府機関に送信された月次電子申告と照合可能でなければなりません。

ステップバイステップ:フランスの給与明細データを検証可能なExcelファイルに抽出する

このワークフローは、単一の前提に基づいています。抽出は、列が作成された時点では完了しません。列がDSNと照合できるようになった時点で完了します。以下の手順は、Silae、PayFit、Sage、ADP、Cegidからエクスポートされた給与明細PDFがフォルダにあり、会計士が読み取るだけでなく検証できるようにスプレッドシートを構成する必要があることを前提としています。

JPG/PNG/PDF AI抽出

ファイルは安全に処理され、保存されることはありません。

1

給与明細ファイルをアップロード — デフォルトは一括処理

PDFをドラッグ&ドロップするだけ。従業員1名の12ヶ月分でも、全従業員50名分の月次明細でも対応。対応形式はPDF、JPG、PNG。会計事務所が年次給与レビューを行う場合、一般的なアップロード数は600ファイル(従業員50名×12ヶ月)。各ファイルは個別に処理されますが、1枚のスプレッドシートに明細ごとに1行で出力されます。

2

DSN構造に合わせた列を定義

対象のチェックリストに表示されている列名を入力します。DSN検証に最低限必要な列は次の通り:従業員名SIRET総賃金被雇用者負担社会保険料合計雇用主負担社会保険料合計控除対象CSG非控除対象CSGCRDS課税対象純額支払純額PAS税率PAS金額。この12列で、DSN月次ブロックとの照合に十分な情報が得られます。ツールは各列名を意味で認識するため、「総賃金」とあれば、Silaeが左上に配置してもPayFitが中央に配置しても、該当フィールドを自動で見つけ出します。

3

計算検証用の列を追加

CSGチェック(総賃金×98.25%×9.2%−抽出CSG)という列を作成します。これは計算列で、ツールが抽出時に計算を実行し、期待されるCSG額と抽出値の差を出力します。明細ごとの差が±1ユーロ以内なら、総賃金とCSGの抽出は正しい可能性が高いです。5ユーロを超える差は、抽出エラー、DSN入力エラー、または例外的なケース(免除、特定の協約適用など)を示します。計算列を追加することで、データ取得作業を、同じ工程でデータ検証作業に変えることができます。

4

エクスポートしてDSNと照合

Excel(XLSX)にエクスポートします。スプレッドシートには、給与明細ごとに1行のデータが、DSN構造に対応した列で出力されます。給与計算ソフトまたはNet-entreprises.frから月次DSNエクスポートをインポートします。照合ポイント:明細の総賃金はDSNの従業員ブロック総額と一致する必要があります。明細の課税対象純額はDSNの課税対象純額と一致する必要があります。PAS金額はDSNのPASブロックと一致する必要があります。CSGチェック列の差が1ユーロを超える行は、年次決算の認証前に手動調査が必要な候補です。

抽出から検証へ — CSG・CRDS・PAS率でDSNの不一致を捉える

抽出ステップでデータが得られ、検証ステップで確信が得られます。フランスの給与法、特にURSSAFが毎年公表するCSGとCRDSの率には、生の抽出を監査可能な出力に変換する組み込みのクロスチェック計算式が備わっています。

給与照合スプレッドシートに含めるべき3つの検証比率と、設定可能な計算列の式を以下に示します。

検証項目計算式許容誤差誤差が示すもの
CSG合計総支給額 × 98.25% × 9.2%±€1総支給額の抽出ミス、控除(exonération)未考慮、またはベース計算の誤り
CSG控除対象分割CSG合計 × (6.8/9.2)±€1CSG控除対象と非控除対象の誤分類 — 課税対象純額(Net Imposable)に直接影響
CRDS総支給額 × 98.25% × 0.5%±€0.50CRDS計算ミス、または類似名称の別の負担金項目を抽出した可能性

98.25%という係数は恣意的なものではなく、フランス法で定められたCSGの課税ベース(assiette CSG)であり、免除基準額未満の企業負担の補完的健康保険(mutuelle)と退職金制度(prévoyance)を除外するためのものです。総支給額(salaire brut)が€3,000の場合、CSGベースは€2,947.50、CSG 9.2%は€271.17となります。抽出されたCSGが€245だった場合、€26の差は何かが間違っていることを示します — 抽出された総支給額が誤っているか、従業員に特定の控除(exonération)があるか、DSNの入力が誤っている可能性があります。問題の内容がわかる前に、問題が存在することがわかるのです。これが抽出と検証の違いです。

これらの計算チェックは、会計士がフランスの請求書(factures)を抽出する際に行うこと、つまりTVA率を明細項目の合計と照合して、単なる総額ではなく正しい税区分が抽出されたことを確認することと、給与計算上で同等のものです。

会計事務所が実際に使うDSN・給与明細照合ワークフロー

抽出が完了し、検証用の列が整ったら、スプレッドシートは「最終回答」ではなく「作業用ドキュメント」になります。つまり、2つのデータソース(給与明細PDFとDSNエクスポート)を構造的に比較するためのものです。以下が、フランスの会計事務所が実際に従う照合ワークフローです。

1

給与ソフトからDSNデータをエクスポート

Silae、PayFit、Sage Paie、ADP、Cegidなど、フランスの法令準拠給与プラットフォームはすべてDSNデータ抽出に対応しています。この抽出データには、従業員・月ごとに、給与明細と同じ項目が含まれています。CSVでエクスポートし、抽出スプレッドシートと一緒に開いてください。

2

従業員のNIR+給与期間で行を一致させる

社会保障番号(NIR、Numéro d'Inscription au Répertoire)が一意のキーです。NIRと給与期間(période de paie)を使用して、各給与明細行を対応するDSN行に一致させます。特定の月に給与明細に対応するDSN行がない場合は、警告サインです。DSNが送信されていない(遅延1ヶ月につき拠出額の5%の罰金)か、給与明細が別の期間のものです。

3

1ユーロ超の差異にフラグを立てる

給与明細とDSN列の間で、総支給額(Salaire Brut)、社会保険料(従業員負担分、Cotisations Salariales)、課税対象額(Net Imposable)、手取り額(Net à Payer)を比較します。1ユーロを超える差異にはフラグを立ててください。CSGチェック計算列(絶対値の降順)でスプレッドシートを並べ替えます。上位の行が調査リストです。ほとんどの月でリストは空になります。その「静けさ」こそが目的です。差異リストが空であれば、会計士は給与照合を数時間ではなく数分で承認できます。

5年間の保存義務 — なぜPDFフォルダより構造化Excelが優れているのか

労働法典第L3243-4条により、事業主はすべての給与明細の写しを5年間保存しなければなりません。従業員50人の企業では、3,000枚のPDFになります。3,000枚のPDFフォルダには検索機能がまったくありません。一方、同じPDFから抽出した3,000行のExcelファイルは、日付、従業員、拠出グループで検索、並べ替え、監査、フィルタリングが可能です。

ここに、抽出が単なる照合を超えた目的を持つ理由があります。2022年の元従業員が年金確認(キャリア再構成)のために年間累計額を請求した場合、人事部門はPDFアーカイブを探し回る必要はありません。ExcelシートをNIRでフィルタリングし、2022年の年間合計が記載された12月の行を確認し、1分以内に回答できます。抽出スプレッドシートは、データ検索に実際に使用可能な形式で、構造化され、検索可能で、5年間の保存義務に準拠した、企業独自のデジタル給与明細台帳となります。

FAQ — フランス給与明細データ抽出

AI抽出は、旧詳細形式と2018年簡略化形式の両方に対応できますか?

はい。2018年1月に導入された明確化された給与明細形式では、拠出金を「健康」「労働災害」「退職」「家族」「失業」の5つのカテゴリに分類していますが、基礎となるフィールドラベル(総給与、課税対象純額、手取り額)は両形式で同じです。意味に基づいてフィールドラベルを読み取るセマンティック抽出ツールは、両方の形式で機能します。2018年以前の詳細形式(約50の個別拠出項目)は、実際にはより詳細なデータを抽出できます。簡素化改革は従業員にとっての視覚的な煩雑さを軽減しましたが、DSNがすでに送信しているデータポイントを削除したわけではありません。

ネットソーシャル額(montant net social)を含む給与明細でも抽出は機能しますか?

はい。2023年7月以降、フランスの給与明細にはネットソーシャル額(RSAや活動手当などの社会給付の受給資格を判断するための基準額)の表示が義務付けられています。この金額は、給与明細上では課税対象純額と手取り額の間に位置します。抽出ツールは、列を定義すれば、これを個別のフィールドとして取得できます。ネットソーシャル額はDSN検証には使用されません(別の行政目的があります)が、同じスプレッドシート行に取得しておくことで、将来の参照のためにすべての給与明細データを一箇所にまとめられます。

特定の月のみ — たとえば年間累計額を得るために12月の明細のみ — を抽出できますか?

はい。年間照合が目的であれば、年末の年間累計額(cumul annuel)が記載されている12月の給与明細のみで十分です。12月のファイルのみをアップロードし、累計フィールド(年間総給与、年間課税対象純額、年間労働時間、年間PAS)の列を定義してください。これにより、12ヶ月分のデータを処理することなく、従業員ごとに年間合計を1行で取得できます。

特定の従業員区分(幹部、VRP、見習い)の扱いは?

フランスの給与計算では、幹部(追加のAGIRC-ARRCOトランシェB拠出金、異なる prévoyance 率)、VRP(特定のURSSAFリスクコード511TG)、見習い(ほとんどの拠出金が免除)で異なる拠出制度があります。抽出対象が複数の従業員カテゴリにまたがる場合は、幹部固有のフィールド(例:Cadre Retraite Complementaire Tranche B)用に別の列を定義し、非幹部の従業員のセルは空白のままにしてください。抽出ツールは、給与明細に対応するフィールドが見つかった場合にのみセルに入力します。空白のセルはエラーではなく、その拠出カテゴリが存在しないことを正確に反映しています。

ネイティブPDFだけでなく、手書きやスキャンされた給与明細でも機能しますか?

はい — AIは埋め込まれたテキストレイヤーではなく、視覚的なレイアウトを読み取ります。スキャンされた給与明細(印刷・再デジタル化)、スマートフォンで撮影した写真、給与ポータルのJPEGスクリーンショットも、すべて同じセマンティック抽出パイプラインを通過します。印刷された明細への手書き注釈(管理者のメモなど)は視覚的なノイズになりますが、AIが印刷されたフィールドラベルを見つけるのを妨げるものではありません。ただし、劣化の激しいスキャン(折れ目、極端な傾き、水濡れ)は精度を低下させます。同じ原理は、あらゆる給与プロバイダーからの給与明細抽出にも当てはまります — 形式よりも可読性が重要です。

SilaeやPayFitから給与台帳をエクスポートするのと、抽出はどう違いますか?

SilaeやPayFitからの給与台帳エクスポートには、ソフトウェア内部のデータが含まれています。しかし、そのエクスポートはソフトウェアが計算した内容を反映しているに過ぎず、必ずしも従業員のPDF給与明細に物理的に表示されている内容と一致するとは限りません。これらは乖離する可能性があります:給与明細生成後に行われた手動調整、後月に適用された修正、または給与データベースとPDFアーカイブ間のバージョンの不一致などです。PDF給与明細から直接データを抽出することで、実際に従業員に交付された書類(第L3243-1条に基づく法的記録)を入手できます。ソフトウェアのエクスポートは計算であり、給与明細PDFは証拠です。給与台帳抽出についても、同じ検証ロジックが適用されます — 台帳は集計値であり、給与明細が証明です。

フランスの給与明細には、世界で最も厳格に規制された給与システムの一つによって義務付けられた30以上のデータ項目が含まれています。抽出によってデータを取得します。URSSAFの税率に基づいた計算検証列は、そのデータが正しいかどうかを教えてくれます。両方を同じワークフローに組み込むべきです。

ブルトン・ドゥ・ペで試す
📮 contact email: [email protected]