So extrahieren Sie französische Gehaltsdaten
in Excel
Wenn eine französische Wirtschaftsprüfungsgesellschaft (cabinet d'expertise comptable) die Lohnabrechnung eines neuen Mandanten übernimmt, ist das erste angeforderte Dokument nicht die Hauptbuchhaltung. Es sind 12 Monate Gehaltsabrechnungen (bulletins de paie) für jeden Mitarbeiter. Jedes PDF ist ein Spiegel der monatlichen DSN (Déclaration Sociale Nominative) – der einzigen elektronischen Meldung, die seit Januar 2017 gemäß Décret n°2016-611 an URSSAF, CNAV, CPAM und Pôle Emploi übermittelt wird. Stimmt das Bruttogehalt auf der Dezember-Abrechnung nicht mit dem DSN-Gesamtbetrag überein, muss die Abweichung gefunden und erklärt werden, bevor die Kanzlei die Bücher zertifizieren kann (arrêter les comptes). Der Engpass liegt nicht im Lesen der Gehaltsabrechnungen. Es sind die 3 Minuten pro Abrechnung, die manuell für die Eingabe von Bruttogehalt, abzugsfähigem CSG-Beitrag und Nettozahllast in eine Tabellenzeile aufgewendet werden – und das Ganze dann für 49 weitere Mitarbeiter über 12 Monate hinweg.
Wichtige Erkenntnisse
- Bei drei Minuten pro Gehaltsabrechnung verbringt ein Unternehmen mit 50 Mitarbeitern jährlich 30 Stunden damit, die sechzehn gesetzlich vorgeschriebenen Felder in Excel einzutippen – bevor überhaupt mit der Prüfung begonnen wird.
- 30 Stunden Tipparbeit, und der Buchhalter kann trotzdem nicht freigeben – denn der DSN-Abgleich erfordert, dass Bruttogehalt, abzugsfähiger CSG-Beitrag und Netto-Steuerpflicht in der PDF-Abrechnung und der elektronischen Meldung übereinstimmen, und ein falsch zugeordneter Beitrag bringt den gesamten Monat durcheinander.
- Eine berechnete Spalte – CSG-Prüfung = Brutto × 98,25 % × 9,2 % − extrahierte CSG – ermöglicht es ImageToTable.ai, Zeilen mit einer Abweichung von über ±1 € während der Extraktion zu markieren und so aus einer 600-Zeilen-Tabelle eine Liste mit drei zu untersuchenden Zeilen zu machen.
Warum der französische Bulletin de Paie zu den komplexesten Dokumenten Europas für die Datenextraktion zählt
Der französische Gehaltszettel ist nicht für Datenextraktionstools konzipiert, sondern für Compliance. Das französische Sozialsystem, finanziert durch eine der höchsten Arbeitgeber-Sozialbeitragsquoten Europas, verlangt, dass jeder Beitrags-Euro nachvollziehbar ist. Sechzehn Felder sind gemäß Artikel R3243-1 des Code du travail Pflicht. Fünf weitere Zeilen sind nach Artikel R3243-4 verboten – ein Arbeitgeber darf Streikstunden nicht als solche ausweisen, noch zwischen Arbeitsstunden und gewerkschaftlicher Freistellung unterscheiden. Ein nicht konformer Bulletin de Paie kann mit einer Geldstrafe von bis zu 450 € pro Dokument belegt werden.
Diese rechtliche Dichte erzeugt drei Extraktionshürden, die generische OCR-Tools – entwickelt für englischsprachige Gehaltsabrechnungen mit wenigen Abzugszeilen – nicht bewältigen können:
- Das Drei-Spalten-Layout. Ein französischer Bulletin de Paie gliedert sich in Kopf (Arbeitgeber- und Arbeitnehmerdaten – SIRET, NAF-Code, Convention collective), Hauptteil (Bruttogehalt → Beiträge → Netto) und Fuß (Jahressummen, Urlaubssalden, Nettosozialbetrag). Jeder Abschnitt verwendet unterschiedliche typografische Konventionen, und derselbe Feldname – „Total“ – erscheint im Hauptteil als Zwischensumme, im Fuß als Jahreskumul und im Kopf als Referenznummer. Eine koordinatenbasierte Vorlage, die „das zweite Total“ von oben nimmt, greift bei einem Silae-PDF eine andere Zahl als bei einem PayFit-PDF.
- Fünf Pflicht-Beitragsgruppen. Die Vereinfachungsreform von 2018 fasste die zuvor rund 50 Zeilen Sozialbeiträge in fünf Kategorien zusammen: Santé (Krankenversicherung), Accidents du travail (Arbeitsunfälle), Retraite (Rente – sécurité sociale plafonnée, sécurité sociale déplafonnée und complémentaire AGIRC-ARRCO), Famille (Familie) und Chômage (Arbeitslosigkeit). Jede Gruppe enthält jedoch weiterhin einen Arbeitnehmeranteil (part salariale) und einen Arbeitgeberanteil (part patronale), die in getrennten Spalten ausgewiesen werden. Die CSG (Contribution Sociale Généralisée) und CRDS (Contribution au Remboursement de la Dette Sociale) stehen in einem eigenen Abschnitt mit eigener Berechnungsgrundlage – 98,25 % des Bruttogehalts, nicht 100 %. Eine Extraktion, die alle „Cotisation“-Zeilen als eine einzige Steuerspalte behandelt, vermischt Arbeitnehmer- und Arbeitgeberbeiträge zu einer Zahl, die für keine der beiden Seiten aussagekräftig ist.
- Net imposable ≠ Net à payer. Der Betrag, der in der jährlichen Steuererklärung des Arbeitnehmers erscheint (Net imposable – steuerpflichtiges Netto), ist nicht der Betrag, der auf sein Bankkonto überwiesen wird (Net à payer – Nettogehalt). Net imposable = Bruttogehalt − abzugsfähige Sozialbeiträge + nicht abzugsfähige CSG (2,4 %-Anteil) + CRDS (0,5 %). Net à payer = Net imposable − an der Quelle einbehaltene Einkommensteuer (PAS) + Erstattungen (Fahrtkosten, Essensgutscheine). Eine generische Extraktion, die eine Spalte „Nettogehalt“ ausgibt, vermischt zwei rechtlich unterschiedliche Zahlen. Diese Unterscheidung ist wichtig, da die DSN das Net imposable verwendet, während der Kontoauszug des Arbeitnehmers das Net à payer zeigt.
Dies sind keine Randfälle. Es ist der Standardaufbau jedes Bulletin de Paie, der von einem französischen Arbeitgeber seit Januar 2018 ausgestellt wird, als das Format des Bulletin de Paie clarifié (vereinfachter Gehaltszettel) für alle Unternehmen verpflichtend wurde. Die Reform machte die Gehaltszettel kürzer – von rund 50 auf rund 20 Zeilen – aber nicht einfacher zu extrahieren. Die Zusammenfassung der Beiträge unter fünf Überschriften ordnete das Layout neu, ohne es über die verschiedenen Lohnabrechnungssoftware-Anbieter hinweg zu standardisieren.
Die 16 Pflichtfelder nach Artikel R3243-1 – Zuordnung zu Ihren Spalten in der Tabelle
Bevor Sie Extraktionsspalten anlegen, benötigen Sie die rechtliche Grundlage. Artikel R3243-1 listet genau auf, was auf jedem Bulletin de paie stehen muss. Jeder Punkt unten entspricht einem Spaltennamen, den Sie in Ihrem Extraktions-Workflow definieren:
| Punkt R3243-1 | Feld | Empfohlener Spaltenname | Rolle bei der DSN-Prüfung |
|---|---|---|---|
| 1° | Name und Anschrift des Arbeitgebers | Employer Name (Nom Employeur) | Muss mit SIRET-Register übereinstimmen |
| 2° | NAF/APE-Code + SIRET | SIRET | Primäre Arbeitgeberkennung in der DSN |
| 3° | Convention collective (Tarifvertrag) | Convention Collective | Bestimmt Beitragssätze |
| 4° | Name und Position des Arbeitnehmers | Employee Name (Nom Salarié) | Muss mit NIR (Sozialversicherungsnummer) übereinstimmen |
| 5° | Sozialversicherungsnummer (NIR) | NIR | DSN-Mitarbeiterblock-Kennung |
| 6° | Einstufung (Koeffizient) | Classification (Coefficient) | Bestimmt Gehaltsraster |
| 7° | Abrechnungszeitraum und geleistete Stunden | Pay Period (Periode), Hours Worked (Heures Travaillees) | DSN: heures für Beitragsberechnung |
| 8° | Überstunden + Zuschlagssätze | Overtime Hours (Heures Sup), Overtime Rate (Taux Majore) | Steuerbefreiung auf Überstunden |
| 9° | Bruttogehalt (salaire brut) | Salaire Brut | Grundlage aller DSN-Beitragsberechnungen |
| 10° | Art und Höhe der Gehaltsnebenleistungen | Accessories (Accessoires Salaire) | Boni, Provisionen, Sachleistungen |
| 11° | Arbeitnehmerbeiträge nach Gruppe | Cotisations Salariales | DSN-Arbeitnehmerbeitragsblock |
| 12° | Arbeitgeberbeiträge nach Gruppe | Cotisations Patronales | DSN-Arbeitgeberbeitragsblock |
| 13° | Net imposable (steuerpflichtiges Netto) | Net Imposable | Jährliche Meldung an DGFiP (Steuerbehörde) |
| 14° | Net à payer (Auszahlungsbetrag) | Net a Payer | Abschließender DSN-Abgleich |
| 15° | Prélèvement à la source (PAS) – Satz und Betrag | PAS Rate (Taux PAS), PAS Amount (Montant PAS) | Individualisierter Satz von DGFiP |
| 16° | Zahlungsdatum | Payment Date (Date Paiement) | DSN-Referenzmonat |
Für eine Buchhaltungskanzlei, die die Jahresabrechnung abstimmt, ergeben diese 16 Felder bei 50 Mitarbeitern 600 Datenzeilen – 9.600 Datenpunkte. Ein einziger falscher SIRET oder eine falsch ausgerichtete Spalte Cotisations Salariales führt zu stundenlanger manueller Korrektur. Das Extraktionstool muss jedes Feld nach seiner Bedeutung erfassen, nicht nach seiner Position auf der Seite.
Fünf zusätzliche Felder sind gemäß Artikel R3243-4 ausdrücklich verboten: jegliche Erwähnung von Streikaktivitäten, jede Unterscheidung zwischen Arbeitsstunden und Freistellungsstunden für Betriebsratsmitglieder sowie jeder Hinweis auf das Recht des Arbeitnehmers auf Nichterreichbarkeit oder die Ausübung anderer sozialer Rechte. Diese Verbote betreffen die Extraktion nicht direkt, bedeuten aber, dass ein konformer Bulletin de Paie neutrale Bezeichnungen wie „Absence non rémunérée“ (unbezahlte Abwesenheit) statt „Grève“ (Streik) verwendet – was den Textstring ändert, den die KI auf dem PDF sieht.
Die Gehaltsabrechnungs-Softwarelandschaft – Warum Silae, PayFit und ADP strukturell unterschiedliche PDFs erzeugen
Artikel R3243-1 schreibt vor, was erscheinen muss, nicht wie es angeordnet wird. Es gibt keine staatlich vorgeschriebene Vorlage – und fünf Anbieter dominieren den französischen Markt für Gehaltsabrechnungssoftware, jeder mit eigener PDF-Rendering-Engine.
| Software | Marktposition | PDF-Exportformat | Extraktionsherausforderung |
|---|---|---|---|
| Silae | Marktführer – von Wirtschaftsprüfern für über 30 % der französischen Privatwirtschaftsgehälter genutzt | Kompaktes 2-Spalten-Layout, dichte Gruppierung | Sozialbeiträge in einem Block zusammengefasst; CSG und CRDS teilen sich eine Zeilenbezeichnung, die je nach Tarifvertrag (convention collective) variiert |
| PayFit | Modernes SaaS für KMU, responsives Einspaltendesign | Einspaltig, breite Abstände, Webfont-Rendering | Netto-Sozialbetrag in einer Seitenleiste positioniert, die Vorlagen-Tools übersehen; PAS-Zeile manchmal auf separater Seite |
| Sage Paie | KMU im Sage-Ökosystem (Sage 50, Sage 100), stark in Einzelhandel und Dienstleistungen | Mehrere Abschnitte mit Überschriften, konventionelles tabellarisches Layout | Arbeitgeberbeiträge unterhalb der Haupttabelle in einem Abschnitt, den einige OCR-Engines als „Fußzeileninhalt“ überspringen |
| ADP | Großunternehmen und multinationale Konzerne | Mehrseitige detaillierte Aufschlüsselung, separate Anhänge für bestimmte Regelungen | Netto-Steuerbetrag und Nettogehalt erscheinen oft auf verschiedenen Seiten; Zusatzseiten für bestimmte Mitarbeitergruppen (Führungskräfte vs. Nicht-Führungskräfte) |
| Cegid RH | Mittelstand mit vollständigem HRIS-Anspruch | Standardisierte Blöcke, konsistent über Cegid-Produktversionen hinweg | Urlaubssalden-Tabellen zwischen Hauptteil und Fußzeile eingefügt, unterbrechen den vertikalen Fluss, auf den lineare OCR angewiesen ist |
Die betriebliche Konsequenz: Eine Wirtschaftsprüfungsgesellschaft, die 10 Kunden mit jeweils unterschiedlichem Gehaltsabrechnungsanbieter – oder dem gleichen Anbieter mit unterschiedlicher Konfiguration – betreut, kann nicht eine Vorlage pro Software erstellen und erwarten, dass diese ein Versionsupdate übersteht. Silae, PayFit und Sage ändern ihr PDF-Layout regelmäßig. Die vorlagenbasierte Extraktion bricht ab. Die semantische Extraktion – bei der die KI nach „Salaire Brut“ sucht, basierend auf der Bedeutung der Bezeichnung, nicht auf Pixelkoordinaten – tut dies nicht.
Dies ist die gleiche Herausforderung, die die Extraktion koreanischer Gehaltsabrechnungen erschwert: Das Gesetz gibt den Inhalt vor, aber Douzone, ECOUNT und PAYZON stellen ihn jeweils anders dar. Die Situation in Frankreich ist noch akuter, da die DSN eine zusätzliche Prüfebene hinzufügt – die extrahierten Daten müssen mit einer monatlichen elektronischen Meldung übereinstimmen, die an fünf Behörden übermittelt wurde.
Schritt für Schritt: Französische Gehaltsabrechnungsdaten in eine prüfbare Excel-Datei extrahieren
Dieser Workflow basiert auf einer einzigen Prämisse: Die Extraktion ist nicht abgeschlossen, wenn Sie Spalten haben. Sie ist abgeschlossen, wenn die Spalten gegen die DSN geprüft werden können. Die folgenden Schritte gehen davon aus, dass Sie einen Ordner mit Bulletin de Paie-PDFs haben – egal ob aus Silae, PayFit, Sage, ADP oder Cegid exportiert – und Ihre Tabelle so strukturiert sein muss, dass ein Comptable (Buchhalter) sie prüfen kann, nicht nur lesen.
Dateien werden sicher verarbeitet und nicht gespeichert.
Bulletins de Paie hochladen – Stapelverarbeitung ist Standard
Ziehen Sie alle PDFs per Drag & Drop – ob 12 Monatsbulletins für einen Mitarbeiter oder 50 Monatsbulletins für die gesamte Belegschaft. Das Tool akzeptiert PDF, JPG und PNG. Für eine Wirtschaftsprüfungskanzlei, die eine jährliche Lohnabrechnung durchführt, sind 600 Dateien typisch (50 Mitarbeiter × 12 Monate). Jede Datei wird einzeln verarbeitet, aber in eine einzige Tabelle exportiert – eine Zeile pro Bulletin.
Spalten definieren, die der DSN-Struktur entsprechen
Geben Sie die Spaltennamen ein, wie sie in Ihrer Ziel-Checkliste erscheinen. Für die DSN-Überprüfung sind mindestens erforderlich: Mitarbeitername, SIRET, Salaire Brut, Cotisations Salariales Total, Cotisations Patronales Total, CSG Déductible, CSG Non Déductible, CRDS, Net Imposable, Net à Payer, PAS-Satz, PAS-Betrag. Diese zwölf Spalten liefern genug Signale, um jeden monatlichen DSN-Block zu überprüfen. Das Tool liest jeden Spaltennamen semantisch – „Salaire Brut“ findet das Bruttogehalt, egal ob Silae es oben links oder PayFit zentriert platziert hat.
Berechnete Prüfspalte hinzufügen
Erstellen Sie eine Spalte namens CSG-Prüfung (Brutto × 98,25 % × 9,2 % − extrahierte CSG). Dies ist eine berechnete Spalte – das Tool führt die Berechnung während der Extraktion durch und gibt die Differenz zwischen dem erwarteten CSG-Betrag und dem extrahierten Wert aus. Ein Ergebnis innerhalb von ±1 € pro Bulletin zeigt an, dass sowohl die Brutto- als auch die CSG-Extraktion wahrscheinlich korrekt sind. Ein Ergebnis über 5 € deutet auf einen Extraktionsfehler, einen DSN-Eingabefehler oder einen Sonderfall hin (Befreiung, spezifische Tarifvertragsanpassung). Berechnete Spalten verwandeln die Extraktion von einer Datenerfassungs- in eine Datenprüfungsaufgabe im selben Durchgang.
Exportieren und mit der DSN abgleichen
Exportieren Sie nach Excel (XLSX). Die Tabelle enthält nun eine Zeile pro Bulletin de Paie mit Spalten, die der DSN-Struktur entsprechen. Importieren Sie den monatlichen DSN-Export aus der Lohnsoftware oder von Net-entreprises.fr. Quervergleich: Salaire Brut im Bulletin muss mit dem Bruttogehalt des DSN-Mitarbeiterblocks übereinstimmen; Net Imposable im Bulletin muss mit dem DSN-Nettofiskalwert übereinstimmen; PAS-Betrag muss mit dem DSN-PAS-Block übereinstimmen. Jede Zeile, in der die CSG-Prüfspalte um mehr als 1 € abweicht, ist Ihre Liste für manuelle Prüfungen – vor der Zertifizierung des Jahresabschlusses.
Vom Extrakt zur Prüfung – Mit CSG-, CRDS- und PAS-Quoten DSN-Diskrepanzen aufdecken
Der Extraktionsschritt liefert Daten. Der Prüfschritt liefert Sicherheit. Das französische Lohnsteuerrecht – insbesondere die von der URSSAF jährlich veröffentlichten CSG- und CRDS-Sätze – bietet eingebaute Quervergleichsformeln, die aus rohen Extraktionen prüfbare Ergebnisse machen.
Hier sind die drei Prüfquoten, die jede Lohnabstimmungstabelle enthalten sollte, mit der berechneten Spaltenformel, die Sie konfigurieren können:
| Prüfung | Formel | Akzeptable Abweichung | Bedeutung einer Abweichung |
|---|---|---|---|
| CSG gesamt | Brutto × 98,25 % × 9,2 % | ±1 € | Brutto-Extraktionsfehler, nicht berücksichtigte Befreiung oder falsche Basisberechnung |
| CSG abzugsfähig Aufteilung | CSG Gesamt × (6,8/9,2) | ±1 € | Fehlklassifizierung von abzugsfähiger vs. nicht abzugsfähiger CSG – wirkt sich direkt auf das Netto steuerpflichtig aus |
| CRDS | Brutto × 98,25 % × 0,5 % | ±0,50 € | CRDS-Fehlberechnung oder Extraktion hat eine andere, ähnlich bezeichnete Beitragszeile erfasst |
Der Faktor 98,25 % ist nicht willkürlich – es ist die CSG-Bemessungsgrundlage (assiette CSG), die gesetzlich festgelegt ist, um Arbeitgeberbeiträge zur betrieblichen Krankenversicherung (mutuelle) und Altersvorsorge (prévoyance) auszuschließen, die unter der Freigrenze liegen. Bei einem Bruttogehalt von 3.000 € beträgt die CSG-Basis 2.947,50 €. CSG bei 9,2 % = 271,17 €. Wenn die extrahierte CSG 245 € beträgt, zeigt die Abweichung von 26 €, dass etwas nicht stimmt – entweder das extrahierte Brutto ist falsch, der Arbeitnehmer hat eine spezifische Befreiung oder der DSN-Eintrag wurde falsch berechnet. Sie wissen dass ein Problem besteht, bevor Sie wissen was das Problem ist. Das ist der Unterschied zwischen Extraktion und Prüfung.
Diese berechneten Prüfungen sind das Lohnabrechnungsäquivalent zu dem, was Buchhalter tun, wenn sie französische Rechnungen (factures) extrahieren: die Mehrwertsteuersätze mit den Positionssummen abgleichen, um zu bestätigen, dass die Extraktion die korrekte Steueraufteilung erfasst hat, nicht nur eine pauschale Summe.
Der DSN-Gehaltsabrechnungs-Workflow, den Steuerberater tatsächlich nutzen
Nach der Extraktion und dem Einfügen der Prüfspalten wird die Tabelle zu einem Arbeitsdokument – keine endgültige Antwort, sondern ein strukturierter Vergleich zwischen zwei Datenquellen (Bulletin de Paie PDF und DSN-Export). So läuft der Abgleich in französischen Steuerberatungskanzleien ab:
DSN-Daten aus der Lohnsoftware exportieren
Jede konforme französische Lohnplattform – Silae, PayFit, Sage Paie, ADP, Cegid – kann einen DSN-Datenextrakt exportieren. Dieser Extrakt enthält pro Mitarbeiter und Monat dieselben Felder wie das Bulletin de Paie. Exportieren Sie ihn als CSV und öffnen Sie ihn parallel zu Ihrer Extraktionstabelle.
Zeilen nach NIR + Abrechnungszeitraum abgleichen
Die Sozialversicherungsnummer (NIR, Numéro d'Inscription au Répertoire) ist der eindeutige Schlüssel. Gleichen Sie jede Zeile des Bulletin de Paie mit der entsprechenden DSN-Zeile ab, und zwar anhand von NIR und Abrechnungszeitraum (période de paie). Fehlt zu einem Bulletin für einen Monat die passende DSN-Zeile, ist das ein Alarmzeichen – entweder wurde die DSN nicht übermittelt (Strafe: 5 % der fälligen Beiträge pro Monat Verzug) oder das Bulletin stammt aus einem anderen Zeitraum.
Abweichungen über 1 € markieren
Vergleichen Sie Salaire Brut, Cotisations Salariales, Net Imposable und Net à Payer zwischen den Spalten des Bulletins und der DSN. Markieren Sie jede Abweichung über 1 €. Sortieren Sie die Tabelle nach der berechneten Spalte „CSG-Prüfung“ (absteigend nach absoluter Differenz). Die obersten Zeilen sind Ihre Prüfliste. In den meisten Monaten ist die Liste leer – und genau diese Stille ist der Zweck. Eine leere Abweichungsliste bedeutet, dass der Steuerberater den Lohnabgleich in Minuten statt Stunden abzeichnen kann.
Die fünfjährige Aufbewahrungspflicht – und warum eine strukturierte Excel-Tabelle besser ist als ein PDF-Ordner
Gemäß Artikel L3243-4 des Code du travail muss der Arbeitgeber eine Kopie jeder Gehaltsabrechnung fünf Jahre lang aufbewahren. Bei einem Unternehmen mit 50 Mitarbeitern sind das 3.000 PDFs. Ein Ordner mit 3.000 PDFs ist nicht durchsuchbar. Eine Excel-Datei mit 3.000 Zeilen – extrahiert aus denselben PDFs – ist durchsuchbar, sortierbar, prüfbar und filterbar nach Datum, Mitarbeiter oder Beitragsgruppe.
Hier zeigt die Extraktion ihren Nutzen über den reinen Abgleich hinaus. Wenn ein ehemaliger Mitarbeiter aus dem Jahr 2022 seinen Jahresbruttobetrag für die Rentenüberprüfung (Reconstitution de carrière) anfordert, durchsucht die Personalabteilung nicht ein PDF-Archiv. Sie filtert die Excel-Tabelle nach der NIR, prüft die Dezember-Zeile auf die Jahressummen 2022 und antwortet in unter einer Minute. Die Extraktionstabelle wird zum eigenen digitalen Gehaltsregister des Unternehmens – strukturiert, durchsuchbar und konform mit der fünfjährigen Aufbewahrungspflicht in einem Format, das für den Datenabruf tatsächlich nutzbar ist.
FAQ – Extraktion französischer Gehaltsabrechnungen
Kann die KI-Extraktion sowohl das alte detaillierte Format als auch das vereinfachte Format von 2018 verarbeiten?
Ja. Das im Januar 2018 eingeführte Format „Bulletin de paie clarifié“ fasst Beiträge in fünf Kategorien zusammen – Santé, Accidents du travail, Retraite, Famille, Chômage – aber die zugrunde liegenden Feldbezeichnungen (Salaire Brut, Net Imposable, Net à Payer) sind in beiden Formaten gleich. Ein semantisches Extraktionstool, das Feldbezeichnungen nach Bedeutung und nicht nach Position liest, funktioniert mit beiden Formaten. Das detaillierte Format vor 2018 mit etwa 50 einzelnen Beitragszeilen liefert sogar noch granularere Daten für die Extraktion – die Vereinfachungsreform reduzierte die visuelle Unübersichtlichkeit für Arbeitnehmer, entfernte aber keine Datenpunkte, die die DSN bereits übermittelt.
Funktioniert die Extraktion auch mit Gehaltsabrechnungen, die den Netto-Sozialbetrag (Montant net social) enthalten?
Ja. Seit Juli 2023 müssen französische Gehaltsabrechnungen einen Netto-Sozialbetrag ausweisen – die Referenzgröße zur Bestimmung der Anspruchsberechtigung für Sozialleistungen wie RSA (Revenu de Solidarité Active) und Prime d'activité. Dieser Betrag steht auf der Abrechnung zwischen Net imposable und Net à payer. Das Extraktionstool erfasst ihn als separates Feld, wenn Sie eine Spalte dafür definieren. Der Netto-Sozialbetrag wird nicht für die DSN-Überprüfung verwendet – er dient einem separaten Verwaltungszweck – aber die Erfassung in derselben Tabellenzeile hält alle Gehaltsdaten für zukünftige Referenzen an einem Ort.
Kann ich nur bestimmte Monate extrahieren – zum Beispiel nur die Dezember-Abrechnungen für die Jahressummen?
Ja. Wenn Ihr Ziel der jährliche Abgleich ist, benötigen Sie nur die Dezember-Gehaltsabrechnung – die alle Jahressummen (Cumul annuel) am Ende auflistet. Laden Sie nur die Dezember-Dateien hoch und definieren Sie Spalten für die Summenfelder: Cumul Brut, Cumul Net Imposable, Cumul Heures, Cumul PAS. So erhalten Sie die Gesamtjahreswerte in einer Zeile pro Mitarbeiter, ohne 12 Monatsdaten verarbeiten zu müssen.
Was ist mit speziellen Arbeitnehmerregelungen — Cadres (Führungskräfte), VRP (Handelsvertreter) oder Apprentis (Auszubildende)?
Die französische Lohnabrechnung kennt unterschiedliche Beitragsregelungen für Cadres (zusätzliche AGIRC-ARRCO Tranche B-Beiträge, abweichende Prévoyance-Sätze), VRP (spezifische URSSAF-Risikokennzahl 511TG) und Apprentis (Befreiungen von den meisten Beiträgen). Wenn Ihre Extraktion mehrere Mitarbeiterkategorien umfasst, definieren Sie separate Spalten für Cadre-spezifische Felder — z. B. Cadre Retraite Complementaire Tranche B — und lassen Sie diese Zellen für Nicht-Cadre-Mitarbeiter leer. Das Extraktionstool füllt eine Zelle nur dann, wenn es das entsprechende Feld auf der Abrechnung findet. Leere Zellen sind keine Fehler; sie spiegeln korrekt das Fehlen dieser Beitragskategorie wider.
Funktioniert das auch mit handschriftlichen oder gescannten Gehaltsabrechnungen — nicht nur mit nativen PDFs?
Ja — die KI liest das visuelle Layout, nicht eingebettete Textebenen. Ein gescannter Bulletin de Paie (ausgedruckt und erneut digitalisiert), ein mit dem Smartphone aufgenommenes Foto oder ein JPEG-Screenshot eines Lohnportals durchlaufen alle dieselbe semantische Extraktionspipeline. Handschriftliche Anmerkungen auf einem gedruckten Bulletin — z. B. eine Notiz des Vorgesetzten — fügen visuelles Rauschen hinzu, hindern die KI jedoch nicht daran, die gedruckten Feldbezeichnungen zu finden. Stark beeinträchtigte Scans (zerknittertes Papier, extreme Schräglage, Wasserschäden) verringern jedoch die Genauigkeit. Das gleiche Prinzip gilt für die Gehaltsabrechnungsextraktion von jedem Lohnabrechnungsanbieter — das Format ist weniger wichtig als die Lesbarkeit.
Wie verhält sich die Extraktion im Vergleich zum Export eines Lohnregisters direkt aus Silae oder PayFit?
Ein Lohnregisterexport aus Silae oder PayFit enthält die Daten innerhalb der Software. Aber dieser Export gibt wieder, was die Software berechnet hat — nicht unbedingt, was die PDF-Abrechnung des Mitarbeiters physisch zeigt. Diese können voneinander abweichen: eine manuelle Anpassung nach Erstellung der Abrechnung, eine Korrektur in einem Folgemonat oder eine Versionsdiskrepanz zwischen der Lohnbuchhaltungsdatenbank und dem PDF-Archiv. Die direkte Datenextraktion aus den PDF-Gehaltsabrechnungen liefert Ihnen das Dokument, das tatsächlich an den Mitarbeiter ausgehändigt wurde — und das ist der rechtliche Nachweis gemäß Artikel L3243-1. Der Softwareexport ist die Berechnung; die PDF-Abrechnung ist der Beleg. Für die Lohnregisterextraktion gilt dieselbe Verifizierungslogik — das Register ist die Zusammenfassung, die Abrechnungen sind der Beweis.
Eine französische Gehaltsabrechnung enthält über 30 Datenpunkte, die von einem der am strengsten regulierten Lohnabrechnungssysteme der Welt vorgeschrieben sind. Die Extraktion liefert die Daten. Berechnete Prüfspalten – verankert an den URSSAF-Sätzen – sagen Ihnen, ob sie stimmen. Beides gehört in denselben Workflow.
Jetzt an einer Gehaltsabrechnung testen