So extrahieren Sie brasilianische Gehaltsabrechnungsdaten
in Excel – mit INSS und IRRF
Artikel 464 der brasilianischen CLT (Consolidação das Leis do Trabalho) schreibt vor, dass jeder Arbeitgeber seinen Mitarbeitern eine detaillierte Gehaltsabrechnung zur Verfügung stellen muss – und bis 2025 muss dieses Dokument vier separate Abzüge (INSS, IRRF, FGTS und optionale Beiträge wie Vale-Transporte oder Gewerkschaftsbeiträge) ausweisen, die auf drei progressive Steuerklassen verteilt sind, die jährlich wechseln. Dennoch ist das gängigste Werkzeug, mit dem HR-Teams diese Daten über Monate und Mitarbeiter hinweg analysieren oder konsolidieren, immer noch die manuelle Excel-Eingabe – eine Gehaltsabrechnung (Holerite/Contracheque) nach der anderen.
Wichtige Erkenntnisse
- 1.200 Holerites manuell in Excel zu übertragen bedeutet 40 nicht abrechenbare Stunden pro Monat – und die eine falsche Ziffer wirkt sich gleichzeitig auf die INSS-Haftung, den IRRF-Einbehalt und die FGTS-Rückstellung aus.
- Eine einzige falsche Steuerklasse führt gemäß CLT Artikel 467 zur Verdopplung des zu wenig gezahlten Betrags bei Beendigung des Arbeitsverhältnisses – und eine OCR-Vorlage kann dies nicht erkennen, da sie versagt, sobald Ihr Gehaltsabrechnungsanbieter das Layout ändert.
- ImageToTable.ai findet „Salário Bruto" und „Desconto INSS", indem es die Bedeutung der Bezeichnung versteht – sodass Sie aufhören, Zahlen abzutippen, und stattdessen die Gehaltsabrechnung mit der progressiven Steuertabelle der Receita Federal abgleichen.
Warum brasilianische Gehaltsabrechnungen schwerer zu automatisieren sind, als sie aussehen
Die Schwierigkeit liegt nicht in der Anzahl der Zahlen auf dem Blatt – sondern darin, dass jede Gehaltsabrechnung (holerite/contracheque) eine Kette abhängiger Berechnungen enthält, bei der ein falsch gelesener Wert gleichzeitig die INSS-Beitragspflicht, den IRRF-Einbehalt und die FGTS-Rückstellung beeinflusst.
Die meisten Lohnabrechnungsprogramme in Brasilien – TOTVS, ADP Brazil, Senior Sistemas, SAP SuccessFactors – exportieren perfekt strukturierte holerite-PDFs. Sobald diese PDFs jedoch das Lohnsystem verlassen, werden sie träge. Ein HR-Manager, der wissen muss: "Wie hoch war der durchschnittliche INSS-Abzug aller Mitarbeiter im Büro São Paulo im letzten Quartal?", hat keinen maschinenlesbaren Weg zu dieser Antwort. Die Daten sind auf jeder einzelnen Gehaltsabrechnung vorhanden, aber sie sind in einem PDF-Layout eingeschlossen, das je nach Arbeitgeber, Lohnabrechnungsanbieter und sogar von Monat zu Monat für denselben Mitarbeiter variiert, sobald neue Abzugskategorien auftauchen (13. Gehalt, Urlaubsgeld, Überstunden, PLR-Gewinnbeteiligung).
Was dies schlimmer macht als die generische Dokumentenextraktion, ist, dass brasilianische Gehaltsabrechnungen Abzüge enthalten, die durch progressive Tabellen geregelt sind, die sich jährlich ändern. Der INSS-Beitragssatz (previdência social) verwendet vier progressive Stufen: 7,5 % bis R$ 1.518,00, 9 % von R$ 1.518,01 bis R$ 2.793,88, 12 % von R$ 2.793,89 bis R$ 4.190,83 und 14 % von R$ 4.190,84 bis zur INSS-Beitragsbemessungsgrenze (teto) von R$ 8.157,41. Der IRRF-Einkommensteuereinbehalt (imposto de renda retido na fonte) umfasst fünf Stufen – von steuerfrei (isento) bis R$ 2.428,80 bis zu 27,5 % über R$ 4.664,68, mit einem monatlichen Pauschalabzug für Angehörige von R$ 189,59 – geregelt durch die IRRF-Tabelle 2025 der Receita Federal gemäß Lei nº 15.191/2025. Hinzu kommt die FGTS-Einlage (Fundo de Garantia do Tempo de Serviço) – 8 % des Bruttogehalts, vom Arbeitgeber zu zahlen gemäß Lei nº 8.036/1990 – die auf dem holerite erscheint, obwohl der Arbeitnehmer sie nie direkt erhält.
Wenn sich diese Sätze ändern – wie zwischen Januar-April und Mai 2025, als die IRRF-Freigrenze von R$ 2.259,20 auf R$ 2.428,80 stieg – wird eine manuell gepflegte Excel-Vorlage mit fest codierten Formeln sofort veraltet. Das Problem ist nicht das Extrahieren von Zahlen. Es ist das Extrahieren der richtigen Zahlen unter den richtigen Regeln für den richtigen Zeitraum.
Schritt für Schritt — Lohnabrechnungsdaten (Holerite/Contracheque) in Excel extrahieren
Im Gegensatz zu vorlagenbasierten OCR-Tools, bei denen Sie jedes Feld auf einer Lohnabrechnung manuell mit einem Rahmen versehen müssen — und die bei einer neuen Abzugszeile oder einer geänderten Anordnung zwischen Abrechnungszeiträumen sofort versagen — funktioniert die Extraktion benutzerdefinierter Spalten anders: Sie geben die gewünschten Feldnamen ein (z. B. „INSS-Beitrag", „einbehaltene IRRF", „Nettogehalt") und die KI findet jeden Wert auf der Seite, indem sie die Bedeutung der Bezeichnung versteht, nicht deren Position im Layout.
Dateien werden sicher verarbeitet und nicht gespeichert.
INSS und IRRF prüfen – Stimmen die Zahlen?
Wer Gehaltsdaten nicht mehr manuell erfasst, merkt auch nicht mehr, wenn die Lohnsoftware einen Fehler gemacht hat – und Lohnfehler in Brasilien, insbesondere bei falschen INSS- oder IRRF-Abführungen, schaffen Haftungsrisiken für Arbeitgeber und Arbeitnehmer.
Deshalb ist die Extraktion allein nicht das Ziel. Die Extraktion liefert die Daten in Excel. Die Prüfung gibt Ihnen Sicherheit. Und der schnellste Weg zur Prüfung ist der Abgleich der extrahierten INSS- und IRRF-Werte mit den offiziellen Progressivtabellen.
Hier ist die Referenztabelle, die Sie für jede brasilianische Gehaltsabrechnung benötigen. Vergleichen Sie das Bruttogehalt (salário bruto) aus dem Holerite mit der jeweiligen Stufe und prüfen Sie, ob der Abzug der Formel entspricht:
| INSS-Stufe (Faixa) | Satz (Alíquota) | Monatliche Gehaltsspanne (Salário de Contribuição) |
|---|---|---|
| 1ª faixa | 7,5 % | Bis R$ 1.518,00 |
| 2ª faixa | 9 % | R$ 1.518,01 bis R$ 2.793,88 |
| 3ª faixa | 12 % | R$ 2.793,89 bis R$ 4.190,83 |
| 4ª faixa | 14 % | R$ 4.190,84 bis R$ 8.157,41 (Höchstgrenze) |
Der INSS wird progressiv berechnet – jede Stufe wird nur auf den innerhalb dieser Stufe liegenden Gehaltsanteil angewandt, dann werden die Beträge summiert. Die Höchstgrenze (teto) beträgt 2025 R$ 8.157,41.
| IRRF-Monatstabelle (ab Mai 2025) | Satz | Abzug (Parcela a Deduzir) |
|---|---|---|
| Bis R$2.428,80 | Befreit (Isento) | — |
| R$2.428,81 bis R$2.826,65 | 7,5% | R$182,16 |
| R$2.826,66 bis R$3.751,05 | 15% | R$394,16 |
| R$3.751,06 bis R$4.664,68 | 22,5% | R$675,49 |
| Über R$4.664,68 | 27,5% | R$908,73 |
Quelle: Receita Federal — Tabelas IRPF 2025, Lei nº 15.191/2025. Abzug pro Angehörigen: R$189,59/Monat.
Sobald die Holerite-Daten in Ihrer Excel-Tabelle sind, fügen Sie neben dem extrahierten INSS-Wert eine Prüfspalte mit einer SVERWEIS-Formel auf diese Tabellenstufen ein. Weicht der ermittelte Wert vom erwarteten ab, haben Sie entweder einen Konfigurationsfehler in der Lohnsoftware oder ein Extraktionsproblem entdeckt – und in beiden Fällen wurde es abgefangen, bevor es Ihr Buchhaltungssystem oder den Mitarbeiter erreicht.
Lohnfehler in Brasilien haben schwerwiegende Folgen. Gemäß CLT Artikel 467 berechtigt eine Unterzahlung des Lohns – einschließlich falscher Abzugsberechnungen – den Arbeitnehmer bei nicht fristgerechter Korrektur zum doppelten Nachzahlungsbetrag. Eine einzige falsche Stufenzuordnung über ein Jahr monatlicher Gehaltsabrechnungen kann sich zu einer erheblichen Verbindlichkeit aufsummieren, die bei einer Arbeitsinspektion (fiscalização trabalhista) oder einer Abfindungsabrechnung ans Licht kommt.
Stapelverarbeitung – Wenn Sie 100 Holerites von 12 Unternehmen haben
Der Einzelabrechnungs-Workflow beantwortet die Frage eines einzelnen Mitarbeiters. Doch das Mengenszenario – in dem Buchhaltungskanzleien (escritórios de contabilidade), Lohnbuchhaltungs-Dienstleister und HR-Abteilungen mit mehreren Tochtergesellschaften arbeiten – erzeugt eine sich verstärkende Reibung, die ein Einzelansatz nicht bewältigen kann.
Eine Buchhaltungskanzlei mit 30 Mandantenunternehmen, die im Schnitt 40 Mitarbeiter haben, bearbeitet monatlich rund 1.200 Holerites. Wenn jede Abrechnung nur 2 Minuten für die Prüfung der Schlüsselfelder – INSS, IRRF, FGTS, Nettogehalt – und den Abgleich mit den eSocial-Meldungen benötigt, sind das 40 Stunden pro Monat für eine reine Compliance-Doppelkontrolle. Jede dieser Stunden ist für niemanden abrechenbar.
Stapelverarbeitung ändert die Rechnung. Laden Sie alle 1.200 Holerites – selbst aus 12 verschiedenen Lohnsystemen mit 12 verschiedenen PDF-Layouts – in einem Stapel hoch. Definieren Sie die Spalten einmal. Die KI verarbeitet sie gemeinsam und gibt eine einzige Excel-Datei mit 1.200 Zeilen aus, jede für einen Mitarbeitermonat. Die Spaltenstruktur ist einheitlich, unabhängig davon, welche Lohnsoftware die jeweilige Holerite erstellt hat.
Für mandantenübergreifende Buchhaltungsfälle bedeutet dies, dass Sie aus einem einzigen Stapellauf Excel-Reiter pro Mandant erstellen oder alles in einem Masterblatt mit einer Spalte „Firmenname“ oder „CNPJ“ zum Filtern belassen können. Das Ausgabeformat ist standardisiert, obwohl die Eingabeformate alles andere als standardisiert waren – und das ist der zentrale Nutzen für jede Firma, die brasilianische Lohnabrechnung in großem Umfang betreibt. Mehr zum Stapelansatz über Dokumenttypen hinweg finden Sie in unserem Leitfaden zum Extrahieren brasilianischer NF-e-Rechnungsdaten, der das gleiche Prinzip auf Procure-to-Pay-Workflows anwendet.
Vom Holerite zum eSocial — Einordnung in den brasilianischen Compliance-Workflow
Die Extraktion von Holerite-Daten in Excel löst das Analyseproblem der HR-Abteilung. Doch in Brasilien hat jeder Gehaltszettel ein zweites Leben als Compliance-Dokument. Seit der Einführung des eSocial (Sistema de Escrituração Digital das Obrigações Fiscais, Previdenciárias e Trabalhistas) gemäß Decreto nº 8.373/2014 müssen Arbeitgeber Lohnereignisse – darunter Vergütung (Ereignis S-1200), Zahlungen (S-1210) und periodische Abschlüsse (S-1299) – elektronisch über eine einheitliche Regierungsplattform melden. Der Holerite, den Ihre Lohnsoftware erstellt, ist die mitarbeiterbezogene Zusammenfassung derselben Daten, die in eSocial fließen.
Stellt eine eSocial-Prüfung eine Diskrepanz zwischen gemeldeter Vergütung und tatsächlichen Einzahlungen fest, wird der Holerite zu Ihrem wichtigsten Nachweis – und wenn Ihre Holerite-Daten nicht in einem analysierbaren Format vorliegen, wird die Rekonstruktion dieses Nachweises zur zeitaufwändigen Suche durch Monate von PDF-Dokumenten.
Die Extraktion von Holerite-Daten in Excel ermöglicht zwei Dinge, die reine PDF-Speicherung nicht leisten kann: (1) eSocial-Kreuzvalidierung – vergleichen Sie extrahierte INSS/IRRF/FGTS-Werte mit den S-1200-Meldungen, um Abweichungen zu erkennen, bevor die Steuerbehörde (Receita Federal) dies tut; und (2) schnelle Prüfungsreaktion – wenn das Ministério do Trabalho Lohnunterlagen für einen bestimmten Mitarbeiter über einen bestimmten Zeitraum anfordert (häufig in Brasiliens arbeitsintensivem Compliance-Umfeld, in dem Unternehmen Lohnunterlagen mindestens 5 Jahre aufbewahren müssen), können Sie in Minuten statt Stunden filtern, exportieren und antworten.
FAQ
Funktioniert das auch mit handschriftlichen Gehaltszetteln oder Quittungen?
Ja. Das Vision-Modell von ImageToTable.ai liest handschriftlichen Text – einschließlich Schreibschrift – und kann Felder aus fotografierten oder gescannten Holerites extrahieren, die gedruckt, handschriftlich oder gestempelt wurden. Für Arbeitgeber, die noch manuelle Gehaltszettel ausstellen (häufig in kleineren brasilianischen Unternehmen oder informellen Arbeitsverhältnissen), verarbeitet das Tool die visuelle Vielfalt, ohne dass saubere digitale PDFs erforderlich sind.
Kann das System Lohnabrechnungen von TOTVS, ADP oder Senior Sistemas verarbeiten?
Ja. Die KI extrahiert Daten semantisch – sie sucht nach Bezeichnungen wie „INSS" oder „IRRF", unabhängig davon, wo diese auf der Seite erscheinen oder wie die Lohnsoftware die Abrechnung formatiert. Es muss keine Vorlage konfiguriert werden. Ein Wechsel des Lohnanbieters oder die gleichzeitige Verarbeitung von Holerites aus mehreren Systemen erfordert daher keine Anpassung der Einrichtung.
Was ist, wenn meine Holerite Abkürzungen oder nur portugiesische Feldbezeichnungen verwendet?
Die KI versteht portugiesische Bezeichnungen – „Salário Bruto", „Desconto INSS", „IRRF Retido", „FGTS do Mês", „Líquido a Receber" – und ordnet sie Ihren definierten englischen Spaltennamen zu. Hier ist die semantische (bedeutungsbasierte) Extraktion der OCR-Vorlage überlegen: Eine Vorlage erwartet eine bestimmte Zeichenkette, während die KI erkennt, dass „FGTS do Mês" und „Depósito FGTS" dasselbe bedeuten.
Kann ich Daten zum 13. Gehalt und Urlaubsgeld extrahieren?
Ja. Definieren Sie Spalten wie „13. Gehalt – 1. Rate" und „Urlaubsgeld (1/3 Férias)" in Ihrem Spaltenset. Wenn diese Posten in der Holerite eines Monats erscheinen, extrahiert die KI die Werte. Fehlen sie (d.h. in Monaten ohne 13. Gehalt oder Urlaubsgeld), bleiben die Zellen leer – Ihre Excel-Datei bildet das Vorhandensein oder Fehlen dieser saisonalen Zahlungen über die Monate hinweg automatisch ab, ohne manuelle Filterung.
Berechnet das Tool INSS oder IRRF, oder extrahiert es nur das Gedruckte?
Standardmäßig wird extrahiert, was auf dem Dokument steht. Aber Berechnete Spalten ermöglichen die Definition von Berechnungen während der Extraktion – z. B. kann eine Spalte namens „IRRF-Prüfung (Brutto × Satz − Abzug)" den erwarteten IRRF aus dem extrahierten Bruttogehalt berechnen und mit dem von der Lohnsoftware ausgedruckten Wert vergleichen. So wird die Extraktion zu einer automatisierten Prüfung.
Lohnabrechnungsdaten, die Fragen beantworten, nicht nur PDF-Dateien
Ein Ordner mit 500 Holerite-PDFs sagt Ihnen nichts – er ist reiner Speicherplatz. Eine Tabelle mit 500 Zeilen, jeweils mit Datum, CPF, Bruttogehalt, INSS-Beitrag, IRRF-Einbehalt, FGTS-Einzahlung und Nettogehalt, verrät Ihnen die durchschnittliche INSS-Belastung pro Gehaltsband, den Monat Ihres IRRF-Spitzenwerts, welche Mitarbeiter die Freigrenze überschritten haben und ob Ihr Lohnanbieter eine Abzugsregel geändert hat, ohne Sie zu informieren. Das ist der Unterschied zwischen Dokumentenbesitz und Datenbesitz.
Brasilianische Lohnabrechnungen haben pro Abrechnung mehr regulatorische Details als die meisten Länder in einer gesamten jährlichen Steuererklärung. Eine Extraktion ohne die Möglichkeit der Überprüfung anhand progressiver Tabellen ist keine Automatisierung – sie ist nur schnelleres Abschreiben. Eine Extraktion, die jede INSS-Zeile und jede IRRF-Stufe in eine Struktur bringt, in der Sie die Mathematik prüfen, über Zeiträume vergleichen und mit eSocial-Meldungen abgleichen können, verwandelt die Holerite von einem Compliance-Beleg in einen operativen Datensatz.