Steuerformular-Extraktion

Umsatzsteuer-Voranmeldung in Excel umwandeln – und Kästchen-Arithmetik prüfen vor der Abgabe

Steuerformulare sind die einzige Dokumentenart, bei der Felder aufeinander verweisen – Kästchen 3 = Kästchen 1 − Kästchen 2, Abschnitt C Summe = Summe der Zeilen 1–8. Herkömmliche OCR extrahiert Zahlen isoliert aus Kästchen, prüft aber nicht, ob Kästchen 3 tatsächlich Kästchen 1 minus Kästchen 2 entspricht. Berechnete Spalten extrahieren jedes Kästchen unabhängig und verifizieren dann die arithmetische Konsistenz – sie decken Abweichungen auf, bevor die Daten in Ihr Buchhaltungssystem gelangen. Dies ist Ihre letzte Verteidigungslinie gegen einen Tippfehler, der die Differenz zwischen Kästchen 1 − Kästchen 2 und dem, was die OCR falsch gelesen hat, kostet.

Verschlüsselte Verarbeitung · Automatische Datenlöschung nach Konvertierung

PDF & Scans
Arithmetik-Prüfung
XLSX/CSV

Was Sie aus Umsatzsteuer-Voranmeldungen extrahieren können

Geben Sie die benötigten Spaltennamen ein – die KI findet diese Werte in jedem Steuerformular, indem sie die Bedeutung der einzelnen Feldbezeichnungen erkennt, unabhängig davon, ob es sich um ein HMRC-VAT100 mit Box-1-bis-Box-9-Nummerierung oder eine EU-Voranmeldung mit völlig anderem Feldaufbau handelt. Sie liest den Besteuerungszeitraum, die Steuernummer, alle Feldwerte und ergänzende Summen aus Formularen jeder Steuerbehörde – ohne Vorlageneinrichtung.

Umsatzsteuerzeitraum Beginn
Umsatzsteuerzeitraum Ende
Umsatzsteuer-ID
Kasten 1 (Ausgangsumsatzsteuer)
Kasten 2 (Vorsteuer)
Kasten 3 (Zahllast)
Kasten 4 (Umsätze netto)
Kasten 5 (Einkäufe netto)
Gesamtumsätze
Gesamteinkäufe
Meldedatum
Meldemethode

Das Tool nutzt die benutzerdefinierte Spaltenextraktion: Sie geben die gewünschten Spaltennamen ein – z. B. „Kasten 1 (Ausgangs-USt)“, „Kasten 2 (Vorsteuer)“, „USt-Identifikationsnummer“ – und die KI findet die passenden Werte auf jedem Formular, indem sie die Bedeutung der einzelnen Kastenbezeichnungen versteht, statt einer festen Vorlage oder Koordinaten zu folgen. So funktioniert ein Satz Spaltennamen gleichzeitig mit der HMRC VAT100, der deutschen Umsatzsteuervoranmeldung, der französischen CA3 und der niederländischen BTW-aangifte – obwohl jede andere Kastennummerierungen und Layouts hat. Sie können auch berechnete Spalten definieren – z. B. eine Spalte namens „Netto-USt-Prüfung (Kasten 1 − Kasten 2)“ – und die KI berechnet, ob der extrahierte Kasten 3 mit Kasten 1 minus Kasten 2 übereinstimmt, und markiert jede Zeile, in der sie abweichen. Diese Querprüfung erfolgt während der Extraktion, sodass Ihre Tabelle bereits mit hervorgehobenen Abweichungen ankommt – nicht erst später beim Abgleich entdeckt werden.

Steuerformulare haben Rechenlogik – herkömmliche OCR ignoriert sie

Rechnungen und Quittungen enthalten Einzelwerte – ein Rechnungsbetrag muss mit nichts anderem auf der Seite übereinstimmen. Bei Steuerformularen ist das anders. Feld 3 ist definiert als Feld 1 minus Feld 2. Summe Abschnitt C ist die Summe der Zeilen 1 bis 8. Diese arithmetischen Beziehungen sind keine Formatierung – sie sind Teil der rechtlichen Definition der Steuererklärung. Herkömmliche OCR liest jedes Feld isoliert und prüft nie, ob die Zahlen aufgehen. Ein Buchhalter auf Reddit beschreibt Übertragungsfehler bei der Prüfung, die aufgefallen wären, wenn die Software die Rechenlogik verifiziert hätte – tat sie aber nicht, sodass der Fehler in die Einreichung des Mandanten gelangte.

01

Herkömmliche OCR liest jedes Feld einzeln – Feld 1, Feld 2 und Feld 3 sind nur drei separate Zahlen auf der Seite. Es gibt keine feldübergreifende Prüfung. Liest die OCR Feld 1 fälschlich als £45.280 statt £45.230, wird £45.280 in Ihre Tabelle übernommen. Feld 3 wird ebenfalls extrahiert – und das System kann nicht fragen: Ist das extrahierte Feld 3 tatsächlich gleich Feld 1 minus Feld 2? Der Fehler von £50 gelangt still in Ihre Buchhaltung, und niemand bemerkt ihn, bis eine Prüfung oder ein Abgleich mit den eigenen Aufzeichnungen des Finanzamts erfolgt. Im größeren Maßstab muss ein Buchhalter, der 30 Mandantenerklärungen pro Quartal bearbeitet, manuell über 20 arithmetische Beziehungen pro Formular prüfen – 600 Prüfungen – zusätzlich zur eigentlichen Dateneingabe.

02

Eine einzige falsch gelesene Ziffer verursacht eine Kaskade von Folgefehlern in Ihrer Buchhaltung. Feld 1 wird um £50 falsch übernommen. Ihre Buchhaltungssoftware akzeptiert dies, da es keinen Prüfschritt zwischen Extraktion und Import gibt. Die vierteljährliche Umsatzsteuerschuld in Ihrem Hauptbuch stimmt nicht mehr mit Ihrer eingereichten Erklärung überein. Wenn Sie den Abgleich durchführen – oft Wochen später, nach einer Mitteilung des Finanzamts oder bei Ihrer eigenen vierteljährlichen Überprüfung – müssen Sie die Ursache der Abweichung durch mehrere Systeme zurückverfolgen. Die Kosten für die Fehlersuche übersteigen die Kosten des Fehlers selbst, und die Uhr tickt bis zur Abgabefrist.

03

Feldabhängigkeiten vervielfachen das Problem – und die meisten Erklärungen enthalten Dutzende davon. Es geht nicht nur um Feld 3 = Feld 1 − Feld 2. Feld 5 (Nettoumsatzsteuer) muss in der Zusammenfassung und im Detailbereich übereinstimmen. Die Summe der Ausgaben muss der Summe der einzelnen Ausgabenposten entsprechen. Abschnittssummen müssen der Summe ihrer Zeilen entsprechen. Ein Formular wie das HMRC VAT100 hat neun Felder mit Beziehungen; eine vollständige deutsche Umsatzsteuervoranmeldung hat über 60 Felder mit mehrfachen, miteinander verknüpften arithmetischen Bedingungen. Die manuelle Überprüfung all dieser Felder für jede Mandantenerklärung in jedem Meldezeitraum ist in keinem Maßstab machbar. Daher verzichten die meisten Kanzleien darauf – und vertrauen der Extraktion. Dieses Vertrauen führt später zum Abgleichsproblem.

01

Die benutzerdefinierte Spaltenextraktion liest jedes Feld einzeln – berechnete Spalten prüfen dann die Arithmetik. Sie definieren Spalten für Feld 1, Feld 2 und das gedruckte Feld 3. Dann definieren Sie eine berechnete Spalte: „Feld-3-Prüfung (Feld 1 − Feld 2).“ Die KI extrahiert Feld 1 und Feld 2 aus dem Formular, berechnet die Differenz und vergleicht sie mit dem ebenfalls extrahierten gedruckten Feld 3. Stimmt das gedruckte Feld 3 mit Feld 1 − Feld 2 überein, gibt die berechnete Spalte „OK“ aus. Falls nicht – weil Feld 1, Feld 2 oder Feld 3 falsch gelesen wurde – gibt die berechnete Spalte die Abweichung aus. Jede Zeile mit einer Abweichung ungleich Null wird vor der Übernahme in Ihr Buchhaltungssystem zur Prüfung markiert.

02

Der £50-Lesefehler in Feld 1 gelangt nie in Ihr Buchhaltungssystem, da die Abweichung bereits bei der Extraktion erkannt wird. Wird Feld 1 mit £45.280 statt korrekt mit £45.230 extrahiert, berechnet die berechnete Spalte Feld 1 − Feld 2 und erhält ein Ergebnis, das nicht zum gedruckten Feld 3 passt. Die Abweichungsspalte zeigt sofort die Unstimmigkeit – Sie prüfen diese Zeile, entdecken den Ziffernfehler, korrigieren ihn, und der korrigierte Wert fließt in Ihre Buchhaltung ein. Der Fehler wird an der Extraktionsgrenze abgefangen, nicht erst Wochen später beim Abgleich. Bei 30 Mandantenrückmeldungen pro Quartal führen die berechneten Spalten alle arithmetischen Prüfungen automatisch durch – Sie prüfen nur die markierten Zeilen, nicht alle 600 Beziehungen.

03

Mehrere berechnete Spalten prüfen gleichzeitig alle arithmetischen Beziehungen im Formular – ein Extraktionsdurchlauf, alle Prüfungen laufen. Definieren Sie berechnete Spalten für „Abschnitt-C-Summenprüfung (Summe Zeilen 1-8 vs. gedruckte Summe)“, „Feld-5-Kreuzprüfung (Zusammenfassung Feld 5 vs. Detailabschnitt Feld 5)“ und „Gesamtausgabeprüfung (Summe der einzelnen Ausgabezeilen vs. gedruckte Summe).“ Die KI extrahiert alle Feldwerte über die gesamte Rückmeldung hinweg – einschließlich mehrseitiger Formulare mit Fortsetzungsblättern – und führt alle arithmetischen Prüfungen im selben Extraktionsdurchlauf durch. Ihre heruntergeladene Excel-Datei enthält alle extrahierten Daten und bereits alle markierten Abweichungen. Sie prüfen nur die markierten Zeilen und importieren alles andere mit Vertrauen. Dies ist Ihre letzte Verteidigungslinie gegen einen Übertragungsfehler, der sonst bis zur Einreichung unentdeckt bliebe.

Wie ein Quartal an Umsatzsteuervoranmeldungen mit Rechenprüfung in einem Durchgang extrahiert wird

Hochladen – alle erhaltenen Unterlagen unverändert

Laden Sie einen Stapel hoch, der eine digital eingereichte HMRC-VAT100-PDF für Q4, eine gescannte Papieranmeldung eines per Post einreichenden Mandanten (leicht schief gescannt mit Knick durch Box 5), eine mehrseitige deutsche Umsatzsteuervoranmeldung mit Fortsetzungsblättern und eine französische CA3 für eine Tochtergesellschaft enthält. Die Formate variieren – saubere digitale PDF, gescanntes Papier mit Artefakten, mehrseitig mit seitenübergreifenden Summen. Keine Vorsortierung nach Rechtsordnung, keine Aufteilung mehrseitiger Anmeldungen in Einzeldateien. Die KI verarbeitet alle Formulare in einem Stapel. Falls Sie begleitende Aufstellungen oder ergänzende Erklärungen zu den Anmeldungen erhalten, laden Sie diese ebenfalls hoch – das Tool verarbeitet gemischte Dokumenttypen im selben Stapel.

Spalten definieren – was Ihr Buchhaltungssystem benötigt, plus Rechenprüfung

Geben Sie die Spaltennamen für Ihre Ausgabetabelle ein: VAT Period Start, VAT Period End, VAT Registration Number, Box 1 (Output VAT), Box 2 (Input VAT), Box 3 (Net VAT Payable), Box 4 (Sales excl. VAT), Box 5 (Purchases excl. VAT). Fügen Sie dann die Prüfspalten hinzu: Box 3 Verification (Box 1 − Box 2; output difference if non-zero), Cross-Page Total Check (sum of detail sections vs summary total). Bei der deutschen mehrseitigen Anmeldung liest die KI alle Fortsetzungsblätter und aggregiert die Werte. Bei der französischen CA3 liest sie die französischen Feldbezeichnungen und ordnet sie Ihren englischen Spaltennamen zu – gleiche Spaltendefinitionen, kein länderspezifisches Template. Bei der gescannten Papieranmeldung mit Knick liest die KI um den Knick herum und extrahiert die Werte; die berechnete Spalte prüft dann, ob Box 3 mit Box 1 − Box 2 übereinstimmt, und markiert die Zeile, falls der Knick zu einem Lesefehler geführt hat.

Ausgabe — eine Tabelle, Rechenprüfungen bereits durchgeführt, nur markierte Zeilen prüfpflichtig

Laden Sie eine Excel-Datei herunter, in der jede Zeile eine Umsatzsteuervoranmeldung repräsentiert. Die Kastenwerte werden extrahiert, wobei die Kastennummern als Spaltendaten erhalten bleiben — Kasten 1, Kasten 2, Kasten 3, Kasten 4, Kasten 5, zusammen mit dem Zeitraum und der Steuernummer. Die berechneten Spalten wurden bereits ausgeführt: Eine Spalte zeigt die Differenz zwischen dem gedruckten Kasten 3 und dem berechneten Kasten 1 − Kasten 2. Bei den vier Meldungen im Batch zeigen drei in der Abweichungsspalte „0“ — diese Zeilen sind verifiziert und importbereit. Falls die gescannte Meldung mit der Knickfalte einen Lesefehler verursacht hat, zeigt die Abweichungsspalte einen Wert ungleich Null — Sie prüfen diese Zeile, vergleichen die extrahierten Zahlen mit dem Originalformular, korrigieren die Ziffer, und der gesamte Batch ist prüfbereit. Export als XLSX, CSV oder JSON für den direkten Import in Xero, QuickBooks, Sage oder Ihr Buchhaltungssystem — mit der Gewissheit, dass kein Rechenfehler die Extraktionsgrenze überlebt hat.

Wann die Extraktion von Umsatzsteuervoranmeldungen am besten funktioniert – und wo Sie prüfen sollten

Die Extraktion von Umsatzsteuervoranmeldungen ist bei strukturierten amtlichen Formularen sehr zuverlässig. Einige Bedingungen sollten Sie vor der Verarbeitung eines großen Stapels kennen – insbesondere solche, die die Feldwertgenauigkeit beeinflussen, da ein falsch gelesenes Feld in die arithmetische Gegenprüfung einfließt.

Zuverlässige Extraktion

Amtliche Steuerformulare mit standardisierten Kästchenlayouts – nahezu perfekte Extraktion inkl. Kästchennummern als Feldbezeichnungen.

Formulare mit gleichem Layout, aber länderspezifischer Kästchennummerierung – dieselben Spaltendefinitionen funktionieren länderübergreifend.

Digital eingereichte PDFs (HMRC VAT100, MTD-konforme Meldungen, EU-elektronische Steuer-PDFs) – saubere Quelle, saubere Extraktion.

Mehrseitige Meldungen mit Fortsetzungsblättern – alle Seiten werden extrahiert; seitenübergreifende Summen mit einer berechneten Spalte prüfen, die Detailabschnitte summiert und mit der Zusammenfassungsseite vergleicht.

Diese Fälle prüfen

Handschriftliche Korrekturen auf gedruckten Steuerformularen – die Genauigkeit hängt von der Lesbarkeit der Handschrift ab. Wenn ein Bearbeiter einen getippten Wert durchgestrichen und handschriftlich in einem kleinen Feld korrigiert hat, liest die KI die sichtbare korrigierte Zahl. Kennzeichnen Sie diese Erklärungen mit einer berechneten Spalte und prüfen Sie den korrigierten Wert vor der Einreichung anhand der Belege.

Berichtigte oder korrigierte Erklärungen, bei denen sowohl Original- als auch korrigierte Werte auf demselben Formular erscheinen – die KI kann beide Zahlen extrahieren, wenn beide sichtbar sind. Definieren Sie eindeutige Spaltennamen für die korrigierten Werte und gleichen Sie diese mit den Originalwerten ab, falls Ihre Aufbewahrungspflichten beides erfordern.

Nicht standardisierte regionale Formulare außerhalb von UK/EU (z. B. bestimmte Umsatzsteuererklärungen auf Bundesstaatsebene, lokale Gemeindesteuererklärungen) – die Feldnummerierung kann abweichen oder nicht-numerische Bezeichnungen verwenden. Die KI kann beschriftete Werte trotzdem extrahieren, aber die Spaltennamen in Ihrem Extraktions-Prompt sollten den tatsächlichen Bezeichnungen auf dem Formular entsprechen. Führen Sie zuerst einen Testdurchlauf mit einem Formular durch, um die Feldzuordnung zu prüfen.

Dieses Tool extrahiert Zahlen aus Feldern, führt aber KEINE Steuerberechnung durch und ermittelt keine Steuerschuld – es liest, was auf dem Formular steht. Berechnete Spalten prüfen, ob die extrahierten Zahlen intern konsistent sind, berechnen aber Ihre Umsatzsteuerschuld nicht nach Steuerrecht neu. Die arithmetische Prüfung bestätigt, dass das Formular korrekt gelesen wurde – nicht, dass das Formular selbst korrekt ausgefüllt wurde.

Häufig gestellte Fragen

Wie funktioniert die arithmetische Prüfung mit berechneten Spalten für Umsatzsteuervoranmeldungen – und warum ist sie wichtig?

Steuerformulare sind die einzige Dokumentenart, bei der Felder per Definition aufeinander verweisen – Kästchen 3 ist Kästchen 1 minus Kästchen 2. Herkömmliche OCR extrahiert jeden Kästchenwert unabhängig und kann nicht prüfen, ob die extrahierten Zahlen diese Beziehungen erfüllen. Berechnete Spalten lösen dieses Problem: Sie definieren eine Spalte wie „Prüfung Kästchen 3 (Kästchen 1 − Kästchen 2)“ und die KI berechnet die erwartete Nettoumsatzsteuer aus den extrahierten Kästchen 1 und 2 und vergleicht sie mit dem ebenfalls extrahierten gedruckten Kästchen 3. Bei Abweichung wird die Differenz in dieser Spalte ausgegeben – die Zeile wird zur Prüfung markiert, bevor sie in Ihr Buchhaltungssystem gelangt. Sie können mehrere berechnete Spalten definieren, um alle arithmetischen Beziehungen des Formulars gleichzeitig zu prüfen. Die ausgegebene Tabelle enthält bereits identifizierte Abweichungen, sodass Ihre Prüfzeit nur auf markierte Zeilen entfällt, anstatt jede arithmetische Beziehung jeder Meldung manuell zu überprüfen.

Funktioniert dies auch mit Umsatzsteuervoranmeldungen aus anderen Ländern als dem Vereinigten Königreich?

Ja. Die KI verarbeitet Standard-Umsatzsteuer-/GST-Formulare aus mehreren Ländern – UK HMRC VAT100, deutsche Umsatzsteuervoranmeldung, französische CA3, niederländische BTW aangifte, indische GSTR-3B und andere. Jedes Land verwendet andere Kästchennummern und Bezeichnungen, aber die KI liest die Struktur jedes Formulars kontextbezogen, anstatt einer festen Vorlage zu folgen. Dieselben Spaltennamen – „Kästchen 1 (Ausgangsumsatzsteuer)“, „Kästchen 2 (Vorsteuer)“, „Umsatzsteuer-Identifikationsnummer“ – funktionieren formularübergreifend, da die KI versteht, was jede Kästchenbezeichnung im Kontext bedeutet. Bei weniger verbreiteten regionalen Formularen mit ungewöhnlichen Bezeichnungen empfehlen wir, zuerst ein Testformular zu verarbeiten, um sicherzustellen, dass Ihre Spaltennamen korrekt auf die spezifischen Bezeichnungen des Formulars abgebildet werden. Die arithmetischen Prüfungen mit berechneten Spalten funktionieren unabhängig vom Land – Kästchen 3 = Kästchen 1 − Kästchen 2 ist in jedem Land dieselbe Mathematik.

Kann ich Umsatzsteuervoranmeldungen mehrerer Mandanten oder Zeiträume auf einmal verarbeiten?

Ja. Sie können Umsatzsteuervoranmeldungen mehrerer Mandanten, Quartale oder Länder in einem einzigen Batch hochladen. Die KI verarbeitet jede Meldung einzeln und fasst alle Ergebnisse in einer Excel-Tabelle zusammen – eine Zeile pro Meldung – mit extrahiertem Voranmeldungszeitraum (Beginn, Ende) und Steuernummer, sodass Sie nach Mandant oder Quartal filtern können. Die Prüfungen der berechneten Spalten laufen für jede Zeile unabhängig, sodass jede Meldung im Batch ihre eigene Verifizierung erhält. Ideal für Steuerberater in der Saison: Laden Sie alle Meldungen auf einmal hoch, prüfen Sie nur die markierten Zeilen und exportieren Sie die verifizierten Daten pro Mandant. Für wiederkehrende Prozesse ermöglicht die Sammellink-Funktion Ihren Mandanten, ihre Meldungen ohne eigenes Konto direkt in Ihre Verarbeitungswarteschlange hochzuladen – fertig für die Batch-Verarbeitung ohne E-Mail-Anhänge oder Dateitransfers.

Wie genau ist die Extraktion bei gescannten Papierbelegen im Vergleich zu digitalen PDFs?

Bei sauber gescannten Papierbelegen mit 200+ dpi und Standard-Kästchenlayout ist die Extraktionsgenauigkeit mit digitalen PDFs vergleichbar. Die Genauigkeitsgrenze wird durch die Scanqualität bestimmt, nicht durch die Lesefähigkeit der KI. Ein flacher, gut ausgeleuchteter Scan eines sauber gedruckten Belegs extrahiert zuverlässig – Kästchennummern, Werte und Zusatzfelder bleiben erhalten. Ein schiefer Scan, ein Scan mit Seitenfalten oder Schatten oder eine Mehrfachkopie (gedruckt → gefaxt → gescannt) kann bei den Werten nahe der physischen Beeinträchtigung zu geringerer Genauigkeit führen. Genau hier bietet die Prüfung der berechneten Spalten ihren Mehrwert: Selbst wenn eine Falte in Kästchen 5 zu einer Fehllesung führt, deckt die arithmetische Prüfung dies auf, da der extrahierte Wert in Kästchen 3 nicht mit Kästchen 1 minus Kästchen 2 übereinstimmt, falls einer der drei Werte falsch gelesen wurde. Für per Post eingehende Papierbelege empfehlen wir das Scannen mit 200+ dpi auf einem Flachbettscanner anstelle eines Handyfotos, um die Extraktionszuverlässigkeit zu maximieren.

Sind meine Steuerdaten während der Verarbeitung sicher?

Alle Dateiübertragungen nutzen TLS 1.3-Verschlüsselung. Ihre Dokumente werden in einer isolierten Sitzung verarbeitet und innerhalb von 24 Stunden automatisch von unseren Servern gelöscht. Ihre Steuerdaten werden niemals zum Trainieren oder Verbessern unserer KI-Modelle verwendet – sie bleiben allein Ihre Daten. Für Steuerberatungskanzleien mit spezifischen Anforderungen an Datenaufbewahrung oder -residenz ist die Verarbeitung auf minimale Datenpersistenz ausgelegt: Hochladen, Extrahieren, Herunterladen – und die Quelldokumente werden gelöscht. Die extrahierte Tabelle verbleibt auf Ihrem Gerät – wir behalten extrahierte Daten nicht über das Verarbeitungsfenster hinaus.

📮 contact email: [email protected]