VLM Powered OCR

PDF-Spesenabrechnungen in Excel umwandeln – Einzelposten aus unterschiedlichen Belegen in eine konsistente Tabelle extrahieren

Eine Spesenabrechnung fasst mehrere Belege in einem Dokument zusammen – und jeder Beleg hat sein eigenes Format, Datumskonvention und Währung. Bei manueller Erfassung müssen Sie jeden Beleg einzeln in eine Tabelle übertragen. Extrahieren Sie jeden Einzelposten – Datum, Lieferant, Beschreibung, Kategorie, Betrag, Währung, Zahlungsmethode – in 5–10 Sekunden pro Abrechnung, unabhängig von den enthaltenen Belegformaten.

Enterprise-grade security · TLS 1.3 encrypted

PDF
Gescannt
XLSX/CSV
Multi-Währung

Was Sie aus einem Spesenbericht extrahieren können

Geben Sie die benötigten Spaltennamen ein – die KI findet diese Werte in jeder Quittung des Berichts, indem sie die Dokumentbedeutung versteht, nicht Pixelkoordinaten. Kopfzeilenfelder wiederholen sich in jeder Zeile für einfaches Filtern und ERP-Import.

Berichtskopf & Mitarbeiterinformationen

Employee Name
Employee ID
Department
Report Period
Report ID
Submission Date
GL Code
Cost Center

Positionen (pro Quittung)

Date
Vendor / Merchant
Description
Category
Amount
Currency
Receipt Attached (Y/N)
Payment Method
Tax Amount
Tip / Gratuity

Dies ist keine feste Liste – geben Sie jedes Feld ein, das Ihre Spesenberichte enthalten. Die KI liest das Dokument und findet, wonach Sie fragen.

Warum Spesenabrechnungen schwerer zu extrahieren sind als erwartet

Eine Spesenabrechnung ist kein einzelnes Dokument – sie ist ein Container, der mehrere Belege bündelt, jeder von einem anderen Anbieter mit eigenem Format, Datumskonvention und Währung. Vorlagenbasierte OCR-Tools und manuelle Kopier-Einfüge-Workflows scheitern beide an dieser Heterogenität.

Das Problem

01 Jede Quittung im Bericht hat ein anderes Format

Ein einzelner Spesenbericht kann ein Delta-Airlines-E-Ticket (USD, Datum im Format MM/TT/JJJJ, Aufschlüsselung nach Flugpreis + Steuern + Gepäck), eine Uber-Quittung (USD, Datum im Format TT/MM, Fahrpreis + Trinkgeld + Aufpreis), ein Hilton-Folio (USD, Übernachtungspreis × 2 Nächte + Steuern + Nebenkosten) und eine Gotham-Steakhouse-Quittung (USD, Zwischensumme + Trinkgeld + Gesamtbetrag, Kategorie „Mahlzeiten & Unterhaltung") enthalten. Jede Quittung gibt Beträge, Daten und Kategorien in ihrem eigenen Layout aus. Bei manueller Erfassung muss für jeden Bericht zwischen vier verschiedenen visuellen Mustern gewechselt werden – und ein Finanzteam, das über 50 Berichte pro Monat bearbeitet, tut dies über 200 Mal.

02 Daten, Währungen und Beträge sind auf Quittungen uneinheitlich

Die Delta-Quittung verwendet „Oct 12, 2024", während Uber „12/10/2024" und das Hotelfolio „2024-10-14" verwendet. Wenn der Mitarbeiter international gereist ist, kann eine Quittung in EUR oder JPY ausgestellt sein, während der Spesenbericht den umgerechneten USD-Betrag anzeigt. Bei der manuellen Übertragung muss die erfassende Person jedes Datum gedanklich standardisieren und jede Währungsumrechnung abgleichen – was zu Fehlern führt, die sich auf Erstattungsberechnungen, Prüfpfade und Steuererklärungen auswirken. Wie auf r/Accounting diskutiert, sind Spesenberichte in mehreren Währungen eine wiederkehrende Fehlerquelle beim Monatsabschluss.

03 Manuelle Erfassung vermischt Kopf- und Positionsdaten

Ein Spesenbericht hat zwei Datenschichten: Kopffelder (Mitarbeitername, Abteilung, Berichtszeitraum, Sachkonto, Gesamterstattung) und Positionsfelder (Datum, Anbieter, Betrag, Kategorie jeder Quittung). Bei der manuellen Erfassung muss man sich entscheiden: Erstellt man eine Zeile pro Quittung mit wiederholten Kopffeldern oder eine Zeile pro Bericht mit Quittungen über Spalten verteilt? Kein Ansatz ist sauber. ERP- und Buchhaltungssysteme erwarten eine flache, positionsbasierte Struktur – jede Ausgabe als eine Zeile mit identifizierenden Kopffeldern – aber dies manuell zu erstellen bedeutet, Mitarbeitername und Abteilung in jede einzelne Zeile zu kopieren. Bei 50 Berichten mit durchschnittlich 5 Quittungen sind das 250 Zeilen mit wiederholter Eingabe von Kopfdaten.

Wie die benutzerdefinierte Spaltenextraktion dieses Problem löst

01 Semantische Extraktion funktioniert bei jedem Belegformat – keine anbieterspezifische Einrichtung

Die benutzerdefinierte Spaltenextraktion – das Kernstück von ImageToTable.ai – ermöglicht es Ihnen, die gewünschten Feldnamen einmal einzugeben: „Datum", „Anbieter/Händler", „Beschreibung", „Kategorie", „Betrag", „Währung", „Zahlungsmethode". Die KI findet jeden Wert, indem sie seine Bedeutung versteht, nicht seine Position auf der Seite. Ein Delta-E-Ticket, eine Uber-Quittung, eine Hilton-Abrechnung und eine Restaurantrechnung haben alle ein Datum, einen Anbieternamen und einen Gesamtbetrag – die KI findet sie unabhängig vom Layout. Dieselbe Spaltendefinition funktioniert für jeden Beleg in jedem Bericht, ohne anbieterspezifische Vorlagen oder koordinatenbasierte Konfiguration. Wenn nächsten Monat ein neuer Mitarbeiter eine Air-France-Quittung in einem völlig anderen Format einreicht, funktionieren dieselben Spalten trotzdem.

02 Daten werden automatisch standardisiert; Währungen werden pro Beleg erfasst

Wenn Sie eine Spalte „Datum" hinzufügen, standardisiert die KI jedes Datum – unabhängig vom Eingabeformat – in ein einheitliches Ausgabeformat (z. B. JJJJ-MM-TT). Wenn Sie eine Spalte „Währung" hinzufügen, erfasst die KI die ursprüngliche Währung auf jedem Beleg („USD", „EUR", „JPY"), während die Spalte „Betrag" den umgerechneten Wert aus dem Kopf des Spesenberichts aufzeichnet. So erhalten Sie zwei kritische Datenpunkte pro Beleg: die ursprüngliche Währung für Prüfzwecke und den umgerechneten Betrag für die Erstattungsberechnung. Bei internationalen Spesenberichten, bei denen der Mitarbeiter Belege in mehreren Währungen einreicht, entfällt so die manuelle Arbeit, Wechselkurse nachzuschlagen und zwei Werte pro Beleg einzugeben.

03 Kopffelder werden automatisch in jeder Positionszeile wiederholt

Wenn Sie sowohl Kopfspalten (Mitarbeitername, Abteilung, Berichtszeitraum, Kostenstelle) als auch Positionsspalten (Datum, Anbieter, Betrag, Kategorie) in derselben Spaltenliste definieren, extrahiert die KI die Kopfwerte einmal und fügt sie in jede Ausgabezeile ein. Das Ergebnis ist genau das, was Ihr ERP erwartet: eine flache Tabelle, in der jede Zeile eine Spesenposition darstellt, mit allen identifizierenden Kopffeldern für Filterung, Pivot-Analyse und direkten Import in SAP, Oracle, NetSuite, QuickBooks oder jede andere Buchhaltungsplattform. Bei einem Bericht mit 5 Belegen erhalten Sie 5 Zeilen – jede mit bereits ausgefülltem Mitarbeiternamen, Abteilung und Berichtszeitraum. Die Stapelverarbeitung von 50 Berichten mit je 5 Belegen erzeugt 250 Zeilen, die alle korrekt ihrem Quellmitarbeiter und ihrer Abteilung zugeordnet sind, in einer einzigen konsolidierten Excel-Datei.

Vom PDF-Spesenbericht zur sauberen Excel-Tabelle: So funktioniert's

Wenn Sie regelmäßig Mitarbeiter-Spesenabrechnungen bearbeiten – für Erstattungen, Monatsabschluss oder Prüfungsvorbereitung – sehen Sie hier den Workflow vom Upload bis zur geprüften Ausgabe.

1

Spesenabrechnungen hochladen – einzeln oder dutzendweise, jedes Format

Laden Sie PDF-Spesenabrechnungen aus Ihrem Unternehmenssystem (Concur, Expensify, Zoho Expense, SAP, Workday) oder gescannte Papierbelege mit angehängten Quittungen hoch. Das Tool akzeptiert JPG, PNG, WebP und PDF – auch mehrseitige Berichte mit eingebetteten Belegbildern. Nutzen Sie die Stapelverarbeitung, um alle Abrechnungen eines monatlichen AP-Durchlaufs auf einmal hochzuladen und die Ergebnisse in einer Datei zusammenzuführen. Um Abrechnungen von Mitarbeitern zu sammeln, die Ihr internes System nicht nutzen, generieren Sie einen Sammellink: eine teilbare URL, über die jeder Spesenabrechnungen in Ihre Verarbeitungswarteschlange hochladen kann – durch Eingabe eines kurzen Verifizierungscodes, ohne Registrierung oder Login auf Seiten des Uploaders. Die Dateien erscheinen im ausstehenden Posteingang Ihres Kontos und sind bereit zur Extraktion.

2

Spaltennamen einmal eingeben – und fertig

Geben Sie die gewünschten Felder ein: „Mitarbeitername", „Abteilung", „Abrechnungszeitraum", „Kontonummer", „Datum", „Lieferant/Händler", „Beschreibung", „Kategorie", „Betrag", „Währung", „Beleg angehängt (J/N)", „Zahlungsmethode". Mischen Sie Kopf- und Positionsfelder in beliebiger Reihenfolge – die KI versteht, welche Werte zu welcher Ebene gehören. Verwenden Sie eine abgeleitete Spalte wie „Kategorie (Optionen: Reise/Verpflegung/Unterkunft/Bürobedarf/Sonstiges)", damit die KI jede Ausgabe basierend auf Lieferant und Beschreibung aus dem Beleg klassifiziert. Verwenden Sie eine berechnete Spalte wie „Währungsprüfung (Abrechnungssumme USD / Summe der umgerechneten Einzelposten)", um zu überprüfen, ob die Spesenabrechnungssumme während der Extraktion mit der Summe der Einzelbelege übereinstimmt. Dieselbe Spaltenkonfiguration funktioniert für jede Abrechnung, jeden Mitarbeiter und jede Abteilung.

3

Die konsolidierte Excel-Tabelle herunterladen – jeder Beleg ist eine Zeile

Jeder Belegposten wird zu einer Zeile in Ihrer Ausgabe. Eine Abrechnung mit 5 Belegen erzeugt 5 Zeilen – jeweils mit Mitarbeitername, Abteilung, Abrechnungszeitraum, Kontonummer, Datum, Lieferant, Betrag, Kategorie und allen anderen angeforderten Feldern. Ein Stapel von 30 Abrechnungen mit durchschnittlich 5 Belegen ergibt ~150 Zeilen, alle korrekt zugeordnet und auswertungsbereit. Export als XLSX, CSV oder JSON. Für wiederkehrende monatliche Spesenverarbeitung speichern Sie Ihre Spaltenkonfiguration nach dem Einloggen als Vorlage – wiederverwendbar für jeden Durchlauf, ohne erneute Eingabe der Feldnamen. Die Ausgabe ist strukturiert für den direkten Import in SAP, Oracle, NetSuite, QuickBooks oder Ihre Hauptbuchhaltung.

Wann es am besten funktioniert – und wann Sie Ergebnisse prüfen sollten

Beste Einsatzmöglichkeiten

PDFs aus Unternehmenssystemen (Concur, Expensify, SAP, Workday, Zoho Expense). Berichte aus Spesenverwaltungsplattformen werden mit hoher Genauigkeit extrahiert. Maschinell formatierte Felder – Mitarbeiterdaten, Berichts-ID, Positionssummen, Kategoriecodes – lassen sich sauber Ihren Spaltennamen zuordnen. Kopfzeilen und Belegdaten werden zuverlässig in einem Durchlauf erfasst.

Abteilungsübergreifende Stapel mit unterschiedlichen Berichtsvorlagen. Jede Abteilung nutzt eine andere Spesenvorlage – Marketing verwendet Concur, Engineering Expensify, Vertrieb einen benutzerdefinierten Excel-Ausdruck. Dieselbe Spaltendefinition extrahiert aus allen, da die KI semantisch und nicht nach Vorlagenkoordinaten liest.

Belege mit gängigen Standardkategorien (Reise, Verpflegung, Unterkunft, Bürobedarf). Lieferantenname und Beschreibung liefern genug Signal, damit die KI die richtige Kategorie ableitet – „Delta Airlines" wird Reise zugeordnet, „Gotham Steakhouse" Verpflegung, „Staples" Bürobedarf – selbst wenn der Beleg keine Kategoriebezeichnung enthält. Eine abgeleitete Spalte macht diese Klassifizierung während der Extraktion automatisch.

Wann Ergebnisse geprüft werden sollten

Belege als niedrig aufgelöste Bilder im PDF eingebettet. Berichte, bei denen Belege mit einem Smartphone in niedriger Auflösung fotografiert und in einen PDF-Container eingefügt wurden, können eine geringere Extraktionsgenauigkeit bei Positionsdetails aufweisen. Kopffelder werden normal extrahiert. Für beste Ergebnisse scannen Sie eingebettete Belege mit mindestens 200 dpi oder laden Sie sie als separate Bilddateien hoch.

Multi-Währungsberichte mit benutzerdefinierten oder nicht standardmäßigen Wechselkursen. Wenn ein Spesenbericht eine unternehmenseigene Wechselkurstabelle verwendet (abweichend von den Marktkursen am Transaktionsdatum), extrahiert die KI den umgerechneten Betrag wie gedruckt, kann aber den angewandten Wechselkurs nicht unabhängig verifizieren. Überprüfen Sie vor der Stapelverarbeitung eines ganzen Monats internationaler Ausgaben einige Zeilen mit der Kurstabelle Ihres Unternehmens.

Spesenberichte mit komplexen Genehmigungs-Signaturüberlagerungen auf gedruckten Beträgen. Berichte, bei denen „GENEHMIGT“-Stempel, mehrere Gegenzeichnungen oder Anmerkungen die gedruckten Finanzbeträge überlagern, können kritische Ziffern verdecken. Überprüfen Sie diese Seiten stichprobenartig, bevor Sie extrahierte Werte in Ihr Kreditorenbuchhaltungssystem importieren.

Häufig gestellte Fragen

Wie verarbeitet die KI Spesenabrechnungen, die Belege verschiedener Firmen mit jeweils eigenem Belegformat kombinieren?

Dies ist das Kernproblem, das Spesenabrechnungen mit sich bringen. Eine Spesenabrechnung bündelt Belege verschiedener Anbieter – Delta, Uber, Hilton, Gotham Steakhouse –, die Beträge in ihrem eigenen Format, mit eigener Datumskonvention (MM/TT, TT/MM, JJJJ-MM-TT) und in eigener Währung ausweisen. Die KI liest den Inhalt jedes Belegs unabhängig, identifiziert dieselben semantischen Felder (Datum, Anbieter, Betrag, Kategorie) unabhängig vom Layout des jeweiligen Belegs und extrahiert jede Position in einheitliche Excel-Spalten. Die Spalte Datum wird in ein einheitliches Format standardisiert. Die Spalte Währung erfasst die Originalwährung jedes Belegs zusammen mit dem umgerechneten Betrag aus dem Kopf der Spesenabrechnung. Das Ergebnis ist eine Tabelle, in der jede Zeile eine Spesenposition darstellt – sauber, konsistent und bereit für Ihr ERP oder Buchhaltungssystem.

Kann ich sowohl die Kopffelder der Spesenabrechnung als auch die einzelnen Belegpositionen in einem Durchgang extrahieren?

Ja. Definieren Sie Ihre Spalten so, dass sie sowohl Felder auf Kopfebene (Mitarbeitername, Abteilung, Abrechnungszeitraum, Kostenstelle, Abrechnungs-ID, Gesamterstattung) als auch Positionsfelder (Datum, Anbieter/Händler, Beschreibung, Kategorie, Betrag, Währung, Beleg angehängt, Zahlungsmethode) enthalten. Die KI extrahiert die Kopffelder einmal und platziert sie in jeder Zeile der Ausgabe, während jede Belegposition ihre eigene Zeile erhält. Das bedeutet, dass Mitarbeitername und Abteilung in jeder Zeile wiederholt werden – ideal für Pivot-Tabellen, Filterung nach Mitarbeiter oder den Import in ein ERP, das flache Positionsdatensätze erwartet.

Was ist, wenn ich Ausgaben in Kategorien einteilen muss, die nicht auf dem Beleg aufgedruckt sind?

Verwenden Sie eine abgeleitete Spalte – eine Funktion, mit der die KI Inhalte basierend auf dem Gelesenen aus dem Dokument klassifiziert. Fügen Sie eine Spalte wie "Kategorie (Optionen: Reise/Verpflegung/Unterkunft/Bürobedarf/Transport/Sonstiges)" hinzu, und die KI liest den Anbieternamen, die Beschreibung und den Kontext der Position jedes Belegs, um die richtige Kategorie zu bestimmen – auch wenn der Beleg selbst kein Feld "Kategorie" enthält. Dies eliminiert den manuellen Schritt, jeden Beleg nach der Extraktion zu prüfen und manuell eine Kategorie zuzuweisen. Für Spesenabrechnungen, die einem bestimmten Kontenplan mit Kostenstellencodes zugeordnet werden müssen, verwenden Sie zwei Spalten: "Kategorie" als abgeleitete Spalte und "Kostenstellencode (aus Kategorie abgeleitet)" als Referenzspalte, die Ihr Finanzteam für den SAP- oder Oracle-Import benötigt.

Kann ich Spesenabrechnungen mehrerer Mitarbeiter und Abteilungen gleichzeitig verarbeiten?

Ja. Laden Sie Spesenabrechnungen beliebig vieler Mitarbeiter aus beliebigen Abteilungen und mit beliebigen Vorlagen in einem einzigen Batch hoch. Jede Belegposition wird zu einer Zeile in der ausgegebenen Excel-Datei, wobei Mitarbeiter- und Abteilungskennungen in jeder Zeile ausgefüllt werden. Für den Monatsabschluss, bei dem Sie 50+ Abrechnungen aus Marketing, Entwicklung, Vertrieb und Betrieb verarbeiten müssen – jede mit einem anderen Spesenmanagementsystem – reicht ein Batch mit einer Spaltendefinition für alle aus. Für wiederkehrende monatliche Verarbeitung speichern Sie Ihre Spaltenkonfiguration nach dem Einloggen als Vorlage – verwenden Sie sie bei jedem Batch erneut, ohne Feldnamen neu eingeben zu müssen. Um Abrechnungen von Mitarbeitern zu sammeln, die Ihr Unternehmenssystem nicht nutzen, generieren Sie einen Sammel-Link: eine teilbare URL, über die jeder durch Eingabe eines kurzen Verifizierungscodes Spesenabrechnungen in Ihre Verarbeitungswarteschlange hochladen kann – ohne Registrierung oder Anmeldung auf Seiten des Hochladenden.

Was ist, wenn Belege als eingebettete Bilder im PDF-Spesenbericht vorliegen und nicht als durchsuchbarer digitaler Text?

Die KI liest das Dokument visuell – sie ist nicht auf durchsuchbare Textebenen angewiesen. Gescannte Belege, die als Bilder in einen PDF-Spesenbericht eingebettet sind, werden genauso gelesen wie digitaler Text: Das VLM analysiert das Layout und extrahiert Werte, indem es erkennt, was jedes Element im Kontext bedeutet. Für beste Genauigkeit bei eingebetteten Belegbildern stellen Sie sicher, dass die Scanauflösung mindestens 200 dpi beträgt. Wenn Sie sowohl die Zusammenfassungsdaten des Spesenberichts als auch die einzelnen Belegdaten mit hoher Genauigkeit benötigen, verarbeiten Sie Belegbilder separat für Positionsdetails und kombinieren Sie diese mit der Extraktion der Kopfdaten aus dem Bericht selbst.

📮 contact email: [email protected]