Falsche extrahierte Zahlen beheben:
3 Ursachen, die Sie heute selbst diagnostizieren können
Wenn Ihre KI-Extraktion den Rechnungsbetrag um 200 € verfehlt, liegt das selten daran, dass die KI „schlecht in Zahlen“ ist. Das Problem steckt fast immer in der Felddefinition – und die gute Nachricht: Das können Sie selbst beheben.
Wichtige Erkenntnisse
- Wenn der extrahierte Rechnungsbetrag um 200 € abweicht, denken Sie zuerst „die KI kann keine Zahlen“ – doch drei verschiedene Ursachen führen zu diesem Fehler, und keine davon ist zufälliges KI-Rauschen.
- Eine Spalte namens „Gesamt“ kann fünf verschiedene Beträge auf einer Rechnung meinen (Zwischensumme, Steuer, Endbetrag, Rabatt, Versand) – das Modell musste raten, welchen Sie meinten.
- Benennen Sie „Gesamt“ in „Endbetrag nach Steuern“ um und fügen Sie drei Validierungsregeln hinzu (nur-Zahlen-Prüfung, Bereichsprüfung, Rechenprüfung) – 80 % der Fehler bei falschen Zahlen verschwinden, bevor sie Ihr Buchhaltungssystem erreichen.
KI ist nicht schlecht in Zahlen – Ihre Feldnamen sind das Problem
Eine Situation, die fast jeder kennt, der mit KI-Extraktion arbeitet: Sie laden eine gut lesbare Rechnung hoch, das Tool liefert jedes Feld selbstbewusst – und dann entdecken Sie es: Die Spalte „Gesamtbetrag“ zeigt 1.247,30 $, obwohl der echte Rechnungsbetrag 1.447,30 $ ist. Zwischensumme, Steuer, Positionen – alles richtig. Nur die eine entscheidende Zahl weicht um 200 $ ab.
Drei unabhängige Entwicklungsteams haben genau diese Fehlerart an 4.149 echten Rechnungen untersucht. Ihr Ergebnis bestätigt, was viele Praktiker vermuten: Die meisten Extraktionsfehler sind kein zufälliges OCR-Rauschen – sie folgen vorhersagbaren Ursachenmustern, die Sie diagnostizieren und beheben können, ohne das Tool zu wechseln.
Die Reddit-Diskussion zu dieser Studie brachte eine noch ehrlichere Einsicht: „Ein gebuchter Vorgang mit falschem Gesamtbetrag kostet 10 Minuten Korrektur. Trennen Sie in Ihren Flags zwischen Lieferantenfehler und Eingabefehler.“ Die Botschaft ist klar: Wenn extrahierte Zahlen falsch sind, erzeugt der automatisierte Prozess mehr Folgeaufwand als er einspart. Die Lösung erfordert aber selten eine andere KI-Engine – sondern das Wissen, zu welcher von drei Ursachenkategorien Ihr Fehler gehört.
Benutzerdefinierte Spaltenextraktion – ImageToTable.ais Mechanismus, bei dem Sie die gewünschten Feldnamen eingeben und die KI passende Werte nach Bedeutung statt nach Position finden lässt – ist auf diese Diagnose-Realität ausgelegt. Doch selbst die beste KI braucht saubere Signale aus Ihren Spaltendefinitionen. Hier sind die drei Ursachenkategorien, die praktisch jeden falschen Zahlenfehler erklären – und wie Sie jede genau diagnostizieren.
Ursache 1: Mehrdeutige Feldbezeichnung – „Gesamtbetrag“ ist nicht präzise genug
Symptome: Der extrahierte Gesamtbetrag ist nicht der erwartete. Es könnte die Zwischensumme sein, der Betrag nach einem übersehenen Rabatt, der inklusive Steuerbetrag, obwohl Sie den Nettobetrag wollten. Die Zahl selbst ist lesbar und steht auf der Rechnung – nur die falsche von mehreren verfügbaren Summen.
Ursache: Der Summenbereich einer typischen Rechnung enthält mindestens drei Geldbeträge untereinander: Zwischensumme, Steuer (oder MwSt./GST) und Gesamtbetrag. Viele Rechnungen haben zusätzlich Rabatt, Versand oder Saldovortrag in derselben Spalte. Heißt Ihre Extraktionsspalte „Gesamtbetrag“, muss die KI raten, welchen Betrag Sie meinen. „Gesamtbetrag“ ist ein gültiges Feldlabel auf dem Dokument – aber es taucht auch in „Zwischensumme“ auf, und im selben Bereich stehen „Steuer“ und „Versand“. Die KI weiß nicht von sich aus, welchen Gesamtbetrag Sie brauchen – sie liest das Label, das Sie ihr geben, und sucht die beste semantische Übereinstimmung auf der Seite. Wenn ein Label auf fünf mögliche Werte passt, steigt die Fehlerquote.
Das ist keine Einschränkung einer bestimmten KI-Engine. So läuft es in einem Vision-Language-Modell bei einer mehrdeutigen Spaltenanfrage ab: Es sieht das Wort „Gesamtbetrag“ in Ihrer Definition, scannt den Summenbereich, findet drei oder vier Zahlen, die alle plausibel passen – die Zwischensumme eine Zeile über der Steuer, der Endbetrag eine Zeile darunter – und wählt die mit dem stärksten semantischen und positionsbezogenen Signal. Bei den meisten Rechnungen funktioniert das. Bei Rechnungen, wo Zwischensumme und Gesamtbetrag ähnlich groß sind und nur durch eine Leerzeile getrennt, ist die Konfidenz des Modells für beide Optionen fast gleich. Das Ergebnis ist ein Münzwurf, der auf der Ausgabe wie eine selbstbewusste Falschantwort aussieht.
Lösung: Geben Sie genau an, welchen Betrag Sie wollen. Statt einer Spalte namens „Gesamtbetrag“ verwenden Sie eine dieser Alternativen:
- „Gesamtbetrag fällig“ — eindeutig, erscheint auf den meisten Rechnungen als letzter zu zahlender Betrag
- „Endsumme (nach Steuer)“ — der Zusatz signalisiert der KI, dass dies der endgültige Betrag nach allen Additionen ist
- „Zwischensumme (vor Steuer)“ — schließt steuerinklusive Werte explizit aus
- „Bezahlter Betrag“ / „Offener Betrag“ — unterscheidet Zahlungen von ausstehenden Beträgen auf Kontoauszügen
Je spezifischer Ihr Spaltenname, desto weniger Kandidaten hat die KI zur Auswahl. Dies ist kein Workaround – es ist das beabsichtigte Design semantischer Extraktion. Wie moderne KI Rechnungsfelder nach Bedeutung, nicht nach Position unterscheidet erklärt, warum die Spezifität von Bezeichnungen die Extraktionsgenauigkeit auf Feldebene direkt steuert.
Um zu testen, ob dies Ihr Problem ist: Vergleichen Sie die Rechnung mit Ihrem Extraktionsergebnis. Finden Sie den Wert, den die KI für „Gesamtbetrag“ zurückgegeben hat, und den Wert im Dokument, der dazu passt. Sind sie identisch, handelt es sich aber um die Zwischensumme oder den steuerinklusive Gesamtbetrag, liegt ein Ambiguitätsproblem vor – und die Lösung kostet nichts außer einem präziseren Spaltennamen.
Ursache 2: Zeichenverwechslung – Wenn 5 zu S und 0 zu O wird
Symptome: Eine Zahl im extrahierten Ergebnis enthält einen Buchstaben, wo eine Ziffer sein sollte – „5“ wird als „S“ extrahiert, „0“ als „O“, „1“ als „l“ oder „7“. Der Fehler tritt bei ähnlichen Dokumenten aus derselben Quelle konsistent auf. Die Zahl ist an ein oder zwei Stellen falsch, aber die Größenordnung stimmt ungefähr.
Warum es passiert: OCR-Engines und Bildmodelle analysieren die Pixelformen von Zeichen. Manche Zeichenpaare haben bei üblichen Schriftgrößen und Scanauflösungen nahezu identische visuelle Profile:
| Paar | Warum OCR sie verwechselt |
|---|---|
| 5 / S | Die geschwungene Ober- und Unterseite sehen bei kleinen Schriftarten oder kontrastarmen Scans nahezu identisch aus |
| 0 / O | Beide erscheinen als runde oder elliptische Form; der Schrägstrich durch die Null fehlt oft in Schriftarten |
| 1 / l / 7 | Dünne vertikale Striche verschmelzen bei niedriger Auflösung zum gleichen visuellen Profil |
| 8 / B | Die inneren Schleifen sind bei leicht unscharfem Scan visuell ähnlich |
| 6 / G | Der Schwanz des G und die Schleife der 6 sind bei kleinen Größen kaum unterscheidbar |
Dies ist kein Problem, das bessere KI vollständig beseitigen kann. Selbst hochmoderne Bildmodelle haben nahezu gleiche Konfidenz für „5“ und „S“, wenn das Zeichen bei 9 Pixeln Höhe mit Kompressionsartefakten erscheint. Das menschliche Gehirn löst diese Ambiguitäten durch Wortkontext – Sie wissen, dass „5ales Tax“ falsch ist, weil „Sales Tax“ ein bekannter Begriff ist. Eine OCR-Engine hat kein solches Wortwissen, es sei denn, sie wurde speziell darauf trainiert, Wörter aus dem Wörterbuch in bestimmten Feldern zu erwarten.
So beheben Sie es: Zeichenverwechslungen werden am besten nach der Extraktion erkannt, nicht währenddessen. Implementieren Sie feldbezogene Validierungsregeln, die den extrahierten Wert auf erwartete Muster prüfen:
- Nur-Zahlen-Felder: Enthält ein Feld nur Ziffern (Rechnungsnummer, Bestellnummer, Kontocode), genügt ein einfacher Regex-Check. Jedes extrahierte Zeichen, das in einem Nur-Zahlen-Feld keine Ziffer ist, ist mit hoher Wahrscheinlichkeit ein Fehler. Ersetzen Sie in diesem Kontext „S“ durch „5“, „O“ durch „0“ und „l“ durch „1“.
- Bereichsprüfung: Liegt ein extrahierter Gesamtbetrag bei 5.000,00 €, während alle anderen Rechnungen desselben Lieferanten im Bereich von 200–800 € liegen, markieren Sie ihn zur Prüfung. Ein einzelner Ausreißer ist oft das Ergebnis eines falsch gesetzten Dezimaltrennzeichens oder eines Zeichenlesefehlers, der einen Wert um eine Größenordnung aufgebläht hat.
- Übergreifende mathematische Validierung: Prüfen Sie, ob Zwischensumme + Steuern = Gesamtsumme ergibt. Stimmt die Rechnung nicht innerhalb einer kleinen Toleranz, enthält mindestens eine der drei Zahlen einen Zeichenfehler. Diese einzelne Prüfung erfasst die Mehrheit der Zeichenverwechslungsfehler, da ein falsch gelesenes Zeichen in einer der drei Summen die arithmetische Beziehung zerstört.
ImageToTable.ai's intelligente Daten-Nachbearbeitung wendet genau diese Arten von Validierungsregeln automatisch an – standardisiert Daten, Beträge und Seriennummern, sodass die Ausgabe ohne manuellen Prüfschritt verwendbar ist. Aber selbst ohne integrierte Nachbearbeitung fangen drei Validierungsregeln in Ihrem nachgelagerten Workflow (Zahlenprüfung, Bereichsprüfung, Rechenprüfung) 80 % der Zeichenverwechslungsfehler ab, bevor sie Ihr Buchhaltungssystem erreichen.
Ursache 3: Formatunterschiede — 1.234,56 vs 1,234.56
Symptome: Die extrahierte Zahl weicht um drei Größenordnungen ab. Ein Betrag von €1.234,56 auf einer europäischen Rechnung wird als 1.234 extrahiert – oder schlimmer noch als 1,234.56 (was in europäischer Notation eintausendzweihundertvierunddreißig und 56/100 bedeutet). Auch Daten sind betroffen: 03/04/2026 wird von einem US-System als 4. März gelesen, obwohl die Rechnung eindeutig den 3. April meint.
Warum es passiert: Etwa 60 % der Welt – darunter ganz Kontinentaleuropa, der größte Teil Südamerikas sowie bedeutende Teile Afrikas und Asiens – verwenden das Komma als Dezimaltrennzeichen und den Punkt als Tausendertrennzeichen. Die USA, das Vereinigte Königreich und einige andere Länder kehren diese Konvention um. Eine KI-Engine, die eine deutsche Rechnung (€1.234,56) und eine US-Rechnung ($1,234.56) im selben Durchlauf verarbeitet, sieht zwei Zahlen, die strukturell identisch aussehen, aber völlig unterschiedliche Bedeutungen haben.
Hier ist der subtile Teil: Die KI weiß nicht, welche Konvention das Dokument verwendet, es sei denn, Sie teilen es ihr mit, da das visuelle Muster dasselbe ist – eine Zahl mit zwei Trennzeichen. Das Modell sieht „1.234,56“ und hat keine inhärente Möglichkeit zu wissen, ob der Punkt ein Tausendertrennzeichen (europäisch) oder ein Dezimalpunkt (ungewöhnlich, aber in manchen Formaten möglich) ist.
So beheben Sie es: Nachgelagerte Validierungsregeln sind die zuverlässigste Lösung für Formatunterschiede, da das visuelle Verständnis der KI eine Mehrdeutigkeit nicht auflösen kann, die grundlegend kultureller und nicht visueller Natur ist.
- Legen Sie pro Dokumentenquelle ein Dezimaltrennzeichen fest. Verarbeiten Sie Rechnungen deutscher Lieferanten, teilen Sie Ihrem System mit, dass das Komma für diesen Stapel das Dezimaltrennzeichen ist. Die meisten Extraktionstools – einschließlich der Daten-Nachbearbeitung von ImageToTable.ai – erlauben diese Einstellung auf Stapelebene.
- Wenden Sie bereichsbasierte Plausibilitätsprüfungen an. Wenn eine extrahierte „Summe“ 1.234 (eintausendzweihundertvierunddreißig nach europäischer Formatierung) beträgt, die Einzelposten sich aber auf etwa 1.234,56 (eintausendzweihundertvierunddreißig und 56 Cent) summieren, hat die KI vermutlich den Dezimalteil verschluckt. Ein Bereichscheck, der die extrahierte Summe mit der Summe der Einzelposten vergleicht, erkennt dies sofort.
- Nutzen Sie mathematische Konsistenzprüfungen. Wie bei Ursache 2 – Zwischensumme + Steuer = Gesamtsumme. Wurde das Dezimaltrennzeichen falsch interpretiert, stimmt die Rechnung nicht, und Sie wissen, dass Sie das Format überprüfen müssen, bevor der Fehler sich ausbreitet.
Die Lösung ist hier keine bessere OCR. Es ist eine Validierungsschicht, die versteht, dass Zahlen kulturelle Konventionen haben und dass dasselbe visuelle Muster je nach Herkunft des Dokuments unterschiedliche Bedeutungen hat.
Wann Sie eskalieren sollten: Die Grenzfälle, die selbst gute Tools nicht beheben können
Ehrlichkeit ist wichtig. Nicht jeder Fehler bei Zahlen lässt sich auf Feldebene beheben. Es gibt zwei Situationen, in denen selbst die beste KI-Extraktion – mit den spezifischsten Spaltennamen und der gründlichsten Nachbearbeitung – noch mit gewisser Häufigkeit falsche Ergebnisse liefert.
Situation 1: Benachbarte Summenzeilen mit identischer Formatierung. Wenn eine Rechnung „Zwischensumme“, „Rabatt“, „Steuer“ und „Gesamtsumme“ in derselben rechtsbündigen Spalte mit derselben Schriftgröße und -stärke und ohne visuelle Trennung auflistet, steht jede KI-Engine vor einem echten Ambiguitätsproblem. Die Signale, die das Modell zur Unterscheidung der Felder nutzt – Schriftgröße, Leerraum, Label-Position – fehlen oder sind unzuverlässig. In diesem Fall ist der zuverlässigste Ansatz, alle vier Werte zu extrahieren (definieren Sie Spalten für jede) und in Ihrer nachgelagerten Tabelle anhand erwarteter Beziehungen aufzulösen: Die Gesamtsumme sollte die größte Zahl sein, die Zwischensumme die zweitgrößte, der Rabatt die kleinste.
Situation 2: Inkonsistente Dezimalkonventionen innerhalb eines einzelnen Dokuments. Manche Rechnungen mischen Formate – sie verwenden in einem Abschnitt einen Punkt als Dezimaltrennzeichen und in einem anderen ein Komma. Dies ist selten, kommt aber vor, typischerweise bei grenzüberschreitenden Rechnungen, deren Layout aus mehreren regionalen Vorlagen zusammengesetzt wurde. In diesen Fällen funktioniert keine einzelne Formatregel für das gesamte Dokument. Die Lösung ist eine manuelle Überprüfung der Felder, in denen die Formatmischung auftritt, kombiniert mit einer Markierungsregel, die Sie warnt, wenn Einzelposten und Summen unterschiedliche Trennzeichenmuster verwenden.
In beiden Grenzfällen ist die richtige Reaktion nicht, dem Tool die Schuld zu geben. Es ist zu erkennen, dass das Quelldokument selbst eine Mehrdeutigkeit enthält, mit der jedes automatisierte System zu kämpfen hätte – und Ihren Validierungs-Workflow entsprechend zu gestalten.
Häufig gestellte Fragen
Wenn der extrahierte Betrag falsch ist, sollte ich dann von einem zufälligen KI-Fehler ausgehen?
Nein. Extraktionsfehler bei Zahlenfeldern folgen vorhersehbaren Mustern. Prüfen Sie zuerst die Genauigkeit Ihres Spaltennamens – „Total“ ist auf den meisten Rechnungen mehrdeutig. Wenn die korrekte Zahl im Dokument steht, aber nicht von der KI zurückgegeben wurde, liegt die Ursache fast sicher an Feld-Mehrdeutigkeit (Ursache 1). Enthält die Zahl unerwartete Zeichen (Buchstaben statt Ziffern), handelt es sich um Zeichenverwechslung (Ursache 2). Weicht der Wert um etwa das 1.000-fache ab, liegt ein Dezimaltrennzeichen-Problem vor (Ursache 3). Jeder Fall erfordert eine andere Lösung, aber keiner sollte als zufälliges Rauschen betrachtet werden.
Kann ich immer denselben Spaltennamen „Total“ verwenden, wenn ich stets den Gesamtbetrag möchte?
Das ist möglich, aber Sie erhalten falsche Ergebnisse bei jeder Rechnung, bei der der Gesamtbetrag mehrdeutig ist. „Total“ ist der am häufigsten überladene Feldname in der Dokumentextraktion. Ein Spaltenname wie „Gesamtbetrag fällig“ oder „Endsumme (nach Steuer)“ beseitigt die Mehrdeutigkeit ohne zusätzlichen Aufwand. Die KI verwendet Ihren Spaltennamen als primäres Suchsignal – je präziser das Signal, desto weniger Interpretationsspielraum.
Behebt bessere KI-Hardware die Zeichenverwechslung zwischen 5/S oder 0/O?
Nein. Zeichenverwechslung ist eine grundlegende visuelle Mehrdeutigkeit, keine Hardware-Einschränkung. Ein hochmodernes Vision-Modell und eine einfache OCR-Engine stehen vor derselben 5/S-Mehrdeutigkeit, wenn das Zeichen auf einem komprimierten Scan nur 9 Pixel hoch ist. Die Lösung ist kein besseres Modell – sondern eine Validierung nach der Extraktion: Prüfen Sie, ob reine Zahlenfelder nur Ziffern enthalten, wenden Sie Bereichsprüfungen an und nutzen Sie feldübergreifende Berechnungen, um inkonsistente Werte zu erkennen. Je besser das Modell, desto selbstbewusster kann es einen falschen, aber plausibel wirkenden Wert zurückgeben.
Meine europäische Rechnung zeigt €1.234,56, aber die Extraktion liefert 1.234. Was ist passiert?
Die KI hat den Punkt wahrscheinlich als Dezimaltrennzeichen und das Komma als Tausendertrennzeichen interpretiert – die US-Konvention – und dadurch den Dezimalteil vollständig abgeschnitten. Der Wert „1.234,56“ bedeutet im europäischen Format eintausendzweihundertvierunddreißig und 56/100. Im US-Format gelesen ist der Punkt das Dezimaltrennzeichen (wodurch der Wert 1,234 oder etwa eins und ein Viertel wird) und das Komma das Tausendertrennzeichen (das bei einer vierstelligen Zahl ignoriert wird). Konfigurieren Sie Ihren Batch für europäische Dezimalformatierung – teilen Sie dem System mit, dass das Komma das Dezimaltrennzeichen ist – und führen Sie ihn erneut aus.
Soll ich jede Extraktion manuell prüfen oder nur bei verdächtigen Zahlen?
Gezielte Prüfung ist besser als pauschale Prüfung. Wenden Sie drei Regeln auf jede Charge an: (1) Markieren Sie jeden extrahierten Gesamtbetrag, der außerhalb eines definierten Bereichs liegt (z. B. 3 Standardabweichungen vom historischen Durchschnitt des Lieferanten), (2) markieren Sie jede Charge, bei der Zwischensumme + Steuer ≠ Gesamtbetrag um mehr als eine kleine Toleranz (z. B. 0,50 €) abweicht, und (3) markieren Sie jedes rein numerische Feld, das Nicht-Ziffern-Zeichen enthält. Diese drei Regeln erfassen die überwältigende Mehrheit der Fehler bei falschen Zahlen, ohne dass Sie jede einzelne Zeile prüfen müssen. Die manuelle Prüfung nur der markierten Einträge hält Ihren Durchsatz hoch und fängt gleichzeitig die relevanten Fehler.
Wie unterscheidet sich die benutzerdefinierte Spaltenextraktion bei mehrdeutigen Feldnamen von vorlagenbasierten Tools?
Benutzerdefinierte Spaltenextraktion behandelt jeden Spaltennamen als semantische Suchanfrage, nicht als positionsbasierte Regel. Wenn Sie „Gesamtbetrag fällig“ eingeben, durchsucht die KI das gesamte Dokument nach einem Wert, der dieser spezifischen Bedeutung entspricht – dem endgültigen Zahlbetrag nach allen Zu- und Abzügen. Ein vorlagenbasiertes Tool hingegen sucht in einem vorab aufgezeichneten Koordinatenbereich auf der Seite. Der Koordinatenbereichsansatz funktioniert gut, wenn sich der Gesamtbetrag nie bewegt. Die benutzerdefinierte Spaltenextraktion funktioniert gut, wenn sich der Gesamtbetrag bewegt, seine Bedeutung aber gleich bleibt. Mehr dazu, wie dieser Paradigmenwechsel die Extraktionszuverlässigkeit verändert, erfahren Sie unter wie KI Rechnungsfelder nach Bedeutung, nicht nach Position unterscheidet.
Kann dieselbe Charge Rechnungen von US-amerikanischen und europäischen Lieferanten mit unterschiedlichen Zahlenformaten enthalten?
Ja, aber Sie müssen die Formatvarianz nachgelagert handhaben. Die KI extrahiert die Zahlen so, wie sie auf der Seite erscheinen – sie normalisiert nicht automatisch Formatkonventionen innerhalb einer Charge. Für Chargen mit gemischten Formaten ist der zuverlässigste Ansatz, US-amerikanische und europäische Dokumente getrennt zu verarbeiten, wobei auf jede Untercharge eine Formatregel angewendet wird, oder die Nachbearbeitungsschicht von ImageToTable.ai zu nutzen, die so konfiguriert werden kann, dass sie Dezimaltrennzeichen dokumentbezogen erkennt und normalisiert. Für einen tieferen Einblick in die Arten von Schreib- und Zeichenhürden, mit denen Extraktionstools konfrontiert sind, lesen Sie unseren Begleitartikel warum OCR mit Handschrift kämpft und wie man es behebt.
Falsch extrahierte Zahlen sind frustrierend, aber fast nie zufällig. Sie fallen in eine von drei vorhersagbaren Kategorien – mehrdeutige Feldnamen, Zeichenverwechslung oder Formatvarianz – und jede Kategorie hat eine spezifische Lösung, die weder einen Toolwechsel noch ein erneutes Training eines Modells erfordert. Fragen Sie sich beim nächsten falschen Gesamtbetrag nicht „Warum ist die KI schlecht mit Zahlen?“, sondern „Welche der drei Grundursachen ist das, und was ist die günstigste Lösung?“ In neun von zehn Fällen ist die Antwort ein spezifischerer Spaltenname oder eine einzelne Validierungsregel in Ihrem nachgelagerten Workflow. Beides kostet nichts außer ein paar Sekunden Nachdenken.
Testen Sie den Ansatz mit Ihren eigenen Dokumenten. Laden Sie eine Rechnung hoch, von der Sie wissen, dass sie einen Fehler bei falschen Zahlen verursacht hat, definieren Sie die Spalten mit maximaler Spezifität – „Endsumme nach Steuer“, nicht „Summe“ – und sehen Sie, ob sich das Ergebnis ändert. Probieren Sie die Extraktion mit Ihren eigenen Dokumenten aus und sehen Sie, ob aus drei Minuten pro Dokument zehn Sekunden werden.