Wie genau liest KI handschriftliche Buchhaltungsjournale?

Ein Benchmark von AIMultiple aus dem Jahr 2025 bescheinigte GPT-5 eine Genauigkeit von 95 % bei Schreibschrift, während Google Document AI bei denselben Proben nur 63,4 % erreichte. Beide Zahlen stammen aus einem Datensatz mit 100 sauberen, einsprachigen handschriftlichen Absätzen – nicht aus Buchhaltungsjournalen mit handgezeichneten Gitternetzlinien, verblassten Kugelschreibereinträgen und gemischten chinesisch-englischen Schriftzeichen. Die Kluft zwischen einer Benchmark-Zahl und dem, was passiert, wenn man eine echte Journalseite in ein Extraktionstool füttert, ist größer, als die meisten Genauigkeitsangaben vermuten lassen.

Genauigkeit ist nicht nur eine Zahl

Die meisten Benchmarks zur Handschrifterkennung geben eine einzige Genauigkeitsrate an. Ein Review von Suparse aus dem Jahr 2026 nennt für GPT-5 95 % bei kursiver Handschrift im AIMultiple-Benchmark. Extend AI stellt fest, dass LLM-basierte Lösungen in kontrollierten Benchmarks rund 90 % erreichen, während traditionelle OCR-Tools bei Handschrift im Durchschnitt bei 64 % liegen. Diese Vergleiche sind nützlich, messen aber nur eines: die zeichengenaue Transkription von isolierten Textabsätzen.

Ein handschriftliches Kassenbuch (台账) präsentiert der KI keinen Absatz zur Transkription. Es präsentiert eine Tabelle – handgezeichnete Gitterlinien, nach Augenmaß ausgerichtete Spalten, kumulative Zeilen, in denen jeder Eintrag von der Zeile darüber abhängt – die zufällig handschriftlich ist. Die Genauigkeitsfrage für Kassenbücher hat vier Dimensionen, und ein gutes Ergebnis in der ersten Dimension garantiert noch keine brauchbaren Resultate in den anderen drei.

Die vier Dimensionen: (1) Zeichenebene – hat die KI jede Ziffer und jedes Zeichen richtig gelesen? (2) Feldebene – hat sie jeden Wert dem richtigen Feld zugeordnet (Soll vs. Haben, Zeile N vs. Zeile N+1)? (3) Strukturebene – hat sie das Layout der handgezeichneten Spalten verstanden? (4) Geschäftslogikebene – erfüllen die extrahierten Daten die Buchhaltungsregeln (Endsaldo = Vorsaldo + Soll - Haben)? Jede Dimension hat ihren eigenen Genauigkeitsbereich, und das Verständnis jeder einzelnen entscheidet darüber, ob Ihr Kassenbuch für die KI-Extraktion bereit ist.

Dimension 1: Zeichengenauigkeit – Lesen jeder Ziffer und jedes Zeichens

Das messen die meisten Benchmarks. Eine arXiv-Studie von 2025 (2503.15195) testete Vision-Language-Modelle an der IAM-Handschriftdatenbank und fand Zeichenfehlerraten (CER) von nur 1,39 % für GPT-4o und 1,74 % für GPT-4o-mini – das bedeutet, 98,3–98,6 % der Zeichen wurden bei sauberer, einsprachiger englischer Handschrift korrekt gelesen. Claude Sonnet 3.5 erreichte 8,55 % CER (91,5 % Genauigkeit), während Open-Source-Modelle wie InternVL2-8B auf 24,74 % CER (75,3 % Genauigkeit) kamen.

Diese Zahlen gelten für den Idealfall: klare Handschrift, gute Beleuchtung, 300 DPI-Scans. Echte Kassenbuchseiten führen Variablen ein, die die Spannweite vergrößern.

Eingabequalität	KI-Zeichengenauigkeit (englische Ziffern)	KI-Zeichengenauigkeit (gemischt Chinesisch/Englisch)
Saubere, gut lesbare Druckschrift, 300 DPI	96–98 %	93–96 %
Verbundene Schreibschrift, gleichmäßiger Stiftdruck	90–94 %	85–90 %
Flüchtige Handschrift, unterschiedliche Zeichengröße	82–90 %	75–85 %
Verblasste Tinte, vergilbtes Papier, unter 200 DPI	70–80 %	60–75 %

Die Lücke zwischen englischen Ziffern und gemischt chinesisch-englischer Schrift ist real und wird zu wenig beachtet. Die Erkennung chinesischer Handschrift ist eine besondere Herausforderung: Der Standard GB18030-2005 definiert 27.533 chinesische Schriftzeichen, verglichen mit etwa 100 Symbolen im lateinischen Alphabet. Apples Forschung zur Echtzeit-Erkennung chinesischer Handschrift für iOS bestätigt, dass „die Genauigkeit mit ausreichenden Trainingsdaten nur langsam mit zunehmendem Zeichenvorrat abnimmt" – aber das Modell muss Zeichen unterscheiden, die sich nur durch einen einzigen Strich unterscheiden, wie 未 (wèi, „noch nicht") und 末 (mò, „Ende"), wo der Kassenbuch-Kontext zwar bei der Disambiguierung helfen kann, die Herausforderung auf Zeichenebene aber bestehen bleibt.

Was diese Zahlen in der Praxis bedeuten: Auf einer Kontoseite mit 30 Zeilen und 6 Feldern (180 Datenpunkte, etwa 800–1.200 Einzelzeichen) führt eine Zeichengenauigkeit von 95 % zu 40–60 falsch gelesenen Zeichen pro Seite. Die meisten davon verursachen keine Fehler auf Feldebene – ein falsch gelesenes Zeichen in einem langen Beschreibungsfeld ist kosmetisch; eine falsch gelesene Ziffer in der Soll-Spalte nicht.

Dimension 2: Feldgenauigkeit – Werte der richtigen Spalte zuordnen

Hier unterscheidet sich die Genauigkeitsdiskussion von allgemeinen Handschrift-Benchmarks. Die Zeichengenauigkeit misst, ob die KI „1.350“ richtig gelesen hat. Die Feldgenauigkeit misst, ob diese „1.350“ in der Spalte „Soll“ gelandet ist – nicht in „Haben“ oder „Saldo“ – und ob sie Zeile 14 zugeordnet wurde, nicht Zeile 13 oder 15.

Bei gedruckten Tabellen mit klaren Gitternetzlinien ist die Feldgenauigkeit nahezu identisch mit der Zeichengenauigkeit – die Grenzen sind eindeutig. Bei handgezeichneten Kontotabellen wird die Lücke größer. Die KI muss Spaltengrenzen aus unvollkommenen Hinweisen ableiten:

Handgezeichnete vertikale Linien, die nicht perfekt gerade sind. Ein Linealrutscher oder eine unruhige Hand erzeugt einen Spaltenteiler, der leicht über die Seite verläuft. Eine Neigung von 1 Grad über eine Seitenbreite von 20 cm verschiebt die rechte Spaltengrenze um 3,5 mm – genug, um eine handgeschriebene Zahl zu durchschneiden, statt daneben zu liegen.
Spalten nach Augenmaß, nicht nach Maßband. Ein Buchhalter, der ein Kontoraster von Hand zeichnet, setzt Spalten ungefähr, nicht exakt. Die Spalte „Datum“ könnte auf Seite 1 2,5 cm breit sein und auf Seite 50 2,8 cm. Herkömmliche vorlagenbasierte OCR scheitert hier, weil sie feste Koordinaten erwartet. KI, die nach Feldbedeutung liest – erkennt, dass eine kurze datumsähnliche Zeichenfolge (JJ/MM/TT) unabhängig von ihrer genauen horizontalen Position in die Datumsspalte gehört – bewältigt diese Variation ohne seitenweise Neukalibrierung.
Dichte Zeilen mit minimalem Abstand. Eine Kontoseite mit 40 schmalen Zeilen lässt nur 5–6 mm pro Zeile. Wenn handschriftliche Unterlängen (wie der Schwanz eines „g“ oder „y“) einer Zeile mit Oberlängen der darunterliegenden Zeile überlappen, muss die KI entscheiden, wo Zeile N endet und Zeile N+1 beginnt. Diese Zeilengrenzen-Unschärfe ist die größte Einzelquelle für Fehler auf Feldebene bei der Kontoblatterfassung.

Bei einer Kontoseite mit einigermaßen konsistenten handgezeichneten Spalten und normalem Zeilenabstand liegt die Feldgenauigkeit etwa 3–5 Prozentpunkte unter der Zeichengenauigkeit. Bei 93 % Zeichengenauigkeit sind 88–90 % Feldgenauigkeit zu erwarten. Bei 85 % Zeichengenauigkeit (eilige Schreibschrift) sind 80–82 % Feldgenauigkeit zu erwarten. Die praktische Auswirkung: Auf einer Seite mit 30 Zeilen sind 3–4 Felder manuell zu korrigieren – nicht weil die KI die Handschrift falsch gelesen hat, sondern weil sie den richtigen Wert im falschen Feld platziert hat.

Der Vorteil der benutzerdefinierten Spaltenerfassung – Definition von Feldnamen wie „Sollbetrag“ und „Kontoname“ vor der Erfassung – besteht darin, dass sie der KI ein semantisches Ziel vorgibt. Anstatt das Spaltenlayout nur aus Gitternetzlinien abzuleiten, sucht die KI nach „etwas, das in der Zeilenstruktur wie ein Sollbetrag aussieht“ und platziert es in der richtigen Ausgabespalte. Wie in der Anleitung zur vorlagenfreien Erfassung beschrieben, reduziert dieser semantische Ansatz Fehler auf Feldebene mehr als jeder Vorverarbeitungsschritt.

Schluss mit Abtippen — lassen Sie KI Ihre Dokumente lesen

Bild oder PDF hochladen — strukturierte Daten in 10 Sekunden

Jetzt testen →

Keine Anmeldung · Keine Kreditkarte · Ergebnis in 10 Sekunden

Dimension 3: Strukturgüte — Das handgezeichnete Raster verstehen

Diese Dimension hat kein Pendant in gängigen Handschrift-Benchmarks. Sie misst, ob die KI die Tabellenstruktur korrekt interpretiert – also die Beziehung zwischen Zeilen, Spalten, Kopfzeilen und der kumulativen Logik, die ein Kassenbuch definiert.

Moderne KI-Modelle nutzen das, was die Sparkco 2025 Benchmark-Analyse als „layoutbewusste Analyse" beschreibt – multimodale Architekturen wie LayoutLM, die „sowohl Text als auch komplexe Layouts mit Tabellen und Spalten verstehen". In einem Kassenbuch bedeutet das, Folgendes zu erkennen:

Der Endsaldo von Zeile 12 = Endsaldo von Zeile 11 + Soll von Zeile 12 – Haben von Zeile 12
Die Spalte „Kontobezeichnung" enthält typischerweise Text, keine Zahlen – ein „1.350" in dieser Spalte ist daher wahrscheinlich eine Fehlzuordnung, kein gültiger Eintrag
Ein Spaltenkopf wie „科目名称" (Kontobezeichnung) beschreibt ein chinesisches Textfeld; jeder darunter gesetzte Wert sollte darauf geprüft werden, ob er dieser semantischen Erwartung entspricht

Die Strukturgüte bei handgezeichneten Kassenbüchern gliedert sich in drei Qualitätsstufen:

Einheitliches Raster, gedruckt oder sauber handgezeichnet: 90–95 % der Zeilen sind korrekt strukturiert – das heißt, Spalten sind richtig zugeordnet, Zeilengrenzen erkannt und kumulative Beziehungen erhalten. Dies ist der häufigste Fall: Ein Buchhalter, der Monat für Monat Spalten mit einem Lineal zeichnet, stets im gleichen Layout.

Uneinheitliches Raster, variable handgezeichnete Linien: 80–90 %. Die KI versteht das grundlegende Layout, ordnet aber 1–2 Zeilen pro Seite falsch zu – verschmilzt zwei schmale Zeilen zu einer oder teilt eine breite Zeile in zwei. Dies tritt auf, wenn die Spaltenbreiten zwischen den Seiten merklich variieren oder die Rasterlinien so blass sind, dass die KI sie als Inhalt statt als Struktur behandelt.

Kein Raster oder stark beschädigtes Raster: 70–80 %. Wenn das Kassenbuch nur horizontale Linien (keine vertikalen Spaltentrenner) verwendet oder das Raster auf altem Papier fast unsichtbar geworden ist, muss die KI die Spaltenstruktur vollständig aus Inhaltsmustern ableiten – erkennen, dass ein kurzes Datum einer längeren Beschreibung vorausgeht, die wiederum einem Zahlenwert vorausgeht. Dies ist der schwierigste Fall und führt zu den meisten Strukturfehlern.

Ein entscheidender Punkt, den generische Benchmarks übersehen: Strukturfehler sind leichter zu erkennen als Zeichenfehler. Wenn die KI eine Zeile in zwei teilt, hat die Ausgabe 31 Zeilen, wo es 30 sein sollten – eine offensichtliche rote Flagge. Liest sie dagegen eine „3" als „8" in einem Sollbetrag, bleibt der Fehler ohne zeilenweise Prüfung unsichtbar. Strukturfehler sind laut; Zeichenfehler sind leise. Diese Asymmetrie hat praktische Auswirkungen auf die Prüfstrategie.

Dimension 4: Genauigkeit auf Geschäftslogik-Ebene – Stimmt der Saldo?

Diese Dimension existiert für Kontoblätter und fast nichts anderes. Sie misst nicht, ob die KI die Handschrift richtig gelesen hat. Sie misst, ob die extrahierten Daten die buchhalterischen Regeln erfüllen, die ein gültiges Kontoblatt definieren – und fängt dabei gleichzeitig Fehler aus allen drei vorherigen Dimensionen ab.

Die Kernregel: Endsaldo = vorheriger Endsaldo + aktuelles Soll – aktuelles Haben.

Dies ist, buchhalterisch gesprochen, die Formel für den fortlaufenden Saldo – die Arithmetik, die ein Kontoblatt zu einem Kontoblatt macht und nicht zu einer Liste unabhängiger Buchungen. Die nach FASB ASC 105 konforme Buchhaltung verlangt, dass jedes Hauptbuchkonto diese kumulative Integrität über alle Buchungen hinweg beibehält. Ein Kontoblatt, bei dem die Salden nicht stimmen, ist nicht nur ungenau – es ist unmöglich.

Die Prüfung der Geschäftslogik-Genauigkeit erfolgt in zwei Richtungen:

Vorwärtsprüfung: Für jede Zeile wird der erwartete Endsaldo aus den extrahierten Soll- und Habenwerten berechnet. Dieser wird mit dem extrahierten Saldo verglichen. Bei Übereinstimmung besteht die Zeile eine doppelte Prüfung, die weder die manuelle Eingabe noch die Standard-OCR bietet – da sowohl die Soll-/Habenwerte als auch der Saldo unabhängig voneinander gelesen wurden und ihre arithmetische Beziehung die Lesung bestätigt oder verwirft.
Rückwärtsprüfung: Wird in Zeile 47 eine Abweichung festgestellt, wird rückwärts verfolgt: War der Saldo von Zeile 46 korrekt? Der von Zeile 45? So wird die Ursprungszeile isoliert – die erste Zeile, in der der berechnete Saldo vom extrahierten abweicht – und es zeigt sich, ob der Fehler auf ein falsch gelesenes Soll, ein falsch gelesenes Haben oder einen falsch gelesenen Saldo in dieser bestimmten Zeile zurückzuführen ist.

Mit der Funktion „Berechnete Spalte“ des Tools ist diese Prüfung automatisch: Definieren Sie eine Spalte namens „Saldenprüfung“ mit der Regel Vorheriger Saldo + Soll - Haben, und die KI berechnet den erwarteten Saldo für jede Zeile während der Extraktion und markiert Abweichungen an der Quelle. Dies ist die beste Möglichkeit für eine kostenlose Genauigkeitsverbesserung bei der Kontoblatt-Extraktion – und sie ist vollständig eine Funktion der Kontoblatt-Struktur, nicht der Handschriftfähigkeiten des KI-Modells.

In der Praxis fängt die Geschäftslogik-Prüfung etwa 60–80 % der Fehler, die die ersten drei Genauigkeitsdimensionen überstehen. Ein falsch gelesenes Soll, das die Zeichenprüfung (die Ziffern „3“ und „8“ sind beide plausibel), die Feldprüfung (es ist in der richtigen Spalte) und die Strukturprüfung (es ist in der richtigen Zeile) besteht, wird dennoch bei der Geschäftslogik-Prüfung durchfallen – weil die Arithmetik nicht aufgeht. Deshalb sollte die Genauigkeit der Kontoblatt-Extraktion nie als einzelne Zahl beschrieben werden: Die vierte Dimension fungiert als Sicherheitsnetz, das allgemeine Genauigkeitsbenchmarks nicht berücksichtigen.

Was Sie beeinflussen können: Eingabequalität, Spaltendesign und Prüfstrategie

Vier Faktoren bestimmen, wo Ihre Tabelle auf jeder Genauigkeitsdimension liegt – und alle vier liegen in Ihrer Hand.

Scanqualität. 300 DPI ist die Mindestschwelle, ab der die Handschrifterkennung von „Glückssache" zu „zuverlässig" wird – bestätigt durch den Sparkco-Benchmark 2025. Unter 200 DPI reicht die Pixeldichte nicht aus, damit die KI ähnliche Zeichen (3 vs. 8, 4 vs. 9) unterscheiden kann – die Genauigkeit fällt unabhängig von der Modellqualität drastisch ab. Verwenden Sie für mit dem Handy aufgenommene Tabellenseiten eine Scan-App mit Perspektivkorrektur und Kontrastverstärkung. Normale Kamerafotos verlieren 10–15 Prozentpunkte Genauigkeit durch Verzerrung, ungleichmäßige Beleuchtung und Trapezeffekt – alles bereits bei der Aufnahme korrigierbar.

Spaltenbenennung. Die von Ihnen definierten Extraktionsspalten bestimmen das Suchverhalten der KI. Eine Spalte namens „Soll" sagt der KI, sie solle nach einem Zahlenwert mit Soll-Semantik suchen. Eine Spalte namens „Spalte 3" sagt ihr nichts – die KI platziert dort, was immer in der dritten visuellen Spalte steht, egal ob Datum, Beschreibung oder Betrag. Benennen Sie Spalten nach ihrer buchhalterischen Bedeutung: „Datum (JJJJ/MM/TT)", „Kontoname", „Sollbetrag", „Habenbetrag", „Saldo." Je präziser der Spaltenname, desto gezielter das Feld-Matching der KI. Dieses Prinzip ist der Kern der benutzerdefinierten Spaltenextraktion und unterscheidet sie von koordinatenbasierten Vorlagenansätzen.

Konsistenz. Zeichnet dieselbe Person jeden Monat das gleiche Tabellenraster, definieren Sie die Spaltenvorlage einmal und verwenden sie wieder. Die Strukturgenauigkeit der KI verbessert sich durch wiederholte Konfrontation mit einem konsistenten Layout. Zeichnen verschiedene Personen unterschiedliche Raster oder ändert sich das Format monatlich, sinkt die Strukturgenauigkeit – planen Sie mehr Prüfzeit pro Seite ein.

Prüfstrategie. Die praktische Genauigkeit der Tabellenextraktion ist nicht nur die Rohausgabe der KI. Es ist die KI-Ausgabe plus Ihr Prüfprozess. Eine Feldgenauigkeit von 90 % bedeutet 3–4 Korrekturen pro Seite – eine überschaubare Prüfaufgabe. Eine Feldgenauigkeit von 70 % bedeutet 9–10 Korrekturen pro Seite – nahe am Aufwand manueller Eingabe. Die Prüfstrategie für 90 % Genauigkeit (markierte Abweichungen prüfen, einige Zeilen stichprobenartig kontrollieren) funktioniert bei 70 % nicht (Sie geben praktisch ein Drittel der Daten neu ein). Bevor Sie sich für die Extraktion entscheiden, verarbeiten Sie eine repräsentative Seite und zählen Sie, wie viele Felder korrigiert werden müssen. Diese Zahl – nicht irgendein Benchmark – sagt Ihnen, ob Ihre Tabellenqualität die Extraktion unterstützt oder ob zuerst bessere Eingaben nötig sind.

FAQ

Ab wann ist die Handschrift in meinem Hauptbuch zu unleserlich, damit sich eine KI-Erfassung noch lohnt?

Der Wendepunkt hängt vom Vergleichsmaßstab ab. Wenn die Alternative die manuelle Eingabe ist – die bei handschriftlichen Hauptbüchern selbst eine Fehlerquote von 3–5 % durch Übertragungsfehler aufweist –, lohnt sich die KI-Erfassung, solange die korrigierte Feldgenauigkeit über der manuellen Genauigkeit liegt. Das ist in der Regel der Fall, bis die rohe KI-Genauigkeit auf Feldebene unter 75–80 % fällt, was stark beeinträchtigten Dokumenten entspricht (verblasster Bleistift auf zerknittertem Papier, überlappende Zeichen, durchschlagende Tinte). Bei typischen handschriftlichen Hauptbüchern – Kugelschreiber auf liniertem Papier, unterschiedliche Handschriftqualität, gelegentliche Verschmierungen – liegt die Feldgenauigkeit bei 85–93 %, was bedeutet, dass pro 30-zeiliger Seite 2–5 Felder korrigiert werden müssen. Bei dieser Korrekturrate ist die KI-Erfassung mit Prüfung immer noch schneller als die vollständige manuelle Eingabe. Der vollständige Vergleich ist im Vergleich zwischen Hauptbuch-OCR und manueller Dateneingabe quantifiziert.

Verarbeitet die KI gemischtes Chinesisch und Englisch auf derselben Hauptbuchseite?

Ja – mit Einschränkungen. Die KI liest beide Zeichensätze in einem Durchgang, ohne den kognitiven Wechsel, den ein menschlicher Bearbeiter erfährt. Auf Chinesisch geschriebene Kontonamen (科目名称) werden zusammen mit in westlichen Ziffern geschriebenen Beträgen extrahiert. Der Grenzfall ist, wenn eine einzelne Zelle beide Schriften enthält – z. B. ein Beschreibungsfeld mit "付款 an ABC Corp" –, wo die Vermischung innerhalb eines Feldes zu Zeichenfehlern an der Grenze zwischen chinesischen und englischen Zeichen führen kann. Die Trennung von gemischtsprachigen Inhalten in separate Spalten beim Erstellen des Hauptbuchs (chinesische Beschreibungen in einer Spalte, englische Notizen in einer anderen) verbessert die Genauigkeit. Den vollständigen Workflow finden Sie im Leitfaden zur Konvertierung handschriftlicher Hauptbücher in Excel.

Wie verändert sich die Genauigkeit über mehrere Seiten desselben Hauptbuchs?

Vision-Language-Modelle zeigen bei mehrseitigen Dokumenten ein Phänomen namens Kontextdrift. Eine von Suparse zitierte Praktiker-Überprüfung aus dem Jahr 2025 ergab, dass GPT-4.1 auf der ersten Seite eine Genauigkeit von 85 % erreichte, auf unordentlicheren zweiten Seiten auf 75 % abfiel und auf der dritten Seite mehrseitiger Extraktionen auf etwa 65 % sank. Dieser Drift betrifft jedoch hauptsächlich narrative Dokumente, bei denen das Modell versucht, einen laufenden Kontext beizubehalten. Bei strukturierten Dokumenten wie Hauptbüchern – wo jede Zeile in sich abgeschlossen ist und einem festen Schema folgt – ist der Drift weniger ausgeprägt, da die Extraktion feldweise und nicht narrativ erfolgt. Die Verarbeitung von Hauptbuchseiten einzeln (eine Seite pro Batch) anstatt als fortlaufendes Dokument mildert den Genauigkeitsabfall über mehrere Seiten ab. Der Batch-Verarbeitungsmodus des Tools behandelt jede Seite als unabhängige Extraktionseinheit innerhalb eines gemeinsamen Schemas.

Kann ich die KI trainieren, damit sie meine Handschrift mit der Zeit besser erkennt?

Nicht im klassischen Sinne von „Trainingsdaten" – Sie laden keine beschrifteten Beispiele hoch, um das Modell zu verfeinern. Was sich mit der Zeit verbessert, ist Ihre Spaltenvorlage: Nach einigen Seiten wissen Sie, welche Felder die meisten Fehler verursachen, und können Spaltennamen präziser fassen. Eine Spalte namens „Saldo" liefert vielleicht 85 % Genauigkeit, weil die KI sie manchmal mit Zwischensummen verwechselt. Wenn Sie sie in „Endsaldo (Summen, ganz rechte Spalte)" umbenennen, erhält die KI mehr Kontext, und die Feldgenauigkeit steigt meist um 3–5 Prozentpunkte. Diese Vorlagenoptimierung – nicht das Feintuning des Modells – ist der praktische Hebel für mehr Genauigkeit bei Ihrem spezifischen Kontenblattformat.

Wo liegt die Genauigkeitsgrenze – ab wann lohnt sich die KI-Extraktion nicht mehr?

Wenn die meisten Seiten Ihres Kontenbuchs eines der folgenden Kriterien erfüllen, liefert die KI-Extraktion Ergebnisse, die mehr Korrekturaufwand erfordern als die manuelle Eingabe: (1) Durchscheinende Tinte von der Rückseite, die Zeichen selbst für einen menschlichen Leser unklar macht, (2) eine derart verbundene Handschrift, dass einzelne Zeichen nicht mehr unterscheidbar sind (durchgehende Schreibschrift, bei der jedes Zeichen ohne Absetzen in das nächste übergeht), (3) vollständig verblasste Gitterlinien, sodass keine optische Trennung zwischen Spalten mehr besteht, (4) schräg fotografierte Seiten mit starker perspektivischer Verzerrung und ohne Nachbearbeitung. Wenn nur wenige Seiten eines Kontenbuchs diese Probleme aufweisen, erfassen Sie diese manuell und extrahieren den Rest. Betrifft es das gesamte Buch, sind die Eingaben – nicht das Extraktionstool – der limitierende Faktor.