Kann KI G702- und G703-Daten extrahieren?
Ja – so funktioniert's
Ja. KI kann Daten aus AIA G702 (Zahlungsantrag und -bescheinigung) und G703 (Fortsetzungsblatt) extrahieren – Vertragssummen, Nachtragsaufträge, ausgeführte Arbeiten, Einbehalte und Positionsdetails. Das standardisierte AIA-Layout begünstigt die Genauigkeit bei digitalen PDFs, wo KI strukturierte Felder bei sauberen, maschinell ausgefüllten Formularen mit 95-98 % erfasst. Handschriftliche Einträge auf ausgedruckten Formularen, minderwertige Scans aus Baustellencontainern und mehrfach kopierte Vorlagen senken die Genauigkeit auf 70-85 % – immer noch brauchbar für die Beschleunigung der Dateneingabe, aber mit systematischer Prüfung jedes extrahierten Feldes.
Wichtige Erkenntnisse
- Ein mittelgroßer Generalunternehmer verbringt 28 Stunden pro Abrechnungszyklus mit der manuellen Erfassung von G702- und G703-Daten von 18 Subunternehmern – jeden Monat, auf identischen AIA-Formularen, die seit Jahrzehnten bundesweit standardisiert sind.
- Das AIA-Formularlayout ist bei jedem Subunternehmer identisch – aber die Dokumente, die beim GU eingehen, reichen von sauberen digitalen PDFs mit 98 % Genauigkeit bis hin zu drittgenerierten Kopien mit unter 50 %.
- Ein einziger Satz in der Subunternehmervereinbarung – der digitale PDF-Zahlungsanträge vorschreibt – bringt alle Anträge in den 95 %+-Genauigkeitsbereich und beseitigt das Problem der Baustellen-Scanqualität vollständig.
Wie gut KI heute AIA G702- und G703-Formulare liest
Das AIA G702/G703 ist das am stärksten standardisierte Abrechnungsformat im US-Bauwesen – dieselben Feldbezeichnungen, dieselben nummerierten Zeilen, dasselbe Layout, egal ob das Dokument von einem Beton-Subunternehmer in Phoenix oder einem Elektroinstallateur in Chicago stammt. Diese Standardisierung ist der größte Vorteil der KI. Da die Formularstruktur vorhersagbar ist, hat die semantische Extraktion – das Lesen nach der Bedeutung jedes Feldes statt nach seiner Position auf der Seite – eine solide Ausgangsbasis.
Die G702-Zusammenfassungsseite enthält kritische Zahlungsdaten in etwa 20 Feldern: Vertragssumme, Nettosumme aus Nachtragsaufträgen, Vertragssumme bis heute, insgesamt bis heute abgeschlossen & eingelagert, Einbehalt (sowohl Prozentsatz in Zeile 5a als auch Dollarbetrag in Zeile 5b), Gesamtverdienst abzüglich Einbehalt, abzüglich vorheriger Zahlungsnachweise, aktuelle fällige Zahlung und Restbetrag zur Fertigstellung. Bei einem sauberen, digital ausgefüllten PDF – wie es von Procore, Sage 300 CRE oder der Buchhaltungssoftware eines Subunternehmers erstellt wird – extrahiert die KI diese Felder mit einer Genauigkeit von 95-98 %. Die Bezeichnungen sind konsistent, die Werte stehen in erwartbaren Beziehungen zu ihren Bezeichnungen, und die Mathematik folgt einer vorhersagbaren Reihenfolge.
Das G703-Fortsetzungsblatt ist der Ort, an dem die Datenmengen liegen. Ein einzelner Zahlungsantrag kann 20 bis 50 Positionen auf 2 bis 10 Seiten umfassen, jede mit Sollwert, dieser Periode abgeschlossener Arbeit, derzeit eingelagerter Materialien, insgesamt bis heute abgeschlossen & eingelagert, Fertigstellungsgrad und einbehaltener Einbehaltsumme. Moderne KI verarbeitet diese Tabellenstruktur gut, da jede Spalte eine klare semantische Identität hat – „Diese Periode abgeschlossene Arbeit“ bedeutet auf Seite 1, Zeile 3 dasselbe wie auf Seite 7, Zeile 42. Die KI verfolgt die Kontinuität der Positionen über Seitenumbrüche hinweg, was wichtig ist, wenn sich der Leistungsverzeichnis eines Subunternehmers mitten in einem Kostenkodex aufteilt.
Was dies ermöglicht, ist die benutzerdefinierte Spaltenextraktion: Sie definieren die benötigten Ausgabespalten – „Vertragssumme bis heute“, „Einbehalt %“, „Aktuelle fällige Zahlung“ für die G702 sowie die halbe Dutzend G703-Positionsspalten – und die KI lokalisiert jeden Wert, indem sie den Inhalt des Dokuments versteht, nicht durch Koordinatenabgleich. Ein positionsbasiertes Tool, das „Einbehalt“ an einer festen Pixelkoordinate erwartet, versagt, sobald ein Subunternehmer einen anderen PDF-Editor verwendet, der Felder um einen Viertelzoll verschiebt. Die semantische Extraktion kümmert das nicht. Für das Gesamtbild, warum die Bauabrechnung besondere Anforderungen an die Datenextraktion stellt, siehe was die Extraktion von Baurechnungen tatsächlich beinhaltet.
Was KI bei G702- und G703-Formularen richtig macht
Saubere, digital ausgefüllte PDF-Zahlungsanträge. Dies ist die Basis und der Bereich, in dem KI am besten funktioniert. Wenn ein Subunternehmer einen G702/G703 mit Procore, Sage, Viewpoint Vista oder sogar einem ausgefüllten PDF-Formular ausfüllt – maschinengenerierter Text im Standard-AIA-Layout – liest KI strukturierte Felder mit 95-98% Genauigkeit. Die Dollar-Beträge neben „Current Payment Due", der Einbehalt-Prozentsatz in Zeile 5a, der Restbetrag – all das landet korrekt in den Tabellenspalten. Die 2-5% Fehlerquote betrifft typischerweise Randfälle: ungewöhnlich formatierte Nachtragspositionen, nicht standardmäßige Abkürzungen in Positionsbeschreibungen oder eingescannte Unterschriftenblöcke, die in angrenzende Textbereiche hineinragen.
G703-Positionstabellen über mehrere Seiten. Die eigentliche Masse steckt im Fortsetzungsblatt. Ein G703 mit 40 Positionen über 6 Seiten bedeutet 240+ Einzelwerte – und die tabellenbewusste KI-Extraktion erfasst sie alle in einem Durchgang. Die KI versteht die Spaltensemantik: Sie weiß, dass die Zahl in der Spalte „Work Completed This Period" etwas anderes ist als „Total Completed & Stored to Date", selbst wenn beide zufällig denselben Dollarbetrag aufweisen (wie im ersten Abrechnungszeitraum). Sie verfolgt Positionen über Seitenumbrüche hinweg, sodass ein Kostenkennzeichen, das auf Seite 2 beginnt und auf Seite 3 weitergeht, als ein durchgehender Eintrag und nicht als zwei Fragmente erfasst wird.
Stapelverarbeitung über mehrere Subunternehmer. Ein Generalunternehmer, der 20 Subunternehmer betreut, erhält monatlich innerhalb eines 48-Stunden-Fensters Zahlungsanträge – einige als saubere PDFs, einige als gedruckte und eingescannte Formulare, einige als QuickBooks-Rechnungen, die locker dem AIA-Format folgen. Da die semantische Extraktion keine projektspezifischen Vorlagen erfordert, landen alle 20 Anträge in einem Stapel und erzeugen eine einzige zusammengeführte Tabelle: eine Zeile pro Sub, dieselben G702-Felder aus jedem Antrag extrahiert, unabhängig davon, wie jeder Sub sein Formular erstellt hat. Das ist der Unterschied zwischen dem Prüfen einer Tabelle und dem Abgleichen von 20 separaten Extraktionen. Eine Schritt-für-Schritt-Anleitung zur Anwendung der Extraktion speziell auf die Subunternehmer-Abrechnung finden Sie unter So extrahieren Sie AIA-G702-Zahlungsantragsdaten in eine Tabelle.
Erkennung des Einbehalt-Feldes. Der Einbehalt steht in zwei separaten Zeilen des G702 – Zeile 5a ist der Prozentsatz, Zeile 5b der Dollarbetrag – und diese korrekt zu erfassen ist wichtig, weil der Einbehalt tatsächliches Bargeld ist, das der Bauherr einbehält. Die KI extrahiert beide unabhängig voneinander und versteht die Beziehung zwischen ihnen, ohne dass ein separater Berechnungsschritt erforderlich ist. Bei digitalen Formularen, bei denen beide Felder maschinell gedruckt sind, liegt die Genauigkeit beim Einbehalt bei 95%+. Bei handschriftlichen oder eingescannten Formularen lässt sich der Einbehaltsbetrag (5b) zuverlässiger lesen als der Prozentsatz (5a), da Dollarbeträge stärkere strukturelle Hinweise bieten.
Wo die KI bei der G702/G703-Erfassung noch an ihre Grenzen stößt
Die drei Szenarien, in denen die KI-Genauigkeit nachlässt, haben eine gemeinsame Ursache: Das Formular mag standardisiert sein, aber das physische Dokument, das im Büro des Generalunternehmers ankommt, ist alles andere als das.
Handschriftliche Einträge auf gedruckten AIA-Formularen. Nicht jeder Subunternehmer füllt eine G702/G703 am Computer aus. Kleinere Gewerke – Maler, Trockenbauer, Wohnungsbausubunternehmer – erhalten oft leere AIA-Formulare vom Generalunternehmer, füllen sie von Hand aus und faxen oder scannen das Ergebnis. Das Problem der Handschrift ist bei G702/G703-Formularen gravierender als bei Standardrechnungen, da die Formulare dicht sind – Geldbeträge, Prozentsätze und Daten stehen in engen Rastern, umgeben von kleinem Beschriftungstext. Bei sauberer Blockschrift mit dunkler Tinte erreicht die KI eine Genauigkeit von 75-85 %. Bei unleserlicher Handschrift oder Kugelschreiber auf Durchschlagpapier sinkt die Genauigkeit unter 70 %. Dann kann die manuelle Eingabe schneller sein als die Überprüfung.
Schlechte Scans von Baustellen. Der Projektmanager eines Subunternehmers füllt die G703 im Baucontainer aus, scannt sie auf einem 15 Jahre alten Multifunktionsdrucker und sendet das PDF per E-Mail. Der Scan ist schief, leicht gedreht und mit 150 DPI statt der von der KI erwarteten mindestens 300 DPI erfasst. Zahlen verschwimmen an den Rändern – eine „3“ und eine „8“ werden mehrdeutig. Die Genauigkeit bei diesen Scans sinkt auf 65-75 %. Die Lösung ist prozessualer, nicht technischer Natur: Verlangen Sie von Subunternehmern, dass sie digitale Originale oder mindestens 300-DPI-Flachbettscans als Teil der Zahlungsantragsunterlagen einreichen.
Mehrfachkopien. Dies ist der schwierigste Fall. Ein Subunternehmer erhält eine Kopie einer Kopie des ursprünglichen AIA-Formulars, füllt es aus und reicht es ein. Die gedruckten Gitterlinien des Formulars verblassen, der Beschriftungstext („TOTAL COMPLETED & STORED TO DATE“) löst sich auf, und der Kontrast zwischen Hintergrund und Text ist gering. Die KI kann dennoch versuchen, die Daten zu erfassen – und wird etwas zurückgeben – aber die Mehrdeutigkeit auf Zeichenebene führt dazu, dass eine „5“ als „6“ und eine „0“ als „8“ gelesen werden könnte. Bei Kopien der dritten Generation sinkt die Genauigkeit auf 50-65 %, und die manuelle Neueingabe ist der sicherere Weg. Wenn Mehrfachkopien ein wiederkehrendes Problem sind, ist die wirkungsvollste Änderung, den Versicherungsvertreter oder das Büro des Subunternehmers zu bitten, eine saubere digitale Version zu erstellen – die meisten können dies in wenigen Minuten erledigen.
G702↔G703-Querverweis-Abstimmung. Dies ist weniger ein Problem der KI-Erfassung als vielmehr eine Realität des Arbeitsablaufs. Die G702-Zusammenfassung übernimmt Summen aus der G703 – aber diese Summen werden vom Subunternehmer eingegeben. Die KI kann die Summen aus beiden Formularen extrahieren und sie in der Ausgabetabelle nebeneinander darstellen. Was sie nicht tut – und kein Extraktionstool behauptet dies – ist zu überprüfen, ob die Mathematik des Subunternehmers korrekt ist. Wenn die G703-Positionen 247.350 € ergeben, der Subunternehmer aber 243.750 € in die Zeile „Total Completed & Stored to Date“ der G702 eingetragen hat, extrahiert die KI beide Zahlen getreu. Die Diskrepanz von 3.600 € ist Sache des Projektbuchhalters, nicht eine Aufgabe der Datenerfassung. Dies ist einer der Gründe, warum der Prüfdurchgang auch bei hoher Genauigkeit unerlässlich bleibt – wie in unserem Leitfaden zu häufigen G702-Erfassungsfehlern, die Zahlungsstreitigkeiten auslösen behandelt.
Die KI liest, was die G702 und G703 enthalten – sie prüft nicht die Mathematik des Subunternehmers, bestätigt nicht, dass die Arbeiten tatsächlich ausgeführt wurden, oder stellt sicher, dass der Einbehalt zum korrekten vertraglichen Satz berechnet wurde. Die Erfassung ist ein Beschleuniger für die Dateneingabe. Die projektbezogene Prüfung und Freigabe bleibt in der Verantwortung des Projektmanagers.
So erzielen Sie die besten Ergebnisse bei der KI-Extraktion von G702/G703
1. Definieren Sie Spaltennamen, die den exakten Feldbezeichnungen des AIA-Formulars entsprechen. Die KI arbeitet mit semantischem Abgleich – der eingegebene Spaltenname bestimmt, wonach gesucht wird. „Vertragssumme bis heute“ funktioniert besser als „Gesamtvertrag“. „Einbehalt %“ und „Einbehaltsbetrag“ als separate Spalten sind besser als eine einzelne Spalte „Einbehalt“. Für die G703-Positionen definieren Sie jede Spalte explizit: „Planwert“, „Diese Periode ausgeführte Arbeiten“, „Derzeit eingelagerte Materialien“, „Gesamt fertiggestellt & eingelagert bis heute“, „% fertiggestellt“, „Einbehalt einbehalten“. Die KI verwendet jeden Spaltennamen als semantische Abfrage – je präziser die Abfrage, desto genauer der Treffer.
2. Fordern Sie digitale PDFs von Subunternehmern an. Die mit Abstand wirksamste Verfahrensänderung: Fügen Sie eine Klausel in Subunternehmerverträge ein, die verlangt, dass Zahlungsanträge als digital erstellte PDFs eingereicht werden, nicht als abfotografierte Papierformulare. Die meisten Subunternehmer, die Baumanagement-Software wie Procore, Sage, Viewpoint oder sogar QuickBooks mit einer AIA-Vorlage nutzen, erstellen bereits digitale PDFs. Diejenigen, die dies nicht tun, lassen sich oft mit einer einzigen E-Mail umstellen. Diese Anforderung allein steigert die Extraktionsgenauigkeit von 70-80 % auf über 95 % und eliminiert das Problem der Scan-Qualität auf der Baustelle vollständig.
3. Bündeln Sie Zahlungsanträge nach Abrechnungszyklus. Die Bauabrechnung erfolgt in monatlichen Zyklen – alle Zahlungsanträge treffen in einem 48-Stunden-Fenster um den 25. herum ein. Die Verarbeitung des gesamten Abrechnungsloses auf einmal liefert eine Tabelle mit allen G702-Zusammenfassungen und G703-Positionen aller Subunternehmer in einer einzigen Tabelle. Der Arbeitsablauf: Laden Sie alle 20 Anträge als einen Batch hoch → KI extrahiert alle Felder → Export in eine Tabelle → Überprüfung des Einbehalts und Quervergleich der Summen. Die Zeitersparnis ergibt sich aus dem Wegfall der separaten Bearbeitung jedes einzelnen Subunternehmerantrags.
4. Überprüfen Sie stets den Einbehalt und die G702↔G703-Gesamtsumme. Selbst bei 95-98 % Genauigkeit bei digitalen Formularen stellt ein falsch gelesener Einbehaltssatz bei 20 Subunternehmern ein echtes finanzielles Risiko dar. Der praktische Arbeitsablauf: KI extrahiert alle Felder → Sie überprüfen die drei wichtigsten Zahlen (Einbehalt %, aktuelle Zahlungsforderung, Übereinstimmung der G702↔G703-Summen) → genehmigte Anträge werden weitergeleitet. So wird aus einer 45-minütigen Dateneingabe pro Antrag eine 2-3-minütige Überprüfungsaufgabe pro Antrag.
5. Nutzen Sie Spaltenextraktion, nicht Ganzseiten-OCR. OCR wandelt die gesamte G702/G703 in einen undifferenzierten Textblock um – jede Feldbezeichnung, jede Position, jede Fußnote verschmilzt zu einem fortlaufenden Text. Sie müssen dann manuell herausfinden, welche Zahl die Vertragssumme und welche die aktuelle Zahlungsforderung ist. Die Spaltenextraktion erzeugt eine Tabelle, in der „Vertragssumme bis heute“ in einer eigenen Spalte mit genau einem Wert steht – und sonst nichts. Das Ausgabeformat ist das Prüfformat.
Praktische Beispiele: Wie KI-basierte G702/G703-Extraktion den Workflow verändert
Monatliche Abschlagsrechnungsbearbeitung beim Generalunternehmer
Ein mittelgroßer GU mit drei Gewerbeprojekten erhält bis zum 25. jedes Monats 18 Nachunternehmer-Abschlagsrechnungen. Jede Rechnung enthält eine G702-Zusammenfassung und ein G703-Fortsetzungsblatt mit durchschnittlich 30 Positionen auf 5 Seiten. Der Projektbuchhalter benötigt drei volle Tage – etwa 24 Stunden – für die manuelle Erfassung der G702-Zusammenfassungsfelder und stichprobenartige Prüfung der G703-Positionen in der Zahlungsverfolgungstabelle. Die Überprüfung von Einbehalten und G702/G703-Summen kostet weitere 4 Stunden.
KI-Extraktion reduziert den Datenerfassungsschritt auf unter 15 Minuten: Laden Sie alle 18 Anträge als einen Batch hoch, definieren Sie die G702- und G703-Spalten einmal, erhalten Sie eine einzige Tabelle mit allen Daten der 18 Nachunternehmer. Die Rolle des Buchhalters wechselt von der Dateneingabe zur Ausnahmebehandlung – Prüfung der Einbehaltsprozentsätze, Kontrolle der zwei oder drei größten Positionen pro NU und Markierung der ein oder zwei Anträge, bei denen die G703-Summen nicht mit der G702 übereinstimmen. Der Zeitaufwand sinkt von ~28 Stunden auf etwa 3 Stunden, und die geistige Kapazität verlagert sich von Transkription auf Verifikation.
Prüfung von Nachunternehmer-Abschlagsrechnungen
Ein Spezialnachunternehmer – ein Elektroinstallateur – reicht monatlich Abschlagsrechnungen bei fünf verschiedenen Generalunternehmern ein, wobei jeder GU seine eigene Version des AIA-Formulars verwendet (manche auf G702/G703, manche auf GU-spezifischen Abschlagsrechnungsvorlagen). Die Büroleiterin des Elektroinstallateurs gibt dieselben Leistungsverzeichnisdaten manuell in fünf verschiedene Formate ein – eine Aufgabe, die etwa 45 Minuten pro Antrag dauert und Übertragungsfehler verursacht, die die Zahlungsfreigabe verzögern.
KI-Extraktion funktioniert umgekehrt: Die Büroleiterin lädt einen einzigen ausgefüllten G702/G703-Satz hoch, definiert die Ausgabespalten und erhält eine Tabelle mit allen Werten. Wenn ein GU ein anderes Format verlangt, befüllen die extrahierten Daten die neue Vorlage – die KI hat einmal gelesen, und die Daten fließen dorthin, wo sie benötigt werden. Für das breitere Spektrum der Formatvielfalt bei Nachunternehmerrechnungen siehe wie die Extraktion von Baurechnungen Nicht-AIA-Formate verarbeitet.
Prüfung der Baukostenabrufe
Ein Baufinanzierer, der ein 12-Millionen-Dollar-Gewerbeprojekt finanziert, benötigt vor der Freigabe des nächsten Monatsabrufs eine Prüfung der Auszahlungsunterlagen. Jede Auszahlungsmappe enthält 12–15 Nachunternehmer-Zahlungsanträge mit G702/G703-Formularen sowie Sicherungseinbehaltsverzichte. Der Analyst des Kreditgebers benötigt zwei Tage, um die G702-Zusammenfassungsdaten in die Kreditüberwachungstabelle einzutragen und zu prüfen, ob der beantragte Abrufbetrag mit den zertifizierten Zahlungsanträgen übereinstimmt.
Die KI-Extraktion verarbeitet die gesamte Auszahlungsmappe in unter 10 Minuten und erstellt eine Tabelle mit allen G702-Feldern jedes Nachunternehmers. Die Aufgabe des Analysten verlagert sich auf die wirklich relevante Prüfung: Bestätigung, dass die Sicherungseinbehaltsverzichte mit den Zahlungsbeträgen übereinstimmen, Abgleich des Abrufbetrags mit den G702-Summen und Kennzeichnung von Nachunternehmern, deren Einbehalt nicht dem vertraglichen Satz entspricht. Die Prüfung bleibt menschlich – aber die Transkriptionsebene, die 85 % der Zeit des Analysten beanspruchte, entfällt vollständig.
FAQ
Kann KI handschriftliche Einträge auf G702- und G703-Formularen lesen?
Teilweise. Bei klarer Blockschrift mit dunkler Tinte auf sauberen Vordrucken erreicht die KI eine Genauigkeit von 75–85 %. Bei unleserlicher Schreibschrift oder Kugelschreiber auf Durchschlagpapier sinkt die Genauigkeit unter 70 % – dann ist die manuelle Eingabe möglicherweise effizienter als die Prüfung. Für Nachunternehmer, die durchgängig handschriftliche Zahlungsanträge einreichen, ist die Anforderung digital ausgefüllter PDFs der wirkungsvollere Ansatz als die Jagd nach marginalen Verbesserungen der Handschrifterkennung.
Kann KI mehrseitige G703-Fortsetzungsblätter verarbeiten?
Ja. Moderne tabellenbewusste Extraktion verfolgt Positionen über Seitenumbrüche hinweg – ein Kostenstelle, die auf Seite 2 beginnt und auf Seite 3 fortgesetzt wird, wird als ein durchgehender Eintrag erfasst. Die KI liest alle G703-Seiten als ein einziges logisches Dokument, anstatt jede Seite als unabhängige Datei zu behandeln. Die Spaltensemantik („In diesem Zeitraum ausgeführte Arbeiten“ vs. „Bisher ausgeführte und eingelagerte Arbeiten insgesamt“) bleibt über alle Seiten hinweg konsistent, sodass die Ausgabetabelle unabhängig von der Seitenanzahl des G703 eine Zeile pro Position enthält.
Versteht KI die Rückbehaltsberechnung auf dem G702?
Die KI extrahiert den Rückbehaltsprozentsatz (Zeile 5a) und den Rückbehaltsbetrag (Zeile 5b) als separate, unabhängige Felder. Sie berechnet nicht den einen aus dem anderen und prüft auch nicht deren Konsistenz. Hat der Subunternehmer 10 % in Zeile 5a eingetragen, den Betrag aber falsch berechnet, extrahiert die KI beide Werte unverändert. Die Prüfung der korrekten Berechnung bleibt Aufgabe des Projektbuchhalters – die Extraktion liefert die Daten, nicht die Prüfung.
Kann die KI prüfen, ob die Summen des G703 mit der G702-Zusammenfassung übereinstimmen?
Nein. Die KI extrahiert die Summen beider Formulare unabhängig voneinander und gibt sie in dieselbe Tabelle aus. Sie vergleicht die Einzelpostensummen des G703 nicht mit dem Feld „Gesamtsumme fertiggestellt und bisher gelagert“ des G702. Die nebeneinander angeordnete Ausgabe erleichtert einem menschlichen Prüfer den Vergleich – beide Zahlen landen in derselben Zeile –, aber das Tool zeigt keine Abweichungen an. Die Querverweisprüfung ist eine Aufgabe der Projektsteuerung, nicht der Datenextraktion.
Wie genau ist die Erkennung bei digitalen im Vergleich zu gescannten G702-Formularen?
Bei sauberen, digital erstellten G702/G703-PDFs – ausgefüllt mit PDF-Formularfeldern, Procore, Sage 300 CRE oder Ähnlichem – erreicht die KI eine feldspezifische Genauigkeit von 95–98 % für strukturierte Felder (Beträge, Daten, Prozentsätze). Bei mit Flachbettscannern gescannten gedruckten Formularen mit 300 dpi sinkt die Genauigkeit auf 85–92 %. Bei niedrig aufgelösten Scans von Baustellen-Multifunktionsdruckern (150 dpi oder weniger) sind 65–75 % Genauigkeit zu erwarten. Bei mehrfach kopierten Vorlagen mit schlechter Druckqualität fällt die Genauigkeit auf 50–65 %. Die wirksamste Einzelmaßnahme ist die Anforderung digitaler PDF-Originale von den Subunternehmern.
Kann die KI G702/G703-Formulare verschiedener Subunternehmer in einem Durchgang verarbeiten?
Ja. Da die semantische Extraktion nach der Feldbedeutung und nicht nach einer festen Position liest, können Sie Zahlungsanträge von 20 verschiedenen Subunternehmern hochladen – einige als saubere PDFs, andere als gescannte Formulare, manche mit handschriftlichen Einträgen – und in einem einzigen Durchgang dieselben G702-Felder aus allen extrahieren. Die KI findet „Aktuelle fällige Zahlung“, egal ob sie genau an der von der AIA-Vorlage vorgesehenen Stelle steht oder durch die PDF-Software des Subunternehmers leicht verschoben wurde. Die Stapelverarbeitung macht den Unterschied zwischen der Prüfung einer einzigen Tabelle und dem Abgleich von 20 separaten Extraktionen aus.
Unterscheidet sich die G702/G703-Extraktion von der Standard-Rechnungs-OCR?
Ja, in drei wesentlichen Punkten. Erstens ist die G702/G703 strukturell ein Zahlungsantrag – keine Rechnung – mit Fortschrittsabrechnungs-Mathematik (kumulative vs. periodenspezifische Werte), separat vom Zahlungsbetrag geführtem Sicherheitseinbehalt und mehrseitigen Positionstabellen, die mit einer Zusammenfassungsseite abgeglichen werden müssen. Zweitens führt die Vielfalt der Ausfüllmethoden (PDF-Formularfelder, ausgedruckt und gescannt, aus Excel-Vorlage in PDF gedruckt, handschriftlich) trotz des AIA-Standards zu mehr Formatvariationen als bei Standardrechnungen. Drittens sind die Prüfanforderungen strenger – ein falsch erfasster Sicherheitseinbehalt bei einer Standardrechnung ist ein Buchhaltungsfehler; bei einer G702 ist es ein vertraglicher Compliance-Verstoß. Für eine tiefergehende Betrachtung dieser Unterschiede siehe was die Extraktion von Baurechnungen umfasst.