Der GC-Leitfaden zur Dokumentenextraktion:
Rechnungen, COIs, AIA-Zahlungsanträge
Ein mittelgroßer Generalunternehmer mit drei laufenden Projekten bearbeitet monatlich rund 200 Dokumente, die außerhalb seiner Projektmanagement-Plattform eingehen – Subunternehmerrechnungen, COI-Bescheinigungen, AIA-G702-Zahlungsanträge, tägliche Bauberichte, Sicherheitsverzichte und Nachtragsaufträge. Die meisten dieser Dokumente kommen als PDF-Anhänge per E-Mail, und die daraus extrahierten Daten werden meist manuell in Sage 300 CRE oder Viewpoint eingegeben. Die Frage, die dieser Leitfaden beantworten soll, lautet nicht „Sollten Sie das automatisieren?“, sondern vielmehr: Welche Tools decken tatsächlich die gesamte Bandbreite der Dokumente ab, die ein GC verarbeitet – und welche lösen nur einen Teil des Problems und überlassen den Rest der Tastatur Ihres AP-Sachbearbeiters?
Wichtige Erkenntnisse
- Bei einem mittelgroßen Generalunternehmer treffen monatlich 200 Dokumente außerhalb der Projektmanagement-Plattform ein – Rechnungen, COIs, AIA-Zahlungsanträge, Tagesberichte, Nachträge – und jedes Feld auf jeder Seite wird von jemandem, der 25 Dollar pro Stunde verdient, manuell in Sage oder Viewpoint übertragen.
- Mehr als 90 % der COI-Bescheinigungen von Auftragnehmern erfüllen die vertraglichen Versicherungsanforderungen in wesentlichen Punkten nicht – und die aus diesen PDFs abgetippte Compliance-Tabelle kann nicht erkennen, dass ein aufgeführtes Endorsement die Deckung für abgeschlossene Arbeiten ausschließt.
- Alle sechs Dokumenttypen werden über dieselbe spaltenbasierte Oberfläche in ImageToTable.ai extrahiert: Sie benennen die benötigten Felder, und die KI findet die Werte anhand ihrer Bedeutung – so verarbeitet dasselbe Setup einen gedruckten AIA G702-Zahlungsantrag ebenso wie einen handschriftlichen Tagesbericht vom Klemmbrett des Bauleiters.
Der Dokumenten-Dschungel, den in Bau-Software-Demos keiner erwähnt
Gehen Sie durch den AP-Eingang einer Generalunternehmung mit 30 Millionen Dollar Jahresumsatz oder mehr, und Sie finden dieselben Dokumente, Monat für Monat, in denselben verstreuten Formaten. Eine QuickBooks-Subunternehmerrechnung des Elektrikers – Lieferantenname fett oben, Positionen in einer generischen Tabelle, Sicherheitseinbehalt außerhalb der Tabelle berechnet. Ein AIA G702-Zahlungsantrag des Beton-Subunternehmers – ein standardisiertes Formular mit neun beschrifteten Feldern, darunter Vertragssumme bis heute, insgesamt abgeschlossen & gelagert bis heute, Sicherheitseinbehalt und fälliger Zahlungsbetrag, begleitet von einem G703-Fortsetzungsblatt, das jede Position in eine eigene Zeile aufteilt. Eine ACORD 25-Versicherungsbescheinigung des HLK-Subunternehmers – mit Policennummer, Versicherer, Deckungssummen, Gültigkeits- und Ablaufdaten, Status als zusätzlicher Versicherter und Kontrollkästchen für Verzicht auf Regress, von denen die Tabelle nichts gegen die tatsächliche Police prüfen kann. Ein täglicher Baubericht des Bauleiters – Mitarbeiterzahl, Stunden nach Gewerk, Geräte-IDs, Materiallieferungen, Sicherheitshinweise, alles handschriftlich auf Kohlepapier. Ein bedingter Verzicht auf Sicherungseinbehalt des Trockenbau-Subunternehmers – unterschrieben, notariell beglaubigt, wartend auf Einreichung vor dem nächsten Zahlungsabschnitt. Eine Nachtragsänderung des Bauherrn, handschriftlich in den Randnotizen vermerkt.
Sechs Dokumententypen. Sechs verschiedene Formate. Sechs verschiedene Quellen. Keines davon stammt aus dem eigenen System des GU – Procore, Viewpoint, CMiC, Sage, Foundation – keines dieser Plattformen hat diese Dokumente erstellt. Sie kamen von außen. Und die Person, die dafür verantwortlich ist, die Daten aus diesen sechs PDFs in die Kostenverfolgungstabelle zu übertragen, verdient nicht 150 Dollar pro Stunde. Sie verdient 25 Dollar pro Stunde und macht Strg+C, Strg+V, dreißig Mal pro Dokument, am 25. jedes Monats.
Das ist keine Technologielücke. Es ist eine Formatlücke. Die Plattformen, die im Bauwesen eingesetzt werden, sind für interne Arbeitsabläufe konzipiert – Verpflichtungen, Nachunternehmerfreigaben, Leistungsanfragen, Änderungsaufträge. Sie wurden nie dafür entwickelt, Dokumente von externen Parteien mit externer Software zu empfangen und zu interpretieren. Deshalb gibt es die Datenerfassungsabteilung immer noch zwischen dem E-Mail-Posteingang und dem ERP, selbst bei Bauunternehmen, die Procore mit vollständiger Integration in Sage 300 CRE nutzen.
Wenn Sie eine Dokumentenerfassungssoftware für ein Bauunternehmen evaluieren, ist dies die Tatsache, die jede Entscheidung leiten sollte. Das von Ihnen gewählte Tool muss die Lücke zwischen den tatsächlich von Ihren Nachunternehmern gesendeten Dokumenten und den tatsächlich von Ihrem ERP benötigten Daten schließen – über alle Dokumenttypen hinweg, nicht nur Rechnungen. Denn niemandes Nachunternehmer senden nur Rechnungen.
Warum ein AP-Automatisierungstool für 499 €/Monat im Bauwesen mehr kostet, als es spart
Enterprise-AP-Automatisierungstools sind für eine Welt gebaut, in der jeder Lieferant eine Standardrechnung in einem erkennbaren Format mit einer Bestellnummer sendet, die mit einem Eintrag im System des Käufers übereinstimmt. In dieser Welt kaufen Sie für 499 bis 2.000 € pro Monat automatisierten Drei-Wege-Abgleich, Genehmigungsrouting und direkte ERP-Integration. Im Bauwesen existiert diese Welt nicht.
Bauprojekte haben vier Besonderheiten, die das Standard-AP-Automatisierungsmodell durchbrechen. Erstens variiert die Rechnung selbst radikal – ein Subunternehmer reicht einen AIA G702/G703-Zahlungsantrag mit einer Leistungsaufstellung ein, ein anderer schickt eine einseitige QuickBooks-Rechnung mit handschriftlichem Änderungsauftrag am Rand. Zweitens ist der Abgleich nicht zwei- oder dreistufig – es ist ein Dreifachabgleich plus eine Pfandverzichtserklärung plus eine COI-Fälligkeitsprüfung, was funktional eine fünfstufige Compliance-Hürde vor jeder Zahlung ergibt. Drittens sind die zu prüfenden Mengen keine diskreten Einheiten, die im Lager gezählt werden – es sind Teilleistungen, eingelagerte Materialien und Fortschrittsprozentschätzungen, die eine Baustellenbestätigung des Bauleiters erfordern, keinen Barcode-Scan. Viertens kann das Dokument selbst ein mit dem Handy auf der Baustelle aufgenommenes Foto sein, keine maschinell erstellte PDF mit strukturierten Metadaten.
Ein 499 $/Monat-AP-Tool, das Rechnungen und sonst nichts verarbeitet, löst nur den kleinsten Teil dieses Problems. Die COI für denselben Subunternehmer wird immer noch manuell in die Compliance-Tabelle eingetippt. Der Tagesbericht des Vorarbeiters wartet immer noch darauf, dass jemand im Büro die Arbeitsstunden in die Lohnabrechnung überträgt. Die Pfandverzichtserklärung wird immer noch abgelegt, ohne dass jemand prüft, ob der Verzichtsbetrag mit dem Rechnungsbetrag übereinstimmt. Die AIA G702 des Beton-Subunternehmers – mit den Feldern Vertragssumme bis heute, Einbehalt und aktuelle Zahlungsfälligkeit – wird immer noch manuell in den Auszahlungsplan in Viewpoint oder Sage eingegeben.
Das ist die versteckte Kostenfalle von Einzweck-Tools im Baugewerbe: Sie erzeugen eine trügerische Fortschrittsillusion, während die vier anderen Dokumenttypen, die über die Rentabilität eines Projekts entscheiden, völlig unbeachtet bleiben. Die 499 $ sind nicht verschwendet – Rechnungen werden schneller bearbeitet –, aber die gesamte Dokumentenlast verändert sich kaum. Der PM- oder AP-Sachbearbeiter verbringt weiterhin 15 Stunden im Monat damit, Daten aus Dokumenten abzutippen, die das neue Tool nicht anfasst. Für eine umfassendere Bewertung eines Tools über mehrere Dimensionen hinweg siehe unser Bewertungsframework für Dokumentenextraktion.
Sechs Dokumenttypen, eine Extraktions-Engine: Worauf es bei der Bewertung wirklich ankommt
Die zentrale Frage bei der Bewertung eines Dokumentenextraktionstools für das Baugewerbe lautet nicht: „Wie genau ist die Rechnungsextraktion?“, sondern: „Kann ich mit demselben Tool Daten aus einer Subunternehmerrechnung, einer COI-Bescheinigung, einem AIA-Zahlungsantrag, einem täglichen Baubericht, einem Verzichtserklärung und einer Nachtragsänderung extrahieren – ohne Plattformwechsel, separate Integrationen oder Schulung der Mitarbeiter für sechs verschiedene Oberflächen?“
Diese Frage ist strukturell die richtige. Bauunternehmen verarbeiten nicht 200 Rechnungen pro Monat und separat 50 COIs. Sie verarbeiten 200 Dokumente, die monatsweise eingehen, jeweils mit unterschiedlichen zu extrahierenden Feldern, unterschiedlichen Zielsystemen und unterschiedlichen Compliance-Hürden. Ein Tool, das diese als separate Workflows behandelt – ein System für AP, ein weiteres für Versicherungs-Compliance, ein drittes für Tagesberichte –, zementiert die Fragmentierung, die manuelle Dateneingabe ohnehin schon mit sich bringt – nur mit zusätzlichen Software-Abonnementkosten.
Hier sind die sechs Dokumenttypen, die ein Extraktionstool für das Baugewerbe abdecken sollte, mit den Feldern, die ein Generalunternehmer tatsächlich benötigt:
| Dokumenttyp | Wichtige Felder | Weiterleitung an |
|---|---|---|
| Subunternehmer-Rechnung | Sub-Name, Auftragsnummer, Kostenstelle, Rechnungsbetrag, Einbehalt, Nettobetrag, Rechnungsdatum | Kreditoren in Sage 300 CRE / Viewpoint / Foundation |
| AIA G702/G703 Zahlungsantrag | Vertragssumme bisher, Fertigstellung bisher, Einbehalt (5a/5b), aktuelle Zahlung, Restbetrag, Nachtragsaufträge | Zahlungsplan / Auftragskostenbuch |
| VSN (ACORD 25) | Polizzennummer, Versicherer, Deckungsart, Höchstbetrag pro Schadenfall, Jahreshöchstbetrag, Beginn, Ablauf, Zusätzlicher Versicherter J/N, Verzicht auf Regress J/N | Compliance-Tabelle / VSN-Tracker |
| Täglicher Feldbericht | Datum, Wetter Vorm./Nachm., Mitarbeiter, Stunden nach Gewerk, Geräte-IDs, gelieferte Materialien, erledigte Arbeiten, Sicherheitsvorfälle | Tagesprotokoll / Lohnabrechnung / Produktionsverfolgung |
| Pfandverzichtserklärung | Antragsteller, Stichtag, Verzichtstyp (bedingt/unbedingt), Zahlungsbetrag, Projektname, Unterschrift vorhanden J/N | Pfandverzichtsprotokoll / Auszahlungspaket |
| Nachtragsauftrag | NA-Nummer, Beschreibung, Kostenauswirkung, Terminauswirkung, Genehmigungsdatum, Unterschriften vorhanden | Nachtragsprotokoll / Budgetverfolgung |
Die entscheidende Fähigkeit, die ein Tool für alle sechs Dokumenttypen nutzbar macht, sind keine vorgefertigten Vorlagen. Vorgefertigte Vorlagen für ein AIA G702 sind nutzlos, wenn ein Subunternehmer eine nicht standardisierte Rechnung oder einen handschriftlichen Tagesbericht einreicht. Entscheidend ist die Fähigkeit der Extraktions-Engine, Felder anhand ihrer semantischen Bedeutung zu lokalisieren – „Finde den aktuellen Zahlungsbetrag in diesem Dokument“ – und nicht anhand ihrer Position auf einem bekannten Formular. Dies ist der Unterschied zwischen vorlagenbasierter OCR und KI-gestützter semantischer Extraktion. Eine Vorlage bildet ein Rechteck auf einem bestimmten Formular ab. Semantische Extraktion liest das Dokument und lokalisiert das Feld, das „fälliger Betrag für diesen Zeitraum“ bedeutet, unabhängig davon, wo es sich befindet oder wie es bezeichnet ist.
ImageToTable.ai verwendet einen anderen Ansatz, um diese Flexibilität zu erreichen: Benutzerdefinierte Spaltenextraktion. Anstatt Vorlagen zu trainieren oder Felder mit Rechtecken zu markieren, geben Sie die gewünschten Spaltennamen ein – „Subunternehmername“, „Policennummer“, „Deckungssumme pro Schadensfall“, „Netto fällig“ – und die KI liest jedes Dokument, um die Werte zu finden, die diesen Feldnamen entsprechen, und gibt sie in einer Tabelle mit genau diesen Spaltenüberschriften aus. Dieselbe Oberfläche verarbeitet ein AIA G702, eine COI und eine Subunternehmerrechnung – Sie ändern lediglich die Spaltennamen für jeden Dokumenttyp. Kein Vorlagentraining, keine positionsbasierte Feldzuordnung, keine Einrichtung pro Dokumenttyp außer der Benennung der benötigten Spalten.
Dateien werden sicher verarbeitet und nicht gespeichert.
Die Demo oben zeigt den Rechnungsworkflow mit einer Rechnungsvorlage, aber derselbe Spaltenbenennungsmechanismus verarbeitet COIs (Police-Nr., Versicherer, Deckungssummen, Ablaufdatum), AIA-Zahlungsanträge (Auftragssumme, Einbehalt, aktuelle Zahlung) und Tagesberichte (Arbeitsstunden, Geräte-IDs, Sicherheitshinweise) – der einzige Unterschied ist, was Sie in die Spaltennamen eingeben. Da das Tool semantisch und nicht vorlagenbasiert liest, spielt es keine Rolle, ob die COI ein ACORD 25 eines nationalen Versicherers oder ein Briefkopfzertifikat eines regionalen Agenten in einem Ihnen unbekannten Format ist.
Für einen breiteren Überblick über die verfügbaren Tools in diesem Bereich und deren Vergleich siehe die Übersicht der Anbieter für Dokumentenextraktion.
Drei Bau-Workflows, bei denen Extraktion die Rechnung ändert
Die meisten Bauunternehmen benötigen keine Dokumentenextraktion, um ihre bestehenden Systeme zu ersetzen. Sie brauchen sie, um die Lücke zwischen den eingehenden Dokumenten und den bereits funktionierenden Systemen zu schließen. Hier sind die drei Workflows, in denen diese Lücke am größten ist und in denen automatisierte Extraktion die finanzielle Gleichung von einem Verwaltungskostenfaktor zu einem Kontrollmechanismus verschiebt.
Der monatliche Zahlungsabruf: Fünf-Dokumenten-Abgleich, derzeit von Hand
Jeden Monat muss ein Generalunternehmer für jeden Subunternehmer auf jedem aktiven Projekt fünf Dinge prüfen, bevor eine Abschlagszahlung freigegeben wird: (1) Der Rechnungsbetrag des Subunternehmers oder der AIA-G702-Zahlungsanforderung stimmt mit den gebundenen Kosten im Subunternehmervertrag überein, (2) die als fertig gemeldeten Arbeiten wurden vom Bauleiter vor Ort bestätigt, (3) die Einbehaltsberechnung – in der Regel 5 % oder 10 % der fertiggestellten Arbeiten gemäß AIA G702 Zeilen 5a und 5b – ist korrekt gemäß den Vertragsbedingungen, (4) die Versicherungsbescheinigung (COI) für diesen Subunternehmer ist nicht abgelaufen, und (5) ein unterschriebener Verzicht auf Pfandrecht (Lien Waiver) für den Zahlungsbetrag bis zum richtigen Datum liegt vor.
Bei einem Projekt mit 15 Subunternehmern sind das 75 Prüfschritte pro Monat – jeden Monat, für die gesamte Projektdauer. Bei einem mittelgroßen Generalunternehmer mit vier gleichzeitigen Projekten sind das 300 Prüfschritte pro Abrufzyklus. Die Daten für diese Prüfungen verteilen sich auf mindestens vier verschiedene Quellen: den Vertrag und die Kostenbindung in Procore oder Viewpoint, die Rechnung oder Zahlungsanforderung als E-Mail-Anhang, die Versicherungsbescheinigung in einer Tabelle oder einem speziellen Tracking-Tool und den Pfandrechtverzicht als signiertes PDF in einem gemeinsamen Laufwerk.
Die Dokumentextraktion ersetzt keines dieser Systeme. Sie entfernt die Tastatur dazwischen. Wenn die Extraktion den fälligen Zahlungsbetrag, den Sicherheitseinbehalt und den Subunternehmernamen aus einem AIA G702 in eine strukturierte Zeile überführt, kann diese Zeile mit der Verpflichtung in Sage abgeglichen werden. Wenn die Extraktion die Policennummer, das Ablaufdatum und die Deckungssummen aus einer COI in dieselbe Tabelle überführt, kann der Ablauf automatisch mit dem Rechnungsdatum abgeglichen werden – ohne manuelles Hin- und Herspringen zwischen PDF und Excel. Die Daten fließen weiterhin in dieselben nachgelagerten Systeme. Sie gehen nur nicht mehr durch die Finger eines Menschen.
COI-Compliance: Neun von zehn Zertifikaten sind falsch – und die Tabelle merkt es nicht
Das International Risk Management Institute hat festgestellt, dass mehr als 90 % der COI-Zertifikate von Subunternehmern die im Vertrag festgelegten Versicherungsanforderungen in wesentlicher Hinsicht nicht erfüllen. Das Dokument besagt, dass die Deckung existiert. Die tatsächliche Police – dem Generalunternehmer unbekannt – stimmt nicht überein.
Der typische COI-Tracking-Workflow verschärft dieses Problem. Ein Subunternehmer leitet ein COI-PDF von seinem Versicherungsmakler weiter. Der Projektkoordinator des Generalunternehmers öffnet das PDF, liest jedes Feld – Policennummer, Versicherer, Deckungsarten, Limits, Beginn, Ablauf, Status als zusätzlich Versicherter, Verzicht auf Regress – und tippt sie in eine Tabelle. Die Tabelle hat keinen Mechanismus, um zu signalisieren, dass die angegebene Gesamtdeckung von 2 Millionen Dollar die spezifischen Gewerke des Subunternehmers ausschließen könnte oder dass die Klausel „Zusätzlich Versicherter“ (CG 20 10, nur laufende Arbeiten) eine Lücke bei abgeschlossenen Arbeiten hinterlässt (hierfür ist CG 20 37 erforderlich). Die Tabelle zeichnet auf, was das PDF sagt, und macht weiter.
Die automatisierte Extraktion aus COIs behebt nicht das zugrunde liegende Problem der Versicherungsprüfung – kein Datenextraktionstool kann überprüfen, ob ein Versicherungsnachweis tatsächlich beim Versicherer eingereicht wurde. Was es verbessert, ist die Geschwindigkeit der Datenerfassung, die den nötigen Spielraum für die eigentliche Compliance-Prüfung schafft. Wenn das Extrahieren der neun wichtigsten Felder aus einer COI 5 Sekunden statt 5 Minuten dauert, kann die Person, die zuvor Datenerfasser war, diese Zeit nun dafür nutzen, zu prüfen, ob die aufgeführten Nachträge den Vertragsanforderungen entsprechen, ob die zusätzliche Versichertenklausel auch abgeschlossene Arbeiten umfasst und ob das Ablaufdatum nicht vor der nächsten geplanten Auszahlung liegt. Das Extraktionstool verwandelt eine blinde Abschreibaufgabe in eine Compliance-Prüfungsrolle.
Tägliche Berichte zur Lohnabrechnung: Die handschriftliche Lücke, die die Automatisierung meist überspringt
Auf einer aktiven Baustelle ist der tägliche Feldbericht oft noch ein Papierformular, das der Bauleiter mit Kugelschreiber ausfüllt. Der Bericht umfasst die anwesenden Teammitglieder, die geleisteten Arbeitsstunden nach Gewerk, die verwendete Ausrüstung, die gelieferten Materialien, die abgeschlossenen Arbeiten nach Bereich sowie Sicherheitshinweise. Bis zum Ende der Woche überträgt jemand im Büro jede handschriftliche Zahl aus einem Stapel von fünf oder sechs Berichten in die Lohnabrechnung, die Auftragskostenverfolgung und das tägliche Logbuch in Procore.
Die meisten an Bauunternehmen vermarkteten Dokumentextraktionstools überspringen dies komplett – sie konzentrieren sich auf getippte PDFs und geben bei Handschrift auf. Eine auf einem Vision-Modell basierende Extraktions-Engine, die handschriftliche Teamstunden, Ausrüstungs-IDs und Materialmengen direkt von einem Handyfoto des täglichen Berichts des Bauleiters lesen kann, spart auf einem mittelgroßen Projekt etwa 45 Minuten manuelle Übertragung pro Tag. Über ein 12-monatiges Projekt sind das ungefähr 180 Stunden – oder viereinhalb Wochen Vollzeitarbeit – die damit verbracht werden, Daten neu abzutippen, die bereits auf Papier existieren.
ImageToTable.ai liest handschriftliche Felder auf Tagesberichten mit demselben spaltenbasierten Extraktionsmechanismus aus – Sie definieren Spalten wie „Mitarbeiter“, „Stunden“, „Gewerk“ und „Geräte-ID“, und die KI überträgt die handschriftlichen Werte in die entsprechenden Tabellenzellen. Kein spezielles Training, keine separate OCR-Engine, keine handschriftenspezifische Konfiguration. Es handelt sich um denselben Mechanismus, der im No-Code-Ansatz für KI-Dateneingabe beschrieben wird, und genau das macht ein einziges Tool für die gesamte Bandbreite an Baudokumententypen nutzbar – von maschinell gedruckten AIA-Formularen bis hin zu handschriftlichen Feldberichten.
Das ungelöste Sammelproblem: Dokumente von Subunternehmern überhaupt erst zu bekommen
Dokumentenextraktion setzt voraus, dass Dokumente eingetroffen sind. Im Bauwesen ist das Eintreffen selbst ein Engpass. Subunternehmer senden Rechnungen als PDF-Anhang in einer einzeiligen E-Mail. Der Projektleiter leitet sie an die Buchhaltung weiter. Die Buchhaltung fragt nach der fehlenden Versicherungsbescheinigung. Der Sub schickt die Bescheinigung eine Woche später. Der Verzichtserklärung kommt, nachdem die Auszahlung bereits bearbeitet wurde. Drei E-Mail-Threads, vier Nachfassaktionen, eine verspätete Zahlung – und der Generalunternehmer hat nichts falsch gemacht, außer in einem System zu arbeiten, in dem die Dokumentensammlung menschliche Koordination über mehrere externe Parteien erfordert, die nicht auf derselben Plattform sind.
Hier ändert eine Funktion namens Sammel-Link den Arbeitsablauf. Es handelt sich um eine teilbare URL – eine pro Projekt oder eine pro Sub, je nachdem, wie Sie es organisieren – die jeder öffnen, einen kurzen Verifizierungscode eingeben und Dokumente direkt in Ihre Verarbeitungswarteschlange hochladen kann. Keine Registrierung, kein Login, keine Softwareinstallation auf Seiten des Subs. Der Sub öffnet den Link auf seinem Handy, macht ein Foto der unterschriebenen Rechnung oder Versicherungsbescheinigung, lädt es hoch, und das Dokument landet in der Warteschlange Ihres Kontos, bereit zur Extraktion.
Für einen Generalunternehmer, der vier Projekte mit 60 Subunternehmern managt, bedeutet ein pro Sub vergebener Collection Link, dass jeder Gewerk einen einzigen Upload-Punkt für alle monatlich geschuldeten Dokumente erhält: Rechnung, COI, Sicherheitseinbehalt. Statt dass die AP drei separate E-Mails pro Sub verfolgt, legt der Sub alle drei Dokumente in denselben Link – und die Extraktion verarbeitet sie nacheinander. Der Link ersetzt nicht die E-Mail-Beziehung, beseitigt aber das Weiterleiten, die Anhangsuche und das Ping-Pong à la „Hast du das aktualisierte Zertifikat geschickt?“, das monatlich Stunden der PM- und AP-Koordinatoren frisst.
Certified Payroll, Davis-Bacon und die Compliance-Dokumente, die Prüfer tatsächlich lesen
Für jeden Generalunternehmer, der an bundesfinanzierten oder bundesgeförderten Bauprojekten arbeitet – darunter ein erheblicher Teil der Infrastruktur-, Verkehrs- und Regierungsbauprojekte in den USA – umfasst die Dokumentenlast eine zusätzliche Ebene, die private Tools ignorieren: die zertifizierte Lohnberichterstattung.
Gemäß dem Davis-Bacon and Related Acts (40 U.S.C. §§ 3141–3144) müssen Auftragnehmer und Subunternehmer bei betroffenen Projekten ortsübliche Löhne zahlen und wöchentlich zertifizierte Lohnberichte auf dem Formular WH-347 einreichen. Jeder WH-347 listet jeden Arbeiter namentlich auf, mit Klassifizierung, Stundensatz, geleisteten Stunden (Normal- und Überstunden), Bruttolohn und Abzügen – für jeden Arbeiter, jede Woche, für die gesamte Projektdauer.
Das Compliance-Risiko ist real. 2024 schloss das Arbeitsministerium über 17.000 Verfahren zu Lohn- und Arbeitszeitverstößen gegen Arbeitgeber ab – Bauunternehmen trafen dabei überproportional hohe Strafen. Ein einziger Rechenfehler auf einem WH-347 – ein falsch eingestufter Arbeiter, eine fehlende Überstunde, ein vorherrschender Lohnsatz, der nicht der Lohnfestsetzung für den jeweiligen Landkreis entspricht – kann Nachzahlungen, Strafen und in schweren Fällen den Ausschluss von künftigen Bundesaufträgen auslösen.
Die meisten Generalunternehmer erhalten geprüfte Lohnabrechnungen von Subunternehmern als PDFs oder eingescannte Papierformulare – und jemand überträgt die Daten dann manuell in Compliance-Tabellen oder Lohnabrechnungssoftware. Angesichts der im Bauwesen üblichen mehrstufigen Subunternehmerkette (GU → Sub → Sub-Sub → Materiallieferant) können bei einem einzigen Projekt pro Woche Dutzende WH-347-Formulare anfallen, jedes mit 10 bis 50 Arbeitnehmerzeilen, die alle unabhängig gegen die geltende Lohnfestsetzung geprüft werden müssen.
Extraktionstools, die WH-347-Felder lesen können – Arbeitnehmername, Einstufung, reguläre Arbeitsstunden, Überstunden, Stundenlohn, Bruttolohn, Abzüge – und in ein strukturiertes Compliance-Protokoll ausgeben, verwandeln eine Dateneingabefunktion in eine Prüffunktion. Der Compliance-Beauftragte gleicht weiterhin mit der Lohnfestsetzung ab; diese Beurteilung kann nicht automatisiert werden. Aber die Zeit, die zuvor für das Eintippen jedes Arbeitnehmernamens und jeder Arbeitsstunde in eine Tabelle aufgewendet wurde, verlagert sich auf die wertvollere Aufgabe, Einstufungsfehler und Lohnsatzabweichungen zu erkennen – genau die Arbeit, die DOL-Durchsetzungsmaßnahmen verhindert, die Baufirmen Tausende kosten.
Für kleinere Firmen, die abwägen, ob sich die Extraktion lohnt, vergleicht die Aufstellung unter Enterprise- vs. SMB-Dokumentextraktion: Funktionen die relevanten Funktionen für verschiedene Größenordnungen.
FAQ
Funktioniert die Dokumentenextraktion mit AIA G702- und G703-Formularen?
Ja. Die KI nutzt semantische Extraktion – sie findet Felder wie „Vertragssumme bis heute“, „Gesamte fertiggestellte und gelagerte Leistungen bis heute“, „Einbehalt“ und „Aktuelle Zahlungsforderung“ auf dem G702, indem sie die Bedeutung dieser Begriffe versteht, nicht durch eine feste Formularvorlage. Das funktioniert auch bei gescannten PDFs, Fotos eines ausgedruckten Formulars oder Versionen mit zusätzlichen Anmerkungen. Derselbe Ansatz verarbeitet die positionsbezogenen Aufschlüsselungen des G703-Fortsetzungsblatts. Für spezifische Extraktionsaufgaben wie das Extrahieren von Baustofflisten in Excel passt sich der spaltenbasierte Ansatz an die jeweiligen Felder im Dokument an.
Kann dasselbe Tool handschriftliche Tagesberichte und getippte COI-Formulare verarbeiten?
Ja, sofern die Extraktions-Engine auf einem Vision-Modell basiert und nicht auf traditioneller OCR. Vision-Modelle lesen Handschrift, gedruckten Text, Tabellen und Kontrollkästchen in einem Durchgang – dieselben Spaltendefinitionen, die Sie für ein getipptes COI erstellen („Versicherer“, „Polizzennummer“, „Ablaufdatum“), funktionieren auch bei einem getippten Dokument, und Spaltendefinitionen für einen Tagesbericht („Mitarbeiter“, „Stunden“, „Geräte-ID“) funktionieren bei einem handschriftlichen. Sie benötigen keine separaten Konfigurationen oder separaten Tools für handschriftliche versus gedruckte Dokumente.
Lässt sich die Extraktion in Procore, Viewpoint oder Sage 300 CRE integrieren?
Extraktionstools exportieren in der Regel nach Excel (XLSX) oder CSV, was in jedes Bau-ERP oder Projektmanagement-System importiert werden kann. Direkte API-Integrationen in Procore, Viewpoint oder Sage variieren je nach Tool und erfordern meist die Enterprise-Stufe. Für die meisten mittelgroßen Generalunternehmer sieht der praktische Workflow so aus: Dokumente hochladen → nach Excel extrahieren → prüfen und importieren. Der Zeitgewinn entsteht durch den Wegfall des manuellen Abtippens; der Importschritt dauert Sekunden, sobald die Daten strukturiert sind. ImageToTable.ai exportiert in Excel-, CSV- und JSON-Formate, die direkt in die von Ihrem ERP erwarteten Spaltenstrukturen passen.
Wie schneidet das im Vergleich zu spezieller COI-Tracking-Software ab?
Spezielle COI-Tracking-Plattformen – myCOI, Billy, Jones, TrustLayer – prüfen die Versicherungskonformität, indem sie sich mit Versicherungssystemen verbinden oder den Workflow zur Dokumentensammlung und -prüfung automatisieren. Sie sind speziell für die Versicherungskonformität entwickelt und erfüllen diese Aufgabe gut. Dokumentextraktionstools haben eine andere Funktion: Sie extrahieren die Daten aus COIs (und Rechnungen, Zahlungsanträgen und Tagesberichten) in strukturierte Formate, die in Ihr bestehendes System eingespeist werden können – einschließlich Ihrer COI-Tracking-Plattform. Für Generalunternehmer, die bereits einen COI-Tracker nutzen, entfällt durch die Extraktion das manuelle Eintippen von Policendaten in diesen Tracker. Für Generalunternehmer, die keinen nutzen, liefert die Extraktion die Datenerfassungsebene, die eine Compliance-Tabelle tatsächlich wartbar macht.
Welche Genauigkeit ist bei der Dokumentenextraktion im Bauwesen zu erwarten?
Tabellendaten auf sauberen, gut beleuchteten Dokumenten werden typischerweise mit bis zu 99% Genauigkeit extrahiert. Handschriftliche Tagesberichte mit schlechter Schrift bei schwachem Licht sind weniger genau – wie viel weniger hängt von der Lesbarkeit ab. Der realistische Maßstab für die Dokumentenextraktion im Bauwesen ist nicht 100% – sondern ob die Extraktion die durchschnittliche Dateneingabezeit pro Dokument von 3 Minuten auf etwa 15 Sekunden Prüfzeit reduziert, selbst wenn einige Felder manuell korrigiert werden müssen. Für die meisten Generalunternehmer, die monatlich über 200 Dokumente verarbeiten, bedeutet das eine Reduzierung von 10 Stunden auf etwa 50 Minuten Datenbearbeitung pro Zyklus – und die verbleibenden 50 Minuten werden für die Prüfung aufgewendet, nicht für die Neueingabe.
Kann ich für jeden Subunternehmer einen Sammlungslink erstellen, um seinen monatlichen Zahlungsantrag und die COI hochzuladen?
Ja. Sammlungslinks sind teilbare URLs, die jeder öffnen kann, um Dateien in Ihre Verarbeitungswarteschlange hochzuladen – auf der Seite des Uploaders ist kein Login oder eine Registrierung erforderlich. Sie können je nachdem, wie Sie Ihre Eingänge organisieren möchten, einen separaten Link für jeden Subunternehmer, jedes Projekt oder jeden Dokumenttyp erstellen. Ein Subunternehmer öffnet seinen Link, lädt seine Rechnungs-PDF, COI und den unterschriebenen Pfandverzicht hoch, und alle drei Dokumente erscheinen in Ihrer Warteschlange, bereit zur Extraktion. Der Link-Ansatz ist besonders nützlich für Generalunternehmer, die mehrere Projekte verwalten, bei denen Subunternehmer kommen und gehen – Sie erstellen einen Link pro aktivem Subunternehmer, anstatt ein dauerhaftes Benutzerkonto für jemanden zu verwalten, der seinen Leistungsumfang in drei Monaten abschließt.
Kann die Extraktion die Prüfung von Pfandverzichtserklärungen übernehmen – bedingt vs. unbedingt, Betragsabgleich?
Extraktionstools können die wesentlichen Felder einer Pfandverzichtserklärung – Name des Anspruchstellers, Gültigkeitsdatum, Verzichtstyp (bedingt oder unbedingt), Zahlungsbetrag und Vorhandensein einer Unterschrift – in eine strukturierte Zeile überführen. Sie können jedoch nicht eigenständig prüfen, ob der Verzichtsbetrag mit dem Rechnungsbetrag übereinstimmt; dieser Abgleich erfordert einen Menschen oder ein regelbasiertes System mit Zugriff auf beide Datenpunkte. Die Extraktion konsolidiert die Verzichts- und Rechnungsdaten in derselben Tabelle oder Datenbank, sodass der Abgleich möglich wird, ohne zwischen zwei PDFs wechseln zu müssen. Der Prüfschritt selbst bleibt eine menschliche Entscheidung – und in der Bauzahlungsabwicklung sollte das auch so sein.
Das richtige Tool zur Dokumentenerfassung für einen Generalunternehmer ist nicht das mit den meisten Funktionen. Es ist das, das die tatsächlichen Dokumententypen Ihrer Subunternehmer abdeckt – alle, nicht nur Rechnungen – ohne dass Sie für jede Dokumentenkategorie separate Tools kaufen und warten müssen. Wenn ein Tool einen handschriftlichen Tagesbericht und einen AIA G702 nicht in derselben Oberfläche verarbeiten kann, löst es nicht das Problem der Baudokumente. Es löst das Rechnungsproblem und lässt den Rest auf Ihrem Schreibtisch liegen.
Testen Sie es mit Ihren eigenen Baudokumenten – einer Rechnung, einer COI, einem Tagesbericht. Sehen Sie, ob aus drei Minuten pro Dokument zehn Sekunden werden. Starten Sie mit der kostenlosen Demo – keine Anmeldung, keine Kreditkarte, keine Vorlageneinrichtung.