Comment extraire les rapports de paie dessous-traitants pour la conformité Davis-Bacon

Sur un projet autoroutier fédéral avec 15 sous-traitants, l'administrateur paie de l'entrepreneur général fait face chaque semaine à une opération de collecte de données qui n'a rien à voir avec la compréhension des règles Davis-Bacon, mais tout à voir avec la mécanique d'extraction de données à partir de 15 documents arrivés dans 15 formats différents. Un sous-traitant envoie un export Sage 300 CRE avec des colonnes qui ne correspondent pas à la grille WH-347. Un autre envoie un PDF QuickBooks par e-mail. Un troisième — une entreprise de terrassement de deux personnes — remplit le formulaire à la main, le scanne et envoie un JPEG. La connaissance de la conformité est là. Le processus d'extraction est le goulot d'étranglement.

Arrêtez la saisie manuelle — laissez l'IA lire vos documents
Image ou PDF — données structurées en 10 secondes
Essayer maintenant
Sans inscription · Sans carte bancaire · Résultat en 10 secondes
Plans de construction et documents de projet sur un bureau — extraction de rapports de paie certifiés pour la conformité Davis-Bacon

Points clés à retenir

  1. La ROC basée sur un modèle nécessite une mise en page fixe, mais vos 15 sous-traitants envoient des rapports dans 15 formats différents.
  2. Les petits sous-traitants changent leur format de rapport dès qu'ils changent de logiciel de paie, et chaque changement de format signifie un nouveau modèle d'extraction à construire de zéro.
  3. L'extraction sémantique lit les champs WH-347 en comprenant leur signification plutôt que leur position sur la page — chaque format fonctionne dès le premier contact, sans aucun paramétrage.

Pourquoi l'extraction des données WH-347 diffère de l'extraction de paie classique

Une extraction de données de paie standard consiste à relever les noms des employés, les montants bruts et le salaire net à partir d'un bulletin de paie ou d'une feuille de temps. L'extraction est simple car les informations nécessaires correspondent directement aux champs imprimés sur le document. La paie certifiée selon la loi Davis-Bacon (40 U.S.C. §3141 et seq.) introduit trois complications structurelles qui rendent l'extraction fondamentalement plus difficile.

Premièrement, un même travailleur peut apparaître sous plusieurs classifications la même semaine. Si un menuisier travaille du lundi au mercredi sur du coffrage et du jeudi au vendredi sur de la pose de cloisons sèches, le formulaire WH-347 exige deux lignes distinctes pour ce travailleur — une pour chaque classification avec son propre taux de salaire en vigueur. Un outil d'extraction qui se contente de lire « nom du travailleur » et « heures totales » manquera cette distinction cruciale, et la soumission de conformité sera erronée car chaque classification nécessite un taux de base et une allocation de prestations sociales différents.

Deuxièmement, la structure des taux comporte deux composantes qui doivent être suivies séparément. Le salaire en vigueur Davis-Bacon se compose d'un taux horaire de base plus un taux de prestations sociales. Les entrepreneurs satisfont à l'obligation de prestations soit en cotisant à un régime de prestations légitime (retraite, assurance maladie, apprentissage), soit en versant l'équivalent en espèces directement au travailleur. La colonne 6A du WH-347 capture le taux de base, la colonne 6B capture le crédit total de prestations sociales par travailleur, et la colonne 6C capture les paiements en espèces de substitution. L'extraction doit préserver ces trois éléments, car la question de conformité — « chaque travailleur a-t-il reçu au moins le salaire en vigueur incluant les prestations sociales ? » — ne peut être répondue que lorsque ces composantes sont maintenues séparées.

Troisièmement, les règles relatives aux heures supplémentaires en vertu de la loi CWHSSA ajoutent une dimension de vérification. Les heures au-delà de 40 par semaine sur les contrats couverts doivent être payées à 1,5 fois le taux de base. Le WH-347 divise la colonne 4 en heures normales et heures supplémentaires pour chaque jour. Une extraction qui lit « heures totales » mais pas la répartition HN/HS ne peut pas soutenir la vérification de conformité qu'un auditeur du DOL effectuera — vérifier si les heures supplémentaires ont été calculées au taux correct sur les bonnes heures.

Ces trois caractéristiques structurelles — lignes multi-classifications, suivi des prestations à double taux, et répartition obligatoire HN/HS — signifient que l'extraction de la paie certifiée ne peut pas être traitée comme une tâche générique de « lire les chiffres sur la page ». L'extraction doit préserver les relations entre les champs, et pas seulement les valeurs des champs elles-mêmes.

Les points de données WH-347 qui pilotent la vérification de conformité

Avant de choisir une méthode d'extraction, il est utile de cartographier les points de données spécifiques du WH-347 qui alimentent les décisions de conformité. Le formulaire collecte environ 18 points de données par travailleur et par ligne de classification, mais sept d'entre eux sont les plus critiques lors d'un audit.

Champ WH-347ColonnePourquoi c'est important pour la conformité
Identifiant travailleur (4 derniers chiffres SSN)1EDoit rester cohérent d'une semaine à l'autre. Un travailleur qui disparaît et réapparaît avec un identifiant différent est un signal d'alarme.
Classification de main-d'œuvre3Doit correspondre à une classification du barème de salaire du projet. La mauvaise classification est la violation DBRA la plus courante.
Heures normales / supplémentaires (Quotidien × 7)4CWHSSA exige les heures sup. à 1,5× le taux de base. La ventilation quotidienne permet une vérification croisée avec les journaux d'accès au chantier.
Heures totales5Somme des heures quotidiennes. Doit être égale à heures normales + heures sup. Les erreurs arithmétiques ici se répercutent sur tous les autres calculs.
Taux de base + Crédit de fringe6A / 6BTaux de base + crédit de fringe doit être ≥ au taux de salaire en vigueur pour cette classification. Les deux valeurs sont nécessaires pour la défense en audit.
Montant brut gagné7ADoit approximativement égaler (heures normales × taux de base) + (heures sup. × taux heures sup.) + crédit de fringe. Tolérance ≤1% d'arrondi.
Déductions (FICA, Impôt, Autres)8Doivent être conformes au 29 CFR Partie 3. Les déductions non autorisées (ex. outils, uniformes) nécessitent l'approbation du DOL.

La relation de vérification la plus importante est le recoupement entre les colonnes 5, 6A, 6B et 7A : le total des heures × taux + crédit de fringe doit correspondre au montant brut dans une tolérance d'arrondi. Lorsque l'extraction préserve les sept champs indépendamment, cette vérification devient un contrôle automatisé plutôt qu'un recalcul manuel. Mais lorsque l'extraction fusionne les classifications ou supprime la répartition heures normales/supplémentaires, la vérification échoue — et la lacune de conformité que vous pensiez avoir comblée reste ouverte.

Le problème de format des sous-traitants est un problème de données, pas de conformité

L'article existant Pourquoi la paie certifiée est un cauchemar manuel pour les petits entrepreneurs détaille le défi structurel de conformité — responsabilité stricte de l'entrepreneur principal, fenêtre d'audit de 3 ans, les 611 enquêteurs couvrant 120 millions de travailleurs. Mais il identifie aussi un goulot d'étranglement plus mécanique qui mérite son propre traitement : le problème de format.

Lorsque 15 sous-traitants envoient chacun des données de paie certifiée dans un format différent, la tâche d'extraction de données de l'entrepreneur principal n'est pas un problème de connaissance de la conformité. C'est un problème de lecture de documents. Chaque format contient les mêmes champs obligatoires — nom du travailleur, classification, heures, taux, brut, déductions, net — mais les organise différemment, les étiquette différemment, et parfois les omet complètement (obligeant l'entrepreneur principal à rechercher la documentation manquante sur les avantages accessoires pendant que le délai de soumission de 7 jours s'écoule).

Les outils OCR basés sur des modèles échouent ici. Ils vous obligent à dessiner un rectangle autour de chaque champ sur une mise en page de formulaire fixe. Lorsque le rapport du sous-traitant A place « Taux de rémunération » dans le coin supérieur droit et celui du sous-traitant B dans un en-tête de colonne au milieu de la page, le modèle se brise. Vous auriez besoin d'un modèle distinct pour chaque format de sous-traitant — et les petits sous-traitants changent leur format de rapport chaque fois qu'ils changent de logiciel de paie ou de cabinet comptable, ce qui est fréquent.

Les entreprises de construction qui utilisent des logiciels de conformité dédiés comme Procore, Viewpoint Vista, Sage 300 CRE ou hh2 peuvent générer leurs propres rapports de paie certifiés directement à partir des données de saisie des heures. Mais elles ne peuvent pas contrôler le format que leurs sous-traitants renvoient. Le problème de format se situe à la frontière entre l'entrepreneur principal et ses sous-traitants, et c'est fondamentalement un problème d'extraction : comment lire les données de tout document entrant et les mapper dans une structure standard unique.

Le problème de format ne consiste pas à savoir quelles données vous avez besoin — il s'agit de lire ces données à partir de documents qui n'ont jamais été conçus pour être lus par une machine. Chaque rapport de sous-traitant contient les mêmes champs critiques pour la conformité. La difficulté est que chacun intègre ces champs dans une mise en page visuelle différente.

Comment extraire les rapports de paie certifiés par extraction sémantique IA

C'est là que l'approche d'extraction de colonnes personnalisées — décrite en détail dans notre article sur l'extraction de documents sans modèle par IA — transforme le processus d'assemblage des données pour la paie certifiée.

L'extraction de colonnes personnalisées part du résultat final. Au lieu d'analyser la mise en page d'un document et de définir des règles d'extraction champ par champ, vous indiquez à l'IA les colonnes souhaitées dans votre tableau final — « Nom du travailleur », « Classification », « Taux de base », « Taux de fringe », « Heures normales », « Heures sup. », « Montant brut » — et l'IA lit chaque rapport de sous-traitant, localise les valeurs correspondantes en comprenant leur sens, et les place dans les bonnes colonnes. La mise en page de chaque formulaire de sous-traitant importe peu, car l'IA se base sur la sémantique, pas sur les coordonnées des pixels.

Le flux d'extraction de la paie certifiée se présente ainsi :

1
Téléchargez tous les rapports WH-347 des sous-traitants — PDF, scans, photos, exports Excel. Le système de traitement par lots les accepte tous ensemble. Pas besoin de trier par format ou de renommer les fichiers.
2
Définissez vos colonnes de sortie — Saisissez les noms de colonnes correspondant à votre feuille de conformité : Nom du travailleur, 4 derniers SSN, Classification, Taux de base, Taux de fringe, Heures normales, Heures sup., Total heures, Montant brut, Déductions, Salaire net. L'IA utilise ces noms comme cibles sémantiques.
3
Laissez l'IA extraire tous les rapports — Le système traite chaque document de sous-traitant en parallèle, en appliquant les mêmes définitions de colonnes à chacun. Un export Sage, un scan manuscrit et un PDF QuickBooks produisent tous des lignes dans le même tableau de sortie.
4
Exportez vers Excel — Toutes les lignes fusionnent en un seul tableur avec une colonne par donnée. Chaque ligne inclut une colonne Nom du sous-traitant et Nom du lot pour tracer chaque donnée jusqu'à son document source.
5
Effectuez les vérifications de conformité — Utilisez les données exportées pour vérifier la concordance heures×taux, la correspondance classification-détermination salariale et l'adéquation des avantages sociaux. Voir la section suivante pour les vérifications spécifiques.

Essayez-le sur un véritable document de paie certifiée. Téléchargez un WH-347 de sous-traitant et saisissez les noms de colonnes ci-dessus — l'extraction s'exécute sans aucune configuration.

JPG/PNG/PDF Extraction IA

Les fichiers sont traités de manière sécurisée et non conservés.

Contrôles de conformité automatisés sur les données extraites

Une fois les données extraites dans un tableur structuré, la vérification de conformité passe d'une tâche manuelle à un ensemble de validations automatisées. Les colonnes extraites deviennent un tableau unique où vous pouvez exécuter les contrôles qu'un auditeur du DOL effectuerait, mais sur l'ensemble des 15 sous-traitants en quelques minutes au lieu de plusieurs heures.

Rapprochement heures × taux. Le contrôle de conformité le plus fondamental : le montant brut de chaque travailleur est-il égal à (heures ST × taux de base) + (heures SUPP × taux de base × 1,5) + crédit de fringe ? Pour un rapport de 15 travailleurs, cela représente 15 calculs manuels. Dans un tableur avec colonnes extraites, c'est une formule unique étirée sur toutes les lignes. Signalez toute ligne où l'écart dépasse 1 % et enquêtez avant soumission.

Correspondance classification-détermination salariale. Comparez chaque classification extraite avec celles listées dans la détermination salariale applicable sur SAM.gov. Si un sous-traitant déclare un travailleur comme « Manœuvre général » mais que la détermination salariale ne mentionne que « Manœuvre (commun) » et « Manœuvre (qualifié) » à des taux différents, la classification doit être clarifiée avant certification du rapport.

Cohérence des identifiants de travailleur d'une semaine à l'autre. Un travailleur apparaissant en semaine 1 avec un SSN se terminant par 4321 et en semaine 3 avec un SSN se terminant par 8765 — même nom, même entrepreneur — est un signal d'alarme pouvant indiquer une erreur de saisie ou, dans le pire des cas, un employé fictif. Les données extraites sur plusieurs semaines peuvent être croisées dans un tableau croisé dynamique pour signaler les anomalies d'identité.

Vérification des heures supplémentaires CWHSSA. Confirmez que chaque travailleur ayant dépassé 40 heures totales dans la semaine a un taux d'heures supplémentaires d'au moins 1,5 fois le taux de base inscrit dans la colonne 6A. La CWHSSA s'applique à tous les contrats principaux de plus de 100 000 $, et la pénalité pour infraction aux heures supplémentaires inclut des dommages-intérêts compensatoires égaux à la totalité du sous-paiement des heures supplémentaires — pas seulement la différence.

La valeur de l'extraction pour la conformité ne réside pas dans une lecture plus rapide des données — elle réside dans le fait de rendre les données calculables. Une pile de 15 PDF de sous-traitants ne peut être triée, filtrée ou vérifiée par formules. Un tableur avec des champs extraits peut être vérifié en le temps d'écrire quelques formules.

Quand les formulaires WH-347 manuscrits nécessitent une attention particulière

Les petits sous-traitants représentent une part importante de la main-d'œuvre sur les chantiers fédéraux, et une proportion non négligeable d'entre eux remplissent le WH-347 à la main. Une enquête de 2023 de l'Associated General Contractors of America a révélé que plus de 40 % des entreprises de construction de moins de 20 salariés préparent encore leurs registres de paie manuellement ou avec un tableur basique — sans système de paie dédié, sans module de salaire prévalent, juste du papier et un stylo.

Les rapports de paie certifiés manuscrits posent un véritable défi d'extraction. L'IA peut lire la grande majorité des écritures manuscrites — y compris l'écriture cursive et les chiffres — comme documenté dans notre guide sur les problèmes et solutions d'OCR pour l'écriture manuscrite. Mais les classifications de poste écrites dans des cases exiguës et les montants qui ressemblent à « 32,5 » ou « 32,8 » (alors que la valeur prévue est 32,57 $) sont des cas où le résultat comporte une incertitude qu'une soumission de conformité ne peut pas absorber.

L'approche pragmatique : Utilisez l'extraction pour obtenir 80 à 90 % des données dans un tableau structuré automatiquement. Effectuez ensuite une vérification ligne par ligne des entrées manuscrites — en particulier les champs de taux, les codes de classification et la signature manuscrite sur la Déclaration de conformité (qui doit être une signature originale, pas une photocopie, conformément au 29 CFR 3.3(b)). Le flux de vérification par sondage fournit un cadre pour cette étape. L'extraction vous évite de ressaisir les 15 rapports électroniques ; la vérification manuelle concentre votre attention sur les 2-3 soumissions manuscrites qui présentent le risque d'erreur le plus élevé.

Tenue de registres : les données extraites doivent être conservées pendant trois ans

Le 29 CFR 3.4 exige que les entrepreneurs conservent les registres de paie certifiés pendant au moins trois ans après l'achèvement de tous les travaux du contrat principal. Ce n'est pas une suggestion — les audits du DOL remontent systématiquement sur trois ans, et les registres manquants sont considérés comme un manquement à la conformité en soi, indépendamment des violations salariales que ces registres manquants auraient pu révéler.

Lorsque l'extraction alimente un tableur structuré, l'obligation de tenue de registres devient plus facile à satisfaire car les données sont déjà dans un format conservable. Chaque exportation par lot doit inclure les métadonnées suivantes — abordées plus en détail dans notre guide des exigences de conservation des documents — pour soutenir une future défense en cas d'audit :

  • Nom du lot et date de traitement (liens vers les documents originaux téléchargés)
  • Nom du sous-traitant et période de paie pour chaque ligne
  • Le numéro de détermination salariale avec lequel les taux extraits ont été vérifiés
  • Une colonne de notes pour toute correction manuelle effectuée lors de la vérification

Un auditeur du DOL voudra voir à la fois les formulaires WH-347 originaux et les données récapitulatives. L'extraction ne remplace pas les originaux ; elle crée la piste d'audit entre les documents bruts et la soumission de conformité.

Questions fréquentes

Puis-je extraire les données de paie certifiée d'un scan de WH-347 manuscrit ?

Généralement oui, à condition de vérifier ligne par ligne les taux et codes de classification manuscrits avant de les utiliser pour une soumission conforme. Le modèle de vision IA lit l'écriture manuscrite, y compris cursive, mais une écriture serrée dans les petites cellules du WH-347 peut produire des résultats ambigus. Un flux de travail pratique : extraire automatiquement, puis prioriser la vérification manuelle des 2-3 champs par travailleur qui impactent le plus la conformité salariale — taux de base, taux de fringe et classification.

Que faire si mon sous-traitant utilise un format que je n'ai jamais vu ?

C'est précisément le problème que résout l'extraction personnalisée de colonnes. Comme elle lit les documents en comprenant le sens de chaque colonne plutôt qu'en reconnaissant un modèle, elle traite les formats inédits dès la première utilisation. Pas besoin de l'entraîner sur un échantillon ni de créer un modèle. La première fois qu'un sous-traitant envoie un export Foundation au lieu d'un export Sage, l'IA le lit en utilisant les mêmes noms de colonnes.

L'extraction gère-t-elle les travailleurs avec plusieurs classifications la même semaine ?

Oui, tant que le formulaire du sous-traitant présente le travailleur sur des lignes distinctes pour chaque classification. L'IA conserve la structure de lignes du document. Si une seule ligne WH-347 liste un travailleur avec deux classifications et des heures combinées (ce que certains sous-traitants font incorrectement), l'extraction signalera la ligne pour vérification plutôt que de la diviser silencieusement — car la soumission conforme nécessite une ventilation précise.

Puis-je utiliser cela pour les formulaires « Little Davis-Bacon » des États ?

La même approche d'extraction personnalisée de colonnes fonctionne pour les formulaires de salaire en vigueur des États de Californie (DIR), New York (DOL), New Jersey, Pennsylvanie, Illinois et les 25 autres États ayant leurs propres lois sur les salaires en vigueur. Les définitions de colonnes restent les mêmes — identification du travailleur, classification, heures, taux, brut, déductions. L'IA s'adapte à la mise en page spécifique de chaque formulaire d'État. Cependant, les formulaires d'État comportent souvent des champs uniques (la paie certifiée DLSE de Californie, par exemple), et vous devrez peut-être les ajouter comme noms de colonnes supplémentaires.

Comment s'applique l'obligation de conservation de 3 ans aux données extraites ?

Selon le 29 CFR 3.4, les feuilles de paie certifiées originales — les formulaires WH-347 eux-mêmes — doivent être conservées pendant au moins trois ans après l'achèvement du projet. Les tableaux extraits sont un complément, pas un substitut. Une bonne pratique consiste à conserver le résultat de l'extraction avec les documents originaux téléchargés dans un dossier de projet, étiqueté avec la date du lot et le numéro de la détermination des salaires, afin qu'un auditeur puisse remonter des données récapitulatives aux documents sources.

Quelle est la différence entre l'extraction des données de paie certifiées et l'utilisation d'un logiciel de conformité comme LCPtracker ?

LCPtracker, eCOMM et les plateformes similaires sont des portails de soumission — ils acceptent les données de paie certifiées des entrepreneurs principaux et les transmettent aux agences contractantes. Ils ne résolvent pas le problème en amont de l'extraction de données à partir de rapports de sous-traitants dans différents formats. Les outils d'extraction comblent le fossé entre « une pile de rapports de sous-traitants » et « des données prêtes à être soumises ». De nombreux entrepreneurs principaux utilisent les deux : l'extraction pour assembler les données, puis un portail pour les soumettre.

De l'extraction à la soumission

La conformité des feuilles de paie certifiées en vertu du Davis-Bacon Act ne va pas se simplifier. La mise à jour réglementaire de 2023 a élargi la définition de « bâtiment ou travaux » pour inclure l'installation de la fibre optique, les infrastructures de recharge pour véhicules électriques et la construction de panneaux solaires — intégrant de nouvelles populations d'entrepreneurs dans le système Davis-Bacon. La révision du WH-347, effective en septembre 2026, ajoute des champs de suivi de l'apprentissage et des exigences de déclaration des avantages sociaux plus strictes. Plus de projets, plus de sous-traitants, plus de données à extraire chaque semaine.

La question pour l'administrateur des paies de l'entrepreneur principal n'est pas de savoir si les exigences de conformité ont du sens. Elle est de savoir si la tâche hebdomadaire d'assemblage des données — ouvrir 15 rapports dans 15 formats, ressaisir les mêmes champs dans un modèle de soumission, vérifier les mêmes calculs à chaque fois — est un coût inévitable du travail fédéral ou une lacune de processus que l'extraction peut combler.

La réponse dépend du fait que les données de ces rapports de sous-traitants restent enfermées dans des PDF et des scans, ou si elles deviennent calculables — extractibles, triables, vérifiables — dans un tableur où les contrôles automatisés peuvent être exécutés avant que la signature ne soit apposée sur la déclaration de conformité.

Télécharger un rapport de paie certifié

📮 contact email: [email protected]