Cómo extraer informes de nómina de subcontratistaspara cumplir con Davis-Bacon

En un proyecto federal de carreteras con 15 subcontratistas, el administrador de nóminas del contratista general se enfrenta cada semana a una operación de ensamblaje de datos que nada tiene que ver con entender las regulaciones Davis-Bacon y todo que ver con la mecánica de extraer datos de 15 documentos que llegaron en 15 formatos distintos. Un subcontratista envía una exportación de Sage 300 CRE con columnas que no coinciden con la cuadrícula del WH-347. Otro envía un PDF de QuickBooks por correo. Un tercero — una empresa de movimiento de tierras de dos personas — llena el formulario a mano, lo escanea y envía un JPEG. El conocimiento de cumplimiento está ahí. El proceso de extracción es el cuello de botella.

Deja de teclear datos — deja que la IA los lea por ti
Sube una imagen o PDF — datos estructurados en 10 segundos
Probar ahora
Sin registro · Sin tarjeta · Resultados en 10 segundos
Planos de construcción y documentos de proyecto sobre un escritorio — extracción de informes de nómina certificados para cumplimiento Davis-Bacon

Puntos clave

  1. El OCR basado en plantillas necesita un diseño de formulario fijo, pero tus 15 subcontratistas envían informes en 15 formatos distintos.
  2. Los subcontratistas pequeños cambian el formato de su informe cada vez que cambian de software de nómina, y cada cambio de formato implica crear una nueva plantilla de extracción desde cero.
  3. La extracción semántica lee los campos del WH-347 al entender su significado, no su posición en la página — cualquier formato funciona al primer contacto sin configuración previa.

Por qué la extracción de datos de la WH-347 es diferente a la extracción de nómina habitual

Un trabajo estándar de extracción de datos de nómina consiste en obtener nombres de empleados, montos brutos y salario neto de un talón de pago o registro horario. La extracción es sencilla porque la información necesaria se corresponde uno a uno con los campos impresos en el documento. La nómina certificada bajo la Ley Davis-Bacon (40 U.S.C. §3141 et seq.) introduce tres complicaciones estructurales que hacen que la extracción sea fundamentalmente más difícil.

Primero, un mismo trabajador puede aparecer bajo múltiples clasificaciones en la misma semana. Si un carpintero trabaja de lunes a miércoles en encofrado y de jueves a viernes en colocación de paneles de yeso, la WH-347 requiere dos filas separadas para ese trabajador — una para cada clasificación con su propia tasa de salario prevaleciente. Una herramienta de extracción que simplemente lea "nombre del trabajador" y "horas totales" pasará por alto esta distinción crítica, y la presentación de cumplimiento será incorrecta porque cada clasificación requiere una tasa base y una asignación de beneficios adicionales diferentes.

Segundo, la estructura de tarifas tiene dos componentes que deben registrarse por separado. El salario prevaleciente de Davis-Bacon consiste en una tarifa horaria base más una tarifa de beneficios adicionales. Los contratistas cumplen con la obligación de beneficios ya sea contribuyendo a un plan de beneficios de buena fe (pensión, seguro médico, aprendizaje) o pagando el equivalente en efectivo directamente al trabajador. La Columna 6A de la WH-347 captura la tarifa base, la Columna 6B captura el crédito total de beneficios adicionales por trabajador, y la Columna 6C captura los pagos en efectivo en lugar de beneficios. La extracción debe preservar los tres, porque la pregunta de cumplimiento aquí — "¿recibió cada trabajador al menos el salario prevaleciente incluyendo beneficios adicionales?" — solo puede responderse cuando estos componentes se mantienen separados.

Tercero, las reglas de horas extra bajo la Ley de Normas de Horas de Trabajo y Seguridad en Contratos (CWHSSA) añaden una dimensión de verificación. Las horas que excedan 40 en una semana en contratos cubiertos deben pagarse a 1.5 veces la tarifa base. La WH-347 divide la Columna 4 en tiempo normal y horas extra para cada día. Una extracción que lea "horas totales" pero no el desglose TN/HE no puede respaldar la verificación de cumplimiento que realizará un auditor del DOL — comprobar si las horas extra se calcularon a la tarifa correcta en las horas correctas.

Estas tres características estructurales — filas de clasificación múltiple, seguimiento de beneficios de tarifa dual y desglose requerido TN/HE — significan que la extracción de nómina certificada no puede tratarse como una tarea genérica de "leer los números de la página". La extracción debe preservar las relaciones entre los campos, no solo los valores de los campos en sí mismos.

Los puntos de datos del WH-347 que impulsan la verificación de cumplimiento

Antes de elegir un enfoque de extracción, ayuda mapear los puntos de datos específicos del WH-347 que alimentan las decisiones de cumplimiento. El formulario recopila aproximadamente 18 puntos de datos por trabajador por fila de clasificación, pero siete de ellos tienen el mayor peso en una auditoría.

Campo WH-347ColumnaPor qué es importante para el cumplimiento
ID del trabajador (últimos 4 del SSN)1EDebe mantenerse constante semana a semana. Un trabajador que desaparece y reaparece con una ID diferente es una señal de alerta.
Clasificación laboral3Debe coincidir con una clasificación en la determinación salarial del proyecto. La clasificación incorrecta es la infracción más común de la DBRA.
Horas ST / OT (Diarias × 7)4CWHSSA exige OT al 1.5× de la tarifa base. El desglose diario permite la verificación cruzada con los registros de acceso al sitio.
Horas totales5Suma de horas diarias. Debe ser igual a ST + OT. Los errores aritméticos aquí se propagan a todos los demás cálculos.
Tarifa base + Crédito de prestaciones6A / 6BLa tarifa base + el crédito de prestaciones debe ser ≥ la tarifa salarial vigente para esa clasificación. Ambos valores son necesarios para la defensa en auditoría.
Monto bruto devengado7ADebe ser aproximadamente igual a (horas ST × tarifa base) + (horas OT × tarifa OT) + crédito de prestaciones. Tolerancia ≤1% de redondeo.
Deducciones (FICA, Impuesto, Otros)8Debe cumplir con 29 CFR Parte 3. Las deducciones no autorizadas (ej., herramientas, uniformes) requieren aprobación del DOL.

La relación de verificación más importante es la verificación cruzada entre las Columnas 5, 6A, 6B y 7A: horas totales × tarifa + crédito de prestaciones debe reconciliarse con el monto bruto dentro de una tolerancia de redondeo. Cuando la extracción conserva los siete campos de forma independiente, esta verificación se convierte en un control automatizado en lugar de un recálculo manual. Pero cuando la extracción colapsa clasificaciones o elimina la división ST/OT, la verificación se rompe — y la brecha de cumplimiento que creías haber cerrado permanece abierta.

El problema del formato de los subcontratistas es un problema de datos, no de cumplimiento normativo

El artículo existente Por qué la nómina certificada es una pesadilla manual para los pequeños contratistas detalla el desafío estructural de cumplimiento — responsabilidad objetiva del contratista principal, el período de auditoría de 3 años, los 611 investigadores que cubren a 120 millones de trabajadores. Pero también identifica un cuello de botella más concreto y mecánico que merece un análisis propio: el problema del formato.

Cuando 15 subcontratistas envían datos de nómina certificada en formatos diferentes, la tarea de extracción de datos del contratista principal no es un problema de conocimiento normativo. Es un problema de lectura de documentos. Cada formato contiene los mismos campos obligatorios — nombre del trabajador, clasificación, horas, tarifas, bruto, deducciones, neto — pero los organizan de manera distinta, los etiquetan de forma diferente y, a veces, los omiten por completo (obligando al contratista principal a buscar la documentación faltante de prestaciones marginales mientras el plazo de presentación de 7 días se agota).

Las herramientas de OCR basadas en plantillas fallan aquí. Requieren dibujar un rectángulo alrededor de cada campo en un diseño de formulario fijo. Cuando el informe del Sub A tiene "Tasa de pago" en la esquina superior derecha y el informe del Sub B lo tiene en un encabezado de columna a mitad de página, la plantilla se rompe. Necesitarías una plantilla separada para cada formato de subcontratista — y los pequeños subcontratistas cambian su formato de informe cada vez que cambian de software de nómina o de firma contable, lo cual es frecuente.

Las empresas constructoras que utilizan software de cumplimiento dedicado como Procore, Viewpoint Vista, Sage 300 CRE o hh2 pueden generar sus propios informes de nómina certificada directamente desde los datos de registro de horas. Pero no pueden controlar el formato en que sus subcontratistas envían la información. El problema del formato se sitúa en el límite entre el contratista principal y sus subcontratistas, y es fundamentalmente un problema de extracción: cómo leer datos de cualquier formato de documento entrante y mapearlos en una única estructura estándar.

El problema del formato no es saber qué datos necesitas — es leer esos datos de documentos que nunca fueron diseñados para ser leídos por una máquina. Cada informe de subcontratista contiene los mismos campos críticos de cumplimiento. La dificultad es que cada uno incrusta esos campos en un diseño visual diferente.

Cómo extraer informes de nómina certificada mediante extracción semántica con IA

Aquí es donde el método conocido como Extracción de Columnas Personalizadas —descrito en detalle en nuestro artículo sobre extracción de documentos con IA sin plantillas— transforma el flujo de trabajo de ensamblaje de datos para nóminas certificadas.

La Extracción de Columnas Personalizadas trabaja desde el resultado hacia atrás. En lugar de analizar el diseño de un documento y definir reglas de extracción campo por campo, le indicas a la IA qué columnas deseas en tu tabla final —"Nombre del Trabajador", "Clasificación", "Tarifa Base", "Tarifa de Prestaciones", "Horas Normales", "Horas Extra", "Monto Bruto"— y la IA lee cada informe de subcontratista, localiza los valores correspondientes al comprender su significado y los coloca en las columnas correctas. El diseño del formulario de cada subcontratista es irrelevante porque la IA empareja por semántica, no por coordenadas de píxeles.

El flujo de trabajo de extracción de nómina certificada es el siguiente:

1
Sube todos los informes WH-347 de subcontratistas — PDFs, escaneos, fotos, exportaciones de Excel. El sistema de procesamiento por lotes los acepta todos juntos. No es necesario ordenar por formato ni renombrar archivos.
2
Define tus columnas de salida — Ingresa los nombres de columna que coincidan con tu hoja de cumplimiento: Nombre del Trabajador, Últimos 4 del SSN, Clasificación, Tarifa Base, Tarifa de Prestaciones, Horas Normales, Horas Extra, Total de Horas, Monto Bruto, Deducciones, Pago Neto. La IA usa estos nombres como objetivos semánticos.
3
Deja que la IA extraiga de todos los informes — El sistema procesa cada documento de subcontratista en paralelo, aplicando las mismas definiciones de columna a cada uno. Una exportación de Sage, un escaneo manuscrito y un PDF de QuickBooks generan filas en la misma tabla de salida.
4
Exporta a Excel — Todas las filas se fusionan en una sola hoja de cálculo con una columna por dato. Cada fila incluye una columna Nombre del Subcontratista y Nombre del Lote para que puedas rastrear cada dato hasta su documento de origen.
5
Ejecuta verificaciones de cumplimiento — Usa los datos exportados para verificar la conciliación horas×tarifa, la correspondencia entre clasificación y determinación salarial, y la adecuación de las prestaciones adicionales. Consulta la siguiente sección para las verificaciones específicas.

Pruébalo con un documento real de nómina certificada. Sube un WH-347 de subcontratista e ingresa los nombres de columna anteriores: la extracción se ejecuta sin configuración previa.

JPG/PNG/PDF Extracción IA

Los archivos se procesan de forma segura y no se almacenan.

Verificaciones automatizadas de cumplimiento sobre datos extraídos

Una vez que los datos se extraen en una hoja de cálculo estructurada, la verificación de cumplimiento pasa de ser una tarea de revisión manual a un conjunto de validaciones automatizadas. Las columnas extraídas se convierten en una única tabla donde se pueden ejecutar las comprobaciones que haría un auditor del DOL, pero en todos los 15 subcontratistas en minutos en lugar de horas.

Conciliación de horas × tarifa. La verificación de cumplimiento más fundamental: ¿el monto bruto de cada trabajador es igual a (horas normales × tarifa base) + (horas extra × tarifa base × 1.5) + crédito de prestaciones? Para un informe de 15 trabajadores, esto son 15 cálculos manuales. En una hoja de cálculo con columnas extraídas, es una sola fórmula arrastrada entre filas. Marque cualquier fila donde la variación supere el 1% e investigue antes de presentar.

Coincidencia de clasificación con determinación salarial. Compare cada clasificación extraída con las clasificaciones enumeradas en la determinación salarial aplicable de SAM.gov. Si un subcontratista reporta a un trabajador como "Obrero General" pero la determinación salarial solo enumera "Obrero (Común)" y "Obrero (Calificado)" con tarifas diferentes, la clasificación necesita aclaración antes de certificar el informe.

Consistencia de ID del trabajador entre semanas. Un trabajador que aparece en la semana 1 con SSN terminado en 4321 y en la semana 3 con SSN terminado en 8765 — mismo nombre, mismo contratista — es una señal de alerta que podría indicar un error de ingreso de datos o, en el peor caso, un empleado fantasma. Los datos extraídos de varias semanas se pueden tabular dinámicamente para detectar anomalías de identidad.

Verificación de horas extra CWHSSA. Confirme que cada trabajador que superó las 40 horas totales en la semana tenga una tarifa de horas extra igual al menos a 1.5× la tarifa base ingresada en la Columna 6A. La CWHSSA se aplica a todos los contratos principales de más de $100,000, y la penalización por violaciones de horas extra incluye daños liquidados iguales al pago insuficiente total de horas extra, no solo la diferencia.

El valor de cumplimiento de la extracción no está en leer los datos más rápido, sino en hacer que los datos sean computables. Un montón de 15 PDFs de subcontratistas no se puede ordenar, filtrar ni verificar con fórmulas. Una hoja de cálculo con campos extraídos se puede verificar en el tiempo que lleva escribir algunas fórmulas.

Cuando los formularios WH-347 manuscritos requieren cuidado adicional

Los pequeños subcontratistas representan una parte significativa de la fuerza laboral en proyectos federales, y una proporción considerable de ellos completa el WH-347 a mano. Una encuesta de 2023 de la Asociación de Contratistas Generales de América encontró que más del 40% de las empresas constructoras con menos de 20 empleados aún preparan registros de nómina manualmente o con software básico de hojas de cálculo — sin un sistema de nómina dedicado, sin módulo de salario prevaleciente, solo papel y bolígrafo.

Los informes de nómina certificados manuscritos presentan un verdadero desafío de extracción. La IA puede leer la gran mayoría de la escritura a mano — incluyendo cursiva y entradas numéricas — como se documenta en nuestra guía sobre problemas y soluciones de OCR para escritura a mano. Pero las clasificaciones de trabajo escritas en espacios reducidos y cifras de tarifas que parecen "32.5" o "32.8" (cuando el valor previsto es $32.57) son casos donde el resultado conlleva una incertidumbre que una presentación de cumplimiento no puede absorber.

El enfoque pragmático: Use la extracción para obtener automáticamente el 80-90% de los datos en una tabla estructurada. Luego realice una revisión línea por línea de las entradas manuscritas — especialmente los campos de tarifas, códigos de clasificación y la firma manuscrita en la Declaración de Cumplimiento (que debe ser una firma original, no una fotocopia, según 29 CFR 3.3(b)). El flujo de trabajo de verificación por muestreo proporciona un marco para esta etapa. La extracción le evita volver a teclear los 15 informes electrónicos; la revisión manual enfoca su atención en las 2-3 presentaciones manuscritas que conllevan el mayor riesgo de error.

Mantenimiento de registros: los datos extraídos deben conservarse durante tres años

29 CFR 3.4 exige que los contratistas conserven los registros de nómina certificados durante al menos tres años después de que se complete todo el trabajo en el contrato principal. Esto no es una sugerencia: las auditorías del DOL suelen abarcar tres años atrás, y los registros faltantes se tratan como un incumplimiento en sí mismos, independientemente de las violaciones salariales que los registros faltantes podrían haber revelado.

Cuando la extracción alimenta una hoja de cálculo estructurada, el requisito de mantenimiento de registros se vuelve más fácil de cumplir porque los datos ya están en un formato preservable. Cada exportación por lote debe incluir los siguientes metadatos — cubiertos con más profundidad en nuestra guía de requisitos de retención de documentos — para respaldar la defensa en futuras auditorías:

  • Nombre del lote y fecha de procesamiento (vincula a los documentos originales cargados)
  • Nombre del subcontratista y período de nómina para cada fila
  • El número de determinación salarial contra el cual se verificaron las tarifas extraídas
  • Una columna de notas para cualquier corrección manual realizada durante la revisión

Un auditor del DOL querrá ver tanto los formularios WH-347 originales como los datos resumidos. La extracción no reemplaza los originales; crea la pista de auditoría entre los documentos sin procesar y la presentación de cumplimiento.

Preguntas Frecuentes

¿Puedo extraer datos de nómina certificada de un escaneo de un WH-347 manuscrito?

Generalmente sí, pero con la salvedad de que las cifras de tarifas y los códigos de clasificación escritos a mano deben verificarse línea por línea antes de usarlos para la presentación de cumplimiento. El modelo de visión de IA lee la escritura a mano, incluida la cursiva, pero la escritura apretada en las pequeñas celdas de la cuadrícula del WH-347 puede producir resultados ambiguos. Un flujo de trabajo práctico: extraer automáticamente, luego priorizar la revisión manual en los 2-3 campos por trabajador que más afectan el cumplimiento salarial: tarifa base, tarifa adicional y clasificación.

¿Qué pasa si mi subcontratista usa un formato que nunca he visto antes?

Ese es el problema específico que la Extracción de Columnas Personalizadas está diseñada para resolver. Debido a que lee documentos comprendiendo el significado de cada columna en lugar de reconocer una plantilla, maneja formatos no vistos desde la primera exposición. No necesita entrenarlo con una muestra ni crear una plantilla. La primera vez que un subcontratista envía una exportación de Foundation en lugar de una de Sage, la IA la lee usando los mismos nombres de columna.

¿La extracción maneja trabajadores con múltiples clasificaciones en la misma semana?

Sí, siempre que el formulario del subcontratista muestre al trabajador en filas separadas para cada clasificación. La IA conserva la estructura de filas que encuentra en el documento. Si una sola fila del WH-347 enumera un trabajador con dos clasificaciones y horas combinadas (lo que algunos subcontratistas hacen incorrectamente), la extracción marcará la fila para revisión en lugar de dividirla silenciosamente, porque la presentación de cumplimiento necesita un desglose preciso.

¿Puedo usar esto para formularios estatales "Little Davis-Bacon"?

El mismo enfoque de Extracción de Columnas Personalizadas funciona para formularios de salarios prevalecientes estatales de California (DIR), Nueva York (DOL), Nueva Jersey, Pensilvania, Illinois y los otros 25 estados con sus propias leyes de salarios prevalecientes. Las definiciones de columna siguen siendo las mismas: identificación del trabajador, clasificación, horas, tarifas, bruto, deducciones. La IA se adapta al diseño específico de cada formulario estatal. Sin embargo, los formularios estatales a menudo tienen campos únicos (la nómina certificada DLSE de California, por ejemplo), y es posible que deba agregarlos como nombres de columna adicionales.

¿Cómo aplica el requisito de conservación de 3 años a los datos extraídos?

Según 29 CFR 3.4, los registros originales de nómina certificada (los formularios WH-347) deben conservarse al menos tres años después de finalizar el proyecto. Las hojas de cálculo extraídas son complementarias, no un reemplazo. Una buena práctica es guardar el resultado de la extracción junto con los documentos originales cargados en una carpeta del proyecto, etiquetada con la fecha del lote y el número de determinación salarial, para que un auditor pueda rastrear desde los datos resumidos hasta los documentos fuente.

¿Cuál es la diferencia entre extraer datos de nómina certificada y usar software de cumplimiento como LCPtracker?

LCPtracker, eCOMM y plataformas similares son portales de envío: aceptan datos de nómina certificada de contratistas principales y los remiten a las agencias contratantes. No resuelven el problema upstream de extraer datos de informes de subcontratistas en diferentes formatos. Las herramientas de extracción llenan el vacío entre "un montón de informes de subcontratistas" y "datos listos para enviar". Muchos contratistas principales usan ambas: extracción para ensamblar los datos y un portal para enviarlos.

De la Extracción al Envío

El cumplimiento de nómina certificada bajo la Ley Davis-Bacon no se va a simplificar. La actualización regulatoria de 2023 amplió la definición de "edificio u obra" para incluir instalación de banda ancha, infraestructura de carga para vehículos eléctricos y construcción de paneles solares, incorporando nuevas poblaciones de contratistas al sistema Davis-Bacon. La revisión del WH-347, vigente desde septiembre de 2026, añade campos de seguimiento de aprendizaje y requisitos más estrictos de declaración de beneficios complementarios. Más proyectos, más subcontratistas, más datos que extraer cada semana.

La pregunta para el administrador de nóminas del contratista principal no es si los requisitos de cumplimiento tienen sentido. Es si la tarea semanal de ensamblaje de datos —abrir 15 informes en 15 formatos, volver a teclear los mismos campos en una plantilla de envío, revisar la misma aritmética cada vez— es un costo inevitable de hacer trabajo federal o una brecha de proceso que la extracción puede cerrar.

La respuesta depende de si los datos de esos informes de subcontratistas permanecen encerrados en PDFs y escaneos, o si se vuelven computables —extraíbles, ordenables, verificables— en una hoja de cálculo donde las comprobaciones automatizadas puedan ejecutarse antes de que la firma vaya en la Declaración de Cumplimiento.

Subir un Informe de Nómina Certificada

📮 contact email: [email protected]