Como Extrair Relatórios de Folha de PagamentoCertificada de Subcontratados para Conformidade com Davis-Bacon

Em um projeto federal de rodovia com 15 subcontratados, o administrador de folha de pagamento da construtora geral enfrenta uma operação semanal de montagem de dados que nada tem a ver com entender os regulamentos Davis-Bacon e tudo a ver com a mecânica de extrair dados de 15 documentos que chegaram em 15 formatos diferentes. Um subcontratado envia uma exportação do Sage 300 CRE formatada em colunas que não correspondem à grade do WH-347. Outro envia um PDF do QuickBooks por e-mail. Um terceiro — uma empresa de terraplenagem com dois funcionários — preenche o formulário à mão, digitaliza e envia um JPEG. O conhecimento de conformidade está lá. O processo de extração é o gargalo.

Pare de digitar dados — deixe a IA ler por você
Envie uma imagem ou PDF — dados estruturados em 10 segundos
Experimente agora
Sem cadastro · Sem cartão · Resultados em 10 segundos
Plantas de construção e documentos de projeto sobre uma mesa — extração de relatório de folha de pagamento certificada para conformidade com Davis-Bacon

Principais Conclusões

  1. O OCR baseado em modelo precisa de um layout de formulário fixo, mas seus 15 subcontratados enviam relatórios em 15 formatos diferentes.
  2. Pequenos subcontratados mudam o formato do relatório sempre que trocam de software de folha de pagamento, e cada mudança de formato significa um novo modelo de extração para construir do zero.
  3. A extração semântica lê os campos do WH-347 entendendo o que eles significam, em vez de onde estão na página — todo formato funciona no primeiro contato sem qualquer configuração.

Por que a Extração de Dados do WH-347 é Diferente da Extração de Folha de Pagamento Comum

Um trabalho padrão de extração de dados de folha de pagamento envolve extrair nomes de funcionários, valores brutos e salário líquido de um contracheque ou registro de ponto. A extração é direta porque as informações necessárias correspondem uma a uma aos campos impressos no documento. A folha de pagamento certificada sob a Lei Davis-Bacon (40 U.S.C. §3141 et seq.) introduz três complicações estruturais que tornam a extração fundamentalmente mais difícil.

Primeiro, o mesmo trabalhador pode aparecer em múltiplas classificações na mesma semana. Se um carpinteiro passa de segunda a quarta fazendo fôrmas e de quinta a sexta instalando drywall, o WH-347 exige duas linhas separadas para esse trabalhador — uma para cada classificação com sua própria taxa salarial vigente. Uma ferramenta de extração que simplesmente lê "nome do trabalhador" e "total de horas" perderá essa distinção crítica, e a submissão de conformidade estará errada porque cada classificação exige uma taxa base e uma alocação de benefícios diferentes.

Segundo, a estrutura de taxas tem dois componentes que devem ser rastreados separadamente. O salário vigente da Davis-Bacon consiste em uma taxa horária base mais uma taxa de benefícios. Os contratantes cumprem a obrigação de benefícios contribuindo para um plano de benefícios legítimo (pensão, plano de saúde, aprendizagem) ou pagando o equivalente em dinheiro diretamente ao trabalhador. A Coluna 6A do WH-347 captura a taxa base, a Coluna 6B captura o crédito total de benefícios por trabalhador, e a Coluna 6C captura pagamentos em dinheiro no lugar dos benefícios. A extração deve preservar todos os três, porque a questão de conformidade aqui — "cada trabalhador recebeu pelo menos o salário vigente incluindo benefícios?" — só pode ser respondida quando esses componentes são mantidos separados.

Terceiro, as regras de horas extras sob a Lei de Padrões de Horas de Trabalho e Segurança em Contratos (CWHSSA) adicionam uma dimensão de verificação. Horas acima de 40 em uma semana em contratos cobertos devem ser pagas a 1,5× a taxa base. O WH-347 divide a Coluna 4 em horas normais e horas extras para cada dia. Uma extração que lê "total de horas" mas não a discriminação HN/HE não pode suportar a verificação de conformidade que um auditor do DOL realizará — verificar se as horas extras foram calculadas na taxa correta nas horas corretas.

Essas três características estruturais — linhas de múltiplas classificações, rastreamento duplo de benefícios e discriminação obrigatória HN/HE — significam que a extração da folha de pagamento certificada não pode ser tratada como uma tarefa genérica de "ler os números na página". A extração deve preservar as relações entre os campos, não apenas os valores dos campos em si.

Os Pontos de Dados do WH-347 que Impulsionam a Verificação de Conformidade

Antes de escolher uma abordagem de extração, é útil mapear os pontos de dados específicos do WH-347 que alimentam as decisões de conformidade. O formulário coleta aproximadamente 18 pontos de dados por trabalhador por linha de classificação, mas sete deles têm o maior peso em uma auditoria.

Campo WH-347ColunaPor que é Importante para a Conformidade
ID do Trabalhador (Últimos 4 dígitos do CPF)1EDeve permanecer consistente semana a semana. Um trabalhador que desaparece e reaparece com um ID diferente é um sinal de alerta.
Classificação da Mão de Obra3Deve corresponder a uma classificação na determinação salarial do projeto. A classificação incorreta é a violação mais comum da DBRA.
Horas Normais / Extras (Diárias × 7)4A CWHSSA exige horas extras a 1,5× a taxa base. A discriminação diária permite a verificação cruzada com os registros de acesso ao canteiro.
Total de Horas5Soma das horas diárias. Deve ser igual a horas normais + extras. Erros aritméticos aqui afetam todos os outros cálculos.
Taxa Base + Crédito de Benefícios6A / 6BTaxa base + crédito de benefícios deve ser ≥ ao salário vigente para aquela classificação. Ambos os valores são necessários para defesa em auditoria.
Valor Bruto Recebido7ADeve ser aproximadamente igual a (horas normais × taxa base) + (horas extras × taxa de hora extra) + crédito de benefícios. Tolerância ≤1% de arredondamento.
Deduções (INSS, Imposto, Outros)8Deve estar em conformidade com 29 CFR Parte 3. Deduções não autorizadas (ex.: ferramentas, uniformes) exigem aprovação do DOL.

A relação de verificação mais importante é o cruzamento entre as Colunas 5, 6A, 6B e 7A: total de horas × taxa + crédito de benefícios deve reconciliar com o valor bruto dentro de uma tolerância de arredondamento. Quando a extração preserva todos os sete campos de forma independente, essa verificação se torna uma checagem automatizada, em vez de um recálculo manual. Mas quando a extração agrupa classificações ou elimina a divisão entre horas normais e extras, a verificação falha — e a lacuna de conformidade que você pensava ter fechado permanece aberta.

O Problema do Formato dos Subcontratados é um Problema de Dados, Não de Conformidade

O artigo existente Por que a Folha de Pagamento Certificada é um Pesadelo Manual para Pequenos Contratados detalha o desafio estrutural de conformidade — responsabilidade objetiva do contratante principal, a janela de auditoria de 3 anos, os 611 investigadores cobrindo 120 milhões de trabalhadores. Mas também identifica um gargalo mais específico e mecânico que merece tratamento próprio: o problema do formato.

Quando 15 subcontratados enviam dados de folha de pagamento certificada em formatos diferentes, a tarefa de extração de dados do contratante principal não é um problema de conhecimento de conformidade. É um problema de leitura de documentos. Cada formato carrega os mesmos campos obrigatórios — nome do trabalhador, classificação, horas, taxas, bruto, deduções, líquido — mas os organiza de forma diferente, os rotula de forma diferente e, às vezes, os omite completamente (exigindo que o contratante principal corra atrás da documentação de benefícios ausentes enquanto o prazo de 7 dias para envio se esgota).

Ferramentas de OCR baseadas em modelos falham aqui. Elas exigem que você desenhe um retângulo ao redor de cada campo em um layout de formulário fixo. Quando o relatório do Sub A tem "Taxa de Pagamento" no canto superior direito e o relatório do Sub B a tem em um cabeçalho de coluna no meio da página, o modelo quebra. Você precisaria de um modelo separado para cada formato de subcontratado — e pequenos subcontratados mudam seu formato de relatório sempre que trocam de software de folha de pagamento ou empresa de contabilidade, o que é frequente.

Empresas de construção que usam software de conformidade dedicado como Procore, Viewpoint Vista, Sage 300 CRE ou hh2 podem gerar seus próprios relatórios de folha de pagamento certificada diretamente dos dados de entrada de horas. Mas elas não podem controlar o formato que seus subcontratados enviam de volta. O problema do formato está na fronteira entre o contratante principal e seus subcontratados, e é fundamentalmente um problema de extração: como ler dados de qualquer formato de documento recebido e mapeá-los em uma única estrutura padrão.

O problema do formato não é sobre saber quais dados você precisa — é sobre ler esses dados de documentos que nunca foram projetados para serem lidos por uma máquina. Cada relatório de subcontratado contém os mesmos campos críticos de conformidade. A dificuldade é que cada um incorpora esses campos em um layout visual diferente.

Como Extrair Relatórios de Folha de Pagamento Certificada Usando Extração Semântica por IA

É aqui que a abordagem conhecida como Extração de Colunas Personalizadas — descrita em detalhes em nosso artigo sobre extração de documentos por IA sem template — muda o fluxo de trabalho de montagem de dados para folhas de pagamento certificadas.

A Extração de Colunas Personalizadas funciona a partir do resultado final. Em vez de analisar o layout de um documento e definir regras de extração campo por campo, você informa à IA quais colunas deseja em sua tabela final — "Nome do Trabalhador", "Classificação", "Taxa Base", "Taxa de Benefícios", "Horas Normais", "Horas Extras", "Valor Bruto" — e a IA lê cada relatório do subcontratado, localiza os valores correspondentes entendendo o que significam e os coloca nas colunas corretas. O layout do formulário de cada subcontratado é irrelevante porque a IA está combinando por semântica, não por coordenadas de pixels.

O fluxo de trabalho de extração de folha de pagamento certificada é assim:

1
Carregue todos os relatórios WH-347 dos subcontratados — PDFs, digitalizações, fotos, exportações do Excel. O sistema de processamento em lote aceita todos juntos. Não é necessário separar por formato ou renomear arquivos.
2
Defina suas colunas de saída — Insira os nomes das colunas que correspondem à sua planilha de conformidade: Nome do Trabalhador, Últimos 4 dígitos do CPF, Classificação, Taxa Base, Taxa de Benefícios, Horas Normais, Horas Extras, Total de Horas, Valor Bruto, Deduções, Pagamento Líquido. A IA usa esses nomes como alvos semânticos.
3
Deixe a IA extrair de todos os relatórios — O sistema processa o documento de cada subcontratado em paralelo, aplicando as mesmas definições de coluna a cada um. Uma exportação do Sage, uma digitalização manuscrita e um PDF do QuickBooks produzem linhas na mesma tabela de saída.
4
Exporte para Excel — Todas as linhas são mescladas em uma única planilha com uma coluna por dado. Cada linha inclui uma coluna Nome do Subcontratado e Nome do Lote para que você possa rastrear cada dado até seu documento de origem.
5
Execute verificações de conformidade — Use os dados exportados para verificar a reconciliação horas×taxa, a correspondência entre classificação e determinação salarial e a adequação dos benefícios. Veja a próxima seção para as verificações específicas.

Experimente com um documento real de folha de pagamento certificada. Carregue um WH-347 de subcontratado e insira os nomes das colunas acima — a extração é executada sem qualquer configuração.

JPG/PNG/PDF Extração por IA

Arquivos são processados com segurança e não são armazenados.

Validações Automáticas de Conformidade nos Dados Extraídos

Uma vez que os dados são extraídos para uma planilha estruturada, a verificação de conformidade passa de uma tarefa manual para um conjunto de validações automatizadas. As colunas extraídas tornam-se uma única tabela onde você pode executar as verificações que um auditor do DOL faria, mas em todos os 15 subcontratados em minutos, em vez de horas.

Conciliação de horas × taxa. A verificação de conformidade mais fundamental: o valor bruto de cada trabalhador é igual a (horas normais × taxa base) + (horas extras × taxa base × 1,5) + crédito de benefícios? Para um relatório de 15 trabalhadores, são 15 cálculos manuais. Em uma planilha com colunas extraídas, é uma única fórmula arrastada pelas linhas. Sinalize qualquer linha onde a variação exceda 1% e investigue antes do envio.

Correspondência classificação vs. determinação salarial. Compare cada classificação extraída com as classificações listadas na determinação salarial aplicável do SAM.gov. Se um subcontratado relatar um trabalhador como "Servente Geral", mas a determinação salarial listar apenas "Servente (Comum)" e "Servente (Qualificado)" com taxas diferentes, a classificação precisa de esclarecimento antes da certificação do relatório.

Consistência do ID do trabalhador entre semanas. Um trabalhador que aparece na semana 1 com CPF terminado em 4321 e na semana 3 com CPF terminado em 8765 — mesmo nome, mesmo contratante — é uma bandeira vermelha que pode indicar um erro de digitação ou, no pior caso, um funcionário fantasma. Dados extraídos entre semanas podem ser tabulados dinamicamente para sinalizar anomalias de identidade.

Verificação de horas extras CWHSSA. Confirme que todo trabalhador que excedeu 40 horas totais na semana tem uma taxa de hora extra igual a pelo menos 1,5× a taxa base inserida na Coluna 6A. A CWHSSA se aplica a todos os contratos principais acima de $100.000, e a penalidade por violações de horas extras inclui danos liquidados iguais ao valor total do pagamento a menor das horas extras — não apenas a diferença.

O valor da extração para conformidade não está em ler os dados mais rápido — está em tornar os dados computáveis. Uma pilha de 15 PDFs de subcontratados não pode ser classificada, filtrada ou verificada por fórmulas. Uma planilha com campos extraídos pode ser verificada no tempo que leva para escrever algumas fórmulas.

Quando Formulários WH-347 Manuscritos Exigem Cuidado Extra

Pequenos subcontratados representam uma parcela significativa da mão de obra em projetos federais, e uma parte considerável deles preenche o WH-347 à mão. Uma pesquisa de 2023 da Associated General Contractors of America constatou que mais de 40% das construtoras com menos de 20 funcionários ainda preparam registros de folha de pagamento manualmente ou com softwares básicos de planilha — sem sistema dedicado de folha, sem módulo de salário vigente, apenas papel e caneta.

Relatórios de folha de pagamento certificados manuscritos representam um verdadeiro desafio de extração. A IA consegue ler a grande maioria das escritas à mão — incluindo letra cursiva e entradas numéricas — conforme documentado em nosso guia sobre problemas e soluções de OCR para escrita manual. No entanto, classificações de trabalho escritas em espaços apertados e valores de taxa que parecem "32,5" ou "32,8" (quando o valor pretendido é R$ 32,57) são casos em que a saída carrega uma incerteza que uma submissão de conformidade não pode absorver.

A abordagem pragmática: Use a extração para obter automaticamente 80-90% dos dados em uma tabela estruturada. Em seguida, realize uma revisão linha por linha das entradas manuscritas — especialmente campos de taxa, códigos de classificação e a assinatura manuscrita na Declaração de Conformidade (que deve ser uma assinatura original, não uma fotocópia, conforme 29 CFR 3.3(b)). O fluxo de verificação por amostragem fornece uma estrutura para esta etapa. A extração evita que você redigite os 15 relatórios eletrônicos; a revisão manual concentra sua atenção nos 2-3 envios manuscritos que apresentam o maior risco de erro.

Manutenção de Registros: Dados Extraídos Precisam Sobreviver por Três Anos

O 29 CFR 3.4 exige que os contratantes preservem os registros de folha de pagamento certificados por pelo menos três anos após a conclusão de todo o trabalho no contrato principal. Isso não é uma sugestão — as auditorias do DOL rotineiramente alcançam três anos, e registros ausentes são tratados como uma falha de conformidade em si, separada de quaisquer violações salariais que os registros ausentes poderiam ter revelado.

Quando a extração alimenta uma planilha estruturada, o requisito de manutenção de registros se torna mais fácil de satisfazer porque os dados já estão em um formato preservável. Cada exportação em lote deve incluir os seguintes metadados — abordados em mais profundidade em nosso guia de requisitos de retenção de documentos — para apoiar a defesa em futuras auditorias:

  • Nome do lote e data de processamento (vincula aos documentos originais enviados)
  • Nome do subcontratado e período de folha de pagamento para cada linha
  • O número da determinação salarial contra o qual as taxas extraídas foram verificadas
  • Uma coluna de observações para quaisquer correções manuais feitas durante a revisão

Um auditor do DOL vai querer ver tanto os formulários WH-347 originais quanto os dados resumidos. A extração não substitui os originais; ela cria a trilha de auditoria entre os documentos brutos e a submissão de conformidade.

Perguntas Frequentes

Consigo extrair dados de folha de pagamento certificada de uma digitalização de um WH-347 manuscrito?

Geralmente sim, mas com a ressalva de que valores de taxas e códigos de classificação manuscritos devem ser verificados linha por linha antes de serem usados para submissão de conformidade. O modelo de visão de IA lê escrita à mão, incluindo cursiva, mas letras apertadas em células pequenas da grade do WH-347 podem produzir resultados ambíguos. Um fluxo de trabalho prático: extrair automaticamente, depois priorizar a revisão manual nos 2-3 campos por trabalhador que mais afetam diretamente a conformidade salarial — taxa base, taxa de benefícios e classificação.

E se meu subcontratado usar um formato que nunca vi antes?

Esse é o problema específico que a Extração de Colunas Personalizadas foi projetada para resolver. Como ela lê documentos entendendo o significado de cada coluna, em vez de reconhecer um modelo, ela lida com formatos nunca vistos na primeira exposição. Você não precisa treiná-la com uma amostra ou criar um modelo. Na primeira vez que um subcontratado enviar uma exportação do Foundation em vez de uma exportação do Sage, a IA a lê usando os mesmos nomes de coluna.

A extração lida com trabalhadores com múltiplas classificações na mesma semana?

Sim, desde que o formulário do subcontratado mostre o trabalhador em linhas separadas para cada classificação. A IA preserva a estrutura de linhas que encontra no documento. Se uma única linha do WH-347 listar um trabalhador com duas classificações e horas combinadas (o que alguns subcontratados fazem incorretamente), a extração sinalizará a linha para revisão, em vez de dividi-la silenciosamente — porque a submissão de conformidade precisa de um detalhamento preciso.

Posso usar isso para formulários estaduais de "Little Davis-Bacon"?

A mesma abordagem de Extração de Colunas Personalizadas funciona para formulários estaduais de salário vigente da Califórnia (DIR), Nova York (DOL), Nova Jersey, Pensilvânia, Illinois e outros 25 estados com suas próprias leis de salário vigente. As definições de coluna permanecem as mesmas — identificação do trabalhador, classificação, horas, taxas, bruto, deduções. A IA se adapta ao layout específico do formulário de cada estado. No entanto, os formulários estaduais geralmente têm campos exclusivos (a folha de pagamento certificada DLSE da Califórnia, por exemplo), e você pode precisar adicioná-los como nomes de coluna adicionais.

Como funciona o requisito de retenção de 3 anos para dados extraídos?

De acordo com 29 CFR 3.4, os registros originais de folha de pagamento certificada — os próprios formulários WH-347 — devem ser preservados por pelo menos três anos após a conclusão do projeto. Planilhas extraídas são complementares, não substitutas. Uma boa prática é manter a saída da extração junto com os documentos originais enviados em uma pasta do projeto, etiquetada com a data do lote e o número da determinação salarial, para que um auditor possa rastrear dos dados resumidos até os documentos de origem.

Qual é a diferença entre extrair dados de folha de pagamento certificada e usar software de conformidade como o LCPtracker?

LCPtracker, eCOMM e plataformas similares são portais de envio — eles aceitam dados de folha de pagamento certificada de empreiteiros principais e os encaminham para agências contratantes. Eles não resolvem o problema upstream de extração de dados de relatórios de subempreiteiros em formatos diferentes. Ferramentas de extração preenchem a lacuna entre "uma pilha de relatórios de subs" e "dados prontos para enviar". Muitos empreiteiros principais usam ambos: extração para montar os dados e, em seguida, um portal para enviá-los.

Da Extração ao Envio

A conformidade da folha de pagamento certificada sob a Lei Davis-Bacon não vai se tornar mais simples. A atualização regulatória de 2023 expandiu a definição de "edifício ou obra" para incluir instalação de banda larga, infraestrutura de carregamento de veículos elétricos e construção de painéis solares — trazendo novas populações de contratantes para o sistema Davis-Bacon. A revisão do WH-347, efetiva em setembro de 2026, adiciona campos de rastreamento de aprendizes e requisitos mais rigorosos de relatórios de benefícios adicionais. Mais projetos, mais subempreiteiros, mais dados para extrair a cada semana.

A pergunta para o administrador de folha de pagamento do empreiteiro principal não é se os requisitos de conformidade fazem sentido. É se a tarefa semanal de montagem de dados — abrir 15 relatórios em 15 formatos, redigitar os mesmos campos em um modelo de envio, verificar a mesma aritmética toda vez — é um custo inevitável do trabalho federal ou uma lacuna de processo que a extração pode fechar.

A resposta depende se os dados nesses relatórios de subempreiteiros permanecem trancados dentro de PDFs e digitalizações, ou se tornam computáveis — extraíveis, classificáveis, verificáveis — em uma planilha onde as verificações automatizadas podem ser executadas antes da assinatura na Declaração de Conformidade.

Enviar um Relatório de Folha de Pagamento Certificada

📮 contact email: [email protected]