Como Rastrear Ordens de Compra de Obras ContraCódigos de Custo da Obra

O Financial Benchmarker 2024 da CFMA aponta que a administração de custos consome 5,4% da receita do projeto para a construtora média nos EUA. Em uma obra de US$ 30 milhões, isso representa US$ 1,6 milhão gastos na codificação de notas fiscais, conciliação de relatórios de custo e reconstrução de previsões — antes mesmo de um dólar ser destinado a retrabalho, atrasos ou indenizações. Uma parcela significativa dessa despesa geral remonta a um único ato repetitivo: um gerente de projeto abrir a confirmação de ordem de compra em PDF de um fornecedor e redigitar manualmente cada linha em uma planilha de custos da obra. Uma OC. Depois outra. E mais outras 80 neste mês.

Extração de dados de ordens de compra de obras — confirmações de OC de materiais de fornecedores empilhadas em uma mesa ao lado de uma planilha de rastreamento de custos da obra na tela, ilustrando o gargalo da entrada manual de dados entre a aquisição e o controle de custos

Principais Conclusões

  1. Cinco minutos para redigitar um PO de material — com 80 a 120 POs por mês em obras ativas, são de 5 a 10 horas movendo texto de um PDF do fornecedor para uma planilha, sem gerar nenhuma informação nova.
  2. Uma taxa de erro de digitação de 1 a 4% insere de 30 a 120 erros silenciosos no seu livro de custos a cada lote de 50 POs de material, e um único pedido de drywall de R$ 4.000 classificado na divisão CSI errada distorce os números de custo final nos quais os gerentes de projeto baseiam suas decisões orçamentárias.
  3. Defina suas colunas de extração uma vez — Obra, Código de Custo, Item, Qtd., Preço Unitário — e o ImageToTable.ai lê qualquer formato de PO de fornecedor pelo significado, e não pela posição no modelo, reduzindo cinco minutos de transcrição por pedido para 15 segundos de verificação, onde itens de linha mal classificados nunca entram no livro de custos da obra.

A Lacuna Entre o PDF do Fornecedor e o Relatório de Custos da Obra

Toda semana, uma construtora de médio porte faz pedidos de materiais com meia dúzia de fornecedores — ABC Supply para telhados, Ferguson para tubos e conexões, 84 Lumber para estruturas, Beacon para telhas, HD Supply para itens de manutenção. A maioria desses fornecedores confirma o pedido por e-mail com um PDF anexado. O documento contém tudo que o gerente de obra precisa: número do pedido, nome do fornecedor, referência da obra, itens com quantidades e preços unitários, data de entrega, impostos e total.

Nenhum desses dados entra automaticamente no sistema de custos da construtora. Eles ficam presos no PDF. Para colocá-los em uma planilha de acompanhamento ou ERP como Procore, Viewpoint Vista ou Sage 300 CRE, alguém abre cada PDF, localiza cada campo e digita — linha por linha, código de custo por código de custo. Um tópico no Reddit em r/ConstructionManagers confirmou o que a maioria no setor já sabe: muitas construtoras de pequeno e médio porte ainda gerenciam pedidos de compra inteiramente em planilhas Excel — não porque preferem planilhas, mas porque o esforço de integração com o ERP ainda não foi justificado.

O problema não é que o formato do fornecedor seja complicado. É que cada fornecedor usa um formato diferente. A confirmação de pedido da ABC Supply não se parece com a da Ferguson. A estrutura do PDF da Beacon difere da da 84 Lumber. E até o mesmo fornecedor formata os pedidos de forma diferente, dependendo se o pedido foi feito pelo portal, por telefone ou por um representante de campo. A extração baseada em modelos — onde você desenha uma caixa ao redor de um campo uma vez e espera que ele esteja na mesma posição na próxima vez — falha assim que o formato muda. Na aquisição da construção civil, o formato está sempre mudando.

Os pedidos de compra de materiais de construção são exclusivamente diversos em formato porque os fornecedores deste setor operam seus próprios sistemas de pedidos proprietários — do portal myABCsupply da ABC Supply à plataforma PRO+ da Beacon e ao balcão de negócios online da Ferguson. As confirmações em PDF geradas por esses sistemas não compartilham um esquema comum. Processá-los em escala sem uma estratégia de extração livre de modelos é travar uma guerra de formatos que a equipe de entrada manual perde todo mês.

Quanto Custa Realmente Processar um PO de Material

O American Productivity & Quality Center (APQC) define como referência o custo médio de processamento de um único pedido de compra em aproximadamente US$ 100 em todos os setores. Mas esse valor abrange todo o ciclo de vida da aquisição — requisição, aprovação, emissão e conciliação — e não a etapa restrita de extrair dados do PDF de confirmação de um fornecedor para uma planilha de acompanhamento. Para POs de materiais de construção, apenas essa etapa de extração se acumula em um custo recorrente significativo quando medida no nível da tarefa.

Detalhe os minutos de um PO de material típico de um fornecedor como Ferguson ou ABC Supply:

  • Abra o PDF e localize os campos relevantes — de 10 a 15 segundos, mais se o anexo estiver enterrado na thread de e-mail
  • Identifique cada dado no documento — número do pedido, nome do fornecedor, referência do serviço, código de custo, itens com quantidades e preços unitários — de 30 a 45 segundos navegando por um layout desconhecido
  • Consulte ou verifique o código de custo CSI MasterFormat que deve ser atribuído a cada item — de 45 a 90 segundos se o código não estiver impresso no documento do fornecedor (geralmente não está)
  • Insira os dados na planilha ou ERP — de 60 a 120 segundos, dependendo da quantidade de itens e de quantas vezes você alterna entre janelas
  • Verifique se há erros de digitação — de 30 a 60 segundos procurando por dígitos trocados ou um item mapeado para o código de custo errado

Total: aproximadamente 4 a 5 minutos por pedido. Uma construtora de médio porte que faz de 80 a 120 pedidos de materiais por mês em todas as obras ativas gasta de 5 a 10 horas por mês apenas redigitando dados de pedidos de fornecedores. Anualmente, com um gerente de projetos ou coordenador de compras a uma taxa horária de $50 a $75, isso representa de $3.000 a $9.000 por ano em mão de obra direta — gasta em uma atividade que não gera valor além de mover texto de um retângulo para outro.

O custo maior não são os minutos. É o que acontece quando a digitação está errada. A entrada manual de dados em condições normais de trabalho tem uma taxa de erro documentada de 1% a 4% — um a quatro erros por cem campos. Em um pedido de compra de materiais com 10 itens e 6 campos por item, são 60 pontos de dados. Um ou dois provavelmente estarão errados. Se o erro for uma quantidade trocada, o custo comprometido no seu relatório de custos da obra estará errado. Se o erro for um código de custo incorreto, todo o gasto de uma linha desaparece na divisão errada — e fica lá até que alguém, no fechamento do mês, rastreie uma variação de volta por três semanas de lançamentos.

Por que modelos por fornecedor não funcionam para a construção civil

A resposta padrão da indústria para a diversidade de formatos é a extração baseada em modelos — você configura um modelo uma vez por formato de fornecedor, mapeando cada posição de campo, e o software reutiliza esse modelo para cada documento subsequente. Essa abordagem funciona para documentos recorrentes de uma única fonte conhecida, como uma conta de serviços públicos mensal ou um formulário de seguro padronizado. Não funciona para pedidos de compra de materiais de construção por uma razão estrutural: o cenário de fornecedores na construção civil é maior e menos previsível do que em quase qualquer outra categoria de compras.

Uma única construtora geral em um projeto multifamiliar pode encomendar materiais de oito fornecedores diferentes ao longo de um mês — e essa combinação muda conforme a obra, a região e o escopo. A cobertura neste projeto vem da ABC Supply; no próximo projeto, a especificação exige uma linha de produtos fornecida apenas pela Beacon. A subempreiteira de concreto compra vergalhões de um fornecedor regional com o qual a construtora geral nunca trabalhou antes. Cada novo fornecedor significa um novo formato de PDF a ser interpretado — e cada um exige que alguém crie ou mantenha um modelo. O custo de manutenção dos modelos cresce linearmente com o número de fornecedores, e o cadastro de fornecedores da construção civil nunca para de crescer.

Mesmo quando o fornecedor permanece o mesmo, o formato pode mudar. Um pedido Ferguson feito no balcão gera um layout de confirmação diferente de um pedido feito pelo portal online ou por telefone com um gerente de território. Um pedido Beacon para materiais de telhado imprime os itens de linha de forma diferente de um pedido Beacon que inclui acessórios e fixadores. Modelos projetados para um formato de PO "padrão" do Fornecedor X falham na variante que chega na caixa de entrada 30% das vezes.

O que a aquisição na construção civil precisa não é de mais modelos. É de uma abordagem de extração que não depende do layout do documento — uma que leia um PO como um humano faria: entendendo o que os dados significam, não onde eles estão na página.

Alinhamento de Código de Custo — A Camada que a Automação Genérica de PO Ignora

A maioria das ferramentas de automação de ordens de compra é construída para aquisição genérica — elas extraem nome do fornecedor, número do PO, data e totais dos itens de linha, e então enviam os dados para um sistema contábil. A aquisição na construção civil adiciona uma dimensão para a qual essas ferramentas não foram projetadas: cada item de linha em um PO de material deve ser etiquetado com um código de custo do trabalho antes de se tornar significativo em um relatório de custos.

O CSI MasterFormat, mantido pelo Construction Specifications Institute, fornece a estrutura de codificação padrão de 50 divisões e seis dígitos que a maioria das empreiteiras gerais usa para organizar os custos do trabalho. A Divisão 03 cobre concreto, a Divisão 06 cobre madeira e plásticos, a Divisão 07 cobre proteção térmica e contra umidade, a Divisão 09 cobre acabamentos, e assim por diante. Cada nível do código de seis dígitos — Divisão, Nível 2, Nível 3 — corresponde a uma granularidade de decisão diferente: relatórios executivos por divisão, aquisição por pacote, rastreamento de alterações de pedido por resultado de trabalho específico.

Quando um gerente de projetos insere um pedido de compra de material na planilha, ele não está apenas copiando números. Ele está atribuindo cada linha — às vezes cada item em cada linha — ao código MasterFormat correto. Um palete de drywall vai para 09 29 00. Uma caixa de parafusos para drywall vai para a mesma divisão, mas uma subseção diferente. O drywall corta-fogo para o poço da escada vai para um código totalmente diferente. Erre o código, e o custo cai no pacote de obra errado. Quando o relatório mensal de custos é gerado, os gerentes tomam decisões com base em números que não correspondem ao que foi realmente consumido em campo.

O custo downstream de gastos mal classificados é documentável. Um estudo de 2023 do Lean Construction Institute descobriu que projetos usando códigos de custo ad-hoc ou específicos do projeto levaram em média 11 dias úteis para produzir uma previsão confiável de custo para conclusão — contra 3,5 dias quando uma estrutura padrão como o MasterFormat governava a codificação. Uma pesquisa de 2024 da AGC associou gastos não classificados acima de 8% dos custos da obra a uma variação orçamento-real quase duas vezes maior em comparação com empresas que mantinham gastos não classificados abaixo de 2%. Esses não são problemas contábeis. São problemas de margem que começam no ponto de entrada de dados.

Uma oscilação de 1% na margem em uma obra de US$ 30 milhões equivale a US$ 300.000. A disciplina de código de custo no ponto de entrada de dados do pedido de compra é uma das poucas alavancas que uma construtora controla para reduzir vazamentos evitáveis de custos mal classificados, ciclos lentos de mudanças e consolidações de previsões fracas — tudo isso remonta a saber se o código de seis dígitos correto foi atribuído à linha de material certa no pedido de compra certo.

Como a Extração por Colunas Baseada em IA Lê Qualquer Formato de PO de Fornecedor

A alternativa à extração baseada em templates é um mecanismo fundamentalmente diferente: em vez de informar ao software onde cada campo está na página, você informa o que deseja extrair — nomeando as colunas necessárias. A IA lê o documento como um gerente de projetos: procura um número que pareça ser uma referência de pedido, um nome de empresa que pareça um fornecedor, uma data, itens com quantidades e preços — e os identifica pelo significado no contexto, não por coordenadas de pixels em um template salvo.

No ImageToTable.ai, isso é chamado de Extração de Colunas Personalizadas. Você define um conjunto de cabeçalhos de coluna — os campos que deseja preenchidos na planilha de saída — e a IA localiza os valores correspondentes em cada documento enviado, independentemente de onde apareçam ou de como a página esteja organizada. Para um fluxo de pedidos de materiais de construção, você pode nomear suas colunas: Nº do Pedido, Fornecedor, Nome da Obra, Código de Custo, Descrição do Item, Quantidade, Unidade, Preço Unitário, Total do Item, Data de Entrega. A IA preenche todas as colunas para cada documento — seja o pedido da ABC Supply, Ferguson, Beacon ou de um fornecedor regional de concreto do qual você nunca comprou antes.

Como a extração é semântica e não posicional, o sistema lida com variações de formato que quebrariam um template: um fornecedor que coloca o número do pedido no cabeçalho de um documento e em uma linha de tabela em outro, itens que ocupam diferentes números de linhas dependendo do tamanho do pedido, uma confirmação que inclui instruções especiais acima dos itens em uma versão e abaixo deles em outra. A IA não precisa que isso seja consistente — ela precisa entender o que cada informação representa.

Esta abordagem também lida diretamente com o desafio do código de custo. Você pode incluir uma coluna Código de Custo na sua definição de extração, e a IA procurará qualquer referência a código de custo no documento. Para fornecedores que imprimem referências de projeto ou código de custo em suas confirmações, a extração é automática. Para fornecedores que não o fazem — que são a maioria — você pode aplicar códigos em lote após a extração, ou usar Colunas Inferidas para que a IA atribua códigos com base nas descrições dos itens. Por exemplo, uma linha com "Pino 2×4 SPF" pode ser inferida como Divisão 06, enquanto "Isolamento de Manta R-19" é mapeado para a Divisão 07. O resultado é uma única planilha onde cada item de linha já está codificado — pronto para importação no Procore, Viewpoint, Sage ou em sua planilha de controle do Excel.

JPG/PNG/PDF Extração por IA

Os arquivos são processados com segurança e não são armazenados.

Um Fluxo que Conecta Dados de PC ao Seu Sistema de Custo de Obra

A etapa de extração não é o destino. O destino é um relatório de custo de obra onde os custos de materiais comprometidos são visíveis por divisão, rastreáveis até o PC de origem e prontos para a reunião de custo até a conclusão. Chegar lá exige um fluxo que preencha a lacuna entre a caixa de entrada do fornecedor e seu sistema de custos — sem adicionar outra camada administrativa.

Veja como é esse pipeline quando a etapa de extração é feita por IA baseada em colunas, em vez de entrada manual:

1
Colete confirmações de PO dos fornecedores. Encaminhe os PDFs de confirmação da sua caixa de entrada para uma pasta dedicada ou baixe-os dos portais dos fornecedores. Sem renomear, sem reformatar — a IA lê o que o fornecedor enviou.
2
Defina suas colunas de extração uma vez. Crie um modelo de coluna salvo com os campos relevantes para seu controle de custos: Nº PO, Fornecedor, Obra, Código de Custo, Item, Qtd, Unidade, Preço Unitário, Total da Linha, Data de Entrega. Este modelo persiste em cada carregamento em lote.
3
Carregue e extraia. Solte todas as POs pendentes dos fornecedores em um único lote — a IA as processa simultaneamente e preenche uma planilha unificada. O tempo de processamento por documento é em média de 5 a 10 segundos.
4
Verifique os códigos de custo. Revise a saída extraída, focando nas atribuições de código de custo. Para materiais pedidos com frequência, os códigos serão consistentes entre os lotes. Sinalize quaisquer linhas não classificadas ou "diversos" antes que entrem no sistema de custos — detectá-las na extração elimina a correria de recodificação no fim do mês.
5
Exportar e importar. Baixe a planilha unificada em Excel (XLSX) e importe para seu sistema de custos de obra — Procore, Viewpoint Vista, Sage 300 CRE, FOUNDATION ou sua pasta de trabalho de controle baseada em Excel. A estrutura de colunas corresponde ao que seu sistema espera, então o mapeamento é uma configuração única.

Para equipes que usam Google Sheets em vez de um ERP tradicional, o Google Sheets Add-on encurta ainda mais esse fluxo: faça upload de POs de fornecedores diretamente pela barra lateral do Sheets, especifique as colunas, e os dados extraídos são anexados à planilha ativa — sem etapa de download, sem transferência de arquivos. O add-on se conecta à sua conta, mantendo templates e histórico sincronizados com o web app.

O ponto de verificação de qualidade na etapa 4 é o que diferencia essa abordagem da automação cega. A extração por IA baseada em colunas é rápida, mas os dados de custos de construção têm consequências significativas — uma linha de equipamento HVAC de US$ 40.000 mal codificada altera completamente a margem de um pacote de obra —, portanto, uma revisão humana antes de os dados entrarem no seu sistema de custos é a disciplina correta. O objetivo não é eliminar o julgamento humano do processo. É substituir 5 minutos de transcrição por PO por 15 segundos de verificação — movendo o humano de operador de digitação para revisor de qualidade.

Perguntas Frequentes

A extração por colunas consegue lidar com anotações manuscritas em POs de fornecedores?

Sim. Como o motor de extração é um modelo de visão, e não um mecanismo de reconhecimento de caracteres, ele lê escrita à mão em contexto — um código de custo manuscrito na margem, uma data de entrega anotada manualmente, as iniciais do encarregado aprovando o pedido — da mesma forma que lê texto impresso. O modelo entende que um número manuscrito ao lado de "Job #" é uma referência de obra e o extrai para a coluna que você nomeou para esse campo. A qualidade da caligrafia importa — uma anotação rabiscada que um humano não consegue decifrar também não será decifrável pela IA —, mas caligrafia legível, incluindo cursiva, é tratada de forma confiável.

O resultado da extração mapeia diretamente para o Procore ou Sage 300 CRE?

A saída é um arquivo Excel (XLSX) padrão com colunas que correspondem aos nomes dos campos definidos durante a extração. Tanto o Procore quanto o Sage 300 CRE suportam importações de Excel para compromissos e ordens de compra. A configuração única é mapear suas colunas de extração para os campos de importação do ERP — por exemplo, garantindo que sua coluna Código de Custo esteja alinhada com o campo de código de custo de compromisso do ERP. Uma vez que esse mapeamento esteja configurado, cada lote semanal segue o mesmo caminho de importação. Para usuários do Google Sheets, o complemento escreve diretamente na planilha, eliminando completamente a etapa de exportação-importação.

E se uma OC tiver 40 itens de linha e a próxima tiver 3?

A extração baseada em colunas lida com itens de linha de comprimento variável sem qualquer alteração de configuração. A IA identifica blocos de itens de linha em cada documento e extrai cada linha em linhas separadas na tabela de saída — cada linha herdando os campos de nível de cabeçalho (número da OC, fornecedor, data) do mesmo documento. Um pedido da ABC Supply com 40 linhas produz 40 linhas em sua planilha, e um pedido da HD Supply com 3 linhas produz 3 linhas. A estrutura da coluna permanece idêntica, independentemente de quantas linhas um determinado documento contém. É isso que torna a abordagem viável para processamento em lote — processar várias OCs de uma só vez em uma única tabela de saída é uma extensão natural do mesmo mecanismo.

Como faço para impedir que OCs de fornecedores criem entradas de código de custo "diversos"?

A forma mais eficaz de controle é uma convenção de nomenclatura de colunas que força a atribuição de código no momento da extração. Em vez de extrair um campo genérico Categoria do documento do fornecedor, defina sua coluna como Código de Custo (opções: 03-Concreto, 06-Madeira, 07-Impermeabilização, 09-Acabamentos, etc.) — isso instrui a IA a classificar cada item da linha em um dos buckets de código definidos com base na descrição do item, mesmo quando o documento do fornecedor não contém nenhum campo de código de custo. A IA se torna a primeira linha de aplicação do código, não a última. Combinado com uma revisão semanal onde qualquer item de linha "não classificado" é recodificado em até 48 horas — uma disciplina que os dados do CFMA 2024 Benchmarker mostram que os empreiteiros de alto desempenho mantêm — os gastos com código incorreto permanecem abaixo do limite de 2% que separa dados de custo limpos de um relatório de custos que parece preciso, mas não é.

Posso usar uma foto de um pedido de compra impresso em vez de um PDF?

Sim. Uma foto nítida de um pedido de compra impresso tirada com a câmera do celular é uma entrada válida — o modelo de visão processa da mesma forma que processa um PDF. Isso cobre um cenário comum de campo: o superintendente recebe uma confirmação de PO em papel de um fornecedor local no canteiro de obras e precisa dela no sistema de custos antes da próxima entrega chegar. Tire uma foto, faça o upload para o lote, e os dados são extraídos junto com as confirmações em PDF de fornecedores maiores. A precisão da extração em uma foto bem iluminada e com bom foco é comparável a um PDF digital — a variável chave é a qualidade da imagem, não o formato do arquivo.

Cada pedido de compra de material que você processa manualmente é um pequeno imposto recorrente sobre a margem do seu projeto — não porque a tarefa seja difícil, mas porque ela se acumula. Uma única linha de custo mal codificada em um pedido de drywall de US$ 4.000 altera a variação no nível da divisão que um gerente de projeto analisa na reunião semanal de custos. Essa variação gera uma decisão — adicionar equipe, reordenar, revisar a previsão — e se o número de entrada estava errado, a decisão também está errada. A etapa de extração é onde a disciplina de código de custo se mantém ou se quebra. Extrair dados de pedidos de compra para o Excel em segundos, em vez de minutos, não apenas economiza tempo. Elimina a etapa de transcrição onde os erros de codificação se proliferam — e essa mudança, multiplicada por cada PO em cada obra em um determinado mês, é a diferença entre um relatório de custos que você pode usar e um sobre o qual você passa a reunião discutindo.

📮 contact email: [email protected]