Como Extrair Dados de Tíquetes de Balança para Excel
para Compras de Aço, Mineração, Grãos e Químicos
Um gerente de compras de uma siderúrgica descreveu sua rotina diária com tíquetes de balança: uma pilha de impressões térmicas das entregas matinais de caminhões, cada uma de uma estação de pesagem de fornecedor diferente — um formato Avery Weigh-Tronix, dois de sistemas B-TEK, quatro impressões WinWeigh e três cópias carbono manuscritas de uma pedreira rural. Doze campos por tíquete. Cinquenta tíquetes por dia. Três minutos cada para digitar na planilha de acertos. E se o peso líquido estiver errado por um único dígito, uma discrepância de pagamento de R$ 40.000 em uma carga de minério de ferro só aparece na reconciliação de fim de mês.
Principais Conclusões
- Só a SmartWeigh oferece mais de 30 modelos de tíquetes, o que significa que uma equipe de compras com uma dúzia de estações de pesagem enfrenta uma dúzia de formatos que quebram assim que um fornecedor atualiza seu software de balança.
- Ninguém em um fluxo de entrada manual de dados verifica se Bruto menos Tara é igual a Líquido em cada tíquete, então um erro de peso líquido fica na sua planilha de acertos sem ser descoberto até o fornecedor contestar o pagamento semanas depois.
- O ImageToTable.ai extrai qualquer formato de tíquete com as mesmas definições de colunas e verifica cada equação de peso líquido durante a extração, sinalizando discrepâncias antes que se tornem disputas de pagamento de R$ 40.000.
O que uma Nota de Balança Realmente Registra — Duas Pesagens Separadas, Uma Única Transação
Antes de falar sobre extração, vale entender o que torna uma nota de balança estruturalmente diferente dos tipos de documento para os quais a maioria das ferramentas de extração foi projetada. Uma nota de balança não é uma tabela de itens. Ela registra dois eventos de pesagem independentes, que ocorrem com minutos de diferença no mesmo veículo e na mesma balança — e a relação entre eles determina o preço final.
Primeira pesagem (Tara): O caminhão vazio entra na balança às 08:14. A balança certificada registra o peso sem carga — 15.720 kg. O operador anota o horário, a placa do veículo e o código do material. O caminhão sai da balança, vai até o pátio de carga e recebe sua carga — minério de ferro, calcário, grãos ou produtos químicos a granel.
Segunda pesagem (Bruto): O caminhão carregado retorna à mesma balança às 08:26. A balança registra 45.660 kg. Ambas as leituras — tara e bruto — aparecem em um único ticket impresso, junto com horários, identificação do veículo, iniciais do operador e descrições do material.
O peso líquido existe apenas como resultado calculado: Líquido = Bruto − Tara. O ticket pode ou não imprimir esse valor. Mesmo quando imprime, é um número gerado pelo software da balança — e se o operador leu a tara errado ou se a impressora falhou, o "líquido" impresso está errado e a discrepância só será percebida quando alguém refizer a subtração. Uma análise da Loop ERP constatou que as taxas de erro de entrada manual de dados em operações de balança de alto volume variam consistentemente entre 1–4% — e, a 200 toneladas por dia, uma discrepância de pesagem de 1% gera um impacto anual na receita superior a US$ 150.000.
Este é o desafio estrutural que torna a extração de notas de balança fundamentalmente diferente do processamento de faturas ou recibos. Você não está extraindo dados de uma tabela plana. Você está reconstruindo uma cadeia causal de dois eventos — e verificando a matemática — antes que os números entrem na sua planilha de liquidação de compras.
Por que nenhum tíquete de balança é igual a outro
O mercado de software para balanças rodoviárias é fragmentado. Uma única operação de compras que recebe material de uma dúzia de fornecedores pode encontrar uma dúzia de formatos de tíquete diferentes — cada um com seu próprio layout. Uma única operação de compras que recebe material de uma dúzia de fornecedores pode encontrar tíquetes impressos por WinWeigh (Weightron), Avery Weigh-Tronix, SmartWeigh, B-TEK ScaleSoft, terminais Mettler Toledo JAGXTREME, Intercomp Weigh e softwares internos personalizados — cada um com seu próprio layout de tíquete.
Só a SmartWeigh oferece mais de 30 modelos de tíquete. Um modelo coloca a tara no canto superior esquerdo, junto com a placa do veículo e o horário. Outro a imprime em uma coluna alinhada à direita, abaixo do ID do operador. Um terceiro empilha todos os campos verticalmente em um recibo de impressora térmica que mal se parece com um formulário. Essas não são variações obscuras — são a realidade diária de qualquer operação de compras que recebe de múltiplas estações de pesagem.
A diversidade de formatos vai além do layout. Alguns tíquetes usam uma estrutura de duas caixas, com "Primeira Pesagem" e "Segunda Pesagem" claramente identificadas como blocos separados. Outros imprimem uma única tabela contínua onde você precisa inferir qual linha é a tara e qual é a bruta a partir dos próprios valores de peso. Duplicatas em papel carbono — ainda comuns em pedreiras menores e elevadores de grãos rurais — sobrepõem impressões fracas em papel de baixo contraste que os mecanismos tradicionais de OCR mal conseguem ler.
A extração baseada em modelos exige a criação de um modelo separado para cada layout de tíquete. Doze fornecedores, doze modelos. Uma estação de pesagem atualizando seu software significa um modelo existente que quebra silenciosamente. Doze fornecedores, doze modelos. Um novo fornecedor significa uma nova sessão de criação de modelo. Uma estação de pesagem atualizando seu software de WinWeigh III para WinWeigh IV significa um modelo existente que quebra silenciosamente. A própria biblioteca de modelos se torna o gargalo que você estava tentando eliminar.
Insight principal: A indústria de software para balanças rodoviárias resolveu o problema da ponta inicial — a balança pesa com precisão e imprime um tíquete. O que ela não resolveu é o problema da ponta final: extrair os dados desses tíquetes impressos para a planilha Excel da equipe de compras sem redigitar cada campo. Para operações que já possuem hardware de balança funcional, substituir todo o sistema por uma integração de software é uma solução de R$ 50.000 a R$ 250.000 para um problema de digitação de dados. A extração de documentos preenche essa lacuna por uma fração do custo.
Como a Extração Personalizada de Colunas Lê Cada Layout de Ticket
Aqui está uma abordagem diferente: em vez de informar à ferramenta onde cada campo está na página, você informa o que cada campo significa. Isso é a Extração Personalizada de Colunas — você digita os nomes das colunas que representam os dados desejados (ex.: "Número do Ticket", "Placa do Veículo", "Peso Tara", "Peso Bruto", "Peso Líquido", "Código do Material", "Nome do Fornecedor"), e a IA localiza cada valor entendendo seu papel no fluxo de trabalho da balança, não suas coordenadas de pixel na página.
Uma coluna chamada "Peso Tara" informa à IA para encontrar a leitura do peso do veículo vazio — o número menor associado ao primeiro evento de pesagem. "Peso Bruto" informa para encontrar a leitura do veículo carregado associada ao segundo evento. A IA não se importa se o ticket da Avery Weigh-Tronix coloca o peso bruto na coluna 40 ou na coluna 105. Ela lê o documento como um operador de balança faria: entendendo o que cada número representa no fluxo de carregamento.
Esta é a diferença estrutural entre OCR de template e IA de visão. O OCR de template corresponde caracteres por posição — funciona quando todo ticket tem o mesmo layout e quebra quando não tem. A IA de visão lê documentos entendendo contexto e semântica — a mesma definição de coluna funciona em tickets de diferentes estações de balança, diferentes fornecedores de software e diferentes formatos de impressão. Você define suas colunas uma vez. Cada ticket — independentemente de qual estação de pesagem o gerou — produz dados alinhados à mesma estrutura de saída.
Fluxo de Trabalho em Lote: 50 Tickets, Uma Planilha, Pesos Líquidos Verificados
O fluxo de trabalho para converter uma pilha de tickets de balança em uma única planilha pronta para liquidação tem quatro etapas — cada uma projetada em torno do princípio de que a ferramenta se adapta aos seus documentos, e não o contrário.
Defina suas colunas de saída uma vez. Insira os campos necessários em todos os tickets: "Número de Série / Placa do Veículo / Data/Hora da 1ª Pesagem (Tara) / Tara / Data/Hora da 2ª Pesagem (Bruto) / Peso Bruto / Peso Líquido / Código do Material / Descrição do Material / Nome do Fornecedor / Nome do Motorista." Eles se tornam os cabeçalhos das colunas da sua planilha. Configure isso uma vez; a mesma lista de colunas processa tickets da Avery, WinWeigh, B-TEK e recibos manuscritos.
Adicione uma Coluna Calculada para verificar cada peso líquido. Digite uma coluna como "Verificação de Peso (Peso Bruto − Tara − Peso Líquido)" e a IA calcula a equação do peso líquido para cada ticket durante a extração. Um resultado zero significa que os três valores de peso são internamente consistentes. Um resultado diferente de zero sinaliza essa linha para revisão — ou a IA leu um valor incorretamente, ou o ticket original contém um erro do operador da balança. De qualquer forma, a discrepância é detectada antes que os dados entrem na sua planilha de liquidação, não descoberta semanas depois durante a reconciliação.
Carregue todos os tickets de uma vez. Arraste 20, 50 ou 100 tickets de balança em um único lote — recibos de papel escaneados, PDFs exportados do software de balança ou fotos tiradas na balança. A entrada suporta PDF, JPG, PNG e WebP. A IA processa cada ticket de forma independente com base nas suas definições de coluna, mas mescla todos os resultados em uma única planilha de saída.
Revise e exporte a planilha verificada. Cada ticket de balança se torna uma linha. Os eventos de pesagem de tara e bruto são alinhados às suas respectivas colunas. A coluna calculada "Verificação de Peso" fica ao lado, mostrando zero para linhas verificadas e um valor diferente de zero para discrepâncias sinalizadas. Exporte como XLSX — formatado, classificado e pronto para cálculos de liquidação, importação para ERP ou reconciliação de fim de mês.
A velocidade de processamento escala com a quantidade de documentos, não com a complexidade do formato. Um ticket de balança de uma página é processado em 5 a 10 segundos. Um lote de 50 tickets é concluído em minutos. A IA não desacelera porque o 23º ticket veio de uma estação de pesagem que usa um software diferente — a extração semântica trata a diversidade de formatos como algo irrelevante, não como um obstáculo de configuração.
Os arquivos são processados com segurança e não são armazenados.
Classificando Materiais Durante a Extração: De Códigos Inconsistentes a Categorias Limpas
Os tickets de balança frequentemente trazem códigos de materiais abreviados, inconsistentes ou específicos do sistema interno da estação de pesagem — "IRN 62," "CRSH AGG 20mm," "FLY ASH DRY," "HRS 10mm." Quando os tickets vêm de múltiplos fornecedores, o mesmo material pode aparecer com códigos diferentes. A equipe de compras de uma siderúrgica precisa saber a tonelagem total de minério de ferro de todos os fornecedores — não reconciliar três esquemas de código diferentes.
Uma Coluna Inferida resolve isso durante a extração. Adicione uma coluna como "Categoria do Material (opções: Minério de Ferro | Calcário | Carvão | Agregado | Produtos Químicos | Outros)" e a IA lê a descrição ou código do material em cada ticket, associa à categoria mais próxima e preenche a coluna. Extração e classificação ocorrem em uma única etapa — sem VLOOKUP pós-processamento, sem revisão manual de cada código. A descrição original do material permanece em sua própria coluna como texto-fonte; a categoria inferida fornece o agrupamento padronizado que sua planilha de liquidação precisa.
Para operações de compras que lidam com materiais de grau commodity, onde a classificação determina o preço — como distinguir minério de ferro com 62% Fe de 58% Fe — mantenha a designação de grau em uma coluna de extração direta junto com a categoria inferida. A coluna inferida lida com o grupo amplo; a coluna de extração direta preserva a especificação contratual.
Chega de caçar anexos de e-mail: deixe cada balança fazer o upload direto
Mesmo depois de resolver o problema da extração, ainda existe um obstáculo logístico: colocar os arquivos dos tíquetes no sistema. O fluxo típico de compras é: a balança do fornecedor imprime os tíquetes → alguém digitaliza ou fotografa → envia PDFs por e-mail para o setor de compras → o setor de compras baixa os anexos → salva em uma pasta → faz upload na ferramenta de extração. A extração é automatizada, mas a coleta não.
Collection Link elimina essa lacuna. Você gera uma URL exclusiva a partir da sua conta e a compartilha com cada balança de fornecedor. O operador da balança abre o link, insere um código de verificação curto e faz o upload do lote de tíquetes do dia diretamente para a sua fila de processamento. Sem e-mail, sem download, sem pasta. O remetente não precisa de conta ou login.
Para equipes de compras que recebem tíquetes de 10 a 30 fornecedores, isso elimina a etapa menos eficiente do processo: a intervenção humana de coletar anexos de e-mail espalhados. Em vez de "verificar 20 e-mails de fornecedores → baixar 20 lotes → organizar → fazer upload", o fluxo se torna "fornecedor faz upload → tíquetes aparecem na sua fila → processamento em lote → exportação."
Como lidar com tíquetes de balança em papel carbono e manuscritos
Nem toda balança gera tíquetes limpos impressos a laser ou térmicos. Pedreiras rurais, pequenos elevadores de grãos e instalações industriais antigas costumam usar tíquetes em papel carbono preenchidos à mão — o operador escreve a placa do veículo, o código do material e as duas leituras de peso, depois arranca a via para o motorista.
Esses tíquetes apresentam dois desafios para a extração. Primeiro, as vias de papel carbono têm baixo contraste inerente — a impressão na segunda ou terceira camada é mais fraca que a original, com caracteres que podem estar quebrados ou fantasmas. Segundo, as leituras de peso manuscritas nesses tíquetes têm a mesma variabilidade de qualquer caligrafia — a letra do operador, borrões e o sangramento do papel carbono afetam a legibilidade.
Para tíquetes em papel carbono, digitalize sempre que possível a via original (a primeira cópia) — o contraste é significativamente melhor que o das vias. Para arquivos onde só restam as vias, o reconhecimento de caligrafia da IA lida com impressões de carbono nítidas com precisão razoável, mas espere menor confiança em campos desbotados ou borrados. Execute a verificação de peso líquido da Coluna Calculada em um lote de amostra antes de processar o arquivo completo — se a maioria dos valores de Verificação de Peso retornar zero, a extração é confiável. Se valores diferentes de zero forem comuns, verifique essas linhas manualmente.
Limitação honesta: Cópias carbono muito degradadas — onde a terceira ou quarta via está quase em branco — e tíquetes densamente manuscritos com caligrafia irregular produzirão menor precisão de extração. A verificação da Coluna Calculada é sua rede de segurança: ela detecta erros de extração antes que eles se propaguem para a liquidação. Mas, para os tíquetes em pior estado, a entrada manual dos campos de peso críticos ainda pode ser necessária. A ferramenta reduz a entrada manual de dados de "todos os campos, todos os tíquetes" para "alguns campos, alguns tíquetes."
O Ticket de Pesagem como Documento Legal: O que Está em Jogo
Na aquisição de commodities a granel, o ticket de balança é mais que um registro de dados — é um documento legal. De acordo com o NIST Handbook 44, o padrão regulatório para dispositivos de pesagem comerciais nos Estados Unidos, balanças com certificação legal para comércio devem atender a tolerâncias de precisão especificadas e produzir representações registradas que incluam o peso da transação. O Programa Nacional de Avaliação de Tipo (NTEP) certifica que os equipamentos de pesagem estão em conformidade com esses requisitos. Um ticket impresso por uma balança certificada pelo NTEP e em conformidade com o NIST Handbook 44 é o registro de peso legalmente decisivo para a transação.
Kentucky Revised Statutes 363.780 — representativo de leis similares na maioria dos estados — exige que entregas de commodities a granel vendidas por peso sejam acompanhadas por um ticket de entrega em duplicata, constando nome e endereço do vendedor, nome e endereço do comprador, peso líquido, e os pesos bruto e tara dos quais o líquido foi derivado. De acordo com 49 CFR §375.519, os tickets de peso devem incluir o nome completo e a localização da balança, a data de cada pesagem, a identificação das entradas de peso como tara/bruto/líquido e a assinatura do mestre de pesagem.
O peso legal desses documentos tem uma implicação prática para a extração: os dados que você extrai são os dados que a balança registrou. A IA não verifica a calibração da balança. Ela extrai o que está impresso ou escrito no ticket. A Verificação de Peso da Coluna Calculada confere a consistência interna — Bruto menos Tara é igual a Líquido? — mas não pode dizer se a balança estava lendo 50 kg a mais naquela manhã. A auditoria de calibração da balança é domínio do agente de serviço registrado que mantém a balança, não da ferramenta de extração de documentos.
Perguntas Frequentes
Consegue processar tickets de balança onde os eventos de tara e bruto estão em páginas separadas?
Sim — carregue ambas as páginas como parte do mesmo lote. A IA processa cada página de forma independente, mas associa os resultados pela placa do veículo e número do ticket. Se sua operação de balança emitir comprovantes separados de tara e bruto (comum em configurações de pesagem única por passagem), carregue-os juntos e a IA pareia os dois eventos pelos identificadores compartilhados.
E se fornecedores usarem nomes de campos diferentes — ex.: "Tara" vs. "Peso Vazio" vs. "Descarregado"?
A IA mapeia termos semanticamente equivalentes. Se você especificar "Peso Tara" como nome da coluna, a IA localizará campos rotulados como "Tara", "Peso Vazio", "Descarregado" ou "Massa Tara" no ticket e os mapeará para sua coluna de Peso Tara. Você não precisa listar cada sinônimo — a IA entende que todos se referem à leitura de peso do veículo vazio.
Preciso configurar algo por posto de pesagem de fornecedor?
Não. A lista de colunas que você define uma vez funciona em todos os postos de pesagem e todos os formatos de ticket. Não há criação de modelos, configuração por fornecedor ou fase de treinamento. Esta é a principal vantagem da extração semântica sobre a extração posicional para um cenário de formatos fragmentados.
O que acontece se um ticket não tiver um campo — por exemplo, alguns tickets de balança não mostram o nome do motorista?
A célula desse campo fica em branco na saída para aquele ticket. Sua estrutura de planilha permanece consistente em todas as linhas; campos ausentes aparecem como células vazias. Sem erros, sem alertas de incompatibilidade de modelo, sem interrupção no fluxo de trabalho.
Posso exportar os dados no formato de importação do meu ERP?
Sim — configure os nomes das colunas para corresponder aos nomes dos campos de importação do seu ERP. Use os cabeçalhos exatos do seu ERP ao definir as colunas, e a saída XLSX será estruturada para importação direta. Formatos de data e número podem ser especificados na sua configuração de extração para atender aos requisitos do seu ERP, seja você usando SAP, Oracle NetSuite, Microsoft Dynamics ou uma plataforma específica de commodity como Loop ERP.
Esta ferramenta conecta-se diretamente ao meu hardware de balança?
Não. O ImageToTable.ai é uma ferramenta de extração de documentos — ele processa tickets de balança após serem impressos, digitalizados ou fotografados. Ele não se conecta ao hardware da balança, células de carga ou sistemas de pesagem em tempo real. Se você precisa de integração de hardware em tempo real, isso é domínio de softwares de gestão de balanças (WinWeigh, B-TEK ScaleSoft, etc.). Esta ferramenta resolve o problema downstream de entrada de dados para tickets que já existem — o lote de 50 vias sobre sua mesa.
Qual a precisão da extração para os campos críticos de peso — Tara, Bruto e Líquido?
Para impressões digitais limpas de softwares de balança (a maioria dos tickets de estações de pesagem operacionais), a precisão da extração dos campos de peso normalmente excede 95%. As principais quedas de precisão vêm de: recibos térmicos muito desbotados, cópias carbono de terceira via com caracteres quebrados, campos manuscritos densos com caligrafia irregular e fotografias severamente distorcidas. A Verificação de Peso da Coluna Calculada detecta inconsistências na extração — um resultado diferente de zero significa que um dos três valores de peso foi mal lido ou o ticket original é inconsistente, e essa linha é sinalizada para revisão.
Para uma análise mais aprofundada de como a extração automatizada se compara à entrada manual de dados em tipos de documentos de aquisição, veja nossa comparação entre OCR de tickets de balança e taxas de erro e custo da entrada manual. Para conversão em lote de tickets de balança em planilhas estruturadas, use o conversor de ticket de balança para Excel.