47 Pedidos de Compra, Um Relatório de Gastos:
Conciliação de Suprimentos Médicos de Vários Fornecedores Sem a Fusão Manual
A própria pesquisa de 2022 da McKesson descobriu que 78% das organizações de saúde ainda usam processos manuais na cadeia de suprimentos. Ande pelo chão de compras de qualquer hospital de médio porte e você verá o porquê: o relatório de gastos que o financeiro solicita todo mês não é uma simples extração de dados de um ERP. É uma planilha montada manualmente a partir de pedidos de compra que chegam como PDFs da Medline, anexos de e-mail da Cardinal Health, downloads do portal da Henry Schein e feeds EDI da GHX de uma dúzia de distribuidores menores — cada um com seu próprio layout de colunas, sua própria convenção de numeração de itens e sua própria interpretação do que um "total de item de linha" deve incluir. O gargalo não é a falta de vontade de automatizar. É que a matéria-prima de um relatório de gastos hospitalares chega em seis formatos diferentes de seis fontes diferentes, e as ferramentas projetadas para lidar com pedidos de compra foram construídas para um formato de cada vez.
Principais Conclusões
- Uma semana inteira de trabalho todo mês desaparece na consolidação de pedidos de compra de uma dúzia de distribuidores, cada um usando suas próprias convenções de nomenclatura de fornecedores e sistemas de unidades de medida incompatíveis
- Processar um único pedido é um problema resolvido, mas a transição entre documentos é onde o trabalho explode, porque seis fornecedores usam seis sistemas de numeração de itens e três convenções de unidades diferentes
- ImageToTable.ai extrai todos os 47 pedidos com uma única definição de coluna em um lote, de modo que o relatório consolidado de gastos chega com subtotais por fornecedor e rastreabilidade por lote já incorporados
Por que fluxos com um único pedido de compra colapsam em escala hospitalar
Processar um pedido de compra é um problema resolvido. Você abre o PDF, localiza o número do pedido, o nome do fornecedor, os códigos dos itens, as quantidades e os preços. Digita tudo em uma planilha ou no seu ERP. Leva de dois a três minutos por documento. O processo é tedioso, mas funcional.
Processar 47 pedidos de compra de 12 fornecedores diferentes de materiais médicos é uma categoria diferente de problema. Um hospital de médio porte normalmente compra de um grupo central de cerca de meia dúzia de distribuidores principais — Medline, Cardinal Health, McKesson Medical-Surgical, Henry Schein, Owens & Minor — além de outros cinco a dez fornecedores especializados em reagentes de laboratório, dispositivos implantáveis ou consumíveis de diagnóstico. Cada fornecedor gera pedidos em seu próprio formato, por seu próprio canal, em seu próprio ritmo. Os PDFs de confirmação da Medline chegam por e-mail com IDs de documento na linha de assunto. Os pedidos da Cardinal Health vêm pelo sistema GHX como transações EDI 850 estruturadas — mas sua equipe financeira os baixa como PDFs do portal porque a integração EDI nunca foi concluída para o fluxo de relatórios de gastos. A Henry Schein usa um sistema de numeração de itens completamente diferente da McKesson, e nenhum deles utiliza as mesmas convenções de abreviação de unidade de medida.
O fluxo de um único pedido quebra aqui não porque qualquer pedido individual seja difícil de processar, mas porque a transição entre documentos é onde o trabalho se multiplica. Ao processar um pedido, a pergunta é "quais dados estão nesta página?" Ao processar 47 pedidos de 12 fornecedores, a pergunta se torna "como faço para que os dados de todos os 12 fornecedores se alinhem nas mesmas colunas?" — e a resposta, para a maioria das equipes de compras hospitalares, é copiar e colar manualmente, um pedido de cada vez, em uma planilha mestre do Excel que alguém do financeiro criou há três anos e vem ajustando desde então.
Insight principal: A diferença entre processar um PO e processar 47 não é 47 vezes o trabalho. É uma diferença arquitetural. Ferramentas para PO único otimizam uma tarefa unitária. O processamento em lote exige uma estratégia de mesclagem — e é nessa mesclagem que toda discrepância de formato entre fornecedores se torna uma etapa de reconciliação manual.
O Problema da Nomenclatura de Arquivos Que Ninguém Menciona
Em um fluxo de PO único, nomes de arquivo quase não importam. Você abre "PO_2025_06_03.pdf", extrai os dados, fecha e segue em frente. O nome do arquivo não precisa codificar nada, pois você está olhando para o documento enquanto trabalha.
Em um fluxo em lote, nomes de arquivo são infraestrutura. Quando você coloca 47 PDFs em uma fila de extração, a ferramenta precisa rastrear qual linha da planilha de saída veio de qual documento de origem — não apenas para rastreabilidade, mas para tratamento de exceções. Se a linha 14 do seu relatório de gastos mostra uma quantidade de 5.000 luvas de nitrila a US$ 0,12/unidade de um fornecedor desconhecido, e o arquivo de origem se chama "scan0251.pdf", você tem um problema de detetive, não de dados. Você precisa encontrar o documento original, abri-lo, verificar os dados e então descobrir a qual fornecedor ele pertence. Isso é um desvio de cinco minutos por anomalia — e em um lote de 47 POs, anomalias são rotineiras.
Os pedidos de compra de suprimentos médicos adicionam uma segunda camada a esse problema: o mesmo fornecedor frequentemente aparece com vários nomes em documentos diferentes. Um PO da McKesson pode listar o fornecedor como "McKesson Medical-Surgical Inc." no cabeçalho do PDF, "McKesson MMS" no assunto do e-mail e "MKC" no cadastro de fornecedores do ERP. Os POs da Cardinal Health às vezes carregam o nome antigo de um centro de distribuição adquirido anos atrás. Ao consolidar 47 POs em um relatório de gastos agrupado por fornecedor, essas inconsistências de nomenclatura fazem com que o mesmo fornecedor apareça em três linhas diferentes — e o total de gastos fica incorreto até que alguém identifique e mescle manualmente.
Isso não é um problema de qualidade de dados no sentido tradicional. Os dados de cada PO individual são precisos. O problema é que não há dois fornecedores que formatem seus documentos de forma alinhada entre si, e a etapa de reconciliação — fazer com que "McKesson Medical-Surgical Inc." e "MKC" sejam resolvidos como o mesmo registro de fornecedor — recai inteiramente sobre a pessoa que está montando a planilha.
Quando Seis Formatos de Distribuidores Precisam se Tornar Uma Única Estrutura de Colunas
O desafio técnico central do processamento em lote de POs não é a precisão da extração. É a normalização das colunas. Um único relatório de gastos exige que cada linha tenha as mesmas colunas: Nome do Fornecedor, Número do PO, Código do Item, Descrição do Item, Quantidade Pedida, Preço Unitário, Total da Linha, Referência do Contrato GPO, Número do Lote, Data de Validade. Mas os documentos de origem preenchem esses campos de forma diferente — ou nem os preenchem.
Considere apenas o campo de código do item. A Medline utiliza seus próprios números de item de 6 dígitos. A Cardinal Health usa um sistema de numeração de catálogo diferente, e seus pedidos podem listar tanto o SKU da Cardinal quanto o número de catálogo do fabricante em colunas separadas. Os pedidos em PDF da McKesson imprimem o número do item sem rótulo de coluna — espera-se que você saiba que a primeira string alfanumérica em cada linha é o código do item. Os pedidos da Henry Schein dividem os itens em sublinhas com diferentes faixas de preço dependendo do volume, e a coluna de descrição do item contém texto concatenado que abrange três campos lógicos em qualquer outro formato de fornecedor.
Agora multiplique isso pelas outras nove colunas do seu relatório de gastos. A unidade de medida é a assassina silenciosa do formato: um fornecedor lista luvas por caixa (100/caixa), outro por fardo (10 caixas/fardo), um terceiro por unidade individual. Se o seu relatório de gastos consolidar tudo sem normalizar a unidade, a coluna de quantidade se torna sem sentido — 50 caixas ao lado de 5 fardos ao lado de 500 unidades parece um erro de pedido, mas é um problema de codificação de unidade de medida que invalida toda a análise de gastos.
Os contratos de organizações de compras coletivas (GPOs) adicionam outra camada de complexidade. A maioria dos hospitais compra por meio da Vizient, Premier ou HealthTrust — três organizações que, juntas, gerenciam centenas de bilhões em volume anual de compras e negociam preços contratuais para cerca de 72% das compras hospitalares. Cada pedido de compra deve fazer referência ao número do contrato GPO aplicável para que o financeiro possa verificar o preço pago em relação à taxa contratual. No entanto, alguns POs de fornecedores incluem o ID do contrato GPO em um campo dedicado; outros o enterram nas notas do cabeçalho; alguns nem o imprimem, exigindo que o comprador o consulte manualmente em seu cadastro de contratos GPO. Um relatório de gastos que omite as referências de contrato GPO não pode ser usado para auditoria de conformidade contratual — o que significa que o relatório está incompleto no momento em que é gerado, e alguém precisa preencher os dados GPO ausentes manualmente.
A Association for Health Care Resource & Materials Management (AHRMM) oferece uma ferramenta gratuita de benchmarking de KPIs que permite aos hospitais medir o desempenho da cadeia de suprimentos em comparação com pares de porte similar. Mas o benchmarking exige dados de gastos limpos e consolidados de todos os fornecedores — os mesmos dados que levam uma semana inteira de reconciliação manual para serem produzidos.
UDI, Números de Lote e Datas de Validade: Os Campos Ignorados pelos Fluxos de Trabalho de PO Único
Os POs de compras gerais rastreiam o básico comercial: o que foi pedido, a que preço, para qual data de entrega. Os POs de suprimentos médicos carregam uma carga regulatória adicional que as ferramentas de extração comercial nunca foram projetadas para lidar.
O sistema de Identificação Única de Dispositivo (UDI) da FDA, estabelecido sob 21 CFR 801 Subpart B e 21 CFR 830.300, exige que a maioria dos dispositivos médicos tenha um UDI em seu rótulo — um código composto por um Identificador de Dispositivo (UDI-DI) que identifica o fabricante e o modelo, e um Identificador de Produção (UDI-PI) que captura número de lote, número de série, data de validade e data de fabricação. Quando um hospital faz pedidos de dispositivos implantáveis, instrumentos cirúrgicos ou consumíveis de diagnóstico, a ordem de compra deve refletir esses identificadores para que a equipe de recebimento possa conferir os produtos entregues com o pedido e para que a equipe da cadeia de suprimentos possa rastrear qualquer item de volta ao seu lote de produção em caso de recall.
Na prática, os dados de UDI aparecem de forma inconsistente nas ordens de compra dos fornecedores. A Medline e a Cardinal Health geralmente incluem números de lote e datas de validade nas ordens de compra de dispositivos médicos como campos separados por linha. A McKesson às vezes imprime números de lote em uma coluna de observações anexada à descrição do item. Fornecedores especializados menores podem nem incluí-los — o lote e a validade estão no romaneio, não na ordem de compra, e a reconciliação exige cruzar dois documentos para cada item.
Para um hospital que processa 47 ordens de compra por mês, essas inconsistências significam que algumas linhas no relatório de gastos estão completas com UDI, enquanto outras não possuem campos críticos de rastreabilidade. Um recall de um lote específico de tela cirúrgica exige encontrar todas as ordens de compra que pediram aquele produto e verificar quais lotes foram realmente recebidos. Se os dados da ordem de compra não incluírem números de lote, a resposta ao recall começa com uma inspeção física do estoque — um processo que pode levar dias e que coloca a segurança do paciente em risco desnecessário.
Por que isso importa em escala de lote: Em um lote de 47 POs, de 8 a 12 terão dados incompletos de UDI ou lote/validade. Um fluxo de trabalho em lote precisa sinalizar esses itens para revisão humana sem interromper todo o processamento. A ferramenta deve extrair o que está presente e deixar células em branco onde faltam dados — sem falhar silenciosamente e sem inventar valores para preencher as lacunas.
Como a Extração Semântica de Colunas Lida com a Diversidade de Formatos de Fornecedores em Uma Única Passada
A abordagem que gerencia lotes de POs de múltiplos fornecedores é fundamentalmente diferente da extração baseada em modelos. Ferramentas de modelo funcionam memorizando posições fixas em uma página — "o número da PO está nas coordenadas X,Y no PDF do Fornecedor A." Quando o Fornecedor B usa um layout diferente, um modelo diferente é necessário. Quando o Fornecedor A altera o formato da PO após uma atualização do ERP, o modelo quebra silenciosamente. Para um hospital que lida com 12 fornecedores, a manutenção de modelos sozinha consome o tempo que a ferramenta de extração deveria economizar.
A extração semântica de colunas funciona de forma diferente. Em vez de informar à ferramenta onde cada campo está na página de cada fornecedor, você define as colunas desejadas: "Nome do Fornecedor," "Número da PO," "Código do Item," "Descrição," "Quantidade," "Preço Unitário," "Total da Linha," "Contrato GPO," "Número do Lote," "Data de Validade." A IA lê cada documento entendendo o significado de cada dado — localizando o número da PO onde quer que apareça, encontrando itens de linha independentemente da estrutura da tabela, identificando números de lote mesmo quando estão embutidos em um campo de descrição em vez de em sua própria coluna.
Os nomes das colunas que você inserir se tornam os cabeçalhos de uma única planilha de saída. Um pedido da Medline, um da Cardinal Health e um da McKesson alimentam a mesma estrutura de colunas. A IA não precisa saber que a Medline coloca o nome do fornecedor no cabeçalho superior esquerdo, enquanto a Cardinal Health o coloca em um campo "Vendido Para" no meio da página. Ela encontra cada valor semântico lendo o documento como uma pessoa faria — seguindo a estrutura, entendendo o contexto — e o mapeia para a coluna que você definiu.
Essa abordagem, que o ImageToTable.ai chama de extração personalizada de colunas, é a diferença entre programar regras de extração por fornecedor e definir um esquema de saída universal uma única vez. Você digita os nomes dos campos desejados — e eles se tornam os cabeçalhos exatos da sua planilha consolidada, para todos os fornecedores e todos os formatos. A mesma configuração que extrai um pedido de 5 linhas de um fornecedor laboratorial regional extrai um pedido de 200 linhas da Medline, porque a IA busca pelo significado, não pela posição.
Os arquivos são processados com segurança e não são armazenados.
Dos Dados Extraídos a um Relatório de Gastos Pronto para a Finança
Ter todos os 47 POs extraídos em uma planilha unificada é um avanço — mas o relatório de gastos que sua equipe financeira espera vai além. Ele precisa de subtotais por fornecedor, verificações de conformidade com contratos GPO, gastos por categoria e variação em relação ao mês anterior. A saída da extração bruta é a base; a transformação em um relatório de gastos é onde a planilha ganha seu lugar no fechamento mensal.
O resultado da extração já possui todos os itens de cada fornecedor em colunas consistentes. A partir daí, construir o relatório de gastos é uma questão de agrupar e agregar — operações que o Excel lida nativamente quando os dados estão em uma única tabela. Agrupe por fornecedor para obter o gasto total comprometido com cada distribuidor. Agrupe por ID do contrato GPO para verificar se cada item foi comprado pelo preço contratado. Faça uma tabela dinâmica por categoria de item para ver se os suprimentos cirúrgicos estão aumentando como parcela do gasto total. Filtre por número de lote e data de validade para identificar estoque próximo ao vencimento em todos os fornecedores simultaneamente — uma visão impossível de construir quando os dados de PO estão espalhados por 12 formatos e 47 documentos separados.
Esta é a saída que os diretores de compras apresentam na revisão mensal da cadeia de suprimentos. Ela responde às perguntas que os dados fragmentados de PO não conseguem: quais fornecedores representam a maior parcela dos gastos, se o preço do contrato GPO está sendo respeitado em cada transação e onde o departamento está pedindo em excesso em relação ao consumo histórico. Nenhuma dessas perguntas pode ser respondida quando os dados de PO estão em PDFs individuais no desktop de alguém. Elas se tornam respondíveis quando 47 POs alimentam uma única planilha com uma estrutura de colunas — e quando a extração ocorre em um único lote, em vez de 47 sessões manuais separadas.
Para hospitais que já usam sistemas ERP como Workday Supply Chain Management, Oracle Cerner ou Infor, a planilha consolidada de PO serve como arquivo de importação — dados limpos e alinhados em colunas que mapeiam diretamente para o template de importação de pedidos de compra do ERP. A extração em lote elimina a etapa de preparação de dados que normalmente consome um dia inteiro de trabalho de redigitação manual por ciclo mensal.
Quando Executar Lotes vs. Quando Processar POs Individuais
Nem todo fluxo de trabalho de PO hospitalar se beneficia do processamento em lote. O fluxo de trabalho de PO única — extrair dados de um documento por vez, imediatamente — tem seu lugar nas operações diárias. Quando um departamento faz um pedido urgente de um implante específico e precisa verificar o preço em relação ao contrato do GPO antes de confirmar, abrir um PDF e extrair seus dados em segundos é a abordagem correta. Para o processo passo a passo de configurar a extração de PO única com campos específicos da área da saúde, como códigos NDC e números de lote, o fluxo de trabalho de extração de PO única para rastreamento de estoque de suprimentos médicos cobre os detalhes em nível de campo.
O processamento em lote mostra seu valor no limite da conciliação mensal. O relatório de gastos, a auditoria de conformidade contratual, a verificação de vencimento de estoque — esses são fluxos de trabalho periódicos que agregam dados de vários fornecedores. Executá-los um PO por vez é uma semana de trabalho manual para um hospital de médio porte. Executá-los em lote — enviar todos os 47 POs, definir as colunas uma vez, obter uma única saída mesclada — transforma uma semana de entrada de dados em uma manhã de revisão e análise.
A linha divisória é direta: se a tarefa exige comparar dados entre fornecedores, é um problema de lote. Se a tarefa envolve agir em um único PO imediatamente, é um problema de documento único. A maioria das equipes da cadeia de suprimentos hospitalares opera nos dois modos, e a ferramenta de extração precisa suportar ambos — um modo de PO única para operações diárias e um modo de mesclagem em lote para relatórios mensais — sem exigir configurações separadas para cada um.
Perguntas Frequentes
A extração em lote lida com POs com moedas ou tratamentos fiscais diferentes?
Sim, com uma ressalva. A IA extrai os valores das moedas conforme aparecem em cada PO. Se os POs da Medline estão em USD e um fornecedor europeu especializado envia POs em EUR, a saída preserva os símbolos e valores das moedas originais em linhas separadas. A ferramenta não realiza conversão de moeda — isso continua sendo uma função financeira. O que ela faz é garantir que valores em USD e EUR não sejam somados inadvertidamente no mesmo total, pois cada linha mantém o rótulo da moeda de origem.
O que acontece se um fornecedor alterar o formato do PO entre os lotes?
Nada quebra. Como a IA localiza os dados pelo significado semântico, e não por coordenadas fixas na página, uma mudança de formato — um novo layout de cabeçalho, uma estrutura de tabela diferente, um rodapé reorganizado — não afeta a extração. A IA lê o documento do zero a cada vez. Esta é a diferença crítica em relação às ferramentas baseadas em modelos, onde uma mudança de formato exige atualizar ou recriar o modelo antes que o próximo lote possa ser processado.
Posso extrair apenas os itens de linha que preciso, ou a ferramenta extrai tudo?
Você controla exatamente quais campos são extraídos definindo sua lista de colunas. Se você só precisa de Número do PO, Nome do Fornecedor, Código do Item, Quantidade e Preço Unitário, defina essas cinco colunas e a saída conterá apenas esses cinco campos. A IA não extrairá pontos de dados que você não solicitou. Isso mantém a saída focada e elimina a etapa de limpeza de excluir colunas irrelevantes após a extração.
Como a ferramenta lida com POs que abrangem várias páginas?
POs de várias páginas — comuns ao pedir kits cirúrgicos com mais de 50 itens — são processados como um único documento contínuo. A IA lê através das quebras de página, reconhece cabeçalhos de coluna repetidos nas páginas seguintes e mescla todos os itens sob o mesmo cabeçalho de PO. O resultado é uma linha por item, independentemente de quantas páginas o PO original ocupava.
Isso funciona com POs EDI da GHX ou apenas com PDFs e imagens?
O mecanismo de extração funciona com PDF, JPG, PNG, WebP e capturas de tela. As transações EDI da GHX (850 Pedido de Compra, 855 Confirmação) já são dados estruturados e não precisam de extração por IA — devem ser alimentadas diretamente no seu ERP. O caso de uso para extração em lote é a lacuna: os POs que chegam como PDFs e imagens porque o fornecedor não suporta EDI, ou porque sua integração EDI foi configurada para transmissão de pedidos, mas não para relatórios de gastos.