Como Extrair Extratos de TransaçõesCoreanas para o Excel

A Coreia do Sul processa mais de 600 milhões de faturas fiscais eletrônicas por ano através do sistema NTS e-Tax. No entanto, o documento que realmente acompanha cada remessa física — o extrato de transação (거래명세서) — está em um ponto cego digital. Ele não tem formato legalmente obrigatório. Não é transmitido a nenhum sistema governamental. E, para a equipe de compras que recebe 40 deles por semana de 20 fornecedores diferentes, cada um chega como PDF, impressão ou foto de celular — todos com layouts diferentes, todos precisando dos mesmos dados em nível de item extraídos para a mesma planilha de recebimento.

Este guia aborda o que um extrato de transação coreano realmente contém, por que as ferramentas OCR convencionais têm dificuldade com ele e como extrair dados de itens de qualquer 거래명세서 de fornecedor para o Excel — em uma única passagem, sem configuração por fornecedor.

Extração de dados de extrato de transação coreano para planilha Excel para conciliação de compras

Principais Conclusões

  1. 600 milhões de faturas fiscais eletrônicas fluem pelo sistema NTS da Coreia todos os anos — mas o 거래명세서 que você realmente recebe com cada remessa está totalmente fora desse sistema, sem formato legalmente obrigatório e sem caminho de transmissão digital.
  2. O gargalo não é o reconhecimento de caracteres coreanos. Cada fornecedor projeta seu próprio layout porque nenhuma lei determina o contrário. A extração baseada em modelos pressupõe formatação consistente — essa suposição quebra no momento em que um segundo fornecedor envia um documento.
  3. Uma única definição de coluna — Nome do Fornecedor, Nome do Item, Quantidade, Preço Unitário — lê qualquer 거래명세서 pelo significado, não pela posição. O ImageToTable.ai localiza campos decodificando o que o documento diz, em vez de depender de onde um fornecedor colocou as coisas.

O que um Extrato de Transação Coreano Realmente Contém

Um extrato de transação (거래명세서, literalmente "documento de detalhamento de transação") é o documento que acompanha uma remessa entre empresas coreanas. Diferente de uma fatura fiscal (세금계산서), que é um documento legalmente regulamentado pelo Artigo 32 da Lei do IVA da Coreia e transmitido ao Serviço Nacional de Impostos, o 거래명세서 não tem formato obrigatório. É um documento de verificação privada (사적 증빙) — não elegível para dedução de imposto de entrada, não arquivado em nenhuma autoridade governamental e não exigido por lei.

Esse vácuo regulatório cria o problema de extração. Como não existe um formato padrão, cada fornecedor cria seu próprio layout. Um extrato de transação de um fornecedor de embalagens em Incheon coloca as informações do comprador no canto superior esquerdo e a tabela de itens no centro inferior. Um de um distribuidor de aço em Pohang coloca o carimbo da empresa (직인) no cabeçalho e as linhas de itens na orientação paisagem. Nenhum está errado — porque não há um modelo para se estar errado.

Um 거래명세서 típico contém estes campos:

CampoNome em CoreanoFinalidade
Dados do fornecedor공급자Nome da empresa, CNPJ, endereço, contato
Dados do comprador공급받는자Nome da empresa destinatária, CNPJ, endereço
Data da transação거래일자Data de entrega das mercadorias
Nome do item품목명Nome ou código de cada item entregue
Especificação규격Dimensões, números de modelo, grau
Quantidade수량Número de unidades entregues
Preço unitário단가Preço por unidade
Valor금액Total da linha (수량 × 단가)
Valor dos bens공급가액Soma de todos os valores de linha, excluindo IVA
Valor do imposto세액IVA (10% do valor dos bens)
Observações비고Notas adicionais — condições de entrega, flags de remessa parcial, referência do pedido

O documento é normalmente emitido em duas vias: uma cópia vermelha para o fornecedor (공급자용) e uma cópia azul para o comprador (공급받는자용). No fluxo de compras, ele chega com a remessa física. A equipe de recebimento confere com o pedido de compra e as mercadorias reais — um processo chamado conciliação tripla — antes de autorizar o pagamento com base na fatura fiscal que chega posteriormente.

Em sistemas ERP coreanos como ECOUNT (이카운트), Douzone (더존) e 얼마에요 da iQuest, os extratos de transação são tipicamente gerados automaticamente a partir de registros de vendas — um problema resolvido no lado da saída. O lado da entrada é onde as coisas quebram: esses mesmos sistemas não oferecem uma forma nativa de ingerir dados dos extratos de transação que você recebe dos seus próprios fornecedores.

Por que ferramentas baseadas em template não conseguem lidar com 거래명세서

A maioria das ferramentas de extração de documentos opera com base em um de dois princípios: templates baseados em coordenadas ou modelos treinados. Em um sistema baseado em coordenadas, você desenha retângulos ao redor dos campos — "nome do fornecedor está em (120, 340)" — e a ferramenta lê o texto que aparece naquela zona. Em um sistema de modelo treinado, você anota de 10 a 50 documentos de amostra para que o modelo aprenda onde cada campo geralmente aparece.

Ambas as abordagens falham com 거래명세서 pelo mesmo motivo: não existe um "geralmente". Como o documento não tem um layout padrão, as coordenadas e posições dos campos são diferentes para cada fornecedor. Treine um modelo em extratos de transações do Fornecedor A, e ele falhará no formato do Fornecedor B. Adicione o formato do Fornecedor B ao conjunto de treinamento, e o layout do Fornecedor C introduz um novo modo de falha. Isso não é um problema de dados de treinamento — é uma incompatibilidade estrutural entre a extração baseada em template e um tipo de documento que nunca foi projetado para ser baseado em template.

A alternativa é a extração semântica: em vez de dizer à ferramenta onde olhar, você diz o que procurar. Você digita os nomes das colunas desejadas — "Nome do Item", "Quantidade", "Preço Unitário", "Valor do Fornecimento" — e a IA lê o documento visualmente, localizando cada campo ao entender o que ele significa, em vez de onde está na página. Essa abordagem, chamada de extração por nome de coluna, significa que uma definição de coluna processa o extrato de transação de cada fornecedor — independentemente do layout, orientação, ou se o nome do fornecedor está no canto superior esquerdo, centralizado ou incorporado em um bloco de cabeçalho.

Essa distinção é importante porque a alternativa — manter um template separado para cada fornecedor — não escala. Você integra 3 fornecedores, funciona. Você chega a 30, e manter a biblioteca de templates se torna uma tarefa administrativa por si só. A extração por nome de coluna elimina essa manutenção completamente: a mesma definição de coluna funciona no documento do primeiro fornecedor e no do 30º.

OCR baseado em template assume que os layouts dos documentos são consistentes. A extração por nome de coluna assume que não são — e essa é a suposição correta para qualquer documento B2B coreano que não tenha um formato legalmente obrigatório.

Passo a Passo: Extrair Dados de 거래명세서 para o Excel

Aqui está o fluxo de trabalho completo, desde o recebimento de um PDF de extrato de transação até ter dados estruturados em uma planilha. Cada etapa é uma ação — sem desenho de coordenadas, sem treinamento de modelo, sem configuração por fornecedor.

1
Carregue seus extratos de transação. Arraste e solte PDFs, digitalizações ou fotos na área de upload. Se um fornecedor enviar um PDF por e-mail, salve-o e faça o upload. Se um entregador lhe der uma cópia impressa, tire uma foto com seu celular e faça o upload da imagem. JPG, PNG, WebP e PDF são suportados. Para processamento em lote diário, carregue todos os extratos das entregas do dia de uma só vez.
2
Defina suas colunas. Digite os nomes dos campos que deseja extrair para sua planilha. Para conciliação de compras, um conjunto típico de colunas é: Nome do Fornecedor, CNPJ do Fornecedor (사업자등록번호), Data da Transação (거래일자), Nome do Item (품목명), Especificação (규격), Quantidade (수량), Preço Unitário (단가), Valor do Item (금액), Valor Base (공급가액), Valor do ICMS (세액), Número do Pedido de Compra. Os nomes das colunas que você digitar se tornarão os cabeçalhos exatos na sua saída do Excel — na ordem em que foram digitados.
3
Processe e revise. A IA lê cada documento, localiza cada campo solicitado pelo significado semântico (não pela posição) e preenche a tabela de saída. Os itens de linha da tabela de itens do extrato de transação são extraídos linha por linha, com campos de nível de cabeçalho, como nome do fornecedor, repetidos para cada linha. Revise os dados extraídos na tela — você pode editar qualquer célula, se necessário, antes de exportar.
4
Baixe como Excel. Exporte a tabela completa como XLSX, CSV ou JSON. Cada linha de item de cada extrato de transação se torna uma linha em sua planilha. Os campos de cabeçalho são preenchidos em todas as linhas. A saída está pronta para importação em seu ERP — seja ECOUNT, Douzone ou um sistema personalizado — sem necessidade de pós-processamento.

O mecanismo de extração lê cada campo pelo significado — ele reconhece um CNPJ de fornecedor (사업자등록번호) pelo seu padrão de 10 dígitos com hífens, um valor base (공급가액) pela sua posição relativa às colunas de quantidade e preço unitário, e um nome de item (품목명) pelo seu contexto na tabela de itens. Esta é a diferença entre reconhecimento óptico de caracteres e compreensão visual de linguagem: um lê texto; o outro lê documentos.

Para um olhar mais aprofundado sobre a mecânica por trás desta abordagem, veja nosso guia sobre extração de campos específicos por nome de coluna.

JPG/PNG/PDF Extração por IA

Arquivos são processados com segurança e não são armazenados.

Conciliação de 3 Vias: PO vs 거래명세서 vs 세금계산서

Extrair dados de um extrato de transações isoladamente é útil. Extraí-los como parte do ciclo de conciliação de compras é onde está a verdadeira alavancagem operacional. O fluxo de trabalho padrão de compras coreano segue uma sequência previsível: a ordem de compra (발주서) é enviada ao fornecedor → as mercadorias são entregues com um extrato de transações (거래명세서) → a inspeção de recebimento é realizada → uma fatura fiscal (세금계산서) é emitida e transmitida à NTS → o pagamento é feito.

No recebimento, a tarefa é a conciliação de 3 vias: comparar o que foi pedido (PO), o que foi entregue (거래명세서) e o que foi faturado (세금계산서). Discrepâncias detectadas no recebimento custam uma ligação. Discrepâncias encontradas durante a conciliação de fim de mês custam horas de retrabalho em registros de entrega, e-mails de fornecedores e telas de ERP.

Aqui estão os dados que cada tipo de documento fornece para a conciliação:

DocumentoOrigemCampos-chave para Conciliação
Ordem de Compra (발주서)Seu ERPQuantidade pedida, preço unitário acordado, data de entrega solicitada
Extrato de Transações (거래명세서)Fornecedor (papel/PDF na entrega)Quantidade entregue, descrição do item, preço unitário no extrato
Fatura Fiscal (세금계산서)Fornecedor (via e-Tax da NTS)Quantidade faturada, preço unitário faturado, valor da operação, IVA, número de aprovação da NTS

O gargalo está na coluna do meio: os dados do extrato de transações quase nunca são digitais. Eles chegam em papel presos a uma caixa ou como um anexo PDF enterrado em um e-mail de notificação de entrega. Até que esses dados estejam em formato de planilha — no mesmo formato dos seus dados de PO do ERP e dos seus dados de fatura fiscal do sistema NTS — a conciliação de 3 vias não pode ser automatizada.

Depois que os dados do extrato de transações forem extraídos para o Excel, você pode usar colunas calculadas para realizar a correspondência diretamente na saída. Defina uma coluna como Diferença: Qtd. Pedida vs Qtd. Entregue (Qtd. PO - Quantidade) e a IA calcula a diferença para cada item de linha durante a extração. Qualquer linha com diferença diferente de zero é sinalizada antes mesmo de a planilha ser aberta. Se você processar pedidos de compra pelo mesmo pipeline de extração, também pode extrair dados de PO para o Excel — trazendo ambos os tipos de documento para o mesmo formato estruturado para comparação direta.

Para um cenário paralelo — extração específica de dados de notas fiscais — veja nosso guia sobre extração de dados de notas fiscais coreanas para o Excel, que cobre os sete campos obrigatórios e o fluxo de trabalho trimestral de declaração de IVA. Se você processa grandes volumes de faturas para declaração de IVA, o guia de processamento em lote de notas fiscais aborda o lado da capacidade de processamento.

Processamento em Lote: Gerenciando Extratos Diários de Entregas

A extração individual resolve o problema por documento. O processamento em lote resolve o problema do volume diário — e faz isso sem exigir que você repita nenhum trabalho de configuração.

A definição de coluna que você criou na Etapa 2 acima não é específica de um documento. Ela descreve os campos que você deseja, não onde esses campos aparecem. Isso significa que você pode enviar 20 extratos de transações de 15 fornecedores diferentes — todos com layouts distintos — em um único lote. A mesma definição de coluna é aplicada a todos os documentos. A saída é uma planilha consolidada onde cada item de linha de cada extrato ocupa uma linha, com o nome do fornecedor e a data preenchidos em todas as linhas do mesmo documento.

Uma equipe de compras que recebe 30 extratos de transações por semana economiza aproximadamente 3 a 4 horas de entrada manual de dados. Considerando um custo horário estimado de KRW 18.000 a 25.000 para um auxiliar de compras, isso representa uma economia mensal de KRW 220.000 a 400.000 com uma única mudança no fluxo de trabalho. Esse valor não inclui o tempo de correção de erros eliminado, que na prática pode igualar ou exceder o próprio tempo de entrada.

Para fornecedores que enviam consistentemente extratos em papel com as entregas, um link de coleta (수집 링크) pode transferir a etapa de digitalização para o início do processo. Gere uma URL compartilhável — sem necessidade de login para o fornecedor — e inclua-a nas instruções de integração do fornecedor. O fornecedor abre o link no celular, insere um código de verificação curto e envia uma foto ou PDF do extrato de transação diretamente para sua fila de processamento. O documento chega já digitalizado, e sua equipe extrai os dados em vez de redigitá-los. Este é o mesmo mecanismo descrito em nosso guia de extração de recibos coreanos, adaptado para o contexto de compras B2B.

Ao processar extratos de transações em lote junto com outros documentos de entrega, o fluxo de trabalho de extração é idêntico — defina as colunas uma vez, carregue tudo, baixe uma planilha. A ferramenta de extração de notas de entrega cobre o mesmo padrão para comprovantes de entrega emitidos pela transportadora, que geralmente acompanham os extratos de transações na mesma remessa.

FAQ

Preciso de uma configuração separada para cada formato de extrato de transação do fornecedor?

Não. A extração por nome de coluna localiza campos pelo significado, não pela posição. A mesma definição de coluna — Nome do Fornecedor, Nome do Item, Quantidade, Preço Unitário, Valor do Fornecimento — funciona em qualquer layout de fornecedor porque a IA lê o documento visualmente e entende o que cada campo representa, independentemente de onde o fornecedor o colocou na página.

Consegue lidar com extratos de transação manuscritos?

Sim, para formulários de modelo impressos com entradas manuscritas — que é o formato de papel mais comum na logística coreana, onde os fornecedores imprimem um modelo em branco de 거래명세서 e preenchem quantidades e datas à mão. Documentos totalmente manuscritos, sem estrutura impressa, são mais desafiadores e a precisão será menor. O sistema trata carimbos (직인) e assinaturas como elementos visuais — ele detecta a presença deles, mas não extrai texto deles.

Como ele distingue entre 공급가액 (valor de fornecimento) e 세액 (valor do imposto)?

A IA entende a hierarquia semântica do documento. 공급가액 é o total antes do IVA. 세액 é tipicamente 10% desse valor (alíquota de IVA coreana). Ao definir ambas as colunas, a IA usa a relação entre elas para validar a extração — se um valor detectado como 공급가액 não corresponder à relação esperada com 세액, o sistema sinaliza. Você também pode definir uma coluna calculada como Verificar IVA (세액 / 공급가액) para gerar a proporção para cada linha.

Posso extrair dados para o ECOUNT ou Douzone em vez do Excel?

O formato de saída direto é Excel (XLSX), CSV ou JSON. Tanto o ECOUNT quanto o Douzone suportam importação de Excel para dados de transação — exporte como XLSX e use a função de importação do seu ERP para carregar os dados. Os nomes das colunas na sua saída do Excel podem ser configurados para corresponder aos nomes dos campos de importação do seu ERP, eliminando a etapa de mapeamento.

E quanto a documentos com campos mistos em coreano e inglês?

A IA lê ambos os idiomas. Muitos extratos de transação coreanos incluem nomes de itens em inglês junto com descrições em coreano, especialmente para produtos importados ou cadeias de suprimentos multinacionais. Defina suas colunas no idioma em que precisar da saída — a IA localiza os valores correspondentes independentemente do idioma do documento de origem.

Próximos Passos

A lacuna na infraestrutura de documentos B2B da Coreia não está no lado da emissão — ECOUNT, Douzone e o sistema NTS e-Tax já digitalizaram notas fiscais de ponta a ponta. A lacuna está no lado do recebimento: os documentos que seus fornecedores enviam e que nunca foram projetados para serem lidos por máquinas. Os extratos de transações estão no centro dessa lacuna, pois afetam a conciliação de compras, o recebimento de estoque e a autorização de pagamento — três fluxos de trabalho dos quais as equipes financeiras downstream dependem.

Fechar essa lacuna não exige mudar como seus fornecedores emitem documentos. Exige mudar como sua equipe processa o que chega. O mesmo extrato de transação que levava 8 minutos para ser redigitado no seu registro de recebimento pode ser extraído em segundos — com a mesma definição de coluna funcionando no extrato de amanhã de um fornecedor diferente em um formato diferente.

📮 contact email: [email protected]