Como Extrair Dados de Fatura Fiscal Coreana
para o Excel
O Serviço Nacional de Impostos da Coreia do Sul processa mais de 600 milhões de faturas fiscais eletrônicas por ano — 99% de todas as faturas emitidas no país. No entanto, para as equipes financeiras que recebem essas faturas, o problema de extração continua teimosamente manual: copiar números de registro de empresa (사업자등록번호), valores de fornecimento (공급가액) e valores de IVA (세액) um campo de cada vez de um PDF ou impresso para uma planilha. Este guia aborda os campos obrigatórios de uma fatura fiscal coreana (세금계산서), por que as ferramentas OCR padrão tropeçam neles e como extrair os dados que você realmente precisa para o Excel — pronto para a declaração trimestral de IVA.
Principais Conclusões
- 99% das faturas coreanas já são eletrônicas — mas o contador a pagar que copia os valores de fornecimento (공급가액) manualmente para o Excel não sente esse progresso.
- Sete campos obrigatórios, dezenas de layouts de fornecedores: HomeTax, Popbill, Barobill e Douzone colocam números de registro empresarial e valores de IVA em lugares diferentes, então ferramentas baseadas em modelos precisam de uma nova configuração para cada fornecedor.
- ImageToTable.ai lê o valor de fornecimento como um conceito, não como uma coordenada de pixel — uma definição de coluna extrai a fatura fiscal de cada fornecedor para a mesma planilha, sem necessidade de configuração por fornecedor.
Fatura Fiscal Coreana vs. Fatura Padrão: Os 7 Campos Que Definem as Faturas Fiscais Coreanas
Uma fatura fiscal coreana (세금계산서) não é uma fatura comercial genérica com uma linha de IVA adicionada. É um formato de documento legalmente prescrito, definido pelo Artigo 32 da Lei do IVA da Coreia, e cada campo nela serve a um propósito específico de conformidade. Se você está extraindo dados de faturas de fornecedores coreanos para o Excel — seja para processamento de contas a pagar, preparação de declaração de IVA ou importação para ERP — entender esses campos obrigatórios é o pré-requisito.
De acordo com o Artigo 32, uma fatura fiscal deve conter as seguintes informações. A ausência de qualquer uma delas na fatura emitida expõe o fornecedor a uma multa de até 2% do valor da transação:
| # | Campo (EN) | Campo (KO) | Por que é importante para a extração |
|---|---|---|---|
| 1 | Número de registro do fornecedor | 공급자 등록번호 | Número de registro comercial de 10 dígitos (사업자등록번호) (formato: XXX-XX-XXXXX). Chave primária para correspondência de fornecedores no ERP. |
| 2 | Nome do fornecedor e representante | 상호 / 성명 | Nome da empresa + nome do representante. Frequentemente impresso em tamanhos de fonte diferentes. |
| 3 | Número de registro do comprador | 공급받는자 등록번호 | Seu próprio número de registro comercial — deve ser verificado em relação aos seus registros para conciliação. |
| 4 | Valor da base de cálculo | 공급가액 | Valor líquido antes do IVA. O número base para o cálculo da sua declaração de IVA. |
| 5 | Valor do IVA | 세액 | 10% do valor da base de cálculo. Deve ser exatamente igual ao valor da base de cálculo × 10% — qualquer divergência sinaliza um erro. |
| 6 | Data de emissão | 작성일자 | Determina em qual período trimestral de IVA a fatura se enquadra. |
| 7 | Itens da linha (descrição, quantidade, preço unitário) | 품목 / 수량 / 단가 | Detalhamento por item. Opcional em faturas simplificadas, mas padrão em faturas fiscais completas. |
Além desses sete campos principais, as notas fiscais eletrônicas emitidas pelo sistema NTS HomeTax (홈택스) trazem um número de aprovação da NTS (국세청승인번호) adicional — um identificador único atribuído pela autoridade tributária que confirma que a nota foi transmitida corretamente. Desde julho de 2023, todas as empresas com receita anual acima de KRW 100 milhões são obrigadas a emitir eletronicamente, então a maioria das notas que você encontrar terá esse número.
A consequência prática para extração de dados: uma única nota fiscal contém no mínimo 7 pontos de dados distintos que precisam ser inseridos em colunas separadas do Excel, com os dois números de registro seguindo um formato rigoroso e o valor da operação / ICMS exigindo validação aritmética. Essa é a estrutura documental com a qual você está trabalhando — e explica por que uma abordagem genérica de "digitalizar e jogar" raramente produz resultados utilizáveis.
Entender os campos é o primeiro passo. A próxima questão é por que extraí-los do documento de forma limpa é mais difícil do que parece.
Por que Copiar e Colar e o OCR Padrão Falham em Notas Fiscais Coreanas
As notas fiscais coreanas (세금계산서) apresentam três desafios específicos que ferramentas genéricas de OCR e processos manuais de copiar e colar lidam mal — e esses desafios se agravam quando você processa notas de vários fornecedores.
Desafio 1: Texto misto em coreano e numérico. Uma nota fiscal típica contém caracteres coreanos (nomes de empresas, descrições de itens), algarismos arábicos (números de registro, valores) e, às vezes, abreviações em inglês — tudo na mesma região visual. Motores de OCR padrão, otimizados para documentos em um único idioma, frequentemente leem mal caracteres coreanos próximos a números, produzindo saída distorcida, como confundir caracteres semelhantes ou interpretar incorretamente valores coreanos separados por vírgula.
Desafio 2: Posições de campos não padronizadas. Embora o conteúdo de uma nota fiscal seja padronizado por lei, o layout não é. Uma nota fiscal eletrônica emitida pelo HomeTax segue uma estrutura reconhecível de dois painéis (fornecedor à esquerda, comprador à direita). Mas notas emitidas por serviços ASP de terceiros — Popbill (팝빌), Barobill (바로빌) ou notas geradas por ERP da Douzone Bizon (더존비즈온) — podem organizar os mesmos campos em posições, tamanhos de fonte e estruturas de tabela diferentes. O OCR baseado em modelos, que depende de zonas predefinidas para localizar campos, precisa de um modelo separado para cada variante de layout.
Desafio 3: A armadilha da validação entre valor base / valor do IVA / valor total. Em uma nota fiscal corretamente emitida, os três números finais seguem uma relação estrita: valor total (합계금액) = valor base (공급가액) + valor do IVA (세액). Quando a entrada manual introduz uma transposição de um único dígito — ₩3.004.000 copiado como ₩3.040.000 — o erro se propaga silenciosamente para sua declaração de IVA. Você pode não perceber até que a Receita Federal cruze sua declaração com os dados transmitidos pelo fornecedor, o que pode gerar uma consulta ou notificação de ajuste.
De acordo com dados da Receita Federal coreana, a emissão eletrônica reduziu os custos de conformidade com notas fiscais em papel em cerca de ₩900 bilhões por ano. Mas o problema da última milha — extrair os dados dessas notas eletrônicas para seus próprios sistemas — ainda está na mesa do contador a pagar.
É aqui que a distinção entre extração baseada em template e extração semântica se torna importante. Ferramentas baseadas em template pedem que você desenhe retângulos ao redor de cada campo e salve as coordenadas — funcional se todas as suas notas vierem de um único fornecedor em um formato, mas impraticável quando você recebe notas fiscais de dezenas de fornecedores. A extração semântica — a abordagem usada por modelos de visão-linguagem — lê o documento como um humano: ela entende que o número ao lado do rótulo "valor base" é o valor base, independentemente de onde ele aparece na página.
Com os desafios definidos, aqui está o fluxo de trabalho real de extração.
Passo a Passo: Extraindo Campos de Notas Fiscais para o Excel
O ImageToTable.ai usa Extração de Colunas Personalizadas para extrair campos específicos de qualquer layout de documento. A ideia central: em vez de mapear coordenadas de campos em um modelo, você digita os nomes das colunas desejadas — em coreano ou inglês — e a IA localiza os valores correspondentes entendendo o significado de cada rótulo, não sua posição na página. Os nomes das colunas inseridos se tornam os cabeçalhos exatos da sua planilha de saída.
Envie seus arquivos de nota fiscal
Envie um ou vários arquivos de nota fiscal — exportações em PDF do HomeTax, notas fiscais digitalizadas (JPG/PNG) ou capturas de tela do e-mail. A ferramenta aceita PDF, JPG, PNG e WebP. Para processamento em lote, envie todos os arquivos de uma vez; os resultados são mesclados em uma única planilha com uma linha por nota fiscal.
Defina as colunas de extração
Insira os nomes dos campos que correspondem ao que você precisa na sua planilha. Você pode usar rótulos em coreano, inglês ou uma mistura — a IA entende ambos. Para uma extração padrão de nota fiscal, um conjunto prático de colunas é:
작성일자— Data de emissão공급자 사업자등록번호— CNPJ do fornecedor공급자 상호— Razão social do fornecedor공급받는자 사업자등록번호— CNPJ do comprador공급가액— Valor líquido (antes do IVA)세액— Valor do IVA합계금액— Valor total국세청승인번호— Número de aprovação da Receita Federal (para notas fiscais eletrônicas)
Gere e baixe seu Excel
Clique em extrair. Cada fatura gera uma linha na planilha de saída, com os nomes das suas colunas como cabeçalhos. Uma fatura fiscal de página única geralmente é processada em 5 a 10 segundos. O resultado é baixado como XLSX, CSV ou JSON — pronto para importação no seu sistema contábil ou análise adicional no Excel. Para um guia detalhado sobre extração de campos de faturas além de faturas fiscais coreanas, veja como extrair campos de faturas para uma planilha.
Dois recursos são particularmente úteis para notas fiscais coreanas. Primeiro, as Colunas Inferidas permitem adicionar colunas para dados que não estão explicitamente impressos na nota. Por exemplo, adicionar uma coluna chamada Período do IVA (opções: T1/T2/T3/T4) fará a IA ler a data de emissão (작성일자), determinar em qual período trimestral do IVA ela se enquadra (Jan–Mar = T1, Abr–Jun = T2, Jul–Set = T3, Out–Dez = T4) e preencher o rótulo do período — economizando uma etapa manual de PROCV no Excel. Segundo, as Colunas Calculadas podem validar a aritmética: uma coluna chamada Verificação do IVA (valor base × 0,1 = imposto?) exibirá "OK" ou o valor da diferença, sinalizando notas onde os números não fecham antes de chegarem à sua declaração de IVA.
Teste em sua própria nota fiscal abaixo — sem necessidade de login:
Os arquivos são processados com segurança e não são armazenados.
Uma fatura é simples. O verdadeiro teste é processar um lote antes do prazo de entrega do IVA.
Processando Centenas de Notas Fiscais Antes dos Prazos Trimestrais do IVA
As declarações de IVA na Coreia são trimestrais, com vencimento no dia 25 do mês seguinte ao fim de cada trimestre: 25 de janeiro (Q4), 25 de abril (Q1), 25 de julho (Q2) e 25 de outubro (Q3). Nas semanas anteriores a cada prazo, as equipes de contas a pagar de empresas coreanas de médio porte — especialmente as que utilizam escritórios de contabilidade externos (세무사) — enfrentam uma janela apertada para consolidar todas as notas fiscais de fornecedores em um único conjunto de dados que concilie com os registros eletrônicos da NTS.
O volume não é trivial. Uma empresa com 30 a 50 fornecedores ativos que recebem faturas mensais acumula de 90 a 150 notas fiscais por trimestre. Uma construtora ou trading que lida com subcontratados e fornecedores de materiais pode facilmente chegar a 300 a 500. A 3 minutos por nota para digitação manual, 300 notas consomem 15 horas de trabalho concentrado de entrada de dados — geralmente comprimidas na última semana antes do prazo de entrega.
O processamento em lote muda essa conta. Envie todas as notas fiscais de uma vez — sejam downloads em PDF do HomeTax, anexos de e-mail de diferentes fornecedores ou cópias impressas digitalizadas. A mesma definição de coluna se aplica a todos os arquivos. Os resultados são mesclados em um único arquivo Excel, uma linha por nota, ordenado cronologicamente. A 5 a 10 segundos por página, 300 notas são processadas em menos de uma hora, sem redigitação manual.
É aqui que a abordagem de extração semântica prova seu valor em relação aos modelos. Suas 300 notas provavelmente vêm de dezenas de fornecedores, cada um com um layout ligeiramente diferente — algumas emitidas via HomeTax, outras via Popbill ou Barobill, outras através do próprio ERP Douzone. Uma ferramenta baseada em modelos exigiria uma configuração separada para cada layout. A Extração de Colunas Personalizadas usa os mesmos nomes de coluna em todas as variantes, porque lê os rótulos dos campos (valor da operação, valor do IVA, número de registro da empresa) em vez das coordenadas dos pixels.
Uma dica prática para execuções em lote: adicione uma coluna Nome do Arquivo. A ferramenta preenche automaticamente essa coluna com o nome do arquivo de origem de cada linha, facilitando rastrear qualquer valor extraído de volta ao documento original se algum número parecer incorreto durante a revisão. Para maior rastreabilidade, você também pode conhecer abordagens mais amplas para extração de dados de notas fiscais em lote.
Do Excel ao Douzone, ECOUNT ou SAP Korea
Extrair dados de notas fiscais para o Excel raramente é a etapa final. Para a maioria das empresas coreanas, os dados precisam fluir para um sistema ERP ou contábil — e o mercado coreano tem um cenário de software distinto, dominado por fornecedores locais.
Douzone Bizon (더존비즈온) é a principal plataforma nacional de ERP e contabilidade na Coreia do Sul, com a maior participação de mercado nos segmentos de PMEs e contabilidade fiscal. Seus produtos — WEHAGO para PMEs em nuvem, iCUBE para médias empresas e Smart A para escritórios de contabilidade fiscal — todos esperam arquivos de importação estruturados com mapeamentos de colunas específicos. O Excel extraído do ImageToTable.ai pode ser reformatado para corresponder ao modelo de importação da Douzone: normalmente o número de registro da empresa como chave primária do fornecedor, valor da operação e valor do IVA em colunas numéricas separadas, e data de emissão no formato AAAA-MM-DD.
ECOUNT ERP é popular entre PMEs coreanas e suporta importações CSV/Excel para transações de contas a pagar. Seu formato de importação espera número de registro do fornecedor, data da nota fiscal, descrição, valor e IVA como colunas distintas — o que se mapeia diretamente para o conjunto de colunas de extração descrito neste guia.
SAP Korea atende grandes empresas e geralmente exige mapeamento de dados por meio de seu módulo FI (Contabilidade Financeira). O Excel extraído pode servir como um arquivo de preparação intermediário antes do upload em lote pelas ferramentas LSMW ou BDC do SAP.
Independentemente do sistema que você usa, o princípio fundamental é o mesmo: defina suas colunas de extração para corresponder aos campos de importação esperados pelo seu ERP desde o início. Se o modelo de importação do Douzone espera uma coluna chamada 거래처코드 (código do fornecedor) em vez de 사업자등록번호, nomeie sua coluna de extração de acordo. A IA extrai o valor com base no que o campo representa no documento, e não no nome que você dá à coluna — assim, sua saída já está formatada para importação, sem necessidade de uma etapa extra de mapeamento.
Para uma visão mais ampla de como a extração de faturas se encaixa nos fluxos de automação de contas a pagar, consulte o guia completo de extração de dados de faturas.
Perguntas Frequentes
A ferramenta consegue ler notas fiscais eletrônicas e em papel?
Sim. Notas fiscais eletrônicas (전자세금계산서) baixadas como PDF do HomeTax e notas escaneadas como JPG ou PNG são suportadas. A IA lê o conteúdo visual do documento independentemente de como foi gerado originalmente. Documentos escaneados com qualidade de impressão nítida produzem a mesma precisão de extração que PDFs nato-digitais. Até 99% de precisão para dados tabulares impressos em condições normais de digitalização.
Ele extrai itens de linha ou apenas totais da fatura?
Ambos. Se você definir colunas para campos de itens de linha — 품목 (descrição do item), 수량 (quantidade), 단가 (preço unitário), 공급가액 (valor da linha) — a ferramenta cria uma linha por item. Se você definir apenas campos no nível da fatura (valor total da venda, valor do IVA, valor total), obtém uma linha por fatura. A escolha depende se você precisa de detalhes por item para contabilidade de custos ou apenas dos totais para declaração de IVA.
Como ele lida com o formato do número de registro empresarial (XXX-XX-XXXXX)?
O número de registro empresarial de 10 dígitos (사업자등록번호) é extraído como está, preservando o formato separado por hífen. Se a importação do seu ERP exigir o número sem hífens, você pode adicionar uma coluna calculada com uma regra para remover a formatação — ou simplesmente usar a função SUBSTITUTE do Excel na saída para remover os traços em uma única etapa.
E o número de aprovação da NTS?
O número de aprovação da NTS (국세청승인번호) aparece nas faturas fiscais eletrônicas como um código alfanumérico longo (geralmente no formato XXXXXXXX-XXXXXXXX). Adicione-o como nome de coluna e ele será extraído junto com os outros campos. Esse número é útil para fazer referência cruzada com seus registros do HomeTax, confirmando que uma fatura específica foi transmitida corretamente para a NTS.
Posso processar notas fiscais em coreano e outros idiomas no mesmo lote?
Sim. Se sua empresa recebe notas fiscais coreanas e faturas de fornecedores internacionais (ex.: em inglês, japonês ou chinês), você pode incluí-las no mesmo lote. A IA processa nativamente mais de 200 idiomas. Os nomes das colunas em coreano corresponderão aos campos em coreano; para notas fiscais não coreanas no mesmo lote, a IA mapeia conceitos de campo equivalentes (ex.: "Valor do Fornecimento" corresponde ao campo de valor de fornecimento). Para guias específicas por país, consulte Extração de notas fiscais qualificadas japonesas, Extração de Rechnung alemã ou Extração de CFDI mexicano.
Os dados extraídos são suficientes para a declaração do IVA?
O Excel extraído fornece os dados brutos — valor da transação, valor do IVA, números de registro comercial do fornecedor/comprador e datas — que alimentam a preparação da declaração do IVA. No entanto, a declaração real do IVA na Coreia é feita através do HomeTax ou do seu contador/software contábil (Douzone, ECOUNT, etc.). O resultado da extração serve como entrada estruturada para esse processo de declaração, não como uma submissão direta à NTS. Para empresas que lidam com formulários fiscais dos EUA juntamente com faturas coreanas, consulte nosso guia sobre extração de dados de formulários fiscais W-2 e 1099.
Veja Como Pode Ser a Preparação do Seu Próximo Prazo de IVA
A distância entre receber faturas fiscais e ter dados limpos e estruturados no seu ERP é onde horas desaparecem a cada trimestre. Quer processe 30 ou 300 faturas, a etapa de extração deve levar minutos, não dias. Carregue uma fatura fiscal — real ou amostra — e veja os campos caírem nas colunas certas logo na primeira tentativa.