Cómo extraer datos de facturas fiscales coreanas
a Excel
El Servicio de Impuestos Nacionales de Corea del Sur procesa más de 600 millones de facturas electrónicas al año — el 99% de todas las facturas emitidas en el país. Sin embargo, para los equipos financieros que reciben esas facturas, el problema de extracción sigue siendo obstinadamente manual: copiar números de registro empresarial (사업자등록번호), valores de suministro (공급가액) y montos de IVA (세액) campo por campo desde un PDF o impreso a una hoja de cálculo. Esta guía explica los campos obligatorios de una factura fiscal coreana (세금계산서), por qué las herramientas OCR estándar fallan con ellos y cómo extraer los datos que realmente necesitas a Excel — listo para la declaración trimestral del IVA.
Conclusiones clave
- El 99% de las facturas coreanas ya son electrónicas, pero el auxiliar de cuentas por pagar que copia manualmente el valor de suministro (공급가액) a Excel no nota ese progreso.
- Siete campos obligatorios, docenas de formatos de proveedores: HomeTax, Popbill, Barobill y Douzone colocan los números de registro mercantil y los montos de IVA en lugares distintos, por lo que las herramientas basadas en plantillas requieren una nueva configuración para cada proveedor.
- ImageToTable.ai lee el valor de suministro como concepto, no como coordenada de píxel: una sola definición de columna extrae la factura fiscal de cada proveedor en la misma hoja de cálculo, sin necesidad de configuración por proveedor.
Factura de IVA coreana vs. Factura estándar: Los 7 campos que definen las facturas de IVA coreanas
Una factura de IVA coreana (세금계산서) no es una factura comercial genérica con una línea de IVA añadida. Es un formato de documento legalmente prescrito definido por el Artículo 32 de la Ley del IVA de Corea, y cada campo tiene un propósito de cumplimiento específico. Si extrae datos de facturas de proveedores coreanos a Excel — ya sea para procesamiento de cuentas por pagar, preparación de declaraciones de IVA o importación a ERP — comprender estos campos obligatorios es el requisito previo.
Según el Artículo 32, una factura de IVA debe contener la siguiente información. La omisión de cualquiera de estos datos en la factura emitida expone al proveedor a una multa de hasta el 2% del valor del suministro:
| # | Campo (EN) | Campo (KO) | Por qué es importante para la extracción |
|---|---|---|---|
| 1 | Número de registro del proveedor | 공급자 등록번호 | Número de registro comercial de 10 dígitos (사업자등록번호) (formato: XXX-XX-XXXXX). Clave primaria para la coincidencia de proveedores en ERP. |
| 2 | Nombre del proveedor y representante | 상호 / 성명 | Nombre de la empresa + nombre del representante. A menudo impreso en diferentes tamaños de fuente. |
| 3 | Número de registro del comprador | 공급받는자 등록번호 | Su propio número de registro comercial: debe verificarse con sus registros para conciliación. |
| 4 | Valor de suministro | 공급가액 | Importe neto antes del IVA. El número base para el cálculo de su declaración de IVA. |
| 5 | Importe del IVA | 세액 | 10% del valor de suministro. Debe ser exactamente igual al valor de suministro × 10%; cualquier discrepancia señala un error. |
| 6 | Fecha de emisión | 작성일자 | Determina en qué período trimestral de IVA cae la factura. |
| 7 | Líneas de detalle (descripción, cantidad, precio unitario) | 품목 / 수량 / 단가 | Detalle a nivel de artículo. Opcional en facturas simplificadas, pero estándar en facturas fiscales completas. |
Además de estos siete campos obligatorios, las facturas electrónicas emitidas a través del sistema NTS HomeTax (홈택스) incluyen un número de aprobación del NTS (국세청승인번호) — un identificador único asignado por la autoridad fiscal que confirma que la factura fue transmitida correctamente. Desde julio de 2023, todas las empresas con ingresos anuales superiores a 100 millones de KRW deben emitir electrónicamente, por lo que la mayoría de las facturas que encuentres llevarán este número.
La consecuencia práctica para la extracción de datos: una sola factura contiene al menos 7 puntos de datos distintos que deben colocarse en columnas separadas de Excel, con los dos números de registro siguiendo un formato estricto y el valor de suministro / IVA requiriendo validación aritmética. Esta es la estructura documental con la que trabajas — y explica por qué un enfoque genérico de "escanear y volcar" rara vez produce resultados utilizables.
Entender los campos es el primer paso. La siguiente pregunta es por qué extraerlos del documento de forma limpia es más difícil de lo que parece.
Por qué el copiar y pegar y el OCR estándar fallan con las facturas coreanas
Las facturas coreanas (세금계산서) presentan tres desafíos específicos que las herramientas genéricas de OCR y los flujos de copiar y pegar manuales manejan mal, y estos desafíos se agravan al procesar facturas de múltiples proveedores.
Desafío 1: Texto mixto coreano y numérico. Una factura típica contiene caracteres coreanos (nombres de empresas, descripciones de artículos), números arábigos (números de registro, montos) y, a veces, abreviaturas en inglés, todo en la misma región visual. Los motores de OCR estándar optimizados para documentos en un solo idioma a menudo leen mal los caracteres coreanos cercanos a números, produciendo resultados confusos como caracteres similares mal interpretados o montos coreanos separados por comas mal leídos.
Desafío 2: Posiciones de campos no estandarizadas. Aunque el contenido de una factura está estandarizado por ley, el diseño no lo está. Una factura electrónica emitida a través de HomeTax sigue una estructura reconocible de dos paneles (proveedor a la izquierda, comprador a la derecha). Pero las facturas emitidas a través de servicios ASP de terceros — Popbill (팝빌), Barobill (바로빌), o facturas generadas por ERP de Douzone Bizon (더존비즈온) — pueden organizar los mismos campos en diferentes posiciones, tamaños de fuente y estructuras de tabla. El OCR basado en plantillas, que depende de zonas predefinidas para localizar campos, necesita una plantilla separada para cada variante de diseño.
Desafío 3: La trampa de validación del valor de suministro / IVA / total. En una factura fiscal correctamente emitida, los tres importes finales siguen una relación estricta: total (합계금액) = valor de suministro (공급가액) + IVA (세액). Cuando el ingreso manual introduce una transposición de un solo dígito — ₩3,004,000 copiado como ₩3,040,000 — el error se propaga silenciosamente a su declaración de IVA. Puede que no lo detecte hasta que el NTS coteje su declaración con los datos transmitidos por el proveedor, lo que puede desencadenar una consulta o un aviso de ajuste.
Según datos del NTS, la emisión electrónica redujo los costos de cumplimiento de facturas en papel en aproximadamente ₩900 mil millones al año. Pero el problema de la última milla — extraer datos de esas facturas electrónicas a sus propios sistemas — sigue en el escritorio del auxiliar de cuentas por pagar.
Aquí es donde importa la diferencia entre la extracción basada en plantillas y la extracción semántica. Las herramientas basadas en plantillas le piden dibujar rectángulos alrededor de cada campo y guardar las coordenadas — funcional si todas sus facturas provienen de un solo proveedor en un formato, pero poco práctico cuando recibe facturas fiscales de docenas de proveedores. La extracción semántica — el enfoque utilizado por los modelos de lenguaje-visión — lee el documento como lo haría una persona: entiende que el número junto a la etiqueta de valor de suministro es el valor de suministro, sin importar dónde aparezca en la página.
Definidos los desafíos, este es el flujo de extracción real.
Paso a paso: Extraer campos de facturas fiscales a Excel
ImageToTable.ai usa Extracción de Columnas Personalizadas para obtener campos específicos de cualquier diseño de documento. La idea central: en lugar de mapear coordenadas de campos en una plantilla, escribes los nombres de las columnas que deseas — en coreano o inglés — y la IA localiza los valores correspondientes al entender qué significa cada etiqueta de campo, no dónde está en la página. Los nombres de columna que ingresas se convierten en los encabezados exactos de tu hoja de cálculo de salida.
Sube tus archivos de factura fiscal
Sube uno o varios archivos de factura fiscal: exportaciones PDF de HomeTax, facturas en papel escaneadas (JPG/PNG) o capturas de pantalla de tu correo. La herramienta acepta PDF, JPG, PNG y WebP. Para procesamiento por lotes, sube todos los archivos a la vez; los resultados se fusionan en una sola hoja de cálculo con una fila por factura.
Define tus columnas de extracción
Ingresa los nombres de campo que coincidan con lo que necesitas en tu hoja de cálculo. Puedes usar etiquetas en coreano, inglés o una mezcla: la IA entiende ambas. Para una extracción estándar de factura fiscal, un conjunto práctico de columnas es:
작성일자— Fecha de emisión공급자 사업자등록번호— Número de registro del proveedor공급자 상호— Nombre de la empresa proveedora공급받는자 사업자등록번호— Número de registro del comprador공급가액— Valor neto (antes de IVA)세액— Monto del IVA합계금액— Monto total국세청승인번호— Número de aprobación del NTS (para facturas electrónicas)
Genera y descarga tu Excel
Haz clic en extraer. Cada factura genera una fila en la hoja de cálculo de salida, con los nombres de tus columnas como encabezados. Una factura fiscal de una página suele procesarse en 5–10 segundos. El resultado se descarga como XLSX, CSV o JSON, listo para importar a tu sistema contable o analizar en Excel. Para más detalles sobre la extracción de campos de facturas más allá de las facturas fiscales coreanas, consulta cómo extraer campos de facturas a una hoja de cálculo.
Dos funciones son especialmente útiles para facturas fiscales coreanas. Primero, las Columnas Inferidas te permiten agregar columnas para datos que no están impresos explícitamente en la factura. Por ejemplo, agregar una columna llamada Período IVA (opciones: T1/T2/T3/T4) hará que la IA lea la fecha de emisión (작성일자), determine en qué trimestre del IVA cae (Ene–Mar = T1, Abr–Jun = T2, Jul–Sep = T3, Oct–Dic = T4) y complete la etiqueta del período — ahorrándote un paso manual de BUSCARV en Excel. Segundo, las Columnas Calculadas pueden validar la aritmética: una columna llamada Verificación IVA (base imponible × 0.1 = impuesto?) mostrará "OK" o el monto de la discrepancia, señalando facturas donde los números no cuadran antes de que lleguen a tu declaración de IVA.
Pruébalo con tu propia factura fiscal a continuación — sin necesidad de iniciar sesión:
Los archivos se procesan de forma segura y no se almacenan.
Una factura es sencilla. El verdadero reto es procesar un lote antes del plazo de declaración del IVA.
Gestión masiva de facturas antes de los plazos trimestrales del IVA
Las declaraciones de IVA en Corea se presentan trimestralmente, con vencimiento el día 25 del mes siguiente al cierre del trimestre: 25 de enero (T4), 25 de abril (T1), 25 de julio (T2) y 25 de octubre (T3). En las semanas previas a cada fecha límite, los equipos de cuentas por pagar de empresas coreanas medianas —especialmente aquellas que trabajan con despachos de asesores fiscales externos (세무사)— enfrentan un plazo ajustado para consolidar todas las facturas de proveedores en un único conjunto de datos que concilie con los registros de facturas electrónicas del NTS.
El volumen no es menor. Una empresa con 30–50 proveedores activos que reciben facturas mensuales acumula entre 90 y 150 facturas por trimestre. Una constructora o empresa comercial que trabaja con subcontratistas y proveedores de materiales puede alcanzar fácilmente las 300–500. A 3 minutos por factura para ingreso manual, 300 facturas consumen 15 horas de trabajo concentrado de captura de datos —generalmente comprimidas en la última semana antes del plazo de presentación.
El procesamiento por lotes cambia esta aritmética. Cargue todas las facturas a la vez —ya sean descargas PDF de HomeTax, archivos adjuntos de correo electrónico de diferentes proveedores o copias escaneadas en papel. La misma definición de columnas se aplica a todos los archivos. Los resultados se fusionan en un único archivo Excel, una fila por factura, ordenadas cronológicamente. A 5–10 segundos por página, 300 facturas se procesan en menos de una hora sin necesidad de volver a teclear manualmente.
Aquí es donde el enfoque de extracción semántica demuestra su valor frente a las plantillas. Sus 300 facturas probablemente provienen de docenas de proveedores, cada uno con un diseño ligeramente diferente —algunas emitidas a través de HomeTax, otras mediante Popbill o Barobill, otras a través de su propio ERP Douzone. Una herramienta basada en plantillas requeriría una configuración separada para cada diseño. La Extracción de Columnas Personalizadas utiliza los mismos nombres de columna en todas las variantes, porque lee las etiquetas de los campos (valor base, importe del IVA, número de registro mercantil) en lugar de las coordenadas de píxeles.
Un consejo práctico para ejecuciones por lotes: agrega una columna Nombre de archivo. La herramienta la completa automáticamente con el nombre del archivo fuente de cada fila, facilitando rastrear cualquier valor extraído hasta el documento original si un número parece incorrecto durante la revisión. Para mayor trazabilidad, también puedes conocer enfoques más amplios sobre extracción de datos de facturas por lotes.
De Excel a Douzone, ECOUNT o SAP Corea
Extraer datos de facturas fiscales a Excel rara vez es el paso final. Para la mayoría de las empresas coreanas, los datos deben fluir hacia un ERP o sistema contable, y el mercado coreano tiene un panorama de software distintivo dominado por proveedores locales.
Douzone Bizon (더존비즈온) es la plataforma ERP y contable líder en Corea del Sur, con la mayor cuota de mercado en los segmentos de PYMES y contabilidad fiscal. Sus productos — WEHAGO para PYMES en la nube, iCUBE para empresas medianas y Smart A para despachos contables — esperan archivos de importación estructurados con asignaciones de columnas específicas. El Excel extraído de ImageToTable.ai puede reformatearse para coincidir con la plantilla de importación de Douzone: normalmente el número de registro empresarial como clave principal del proveedor, el valor de suministro y el monto del IVA en columnas numéricas separadas, y la fecha de emisión en formato AAAA-MM-DD.
ECOUNT ERP es popular entre las PYMES coreanas y admite importaciones CSV/Excel para transacciones de cuentas por pagar. Su formato de importación espera el número de registro del proveedor, fecha de factura, descripción, monto e IVA como columnas distintas, lo que se asigna directamente al conjunto de columnas de extracción descrito en esta guía.
SAP Corea atiende a grandes empresas y generalmente requiere el mapeo de datos a través de su módulo FI (Contabilidad Financiera). El Excel extraído puede servir como archivo de preparación intermedio antes de la carga por lotes a través de las herramientas LSMW o BDC de SAP.
Independientemente del sistema que uses, el principio clave es el mismo: define tus columnas de extracción para que coincidan desde el inicio con los campos de importación esperados por tu ERP. Si tu plantilla de importación de Douzone espera una columna llamada 거래처코드 (código de proveedor) en lugar de 사업자등록번호, nombra tu columna de extracción en consecuencia. La IA extrae el valor según lo que el campo representa en el documento, no cómo llames a la columna — así tu salida ya está formateada para importación sin un paso de mapeo adicional.
Para una visión más amplia de cómo la extracción de facturas encaja en los flujos de automatización de cuentas por pagar, consulta la guía completa de extracción de datos de facturas.
Preguntas Frecuentes
¿La herramienta puede leer facturas electrónicas y en papel?
Sí. Se admiten facturas electrónicas (전자세금계산서) descargadas como PDF desde HomeTax y facturas en papel escaneadas como JPG o PNG. La IA lee el contenido visual del documento sin importar cómo se generó originalmente. Los documentos escaneados con buena calidad de impresión ofrecen la misma precisión de extracción que los PDF digitales. Hasta un 99% de precisión para datos tabulares impresos en condiciones normales de escaneo.
¿Extrae partidas individuales o solo totales de factura?
Ambos. Si defines columnas para campos de partidas — 품목 (descripción del artículo), 수량 (cantidad), 단가 (precio unitario), 공급가액 (valor de suministro por línea) — la herramienta crea una fila por cada partida. Si solo defines campos a nivel de factura (valor total del suministro, importe del IVA, importe total), obtienes una fila por factura. La elección depende de si necesitas detalle a nivel de artículo para contabilidad de costes o solo los totales para la declaración del IVA.
¿Cómo maneja el formato del número de registro empresarial (XXX-XX-XXXXX)?
El número de registro empresarial de 10 dígitos (사업자등록번호) se extrae tal cual, conservando el formato separado por guiones. Si su importación de ERP requiere el número sin guiones, puede agregar una columna calculada con una regla para eliminar el formato, o simplemente usar la función SUSTITUIR de Excel en el resultado para quitar los guiones en un solo paso.
¿Y el número de aprobación del NTS?
El número de aprobación del NTS (국세청승인번호) aparece en las facturas electrónicas como un código alfanumérico largo (normalmente con el formato XXXXXXXX-XXXXXXXX). Agréguelo como nombre de columna y se extraerá junto con los demás campos. Este número es útil para cotejar con sus registros de HomeTax y confirmar que una factura en particular se transmitió correctamente al NTS.
¿Puedo procesar facturas en coreano y otros idiomas en el mismo lote?
Sí. Si su empresa recibe tanto facturas fiscales coreanas como facturas de proveedores extranjeros (p. ej., en inglés, japonés o chino), puede incluirlas en el mismo lote. La IA procesa de forma nativa más de 200 idiomas. Los nombres de columna en coreano coincidirán con los campos en coreano; para facturas no coreanas en el mismo lote, la IA asigna conceptos de campo equivalentes (p. ej., "Valor del suministro" coincide con el campo de valor del suministro). Para guías específicas por país, consulte extracción de facturas cualificadas japonesas, extracción de facturas alemanas (Rechnung) o extracción de CFDI mexicanos.
¿Son suficientes los datos extraídos para presentar la declaración del IVA?
El Excel extraído proporciona los datos brutos (valor del suministro, importe del IVA, números de registro comercial del proveedor/comprador y fechas) que alimentan la preparación de la declaración del IVA. Sin embargo, la presentación real de la declaración del IVA en Corea se realiza a través de HomeTax o de su contable/software de contabilidad (Douzone, ECOUNT, etc.). El resultado de la extracción sirve como entrada estructurada para ese proceso de declaración, no como una presentación directa ante el NTS. Para empresas que gestionan formularios fiscales estadounidenses junto con facturas coreanas, consulte nuestra guía sobre extracción de datos de formularios fiscales W-2 y 1099.
Mira cómo podría ser tu próxima preparación para el IVA
La brecha entre recibir facturas fiscales y tener datos limpios y estructurados en tu ERP es donde desaparecen horas cada trimestre. Ya sea que proceses 30 o 300 facturas, el paso de extracción debería tomar minutos, no días. Sube una factura fiscal — real o de muestra — y ve cómo los campos caen en las columnas correctas desde el primer intento.