Cómo extraer datos de notas de entrega japonesas (納品書) a Excel — en múltiples formatos de proveedor

Las notas de entrega japonesas (納品書 nōsho) varían según el proveedor. Descubra cómo la extracción con IA maneja datos de nōsho en múltiples formatos sin necesidad de configurar plantillas por proveedor.

Cómo extraer datos de notas de entrega japonesas (納品書) a Excel — en múltiples formatos de proveedor

Por qué falla la extracción basada en plantillas en albaranes japoneses

El OCR basado en plantillas funciona memorizando dónde se encuentra un campo en una página. Entrénelo con el diseño del albarán del Proveedor A — fecha de entrega arriba a la derecha, número de pedido debajo del encabezado, tabla de artículos comenzando en la fila 12 — y extraerá correctamente esos campos de cada albarán futuro que envíe el Proveedor A. Luego, el Proveedor B envía un albarán con la fecha de entrega abajo a la izquierda, el número de pedido incrustado en la línea de referencia y la tabla de artículos con un diseño vertical. La plantilla falla. Para manejar 30 proveedores, necesita 30 plantillas — y una de ellas se rompe cada vez que un proveedor actualiza su ERP y el diseño cambia sin previo aviso.

Los albaranes japoneses amplifican el problema de las plantillas de tres maneras que las herramientas genéricas para albaranes —diseñadas para formatos occidentales— no manejan. La tasa de impuesto al consumo dual divide los importes en dos tramos fiscales que la herramienta no reconoce. La fecha está escrita en el calendario de la era japonesa (令和, Reiwa) que un analizador de fechas entrenado en Occidente interpreta mal. Y la diversidad de formatos en Japón es extrema: los albaranes generados por diferentes sistemas de contabilidad y gestión de ventas — 弥生販売, freee, Money Forward, 楽々シリーズ, exportaciones ERP personalizadas — no comparten un diseño común, además de los albaranes manuscritos con papel carbón (todavía muy utilizados por servicios de reparación, proveedores de construcción y vendedores más pequeños) que introducen desafíos de reconocimiento de escritura a mano en caracteres japoneses para los que la mayoría de las herramientas OCR nunca fueron entrenadas.

El problema central no es la precisión del OCR. Un motor de OCR con IA moderno puede leer caracteres individuales en un albarán impreso limpio con alta confianza. El problema es que la herramienta no sabe qué fragmento de texto corresponde a qué campo. Ve "令和7年6月10日" y "T1234567890123" y "¥140,000" como cadenas de texto, pero no puede asignarlos a "Fecha de entrega", "Número de registro de factura cualificada" e "Importe total (sujeto al 10%)" sin entender qué significa cada campo. Esta es la brecha entre el OCR y la Extracción de columnas personalizadas — un enfoque en el que define las columnas que desea por su significado semántico ("Fecha de entrega", "Número de pedido", "Nombre del proveedor") y la IA localiza el valor correspondiente en cualquier lugar de la página al comprender lo que representa, no al recordar dónde estaba la última vez.

Los campos de la 納品書 que impulsan los flujos de compras y recepción

Antes de extraer datos de un albarán a Excel, debe decidir qué campos extraer. Un albarán japonés (納品書) contiene entre 8 y 14 campos relevantes para la recepción, el registro de inventario y la conciliación a tres bandas, según si también funciona como Factura Cualificada según el sistema de facturación.

En Japón, un albarán no tiene un formato legal obligatorio. La Agencia Tributaria Nacional (国税庁, NTA) define cinco campos obligatorios a efectos de documentación fiscal, y el Sistema de Factura Cualificada (インボイス制度, inboisu seido) —vigente desde octubre de 2023— añade tres más cuando el albarán actúa como factura cualificada. Pero los equipos de compras necesitan más que el mínimo fiscal. Necesitan campos que alimenten el sistema de gestión de almacenes, el módulo de recepción de mercancías del ERP y el flujo de conciliación de órdenes de compra.

El conjunto mínimo de columnas de extracción para un muelle de recepción japonés:

Campo (inglés)Variaciones de etiqueta en japonésUso posterior
Nombre del proveedor発行者名, 会社名, 納入元Conciliar con el registro maestro de proveedores; validar contra el emisor de la OC
Número de albarán納品書番号, 伝票番号, No.Clave principal del registro de recepción de mercancías; pista de auditoría
Fecha de entrega納品日, 発行日, 取引年月日Registro de recepción; determina el período contable de la recepción
Referencia de orden de compra発注番号, 注文番号, ご注文番号Conciliación a tres bandas con OC abiertas
Nombre / descripción del artículo品名, 商品名, 品目Registro de inventario; verificar contra líneas de la OC
Cantidad数量, 個数Actualización de inventario; detectar entregas de más o menos
Precio unitario (si se muestra)単価Verificación de precio; algunos albaranes lo omiten
Importe por línea (si se muestra)金額, 税抜金額Valor agregado de recepción; algunos albaranes solo muestran totales
Número de registro (SFC)登録番号, T+13桁Validar el estado del emisor de Factura Cualificada para crédito fiscal de IVA soportado
Desglose de impuestos (SFC)10%対象, 8%対象, 消費税額Separar importes gravables al 10% y 8% para la declaración del impuesto al consumo
Nombre del destinatario宛名, 納品先, 御中Confirmar entrega a la entidad correcta; asignación a centro de costo

Si un albarán también funciona como Factura Cualificada (適格請求書), el número de registro (登録番号) y el importe del impuesto al consumo desglosado por tipo impositivo (税率ごとの消費税額) ya no son opcionales: si faltan, el comprador no podrá reclamar el crédito fiscal de IVA soportado por esa compra.

Cómo el Sistema de Factura Cualificada Cambió la Extracción de Albaranes

Antes de octubre de 2023, extraer datos de albaranes era pura eficiencia: ahorrabas tiempo al no escribir. Después de octubre de 2023, con la introducción del Sistema de Factura Cualificada (インボイス制度), la extracción de albaranes adquirió una dimensión de cumplimiento que la mayoría de las herramientas aún no han alcanzado.

Con el antiguo sistema de retención de facturas clasificadas por tasa (区分記載請求書等保存方式), un albarán necesitaba cinco campos básicos: nombre del emisor, fecha de transacción, detalles de la transacción (con indicación de tasa reducida), monto total por tasa impositiva y nombre del destinatario. El nuevo Sistema de Factura Cualificada agrega tres más: el número de registro del emisor de factura cualificada (登録番号, formato T + 13 dígitos), la tasa impositiva aplicable por categoría y el monto del impuesto al consumo desglosado por tasa. Un albarán que funcione como factura cualificada debe incluir todo esto, y el comprador debe conservarlo durante siete años para respaldar las solicitudes de crédito fiscal por insumos según el Artículo 30 de la Ley del Impuesto al Consumo.

Esto significa que la herramienta de extracción ahora debe capturar campos que hace unos años eran opcionales. Más importante aún, la estructura de tasa dual — 10% estándar y 8% reducida para alimentos y periódicos — implica que un solo albarán puede contener dos subtotales de impuestos separados, cada uno con su propio monto gravable y su propio cálculo de impuesto. Una herramienta que lea el total como un solo número, sin dividirlo por tasa, produce una hoja de cálculo que no puede respaldar la declaración del impuesto al consumo.

La autoridad tributaria japonesa (国税庁) permite explícitamente que albaranes y facturas funcionen juntos como una sola Factura Cualificada. Según las directrices de la Federación Japonesa de Asociaciones de Contadores Públicos Certificados, múltiples documentos con referencias cruzadas claras — como un albarán con detalles de líneas y una factura con el desglose de impuestos — pueden cumplir juntos los requisitos de la Factura Cualificada. Esto significa que la salida de extracción de albaranes debe estructurarse para emparejarse con los datos de facturas posteriores. Dos hojas de cálculo sin una clave compartida son inútiles.

Para un análisis más profundo de cómo el Sistema de Factura Cualificada afecta el procesamiento de documentos en los flujos de adquisiciones, consulte nuestra guía para extraer datos bajo el Sistema de Factura Cualificada de Japón.

Extracción de notas de entrega en múltiples formatos de proveedores: Un flujo de trabajo paso a paso

Aquí es donde el enfoque pasa de la teoría a la práctica. Tienes notas de entrega de exportaciones de 弥生販売, PDFs generados por freee, impresiones de Money Forward, copias carbón escritas a mano y cualquier formato personalizado que produzca el sistema interno del proveedor. El método de extracción debe manejar todos ellos con una sola definición de columna, porque mantener 30 plantillas anula el propósito de la automatización.

1

Define las columnas de extracción una sola vez

Nombra los campos que necesitas — no por posición de píxel, sino por su significado. "Fecha de entrega (納品日)" le indica a la IA que encuentre la fecha de entrega sin importar dónde aparezca en la página. "Nombre del artículo (品名)" localiza cada descripción de línea, ya sea en una tabla, una lista vertical o impresa junto a un código de barras. "Número de OC (発注番号)" encuentra la referencia incluso si el proveedor la etiqueta como "ご注文番号" o "注文番号". Los nombres de columna que escribes se convierten en los encabezados de tu hoja de cálculo de salida. Guarda este conjunto de columnas como plantilla — defínelo una vez, úsalo para cada proveedor.

2

Sube todos los albaranes del día en un solo lote

Escanea albaranes en papel en el muelle de recepción. Sube PDFs de proveedores desde archivos adjuntos de correo. Fotografía copias carbón con un smartphone en la puerta del camión. Coloca todo en un solo lote — la IA procesa PDFs, JPEGs de cámara de teléfono e imágenes escaneadas en la misma ejecución. Formatos mixtos, proveedores mixtos, una sola subida.

3

La IA lee cada albarán por significado del campo, no por posición

Para cada documento, la IA lee toda la página, identifica qué fragmentos de texto corresponden a cada definición de columna y extrae los valores. Los campos de nivel de encabezado — Nombre del proveedor, Número de albarán, Fecha de entrega — se repiten en cada fila de línea para que la hoja de cálculo se mantenga relacional. Los campos de línea — Nombre del artículo, Cantidad, Precio unitario — se extraen fila por fila de la estructura de tabla o lista que use el documento. Un formato 弥生 con una tabla de 6 columnas funciona igual que una nota manuscrita con tres campos en una lista vertical.

4

Revisa y exporta a Excel

El resultado aparece como una tabla estructurada — una fila por línea de artículo, con campos de encabezado repetidos y todos los valores en formato estándar. Revisa casos límite: una cantidad manuscrita ambigua, una fecha que la IA marcó para confirmación manual. Una vez verificado, exporta como XLSX. El archivo está listo para importar en tu WMS, ERP o para cotejar con órdenes de compra en una hoja de cálculo. Si tu sistema acepta CSV, exporta ese formato en su lugar — sin conversión de formato, sin reescritura manual.

Este enfoque funciona porque la IA no busca plantillas, sino significados. Un albarán de 弥生販売 con "納品日" en el encabezado y uno de freee con "発行日" en el pie contienen ambos una fecha de entrega. La columna "Fecha de entrega" encuentra ambas, sin que nadie tenga que indicarle a la herramienta dónde buscar en la página. Para un tutorial detallado sobre el procesamiento por lotes de albaranes, consulta nuestra guía para combinar albaranes y notas de entrega en una sola hoja de cálculo de recepción.

JPG/PNG/PDF Extracción con IA

Los archivos se procesan de forma segura y no se almacenan.

Cómo afrontar los desafíos de extracción específicos de Japón

Los albaranes japoneses presentan cuatro desafíos de extracción en los que las herramientas genéricas fallan, no porque el OCR sea inexacto, sino porque carecen del contexto específico de Japón necesario para interpretar lo que leen.

Fechas del calendario de era japonesa (和暦)

Un albarán fechado como 令和7年6月10日 corresponde al 10 de junio de 2025 en el calendario occidental. 令和 (Reiwa) comenzó en mayo de 2019. Antes fue 平成 (Heisei, enero de 1989 – abril de 2019), y antes 昭和 (Showa, diciembre de 1926 – enero de 1989). Los albaranes de proveedores con relaciones de larga duración pueden llevar cualquiera de estos nombres de era según cuándo se creó la plantilla. Una herramienta que extrae "令和7年6月10日" como texto sin formato obliga al usuario de la hoja de cálculo a convertir manualmente cada fecha. Una herramienta de extracción adaptada a Japón debe reconocer los nombres de era, realizar la conversión y generar un formato de fecha estándar — 2025-06-10 o June 10, 2025 — de forma automática. Esto supone una corrección de 30 segundos por documento si se hace manualmente. En 100 albaranes, son 50 minutos solo en fechas.

Tipos duales de impuesto al consumo (複数税率)

Desde octubre de 2019, Japón aplica un tipo estándar del 10% y un tipo reducido del 8% a alimentos (excluyendo alcohol y comidas fuera) y suscripciones de periódicos. Un solo albarán de un distribuidor de alimentos puede incluir ambos tipos — cajas de verduras al 8% y productos de limpieza al 10%. El albarán muestra un subtotal y un importe de impuesto para cada categoría de tipo. Una herramienta de extracción que suma todo en una columna "Total" pierde la división del impuesto, haciendo que los datos sean inútiles para la declaración del impuesto al consumo. La definición de columnas debe incluir campos separados: "10% Taxable Amount (10%対象)," "8% Taxable Amount (8%対象)," "10% Tax Amount (10%消費税)" y "8% Tax Amount (8%消費税)".

Albaranes manuscritos y con copia carbón

Los albaranes manuscritos (手書き納品書) siguen siendo comunes en Japón — utilizados por servicios de reparación, proveedores de materiales de construcción, pequeños fabricantes y contratistas independientes. Un albarán con copia carbón (複写式納品書) produce varias capas: la hoja superior va al destinatario, la segunda se queda con el proveedor. Cuando el almacén lo recibe, la copia puede ser una impresión carbón de tercera generación con caracteres desvaídos, tinta manchada y un sello de la empresa (印鑑) estampado sobre el texto. El OCR general entrenado en diseños occidentales limpios tiene dificultades con los tres aspectos: la escritura irregular, la transferencia carbón degradada y la superposición del sello de tinta roja. Un modelo de IA visual que lee el documento como una imagen completa, entendiendo el texto como parte de un contexto documental en lugar de cuadrículas de caracteres aislados, puede extraer estos campos. La precisión en japonés manuscrito es menor que en texto impreso — prevea una revisión rápida en cualquier albarán manuscrito — pero la diferencia entre "la IA lee el 80% correctamente y usted corrige el 20%" y "usted escribe el 100% desde cero" es la diferencia que importa. Para más información sobre el manejo de documentos manuscritos, consulte nuestra guía sobre extracción de albaranes manuscritos a Excel.

Sellos y estampillas de la empresa (印鑑 / 角印)

La mayoría de los albaranes japoneses llevan un sello de la empresa, generalmente un sello cuadrado 角印 (kakuin) en tinta roja, colocado sobre el nombre y la dirección del emisor. El sello es una marca de autenticidad, no un campo de datos, pero su superposición de tinta roja confunde a los motores de OCR que intentan leer el texto subyacente. Peor aún, algunos proveedores estampan sobre la fecha de entrega o la línea del importe total, justo los campos que más necesitas. Un modelo de IA visual entrenado en estructuras de documentos puede distinguir entre las impresiones de sellos superpuestas y el texto debajo de ellas, extrayendo el texto original e ignorando el sello. Esta capacidad es un requisito básico para la extracción de documentos japoneses; si una herramienta no puede manejar 印鑑, no puede manejar albaranes japoneses.

Para una visión más amplia de cómo el ecosistema de procesamiento de documentos japonés aborda estos desafíos, incluida una comparación de costos de herramientas que van desde el OCR integrado de freee hasta servicios de extracción por IA dedicados, consulte nuestro análisis de opciones de extracción asequibles para pymes japonesas.

Preguntas frecuentes

¿Funciona esto con albaranes japoneses escritos a mano?

Sí: el modelo de IA visual subyacente a la extracción de nombres de columnas lee tanto texto impreso japonés como escritura a mano, incluida la escritura cursiva y la escritura mixta kanji/kana. La precisión en campos escritos a mano no es idéntica a la del texto impreso, particularmente para kanji complejos con muchos trazos o copias carbón muy degradadas, pero el paso de revisión detecta casos excepcionales en lugar de requerir una reentrada manual completa. Si un albarán está completamente escrito a mano, espere verificar el resultado de la extracción en lugar de confiar ciegamente en él.

¿Puede la herramienta manejar el calendario de era japonés (令和/平成/昭和) para las fechas?

Sí. Cuando defines una columna como "Fecha de entrega (納品日)", la IA reconoce las fechas basadas en la era y las convierte al calendario occidental en la salida. 令和7年6月10日 se convierte en 10 de junio de 2025 o 2025-06-10, según tu formato preferido. Esta conversión ocurre automáticamente durante la extracción, sin necesidad de corrección manual de fechas en Excel después.

¿Qué pasa si algunas notas de entrega muestran precios y otras no?

En las adquisiciones japonesas, el precio no es obligatorio en una nota de entrega (納品書). Algunos proveedores incluyen el precio unitario y el importe por línea; otros —especialmente los que facturan mensualmente con una factura consolidada— omiten los precios por completo y muestran solo los nombres de los artículos y las cantidades. La definición de sus columnas puede incluir campos como "Precio unitario (単価)" e "Importe (金額)" — la IA los extraerá cuando estén presentes y dejará la celda vacía cuando no. La hoja de cálculo se mantiene coherente y la conciliación de precios se realiza posteriormente con la factura.

¿Puedo extraer datos de notas de entrega que también sirven como Facturas Cualificadas?

Sí. Defina columnas para el número de registro de la Factura Cualificada (登録番号), el desglose del 10% de impuesto (10%対象額, 10%消費税額) y el desglose del 8% de impuesto (8%対象額, 8%消費税額). La IA extrae todos los campos en la misma fila de la hoja de cálculo. Si una nota de entrega no incluye campos de Factura Cualificada, esas columnas permanecen vacías: la extracción maneja ambos tipos de notas de entrega en el mismo lote sin plantillas separadas.

¿La extracción maneja notas de entrega escritas verticalmente (縦書き)?

Algunas notas de entrega japonesas —particularmente las que usan formatos tradicionales— disponen el texto verticalmente, con la información del destinatario a la derecha y la del emisor a la izquierda. El modelo de lenguaje visual de la IA lee el documento como una imagen y comprende la estructura del diseño, no solo la dirección del flujo de texto. Localiza los campos por su función semántica independientemente de la orientación. Dicho esto, la precisión es mayor en diseños horizontales (横書き); si un proveedor usa consistentemente formato vertical, incluya algunas muestras en su lote de prueba inicial para evaluar la precisión en el diseño específico de ese proveedor.

¿Cómo se compara esto con el OCR integrado en freee o Money Forward?

Los motores OCR integrados en freee, Money Forward y 弥生 (Yayoi) fueron diseñados principalmente para recibos (レシート) —tickets cortos de papel térmico de un solo formato con una estructura conocida. Son excelentes para leer un recibo de una tienda de conveniencia y categorizar automáticamente el gasto. Una nota de entrega de proveedor con múltiples formatos —particularmente una con una tabla de líneas de artículos, tasas impositivas duales y diseño mixto horizontal/vertical— es un documento fundamentalmente diferente. El OCR integrado puede extraer algunos campos correctamente, pero típicamente falla en la estructura de la tabla de líneas de artículos, la conversión de fechas de era y la división de la tasa impositiva. La extracción dedicada de notas de entrega que lee por el significado del campo en lugar de por la plantilla del documento está diseñada para este escenario exacto.

¿En qué sistemas WMS o ERP se puede importar el archivo Excel?

El archivo XLSX o CSV puede importarse en cualquier sistema que admita la importación de hojas de cálculo para la recepción de mercancías, incluyendo SAP, Sage, Microsoft Dynamics y plataformas específicas de Japón ampliamente utilizadas en la gestión de compras japonesa: 弥生販売, freee, Money Forward y 楽々シリーズ. Si su sistema admite la importación CSV para registros de recepción, el archivo está listo sin necesidad de transformación adicional.

El albarán japonés no es más difícil de leer que cualquier otro albarán. Lo que lo hace más complejo es que la mayoría de las herramientas de extracción fueron entrenadas con supuestos diferentes sobre cómo es un albarán, cómo se ve una fecha y qué información fiscal debe aparecer en la página. Cuando la herramienta lee por el significado del campo en lugar de su posición, esos supuestos dejan de importar. La misma definición de columna que extrae datos de un PDF de 弥生販売 funciona en una impresión de freee, una exportación de Money Forward y una copia carbón manuscrita de un proveedor que aún usa sello de empresa y pluma estilográfica. La hoja de cálculo es lo primero. La escritura manual termina. La conciliación a tres bandas comienza.

📮 contact email: [email protected]