Cómo extraer datos de albaranes españoles
a Excel
La mayoría de las herramientas de extracción tratan todos los albaranes por igual. El albarán español rompe esa suposición de tres formas que importan cuando gestionas un muelle de recepción en Barcelona, Valencia o Zaragoza: contiene campos que ninguna plantilla genérica reconoce —como un NIF con letra de control que sigue un patrón de 8 dígitos más 1 letra—, vuelve del receptor cubierto de anotaciones manuscritas y, según la ley mercantil española, sirve como prueba legal de entrega sin ser un documento fiscal. Este artículo repasa cada campo de un albarán español, explica por qué la fragmentación de formatos afecta más a los almacenes españoles, y muestra cómo obtener datos de entrega limpios y conciliados en una hoja de cálculo sin teclear manualmente.
Conclusiones clave
- Los albaranes españoles parecen notas de entrega pero tienen un peso legal único — son el único documento de la cadena de suministro que sale impreso del almacén y vuelve con anotaciones manuscritas que sirven como prueba de entrega según el Código de Comercio, vigente desde hace 141 años.
- Las herramientas de extracción basadas en plantillas fallan ante la estructura de dos capas del albarán — o descartan las correcciones manuscritas como ruido o las mezclan con los datos impresos, generando cantidades que rompen la conciliación triple entre pedido, albarán y factura.
- La extracción por nombre de columna lee ambas capas por significado — define "Cant. Enviada" y "Cant. Recibida" una vez, e ImageToTable.ai encuentra cada valor en cualquier formato de proveedor sin necesidad de una plantilla distinta por diseño.
Un albarán español tiene un peso legal que ningún albarán genérico posee — y campos que ninguna plantilla genérica reconoce.
En la mayor parte de Europa, un albarán es un documento de transporte. Enumera lo que hay en la caja, el conductor lo entrega y el empleado receptor lo coteja con el pedido. El abogado de nadie lo mira jamás. En España, el albarán ocupa una categoría diferente. Según el Código de Comercio (Real Decreto de 22 de agosto de 1885), el albarán sirve como prueba documental de la entrega — traditio — en un contrato de compraventa. No es un instrumento fiscal. No incluye importes de IVA. Pero es el documento que confirma legalmente que las mercancías cambiaron de manos.
El albarán es el único documento de transporte en la cadena de suministro europea que es simultáneamente un recibo de entrega legal y un documento de retorno — el proveedor lo imprime, las mercancías viajan con él, el receptor escribe en él y la copia firmada regresa al proveedor como comprobante. La entrada de Wikipedia sobre albarán lo define claramente: "un documento mercantil que acredita el traslado y la entrega de un pedido". La parte receptora debe firmarlo para confirmar la recepción correcta. Esa firma transforma el documento de una simple lista de empaque en un registro legal.
Este rol legal crea diferencias estructurales entre un albarán español y un albarán genérico. Un albarán de un proveedor español — ya sea del centro logístico de Mercadona cerca de Valencia o de un distribuidor industrial como RS Components España — suele incluir campos que un albarán británico o un Lieferschein alemán no tienen. El campo de identificación fiscal aparece en formato NIF (Número de Identificación Fiscal): 8 dígitos más una letra de control para personas físicas, una letra más 7 dígitos más una letra de control para empresas. Tanto el NIF del proveedor como el del comprador aparecen en el documento. El número de albarán sigue una numeración interna específica del proveedor sin estándar entre proveedores. Y, críticamente — porque el albarán precede a la factura en el flujo comercial — el número de albarán debe cotejarse posteriormente con la factura que lo referencia, permitiendo la conciliación a tres bandas con el pedido.
El albarán español no es un "albarán con algunos campos extra". Es una categoría documental moldeada por un código comercial de 140 años, un flujo de conciliación de múltiples pasos y un recorrido físico que lo convierte en el único documento de la cadena de suministro que sale impreso del almacén y regresa con datos manuscritos. Las herramientas de extracción entrenadas con diseños de albaranes genéricos pasarán por alto la letra de control del NIF, confundirán el número de albarán con la referencia del pedido y el número de seguimiento del transportista, e ignorarán por completo las anotaciones manuscritas del receptor.
Cada albarán contiene 10–14 campos clave para la recepción en almacén — y su etiquetado exacto varía según el proveedor.
Cuando un almacén español recibe un envío, el encargado debe extraer los datos del albarán e introducirlos en el SGA (Sistema de Gestión de Almacén) para registrar el inventario o en el ERP para conciliar el pedido. En España, el software de recepción suele ser SAP Business One, Sage 200 (o Sage Murano, muy usado en pymes españolas), Microsoft Dynamics NAV / Business Central o el ERP SaaS español Holded. Para operativas de almacén, Mecalux Easy WMS — un SGA español del grupo intralogístico Mecalux, con sede en Barcelona — es habitual en almacenes medianos y grandes. El SGA espera datos estructurados. El albarán es todo lo contrario.
Los campos que un almacén español extrae típicamente de cada albarán, y dónde se integran:
| Campo del albarán | Etiqueta habitual del proveedor | Se integra en |
|---|---|---|
| Número de albarán | "Albarán N.º", "Nº Albarán", "Delivery Note Ref" | Registro de recepción; clave para cotejo triple |
| Referencia del pedido | "Su Pedido", "Pedido N.º", "PO Ref." | Conciliación de pedido en ERP |
| Nombre y NIF del proveedor | "Proveedor", "Razón Social", "NIF/CIF" | Verificación de datos maestros del proveedor |
| NIF del comprador | "Cliente", "Destinatario", "NIF" | Asignación a centro de coste interno |
| Fecha de entrega | "Fecha", "Fecha de Entrega" | Registro de recepción; control de SLA del transportista |
| Código de producto / SKU | "Código", "Referencia", "Artículo" | Registro de inventario (PGC Grupo 3 Existencias) |
| Descripción del artículo | "Descripción", "Concepto" | Verificación de recepción contra líneas de pedido |
| Cantidad enviada | "Cantidad", "Uds.", "Unidades" | Asiento contable de Existencias (Debe 3xx) |
| Cantidad recibida | Anotación manuscrita | Señal de discrepancia; retención en cuentas a pagar |
| Firma del receptor | "Recibí conforme", "Firma" | Prueba legal de entrega; confirmación al proveedor |
| Notas de incidencia / daños | Anotaciones manuscritas en márgenes | Informe de no conformidad; reclamación al proveedor |
El Plan General de Contabilidad (PGC) determina dónde se registra cada dato. Cuando se reciben mercancías contra un albarán, el asiento contable debita el Grupo 3 (Existencias, normalmente la cuenta 600 para compras de mercaderías o la 601 para materias primas) y acredita la cuenta 400 (Proveedores). El número de albarán es la referencia que vincula la recepción física con el asiento contable, antes de que llegue la factura. Si el número de albarán se introduce incorrectamente, la conciliación triple entre pedido, albarán y factura se rompe a nivel contable.
Los almacenes españoles sufren la misma fragmentación de formatos que cualquier muelle de recepción, pero el vacío regulatorio en España la vuelve permanente.
No existe una ley española que exija un formato estándar de albarán. El Código de Comercio describe la función del documento, pero no prescribe su diseño. AECOC (Asociación de Fabricantes y Distribuidores), el organismo de estándares GS1 en España con más de 35.000 empresas asociadas, ha desarrollado un estándar de albarán electrónico a través de sus plataformas AECOC EDI y AECOC TRANSP. Pero la adopción de EDI en la logística española sigue el mismo patrón que en otros lugares: grandes minoristas como Mercadona, Carrefour España y El Corte Inglés lo exigen a sus proveedores de primer nivel, mientras que el mercado medio —distribuidores regionales, proveedores industriales, fabricantes locales— sigue enviando albaranes en papel impresos desde el ERP que cada proveedor utiliza.
El resultado es el mismo caos visual al que se enfrenta un recepcionista en un almacén alemán o francés, con una complicación adicional: los proveedores españoles usan a menudo talonarios de albaranes con papel carbón. El original se queda con el comprador, la copia va para el transportista y la tercera queda en el talonario del proveedor. Cuando la copia del comprador llega al departamento de entrada de datos, puede ser una segunda o tercera generación de papel carbón con texto cada vez más borroso. A eso se suman las anotaciones manuscritas que el receptor añadió en el muelle —correcciones de cantidad, notas de daños, una firma— y tienes una sola página con tres capas de información con distintos niveles de legibilidad.
UNO Logística, la principal asociación logística de España que representa a más de 350 operadores logísticos y empresas de transporte, identifica la digitalización de los flujos documentales como una prioridad clave en su agenda sectorial. Pero la asociación también señala que la fragmentación de los formatos documentales en la cadena de suministro —especialmente entre los grandes minoristas que usan EDI y los proveedores del mercado medio que usan papel— sigue siendo una barrera estructural. El Centro Español de Logística (CEL), la mayor comunidad profesional de logística en España desde 1978, ha publicado sobre el desafío de la estandarización documental en sus grupos de trabajo de digitalización de la cadena de suministro. El consenso: la estandarización llegará primero a los corredores de alto volumen, pero la larga cola de proveedores del mercado medio seguirá produciendo albaranes heterogéneos en papel y PDF durante años.
La fragmentación de formatos en España se refuerza por una arquitectura de incentivos similar a los albaranes estándar: el proveedor asume el costo de cambiar su formato de albarán pero no captura ninguna de las ganancias de eficiencia — esa ganancia va íntegramente al almacén receptor. Un pequeño fabricante español que imprime albaranes desde Sage Murano no tiene motivación alguna para rediseñar su plantilla de salida para que el WMS de un cliente pueda leerla más rápido. El formato se mantiene fragmentado porque la economía de la estandarización está permanentemente desalineada.
No necesitas una plantilla para cada proveedor. Defines tus columnas una vez y dejas que la IA encuentre cada campo por lo que significa.
El enfoque estándar para extraer datos de albaranes españoles — escribir cada campo de cada diseño único de proveedor en una hoja de Excel — toma unos 3 minutos por albarán de una página según los benchmarks del sector. Para un almacén que recibe 30 envíos al día, eso son 90 minutos de pura entrada de datos. La alternativa que ofrecen herramientas como el OCR basado en plantillas es peor en el contexto español porque requiere construir una plantilla de extracción separada para cada diseño de proveedor — y los proveedores españoles, a diferencia de los alemanes o franceses donde la estandarización de formatos está más avanzada, muestran una variabilidad extrema. Un albarán de un proveedor industrial catalán y uno de un distribuidor de alimentos andaluz no comparten casi ninguna similitud visual, aunque tengan la misma función legal.
Lo que funciona en su lugar es la Extracción Personalizada de Columnas: un método donde escribes los nombres de los campos que deseas — "Número de Albarán", "Referencia de Pedido", "NIF del Proveedor", "Código de Producto", "Cantidad Enviada", "Firma del Receptor" — y la IA lee cada documento para localizar esos valores entendiendo lo que cada nombre de campo significa semánticamente, no coincidiendo con una posición fija de píxel. Los nombres de columna que ingresas se convierten en los encabezados de tu hoja de cálculo de salida. Una definición de columna funciona para todos los proveedores porque la IA lee el documento como lo haría una persona — buscando el significado de cada campo en lugar de sus coordenadas en la página.
Aquí está el flujo de trabajo de principio a fin, usando un lote de albaranes de múltiples proveedores españoles:
Sube tus albaranes — PDFs, escaneos o fotos
Arrastra un lote de albaranes en PDF del portal del proveedor, copias en papel escaneadas del muelle de recepción o fotos tomadas en la entrega. Puedes mezclar PDFs digitales y papel escaneado en una misma subida. Si tus proveedores o transportistas envían albaranes directamente, la función Enlace de Recogida genera una página de subida compartible — sin necesidad de inicio de sesión para el remitente — así los albaranes llegan automáticamente a tu cola de procesamiento, sin archivos adjuntos por correo ni fotos de WhatsApp.
Define las columnas que necesitas en cada albarán
Introduce los nombres de campo que requiere tu flujo de recepción y ERP: Nº Albarán | Ref. Pedido | Nombre Proveedor | NIF Proveedor | Fecha Entrega | Código Producto | Descripción Artículo | Cant. Enviada | Cant. Recibida | Notas Incidencia | Firma Receptor. Para automatizar la conciliación, añade una columna calculada como Diferencia Cant. (Cant. Enviada - Cant. Recibida) y la IA calcula la diferencia durante la extracción — señalando discrepancias antes de que los datos lleguen a tu SGA o sistema de cuentas a pagar. También puedes definir columnas inferidas como Estado Entrega (opciones: Completa/Parcial/Dañada) y la IA evalúa el contenido del albarán para asignar el estado correcto.
Descarga la hoja de cálculo estructurada
Exporta a XLSX, CSV o JSON. Cada albarán se convierte en una fila de la tabla de salida. El número de albarán, NIF del proveedor, códigos de producto, cantidades enviadas, cantidades recibidas y estado de la firma del receptor aparecen en columnas adyacentes — listos para la contabilización de entrada en el SGA, la conciliación de pedidos en Sage o SAP Business One, o la triple coincidencia con facturas de proveedores. El procesamiento se ejecuta en 5–10 segundos por página. Para usuarios de Google Sheets, el complemento de la barra lateral extrae los resultados directamente en la hoja activa sin salir de la hoja de cálculo.
Pruébalo abajo con un albarán de muestra. La demo usa un preajuste — un conjunto preconfigurado de nombres de columna que coincide con la estructura estándar de albarán / hoja de embalaje — para que veas los resultados de extracción de inmediato sin escribir nombres de columna. Haz clic en "Procesar" y la IA lee tanto los datos de envío impresos como las anotaciones manuscritas de recepción en la página.
Los archivos se procesan de forma segura y no se almacenan.
El albarán es el único documento logístico que sale impreso del almacén y vuelve con datos manuscritos — tu extracción debe leer ambos.
Ningún otro documento del envío hace un viaje de ida y vuelta. El pedido se queda con el comprador. La factura se genera tras la entrega. El conocimiento de embarque viaja con el transportista pero no vuelve al proveedor lleno de anotaciones. El albarán es único: el proveedor lo imprime, la mercancía viaja con él, el receptor escribe sobre él — rodeando una caja dañada, escribiendo "solo 8 uds recibidas" junto a una línea que dice 10, firmando al pie — y la copia anotada regresa al proveedor como comprobante del estado de la entrega.
Este viaje de ida y vuelta crea un problema documental de dos capas que la mayoría de las herramientas de extracción manejan mal. Las herramientas OCR basadas en plantillas leen la capa impresa: los campos del proveedor, las cantidades enviadas, los números de referencia. La capa manuscrita — correcciones, notas de estado, una firma — se ignora como ruido o se mezcla con el texto impreso, generando una salida donde "10 unidades" y "8 uds" aparecen en la misma celda.
Un lector semántico que entienda el significado del campo, en lugar de emparejar bloques de píxeles, puede separar ambas capas en columnas distintas. Define Cantidad Enviada y la IA lee la cantidad impresa de la tabla de líneas del proveedor. Define Cantidad Recibida en la misma configuración de columna y la IA lee la corrección manuscrita que el receptor escribió al lado. Define Notas de Incidencia y los comentarios manuscritos en el margen — "caja dañada", "embalaje roto", "falta 2" — se extraen como texto estructurado en lugar de ignorarse. Define Firma del Receptor con una sugerencia de formato como "Sí/No" y la IA detecta si el documento contiene una firma, independientemente de dónde aparezca en la página.
La capa manuscrita del albarán no es ruido — es el único registro a nivel de campo de lo que realmente llegó frente a lo que debía llegar. Ignorarla significa que tu SGA recibe cantidades incorrectas y tu conciliación a tres bandas falla en la etapa de reconciliación de la factura, donde la cantidad facturada (basada en lo enviado) debe conciliarse con lo realmente recibido.
Los datos extraídos del albarán se integran directamente en la contabilidad española: cada campo se asigna a una cuenta del PGC o a una transacción del SGA.
La hoja de cálculo generada en la extracción no es el destino final. Es un formato intermedio que conecta el albarán con los sistemas que necesitan sus datos. En un almacén español que utiliza Sage 200 o SAP Business One, los campos extraídos siguen una ruta específica:
| Campo extraído | Sistema de destino | PGC / Transacción |
|---|---|---|
| Código de producto, Cantidad recibida | Recepción de mercancías (SGA) | Debe (3xx) Existencias / Haber (400) Proveedores |
| Nº de albarán, Referencia del pedido | Módulo de pedidos de compra (ERP) | Estado del pedido: Parcialmente recibido / Totalmente recibido |
| NIF del proveedor, Fecha de entrega | Libro mayor de proveedores (ERP) | Apunte en subdiario de la cuenta 400 (Proveedores) |
| Discrepancia de cantidad, Notas de incidencia | Retención de facturas / No conformidad | Cuenta 606 (Descuentos sobre compras por pronto pago) o nota de débito del proveedor |
| Firma del receptor | Archivo documental / Legal | Prueba de entrega para disputas con proveedores |
El vínculo crítico es el número de albarán. Según la práctica comercial española, el proveedor emite posteriormente una factura que referencia el mismo número de albarán. La conciliación triple (pedido de compra, albarán de recepción, factura) depende de que el número de albarán y las cantidades entregadas sean correctos en el ERP. Si la introducción manual introduce un error tipográfico en el número de albarán (dígitos transpuestos, carácter faltante), la conciliación posterior de la factura falla y alguien tiene que revisar los registros en papel para encontrar el número correcto. La extracción que obtiene el número de albarán directamente del documento elimina el punto de fallo más común en la conciliación.
Para los equipos que reciben albaranes de personal de campo o conductores en lugar de en un muelle de recepción fijo, la función Enlace de Recogida cierra la brecha en la captura de documentos. Genere un enlace compartible, envíelo a conductores o personal de almacén remoto, y los albaranes llegarán directamente a su cola de procesamiento: sin archivos adjuntos de correo electrónico, sin fotos de WhatsApp, sin necesidad de registro para el remitente. Esto es especialmente útil para operaciones logísticas españolas donde las entregas se realizan en múltiples ubicaciones o donde empresas de transporte externas gestionan la entrega física, pero los datos de recepción deben llegar a un equipo central de AP o inventario.
Preguntas Frecuentes
¿Funciona con albaranes en papel autocopiativo, no con PDFs digitales?
Sí, con un matiz. Las copias de primera y segunda generación con calidad de escaneo estándar (300 dpi o superior) se extraen de forma fiable para campos impresos y escritura a mano legible. Las copias de tercera y cuarta generación, donde la presión de la tinta se ha desvanecido significativamente, producen menor precisión en campos de letra pequeña como números de referencia. Para mejores resultados, escanee la primera o segunda copia. La IA sigue intentando extraer texto desvaído, pero puede marcar valores de baja confianza. Los albaranes en papel térmico (usados por algunas mensajerías españolas) funcionan bien si son recientes; las impresiones térmicas de más de 6 a 12 meses pueden oscurecerse de forma desigual y es recomendable revisar los valores extraídos.
¿Puede la herramienta distinguir el NIF del número de albarán cuando ambos aparecen en el mismo bloque de cabecera?
Sí. La IA lee las etiquetas de los campos y entiende su contexto semántico, en lugar de buscar texto por posición. Al definir una columna llamada NIF Proveedor, busca específicamente el número de identificación fiscal, reconociendo el formato de 8 dígitos más letra de control que distingue un NIF de un número de albarán. También distingue el número de albarán de la referencia de pedido y de cualquier número de seguimiento o de carga que pueda aparecer cerca. Cada identificador llega a la columna correcta independientemente del diseño, algo esencial para la conciliación a tres bandas: un NIF incorrecto en el libro de proveedores genera un error de conciliación que puede llevar horas localizar.
¿Puedo procesar albaranes de 20 proveedores españoles diferentes en un solo lote sin crear 20 plantillas?
Sí. Esa es la diferencia clave entre la extracción por nombre de columna y el OCR basado en plantillas. Usted define sus columnas una vez — Nº Albarán | Ref. Pedido | NIF Proveedor | Código Producto | Cant. Enviada | Cant. Recibida | Notas Incidencia | Firma Receptor — y la IA encuentra cada valor en el albarán de cualquier proveedor al entender el significado del nombre de la columna. Un albarán de un centro logístico de Mercadona, un albarán de RS Components España y una página manuscrita de un libro de albaranes de un fabricante andaluz producen la misma salida estructurada con las mismas definiciones de columna. Súbalos en un solo lote, un archivo Excel unificado, una fila por documento.
¿Los datos extraídos manejan el desglose del IVA con varios tipos que exigen los documentos españoles?
El albarán en sí no incluye importes de IVA — esa es función de la factura. Los albaranes españoles son documentos comerciales, no fiscales. Los datos que se extraen de un albarán no son financieros: números de referencia, códigos de producto, cantidades e información de estado. El desglose del IVA (tipos del 21%, 10% o 4%, cada uno con su base imponible y cuota) aparece en la factura, no en el albarán. Si necesita extraer datos de IVA de facturas españolas, consulte la guía de extracción de facturas españolas. La extracción de albaranes aquí tratada alimenta la parte de recepción de mercancías de la conciliación a tres bandas; la extracción de facturas alimenta la parte de facturación.
¿Qué ocurre si el receptor escribió en el albarán en español — puede la IA leer notas manuscritas en español?
Sí. La IA lee texto manuscrito independientemente del idioma. Anotaciones en español como "recibido conforme", "falta 1 caja" o "producto dañado" se extraen como texto estructurado en el idioma en que fueron escritas. El nombre de columna que defina (p. ej., Notas de excepción) determina lo que busca la IA; el idioma del contenido manuscrito no afecta la lógica de extracción. La escritura en mayúsculas estándar se extrae de forma fiable. La cursiva muy apresurada — habitual en notas de conductores garabateadas en el muelle — puede requerir verificación manual para la transcripción de texto completo, aunque la detección estructurada como "firma presente: sí/no" sigue siendo fiable incluso con escritura apresurada.
Los albaranes españoles cargan con el peso de un código comercial de 140 años, la variedad de salidas ERP de cada proveedor y la evidencia física de lo que realmente llegó al muelle. El problema de la extracción de datos no es la velocidad — es que el empleado de recepción nunca desarrolla memoria muscular, porque cada diseño de albarán se lee por primera vez. La extracción por nombre de columna cambia la ecuación: defines lo que necesitas una vez y el formato deja de importar.
Relacionado: Extraer albaranes y notas de entrega por lotes a Excel · Extracción manual vs IA de albaranes en recepción de almacén · Extraer campos de albarán de cualquier formato a Excel · Convertidor de nota de entrega a Excel