Cómo extraer datos de albaranes alemanes (Lieferschein) a Excel — en múltiples formatos de proveedor
Los documentos Lieferschein alemanes varían según el proveedor. La extracción con IA lee todos los formatos sin configurar plantillas, obteniendo códigos de artículo, cantidades y fechas de entrega en Excel.
Qué contiene un albarán alemán — y por qué no es una factura
Un albarán alemán — denominado Lieferschein (albarán) o Warenbegleitschein (documento de acompañamiento de mercancías), según el proveedor — es fundamentalmente diferente de una factura (Rechnung). Un Lieferschein enumera qué se envió. Una factura enumera qué se debe pagar. Tratar un Lieferschein como una factura — extrayendo solo los campos de importe — te deja sin registro de cantidades recibidas, detalle a nivel de artículo ni anotaciones del receptor que tanto finanzas como operaciones necesitan.
Sección de cabecera. Todo Lieferschein comienza con los datos del remitente y del destinatario: Absender (remitente/proveedor) — nombre de la empresa, dirección y, a menudo, un Lieferantennummer (número de proveedor) — y Empfänger (destinatario) con Lieferadresse (dirección de entrega). Debajo de estos, tres campos identificativos anclan el documento: Lieferscheinnummer (número de albarán, un identificador único asignado por el proveedor), Lieferdatum (fecha de entrega — cuándo se enviaron o llegaron las mercancías) y Bestellnummer (número de pedido de compra, tu referencia interna de pedido). Algunos Lieferscheine también incluyen un Kundennummer (número de cliente) y un Auftragsnummer (número de pedido) que difiere del Bestellnummer — saber cuál es cuál evita errores de conciliación posteriores.
Tabla de artículos. El núcleo del documento. Cada fila suele contener: Positionsnummer (número de línea), Artikelnummer (número de artículo/SKU), Artikelbezeichnung (descripción del artículo), Menge (cantidad entregada) y Einheit (unidad — Stück/pieza, kg, m, l, Karton/caja, Palette/palet). Algunos proveedores añaden Chargennummer (número de lote) para mercancías trazables, Gewicht (peso en kg) o Packstücke (número de bultos por línea de artículo). En entregas con múltiples palets, puede aparecer una columna Packstücknummer (número de bulto) que asigna artículos a palets específicos.
Pie de página y firmas. La parte inferior del Lieferschein suele mostrar Gesamtmenge (cantidad total), Anzahl Packstücke (número total de bultos/palets) y un Unterschriftsfeld (campo de firma) donde la parte receptora confirma la aceptación. Las anotaciones manuscritas en esta zona — "2 Kartons beschädigt/2 cajas dañadas", "Nachlieferung folgt/pendiente de entrega posterior", "1 Palette fehlt/falta 1 palet" — contienen información operativa que tu hoja de cálculo debe capturar.
A diferencia de las facturas, los Lieferscheine no tienen campos obligatorios por ley. La legislación alemana no exige un Lieferschein — a diferencia de las facturas, que se rigen por el §14 UStG (Ley del IVA). El Lieferschein es una convención del sector, no una obligación legal. Por eso los formatos de los proveedores varían tanto: al no haber un diseño de campos impuesto por el gobierno, cada sistema ERP y cada proveedor diseña el suyo propio. Un Lieferschein generado por SAP de un gran proveedor automotriz no se parece en nada a un Lieferschein generado por Lexware de un distribuidor regional de materiales de construcción. Si tu enfoque de extracción asume un formato estandarizado, falla al llegar.
Por qué la variabilidad de formatos de proveedores rompe la mayoría de los métodos de extracción
La OCR basada en plantillas —el método de extracción de documentos más común— se entrena con un diseño de documento y luego intenta coincidir ese diseño en cada documento posterior. Dibujas un cuadro delimitador alrededor de "Lieferscheinnummer" en las coordenadas (x=140, y=95) en un PDF generado por SAP, y el sistema busca texto en esas posiciones exactas de píxeles en adelante. Esto funciona para formularios gubernamentales estandarizados. No funciona para los Lieferscheine alemanes porque:
Un Lieferschein de SAP S/4HANA de un fabricante mediano coloca el bloque de encabezado en la parte superior izquierda en una cuadrícula densa, la tabla de artículos abarca todo el ancho de la página con 8 o más columnas, y el pie de página está en la parte inferior derecha. Un Lieferschein de Lexware Faktura de un pequeño Handwerksbetrieb apila todo verticalmente —remitente arriba a la izquierda, destinatario arriba a la derecha, artículos en una tabla simple de 4 columnas (Pos., Artikel, Menge, Einheit), totales al final. Un Lieferschein de sevDesk tiene un diseño más amplio con encabezado de marca, bloque de dirección apilado verticalmente y una tabla de artículos limpia de 5 columnas. Un Lieferschein en papel de un proveedor que aún no se ha digitalizado —quizás un pequeño Spediteur que usa un Durchschreibesatz (juego de copias carbón)— puede tener el número de Lieferschein en la esquina superior derecha escrito a mano, artículos en una tabla dibujada a mano y una firma garabateada en la parte inferior. Cuatro formatos, cero coordenadas compartidas.
La extracción basada en IA resuelve esto de manera diferente. En lugar de coincidir coordenadas de píxeles, un modelo de lenguaje de visión lee el documento comprendiendo qué significa cada fragmento de texto en contexto. Tú defines nombres de columna —los campos de datos que deseas, como "Lieferscheinnummer", "Lieferdatum", "Artikel", "Menge"— y la IA localiza el valor correspondiente en cada documento reconociendo la semántica del campo (un número de albarán cerca de la parte superior del documento, una fecha en formato alemán cerca de una etiqueta que dice "Lieferdatum" o "Datum"), no su posición en la página. Esto es Extracción de Columna Personalizada: escribes los nombres de campo que deseas y la IA empareja cada uno con el valor correcto independientemente del diseño.
Este enfoque también maneja la variabilidad de nombres que desconcierta a los sistemas de plantillas. Un proveedor etiqueta la fecha de entrega como "Lieferdatum", otro escribe "Versanddatum", un tercero usa "Datum". Un proveedor usa "Pos." como encabezado de columna para el número de línea de artículo, otro escribe "Nr.", un tercero escribe "Position". Si tu extracción entiende que los tres se refieren al mismo concepto, obtienes una columna unificada en tu salida. Sin necesidad de mapeo por proveedor.
El marco GoBD y HGB: por qué la extracción precisa importa más allá de la eficiencia
La extracción de datos de Lieferscheine no solo ahorra tiempo. El derecho mercantil y fiscal alemán crea razones estructurales para que los datos de los albaranes estén estructurados, sean buscables y estén archivados.
Según el Código de Comercio alemán (HGB), específicamente el §408, una carta de porte debe incluir identificación del remitente y destinatario, número de bultos, peso total, fecha de entrega o envío, y un número de albarán o pedido. Aunque el §408 HGB regula el contrato de transporte (Frachtvertrag) más que el Lieferschein directamente, define el estándar de información que los Lieferscheine en la logística alemana siguen habitualmente.
Más relevante operativamente es la GoBD (Grundsätze zur ordnungsmäßigen Führung und Aufbewahrung von Büchern, Aufzeichnungen und Unterlagen in elektronischer Form) — los principios de Alemania para la contabilidad electrónica y conservación de registros, emitidos por el Ministerio Federal de Finanzas (BMF). Según GoBD, los albaranes se consideran correspondencia comercial (Geschäftsbriefe) y deben conservarse durante 6 años en un formato inalterable y trazable. Si recibe Lieferscheine como PDF, debe archivarlos como PDF. Si extrae sus datos, los datos extraídos deben poder rastrearse hasta el documento original. Un archivo Excel estructurado de todos los Lieferscheine — buscable por Lieferscheinnummer, Lieferdatum o proveedor — satisface los requisitos de auditoría mucho mejor que una carpeta de PDF renombrados.
GS1 Germany, la organización de estándares detrás de los códigos de barras y estándares de cadena de suministro en Alemania, ha publicado una especificación de albarán digital (dLS) — un formato PDF/A-3 con XML legible por máquina incrustado (análogo a ZUGFeRD para facturas). El estándar dLS define un modelo de datos estructurado con más de 30 campos, desde Lieferscheinnummer y Bestellnummer hasta detalles a nivel de Packstück e información del Fahrer (conductor). La adopción está creciendo entre grandes minoristas y sus proveedores de FMCG, pero la gran mayoría de los proveedores alemanes — especialmente las PYME — todavía emiten Lieferscheine en PDF o papel. La realidad práctica para la mayoría de los equipos receptores es una mezcla: mensajes EDI DESADV estructurados de grandes proveedores, PDF no estructurados de proveedores medianos y notas en papel de pequeños Handwerksbetriebe. La extracción que funciona en los tres casos es el puente entre el caos de formatos actual y el albarán digital estandarizado del mañana.
Paso a paso: del PDF Lieferschein al Excel estructurado
Este flujo de trabajo asume que tienes un lote de PDF de albaranes alemanes — de SAP, Lexware, sevDesk, DATEV o papel escaneado — y quieres un único archivo Excel con una fila por línea de artículo del Lieferschein y columnas homogéneas para todos los proveedores.
Paso 1: Define tus columnas de extracción. Los nombres de columna que escribas se convertirán en los encabezados de tu hoja de cálculo de salida. Para una extracción completa de un Lieferschein alemán, empieza con estos:
| Nombre de columna | Etiqueta en Lieferschein alemán | Qué captura |
|---|---|---|
| Lieferscheinnummer | Lieferscheinnummer / Lieferschein-Nr. | Identificador único del albarán |
| Lieferdatum | Lieferdatum / Versanddatum / Datum | Fecha de entrega o envío |
| Bestellnummer | Bestellnummer / Ihre Bestell-Nr. / PO-Nr. | Tu número de pedido de compra |
| Absender | Absender / Lieferant / Versender | Nombre de la empresa proveedora/remitente |
| Positionsnummer | Pos. / Position / Nr. | Número de línea de artículo en la entrega |
| Artikelnummer | Artikel-Nr. / Art.-Nr. / SKU | Código de artículo/SKU |
| Artikelbezeichnung | Artikel / Bezeichnung / Artikeltext | Descripción del artículo |
| Menge | Menge / gelieferte Menge / Stück | Cantidad entregada |
| Einheit | Einheit / ME / Maßeinheit | Unidad de medida (Stk, kg, m, l, Ktn.) |
| Packstücke | Packstücke / Kolli / Pakete | Número de bultos/palés |
Los nombres de columna están en alemán porque es lo que aparece en el documento. La IA lee "Lieferscheinnummer" en el PDF y lo asigna a tu columna "Lieferscheinnummer" — la semántica coincide. Si prefieres encabezados de columna en inglés en tu salida (p. ej., "Delivery Note Number"), puedes escribirlos. La IA seguirá encontrando el campo alemán correspondiente en el documento porque entiende que "Delivery Note Number" y "Lieferscheinnummer" se refieren al mismo concepto.
Paso 2: Añade columnas calculadas para verificar discrepancias al instante. Una vez que tengas los campos brutos, puedes definir columnas que calculen resultados durante la extracción — no necesitas crear fórmulas en Excel después. Por ejemplo:
- Differenz (Bestellt − Geliefert) — resta la cantidad entregada de la cantidad del pedido almacenada en tu referencia de Bestellnummer. Útil cuando tu Lieferschein incluye una columna "bestellte Menge" (cantidad pedida).
- Lieferstatus — una columna inferida que usa opciones (Vollständig, Teillieferung, Überlieferung) y clasifica cada entrega según las cantidades pedidas frente a las entregadas.
- MHD-Status — para entregas de alimentos/farmacia, marca los artículos próximos a vencer o vencidos según su Mindesthaltbarkeitsdatum (fecha de caducidad) si el Lieferschein lo incluye.
Esto es lo que hacen las columnas calculadas: en lugar de extraer números brutos y luego ejecutar fórmulas de Excel, defines la lógica una vez como definición de columna, y la IA realiza la comparación durante la extracción. Obtienes una hoja de cálculo terminada con las discrepancias ya señaladas.
Paso 3: Sube todos los Lieferscheine de una vez. Arrastra tus PDFs al área de carga — Lieferscheine SAP de grandes proveedores, Lieferscheine Lexware de talleres, Lieferscheine sevDesk de tiendas online, copias escaneadas en papel de proveedores no digitalizados. La IA lee cada documento individualmente y rellena las mismas columnas sin importar qué software generó cada PDF.
Los archivos se procesan de forma segura y no se almacenan.
Paso 4: Exportar a Excel. El resultado es una hoja de cálculo estructurada — una fila por línea de artículo de todos los Lieferscheine, con el número de albarán repetido en cada fila para mantener cada línea trazable hasta su documento original. Todos los importes y cantidades en formato uniforme, todas las fechas normalizadas a un único estándar, listo para importación en WMS, conciliación a tres bandas con pedidos y facturas, o archivado conforme a GoBD.
Una hoja de cálculo de albaranes donde cada fila lleva el número de albarán y la referencia del pedido significa que puedes filtrar por proveedor, por fecha o por pedido — y cada celda es trazable hasta su posición exacta en el PDF original.
Gestión de anotaciones manuscritas, albaranes de varias páginas y entregas parciales
La logística alemana presenta varios casos atípicos recurrentes que invalidan un enfoque simplista de "extraer los campos impresos". Cada uno requiere su propia estrategia de tratamiento.
Anotaciones manuscritas y firmas. Los albaranes suelen llegar con añadidos escritos a mano: un trabajador del almacén rodea una cantidad dañada y escribe "beschädigt" (dañado), un conductor anota "2 Kartons fehlen" (faltan 2 cajas) en el margen, un empleado de recepción firma y fecha al pie. Estas anotaciones tienen valor operativo. La IA lee la escritura manual — una foto bien iluminada del albarán anotado funciona prácticamente igual que el original —, pero la precisión en texto manuscrito es inherentemente menor que en texto impreso. Para los campos impresos principales (Lieferscheinnummer, Artikel, Menge), la precisión en un PDF o foto nítidos iguala los estándares de documentos impresos. Para notas marginales garabateadas, espere resultados reducidos pero aún utilizables. Si su flujo de trabajo depende de anotaciones manuscritas, considere añadir una columna específica para "Anmerkungen" (notas) y revisar esas filas manualmente.
Albaranes de varias páginas. Una entrega con 40 líneas de artículo no cabe en una sola página A4. El albarán se extiende a 2, 3 o más páginas, con el encabezado solo en la página 1 y la tabla de artículos continuando en las siguientes. La IA lee el documento completo como una unidad lógica única: el Lieferscheinnummer de la página 1 se asocia con los artículos de las páginas 2 y 3. La salida repite correctamente los campos del encabezado en cada fila de línea de artículo, incluso si esos campos del encabezado solo aparecen físicamente una vez.
Entregas parciales (Teillieferungen). Un proveedor puede enviar parte de un pedido ahora y el resto después, emitiendo dos albaranes para un mismo Bestellnummer. El primer albarán puede incluir una nota "1. Teillieferung" (primera entrega parcial) o "Rest folgt" (resto pendiente). Estas notas, al extraerse en su hoja de cálculo, proporcionan el contexto necesario para evitar dobles contabilizaciones o marcar incorrectamente un pedido como completo antes de que lleguen todas las entregas parciales.
Si sus albaranes provienen de proveedores internacionales que operan en Alemania pero usan inglés, francés u otros idiomas para las etiquetas de los campos, la IA también gestiona documentos multilingües: "delivery note number", "numéro de bon de livraison" y "Lieferscheinnummer" se asignan al mismo campo cuando define la columna en el idioma que prefiera. Para más información sobre los tipos de documentos recurrentes en las cadenas de suministro alemanas, consulte nuestra guía sobre por qué la inconsistencia en el formato de los albaranes altera la recepción en almacén.
Preguntas frecuentes: Extracción de datos de albaranes alemanes
¿La extracción por IA funciona con albaranes manuscritos o copias en papel fotografiadas?
Sí, con la calidad de entrada adecuada. La IA lee texto de imágenes, por lo que una fotografía bien iluminada de un albarán impreso funciona prácticamente igual que el PDF original. Las anotaciones manuscritas (una nota marginal del conductor, la firma del recepcionista, una cantidad corregida a mano) pueden extraerse, pero la precisión en escritura a mano es inherentemente menor que en texto impreso. Para los campos impresos principales (número de albarán, artículo, cantidad), espere la misma precisión que con un PDF. Para anotaciones manuscritas densas, espere resultados reducidos pero utilizables. Siempre verifique los campos manuscritos con el original.
¿Puede la herramienta manejar albaranes de SAP, Lexware, sevDesk y papel, todos en el mismo lote?
Sí. Como la extracción es semántica y no basada en plantillas, el mismo conjunto de nombres de columna (número de albarán, fecha de entrega, artículo, cantidad) localiza los valores correctos independientemente del software que generó el documento. Usted sube todos los albaranes en un solo lote (5 de proveedores SAP, 8 de usuarios de Lexware, 3 de sevDesk, 2 escaneados en papel) y la salida es un archivo Excel unificado con columnas consistentes en todas las fuentes. Sin configuración por proveedor, sin cambio de plantilla.
¿Qué campos debería incluir siempre en mis columnas de extracción?
Como mínimo: número de albarán (vincula cada fila al documento original), fecha de entrega (fecha de recepción para seguimiento), número de pedido (su referencia de orden de compra para conciliación triple), número de artículo y descripción del artículo (lo que se entregó), y cantidad (cuánto). Si maneja productos trazables, añada número de lote y fecha de caducidad. Si concilia con órdenes de compra, añada cantidad pedida cuando el albarán la incluya, luego use una columna calculada para marcar discrepancias automáticamente.
¿Qué precisión puedo esperar en la extracción de albaranes alemanes?
Para PDFs impresos y claramente legibles, los campos de identificación principales (número de albarán, fecha de entrega, número de pedido) y los campos numéricos (cantidad, unidad) suelen superar el 95% de precisión. Las descripciones de artículos, especialmente palabras compuestas alemanas largas en fuentes pequeñas, pueden tener una precisión ligeramente menor. Las anotaciones manuscritas tienen la precisión más baja. La recomendación honesta: revisa la primera extracción contra los documentos originales, especialmente el número de albarán y la cantidad — tus dos anclas de conciliación — y corrige cualquier error en el resultado. Una celda corregida no afecta a otros campos del mismo documento ni del lote.
¿Cómo maneja la extracción las entregas parciales (Teillieferungen) del mismo pedido?
Cada entrega parcial tiene su propio número de albarán único. Si ambos albaranes hacen referencia al mismo número de pedido, la columna de número de pedido los agrupa en tu hoja de cálculo. Puedes filtrar por número de pedido para ver todas las entregas parciales de ese pedido, y una columna calculada puede sumar la cantidad entregada en todas las filas para verificar si el total entregado coincide con la cantidad total del pedido. La IA no fusiona entregas parciales — ves exactamente lo que contiene cada albarán — pero la hoja de cálculo estructurada hace que la agregación sea trivial.
¿Es la extracción de datos de albaranes a Excel compatible con los requisitos de archivo GoBD?
Los datos extraídos no sustituyen al archivo del PDF original. Según GoBD, debes conservar el albarán original en el formato en que lo recibiste (PDF, escaneo, papel). El Excel extraído es una copia de trabajo complementaria. Sin embargo, un archivo Excel estructurado — con búsqueda por número de albarán, fecha de entrega y proveedor — mejora significativamente tu capacidad para localizar y recuperar documentos originales durante una auditoría fiscal (Betriebsprüfung). El proceso de extracción no reemplaza el archivo; hace que los documentos archivados sean útiles.