Cómo extraer datos de facturas españolasa Excel

Una factura española parece una factura estándar de la UE a simple vista — nombre del proveedor, fecha, líneas de detalle, total. Pero tres campos la hacen estructuralmente diferente de una factura alemana, francesa o italiana: un NIF que sigue el patrón de 8 dígitos más letra de control, un desglose de IVA que puede incluir hasta tres tipos en la misma página (21%, 10% y 4%), y una retención de IRPF que resta del total en lugar de sumar. Si introduces estos campos manualmente en Excel, las diferencias de formato generan fricción en cada paso. Si usas una herramienta de extracción basada en plantillas entrenada con diseños genéricos de la UE, la validación del NIF falla, el desglose del IVA acaba en columnas incorrectas y el campo de IRPF pasa completamente desapercibido. Este artículo repasa cada campo de una factura española, explica qué significa para la extracción y muestra cómo obtener datos limpios y conciliados en una hoja de cálculo sin entrada manual.

Extracción de datos de factura española a hoja de Excel con herramienta de IA en un portátil

Puntos clave

  1. Tu herramienta de extracción funciona perfectamente con facturas alemanas e italianas, pero generará totales incorrectos en una factura española sin que te des cuenta.
  2. Tres tipos de IVA (21%, 10%, 4%) en la misma página rompen las herramientas basadas en plantillas que esperan una sola línea de IVA, y la retención de IRPF —una línea que resta del total en lugar de sumar— pasa completamente desapercibida.
  3. Un lector semántico como ImageToTable.ai extrae cada tipo de IVA, retención de IRPF y letra de control del NIF independientemente del diseño, de modo que una única fórmula de conciliación (Total = Base + ΣIVA − IRPF) detecta cualquier fila desajustada en la hoja de cálculo.

¿Qué diferencia a una factura española de otros formatos europeos?

La Directiva del IVA de la UE (2006/112/CE) establece un marco común para el contenido de las facturas en todos los estados miembros. Toda factura europea debe incluir el número de IVA del proveedor, una fecha, una descripción y el importe del IVA. Ese mínimo común es el mismo de Lisboa a Helsinki. Lo que diferencia a una factura española es lo que España añade.

Las obligaciones de facturación en España se rigen por el Real Decreto 1619/2012, que especifica campos obligatorios más allá del mínimo de la UE. La Agencia Estatal de Administración Tributaria (AEAT) aplica estas normas mediante las declaraciones fiscales trimestrales. Una factura que omita un campo obligatorio puede bloquear la deducción del IVA para el receptor y conllevar sanciones del 1-2% del importe de la transacción.

Cuatro diferencias estructurales separan una factura española de la plantilla europea genérica:

CampoFactura UE genéricaFactura española
Formato del ID fiscalNúmero de IVA (código de país + alfanumérico, longitud variable)NIF/CIF: 8 dígitos + 1 letra de control para personas físicas, 1 letra + 7 dígitos + 1 control para empresas
Tipos de IVAGeneralmente 1-2 tipos (general + reducido)Hasta 3 tipos de IVA en la misma factura: 21% (general), 10% (reducido), 4% (superreducido) — cada uno con su propia Base Imponible y Cuota
Retención de IRPFNo presente en la mayoría de facturas europeasRetención de IRPF — normalmente 15% o 7% restado del total. Aparece como una línea de impuesto negativa
Numeración de facturasNúmero secuencial, sin requisito de serieSerie + Número: facturas organizadas en series con nombre (p. ej. 2026-F-0001), con series obligatorias separadas para facturas rectificativas

No son diferencias cosméticas. Una herramienta de extracción basada en plantillas que espere un único tipo de IVA por factura dividirá las líneas del 21% y 10% de IVA de una factura española en dos filas separadas — o peor, las fusionará en una sola columna sin preservar qué base corresponde a cada tipo. Una herramienta entrenada con diseños de facturas alemanas o británicas no tendrá concepto de línea de retención, porque en esos mercados el total de la factura es simplemente base + IVA. En una factura española, el total suele ser base + IVA − IRPF, y equivocarse en la aritmética significa que la cifra extraída no coincidirá con lo que realmente se pagó.

El reto de la extracción no es que las facturas españolas sean más difíciles de leer. Es que contienen categorías de datos que la mayoría de las herramientas de extracción no fueron diseñadas para reconocer. Una vez que se conocen esas categorías, el proceso de extracción se vuelve predecible.

Campos obligatorios de la factura española que debes extraer y su significado

Según el Real Decreto 1619/2012, artículo 6, una factura completa debe contener al menos once datos. La factura simplificada, usada para importes inferiores a 400 € o en sectores como hostelería y transporte, omite el NIF y la dirección del destinatario. Para la extracción, debes contemplar ambas variantes: un lote de 30 facturas de proveedores casi seguro incluirá una mezcla.

Campo (Nombre en español)Qué contieneNota de extracción
Número y SerieNúmero de factura secuencial dentro de una serie con nombre. Ejemplo: 2026-F-000123 o R-2026-045El prefijo de la serie indica el tipo (F = factura, R = rectificativa). Extraer ambos como columnas separadas para rastrear la continuidad de la serie
Fecha de ExpediciónFecha de emisión de la factura. Para B2B, debe ser dentro de los 16 días del mes siguiente al servicioEl formato de fecha español es DD/MM/AAAA. La extracción por IA normaliza automáticamente a su configuración regional
Fecha de OperaciónFecha de suministro de los bienes o servicios, si es diferente de la fecha de emisiónPresente en aproximadamente el 40% de las facturas. Si está en blanco, fecha de operación = fecha de emisión
NIF/CIF EmisorNúmero de identificación fiscal del proveedor. Personas físicas: 8 dígitos + 1 letra (ej. 12345678Z). Empresas: 1 letra + 7 dígitos + 1 control (ej. B12345678)El sufijo de letra es un dígito de control calculado a partir de la parte numérica. Los dígitos de control no válidos indican un error de entrada de datos o una factura fraudulenta
Razón SocialNombre comercial completo registrado tanto del emisor como del destinatarioPuede diferir del nombre comercial. Extraer siempre Razón Social en lugar del nombre de la marca del logotipo
Dirección FiscalDirección fiscal registrada de ambas partesObligatoria en factura completa, ausente en factura simplificada para el destinatario
DescripciónDescripción de los bienes o servicios, incluyendo cantidad y precio unitarioDebe ser lo suficientemente detallada para identificar la transacción. Las descripciones vagas aumentan el riesgo de auditoría
Base ImponibleImporte neto antes de impuestos, desglosado por tipo de IVA aplicadoUna sola factura puede contener múltiples líneas de Base Imponible — una por tipo de IVA más una para operaciones exentas
Tipo de IVA + Cuota IVAPorcentaje (21%, 10% o 4%) e importe en euros correspondiente para cada tipoExtraer como pares: cada tipo debe permanecer asociado a su base y su importe
Retención IRPFPorcentaje (15% o 7%) e importe en euros retenido. Solo en facturas de servicios B2B de profesionales individuales (autónomos)Esta es una línea negativa. Total a Pagar = Base Imponible + IVA − IRPF. Las herramientas basadas en plantillas a menudo fallan al analizar una línea de impuesto negativa
Importe TotalImporte final adeudado, incluidos todos los impuestos y retencionesCuando hay IRPF, el total NO es igual a Base + IVA. Verificar cruzadamente: Total = Base + IVA − IRPF

El error de extracción más común es tratar el Importe Total como Base Imponible + IVA e ignorar la deducción del IRPF. En una factura de servicio de 1.000 € con IVA al 21% e IRPF al 15%, el total es 1.060 €, no 1.210 €. Una herramienta que suma el IRPF en lugar de restarlo infla el importe a pagar en 150 € por factura. Con 30 facturas al mes, eso supone un desfase mensual de 4.500 € en su libro mayor de cuentas por pagar.

El problema del desglose del IVA: por qué una factura puede tener tres tipos impositivos

España aplica tres tipos de IVA según la Ley 37/1992 (LIVA): 21% general, 10% reducido y 4% superreducido. El tipo del 10% cubre productos alimenticios, transporte de viajeros, hostelería y ciertos servicios profesionales. El tipo del 4% se aplica a bienes esenciales: pan, leche, libros, medicamentos. Una sola factura de un distribuidor mayorista de alimentos puede incluir artículos al 10% (comidas preparadas) y al 4% (productos básicos), además del 21% en envases o gastos de envío.

Cuando esto ocurre, la factura debe mostrar cada tipo en su propia línea con una Base Imponible y una Cuota separadas. Agrupar diferentes tipos es contrario a lo dispuesto en el Real Decreto 1619/2012. Para la extracción, esto significa que una sola factura puede generar múltiples filas de impuestos:

Tipo de IVABase ImponibleCuota IVACategoría aplicable
21% (General)200,00 €42,00 €Envases, entrega, artículos no alimenticios
10% (Reducido)500,00 €50,00 €Comidas preparadas, transporte
4% (Superreducido)300,00 €12,00 €Pan, leche, productos básicos
Total1.000,00 €104,00 €

La mayoría de las herramientas genéricas de extracción de facturas manejan esto mal. O capturan solo la primera línea de IVA e ignoran el resto, o suman todos los importes de IVA en una columna sin conservar el desglose por tipo. Ese desglose faltante importa: al presentar el Modelo 303 (la declaración trimestral de IVA), la AEAT exige que el IVA soportado se declare por categoría de tipo. Si su extracción muestra 104,00 € de IVA sin atribución de tipo, no podrá rellenar correctamente las casillas 28 a 31 de la declaración.

Aquí es donde el método de extracción marca la diferencia. Las herramientas de OCR basadas en plantillas buscan una etiqueta como "IVA" y toman el número que la acompaña. En una factura española con tres líneas de IVA, "IVA" aparece tres veces con tres números diferentes. Un enfoque de extracción semántica —que entiende qué significa cada tipo en lugar de dónde está en la página— captura los tres tipos como puntos de datos distintos con sus bases e importes intactos. Usted define columnas como "Base Imponible 21%", "Cuota IVA 21%", "Base Imponible 10%", etc. La IA lee toda la página, identifica cada bloque de IVA y coloca el valor correcto en cada columna, independientemente del diseño.

Cuando la AEAT cruza su Modelo 303 con las facturas de sus proveedores, el desglose del IVA es lo primero que verifican. Un desajuste entre el IVA soportado declarado y el IVA documentado por tipo es una señal de alerta que desencadena una inspección más rápido que cualquier otra discrepancia.

Retención IRPF: el campo que hace que tus totales no cuadren

La retención de IRPF es el campo más confuso de una factura española para quien no está en España. Es un anticipo del impuesto sobre la renta, no un impuesto sobre las ventas. Cuando un profesional autónomo factura a una empresa española por sus servicios, el cliente debe retener un porcentaje de la base imponible e ingresarlo directamente en la AEAT en nombre del profesional. El profesional recibe el importe neto tras la retención y recupera la cantidad retenida al presentar su declaración anual de IRPF (Modelo 100 o Declaración de la Renta).

Los porcentajes de retención los establece el Artículo 101 de la Ley del IRPF:

PorcentajeA quién aplicaDuración
15%Servicios profesionales (consultores, abogados, arquitectos, informáticos, diseñadores) — tipo generalA partir del tercer año natural completo de actividad
7%Nuevos profesionales en sus tres primeros años naturales de actividadAño de alta más los dos siguientes
19%Derechos de propiedad intelectual y ciertos ingresos artísticosIndefinido
0%Actividades agrícolas y ganaderas; facturas a particulares o clientes no residentes; empresas (S.L./S.A.) que facturan a otras empresasIndefinido — el IRPF no aplica en facturas entre empresas

En la factura, el IRPF aparece como una línea negativa debajo del cálculo del IVA. Un diseño típico:

Base Imponible: €1.000,00
IVA (21%): +€210,00
IRPF (15%): −€150,00
Total a Pagar: €1.060,00

Para la extracción, la línea de IRPF supone un reto específico: parece un descuento pero se comporta como un impuesto. Algunas facturas la etiquetan como "Retención IRPF", otras la abrevian como "IRPF" o "Ret. IRPF". El porcentaje y el importe pueden aparecer en la misma línea o divididos en dos. Una plantilla que espere que todos los campos monetarios sean positivos leerá −150 como 150 y dará un total de €1.360 en lugar de €1.060.

La comprobación es sencilla: una vez extraídos los datos, verifica que Importe Total = Base Imponible + ∑Cuota IVA − Retención IRPF. Si los números no cuadran, la extracción omitió un tipo de IVA o la línea de IRPF.

Reglas de numeración de facturas y por qué son clave para la conciliación de datos

La numeración de facturas en España según el Real Decreto 1619/2012 sigue una estructura de Serie + Número. Una serie es un prefijo con nombre (como "2026-F" para facturas ordinarias o "R-2026" para rectificativas), y los números son correlativos dentro de esa serie sin saltos permitidos. El sistema de series existe porque la ley española exige flujos de numeración separados para distintos tipos de factura: las facturas ordinarias, las simplificadas y las rectificativas deben tener su propia serie.

Una factura rectificativa no simplemente anula la original. Hace referencia a la factura original por número y fecha, indica el motivo de la corrección y muestra la diferencia entre los importes original y corregido. El importe corregido puede ser positivo (cobró de menos) o negativo (cobró de más o el cliente devolvió mercancía). Las normas de auditoría del Real Decreto 1619/2012 exigen que las rectificativas se emitan dentro de los cuatro años siguientes a la fecha de devengo del impuesto de la factura original. Pasados cuatro años, ya no es posible realizar correcciones mediante rectificativas.

Para la conciliación de datos, el prefijo de serie actúa como clasificador del tipo de documento. Un lote de facturas que mezcla series F (estándar) y R (rectificativa) requiere un tratamiento diferente: una factura de la serie R no representa un nuevo importe a pagar, sino que ajusta uno existente. No separarlas implica contar dos veces el mismo gasto o, en el caso de una rectificativa negativa, conciliar un pago que nunca existió.

La estrategia de extracción: defina dos columnas — "Serie de factura" y "Número de factura" — y extráigalos de forma independiente. Luego, configure una columna calculada o una fórmula de Excel que marque cualquier prefijo de serie R para revisión manual. La IA lee el prefijo de serie exactamente como aparece impreso, ya sea "2026-F-000123", "R-2026/045" o "REC-001".

Paso a paso: Cómo extraer datos de facturas españolas a Excel

Este es el flujo de trabajo para extraer datos de un conjunto de facturas españolas en una sola hoja de cálculo de Excel. El enfoque utiliza extracción semántica con IA: la herramienta lee la factura comprendiendo qué significa cada campo, no dónde está ubicado en la página. Esto es importante porque las facturas españolas de distintos proveedores pueden colocar el mismo campo en posiciones completamente diferentes: un proveedor pone el NIF en la esquina superior derecha, otro lo coloca en un bloque de pie de página debajo de las líneas de detalle, y un tercero lo incrusta en un código QR. La extracción posicional falla cuando cambia el diseño. La extracción semántica no.

1

Sube tus facturas españolas

Arrastra y suelta PDFs, imágenes escaneadas o capturas de pantalla de facturas en el área de carga. La herramienta acepta PDFs, JPGs, PNGs y capturas web. Carga todas las facturas a la vez — 10, 50 o más en una sola sesión. No es necesario preseleccionar por proveedor, formato o tipo de factura.

2

Define tus columnas de extracción

Escribe los nombres de las columnas que coincidan con los campos de factura española que necesitas: "NIF Emisor," "Razón Social," "Número de Factura," "Serie," "Fecha de Expedición," "Base Imponible 21%," "Cuota IVA 21%," "Base Imponible 10%," "Cuota IVA 10%," "Retención IRPF (%)," "Retención IRPF (€)," "Importe Total." Los nombres que escribas serán los encabezados de tu hoja de cálculo de salida. También puedes añadir una columna calculada: por ejemplo, "Verificación (OK si Base Imponible 21% + Base Imponible 10% + IVA − IRPF = Importe Total, si no DIF)" para marcar automáticamente errores de conciliación.

3

Procesa y revisa

Haz clic en procesar. La IA lee cada factura, localiza cada campo comprendiendo su significado semántico (no su posición en píxeles) y rellena la tabla de resultados. Revisa los resultados en el navegador. La columna de verificación señala cualquier factura donde el desglose del IVA y el IRPF no cuadren, para que puedas revisar esas primero. El procesamiento tarda de 5 a 10 segundos por página.

4

Exporta a Excel y concilia

Descarga el conjunto de datos completo como archivo XLSX. Cada fila es una factura, cada columna es un campo. Los datos están prenormalizados: fechas en formato consistente, importes como valores numéricos (no texto) y columnas de verificación precalculadas. Desde aquí, la hoja de cálculo se integra directamente en tu software de contabilidad, preparación del Modelo 303 o flujo de conciliación de cuentas por pagar.

JPG/PNG/PDF Extracción IA

Los archivos se procesan de forma segura y no se almacenan.

Variantes de Formato: Factura Completa, Simplificada, Rectificativa y Proforma

No todas las facturas que recibes de un proveedor español serán una factura completa con los once campos obligatorios. La legislación fiscal española reconoce varios tipos de factura, y una bandeja de entrada típica de AP contiene una mezcla:

Tipo de FacturaUsoDiferencia Clave en Extracción
Factura Completa (Ordinaria)Factura B2B estándar. Todos los campos obligatorios presentes.Extracción completa: los 11 campos disponibles. Contiene NIF del emisor y del destinatario, dirección completa y desglose fiscal completo.
Factura SimplificadaImportes inferiores a 400 €, o hasta 3.000 € en hostelería, transporte, aparcamiento. Transacciones B2C.Falta el NIF y la dirección del destinatario. El tipo de IVA sigue siendo obligatorio, pero no se requiere desglose por Base Imponible por tipo: basta con el total con IVA. No permite la deducción del IVA soportado por el destinatario.
Factura RectificativaCorrige una factura emitida previamente. Debe hacer referencia a la factura original e indicar el motivo de la corrección.Lleva un prefijo de serie único (R- o REC-). Contiene dos conjuntos de números: los datos corregidos más los valores originales. La extracción debe capturar el número de factura referenciado y la diferencia.
Factura RecapitulativaAgrupa varias operaciones del mismo cliente en una sola factura mensual.Puede contener líneas de diferentes fechas y con distintos tipos de IVA. Cada línea puede tener su propio tratamiento fiscal.
Factura ProformaFactura preliminar, no es un documento fiscal. Se utiliza para presupuestos o solicitudes de pago anticipado.No es una factura fiscal válida. Debe incluir la etiqueta "Proforma" de forma destacada. No incluir en declaraciones de IVA. Extraer solo como referencia.

La estrategia de extracción se adapta al tipo que llegue a tu bandeja de entrada. Para una simplificada sin NIF de destinatario, la columna NIF simplemente queda en blanco y la fila sigue siendo válida. Para una rectificativa, el prefijo de serie activa una marca para revisión manual. La IA lee lo que hay en la página en lugar de esperar un esquema fijo.

Más allá de la extracción de una sola factura: ¿qué sigue?

Extraer una factura española a Excel resuelve el problema de entrada de datos para ese documento. El reto operativo mayor —procesar 30, 50 o 200 facturas de proveedores a la vez, consolidar el IVA de todas ellas para el Modelo 303 y agregar las retenciones de IRPF para cotejar el Modelo 111— es el tema de procesamiento por lotes de facturas de proveedores españoles en una hoja de cálculo de cuentas por pagar, que cubre flujos de trabajo con múltiples proveedores y la consolidación fiscal trimestral.

Para empresas que procesan facturas españolas junto con facturas de otros mercados, el mismo enfoque de extracción funciona en distintos formatos. Una herramienta que lee una página visualmente, en lugar de analizar XML, no distingue si la factura es una factura española, un CFDI mexicano o una facture francesa: lee los números y las etiquetas igual que lo haría una persona. Para comparar costes de extracción en mercados hispanohablantes, consulte extracción de documentos en mercados hispanohablantes con presupuesto ajustado y extracción de CFDI asequible para pequeñas empresas mexicanas.

Preguntas frecuentes

¿La extracción con IA funciona con facturas españolas manuscritas?

Sí. El reconocimiento de escritura a mano abarca tanto facturas impresas como manuscritas, incluida la letra cursiva. El mismo enfoque basado en nombres de columna funciona: la IA identifica "NIF" y "Base Imponible" por su significado semántico, independientemente de si el texto está escrito a máquina o a mano. La precisión en escritura clara es comparable a la del texto impreso; la escritura muy estilizada o tenue puede requerir una verificación puntual.

¿La herramienta puede procesar archivos XML FacturaE, o solo PDF?

La herramienta de extracción lee la capa visual de los documentos —PDF, imágenes y capturas de pantalla—. No analiza XML directamente. Si dispone de un archivo XML FacturaE, los datos ya están estructurados y son legibles por máquina; no necesita extracción. La herramienta está diseñada para el escenario mucho más común: el proveedor envió una versión PDF de la factura, no el XML, y usted necesita extraer los datos de la representación visual.

¿Qué ocurre cuando cambian los tipos de IVA o se introduce uno nuevo?

Como la extracción es semántica y no basada en plantillas, se adapta a cualquier tipo de IVA que aparezca en la factura. Si el gobierno español introduce un nuevo tipo o modifica uno existente, la IA lee el tipo que figure en la página. Sin necesidad de actualizar plantillas ni reentrenar. Lo mismo aplica a cambios en el tipo de IRPF.

¿Cómo gestiona la herramienta facturas de proveedores extracomunitarios de la UE con IVA invertido?

Cuando una empresa española recibe una factura de otro país de la UE con inversión del sujeto pasivo, la factura muestra «IVA: Inversión del sujeto pasivo» o «0% IVA — Art. 84 LIVA» sin importe de impuesto. La IA extrae la notación de IVA al 0% y la referencia al artículo legal. Dado que el IVA invertido lo autoliquida el destinatario (no lo cobra el proveedor), los datos extraídos reflejan correctamente un IVA soportado cero en esta factura. Para operaciones intracomunitarias, la declaración se realiza en el Modelo 349 (no en el Modelo 303).

¿Qué precisión tiene la extracción en facturas españolas de varias páginas?

La IA procesa todas las páginas de un documento multipágina como una sola unidad. Las líneas de detalle que abarcan varias páginas se capturan en secuencia. Los encabezados, pies de página y números de página se reconocen como elementos repetidos y no se duplican en el resultado. La precisión en facturas de varias páginas es comparable a la de documentos de una sola página.

La extracción que realmente necesitan las facturas españolas

Las facturas españolas tienen una complejidad estructural mayor que las de otros países de la UE: IVA a varios tipos, retención de IRPF que invierte la aritmética fiscal habitual y un sistema de numeración por series con flujos separados para rectificativas. La mayoría de las herramientas de extracción se diseñaron para un modelo de factura más simple. El resultado son datos incompletos (faltan tipos de IVA, falta IRPF) o totales incorrectos (un total que no coincide con lo pagado porque se ignoró la resta del IRPF). La extracción semántica cambia las reglas del juego al leer la factura como lo haría un contable español: identificando cada campo por lo que significa, no por dónde espera encontrarlo una plantilla. El resultado es una hoja de cálculo limpia donde la Base Imponible al 21% está en una columna, la Base Imponible al 10% en otra, el IRPF en su propia columna y el total cuadra.

📮 contact email: [email protected]