Cómo extraer datos de nóminas francesas
a Excel
Cuando un despacho contable francés (cabinet d'expertise comptable) asume la nómina de un nuevo cliente, el primer documento que solicita no es el libro mayor. Son 12 meses de bulletins de paie (nóminas) de cada empleado. Cada PDF es un reflejo de la DSN (Déclaration Sociale Nominative) mensual — la declaración electrónica única transmitida a URSSAF, CNAV, CPAM y Pôle Emploi desde enero de 2017 según el Décret n°2016-611. Si el salaire brut del boletín de diciembre no coincide con el total de la DSN, la discrepancia debe localizarse y explicarse antes de que el despacho pueda certificar los libros (arrêter les comptes). El cuello de botella no es leer las nóminas. Son los 3 minutos por boletín dedicados a teclear manualmente Gros (salario bruto), CSG deductible (cotización social deducible) y Net à payer (sueldo neto) en una fila de hoja de cálculo — y luego repetirlo para otros 49 empleados, durante 12 meses.
Conclusiones clave
- A tres minutos por bulletin de paie, una empresa de 50 empleados invierte 30 horas al año tecleando los dieciséis campos legalmente obligatorios en Excel — antes siquiera de comenzar cualquier verificación.
- 30 horas tecleando, y el contador aún no puede certificar — porque la conciliación DSN exige que Salaire Brut, CSG deductible y Net Imposable coincidan entre el PDF de la nómina y la declaración electrónica, y una sola cotización mal clasificada rompe todo el mes.
- Una columna calculada — Verificación CSG = Bruto × 98,25% × 9,2% − CSG extraída — permite a ImageToTable.ai marcar filas con diferencias superiores a ±1 € durante la extracción, convirtiendo una hoja de cálculo de 600 filas en una lista de investigación de solo tres filas.
Por qué el Bulletin de Paie francés es uno de los documentos más complejos de extraer en Europa
La nómina francesa no está diseñada para herramientas de extracción de datos. Está diseñada para el cumplimiento normativo — y el sistema de protección social francés, financiado por unas de las tasas de cotización patronal más altas de Europa, exige que cada euro de cotización quede registrado. Dieciséis campos son obligatorios según el Artículo R3243-1 del Código del Trabajo. Otras cinco líneas están prohibidas según el Artículo R3243-4: un empleador no puede mostrar las horas de huelga como tales, ni distinguir entre horas trabajadas y tiempo de representación sindical. Un bulletin de paie no conforme conlleva una multa de hasta 450 € por documento.
Esta densidad legal genera tres niveles de dificultad de extracción que las herramientas OCR genéricas — diseñadas para nóminas en inglés con unas pocas líneas de deducciones — no pueden manejar:
- La estructura de tres secciones. Un bulletin de paie francés se divide en parte superior (identidad del empleador y empleado — SIRET, código NAF, convenio colectivo), cuerpo (salario bruto → cotizaciones → neto) y parte inferior (acumulados anuales, saldos de vacaciones, importe social neto). Cada sección utiliza diferentes convenciones tipográficas, y el mismo nombre de campo — "Total" — aparece en el cuerpo como subtotal, en la parte inferior como acumulado anual y en el encabezado como número de referencia. Una plantilla basada en coordenadas que extraiga "el segundo Total" desde arriba obtendrá el número incorrecto en un PDF generado por Silae frente a uno de PayFit.
- Cinco grupos obligatorios de cotizaciones. La reforma de simplificación de 2018 agrupó las aproximadamente 50 líneas de cotizaciones sociales en cinco categorías: Santé (salud), Accidents du travail (accidentes laborales), Retraite (jubilación — sécurité sociale plafonnée, sécurité sociale déplafonnée y complémentaire AGIRC-ARRCO), Famille (familia) y Chômage (desempleo). Pero cada grupo sigue conteniendo una parte salarial y una parte patronal, mostradas en columnas separadas. La CSG (Contribución Social Generalizada) y la CRDS (Contribución al Reembolso de la Deuda Social) se encuentran en su propia sección con su propia base de cálculo: el 98,25% del salario bruto, no el 100%. Una extracción que trate todas las líneas de "cotización" como una única columna de impuestos mezclará las contribuciones del empleado y del empleador en un número que no significa nada para ninguna de las partes.
- Neto imponible ≠ Neto a pagar. El importe que aparece en la declaración fiscal anual del empleado (neto imponible) no es el importe transferido a su cuenta bancaria (neto a pagar). Neto imponible = salario bruto − cotizaciones sociales deducibles + CSG no deducible (porción del 2,4%) + CRDS (0,5%). Neto a pagar = neto imponible − impuesto sobre la renta retenido en origen (PAS) + reembolsos (transporte, vales de comida). Una extracción genérica que genere una columna de "Sueldo Neto" fusiona dos cifras legalmente distintas. Esta distinción es importante porque la DSN utiliza el neto imponible, mientras que el extracto bancario del empleado refleja el neto a pagar.
Estos no son casos excepcionales. Son la anatomía estándar de cada bulletin de paie emitido por un empleador francés desde enero de 2018, cuando el formato de nómina simplificada (bulletin de paie clarifié) se volvió obligatorio para todas las empresas. La reforma hizo las nóminas más cortas — de aproximadamente 50 líneas a unas 20 — pero no las hizo más fáciles de extraer. Agrupar las contribuciones bajo cinco epígrafes reorganizó el diseño sin estandarizarlo entre los diferentes proveedores de software de nóminas.
Los Dieciseis Campos Obligatorios Según el Artículo R3243-1 — Correspondencia con las Columnas de tu Hoja de Cálculo
Antes de crear las columnas de extracción, necesitas el inventario legal. El Artículo R3243-1 enumera exactamente lo que debe aparecer en cada nómina. Cada elemento a continuación se corresponde con un nombre de columna que definirás en tu flujo de extracción:
| Elemento R3243-1 | Campo | Nombre de Columna Recomendado | Función en la Verificación DSN |
|---|---|---|---|
| 1° | Nombre y dirección del empleador | Nombre del Empleador | Debe coincidir con el registro SIRET |
| 2° | Código NAF/APE + SIRET | SIRET | Identificador principal del empleador en DSN |
| 3° | Convenio colectivo | Convenio Colectivo | Determina las tasas de cotización |
| 4° | Nombre y puesto del empleado | Nombre del Empleado | Debe coincidir con el NIR (número de seguridad social) |
| 5° | Número de seguridad social (NIR) | NIR | Identificador del bloque de empleado en DSN |
| 6° | Nivel de clasificación (coeficiente) | Clasificación (Coeficiente) | Determina la tabla salarial base |
| 7° | Período de pago y horas trabajadas | Período de Pago, Horas Trabajadas | DSN: horas para cálculo de cotizaciones |
| 8° | Horas extra + tasas de prima | Horas Extra, Tasa de Prima | Exoneración fiscal en horas extra |
| 9° | Salario bruto | Salario Bruto | Base de todos los cálculos de cotizaciones DSN |
| 10° | Naturaleza e importe de los complementos salariales | Complementos Salariales | Bonificaciones, comisiones, beneficios en especie |
| 11° | Cotizaciones del empleado por grupo | Cotizaciones del Empleado | Bloque de contribuciones del empleado en DSN |
| 12° | Cotizaciones del empleador por grupo | Cotizaciones del Empleador | Bloque de contribuciones del empleador en DSN |
| 13° | Neto imponible | Neto Imponible | Alimentación anual de DGFiP (autoridad fiscal) |
| 14° | Neto a pagar | Neto a Pagar | Punto de control final de conciliación DSN |
| 15° | Retención en origen (PAS) — tasa e importe | Tasa PAS, Importe PAS | Tasa individualizada de DGFiP |
| 16° | Fecha de pago | Fecha de Pago | Referencia del período mensual DSN |
Para un despacho contable que concilia una nómina anual, estos dieciséis campos generan 600 filas de datos para 50 empleados — 9.600 puntos de datos. Un SIRET mal emparejado o una sola columna de Cotizaciones del Empleado desalineada provoca horas de corrección manual. La herramienta de extracción debe capturar cada campo por lo que significa, no por dónde está en la página.
Cinco campos adicionales están explícitamente prohibidos según el Artículo R3243-4: cualquier mención a actividad huelguística, cualquier distinción entre horas trabajadas y horas de representación sindical, y cualquier referencia al derecho de desconexión del empleado o al ejercicio de otros derechos sociales. Estas prohibiciones no afectan la extracción directamente, pero implican que un bulletin de paie conforme usará etiquetas neutras como "Absence non rémunérée" en lugar de "Grève" — lo que cambia la cadena de texto que la IA ve en el PDF.
El Panorama del Software de Nómina — Por Qué Silae, PayFit y ADP Generan PDFs Estructuralmente Diferentes
El Artículo R3243-1 exige qué debe aparecer, no cómo debe organizarse. No existe una plantilla gubernamental prescrita — y cinco proveedores dominan el mercado francés de software de nómina, cada uno con su propio motor de renderizado de PDF.
| Software | Posición en el Mercado | Formato de Exportación PDF | Desafío de Extracción |
|---|---|---|---|
| Silae | Líder — usado por contadores públicos para más del 30% de las nóminas del sector privado francés | Diseño compacto de 2 columnas, agrupación densa | Cotizaciones fusionadas en un solo bloque; CSG y CRDS comparten una etiqueta de fila que varía según el convenio colectivo |
| PayFit | SaaS moderno para PYMEs, diseño responsivo de una columna | Una columna, espaciado amplio, renderizado con fuentes web | Monto neto social ubicado en una columna lateral que las herramientas de plantilla pasan por alto; línea PAS a veces en página separada |
| Sage Paie | PYMEs en el ecosistema Sage (Sage 50, Sage 100), fuerte en comercio minorista y servicios | Multi-sección con encabezados seccionales, diseño tabular convencional | Cotizaciones patronales renderizadas debajo de la tabla principal en una sección que algunos motores OCR omiten como "contenido de pie de página" |
| ADP | Grandes empresas y multinacionales | Desglose detallado en varias páginas, anexos separados para regímenes específicos | Neto imponible y neto a pagar a menudo aparecen en páginas diferentes; páginas suplementarias para grupos específicos de empleados (cadres vs non-cadres) |
| Cegid RH | Mercado medio con ambición de HRIS completo | Bloques estandarizados, consistentes entre versiones del producto Cegid | Tablas de saldos de vacaciones insertadas entre las secciones del cuerpo y el pie de página, rompiendo el flujo vertical del que depende el OCR lineal |
La consecuencia operativa: una firma contable que atiende a 10 clientes, cada uno usando un proveedor de nómina diferente — o el mismo proveedor con configuración diferente — no puede crear una plantilla por software y esperar que sobreviva a una actualización de versión. Silae, PayFit y Sage cambian el diseño de sus PDFs periódicamente. La extracción basada en plantillas falla. La extracción semántica — donde la IA busca "Salaire Brut" por lo que significa la etiqueta, no por coordenadas de píxeles — no falla.
Este es el mismo desafío que hace difícil la extracción de nóminas coreanas: la ley define el contenido, pero Douzone, ECOUNT y PAYZON lo presentan de forma diferente. La situación en Francia es más crítica porque la DSN añade una capa de verificación: los datos extraídos deben coincidir con una declaración electrónica mensual enviada a cinco organismos gubernamentales.
Paso a paso: Extraer datos de nóminas francesas a un archivo Excel verificable
Este flujo de trabajo parte de una premisa: la extracción no termina cuando tienes columnas. Termina cuando las columnas pueden cotejarse con la DSN. Los pasos siguientes asumen que tienes una carpeta con boletines de pago en PDF —exportados desde Silae, PayFit, Sage, ADP o Cegid— y tu hoja de cálculo debe estar estructurada para que un contable la verifique, no solo la lea.
Los archivos se procesan de forma segura y no se almacenan.
Sube los Boletines de Pago — El lote es la opción por defecto
Arrastra y suelta todos los PDF: ya sean 12 boletines mensuales de un empleado o 50 de toda una plantilla. La herramienta acepta PDF, JPG y PNG. Para un despacho de expertos contables que realiza una revisión salarial anual, la carga típica es de 600 archivos (50 empleados × 12 meses). Cada uno se procesa individualmente, pero se exportan a una sola hoja de cálculo: una fila por boletín.
Define las columnas que coinciden con la estructura DSN
Escribe los nombres de las columnas tal como aparecen en tu lista de verificación. Para la verificación DSN, el conjunto mínimo es: Nombre del Empleado, SIRET, Salaire Brut, Cotisations Salariales Total, Cotisations Patronales Total, CSG Deductible, CSG Non Deductible, CRDS, Net Imposable, Net a Payer, Taux PAS, Montant PAS. Estas doce columnas proporcionan suficiente información para cotejar cualquier bloque mensual de la DSN. La herramienta lee cada nombre de columna por su significado semántico: "Salaire Brut" encuentra el campo de salario bruto independientemente de si Silae lo colocó arriba a la izquierda o PayFit en el centro.
Añade una columna de verificación calculada
Crea una columna llamada Verificación CSG (Bruto × 98,25% × 9,2% − CSG extraída). Es una columna calculada: la herramienta ejecuta el cálculo durante la extracción y muestra la diferencia entre el importe de CSG esperado y el valor extraído. Un resultado dentro de ±1 € por boletín indica que tanto la extracción del bruto como la de la CSG son probablemente correctas. Un resultado superior a 5 € señala un error de extracción, un error de entrada en la DSN o un caso particular (exoneración, ajuste por convenio colectivo). Las columnas calculadas convierten la extracción de una tarea de captura de datos en una tarea de verificación de datos en una sola pasada.
Exporta y coteja con la DSN
Exporta a Excel (XLSX). La hoja de cálculo ahora contiene una fila por boletín de pago con columnas que reflejan la estructura de la DSN. Importa la exportación mensual de la DSN desde el software de nóminas o Net-entreprises.fr. Coteja: el Salaire Brut del boletín debe coincidir con el bruto del bloque de empleado de la DSN; el Net Imposable del boletín debe coincidir con el neto fiscal de la DSN; el Montant PAS debe coincidir con el bloque PAS de la DSN. Cualquier fila donde la columna de Verificación CSG se desvíe más de 1 € es tu lista corta para investigación manual, antes de certificar las cuentas anuales.
De la extracción a la verificación: uso de los ratios CSG, CRDS y PAS para detectar discrepancias en la DSN
La extracción te da datos. La verificación te da confianza. La legislación laboral francesa — específicamente las tasas CSG y CRDS publicadas anualmente por URSSAF — proporciona fórmulas de verificación integradas que convierten la extracción bruta en un resultado auditable.
Estos son los tres ratios de verificación que toda hoja de conciliación de nóminas debería contener, con la fórmula de columna calculada que puedes configurar:
| Verificación | Fórmula | Desviación aceptable | Qué indica una desviación |
|---|---|---|---|
| CSG total | Bruto × 98,25% × 9,2% | ±1 € | Error de extracción del bruto, exoneración no contabilizada o base de cálculo incorrecta |
| Desglose CSG deducible | CSG Total × (6,8/9,2) | ±1 € | Clasificación errónea de CSG deducible vs no deducible — afecta directamente al Neto Imponible |
| CRDS | Bruto × 98,25% × 0,5% | ±0,50 € | Error de cálculo de CRDS o la extracción tomó una línea de cotización diferente con nombre similar |
El factor 98,25% no es arbitrario: es la base CSG (assiette CSG), fijada por la ley francesa para excluir las contribuciones del empleador a la mutua y la previsión que están por debajo del umbral de exención. Para un salario bruto de 3000 €, la base CSG es 2947,50 €. CSG al 9,2% = 271,17 €. Si la CSG extraída es de 245 €, la discrepancia de 26 € indica que algo está mal: el bruto extraído es incorrecto, el empleado tiene una exoneración específica o el registro en la DSN se calculó mal. Sabes que existe un problema antes de saber cuál es. Esa es la diferencia entre extracción y verificación.
Estos controles calculados son el equivalente en nóminas de lo que hacen los contables al extraer facturas francesas: cotejar las tasas de IVA con los totales de las líneas para confirmar que la extracción capturó el desglose fiscal correcto, no solo un total genérico.
El flujo de conciliación DSN-Nómina que usan los despachos contables
Una vez realizada la extracción y colocadas las columnas de verificación, la hoja de cálculo se convierte en un documento de trabajo — no en una respuesta definitiva, sino en una comparación estructurada entre dos fuentes de datos (PDF de nómina y exportación DSN). Este es el flujo de conciliación que siguen los despachos contables franceses:
Exportar datos DSN desde el software de nómina
Toda plataforma de nómina francesa conforme — Silae, PayFit, Sage Paie, ADP, Cegid — puede exportar un extracto de datos DSN. Este extracto contiene, por empleado y mes, los mismos campos que aparecen en la nómina. Expórtalo como CSV y ábrelo junto con tu hoja de extracción.
Emparejar filas por NIR del empleado + período de pago
El número de seguridad social (NIR, Numéro d'Inscription au Répertoire) es la clave única. Empareja cada fila de nómina con su fila DSN correspondiente usando el NIR y el período de pago. Si una nómina no tiene fila DSN coincidente para un mes determinado, eso es una alerta roja — o no se transmitió la DSN (sanción: 5% de las cotizaciones adeudadas por mes de retraso) o la nómina es de otro período.
Señalar desviaciones superiores a 1 €
Compara Salario Bruto, Cotizaciones Sociales, Neto Imponible y Neto a Pagar entre las columnas de nómina y DSN. Señala cualquier desviación superior a 1 €. Ordena la hoja por la columna calculada de Verificación CSG (descendente por diferencia absoluta). Las filas superiores son tu lista de investigación. La mayoría de los meses, la lista estará vacía — y ese silencio es el objetivo. Una lista de desviaciones vacía significa que el contador puede validar la conciliación de nóminas en minutos, no en horas.
La obligación de conservación de cinco años — y por qué un Excel estructurado supera a una carpeta de PDF
Según el artículo L3243-4 del Código del Trabajo, el empleador debe conservar una copia de cada nómina durante cinco años. Para una empresa de 50 empleados, son 3000 PDF. Una carpeta con 3000 PDF no permite búsquedas. Un archivo Excel con 3000 filas — extraídas de esos mismos PDF — es buscable, ordenable, auditable y filtrable por fecha, empleado o grupo de cotización.
Aquí la extracción sirve para algo más que la conciliación. Cuando un exempleado de 2022 solicita su acumulado anual para verificar su pensión (reconstitución de carrera), RR. HH. no rebusca en un archivo de PDF. Filtra la hoja de Excel por NIR, consulta la fila de diciembre con los totales anuales de 2022 y responde en menos de un minuto. La hoja de extracción se convierte en el registro digital de nóminas de la empresa: estructurado, buscable y conforme con la obligación de conservación de cinco años en un formato realmente útil para la recuperación de datos.
Preguntas frecuentes — Extracción de datos de nóminas francesas
¿La extracción con IA funciona tanto con el formato detallado antiguo como con el simplificado de 2018?
Sí. El formato de nómina clarificada introducido en enero de 2018 agrupa las cotizaciones en cinco categorías — Salud, Accidentes laborales, Jubilación, Familia, Desempleo — pero las etiquetas de campo subyacentes (Salario Bruto, Base Imponible, Neto a Pagar) son las mismas en ambos formatos. Una herramienta de extracción semántica que lee las etiquetas por significado, no por posición, funciona con ambos formatos. El formato detallado anterior a 2018, con unas 50 líneas de cotización individuales, ofrece datos aún más granulares para la extracción; la reforma de simplificación redujo el desorden visual para los empleados, pero no eliminó los datos que ya transmite la DSN.
¿La extracción funciona con nóminas que incluyen el importe neto social?
Sí. Desde julio de 2023, las nóminas francesas deben mostrar el importe neto social, la cifra de referencia para determinar la elegibilidad para prestaciones sociales como la RSA (Renta de Solidaridad Activa) y la prima de actividad. Este importe se sitúa entre el neto imponible y el neto a pagar en la nómina. La herramienta de extracción lo captura como un campo diferenciado si se define una columna para ello. El neto social no se utiliza en la verificación DSN — tiene un fin administrativo distinto —, pero registrarlo en la misma fila de la hoja de cálculo mantiene todos los datos de la nómina en un solo lugar para futuras consultas.
¿Puedo extraer solo meses concretos, por ejemplo, solo las nóminas de diciembre para los acumulados anuales?
Sí. Si tu objetivo es la conciliación anual, solo necesitas la nómina de diciembre, que incluye todos los acumulados anuales al final. Sube solo los archivos de diciembre y define columnas para los campos de acumulado: Bruto Acumulado, Neto Imponible Acumulado, Horas Acumuladas, PAS Acumulado. Así obtienes los totales del año completo en una sola fila por empleado sin procesar 12 meses de datos.
¿Qué pasa con regímenes específicos como cadres (ejecutivos), VRP (viajantes) o apprentis (aprendices)?
La nómina francesa tiene regímenes de cotización distintos para cadres (cotizaciones adicionales AGIRC-ARRCO tramo B, diferentes tasas de prévoyance), VRP (código de riesgo URSSAF 511TG) y apprentis (exoneraciones en la mayoría de cotizaciones). Si su extracción abarca varias categorías de empleados, defina columnas separadas para campos específicos de cadres — por ejemplo, Cadre Retraite Complementaire Tranche B — y deje esas celdas vacías para empleados no cadre. La herramienta de extracción solo rellenará una celda cuando encuentre el campo correspondiente en el boletín. Las celdas en blanco no son errores; reflejan con precisión la ausencia de esa categoría de cotización.
¿Funciona con nóminas manuscritas o escaneadas, no solo PDF nativos?
Sí — la IA lee el diseño visual, no las capas de texto incrustadas. Un bulletin de paie escaneado (impreso y redigitalizado), una foto tomada con un smartphone o una captura de pantalla JPEG de un portal de nóminas pasan por el mismo proceso de extracción semántica. Las anotaciones manuscritas en un boletín impreso — como una nota del gerente — añaden ruido visual pero no impiden que la IA encuentre las etiquetas de campo impresas. Sin embargo, los escaneos muy degradados (papel arrugado, inclinación extrema, daños por agua) reducen la precisión. El mismo principio se aplica a la extracción de recibos de nómina de cualquier proveedor — el formato importa menos que la legibilidad.
¿En qué se diferencia la extracción de exportar un registro de nóminas directamente desde Silae o PayFit?
Una exportación del registro de nóminas desde Silae o PayFit contiene los datos dentro del software. Pero esa exportación refleja lo que el software calculó — no necesariamente lo que el boletín PDF del empleado muestra físicamente. Pueden divergir: un ajuste manual realizado después de generar el boletín, una corrección aplicada en un mes posterior o una discrepancia de versión entre la base de datos de nóminas y el archivo PDF. Extraer datos directamente de los boletines de pago PDF le da el documento que realmente se entregó al empleado — que es el registro legal según el Artículo L3243-1. La exportación del software es el cálculo; el boletín PDF es la evidencia. Para la extracción del registro de nóminas, se aplica la misma lógica de verificación — el registro es el agregado, los boletines son la prueba.
Una nómina francesa contiene más de 30 campos de datos exigidos por uno de los sistemas de nóminas más regulados del mundo. La extracción te da los datos. Las columnas de verificación calculadas — ancladas a las tasas de URSSAF — te dicen si son correctos. Ambos deben estar en el mismo flujo de trabajo.
Pruébalo en un Bulletin de Paie