¿Por qué falla la extracción de tablas conceldas combinadas? 4 causas comunes y soluciones

No estás solo: este es el problema de extracción más común. Tu herramienta lee el texto, pero el resultado llega con celdas vacías donde debería haber datos, encabezados de columna dispersos en columnas equivocadas o filas que simplemente desaparecieron. Las celdas combinadas en el documento original son casi siempre las culpables, y la solución depende de entender qué tipo de patrón de celda combinada está causando el problema.

Deja de teclear datos — deja que la IA los lea por ti
Sube una imagen o PDF — datos estructurados en 10 segundos
Probar ahora
Sin registro · Sin tarjeta · Resultados en 10 segundos
Documentos financieros y recibos: una escena de escritorio que ilustra el desafío de extraer datos de tablas estructuradas de documentos con celdas combinadas

Puntos clave

  1. Tu extracción se completó sin errores, pero columnas enteras volvieron vacías porque cada celda combinada en el origen obligó a tu herramienta a hacer una suposición silenciosa.
  2. Esas celdas en blanco no son aleatorias: cuatro patrones específicos de celdas combinadas las provocan y cada uno tiene una causa raíz con nombre que puedes diagnosticar en 30 segundos.
  3. Una sola verificación posterior a la extracción — separar las celdas combinadas restantes, rellenar hacia abajo para propagar valores y verificar el recuento de filas contra el origen — detecta la corrupción silenciosa a la que toda herramienta es vulnerable.

¿Te Suena Familiar?

Si estás aquí, probablemente uno de estos escenarios coincide con lo que estás viendo ahora:

  • Celdas vacías en columnas que deberían tener datos. Una etiqueta de categoría combinada ("Ingresos Q1") que abarca tres filas — la primera fila tiene el texto, las dos siguientes están vacías.
  • Datos desplazados a la columna incorrecta. Valores que pertenecen a "Monto" terminaron en "Descripción" porque el encabezado combinado confundió la detección del límite de columna.
  • Encabezados de columna faltantes o desordenados. Un bloque de encabezado de dos filas donde "Detalles del Producto" abarca cinco columnas — la extracción lo colapsó en una sola columna.
  • Las filas no cuadran. La fuente tiene 14 filas de datos pero la salida muestra 9, o viceversa, porque los límites de las filas combinadas se contaron mal.

Cada uno de estos síntomas apunta a una causa raíz diferente. La buena noticia: una vez que sepas qué patrón está en juego, la solución es sencilla.

El Panorama General: Por Qué las Celdas Combinadas Rompen la Extracción

Una tabla es una cuadrícula — filas y columnas que forman celdas, cada una con un valor. Una celda combinada une celdas adyacentes en una sola unidad visual. Se ve como una celda grande en pantalla, pero la estructura subyacente sigue tratándolas como celdas separadas — solo una de las cuales contiene datos.

Esta brecha entre la apariencia visual y la realidad estructural es donde las herramientas de extracción fallan. Ya sea que uses OCR tradicional o un modelo de IA de visión, el motor de extracción debe decidir: "¿Cómo mapeo este tramo visual de vuelta a una cuadrícula limpia?" Esa decisión es donde las cosas salen mal.

Las celdas combinadas obligan a las herramientas de extracción a adivinar. Ambos enfoques fallan cuando la suposición es incorrecta — y con celdas combinadas, lo es con frecuencia.

Causa Raíz 1: El OCR Línea por Línea No Maneja Estructuras 2D

Síntomas

El texto está completo, pero la correspondencia fila-columna está rota. Una fila que debería ser "Parte A | $12.50 | 3 | $37.50" aparece como "Parte A | $12.50 | " con los valores restantes desplazados a la siguiente línea. Las celdas combinadas que abarcan varias filas generan filas vacías en la salida.

Causa Raíz: Fractura de Coordenadas

Los motores OCR tradicionales procesan documentos de forma secuencial — líneas de arriba abajo, palabras de izquierda a derecha. Esto funciona para párrafos. Para tablas, trata cada bloque de texto como una línea independiente sin comprender la alineación vertical que define una columna.

Aquí hay un ejemplo concreto. Imagine una orden de compra con una celda combinada que dice "Suministros de Oficina" y abarca tres filas:

Categoría (combinada)ArtículoCant.Precio Unit.
Suministros de OficinaCuadernos10$3.50
Bolígrafos (Caja)5$8.00
Grapadora2$12.00

Un motor OCR basado en líneas lee esto como:

Línea 1: "Suministros de Oficina" | "Cuadernos" | "10" | "$3.50"
Línea 2: "Bolígrafos (Caja)" | "5" | "$8.00"
Línea 3: "Grapadora" | "2" | "$12.00"

Observe lo que sucedió: "Suministros de Oficina" se leyó en la línea 1 junto con los datos reales de esa fila, porque el OCR lo encontró en la misma posición vertical. En las líneas 2 y 3, el motor OCR no sabe que "Suministros de Oficina" sigue rigiendo esas filas — el texto físicamente no está allí. El resultado es una extracción donde la columna Categoría está vacía para las filas 2 y 3, rompiendo cualquier análisis posterior que agrupe por categoría.

La solución

Preprocesamiento: detectar los límites de celdas combinadas antes de la extracción. Algunas herramientas (incluyendo ImageToTable.ai) analizan primero el diseño del documento — identificando la cuadrícula de la tabla, incluyendo los tramos combinados — antes de leer cualquier texto. Al comprender la estructura 2D completa de antemano, el motor de extracción sabe que "Material de oficina" ocupa las filas 1 a 3 y puede propagar ese valor en las tres filas de la salida. Si tu herramienta actual no hace esto, busca una que realice un análisis de diseño como fase separada antes del OCR o la extracción de texto — esta es la mejora más importante frente a la extracción línea por línea.

Causa raíz 2: Ambigüedad de tramos — La celda que pertenece a todas partes

Síntomas

Un encabezado de columna combinado provoca que los datos aparezcan bajo el encabezado incorrecto. Por ejemplo, una tabla con encabezados "Detalles del producto | T1 | T2 | T3 | T4" donde "Detalles del producto" abarca dos subcolumnas ("Artículo" y "SKU") — la salida extraída colapsa las dos subcolumnas en una, o duplica valores entre ellas.

Causa raíz: Ambigüedad de tramos

Cuando una celda combinada abarca varias columnas, la herramienta de extracción debe responder: "¿Esta celda pertenece a la columna 1, a la columna 2 o a todas?" La respuesta parece obvia para el ojo humano, pero para un algoritmo es ambigua.

Esto es especialmente complicado para los modelos de IA visual que usan análisis por parches. Estos modelos dividen la imagen en pequeños mosaicos y analizan cada uno de forma independiente. Una celda combinada que abarca cinco columnas se fragmenta en múltiples mosaicos. Cada mosaico ve solo una parte de la celda combinada, y el modelo debe unirlas de nuevo — una tarea que introduce errores en cada costura. Un análisis de Medium sobre fallos prácticos en la reconstrucción de tablas documentó este problema exacto: los modelos de visión que dividen imágenes en parches "tienen un rendimiento deficiente para objetos que dependen de la continuidad global — las tablas son uno de ellos".

La solución

Diseña tu extracción con la estructura esperada. Si sabes que tu documento fuente tiene un encabezado como "Detalles del producto (Artículo | SKU)", define los nombres de tus columnas en consecuencia — "Artículo" y "SKU" — en lugar de confiar en que la herramienta adivine la jerarquía. Herramientas como ImageToTable.ai que usan Extracción de columnas personalizadas te permiten especificar exactamente las columnas que deseas. La IA luego empareja cada columna con la subcolumna correcta en el documento al comprender lo que significa cada campo, no adivinando los límites de las celdas combinadas. Esto evita por completo el problema de ambigüedad: en lugar de preguntarle a la herramienta "¿qué tan ancha es esta celda combinada?", le dices "estas son las columnas que necesito — encuéntralas en el documento".

Causa raíz 3: Alturas de fila irregulares rompen el ritmo

Síntomas

La tabla extraída tiene demasiadas o muy pocas filas. Una fila de subtotal de sección que abarca todo el ancho de la tabla se cuenta como una nueva fila (expandiendo la cuadrícula) o se omite por completo (colapsándola). El número total de filas de la tabla extraída no coincide con el original.

Causa raíz: Variación en la altura de fila

La mayoría de los algoritmos de extracción de tablas se basan en detectar líneas horizontales o espacios en blanco para identificar los límites de las filas. Una celda combinada que abarca varias filas cambia el patrón de altura visual — ya sea más alta (el contenido combinado necesita más espacio) o más baja (área combinada vacía). En cualquier caso, la heurística del algoritmo para los límites de fila se confunde.

Esto es especialmente común con patrones escalonados, donde las celdas combinadas crean un límite diagonal. El algoritmo ve alturas inconsistentes y no puede determinar si debe tratar todo el bloque como una fila grande o dividirlo.

La solución

Post-procesamiento: verifica el número de filas contra la estructura esperada. Después de la extracción, realiza una verificación rápida: ¿el número de filas de datos coincide con lo que esperas? Si sabes que cada factura tiene una sección de artículos con 3 a 12 filas, marca cualquier resultado fuera de ese rango. En Excel, puedes usar una simple verificación con CONTARA o una tabla dinámica para verificar los recuentos de filas entre lotes. Las herramientas más avanzadas ofrecen validación integrada que compara automáticamente la estructura extraída con los recuentos esperados de filas y columnas y resalta las discrepancias para revisión manual.

Causa Raíz 4: Sin Validación Posterior al Procesamiento

Síntomas

La extracción parece exitosa — sin errores, sin tiempos de espera — pero al usar los datos, descubres que los valores están en filas o columnas incorrectas. El error es silencioso, lo que lo hace más peligroso que una extracción fallida.

Causa Raíz: Colapso en el Post-Procesamiento

Muchas herramientas de extracción tienen un paso final de ensamblaje donde los bloques de texto detectados se asignan a una cuadrícula. Si las celdas combinadas causaron problemas en etapas anteriores (fractura de coordenadas, ambigüedad de extensión o confusión en la altura de filas), el post-procesamiento a menudo intenta ocultarlos colapsando o rellenando celdas para ajustarse a una cuadrícula rectangular. Aquí ocurre la corrupción silenciosa de datos: la herramienta llena celdas vacías con valores vecinos, desplaza columnas enteras a izquierda o derecha, o elimina filas que no encajan en la forma de cuadrícula que decidió.

El mecanismo específico: el post-procesador tiene una forma de cuadrícula objetivo (ej., 4 columnas × 15 filas) inferida del recuento de celdas detectadas. Cuando una celda combinada crea una anomalía — digamos, 63 celdas detectadas para lo que debería ser una cuadrícula de 4×16=64 — el motor debe compensar el espacio. Algunas herramientas rellenan con espacios en blanco (creando el síntoma de "celda vacía"). Otras comprimen: redistribuyen las 63 celdas en 64 espacios, empujando un valor de datos a la columna incorrecta.

La Solución

Implementa validación posterior a la extracción. Ya sea manual o automatizada, cada lote de extracciones de documentos con celdas combinadas debe incluir un paso de verificación cruzada. El enfoque más práctico: exporta tu tabla extraída, descombina las celdas combinadas restantes en Excel o Google Sheets usando la función "Unmerge Cells", luego usa "Fill Down" para propagar valores a las celdas recién vacías. Esto te da una cuadrícula rectangular limpia que puedes validar contra tu fuente original.

Tres soluciones que realmente funcionan

Basándonos en las cuatro causas raíz anteriores, aquí tienes la ruta práctica de solución, desde la más simple hasta la más completa.

1
Preprocesamiento: detecta los límites de celdas combinadas antes de la extracción.

Si tu herramienta lo permite, activa el análisis de diseño o la detección de estructura de tabla como paso de preprocesamiento. Esto le indica al motor de extracción que identifique la cuadrícula completa —incluyendo los rangos combinados— antes de leer el texto. Para herramientas que no ofrecen esto, considera dividir el documento previamente. En PDFs, herramientas como "Preparar formulario" de Adobe Acrobat pueden ayudarte a definir límites manualmente. Para imágenes, busca una herramienta que realice detección de tablas como primer paso discreto.

2
Diseña con la estructura esperada.

No confíes en que la herramienta adivine tus columnas. Especifícalas explícitamente. Con la Extracción de columnas personalizadas de ImageToTable.ai, defines los nombres de columna que deseas —y la IA empareja cada uno con los datos correctos del documento mediante comprensión semántica, no por posición. Esto significa que incluso si un encabezado combinado confunde la detección de diseño, el mapeo de columnas sigue siendo correcto porque la IA sabe qué significa "SKU", no solo dónde está ubicado.

3
Postprocesamiento: verifica y completa.

Después de la extracción, ejecuta una validación simple en Excel o Google Sheets: descombina las celdas que sigan combinadas, usa Rellenar hacia abajo para propagar valores y verifica que el número de filas coincida con el documento fuente. Para procesamiento por lotes, configura una fórmula CONTARA por columna para marcar cualquier columna con menos entradas de las esperadas. Si procesas el mismo tipo de documento regularmente, guarda esta validación como plantilla: toma 30 segundos ejecutarla y detecta casi toda la corrupción silenciosa.

Cuándo escalar: no todas las celdas combinadas se pueden corregir automáticamente

Algunos patrones de celdas combinadas son realmente difíciles, incluso para la IA avanzada. Aquí te indicamos cuándo deberías considerar preprocesar el documento fuente manualmente en lugar de intentar corregir la extracción:

  • Combinaciones anidadas (rowspan + colspan en la misma celda): Una celda que abarca 3 filas Y 2 columnas crea un hueco en la cuadrícula que ninguna herramienta rellena perfectamente. Dividir previamente el documento en tablas más simples antes de la extracción suele dar mejores resultados.
  • Patrones de combinación en escalera: Límites diagonales donde la fila 1 combina las columnas A-B, la fila 2 combina B-C, la fila 3 combina C-D; esta estructura en cascada rompe casi todos los motores de extracción. La solución más eficiente suele ser exportar el documento como una tabla plana desde la aplicación de origen antes de la extracción.
  • Tablas de varias páginas con celdas combinadas que cruzan saltos de página: Incluso las mejores herramientas tienen dificultades aquí. Considera procesar cada página de forma independiente y unir los resultados manualmente.

Respuesta honesta: si tu documento tiene combinaciones anidadas o en escalera complejas y procesas más de 50 documentos de este tipo al mes, vale la pena calcular el ROI de un cambio de herramienta (a una que maneje estos patrones de forma nativa). Para documentos ocasionales, el preprocesamiento manual antes de la extracción es más barato que lidiar con resultados deficientes.

Preguntas frecuentes

¿La extracción con IA maneja mejor las celdas combinadas que el OCR tradicional?

Sí, pero no perfectamente. Los modelos de IA visual analizan el documento como un diseño completo en lugar de línea por línea, por lo que identifican los límites de las celdas combinadas con mayor precisión que el OCR basado en líneas. Sin embargo, la ambigüedad de extensión sigue siendo un desafío para los modelos de IA porque el análisis basado en parches puede fragmentar las celdas combinadas entre mosaicos. Herramientas como ImageToTable.ai, que combinan el análisis de diseño con la coincidencia semántica de campos, manejan las celdas combinadas significativamente mejor que el OCR tradicional, pero no son 100% inmunes, especialmente con patrones anidados o en escalera.

¿Puedo corregir errores de extracción de celdas combinadas en Excel sin reprocesar?

Sí, para la mayoría de patrones de combinación por filas. Selecciona la columna, ve a Inicio → Combinar y centrar → Descombinar celdas, luego selecciona las celdas vacías y presiona Ctrl+D (Rellenar hacia abajo) para propagar el valor. Para combinaciones por columnas, usa Texto en columnas o Relleno rápido. Esto funciona como solución temporal, pero para procesamiento por lotes, corrige la extracción en origen.

¿Las celdas combinadas en PDF son el mismo problema que en Excel?

Estructuralmente, sí. Pero los PDF son más difíciles de corregir porque no puedes simplemente "descombinarlas". Una celda combinada en PDF está integrada en el diseño de la página, por lo que la corrección debe hacerse en el momento de la extracción, no en el origen.

¿Qué pasa si mi documento fuente tiene bordes que parecen celdas combinadas pero no lo son?

Esto es común. Los bordes tenues o rotos de la tabla pueden hacer que celdas separadas parezcan combinadas, especialmente en escaneos. Intenta preprocesar la imagen para mejorar el contraste; esto puede hacer que los bordes tenues sean detectables. Consulta nuestra guía sobre preprocesamiento de imágenes para mejor detección para técnicas específicas.

Mi herramienta dice "extracción de tabla completa" pero los datos son incorrectos — ¿qué pasó?

Esta es la Causa Raíz 4. El posprocesador ensambló el texto detectado en una cuadrícula, pero las celdas combinadas causaron errores previos que no se señalaron. "Éxito" significó que se produjo una cuadrícula rectangular, no que fuera correcta. Siempre valida una muestra de salida. Para más información sobre cómo crear un flujo de validación, lee nuestra guía completa de solución de problemas para extracción de tablas.

Las celdas combinadas son la fuente más común de errores de extracción, pero una vez que entiendes qué patrón está causando el problema, la solución suele ser sencilla.

Prueba tu propio documento con una herramienta que primero analice el diseño. Muchos problemas de celdas combinadas desaparecen cuando el motor de extracción ve la cuadrícula completa antes de leer una sola palabra.

📮 contact email: [email protected]