Verificar datos extraídos por IA:
Lista de control de 7 puntos para hojas de cálculo
Acabas de extraer 300 facturas. La hoja de cálculo está abierta: columnas llenas, filas pobladas, totales a la derecha. Antes de enviarla a contabilidad o importarla a tu ERP, hay un paso que la mayoría de las guías de extracción de facturas omiten: la verificación de calidad de salida. Aquí tienes la lista de control de siete puntos que toma 12 minutos y detecta los errores que derivan en pagos incorrectos, gastos mal clasificados y declaraciones fiscales que debes corregir.
Conclusiones clave
- Un decimal que no detectaste convirtió una factura de $295 en un pago de $2,950 — y la herramienta de extracción que lo generó aún reporta un 99% de precisión.
- Los errores de extracción no son casos aislados aleatorios — siguen patrones, y una configuración de desplazamiento de columna corrompe silenciosamente cada fila de ese formato de documento.
- Un filtro de hoja de cálculo de 12 minutos detecta estos errores de patrón antes de que se conviertan en declaraciones fiscales corregidas — y después del primer lote, las fórmulas se ejecutan solas.
Cada herramienta de extracción devolverá algo incorrecto de vez en cuando, incluso las que reportan un 99% de precisión en sus páginas de marketing. Un decimal corrido un lugar. Una fecha que apunta a la fecha de entrega en lugar de la de factura. Un campo de ID fiscal vacío porque la IA no lo encontró en la página 3. Como explica nuestra guía práctica para probar la precisión de la extracción, "99%" es un número sin una definición acordada; lo que importa es si detectas los errores antes de que los datos salgan de tu hoja de cálculo.
Esta lista de verificación está diseñada para el momento posterior a la extracción y anterior a que alguien más toque el archivo. Cada verificación es independiente (puedes ejecutarlas en cualquier orden), pero juntas forman un control completo. Ejecútalas todas en un lote nuevo y encontrarás al menos una cosa que habrías pasado por alto.
Verificación 1: Alineación de Columnas — ¿Los Datos Llegaron al Lugar Correcto?
La forma más rápida de detectar un problema sistémico de extracción es escanear las columnas verticalmente. Cuando la extracción falla a nivel de columna, tiende a fallar para lotes enteros: un campo mal leído desplaza cada valor una columna a la izquierda, o una confusión de delimitadores pone el nombre del proveedor donde va la dirección.
Qué hacer: Lee hacia abajo en cada columna, no a lo ancho de cada fila. Escanear fila por fila es lento y tu cerebro empieza a buscar patrones: dejas de ver los datos. Escanear columnas, en cambio, hace que los valores atípicos resalten. Una dirección en la columna "Monto" es imposible de pasar por alto cuando lees verticalmente.
- Campos de texto: ¿Cada celda en la columna Nombre del Proveedor contiene algo que parezca un nombre (no una dirección, un número de teléfono o una fecha)?
- Campos numéricos: Si tienes una columna Monto y una columna Impuesto una al lado de la otra, ¿tienen sentido las magnitudes? El impuesto debería ser aproximadamente el 5-25% del monto. Si el Impuesto dice $2,495.00 y el Monto dice $2.50, están intercambiados.
- Campos de identificación: Números de factura, órdenes de compra, códigos de referencia: ¿todos siguen un patrón reconocible, o una fila tiene un número de teléfono insertado?
Esta verificación toma 90 segundos para una hoja de cálculo de 200 filas. Si encuentras un desplazamiento de columna, probablemente has encontrado un sesgo que afecta a todos los documentos de ese formato de origen: corrige el mapeo de columnas y vuelve a extraer en lugar de corregir filas una por una.
Verificación 2: ¿Coinciden filas y archivos? ¿Perdimos algún documento?
Nada desacredita más rápido un lote de extracción que un documento faltante. Enviaste 12 facturas a contabilidad pero solo llegaron 11 filas a su sistema — el proveedor número 12 envía un recordatorio de pago atrasado y pierdes 40 minutos rastreando qué pasó.
Qué hacer: Tres comprobaciones rápidas de conteo de filas:
- Archivos subidos vs filas en la hoja: Si subiste 47 archivos y la hoja tiene 44 filas de datos (más un encabezado), tres documentos no generaron salida. El registro de estado de la herramienta de extracción te indicará cuáles fallaron y por qué — pero no puedes actuar sobre una falla que desconoces.
- Filas en blanco: Selecciona todo el rango de datos, ordena por cualquier columna de texto ascendente. Las filas en blanco aparecen al inicio. Una fila completamente en blanco suele significar que el documento se procesó pero no coincidió ningún campo — vale la pena revisar por qué.
- Filas duplicadas: Ejecuta
=CONTAR.SI(A:A; A2)en una columna identificadora como Número de Factura. Un valor de 2+ significa que el mismo documento generó dos filas — ya sea una subida duplicada o un PDF de varias páginas que debió fusionarse en una sola fila.
Estas comprobaciones toman dos minutos en total. La discrepancia en el conteo de filas — archivos subidos menos filas producidas — es la verificación de mayor impacto que la mayoría omite porque asume que la herramienta lo manejó.
La verificación del conteo de filas es particularmente importante al usar extracción por lotes — el modo donde subes múltiples archivos a la vez y exportas una hoja combinada. Un solo archivo que falla silenciosamente en un lote de 50 es difícil de notar a menos que cuentes. En ImageToTable.ai, el panel de estado del lote muestra la finalización por archivo — verde para completado, rojo para fallido — así que la discrepancia en el conteo de filas es visible antes de exportar.
Verificación 3: Validación numérica — ¿Cuadran los números?
Los números son donde los errores de extracción causan daños financieros medibles. Una mala lectura decimal convierte una factura de $295.00 en un pasivo de $2,950.00 en tus registros. Un subtotal leído como total significa que apruebas un pago con $400 de menos. Las relaciones aritméticas inherentes al documento son una capa de verificación gratuita — solo necesitas usarlas.
Qué hacer: Agrega tres columnas calculadas a tu hoja de salida:
| Verificación | Fórmula | Esperado |
|---|---|---|
| Subtotal + Impuesto vs Total | =REDONDEAR(Subtotal + Impuesto - Total; 2) | 0.00 |
| Suma de líneas vs Subtotal | =REDONDEAR(SUMA(ColLínea) - Subtotal; 2) | 0.00 |
| Cant. × Precio Unit. vs Total Línea | =REDONDEAR(Cant * PrecioUnit - TotalLínea; 2) | 0.00 |
Cualquier fila donde el resultado no sea cero necesita revisión. En la práctica, un resultado distinto de cero suele apuntar a una de tres cosas: un separador decimal mal leído (el problema coma-vs-punto en facturas europeas), la línea incorrecta leída como total (la herramienta tomó el subtotal de una sección y lo aplicó a toda la factura), o un campo de cantidad mal leído (50 en lugar de 15).
Si tu herramienta de extracción soporta columnas calculadas, puedes incorporar estas validaciones aritméticas en el propio paso de extracción — la herramienta realiza el cálculo al leer el documento y marca la fila antes de que llegue a tu hoja. Esto mueve la verificación de una fórmula posterior en Excel a una compuerta siempre activa.
Los archivos se procesan de forma segura y no se almacenan.
Verificación 4: Validación de Fechas — Formato Consistente, Rango Razonable
Una fecha como "01/03/2026" es correcta en formato DD/MM/AAAA. En formato MM/DD/AAAA, la misma cadena significa 3 de enero — tres meses antes. Ambas son fechas válidas. Solo una coincide con lo que realmente dice el documento. La ambigüedad de formato es el error de extracción de fechas más común, y pasa desapercibido en una inspección casual.
Qué hacer: Tres verificaciones de fecha, ordenadas por rapidez para detectar errores:
- Consistencia de formato: Selecciona la columna de fecha, aplica una regla de formato condicional que resalte cualquier celda donde el año no tenga cuatro dígitos, o el mes supere 12, o el día supere 31. Una fecha como "2026-15-03" (mes 15) es un error de extracción inequívoco — el modelo alucinó un valor de mes.
- Rango de fechas razonable: Agrega
=MIN(ColFecha)y=MAX(ColFecha)al inicio de la hoja. Si tu lote es de facturas de junio de 2026 y el mínimo es 2019-01-01 o el máximo es 2028-12-15, algo está mal. Las fechas fuera de rango suelen deberse a que la IA leyó una fecha diferente en el documento — la fecha de pago en lugar de la fecha de factura, o una fecha de una sección completamente distinta. - Fecha de factura vs. fecha de vencimiento: Si ambos campos se extrajeron, agrega una columna de verificación simple:
=FechaFactura <= FechaVencimiento. Una fecha de vencimiento anterior a la fecha de factura es casi siempre un error de extracción — la IA intercambió los dos campos.
La verificación de rango de fechas detecta los errores más costosos. Una sola factura extraída con 2027-03-15 en lugar de 2026-03-15 mueve 4.500 € de gasto al año fiscal incorrecto. Un auditor lo encuentra. Tú lo corriges. Pero la corrección te cuesta horas de explicación y declaraciones revisadas que se habrían evitado con una verificación de 30 segundos con =MAX().
Verificación 5: Auditoría de Campos Vacíos — ¿Qué Campos Llegaron Sin Datos?
No todos los espacios en blanco son errores; algunos documentos realmente carecen de ciertos campos. Pero debes saber qué campos se extrajeron al 0% en todo el lote, porque una columna universalmente vacía casi siempre es un problema de configuración, no una característica del documento.
Qué hacer: Por cada columna solicitada, cuenta cuántas filas tienen datos frente a cuántas están en blanco. En Excel, selecciona la columna y revisa la barra de estado para ver el conteo (las celdas en blanco se excluyen de CONTAR, así que el número mostrado es tu tasa de llenado). O usa =CONTARA(RangoCol) / CONTARA(A:A) para obtener un porcentaje.
Guía de interpretación para tasas de llenado:
- 90-100% lleno: Normal. Algunos documentos realmente carecen de ese campo — un proveedor que no imprime números de IVA, una factura sin referencia de orden de compra.
- 40-90% lleno: Vale la pena investigar. El campo existe en la mayoría de los documentos, pero el motor de extracción no lo encuentra de manera confiable. Verifica si el nombre de columna que especificaste coincide con la terminología del documento — "Proveedor" vs "Vendedor" vs "Vendedor" puede dar diferentes tasas de acierto según los formatos de documento.
- 0-40% lleno: Probablemente un problema de configuración. El nombre de columna puede ser demasiado específico ("Referencia de Aviso de Remesa" cuando los documentos usan "Ref. de Pago"), o el campo puede no ser candidato para extracción directa — requiere extracción inferida, donde la IA deduce el valor del contexto en lugar de leerlo de un campo etiquetado.
Una columna con 5% de llenado que esperabas al 95% significa una de dos cosas: los documentos no contienen lo que pediste (revisa una muestra), o la herramienta de extracción no está mapeando el nombre de columna al campo correcto del documento (ajusta el nombre de columna y vuelve a extraer). De cualquier forma, detectar esto antes de que los datos sigan su curso evita el correo de contabilidad tres días después preguntando "¿por qué esta columna está vacía?".
Verificación 6: Lógica entre campos — relaciones que deben cumplirse
La validación de un solo campo (Verificación 3 cubrió aritmética; Verificación 4 cubrió fechas) detecta errores individuales. La lógica entre campos detecta errores donde cada campo parece plausible por sí solo, pero la relación entre campos es imposible. Estos son los errores más difíciles de detectar a simple vista y los más fáciles de atrapar con una fórmula.
Qué hacer: Construye algunas reglas lógicas específicas para tu tipo de documento. Empieza con estas verificaciones transversales y añade las tuyas:
| Tipo de documento | Regla lógica | Esqueleto de fórmula |
|---|---|---|
| Factura | Fecha de factura ≤ Fecha de vencimiento | =InvoiceDate <= DueDate |
| Factura / OC | Total línea = Cant. × Precio unitario | =ROUND(Qty * UnitPrice - LineTotal, 2)=0 |
| Factura | Monto impuesto ≈ Tasa impuesto × Monto neto | =ABS(Tax / NetAmount - TaxRate) < 0.02 |
| Recibo / Gasto | Fecha dentro del período de reporte | =AND(Date >= PeriodStart, Date <= PeriodEnd) |
| Hoja de horas | Hora fin > Hora inicio | =EndTime > StartTime |
| Estado de cuenta | Saldo final = Saldo inicial + Σ transacciones | =ROUND(Opening + SUM(TxnRange) - Closing, 2)=0 |
Cada regla produce una columna VERDADERO/FALSO. Cualquier fila FALSA necesita revisión manual. En un lote de 200 documentos, normalmente marcarás 2-5 filas, es decir, 2-5 errores de extracción que puedes corregir antes de que se conviertan en errores contables. La alternativa es encontrarlos durante la conciliación de fin de mes, lo que cuesta mucho más tiempo y genera presión que lleva a correcciones apresuradas.
Para un análisis más profundo de cómo la aritmética entre campos detecta errores disfrazados, consulta nuestra guía sobre verificación de resultados de extracción con un marco de muestreo por capas, que cubre las cuatro verificaciones aritméticas en detalle con diagnóstico por tipo de error.
Verificación 7: Muestreo Aleatorio — Elige 3 Filas, Compara con el Original
Las verificaciones automatizadas (Verificaciones 1-6) detectan errores estructurales, aquellos que siguen patrones. Pero no todos los errores siguen patrones. Una lectura errónea puntual en un solo documento —la IA confundiendo dos partidas similares, o extrayendo 15 en lugar de 5 para una cantidad en un escaneo desvaído— pasa la mayoría de los filtros basados en fórmulas porque el número parece razonable y la aritmética cuadra. Una persona que revisa el documento fuente lo detecta en 20 segundos.
Qué hacer: Elige 3 filas al azar de la hoja de cálculo. Abre los documentos originales de esas filas lado a lado. Revisa cada campo. Busca cualquier cosa que no coincida: un dígito incorrecto, un campo intercambiado, una partida faltante. No se trata de cobertura. Se trata de detectar el tipo de error que el muestreo estadístico y la validación de fórmulas no ven.
¿Qué 3 filas? No elijas las tres primeras —suelen ser los documentos que revisaste al configurar la extracción. No elijas valores atípicos evidentes —las verificaciones automatizadas ya los señalaron. Usa =ALEATORIO.ENTRE(2, CONTARA(A:A)) tres veces y revisa esas filas. Si las tres están limpias, tienes una confianza razonable de que el lote está bien. Si una o más tienen errores, aumenta a 10 filas al azar. Si encuentras errores en 10, el lote necesita una revisión más exhaustiva.
El muestreo aleatorio descubre si las compuertas automatizadas realmente funcionan. Si la Verificación 3 dijo "todos los números cuadran" pero tu fila aleatoria tiene un subtotal que no coincide con la suma de las partidas, tu fórmula aritmética tiene un error —y lo acabas de detectar antes de procesar 200 filas con una verificación defectuosa.
Cuándo Re-Extraer vs. Cuándo Corregir Manualmente
Ejecutar esta lista de verificación revelará problemas. La siguiente decisión es si corregir celdas individuales o volver a ejecutar la extracción. La regla es simple: si el mismo error aparece en tres o más documentos, la causa raíz está en la configuración de extracción —corrige los nombres de columna, ajusta la especificación de formato y vuelve a extraer. Si el error está aislado en un solo documento con un formato inusual, corrige la celda y continúa.
Tres señales de que deberías re-extraer en lugar de corregir manualmente:
- El mismo campo está incorrecto en varias filas. Si 15 facturas tienen el total equivocado, la herramienta de extracción está leyendo consistentemente la línea incorrecta en ese formato de documento. Ajustar la especificación de columna —por ejemplo, cambiando de "Total" a "Gran Total"— corrige las 15 de una vez.
- Una columna está completamente vacía o sistemáticamente incorrecta. Esto es un desajuste de nombre de columna. El resultado no tiene sentido y la corrección manual implicaría escribir cada valor desde cero —lo que anula el propósito de usar la extracción.
- Las fechas tienen el formato incorrecto en todo el lote. Un ajuste en la especificación de formato (DD/MM/AAAA vs MM/DD/AAAA) corrige todo el lote en el momento de la extracción. Corregir fechas una por una después de la exportación es la actividad posterior a la extracción más tediosa y propensa a errores.
La corrección manual es la opción correcta cuando el error es específico de un documento: un escaneo manchado, una nota manuscrita que la IA leyó mal, un diseño no estándar de un proveedor en particular. Abre la fuente, lee el valor, escríbelo. Una edición, listo.
Integrando esta lista de verificación en tu flujo de trabajo
La primera vez que ejecutes esta lista, puede llevarte 20 minutos: estás creando las fórmulas, averiguando qué columna es cuál, aprendiendo dónde suelen agruparse los errores. Para el tercer lote, toma 12 minutos. Para el décimo, ya tienes una plantilla de hoja de cálculo con todas las fórmulas preconstruidas: pegas los datos extraídos, las comprobaciones se iluminan y dedicas 5 minutos a las filas marcadas y a las 3 verificaciones puntuales.
Piensa en esta lista como los ingenieros de control de calidad piensan en los conjuntos de pruebas: la inversión inicial está en construir las comprobaciones, y cada lote posterior te recompensa al detectar errores antes de que salgan de tu máquina. Una factura de $50,000 pagada con un total mal leído cuesta mucho más que los 12 minutos que lleva verificarla.
Preguntas frecuentes
¿Cuánto tiempo lleva realmente esta lista de 7 puntos?
Para un lote de 200 documentos de un formato conocido: 12 minutos. Desglose: Comprobaciones 1-2 (escaneo de columnas + conteo de filas) — 3 minutos. Comprobaciones 3-6 (fórmulas) — 5 minutos para configurar una vez, 2 minutos para revisar las filas marcadas. Comprobación 7 (verificaciones puntuales) — 5 minutos para abrir 3 documentos y comparar. Después del primer lote, la reutilización de la plantilla reduce el total a menos de 10 minutos.
¿Necesito ejecutar las 7 comprobaciones en cada lote?
Las comprobaciones 1-2 y 7 en cada lote: son los filtros de mayor rendimiento y menor esfuerzo. Las comprobaciones 3-6 las configuras una vez como plantillas de hoja de cálculo y se ejecutan automáticamente cuando pegas nuevos datos. La pregunta no es "debería ejecutarlas" — una vez construidas, se ejecutan solas. La pregunta es "reviso las filas marcadas", y la respuesta es siempre sí.
¿Y si la herramienta de extracción tiene validación incorporada? ¿Aún necesito esto?
La validación incorporada generalmente cubre comprobaciones a nivel de formato: "este valor no es una fecha válida" o "esta celda está vacía". Las comprobaciones de este artículo cubren la validación a nivel de relación que ninguna herramienta de extracción puede automatizar completamente sin conocer tu contexto empresarial. La herramienta no sabe que la Fecha de Factura debe ser anterior a la Fecha de Vencimiento para tus acuerdos con proveedores. No conoce las fechas de tu período de informe. Esas reglas viven en tu hoja de cálculo, y valen los cinco minutos que lleva construirlas.
¿Puedo omitir la verificación puntual si todas las automáticas pasan?
No. La verificación puntual (Check 7) no es redundante con las automáticas — cumple un propósito distinto. Las automáticas validan que los números sigan las reglas que codificaste. La puntual valida que las reglas codificadas sean las correctas y que funcionen adecuadamente. Una fórmula que devuelve cero en silencio por un error de referencia te da una falsa confianza. La verificación puntual mantiene honesta tu automatización.
¿Cuál es el error más común en las 7 verificaciones?
La desalineación de columnas (Check 1) es la más común y la más rápida de detectar. En aproximadamente uno de cada 15 lotes, al menos un campo termina en la columna equivocada — generalmente porque dos campos adyacentes tienen valores similares. Un monto y un monto de impuesto lado a lado, ambos numéricos, ambos en un rango plausible. Solo lo detectas leyendo la columna verticalmente y notando que los valores de "impuesto" en la columna de montos parecen sospechosamente el 15-20% de los montos reales.
La verificación es la brecha entre "usé la herramienta por primera vez" y "confío en el resultado". No se trata de dudar del motor de extracción — se trata de respetar las consecuencias posteriores si algo pasa sin revisar. Doce minutos por lote, siete verificaciones, confianza para cerrar el archivo y seguir adelante.
Ejecuta esta lista en tu próximo lote de documentos extraídos. Abre la hoja de cálculo, recorre las verificaciones 1 a 7 en orden y observa qué aparece. La primera vez que detectes un desplazamiento decimal antes de que se convierta en un error de pago, los 12 minutos se amortizan solos. Sube un lote y ejecuta tú mismo la lista de verificación.
Sin registro · Funciona con JPG, PNG y PDF