VLM Powered OCR

Convierte informes de gastos en PDF a Excel — Extrae cada partida de recibos heterogéneos en una sola hoja de cálculo uniforme

Un informe de gastos combina varios recibos en un solo documento resumen — y cada recibo tiene su propio formato, convención de fecha y moneda. El ingreso manual implica transcribir cada recibo individualmente a una hoja de cálculo. Extrae cada partida — Fecha, Proveedor, Descripción, Categoría, Importe, Moneda, Método de pago — en 5–10 segundos por informe, sin importar los formatos de los recibos que contenga.

Enterprise-grade security · TLS 1.3 encrypted

PDF
Escaneado
XLSX/CSV
Multimoneda

Qué puedes extraer de un informe de gastos

Escribe los nombres de las columnas que necesitas — la IA encuentra estos valores en cada recibo del informe comprendiendo la semántica del documento, no coordenadas de píxeles. Los campos del encabezado se repiten en cada fila para facilitar el filtrado y la importación al ERP.

Encabezado del informe e información del empleado

Employee Name
Employee ID
Department
Report Period
Report ID
Submission Date
GL Code
Cost Center

Campos de línea (por recibo)

Date
Vendor / Merchant
Description
Category
Amount
Currency
Receipt Attached (Y/N)
Payment Method
Tax Amount
Tip / Gratuity

Esta no es una lista prescriptiva — escribe cualquier campo que contengan tus informes de gastos. La IA lee el documento para encontrar lo que pides.

Por qué extraer informes de gastos es más difícil de lo que crees

Un informe de gastos no es un solo documento, sino un contenedor que agrupa múltiples recibos, cada uno de un proveedor distinto con su propio formato, convención de fecha y moneda. Tanto las herramientas OCR basadas en plantillas como los flujos de copiado manual fallan ante esta heterogeneidad.

El Problema

01 Cada comprobante en el informe usa un formato diferente

Un solo informe de gastos puede contener un boleto electrónico de Delta Airlines (USD, fecha MM/DD/AAAA, desglose de tarifa + impuestos + equipaje), un recibo de Uber (USD, fecha DD/MM, tarifa + propina + incremento), un folio de Hilton (USD, tarifa nocturna × 2 noches + impuestos + gastos varios) y un recibo de Gotham Steakhouse (USD, subtotal + propina + total, categoría "Comidas y Entretenimiento"). Cada recibo imprime montos, fechas y categorías en su propio formato. El ingreso manual implica cambiar de contexto entre cuatro patrones visuales diferentes por cada informe — y un equipo de finanzas que procesa más de 50 informes al mes hace esto más de 200 veces.

02 Fechas, monedas y montos son inconsistentes entre comprobantes

El recibo de Delta usa "Oct 12, 2024", mientras que el de Uber usa "12/10/2024" y el folio del hotel imprime "2024-10-14". Si el empleado viajó al extranjero, un recibo puede estar en EUR o JPY mientras que el encabezado del informe muestra el monto convertido a USD. La transcripción manual obliga a quien ingresa los datos a estandarizar mentalmente cada fecha y conciliar cada conversión de moneda, introduciendo errores que se propagan a los cálculos de reembolso, pistas de auditoría y declaraciones fiscales. Como se discute en r/Accounting, los informes de gastos en múltiples monedas son una fuente recurrente de errores de conciliación durante el cierre de mes.

03 El ingreso manual mezcla datos del encabezado y de las líneas

Un informe de gastos tiene dos capas de datos: campos de encabezado (Nombre del Empleado, Departamento, Período del Informe, Código de Contabilidad, Reembolso Total) y campos de líneas (fecha, proveedor, monto y categoría de cada recibo). El ingreso manual normalmente te obliga a decidir: ¿creas una fila por recibo repitiendo los campos del encabezado, o una fila por informe distribuyendo los recibos en columnas? Ningún enfoque es limpio. Los sistemas ERP y contables esperan una estructura plana de líneas — cada gasto como una fila con los campos de encabezado identificadores — pero producir esto manualmente significa copiar Nombre del Empleado y Departamento en cada fila. Cuando procesas 50 informes con un promedio de 5 recibos cada uno, son 250 filas que requieren ingreso repetido de datos del encabezado.

Cómo lo resuelve la extracción de columnas personalizadas

01 La extracción semántica funciona con cualquier formato de recibo, sin configuración por proveedor

La Extracción de Columnas Personalizadas — el mecanismo central de ImageToTable.ai — te permite escribir los nombres de campo una sola vez: "Fecha", "Proveedor/Comercio", "Descripción", "Categoría", "Monto", "Moneda", "Método de Pago". La IA localiza cada valor entendiendo su significado, no su posición en la página. Un boleto electrónico de Delta, un recibo de Uber, un folio de Hilton y una cuenta de restaurante tienen fecha, nombre del proveedor y total — la IA los encuentra sin importar el diseño. La misma definición de columna funciona para todos los recibos en todos los informes, sin plantillas por proveedor ni configuración basada en coordenadas. Si el próximo mes un nuevo empleado presenta un recibo de Air France con un formato completamente diferente, las mismas columnas siguen funcionando.

02 Las fechas se estandarizan automáticamente; las monedas se capturan por recibo

Al añadir una columna "Fecha", la IA estandariza cada fecha — sin importar el formato de entrada — en un formato de salida uniforme (ej. AAAA-MM-DD). Al añadir una columna "Moneda", la IA captura la moneda original mostrada en cada recibo ("USD", "EUR", "JPY"), mientras que la columna "Monto" registra el valor convertido del encabezado del informe de gastos. Esto te proporciona dos datos críticos por recibo: la moneda original para fines de auditoría y el monto convertido para cálculos de reembolso. Para informes de gastos internacionales donde el empleado presenta recibos en múltiples monedas, esto elimina el trabajo manual de buscar tipos de cambio e ingresar dos valores por recibo.

03 Los campos de encabezado se repiten automáticamente en cada fila de detalle

Cuando defines tanto columnas de encabezado (Nombre del Empleado, Departamento, Período del Informe, Código GL) como columnas de detalle (Fecha, Proveedor, Monto, Categoría) en la misma lista de columnas, la IA extrae los valores del encabezado una vez y los coloca en cada fila de salida. El resultado es exactamente lo que tu ERP espera: una tabla plana donde cada fila representa un detalle de gasto, con todos los campos de identificación del encabezado presentes para filtrado, análisis de tabla dinámica e importación directa a SAP, Oracle, NetSuite, QuickBooks o cualquier plataforma contable. Para un informe con 5 recibos, obtienes 5 filas — cada una con el Nombre del Empleado, Departamento y Período del Informe ya completados. El procesamiento por lotes de 50 informes con 5 recibos cada uno produce 250 filas, todas correctamente asociadas con su empleado y departamento de origen, en un único archivo Excel consolidado.

De informe de gastos en PDF a Excel limpio: cómo funciona

Si procesa informes de gastos de empleados con regularidad — para reembolsos, cierres de mes o preparación de auditorías — así es el flujo de trabajo desde la carga hasta la salida verificada.

1

Cargue informes de gastos — uno o decenas, en cualquier formato

Arrastre informes de gastos en PDF de su sistema corporativo (Concur, Expensify, Zoho Expense, SAP, Workday) o informes en papel escaneados con recibos adjuntos. La herramienta acepta JPG, PNG, WebP y PDF, incluidos informes de varias páginas donde los recibos están incrustados como imágenes. Use el procesamiento por lotes para cargar todos los informes de un lote de cuentas por pagar mensual de una sola vez y consolidar los resultados en un archivo. Para recopilar informes de empleados que no usan su sistema interno, genere un Enlace de Recopilación: una URL compartible donde cualquiera puede cargar informes de gastos a su cola de procesamiento ingresando un código de verificación corto, sin necesidad de registro ni inicio de sesión por parte del que carga. Los archivos aparecen en la cola pendiente de su cuenta, listos para la extracción.

2

Escriba los nombres de las columnas que necesita, una vez

Ingrese los campos que desee: "Nombre del Empleado", "Departamento", "Período del Informe", "Código Contable", "Fecha", "Proveedor/Comercio", "Descripción", "Categoría", "Monto", "Moneda", "¿Recibo Adjunto? (S/N)", "Método de Pago". Combine campos de cabecera y de detalle en cualquier orden — la IA entiende qué valores pertenecen a cada nivel. Use una Columna Inferida como "Categoría (opciones: Viajes/Comidas/Alojamiento/Suministros de Oficina/Otros)" para que la IA clasifique cada gasto según el proveedor y la descripción que lee del recibo. Use una Columna Calculada como "Verificación de Moneda (Total del Informe en USD / Suma de Partidas Convertidas)" para verificar que el total del informe de gastos coincida con la suma de los recibos individuales durante la extracción. La misma configuración de columnas funciona para cada informe, de todos los empleados y departamentos.

3

Descargue el Excel consolidado — cada recibo es una fila

Cada partida de recibo se convierte en una fila en su archivo de salida. Un informe con 5 recibos produce 5 filas, cada una con Nombre del Empleado, Departamento, Período del Informe, Código Contable, Fecha, Proveedor, Monto, Categoría y todos los demás campos solicitados. Un lote de 30 informes con un promedio de 5 recibos cada uno produce ~150 filas, todas correctamente asociadas y listas para analizar. Exporte como XLSX, CSV o JSON. Para el procesamiento recurrente de gastos mensuales, guarde su configuración de columnas como plantilla después de iniciar sesión — reutilícela en cada lote sin tener que volver a escribir los nombres de los campos. La salida está estructurada para importación directa a SAP, Oracle, NetSuite, QuickBooks o su libro mayor general.

Cuándo Funciona Mejor — y Cuándo Revisar los Resultados

Cuándo funciona mejor

PDFs de sistemas corporativos (Concur, Expensify, SAP, Workday, Zoho Expense). Los informes generados desde plataformas de gestión de gastos se extraen con alta precisión. Los campos con formato de máquina — información del empleado, ID del informe, totales por línea, códigos de categoría — se asignan limpiamente a los nombres de tus columnas. Los campos de encabezado y los datos a nivel de recibo se capturan de forma fiable en una sola pasada.

Lotes de varios departamentos con diferentes plantillas de informes. Cada departamento puede usar una plantilla de informe de gastos diferente — Marketing usa Concur, Ingeniería usa Expensify, Ventas usa una impresión personalizada de Excel. La misma definición de columna extrae de todas ellas porque la IA lee semánticamente, no por coordenadas de plantilla.

Recibos con categorías comunes estándar (Viajes, Comidas, Alojamiento, Suministros de Oficina). Los nombres de proveedores y las descripciones contienen suficiente señal para que la IA infiera la categoría correcta — "Delta Airlines" se asigna a Viajes, "Gotham Steakhouse" se asigna a Comidas, "Staples" se asigna a Suministros de Oficina — incluso cuando el recibo en sí no tiene una etiqueta de categoría. Una Columna Inferida hace que esta clasificación sea automática durante la extracción.

Cuándo revisar los resultados

Recibos incrustados como imágenes de baja resolución dentro del PDF. Los informes donde los recibos se fotografiaron con un teléfono a baja resolución y se pegaron en un PDF pueden tener menor precisión en la extracción de detalles de líneas. Los campos de encabezado se extraen con normalidad. Para mejores resultados, escanee los recibos incrustados a 200+ dpi o súbalos como archivos de imagen separados.

Informes multidivisa con tipos de cambio personalizados o no estándar. Cuando un informe de gastos utiliza una tabla de tipos de cambio específica de la empresa (diferente a las tasas de mercado en la fecha de la transacción), la IA extrae el monto convertido tal como está impreso, pero no puede verificar de forma independiente el tipo de cambio aplicado. Verifique algunas filas con la tabla de su empresa antes de procesar por lotes un mes completo de gastos internacionales.

Informes de gastos con superposiciones complejas de firmas de aprobación sobre montos impresos. Los informes donde sellos de "APROBADO", múltiples contrafirmas o marcas de anotación cubren los montos financieros impresos pueden ocultar dígitos críticos. Verifique estas páginas antes de importar los valores extraídos a su sistema de cuentas por pagar.

Preguntas Frecuentes

¿Cómo maneja la IA los informes de gastos que combinan recibos de diferentes empresas, cada una con su propio formato de recibo?

Este es el problema central de fusión que generan los informes de gastos. Un informe de gastos consolida recibos de diferentes proveedores — Delta, Uber, Hilton, Gotham Steakhouse — cada uno imprime los montos en su propio formato, usa su propia convención de fecha (MM/DD, DD/MM, YYYY-MM-DD) y cotiza en su propia moneda. La IA lee el contenido de cada recibo de forma independiente, identifica los mismos campos semánticos (Fecha, Proveedor, Monto, Categoría) independientemente del diseño de cada recibo y extrae cada partida en columnas de Excel consistentes. La columna Fecha se estandariza a un solo formato. La columna Moneda captura la moneda original de cada recibo junto con el monto convertido del encabezado del informe de gastos. El resultado es una hoja de cálculo donde cada fila es una partida de gasto — limpia, consistente y lista para tu ERP o sistema contable.

¿Puedo extraer tanto los campos del encabezado del informe de gastos como las partidas individuales de los recibos en una sola pasada?

Sí. Define tus columnas para incluir tanto campos de nivel de encabezado (Nombre del Empleado, Departamento, Período del Informe, Código de Contabilidad, ID del Informe, Reembolso Total) como campos de partidas (Fecha, Proveedor/Comercio, Descripción, Categoría, Monto, Moneda, Recibo Adjunto, Método de Pago). La IA extrae los campos del encabezado una vez y los coloca en cada fila de la salida, mientras que cada partida de recibo ocupa su propia fila. Esto significa que Nombre del Empleado y Departamento se repiten en cada fila — ideal para tablas dinámicas, filtrado por empleado o importación a un ERP que espera registros de partidas aplanados.

¿Qué pasa si necesito clasificar gastos en categorías que no están impresas en el recibo?

Usa una Columna Inferida — una función que permite a la IA clasificar el contenido basándose en lo que lee del documento. Agrega una columna como "Categoría (opciones: Viajes/Comidas/Alojamiento/Suministros de Oficina/Transporte/Otros)" y la IA lee el nombre del proveedor, la descripción y el contexto de la partida de cada recibo para determinar la categoría correcta — incluso si el recibo no tiene un campo "Categoría". Esto elimina el paso manual de revisar cada recibo después de la extracción y asignar una categoría a mano. Para informes de gastos que necesitan asignarse a un plan de cuentas específico con códigos contables, usa dos columnas: "Categoría" como Columna Inferida y "Código de Contabilidad (mapeado desde Categoría)" como la columna de referencia que tu equipo financiero necesita para la importación a SAP u Oracle.

¿Puedo procesar por lote informes de gastos de varios empleados y departamentos a la vez?

Sí. Sube informes de gastos de cualquier número de empleados, de cualquier combinación de departamentos y plantillas, en un solo lote. Cada línea de recibo se convierte en una fila del archivo Excel de salida, con los identificadores de empleado y departamento completados en cada fila. Para un cierre de mes donde necesites procesar más de 50 informes de Marketing, Ingeniería, Ventas y Operaciones — cada uno usando un sistema de gestión de gastos diferente — un solo lote con una definición de columna los maneja todos. Para procesos mensuales recurrentes, guarda tu configuración de columnas como plantilla tras iniciar sesión — reutilízala en cada lote sin volver a escribir los nombres de los campos. Para recopilar informes de empleados que no usan tu sistema corporativo, genera un Enlace de Recogida: una URL compartible donde cualquiera puede subir informes de gastos a tu cola de procesamiento ingresando un breve código de verificación — sin necesidad de registro ni inicio de sesión por parte del que sube.

¿Qué pasa si los recibos son imágenes incrustadas dentro del PDF del informe de gastos en lugar de texto digital buscable?

La IA lee el documento visualmente — no depende de capas de texto buscable. Los recibos escaneados incrustados como imágenes dentro de un PDF de informe de gastos se leen igual que el texto digital: el VLM analiza el diseño y extrae valores comprendiendo qué significa cada elemento en contexto. Para mayor precisión en imágenes de recibos incrustados, asegúrate de que la resolución del escaneo sea de 200+ ppp. Si necesitas tanto los datos resumidos del informe de gastos como los datos detallados de cada recibo con alta fidelidad, procesa las imágenes de los recibos por separado para obtener el detalle de las líneas y combínalo con la extracción a nivel de encabezado del propio informe.

📮 contact email: [email protected]