La Extracción de Documentos Agéntica de ADE DPT-2 (Agentic Document Extraction) de LandingAI, presentada por la compañía el 30 de septiembre de 2025, marca un punto de inflexión en la gestión de datos no estructurados. De la mano del visionario Andrew Ng, esta herramienta va mucho más allá del simple Reconocimiento Óptico de Caracteres (OCR), proponiendo una Comprensión Inteligente de Documentos con contexto visual. En mis más de cinco años en el sector de la Inteligencia Artificial, he visto muchas soluciones, pero el enfoque agente de ADE DPT-2 promete convertir décadas de archivos empresariales en datos compatibles con modelos de lenguaje grande (LLM) en horas, no en semanas. Es la transición de un «parche» de procesamiento a una capacidad central de la inteligencia documental.
Un Salto en la Inteligencia Documental con Agentic Document Extraction
El verdadero desafío en el ámbito empresarial reside en que los documentos críticos (contratos, informes médicos, pólizas de seguros) a menudo se esconden en diseños poco estándar: escaneados en ángulo, con sellos y firmas manuscritas, tablas torcidas o casillas marcadas a mano. Aquí es donde los LLM genéricos, aunque potentes para tareas generales, tienden a fallar. ADE DPT-2 aborda esto con lo que LandingAI denomina razonamiento agente.
La Clave: Razonamiento Agente y División de Tareas
En lugar de intentar «agrandar» un modelo universal, el sistema de LandingAI divide el documento en subpartes, razona sobre cada bloque de manera individual y luego reconstruye el contexto completo. Este flujo agentístico imita la forma en que un humano altamente capacitado revisaría un expediente:
- Localizar la tabla de valores.
- Interpretar las celdas fusionadas que desordenan el formato.
- Verificar un sello o una firma.
- Rastrear un número de póliza o un valor financiero hasta su origen en otra página. Este proceso garantiza un seguimiento de cada valor trazable y justificable, crucial para el cumplimiento normativo y las auditorías reales.

Por Qué ADE DPT-2 es Fundamental para la Empresa Moderna
La precisión no es opcional en sectores como finanzas, salud y seguros. La incapacidad de extraer datos de forma precisa y rápida de documentos poco estándar provoca errores costosos y demoras críticas, desde retrasos en la aprobación de préstamos hasta riesgos en el diagnóstico. Según Dan Maloney, CEO de LandingAI, la inteligencia documental ya no es un extra, sino una capacidad central que se ha potenciado gracias al salto en el razonamiento agente.
Capacidad sin Precedentes en Documentos ‘Reales’
Lo que distingue a Agentic Document Extraction de otras soluciones es su robustez ante la complejidad visual:
- Interpretación de Tablas sin Cuadrículas: Extrae datos con precisión incluso de tablas que carecen de las líneas de separación estándar.
- Reconstrucción de Celdas Fusionadas: Mantiene el contexto de las celdas que se han unido en el diseño original.
- Detección de Elementos No Textuales: Reconoce logotipos, sellos pequeños, firmas manuscritas, códigos de barras, códigos QR y credenciales, vinculándolos al dato correcto.
- Detección Precisa de Diseño: Es clave para identificar, por ejemplo, un sello regulatorio dentro de una tabla de impuestos y enlazarlo correctamente al cumplimiento.
- Descarte de Ruido: Elimina rótulos publicitarios o datos irrelevantes de páginas que mezclan información de valor con spam visual.
Aplicaciones de Impacto: Ahorro y Rigor Regulatorio
La infraestructura de ADE DPT-2 está diseñada para escalar horizontalmente con GPU, soportando picos de millones de páginas al día sin degradar el rendimiento. Los usuarios iniciales reportan ahorros de tiempo de hasta un 90 % en la búsqueda y validación de información, una cifra que justifica cualquier inversión en tecnología.
Impacto Sectorial Directo
- Finanzas y Banca: Acelera la aprobación de préstamos al extraer y validar contratos automáticamente de forma trazable, reduciendo el riesgo regulatorio.
- Salud: Captura con precisión formularios de pacientes e informes de laboratorio, lidiando con la sensibilidad de escaneos irregulares y manuscritos.
- Seguros: Procesa reclamaciones manuscritas o selladas, manteniendo el contexto sin «inventar» campos, garantizando un rigor en la tramitación.
Para un ejecutivo, esto se traduce en ciclos de negocio más rápidos, menos riesgos y mayor rigor en el cumplimiento normativo.
Arquitectura y Visión de Futuro
LandingAI ha decidido especializarse y enfocarse en soluciones explicables de inteligencia documental, a diferencia de gigantes como OpenAI, Microsoft o Google que impulsan modelos más universales. Andrew Ng, Executive Chairman de LandingAI, insiste en que esta herramienta no compite con los LLM o los sistemas RAG (Retrieval-Augmented Generation), sino que convive y suma.
Cómo Funciona la Extracción Agéntica
El sistema utiliza flujos agentísticos que se basan en la arquitectura DPT-2 (Document Pre-trained Transformer versión 2). Este modelo no solo ve, sino que «entiende» el diseño:
- Comprensión de Diseño: El agente primero determina el layout o la estructura visual del documento.
- Razonamiento por Bloques: Luego, razona sobre cada bloque de información, detectando la relación entre, por ejemplo, un sello y la celda de una tabla que valida un impuesto.
Las APIs facilitan la integración en el flujo de trabajo existente:
- La API Parse convierte documentos complejos en markdown estructurado y fragmentos semánticos, facilitando consultas rápidas.
- La API Extract extrae solo los campos específicos que exige una auditoría o un proceso interno, manteniendo la fidelidad visual.
ADE DPT-2 se conecta con plataformas de registro clave como ServiceNow, Snowflake y SAP, permitiendo gestionar los datos extraídos sin necesidad de mover información manualmente.
La Era de la Inteligencia Agente
Andrew Ng recuerda que la inteligencia documental ha mejorado drásticamente en los últimos dos años, elevando el valor de la extracción automatizada frente a la tarea manual. ADE DPT-2 se coloca como un catalizador para la Inteligencia Agente, en la que los modelos no solo procesan datos, sino que los entienden y justifican el resultado. Esto es crucial para la toma de decisiones informadas, la escalabilidad y, sobre todo, la confianza en los datos. Estamos entrando en una etapa donde la especialización y la trazabilidad definen el liderazgo en la IA corporativa.
Si quieres usar Agentic Document Estraction, simplemente tienes que acceder al siguiente enlace: AGENTIC DOCUMENT ESTRACTION