Taktile: ya están aquí los modelos de lenguaje grande (LLM) tabulares, que ofrecen avances revolucionarios para los equipos de gestión de riesgos

Los avances en el aprendizaje profundo han impulsado innovaciones en casi todos los sectores, desde la movilidad (Waymo) y la biología (AlphaFold) hasta la música (Suno.ai). Sin embargo, a pesar del éxito del aprendizaje profundo en tareas altamente complejas, como los autos autónomos, las aplicaciones relacionadas con el riesgo han brillado por su ausencia en esta revolución. Pero esto está a punto de cambiar.

Una de las razones principales por las que los equipos de gestión de riesgos aún no han integrado las redes neuronales profundas en sus herramientas es su dificultad histórica con los datos tabulares. Los bancos, las empresas de tecnología financiera y las compañías de seguros cuentan con una gran cantidad de datos tabulares y los utilizan a diario para prevenir el fraude, detectar el lavado de dinero y determinar el riesgo crediticio. Y cuando se trata de desarrollar modelos de predicción de alta precisión para esos casos de uso, la familia de modelos de árboles potenciados por gradientes ha reinado sin rival.

El «momento ChatGPT» de los datos tabulares

En un lanzamiento que los expertos del sector han bautizado como el «momento ChatGPT» de los datos tabulares, Prior Labs presentó un modelo revolucionario: TabPFN. Este modelo supera ampliamente a los métodos existentes en conjuntos de datos tabulares en una amplia gama de tareas relacionadas con este tipo de datos, un hallazgo tan significativo que fue publicado recientemente en Nature.

Dada la amplia gama de aplicaciones de alto valor en el sector de los servicios financieros, nos entusiasma asociarnos con Prior Labs para brindar a los equipos de riesgo, fraude y cumplimiento normativo acceso a TabPFN.

Puntos clave

Prior Labs ha lanzado un modelo revolucionario, TabPFN, que supera ampliamente a los métodos existentes en conjuntos de datos tabulares en una amplia gama de tareas relacionadas con tablas.
Este modelo representa lo último en tecnología para entornos con pocos datos, y los equipos no necesitan un reentrenamiento complejo ni una infraestructura de MLOps.
Nos hemos asociado con Prior Labs para que TabPFN esté disponible en la plataforma Taktile, con el fin de facilitar su uso en aplicaciones de gestión de riesgos y optimización de decisiones.
El modelo ya está demostrando su utilidad en múltiples aplicaciones relacionadas con el riesgo, como los controles de fraude y la detección de anomalías en el riesgo crediticio.

Cómo funciona TabPFN

A diferencia de intentos anteriores por hacer que las redes neuronales profundas resulten útiles en entornos tabulares, este modelo está preentrenado. De manera similar a cómo los modelos de lenguaje grandes (LLM) modernos se preentrenan con un amplio corpus de datos de texto —que incluye la mayor parte de la información pública de Internet—, TabPFN se ha preentrenado con una amplia variedad de conjuntos de datos sintéticos, lo cual constituye una innovación clave del modelo.

Cuando realizas una predicción con TabPFN, le proporcionas una cantidad de filas etiquetadas de tus datos, además de las filas sin etiquetar. A continuación, el sistema completa las filas sin etiquetar con predicciones, de manera similar a como un modelo de lenguaje grande (LLM) utiliza los ejemplos de una solicitud para ayudarte con una consulta.

Fuente: Nature.com

Cuando lo escuchas por primera vez, puede parecer increíble que no haya un entrenamiento del modelo en el sentido tradicional del término. Los parámetros (pesos) del modelo permanecen fijos durante todo el proceso. En cambio, el modelo se basa en la flexibilidad y el poder de la arquitectura del transformador para aprender los patrones de tus datos mientras realiza la predicción. El hecho de que esto funcione tan bien también fue una sorpresa en los inicios del modelado del lenguaje.

El valor de TabPFN para los profesionales del riesgo

Dado que el modelo no se entrena para cada nuevo caso de uso y se basa en gran medida en sus conocimientos previos del entrenamiento previo, existen algunas ventajas clave para los profesionales del sector de servicios financieros:

Los expertos en la materia ahora pueden crear predicciones de modelos competitivas sin necesidad de contar con años de experiencia en ciencia de datos; esto se traduce en equipos más pequeños, más ágiles y con mayor autonomía.
El modelo funciona bien en entornos con pocos datos, lo cual resulta especialmente interesante para aplicaciones relacionadas con el fraude, el crédito y la lucha contra el lavado de dinero, ya que muchas empresas cuentan con relativamente pocos verdaderos positivos.
Los equipos no necesitan una infraestructura compleja de reentrenamiento y MLOps; al no haber reentrenamiento, se puede minimizar la carga administrativa derivada de la validación, las pruebas y la aprobación de los modelos.

TabPFN también incluye valiosas funciones adicionales que suelen ser una fuente de dificultades en el aprendizaje automático:

El modelo devuelve, por supuesto, distribuciones para sus resultados, que puedes utilizar en las decisiones posteriores.
El modelo maneja de forma nativa los valores faltantes y los valores atípicos, por lo que no es necesario que te preocupes por la imputación ni por otras estrategias para adaptar los datos al formato que espera tu modelo.
El modelo puede ofrecer explicaciones sobre sus predicciones (utilizando los llamados «valores de Shapley»), lo que mitiga las preocupaciones en torno a la IA de «caja negra».

“Estamos muy entusiasmados con la capacidad de TabPFN para transformar la forma en que los equipos trabajan con el aprendizaje profundo para desarrollar y optimizar productos financieros. Los casos de uso que estamos viendo con Taktile son, en realidad, solo el comienzo de lo que se puede lograr.”
Frank Hutter, cofundador de Prior Labs

Aplicaciones prácticas de TabPFN en casos de uso relacionados con el riesgo

1. Verificaciones de fraude

Dado que el modelo ofrece un buen desempeño en entornos con pocos datos, creemos que la aplicación inmediata más interesante son los controles de fraude. Hemos evaluado el desempeño del modelo en un conjunto de datos anónimo y real sobre fraudes en la apertura de cuentas y lo hemos comparado con un enfoque estándar de árboles potenciados. Cuanto más dispersos son los datos, mayor es el rendimiento superior del modelo frente al enfoque clásico de aprendizaje automático. Observe cómo el modelo funciona sorprendentemente bien cuando apenas cuenta con datos de entrenamiento: este es el poder del preentrenamiento en acción.

Ejemplo: Detección de fraudes al abrir una cuenta

2. Detección de anomalías en el riesgo crediticio

Otra aplicación que nos apasiona es la detección de anomalías. El modelo ocupa el primer lugar en entornos de series temporales, superando incluso a Chronos de Amazon, por lo que también se puede utilizar para pronosticar tasas de aprobación y métricas clave, como el número de solicitudes o la distribución de las calificaciones FICO de los solicitantes. Si las métricas observadas se desvían demasiado de esas distribuciones, puedes generar una alerta para que los analistas investiguen la anomalía.

Ejemplo: Detección de anomalías en las solicitudes diarias de préstamos

Estos son solo dos ejemplos de por qué nos entusiasma tanto TabPFN; creemos que hay innumerables casos de uso valiosos más.

Sigue siendo importante tener en cuenta las limitaciones. En la actualidad, el tiempo de predicción (latencia de inferencia) es relativamente alto y existen restricciones en cuanto al tamaño de los datos que se pueden procesar. Sin embargo, esperamos que ambas limitaciones se reduzcan rápidamente a lo largo de 2025.

¿Quieres saber cómo TabPFN podría aportar valor a tu caso de uso específico?

Contáctanos

Los modelos de lenguaje grandes (LLM) tabulares ya están aquí, y traen consigo avances revolucionarios para los equipos de riesgo

El «momento ChatGPT» de los datos tabulares

Puntos clave

Cómo funciona TabPFN

El valor de TabPFN para los profesionales del riesgo

Aplicaciones prácticas de TabPFN en casos de uso relacionados con el riesgo

1. Verificaciones de fraude

Ejemplo: Detección de fraudes al abrir una cuenta

2. Detección de anomalías en el riesgo crediticio

Ejemplo: Detección de anomalías en las solicitudes diarias de préstamos

¿Quieres saber cómo TabPFN podría aportar valor a tu caso de uso específico?

Lecturas adicionales recomendadas

Anthropic está avivando el debate sobre la IA en las instituciones financieras. Este es el siguiente paso que darán las instituciones con visión de futuro.

Capacitación en IA: Yuliya Kazakevich explica cómo activar las tres capas fundamentales de la IA en las decisiones de KYB

Cómo los equipos utilizan la solución Agentic AML de Taktile para reducir los falsos positivos y agilizar las investigaciones

Aplicaciones de la IA general en la gestión de riesgos: 10 ejemplos reales de empresas líderes del sector

Agentes de IA en la evaluación de crédito comercial: una guía para su implementación responsable

Los agentes de incorporación de Taktile: cómo los equipos están multiplicando por 10 su capacidad sin perder de vista los costos y el cumplimiento normativo

El «momento ChatGPT» de los datos tabulares

Puntos clave

Cómo funciona TabPFN

El valor de TabPFN para los profesionales del riesgo

Aplicaciones prácticas de TabPFN en casos de uso relacionados con el riesgo

1. Verificaciones de fraude

Ejemplo: Detección de fraudes al abrir una cuenta

2. Detección de anomalías en el riesgo crediticio

Ejemplo: Detección de anomalías en las solicitudes diarias de préstamos

¿Quieres saber cómo TabPFN podría aportar valor a tu caso de uso específico?

Lecturas adicionales recomendadas

Anthropic está avivando el debate sobre la IA en las instituciones financieras. Este es el siguiente paso que darán las instituciones con visión de futuro.

Capacitación en IA: Yuliya Kazakevich explica cómo activar las tres capas fundamentales de la IA en las decisiones de KYB

Cómo los equipos utilizan la solución Agentic AML de Taktile para reducir los falsos positivos y agilizar las investigaciones

Aplicaciones de la IA general en la gestión de riesgos: 10 ejemplos reales de empresas líderes del sector

Agentes de IA en la evaluación de crédito comercial: una guía para su implementación responsable

Los agentes de incorporación de Taktile: cómo los equipos están multiplicando por 10 su capacidad sin perder de vista los costos y el cumplimiento normativo

Descubre Taktile