Una de las grandes búsquedas que están haciendo algunas compañías tecnológicas vinculadas a la inteligencia artificial es lograr que estos modelos puedan razonar como lo hacemos los humanos. Si bien eso no sucedió, OpenAI presentó sus nuevas tecnologías que pueden 'simular el razonamiento'.
- Qué pasó. OpenAI presentó lo que llaman "cadena privada de razonamiento", una técnica que lo que hace es pausar el resultado que dio en una primera instancia un modelo de inteligencia artificial para que sea examinado por otro, ver si puede ser mejorado y recién en ese momento devolvérselo al usuario. A esto es lo que llaman "razonamiento simulado".
- Pruebas. Desde OpenAI, explicaron que el modelo o3 obtuvo una puntuación récord en el test ARC-AGI, un benchmark de razonamiento visual que no había sido superado desde su creación en 2019. Además, en pruebas de bajo consumo, obtuvo resultados exitosos en un 75.7% mientras que en pruebas de alto consumo fue de 87.5%, comparable al rendimiento humano, que tiene un umbral del 85%.
- Qué dijeron. "Cuando veo estos resultados, necesito cambiar mi visión del mundo sobre lo que la IA puede hacer y de lo que es capaz", comentó el presidente de la Fundación del Premio ARC.
- Hay más. Si bien son los que están más avanzados presentando características que otros todavía no alcanzaron, no son los únicos que están trabajando en este tipo de modelos que pueden "simular el razonamiento". Google, Alibaba o DeepSeek son otros grandes jugadores.