
Desde hace meses, los usuarios de ChatGPT y la API de OpenAI han contado con dos grandes familias de modelos: los modelos GPT tradicionales, como GPT-4o, y los modelos razonadores, como O1, especializados en pensamiento complejo. Sin embargo, hasta ahora estos últimos no contaban con capacidades esenciales como la interpretación de imágenes o la navegación web. Eso cambia desde hoy.
Los nuevos modelos razonadores de OpenAI
OpenAI ha anunciado oficialmente O3 y O4-mini, dos modelos que fusionan lo mejor de ambos mundos: el razonamiento pausado y estratégico de los modelos O, con las herramientas más avanzadas hasta ahora exclusivas de los modelos GPT. Entre ellas:
- Análisis e interpretación de imágenes.
- Análisis de archivos.
- Generación de imágenes.
- Navegación web en tiempo real.
- Investigación avanzada.
- Modo de voz mejorado.
Razonamiento visual: ahora sí, “piensan” con imágenes
La clave está en cómo estos modelos procesan imágenes. No se limitan a describirlas: deciden cómo mirarlas. Pueden girarlas, ampliar detalles importantes o ignorar lo irrelevante para formular una respuesta mejor y más coherente dentro de su cadena de razonamiento. Es un paso más en la evolución de los asistentes inteligentes.
Un salto notable en codificación y tareas complejas
O3 y O4-mini no son los modelos ideales para redactar cuentos o responder trivialidades al instante. Donde brillan es en la codificación avanzada, análisis científico y planificación de procesos complejos que requieren varios pasos y decisiones secuenciales.
De hecho, en la exigente prueba SWE-bench, O3 alcanzó un 69,1% sin personalización —superando ampliamente al antiguo O1 y a competidores como Claude 3.7 Sonnet. O4-mini, optimizado para razonamiento rápido y económico, logró un 68,1%, destacando en matemáticas, codificación y análisis visual.
Una estrategia que cambia de rumbo
Curiosamente, en febrero Sam Altman había descartado lanzar O3 como modelo independiente. Sin embargo, OpenAI cambió de idea y hace apenas unas semanas confirmó su llegada. Hoy ya es una realidad. Además, en las próximas semanas llegará O3-pro, una versión aún más potente, disponible para los suscriptores del plan Pro.
Ya disponible para usuarios de ChatGPT
Desde hoy, los suscriptores de ChatGPT Plus, Pro y Team pueden empezar a utilizar O3 y O4-mini. Esto marca una nueva etapa para OpenAI, que sigue afianzando su liderazgo en modelos de IA multimodal y razonamiento avanzado.