OpenAI lanza O3 y O4-mini: los modelos que por fin piensan con imágenes, voz y web

GPT

Desde hace meses, los usuarios de ChatGPT y la API de OpenAI han contado con dos grandes familias de modelos: los modelos GPT tradicionales, como GPT-4o, y los modelos razonadores, como O1, especializados en pensamiento complejo. Sin embargo, hasta ahora estos últimos no contaban con capacidades esenciales como la interpretación de imágenes o la navegación web. Eso cambia desde hoy.

Los nuevos modelos razonadores de OpenAI

OpenAI ha anunciado oficialmente O3 y O4-mini, dos modelos que fusionan lo mejor de ambos mundos: el razonamiento pausado y estratégico de los modelos O, con las herramientas más avanzadas hasta ahora exclusivas de los modelos GPT. Entre ellas:

  • Análisis e interpretación de imágenes.
  • Análisis de archivos.
  • Generación de imágenes.
  • Navegación web en tiempo real.
  • Investigación avanzada.
  • Modo de voz mejorado.

Razonamiento visual: ahora sí, “piensan” con imágenes

La clave está en cómo estos modelos procesan imágenes. No se limitan a describirlas: deciden cómo mirarlas. Pueden girarlas, ampliar detalles importantes o ignorar lo irrelevante para formular una respuesta mejor y más coherente dentro de su cadena de razonamiento. Es un paso más en la evolución de los asistentes inteligentes.

Un salto notable en codificación y tareas complejas

O3 y O4-mini no son los modelos ideales para redactar cuentos o responder trivialidades al instante. Donde brillan es en la codificación avanzada, análisis científico y planificación de procesos complejos que requieren varios pasos y decisiones secuenciales.

De hecho, en la exigente prueba SWE-bench, O3 alcanzó un 69,1% sin personalización —superando ampliamente al antiguo O1 y a competidores como Claude 3.7 Sonnet. O4-mini, optimizado para razonamiento rápido y económico, logró un 68,1%, destacando en matemáticas, codificación y análisis visual.

Una estrategia que cambia de rumbo

Curiosamente, en febrero Sam Altman había descartado lanzar O3 como modelo independiente. Sin embargo, OpenAI cambió de idea y hace apenas unas semanas confirmó su llegada. Hoy ya es una realidad. Además, en las próximas semanas llegará O3-pro, una versión aún más potente, disponible para los suscriptores del plan Pro.

Ya disponible para usuarios de ChatGPT

Desde hoy, los suscriptores de ChatGPT Plus, Pro y Team pueden empezar a utilizar O3 y O4-mini. Esto marca una nueva etapa para OpenAI, que sigue afianzando su liderazgo en modelos de IA multimodal y razonamiento avanzado.

Leave a Comment

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *