Ni ChatGPT ni Gemini: la IA china que genera imágenes en segundos y al estilo Ghibli o Pixar, Qwen-VLo

🧠 Alibaba desafía a Occidente con su IA creativa

Mientras OpenAI y Google dominan los titulares con ChatGPT y Gemini, Alibaba acaba de presentar Qwen-VLo, una IA multimodal capaz de generar imágenes, audio, video y texto, con un enfoque único: la generación progresiva. Esta técnica muestra cómo la imagen se dibuja en tiempo real, de manera visual y paso a paso.

🎨 ¿Qué hace diferente a Qwen-VLo?

A diferencia de modelos como DALL·E, Midjourney o Stable Diffusion, que trabajan a partir de ruido aleatorio para formar imágenes, Qwen-VLo construye visualmente las ilustraciones como un dibujo real, comenzando por una base borrosa que se va perfeccionando en capas:

Contornos
Colores
Texturas
Detalles finos

👉 Puedes ver cómo la imagen toma forma en tiempo real, como si la IA estuviera dibujando frente a tus ojos.

✏️ Genera y edita imágenes con estilo Ghibli o Pixar

Una de sus funciones más llamativas es su capacidad para transformar cualquier imagen a un estilo artístico, como:

Ghibli (animación japonesa)
Pixar (3D animado)

Esto lo hace a través de comandos de texto en varios idiomas, incluyendo español. Solo basta con escribir algo como:

"Haz que esta foto parezca una escena de una película de Ghibli"

Y Qwen-VLo lo interpreta sin perder la estructura original de la imagen.

🧩 ¿Qué más puede hacer Qwen-VLo?

Alibaba está apostando fuerte por esta IA creativa. Entre sus principales capacidades, Qwen-VLo también permite:

🧑‍🎨 Editar imágenes existentes (cambiar estilo, color, fondo, añadir o quitar objetos)
🌍 Procesar múltiples idiomas (español, inglés, chino…)
🎯 Detectar y localizar objetos con precisión
🧠 Generar contenido multimodal (no solo imágenes, también audio, video y texto combinados)

🧪 ¿Está al nivel de ChatGPT o Imagen?

Por ahora, Qwen-VLo está en fase de vista previa, y sus resultados realistas todavía no alcanzan el nivel de los mejores modelos occidentales. Las imágenes pueden verse demasiado suavizadas o planas en estilo realista, aunque en estilo artístico (Ghibli/Pixar) ofrece una calidad destacable.

📌 Pero lo más prometedor es su enfoque transparente y editable, que da control total al usuario sobre lo que está creando.

🤔 ¿Dónde y cuándo puedo usar Qwen-VLo?

Actualmente, Alibaba no lo ha lanzado al público de forma global, pero se encuentra en etapa de pruebas internas. Se espera que en los próximos meses pueda probarse desde plataformas abiertas, especialmente en China y, posiblemente, con traducción al español desde el día uno.

🚀 Conclusión: ¿es Qwen-VLo el futuro de la IA creativa?

Qwen-VLo todavía tiene camino por recorrer, pero ha puesto a Alibaba en el mapa de la IA creativa. Su forma de generar imágenes paso a paso, la edición en tiempo real y el enfoque multilingüe pueden convertirse en el estándar de la siguiente generación de IAs visuales.

Habrá que ver cómo responden OpenAI, Google y Meta. Pero una cosa está clara: la guerra de las IAs visuales acaba de empezar… y China ya entró al juego.