La nueva cara de ChatGPT: Ahora también crea imágenes (¡Y lo hace bien!)

Por Guillermo Hernández Salgado

Cuando OpenAI lanzó ChatGPT en noviembre de 2022, muchos quedamos boquiabiertos con su capacidad para escribir textos, responder preguntas complejas y hasta generar código. Pero el tiempo no se detuvo, y la evolución fue inevitable. Luego vinieron mejoras como el uso de plugins, la navegación web, los modelos GPT-4 y ahora… ¡la generación de imágenes directamente desde el chat! 😲

Aunque DALL·E ya era una herramienta de OpenAI para crear imágenes, estaba algo separada del flujo conversacional. Hoy, gracias a la integración directa en ChatGPT (especialmente en la versión GPT-4 Turbo), los usuarios pueden generar imágenes sin salir del chat, con comandos simples y en tiempo real. ¡Una herramienta más para liberar tu creatividad con solo unas palabras! 🧙‍♂️✨

Imágenes con ChatGPT

📌 ¿Qué es esta nueva capacidad?

Es la integración del modelo de generación de imágenes DALL·E 3 dentro de ChatGPT (versión Plus y Enterprise). Permite crear imágenes a partir de texto, directamente desde la misma interfaz del chat, sin necesidad de cambiar de herramienta o app. Además, ahora incluye funciones de edición: puedes hacer clic sobre la imagen y pedir cambios como “hazlo de noche”, “ponle un sombrero”, o “haz que sonría”. 😄🎩🌙

  • Se pueden detallar el prompt
  • Se pueden incorporar elementos
  • Se puede definir el tipo de acabado (foto, realista, caricatura, infog
  • No requiere aprender instrucciones como Midjourneyrafía, etc)
  • Solo en la versión de pago

La función de generación de imágenes con DALL·E 3 dentro de ChatGPT solo está disponible para los usuarios de pago, es decir, para quienes están suscritos al plan ChatGPT Plus (USD $20/mes) o a versiones empresariales (como ChatGPT Team o Enterprise).

En resumen:

• 🆓 ChatGPT gratuito (modelo GPT-3.5) → ❌ No tiene acceso a DALL·E 3.

• 💰 ChatGPT Plus (modelo GPT-4 Turbo) → ✅ Sí incluye DALL·E 3, y también permite editar imágenes generadas (“inpainting”).

🎯 ¿Para qué sirve?

• Crear ilustraciones personalizadas para redes sociales, blogs o presentaciones.

• Generar material visual para proyectos escolares, creativos o de negocios.

• Probar ideas visuales de productos, personajes, escenarios.

• Diseñar storyboards, cómics o arte conceptual.

• Apoyar procesos educativos y explicaciones con imágenes didácticas.

• Hacer infografías – Una infografía es una imagen que explica algo usando dibujos, palabras, números y colores. Es como una mezcla de un cuento corto y una historieta, pero que sirve para aprender algo rápido y fácil.

¡Y todo esto sin saber dibujar! 🙌

🤖 Comparativa: ChatGPT vs Midjourney

CaracterísticaChatGPT (DALL·E 3)Midjourney v6
InterfazConversacionalDiscord
Facilidad de usoAlta (escribir texto)Media (comandos en Discord)
EdiciónClic y texto editableRequiere nuevo prompt
Nivel de detalleMuy bueno, pero menos artísticoMuy detallado y artístico
EstiloRealista o simple según el promptCinemático y creativo por defecto
AccesoDentro de ChatGPT PlusServidor de Discord (pago)

Ambos son potentes, pero ChatGPT gana en simplicidad y edición rápida, mientras Midjourney destaca por su estilo visual más artístico y complejo. 🧑‍🎨🖌️

🧪 Ejemplos de uso

• Un profesor de historia genera escenas del antiguo Egipto para una clase. 🏺

• Una emprendedora crea mockups de sus productos antes de lanzarlos. 🛍️

• Un escritor visualiza sus personajes antes de describirlos. 📚

• Un creador de contenido diseña thumbnails para YouTube. 📹

• Un presentador que hace infografías. 🖌️

¡Solo necesitas un poco de imaginación!

Ventajas

Rápido y simple: Solo escribe lo que quieres ver.

Edición sin volver a empezar: Puedes ajustar lo generado.

Todo en uno: No necesitas cambiar de plataforma.

Educativo y creativo: Ideal para estudiantes, docentes, diseñadores.

Desventajas

• Estilo menos variado que Midjourney o Stable Diffusion.

• Algunas imágenes pueden tener errores en manos, ojos, etc.

• Requiere suscripción a ChatGPT Plus ($20 USD/mes).

• No ofrece aún control total del estilo o resolución profesional.

Un Ejercicio

Ahora, haremos un ejercicio más interesante, tu tarea es hacer un anuncio que contenga lo siguiente:

1. Al conductor de noticias en México Eduardo Ruíz Healy

2. Al conductor de noticias en México guillermo Vázquez Handall

3. El anuncio aparte de mostrar estos 2 conductores sonrientes debe invitar a sintonizar el programa que se transmite de lunes a viernes de 4:00 PM a 5:00 PM horario de la CDMX en teleformula

Está mal, te voy a dar las fotos reales

Ahora hazlos en modo cómic y que salgan los comentarios de invitación a ver el programa

Agrega este micrófono a la imagen

Conclusiones

La capacidad de generar imágenes dentro de ChatGPT representa un paso más hacia una IA verdaderamente multimodal, donde texto e imagen conviven de forma fluida. Aunque no reemplaza a herramientas ultraespecializadas como Midjourney en términos artísticos, ofrece una experiencia accesible, rápida y poderosa para la mayoría de los usuarios.

¿Quieres visualizar tu idea, ilustrar un concepto o simplemente divertirte? ChatGPT con DALL·E 3 te da una nueva forma de expresarte. ¡El futuro del diseño está más cerca de tus dedos que nunca! 🚀🎨

Referencias

  • OpenAI. (2024). DALL·E in ChatGPT. https://openai.com/index/dall-e-3/
  • The Verge. (2023). ChatGPT now lets you edit AI-generated images. https://www.theverge.com
  • Midjourney Community. (2024). Midjourney v6 Launch Notes.
  • YouTube: Comparativa entre ChatGPT y Midjourney (Canal: Two Minute Papers)

También te puede gustar