En esta web hemos hablado a menudo de la Inteligencia Artificial y de sus usos prácticos. Hoy en día ChatGPT y otros generadores de texto similares son los que acaparan casi todos los titulares, pero la cosa no queda ahí, ya que los generadores de imágenes mediante IA también están causando toda una revolución en el panorama artístico y en la creación de contenido.
Si en 2022 asistíamos al nacimiento de este tipo de tecnologías, 2023 ha supuesto todo un boom tanto a nivel cualitativo como cuantitativo. Los generadores de imágenes ya no solo sirven para crear imágenes y pequeñas obras de arte a partir de texto, sino que también podemos usar este tipo de herramientas para expandir artificialmente los márgenes de una foto, o para eliminar objetos de una imagen de forma realmente sencilla.
Las mejores Inteligencias Artificiales para crear arte a partir de texto (o a partir de otras imágenes)
Las IAs que generan imágenes a partir de palabras requieren un poder de procesamiento bastante potente. Por este motivo, la mayoría de aplicaciones de este tipo suelen presentar ciertas limitaciones en sus correspondientes versiones gratuitas (ya sea en la resolución de las imágenes, o en el número de imágenes que podemos crear sin pasar por caja), siendo necesario contratar las versiones premium para aprovechar todo su potencial.
Por suerte, también existen generadores de imágenes que se pueden usar de forma gratuita con bastante margen de maniobra y resultados ciertamente impactantes. Después de varios meses probando este tipo de herramientas, a continuación hemos recogido 10 de las mejores IAs para crear arte a partir de texto en 2023.
Bing Image Creator
Este es el creador de imágenes de Bing, y a día de hoy es la mejor IA para generar imágenes a partir de texto de forma gratuita. Se trata de una herramienta basada en el modelo DALL-E 2 de OpenAI, y permite generar un número ilimitado de imágenes gratis con un tamaño estándar de 1024 x 1024 píxeles. Las primeras 400 imágenes se generan rápidamente gracias al modo turbo, mientras que para el resto (si es que necesitas generar tantas imágenes) se utilizan los servidores convencionales que son un poco más lentos.
A nivel creativo es uno de los generadores de imágenes más versátiles, con capacidad para trabajar con diferentes estilos artísticos y otorgando resultados de lo más satisfactorios siempre y cuando seamos lo más precisos posibles en nuestros enunciados o «prompts».
Midjourney
Midjourney es uno de los generadores de imágenes más prestigiosos dentro del sector gracias a la enorme calidad de sus creaciones. La IA de Midjourney está entrenada para generar imágenes oníricas, lo que hace que sea especialmente hábil a la hora de crear imágenes de ciencia-ficción y mundos de fantasía. También se maneja muy bien con las imágenes hiperrealistas, el arte digital y las ilustraciones con un alto nivel de detalle. Eso sí, en su versión gratuita solo podemos generar un máximo de 25 imágenes.
La aplicación tiene una gran pega a nivel operativo, y es que para usar Midjourney es necesario hacerlo a través de su servidor oficial de Discord. Por tanto no es tan intuitiva ni accesible como otras herramientas de la lista. En cualquier caso, Midjourney es uno de los grandes ejemplos a seguir y todo un referente dentro de una industria con posibilidades casi infinitas.
Leonardo.ai
La gran joya oculta dentro de los generadores de imágenes IA. Personalmente es una de mis favoritas, y permite crear imágenes tan detalladas y de tan buena calidad como Midjourney. Tiene un gran punto a su favor, y es que en su versión gratuita obtenemos 150 créditos que se van renovando diariamente, lo que significa que podemos generar decenas de imágenes cada día sin necesidad de suscribirnos a su versión premium.
La interfaz de Leonardo es la más versátil de todas, pudiendo ajustar detalles como la resolución y la relación de aspecto de la imagen, usar prompts negativos para detallas elementos que no queramos que aparezcan en la imagen final, y hasta aumentar el tamaño de nuestras creaciones, o empezar a trabajar a partid de imágenes existentes, entre otras funciones interesantes.
Pero lo mejor de todo es que cuenta con una docena de modelos de IA, cada uno de ellos entrenados específicamente para crear un tipo de imagen en concreto, como por ejemplo, retratos hiperrealistas, ilustraciones, imágenes creativas, diseño de personajes en 3D, anime, monstruos, pixel art y mucho más.
Adobe Firefly
El generador de imágenes de Adobe es uno de los más interesantes, ya que combina la potencia y la calidad de su IA con una interfaz fácil de usar y un set de funcionalidades realmente completo. De hecho, Adobe Firefly no solo sirve para generar imágenes a partir de texto, también podemos usarlo para borrar objetos o personas de una foto, añadir nuevos elementos a una imagen existente, crear efectos para fuentes tipográficas o modificar los colores de imágenes vectoriales en formato SVG.
En lo que respecta a la generación de imágenes a partir de texto, su interfaz incluye varias opciones preconfiguradas con las que podemos elegir detalles como la relación de aspecto (4:3, cuadrado, panorámico, etc.), el estilo artístico, y otros detalles como la iluminación, la composición o el tono de la imagen. Se espera que en un futuro Adobe Firefly sea de pago, pero en estos momentos todavía se encuentra en fase beta (aunque en un estado de desarrollo bastante avanzado), lo que significa que Adobe nos permite usar la aplicación de forma completamente gratuita. Muy recomendable.
DALL-E 2
Esta es la versión más avanzada de DALL-E hasta la fecha, y uno de los principales referentes en la creación de imágenes mediante IA. Desarrollado por OpenAI, y con una potente financiación por parte de Microsoft, DALL-E es el modelo base sobre el que está construido el generador de imágenes de Bing. Por tanto, a nivel creativo no hay mucha diferencia con la herramienta gratuita de Microsoft.
DALL-E 2 sin embargo solo se puede usar gratis de forma limitada (50 créditos iniciales + 15 créditos gratuitos al mes), siendo necesario comprar créditos extra para seguir usando la aplicación. La gran diferencia de DALL-E 2 respecto al generador de Bing es que también cuenta con un editor de imágenes que nos permite añadir o quitar elementos de una imagen existente, o ampliar los márgenes de las imágenes con contenido generado mediante IA.
NightCafe
NightCafe cuenta con una de las IAs más potentes para crear arte y destaca por contar con multitud de modelos de IA diferentes. NightCafe permite trabajar con DALL-E 2, Stable Diffusion, Stable Diffusion XL, VQGAN+CLIP y CLIP-Diffusion. Todo ello desde una misma aplicación web a través del navegador. Es muy fácil de usar: simplemente escribe una descripción de lo que quieres ver en pantalla y después elige un estilo artístico (óleo, synthwave, cyberpunk, juego 3D, surrealismo, etc.)
Pasados unos cuantos segundos la Inteligencia Artificial mostrará en pantalla la imagen creada con una resolución de unos 512×512 píxeles, aunque también hay otras resoluciones disponibles dependiendo del modelo de IA utilizado. En su versión gratuita permite realizar hasta 5 imágenes diarias, que podemos ir acumulando o alcanzar diferentes hitos para conseguir más créditos gratis. Si lo vas a usar con frecuencia necesitarás comprar créditos para poder sacarle provecho, aunque hay que admitir que es uno de los generadores de imágenes que más se actualiza y más nuevas funciones añade cada cierto tiempo.
Stable Diffusion GUI
A diferencia de la mayoría de «modelos» o algoritmos IA para generar imágenes, en el caso de Stable Diffusion nos encontramos ante un modelo de código abierto, lo que significa que lo podemos usar completamente gratis. Eso sí, esto también implica que tengamos que instalar la aplicación en nuestro PC y contar con una tarjeta gráfica bastante potente que sea capaz de soportar el pesado trabajo de procesar imágenes.
Muchas de las aplicaciones más populares de hoy en día, como Leonardo.ai o NightCafe utilizan modelos entrenados de Stable Diffusion, por lo que si tú también quieres probar la aplicación aquí te dejo un par de tutoriales para que puedas instalarlo en tu PC.
- Cómo instalar Stable Diffusion en un PC (con interfaz gráfica)
- Cómo instalar Stable Diffusion en un PC (sin interfaz gráfica)
Anonymizer
Esta herramienta permite crear imágenes realistas (pero artificiales) a partir de otras imágenes. La idea es que puedas proteger tu identidad online usando una fotografía de una persona que se parezca a ti, pero no seas realmente tú mismo.
El funcionamiento es muy sencillo: subimos un selfie y en cuestión de segundos obtendremos una veintena de imágenes de personas con rasgos similares generadas mediante inteligencia artificial.
DALL-E Mini
DALL-E Mini fue uno de los generadores de arte más populares de 2022, aunque actualmente ha sido claramente superado por otras alternativas mucho más potentes. Se trata de una versión gratuita y open-source de DALL-E, una inteligencia artificial que aprende leyendo las descripciones de otras imágenes que encuentra por internet.
El resultado quizá no sea tan apurado como otras máquinas, pero nos permite realizar todos los intentos que queramos. Un consejo: intenta ser lo más específico posible. A día de hoy los desarrolladores de DALL-E Mini han seguido trabajando en la generación de imágenes mediante IA y cuentan con una nueva herramienta llamada Craiyon, que es el sucesor de DALL-E Mini y permite generar hasta 9 imágenes por cada prompt o solicitud por parte del usuario.
AI Image Generator API (DeepAI)
Esta herramienta desarrollada por DeepAI funciona como una aplicación web, pero también podemos usarla como una API. Por lo general si le damos una buena descripción el resultado será bastante interesante, aunque no esperes imágenes fotorrealistas.
Otro aspecto positivo es que el tiempo de procesamiento suele ser corto, por lo que no tendrás que esperar mucho tiempo para ver las 7 imágenes generadas por el algoritmo.
Entrar en AI Image Generator API
Deep Dream Generator
Otra IA capaz de generar arte es Deep Dream, una herramienta desarrollada por Google que está resultando ser bastante popular. En lugar de escribir texto lo que tenemos que hacer es subir una imagen para que el algoritmo se ponga a funcionar y genere una nueva imagen basada en la original.
La aplicación utiliza diferentes estilos pictóricos, muchos de ellos hiperrealistas y de diferentes épocas y corrientes artísticas. La herramienta también nos permite elegir la categoría de la imagen, como por ejemplo “animales” o “paisajes”, lo que permite obtener mejores resultados.
Entrar en Deep Dream Generator
Starry AI
A diferencia de otras herramientas Starry AI también está disponible en formato app para Android e iOS. Si prefieres usar su versión web también podrás hacerlo, aunque hay que tener en cuenta que ofrece un número limitado de créditos en su versión gratuita.
La Inteligencia de Starry es bastante versátil, ya que dispone de varias opciones de configuración, como la posibilidad de elegir entre dos algoritmos, diferentes tamaños de imagen, número de iteraciones (cuantas más iteraciones mejores resultados) y modelo de imagen (realista o no).
Entrar en Starry AI (versión web)
BigSleep
Desarrollado originalmente por @advadnoun, BigSleep es un notebook con el que puedes crear imágenes realistas a través de una descripción o frase escrita. Se trata de una herramienta un poco más complicada, ya que su código está disponible a través de Github y necesitaremos una máquina donde poder correr el programa (tranquilo, si entras verás todos los detalles para utilizarlo desde el navegador).
La aplicación está programada en Python y utiliza una red neuronal para generar el arte, combinando el modelo CLIP de OpenAI y el generador de BigGAN. Cuantas más iteraciones realicemos mejores imágenes conseguiremos, pudiendo conseguir resoluciones de hasta 1024×1024 píxeles.
Entrar en BigSleep (proyecto Github)
Dream by WOMBO
Excelente generador de imágenes mediante IA, disponible en versión web y también en versión app para Android e iOS. Simplemente introduce un texto descriptivo para la imagen y elige un estilo entre los más de 20 que hay disponibles (realista, cómic, líneas, meme, Ghibli, arcano, Dalí, fantasía oscura, barroco, etc.)
Personalmente recomiendo usar la versión web para navegadores, ya que en la versión para móviles han introducido bastantes elementos de pago y su uso no es tan limpio ni agradable como era antaño. En la versión web, sin embargo, podemos generar imágenes y descargarlas sin anuncios ni suscripciones de por medio.
Entrar en Dream by WOMBO (versión web)
VQGAN+CLIP
Esta otra IA generadora de imágenes mediante texto funciona utilizando el mismo acercamiento descrito por @advanoun. VQGAN es un modelo de inteligencia artificial que se encarga de comprimir y descomprimir imágenes en base a determinados patrones. CLIP es otro modelo cuyo trabajo es el de relacionar información de texto con imágenes.
Una vez combinadas ambas herramientas conseguimos una imagen a medio camino entre lo abstracto y lo hiperrealista. Puedes probarlo siguiendo las indicaciones mencionadas en ESTE POST.
Entrar en VQGAN+CLIP (notebook colaborativo)
¡Nos leemos en el siguiente post!
Buenas,
He creado una interfaz para utilizar Stable diffusion en español. Se llama Generador De Imágenes.
Dejo el enlace por si os interesa:
(el enlace ya no está disponible)
Agradecería vuestro feedback!
Saludos
Gracias por el aporte Ignasi! Le voy a echar un vistazo:) Saludos