Muchos de nosotros hemos oído el nombre de DALL-E, pero puede que no sepamos lo que es. En pocas palabras, es un modelo generativo de IA que puede crear imágenes que nunca han existido antes, todo lo que tenemos que hacer es decirle lo que queremos crear.
Cuando salió la siguiente versión, llamada DALL-E 2, se hizo famosa. Las imágenes que podía producir eran de tan alta calidad y tan bien generadas que era difícil decir que habían sido creadas por una máquina.
Esto es lo que debes saber sobre DALL-E y su funcionamiento.
¿Qué es DALL-E?
DALL-E es un modelo de IA generativa desarrollado por Open AI que puede generar imágenes y obras de arte a partir de texto. En otras palabras, podemos escribir una frase describiendo exactamente lo que queremos ver y DALL-E se encargará de crear esa imagen por nosotros en cuestión de segundos.
DALL-E fue lanzado por primera vez en enero de 2021 y desde entonces ha sido mejorado significativamente en su segunda versión llamada DALL-E 2. Fue uno de los pocos generadores de arte AI que se hizo extremadamente popular por su capacidad para crear bellas imágenes y arte desde cero.
Como sólo necesitas escribir unas pocas palabras descriptivas para generar una imagen, ha atraído a muchos no artistas que encuentran esta herramienta increíblemente divertida y fácil de usar.
Por ejemplo, éste es el resultado de la consulta “Un cuadro estilo Van Gogh de un jugador de fútbol americano“.
Las imágenes producidas por DALL-E son tan convincentes que fácilmente se confunden con obras de arte realizadas por un ser humano. Además de su capacidad para representar objetos y paisajes del mundo que nos rodea, puede representar estas imágenes en un estilo específico, como el arte digital, la acuarela o el impresionismo.
Nota: DALL-E toma su nombre del artista Salvador Dalí y de un robot llamado WALL-E de una película de animación de Pixar. Sin duda, el nombre DALL-E nos da una idea de cómo la empresa pretendía combinar el arte y la tecnología de IA.
¿Cómo Funciona DALL-E?
DALL-E se basa en diversas tecnologías. Pero sin entrar en complejos detalles matemáticos, empecemos explicando cómo se entrenó a DALL-E con millones de imágenes de Internet.
Las imágenes utilizadas para el entrenamiento proceden de conjuntos de datos que contienen un gran número de imágenes con subtítulos. Con datos suficientes, el modelo de IA puede aprender a reconocer qué es un objeto y qué aspecto tiene en una imagen.
No se ha revelado el conjunto de datos utilizado para entrenar a DALL-E, pero siempre podemos saber si nuestras imágenes han entrenado a un modelo de IA y descartarlo.
DALL-E también se construyó utilizando un modelo de lenguaje llamado GPT-3, o Generative Pre-trained Transformer. Se popularizó ampliamente cuando Open AI lanzó ChatGPT, un chatbot de IA con el que podemos conversar fácilmente en lenguaje humano natural. Esta tecnología tiende un puente entre el texto y la imagen y permite transformar las palabras que tecleamos en una imagen en la pantalla compuesta de píxeles.
Otro elemento clave de DALL-E es el uso de un modelo de difusión. Este modelo toma una imagen ruidosa -piensa en una imagen muy pixelada que no es reconocible– y trabaja hacia atrás para producir una imagen clara que coincida con la descripción textual que has introducido.
¿Qué se Puede Hacer con DALL-E?
La gente utiliza DALL-E para todo tipo de cosas. Por ejemplo, podemos probar el arte de la IA, utilizarlo para remezclar una obra de arte famosa o tomar una obra de arte original y ampliarla utilizando las funciones de edición de DALL-E.
Outpainting es una función de DALL-E que nos permite crear obras aún mayores adjuntando paneles de imágenes recién generados a una obra de arte existente.
Para Concluir…
DALL-E es una herramienta de IA fácilmente accesible que podemos utilizar para hacer arte o generar imágenes, ninguna de las cuales había existido antes. Utiliza los increíbles avances del aprendizaje automático, incluidos los modelos GPT-3 y de difusión. Los conocimientos de DALL-E sobre el mundo humano, incluida la historia del arte, proceden de millones de imágenes probablemente recopiladas en Internet.
Combinando varias tecnologías nuevas de IA generativa, podemos dar vida a nuestras ideas utilizando sólo palabras para pintar un cuadro.