Conecta con nosotros

A Fondo

Probando DALL-E 2, la IA de moda que convierte palabras en imágenes

Publicado

el

dall-e 2

Seguro que en las últimas semanas has oído hablar de DALL-E 2, un proyecto de la compañía de inteligencia artificial OpenAI (participada entre otros por Elon Musk) que tras meses de pruebas a puerta cerrada, se abre a todo aquel que lo quiera utilizar, aun cuando se mantiene en fase beta.

Tras mucho ver y leer sobre DALL-E 2, una IA que, hay que recordar, es capaz de crear imágenes originales a partir de una descripción escrita, me he animado a probarla, a ver si es, como algunos aventuraban, la muerte anticipada de los creadores digitales. Lo único que puedo adelantar es que, ahora mismo, ni de lejos. Pero no deja de ser un avance de lo más curioso del que no me cabe ninguna duda que llega para cambiar las cosas, pero a futuro.

A saber: DALL-E 2 puede generar imágenes según lo que le describas, por lo que dicha descripción debe ser certera, pues cada cosa que indiques cuenta y será interpretada por la IA a su manera. Tiene miga la cosa, sí. Nada más entra en el sitio de DALL-E 2 verás cantidad de imágenes, todas han sido creadas por el servicio y todas rezuman el mismo estilo de surrealismo un tanto cutre, cuando no desagradable. Lo cierto es que hay de todo un poco, de ahí la importancia de la descripción de marras.

dall-e 2

En el mismo sitio de DALL-E 2 hay multitud de ejemplos de cómo configurar una imagen

En cuanto a sus opciones, además de la propia de describir la imagen que desees que DALL-E cree para ti, es posible realizar una edición sencilla del resultado, por ejemplo para borrar elementos de la imagen, para generar variaciones o para ampliar a base de bloques el frame original de 1024×1024 píxeles… Porque esa es otra: el tamaño no es modificable, al menos en este primera iteración. Poca cosa, aunque el editor también se encuentra en estado de desarrollo.

Por lo demás, DALL-E es un servicio gratuito, pero limitado: nada más registrarte te regalan 50 créditos, cada uno de los cuales sirve para generar una generación de imágenes, es decir, cuatro imágenes por una misma descripción; una vez consumidos esos créditos, se regalan 15 créditos al mes. Más allá de eso, se pueden adquirir créditos adicionales.

Ten en cuenta asimismo que para usar DALL-E deberás crear una cuenta en el servicio y verificar tu número de teléfono, requisito imprescindible.

dall-e 2

Esto es lo que me ha creado cuando le he pedido «una imagen de DALL-E 2 para muycomputer.com» (la imagen más presentable, al menos)

Otras limitaciones de DALL-E 2, estas de carácter «artístico», incluyen la recreación de personajes famosos reales, de escenas que impliquen violencia o sexo, temas ilegales o muy controvertidos y, muy curioso, caras, un aspecto que se suponía superado tras tiempo deformando los rostros para impedir –deepfakings en un principio- no se sabe bien qué, pero que sigue dando un repelús importante… con excepciones, como se verá más abajo.

Y poco más hay que contar acerca de DALL-E 2… o más bien al contrario: es muchísimo lo que se podría contar acerca de una tecnología que, no vamos a negarlo, tiene una fuerte dosis de innovación detrás de sí. Pero si te interesan más los pormenores de la misma, mejor sacia tu curiosidad directamente desde la fuente.

Te dejo con algunas de mis creaciones en DALL-E 2… o, más bien, con algunas de las creaciones que DALL-E 2 a ha hecho de mis peticiones. Para que te hagas una idea de qué es lo que puede lograr DALL-E 2 con unas pocas indicaciones (en elegir las palabras exactas, cual ingredientes de una receta, está el secreto de este invento).

Pero antes: aquí tienes el sitio web de DALL-E 2, donde puedes registrarte si te apetece para probarlo por ti mismo.

Ejemplos varios del ‘genio’ de DALL-E 2

A continuación, varias de las muchas peticiones que le he hecho a la IA de DALL-E 2 y mis impresiones de cada una de ellas… cuando lo crea conveniente. A todo esto, puede tardar unos 10-20 segundos en generar cada unos de los

DALL-E 2

He empezado por algo sencillo a mi parecer, lo primero que se me ha ocurrido… y ha salido esa moñiga. Tras utilizarlo más tiempo he aprendido que los temas con copyright son delicados y que, para haberse acercado a la imagen a lo que tenía en la mente, véase una imagen épica de batalla entre los dos personajes, en un buen escenario, tendría que haber sido mucho más específico.

DALL-E 2

Así que le he pedido algo más sencillo aún, pero menos específico al mismo tiempo como es «un paisaje de Hyrule» (ya que tenía a Zelda en mente). Y el resultado ha sido mejor… con peros. Así se ve una de esas imágenes a mayor resolución (recuerda: son 1024×1024 píxeles; salvo que te pongas a pegar trozos como si estuvieses montando un puzle, DALL-E 2 no te va a crear wallpapers increíbles):

DALL-E 2

Parece más un cuadro que una fotografía, pero da el pego.

DALL-E 2

Quería ver hasta dónde llegaba el tema del copyright con un personaje tan conocido como Harry Potter y… digamos que el resultado es igualmente decepcionante, aunque da la sensación de más tino. Por cierto, he probado a hacerlo en castellano y lo ha entendido a la perfección.

DALL-E 2

Como no hay dos sin tres, he terminado el repaso con la imagen que ves y, como siempre, cuanto más detalles la escena, más se acercará a lo que le pides; así que la doy por válida, a tenor de lo escueto de la descripción.

DALL-E 2

He intentado indagar un poco más el asunto del copyright con lo que pretendía que fuese la típica imagen de catálogo y… sí, la intención la ha pillado, pero del título nanay y, lo que es peor, me he topado por primera vez con el tema de las «caras del horror«…

DALL-E 2

Ni valle inquietante ni gaitas: es entre desagradable y espeluznante no lo que hace DALL-E 2 con las caras…

DALL-E 2

Así he vuelto con ello de manera más específica y ante el repetido horror, he vuelto a intentarlo de manera mucho más detallada…

DALL-E 2

Y, bueno, digamos que por lo menos esta vez DALL-E 2 no me ha devuelto monstruos. Sobre gustos ya… Y sí, es normal que pongan cota al pervertido de turno que intente hacerse la colección; lo que no entiendo es por qué genera esos rostros horribles por defecto.

DALL-E 2

He seguido con mis pesquisas pidiéndole cosas a la IA, a ver cómo afectaba al resultado ligeros cambios, por ejemplo con el estilo visual empleado.

DALL-E 2

Y, como ves, es todo un poco raro…

DALL-E 2

… Pero al mismo tiempo, tiene un pase. De nuevo, quizás tendría que haber especificado con el estilo…

DALL-E 2

Total, que he vuelto a temas más mundanos y de este siglo y, las cosas como son, con esas imágenes engañas a más de uno.

DALL-E 2

¿Y si además de dictarle en castellano le introduzco detalles más concretos? La verdad es que me han sorprendido estas imágenes, aunque, las cosas como son, cuando las revisas con minuciosidad, les ves las costuras y tienen un efecto similar al de las caras: un efecto de rechazo.

DALL-E 2

He ido un paso más allá con este tema y le he pedido algo de lo que puede encontrar un millón de fotos en Internet, pero lo que me ha devuelto parece justo es, uno devuelto. Ahí va la mejor parada de las cuatro…

DALL-E 2

No, no voy a entrar en el hecho de que eso no es una paella valenciana. Ni eso, ni lo que se ve en las otras imágenes. Pero es que si alguien encuentra eso apetitoso, me compadezco de él… porque parece una argamasa. O sea: o el arroz se ha pasado al punto de crear una papilla, o la imagen ha perdido tanta resolución que ha creado ese efecto. Sé lo que estás pensando: qué tontería es esa…; pero no, porque considerando que, efectivamente, DALL-E 2 es una herramienta hecha por y para la publicidad… A mí solo me produce asco.

Así que lo he intentado de nuevo, esta vez de forma mucho más específica.

DALL-E 2

Mucho mejor ¿cierto?Como se suele decir, el diablo está en los detalles y estas imágenes, al detalle…

DALL-E 2

¿Qué opinas? ¿Te lo comerías? Yo tal vez haya perdido la noción de la realidad a estas alturas, pero me sigue resultando poco auténtico, incluso cuando le pides que lo sea. Con este ejemplo, de hecho, he abandonado cualquier deseo «realista» para con DALL-E 2, aunque me faltaban un par de cosas por probar, antes de dar por terminada mi primera sesión con la IA.

DALL-E 2

La primera era pedirle una imagen en otro idioma al margen del inglés y el castellano y como llego a donde llego, lo he hecho en catalán. Entenderme me ha entendido, pero el resultado, de nuevo, ha sido un poco decepcionante. Digamos que, a falta de que le hagas una descripción diga de Tolkien de lo que quieres ver, DALL-E 2 tiene poca imaginación.

DALL-E 2

Por último, quería probar la creación de variantes a partir de una imagen externa, una característica de DALL-E 2 que ya avisan que puede generar controversia, habida cuenta de que en potencia puede servir para falsificar cualquier cosa, pero visto el resultado, yo tampoco me preocuparía tanto (aunque entre esta y la imagen de la playa de Barcelona hay un trecho que cuesta cubrir). Así, le he pedido una variante del Paseo por la playa de Joaquín Sorolla, uno de esos tipos de pintura que parecen hechos a brochazos, pero que si los miras con atención captas los detalles, la luz… y te das cuenta de que no…

DALL-E 2

Y lo que me ha devuelto DALL-E 2, con un psudoestilo a lo Sorolla, pero mucho más guarreado en todo, es…  más monstruos. Compáralo si quieres.

Iba a titular esta entrada algo así como «DALL-E 2, la inteligencia artificial que quería ser Sorolla, pero no le llegaba ni a la p…». Y lo he pensado mejor. Porque puede que DALL-E 2 no se acerque todavía a la maestría de pintores consagrados, que todavía no sea capaz de acercarse al saber hacer de un buen ilustrador, de un buen fotógrafo… o que casi todo lo que salga de sus servidores peque de los mismos errores, y es que si no buscas una imagen  con un punto de extravagancia y un estilo raruno, incluso cuando le indicas el estilo que quieres, no vas a obtener nada realmente consistente. Pero, como es obvio, el acento está en el todavía.

Dicho lo cual, esta es solo una primera entrega da mis aventuras con DALL-E 2. Cuando aprenda a sacarle el jugo puede que publique otra… o puede que no. Por si acaso, me voy a despedir con una imagen más con la que cerrar el círculo…

DALL-E 2

Enfocado en las nuevas tecnologías empresariales y de usuario final. Especializado en Linux y software de código abierto. Dirijo MuyLinux y escribo en MC, MCPRO y MuySeguridad, entre otros.

Lo más leído