blurred_faces

El ejercicio consistía en crear cinco prompts en inglés relativos a imágenes. Por cada prompt, debíamos generar una imagen en cada uno de los dos modelos, DALL-E 3 (utilizamos Bing) y para SDXL haz clic aquí.

A continuación, teníamos que ponerles una nota del 0 al 10 a cada imagen y comentar el porqué de dicha nota (por ejemplo, no ha generado bien las manos, ha duplicado la cabeza...). Por último, hacer la media de las notas de cada modelo e indicar el ganador.

En resumen, fue un buen ejercicio para poner en práctica la teoría sobre generación de prompts.


En general, observo que las imágenes generadas por DALL-E 3 tienen calificaciones ligeramente más altas que las de SDXL en los distintos prompts. Ambos modelos tienen sus puntos fuertes y áreas de mejora, pero parece que DALL-E 3 logra capturar mejor la esencia de las escenas solicitadas.

Este fue el resultado:

blurred_faces

blurred_faces

blurred_faces

blurred_faces

blurred_faces

Pero vayamos al grano: ¿Resultado Esperado?

En particular, se destacan la calidad de la atmósfera y la iluminación en las imágenes de DALL-E 3. En ambas plataformas la representación de ciertos detalles como las manos o la apariencia de los personajes no está bien conseguida. Por lo tanto, con base en estas valoraciones, consideraría a DALL-E 3 como el modelo ganador en términos de calidad percibida.

En conclusión, es un tema apasionante y el análisis era solo una introducción al mundo del Prompt Engineering, entre otros ejercicios. Además, todo avanza no solo día a día, sino segundo a segundo, y es seguro que cuando estés leyendo esto, estos modelos ya estarán desfasados.

Un saludo y hasta la próxima.



About

"Mi pasión por la tecnología y el aprendizaje continuo me ha llevado a formarme en programación, inteligencia artificial y big data.


Recent posts