Pront Engineering
El ejercicio consistía en crear cinco prompts en inglés relativos a imágenes. Por cada prompt, debíamos generar una imagen en cada uno de los dos modelos, DALL-E 3 (utilizamos Bing) y para SDXL haz clic aquí.
A continuación, teníamos que ponerles una nota del 0 al 10 a cada imagen y comentar el porqué de dicha nota (por ejemplo, no ha generado bien las manos, ha duplicado la cabeza...). Por último, hacer la media de las notas de cada modelo e indicar el ganador.
En resumen, fue un buen ejercicio para poner en práctica la teoría sobre generación de prompts.
En general, observo que las imágenes generadas por DALL-E 3 tienen calificaciones ligeramente más altas que las de SDXL en los distintos prompts. Ambos modelos tienen sus puntos fuertes y áreas de mejora, pero parece que DALL-E 3 logra capturar mejor la esencia de las escenas solicitadas.
Este fue el resultado:
Pero vayamos al grano: ¿Resultado Esperado?
En particular, se destacan la calidad de la atmósfera y la iluminación en las imágenes de DALL-E 3. En ambas plataformas la representación de ciertos detalles como las manos o la apariencia de los personajes no está bien conseguida. Por lo tanto, con base en estas valoraciones, consideraría a DALL-E 3 como el modelo ganador en términos de calidad percibida.
En conclusión, es un tema apasionante y el análisis era solo una introducción al mundo del Prompt Engineering, entre otros ejercicios. Además, todo avanza no solo día a día, sino segundo a segundo, y es seguro que cuando estés leyendo esto, estos modelos ya estarán desfasados.
Un saludo y hasta la próxima.