Los grandes modelos de inteligencia artificial (LLM) procesan y almacenan vastas cantidades de conocimiento en un archivo inmenso conocido como espacio latente, estructurado bajo criterios propios.
A diferencia de los humanos, no se sabe con exactitud cómo organizan esta información (fenómeno conocido como “black box”). Por esta razón, aprender a comunicarse efectivamente con estos modelos es una habilidad que hemos denominado Prompt Engineering.
El método más efectivo para alcanzar un criterio estético específico es permitir que la IA construya el prompt a partir de una o varias imágenes de referencia proporcionadas. Esto garantiza resultados más precisos y alineados con la visión deseada.
Por lo tanto, al solicitar un servicio de generación de imágenes, es altamente recomendable hacerlo mediante ejemplos visuales que reflejen lo que necesitas. Veamos ejemplos de cómo realizar una solicitud adecuada.
Estilo Artístico
Estilo dibujo o pintura
Estilo cinematográfico
Estilo moda urbana
El acabado general de la imagen puede variar ampliamente, desde dominantes de color y lentes utilizadas hasta la técnica empleada, el encuadre o la actitud del modelo. Por ello, es ideal proporcionar una imagen que refleje con precisión el estilo deseado. Esto asegura que la IA tenga una referencia clara para trabajar.
Rostro del Personaje
Mujer joven rostro redondo
Mujer joven rostro afilado
Mujer joven rostro ovalado
En el ejemplo anterior, los tres personajes comparten la característica de ser mujeres jóvenes, pero sus rasgos físicos son completamente diferentes. Para obtener un resultado más alineado a tu visión, lo mejor es proporcionar una imagen de un rostro lo más parecido posible al que tienes en mente. También puedes ofrecer dos o más imágenes para combinar detalles específicos, como los ojos de una, la forma de la boca de la otra.
Vestuario
Outfit Masculino
Outfit Femenino Casual
Outfit Femenino Trendy
El vestuario es otro elemento que resulta más fácil de comunicar a través de imágenes debido a la gran cantidad de detalles y variaciones que puede presentar una prenda. Describir cada aspecto de la vestimenta en palabras puede ser complicado, especialmente si quieres que la IA lo interprete con precisión. Una imagen de referencia facilitará enormemente este proceso.
Escenario
Bosque Diurno
Interior Abandonado Diurno
Exterior Nocturno
Para definir un fondo o escenario, asegúrate de que la iluminación, las dominantes de color y los elementos que lo componen se alineen con lo que realmente deseas. Aunque es posible solicitar la inclusión o exclusión de elementos específicos que no estén presentes en la imagen, una referencia visual clara será siempre la mejor guía para la IA.
Como solicito la creación de una imagen
Ya sea para crear una imagen o para solicitar un anuncio en video, las imágenes de referencia son fundamentales para lograr el acabado deseado. A continuación, te muestro un ejemplo de cómo hacer una solicitud, utilizando imágenes de referencia como guía:
Estilo De Iluminación
Rostro Del Personaje
Vestuario Del Personaje
Escenografia
“Quiero la imagen de una mujer con una actitud de inseguridad, de pie en un edificio abandonado como el de la imagen de referencia, con una fuente de luz solar que provenga desde arriba. Su rostro debe ser como el de la chica de cabello blanco en la imagen que te proporciono. El vestuario debe coincidir con el del chico en la imagen adjunta, incluyendo el sombrero pero excluyendo las gafas. El estilo debe ser cinematográfico, como el de la imagen de la chica mirando hacia arriba con flores en la mano. Además, quiero que la palabra ‘TUZZI’ esté escrita en las paredes del escenario.”
Resultado 01
Resultado 02
Resultado 03
Como puedes observar, el modelo de IA interpreta todos los elementos en una sola imagen de manera precisa y coherente. Una vez generados los resultados, te los presentaré para que realices ajustes y elijas el que mejor se acerque a tu visión.
En el caso de videos, se trabajará de forma similar, pero te entregaré un conjunto de imágenes para cada escena, asegurando la consistencia visual y narrativa en todo el proyecto.
¿Que ocurre si necesito un actor específico?, entrenamiento de modelo de persona.
Si deseas trabajar con un actor o una persona real, será necesario proporcionar entre 10 y 50 imágenes de esa persona. Estas imágenes serán utilizadas por el modelo de IA para analizar sus rasgos y crear un modelo específico y consistente. Para garantizar resultados de alta calidad y evitar inconsistencias en el rostro, es fundamental respetar los siguientes lineamientos:
- Capturas del rostro desde múltiples ángulos: Las imágenes deben incluir el rostro con una expresión neutral y vistas desde todos los ángulos posibles (frontal, perfil, desde arriba y desde abajo).
- Calidad de las imágenes: Las fotografías deben ser de alta resolución, con iluminación uniforme y neutral. Todas las imágenes deben mostrar a la persona usando la misma vestimenta para garantizar coherencia en el modelo.
- Consistencia en el cuerpo (opcional): Si se desea incluir consistencia corporal, es recomendable fotografiar a la persona en ropa interior ajustada o prendas ceñidas, de forma que el modelo pueda interpretar correctamente las proporciones del cuerpo.
- Retoque Digital: Las imágenes pueden incluir retoque digital siempre que se aplique de forma consistente en todas las fotografías.
- Expresiones Faciales: Una vez obtenidas las imágenes fundamentales, se recomienda incluir capturas que reflejen distintas expresiones faciales, como sonrisas, enojo, llanto, sorpresa, etc., para que el modelo pueda entender cómo varía el rostro al mostrar emociones. No importa si son de momentos diferentes, eso incluso es mejor.
- Variedad de poses, vestuarios e iluminación: Adicionalmente, incluir imágenes en diferentes poses, con distintos vestuarios y bajo diversas condiciones de iluminación ayudará al modelo a interpretar cómo estos factores afectan la apariencia de la persona representada.
Puedes usar tu teléfono móvil para hacer las fotos, siempre y cuando la iluminación sea buena.
Con estas directrices, el modelo de IA podrá generar representaciones precisas y consistentes del actor o persona requerida, asegurando un resultado de alta calidad que respete los detalles únicos del individuo.
En la siguiente página verás un ejemplo de imágenes entregadas por un cliente y el resultado una vez el modelo fue entrenado
Dataset para el entrenamiento del modelo:
Rostro
Expresiones
Cuerpo
Algunas pruebas de funcionamiento del modelo:
Conclusión
Solicitar imágenes y videos generados por inteligencia artificial no solo abre un abanico de posibilidades creativas, sino que también puede transformar radicalmente la manera en que marcas, empresas y profesionales cuentan historias visuales. Comprender los pasos clave para realizar una solicitud efectiva no solo asegura que el resultado final sea impactante, sino que también ahorra tiempo y recursos.
La colaboración clara entre el cliente y el creador es fundamental para materializar ideas innovadoras y, al mismo tiempo, garantizar que las piezas finales conecten con el público deseado. En un mundo en constante evolución tecnológica, aprovechar al máximo las herramientas de IA no es solo una ventaja competitiva: es una oportunidad para explorar nuevas fronteras en la creatividad y comunicación visual.
Invitamos a todos los interesados a dar el siguiente paso y explorar cómo estas tecnologías pueden potenciar sus proyectos. Recuerda que con una visión clara y una comunicación efectiva, el único límite será tu imaginación.