La IA con sentido común – Un experimento en dos fases

La IA con sentido común – Un experimento en dos fases


La IA con cabeza

¿Puede la IA ayudar a que mejoremos nuestras habilidades en una disciplina concreta?

En este artículo de dos partes procederemos a poner a prueba un uso de la IA que si puede ser interesante.

La IA antes que nada es un compendio de información.

Si planteamos correctamente las preguntas, es capaz de señalarnos  detalles o situaciones que se nos pueden escapar a simple vista y que pueden estar bloqueando nuestro desarrollo o evolución en un campo en concreto.

La idea de este experimento no es 100% original. La idea de que la IA evalúe o asesore sobre la efectividad o eficacia de un contenido generado para internet ya ha rondado antes con iniciativas como “roast my instagram”  que pasó el año pasado a modo de pasatiempo.

En esta ocasión también lo tomaremos como un experimento más técnico (no somos artistas sino artesanos) sobre si la IA es capaz de hacernos caer en cuenta o apuntarnos sobre tips que nos ayuden a lograr una mejora. En este caso en el campo del CGI 3D.

De esta forma la IA no está supliendo nada sino que estaría funcionando como un asesor objetivo sobre los aspectos de la ejecución de una creación visual.

En esta ocasión usaremos a Chatgpt para el experimento. Podríamos haber usado cualquier otra IA, pero quisimos ir por una que fuera de uso bastante extendido.

Fase I .- La evaluación

 

La premisa.

 

Pasaremos a la IA un lote de seis imágenes creadas en 3D con la finalidad de que la IA genere un feedback sobre ellas y valore aquellas que cree que les falta para ser consideradas “fotográficas” (si dan el pego como fotos).

Estas imágenes ayudarán a establecer un conjunto de parámetros tipo que puedan servir para al final formular una lista de requisitos para que un render sea considerado fotográfico.

Además, le pediremos que retoque las imágenes en la medida de lo posible (sin alterar la idea original) de forma de que estas tengan un acabado más fotográfico.

En la segunda parte de este artículo usaremos esa lista de características para intentar crear un render lo más fotográfico posible.

Se ha procurado elegir Tomas y composiciones que sean bastante convencionales, ya que parte de la credibilidad de las imágenes viene de que sean sobre situaciones cotidianas o usuales. No hemos querido arriesgar mucho con la “temática” o el “mood” de las escenas. Así la IA puede centrarse en lo técnico de cada toma.

 

Los matices.

  • Antes de desarrollar nuestro experimento, debemos hacer ciertas puntualizaciones
  • Tanto los pasos que se toman como los resultados que se obtienen en este tipo de actividades son de tipo experimental y que conllevan un ensayo error porque no se han hecho nunca antes
  • Tampoco debemos tomarnos demasiado en serio, el uso de términos como fotográfico realista, etc. y que muchas de estas excepciones tienen un componente subjetivo o de apreciación personal.
  • La intención real es tratar de averiguar dónde puede encajar la inteligencia artificial dentro del proceso creativo, sin necesidad de ser un elemento 100 % invasivo.

Hay que mantener vivo el dicho:

No es la herramienta, sino el que la maneja.

La exploración de nuevas formas de trabajo debe ser algo entretenido y, a ser posible sin depender de un software determinado.

 

Evaluaciones de los renders

Render 1 (sala)

la IA

Lo que dijo la IA sobre la imagen

Se percibe como una fotografía de interior contemporáneo, tomada con luz natural, con un momento cotidiano detenido: una partida de ajedrez abandonada, sin intención de orden ni puesta en escena perfecta.

Eso es clave:

No parece un “objeto exhibido”, sino un espacio habitado.

 

Se usa correctamente:

  • profundidad de campo
  • superposición
  • escala
  • iluminación creíble
  • composición humana

 

Le Falta:

Micro imperfecciones de materiales

  • La mesa podría tener:
    • ligeras variaciones de roughness
    • arrugas o tensión irregular en la tela
  • Las piezas negras:
    • micro rayones
    • huellas casi invisibles

Ahora se sienten un poco demasiado limpias.

Imperfecciones ópticas leves

Muy sutiles, casi invisibles:

  • Un poco de viñeteado
  • Un toque mínimo de aberración cromática en bordes de alto contraste
  • Algo de ruido en sombras

No para que se note, sino para que no se sienta perfecto.

Imperfección de exposición

  • Las ventanas están muy blancas (lo cual es realista),
    Se podría:

    • perder un poco más de información en highlights
    • o ensuciar ligeramente las sombras

Las cámaras reales rara vez conservan todo tan equilibrado

 

Luego le pedimos que retocara la imagen de forma que procurase insertar esas imperfecciones y el resultado fue este

 

La IA

 

Los cambios que apreciamos nosotros son:

Cambio en el material del vino en la copa.

Resplandor de la luz fuerte de la ventana sobre lo que viene a ser el cristal de la cámara

Partículas de polvo (luz volumétrica)

Grano

Un viñeteado más agresivo.

Además del cambio del formato de un apaisado a uno más cuadrado (quizás más “instagrameable”).

Render 2 (sala 2)

Lo que dijo la IA sobre la imagen

funciona bien a nivel técnico, pero revela con más claridad dónde todavía se siente “render”.

Esta imagen se lee como una visualización arquitectónica bien hecha, mientras que la anterior se leía como una fotografía de un momento.

La diferencia no está en la calidad, sino en:

  • control excesivo
  • falta de imperfección narrativa

Puntos fuertes:

Perspectiva y escala

Superposición de planos

Iluminación natural clara (volumen y contraste)

Le falta:

Imperfecciones presentes (pocas)  e imperfecciones ópticas (ausentes)

Grano, viñeteado, aberración cromática, distorsión de lente

El veredicto de esta imagen

El resultado es demasiado clínico.

Materiales muy uniformes

Objetos “demasiado colocados”

Todo está muy alineado.

Nada parece accidental.

En una foto real:

algo suele estorbar, quedar torcido o cortar el encuadre de forma incómoda

 

Luego le pedimos que retocara la imagen de forma que procurase insertar esas imperfecciones y el resultado fue este:

 

Los cambios que apreciamos nosotros son:

El balance de blancos ha desaparecido para dar más presencia de sol

Vuelve a cambiar el material del líquido en las copas

Añade textura al mueble del ajedrez Pero con eso elimina parte del desenfoque de FOV

Integra polvo en el haz de  luz

Agrega textura a la pared blanca.

 

Ignoraremos el hecho de que ha omitido representar correctamente el tablero de ajedrez. Suponemos que es porque es un elemento no muy reconocible.

Render 3 (tablero de ajedrez).-

La IA

Lo que dijo la IA sobre la imagen

Este render es ideal para seguir afinando el ojo porque está muy bien ejecutado a nivel técnico, pero deja ver con claridad dónde se rompe la ilusión fotográfica. Haré la misma lectura estructurada que en los anteriores.

 

Profundidad y cámara

Perspectiva y encuadre

El ángulo picado es totalmente creíble: recuerda a una foto tomada desde arriba de una mesa.

El encuadre es limpio y claro, sin distorsiones raras.

La escala del tablero, piezas y reloj es coherente.

 

Iluminación

Dirección clara y lógica

Luz principal desde arriba (lámpara).

Buen modelado de volumen en las piezas.

Sombras suaves y consistentes.

La intención está bien resuelta.

 

Materiales (el punto más fuerte y el más débil)

Buen trabajo de materiales base

Madera del tablero bien definida.

Mármol del tablero legible.

Piezas con diferenciación clara entre blancas y negras.

Le falta:

Todo está prácticamente enfocado.

El blur que existe es uniforme y suave, no responde a una lente real.

La luz es muy controlada.

No hay rebotes irregulares, zonas ligeramente sucias, contaminación cromática entre materiales, La iluminación real suele ser menos predecible

Aquí aparece el “síndrome de catálogo”:

La madera, sin variación tonal, sin micro rayones

El mármol demasiado limpio

Este render es técnicamente sólido y estéticamente limpio, pero se lee como visualización de producto, no como fotografía documental.

 

La imagen revisada  es la siguiente:

Los cambios que apreciamos nosotros son:

Más saturación del color y veta de la madera del tablero

Se añadieron piezas desordenadas (las piezas originales son peculiares, por lo que suponems que no le fue posible reproducirlas)

Las imperfecciones del mármol del tablero se han hecho más evidentes.

De nuevo presencia de polvo y ruido, además de una viñeta más evidente.

 

Render 4 (reloj alarma)

La IA

 

Lo que dijo la IA sobre la imagen

  • Cámara creíble
    DOF correcto
    Materiales vivos
    Imperfección bien dosificada
    Narrativa implícita

Este es el benchmark al que deberías apuntar si buscas realismo fotográfico.

A destacar la IA propone que los puntos fuertes son la variación en el brillo del metal y la composición en plan “objeto encontrado” que le brindan su cualidad más fotográfica.

Lo que le falta:

A la IA el balance de blancos no le convence y critica el halo azul verdoso resultado de dicho balance.

Señala también que falla el cristal perfecto y sugiere polvo y alguna huella insinuada. El reloj tiene un aire a usado y descoloca el cristal impoluto

 

Su versión revisada es:

Los cambios que apreciamos nosotros son:

Acentúa todo convirtiendo la toma en una versión de alto rango dinámico de la toma. Y añade polvo volumétrico

 

Render 5 (Caballito)

Lo que dijo la IA sobre la imagen.-

Esta imagen es muy didáctica porque está justo en el punto medio entre render estilizado y foto real, y permite ver con claridad qué decisiones empujan en una dirección u otra.

Esta imagen se lee como una fotografía infantil estilizada, muy cercana a una foto real, pero aún con un pulido excesivo.

No canta “render” de inmediato, pero tampoco engaña al 100% en inspección prolongada.

Comparación con el reloj

  • Reloj → fotografía artística madura
  • Caballito → fotografía editorial / publicitaria infantil

 A diferencia de los primeros renders, en estos dos últimos hace referencia a una “narrativa”. Los renders de ambientes suelen ser poco personales y apuntan a ser especiales pero genéricos. Suponemos que estos dos últimos ganan algún tipo de sentimiento por centrarse en un objeto.

 

Le falta:

  • Demasiado limpio
  • Falta accidente humano
  • Óptica demasiado perfecta

 

Su versión revisada es la siguiente:

Los cambios que apreciamos nosotros son:

Un ligero aumento en el contraste luz/sombra

Un avejentamiento en el material del caballito

Polvo y viñeta

Menos protagonismo al suelo. (lo obscurece)

 

En lo personal me agrada que haya solucionado el toque «artificial» de la madera de apoyo de las patas delanteras

 

Render 6 (Café)

Lo que dijo la IA sobre la imagen.-

Esta ya está muy cerca del umbral fotográfico, así que la evaluación es más fina y crítica.

Composición sólida

Materiales excelentes

Iluminación creíble

DOF correcto

Narrativa presente

 

Le falta:

  • Suciedad, desorden, caos.
  • Polvo y ruido
  • Viñeta más acusada.
  • La versión Revisada es:

 

Los cambios que apreciamos nosotros son:

Aquí si se aprecia un cambio en el ángulo de la toma, puede ser un lente distinto o la distorsión del mismo.

Se acerca la cámara y se quita protagonismo a la tabla de corte, pero se mejora el material.

La madera de la mesa también tiene un cambio para romper con su armonía.

Y añade su “firma” con polvo y viñeta.

El “ranking” de las seis imágenes de acuerdo con la IA es el siguiente.

Conclusiones de la IA

A partir de lo observado en estas imágenes la IA nos ofrece un listado de “requerimientos” para un render más fotográfico (recordemos que se trata de un tema subjetivo).

Esta parte es transcripción directa de la IA:

✅ CHECKLIST DEFINITIVA DE REALISMO FOTOGRÁFICO (CG → FOTO)

1️⃣ Cámara (si falla esto, todo falla)

⬜ Altura y punto de vista creíbles

  • ¿La cámara está donde un humano podría ponerla?

  • ¿No está flotando ni excesivamente perfecta?

Si parece “ideal”, desconfía.


⬜ Lente plausible

  • ¿Podrías decir qué lente es? (35mm, 50mm, 85mm…)

  • ¿El encuadre coincide con esa focal?

Si no puedes imaginar la lente, hay un problema.


⬜ Profundidad de campo con intención

  • ¿Hay un plano claro de enfoque?

  • ¿El desenfoque es progresivo, no uniforme?

  • ¿Los bordes del encuadre caen un poco?

Error común: todo enfocado o blur “perfecto”.


⬜ Imperfecciones ópticas

  • ⬜ Viñeteado leve

  • ⬜ Distorsión mínima

  • ⬜ Aberración cromática casi invisible

Una cámara perfecta no existe.


2️⃣ Iluminación (la trampa más común del CG)

⬜ Fuente de luz identificable

  • ¿Puedes señalar de dónde viene la luz?

  • ¿Tiene sentido físico?


⬜ Iluminación irregular

  • ¿Hay zonas menos favorecidas?

  • ¿Algo se pierde un poco en sombra o highlight?

La luz real nunca es democrática.


⬜ Rebotes “sucios”

  • ¿Los colores se contaminan entre sí?

  • ¿Las sombras no son neutras?

Render típico = sombras demasiado limpias.


3️⃣ Materiales (donde el CG suele delatarse)

⬜ Variación de roughness

  • ¿Un mismo material refleja distinto según la zona?

  • ¿O todo responde igual?


⬜ Imperfección microscópica

  • ⬜ Micro rayones

  • ⬜ Manchas suaves

  • ⬜ Bordes desgastados

No exageres: muchas pequeñas > una grande.


⬜ Historia del objeto

  • ¿El objeto parece:

    • nuevo

    • usado

    • viejo
      y eso es consistente?

Objetos “sin pasado” se sienten falsos.


4️⃣ Composición (el ojo humano lo detecta rápido)

⬜ Nada está perfectamente colocado

  • ¿Hay:

    • algo levemente torcido?

    • algo cortado incómodo?

    • algo que estorba?

La perfección es artificial.


⬜ Accidente visual

  • ¿Hay algún elemento que no aporta estéticamente, pero aporta realidad?

Ejemplos:

  • grano fuera de lugar

  • pieza mal alineada

  • sombra inesperada


5️⃣ Narrativa (clave del reloj y el café)

⬜ Momento, no objeto

  • ¿La imagen parece:

    • “esto estaba pasando”

    • y no “esto fue colocado”?


⬜ Decisión implícita

  • ¿Parece que alguien:

    • dejó eso ahí

    • estuvo antes

    • volverá después?

Render sin narrativa = catálogo.


6️⃣ Sensor y post (el último 5%)

⬜ Grano sutil

  • Especialmente en:

    • sombras

    • zonas desenfocadas

Si no se nota, está bien.


⬜ Compresión tonal

  • ¿Los negros no son completamente negros?

  • ¿Los blancos no son perfectos?


⬜ Color imperfecto

  • ¿Hay una dominante?

  • ¿Hay mezcla de temperaturas?

El balance de blancos perfecto es raro en la vida real.

Nuestras conclusiones.-

«El realismo fotográfico no se logra añadiendo calidad, se logra quitando control

Esta es la frase que establece la ironía definitiva de la IA. Ya que nuestro objetivo de alguna forma era tener el control de nuestra imagen.

Partimos de que las premisas de esta asesoría con IA son humanamente subjetivas. El objetivo era formular algo que nos sirviera como marco de partida para guiarnos a crear un render que tenga en cuenta todo lo que tendría que considerar u. Fotografo.

Los elementos que encuentra faltar la IA en los renders son algo que puede ser muy obvio, pero que de alguna manera han logrado escaparse a la hora de dar por terminado el proceso de creación de la imagen

Principalmente, lo que se ha logrado con esta experiencia, es ordenar una lista de aspectos por escrito y por prioridad. Algo que se le da bien a la IA. La matemática del  pensamiento.

En la siguiente parte, utilizaremos esa guía para establecer un par de escenas y vamos a intentar obtener una “calificación alta”

Si todo sale bien, habremos cumplido nuestro objetivo de utilizar la IA como una herramienta que nos ayuda a vencer nuestras dificultades de percepción y no como un remplazo del proceso creativo.

En el fondo lo importante es pasárselo bien.


 

Escribe un comentario