Descripción del flujo de trabajo por u/FotoRe_store
Este artículo está basado en la experiencia completa. El autor se propuso restaurar una fotografía antigüa del escritor ruso Fiodr Dostoevsky de 1879 y que recogió en un hilo de Reddit.
El autor se propuso dos tareas: en primer lugar, hacer algo lo más cercano posible al original (restauración, no reconstrucción), y en segundo lugar, hacer la textura de la piel del rostro lo más realista posible. El trabajo le llevó un poco más de dos días.
Primer día:
-
Buscar y sistematizar los recuerdos de los contemporáneos de Dostoevsky sobre su apariencia en el período en que se tomó la foto original;
-
Buscar versiones anteriores de colorización de esta foto;
-
Buscar y estudiar otras imágenes del escritor;
-
Luego, es necesario «dormir con» el conocimiento adquirido.
Segundo día:
-
Hacer varias variantes de colorización y detallado facial en diferentes sitios gratuitos, que mezcla entre sí y con colorizaciones anteriores de otros autores;
-
Un poco de juego con los amplificadores en Difusión Estable;
-
Mucha pegadura intermedia y final, mezcla y acabado en Gimp;
-
Mucha pintura de piezas de imagen separadas en Difusión Estable (más de mil generaciones), con y sin controlnet (lineart_anime).
El último punto es el principal y tomó alrededor del 80% del esfuerzo. Y sí, la parte más difícil de este tipo de restauración detallada no es extraer información válida del ruido con redes neuronales de difusión. Lo más difícil es evaluar la información extraída contra la información inferida. Y hasta ahora, solo el cerebro humano puede hacer tal evaluación de manera adecuada. Una computadora no puede hacer frente a tales tareas (y parece que no podrá hacerlo durante mucho tiempo). De hecho, el proceso de trabajo es algo así como armar un rompecabezas a partir de mil piezas del mismo tono basado en una imagen vaga del original, que está (y constantemente se escapa) solo en la mente de la persona que lo está armando.
Prompt Usado:
Foto RAW, retrato de hombre de 59 años, ojos [grises | marrones], cabello claro [pelirrojo | marrón | pelirrojo] (con mechones grises:1.2), una verruga en la mejilla derecha, labios pálidos y delgados, tez terrosa, apariencia enfermiza, barba descuidada y larga (1.3) de color pelirrojo, chaqueta de color pantano, (características faciales detalladas), (enfoque nítido:1.3), (piel altamente detallada:1.2), ((rostro detallado)), ultra alta resolución, hdr, hiperdetallado
Prompt Negativo:
anime, 3d, render, caricatura, pintura, mult, (deformado, distorsionado, desfigurado:1.3), mal dibujado, mala anatomía, anatomía incorrecta, mutación, mutado, feo, repugnante, borroso, obeso
Modelo:
Realistic_Vision_v5
Aquí tienes otro ejemplo de este tipo de restauración de fotos antiguas con IA. En este caso una reconstrucción 4K UHD. SD+Gimp+A100
Para más detalles, puedes visitar el hilo de Reddit donde se discute este proceso.
Comentarios