El “problema de las manos” ha sido el talón de Aquiles de la IA generativa desde sus inicios. Dedos que se fusionan, manos con seis dedos o extremidades que parecen espaguetis son el pan de cada día. Aunque modelos como SDXL y FLUX han mejorado, la perfección quirúrgica sigue requiriendo intervención manual.
En esta guía, vamos a ir más allá del simple inpainting. Vamos a construir un sistema robusto en ComfyUI que combina anatomía 3D, visión por computador y refinamiento de texturas.
🏗️ Workflow: Inpainting Anatómico
🎨 El Desafío de las Manos: ¿Por qué falla la IA?
Para solucionar un problema, primero hay que entenderlo. La IA no sabe qué es un “hueso” o un “tendón”; solo sabe que en los datos de entrenamiento, a menudo aparecen “formas de color carne con apéndices” cerca de los brazos. Cuando el área de la mano es pequeña en la imagen original, la IA no tiene suficientes píxeles para representar la complejidad de cinco dedos.
La Regla de Oro: Para arreglar una mano, debes darle a la IA más resolución de la que tiene en la imagen original. Esto se llama Detailer o Crop-and-Stitch.
🎨 Paso 1: Creación de Máscaras Efectivas
El primer paso es decirle a ComfyUI qué parte de la imagen queremos cambiar.
🎨 Máscara Manual (La más precisa)
- Haz clic derecho en tu nodo
Load Imagey selecciona Open in MaskEditor. - Pinta sobre la mano fallida.
- Consejo Pro: No pintes solo los dedos. Cubre toda la mano hasta la muñeca. Esto permite que la IA cree una transición anatómica lógica con el antebrazo.
🎨 Máscara Automática (Efficiency)
Si tienes muchas imágenes, usa el nodo SAM Detector (Segment Anything) combinado con un prompt de texto como “hand”. Esto generará la máscara automáticamente por ti.
🎨 Paso 2: InpaintModelConditioning (El Nodo Clave)
Muchos usuarios cometen el error de usar un KSampler normal para inpainting. Para resultados profesionales, necesitamos el nodo InpaintModelConditioning.
Este nodo toma cuatro entradas:
- Positive/Negative Conditioning: Tus prompts.
- VAE: El VAE de tu modelo.
- Pixels: La imagen original.
- Mask: La máscara que creamos en el paso anterior.
¿Qué hace especial a este nodo? Crea una “guía” latente que le dice al modelo: “Aquí hay un hueco, pero alrededor hay una manga de camisa roja y piel clara; asegúrate de que lo que dibujes encaje con eso”.
🎨 Paso 3: MeshGraphormer: El Esqueleto 3D
Para evitar que la IA invente dedos, usamos MeshGraphormer (parte de ComfyUI-ControlNet-Aux). Este nodo analiza la imagen, detecta una mano (aunque esté mal dibujada) e intenta reconstruir su pose anatómica correcta en un mapa de profundidad.
- Conecta tu imagen al nodo
MeshGraphormer-HandRefiner. - La salida será un mapa de profundidad de una mano humana real.
- Pasa ese mapa por un ControlNet Depth (ej.
control_v11p_sd15_depth). - Conecta el ControlNet a tu prompt positivo.
Ahora, la IA no tiene libertad para inventar; tiene que dibujar los dedos siguiendo el “esqueleto” que MeshGraphormer ha creado.
🎨 Paso 4: CLIP Vision para Detalle Realista
Incluso con la forma correcta, a veces las manos parecen de plástico. Para solucionar esto, usamos CLIP Vision con IP-Adapter.
- Carga una imagen de referencia de una mano real con buena iluminación y piel similar a tu personaje.
- Usa el nodo
IP-Adapter Apply. - Esto inyectará la “esencia” de esa mano real (textura, uñas, arrugas) en tu proceso de inpainting.
🎨 Paso 5: El Flujo ‘Refiner’ (Piel y Uñas)
Para el toque final, no lo hagas todo de una vez. Usa un proceso de dos etapas:
🎨 Etapa A: Corrección Estructural
- Denoise: 0.6 - 0.7.
- Objetivo: Cambiar la forma de la mano siguiendo el ControlNet.
- Resultado: Una mano con la forma correcta pero quizá un poco borrosa.
🎨 Etapa B: Refinado de Detalles
- Pasa el resultado de la Etapa A a un segundo
KSampler. - Denoise: 0.2 - 0.3.
- Prompt: Añade
"(highly detailed skin pores, manicured nails, realistic skin texture, 8k)". - Objetivo: Enfocar y añadir texturas microscópicas sin cambiar la forma que ya arreglamos.
🎨 Workflow Paso a Paso: El Resumen
- Cargar Imagen -> Crear Máscara de la mano.
- MeshGraphormer -> Crear mapa de profundidad de la mano correcta.
- ControlNet Depth -> Aplicar mapa de profundidad.
- InpaintModelConditioning -> Combinar imagen, máscara y prompts.
- KSampler 1 (Denoise 0.65) -> Generar la base de la mano.
- KSampler 2 (Denoise 0.25) -> Refinar piel y uñas.
- VAE Decode -> Resultado final.
🎨 FAQ Técnico: Resolviendo Errores Comunes
🎨 ¿Qué hago si la mano sale de un color diferente al cuerpo?
Esto suele ser un problema de falta de contexto. Asegúrate de que el prompt positivo incluya descripciones del personaje (“pale skin”, “tanned”, etc.) y que la máscara incluya un trozo de la muñeca para que el modelo pueda “muestrear” el color de la piel original.
🎨 La mano se ve “pegada” y no se integra bien.
Aumenta el mask_blur en el nodo de inpainting o usa un nodo Differential Diffusion. Esto suaviza los bordes de la zona modificada para que el blending con la imagen original sea perfecto.
🎨 El MeshGraphormer no detecta la mano.
Si la mano original es un desastre total (solo un borrón), MeshGraphormer podría fallar. En ese caso, es mejor que tú mismo pongas una imagen de una mano real en la posición que quieras, le hagas un mapa de profundidad y lo uses como guía.
Arreglar manos en ComfyUI es la prueba de fuego de cualquier artista de IA. Requiere paciencia y un entendimiento profundo de cómo se encadenan los nodos, pero una vez que dominas este flujo de trabajo, ninguna imagen volverá a estar arruinada por un dedo de más.
Si quieres aprender a llevar estas imágenes ya corregidas a una resolución profesional, echa un vistazo a nuestra guía de upscaling 4K, el complemento perfecto para este tutorial. Si el problema viene de antes, en la fase de generación, la guía de img2img con LoRAs te permitirá generar poses de mano más controladas desde el inicio.
Preguntas frecuentes
- ¿Por qué la IA siempre dibuja mal las manos?
- Las manos son estructuras extremadamente complejas con una enorme libertad de movimiento. En los datasets de entrenamiento, las manos suelen aparecer en posiciones infinitas y a menudo parcialmente ocultas, lo que dificulta que el modelo aprenda una estructura lógica 3D coherente. Por eso necesitamos guiarla con herramientas externas.
- ¿Qué es mejor: InpaintModelConditioning o VAE Encode (for Inpainting)?
- InpaintModelConditioning es superior. Mientras que VAE Encode solo le da al modelo la imagen y la máscara, InpaintModelConditioning 'prepara' el espacio latente para que el modelo entienda qué partes de la imagen original debe conservar y qué 'agujero' debe llenar, resultando en un blending mucho más natural.
- ¿Puedo arreglar manos sin usar ControlNet?
- Puedes, pero es mucho más difícil. ControlNet (especialmente el de Depth o el nuevo MeshGraphormer) actúa como un 'esqueleto' que obliga a los dedos a estar donde deben. Sin él, el inpainting es una lotería que suele requerir decenas de intentos.
- ¿Para qué sirve CLIP Vision en este proceso?
- CLIP Vision permite 'inyectar' el estilo visual de una mano real (textura de la piel, forma de las uñas, vello) sin dictar la posición. Es ideal para que la mano corregida coincida perfectamente con el resto del cuerpo del personaje.