LHM, o Large Animatable Human Reconstruction Model, è un modello proposto per la ricostruzione di avatar 3D animabili a partire da una singola immagine. È stato sviluppato per risolvere una delle sfide principali nella computer vision e nella grafica 3D, ovvero la creazione di modelli 3D di esseri umani altamente realistici e animabili, utilizzando una sola immagine come input.
LHM sfrutta un’architettura multimodale basata su transformer per codificare efficacemente le caratteristiche spaziali e visive del corpo umano, consentendo una riproduzione dettagliata della geometria e della texture dei vestiti. Inoltre, il modello introduce una piramide di feature della testa per migliorare la conservazione dell’identità facciale e il recupero dei dettagli fini, come le espressioni facciali e le mani.