多模態(tài)信息引導(dǎo)的三維數(shù)字人運(yùn)動生成綜述
中國圖象圖形學(xué)報
頁數(shù): 25 2024-09-16
摘要: 基于多模態(tài)信息的三維數(shù)字人運(yùn)動生成技術(shù)旨在通過文本、音頻、圖像和視頻等數(shù)據(jù)實(shí)現(xiàn)特定輸入條件下的人體運(yùn)動生成。這項(xiàng)技術(shù)在電影、動畫、游戲制作和元宇宙等領(lǐng)域具有重要的應(yīng)用價值和廣泛的經(jīng)濟(jì)社會效益,是近年來計算機(jī)圖形學(xué)和計算機(jī)視覺等領(lǐng)域研究的熱點(diǎn)問題之一。然而,基于多模態(tài)信息的三維數(shù)字人運(yùn)動生成面臨著諸多挑戰(zhàn),包括跨模態(tài)信息的表征和融合困難、高質(zhì)量數(shù)據(jù)集缺乏、生成的運(yùn)動質(zhì)量較差(如抖...