語音驅動說話數(shù)字人視頻生成方法綜述
摘要: 近年來,深度學習技術的飛速發(fā)展極大地推動了虛擬數(shù)字人技術的進步,尤其是在說話數(shù)字人視頻生成方面。該領域的研究在視頻翻譯、電影制作和虛擬助手等多個場景中展現(xiàn)出廣闊的應用前景。該文對當前語音驅動說話數(shù)字人視頻生成方法及研究現(xiàn)狀進行了梳理與總結,并深入探討了關鍵技術、數(shù)據(jù)集以及評估策略。在關鍵技術方面,生成對抗模型、擴散模型和神經(jīng)輻射場等人工智能技術均發(fā)揮了重要作用。數(shù)據(jù)集的規(guī)模和多... (共11頁)
開通會員,享受整站包年服務