當前位置:首頁 > 科技文檔 > 計算機軟件及計算機應用 > 正文

語音驅動說話數(shù)字人視頻生成方法綜述

電子科技大學學報 頁數(shù): 11 2024-11-30
摘要: 近年來,深度學習技術的飛速發(fā)展極大地推動了虛擬數(shù)字人技術的進步,尤其是在說話數(shù)字人視頻生成方面。該領域的研究在視頻翻譯、電影制作和虛擬助手等多個場景中展現(xiàn)出廣闊的應用前景。該文對當前語音驅動說話數(shù)字人視頻生成方法及研究現(xiàn)狀進行了梳理與總結,并深入探討了關鍵技術、數(shù)據(jù)集以及評估策略。在關鍵技術方面,生成對抗模型、擴散模型和神經(jīng)輻射場等人工智能技術均發(fā)揮了重要作用。數(shù)據(jù)集的規(guī)模和多... (共11頁)

開通會員,享受整站包年服務