基于穩(wěn)定擴(kuò)散模型的漢服效果圖生成研究
摘要: 針對(duì)漢服效果圖生成過程中因各朝代服飾特征難以被準(zhǔn)確捕捉而造成生成圖像朝代混淆的問題,本文基于穩(wěn)定擴(kuò)散模型(Stable Diffusion),根據(jù)新輸入的文本提示詞匹配文本與圖像特征空間向量,將V~*作為新標(biāo)記符號(hào)嵌入層,并協(xié)同交叉注意力層參數(shù)W
k和W
v進(jìn)行聯(lián)合優(yōu)化,最終搜索模型再學(xué)習(xí)新服飾文本特征后的損失函數(shù)最小值。通過查閱文獻(xiàn)史料,收集整理并新增了唐、宋、明3個(gè)朝代16... (共8頁(yè))
開通會(huì)員,享受整站包年服務(wù)