基于概率密度的自適應(yīng)k近鄰缺失值填充方法
摘要: 基于k近鄰的缺失值填充方法通常使用樣本間的距離來度量樣本的相似性,在計(jì)算距離時(shí),沒有區(qū)分樣本各屬性的權(quán)重,即所有屬性對(duì)距離的貢獻(xiàn)是一樣的。然而,在非均勻分布的不平衡數(shù)據(jù)集中,樣本的異質(zhì)性往往體現(xiàn)在取值不常見的屬性上,即樣本之間的相似性受屬性取值概率影響,此時(shí)用傳統(tǒng)的距離公式來度量相似性是不夠準(zhǔn)確的。因此,文章針對(duì)非均勻分布的不平衡數(shù)據(jù)集提出了一種自適應(yīng)k近鄰缺失值填充方法(Ak... (共11頁)
開通會(huì)員,享受整站包年服務(wù)