不均衡、邊界模糊的機器學(xué)習(xí)技術(shù)
深度學(xué)習(xí)方面一般采用重賦權(quán)、重采樣、多專家等技術(shù),將特征提取器與分類器解耦訓(xùn)練;而傳統(tǒng)機器學(xué)習(xí)的發(fā)展主要集中在代價敏感學(xué)習(xí)與集成學(xué)習(xí)方法。大多數(shù)真實世界的應(yīng)用中,數(shù)據(jù)不均衡分布問題較為嚴(yán)重,尤其是在疾病預(yù)測、設(shè)備異常檢測等領(lǐng)域,采集到的數(shù)據(jù)極度不均衡,且在這些問題中我們關(guān)注的類別常為少數(shù)類(如疾病患者、故障機器等),傳統(tǒng)的方法在這種數(shù)據(jù)不均衡問題上分類性能下降較明顯,且對于少數(shù)類的分類效果不好。該項目針對以上問題,結(jié)合自適應(yīng)下采樣與集成學(xué)習(xí),開發(fā)了一種不均衡、邊界模糊的機器學(xué)習(xí)技術(shù),使分類算法更多的關(guān)注少數(shù)類別的有效信息,篩除噪聲樣本,增加模型魯棒性的同時提高分類算法在樣本不均衡問題下的性能。我們提出的技術(shù)具有廣泛適用性,可應(yīng)用于醫(yī)療與大健康、故障檢測等多個領(lǐng)域。
聯(lián)系方式:
北京科大科技園
010-62333830,62335841,62335665,62333626