關(guān)鍵詞:集成學(xué)習(xí) bagging算法 聚類 剪枝
摘要:針對增加集成學(xué)習(xí)Bagging算法中分類器的差異性,提高集成學(xué)習(xí)算法模型的魯棒性,研究了基于k-means聚類技術(shù)對集成學(xué)習(xí)算法Bagging進行剪枝。在基礎(chǔ)Bagging算法中融合對Bagging分類器的聚類,然后在不同簇中選擇具有代表價值的分類器為最終集成學(xué)習(xí)預(yù)測結(jié)果投票,并在多個機器學(xué)習(xí)數(shù)據(jù)集上驗證這種提高差異性的方法與基本Bagging性能的差異。經(jīng)過仿真實驗最終得出在算法迭代10次的前提下,改進的Bagging算法較常規(guī)Bagging算法在10個實驗數(shù)據(jù)集中提高了7個數(shù)據(jù)集的預(yù)測精度,其精度提高的平均值在3%;在算法迭代100次的前提下,改進的Bagging算法較常規(guī)Bagging算法在10個實驗數(shù)據(jù)集中提高了9個數(shù)據(jù)集的預(yù)測精度,其精度提高的平均值為2.5%。為復(fù)雜數(shù)據(jù)庫環(huán)境下Bagging算法的應(yīng)用提供了新思路。
光學(xué)與光電技術(shù)雜志要求:
{1}摘要需概述文章研究的目的、主題、論點等,一般為150~300字。
{2}來稿必須為原創(chuàng)性作品,此前未經(jīng)公開發(fā)表。嚴禁抄襲、剽竊和一稿多投,如有發(fā)現(xiàn),將永不刊用該作者來稿。
{3}來稿經(jīng)審查后,編輯部有權(quán)對來稿作適當文字修改.來稿不退,請作者自留底稿。
{4}標題:一般單獨占行,居左;段首小標題,前空兩格,后空一格。
{5}正文中內(nèi)容與圖、表、注釋內(nèi)容不得重復(fù)。所附圖、表請插入正文相應(yīng)位置。
注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社