關鍵詞:鄰域粗糙集 特征約簡 對稱機制 過濾機制 散列分桶
摘要:從高維異構(gòu)感知信息中提取有效特征是支撐物聯(lián)網(wǎng)系統(tǒng)預測與識別的基礎.物聯(lián)網(wǎng)場景中通常包括多個多種感知節(jié)點,系統(tǒng)通常會從感知數(shù)據(jù)中提取大量特征,其中不乏部分無關和冗余特征.這些無關及冗余特征會降低系統(tǒng)的運行速度,引入冗余計算,更會影響后續(xù)的分類及預測等機器學習操作的性能.因而高效識別并提取低維有效的特征子集是物聯(lián)網(wǎng)數(shù)據(jù)分析所面臨的一大挑戰(zhàn).鄰域粗糙集方法能夠在保持數(shù)據(jù)集可分性的前提下,識別和去除無關及冗余特征子集,從而達到降維效果.但由于現(xiàn)有基于鄰域粗糙集的特征約簡算法的計算開銷大、運行時間長,故而并未得到廣泛應用.提出了一種基于鄰域關系對稱性及決策值過濾策略的特征快速約簡算法EasiFFRA.EasiFFRA可通過改進的散列分桶方法加速正域樣本計算,可檢驗并過濾冗余決策值樣本,從而降低現(xiàn)有方法中由于重復距離評估所帶來的冗余計算.實驗結(jié)果表明:EasiFFRA在實際采集的水質(zhì)數(shù)據(jù)集和多個不同樣本量及維度的公開數(shù)據(jù)集中平均加快75.45%的特征約簡時間,其約簡結(jié)果和已有鄰域粗糙集特征約簡算法等效,可有效解決物聯(lián)網(wǎng)數(shù)據(jù)分析中由冗余及無關特征導致的分類及預測精度下降問題,有重要應用價值.
計算機研究與發(fā)展雜志要求:
{1}摘要200字左右,應具有獨立性和自明性,闡明撰寫該文的目的、方法、結(jié)論并體現(xiàn)出原創(chuàng)性,不加引注。
{2}來稿請恪守學術道德,嚴禁抄襲。
{3}來稿經(jīng)審查后,編輯部有權對來稿作適當文字修改.來稿不退,請作者自留底稿。
{4}間接引文通常以“參見”或“詳見”等引領詞引導,反映出與正文行文的呼應,標注時應注出具體參考引證的起止頁碼或章節(jié)。標注項目、順序與格式同直接引文。
{5}本期刊的文獻引證方式均采用頁下注(腳注),采用小五號宋體,每頁單獨編號,注釋中卷次、出版時間、刊期、頁碼一律用阿拉伯數(shù)字表示。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社