久热精品在线视频,思思96精品国产,午夜国产人人精品一区,亚洲成在线a

<s id="x4lik"><u id="x4lik"></u></s>

      <strong id="x4lik"><u id="x4lik"></u></strong>

      一種基于Spark的不確定數(shù)據(jù)集頻繁模式挖掘算法

      楊陽; 丁家滿; 李海濱; 賈連印; 游進(jìn)國; 姜瑛 昆明理工大學(xué)信息工程與自動(dòng)化學(xué)院; 云南昆明650500

      關(guān)鍵詞:不確定數(shù)據(jù) 數(shù)據(jù)挖掘 頻繁模式 spark 

      摘要:如何在海量不確定數(shù)據(jù)集中提高頻繁模式挖掘性能是目前研究的熱點(diǎn).傳統(tǒng)算法大多是以期望、概率或者權(quán)重等單一指標(biāo)為數(shù)據(jù)項(xiàng)集支持度,在大數(shù)據(jù)背景下,同時(shí)考慮概率和權(quán)重支持度的算法難以兼顧其執(zhí)行效率.為此,本文提出一種基于Spark的不確定數(shù)據(jù)集頻繁模式挖掘算法(UWEFP),首先,為了同時(shí)兼顧數(shù)據(jù)項(xiàng)的概率和權(quán)重,計(jì)算一項(xiàng)集的最大概率權(quán)重值并進(jìn)行剪枝;然后,為了減少對(duì)數(shù)據(jù)集的多次掃描,結(jié)合Spark框架的優(yōu)點(diǎn),設(shè)計(jì)了一種具有FP-tree特征的新穎的UWEFP-tree結(jié)構(gòu)進(jìn)行模式樹的構(gòu)建及挖掘;最后在Spark環(huán)境下,以UCI數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)驗(yàn)證.實(shí)驗(yàn)結(jié)果表明本文的方法在保證挖掘結(jié)果的同時(shí),提高了效率.

      信息與控制雜志要求:

      {1}基金或課題項(xiàng)目:若要標(biāo)注獲得基金或課題贊助的論文,應(yīng)注明基金或課題項(xiàng)目名稱,并在圓括號(hào)內(nèi)注明項(xiàng)目編號(hào)。

      {2}本刊歡迎具有創(chuàng)見性、應(yīng)用性、前瞻性的論文,對(duì)觸及社會(huì)和學(xué)術(shù)界熱點(diǎn)、重點(diǎn)及時(shí)代感、現(xiàn)實(shí)性較強(qiáng)的論文優(yōu)先錄用。

      {3}圖片要求為原始稿件單獨(dú)發(fā)送,清晰,色彩、亮度適中,圖像分辨率應(yīng)為1024×768像素,4M以上。

      {4}文中需進(jìn)一步解釋的內(nèi)容作為頁末注釋,用宋體五號(hào)字。文中用上標(biāo)標(biāo)注,編號(hào)為:①②③。

      {5}附錄內(nèi)容較少,與參考文獻(xiàn)排在同一頁;如出現(xiàn)內(nèi)容較多,則另起一頁。附錄的字體為12磅,Times New Roman字體,加粗。附錄內(nèi)容格式要求與正文一致。

      注:因版權(quán)方要求,不能公開全文,如需全文,請(qǐng)咨詢雜志社

      信息與控制

      北大期刊
      1-3個(gè)月下單

      關(guān)注 11人評(píng)論|1人關(guān)注
      相關(guān)期刊
      • 戶外探險(xiǎn)
        省級(jí)期刊 1個(gè)月內(nèi)下單
        戶外雜志社
      • 歌劇
        省級(jí)期刊 1個(gè)月內(nèi)下單
        上海歌劇院
      • 家居主張
        省級(jí)期刊 1個(gè)月內(nèi)下單
        上海世紀(jì)出版股份有限公司;上海辭書出版社
      • 幸福生活指南
        省級(jí)期刊 1個(gè)月內(nèi)下單
        福建省廣播影視集團(tuán)
      服務(wù)與支付