久热精品在线视频,思思96精品国产,午夜国产人人精品一区,亚洲成在线a

<s id="x4lik"><u id="x4lik"></u></s>

      <strong id="x4lik"><u id="x4lik"></u></strong>

      非平衡分類技術(shù)在人群糖尿病疾病風險預測模型中的應(yīng)用

      武海濱; 李康; 楊麗; 胡如英; 鐘節(jié)鳴; 游頂云; 郭彧; 卞錚; 李立明; 陳錚鳴 浙江省疾病預防控制中心; 310051; 哈爾濱醫(yī)科大學; 浙江醫(yī)院; 昆明醫(yī)科大學; 中國醫(yī)學科學院; 北京大學; 英國牛津大學

      關(guān)鍵詞:風險預測 非平衡分類 機器學習 流行病 

      摘要:目的分析比較幾種常用的非平衡分類技術(shù)在人群糖尿病疾病風險預測模型中的應(yīng)用。方法利用中國慢性病前瞻性研究浙江省桐鄉(xiāng)市項目點基線調(diào)查數(shù)據(jù)和隨訪數(shù)據(jù),使用機器學習算法建立人群糖尿病發(fā)病風險的預測模型,同時探討欠采樣、過采樣、SMOTE技術(shù)及替換切點技術(shù)對分類器性能的影響。結(jié)果本研究中神經(jīng)網(wǎng)絡(luò)預測模型的AUC值最高,達0.7971,經(jīng)最優(yōu)切點的選擇和分類后,靈敏度和特異度分別為0.7149和0.7431,模型具有較高的預測能力,同時較好的平衡了靈敏度和特異度的分布。采樣法對不同分類器的AUC值影響不同,一般欠采樣比過采樣具有更高的AUC值;隨著SMOTE中少數(shù)類比例的上升,AUC出現(xiàn)下降的趨勢。結(jié)論使用神經(jīng)網(wǎng)絡(luò)結(jié)合替換切點技術(shù)建立的人群糖尿病5年發(fā)病風險模型具有較高的預測能力,并能夠較好的處理非平衡數(shù)據(jù)的影響。

      中國衛(wèi)生統(tǒng)計雜志要求:

      {1}計量單位以國家法定計量單位為準;統(tǒng)計學符號按國家標準《統(tǒng)計學名詞及符號》的規(guī)定書寫。

      {2}本刊維護首發(fā)權(quán),切勿一稿多投。稿件寄出3個月內(nèi)未收到用稿通知者,作者可自行處理。來稿一律不再退還。

      {3}文章題名應(yīng)簡潔、確切、真實反映文章的主題特色。不超過20字,避免使用非公知公用的縮略字、代號等(一般不用副標題)。

      {4}參考文獻:引文務(wù)必準確,參考文獻表中列出的應(yīng)限于作者直接閱讀過的、最主要的、發(fā)表在正式出版物上并且在文章中直接引用的文獻;按GB7714-87的規(guī)定采用順序編碼標注制著錄。

      {5}通訊作者(第一作者)簡介:包括姓名、出生年、性別、民族(指少數(shù)民族)、籍貫、職稱(學位)及研究方向(附Email與電話號碼)。

      注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社

      中國衛(wèi)生統(tǒng)計

      北大期刊
      1-3個月下單

      關(guān)注 9人評論|0人關(guān)注
      相關(guān)期刊
      服務(wù)與支付