關(guān)鍵詞:xgboost算法 web安全 機(jī)器學(xué)習(xí)
摘要:常見的php-webshell檢測方法主要有靜態(tài)檢測方法和動態(tài)檢測方法兩類,相較于動態(tài)檢測方法,靜態(tài)檢測方法以其占用資源少,檢測周期短,效率高的優(yōu)點,獲得了更為廣泛的應(yīng)用,但是傳統(tǒng)的基于正則匹配的靜態(tài)檢測方法,不能有效識別混淆后的php-webshell腳本,也不能有效識別從未出現(xiàn)過的php-webshell腳本,新興的使用機(jī)器學(xué)習(xí)算法的靜態(tài)檢測方法又有著特征普適性差的缺點.針對以上問題,提出了一種基于文本向量的php-webshell檢測方法,使用n-gram算法和TF-IDF算法將php腳本執(zhí)行過程中產(chǎn)生的操作碼序列轉(zhuǎn)化為文本向量,以文本向量作為輸入特征,使用極限梯度提升算法XGBoost對php腳本分類,通過判斷分類結(jié)果,實現(xiàn)php-webshell檢測,實驗結(jié)果表明,所提方法能有效地檢測php-webshell,提高了php-webshell靜態(tài)檢測方法的準(zhǔn)確率.
數(shù)據(jù)通信雜志要求:
{1}正文:文內(nèi)標(biāo)題簡捷、層次分明。文字、標(biāo)點及數(shù)字的運用應(yīng)符合規(guī)范。
{2}多作者稿署名時須征得其他作者同意,排好先后次序,接“擬用通知”后不再改動。
{3}正文內(nèi)各級標(biāo)題處理如下:一級標(biāo)題為“一、二、三……”,二級標(biāo)題為“(一)、(二)、(三)……”,三級標(biāo)題為“1、2、3……”,四級標(biāo)題為“(1)、(2)、(3)……”。單獨成行。
{4}摘要應(yīng)具有獨立性和自明性,須說明論文的目的、方法、結(jié)果(包括主要數(shù)據(jù))和結(jié)論,著重于創(chuàng)新與發(fā)現(xiàn),以300字左右為宜。
{5}文稿首頁頁腳處注明投稿日期和通信作者簡介(包括姓名、出生年、性別、職稱、學(xué)位、研究方向、E-mail)。
注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社