關(guān)鍵詞:語義相似性 語義詞典 未登錄詞 低頻詞 單詞內(nèi)部信息
摘要:研究了單詞語義相似性計(jì)算方法,其中基于知識(shí)的方法和基于語料的方法是兩種主要方法。這兩種方法及其融合方法都把單詞看成一個(gè)整體,主要利用單詞外部信息進(jìn)行語義相似性計(jì)算。近些年,出現(xiàn)了一些利用單詞內(nèi)部信息進(jìn)行單詞語義相似性計(jì)算的工作,它們使用漢字、部首、詞根、詞綴等來計(jì)算單詞語義相似性。利用單詞的內(nèi)部結(jié)構(gòu)解析,解決從細(xì)粒度到粗粒度的語義相似性推導(dǎo),最終計(jì)算出單詞間的語義相似性是單詞語義相似性計(jì)算的必然階段。當(dāng)從外部信息轉(zhuǎn)向內(nèi)部信息時(shí),可以改善已有單詞語義相似性計(jì)算的性能,尤其是為低頻詞或未登錄詞的準(zhǔn)確語義相似性計(jì)算提供了可能性。
計(jì)算機(jī)工程與應(yīng)用雜志要求:
{1}本刊注釋一律采用國標(biāo)形式,腳注尾注分開。引用文獻(xiàn)依次注明:作者、文獻(xiàn)名、出版社、出版年、出版時(shí)間、頁碼等項(xiàng),并請(qǐng)核對(duì)無誤。
{2}編輯部收到稿件后立即編號(hào),并給回執(zhí),日后聯(lián)系時(shí)請(qǐng)注明編號(hào)。在接到本刊回執(zhí)3個(gè)月未接到稿件處理通知書,系該稿仍在審閱中。
{3}本刊可對(duì)來稿做必要的文字修改、刪節(jié);投寄本刊的稿件自發(fā)表之日起,其網(wǎng)絡(luò)傳播權(quán)即授予本刊。
{4}篇名要簡明、具體、確切,一般不超過20個(gè)字,且應(yīng)避免使用縮略詞、字符、代號(hào)和公式等。
{5}關(guān)鍵詞盡量使用MeSH詞匯,或從文題、摘要、正文中選取與本文研究或討論中的中心問題有關(guān)和必要的詞。
注:因版權(quán)方要求,不能公開全文,如需全文,請(qǐng)咨詢雜志社