關(guān)鍵詞:關(guān)系數(shù)據(jù) 實(shí)體間關(guān)系提取 知識(shí)圖譜
摘要:知識(shí)圖譜需要從大量文本、圖像、數(shù)據(jù)庫(kù)等信息源中提取知識(shí),而關(guān)系數(shù)據(jù)庫(kù)是其中一個(gè)重要的數(shù)據(jù)源,存儲(chǔ)了大量高質(zhì)量數(shù)據(jù)。目前,有許多研究工作集中于從關(guān)系數(shù)據(jù)庫(kù)到RDF的轉(zhuǎn)換,主要考慮結(jié)構(gòu)信息的轉(zhuǎn)換,較少研究實(shí)體間語(yǔ)義關(guān)系的發(fā)現(xiàn)。提出一種基于隨機(jī)森林的數(shù)據(jù)庫(kù)實(shí)體間語(yǔ)義關(guān)系發(fā)現(xiàn)與轉(zhuǎn)換方法,將關(guān)系數(shù)據(jù)轉(zhuǎn)換為RDF,能夠有效地發(fā)現(xiàn)數(shù)據(jù)庫(kù)中實(shí)體之間的隱含語(yǔ)義關(guān)系。該方法構(gòu)建融合數(shù)據(jù)庫(kù)模式和數(shù)據(jù)內(nèi)容的特征向量,設(shè)計(jì)并實(shí)現(xiàn)基于隨機(jī)森林的實(shí)體間語(yǔ)義關(guān)系發(fā)現(xiàn)算法;基于發(fā)現(xiàn)的語(yǔ)義關(guān)系,實(shí)現(xiàn)多對(duì)多、一對(duì)多等實(shí)體語(yǔ)義關(guān)系的轉(zhuǎn)換。實(shí)驗(yàn)結(jié)果表明,相對(duì)于傳統(tǒng)的直接映射算法,該方法有更高的提取質(zhì)量,減少了最終生成知識(shí)圖譜中的冗余與錯(cuò)誤。
計(jì)算機(jī)應(yīng)用與軟件雜志要求:
{1}文章關(guān)鍵要素,需有英文摘要。
{2}文章主題明確,數(shù)據(jù)可靠,書(shū)寫(xiě)準(zhǔn)確,圖表清晰,文字簡(jiǎn)練,內(nèi)容齊全完整。來(lái)稿應(yīng)含以下部分:中英文題名、中英文摘要、中英文關(guān)鍵詞、中圖分類(lèi)號(hào)(本編輯部亦可代查)、正文以及必要的圖表、參考文獻(xiàn)。
{3}文稿要一稿一投,嚴(yán)禁各類(lèi)侵權(quán)行為。
{4}前言應(yīng)充分說(shuō)明研究工作的背景、意義、本文擬解決的問(wèn)題、采用的方法和手段,引出重要文獻(xiàn),全面評(píng)述相關(guān)研究工作,突出本工作的重要性和創(chuàng)新性,不要忽視國(guó)內(nèi)同行的工作。
{5}稿件注釋一律采用 “腳注”。注釋規(guī)則請(qǐng)參下附《注釋規(guī)范》,請(qǐng)投稿者嚴(yán)格遵循。
注:因版權(quán)方要求,不能公開(kāi)全文,如需全文,請(qǐng)咨詢(xún)雜志社