關鍵詞:關系數據 實體間關系提取 知識圖譜
摘要:知識圖譜需要從大量文本、圖像、數據庫等信息源中提取知識,而關系數據庫是其中一個重要的數據源,存儲了大量高質量數據。目前,有許多研究工作集中于從關系數據庫到RDF的轉換,主要考慮結構信息的轉換,較少研究實體間語義關系的發現。提出一種基于隨機森林的數據庫實體間語義關系發現與轉換方法,將關系數據轉換為RDF,能夠有效地發現數據庫中實體之間的隱含語義關系。該方法構建融合數據庫模式和數據內容的特征向量,設計并實現基于隨機森林的實體間語義關系發現算法;基于發現的語義關系,實現多對多、一對多等實體語義關系的轉換。實驗結果表明,相對于傳統的直接映射算法,該方法有更高的提取質量,減少了最終生成知識圖譜中的冗余與錯誤。
計算機應用與軟件雜志要求:
{1}文章關鍵要素,需有英文摘要。
{2}文章主題明確,數據可靠,書寫準確,圖表清晰,文字簡練,內容齊全完整。來稿應含以下部分:中英文題名、中英文摘要、中英文關鍵詞、中圖分類號(本編輯部亦可代查)、正文以及必要的圖表、參考文獻。
{3}文稿要一稿一投,嚴禁各類侵權行為。
{4}前言應充分說明研究工作的背景、意義、本文擬解決的問題、采用的方法和手段,引出重要文獻,全面評述相關研究工作,突出本工作的重要性和創新性,不要忽視國內同行的工作。
{5}稿件注釋一律采用 “腳注”。注釋規則請參下附《注釋規范》,請投稿者嚴格遵循。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社