關鍵詞:知識圖譜 知識三元組抽取 對抗訓練 端到端網絡 標注策略
摘要:知識圖譜作為一種有效表示現實世界的系統受到學術界和工業界廣泛關注,并由于其精準表示知識的能力被廣泛應用于信息服務、智慧搜索、自動問答等上層應用.知識圖譜的核心為三元組形式的實體和關系.現有知識圖譜遠不足以描述現實世界,因此,如何通過實體關系抽取方法來補全或者構建新的知識圖譜顯得至關重要.傳統流水線式的實體關系抽取方法會導致誤差傳遞,而已有的聯合抽取沒有充分考慮命名實體識別與關系抽取之間的聯系,從而降低抽取效果.針對上述問題,對知識三元組抽取方法進行了深入研究,提出了一種融合對抗訓練的端到端知識三元組聯合抽取方法.首先,采用了一種實體關系聯合標注策略,通過端到端的神經網絡抽取文本語義特征,并對文本進行自動標注;其次,模型在神經網絡中加入自注意力機制增強對文本信息的編碼能力,并通過引入帶偏置項的目標函數提高對相關聯實體的辨識能力;最后,模型融合了對抗訓練以提高魯棒性,改進抽取效果.在實驗部分,采用4種分析方法和3種評價指標對模型性能進行評價分析,實驗結果證明了模型在知識抽取上的性能明顯優于現有方法.
計算機研究與發展雜志要求:
{1}摘要200字左右,應具有獨立性和自明性,闡明撰寫該文的目的、方法、結論并體現出原創性,不加引注。
{2}來稿請恪守學術道德,嚴禁抄襲。
{3}來稿經審查后,編輯部有權對來稿作適當文字修改.來稿不退,請作者自留底稿。
{4}間接引文通常以“參見”或“詳見”等引領詞引導,反映出與正文行文的呼應,標注時應注出具體參考引證的起止頁碼或章節。標注項目、順序與格式同直接引文。
{5}本期刊的文獻引證方式均采用頁下注(腳注),采用小五號宋體,每頁單獨編號,注釋中卷次、出版時間、刊期、頁碼一律用阿拉伯數字表示。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社