關鍵詞:立場檢測 主題短語 關系矩陣 句向量
摘要:微博立場檢測是判斷一段微博文本針對某一目標話題所表達的觀點態度是支持、中立或反對.隨著社交媒體的發展,從海量的微博數據中挖掘其蘊含的立場信息成為一項重要的研究課題.但是現有的方法往往將其視作情感分類任務,沒有對目標話題和微博文本之間的關系特征進行分析,在基于深度學習的分類框架上,擴展并提出了基于Bert-Condition-CNN的立場檢測模型,首先為提高話題在文本中的覆蓋率,對微博文本進行了主題短語的提取構成話題集;然后使用Bert預訓練模型獲取文本的句向量,并通過構建話題集和微博文本句向量之間的關系矩陣Condition層來體現兩個文本序列的關系特征;最后使用CNN對Condition層進行特征提取,分析不同話題對立場信息的影響并實現對立場標簽的預測.該模型在自然語言處理與中文計算會議(NLPCC2016)的數據集中取得了較好的效果,通過主題短語擴展后的Condition層有效地提升了立場檢測的準確度.
計算機系統應用雜志要求:
{1}參考文獻按GB/T 7714-2005《文后參考文獻著錄規則》采用順序編碼制著錄,依照其在文中出現的先后順序用阿拉伯數字加方括號標出。
{2}文責自負。概不接受抄襲稿件。本刊概不退稿,請作者自留底稿。
{3}請勿一稿多投,三個月內未接到本刊錄用通知可另行處理。
{4}文題:力求簡明、醒目,反映出文章的主題。中文文題一般以20個漢字以內為宜。
{5}正文應層次清楚,方便閱讀,行文符合規范。正文中的各級標題分別為:“1”、“1.1”、“1.1.1”等。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社