關鍵詞:名詞詞組模式 birch聚類算法 pmi算法
摘要:本文對于意見挖掘領域中的評價對象的修剪和聚類問題,提出使用K-means聚類算法和BIRCH聚類算法相結合的方式來進行評價對象的修剪和聚類。利用BIRCH算法類別聚類的功能對評價對象進行聚類,并刪除包含較少數據的簇來實現修剪評價對象;再通過對于剩下的簇使用K-means聚類算法來獲得最優評價對象。這種修剪聚類方法與以往的基于PMI算法修剪然后基于K-means聚類算法相比,減少了評價對象修剪時對語料庫的依賴,最終聚類的結果更加精準,而且BIRCH算法采用一次掃描數據庫的策略,可以有效提高速度。
軟件雜志要求:
{1}來稿若有基金項目或其他資金資助項目,請詳細列出基金或其他資金項目類型、名稱及編號,每篇來稿的基金項目或其他資金資助項目原則上不超過3個。
{2}編輯部收到稿件后立即編號,并給回執,日后聯系時請注明編號。在接到本刊回執3個月未接到稿件處理通知書,系該稿仍在審閱中。
{3}參考文獻盡可能使用近5年公開發表的文獻,數量在10—30條,采用順序編碼制著錄,依照其在文中出現的先后順序用阿拉伯數字標出,并將序號置于方括號中,排列于文后。
{4}每篇文稿均應標引3~8個中文及英文關鍵詞。
{5}來稿需注明作者的真實姓名、單位、地址、郵編、職務、專業等信息,寫明電子郵箱及電話以便聯系。凡學生來稿請務必注明學校、專業和年級。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社