關鍵詞:語義相似性 語義詞典 未登錄詞 低頻詞 單詞內部信息
摘要:研究了單詞語義相似性計算方法,其中基于知識的方法和基于語料的方法是兩種主要方法。這兩種方法及其融合方法都把單詞看成一個整體,主要利用單詞外部信息進行語義相似性計算。近些年,出現了一些利用單詞內部信息進行單詞語義相似性計算的工作,它們使用漢字、部首、詞根、詞綴等來計算單詞語義相似性。利用單詞的內部結構解析,解決從細粒度到粗粒度的語義相似性推導,最終計算出單詞間的語義相似性是單詞語義相似性計算的必然階段。當從外部信息轉向內部信息時,可以改善已有單詞語義相似性計算的性能,尤其是為低頻詞或未登錄詞的準確語義相似性計算提供了可能性。
計算機工程與應用雜志要求:
{1}本刊注釋一律采用國標形式,腳注尾注分開。引用文獻依次注明:作者、文獻名、出版社、出版年、出版時間、頁碼等項,并請核對無誤。
{2}編輯部收到稿件后立即編號,并給回執,日后聯系時請注明編號。在接到本刊回執3個月未接到稿件處理通知書,系該稿仍在審閱中。
{3}本刊可對來稿做必要的文字修改、刪節;投寄本刊的稿件自發表之日起,其網絡傳播權即授予本刊。
{4}篇名要簡明、具體、確切,一般不超過20個字,且應避免使用縮略詞、字符、代號和公式等。
{5}關鍵詞盡量使用MeSH詞匯,或從文題、摘要、正文中選取與本文研究或討論中的中心問題有關和必要的詞。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社