關(guān)鍵詞:兼類(lèi)詞消歧 兼類(lèi)詞詞典 兼類(lèi)詞語(yǔ)料庫(kù) 語(yǔ)言特征 條件隨機(jī)場(chǎng)模型
摘要:兼類(lèi)詞歧義直接影響詞性標(biāo)注的準(zhǔn)確率。本文針對(duì)越南語(yǔ)兼類(lèi)詞歧義問(wèn)題提出一種融合語(yǔ)言特性的越南語(yǔ)兼類(lèi)詞消歧方法。通過(guò)構(gòu)建越南語(yǔ)兼類(lèi)詞詞典和兼類(lèi)詞語(yǔ)料庫(kù),分析越南語(yǔ)的語(yǔ)言特征和兼類(lèi)詞特點(diǎn),選取有效的特征集;然后利用條件隨機(jī)場(chǎng)能添加任意特征等優(yōu)點(diǎn),在使用詞和詞性上下文信息的同時(shí),引入句法成分和指示詞特征,得到消歧模型。最后在兼類(lèi)詞語(yǔ)料上實(shí)驗(yàn),準(zhǔn)確率達(dá)到了87.23%。實(shí)驗(yàn)表明本文所提出的越南語(yǔ)兼類(lèi)詞消歧方法有效可行,可以提高詞性標(biāo)注正確率。
數(shù)據(jù)采集與處理雜志要求:
{1}基金項(xiàng)目:如果論文是項(xiàng)目成果,請(qǐng)按“項(xiàng)目名稱(chēng)(項(xiàng)目號(hào))”的形式寫(xiě)出。項(xiàng)目名稱(chēng)與項(xiàng)目號(hào)兩者都要有。
{2}稿件應(yīng)具有科學(xué)性、創(chuàng)新性和實(shí)用性,論點(diǎn)明確、論據(jù)可靠、數(shù)據(jù)準(zhǔn)確、邏輯嚴(yán)謹(jǐn)、文字通順。
{3}文中圖表或插圖請(qǐng)附清晰的原圖文件(tif. 或eps.格式,不低于600 像素)。
{4}注釋是對(duì)論文中某一特定內(nèi)容的解釋或補(bǔ)充說(shuō)明,用帶圈數(shù)字注于當(dāng)頁(yè)頁(yè)腳。
{5}稿件文字、標(biāo)點(diǎn)、年代、數(shù)字等書(shū)寫(xiě)方式均以國(guó)家有關(guān)規(guī)定為準(zhǔn)。
注:因版權(quán)方要求,不能公開(kāi)全文,如需全文,請(qǐng)咨詢(xún)雜志社