關(guān)鍵詞:端到端指代消解 結(jié)構(gòu)化嵌入 詞性 成分句法樹 文檔句法壓縮樹
摘要:在LEE等人提出的端到端指代消解模型基礎(chǔ)上,考慮中文行文特點(diǎn),提出一種融合結(jié)構(gòu)化信息的中文指代消解模型。壓縮文檔中所進(jìn)行有句子對應(yīng)的成分句法樹并獲取文檔壓縮樹葉節(jié)點(diǎn)深度,采用成分句法樹的結(jié)構(gòu)化嵌入(SECT)方法將結(jié)構(gòu)信息進(jìn)行向量化處理,將詞性、文檔壓縮樹葉節(jié)點(diǎn)深度與SECT信息作為3個特征向量引入模型中進(jìn)行中文指代消解。在CoNLL2012數(shù)據(jù)集中的測試結(jié)果表明,通過結(jié)合上述3個特征,可使該模型的中文指代消解性能得到有效提高,其平均F1值可達(dá)62.33%,較基準(zhǔn)模型提升5.28%。
計算機(jī)工程雜志要求:
{1}文獻(xiàn)按作者姓氏的第一個字母依A-Z順序分中、英文兩部分排列,中文文獻(xiàn)在前,英文文獻(xiàn)在后。引文中的英文書名及期刊名用斜體,論文題目寫入“”號內(nèi)。
{2}來稿應(yīng)是未以任何形式公開發(fā)表過的論文,亦不接受一稿多投的文章。稿件寄出1個月未接到本刊通知即可自行處理。
{3}本刊已許可中國知網(wǎng)以數(shù)字化方式復(fù)制、匯編、發(fā)行、信息網(wǎng)絡(luò)傳播本刊全文。如有異議,請在投稿時說明,本刊將按作者說明處理。
{4}標(biāo)題之下如“(1)(2)”和“①②”序數(shù)不分行顯示。
{5}作者簡介:第一作者姓名(出生年月),性別,畢業(yè)院校及學(xué)位,職稱,研究方向。
注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社