關(guān)鍵詞:文本分類 詞向量 卷積神經(jīng)網(wǎng)絡(luò) 主題模型
摘要:【目的】更加全面地提取文本語義特征,提高文本向量對(duì)文本語義的表示能力。【方法】通過卷積神經(jīng)網(wǎng)絡(luò)提取詞粒度、主題粒度和字粒度文本特征向量,通過“融合門”機(jī)制將三種特征向量融合得到最終的文本向量,并進(jìn)行文本分類實(shí)驗(yàn)。【結(jié)果】該模型在搜狗語料庫文本分類實(shí)驗(yàn)上的準(zhǔn)確率為92.56%,查準(zhǔn)率為92.33%,查全率為92.07%,F1值為92.20%,較基準(zhǔn)模型Text-CNN分別提高2.40%,2.05%,1.77%,1.91%。【局限】詞序關(guān)系范圍較小,語料庫規(guī)模較小。【結(jié)論】該模型可以更加全面地提取文本語義特征,得到的文本向量對(duì)文本語義表示能力更強(qiáng)。
數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn)雜志要求:
{1}所有作者的作者簡(jiǎn)介(姓名、工作單位、職稱、研究方向);通訊作者請(qǐng)?jiān)偬峁╇娮余]箱。
{2}稿件文責(zé)自負(fù)。編輯部有權(quán)對(duì)來稿進(jìn)行文字和技術(shù)性刪改,對(duì)實(shí)質(zhì)性內(nèi)容的修改,則應(yīng)征求作者同意。
{3}標(biāo)題序號(hào):可按四級(jí)小標(biāo)題的格式寫:一、(一)、1、(1);一級(jí)、二級(jí)標(biāo)題另起段,正文另起段;三級(jí)、四級(jí)小標(biāo)題另起段,但正文接排;正文內(nèi)序號(hào)用①……②……等。
{4}參考文獻(xiàn):(1)正文格式:作者,發(fā)表年(多版次文獻(xiàn)請(qǐng)同時(shí)提供第 1 版的發(fā)表時(shí)間),頁碼,外加圓括號(hào)。(2)文末格式:中、外文獻(xiàn)分開,各按音序排列。
{5}摘要應(yīng)反映論文的目的、方法及主要結(jié)果、結(jié)論,并充分反映論文的創(chuàng)新點(diǎn),表達(dá)簡(jiǎn)明、語義確切,以100 ~300 字為宜。
注:因版權(quán)方要求,不能公開全文,如需全文,請(qǐng)咨詢雜志社