關(guān)鍵詞:主題語(yǔ)義標(biāo)注 概率主題模型 隱含狄利克雷分布
摘要:【目的】對(duì)面向主題模型的主題自動(dòng)語(yǔ)義標(biāo)注方法進(jìn)行總結(jié)與評(píng)述,以促進(jìn)主題模型的發(fā)展與應(yīng)用。【文獻(xiàn)范圍】在Web of Science和CNKI數(shù)據(jù)庫(kù)中分別以“Topic Labeling OR Topic Labelling OR Topic Tagging ORTopicIndexing”和“主題模型AND(標(biāo)注OR標(biāo)簽)”等檢索式進(jìn)行檢索,通過(guò)手工篩選獲得代表性文獻(xiàn)57篇。【方法】對(duì)相關(guān)論文進(jìn)行深入閱讀與分析,以主題標(biāo)注過(guò)程中主題標(biāo)簽的生成來(lái)源為線(xiàn)索,對(duì)已有方法進(jìn)行分類(lèi)與比較分析。【結(jié)果】面向主題模型的主題自動(dòng)語(yǔ)義標(biāo)注包括候選標(biāo)簽生成與排序兩個(gè)主要步驟,根據(jù)候選標(biāo)簽的生成來(lái)源可分為依靠自身語(yǔ)料庫(kù)和依靠外部語(yǔ)料庫(kù)兩類(lèi)方法。【局限】目前該領(lǐng)域的研究還不是很豐富,分析與評(píng)述不夠系統(tǒng)和全面。【結(jié)論】該領(lǐng)域的研究仍具有較大探索空間,面向社交媒體內(nèi)容的主題語(yǔ)義標(biāo)注是未來(lái)研究方向,可結(jié)合更豐富的知識(shí)庫(kù)并采用深度學(xué)習(xí)技術(shù)進(jìn)行改進(jìn)提升。
數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn)雜志要求:
{1}所有作者的作者簡(jiǎn)介(姓名、工作單位、職稱(chēng)、研究方向);通訊作者請(qǐng)?jiān)偬峁╇娮余]箱。
{2}稿件文責(zé)自負(fù)。編輯部有權(quán)對(duì)來(lái)稿進(jìn)行文字和技術(shù)性刪改,對(duì)實(shí)質(zhì)性?xún)?nèi)容的修改,則應(yīng)征求作者同意。
{3}標(biāo)題序號(hào):可按四級(jí)小標(biāo)題的格式寫(xiě):一、(一)、1、(1);一級(jí)、二級(jí)標(biāo)題另起段,正文另起段;三級(jí)、四級(jí)小標(biāo)題另起段,但正文接排;正文內(nèi)序號(hào)用①……②……等。
{4}參考文獻(xiàn):(1)正文格式:作者,發(fā)表年(多版次文獻(xiàn)請(qǐng)同時(shí)提供第 1 版的發(fā)表時(shí)間),頁(yè)碼,外加圓括號(hào)。(2)文末格式:中、外文獻(xiàn)分開(kāi),各按音序排列。
{5}摘要應(yīng)反映論文的目的、方法及主要結(jié)果、結(jié)論,并充分反映論文的創(chuàng)新點(diǎn),表達(dá)簡(jiǎn)明、語(yǔ)義確切,以100 ~300 字為宜。
注:因版權(quán)方要求,不能公開(kāi)全文,如需全文,請(qǐng)咨詢(xún)雜志社