bbw丰满大肥奶肥婆,韩国电影两个女人,亚洲一区二区三区含羞草

^{<blockquote id="xw5jb"></blockquote>}

投稿策略

期刊推薦

雜志分類

首頁學術雜志科普訂閱 SCI期刊投稿經驗期刊咨詢文秘服務論著出書出版社

首頁 > 期刊 > 數據分析與知識發現 > 基于均值漂移算法的文本聚類數目優化研究【正文】

基于均值漂移算法的文本聚類數目優化研究

趙華茗; 余麗; 中國科學院文獻情報中心; 北京100190

關鍵詞：均值漂移文本聚類聚類數聚類有效性

摘要：【目的】探索最佳文本聚類數目的優化方法,為提升文本聚類算法的有效性和質量提供參考。【方法】結合TF-IDF和Word2Vec算法,提取TopN關鍵詞向量作為語料庫文本特征表達;結合均值漂移算法、聚類有效性指標(Silhouette)和均方誤差(MSE)指標,確定最佳文本聚類數目。【結果】Top 4 500關鍵詞向量規模能較好呈現文本特征;基于均值漂移算法確定的最佳文本聚類數與人工研判優化的聚類數相符。【局限】選取的實驗數據集合不夠充足,缺少在其他領域的應用對比。【結論】本文方法可以在無監督方式下高質量完成文本聚類個數的確定。

數據分析與知識發現雜志要求:

{1}所有作者的作者簡介（姓名、工作單位、職稱、研究方向）；通訊作者請再提供電子郵箱。

{2}稿件文責自負。編輯部有權對來稿進行文字和技術性刪改，對實質性內容的修改，則應征求作者同意。

{3}標題序號：可按四級小標題的格式寫：一、（一）、1、（1）；一級、二級標題另起段，正文另起段；三級、四級小標題另起段，但正文接排；正文內序號用①……②……等。

{4}參考文獻：（1）正文格式：作者，發表年（多版次文獻請同時提供第 1 版的發表時間），頁碼，外加圓括號。（2）文末格式：中、外文獻分開，各按音序排列。

{5}摘要應反映論文的目的、方法及主要結果、結論，并充分反映論文的創新點，表達簡明、語義確切，以100 ～300 字為宜。

注：因版權方要求，不能公開全文，如需全文，請咨詢雜志社

投稿咨詢免費咨詢