關鍵詞:集成學習 bagging算法 聚類 剪枝
摘要:針對增加集成學習Bagging算法中分類器的差異性,提高集成學習算法模型的魯棒性,研究了基于k-means聚類技術對集成學習算法Bagging進行剪枝。在基礎Bagging算法中融合對Bagging分類器的聚類,然后在不同簇中選擇具有代表價值的分類器為最終集成學習預測結果投票,并在多個機器學習數據集上驗證這種提高差異性的方法與基本Bagging性能的差異。經過仿真實驗最終得出在算法迭代10次的前提下,改進的Bagging算法較常規Bagging算法在10個實驗數據集中提高了7個數據集的預測精度,其精度提高的平均值在3%;在算法迭代100次的前提下,改進的Bagging算法較常規Bagging算法在10個實驗數據集中提高了9個數據集的預測精度,其精度提高的平均值為2.5%。為復雜數據庫環境下Bagging算法的應用提供了新思路。
光學與光電技術雜志要求:
{1}摘要需概述文章研究的目的、主題、論點等,一般為150~300字。
{2}來稿必須為原創性作品,此前未經公開發表。嚴禁抄襲、剽竊和一稿多投,如有發現,將永不刊用該作者來稿。
{3}來稿經審查后,編輯部有權對來稿作適當文字修改.來稿不退,請作者自留底稿。
{4}標題:一般單獨占行,居左;段首小標題,前空兩格,后空一格。
{5}正文中內容與圖、表、注釋內容不得重復。所附圖、表請插入正文相應位置。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社