關(guān)鍵詞:鄰域粗糙集 特征約簡 對(duì)稱機(jī)制 過濾機(jī)制 散列分桶
摘要:從高維異構(gòu)感知信息中提取有效特征是支撐物聯(lián)網(wǎng)系統(tǒng)預(yù)測與識(shí)別的基礎(chǔ).物聯(lián)網(wǎng)場景中通常包括多個(gè)多種感知節(jié)點(diǎn),系統(tǒng)通常會(huì)從感知數(shù)據(jù)中提取大量特征,其中不乏部分無關(guān)和冗余特征.這些無關(guān)及冗余特征會(huì)降低系統(tǒng)的運(yùn)行速度,引入冗余計(jì)算,更會(huì)影響后續(xù)的分類及預(yù)測等機(jī)器學(xué)習(xí)操作的性能.因而高效識(shí)別并提取低維有效的特征子集是物聯(lián)網(wǎng)數(shù)據(jù)分析所面臨的一大挑戰(zhàn).鄰域粗糙集方法能夠在保持?jǐn)?shù)據(jù)集可分性的前提下,識(shí)別和去除無關(guān)及冗余特征子集,從而達(dá)到降維效果.但由于現(xiàn)有基于鄰域粗糙集的特征約簡算法的計(jì)算開銷大、運(yùn)行時(shí)間長,故而并未得到廣泛應(yīng)用.提出了一種基于鄰域關(guān)系對(duì)稱性及決策值過濾策略的特征快速約簡算法EasiFFRA.EasiFFRA可通過改進(jìn)的散列分桶方法加速正域樣本計(jì)算,可檢驗(yàn)并過濾冗余決策值樣本,從而降低現(xiàn)有方法中由于重復(fù)距離評(píng)估所帶來的冗余計(jì)算.實(shí)驗(yàn)結(jié)果表明:EasiFFRA在實(shí)際采集的水質(zhì)數(shù)據(jù)集和多個(gè)不同樣本量及維度的公開數(shù)據(jù)集中平均加快75.45%的特征約簡時(shí)間,其約簡結(jié)果和已有鄰域粗糙集特征約簡算法等效,可有效解決物聯(lián)網(wǎng)數(shù)據(jù)分析中由冗余及無關(guān)特征導(dǎo)致的分類及預(yù)測精度下降問題,有重要應(yīng)用價(jià)值.
計(jì)算機(jī)研究與發(fā)展雜志要求:
{1}摘要200字左右,應(yīng)具有獨(dú)立性和自明性,闡明撰寫該文的目的、方法、結(jié)論并體現(xiàn)出原創(chuàng)性,不加引注。
{2}來稿請(qǐng)恪守學(xué)術(shù)道德,嚴(yán)禁抄襲。
{3}來稿經(jīng)審查后,編輯部有權(quán)對(duì)來稿作適當(dāng)文字修改.來稿不退,請(qǐng)作者自留底稿。
{4}間接引文通常以“參見”或“詳見”等引領(lǐng)詞引導(dǎo),反映出與正文行文的呼應(yīng),標(biāo)注時(shí)應(yīng)注出具體參考引證的起止頁碼或章節(jié)。標(biāo)注項(xiàng)目、順序與格式同直接引文。
{5}本期刊的文獻(xiàn)引證方式均采用頁下注(腳注),采用小五號(hào)宋體,每頁單獨(dú)編號(hào),注釋中卷次、出版時(shí)間、刊期、頁碼一律用阿拉伯?dāng)?shù)字表示。
注:因版權(quán)方要求,不能公開全文,如需全文,請(qǐng)咨詢雜志社