關鍵詞:非易失性存儲器 多表連接 連接順序 數據庫
摘要:多表連接操作是嵌入式數據庫、數據倉庫等系統中的一個重要操作.因此,提升多表連接的性能能夠加快數據處理和分析的速度,進而提升系統的整體性能.新型的非易失性存儲器(Non VolatileMemory,NVM)具有內存級讀寫速度、存儲密度高、可字節尋址和持久化等優點,成為補充或替代DRAM的新型存儲設備.然而,直接將現有的多表連接算法應用在NVM上會帶來兩個問題:(1)現有算法不能充分發揮新型非易失性存儲器的優勢,無法展現較優的性能;(2)連接算法會生成大量中間表,對存儲設備造成大量寫操作.由于NVM的寫耐受度有限,現有多表連接操作極易造成NVM的損壞.該文考慮NVM寫耐受度有限的特性,旨在減少多表連接操作引起的對NVM的寫操作.首先,該文提出優化連接順序的NVjoin算法,該算法解析不同表之間的關聯性,并通過采樣的方法估算中間結果的大小,從而選擇較優的連接順序,盡可能減少NVM上的寫操作.其次,該文設計了一個組織中間結果的數據結構LWTab,該結構充分利用了NVM可字節尋址的特性,通過存儲數據的地址而非數據的方式,進一步減少連接過程中中間結果所產生的NVM寫操作.該文利用DRAM模擬NVM進行大量的測試實驗,結果表明,該文提出的算法在時間性能與NVM寫次數兩個方面均得到提升:與MySQL所提供的連接順序相比,NVjoin可以減少104.21倍的NVM寫操作并提升65.01%的性能.除此之外,LWTab可以在NVjoin的基礎上,進一步減少16.74倍的NVM寫操作以及提升71.86%的性能.
計算機學報雜志要求:
1.來稿要求論點明確,數據,條理清晰,文字精練,字跡清楚.
2.為了使審理過程順利進行,在投稿的同時,作者需附一份關于文章所述工作的背景。將研究背景同文章放在同一個文件中,另起一頁。并且需向編輯部聲明:稿件內容屬于作者的科研成果;署名無爭議;引用他人成果已注明出處;未公開發表過.
3.稿件首頁包括下列內容:題目、真實姓名、詳細工作單位、城市及郵政編碼、200字的中文摘要和3-5條關鍵詞.文末附上稿件的英文文摘,包括英文題目、漢語拼音的姓名、工作單位的英文譯名、200個單詞以上的英文摘要和3-5條與中文關鍵詞對應的英文關鍵詞.請將作者的Email、聯系地址、電話放在文章的首頁下方。
4.來稿必須做到清稿定稿.稿件中的外文字母必須分清大、小寫,正、斜體;上、下角的字母、數碼和符號,其位置高低應區別明顯;符號及時次出現時需要進行說明。
5.文中的計量單位一律使用《中華人民共和國法定計量單位》.文中圖表只附必要的,插圖要精繪,圖中文字書寫清楚.插圖和照片不得用復印件,必須是清繪圖和原照片.圖、表應貼在正文中的相應位置上.圖、表和公式分別用阿拉伯數字全文統一編號.
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社