關鍵詞:神經網絡加速器 模型壓縮 負載均衡 嵌入式設計
摘要:神經網絡在嵌入式端的應用日益廣泛,為滿足嵌入式端低功耗,低延遲等特點,通常的解決方案是針對長短記憶序列LSTM模型(Long-Short Term Memory)進行壓縮,并定制專用的硬件加速器.當LSTM模型經過剪枝等壓縮操作后,其網絡模型將變得稀疏且不規則,會給PE(Process Element)運算單元帶來負載不均衡的問題.通過排序的方法,將權重矩陣按一定的規則重新分發給各個PE單元,并在此基礎上針對稀疏化的模型定制專用的硬件單元.在賽靈思zynq系列XCZU9EG.2FFVB1156E開發板上進行實驗,實驗結果顯示,當PE單元多消耗0.314%硬件資源的情況下,其運算速度取得了2%的提升.
南京大學學報·自然科學雜志要求:
{1}基金項目的成果或論文,請在首頁注明基金項目類別、課題項目名稱及編號。
{2}稿件要求資料真實可靠,內容充實,論點明確,推論嚴謹,設計合理,數據準確,結構嚴密,層次分明,文通句順,字跡端正。
{3}題名:恰當、準確、簡明、清楚的反映論文全部重要信息,盡可能將表達核心內容的主題詞放在題名開頭,保證檢索的敏感性和特異性。慎用縮略語、特殊符號、疾病例數等。一般不超過20個漢字。
{4}參考文獻緊接正文,重復文獻請以第一次出現的次序標注。
{5}摘要須簡潔客觀地反映文章主要內容及觀點,字數在300字以內。關鍵詞是反映文章主要內容及觀點的詞或詞組,數量為3~8個,多個關鍵詞之間用分號分隔。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社