關鍵詞:情感識別 聲學特征 韻律特征 文本特征 特征融合
摘要:情感識別在人機交互中具有重要意義,為了提高情感識別準確率,將語音與文本特征融合。語音特征采用了聲學特征和韻律特征,文本特征采用了基于情感詞典的詞袋特征(Bag-of-words,BoW)和N-gram模型。將語音與文本特征分別進行特征層融合與決策層融合,比較它們在IEMOCAP四類情感識別的效果。實驗表明,語音與文本特征融合比單一特征在情感識別中表現更好;決策層融合比在特征層融合識別效果好。且基于卷積神經網絡(Convolutional neural network,CNN)分類器,語音與文本特征在決策層融合中不加權平均召回率(Unweighted average recall,UAR)達到了68.98%,超過了此前在IEMOCAP數據集上的最好結果。
數據采集與處理雜志要求:
{1}基金項目:如果論文是項目成果,請按“項目名稱(項目號)”的形式寫出。項目名稱與項目號兩者都要有。
{2}稿件應具有科學性、創新性和實用性,論點明確、論據可靠、數據準確、邏輯嚴謹、文字通順。
{3}文中圖表或插圖請附清晰的原圖文件(tif. 或eps.格式,不低于600 像素)。
{4}注釋是對論文中某一特定內容的解釋或補充說明,用帶圈數字注于當頁頁腳。
{5}稿件文字、標點、年代、數字等書寫方式均以國家有關規定為準。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社