關鍵詞:蛋白質磷酸化 生物信息 半監督學習 磷酸激酶預測
摘要:目的蛋白質磷酸化是通過激酶催化特定位點把磷酸基轉移到底物蛋白質氨基酸殘基的過程,是研究蛋白質活力及功能的重要機制。目前已鑒定的數千個磷酸化位點大多缺失激酶信息,為此本研究提出基于PU-learning的磷酸激酶預測算法,通過迭代標記磷酸位點,可以準確預測催化磷酸肽的磷酸激酶。方法首先該算法以PU-learning為框架,利用最大熵方差對不同種類的磷酸激酶自動篩選最佳閾值,從而提取每條磷酸肽上潛在的磷酸化位點,然后根據統計分析確定磷酸化位點對應的激酶,最后通過五折交叉驗證該算法在Phospho.ELM數據庫上的預測性能,并與現有算法對比。結果該算法的交叉驗證特異性和靈敏度比現有最好算法在單個數據集上最高提高4%及10%,其預測Phospho.ELM中數據準確度達到79.52%。結論基于PU-learning的磷酸激酶預測算法顯著優于現有算法,且可以準確預測Phospho.ELM數據庫中未知激酶信息的磷酸肽,在磷酸化實驗中具有較強的指導意義。
北京生物醫學工程雜志要求:
{1}注釋對正文特定內容的解釋與說明,以及未公開發表的資料和“轉引自”等類文獻的著錄,用圈碼標引,在頁下注文。
{2}稿件要遵守國家的相關法律法規,題材貼近實際、貼近基層、貼近群眾,主題新穎、健康向上。
{3}來稿應包括題名、作者署名及通訊地址、作者簡介、摘要、關鍵詞、中圖分類號、正文、注釋、參考文獻,并將題名、作者署名及通訊地址、摘要和關鍵詞。
{4}摘要:一般為500~600字。研究論文摘要應包括研究目的、方法、結果和結論;綜述論文摘要應包括論述主題、重要進展和前景展望。
{5}文章正文的標題、表格、圖、公式以及腳注應分別連續編號。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社