關(guān)鍵詞:pacbio 轉(zhuǎn)錄組表達 第三代測序技術(shù) 新型異構(gòu)體檢測 多源映射
摘要:近年來,基于單分子測序技術(shù)的ISO-seq數(shù)據(jù)以其超長讀段長度被越來越多地應用于轉(zhuǎn)錄組新型異構(gòu)體預測研究,但目前大多數(shù)研究工作只用到全長讀段數(shù)據(jù),丟失了非全長讀段數(shù)據(jù)中較多有用信息,因而數(shù)據(jù)沒有得到充分利用。針對這一問題,本文在保留非全長讀段的基礎上提出了兩個能同時預測異構(gòu)體結(jié)構(gòu)和計算其表達比例的模型基于狄利克雷采樣的異構(gòu)體探測與預測(Dirichletsampling for isoform detection and prediction,DSIDP)和基于馬爾科夫鏈的異構(gòu)體探測與預測(Markovchain for isoform detection and predition,MCIDP)。兩個模型均從全長讀段中建立異構(gòu)體預測集,并采用全長讀段和非全長讀段計算異構(gòu)體表達比例。DSIDP將所有讀段比對至異構(gòu)體預測集,并使用Dirichlet采樣解決多源映射問題,MCIDP使用馬爾科夫鏈模擬基因外顯子之間的選擇性剪切,該模型還能預測出數(shù)據(jù)中沒有全長讀段的異構(gòu)體。本文采用模擬數(shù)據(jù)和真實數(shù)據(jù)驗證了兩個模型的有效性。
數(shù)據(jù)采集與處理雜志要求:
{1}基金項目:如果論文是項目成果,請按“項目名稱(項目號)”的形式寫出。項目名稱與項目號兩者都要有。
{2}稿件應具有科學性、創(chuàng)新性和實用性,論點明確、論據(jù)可靠、數(shù)據(jù)準確、邏輯嚴謹、文字通順。
{3}文中圖表或插圖請附清晰的原圖文件(tif. 或eps.格式,不低于600 像素)。
{4}注釋是對論文中某一特定內(nèi)容的解釋或補充說明,用帶圈數(shù)字注于當頁頁腳。
{5}稿件文字、標點、年代、數(shù)字等書寫方式均以國家有關(guān)規(guī)定為準。
注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社