關(guān)鍵詞:pacbio 轉(zhuǎn)錄組表達(dá) 第三代測(cè)序技術(shù) 新型異構(gòu)體檢測(cè) 多源映射
摘要:近年來(lái),基于單分子測(cè)序技術(shù)的ISO-seq數(shù)據(jù)以其超長(zhǎng)讀段長(zhǎng)度被越來(lái)越多地應(yīng)用于轉(zhuǎn)錄組新型異構(gòu)體預(yù)測(cè)研究,但目前大多數(shù)研究工作只用到全長(zhǎng)讀段數(shù)據(jù),丟失了非全長(zhǎng)讀段數(shù)據(jù)中較多有用信息,因而數(shù)據(jù)沒(méi)有得到充分利用。針對(duì)這一問(wèn)題,本文在保留非全長(zhǎng)讀段的基礎(chǔ)上提出了兩個(gè)能同時(shí)預(yù)測(cè)異構(gòu)體結(jié)構(gòu)和計(jì)算其表達(dá)比例的模型基于狄利克雷采樣的異構(gòu)體探測(cè)與預(yù)測(cè)(Dirichletsampling for isoform detection and prediction,DSIDP)和基于馬爾科夫鏈的異構(gòu)體探測(cè)與預(yù)測(cè)(Markovchain for isoform detection and predition,MCIDP)。兩個(gè)模型均從全長(zhǎng)讀段中建立異構(gòu)體預(yù)測(cè)集,并采用全長(zhǎng)讀段和非全長(zhǎng)讀段計(jì)算異構(gòu)體表達(dá)比例。DSIDP將所有讀段比對(duì)至異構(gòu)體預(yù)測(cè)集,并使用Dirichlet采樣解決多源映射問(wèn)題,MCIDP使用馬爾科夫鏈模擬基因外顯子之間的選擇性剪切,該模型還能預(yù)測(cè)出數(shù)據(jù)中沒(méi)有全長(zhǎng)讀段的異構(gòu)體。本文采用模擬數(shù)據(jù)和真實(shí)數(shù)據(jù)驗(yàn)證了兩個(gè)模型的有效性。
數(shù)據(jù)采集與處理雜志要求:
{1}基金項(xiàng)目:如果論文是項(xiàng)目成果,請(qǐng)按“項(xiàng)目名稱(chēng)(項(xiàng)目號(hào))”的形式寫(xiě)出。項(xiàng)目名稱(chēng)與項(xiàng)目號(hào)兩者都要有。
{2}稿件應(yīng)具有科學(xué)性、創(chuàng)新性和實(shí)用性,論點(diǎn)明確、論據(jù)可靠、數(shù)據(jù)準(zhǔn)確、邏輯嚴(yán)謹(jǐn)、文字通順。
{3}文中圖表或插圖請(qǐng)附清晰的原圖文件(tif. 或eps.格式,不低于600 像素)。
{4}注釋是對(duì)論文中某一特定內(nèi)容的解釋或補(bǔ)充說(shuō)明,用帶圈數(shù)字注于當(dāng)頁(yè)頁(yè)腳。
{5}稿件文字、標(biāo)點(diǎn)、年代、數(shù)字等書(shū)寫(xiě)方式均以國(guó)家有關(guān)規(guī)定為準(zhǔn)。
注:因版權(quán)方要求,不能公開(kāi)全文,如需全文,請(qǐng)咨詢雜志社