本書(shū)介紹了環(huán)形RNA全長(cháng)轉錄本序列重構和定量算法CircAST,該算法通過(guò)計算不同組織、不同疾病狀態(tài)下環(huán)形RNA轉錄本完整的序列組成和內部結構以及對環(huán)形RNA基于轉錄本水平的精確定量,幫助研究者更有效地篩選出具有潛在功能的環(huán)形RNA可變剪接異構體,為更加精準地全面解析環(huán)形RNA全長(cháng)轉錄本提供了重要的工具,對環(huán)形RNA功能的深入研究具有重要意義。 本書(shū)可供生物信息學(xué)、系統...
環(huán)形RNA(circularRNA,circRNA),也稱(chēng)為環(huán)狀RNA,是一類(lèi)經(jīng)由反向剪接事件產(chǎn)生、以共價(jià)鍵連接形成封閉環(huán)狀結構的特殊內源性非編碼RNA。近年來(lái),研究發(fā)現環(huán)形RNA廣泛存在于真核細胞內,且已證實(shí)某些環(huán)形RNA具有重要的生物學(xué)功能,包括充當miRNA(微RNA,小分子核糖核酸)分子海綿調控靶基因的表達、調控親本基因轉錄和選擇性剪接、翻譯短肽等。同時(shí),越來(lái)越多的研究發(fā)現環(huán)形RNA與包括癌癥在內的多種重大疾病密切相關(guān),有潛力成為疾病診斷的生物標志物或治療的靶點(diǎn)。然而目前大多數環(huán)形RNA的功能仍不甚清楚,在轉錄組測序大數據基礎之上利用現有的計算工具對環(huán)形RNA的反向剪接位點(diǎn)進(jìn)行識別之后,進(jìn)一步獲取環(huán)形RNA轉錄本的全長(cháng)序列并對可變剪接產(chǎn)物進(jìn)行定量是環(huán)形RNA功能研究中的首要關(guān)鍵環(huán)節,對理解環(huán)形RNA轉錄本的多樣性和表達模式、篩選有潛在生物學(xué)功能的環(huán)形RNA分子具有重要的意義。雖然已有研究在這方面做出了一些有益的嘗試,但是仍存在許多亟待解決的問(wèn)題。 本書(shū)針對環(huán)形RNA全長(cháng)序列的組裝和定量問(wèn)題提出一種新的算法,并以此開(kāi)展不同組織(小鼠睪丸和卵巢)以及不同狀態(tài)的樣本(人腦膠質(zhì)瘤樣本和對應的癌旁正常樣本)環(huán)形RNA可變剪接異構體的相關(guān)研究,以驗證算法在不同物種、不同組織的適用性。具體內容如下: 首先,為了解決環(huán)形RNA轉錄本全長(cháng)序列組裝問(wèn)題,筆者提出一個(gè)基于多剪接圖模型的算法CircAST。該算法全面考慮環(huán)形RNA轉錄本的結構特點(diǎn),利用轉錄組測序讀段的比對信息,將環(huán)形RNA所有可變剪接事件通過(guò)多剪接圖建模,并且將環(huán)形RNA轉錄本全長(cháng)序列組裝問(wèn)題轉化為擴展的最小路徑覆蓋(EMPC)問(wèn)題,解決了轉錄本組裝問(wèn)題中外顯子連接不確定性的核心難題。經(jīng)模擬數據和真實(shí)數據測試,CircAST算法在組裝環(huán)形RNA全長(cháng)轉錄本時(shí)有著(zhù)較好的表現,在與CIRCexplorer2、CIRI-full等同類(lèi)工具的比較中,也表現出較好的性能。 接著(zhù),針對環(huán)形RNA在轉錄本水平的定量問(wèn)題,筆者提出了一種基于期望最大化(EM)算法估計環(huán)形RNA轉錄本表達量的方法,并將該定量功能增加到CircAST算法中。該方法以模型為基礎考慮讀段在同一基因的不同環(huán)形轉錄本上的分配,選取針對環(huán)形RNA定量的似然函數,通過(guò)期望最大化算法估計參數的值,從而實(shí)現轉錄本的表達豐度估計。模擬數據的測試結果表明,無(wú)論是絕對定量還是相對定量,算法都表現出了良好的性能,同時(shí),對小鼠睪丸組織中的環(huán)形RNA轉錄本的定量結果進(jìn)行qPCR實(shí)驗,結果也驗證了算法定量的準確性。 隨后,為驗證算法CircAST的實(shí)用性,將其應用于小鼠兩個(gè)典型的生殖腺組織(睪丸和卵巢)的環(huán)形RNA測序數據,得到小鼠生殖腺組織中環(huán)形RNA全長(cháng)轉錄本表達譜,并篩選出差異表達的環(huán)形RNA轉錄本和mRNA轉錄本,構建circRNA-miRNA-mRNA相互作用調控網(wǎng)絡(luò )。此研究為更好地理解可變剪接事件導致的環(huán)形RNA轉錄本異構體在哺乳動(dòng)物睪丸和卵巢中生物學(xué)功能的差異、深入研究睪丸和卵巢內的基因表達調控機制奠定了基礎。 最后,基于環(huán)形RNA在癌癥的發(fā)生發(fā)展中所扮演的重要角色,以膠質(zhì)瘤為例,將CircAST應用于人類(lèi)腦膠質(zhì)瘤腫瘤樣本和癌旁正常樣本環(huán)形RNA測序數據,構建人腦膠質(zhì)瘤樣本中環(huán)形RNA全長(cháng)轉錄本表達譜,篩選出在膠質(zhì)瘤樣本中顯著(zhù)上調和下調的環(huán)形轉錄本,分析可變剪接事件產(chǎn)生的環(huán)形RNA轉錄本可能的生物學(xué)功能,并構建了circRNA介導的競爭性?xún)仍碦NA調控網(wǎng)絡(luò )。此工作為探索人腦膠質(zhì)瘤發(fā)生發(fā)展相關(guān)的環(huán)形RNA分子機制提供了研究基礎,為人腦膠質(zhì)瘤的臨床診斷和治療確定可能的分子標志物和治療靶點(diǎn)提供科學(xué)的參考依據。 本專(zhuān)著(zhù)研究開(kāi)發(fā)的算法CircAST為更加精準地全面解析環(huán)形RNA全長(cháng)轉錄本提供了重要的工具,通過(guò)計算不同組織、不同疾病狀態(tài)下環(huán)形RNA轉錄本完整的序列組成和內部結構,以及對環(huán)形RNA基于轉錄本水平的精確定量,可以幫助研究者更有效地篩選出具有潛在功能的環(huán)形RNA可變剪接異構體,對環(huán)形RNA功能的深入研究具有重要意義。 本著(zhù)作的研究得到南京醫科大學(xué)學(xué)術(shù)著(zhù)作出版項目、國家自然科學(xué)基金青年項目(No.61901225)、國家自然科學(xué)基金面上項目(No.62273175)的資助,在此表示衷心感謝。 由于我們的理論水平及實(shí)踐經(jīng)驗有限,書(shū)中疏漏和不足之處在所難免,懇請讀者給予批評指正。 作者 2024年1月
吳靜,博士,南京醫科大學(xué)副教授,碩士生導師,現任中國人工智能學(xué)會(huì )生物信息學(xué)與人工生命專(zhuān)委會(huì )委員,中國計算機學(xué)會(huì )生物信息學(xué)專(zhuān)委會(huì )委員,中國自動(dòng)化學(xué)會(huì )智能健康與生物信息專(zhuān)委會(huì )委員。主持和參與國家自然科學(xué)基金等項目多項,近五年發(fā)表國際國內學(xué)術(shù)論文10余篇,指導大學(xué)生創(chuàng )新創(chuàng )業(yè)訓練項目及全國大學(xué)生數學(xué)建模競賽等學(xué)科競賽,多人次獲獎。 宋曉峰,南京航空航天大學(xué)教授。主要研究領(lǐng)域為生物信息學(xué)與計算系統生物學(xué)。近幾年主持國家自然科學(xué)基金一項、江蘇省自然科學(xué)基金一項,主持校級教改項目三項,參與國家或部級科研項目十多項,以一作或通訊作者在國際SCI檢索學(xué)術(shù)期刊Nucleic Acids Research, Journal of Theoretical Biology, Journal of Medical Virology, BioSystems等發(fā)表論文14篇,EI、ISTP收錄論文30多篇。多次參與組織和參加國內國際學(xué)術(shù)會(huì )議。目前擔任:中國生物醫學(xué)物理學(xué)研究會(huì )理 事;中國電子學(xué)會(huì )生命電子學(xué)專(zhuān)業(yè)委員會(huì )委員;江蘇省生物醫學(xué)工程學(xué)會(huì )生物信息學(xué)專(zhuān)業(yè)委員會(huì )委員;Nucleic Acids Research, Computers in Biology and Medicine等多個(gè)國際雜志的審稿人,多個(gè)國際學(xué)術(shù)會(huì )議(WCCI2008, ACM BCB2011, BSBT2011,BSBT2010,BSBT2009,BSBT2008, IEEE BIBM2010, IEEE BIBM2011, IJCBS2009, AST2010, ICCC2010,ICCC2009)程序委員會(huì )委員,主席,分會(huì )主席等。
本書(shū)介紹了環(huán)形RNA全長(cháng)轉錄本序列重構和定量算法CircAST,該算法通過(guò)計算不同組織、不同疾病狀態(tài)下環(huán)形RNA轉錄本完整的序列組成和內部結構以及對環(huán)形RNA基于轉錄本水平的精確定量,幫助研究者更有效地篩選出具有潛在功能的環(huán)形RNA可變剪接異構體,為更加精準地全面解析環(huán)形RNA全長(cháng)轉錄本提供了重要的工具,對環(huán)形RNA功能的深入研究具有重要意義。 本書(shū)可供生物信息學(xué)、系統生物學(xué)、計算生物學(xué)等學(xué)科的研究人員參考,也可作為高等院校相關(guān)專(zhuān)業(yè)的教材或教學(xué)參考書(shū)。
第1章緒論001 1.1環(huán)形RNA概述003 1.2環(huán)形RNA的生物學(xué)功能005 1.3環(huán)形RNA的識別計算010 1.4環(huán)形RNA內部結構的探索及定量估計研究013 第2章環(huán)形RNA全長(cháng)轉錄本序列組裝的計算研究019 2.1引言021 2.2基于EMPC算法的環(huán)形RNA全長(cháng)轉錄本序列重構方法022 2.2.1基于參考基因組的轉錄本組裝022 2.2.2環(huán)形RNA全長(cháng)轉錄本序列組裝024 2.3模擬數據驗證027 2.3.1環(huán)形轉錄組測序模擬數據生成工具027 2.3.2模擬數據集030 2.3.3算法性能評估031 2.3.4環(huán)形RNA轉錄本重構的復雜性分析032 2.4實(shí)驗驗證034 2.4.1小鼠睪丸環(huán)形RNA測序數據的準備034 2.4.2小鼠睪丸環(huán)形RNA組裝結果035 2.4.3用RT-PCR和Sanger測序對組裝結果進(jìn)行驗證038 2.4.4算法對真實(shí)數據的重構效率分析051 2.5與現有算法的比較054 2.6小結058 第3章環(huán)形RNA轉錄本定量計算研究061 3.1引言063 3.2基于EM算法的環(huán)形RNA轉錄本定量計算方法064 3.3模擬數據驗證068 3.3.1模擬數據集068 3.3.2算法性能評估069 3.4實(shí)驗驗證072 3.5與現有算法的比較075 3.6人細胞系、小鼠睪丸和原雞肌肉中環(huán)形RNA的表達與分析076 3.7小結080 第4章小鼠睪丸和卵巢中環(huán)形RNA全長(cháng)轉錄本表達譜分析083 4.1引言085 4.2材料和方法088 4.2.1樣本數據集的制備088 4.2.2環(huán)形RNA全長(cháng)轉錄本序列組裝和定量分析089 4.2.3環(huán)形RNA可變剪接體的差異表達分析090 4.2.4功能富集分析090 4.2.5circRNA-miRNA-mRNA調控網(wǎng)絡(luò )構建090 4.3結果091 4.3.1小鼠睪丸和卵巢組織中環(huán)形轉錄本的概貌091 4.3.2小鼠睪丸和卵巢組織中環(huán)形轉錄本的表達特征099 4.3.3對差異表達環(huán)形轉錄本的分析103 4.3.4circRNA-miRNA-mRNA相互作用調控網(wǎng)絡(luò )111 4.4小結113 第5章人腦膠質(zhì)瘤樣本中環(huán)形RNA全長(cháng)轉錄本表達譜分析115 5.1引言117 5.2材料和方法119 5.2.1樣本數據集119 5.2.2環(huán)形RNA轉錄本序列重構和定量分析119 5.2.3差異表達環(huán)形RNA轉錄本的鑒定120 5.2.4GO功能富集和KEGG信號通路分析120 5.2.5miRNA預測和ceRNA網(wǎng)絡(luò )構建120 5.3結果121 5.3.1人腦膠質(zhì)瘤樣本中環(huán)形轉錄本的概貌121 5.3.2對照樣本和疾病樣本中環(huán)形轉錄本的特征125 5.3.3環(huán)形轉錄本差異表達分析130 5.3.4circRNA介導的ceRNA網(wǎng)絡(luò )137 5.4小結139 附錄142 附錄1縮略語(yǔ)142 附錄2小鼠睪丸組織環(huán)形RNA內部新的可變剪接事件144 附錄3RT-PCR實(shí)驗所用引物信息149 附錄4人類(lèi)HeLa細胞系中環(huán)形RNA內部新的可變剪接事件154 附錄5人類(lèi)HEK293細胞系中環(huán)形RNA內部新的可變剪接事件158 附錄6人類(lèi)Hs68細胞系中環(huán)形RNA內部新的可變剪接事件160 附錄7原雞肌肉組織中環(huán)形RNA內部新的可變剪接事件163 參考文獻164
ISBN:978-7-122-44992-4
語(yǔ)種:漢文
開(kāi)本:16
出版時(shí)間:2024-06-01
裝幀:平
頁(yè)數:176