English
創新創業Innovation
創新創業
當前位置: 首頁  > 創新創業  > 正文
水稻團隊發布基于深度學習模型預測植物基因組序列變異調控效應的網絡服務
發布時間:2021-05-31

5月25日,我校水稻團隊謝為博教授課題組發布了一項基于深度學習模型預測植物基因組序列變異調控效應的網絡服務,該服務還可用于分析序列中的順式調控元件。相關研究成果發表在國際學術期刊Nucleic Acids Research上。

全基因組關聯分析(GWAS)被廣泛用于農藝性狀重要調控位點的鑒定,然而GWAS獲得的顯著位點并不一定是關鍵變異位點。此外,如何將GWAS結果與調控機制聯系起來,目前仍充滿挑戰。通過變異(尤其是非編碼調控區域的變異)效應的預測,可幫助篩選GWAS結果中的關鍵變異以及候選基因的鑒定。

真核生物中核DNA被緊密的包裝成核小體,轉錄因子與DNA互作和行使轉錄調控功能將導致核小體解離,形成染色質開放區(open chromatin region,OCR)。因此,染色質開放狀態是影響基因表達的重要表觀遺傳因素。近年來,多項人類醫學中的研究表明,深度神經網絡模型可從基因組序列中提取復雜特征,這些特征部分代表了順式調控元件,因而可準確預測染色質開放狀態。利用染色質開放狀態數據訓練獲得的深度神經網絡模型,可評估非編碼區序列變異的效應及鑒定可能的順式調控元件。其原理是,利用模型分別預測非編碼序列變異對應的兩個單倍型染色質開放狀態,如兩個狀態間差異較大,表明該變異可能具有較大效應。當對一段非編碼序列中的每個堿基進行飽和突變(in silico saturated mutagenesis)并預測其效應,可鑒定出一些連續高影響力位點,有研究表明這些位點往往代表了順式調控元件。

盡管此類方法在人類醫學中已得到一定應用,但這一領域的研究在植物中仍關注較少。此外,深度學習模型的構建需花費大量計算資源,很難被普通實驗研究者直接利用。因此,植物中亟需可以幫助研究者快速評估序列變異調控效應以及鑒定序列中的調控元件在線網絡服務。

水稻團隊發布基于深度學習模型預測植物基因組序列變異調控效應的網絡服務

該研究中,謝為博教授課題組通過ATAC-seq技術獲得5種禾本科植物物種(包含4種作物)多個組織的高質量染色質可及性數據,并收集了已發表擬南芥數據,從中鑒定了OCR。利用各個物種對應的參考基因組序列以及OCR信息,使用深度學習模型框架DeepSEA進行訓練。通過評估,各模型曲線下面積(AUROC)在0.93-0.99之間,表明所構建的系列模型具有較高可用性。

謝為博教授課題組基于所獲得的深度學習模型,構建了PlantDeepSEA(http://plantdeepsea.ncpgr.cn)網絡服務,免費供所有用戶使用。該網站主要包含2項功能:一是Variant Effector,其目的是預測序列變異對于各組織中染色質可及性的影響,用戶可提交VCF文件進行變異效應預測;一是Sequence Profiler,該工具利用"in silico saturated mutagenesis"挖掘序列中的高影響力位點(High-impact sites,如順式調控元件)。用戶可選擇染色體編號和輸入基因組坐標、任意一段核苷酸序列或者包含一個或多個染色體區段的BED文件進行分析。由于計算資源所限,目前PlantDeepSEA允許1次提交最多2000個變異位點進行變異效應預測,以及5個區段進行調控元件分析。

我校博士后趙虎、碩士研究生涂卓為該論文共同第一作者,信息學院謝為博教授為該論文通訊作者,胡學海教授指導了部分研究工作。該研究數據分析工作得到武漢大學超算平臺及華中農大作物遺傳改良國家重點實驗室生物信息計算平臺支持和幫助,得到國家重點研發計劃(2016YFD0100803)與國家自然科學基金(31771755, 31922065)資助。

---友情鏈接---
華中農業大學 中國研究生招生信息網 中國學位與研究生教育信息網

版權所有:華中農業大學研究生院   黨委研究生工作部

地址:湖北省武漢市洪山區獅子山街1號華中農業大學    郵箱:yjs@mail.hzau.edu.cn    電話:027-87282049    郵編:430070   

中国农村妇女hdxxxx