国产亚洲精品性色Av片在线播放_午夜理论在线观看视频无码_亚洲国产综合久久天堂_欧美精品二区三区中文

中國(guó)科學(xué)院昆明植物研究所
location
當(dāng)前位置:首頁(yè) > 新聞動(dòng)態(tài) > 頭條新聞
left
新聞動(dòng)態(tài)
頭條新聞

細(xì)胞器基因組組裝利器——GetOrganelle正式在線發(fā)表

文章來源:中國(guó)西南野生生物種質(zhì)資源庫(kù)  |  發(fā)布時(shí)間:2020-09-12  |  作者:金建軍  |  瀏覽次數(shù):  |  【打印】 【關(guān)閉

 

  真核生物細(xì)胞器基因組主要包括線粒體和質(zhì)體(包括葉綠體、白色體等)所包含的全部DNA分子,是細(xì)胞質(zhì)遺傳的主要載體。在動(dòng)植物和真菌的單個(gè)細(xì)胞內(nèi),往往有多個(gè)(甚至成千上萬(wàn)個(gè))細(xì)胞器基因組單元的拷貝,這使得利用低覆蓋度的全基因組測(cè)序數(shù)據(jù)組裝得到完整的細(xì)胞器基因組成為可能。隨著DNA高通量測(cè)序技術(shù)的發(fā)展,測(cè)序成本急劇下降,低覆蓋度的全基因組測(cè)序數(shù)據(jù)得以大規(guī)模產(chǎn)生,如何快速、準(zhǔn)確地組裝細(xì)胞器基因組對(duì)后續(xù)生物學(xué)問題的研究至關(guān)重要。細(xì)胞器基因組序列在研究真核生物系統(tǒng)發(fā)育、譜系地理、雜交和物種鑒定等方面具有重要價(jià)值。1986Shinozaki等破解煙草葉綠體基因組以來,特別是近年來二代測(cè)序技術(shù)的快速發(fā)展,質(zhì)體系統(tǒng)發(fā)育基因組已成為解析植物系統(tǒng)發(fā)育關(guān)系不可或缺的重要手段之一。 

  中國(guó)科學(xué)院昆明植物研究所植物多樣性與基因組學(xué)大團(tuán)隊(duì)李德銖研究組和伊廷雙研究組多年來關(guān)注基于植物質(zhì)體基因組的系統(tǒng)發(fā)育、基因組結(jié)構(gòu)演化和DNA條形碼研究,逐步發(fā)展了基于質(zhì)體基因組數(shù)據(jù)分析的一套完善的研究體系,并取得了一系列重要進(jìn)展(Ma et al., 2014. Systematic BiologyZhang et al., 2017.New Phytologist;Li et al., 2019.Nature Plants;Zhang et al., 2020. Systematic Biology)。該團(tuán)隊(duì)重視質(zhì)體基因組分析方法的開發(fā)和應(yīng)用,已開發(fā)一個(gè)全新的質(zhì)體基因組注釋軟件PGA (Qu et al., 2019,Plant Methods)并得到廣泛應(yīng)用,并成為ESI高引用和熱點(diǎn)論文。 

  近來,針對(duì)已有細(xì)胞器基因組組裝軟件組裝流程存在的低效率、低成功率、低準(zhǔn)確度,以及需要大量人工介入等問題,該團(tuán)隊(duì)聯(lián)合中國(guó)科學(xué)院西雙版納熱帶植物園和美國(guó)賓州州立大學(xué)合作團(tuán)隊(duì)開發(fā)了一套全新的細(xì)胞器基因組組裝工具GetOrganelle,實(shí)現(xiàn)了大規(guī)模細(xì)胞器基因組快速、準(zhǔn)確地組裝。GetOrganelle的核心流程包括:1)通過“種子”序列獲得部分目標(biāo)相關(guān)reads,2)延伸reads獲得所有目標(biāo)相關(guān)reads,3)對(duì)reads進(jìn)行從頭組裝得到組裝圖形,4)過濾組裝圖形,5)識(shí)別細(xì)胞器組分并自動(dòng)導(dǎo)出所有可能的細(xì)胞器基因組結(jié)構(gòu)(圖1)。GetOrganelle在“baiting and iterative mapping”的基礎(chǔ)上提出了大大提高延伸效率的reads預(yù)分群算法;提出了適用于細(xì)胞器基因組的估算contigs拷貝數(shù)的算法,該算法能綜合組裝圖信息和測(cè)序深度信息(圖2)?;?0個(gè)植物物種的公開reads數(shù)據(jù)集的測(cè)試顯示,在計(jì)算資源消耗略高的情況下,GetOrganelle的默認(rèn)參數(shù)的完整成環(huán)率(78%)遠(yuǎn)高于目前使用最廣泛的工具NOVOPlasty的最好參數(shù)的結(jié)果(16%);而資源消耗接近甚至更低的情況下,GetOrganelle仍然能保持遠(yuǎn)高于NOVOPlasty的成環(huán)率。并且NOVOPlasty在K=23和K=31的情況下約20%~25%的假陽(yáng)性率(錯(cuò)誤結(jié)果謊稱完整成環(huán))(圖3)。在不同參數(shù)的測(cè)試下,GetOrganelle的結(jié)果一致性優(yōu)于NOVOPlasty。Read mapping進(jìn)一步顯示,GetOrganelle的結(jié)果準(zhǔn)確性不僅高于NOVOPlasty,也高于基于相同reads數(shù)據(jù)的已發(fā)表結(jié)果(圖4),并發(fā)現(xiàn)了部分已發(fā)表結(jié)果的明顯組裝錯(cuò)誤。在56個(gè)動(dòng)物數(shù)據(jù)和50個(gè)真菌數(shù)據(jù)測(cè)試中,GetOrganelle也獲得了比NOVOPlasty更高的線粒體基因召回率。值得一提的是,在Freudenthal et al. (2020) 針對(duì)主流葉綠體基因組組裝工具(包括chloroExtractor、Fast-Plast、GetOrganelle、IOGA、NOVOPlasty、org.ASM等)的基準(zhǔn)檢測(cè)文章中,GetOrganelle也獲得了遠(yuǎn)高于其他工具的成環(huán)率和準(zhǔn)確性,并被推薦作為默認(rèn)(組裝工具)選項(xiàng)。 

  2020年9月10日,該研究成果以 “GetOrganelle: a fast and versatile toolkit for accurate de novo assembly of organelle genomes”為題正式在線發(fā)表于國(guó)際遺傳學(xué)/生物技術(shù)權(quán)威期刊Genome Biology雜志上(https://doi.org/10.1186/s13059-020-02154-5)。 昆明植物研究所金建軍博士和西雙版納熱帶植物園郁文彬博士為該論文的并列第一作者,李德銖研究員和伊廷雙研究員為通訊作者。該研究得到中國(guó)科學(xué)院戰(zhàn)略性先導(dǎo)科技專項(xiàng)(XDB31000000)、國(guó)家自然基金重點(diǎn)國(guó)際(地區(qū))合作研究項(xiàng)目(No.31720103903)、中國(guó)科學(xué)院大科學(xué)裝置開放研究項(xiàng)目(2017-LSFGBOWS-02)和中國(guó)西南野生生物種質(zhì)資源庫(kù)“交叉合作團(tuán)隊(duì)”項(xiàng)目的資助。  

  GetOrganelle的源代碼于2016年4月在GitHub第一次上線。2018年5月,報(bào)道GetOrganelle的第一版預(yù)印稿在bioRxiv上線。2020年3月,GetOrganelle快裝版在Bioconda上線。截止發(fā)稿前,GetOrganelle的預(yù)印稿在谷歌學(xué)術(shù)搜索(Google Scholar)中已被引用超過230次。此外,GetOrganelle的動(dòng)物meta-mitogenomics測(cè)試版已經(jīng)上線,利用三代測(cè)序數(shù)據(jù)進(jìn)行組裝的功能正在開發(fā)中,該工具的擴(kuò)展新功能值得期待。 

 

圖1. GetOrganelle的工作流程圖 

 

圖2. GetOrganelle的contigs拷貝數(shù)估算及基因組結(jié)構(gòu)導(dǎo)出算法示例 

  

圖3. GetOrganelle和NOVOPlasty分別在50個(gè)公開植物數(shù)據(jù)上的四組不同參數(shù)的測(cè)試結(jié)果 

  

圖4. 基于Read mapping用50種植物的公開數(shù)據(jù),評(píng)估并比較GetOrganelle組裝質(zhì)量、NOVOPlasty組裝質(zhì)量的和已發(fā)表的質(zhì)體基因組的組裝質(zhì)量,統(tǒng)計(jì)三者在組裝質(zhì)量上最好(最多reads數(shù)、最高深度或者最低錯(cuò)誤率)的樣本個(gè)數(shù)。 

(責(zé)任編輯:李雪)

中國(guó)科學(xué)院昆明植物研究所

版權(quán)所有 Copyright © 2002-2025 中國(guó)科學(xué)院昆明植物研究所,All Rights Reserved 【滇ICP備05000394號(hào)
地址:中國(guó)云南省昆明市藍(lán)黑路132號(hào)  郵政編碼:650201    點(diǎn)擊這里聯(lián)系我們