• 您现在位置:首页发表文章》计算生物学团队发布300种植物 LTR 类转座子注释数据集,为解析松树等针叶树庞大基因组维持机制提供重要基础

计算生物学团队发布300种植物 LTR 类转座子注释数据集,为解析松树等针叶树庞大基因组维持机制提供重要基础

来源:        作者:       浏览次数:   发表时间(2021-07-21)

针叶树是北半球森林生态系统的建群种,具有显著的生态和经济价值,为重要的林业经营对象。针叶树基因组庞大而复杂,LTR 类转座子占其基因组的 70-80%,然而目前植物学界对该类转座子研究还很有限。人们对针叶树中LTR 类转座子的维持机制及其功能效应的认识还非常模糊。

编码基因仅仅是决定植物表型的部分因素,基因组的非编码序列同样起着重要作用。植物基因组中绝大部分是由所谓的垃圾序列(重复序列)构成,编码区的占比很小。转座子是构成基因组重复序列的主要成分,它们像病毒一样在基因组中不断复制扩张,按其复制方式可分为逆转录转座子(Class I retrotransposons)和非逆转录转座子(Class II DNA transposons)。越来越多的研究表明,转座子往往导致基因组结构变异、序列突变、基因丢失、基因融合、新编码基因的形成,也通过提供各类非编码基因、新的调控序列或改变甲基化和染色质构象模式等影响基因的表达,转座子是控制植物表型变异中不可忽视的因素。除了直接的功能效应,转座子也与基因组大小有紧密关联,被认为是基因组变庞大的重要原因。解析控制植物表型的各类编码和非编码因素是分子生物学研究的重要课题,也是高效遗传改良和分子设计育种的基础。

 

 

LTR 类转座子是植物基因组中占比最高的重复序列类型,它是逆转录转座子的一种。在玉米、小麦、松树等复杂基因组中,LTR 类转座子的比例超过或接近 70%,在其它植物基因组中占比也普遍超过了 50%。尽管 LTR 类转座子是基因组中的主导成分,起着显著的功能效应,然而由于不同物种中往往采用不同的注释算法,种间比研究很难进行,这严重限制着对这类转座子扩张机制、功能效应的深入分析。

 

 

研究团队收集了已发布的植物基因组数据,整合先进的识别和注释算法,用统一的策略完成了 300 种植物基因组的 LTR 注释。发布的信息包括:LTR 的基因组位置、所属亚类、LTR内编码区、TSD 序列、两端 LTR 序列的分化程度(LTR 的插入时间)等。该数据集可为后续 LTR 扩张及清除机制、LTR 转录及功能效应、LTR 形成基因重复、LTR 种间水平转移、LTR 对基因组大小变异作用等课题提供重要的基础,为解析松树等针叶树庞大基因组的构成和维持机制提供参考

该研究A comprehensive annotation dataset of intact LTR retrotransposons of 300 plant genomes”为主题发表在重要的多学科期刊 Scientific Data 上。

 

该研究得到国家自然科学基金31670664)、北京林业大学双一流建设项目(2019XKJS0308)、北京林业大学基础科研业务费(2018BLCB08)等基金项目的支持。

Copyright @ 2012-2013  北京林业大学林木育种国家工程实验室  北京林业大学69号信箱  联系电话:62336226