端粒到端粒(Telomere-to-Telomere,T2T)基因组作为物种参考基因组的终极形态,包含了该物种在个体层面上最完整的关键遗传信息,对于后续物种群体和基因功能研究都将起到巨大的推动作用。随着第三代测序技术的发展,以PacBio和Oxford Nanopore为代表的测序仪平台为重要物种的高质量基因组解析提供了有力支撑。
齿肋赤藓(Syntrichia caninervis)作为荒漠生物结皮中的重要物种,对于古尔班通古特沙漠生态系统的维持发挥了不可或缺的作用,近年来已经成为耐脱水“干而不死”(Drying without Dying)研究的主要模式物种,且能够耐受多种极端胁迫环境,受到广泛的关注。然而苔藓作为一个共生体系统,其高质量基因组的解析受到诸如单克隆株系难以获取以及内共生菌序列污染干扰等多种难题。
基于其重大的生态和科研价值,中国科学院新疆生地所张道远研究员团队针对上述难题,开发出了古尔班通古特沙漠齿肋赤藓成熟的单克隆组培体系,并利用三代测序技术获取了其内共生菌(类芽孢杆菌)的完整基因组序列,并通过优化的基因组组装策略克服了内共生菌等非核基因组序列干扰的难题,实现了齿肋赤藓13条染色体的完整无缝组装,全基因组最终生成长度为323.44 Mbp,N50为24.41 Mbp,单碱基准确率超过99.999%,是迄今已报道的质量最高的苔藓基因组。
该齿肋赤藓T2T基因组比此前发布的莫哈韦沙漠齿肋赤藓基因组有了质的提升,组装出此前遗漏的超过30 Mbp的染色体序列,填补了超过2万个染色体空白区域,并注释多出1500多个蛋白编码基因;发现了古尔班通古特沙漠和莫哈韦沙漠两个生态型的齿肋赤藓在性染色体上存在较大的结构变异。该齿肋赤藓T2T基因组共注释到677个转录因子基因,比此前版本的基因组多135个,此前未注释到的多个转录因子基因如RAV, TCP, BBR-BPC和VOZ转录因子基因均在此T2T基因组中得到完整的结构注释,显著提升了齿肋赤藓转录调控基因集的完整度。对关键的耐脱水相关基因家族如LEA和ELIPs的分析发现了更多的串联重复模式,转录组测序数据的回贴比率比此前版本有约10%的提升;该T2T基因组多维度的提升为后续的群体基因组学和基因功能等的研究提供了坚实的数据支撑。
着丝粒区作为基因组中较难组装的困难区域,对其精细结构的解析成为T2T基因组研究的关键点,为证实该基因组着丝粒区组装的完整性和准确性,利用从头设计合成的着丝粒蛋白抗体并结合CUT&Tag测序技术,精准定位了齿肋赤藓13条染色体的着丝粒区位置,发现了其不同于被子植物的由Copia转座子主导型的着丝粒结构,且齿肋赤藓着丝粒区更为狭小,着丝粒区的Copia转座子比其他区域的转位插入时间更近,这为更深入研究陆地植物着丝粒结构的演化模式提供了重要参照。
此外,乌柳(Salix cheilophila)是沙漠中的重要灌木,是杨柳科中对各类极端环境条件适应性较强的树种,从青藏高原到沙漠地区均有分布。为解析其超强的环境适应性演化机制,中国科学院新疆生地所张道远研究员团队与南京林业大学合作完成了乌柳端粒到端粒的高质量基因组的组装和注释,全部19条染色体均达到了无缝组装,单碱基准确度达到99.99%以上,LTR组装指数达到基因组金标水准,是迄今已报道的杨柳科植物第一套T2T基因组。该研究还利用多个杨柳科基因组内部的共线性重构了杨柳科基因组加倍前的9条祖先染色体,对乌柳的着丝粒结构进行详细的结构解析发现其存在不同类型的着丝粒重复序列单体。通过对乌柳全基因组扫描正向选择基因(PSGs),串联重复基因簇(TDGs)以及显著扩张家族基因(EGFs)进行综合分析,圈定了19个关键的适应性演化靶点;并结合对青藏高原和沙漠两种极端生境的乌柳进行重测序,发掘并验证了在两种极端环境中发生微妙变异的靶标基因,最终揭示了基因的串联重复加倍以及累加的正向选择压力是乌柳对极端环境适应性的重要驱动力。
上述相关研究成果分别以“Telomere-to-telomere genome of the desiccation-tolerant desert moss Syntrichia caninervis illuminates Copia-dominant centromeric architecture”为题发表在《Plant Biotechnology Journal》和“A telomere-to-telomere genome assembly of Salix cheilophila reveals its evolutionary signatures for environmental adaptation”为题发表在《Plant Communications》。中国科学院新疆生态与地理研究所高贝研究员为论文第一作者,张道远研究员为通讯作者。相关研究得到了国家自然科学基金国家级青年人才计划和第三次新疆综合科学考察等项目的资助。
文章链接:
https://doi.org/10.1111/pbi.14549
https://doi.org/10.1016/j.xplc.2024.101182
图1:齿肋赤藓完整基因组和精细着丝粒结构解析
图2:杨属和柳属基因组祖先核型重构和演化路径,以及乌柳高原和荒漠环境适应性演化关键靶点的靶定与功能验证