(资料图)
基因组学面临的一个主要挑战是辨别数十亿个碱基中哪些碱基改变了有机体的表型并影响了健康和疾病风险。过去对碱基的选择性压力的证据,无论是高度保守的还是快速进化的,都是功能重要性的标志。在所有哺乳动物中没有变化的碱基可能塑造对有机体健康至关重要的表型。在某些物种中快速进化的碱基,或仅在具有共同适应性状的物种中发生变化的碱基,可能塑造出支持在特定的生态环境中生存的表型。比如在冬眠的物种中,识别与细胞复活的非凡能力有关的碱基,可能为治疗的发现提供信息。
进化分析的能力和分辨率随着所比较的物种的数量和多样性的增加而增加。通过分析数百种胎盘哺乳动物的基因组,一个国际研究团队在一项新的研究中可以检测出基因组中哪些碱基是特别保守的(受限制的),而且可能在编码区域和非编码区域具有重要功能。通过纳入代表胎盘哺乳动物所有目的物种,并使用一种不需要指定人类为参考物种的方法来进行基因组比对,他们探索了其他物种的不寻常性状。相关研究结果发表在2023年4月28日的Science期刊上,论文标题为“Evolutionary constraint and innovation across hundreds of placental mammals”。
Zoonomia项目的哺乳动物比较基因组学资源是迄今为止最全面和统计学上最有力的,有427种哺乳动物的蛋白编码区比对和240种代表胎盘哺乳动物所有目的胎盘哺乳动物的全基因组比对。这些作者估计了人类基因组中至少有10.7%相对于中性进化的重复序列是进化保守的,并确定了大约1.01亿个明显受限的单碱基(错误发现率<0.05)。他们编列了4552个至少20个碱基长的超保守元件,这些超保守元件对240种胎盘哺乳动物中的98%以上而言是相同的。
许多受限制的碱基没有已知的功能,说明了使用进化方法取得发现的潜力。80%受限制的碱基位于编码蛋白质的外显子之外,一半在ENCODE(Encyclopedia of DNA Elements)资源中没有功能注释。受限制的碱基在人类种群中往往变化较小,这与纯化选择(purifying selection)是相一致的。濒临灭绝的物种在受限位点的替换很少,这可能是因为严重有害的等位基因已经从它们的小群体中被清除。
图片来自Science, 2023, doi:10.1126/science.abn3943。
通过将Zoonomia项目的基因组资源与表型注释配对,这些作者发现了与不同物种中的不同表型---包括嗅觉、冬眠、大脑大小和发声学习---相关的基因组元件。他们将基因组特征(比如嗅觉受体基因的数量)与物理表型(比如嗅觉鼻甲的数量)相关联。通过比较冬眠的物种和非冬眠的物种,他们将涉及线粒体紊乱、预防热应激和长寿的基因与这种生理上令人关注的表型联系起来。他们使用一种基于机器学习的方法,利用来自少数物种的数据预测数百个物种的组织特异性顺式调控元件的活性,将非编码序列的变化与人类的特殊性状---大脑大小和发声学习---联系起来。
综上所述,大规模的比较基因组学为探索基因组如何随着哺乳动物适应广泛的生态环境而进化,以及发现哪些基因组特征是跨物种的,哪些基因组特征是人类特有的,提供了新的机会。要实现这一潜力,必须要有一致定义的表型的高质量数据。通过与其他领域的研究人员合作,比较基因组学可以解决人类健康和基础生物学方面的问题,同时指导保护对这些发现至关重要的生物多样性的努力。(生物谷 Bioon.com)
参考资料:
Matthew J. Christmas et al. Evolutionary constraint and innovation across hundreds of placental mammals. Science, 2023, doi:10.1126/science.abn3943.
关键词: