怎样从遗传角度科学地证明你是你
Science125个科学前沿问题解读
话说500万年前,一群猿与另一群猿一言不合,就地解散,从此分道扬镳,各自走向了不同的道路。岁月如梭,转眼就到了今天,一群猿进化成了黑猩猩,而另一群猿脱掉了身上的被毛,裸露出皮肤成为“裸猿”,除此之外裸猿还慢慢站了起来,解放双手直立行走,进化出了巨大的脑容量,发展了丰富的文化和复杂的语言。故事讲到这儿,想必大家都已经猜出我们人类就是所谓的裸猿。人类与黑猩猩分歧后进化出了很多独特的表型,而这些独特表型的幕后操纵者又是谁呢?
《科学通报》2017年第13期特邀中国科学院昆明动物研究所宿兵研究员课题组为您解读。
宿兵,中国科学院昆明动物研究所研究员, 理学博士, 博士生导师; 国家杰出青年科学基金获得者。毕业于武汉大学生物系并于中国科学院昆明动物研究所获博士学位, 曾在美国德克萨斯大学休斯顿人类遗传学中心从事博士后研究, 在美国辛辛那提大学医学院任助理教授。从事灵长类比较基因组学及现代人类起源和迁徙的研究。
每一种人类特异的表型性状的产生都不是一蹴而就的,通常都涉及到多个环节, 是一个非常复杂的过程,都是经历了进化上百万年的积累最后形成的。例如,人类大脑的进化涉及神经前体细胞的分化和迁移、轴突的导向、突触的数量, 以及新的细胞类型的产生等,每个环节的改变都伴随着很多遗传变异的积累。通过比较人类和其他非人灵长类基因组数据,研究人员已经发现了众多人类特异的遗传变异,这些变异使得我们成为我们。这些遗传上的变异,大致可以分为4类: 基因编码水平的改变、基因表达调控水平的改变、基因丢失和基因重复。这四个水平的`遗传变异,都可能对人类特异表型的产生有贡献。
“推动力1”基因编码水平的改变:蛋白质版本升级
生物体几乎所有功能的执行者都是蛋白质,所以人们很自然的想到一种推动人类进化的力量,即编码蛋白的基因序列的改变。起初,人们认为只有编码蛋白的基因序列才会起到功能作用,而这些相应蛋白功能的变化才会引起表型的变化,这就是蛋白质进化假说。该假说认为,基因编码区序列的改变会导致编码蛋白质的改变,产生不同的生物学效应。这种变化产生的蛋白新版本,有可能导致系统升级也有可能导致系统崩溃,因而受到自然选择的作用被清除或者保存下来。现在已发现很多基因的编码区的变异,与人类独特表型相关,比如和人类脑容量相关的MCPH1和ASPM及“语言基因”FOXP2等。
“推动力2” 基因表达水平的改变
作为生物功能的执行者,蛋白质的序列与功能固然重要,但是蛋白的表达量亦是生物表型决定的重要因素。1969年科学家们就提出,物种间表型的差异可能主要是由于调控元件的改变造成的。研究人员通过比对不同灵长类的基因组序列, 定义了一批在人类中加速进化的区域, 而这些加速进化的区域大多数都处在基因的调控区域,这也体现了基因调控区域的重要性。目前,研究者已经验证了一些调控区变异对人类进化的作用,如HACNS1作为增强子在下肢发育过程中具有重要的作用,这个增强子在人类中的同源序列与黑猩猩和猕猴相比,具有更强的增强子活性,这可能暗示着HACNS1在人类直立行走中扮演着重要的角色。近年来, 研究者通过比较人类和非人灵长类的多种组学数据发现表观遗传修饰、小RNA(microRNA)和长非编码RNA(lncRNA)等在人类进化过程中可能也具有重要作用。
“推动力3” 基因丢失:是福还是祸?
尽管生物进化似乎是向着更复杂更高等前进的,但进化并不仅仅是某些功能的获得,一些基因功能的丢失可能也能促进生物的进化。一些基因发生基因片段的丢失,或者通过添加或替换碱基导致基因不翻译或提前终止翻译, 使得基因失去功能或假基因化(gene loss)。1999年Olson博士提出Less-is-More 假说, 他认为基因丢失在人类进化过程中发挥重要作用。该假说提出人类通过一些关键基因功能的丢失,使人类失去很多与猿类相似的特征(如体表的毛发和宽大的下颌骨等)。
“推动力4” 基因重复
除了缺失,基因重复在人类进化过程中也具有重要作用。人类相较于其他物种存在大量特异的基因拷贝数变异。归结起来, 主要分为3类: (ⅰ) 最常发生的一类,即基因重复之后,其中一个拷贝退化, 失去功能,因而对表型不会带来影响; (ⅱ) 通过拷贝数的增加带来基因剂量效应;(ⅲ) 通过复制祖先型基因的部分或者全部,产生具有全新功能的基因。
当然我们说这些遗传水平上的变异对人类进化有着非常重要的贡献,绝不是空穴来风,现在已有很多变异被发现并有相当一部分得到了功能上的验证。