作者:天羽
生物进化不仅发生在物种水平,也发生在分子水平。蛋白质是构成生命所必需的最基本的大分子物质,因此蛋白质的进化是生物进化的基础。事实上,不同蛋白质分子的进化速率是不同的。影响蛋白质进化的最主要因素是自然选择,其中,除了一小部分的正选择,绝大多数的蛋白质分子受到选择性抑制。通俗地说,就是在自然选择的作用机制下,其编码基因的转录和翻译效率、表达水平和宽度以及和其它大分子的相互作用等均受到抑制。蛋白质受到的选择性抑制越强,其进化速率越慢,也越趋于保守。
那么问题来了,为什么大部分蛋白质分子受到选择性抑制呢?我们首先想到的答案就是因为它重要。不难理清这个逻辑链条,因为如果一个蛋白质在生物体中有非常重要的作用,它的任何一点轻微改变都可能会造成对个体的伤害,因此自然选择的作用就是在群体中维持它的稳定,抑制它过快的进化。听起来很有道理,一个很有力的证据是表达量越高的蛋白编码基因,其进化也越趋于保守。基因表达量通常被认为与蛋白的重要性相关。
不过,也有另外的学者提出了不同的观点,因为他们发现那些非常重要的蛋白质和一些也不是那么重要的蛋白质之间的进化速率差异并不是很大,所以他们认为促使蛋白保守的原因是它们自身的脆弱性,禁不起太多的变异。也就是说当某个蛋白质分子积累了很多变异时,它的理化性质就会随着改变而使得它自身“散架”。
到底是什么原因抑制了蛋白质的进化呢?这个问题看似枯燥,但却是进化生物学中一个非常重要的问题。要对蛋白质的脆弱性和重要性进行比较,首先要找到合适的定量数据来代表这两个显得非常抽象的概念。科学家们找到了两个非常好的东西,一个叫无义突变(nonsense mutation),另一个叫错义突变(missense mutation)。这两种突变分别都是蛋白编码基因的突变类型之一,其中无义突变是指编码某个氨基酸的密码子变异以后形成了终止密码子或其它结构,造成蛋白质的合成中断。无义突变之后的蛋白质虽然还在,但基本丢失了功能,也就是说重要性不复存在了,因此可以作为衡量蛋白质重要性的标准。而错义突变是指密码子突变以后形成了新的氨基酸,这种突变通常会使得蛋白质的理化性质发生变化,因此可以作为衡量蛋白质脆弱性的标准。
科学家们用这两个突变的概念来研究蛋白质保守的驱动力。要了解这个过程,我们还要了解两个概念:第一个叫做选择系数(s),是用来衡量蛋白编码基因受到自然选择程度的,s越大说明受选择性抑制越强;第二个叫做非同义替代率(Ka),是用来衡量蛋白质保守程度的,Ka越小,蛋白越趋于保守。此外,选择合适的研究物种也是非常重要的,果蝇由于长期作为模式生物,已经积累了完备的数据,因此非常适合于这个研究的开展。
科学家分析了162个果蝇家系的13182个蛋白编码基因的进化,结果一共发现了1548个无义突变和181192个错义突变。并未出乎意料的是,无义突变的选择系数要远大于错义突变,也就是说丢失功能比改变结构对个体本身的危害更大。但是,当与非同义替代率相比较,却发现Ka与错义突变的选择系数密切相关,其相关系数达到Ka与无义突变的3倍。进一步检查了这两种突变与一些功能的关系,发现错义突变所受的选择压力与无论基因表达水平、基因表达特异性还是蛋白质相互作用程度都呈现更强的相关关系。
图1. 两种突变的选择系数对比
图2. 选择系数与Ka的相关性
这个研究表明,蛋白质在进化上保守的原因主要是由于其本身的脆弱性,而不是保守蛋白在生物网络中发挥重要功能,它的进化牵一发而动全局。确实,自然界的运行机制,有时候确实和我们想象的不大一样。
延伸阅读
1. Rose. 2001. Adaptation. In Encyclopedia of Biodiversity. Edited by Levin RA. San Diego Academic Press: 17-23.
2. Assis and Kondrashov. 2014. Conserved Proteins are fragile. Mol Biol Evol 31(2): 419-424.
中国科普博览-从水到陆专栏
首发
转载请注明出处:http://csar.blog.kepu.cn/