遗传密码的简并性

作者:神州
审核:神州

  在蛋白质翻译的过程中,核苷酸序列与氨基酸序列之间主要通过遗传密码建立信息上的联系,并进一步的通过tRNA进行实体上的联系。也就是说,遗传密码是联系蛋白质与核苷酸序列的重要桥梁。
  在遗传密码研究的早期,曾有科学家通过数学分析,认为只有用3个碱基决定1个氨基酸的方式才能满足编码20种氨基酸的需要。此后,Crick通过对噬菌体进行不同数量碱基的插入或缺失实验并对比其表现,证实了遗传密码为核苷酸三联体的假说。
  同时 ,Nirenberg和Matthaei利用人工合成的mRNA,以及蛋白质的体外翻译体系破译了一些简单的密码子与氨基酸的对应关系,例如UUU、CCC、AAA等。之后不久Nirenberg又通过硝酸纤维滤膜可以滞留核糖体与结合了对应氨基酸的tRNA以及mRNA的复合物的性质,继续进行其他遗传密码的破译。
  首先准备20个具有20种氨基酸以及核糖体的体外合成体系,20种氨基酸在各个体系中分别被C14标记。然后,用人工合成的三核苷酸RNA分别进行反应,反应后再将反应液用硝酸纤维滤膜过滤。理论上只有完整的核糖体-氨基酸-tRNA-mRNA复合体才能留在滤膜上,并且可以在滤膜上检测出较强放射性。所以用此方法就可以一一找出任意一氨基酸所对应的核苷酸序列。最终,科学家们以这种方法实现了除终止密码以外的其他全部61种遗传密码的破译。
  由于终止密码子不编码任何氨基酸,所以并不能用上述方法进行破译,只能另辟蹊径。1965年Garen找到了这个新方法,即通过研究E.coli终止突变株的回复突变的方式来推测分析终止密码子的序列。
  E.coli的碱性磷酸酶琥珀突变株是在该基因的色氨酸(UGG)位点突变为终止密码子造成的,Garen在获得了大量回复突变后研究了该位点在回复突变后产生的新氨基酸并分析了其所对应的序列,分别是Ser(UCG)Leu(UUG)Tyr(UAC)Lys(AAG)Gln(CAG)Glu(GAG)。对这些序列进行分析就可以得出,Trp(UGG)产生的终止突变即为UAG,从而完成了第一个终止密码子的证明。最后在1967年Brennr和Crick用这种方法完成了最后一个终止密码子的证明,并且根据证明过程中所用的终止突变的名称命名了三种终止密码子:UAG-琥珀密码子、UAA赭石密码子、UGA蛋白石密码子
  在得出所有编码氨基酸的密码子的序列后不难发现,密码子的数量要远大于氨基酸的数量,这种现象就被称为遗传密码的简并性。例如编码Leu的密码子就有四种,分别为CUU、CUC、CUA、CUG。而且通过观察其他编码对应氨基酸的密码子可以发现,对于任意一种氨基酸,其前两位密码子往往比较独特且固定,而第三位就比较多变。从这种现象我们大概就可以推测出密码子的第三位对于氨基酸的编码并不重要,而这也是氨基酸编码的一种重要机制,在一定程度上对遗传密码的简并性做出了贡献。
  由于tRNA的反密码子位于其下方的环形结构上,所以三位反密码子是以一个弧形结构排列的。而RNA上的密码子则是直线型的,这就导致两者并不能完全平行并进行比较标准的咬合。加之反密码子的第一位由于tRNA本身结构的特点本就具有较大的自由度,就使反密码子的第一位与密码子第三位之间可以不严格按照碱基互补配对原则进行配对。而如果反密码子中这一位点经过修饰,那就可以出现更多的配对关系。而这种配对原则使61种密码子仅用32个tRNA就可以识读,这一定程度上减少了编码tRNA所需的基因。
  遗传密码的简并性具有重要意义,这种性质允许生物的基因有比较大的“容错率”,极大的降低了基因突变造成的危害。遗传密码在这种解读机制下,即使一些位点的核苷酸发生了突变,也很有可能并不影响生物性状的表达,从而稳定了物种的繁衍。而且在氨基酸的编码方式中,还有另一重进一步降低突变风险的机制。
  之前我们说密码子的第三位对于氨基酸的编码并不重要,那么前两位密码子在编码过程中其何种作用呢?这与氨基酸的理化性质有一定联系。
  观察密码子与氨基酸的极性我们可以发现,第二位碱基相同的密码子所编码的氨基酸其物理或化学性质是相似的。即:一般情况下非极性或侧链不带电荷的氨基酸其密码子的第二位为C;疏水性比较强的氨基酸对应密码子的第二位则多为U;第二位为A或G所对应的氨基酸则一般为亲水氨基酸。在这种编码机制下只要密码子的第二位没有发生变化,即使最后所翻译出的氨基酸发生了改变也能保证其与原有氨基酸具有相似的功能,又进一步降低了基因突变带来的风险。