蔡 途
基因是遗传物质的功能单位,它可以把遗传信息传给下一代。大多数生物的基因存在于DNA分子中,少数生物的基因是由RNA组成的。真核生物的基因主要位于细胞核内的染色体上,称为细胞核基因,按孟德尔式遗传。细胞质中的线粒体、叶绿体以及原核细胞的质粒中也含有基因,称为细胞质基因,其遗传方式是非孟德尔式的,表现为母系遗传。
等 位 基 因
1910年美国遗传学家摩尔根(T. H. Morgan)证明基因位于染色体上,并把位于同一条染色体上的基因称为连锁群。大多数真核生物的体细胞是二倍体细胞,细胞里的染色体是成对存在的,二者互为同源染色体;而生殖细胞里每种染色体都只有一条,所以是单倍体细胞。二倍体细胞每个基因也是成对存在的,每一对基因分别位于来自双亲的染色体的同一位置上,这个位置称为基因座。一对同源染色体同一基因座上的一对基因称为一对等位基因。例如,豌豆的高茎基因与矮茎基因互为等位基因。一个二倍体生物如果具有一对不同的等位基因,则这种生物为该基因的杂合子,反之则为纯合子。若杂合子的一对等位基因中只有一个能表达出性状,另一个不表达,则前者称显性基因,后者称隐性基因。如果一对等位基因同时表达,则称为共显性。
对个体而言,一对同源染色体的一个基因座上只有一对等位基因。但在一个生物群体中,一个基因座上的等位基因多于两种时,称为复等位基因。例如决定人类ABO血型系统的等位基因有三种,分别为IA、IB和i。就每个人而言,只可能具有这3种复等位基因中的1种或2种,从而表现出特定的血型。在这里,IA和IB对i而言是显性,IA和IB是共显性,i是隐性。
基因概念的发展
1950年代初,美国遗传学家麦克林托克(B. Meclintock)在玉米控制因子的研究中指出,某些遗传因子是可以转移位置的。后来的研究发现,在原核生物和真核生物中均有基因转移的现象,即染色体上的基因不是固定不动的,而可以从一个座位转移到另一个座位,甚至从一条染色体转移到另一条染色体,这就是跳跃基因,统称转座子。
传统的观点认为,一个结构基因是一段连续的DNA序列,1970年代后期发现绝大多数真核生物基因都是不连续的,其中被一些不编码序列所隔开,一个基因断裂成若干个内含子和外显子,故称为断裂基因。
1977年,在噬菌体中还发现了重叠基因,一个基因序列可被包含在另一个基因中,两个基因序列可能部分重叠。当两个或两个以上的基因共有一段DNA序列时,这种“你中有我,我中有你”的基因即为重叠基因。
假基因是没有功能的基因,它具有与功能基因相似的序列,但由于有许多突变以致失去了原有的功能。假基因是由功能基因演变而来,可以看做是进化的一种遗迹。
基 因 突 变
基因的结构变化称为基因突变。当构成核苷酸的碱基发生两种嘌呤或两种嘧啶之间互换时,称转换突变;当嘌呤和嘧啶之间发生互换时,称颠换突变。这两类突变统称点突变。当基因的DNA序列中增加或减少核苷酸时,称为插入突变或缺失突变。
突变的后果可分为:错义突变,即因密码子改变而编码另一种氨基酸;同义突变,突变后的密码子仍编码同一种氨基酸;无义突变,密码子突变成终止密码子,使基因编码的多肽链在该密码子处终止,导致肽链缩短而失去功能;移码突变,增加或减少的核苷酸数目不是3的倍数时,三联体密码子的阅读框发生变化,导致合成面目全非的多肽链。
自然条件下发生的基因突变称自发突变,人工诱发条件下的突变称为诱发突变(诱变)。诱变因素包括物理因素(如射线)、化学物质(如烷化剂、亚硝胺等)和生物因素(如病毒等)。突变后的基因是可以遗传的。
从表型性状看,突变可分为:形态突变,主要影响生物的形状、大小、色泽等形态结构;生化突变,主要影响生物的代谢过程,导致某些生化功能的改变或丧失;致死突变,主要影响生物的生活力,导致个体死亡;条件致死突变,在特定条件下死亡。
人工诱变在遗传育种中有广泛的应用,在基因工程技术出现之前,它是人工改造生物遗传性的主要手段,如通过诱变和筛选育成了高产、抗逆和优质的作物品种或菌株。基因突变大多对生物体是有害的,人体基因的突变往往是包括癌、心血管系统等严重疾病的主要原因,但是突变又是在自然选择压力下产生新性状的手段,对生物进化而言是必不可少的。
基因表达与调控
生物体的所有遗传性状都由基因所控制。基因不仅可以通过复制把遗传信息传递给下一代,还可以使遗传信息得到表达。不同人种之间头发、肤色、眼睛、鼻子等不同,是基因差异所致。
从宏观上说,基因表达就是生物体的基因型在与环境共同作用下实现其表型。1909年丹麦遗传学家约翰森(W. L. Johannsen)提出基因型(生物的遗传基础)与表型(生物表现出来的性状)的概念,其中就蕴含了基因表达的思想。从分子水平上说,基因表达是指基因产生其产物如RNA和蛋白质的过程。1958年,DNA双螺旋结构的发现者之一克里克(F. Crick)提出遗传信息的流向是从DNA到RNA,再到蛋白质,即基因表达的“中心法则”,基因表达的每一步都受到精确的调节与控制。后来的研究还证明,在特殊情况下,遗传信息可以从RNA流向DNA。
从DNA生成RNA的过程称为转录,它是基因表达的第一步。该过程依赖于RNA多聚酶催化。转录过程从DNA模板上的启动子开始,随后RNA多聚酶即与DNA模板结合。转录过程起动后,RNA链不断延伸。当终止因子结合到DNA分子上时,转录过程即终止。转录出来的RNA分子需经加工成为有功能的成熟mRNA分子,才能进一步指导合成蛋白质。
逆转录是以RNA为模板合成DNA。1970年在致癌的RNA病毒中发现了以RNA为模板催化合成DNA的一种酶,称为逆转录酶。RNA病毒通过逆转录侵入寄主DNA。
翻译是指把mRNA的核苷酸序列转换为蛋白质的氨基酸序列,这两种序列间的对应关系是通过密码子决定氨基酸的形式建立起来的。三个连续的核苷酸构成一个密码子,四种核苷酸按三个一组可有64种组合,即有64种密码子。生物界除极个别生物外,用的都是同样的遗传密码。
密码子在编码氨基酸过程中,tRNA是把mRNA的核苷酸序列与蛋白质的氨基酸序列联系起来的关键分子。它把特定的氨基酸送到已结合了mRNA的核糖体上,每种氨基酸都有相应的tRNA。遗传密码有64种密码子,可是基本氨基酸只有20种,因此,一种氨基酸会有多个密码子,这种现象称遗传密码的简并性,编码同一种氨基酸的密码子互称同义密码子。这样,即使一个碱基发生替换,也不至于引起蛋白质氨基酸的变化,从而把碱基突变的影响减少到最低限度。虽然一种氨基酸有几种密码子,但密码子的使用频率是不均等的,各种生物编码某种氨基酸往往较多地采用其中一种,这种现象是遗传密码的偏爱性。
基因表达受到环境因子的作用,有着精确的时空调控形式。单细胞生物有几千个基因,哺乳动物有几万个基因,除了与保持生物体生命存在有关的少数基因一直处于表达状态外,大部分基因只在生命周期的某一时刻和生物体的某一部位中表达,而且表达的量也是受到控制的。
基因表达的调控可发生在转录、转录后加工和翻译阶段。调控是通过多种调控元件实现的,各种调控作用之间还存在相互作用,由此形成一个复杂而精致的调控网络,支配着基因的表达。基因表达受到与该基因处于同一条染色体上某一个DNA序列的调控,称为顺式作用。一个基因编码的产物调控另一个基因的表达,称为反式作用,这两个基因多半不在同一条染色体上。使基因处于转录活性状态的是正调控,反之则是负调控。