四、基本组织

由于DNA分子中核苷酸序列分析以及一级结构与功能相关的研究,使得人们有可能进一步了解DNA一级结构与基因组织的关系。已经证实,自然界极大多数生物体遗传信息贮存在DNA的核苷酸排列顺序中,因此,基因是DNA的一个片段,只有少数病毒的遗传信息贮存在RNA分子中。DNA分子中不同区域有不同功能,有些区域可编码蛋白质(最终产物是蛋白质),有些区域可编码RNA(最终产物是tRNA和rRNA),有些序列则与调控有关。那么一个DNA分子能携带多少基因呢?如果以平均1000个碱基对可编码一个3kD的蛋白质计算,猴病毒(SV40)DNA分子量为3.0×105,有5000碱基对可编码5种蛋白质。人染色体DNA有2.3×109碱基对,可编码200万以上的基因,但实际上,最多可编码基因数为2~3万。这是由于真核细胞DNA分子除编码蛋白质和RNA等结构基因外,有相当部分DNA顺序属于非编码区,而原核细胞DNA由于分子较小,必需充分利用有限的核苷酸序列。各种生物体内DNA分子的大小见表18-2。

表18-2 各种生物体内DNA分子的大小

来源 分子量 碱基对数目 长度
噬菌体фX174 0.6μm
腺病毒(SV40 1.6×106 4500 1.5μm
鼠线粒体 3.0×106 14000 4.9μm
噬菌体λ 9.5×106 50000 17μm
噬菌体T2或T4 3.3×107 200000 67μm
大肠杆菌染色体 1.3×108 4500000 1.5μm
人染色体 3.0×109 125000000 4.1μm

1.真核生物的基因组织根据某一段核苷酸顺序在整个DNA分子中出现的频率不同可分为以下几种:

(1)单拷贝顺序(singlecopy sequence):在整个DNA分子中只出现一次或少数几次,主要是编码蛋白质的结构基因。除组蛋白、角蛋白和肌动蛋白以外,几乎所有的蛋白质基因都是单拷贝顺序,平均为1000碱基对。单拷贝基因在整个基因组织中所占比例最高。在人的细胞中约占DNA含量的一半。

(2)中等重复顺序(moderatelyrepetitive sequences):有些基因如核蛋白体RNA基因、tRNA基因、组蛋白基因等在DNA分子中可重复出现几十到几千次,约占人细胞DNA含量的30~40%。以rRNA为例,在大肠杆菌中重复频率为7而果蝇中可重复千次。可见真核细胞中重复顺序比原核细胞高得多。

(3)高重复顺序(highlyrepetitive sequences):可重复几百万次。往往是简单的重复顺序,如蟹的T-A-T-A-T-A-T。也有的较长如非洲绿猴DNA是以172个碱基对的顺序为基础重复几万次。高重复顺序一般位于异染色质上,多数不编码蛋白质或RNA,其功能还不太清楚,主要是起间隔作用,可能与调控有关。

在重复顺序中还有一种反转重复顺序(inverted repetitivesequences)。其特点是一段碱基呈现回文结构,即一条单链回折即可形成互补的双链,故称为回文结构(palindromicstructure)或发夹结构(hairpin structure)。这种结构对基因的复制与转录可能具有调节 控制功能。

真核细胞中单拷贝顺序和重复顺序常常是中间隔排列的。不仅如此,在一个基因内部往往被一个或几个额外的顺序分割成若干片段,这种插入到基因内部的顺序称为插入顺序或内含子(intron)。内含子是不编码的顺序,而编码的碱基顺序则称为外显子(exon)。插入顺序是真核细胞DNA最主要的特征。

真核生物由于存在着较多的重复顺序、特殊的插入顺序以及控制区和其它多余顺序,使得DNA总长度往往大于编码的结构基因,因此,实际基因数往往小于DNA分子。

2.原核生物的基因组织原核生物DNA分子较小,基因组织也较简单,一般具有以下特点:

(1)DNA分子绝大部分用于编码蛋白质,不编码部分(又称间隔区)通常包含控制基因表达的顺序。例如,噬菌体фX174中只有5%是非编码区。

(2)功能相关的基因常常串联在一起,并转录在同一个mRNA分子中,称为多顺序反子。这种现象在真核生物中是很少见的。

(3)基因重叠:例如фX174的E基因全部包括在D基因内,B基因则包括在查基因内。这种现象主要发现在病理DNA分子中,可能是由于DNA分子太小又要装入相当量的基因的缘故。