第一节 载脂蛋白基因结构(当前章节内容组合)

一、ApoAⅠ、AⅡ、AⅣ、CⅠ、CⅡ、CⅢ及E的基因结构的类同性

载脂蛋白AⅠ、AⅡ、AⅣ、CⅠ、CⅡ、CⅢ以及E的基因结构非常相似。除ApoAⅣ缺少第1个内含子外,其余的载脂蛋白基因均由三个内含子与四个外显子组成(如图4-1所示)。内含子的分布位置几乎相同。第一个内含子截断5'未翻译区,第二个内含子截断信号肽的编码区,靠近信号肽的切割部位,第三个内含子截断编码成熟蛋白质的区域。尽管ApoAⅣ缺少第一个内含子,它的第二及第三内含子的分布与其他载脂蛋白相同。载脂蛋白AⅠ、AⅡ、CⅠ、CⅡ、CⅢ、E基因的前三个外显子以及ApoAⅣ基因的前二个外显子的长度颇为相近,它们之间长度的不同主要取决于第四个或第三个(ApoAⅣ)外显子的长短。这七种载脂蛋白基因结构的类同支持如下假说,即这些基因起源于一个共同的前体,通过部分或完全的基因重复的机制衍化而来。

载脂蛋白AⅠ、AⅡ、AⅣ、CⅠ、CⅡ、CⅢ以及E的基因结构示意图

图4-1 载脂蛋白AⅠ、AⅡ、AⅣ、CⅠ、CⅡ、CⅢ以及E的基因结构示意图

宽方块代表外显子,细线代表内含子或5'及3'侧翼区。在外显子区内:两端的空方块代表5'及3'未翻译区;斜线方块代表信号肽区;位于信号肽与成熟肽之间的窄空方块代表前肽(Prosegment)区。图中的数值表示各个外显子的长度(核苷酸对的数目)。(源出:L.Chan,Klin.Wochenschr.67:227,1989)

二、载脂蛋白B的基因结构

与上述载脂蛋白基因的结构相比较,载脂蛋白B的基因结构具有显着的差异。后者长达43000核苷酸碱基对,含有28个内含子与29个外显子。其中外显子26与29分别长达7572与1906碱基对。外显子26编码载脂蛋白B的第1379至3903个氨基酸,它比迄今为止所发现的哺乳动物基因的任何外显子都长3倍之多。这种特长的外显子是否由一些短外显子融合所致尚不清楚。在载脂蛋白B的内含子中,已发现有6种重复DNA序列。其中某些特征序列模式已成为流行病学及家族研究的工具。

载脂蛋白B基因表达的产物有ApoB100和ApoB48,前者由4536个氨基酸组成,后者包含2152个氨基酸。载脂蛋白B48是由小肠RNA剪切酶修饰ApoB信使RNA所产生的。小肠ApoB信使RNA在第6666个核苷酸的位置上含U,而肝ApoB信使RNA的同一位置上为C。由U取代C导致了一个终止翻译密码子(UAA)的产生。UAA取代了编码ApoB100第2153个氨基酸谷氨酰胺的CAA密码子。故在小肠ApoB基因表达的产物ApoB48仅含2152个氨基酸。约占ApoB100组成的48%(见图4-2)。这种ApoB信使RNA剪切机制在哺乳动物的分子生物学研究领域内是空前未有的先例。这种机制的存在有何生理意义还待进一步的探讨。

载脂蛋白B基因结构以及ApoB100与ApoB48合成示意图

图4-2 载脂蛋白B基因结构以及ApoB100与ApoB48合成示意图

载脂蛋白B基因的29个外显子均由竖线表示出来,其中两个特长的外显子26个和29作了特别的标记。位于外显子之间的28个间隙代表28个内含子。图中的碱基对数目分别代表载脂蛋白B基因、载脂蛋白B100信使RNA以及ApoB48信使RNA的长度。UAA和TAA为终止翻译密码子,CAA为编码谷氨酰胺的密码子。(源自Young S G Circulation82(5):1597,1990)

三、载脂蛋白(a)的基因结构

载脂蛋白(a)的基因由10~45个内含子和11~46个外显子组成(见图4-3A)。这种变异主要取决于Kringle(丹麦烤卷饼)-4功能区的数目,此数目可高达37。其中24个Kringle-4功能区核苷酸序列完全相同,均由342核苷酸碱基对组成。第24、27、28及29区仅相异于3个核苷酸。其他的区有11~71核苷酸序列的不同。Apo(a)基因的结构与血纤维蛋白溶酶原的基因结构相似(见图4-3A与图4-1B)。其中信号肽编码区100%的等同。其他区域的类似程度在75%~94%不等。这提示Apo(a)与血纤维蛋白溶酶原基因由同一个前体衍化而来。正是由于这个类同性,脂蛋白(a)不仅与脂类代谢有关。而且也参与血液凝固的机制。

Apo(a)与血纤维蛋白溶酶原基因结构(A)与cDNR结构(B)的比较

图4-3 Apo(a)与血纤维蛋白溶酶原基因结构(A)与cDNR结构(B)的比较

在图4-3A中,数值Ⅰ-XIX标记的竖棒代表外显子的数目与序列。外显子间的间隙为内含子。在Apo(a)的基因结构中,n代表Kringle-4功能区的数目是变动的,可高达37。在图4-3B中,S代表信号肽:T代表“尾巴”区;Ⅰ-Ⅴ分别代表Kringle-5功能区;P代表蛋白酶功能区。血纤维蛋白溶酶原与Apo(a)各功能区的相似程度(%)标记在图B的下部。(源自:Ichinose A. Biochemistry31:3115,1992 and Mclean et al. Nature 330:136,1987.)

四、人体载脂蛋白基因结构一览表

表4-1列出所有已经鉴定的人体载脂蛋白的基因结构,即内含子与外显子的组成以及基因表达后的产物信号肽、前肽及成熟肽的分布。表中附有的文献索引供进一步查阅时参考。

表4-1 人体载脂蛋白基因的结构特征

基因 内含子 外显子 信号肽 前肽 成熟肽 参考文献
AⅠ 3 4 18 6 243 6
AⅡ 3 4 18 5 77 7
AⅣ 2 3 20 377 8
(a) 10-45 11-46 19 4.529 4.5
B 28 29 27 4.536 9
CⅠ 3 4 26 57 10.2
CⅡ 3 4 22 79 11
CⅢ 3 4 20 79 12a
CⅣ 2 3 25 102 12b
D 4 5 20 169 13
E 3 4 18 299 14
F * * 22 286 15
G*
H * * 19 326 16
J 8 9 ? 427 17.27

*:尚未见有关资料报道。