|
第一章 基因的结构
第一节 基因和基因组
一、基因(gene) 是合成一种功能蛋白或RNA分子所必须的全部DNA序列. 一个典型的真核基因包括 ①编码序列—外显子(exon) ②插入外显子之间的非编码序列—内合子(intron) ③5'-端和3'-端非翻译区(UTR) ④调控序列(可位于上述三种序列中) 绝大多数真核基因是断裂基因(split-gene),外显子不连续。
二、基因组(genome) 一特定生物体的整套(单倍体)遗传物质的总和, 基因组的大小用全部DNA的碱基对总数表示。 人基因组3X1 09(30亿bp),共编码约10万个基因。 每种真核生物的单倍体基因组中的全部DNA量称为C值,与进化的复杂性并不一致(C-Value Paradox)。 人类基因组计划(human genome project, HGP) 基因组学(genomics),结构基因组学(structural genomics)和功能基因组学(functional genomics)。 蛋白质组(proteome)和蛋白质组学(proteomics)
第二节 真核生物基因组
一、真核生物基因组的特点: , ①真核基因组DNA在细胞核内处于以核小体为基本单位的染色体结构中. ②真核基因组中,编码序列只占整个基因组的很小部分(2—3%), 二、真核基因组中DNA序列的分类 · (一)高度重复序列(重复次数>lO5) 卫星DNA(Satellite DNA) (二)中度重复序列 1.中度重复序列的特点 ①重复单位序列相似,但不完全一样, ②散在分布于基因组中. ③序列的长度和拷贝数非常不均一, ④中度重复序列一般具有种属特异性,可作为DNA标记. ⑤中度重复序列可能是转座元件(返座子), 2.中度重复序列的分类 ①长散在重复序列(long interspersed repeated segments.) LINES ②短散在重复序列(Short interspersed repeated segments) SINES SINES:长度<500bp,拷贝数>105.如人Alu序列 LINEs:长度>1000bp(可达7Kb),拷贝数104-105,如人LINEl (三)单拷贝序列(Unique Sequence) 包括大多数编码蛋白质的结构基因和基因间间隔序列, 三、基因家族(gene family) 一组功能相似且核苷酸序列具有同源性的基因.可能由某一共同祖先基因(ancestral gene)经重复(duplication)和突变产生。 基因家族的特点: ①基因家族的成员可以串联排列在一起,形成基因簇(gene cluster)或串联重复基因(tandemly repeated genes),如rRNA、tRNA和组蛋白的基因; ②有些基因家族的成员也可位于不同的染色体上,如珠蛋白基因; ③有些成员不产生有功能的基因产物,这种基因称为假基因 (Pseudogene).Ψa1表示与a1相似的假基因. 假基因分类。加工过的假基因(processed pseudogene)。 典型的基因家族 1.tRNA基因 单倍体人基因组中1300个tRNA基因,tRNA基因簇. 2.rRNA基因 >l00copy.rRNA基因簇(重复单元28S、18S、5.8s-rRNA) 3.组蛋白基因 30-40copy.定位:7q32-q36 组蛋白基因簇(重复单位:H1,H2A,H2B,H3、H4) 特点:无intron,Poly(A)- RNA. 4.珠蛋白基因 α类:16p13,基因簇(24Kb):5’—ζ—Ψζ—Ψα1—α2—α1—3’ β类:11p15,基因簇(60Kb):5’— ζ—Gr—Ar—Ψβ—δ—β—3’ 四、超基因家族(Supergene family ,Superfamily) 由基因家族和单基因组成的大基因家族,结构上有程度不等的同源性,但功能不同. 五、人类基因组中的重复序列标记 1、A1u序列 单倍体人基因组50万-100万拷贝,平均每隔3-6Kb就有一个Alu序列, 人A1u序列长300bp: 2X130bp重复序列; +31bp间隔序列(中间); 两侧7-21bp正向重复(direct repeats),返座子? Alu序列广泛散布于人基因组,约90%巳克隆的人基因合有Alu序列 Alu序列标志。 2、可变数串联重复 · , · Variable number tamdem repeat, VNTR. 又称小卫星DNA(minisatellite DNA) 由短重复单位(6-40bp)串联重复(6-100次以上)而成,多位于基因的非编码区,广泛分布。 VNTR多态性—分子标记—DNA指纹图(fingerprint). 小卫星DNA突变与肿瘤,H-Ras。 3、短串联重复(short tandem repeat,STR) 又称微卫星DNA(microstallite DNA) 2-6个核苷酸组成的重复单位串联重复(10-60次),两侧为特异的单拷贝序列,人基因组中每l0kb DNA序列至少一个STR序列。 {CA)n,50,000-100,000拷贝. 新一代遗传标记,人类基因组研究,肿瘤,遗传病.
第三节 线粒体基因组
人线粒体基因组的特点: 1、人线粒体基因组为16,569bp的双链闭环分子,一条链为重链(H链),一条链为轻链(L链),两条链均有编码功能,每个mtDNA分于编码13种蛋白质和24种结构RNA(22rRNA,2tRNA). 2、线粒体DNA为母系遗传. 3、结构基因不含内含子,部分区域有基因重叠,因此病理性mtDNA突变更易发生. 4、mtDNA突变频率更高. 5、线粒体DNA突变的表型表达与核DNA不同。
第四节 细菌和病毒基因组
一、细菌基因组的特点。 1.功能相关的几个结构基因往往串联在—起,受它们上游的共同调控区控制,形成操纵子结构, 2.结构基因中没有内含子,也无重叠现象。 3.细菌DNA大部分为编码序列。
二、病毒基因组的特点 1.每种病毒只有一种核酸,或者DNA,或者RNA; 2.病毒核酸大小差别很大,3X103一3X106bp; 3.除逆病毒外,所有病毒基因都是单拷贝的。 4.大部份病毒核酸是由一条双链或单链分子(RNA或DNA),仅少数RNA病毒由几个核酸片段组成. 5.真核病毒基因有内含子,而噬菌体(感染细菌的病毒)基因中无内含子. 6.有重叠基因.
第五节 染色质和染色体
细胞分裂间期—染色质(chromatin) 分裂期—染色体(chromosome)
一、染色质的基本单位—核小体 (一)核小体(nucleosome)结构 DNA绕在组蛋白八聚体(H2A、H2B、H3、H4各一对)核心外1.8周(146bp),形成核小体核心颗粒。 两个核小体核心颗粒之间有Linker DNA(0-80bp), 核小体核心颗粒+Linker=核小体(长180-210bp) 核小 体DNA Ladder. (二)组蛋白(histone):一类小的带有丰富正电荷<富含Lys,Arg)的核蛋白,与DNA有高亲和力. 组蛋白分类: 1.核小体核心组蛋白,H2A,H2B,H3,H4。分子量较小(102-135aa) 作用:盘绕DNA形成核小体 。 2.H1组蛋白:较大(220aa),作用:与Linker DNA结合后利于核小体稳定和更高级结构的形成· 。 二、染色质的高级结构 1、30nm染色质纤丝 , 2、袢环结构(looped domain) 。 3、细胞分裂期染色体 分裂期染色体=一对姐妹染色单体(Chromatid) 有丝分裂中期46条染色体按大小和形状排列的的光学显微镜图像称为人的染色体核型(Karyotype) 三、染色体的结构要素
(一).着丝粒(centromere):细胞分裂时染色体与仿锤丝相连结的部位,为染色体的正常分离所必需。 (二).端粒(telomere):真核生物线状染色体分子末端的DNA区域 端粒DNA的特点: 1、由富含G的简单串联重复序列组成(长达数kb). 人的端粒DNA重复序列:TTAGGC。 2、端粒的末端都有一条12-16碱基的单链3’端突出。 端粒的作用:防止DNA末端降解,保证染色体的稳定性和功能 (三)、复制原点
第二章 DNA的复制、修复和重组
第一节 DNA的复制(DNA Replication)
一、DNA复制的基本特性 1. 半保留性(Semi-Conservative) Meselson-Stahl实验 2. 双向复制(一般) 复制起始点(origin)+两侧复制叉=复制单位(复制子, Replicon) 3.半不连续性(Semi-discontinuous) 前导链(leading strand)-连续合成 随从链(Lagging Strand)-不连续,由岗崎片段(okazaki fragment)连接而成.
二、DNA复制必需的成份(真核生物) 1.染色体DNA复制必需三种核苷酸序列 ①复制起点 ②着丝粒 ③端粒. 2.RNA引物(RNA Primer)一般8-14nt.带游离3'-OH末端. 3.参加DNA复制的主要酶和蛋白质 ① DNA聚合酶(DNA Polymerase) 真核DNA复制的主要酶DNA Pol a/δ. 功能:从5'-3'方向延伸与模板互补的子代链. ②引发酶(Primase) 与其他多种蛋白组成多蛋白复合体-引发体(Primosome).催化RNA引物合成和复制起始. ③DNA连接酶(DNA Ligase):催化一个双链DNA的5'磷酸与另一双链DNA的3'-OH形成磷酸二酯键. ④DNA解链酶(DNA Helicase),打开DNA双链. ⑤增殖细胞核抗原(Proliferating cell nuclear antigen.PCNA) :助催化前导链合成. ⑥端粒酶(Telomerase) 末端复制问题。 端粒酶负责染色体末端(端粒)复制,是由RNA和蛋白质组成的核糖核蛋白.其中的RNA成分是端粒复
制的模板.(因此端粒是逆转录酶) 作用:维持端粒长度. 端粒酶活性可用基于PCR的“TRAP”(Telomerase repeat amplification protocol)法测定(Kim,N et
al.,science,266,2011-2014(1994) 端粒与细胞寿命。 端粒、端粒酶与肿瘤的关系:绝大多数恶性肿瘤具有端粒酶活性但端粒缩短,但也有约5%的肿瘤无
端粒酶活性且端粒较长。
端粒酶作为新的肿瘤标志和肿瘤治疗靶点.
第二节 DNA修复(DNA repair)
DNA修复是维持基因组完整性的重要机制,在保护基因组避免发生可能导致肿瘤或遗传疾病的突变中起关键的作用。 引起DNA损伤的因素: 1.细胞内源性损伤因素: DNA复制错误;自发损伤包括碱基互变异构、碱基脱氨(C→U、A→I)和碱基丢失等;氧化代谢副产物如活性氧物质(Reactive oxygen species,ROS)的攻击等。 2环境中的损伤因素: 辐射(含紫外线、X射线)产生胸腺嘧啶二聚体;化学致癌物(氧化脱氨,烷化剂或代谢活化物如苯并芘、黄曲霉素等产生碱基加合物) 一、碱基切除修复(Base excision repair、BER) 该途径中最关键的是必须通过一种糖苷酶(glycosylase)先除去变异碱基(如被氧化、烷基化或脱氨的碱基),该糖苷酶催化连接损伤碱基与脱氧核糖之间的糖苷键水解,释放游离碱基并在DNA中产生一个去碱基位点,然后由去嘌呤/去嘧啶(AP)核酸内切酶、DNA聚合酶和DNA连接酶等利用相对的一条正常链为模板进行修补合成。 BER途径中的重要糖苷酶: (1)尿嘧啶DNA糖苷酶(UDG),从DNA中除去尿嘧啶碱基; (2)3—甲基腺嘌吟(3MeA)DNA糖苷酶,可修复烷化剂产生的损伤; (3)负责修复DNA氧化损伤的糖苷酶(如Fpg/MutM DNA糖苷酶) BER是修复内源性DNA损伤(自发水解、烷基化和活性氧攻击)的主要途径,因此对于降低自发突变的频率、防止肿瘤发生有重要作用。 二、核苷酸切除修复(Nucleotide excision repair,NER) 首先由多聚体复合物识别损伤,再在损伤的两侧进行切除。随着DNA链被解开,包含损伤的单链片段释放出来,留下的缺口由DNA聚合酶填补,DNA连接酶封闭。该途径包括20种以上蛋白,可以修复紫外辐射诱导的环丁烷嘧啶二聚体(CPD)和(6—4)光产物((6—4)PPs),以及一些化学物质产生的大加合物。 人的NER系统有关基因及其蛋白质产物功能。 NER系统缺陷与着色性干皮病(Xeroderm pigmentosum,XP) NER可再分为二条子途径: (1)全基因组修复(Global Genomic repair,GGR)途径:修复整个基因组内的损伤,其效率取决于损伤的化学特性、损伤部位的DNA序列和染色质结构。 (2)转录藕联修复(Trancsription—coupled repair,TCR,):特异地修复基因组中具有转录活性(即表达)的基因的被转录DNA链上的损伤,该途径的 特点是依赖RNA聚合酶II催化的转录,其中的一些蛋白是普通转录因子TFIIH 的亚基。 三、错配修复(Mismatch repair) 负责修复DNA复制过程中由于错误掺入而产生的错配。 STR序列复制-模板链的滑动产生小的环状突出(loop)- 重复序列扩张(expansion)或丢失:微卫星不
稳定性(microsatellite instability) E coli中的MMR途径需要mutS,mutH,mutL和uvrD基因产物和特异性核酸外切酶、DNA聚合酶和DNA连接酶等。在酵母和人类已鉴定了mutS,mutH的多种同源物。遗传性非息肉性结肠癌(HNPCC)基因缺陷。 微卫性不稳定与肿瘤。新的肿瘤基因诊断标志。
四、重组修复(Recomhinant repair) 修复DNA的两条链均受损伤的部位的双链断裂或链间交连。
第三节 重组(recombination)
重组的本质是基因的重排或交换.即2个DNA分子间或一个DNA分子的不同部位间,通过断裂和重接,交换DNA片段从而改变基因的组合和序列. 一.同源重组(Homologous recombination) 指DNA同源序列间的重组,常发生于两个较长的同源DNA片段或同源染色体之间。 可通过同源重组将外源基因定位整合到细胞基因组中. 二.转座(transposition) 可移动的DNA元件(mobile DNA elements) -转座元件(Transposable element).它是指那些可在DNA分子内或DNA分子间转移的DNA片段. 转座元件的转移过程-转座 转座的特点: 1.转座后原来位置的转座元件序列仍然保留,但同时又把新合成的DNA 复本插入到另外一个位点. 2.转座过程需要转座酶(transposase).它催化断裂和重接两步连续的 过程(需要M2+) 3.转座元件插入位置的两茶有3-12bp的正向重复序列(靶序列),它是由于转座酶错位切割DNA造成的.这种短正向重复序列是存在转座元件的特征. 转座元件的分类 ①转座子(transposon):通过DNA复制而转移的转座元件. ②逆转座子(retroposon)或返座子,通过RNA阶段实现转移的转座元件 (DNA→ RNA→ DNA→ 插入新位点) 逆转座子例:Alu.LINE1.逆假基因(retro-pseudogene) 转座的遗传效应-导致基因重排、插入、缺失。
第三章 基因表达的调控
基因表达:DNA→mRNA→蛋白质的遗传信息传递过程 基因表达的调控
第一节 基因的活化
基因的“开关”-染色质的活化 一、活性染色质的结构 间期核染色质: 异染色质(heterochromatin),高度压缩(不转录); 常染色质(euchromatin),较为松散, 常染色质中约10%为活性染色质(更开放疏松)。 活性染色质→←非活性染色质 二、活性染色质的结构特点 (一)DNaseI敏感性 转录活性(或有潜在转录活性)的染色质对DNase I更敏感. DNase I超敏感位点(DNase I HyperSensitive Sites,DHSS) (二)组蛋白H3的CyS110上巯基暴露,
三、活性染色质结构的形成 (一)、核小体位相(Phased positioning) 1.核小体的旋转定位(rotational positioning) 指核小体核心与DNA双螺旋在空间结构中的相互关系,主要包括DNA双螺旋的大沟是面向还是背向核心结构. ‘ 2.核小体的平移定位(translational positioning) 指核小体与特定DNA序列的结合位置和方式,特别是转录活性相关的DNA调控元件(启动子、增强子等)序列与核小体的相互位置关系。 (二)、组蛋白修饰 1.H1组蛋白磷酸化 促进染色体包装,影响转录活性, 2.核心组蛋白修饰 乙酰化:常发生在组蛋白的Lys, 一般活性染色质是高度乙酰化的。 (三)HMG蛋白结合 HMG(high mobility group)蛋白—高迁移率蛋白, 如HMG14/HMG17. 与核小体核心颗粒结合,有利转录。
四、DNA甲基化与基因表达 . (一)、真核生物基因组DNA的甲基化(Methylation) 哺乳动物基因组中5%的C为甲基化(m C),mC主要存在于CpG二核苷酸中. CpG二核苷酸序列常成簇聚集并零散地分布于人基因组中,形成CpG岛(CpG islands).人基因组中约每10Kb就有一个CpG岛. CpG岛常与基因相连(可作为寻找基因的标记)。 (二)DNA甲基化的转录抑制作用。 基因表达与甲基化呈负相关 基因甲基化状态: 1、高度甲基化: 基因为持续失活(如女性的一条X染色体; 2、诱导去甲基化:如组织或发育阶段特异性表达基因; 3、持续低水平甲基化:具有转录活性(如持家基因)。 持家基因(housekeeping gene): 是指对所有类型组织细胞在任何时候都需要其表达的基因,通常都是维持细胞基本生存所必须的基因,其表达常保持在固定的水平。又称为组成性基因(Constitutive gene)。 (三)甲基化与基因组印迹 基因组印迹(genomic imprinting):指基因表达活性只局限于来自双亲之一的基因版本。 被印迹(imprinted)的基因. 基因组印迹的机制--DNA高度甲基化 基因组印记与肿瘤.
第二节 转录水平的调控
转录水平的调控是基因表达调控中最重要的环节。 一、真核基因转录基本条件: 特异性基因转录的基本条件包括: ①启动子(特别是核心启动子) ②转录模板(转录起始点(+1)---终止点) ③RNA PolⅡ ④普通转录因子(GTFs) (一)启动子(promoter)
共5页: 上一页 1 [2] [3] [4] [5] 下一页 |