当前位置：首页 > 教育综合 > 正文

dna的甲基化修饰必须有sRNA介导吗

教育综合
2024-11-12 17:44:48

表观遗传的研究成果

核小体结构的存在为染色质包装提供了便利，但DNA与组蛋白八聚体紧密结合却为基因的表达设置了障碍，要打破这一障碍获得有活性的染色质结构，可通过染色质重塑来实现。染色质重塑是指在能量驱动下核小体的置换或重新排列。它改变了核小体在基因启动子区的排列，增加了基础转录装置和启动子的可接近性。染色质重塑的发生和组蛋白N端尾巴修饰密切相关，尤其是对组蛋白H3和H4的修饰。修饰直接影响核小体的结构，并为其它蛋白提供了和DNA作用的结合位点。染色质重塑和组蛋白修饰均由各自特异的复合物来完成，两者发生的先后顺序与启动子序列的特异性有关；后与启动子结合的复合物有助于维持两个复合物与启动子的稳定结合，且两复合物又可相互加强对方的功能。染色质重塑复合物、组蛋白修饰酶的突变均和转录调控、DNA甲基化、DNA重组、细胞周期、DNA的复制和修复的异常相关，这些异常可以引起生长发育畸形，智力发育迟缓，甚至导致癌症。
ATP依赖的染色质重塑与人类疾病
染色质重塑复合物依靠水解ATP提供能量来完成染色质结构的改变，根据水解ATP的亚基不同，可将复合物分为SWI/SNF复合物、ISW复合物以及其它类型的复合物。这些复合物及相关的蛋白均与转录的激活和抑制、DNA的甲基化、DNA修复以及细胞周期相关。
ATRX、ERCC6、SMARCAL1均编码与SWI/SNF复合物相关的ATP酶。ATRX突变引起DNA甲基化异常导致数种遗传性的智力迟钝疾病如：X连锁α-地中海贫血综合征、Juberg-Marsidi综合征、Carpenter-Waziri综合征、Sutherland-Haan综合征和Smith-Fineman-Myers综合征，这些疾病与核小体重新定位的异常引起的基因表达抑制有关。ERCC6的突变将导致Cerebro-Oculo-Facio-Skeletal综合征和B型Cockayne综合征。前者表现为出生后发育异常、神经退行性变、进行性关节挛缩、夭折；后者表现出紫外线敏感、骨骼畸形、侏儒、神经退行性变等症状。这两种病对紫外诱导的DNA损伤缺乏修复能力，表明ERCC6蛋白在DNA修复中有重要的作用。SMARCAL1的突变导致Schimke免疫性骨质发育异常，表现为多向性T细胞免疫缺陷，临床症状表明SMARCAL1蛋白可能调控和细胞增殖相关的基因的表达。BRG1、SMARCB1和BRM编码SWI/SNF复合物特异的ATP酶，这些酶通过改变染色质的结构使成细胞纤维瘤蛋白（Retinoblastoma protein,RB蛋白）顺利的行使调节细胞周期、抑制生长发育以及维持基因失活状态的功能，这三个基因的突变可导致肿瘤形成。
组蛋白乙酰化、去乙酰化与人类疾病
组蛋白乙酰化与基因活化以及DNA复制相关，组蛋白的去乙酰化和基因的失活相关。乙酰化转移酶（HATs）主要是在组蛋白H3、H4的N端尾上的赖氨酸加上乙酰基，去乙酰化酶（HDACs）则相反，不同位置的修饰均需要特定的酶来完成。乙酰化酶家族可作为辅激活因子调控转录，调节细胞周期，参与DNA损伤修复，还可作为DNA结合蛋白。去乙酰化酶家族则和染色体易位、转录调控、基因沉默、细胞周期、细胞分化和增殖以及细胞凋亡相关。
CREB结合蛋白（CREB binding protein,CBP）、E1A结合蛋白p300(E1A binding protein p300,EP300）和锌指蛋白220(zinc finger 220,ZNF220）均为乙酰化转移酶。CBP是cAMP应答元件结合蛋白的辅激活蛋白，通过乙酰化组蛋白使和cAMP应答元件作用的启动子开始转录，它的突变导致Rubinstein Taybi综合征，患者智力低下、面部畸形、姆指和拇趾粗大、身材矮小。CBP和EP300均可抑制肿瘤的形成，在小鼠瘤细胞中确定了CBP的突变，在结肠和乳房瘤细胞系中确定了EP300的突变，另外ZNF220异常和人的急性进行性髓性白血病相关。
如果突变导致错误的激活去乙酰化酶或错误的和去乙酰化酶相互作用，将可能导致疾病的发生。甲基化CpG-结合蛋白-2(methyl cytosine binding protein-2,MeCP2）可募集去乙酰化酶到甲基化的DNA区域，使组蛋白去乙酰化导致染色质浓缩，MeCP2的突变导致Rett综合征，患者出生即发病、智力发育迟缓、伴孤独症。若阻碍去乙酰化酶的功能，则可抑制癌细胞的增殖和分化，可用于急性早幼粒细胞性白血病，急性淋巴细胞性白血病和非何杰金氏淋巴瘤的治疗。
染色质重塑异常引发的人类疾病是由于重塑复合物中的关键蛋白发生突变，导致染色质重塑失败，即核小体不能正确定位，并使修复DNA损伤的复合物，基础转录装置等不能接近DNA，从而影响基因的正常表达。如果突变导致抑癌基因或调节细胞周期的蛋白出现异常将导致癌症的发生。乙酰化酶的突变导致正常基因不能表达，去乙酰化酶的突变或一些和去乙酰化酶相关的蛋白的突变使去乙酰化酶错误募集将引发肿瘤等疾病。基因组印记是指来自父方和母方的等位基因在通过精子和卵子传递给子代时发生了修饰，使带有亲代印记的等位基因具有不同的表达特性，这种修饰常为DNA甲基化修饰，也包括组蛋白乙酰化、甲基化等修饰。在生殖细胞形成早期，来自父方和母方的印记将全部被消除，父方等位基因在精母细胞形成精子时产生新的甲基化模式，但在受精时这种甲基化模式还将发生改变；母方等位基因甲基化模式在卵子发生时形成，因此在受精前来自父方和母方的等位基因具有不同的甲基化模式。发现的印记基因大约80%成簇，这些成簇的基因被位于同一条链上的顺式作用位点所调控，该位点被称做印记中心（imprinting center,IC）。印记基因的存在反映了性别的竞争，从发现的印记基因来看，父方对胚胎的贡献是加速其发育，而母方则是限制胚胎发育速度，亲代通过印记基因来影响其下一代，使它们具有性别行为特异性以保证本方基因在遗传中的优势。
印记基因的异常表达引发伴有复杂突变和表型缺陷的多种人类疾病。研究发现许多印记基因对胚胎和胎儿出生后的生长发育有重要的调节作用，对行为和大脑的功能也有很大的影响，印记基因的异常同样可诱发癌症。
基因组印记与脐疝-巨舌-巨人症综合征（BWS）
BWS患者表现为胚胎和胎盘过度增生，巨舌，巨大发育，儿童期易发生肿瘤。该病主要是由11号染色体上的IGF2和CDKN1C两个印记基因的错误表达引发，IGF2为父本表达的等位基因，CDKN1C为母本表达的等位基因。父本单亲二体型（uniparental disomies,UPDs）是引发BWS的主要原因，即IGF2基因双倍表达，CDKN1C基因不表达；次要原因是母本的CDKN1C等位基因发生突变[22]；极少数病例是由于母本的染色体发生移位造成CDKN1C基因失活和（或）造成母本的IGF2基因表达。其它一些印记基因在胚胎发育过程中的过量或缺失表达也可导致类似于BWS的综合征，如原来母本表达的IPL基因的不表达或母本的ASCL2基因逃避印记都将导致胚胎的过度发育。这表明父本表达的等位基因对胚胎的生长有促进作用，而母本表达的等位基因对胚胎的发育起到限制作用。
基因组印记与Prader-Willi/Angelman综合征（PWS/AS）
PWS表现为肥胖、身材矮小和轻度智力发育迟缓；AS表现为共济失调、过度活跃、严重智障、少语、表情愉悦，这两种疾病都和神经功能失调相关。PWS是由于突变导致父本印记基因在大脑中高表达所致，如SNPNP基因高表达；AS是由于母本的UBE3A基因的缺失或受到抑制所致，该基因编码泛素蛋白连接酶并在脑中表达。父本表达的SNRNP基因的微缺失可导致PWS，而在其上游进一步缺失则可导致AS，这说明这两个区域就是印记中心所在的位置。如果缺失父本染色体上的PWS印记中心将导致SNRNP基因以及附近的父本表达的等位基因被抑制，而缺失父本染色体上的AS印记中心则没什么变化，但若缺失母本染色体上的AS印记中心将导致UBE3A被抑制而导致AS。
基因组印记与癌症
印记丢失不仅影响胚胎发育并可诱发出生后的发育异常，从而导致癌症发生。如果抑癌基因有活性的等位基因失活便提高了发生癌症的几率，例如IGF2基因印记丢失将导致多种肿瘤，如Wilm’s 瘤。和印记丢失相关的疾病还有成神经细胞瘤，急性早幼粒细胞性白血病，横纹肌肉瘤和散发的骨肉瘤等。
与基因组印记相关的疾病常常是由于印记丢失导致两个等位基因同时表达，或突变导致有活性的等位基因失活所致。调控基因簇的印记中心发生突变将导致一系列基因不表达，引发复杂综合征。基因组印记的本质仍为DNA修饰和蛋白修饰，所以和印记相关的蛋白发生突变也将导致表观遗传疾病。 X染色体失活
女性有两条X染色体，而男性只有一条X染色体，为了保持平衡，女性的一条X染色体被永久失活，这便是“剂量补偿”效应。哺乳动物雌性个体的X染色体失活遵循n-1法则，不论有多少条X染色体，最终只能随机保留一条的活性。对有多条X染色体的个体研究发现有活性的染色体比无活性的染色体提前复制，复制的异步性和LINE-1元件的非随机分布有可能揭示染色体失活的本质[27]。哺乳动物受精以后，X染色体发生系统变化。首先父本X染色体（paternal X chromosome,Xp）在所有的早期胚胎细胞中失活，表现为整个染色体的组蛋白被修饰和对细胞分裂有抑制作用的Pc-G蛋白（Polycomb group proteins,Pc-G）表达，然后Xp在内细胞群又选择性恢复活性，最后父本或母本X染色体再随机失活。
X染色体随机失活是X失活中心（X inactivation center,Xic）调控的。Xic是一个顺式作用位点，包含辨别X染色体数目的信息和Xist基因，前者可保证仅有一条染色体有活性，但机制不明，后者缺失将导致X染色体失活失败。X染色体失活过程为：Xist基因编码Xist RNA，Xist RNA包裹在合成它的X染色体上，引发X染色体失活；随着Xist RNA在X染色体上的扩展，DNA甲基化和组蛋白的修饰马上发生，这对X染色体失活的建立和维持有重要的作用；失活的染色体依旧持续合成Xist RNA，维持本身的失活状态，但有活性的X染色体如何阻止Xist RNA的结合机制还不明确。
与X染色体失活相关的疾病
和X染色体失活相关的疾病多是由X染色体的不对称失活，使携带有突变等位基因的X染色体在多数细胞中具有活性所致。Wiskott-Aldrich综合征表现为免疫缺陷、湿疹、伴血小板缺乏症，该病是由于WASP基因突变所致。因为染色体随机失活导致女性为嵌合体，携带有50%的正常基因，通常无症状表现，该病患者多为男性。存在女性患病的原因在于不对称X染色体失活，即携带有正常WASP基因的染色体过多失活。但女性体内还存在另一种机制，通过不对称失活使携带有突变基因的X染色体大部分失活。对Pelizaeus-Merzbacher病的研究表明这种机制的存在，它使带有突变PLP基因的X染色体倾向于失活。RTT综合征也和不对称X染色体失活有关，携带有MeCP2突变基因的女性，X染色体失活时倾向于使携带有发生突变的等位基因的染色体失活。
即便是失活的X染色体，也有一部分基因可以逃避失活而存在两个有活性的等位基因，但逃避失活的等位基因的表达水平有很大的差异。由于逃避失活而易使一些抑癌基因丧失功能，这是引发女性癌症的一个重要原因。也有一些逃避失活的基因过量表达而增加某些疾病的易感性，如TIMP1基因随着年龄的增加表达量逐渐增加，导致迟发型疾病。女性易感的自身免疫性疾病也和X染色体失活相关，因为女性为嵌合体，如果自身免疫性T细胞不能耐受两个X染色体所编码的抗原，则会导致自身免疫缺陷性疾病，如红斑狼疮等。非编码RNA在表观遗传学中的作用
功能性非编码RNA在基因表达中发挥重要的作用，按照它们的大小可分为长链非编码RNA和短链非编码RNA。长链非编码RNA在基因簇以至于整个染色体水平发挥顺式调节作用。在果蝇中调节“剂量补偿”的是roX RNA，该RNA还具有反式调节的作用，它和其它的蛋白共同构成MSL复合物，在雄性果蝇中调节X染色体活性。在哺乳动物中Xist RNA调节X染色体的失活，其具有特殊的模体可和一些蛋白共同作用实现X染色体的失活。Tsix RNA是Xist RNA的反义RNA，对Tsix起负调节作用，在X染色体随机失活中决定究竟哪条链失活。air RNA调节一个基因簇的表达，该基因簇含有3个调节生长的基因。长链RNA常在基因组中建立单等位基因表达模式，在核糖核蛋白复合物中充当催化中心，对染色质结构的改变发挥着重要的作用。
短链RNA在基因组水平对基因表达进行调控，其可介导mRNA的降解，诱导染色质结构的改变，决定着细胞的分化命运，还对外源的核酸序列有降解作用以保护本身的基因组。常见的短链RNA为小干涉RNA(short interfering RNA,siRNA）和微小RNA(microRNA,miRNA），前者是RNA干扰的主要执行者，后者也参与RNA干扰但有自己独立的作用机制。
非编码RNA与疾病
非编码RNA对防止疾病发生有重要的作用。染色体着丝粒附近有大量的转座子，转座子可在染色体内部转座导致基因失活而引发多种疾病甚至癌症，然而在着丝粒区存在大量有活性的短链RNA，它们通过抑制转座子的转座而保护基因组的稳定性。在细胞分裂时，短链RNA异常将导致染色体无法在着丝粒处开始形成异染色质，细胞分裂异常，如果干细胞发生这种情况可能导致癌症的发生。siRNA 可在外来核酸的诱导下产生，通过RNA干扰清除外来的核酸，对预防传染病有重要的作用。RNA干扰已大量应用于疾病的研究为一些重大疾病的治疗带来了新的希望。
非编码RNA不仅能对整个染色体进行活性调节，也可对单个基因活性进行调节，它们对基因组的稳定性、细胞分裂、个体发育都有重要的作用。RNA干扰是研究人类疾病的重要手段，通过其它物质调节RNA干扰的效果以及实现RNA干扰在特异的组织中发挥作用是未来RNA干扰的研究重点。

蛋白质的甲基化修饰

蛋白质的甲基化，作为一种普遍的蛋白质修饰方式，涉及到将甲基酶促转移到蛋白质特定残基，如赖氨酸或精氨酸。在大鼠肝细胞核的总蛋白提取物中，约有2%的精氨酸残基二甲基化。蛋白质甲基化与乙酰化并列，作为常见的表观遗传修饰，它们经常发生在组蛋白上。甲基化由S-腺苷甲硫氨酸（SAM）提供，而赖氨酸的ε-氨基和精氨酸的胍基充当受体。甲基化反应也可以发生在组氨酸的咪唑基、谷氨酰胺和天冬酰胺的酰胺基、半胱氨酸的巯基、半胱氨酸的羧基、谷氨酸和天冬氨酸的侧链羧基。
蛋白质的甲基化在生物体中扮演着重要角色，包括调节蛋白质-蛋白质相互作用、蛋白质-DNA或蛋白质-RNA相互作用、蛋白质稳定性、亚细胞定位或酶活性。在组蛋白上至少存在五个可以被甲基化的精氨酸残基和六个赖氨酸残基。不同位点的甲基化对转录产生正反不同的影响。
蛋白质甲基化对蛋白质结构和功能有显著影响，尽管它不会改变残基的总电荷，但甲基的存在会影响其性质。例如，精氨酸的甲基化会影响相分离过程，这种过程与多种生理病理现象相关，如染色质高级结构、基因表达、核糖体形成、DNA损伤应答以及神经退行性疾病等。
在生物大分子通过相分离形成凝聚物过程中，蛋白质的甲基化也发挥关键作用。这些凝聚物是亚稳态的，可以硬化成粘性液体、凝胶或淀粉样物质。FUS是一个多功能的DNA/RNA结合蛋白，参与多种生命过程。然而，FUS功能异常会导致多种神经退行性疾病，如ALS和FTLD等。研究表明，精氨酸的甲基化会削弱蛋白质间的阳离子-π相互作用，影响其液滴和凝胶状态，从而降低液-液相分离过程。
这些研究揭示了蛋白质甲基化在生命过程中复杂而重要的作用，它不仅影响蛋白质的结构和功能，还与多种生理和病理现象紧密相关。进一步研究蛋白质甲基化机制及其调控可能为开发治疗神经退行性疾病等疾病的新策略提供线索。

组蛋白甲基化修饰（Histone Lysine Methylation）

染色质的精细调色板：组蛋白甲基化的作用与动态平衡在真核生物的基因舞台上，组蛋白甲基化（组蛋白H3和H4的N端尾部的赖氨酸或精氨酸被甲基化修饰），这一过程由组蛋白甲基转移酶（HMTs）精细操控，如同艺术家手中的画笔，将S-腺苷甲硫氨酸（SAM）的甲基巧妙地添加到DNA的守护者上。赖氨酸可接纳一至三个甲基，精氨酸则可被加上一或两个，这些看似微小的变化，却在基因表达的调色板上产生了深远影响。
核小体的动态核心作为染色质的基本组件，核小体由H3-H4和H2A-H2B二聚体构成，最初被认为是DNA的静态框架。然而，现代研究揭示，组蛋白并非静止不变，它们通过甲基化等翻译后修饰，参与到细胞核的多种功能调控中，尤其是赖氨酸甲基化，成为决定基因组结构和活性的关键开关。
赖氨酸甲基化：三种状态与命运决定赖氨酸的甲基化状态——单、二、三甲基化，如同基因组的密码，与不同的核活性和转录状态紧密相连。通过赖氨酸甲基转移酶（KMTs）的精细操作和去甲基化酶（KDMs）的调节，这些变化在细胞层面刻画了基因的开启与关闭。
抗癌策略的基石：组蛋白去甲基化酶其中，一些去甲基化酶，如KDM2/7，拥有抗癌潜力，它们抑制了过度的甲基化，恢复基因的正常表达。HMTs和KDMs的特异性识别和作用，共同构建了染色质调控的精密网络。
组蛋白甲基化：基因表达的指挥棒甲基化程度和位置决定了基因的转录命运。H3K4me2、me3和H3K79me3倾向于激活，而H3K9me2、me3、H3K27me2、me3和H4K20me3则抑制，它们还参与DNA修复，与相关蛋白形成动态协作。
赖氨酸甲基化在性别决定与疾病中的角色在雌性哺乳动物中，X染色体的去活化过程中，组蛋白H3K9me3、H3K27me3等位点的甲基化至关重要，它们通过与Xist RNA的结合，将X染色体塑造成异染色质，这一过程的失调与多种癌症的发展紧密相关。
通过深入理解组蛋白甲基化这一生物化学机制，我们得以窥探生命的复杂性，揭示基因表达调控的深层逻辑。赖氨酸甲基化，这一看似微不足道的修饰，实则在细胞的每一丝基因活动背后发挥着至关重要的角色。

DNA甲基化

DNA的甲基化是在DNA的序列不变的条件下，在其中某些碱基上加上甲基的这样一个过程。DNA甲基化的结果，一般是使甲基化位点的下游的基因表达量变少。
DNA甲基转移酶家族（Dnmts）催化甲基从S-腺嘌呤甲硫氨酸（SAM）转移至胞嘧啶残基的第五个碳，形成5-甲基胞嘧啶（5mC）。
（a）Dnmt3a和Dnmt3b是从头 Dnmts并将甲基（红色）转移到裸DNA上。
（b）Dnmt1是维持Dnmt并在复制期间维持DNA甲基化模式。当DNA经历半保守复制时，亲本DNA支架保留原始DNA甲基化模式（灰色）。Dnmt1与复制灶相关联，并通过在新形成的子链（蓝色）上添加甲基（红色）来精确复制原始DNA甲基化模式。
DNA甲基化与组蛋白修饰和microRNA（miRNA）一起调节转录。在真核生物中，DNA与组蛋白结合，有助于将长链DNA包装到小核区。将包括甲基化，乙酰化，遍在蛋白化和磷酸化的化学修饰添加到N-末端组蛋白尾部的三个特定氨基酸上。这些修饰不仅影响DNA链的包装方式，还影响其转录活性。松散DNA与组蛋白结合的组蛋白修饰通常为转录提供了允许的环境，而紧密包装DNA和组蛋白的组蛋白修饰抑制了基因表达。Dnmts直接与调节通常参与基因抑制的组蛋白修饰的酶相互作用。已知Dnmt1和Dnmt3a都与组蛋白甲基转移酶SUV39H1结合，后者通过H3K9上的甲基化来限制基因表达。此外，Dnmt1和Dnmt3b都可以结合组蛋白脱乙酰酶，去除组蛋白的乙酰化，使DNA包装更紧密，限制转录的进入。通常，Dnmts与组蛋白修饰酶配合，所述组蛋白修饰酶参与添加和/或剥离组蛋白标记，以便在基因区域上施加抑制状态。
用亚硫酸氢盐来处理DNA。DNA当中，没有甲基化或羟甲基化的C碱基，就会被转化成U碱基。
在弱酸性条件下，亚硫酸氢根会结合到没有甲基化的C碱基的6位。而甲基化了的C碱基不会和亚硫酸氢根发生这个反应的。然后用碱来处理。结合了亚硫酸氢根的非甲基化的C，就被脱氨基，并且脱亚硫酸根。然后，就被转化成U碱基。甲基化或者羟甲基化的C碱基还保持了是“C”。
用亚硫酸氢盐来处理DNA，可以让99%左右的非甲基化的C碱基变成U。也就是说这种方法的的转化效率非常高，转化效率达到了99%。
经过亚硫酸氢盐转化过的DNA，再经过PCR，PCR新合成出来的链，U碱基的位置，就会被替换成了“T”。那么在接下来的测序过程中，测到的也是T碱基。而甲基化的C，因为没有被亚硫酸氢盐所转化，所以，在接下来的测序过程中，被测到的，还是“C”碱基。
甲基化的建库过程。
第一种，Illumina公司的Truseq DNA建库方法。
因为Illumina Truseq DNA建库试剂盒当中，它所提供的接头上的C碱基都是已经经过甲基化修饰了。所以，用这些接头做出来的文库，在用亚硫酸氢盐做转化的过程当中，它的（接头上的）C还是保持是C ，不会被转成U。带了这些接头的文库分子，就可以和测序芯片上的草皮DNA发生互补杂交。并且进一步发生桥式PCR反应。生成测序用的DNA的簇（Cluster）。但是，这个方法有一个缺点，就是在用亚硫酸氢盐处理DNA文库的时侯，90%以上的DNA链会断掉。这样，已经建好的文库，其中90%分子会被破坏掉。也就是说文库的丰富度就会损失90%以上。它的好处就是，在这个建库过程当中用的PCR循环数较少。所以它PCR扩增效率不同，所引起的文库不均一程度也就较低。也就是我们通常所说的PCR bias较少。
第二种，EpiCentre公司开发的EpiGnome方法。
第1步，亚硫酸氢盐先处理DNA，把未甲基化的C都转变成U。
第2步，把带标签1的随机引物加入，进行第一次的复制。得到第1条的复制链。
第3步，消化掉过量的引物。
第4步，加入带末端终止碱基、并带标签2的随机引物。这个引物的作用是让第1复制链延伸，并且加上标签2。
第5步，加入建库的PCR引物，进行PCR。通过PCR，把Index序列和成簇引物序列加入到链的两侧。得到真正的文库。
这个方法的优点是，把亚硫酸氢盐处理的过程，放在了建库之前。这样建成的库的丰富程度会比较高。但缺点就是要做较多的PCR循环，那么有了比较多的PCR循环之后，PCR产物的扩增均一性是不太好的。也就是说PCR bias会比较大。
因为甲基化文库中经过亚硫酸氢盐处理，绝大多数的C都变成了T。所以，这个文库中是严重地缺少C碱基的，也就是四种碱基的比例是严重不平衡的。这样在用HiSeq 2000或2500测序仪来测甲基化文库的过程当中，文库测序得到的数据质理就较差。并且经过PF过滤得到的有效的数据产量也会较低。为了弥补甲基化文库的碱基不平衡性，一般情况下，在上机过程当中，是掺入大比例的基因组文库，或者PhiX文库，来补充比较多的C碱基，一般会掺30%的PhiX文库、或者基因组文库。在掺入30%的PhiX文库的条件下，一条HiSeq 2000 V3 PE100的Lane，大概可以得到20G 左右的甲基化文库数据。也就是说，在HiSeq 2000或者2500平台上，甲基化文库的测序数据产量，一直都不是很高。质量也比较低。

2021-03-30 用于基因工程的工具酶

一,限制性内切酶(Endonucleosase)
(一)限制性内切酶(Endonucleosase)的发现与分类
1) 50年代初发现细菌能将外来 DNA 片段在某些专一位点上切断,从而保证其不为外来噬菌体所感染,而其自身的染色体DNA由于被一种特殊的酶所修饰而得以保护,这种现象叫做限制-修饰,它们由三个基因位点所控制:hsd R, hsd M, hsd S, 十年后,人们搞清了细菌的限制与修饰分子机理:
hsd R---限制性内切酶
hsd M---限制性甲基化酶
hsd S---控制两个系统的表达
1968年Smith等人从流感嗜血杆菌株中分离出两个类内切酶,Hind II和Hind III,为基因工程技术的诞生奠定了基础.
截止到目前为止,已经分离出400余种II类酶,搞清识别位点的有300种,商品化的约有一百种,而实验室常用的有二十种 .
2)限制性核酸内切酶可分为三大类:
I类能识别专一的核苷酸顺序,并在识别点附近切割双链,但切割序列没有专一性.
II类识别位点(回文序列)严格专一,并在识别位点内将双链切断
III类识别位点严格专一(不是回文序列),但切点不专一,往往不在识别位点内部.
因此在基因工程中具有实用价值的是II类限制性内切酶.
(二)II类限制性内切酶的命名及特性
命名原则:取属名的第一个字母大写,取种名的前两个字母小写,构成基本名称.该种中发现的不同的酶按照顺序编号I, II, III等.如存在变种和品系,取变种或品系的一个字母.若酶存在于质粒上,则需大写字母表示非染色体遗传因子.
如,HindIII从Haemophilus Influenzue d株中分离的第三个酶.EcoRI表示基因位于Escherichia coli中的抗药性R质粒上.
(三)II类限制性内切酶的底物识别顺序及切割位点
绝大多数的II类限制性内切酶在底物DNA上的识别顺序长度为4,5,6碱基对,这些碱基对的顺序呈回文结构(Palindromic),而且切点就在其内部,如EcoRI 5'-GAATTC-3' .
DNA被限制性内切酶切开之后,呈现两种断口:
钝端(平端)如Pvu II, Alu I, EcoR V等
粘端(粘性末端)如:EcoR I等
图2-1 限制性内切酶产生的末端
(四)识别位点在DNA分子中的频率
对于特定的限制性酶在DNA分子中的识别位点数目是可以计算的,四碱基的酶平均大约每256个核苷酸(44)有一个识别位点,而六碱基的酶大约4096(46)个核苷酸有一个识别序列,计算是在假定核苷酸随机排列的情况下进行的.实践中这种方法不完全正确,如λ DNA长49kb,对于六碱基的酶应该有12个切割位点,实际上要少一些,如Bgl II只有6个,BamHI只有5个,而SalI只有2个.
二,甲基化酶
在专一位点上甲基化,与限制性内切酶相对应.
(一)大肠杆菌中的甲基化酶
dam甲基化酶: 可在5'GATC3'序列中的腺嘌呤N6位置上引入甲基,这样可使一些识别顺序中含有5'GATC3'的限制性内切酶不能切割来自大肠杆菌的DNA如Bcl I(TGATCA),但BamH I(GGATAA)则不会因为N6A的甲基化而失去活性,因为这两种酶对底物的特异性不同.
dcm甲基化酶此酶在序列5'CCAGG3'或5'CCTGG3'中的胞嘧啶C5上引入甲基,受其影响的限制性内切酶是EcoR II.
(二) 甲基化酶在基因工程中用途
许多II类限制性内切酶,都存在着相对的甲基化酶,它们可修饰限制酶识别顺序中的第三位腺嘌呤上,封闭酶切位点,从而使其免受切割.如:M.EcoRI催化s-腺苷-L-甲硫氨酸(SAM)的甲基转移到EcoRI识别顺序中的第三位腺嘌呤上,从而使DNA免受EcoRI的切割.
三,T4-DNA连接酶(T4-DNA Ligase)
来源于T4噬菌体感染的大肠杆菌,连接修复3'端羟基和5'端磷酸基因,脱水形成3'-5'磷酸二酯键
连接双链DNA上的单链缺口(Nick),因此亦可连接限制内切酶所产生的粘性末端
连接RNA模板上的DNA链缺口
连接平头双链DNA速度很慢,在高浓度的底物和酶的作用下方可进行,这属于分子之间的连接.
四,核酸酶
作用: 降解磷酸二酯键
分为:外切酶内切酶
(一) Bal 31(来自于细菌Alteromonas espejiana) 单链特异的核酸内切酶活性,双链特异的内切酶活性.依赖于Ca2+
用途:
构建限制酶图谱
产生末端缺失突变
DNA超螺旋线性化
(二)E. coli外切酶III
只降解DNA分子的一条链,产生单链的DNA分子.
(三)S1核酸酶(来源于米曲霉菌)
特性:
1. 降解单链DNA或RNA,降解DNA的速度大于降解的速度
2. 降解发生的方式为内切和外切
3. 酶切活性需4.0-4.5pH环境,Zn2+激活
4. 酶量过大时会降解双链核酸,因为双链降解活性比单链低75000倍
(四) DNase I: 来自于牛胰腺, 既可以降解单链也可以降解双链,没有特异性,产生单核苷酸或短链
五,聚合酶
(一)DNA聚合酶I
5'-3'聚合酶活性
3'-5'外切酶活性
5'-3'外切酶活性
核酸内切酶活性
可以被枯草杆菌蛋白酶水解成:Klenow片段和N端具5'-3'外切酶活性的分子.
(二) Klenow酶
该酶无5'-3'外切活性,保留了5'-3'聚合活性及3'-5'外切活性,基因工程中利用该酶:
修复限制性内切酶造成的5'突出的粘性末端
标记DNA探针
催化cDNA第二条链的合成
末端终止法测序
图2-4 Klenow 酶的作用方式
(三) T4 DNA聚合酶
与Klenow酶相似,外切酶活性更高.体外诱变反应中效率很高.
(四)T7 DNA聚合酶
测序酶
(五) Taq DNA聚合酶
耐高温,主要用于 PCR 反应.
(六) 逆转录酶:将mRNA转录成cDNA
AMV逆转录酶(鸟类成髓细胞性白血病病毒)
DNA聚合酶活性
RNase H活性
DNA内切酶活性
核酸结合活性
M-MLV逆转录酶(Moloney鼠白血病病毒)
两种逆转录酶的区别
肽链的组成
禽酶2条肽链,具聚合酶和很强的RNase H活性
鼠酶1条,较弱的RNase H活性
反应的最适温度
禽酶42°C,二级结构丰富RNA,禽酶效率高
反应的最适pH值
禽酶pH 8.3
鼠酶pH 7.6
六,DNA修饰酶
有大量的修饰酶,主要的有以下几种:
1) 碱性磷酸酯酶(来自于大肠杆菌或小牛肠道)可以去掉DNA分子的5'端的磷酸基团.
2) polynucleotide kinase: 来自于T4侵染的大肠杆菌,在5'端增加磷酸基团.
3) 末端脱氧核苷酸转移酶 (terminal deoxynucleotidyl tansferase) 来自于小牛胸腺组织 ,在DNA分子的3'端增加一个或多个脱氧核苷酸.
4) Topoisomerase改变共价闭合双链DNA分子的结构
第二节 DNA的切割反应
一,缓冲系统的组成
II类酶的酶活条件:Tris-HCl PH7.5, 25-50mM;10mM MgCl2 ;NaCl 0-150mM; DTT 1mM
根据不同酶对盐离子要求不同,可将缓冲液分为以下三种情况:
高盐:100-150mM
中盐:50-100mM
低盐:0-50mM
二,酶切操作
DNA量的确定,加入酶量的确定,发应体积的确定(20μl),反应时间的确定,1-1.5hr,一般为37℃,但也有例外,如Taq I在65°C时活性最高.
单位限制性内切酶定义为:在最佳缓冲系统和20μl体积中反应1小时,完全水解1μgDNA所需的酶量.
三,酶切结果分析
(一) 酶切片段的检测
1) 通过凝胶电泳分离,根据分子量分离.根据凝胶的浓度可以分离不同分子量的片段,聚丙烯酰胺凝胶电泳可以分离1-300bp的分子.
2) DNA分子的检测 a. 染色EB,DNA分子小于25ng,很难检测到
b. 放射性自显影, 可以监测少到2ng DNA分子.
(二)估计DNA分子的大小
根据DNA分子的迁移率,可以用公式计算出分子量D=a-b(logM)
D是移动的距离,M是分子量,a, b是恒量但随着电泳条件的改变而改变.
也可以根据已知大小的片段进行比较,误差约在5%左右.
四,多酶联合酶解
对于对浓度要求相同的酶,原则上可以同时酶解;
对于对浓度要求不同的酶,可以:
1. 低盐浓度的酶先切,后补加NaCL
2. 一种酶切后,换缓冲液,加5mM NaAc 0.1体积,2体积乙醇,冰浴5min,4℃离心10min, 干燥
五,定位酶切位点
建立酶切图谱需要一系列的酶.
首先确定每一种酶切后产生的分子量和片段的数目;
然后进行双酶切;
比较酶切和双酶切的结果,绘制酶切图谱;
含糊的位点可以通过部分酶切解决,可以短时间的酶切或者在4°C条件下进行.
六, 限制性内切酶的star活性
在PH不合适,或甘油浓度过高≥10%时,限制性内切酶的切割位点会出现非专一性,因此应确保酶的体积为总体积的十分之一以下.
第三节 DNA片段的连接
重组DNA分子构建的最后一步是连接,通过连接酶完成.相对而言,钝端的连接效率较低,因此一般提高DNA浓度的方法增加接触的机会.而粘性末端的连接效率较高,因为两个粘性末端可以通过氢键碱基互补配对.这种暂时的,碱基配对结构可以提高连接的效率.在分子克隆的连接方式主要有以下几种:
一,连接方式
(一)相同粘性末端的连接
来源:
相同的酶
同尾酶
问题:
极性有两种可能
同尾酶连接后,不能用任何一种酶酶切.称为"焊死".
(二)平头末端的连接
粘性末端--分子内部连接,平头末端--分子间的连接.
提高连接效率的方法:
加大酶用量(10倍)
加大平头末端底物的浓度
加入10%PEG(8000),促进分子间的有效作用
加入单价阳离子, 150-200mM NaCl
提高反应温度
平头连接同样存在两种极性
(三)不同粘性末端的连接
突出5'末端
Klenow补平,或S1核酸酶切平,然后平头连接
突出3'末端
T4-DNApol切平,然后平头连接
突出末端不同
Klenow补平,或S1核酸酶切平
连接后,可能恢复限制性位点,甚至还可能产生新的位点.XbaI与HindIII( XbaI恢复), XbaI与EcoRI(均保留),BamHI与Bgl II(产生ClaI位点)
(四)人工粘性末端的连接
5'突出的末端
外源片段先用Klenow补平;然后用TdT补加polyC;载体片段也用Klenow补平,加polyG,退火不经连接即可转化.目的是:不使酶切位点遭受破坏.
3'突出的末端
外源片段先用TdT加polyG;载体片段加polyC;然后退火;再用Klenow补齐;连接
平头末端
可直接用TdT补加末端,但以加polyA/T为佳.这样稍微加热 ,AT区就会出现单链区域,然后用S1核酸酶水解即可回收片段
(五)粘端与平端的连接
linker : 人工合成的,含有限制性内切酶识别序列的,短的双链DNA片段.
– 连接的效率较高
– 酶切时可能破坏DNA分子的完整.
adaptor:人工合成的,具有粘性末端寡聚核苷酸.
(六)粘性末端的更换
在DNA片段上某一酶切口处换成另一种酶切口
– BamHI酶切片段用Klenow补平,或用S1酶切平;连接一段linker或Adaptor,使之产生EcoRI粘性末端.这样BamHI切口就换成了EcoRI切口 .
– 由AluI更换EcoRI:AluI切开,T4-DNApol切平,另一段DNA EcoRI切开,Klenow补平,连接,原来含有AluI的片段变成含有EcoRI
二,重组率
重组率:连接反应结束后,含有外源DNA片段的重组分子数与加入的载体分子数之比.较为理想的重组率为25-75%
提高重组率的方法:
连接反应条件外源片段:载体=2:1-10:1(分子数),增加碰撞机会,减少自身环化.
载体除磷 (磷酸酯酶5'除磷).
TdT在3'端增加人工粘性末端,防止载体自我环化
(责任编辑：大汉昆仑王)