表观遗传学是研究除DNA序列变化外的其他机制引起的细胞表型和基因表达的可遗传的改变。表观遗传学现象涉及组蛋白修饰、DNA甲基化、RNAi、染色质重塑等。表观遗传机制主要在基因转录层面调控基因表达,最近新兴起的RNA表观遗传则以N6-甲基化腺嘌呤为标志,研究后转录过程对真核基因表达的调控。
1表观遗传学修饰
1.1组蛋白修饰
在染色质的组蛋白上可以发生各种位点特异的翻译后修饰,如组蛋白甲基化、乙酰化、泛素化和磷酸化等。近年来又先后发现其他一些修饰,如Sumo化、ADP ribosylation、巴豆酰化等。不同的组蛋白修饰通过不同的作用机制调控染色质的结构和功能。相应于各种组蛋白修饰有各种酶类,建立修饰的酶,被称为‘Writer',如甲基转移酶、乙酰化转移酶等。而去除修饰的酶被称为'Eraser',如去甲基化酶、去乙酰化酶等。组蛋白翻译后修饰能够募集一些效应分子,这些效应分子能识别组蛋白翻译后修饰,然后引起下游功能改变,这些效应分子被称为'Reader'.下面就赖氨酸乙酰化、赖氨酸甲基化以及精氨酸甲基化这几种主要的组蛋白修饰为例来描述一下这些效应蛋白质识别及调控组蛋白修饰的生物学过程。
(1)组蛋白赖氨酸乙酰化识别及调控。组蛋白的乙酰化可以发生在人组蛋白H3 (K4, K9, K14, K18,K23, K27, K36, K56和K79), H4 (K5, K8, K12, K16,K20和K91), H2A (K5和K9)和H2B (K5, K12,K15, K16, K20和K120)。乙酰化修饰的范围比甲基化修饰的范围更广,一般来讲,这个修饰总是跟转录激活相关,赖氨酸乙酰化导致了赖氨酸正电性质的改变,使得染色质的结构更加开放,导致基因转录更加易于进行。
赖氨酸乙酰化是由组蛋白乙酰转移酶,以乙酰辅酶A为供体,将乙酰基团转移到赖氨酸的e基上实现的。组蛋白乙酰基团也可以被一类称为组蛋白去乙酰化酶所去除,因而整体来讲组蛋白的乙酰化水平处于这两类酶的动态调节中。组蛋白上被乙酰化修饰的赖氨酸被效应分子识别将信号传给下游分子。
MOZ和MORF是两个对造血干细胞和神经干细胞的发育有重要影响的组蛋白乙酰转移酶,并调节HOX基因的表达。在白血病中,它们的基因往往发生染色体异位。在细胞内MOZ/MORF与ING5,EAF6, BRPF1/2/3形成复合物,其中BRPF蛋白起着桥梁的作用,促进转录,并能增强MOZ的乙酰转移酶活性[1].我们报告了人MOZ串联PHD结构域(PHD12)处于自由状态的溶液结构,以及和H3K14ac肽1.47A复合物的晶体结构,揭示了该串联结构域与乙酰化组蛋白H3未修饰的第二位精氨酸(H3R2),以及乙酰化的第14位的赖氨酸(H3 K14ac)识别的结构基 础(图1A)。此 外,染 色 质 免 疫 沉 淀(Ch IP)和RT-PCR分析的结果表明, PHD12与组蛋白的识别将有助于将MOZ复合物定位到HOXA9基因的启动子位点上,从而促进HOXA9基因在启动子区域H3的乙酰化,进而上调HOXA9 m RNA的水平。研究表明,通过PHD12的识别H3R2/K14ac,是一种重要的表观遗传调控机制[2].最近,清华大学李海涛实验室发现,MOZ的PHD12还可以以更强的方式结合巴豆酰化的H3K14[3]. BRPF蛋白中含有两个PHD锌指、一个Bromodomain、一个PWWP结构域。通过实验证明,BRPF2-PHD1锌指结构域,能特异结合非甲基化的组蛋白H3K4,但不能结合甲基化的组蛋白H3K4.我们用核磁共振方法解析了BRPF2-PHD1与组蛋白H3K4me0小肽复合物的溶液结构[4].染色质免疫共沉淀(chromatin immuno precipitation, CHIP)实验表明, BRPF2-PHD1与H3K4me0的相互作用与BRPF2在HOXA9基因座的定位有关。我们还测定了BRPF2-PHD2与DNA复合物的结构,揭示其功能意义[5].
Bromodomain是一类与乙酰化组蛋白特异识别的 蛋 白 质 结 构 域。我 们 测 定 了 人 的 系 列 含Bromodomain的蛋白质,如Brg1, Brd2, Brd4, Brd7的Bromodomain的三维结构,分别研究了它们与乙酰化组蛋白的特异识别[6~9].其中, Brg1是人的染色质重塑复合物SWI/SNF复合物的核心催化亚基,在细胞周期调控、细胞分化和肿瘤发生中发挥重要作用。我们测定了Brg1的Bromodomain的三维结构,发现Brg1的Bromodomain与组蛋白特定位点乙酰化的赖氨酸的特异识别,并阐明了二者识别方式,及关键残基[6]. Brd2, Brd4是BET家族成员, Brd7也是染色质重塑复合物的重要组分,目前这些Bromodomain已经成为重要的药物作用靶点。阮科副教授在中国科学技术大学生命科学学院建立了国内首个基于核磁共 振 方 法 的 片 段 药 物 筛 选 与 鉴 定 平 台,以Bromodomain及其他表观遗传相关靶标为对象,已筛选并在结构的基础上优化设计了多个抗肿瘤增殖和迁移的靶点的小分子抑制剂。初步结果已经发表。还针对基于片段的药物发现过程中,苗头化合物和靶点蛋白的弱相互作用难以表征的瓶颈问题,发展了转移顺磁弛豫增强技术。并发表了特邀综述,申请了专利,有望开发成具有我国自主产权的药物先导化合物。
(2)组蛋白赖氨酸甲基化识别及调控。 (ⅰ)组蛋白赖氨酸甲基化识别。核心组蛋白H3和H4上有多个赖氨酸位点能被甲基化,包括组蛋白H3K4,H3K9, H3K27, H3K36, H3K79和H4K20[10].甲基化组蛋白赖氨酸能被多种识别结构域识别,在染色质高级结构控制、基因转录调控、DNA损伤修复、RNA剪切等过程中起着重要的作用[11].例如在基因转录调控过程中,通常认为甲基化组蛋白H3K4, H3K36和H3K79与转录激活相关,而H3K9, H3K27和H4K20被认为与转录抑制有关。组蛋白赖氨酸的甲基化还能调控组蛋白的其他翻译后修饰(如乙酰化等),也能被其他组蛋白修饰(如泛素化)调控[12,13].
目前,已经发现多种甲基化组蛋白赖氨酸的识别结构域,包括PHD结构域[14]、WD40-repeat结构域[15]、Ankyrin-repeat结构域[16]和Royal结构域家族蛋白等。 Royal结构域家族包括Tudor结构域、Chromo结构域、MBT结构域、PWWP结构域等[17].虽然甲基化组蛋白赖氨酸识别结构域之间的氨基酸序列和空间结构差异较大,其甲基化赖氨酸识别位点都是由芳香族氨基酸组成的“aromatic cage”,结构特征相似[17,18].
Tudor结构域是一类重要的甲基化组蛋白赖氨酸识别结构域,在基因转录中起着重要的作用。酿酒酵母SAGA复合物是由多个亚基组成的分子量为1.8MDa的转录共激活复合物,包括乙酰转移酶Gcn5和去泛素化酶Ubp8,能使组蛋白乙酰化和去泛素化,在基因表达过程中起着激活基因转录的作用[19].研究发现, SAGA复合物的亚基Sgf29羧基端具有两个串联的Tudor结构域,能识别甲基化修饰的组蛋白H3K4 me2/3[20].酿酒酵母Sgf29的串联Tudor结构域采取面对面排列,与其他已知的串联Tudor结构的空间折叠模式有较大的差别。在Sgf29串联Tudor结构与组蛋白H3K4 me2/3多肽的结构中,第一个Tudor结构域有一个带负电的小结合口袋,负责结合H3A1;第二个Tudor结构域具有由芳香族氨基酸组成的甲基化赖氨结合口袋, H3K4的甲基化赖氨酸侧链插入其中(图1B)。 Sgf29羧基端串联Tudor结构域的结构特征及其与甲基化组蛋白赖氨酸多肽相关作用的模式,决定了其特异性地识别组蛋白H3K4 me2/3.Sgf29与组蛋白H3K4 me2/3的相互作用控制着SAGA复合物在染色质上的募集,并能影响组蛋白乙酰化水平,从而调控基因转录水平[20].
(ⅱ)组蛋白赖氨酸甲基化/去甲基化调控。目前发现的组蛋白赖氨酸去甲基化可以分为两大类,即胺氧化酶家族和含有Jmj C结构域的氧化酶家族[21,22].由于化学反应机理的差异,胺氧化酶家族去甲基化酶仅能催化单甲基化和二甲基化的赖氨酸去甲基化,而Jmj C家族去甲基化酶能催化单甲基化、二甲基化及三甲基化修饰的去甲基化[23].已经发现的含有Jmj C结构域的组蛋白去甲基化酶可以分为7个亚家族: KDM2, KDM3, KDM4, KDM5, KDM6, JHDM1及Jmj C domain only[24,25].这些组蛋白去甲基化酶能调控基因转录、染色质着丝粒区域的组装、DNA损伤修复等,其功能异常将导致肿瘤、精神发育异常等重大疾病的发生[24].
对于一些仅含有Jmj C结构域的蛋白,其底物特异性还存在争议。例如,胞内实验表明, NO66具有H3K4me和H3K36me的去甲基化酶活性,能与骨细胞分化过程中的关键转录因子Osx相互作用,调节成骨细胞的发育以及骨量维持[26,27];而又有体外的生化研究表明, NO66与Mina53作为典型的仅含有Jmj C结构域酶类,能分别羟基化核糖体亚基Rpl8和Rpl27a[28,29].
我们测定了人源NO66的结构,发现NO66单体的结构中含有保守的Jmj C结构域,钩状结构域和w HTH类似的结构域, 4个NO66分子能形成环状四聚体[27](图2A和B)。我们鉴定了Osx与NO66相互作用区域的氨基酸序列,发现了NO66四聚体分子的表面与Osx相互作用的界面(图2C),破坏NO66与Osx的相互作用将导致组蛋白H3K4甲基化水平偏高, Osx依赖的骨骼发育关键基因表达水平升高,促使骨细胞分化加速、骨骼发育异常[27,30].氨基酸序列同源性分析发现, NO66与Osx相互作用的界面在脊椎动物中是保守的,提示NO66与Osx相互作用调控骨细胞分化的机制在进化上是保守的[27].我们还测定了NO66与Rpl8多肽(AA204~224)的复合物结构,发现NO66与Rpl8204~224多肽中N215, H216和H218形成氢键相互作用,决定了其底物特异性(图2D)[28].
研究提示, NO66可能是一类具有组蛋白去甲基化和蛋白质羟基化作用的双功能酶。
(3)组蛋白精氨酸甲基化调控及识别。精氨酸甲基化在基因表达调控, RNA代谢,细胞信号转导及DNA修复等过程中发挥重要作用[31~33].这个过程是由精氨酸甲基转移酶(PRMT)催化的,以腺苷甲硫氨酸(Ado Met)为 甲 基 供 体,生 成 腺 苷 高 半 胱 氨 酸(Ado Hcy)和甲基化精氨酸。根据甲基化精氨酸产物的不同,非对称二甲基精氨酸,对称二甲基精氨酸,及单甲基精氨酸,精氨酸甲基转移酶被相应划分为Ⅰ类,Ⅱ类和Ⅲ类。我们解析了布氏锥虫精氨酸甲基转移酶Tb PRMT7与Ado Hcy及H4小肽底物三元复合物的三维结构,这是第三类精氨酸甲基转移酶的第一个三维结构,同时也是第二个解析的精氨酸甲基转移酶-Ado Hcy-小肽底物三元复合物[34].揭示了它作为第三类精氨酸甲基转移酶,具有严格的催化精氨酸单甲基化活性的结构基础(图3)。还解析了Tb PRMT6和Tb PRMT6-Ado Hcy二元复合物的结构[35],发现Ado Hcy的结合引起Tb PRMT6活性位点附 近的构象调 整。免疫印 迹和质谱学 结果表明,Tb PRMT6在体外可以对称性二甲基化牛组蛋白H4R3,但是不能催化锥虫组蛋白的小肽。
目前已知Tudor结构域可以特异识别甲基化精氨酸,其识别方式与以上甲基化赖氨酸的识别方式极其相似,也是通过一个芳香环口袋识别甲基化精氨酸的甲基[36].