研究发现,在哺乳动物基因组中,只有不到 2%的转录产物具有蛋白编码功能,其余 98% 均为非编码 RNA ( noncoding RNA,ncRNA)[1,2]. 根据核苷酸序列的长度,ncRNA 可分为短链 ncRNA ( short/small ncRNA) 和长链 LncRNA( long ncRNA) ,二者之间并没有特别严格的界限,仅以 ncRNA 核苷酸序列的长度来区分,一般将长度大于 200 核苷酸 ncRNA定义为 LncRNA[3.7]. 根据核苷酸序列长度定义LncRNA 虽已得到了普遍的公认,但缺乏严谨性[8],已有报道证实,有些 LncRNA 的长度就小于 200 个核苷 酸[9]. LncRNA 分布广泛,在动物[10,11]、植物[12]、酵母[13]甚至病毒[4]中均发现有 LncRNA 存在,其功能几乎涉及到生物体生理及病理的全部生物学过程,既能调节细胞的增殖、分化及代谢等生理过程,也参与调节机体的各种病理过程,如癌症、糖尿病、免疫病、阿尔茨海默病等[14,15,32 ,41]. 本文对近年来有关 LncRNA 的结构、功能及其作用机制的研究进展进行综述。
1 LncRNA 的分子结构
尽管在过去 20 多年里,也有关于 LncRNA 的一些报道,但高通量测序技术的发展才使得从基因水平研究 LncRNA 成为可能[15]. 为了更深入地展开LncRNA 相关研究,了解其功能及作用机制,科学家们根据 LncRNA 在基因组中所处的位置及背景,将LncRNA 分为基因间 LncRNA ( intergenic LncRNA)和内含子 LncRNA ( intronic LncRNA) 以及正义LncRNA ( sense LncRNA) 和反义 LncRNA( antisenseLncRNA) 等 4 种类型[4],也有人将 LncRNA 分为 5类,即正义、反义、双向、基因内 LncRNA 及基因间LncRNA 等 5 种类型[2,8].结构是功能的基础,任何物质的功能发挥都离不开其特有的分子结构,研究一个物质的结构是了解其功能及其作用机制必要前提。 因此,LncRNA 分子的结构解析对 LncRNA 的功能及作用机制研究同样具有非常重要的作用。 但由于 LncRNA 处于生物体这个复杂的整体中,其自身会受到生物体的调控而发生相应的变化,加之数量庞大、分子量大、体外稳定性较差、难以结晶等特点,使得其结构研究困难重重,目前仅有少量研究报道其结构。
1. 1 LncRNA 的一级结构
LncRNA 的一级结构即为 LncRNA 的核苷酸排列顺序。 LncRNA 调节基因功能的途径多种多样,其中最为重要的一种方式便是通过碱基互补配对方式与靶基因结合来直接调节靶基因的转录翻译或间接调节靶基因上游或下游基因的转录翻译[16],碱基配对的基础便是其一级结构。 研究报道 LncRNA Gas5可直接与糖皮质激素上的 DNA 结合域 ( DNA.binding domain) 结合,进而与含有糖皮质激素反应元件( glucocorticoid response elements) 目的基因竞争并调节其表达[17],而与靶标碱基互补配对的基础便是 LncRNA 的一级结构。 LncRNA 参与调节的靶标既可以是 miRNA 也可以是 mRNA,如 Linc.MD1通过碱基互补配对的方式与 miR.133 和 miR.135 结合,竞争性抑制二者与靶基因的结合,进而发挥调节肌肉分化的作用[18]; 而 LncRNA1/2.sbsRNAs ( half.STAU1.binding site RNAs) 则可与 mRNA 的 3'.UTR区的 Alu 元件不完全配对结合,而形成 RNA 结合蛋白 Stau1 的结合位点,促进 Stau1 与 mRNA 的结合,通过 SMD ( stau1.mediated mRNA decay) 途 径 使mRNA 降解[19].
1. 2 LncRNA 的高级结构
LncRNA 二级结构及三级结构 ( 空间结构) 是LncRNA 发挥其功能的中枢[20]. 2012 年,Novikova等[20,21]报道了人类 SRA LncRNA ( steroid receptorRNA activator LncRNA) 二级结构信息 ( Fig. 1) . SRA能够激活数种性激素受体,并与乳腺癌的发病密切相关。
目前,还没有更多关于 LncRNA 空间结构( 三级结构及四级结构) 的研究报道,现有的关于 LncRNA高级结构的认识仅来源于 NEAT1. NEAT1 的两个亚基拥有相同的启动子及相似表达量 ( 人 NEAT1 亚基为: NEAT_V1∶ 3. 7kB,NEAT_V2∶ 22. 7 kB ) ,二者均参与特异性核腔隙 ( specific nuclearcompartments) .paraspeckles 的形成[21]. LncRNA 结构相关研究是一个全新的未知领域,随着研究的深入,越来越多 LncRNA 在生物体生理病理过程中发挥的功能及其作用机制被大家所认知。 这些作用机制可能依赖它的一级结构或/和二级结构或/和三级结构。 因 此,LncRNA 的结构解析是深入了解LncRNA 的功能及其作用机制的必经之路。
2 LncRNA 的生物学功能
2. 1 LncRNA 与癌症
目前,关于 LncRNA 功能相关研究中,最为深入的便是其在癌症中的作用。 大量的研究报 道,LncRNA 在肿瘤的发生发展过程中均具有极其重要的作用[22,23],它既可作为原癌基因促进肿瘤的生成,亦可作为抑癌基因来抑制肿瘤细胞的增殖、迁移等。 在许多癌症的发生发展中均伴随着 LncRNA 异常表达。 对膀胱癌患者组织进行芯片分析发现有 3324 个 LncRNA 发生了异常表达( 与对照组相比,变化倍数大于或等于 2) ,其中有 110 个 LncRNA 变化非常明显( 与对照组相比,变化倍数大于或等于 8) ,进一步的实验验证还发现,LncRNA TNXA、CTA.134P22. 2、CTC.276P9. 1 及 KRT19P3 变化与芯片数据高度一致[24]. 在膀胱癌中差异表达的 LncRNA 还有 LncRNA H19,其在膀胱癌组织中高表达,且体内外的实验也已证实上调 LncRNA H19 可加速膀胱癌细胞的转移[25]. LncRNA H19 可与 EZH2 ( zestehomolog 2) 结合后激活 Wnt / β.catenin,并下调 E.cad( E.cadherin) . 因此,LncRNA H19 可能是通过与EZH2 结合并且抑制 E.cad 的表达来促进膀胱癌的转移[25]. 除了膀胱癌,LncRNA H19 在前列腺癌中也发挥调节功能,LncRNA H19.miR675 轴可能通过调节转化生长因子 β 诱导蛋白( transforming growthfactor beta induced protein,TGFBI) 抑制前列腺癌的转移[26],其中,TGFBI 与癌症转移密切相关,而miR675 能够与 TGFBI mRNA 的 3'UTR 直接结合而抑制其翻译。 HOTAIRM1 是一个基因间 LincRNA( long intergenic noncoding RNA,LincRNA) ,在成熟髓系细胞( myeloid cells) 中特异性高表达。 巴雷特食管( Barretts esophagus,BE ) 是公认的食管腺癌( esophageal adenocarcinoma,EAC) 的癌前病变,80%的食管腺癌产生于 BE. 研究报道,LncRNA AFAP1.AS1 在 BE 和 EAC 中高表达[27]. 当小干扰 RNA 将LncRNA AFAP1.AS1 沉默时,能够抑制 EAC 的分化,促进其凋亡,并能够抑制 EAC 细胞的侵袭及其转移,并且这不影响 AFAP1 蛋白的表达[27].LncRNA 泌尿系统癌症相关基因 1 ( urothelialcarcinorna associated 1,UCA1) 可通过调节 Wnt 等多种基因促进膀胱癌细胞 BLS.211 的增殖并增强其耐药性[28]. 应激介导长链非编码转录体 5 ( long stress.induced non.coding transcripts5,LSINCT5) 在乳腺癌及卵巢癌中高表达,LncRNA LSINCT5 敲除后,可明显抑制癌细胞的增殖[29]. 另外一些 LncRNA,如生长休止基因转录体 5( Gas5) 可通过调控目的基因使细胞凋亡发挥抑癌基因的功能。 在乳腺癌中,Gas5 表达水平与正常对照相比显着下调[30]. 研究发现,在乳腺癌中显着下调的 LncRNA 还有 ZFAS1 ( zincfinger antisense 1).
2. 2 LncRNA 与神经退行性疾病及精神疾病
随着研究的深入,人们逐渐认识到,哺乳动物脑中不仅存在大量 LncRNA 的表达,且许多神经系统疾病的发生发展也常常伴随着 LncRNA 的异常表达[32]. 阿茨海默病( Alzheimers disease,AD) 是最为常见的神经系统疾病之一,目前研究普遍认为 AD是由于患者脑中 β.淀粉样蛋白( amyloid.β,Aβ) 大量表达,继而形成老年斑( senile plaque,SP) 而引起的病变,而 Aβ 则是淀粉样前体蛋白 ( amyloidprecursor protein,APP) 经分泌酶剪切加工后形成的产物。 β 分泌酶 1( BACE1) 是剪切 APP 的分泌酶之一,它是产生 β.淀粉样蛋白的关键分子,在 β.淀粉样蛋白的聚集过程中起到非常重要的作用。 有研究[33]
报道,BACE1 的反义转录本 LncRNA BACE1AS在 AD 的发生发展中也扮演着非常重要的角色。 在应激条件下,BACE1AS 可与 BACE1mRNA 形成复合体以增加后者的稳定性,防止后者降解,从而有利于β.淀粉样蛋白的进一步聚集。 而进一步的实验研究也得出相似的结论,BACE1AS 在 AD 患者及 BACE1转基因小鼠中均高表达[33,34]. 另有研究发现,Aβ142( amyloid beta protein 142) 可以抑制 SH.SY5Y细胞的分化,诱导 APP 相关因子的表达及 SP 的形成。 AD 模型组中,Aβ142 和 Aβ140 蛋白及 mRNA的表达均有所上调,同时伴随着 Ki67 表达的下调。
研究还证实,外源性 Aβ142 不仅促进 BACE1 的表达,还能促进 LncRNA BACE1AS 的表达。 LncRNA 增加 BACE1mRNA 的稳定性。 下调 SH.SY5Y 细胞中LncRNA BACE1AS 的表达可以减弱 BACE1 剪切APP 的能力,减缓 SP AD SH.SY5Y 模型中老年斑的形成[34]. 另有研究报道,AD 发生和发展还与LncRNA BC200 的变异表达及异常定位有关[35].LncRNA 也参与调节精神相关疾病。 精神分裂症、情感分裂性精神障碍、双相性障碍、重度抑郁及自闭症谱系障碍等相关精神疾病的发生发展与精神分裂症断裂基因 1 ( disorder in schizophrenia.1,DISC1) 表达异常有密切的关系[36]. 研究报道,LncRNA DISC2 可调节 DISC1,因此,LncRNA DISC2也有可能成为治疗精神疾病的一个潜在的靶标。 另外还有研究报道,自闭症谱系障碍和阿茨海默症与RELN 及其反义转绿本 LncRNA HAR1 密切相关[37].
2. 3 LncRNA 与糖尿病
糖尿病是一类由多种因素引起的代谢性疾病,其主要特点是慢性高血糖,伴随胰岛素分泌受损或胰岛素作用缺陷引起的糖、脂肪及蛋白质代谢紊乱。
世界卫生组织将糖尿病分为 4 种类型: 1 型、2 型、妊娠期糖尿病及其它类型糖尿病。 不同类型糖尿病的发病机制不尽相同,但它们均表现为使胰岛 β 细胞功能衰退,不能分泌足量胰岛素进而导致高血糖症。
随着研究的深入,已有大量的研究证实,miRNA 在糖尿病的发生发展中扮演着极其重要的角色。 然而,关于 LncRNA 在糖尿病中的作用却知之甚少,目前仅有少量研究报道了 LncRNA 在糖尿病的发生发展中的作用。 如胰岛素样生长因子 2 ( insulin likegrowth factor 2,IGF2) 反义转录本 IGF2AS 以及第 10号染色体丢失的磷酸酶基因诱导激酶 1[PTEN.induced putative kinase 1,PINK1]的反义转录本naPINK1. 高浓度的葡萄糖刺激可上调胰岛 β 中IGF2AS 的表达,暗示 IGF2AS 的表达可能与血糖浓度相关[38]. PINK1 可以被 PTEN 激活,而 PTEN 是一个重要的胰岛素信号通路抑制剂,有研究报道,naPINK1 可能与糖代谢密切相关[39,40]. LncRNA 相关研究仍处于起步阶段,而关于 LncRNA 与糖尿病相关研究报道更少,要想使 LncRNA 服务于糖尿病临床诊断及治疗等,还需要做大量的研究工作。
3 LncRNA 的作用机制
LncRNA 可通过多种形式参与调节生物体的生理病理过程。 根据现有关于 LncRNA 的研究报道,其作用机制可从两方面来归纳总结。
3. 1 LncRNA 参与调节的生物学过程
3. 1. 1 参与基因的表观遗传调控 表观遗传学是研究生物体或细胞表观遗传的一门学科分支,在基因的核苷酸序列不发生改变的情况下,基因表达了可遗传的变化。 目前已知的表观遗传学现象有 DNA甲基化、基因沉默、核仁显性、组蛋白修饰、基因组印迹、母体效应、休眠转座子激活及 RNA 编辑等。 表观遗传学现象的发现使人们认识到,RNA 可以参与调控使相同的基因型产生不同的表现型,而 LncRNA作为一种新的表观遗传调控分子,受到了广泛的关注,越来越多的证据显示,LncRNA 在表观遗传学调控中扮演着非常重要的角色[42]. 胞嘧啶甲基化是较为普遍的 DNA 修饰方式,即生成 5.甲基胞嘧啶,它是一个动态可逆过程。 5.甲基胞嘧啶可以在 Tet 甲基胞嘧啶双加氧酶的作用下转化为 5.羟甲基胞嘧啶,而 5.羟甲基胞嘧啶在胸腺嘧啶.DNA.糖基化酶的作用下,通过碱基切除修复最终将该位点转化为胞嘧啶,实现 DNA 甲基化与去甲基化之间的转换[43].研究 报 道,LncRNA TARID ( TCF21 antisenseRNA inducing demethylation) 通过诱导 TCF21 启动子的去甲基化激活 TCF21 的表达[43],TARID 能够与 TCF21 的启动子和 GADD 45A( growth arrest andDNA.damage.inducible,alpha) 相互作用,GADD45A是 DNA 去甲基化的调节因子,可以招募胸腺嘧啶.DNA.糖基化酶 ( thymine.DNA.glycosylase)[43]. DNA甲基化也称为 CpG 的甲基化。 已知 CpG 岛( CpG岛: 基因组中富含 CpG 位点的区域) 与基因表达的启动序列密切相关,当基因的 CpG 岛甲基化时,其转录活性受到抑制[44]. LncRNAXist ( X chromosomeinactive specific transcript) 就是通过调节目的基因使其 CpG 岛发生甲基化,抑制 X 染色体基因的表达来介导 X 染色体失活[45]; 基因组印记是指来自亲本的等位基因传递给子代时发生了修饰,使带有亲本印记的等位基因表达与亲本不同的性状。 而 H19LncRNA 对维持人类 11 号染色体近端的 IGF2 受体.H19 基因组印迹具有非常重要的作用[46]. 另外,LncRNA AIR 和 LncRNA Kcnqlotl 参与调节基因组印迹,同时,二者也可以通过募集组蛋白修饰酶使组蛋白发生修饰而影响目的基因的表达[47.49]. 研究发现,当细胞损伤时,细胞周期蛋白 D1( cyclin D1,CCND1) 基因启动子区可转录出一种低拷贝的LncRNA,它可将 RNA 结合蛋白 TLS 招募至 CCND1的启动子区并激活 TLS,使其与组蛋白去乙酰化酶结合进而抑制酶的活性,下调 CCND1 的表达[50].
3. 1. 2 参与基因的转录及转录后调控
可变剪接( alternative splicing) 或选择性剪接是指基因或mRNA 前体转录时产生的外显子可以以多种方式通过 RNA 剪切进行重新连接,以此产生不同 的mRNA,进翻译成不同的蛋白质。 LncRNAMALAT1 参与了基因的可变剪接[22,51]. 研究报道,MALAT1 能够与富含丝氨酸 / 精氨酸的剪接调节蛋白相互作用,进而影响剪接的模式[51],而这些剪接调节蛋白本身又被其自身的磷酸化水平所调节。 当MALAT1 与剪接调节蛋白相互作用时,一方面可以使得剪接调节蛋白在剪接斑点( splicing speckles) 重新分布[52],同时也可以调节这些蛋白自身的磷酸化水平,最终调节基因的转录过程。 由此,MALAT1 是一个非常重要的可变剪接的调节因子,干 扰MALAT1 表达与活性可严重影响机体的可变剪接过程[22]. 转录后调控是指基因转录后的产物的一系列加工、修饰及其调节的过程。 基因的转录后调控主要包括 RNA 的剪切、加工、拼接、代谢、成熟及稳定性调节等,它在基因的表达中占有极其重要的作用。
LncRNA 可通过与 mRNA 形成双链复合物等形式,进而从转录后水平调控基因的表达[16]; 从目前已知的关于 LncRNA 基因转录后调控的文献报道来看,它能够调控转录后的各个步骤,如,Zeb2 的反义LncRNA 能够与其内含子 5'端剪切位点所在区域形成互补双链,从而阻止该内含子剪切,保证 Zeb2 蛋白的正常表达[53]; LncRNA 也可以"困住"拼接相关的调节蛋白影响基因的拼接过程[16]; LncRNA 还可以通过调节 mRNA 的翻转( mRNA turnover) 对基因进行转录后的调控。
3. 1. 3 参与基因翻译的调控 LncRNA 通过调节mRNA 的稳定性及翻译来调控基因的活性。 β 淀粉样前体蛋白裂解酶 1( BACE1) 在 AD 的发生发展中扮演着非常重要的角色。 LncRNA BACE1AS 通过与BACE1 相互作用使其 mRNA 稳定性增加,其直接影响便是 BACE1 蛋白表达量的增加[54] . LncRNA 同样可以降低 mRNA 的翻译效率[22]. LncRNA pseudo.NOS 与神经元性一氧化氮合酶 ( neuronal nitricoxide synthase,nNOS) 结合后,通过影响核糖体与nNOS. pseudo.NOS 复合物的结合抑制 nNOS 的翻译[55].
3. 2 LncRNA 在生物学过程中充当媒介
3. 2. 1 充当分子支架 LncRNA 分子充当分子支架,将两个蛋白( 蛋白和 RNA) 分子绑定在一起进而发挥特定的生物学功能[56.59],如 LncRNA ANRIL 和LncRNA HOTAIR.3. 2. 2 充当分子向导 LncRNA 可以使特定的核糖核蛋白复合体定位到染色体的特定部位,进而改变基因( 邻近基因、远距离基因均可) 的表达,发挥分子向导的作用[56,57,59].3. 2. 3 充当分子诱饵 某些 LncRNA 可能充当分子诱饵的作用,它可以诱导某些蛋白、RNA 或miRNA 分子离开特定区域[56,57,59,60]. 有些诱饵分子还可以成为蛋白或 miRNA 的"分子海绵",如LncRNA H19 是 miRNA Let.7 的"分子海绵",其序列中包含许多 Let.7 结合位点[59,61].3. 2. 4 充当信号通路的调节剂 某些 LncRNA 能够响应来自细胞内或细胞外的信号,充当特定信号通 路 的 调 节 剂[56,57,59],如 LncRNA LUNAR1、LncRNA UCA1[59,62,63].
4 问题与展望
LncRNA 是真核生物转录本中非常重要的一个组成部分,能够调节大约 70% 以上的基因表达,它在机体的生理及病理过程中均有非常重要的作用。
目前,LncRNA 的研究还处于初级阶段,其功能、结构及其调控机制还需要进一步的阐明。 生物体所有的生命活动都依赖于其体内 DNA、RNA 及蛋白三者之间错综复杂的交互调控网络,因此,未来的研究必将趋向于从整体、系统的角度去研究生物体的生命过程。 小到研究特定类型的细胞在不同时间、空间内所有蛋白、DNA、RNA 的表达情况及其相互之间的关系,大到特定组织甚至是生物体本身在特定时间特定空间内蛋白、DNA、RNA 的三维表达及其调控网络,这是清楚了解生物有机体生命形式的一个必经之路。 但是三者本身数目之巨加上本身的结构复杂多样,这将是一个庞大而艰巨的任务,需要全人类共同的努力才有可能完成。
脂肪酶(lipase,EC3.1.1.3)主要是指一类能够催化甘油三酯水解生成脂肪酸、甘油和甘油单酯或二酯的酶,广泛应用于水解或醇解、酯合成、酯交换、内酯合成、多肽合成、高聚物合成及立体异构体拆分等有机合成反应,是目前用途最广泛的酶催化剂之一。猪胰脂...
在自然环境下,两栖动物受到紫外线、病原微生物的伤害及捕食者的威胁.面对恶劣的自然环境,两栖动物体表进化出许多特殊的腺体,这些腺体能够分泌丰富多样的生物活性肽,如抗氧化肽、抗菌肽、抗病毒多肽等,其中的抗菌肽研究已取得诸多进展.有研究者仅从...
GAF结构域是以最早被发现含有这个结构域的蛋白质来命名的,由特异性的cGMP磷酸二酯酶 (cGMP-binding phosphodiesterases) 、腺苷酸环化酶 (adenylyl cyclases, AC) 和细菌转录因子FhlA (formate hydrogenlyase transcription activator) 的首字母构成。...
膜蛋白是生物膜功能的主要承担者,根据膜蛋白的分布,膜蛋白可以分为三类:外周膜蛋白、整合膜蛋白和脂锚定蛋白。膜蛋白的功能具有多方面性,有些膜蛋白可以作为载体而将物质转运出细胞;有些膜蛋白是激素或者其他化学物质的专一受体;有些膜蛋白作为专一的...
G蛋白偶联受体是人类基因组中发现的最大的超家族蛋白之一,具有7个跨膜螺旋,在细胞信号传递中起着关键作用,拥有广泛的生理功能....
硫化物是H2S,HS-和S2-的统称。由于硫化物与细胞色素aa3血红素卟啉环铁离子的可逆性结合进而阻止氧气与其结合[1];此外高浓度的硫化物可以导致细胞色素氧化酶构象的不稳定和亚基的降解[2];因此,硫化物能够破坏线粒体氧化呼吸链中电子传递,抑制ATP的产生。所...
1肌球蛋白的结构与功能肌球蛋白主要存在于平滑肌中,它是肌原纤维粗丝的组成单位。其分子形状如豆芽状,由多条重链与多条轻链组成。肌球蛋白的家族较大,目前发现的肌球蛋白有24种,但依据其来源又可分为传统的肌球蛋白和非传统的肌球蛋白,如传统的...
蜘蛛丝拥有优异的机械和生物学性能,是一种理想的多功能材料。由于蜘蛛自相捕食和产丝量小等,通过驯养蜘蛛获取大量蛛丝纤维的难度较高,因此采用生物技术的方法重组表达蜘蛛丝蛋白成为获取仿生蜘蛛丝纤维的主要途径。到目前为止,在蛛丝仿生领域仍未取得突...
1、研究背景及意义蛋白质二级结构的预测是生物、数学与计算机交叉领域的课题,进行二级结构预测对于理解蛋白质结构与功能的关系,以及分子设计、生物制药等领域都有重要的现实。随着人类基因组计划的顺利实施,已知氨基酸序列的蛋白质数量成级数增长,目前试验...
对血红蛋白可逆载氧的系统研究是生物无机化学领域的重要成果之一,其结构与功能的关系也一直是相关教学关注的重点。在近一个世纪以来的研究中,人们对于血红蛋白的分子结构、载氧机理与生物学功能都有了较为全面的认识;但是对于其活性中心血红素在结合氧分...