随着基因测序技术的发展,利用基因组编辑技术(genome editing technologies) 研究基因的功能已经成为后基因组时代生物学研究的重要方向。锌指核酸酶(zinc finger nucleases,ZFN)、类转录激活因子 核 酸 酶 (transcription activator-like effectornucleases,TALEN) 及规律成簇的间隔短回文重复序列(clustered regularly interspaced short palindromicrepeats,CRISPR) 是继同源重组基因打靶技术后,迅速发展起来的基因组编辑技术。与传统的基因打靶技术不同,人工核酸酶技术是利用限制性内切酶在特定的DNA位点切割DNA双链断裂(double strandbreaks,DSBs) ,诱 导 细 胞 产 生 非 同 源 末 端 连 接(non-homologous end joining,NHEJ) 或 同 源 重 组(homologous recombination,HR) 修复机制对损伤的DNA进行修复,从而实现对基因组的定点修饰。传统的基因修饰技术是通过胚胎干细胞的同源重组实现基因组的靶向修饰[1],但是该技术打靶效率低、耗时长,且打靶后有外源基因的残留[2].人工核酸酶技术构建简单,耗时短且不再依赖ES细胞,可以通过受精卵注射直接获得基因修饰动物,在许多物种已经实现基因的定向修饰。本文将介绍3种人工核酸酶的原理及在生命科学和医学研究的应用。
1基于ES细胞同源重组的基因打靶技术
传统的基因修饰技术是基于胚胎干细胞的获得与DNA同源重组引入外源基因这两种技术获得转基因动物[1].同源重组技术是在酵母细胞中最先发展起来。 Smithies等[3]首次证明了在哺乳动物细胞也存在同源重组现象。 Mansour等[4]采用了正负选择系 统 使 同 源 重 组 的 概 率 大 大 提 高。同 时,Capecchi[5]利用ES细胞同源重组打靶技术成功构建基因敲除小鼠。虽然基于ES细胞的同源重组基因打靶技术能够实现基因组的定点突变,但是由于该技术依赖于胚胎干细胞的获得、胚胎干细胞嵌合到动物生殖细胞的能力以及同源重组在胚胎干细胞中的重组效率等因素,导致这种基因打靶技术存在效率低、耗时长并有明显物种限制的缺陷。
2人工核酸酶介导的基因修饰技术
目前,主要的人工核酸酶主要包括3种:ZFN、TALEN和CRISPR系统。这3种基因组编辑技术的工作原理大致相似:DNA的特异性结合,限制性内切酶 在 特 定 的DNA位 点 切 割DNA双 链 断 裂(double strand breaks,DSBs) ,诱导细胞产生非同源末端连接(non-homologous end joining,NHEJ) 和同源重组 (homologous recombination,HR) 修复机制对损伤的DNA进行修复,从而实现对基因组的定点修饰[6,7].
2. 1锌指核酸酶
锌指核酸酶(zinc finger nucleases,ZFN) 是第1代人工核酸酶,ZFN由锌指蛋白(zinc finger protein,ZFP) 构成的特异性的DNA结合域和核酸内切酶FokⅠ构成切割域两部分组成[8,9]. DNA结合结构域由3 ~ 6个Cys2-His2锌指重复单位组成。 ZFP可以识别并结合3个连续的碱基,然后ZFP在核酸内切酶FokⅠ的指导下在靶基因位点将DNA双链切开(Fig. 1)。由于核酸内切酶FokⅠ需要形成二聚体才具有酶切活性[10].因此需要将两个锌指蛋白分别与核酸内切酶FokⅠ结合,使核酸内切酶FokⅠ形成二聚体将DNA双链切开,诱发细胞的DNA损伤修复机制[11].经过十几年的发展,锌指核酸酶技术已经成 功 应 用 于 很 多 物 种 的 遗 传 研 究,不 仅 在 果蝇[12]、斑马鱼[13]、大鼠[14]、小鼠[15]等多种模式动物成功实现了基因敲除或修饰,而且在2005年ZFN技术首次实现了对人类细胞的基因的定点敲除[16],随后更多类型的人类细胞也成功实现了靶基因的定点修饰[17,18].
作为最先应用的靶向基因编辑技术,与ES细胞同源重组基因打靶技术相比ZFN技术有以下几点优势:1) 不需要获取ES细胞就能实现基因组修饰;2)ZFN可以实现基因的定点修饰;3) 敲除效率明显提高。但是,ZFN也有一定的局限性,比如:ZFN对于每一个特定的靶点都需要构建庞大的锌指表达文库,然后再筛选出高效且特异的锌指蛋白,这一构建过程耗时耗力且费用较高。
2. 2类转录激活因子核酸酶
类转录激活因子核酸酶(TALEN) 是第2代人工核酸酶,与ZFN相比,构建更加简单,特异性更强。 TALEN与ZFN结 构 类 似,其DNA结 合 域 由TALE蛋白构成,TALE蛋白的DNA结合域由12个以上的串联重复单元组成[20],每个重复单元一般含有34个氨基酸残基,其中第12、13位氨基酸被称为RVD(repeat-variable diresidue)[21,22].不 同 的RVD能够特异性识别一种或多种碱基,目前已经发现了五种RVD,它们与碱基对应关系为: 组氨酸-天冬氨酸识别碱基C; 天冬酰胺-异亮氨酸识别碱基A; 天冬酰胺-天冬酰胺识别碱基G或A; 天冬酰胺-甘氨酸识别碱基T; 天冬酰胺-丝氨酸可以识别A、T、G、C中的任一种。与ZFN的工作原理一样,两个TALE蛋白分别与核酸内切酶FokⅠ结合形成二聚体,对基因组上特定靶位点进行切割,诱导细胞DNA修复机制从 而 实 现 靶 位 点 的 基 因 修 饰 (Fig. 2)。目 前TALEN技术已经成功的应用于包括果蝇[23]、斑马鱼[24]、大鼠[25]、小鼠[26]以及人类的多能干细胞[27]等的基因组修饰。 2014年,我们的研究组与国内学者合作利用TALEN技术实现了对非人灵长类X染色体连锁基因MECP2基因敲除[28].
TALEN技术较ZFN技术有巨大的进步。 TALEN技术有如下优势:1) 在构建上TALEN易于ZFN,且TALEN只需要简单的分子克隆技术就可以完成筛选;2)TALEN在识别靶位点时有更加广泛的选择范围,且在特异识别DNA序列上能力更强,特异性更强,相应的效率也高。但是,TALEN技术目前仍然处于初级阶段,存在以下几个方面的问题:1) 与ZFN一样TALEN识别目的基因的成分是蛋白质,构建识别20 bp DNA的TALEN蛋白,可能需要设计含有1000多个氨基酸的TALEN蛋白,这可能会引起机体的免疫反应,从而在细胞中降低TALEN的作用;2)TALEN也存在一定脱靶问题,这会直接影响基因的敲除效率。
2. 3规律成簇的间隔短回文重复序列
规律成簇的间隔短回文重复序列(CRISPR) 系统是第3代人工核酸酶,该系统最初并没有被应用于生物基因组的编辑,而是在原核生物中表现出某种获得性免疫功能,能使宿主获得抵抗噬菌体、质粒等外来DNA入侵的免疫能力[29]. CRISPR系统通常由CRISPR基 因 座 转 录 的RNA以 及CRISPR-associated(Cas) 蛋白两个部分组成,其中最为常见的是Ⅱ型CRISPR系统即CRISPR/Cas9系统。在CRISPR / Cas9系 统 中CRISPR基因 座 转 录crRNA(CRISPR RNA) 与转录激活crRNA(trans-activatingcrRNA,tracrRNA) 退火形成复合物特异识别基因组序列,然后引导Cas9核酸内切酶在目的片段生成DNA双链断裂 (double-strand breaks,DSBs) ,进而诱导 细 胞 产 生DNA损 伤 修 复 (Fig. 3)。目 前,CRISPR / Cas9已经在斑马鱼[29]、大鼠[30]、小鼠[31]、以及人类细胞[32]等成功实现了基因的靶向修饰。此外,2014年,我们与合作者利用CRISPR/Cas9技术对非人灵长类的基因组进行了修饰,获得多位点基因敲除食蟹猴[33].
CRISPR / Cas9系统相比于ZFN和TALEN有着明显的优势: 首先,CRISPR/Cas9系统的靶位点比ZFN和TALEN在 基 因 组 中 分 布 范 围 广; 其 次,CRISPR / Cas9系统可以同时实现对多个基因进行定点修饰,而ZFN和TALEN则需要多对; 再次,相对于ZFN和TALEN的构建,CRISPR/Cas9系统更加相简易且成本较低; 最后,Ⅱ型CRISPR/Cas9系统易于改造,例如将cas9蛋白进行改造可以实现对真核细胞转录的调控[35].然而,CRISPR / Cas9系统也存在像ZFN、TALEN这些人工核酸酶常见的脱靶效应[36,37].
3基因组编辑技术的应用
3. 1基因功能研究
随着基因测序技术的不断发展,深入了解基因的功能、构建人类疾病动物模型以及探索新型基因治疗方案已经成为后基因组时代的重要研究方向。而基因敲除是基因功能研究必不可少的环节,随着人 工 核 酸 酶 技 术 的 不 断 发 展,ZFN、TALEN和CRISPR / Cas9系统都已经在许多物种实现了靶基因的敲除。例如:2009年,Geurts等[38]利用ZFN技术成功构建靶基因敲除的大鼠,而且该基因突变可以稳定遗传至后代;Huang等[39]利用TALEN技术在斑马鱼中实现对Tnikb和Dip2a两基因的定点突变,并证明这种突变可以稳定地遗传; 利用传统的基因打靶技术很难实现对哺乳动物的Y染色体的基因修饰,而Wang等[40]成功利用TALEN技术实现了小鼠Y染色体上相关基因的修饰,并且成功获得了基因修饰的小鼠。 Wang等[41]利用CRISPR/Cas9技术实现了同时高效编辑5个不同基因,这对于基因家族成员的功能相关性的研究有着重要的意义。同样的结果相继在斑马鱼[29]和人体细胞[32]被证实。
3. 2人类疾病模型
人类疾病动物模型在探索发病机制、疾病诊断及药物筛选等方面发挥重要作用。采用基因组打靶技术至今,研究者已制备许多重要的人类疾病动物模型。 Jaenisch等报道了利用CRISPR/Cas9技术构建多基因突变的小鼠,实现首次应用CRISPR/Cas9技术对哺乳动物进行基因编辑。
2014年,我们研究组[28]与国内学者合作利用TALEN技术实现了对食蟹猴X染色体连锁基因MECP2基因敲除,这是利用这项技术构建出的首个非人类灵长类动物模型。 MECP2基因位于X染色体,该位点的突变通常会造成妊娠中期的雄性胎儿的死亡,仅有雌性胎儿可以顺利出生并存活,但会在出生后6 ~ 18个月开始发病,表现自闭症特点的“Rett综合征”(Rett syndrome,RTT,一种严重影响女性神经系统发育的疾病)。我们的研究结果显示,该基因突变的雄性胎儿在怀孕期间流产,而雌性猴在出生后则表现出明显的自闭症症状。