1、前言
禽类是在大约310000000年前与哺乳动物类分离。始祖鸟是最先发现的,生活在大约150000000年前的禽类。鸡(家禽)在7500多年前被驯养。
目前的鸡基因组草图是在2004年绘制的,运用了6.6倍的DNA序列覆盖,采用了包括BAC、DNA杂交序列质粒载体、EST、mRNA以及DNA序列载体质粒配对首尾读序在内的全基因组排序方法。最先完成的禽类基因组序是利用未驯养鸡作为模型,它是目前认为现存的9600类禽种的一个禽类模型。鸡基因组的许多特性及其生物学特性使鸡在研究禽类发生与进化以及在生物农业和生物医学利用中成为了一个理想的生物有机模型。据估计,鸡基因组含有约20000~23000个基因,覆盖97%的基因组。鸡代表基因含量分化的一个中间水平,位于鱼和哺乳动物之间,可以确定基因的保守性以及哪些基因有重要功能,这样对确定脊椎动物基因组的必要特性很有用。鸡全基因组序是使鸡在研究禽类生物学、发生与进化生物学以及精确生物科学中成为一个真正的模型。由于新型的基因组学技术,研究鸡基因组将主要地促进分子生物学和遗传学在农业与医学中的利用。因此,鸡会成为一个全球的蛋白质营养源以及一个治疗疾病的生物工具。
2、鸡基因组的结构背景
大多数禽类真核型含有38对常染色体和一对以雌性为杂合型配子的性染色体,包含3类大小不同的染色体,大型染色体(GGA1~5)、中型染色体(GGA6~10)和微型染色体(GGA11~38)。鸡单倍体基因组约1.2×1010碱基对,约哺乳动物的40%。仅15%的鸡基因组可以被标注为散状重复,比在哺乳动物基因组观察的40%~50%的散状重复密度显著的低。很多辩认出的重复分化早,表明鸡的散状重复密度低是由于先祖可转移元件可能发生了变异。鸡基因组中所有有LTRs(LongTerminalRepeats)的复位子都属于脊椎动物特有的逆向病毒类。复位子含有基因组序中已知存在的禽肉瘤或白细胞增多病毒原病毒之一的序列。
富含G+C、CpG岛与基因的微型鸡染色体显示出与DNA转录活性相关的特性,有与哺乳动物染色体R带富含G+C的相同结构。鸡基因组内复制片段小,长度很少超过10Kb,并且没有超过50Kb的片段,鸡基因组内复制是染色体内进行的。
人类仅有2.5%的DNA与鸡的排序相同,其中44%是在蛋白编码区,25%是在内含子以及31%是在基因间,显示了全套非编码与编码保守序段的整体特性。来自3个基因发生GO(GeneOntology)类(组织发育、组织代谢和肌肉组织形成)基因在鸡基因调节模块CRMs(ChickenRegulatoryMod-ules)保守序列调节的基因丛中过度表达;而来自信号传递和水解酶活性GO类基因在非保守序列调节元件调节的基因丛中过度表达。编码区域大小与非编码区域保守序列大小呈负相关,因此,近距离顺序调节元件似乎不是所有非编码区域保守序列的主要功能元件。人类的6号染色体和鸡的10号染色体上保留着哺乳动物先祖的同线型,而啮齿类仅有X染色体上保留有哺乳动物先祖的同线型。在鸡染色体(GGA1~GGA4)与哺乳动物先祖X染色体间保守有14个染色体片段重组(13个倒位,1个融合)。
3、鸡基因组序使鸡成为了进一步提高对生物学认识的一个理想生物模型
鸡基因组序实际上是鸡的染色体单倍体成对碱基排序,给所有生物的的遗传信息提供了前景。鸡一直是遗传研究中利用的一种主要生物,对基础生物学已有显著影响。利用蛋的孵化,容易接触鸡胚并且操作简便,使这个生物体成为了脊椎动物发育分子生物学研究的理想模型。分子技术的出现启发了对基因型-表现型关系的认识。今天,由于分子水平的生物学信息,遗传机制的研究已大大地受到生物基因组背景(特别是基因标记)的影响。遗传与非遗传因素可能导致生物界的变化,正是生物体基因组因素促进这些变化的可持续性。鸡是一种生物有机体,具有由自然选择产生的遗传特性,最初有益于驯化、驯养。随着重组DNA技术的产生、DNA标记RFLP又占优势、随继出现指印标记到微卫星标记,今天几乎所有分隔的DNA多肽都能够用作标记。除减数分裂外,利用RH技术按需要断裂染色体,分离人类与鸡基因组的基因序估计在100~200个切入点,共线型超过100cM的保守区域。这是目前鉴别出表现型后,测定鸡基因型的基础,也是进一步完善鸡全基因组排序的参考。
分析鸡基因组结构变异,并利用其估测生物多样性,以及解释这种结构变异与生物表现的关系,禽类基因组学会提高对生物学的认识。通过全基因组标记分析,鉴别鸡QTL和高效率基因型测定会整合总遗传值。从鸡、火鸡和鹌鹑内含子排序推断,碱基替换方式引起了G、C含量中(等量基因结构)大规模杂合性的产生和进化,与等量基因结构进化的偏向基因转化(BGC)模型一致,当推断等量基因结构起源时,跟先祖羊膜动物基因组非常相似。哺乳动物基因组共线型保守区域有38%的鸡CpG岛,其中48%与基因有关,微型染色体上含量最高。鸡微型染色体显示,内含子中有高于大型染色体18%的序列(基因)分化和编码区(编码蛋白基因区)中有高于26%的中性替换率,表明较小染色体容易经历生殖细胞变异,因为变异率的差异是“偏向基因转化”,一种重组引起的变异机制。
许多基因特征像G+C含量%、CpG岛密度和基因密度表示与染色体大小、基因重组率之间的明显关系。禽类基因组的一个独特特点是染色体大小的巨大差异,微型染色体的重组率最高,使其对遗传连锁研究最为理想。DNA克隆显示5%~10%的基因从鸡基因组遗失。禽类雌性性染色体基因组代表性差,W染色体的重复含量高。
人类、鸡和河豚鱼共享一套核心基因(7606),在鸡基因组几乎占所有基因的1/3,在脊椎动物都被保留;在禽类世系中,基因遗失率较高,基因重复较少。鸡世系丢失的基因包括犁鼻器受体、奶酪蛋白以及一些免疫系统基因。同样地,禽类有更多的羽毛特有的角蛋白基因,而哺乳动物则丢失了蛋抑生物素蛋白基因。在鸡中仍然存在尿素循环的所有酶,表明在鸡组织中它们有作用于含氮的代谢中间物的功能。用ESTs(ExpressedSequenceTags)作标签,在许多组织中被表达的基因趋向于在哺乳动物和鸡中有好的保守性,而在少的组织中能被表达的基因则更容易分化。在蛋中检测基因功能和预测调节基因,利用大量的被排序鸡ESTs标签和标准的3维胚胎重组结构是最理想的。对禽类性别决定SOX2(SexDeterminingRegionY,Box2)基因保守性的研究,鉴别出了鸡神经特异增强基因,通过电穿孵化蛋鸡胚神经管证实。性连锁Id位点基因可能通过控制黑素细胞转移,确定皮肤皮下黑素的存在和缺乏。常染色体W位点基因决定皮肤是否贮藏有黄色类葫萝卜素。在这些位点不同基因型的组合决定鸡是否有暗黑、白色、黄色或呈绿色的腿,可能解释了其它禽种腿色或人类肤色丰富多样性的原因。
PMEL17编码蛋白质在优黑色素体中起关键作用,灰白色羽毛毛色变异就是这个基因中的两次变异。SOMKY基因作为一种抑制色变基因部分地恢复毛色,即是部分地阻止同一基因内第一次突变的显性白色基因变异作用。禽类基因组好像显示出相对高水平的保守性,至少在真核类生物中是这样,现有鸡基因组序和相关信息及基础结构给所有野禽和家禽的遗传学分析增加了分子水平上的益处。
4、鸡基因组在农业和医学中的利用
生物学的主要进展和分子遗传学的发展以及禽类基因组学包括绘制高质量基因组序草图将会有益于鉴别控制复杂多因子性状的基因,提高对甚至保留在已经历过很多代强度选择的鸡群中的纷繁多样性的认识,以及对QTL分子本质的进一步认识。目前对多因子性状和基因异常的遗传基础的认识不是很完全,并且对存在被分化群中的正常表现型多样性的认识还很差。标准的单个QTL分析,揭示出了影响鸡体重和体组成的大约15个QTL,也就是说,随着相互作用的QTL基因频率的变化,每个单个影响生长的位点基因的表现型效应会因之改变。选择期间遗传变异会表现出来。因此,鸡模型提高了对基因型与表现型间关系的认识,提供了对食欲与生长遗传控制的重要认识。
鸡基因组序在禽类生物学和农业中都起着指导作用。随着分子遗传学和禽类基因组学的发展,鸡基因组序高质量草图和高密度SNPs的产生以及复杂多因子性状的鉴别,使鸡在生物学的主要进展中起着重要作用。目前,600多个QTL和一套标准的10000多个SNPs,结合构建巨大结构资源鸡群的容易性,对鉴别、检测控制这些性状的基因和进一步发展数量遗传学的理论怀有很大希望。与哺乳动物种类比较,鸡染色体重组率较高。
为了扩大采集禽类生物的变异,通过敲出实验或大规模N-乙酰基-N-亚硝基脲(ENU)诱发产生变异,鸡中的遗传多样性能够用作了解生物学的有用资源。鸡的巨大群体数量是遗传研究采集有趣而新型变异的一种潜在资源。因而,需要一个很稠密的SNP图(约1SNP/10Kb),提供一个好机会检测强度选择基因。在育种方案中,能利用这种方法增加有益等位基因频率或淘汰不利等位基因。将会有新的机遇利用现代对农业重要的基因组技术,从遗传上,精确地对鸡实施生物工程技术。
由于人类的干预,对家畜实施强度定向选择,强度选择基因(有益基因选择)在这些种类就成为了一个共同现象。在猪育种中,在猪的IGF2基因位点对瘦肉生长选择就是一个首选例子,对高度肌肉发育强度选择和品种对IGF2内含子的变异因子的选择,导致了变异因子附近10Kb区域的高度纯合性。
鸡中一定存在很多强度选择固定的有益基因,但是,影响的序列区域相当小。一个新兴的机遇就是利用基因组选择作为一种方法,根据全基因组标记密度图,预测家畜总遗传值,使其产生新的时机,用对农业有价值的方法从遗传上改进鸡种。庞大的商用鸡群意味着在鸡中能够作大规模的育种研究,因为可以获得大量的高度近交系品系。蛋鸡选择高产蛋量,而肉鸡选择快速生长及产肉量高。从长远角度看,通过转基因技术,改进鸡品系遗传贡献量的能力可能最终会成为分子遗传学和鸡生理系统上最重要而又实际的利用。鸡作为营养相关研究的一个生物模型,是科学数据的一种补偿资源,给人类健康和普通生物学提供认识,因此,鸡遗传研究和医学研究常常互补。在鸡蛋白蛋白中将会研发一种给人类医学生产重组蛋白的系统。在禽类免疫系统中,利用基因组方法,基因和蛋白质的特性化,禽类细胞激素和其它信号分子的分离研究将获得重要进展。与免疫相关的185个基因包括白细胞介素、转录因子、化学激素、分化抗原、受体、影响Tollpathway奇异免疫基因以及MHC(MajorHistocomptabilityComplex)相关基因。曾经认为TNF(tumornecrosisfactor)基因缺乏,但是发现了它的受体基因(TNFRSFA)。甚至在鸡基因组也发现了曾经认为是哺乳动物特有免疫基因,包括IL3、IL7、IL9、IL26、CSMF、LIF以及Cathelici-din杭菌多肽。
用禽类基因组法对禽类免疫系统的基因和蛋白质特性化获得了许多关于禽机体对传染性病原的应答性。综合分析鸡基因组序已鉴别出很多细胞激素、化学激素以及其受体。可以从遗传上精确地对鸡采用生物工程技术,使其具有对疾病高度的抵抗力。
禽类,特别是,家禽和鸭子是许多传染性疾病的传染源,基因组学将告诉很多关于宿主对这些病原的应答性。鸡基因组学在进化生物学、系统学、发育模型以及人类疾病与农业中可能有主要的应用和利益。在肉用型鸡,先天性疾病,像腹腔积水、瘸腿、受精率降低以及对传染性疾病抵抗力降低的病例已经有升高的趋势;在蛋用型鸡,与产蛋量升高继发的骨质疏松症病例也有增加的趋势。由于食品安全要求的提高,有必要减少化学药品和抗菌素的利用,提高禽对病原的遗传抵抗力。这些新性状通过常规遗传选择方法,既难测定又成本费用高,家禽基因组学给这些问题承诺了新的方法。
5、结论
人类、鸡和河豚鱼间比较基因组排序,显示出一套核心基因。这套核心基因序列比其它人类/鸡同祖同源基因更倾向保守,表明强度淘汰、纯种化选择在对它们起作用,也表明这些基因在很多不同组织中有表达,快速进化基因只在较少组织中表达。大多数核心基因影响细胞质与细胞内细胞核间蛋白质转运。禽类存在尿素循环的所有酶,但是又明显没有作用于这一功能。表达这些酶的基因存在哪种组织,起什么作用有待进一步的研究,与含氮代谢中间产物的代谢过程有关是一个探讨方向。
鸡跟人类OR5U1和OR5BF1嗅觉受体基因同祖同源的基因至少有218个非等同基因,揭示出鸡跟人类有相同数量的嗅觉受体基因,这些嗅觉基因在它们的行为中也许起着比以前认为更多的作用,也许起作跟在人类中不同的作用,这是目前最热门的禽类嗅觉与嗅觉基因研究。
鸡与哺乳动物和鱼基因组相比,证实了广泛的基因保守性共线型,可能人类基因组与鸡之间比人类与鼠之间发现的保守性更多。鸡代表哺乳动物与鱼之间比较的一个中间进化水平,使得它对确定脊椎动物基因组的必要特性很有用,此外,它能够用于评测进化期间发生的基因组变化,像染色体重组和进化率的变化。基因组分析能给我们提供大量的关于禽类生物的信息,这些信息将会利用在农业以及很多不同基础研究领域。鸡的数量性状基因位点与相关的农业与医学结合,既促进发展更多的精妙多肽性又促进构建影响有趣数量性状的功能多肽性框架,以至于充分地利用鸡的遗传潜力。鸡作为一个生物种类模型将提供对复杂生物的整体认识。
认识病毒与基因相互作用,研究新的方法,鉴别鸡中被激活的基因或通过MDV转染修饰基因。把被鉴别的鸡MIP-1基因克隆到病毒的疫苗株,一种新的重组疫苗被开发出。禽类血型本质可指导鉴别单倍体B21,产生对马立克式病的抵抗力,并且指导在商用品系选择这个位点基因。
利用最新研究能够充分发挥鸡的真正遗传潜力。除此之外,表观遗传学也研究精确描述基因活动的变化,虽并不包括基因组结构的变化,但它们仍然可传递到至少下一代。通过细胞内物质表观基因组一系列表观基因“标记”,操纵基因启动或关闭,控制基因表达。通过这些标记,环境因素像饲料、应激、临产期以及营养给基因标上永久记忆,将这种持续影响传递到下一代。
枯草芽孢杆菌(Bacillussubtilis)是革兰氏阳性细菌,是一种重要工业酶制剂的生产菌,中国农业部批准使用的安全菌株,现已广泛应用于食品发酵行业.在基因工程操作中,因为高拷贝外源质粒在B.subtilis中的稳定性较差,造成复制过程中大量单链脱氧核糖核酸...