• 回答数

    5

  • 浏览数

    93

小盆友2鸣儿
首页 > 期刊论文 > 人类研究基因是有论文

5个回答 默认排序
  • 默认排序
  • 按时间排序

缌喵喵喵

已采纳

这次破译得知人类基因组超过60亿个独立的DNA碱基、大约2-3万个蛋白质编码基因组成,新序列填补的空白包括人类5条染色体的整个短臂 并覆盖了基因组中一些最复杂的区域 ,通过新的技术研究出全球第一个完整的无间隙人类基因组序列,首次揭示高度相同的阶段重复基因组区域及其在人类基因组中的变异。

258 评论

纳殇誰鯟

题目:人类基因组计///作者///院系:///年级:///学号:摘要:人类基因组计划由美、英、日、中、德、法等国参加进行了人体基因作图,测定人体全部DNA序列创建计算机分析管理系统,检验相关的伦理、法律及社会问题,进而通过转录物组学和蛋白质组学等相关技术对基因表达谱、基因突变进行分析,可获得与疾病相关基因的信息。在揭示人类发展历史,基因治疗,农作物绿色革命,DNA鉴定方面具有深远影响。关键字:人类基因组计划正文:人类基因组计划人类基因组计划于20世纪80年代提出,由国际合作组织包括有美、英、日、中、德、法等国参加进行了人体基因作图,测定人体23对染色体由3×109核苷酸组成的全部DNA序列,于2000年完成了人类基因组“工作框架图”。2001年公布了人类基因组图谱及初步分析结果。其研究内容还包括创建计算机分析管理系统,检验相关的伦理、法律及社会问题,进而通过转录物组学和蛋白质组学等相关技术对基因表达谱、基因突变进行分析,可获得与疾病相关基因的信息。人类基因组计划与曼哈顿原子弹计划和阿波罗计划并称为三大科学计划。人类基因组计划在二十多年的时间里取得了较大进展。人类基因组计划最早在1985年由诺贝尔奖获得者,美国的杜尔贝克Renato Dulbecoo提出。最初目的是完成人类基因组全长约30亿个核苷酸的碱基序列测定,阐明所有人类基因并确定其在染色体上的位置,从而破译全部的人类遗传基因。1986年3月7日,杜尔贝克在《科学》杂志上发表了一篇题为“癌症研究的转折点——测定人类基因组序列”的文章,指出癌症和其它疾病的发生都与基因有关,并提出测定人类整个基因组序列的途径和重要意义。1988年美国能源部和国家卫生研究院率先在美国开展人类基因组计划,并经国会批准由政府给予资助。此后,成立了一个国际间的合作机构——人类基因组织(Human Genome Organization),由多个国家筹集资金和科研力量,积极参加这一国际性研究计划。1990年10月,国际人类基因组计划正式启动,预计用15年时间,投资30亿美元,完成30亿对碱基的测序,并对所有基因(当时预计为8万~10万个)进行绘图和排序。全球性人类基因组计划有美国、英国、日本、法国、德国和中国六个国家负责,其中美国承担了全部任务的54%,英国33%,日本7%,法国2.8%,德国2.2%,中国于1999年9月获准加入人类基因组计划并承担了1%的测序任务,即3号染色体断臂自D3S3610标志至端粒区段约3000万个碱基的全序列测定。中国1993年启动了相关研究项目,相继在上海和北京成立了国家人类基因组南、北两个中心,并承担人类基因组计划中1%的测序任务。经过多个国家的科学家的共同协作,人类终于在20世纪90年代完成了对自身基因组测序的初步工作。2003年6月,中、美、日、德、法、英等六国科学家宣布首次绘成人类基因组“工作框架图”。2003年4月14日,中、美、日、德、法、英等六国科学家宣布人类基因组序列图绘制成功,人类基因组计划的所有目标全部实现。2004年,人类基因组完成测序;2005年,人类X染色体测序工作基本完成,并公布了该染色体基因草图。HGP的主要任务是人类的DNA测序,包括下图所示的四张谱图,此外还有测序技术、人类基因组序列变异、功能基因组技术、比较基因组学、社会、法律、伦理研究、生物信息学和计算生物学、教育培训等目的。1、遗传图谱(genetic map)又称连锁图谱(linkage map),这是根据基因或遗传标记之间的交换重组值来确定它们在染色体上的相对距离、位置的图谱。其图距单位是厘摩(coml),以纪念现代遗传学奠基人摩尔根。遗传图谱的建立为基因识别和完成基因定位创造了条件。意义:6000多个遗传标记已经能够把人的基因组分成6000多个区域,使得连锁分析法可以找到某一致病的或表现型的基因与某一标记邻近(紧密连锁)的证据,这样可把这一基因定位于这一已知区域,再对基因进行分离和研究。对于疾病而言,找基因和分析基因是个关键。2、物理图谱(physical map)物理图谱是指有关构成基因组的全部基因的排列和间距的信息,它是通过对构成基因组的DNA分子进行测定而绘制的。绘制物理图谱的目的是把有关基因的遗传信息及其在每条染色体上的相对位置线性而系统地排列出来。DNA物理图谱是指DNA链的限制性酶切片段的排列顺序,即酶切片段在DNA链上的定位。因限制性内切酶在DNA链上的切口是以特异序列为基础的,核苷酸序列不同的DNA,经酶切后就会产生不同长度的DNA片段,由此而构成独特的酶切图谱。因此,DNA物理图谱是DNA分子结构的特征之一。DNA是很大的分子,由限制酶产生的用于测序反应的DNA片段只是其中的极小部分,这些片段在DNA链中所处的位置关系是应该首先解决的问题,故DNA物理图谱是顺序测定的基础,也可理解为指导DNA测序的蓝图。广义地说,DNA测序从物理图谱制作开始,它是测序工作的第一步。制作DNA物理图谱的方法有多种,这里选择一种常用的简便方法──标记片段的部分酶解法,来说明图谱制作原理。用部分酶解法测定DNA物理图谱包括二个基本步骤:(1)完全降解 (2)部分降解3、序列图谱(sequence map)随着遗传图谱和物理图谱的完成,测序就成为重中之重的工作。DNA序列分析技术是一个包括制备DNA片段化及碱基分析、DNA信息翻译的多阶段的过程。通过测序得到基因组的序列图谱。4、基因图谱(DNA map)基因图谱是在识别基因组所包含的蛋白质编码序列的基础上绘制的结合有关基因序列、位置及表达模式等信息的图谱。在人类基因组中鉴别出占具2%~5%长度的全部基因的位置、结构与功能,最主要的方法是通过基因的表达产物mRNA反追到染色体的位置。原理基因图谱的意义在于它能有效地反应在正常或受控条件中表达的全基因的时空图。通过这张图可以了解某一基因在不同时间不同组织、不同水平的表达;也可以了解一种组织中不同时间、不同基因中不同水平的表达,还可以了解某一特定时间、不同组织中的不同基因不同水平的表达。人类基因组计划的实施具有重大意义和影响。第一,揭示人类发展历史破译生命密码的人类基因组计划有助于人们对基因的表达调控有更深入的了解。同时,人类基因组图谱对揭示人类发展、进化的历史具有重要意义。对进化的研究,不再建立在假说的基础上,利用比较基因组学,通过研究古代DNA,可揭示生命进化的奥秘以及古今生物的联系,帮助人们更好地认识人类在自然界中的地位。第二,基因治疗获得人类全部基因序列将有助于人类认识许多遗传疾病以及癌症等疾病的致病机理,为分子诊断、基因治疗等新方法提供理论依据。在不远的将来,根据每个人DNA序列的差异,可了解不同个体对疾病的抵抗力,依照每个人的“基因特点”对症下药,这便是21世纪的医学——个体化医学。更重要的是,通过基因治疗,不但可预防当事人日后发生疾病,还可预防其后代发生同样的疾病。第三,基因工程药物研究基因工程药物,是重组DNA的表达产物。广义的说,凡是在药物生产过程中涉及用基因工程的,都可以成为基因工程药物。基因技术应用于制药工业,可以生产出高效、高产、廉价、不再苦口的防治疾病的新药物,从而引起制药工业的革命性变革。对于肝炎、心血管疾病、肿瘤、艾滋病等目前尚无良药可治的重大疑难病,人们对生物工程寄予厚望,期待基因工程技术生产出有效地治疗药物。第四,农作物的绿色革命科学家们在利用基因工程技术改良农作物方面已取得重大进展,基因技术的突破使科学家们得以用传统育种专家难以想象的方式改良农作物。例如,基因技术可以使农作物自己释放出杀虫剂,可以使农作物种植在旱地或盐碱地上,或者生产出营养更丰富的食品。科学家们还在开发可以生产出能够防病的疫苗和食品的农作物。基因技术也使开发农作物新品种的时间大为缩短。利用传统的育种方法,需要七、八年时间才能培育出一个新的植物品种,基因工程技术使研究人员可以将任何一种基因注入到一种植物中,从而培育出一种全新的农作物品种,时间则缩短一半。第五,DNA鉴定DNA鉴定已经给法医科学和犯罪司法系统带来了一场革命。DNA已经成为无数审判中的关键证据,帮助警察和法庭鉴别暴力犯罪中的罪犯,而且可信度非常高。它能够确定犯罪的人,同时也能够证明误判的人无罪。不仅如此,DNA鉴定还可以用于帮助寻找失踪的人、谋杀或事故中的受害者;还可以用于证明或否认父子关系。第六,转基因动物随着基因工程技术的飞速发展及其在动物上的应用,转基因动物的发展呈现出一片“大好形势”。比如基因育种能提供高产优质抗病的“超级动物”;基因工程疫苗为畜牧业节省了大笔开支;通过转基因动物进行器官移植。人类基因组的重要性由以上的事实我们可以看出,要想解开人类自身的秘密,就要从破解基因的密码做起。对人类基因的了解和掌控,也将对人类物种的进化、人类社会的进步产生强大推动作用。通过对人类基因已知和未知领域的探索,可以找到更好的基因更有利人类进步的基因,人类社会将从本质上发生突破性的飞越。因此我们可以说,这项耗资大耗时长的人类基因组计划确实是非常必要而且永世受益的。对于生物学界来说这可能是很小的一步,但对人类社会来说却是非常大的一步。尽管该计划已宣告完成,但该计划尚未得出令人满意的人类基因图谱,因此,科学工作者们对人类基因组的探索研究仍在紧张的进行中。希望在不久的将来,人类能解开基因的面纱,了解它掌控它,给人类社会带来无穷的财富。参考文献:1、章波《人类基因研究报告》重庆出版社 2006年版2、钱俊生、孔伟、卢大振《生命是什么》中共中央党校出版社2000年12月版3、C.丹尼斯、R.加拉格尔、J.D.沃森 序《人类基因组 我们的DNA》科学出版社2003年4月版4、杨业洲、陈廉《人类基因组计划》实用妇产科杂志2001年1月第17期 (Journal of Practical Obstetrics and Gynecology 2001 January Vol.17 No.1)5、参考资料:《科学》(Science)

99 评论

易叉叉叨叨

李宝键教授在“展望21世纪的生命科学”一文中谈到基因组研究计划研究重要性时,引用《Scinence》上“第三次技术命革”中的一句话:“下一个传大时代将是基因组革命时代,它正处于初期阶段。”在当前的研究水平上,只要涉及生命体重要现象的课题,几乎离不开对基因及其作用的分析。2000年6月26日,英美两国首脑会同公私两大人基因组测序集团向世人正式宣告,人基因组的工作草图已绘制完成。科学家把这作为生命科学进入新时代的标志,即后基因组时代(post-genome era)。因此有必要对基因组及其研究内容和进展作一个了解。1基因组学及其研究内容基因组(GENOME)一词是1920年Winkles从GENes和chromosOMEs组成的,用于描述生物的全部基因和染色体组成的概念。1953年Watson和Crick发现DNA双螺旋结构,标志分子生物学的诞生,随着各学科的发展,当前生物学研究进入新的进代,在生物大分子水平上将不同的研究技术和手段有机的结合以攻克生物学难题。基因组研究可以理解为:(1)基因表达概况研究,即比较不同组织和不同发育阶段、正常状态与疾病状态,以及体外培养的细胞中基因表达模式的差异,技术包括传统的RTPCR,RNase保护试验,RNA印迹杂交,但是其不足是一次只能做一个。新的高通量表达分析方法包括微点阵(microarrary),基因表达序列分析(serial analysis of gene expression,SAGE),DNA芯片(DNA chip)等;(2)基因产物-蛋白质功能研究,包括单个基因的蛋白质体外表达方法,以及蛋白质组研究;(3)蛋白质与蛋白质相互作用的研究,利用酵母双杂交系统,单杂交系统(one-hybrid system),三杂交系统(thrdee-hybrid system)以及反向杂交系统(reverse hybrid system)等。1986年美国科学家Thomas Roderick提出了基因组学(Genomics),指对所有基因进行基因组作图(包括遗传图谱、物理图谱、转录图谱),核苷酸序列分析,基因定位和基因功能分析的一门科学。因此,基因组研究应该包括两方面的内容:以全基因组测序为目标的结构基因组学(structural genomics)和以基因功能鉴定为目标的功能基因组学(functional genomics)。结构基因组学代表基因组分析的早期阶段,以建立生物体高分辨率遗传、物理和转录图谱为主。功能基因组学代表基因分析的新阶段,是利用结构基因组学提供的信息系统地研究基因功能,它以高通量、大规模实验方法以及统计与计算机分析为特征。随着1990年人类基因组计划(Human Genome Project,HGP)的实施并取得巨大成就,同时模式生物(model organisms)基因组计划也在进行,并先后完成了几个物种的序列分析,研究重心从开始揭示生命的所有遗传信息转移到从分子整体水平对功能的研究上。第一个标志是功能基因组学的产生,第二个标志是蛋白质组学(proteome)的兴起。2 结构基因组学研究内容结构基因组学(structural genomics)是基因组学的一个重要组成部分和研究领域,它是一门通过基因作图、核苷酸序列分析确定基因组成、基因定位的科学。遗传信息在染色体上,但染色体不能直接用来测序,必须将基因组这一巨大的研究对象进行分解,使之成为较易操作的小的结构区域,这个过程就是基因作图。根据使用的标志和手段不同,作图有三种类型,即构建生物体基因组高分辨率的遗传图谱、物理图谱、转录图谱。2.1遗传图谱通过遗传重组所得到的基因在具体染色体上线性排列图称为遗传连锁图。它是通过计算连锁的遗传标志之间的重组频率,确定他们的相对距离,一般用厘摩(cM,即每次减数分裂的重组频率为1%)来表示。绘制遗传连锁图的方法有很多,但是在DNA多态性技术未开发时,鉴定的连锁图很少,随着DNA多态性的开发,使得可利用的遗传标志数目迅速扩增。早期使用的多态性标志有RFLP(限制性酶切片段长度多态性)、RAPD(随机引物扩增多态性DNA)、AFLP(扩增片段长度多态性);80年代后出现的有STR(短串联重复序列,又称微卫星)DNA遗传多态性分析和90年代发展的SNP(单个核苷酸的多态性)分析。2.2物理图谱物理图谱是利用限制性内切酶将染色体切成片段,再根据重叠序列确定片段间连接顺序,以及遗传标志之间物理距离[碱基对(bp)或千碱基(kb)或兆碱基(Mb)的图谱。以人类基因组物理图谱为例,它包括两层含义,一是获得分布于整个基因组30 000个序列标志位点(STS,其定义是染色体定位明确且可用PCR扩增的单拷贝序列)。将获得的目的基因的cDNA克隆,进行测序,确定两端的cDNA序列,约200bp,设计合成引物,并分别利用cDNA和基因组DNA作模板扩增;比较并纯化特异带;利用STS制备放射性探针与基因组进行原位杂交,使每隔100kb就有一个标志;二是在此基础上构建覆盖每条染色体的大片段:首先是构建数百kb的YAC(酵母人工染色体),对YAC进行作图,得到重叠的YAC连续克隆系,被称为低精度物理作图,然后在几十个kb的DNA片段水平上进行,将YAC随机切割后装入粘粒的作图称为高精度物理作图.2.3转录图谱利用EST作为标记所构建的分子遗传图谱被称为转录图谱。通过从cDNA文库中随机条区的克隆进行测序所获得的部分 cDNA的5'或3'端序列称为表达序列标签(EST),一般长300~500bp左右。一般说,mRNA的3' 端非翻译区(3'-UTR)是代表每个基因的比较特异的序列,将对应于3'-UTR的EST序列进行RH定位,即可构成由基因组成的STS图。截止到1998年12月底,在美国国家生物技术信息中心(NCBI)数据库中分布的植物EST的数目总和已达几万条,所测定的人基因组的EST达180万条以上。这些EST不仅为基因组遗传图谱的构建提供了大量的分子标记,而且来自不同组织和器官的EST也为基因的功能研究提供了有价值的信息。此外,EST计划还为基因的鉴定提供了候选基因(candidantes)。其不足之处在于通过随机测序有时难以获得那些低丰度表达的基因和那些在特殊环境条件下(如生物胁迫和非生物胁迫)诱导表达的基因。因此,为了弥补EST计划的不足,必须开展基因组测序。通过分析基因组序列能够获得基因组结构的完整信息,如基因在染色体上的排列顺序,基因间的间隔区结构,启动子的结构以及内含子的分布等。3功能基因组学研究功能基因组学(functional genomics)又往往被称为后基因组学(postgenomics),它利用结构基因组所提供的信息和产物,发展和应用新的实验手段,通过在基因组或系统水平上全面分析基因的功能,使得生物学研究从对单一基因或蛋白质的研究转向多个基因或蛋白质同时进行系统的研究。这是在基因组静态的碱基序列弄清楚之后转入基因组动态的生物学功能学研究。研究内容包括基因功能发现、基因表达分析及突变检测。基因的功能包括:生物学功能,如作为蛋白质激酶对特异蛋白质进行磷酸化修饰;细胞学功能,如参与细胞间和细胞内信号传递途径;发育上功能,如参与形态建成等采用的手段包括经典的减法杂交,差示筛选,cDNA代表差异分析以及mRNA差异显示等,但这些技术不能对基因进行全面系统的分析。新的技术应运而生,包括基因表达的系统分析,cDNA微阵列,DNA芯片等。鉴定基因功能最有效的方法是观察基因表达被阻断或增加后在细胞和整体水平所产生的表型变异,因此需要建立模式生物体。比较基因组学(Comparative Genomics)是基于基因组图谱和测序基础上,对已知的基因和基因组结构进行比较,来了解基因的功能、表达机理和物种进化的学科。利用模式生物基因组与人类基因组之间编码顺序上和结构上的同源性,克隆人类疾病基因,揭示基因功能和疾病分子机制,阐明物种进化关系,及基因组的内在结构。目前从模式生物基因组研究中得出一些规律:模式生物基因组一般比较小,但编码基因的比例较高,重复顺序和非编码顺序较少;其G+C%比较高;内含子和外显子的结构组织比较保守,剪切位点在多种生物中一致;DNA 冗余,即重复;绝大多数的核心生物功能由相当数量的orthologous蛋白承担;Synteny连锁的同源基因在不同的基因组中有相同的连锁关系等。模式生物基因组研究揭示了人类疾病基因的功能,利用基因顺序上的同源性克隆人类疾病基因,利用模式生物实验系统上的优越性,在人类基因组研究中的应用比较作图分析复杂性状,加深对基因组结构的认识。 此外,可利用诱变技术测定未知基因,基因组多样性以及生物信息学(Bioinformatics)的应用。4蛋白质组学研究基因是遗传信息的携带者,而全部生物功能的执行者却是蛋白质,它有自身的活动规律,因而仅仅从基因的角度来研究是远远不够的,必须研究由基因转录和翻译出蛋白质的过程,才能真正揭示生命的活动规律,由此产生了研究细胞内蛋白质组成及其活动规律的新兴学科——蛋白质组学(proteomics)。蛋白质组(proteome)是由澳大利亚Macquarie大学的Wilkins和Williams于1994首先提出,并见于1995年7月的“Electrophonesis”上,指全部基因表达的全部蛋白质及其存在方式,是一个基因、一个细胞或组织所表达的全部蛋白质成分,蛋白质组学是对不同时间和空间发挥功能的特定蛋白质群体的研究。它从蛋白质水平上探索蛋白质作用模式、功能机理、调节控制以及蛋白质群体内相互作用,为临床诊断、病理研究、药物筛选、药物开发、新陈代谢途径等提供理论依据和基础。 蛋白质组学旨在阐明生物体全部蛋白质的表达模式及功能模式,内容包括鉴定蛋白质表达、存在方式(修饰形式)、结构、功能和相互作用方式等。它不同于传统的蛋白质学科,是在生物体或其细胞的整体蛋白质水平上进行的,从一个机体或一个细胞的蛋白质整体活动来揭示生命规律。但由于蛋白质具有多样性和可变性,复杂性,低表达蛋白质难以检测等,应该明确其研究的艰难性。总体上研究可以分为两个方面:对蛋白质表达模式(或蛋白质组成)研究,对蛋白质功能模式(目前集中在蛋白质相互作用网络关系)研究。对蛋白质组研究可以提供如下信息:从基因序列预测的基因产物是否以及何时被翻译;基因产物的相对浓度;翻译后被修饰的程度等。由于蛋白质数目小于基因组中开放阅读框(ORF, open reading frame)数目,因此提出功能蛋白质组学(functional proteomics),功能蛋白质指在特定时间、特定环境和试验条件下基因组活跃表达的蛋白质,只是总蛋白质组的一部分。功能蛋白质组学研究是位于对个别蛋白质的传统蛋白质研究和以全部蛋白质为研究对象的蛋白质研究之间的层次,是细胞内与某个功能有关或某种条件下的一群蛋白质。对蛋白质组成分析鉴定,要求对蛋白质进行表征化,即分离、鉴定图谱化,包括两个步骤:蛋白质分离和鉴定。双向凝胶电泳(2-DGE)和质谱(MS)是主要的技术。近年来,有关技术和生物信息学在不断并迅速开发和发展中。蛋白质组研究技术体系包括:样品制备;双向聚丙烯酰胺凝胶电泳(two-dimensional polyacrylamide gel electrophoresis,2-D PAGE);蛋白质的染色;凝胶图像分析;蛋白质分析;蛋白质组数据库。其中三大关键是:双向凝胶电泳技术、质谱鉴定、计算机图像数据处理与蛋白质数据库。5与基因组学相关学科诞生随着基因组学研究的不断深入,人类有望揭示生命物质世界的各种前所未知的规律,完全揭开生命之谜,进而驾驶生命,使之为人类的社会经济服务。基因组研究和其它学科研究交叉,促进一些学科诞生,如营养基因组学(nutritional genomics),环境基因组学(environmental genomics),药物基因组学(phamarcogenomics),病理基因组学(pathogenomics),生殖基因组学(reproductive genomics),群体基因组学(population genomics)等。其中,生物信息学正成为备受关注的新型产业的支撑点。生物信息学是以生物大分子为研究,以计算机为工具,运用数学和信息科学的观点、理论和方法去研究生命现象、组织和分析呈指数级增长的生物信息数据的一门科学。研究重点体现在基因组学和蛋白质两个方面。首先是研究遗传物质的载体DNA及其编码的大分子量物质,以计算机为工具,研究各种学科交叉的生物信息学的方法,找出其规律性,进而发展出适合它的各种软件,对逐步增长的DNA 和蛋白质的序列和结构进行收集、整理、发布、提取、加工、分析和发现。由数据库、计算机网络和应用软件三大部分组成。其关注的研究热点包括:序列对比,基因识别和DNA序列分析,蛋白质结构预测,分子进化,数据库中知识发现(Knowledge Discovery in Database, KDD)。这一领域的重大科学问题有:继续进行数据库的建立和优化;研究数据库的新理论、新技术、新软件;进行若干重要算法的比较分析;进行人类基因组的信息结构分析;从生物信息数据出发开展遗传密码起源和生物进化研究;培养生物信息专业人员,建立国家生物医学数据库和服务系统[5]。20世纪末生物学数据的大量积累将导致新的理论发现或重大科学发现。生物信息学是基于数据库与知识发现的研究,对生命科学带来革命性的变化,对医药、卫生、食品、农业等产业产生巨大的影响。邹承鲁教授在谈论21世纪的生命科学时讲到,生物学在20世纪已取得巨大的发展,数理科学广泛而又深刻地深入生物学的结果在新的高度上揭示了生命的奥妙,全面改变了生物学的面貌。生物学不仅是当前自然科学发展的热点,进入21世纪后将仍然如此。科学家称21世纪是信息时代。生物科学和信息科学结合,无疑是多个学科发展的必然结果。

86 评论

迪拉索高品

历时22年,研究人员终于从头到尾破译了完整的人类基因组序列。

钛媒体App4月1日消息,据科技日报,全球顶级期刊《Science》(科学)杂志今天凌晨连发6篇论文报告,公布了人类基因组测序的最新进展:国家人类基因组研究中心(NHGRI)组成的端粒到端粒 (T2T) 联盟科学团队,通过新的技术研究出全球第一个完整的、无间隙的人类基因组序列,首次揭示了高度相同的节段重复基因组区域及其在人类基因组中的变异。

这是对标准人类参考基因组,即2013年发布的参考基因组序列(GRCh38)的“重大升级”,增加了之前整条染色体上隐藏的DNA片段,破译了缺失的大约2亿个DNA碱基对以及2000多个新基因——占人类基因组的8%。

这篇研究成果意义重大。科研人员揭示的完整人类基因组序列,是世界上最复杂的谜题之一,这一研究使得人类第一次看到最完整的、无间隙的DNA碱基基因序列,对于人类了解基因组变异的全谱,以及某些疾病的遗传贡献至关重要,将会推动与癌症、出生缺陷和衰老相关的研究与科学发展。

同时,这也是《Science》创刊141年来,首次在同一期杂志中连发6篇论文揭示人类基因组研究。

本论文作者,圣路易斯华盛顿大学医学院遗传学家Ting Wang(音译:王庭)表示,此次拥有完整的基因组,一定会改善生物医学研究。“毫无疑问,这是一项重要的成就。”

据中国科学报,人类基因组计划参与者、中国科学院北京基因组研究所研究员于军表示,假如把人类基因组序列比作一辆非常复杂的汽车,那么与20年前完成的人类基因组草图相比,完整的新序列非常于增添了更多零件。

“我们看到了以前从未阅读过的章节,”本论文通讯作者,华盛顿大学霍华德-休斯医学研究所(HHMI)研究员Evan Eichler(艾希勒)表示,这是全行业的一件大事。

Science封面图研究人员到底破译了什么?人类基因组由超过60亿个独立的DNA碱基、大约2-3万个蛋白质编码基因(整个基因仍未有统一答案)组成,与黑猩猩等其他灵长类动物的数量差不多,分布在23对染色体上。为了读取数以万计的基因组,科学家们首先将所有的DNA链切成几百到几千个单位长度的DNA片段。然后用测序机器读取每个片段中的各个碱基,科学家们试图按照正确的顺序组装这些片段,就像拼凑一个复杂的拼图。

2001年2月12日,由6国科学家共同参与的国际人类基因组计划首次公布人类基因组图谱及初步分析结果;2003年4月15日,公布了人类基因组序列草图。

然而,由于技术限制,当初的人类基因组计划留下了大约8%的“空白”间隙。这部分很难被测序,由高度重复、复杂的DNA块组成,其中包含功能基因以及位于染色体中间和末端的着丝粒和端粒。

实际上,核心的挑战在于,基因组的某些区域反复重复相同的碱基。重复的区域包括着丝粒和核糖体DNA等,过去无法按照正确的顺序组装一些被切碎的片段。这就像拥有相同的拼图碎片一样,科学家们不知道哪块碎片在哪里,因此基因组图中留下了很大的空白。

而且大多数细胞包含两个基因组--一个来自父亲,一个来自母亲。当研究人员试图组装所有的片段时,来自父母双方的序列可能混合在一起,掩盖了个体基因组内的实际变异。

如今,研究人员通过新的纳米机器设备与核心技术,实现了新的无间隙版本T2T-CHM13,由30.55亿个碱基对和19969个蛋白质编码基因组成。增加了近2亿个碱基对的新DNA序列,包括99个可能编码蛋白质的基因和其中近2000个需要进一步研究的候选基因。

这些候选基因大多数是失活的,但其中115个仍然可能表达。团队还在人类基因组中发现了大约200万个额外的变异,其中622个出现在与医学相关的基因中。此外,新序列还纠正了GRCh38中的数千个结构错误。

近端着丝粒染色体的显示图样(来源:论文)

具体而言,新序列填补的空白包括人类5条染色体的整个短臂,并覆盖了基因组中一些最复杂的区域。其中包括在重要的染色体结构中及其周围发现的高度重复的DNA序列,如染色体末端的端粒和在细胞分裂过程中协调复制染色体分离的着丝粒。

此外,新序列还揭示了以前未被发现的节段重复,即在基因组中复制的长DNA片段,并揭示了关于着丝粒周围区域的前所未见的细节。这一区域内的变异性可能为人类祖先如何进化提供新证据。

值得一提的是,本研究成果的关键进展,其实是利用了新的技术设备——英国牛津纳米孔技术公司和太平洋生物科学公司制造的快速迭代的基因测序机器。

早在2017年,国家人类基因组研究中心(NHGRI)负责人Adam Phillippy(亚当-菲利皮),以及加州大学圣克鲁兹分校(UCSC)的凯伦-米加意识到,新的纳米孔机器实现了一次准确读取100万个DNA碱基的能力,可以为最终解决基因组难点打开了大门。

大约在同一时间,华盛顿大学霍华德-休斯医学研究所(HHMI)Evan Eichler(艾希勒)领导的科研团队已经证明,使用太平洋生物科学公司的设备技术,可以解决更复杂形式的遗传变异技术。

因此,三人一起创办了端粒到端粒(T2T)联盟,利用全球约100名科学家团队资源,使其加快了研究佳偶。

随后,该团队连续六个月不间断地利用快速迭代的纳米孔基因测序机器,并请来几十位科学家来组装这些基因片段并分析结果。最终利用设备、技术等,实现了长读数测序读数,并将长读测序与牛津纳米孔的数据相结合,准确率超过了99%,填补了全球基因学研究的空白。

一直到2020年夏天,该团队已经拼上了两条染色体。在新冠疫情爆发的期间,团队通过Slack等通讯工具进行远程工作,获得了另外21条染色体,将每个染色体从一端或端粒排序到另一端。而且,科研人员人员还试图组装基因组中最难的区域,即着丝粒中高度重复的DNA序列。

最终,通过长时间的研究与团队合作,该团队成功实现了对每个染色体进行了测序,包含了编码用于制造核糖体的RNA的基因的多个拷贝,总共400个。

2021年6月,这份研究成果首次发表在预印版平台bioRxiv上。经过同行评议等,如今一系列论文登上了《Science》(科学)杂志。

研究人员在会后采访中表示,下一阶段的研究将对不同人的基因组进行测序,以充分掌握人类基因的多样性、作用以及人类与近亲、其它灵长类动物的关系。

年增速超20%,中国百亿基因市场前景广阔

随着生物学技术的不断发展,新的行业层出不穷,本次研究成果所属的中国基因测序行业是一个百亿级市场,拥有广阔的发展前景。

根据千际投行的研究统计数据显示,早在2019年,基因测序所在的全球生物制品行业市场规模就达到了3172亿元,未来五年有望达到万亿级别。其中,2019年中国基因测序行业市场规模约为149亿元,年增速超20%。

近年来,基因测序行业得到迅速发展,吸引了大量资本和企业的进入。从产业上下游来看,基因测序产业链主要包括了上游仪器、中游服务提供商以及下游终端应用三个环节。涉及到的公司包括华大基因、达安基因、药明康德,以及互联网巨头苹果公司、亚马逊、谷歌、微软等。

整个产业看似简单,但上游的基因测序仪及配套试剂是整个产业链壁垒最高的部分,下游终端应用还涉及领域覆盖面非常广,既包括医疗领域的人体基因组、人体微生物基因组以及基础研究领域,还包括非医疗领域的环境治理、石油存储探测、农牧软文种等。

实际上,早在几十年前,医学界就对此有过尝试,将狒狒的心脏移植给了一个罹患先天性心脏病的孩子。如今,通过嵌合的方式,通过基因编辑的方式,甚至是通过合成生物学的方式,实现了猪心脏在人类身上的移植。

华大集团CEO尹烨曾表示,其实,今天人类进入了生命时代,我们关心的则是自身的基因和健康,以此就将去整合物理世界、信息世界和生命世界。

在应用场景不断拓宽,测序能力进一步加强的共同促进作用下,全球基因测序行业市场规模将不断增长,中国基因行业市场规模虽然与全球头部企业差距较大,但是在国内市场中仍然占据较大的优势,未来要想提高国际市场份额,还需进一步加强技术研发,未来发展具有巨大的想象空间。

今天,新的基因组序列研究成果,是科研人员必不可少的第一步,也是实现商业化的重要一步。

Evan Eichler(艾希勒)表示,“现在我们有了一块罗塞塔石碑(注:一块制作于公元前196年的花岗闪长岩石碑,解读出已经失传千余年的埃及象形文之意义与结构),可以在未来研究数十万个其他基因组的完整编译。”

350 评论

美人儿不哭

人类基因组计划明确的内容

264 评论

相关问答

  • 人类基因组计划的研究论文

    人类基因组计划明确的内容

    小不娃娃 3人参与回答 2023-12-09
  • 研究论文基因名斜体

    需要。第一个字母大写斜体,第二、三个字母小写斜体,第四个字母正体,后接正体的字母就可以了。如果直接写中文不需要斜体。基因名字、细菌种名等需要斜体。比如test,

    Lolita1015 4人参与回答 2023-12-12
  • 有关于基因工程最新研究的论文

    基因支持着生命的基本构造和性能。下面是我为大家精心推荐的关于基因的生物科技论文 范文 ,希望能够对您有所帮助。 基因研究 引起人们大惊小怪的,就是让父母能够

    我想说真话 2人参与回答 2023-12-05
  • 转基因研究论文

    问题一:转基因食品安全研究论文3000字 可以去知网 或者 谷歌学术 搜索 问题二:转基因食品的利与弊 面对越来越多的转基因食品,人们的认识并非一

    艳的笑窝 3人参与回答 2023-12-07
  • 基因工程制药研究论文

    人类基因组计划明确的内容

    曼特宁先森 3人参与回答 2023-12-11