1基因组学-1汇总.ppt
Xiaofang Xie College of Life Sciences Fujian Agriculture and Forestry University E-mail,基因组学 Genomics,COLLEGE OF LIFE SCIENCE,课程名称基因组学 20112012学年第1学期 授课时间每周三,第6-7-8节创新楼309; 1-11周 听课人数 35 人 开课院系 生命科学学院 授课形式多媒体教学计算机上机,教学安排 1教学参考书 基因组学 杨金水 编著, 高等教育出版社 2007年7月,COLLEGE OF LIFE SCIENCE,2 其它参考书 基因组 布朗 著, 袁建刚等译 科学出版社 2002年9月,COLLEGE OF LIFE SCIENCE,2 其它参考书 基因组 布朗 著, 袁建刚等译 科学出版社 2006年6月,COLLEGE OF LIFE SCIENCE,2 其它参考书表观基因组学(电子书,COLLEGE OF LIFE SCIENCE,2 其它参考书,COLLEGE OF LIFE SCIENCE,2 其它参考书,生物信息学手册(第2版) 郝柏林,张淑誉,上海科技出版社,2002 基因组数据分析手册 胡松年,薛庆中,浙江大学出版社,2003 植物基因组 赵微平著, 首都示范大学出版社, 1996 分子遗传学 张玉静主编, 科学出版社 2000 基因及其表达 童克中,科学出版社, 2001. 比较基因组学基础马希特贾恩,科学出版社, 2007. 生物信息学与功能基因组学乔纳森. 佩夫斯纳, 化学工业出版社,2006 表观基因组学Anne Ferguson-Smith, et al. Publisher Springer 2009,COLLEGE OF LIFE SCIENCE,2 授课计划 a 第一部分 基因组的研究方法 i. 什么是基因组 ii. 通过遗传学方法和物理方法进行基因组作图 iii. 基因组测序与序列组装 .解读基因组序列 b第二部分 基因组功能 i. 基因组的结构(Genome structure)贯穿至第一部分讲授 ii. 基因的转录调控选讲 .基因组的表达调控 选讲 .蛋白质组 选讲 c第三篇 基因组的复制和进化 i.基因组的复制(Genome replication) ii.基因组进化的分子基础 iii.基因组的进化模式 .基因组与生物进化,COLLEGE OF LIFE SCIENCE,2 授课计划 d 在基因组学关系密切或在其基础上发展而来的学科 i. 功能基因组学 ii. 比较基因组学 iii. 分子系统发生,COLLEGE OF LIFE SCIENCE,本课程的学习方法和要求 本课程学习方法 研讨型教师引导型讲解课堂讨论课外自学 课内课外11n,COLLEGE OF LIFE SCIENCE,为学习好基因组学课程所必需的基础知识 生物化学、分子生物学、遗传学 如果要在基因组学中有所发展必须关注的学科 生物化学、分子生物学、遗传学 信息科学(计算机编程(PERL、数据库,COLLEGE OF LIFE SCIENCE,本课程的考核方法 i. 平时成绩40 出勤率 平时作业实验报告 .期末考试60 时间第周 形式闭卷,COLLEGE OF LIFE SCIENCES,基因组学的定义,基因组学 研究基因组的一门学问。“基因组学”这个词最早于1986年由美国科学家Tho-mas Roderick提出,是一门关于基因组图、测序和基因组分析的科学。这门科学还在迅速发展之中,但侧重点已经从当初的作图与测序,到基因组功能的研究。为了反映这个转变,基因组分析可以分成“结构基因组学”与“功能基因组学”两个大部分,COLLEGE OF LIFE SCIENCE,结构基因组学和功能基因组学,结构基因组学研究基因组的结构,是基因组研究初始阶段的主要工作。最终目的是构建某一个物种高分辨率的“遗传图”、“物理图”、以及“转录本图谱”。某个物种最终的物理图谱,是它的完整的DNA序列,COLLEGE OF LIFE SCIENCE,结构基因组学和功能基因组学,功能基因组学应用“结构基因组学“的研究成果,在整个基因组的规模或范围内,分析与研究基因的功能。特点是“高通量”、“大规模”,计算机辅助分析,COLLEGE OF LIFE SCIENCE,COLLEGE OF LIFE SCIENCE,基因组学的创新性,1对生命进行系统和科学的解码,通过单个物种的全部染色体DNA序列测定、序列分析、对序列中的编码区ORF以及功能片断进行注释和功能预测。 2在生命遗传信息的整体水平上分析和研究基因组的结构;基因的结构与功能,基因之间的相互关系等。 3基因组学通过对多个物种的基因组比较研究,探索基因的分子进化、物种进化、生命起源,COLLEGE OF LIFE SCIENCE,基因组研究的特点,基因组学是高效的遗传学。与传统的遗传学比较,基因组学具有全局性、高效性、综合性和先进性的特点。 1、全局性(Overall, genome-wide)以整个基因组 为研究对象,而非具体到单个特定的基因。 2、高效性(High-throughput)研究方法是平行的、高通量的,一次试验可产生大量的数据。 3、综合性需要多学科的合作,包括生物学、化学、统计学、机械技术、电子技术、信息技术等。 4、先进性将现有各种最先进的技术应用到极至,同时也推动了各种技术的高速发展,COLLEGE OF LIFE SCIENCE,人类基因组计划(Human Genome Project,诺贝尔奖获得者Dulbecco“人类DNA序列是人类的真谛,这个世界发生的一切,均与DNA序列息息相关”(1986) 90年启动的国际性研究计划 利用大规模测序技术,完成全部人类数万个基因,30亿对碱基的序列分析,COLLEGE OF LIFE SCIENCE,由于政府和企业共同努力,人类基因组计划的序列测定提前完成,在2000年6月完成工作框架图。2001年完成基因全图,COLLEGE OF LIFE SCIENCE,我国94年启动“中华民族基因组若干位点基因研究”“重大疾病相关基因研究”课题,99年承担了人类基因组1序列的测序任务,负责第3号染色体3千万核苷酸的序列测定工作,COLLEGE OF LIFE SCIENCE,History of the Human Genome Project,1953,Watson, Crick DNA structure,1972,Berg, 1st recombinant DNA,1977,Maxam, Gilbert, Sanger sequence DNA,1980,Botstein, Davis, Skolnick White propose to map human genome with RFLPs,1982,Wada proposes to build automated sequencing robots,1984,MRC publishes first large genome Epstein-Barr virus 170 kb,1985,Sinsheimer hosts meeting to discuss HGP at UCSanta Cruz; Kary Mullis develops PCR,1986,DOE begins genome studies with 5.3 million,1987,Gilbert announces plans to start company to sequence and copyright DNA; Burke, Olson, Carle develop YACs; Donis-Keller publish first map 403 markers,History of the Human Genome Project continued,1987 cont,Hood produces first automated sequencer; Dupont devolops fluorescent dideoxy- nucleotides,1988,NIH supports the HGP; Watson heads the project and allocates part of the budget to study social and ethical issues,1989,Hood, Olson, Botstein Cantor propose using STSs to map the human genome,1990,Proposal to sequence 20 Mb in model organism by 2005; Lipman, Myers publish the BLAST algorithm,1991,Venter announces strategy to sequence ESTs. He plans to patent partial cDNAs; Uberbacher develops GRAIL, a gene finding program,1992,Simon develops BACs; US and French teams publish first physical maps of chromosomes; first genetic maps of mouse and human genome published,1993,Collins is named director of NCHGR; revise plan to complete seq of human genome by 2005,1995,Venter publishes first sequence of free-living organism H. influenzae 1.8 Mb; Brown publishes on DNA arrays,1996,Yeast genome is sequenced S. cerevisiae,History of the Human Genome Project continued,1997,Blattner, Plunket complete E. coli sequence; a capillary sequencing machine is introduced,1998,SNP project is initiated; rice genome project is started; Venter creates new company called Celera and proposes to sequence HG within 3 years; C. elegans genome completed,1999,NIH proposes to sequence mouse genome in 3 years; first sequence of chromosome 22 is announced,2000,Celera and others publish Drosphila sequence 180 Mb; human chromosome 21 is completely sequenced; proposal to sequence puffer fish; Arabadopsis sequence is completed,2001,Celera publishes human sequence in Science; the HGP consortium publishes the human sequence in Nature,2000,2000,2001,人类基因组核型模式图,COLLEGE OF LIFE SCIENCE,人类基因组的物理结构 1.核基因组(nuclear genome)由大约30亿个碱基对bp组成,分为24个线性DNA分子,其中22条为常染色体,两条性染色体X和Y。 2.线粒体基因组mitochondrion genome是一个长为16569bp的环状DNA分子,有许多拷贝,位于线粒体中,COLLEGE OF LIFE SCIENCE,人类基因组组成,目前虽完成了基因的序列分析,但30以上的人类基因尚不了解功能。 最重要问题是如何将人类基因序列资料转变为有用的知识,如何对这些基因加以利用,使之能够造福于人类的健康,COLLEGE OF LIFE SCIENCE,后基因组时代(Post-genome Project Era,功能基因组学研究 对基因及其编码蛋白的功能进行研究,COLLEGE OF LIFE SCIENCE,人类功能基因组,计算机科学家,生物化学家,细胞生物学家,结构生物学家,生理学家,遗传学家,临床和病理学家,COLLEGE OF LIFE SCIENCE,人类功能基因研究策略,传统生物学途径 发现生物活性鉴定蛋白质克隆基因细胞分析动物模型人体内功能及与疾病关联。 反向生物学的途径 1 数据库DNA 序列蛋白质表达细胞筛选动物模型人类体内功能及疾病关联性; 2 疾病标本DNA 标本致病基因或易感基因分析蛋白质分析突变型基因的对细胞表型影响动物模型人类体内功能和疾病分子机理,COLLEGE OF LIFE SCIENCE,基因组学研究内容 疾病基因组学研究 发现疾病相关基因和致病基因, 从疾病诊断到疾病易感性研究。 药物基因组学Pharmacogenomics 研究不同个体对药物敏感性的基因基础,特别是SNPs。 环境基因组学( Enviromental Genomics) 鉴定机体暴露在特定环境下的那些显示易感性或抵抗性基因的DNA多态性。如DNA修复基因、细胞周期相关基因、激素代谢基因、受体基因、参与免疫和感染反应的基因和信号转导基因等,COLLEGE OF LIFE SCIENCE,蛋白质组学(Proteomics) 利用双相电泳、蛋白芯片等技术研究细胞或组织的基因组表达的全部蛋白质 模式生物和病原生物基因组学 对其它生物进行全基因组序列分析 基因开发研究 基因组药物、基因芯片、基因诊断、基因治疗等,COLLEGE OF LIFE SCIENCE,An International Crop Livestock Genomics Campaign For The Future,Thank you Questions,Xiaofang Xie College of Life Science Fujian Agriculture and Forestry University E-mail,第一章 基因组 Genome,什么是基因组,基因组是一种生物所拥有的整套遗传物质,它包含该生物的全部遗传信息。 绝大多数生物都以脱氧核糖核酸(DNA)为遗传物质,仅一些病毒以核糖核酸(RNA)为遗传物质。 朊病毒是一种蛋白质(Prion蛋白),但它是否称得上是一种生物,尚无定论。(疯牛病,不能产生抗体,COLLEGE OF LIFE SCIENCE,内容提要 1.1 遗传的分子基础 1.2 基因组序列复杂性 1.3 基因与基因家族 1.4 染色体 1.5 基因组,COLLEGE OF LIFE SCIENCE,1.1 遗传的分子基础(基本概念,基因(Gene)生物体的遗传单位,由脱氧核糖核酸(DNA)组成。DNA由4种核苷酸(A、T、C、G)组成,COLLEGE OF LIFE SCIENCE,DNA和RNA的一级结构,DNA和RNA是由核苷酸亚基连接成的不分支长链大分子。 核苷酸亚基由一个核糖、一个磷酸基团和一个碱基(嘌啉、嘧啶)组成。 核苷酸通过 3 与 5 位的磷酸二酯键连接成高聚物多聚核苷酸,COLLEGE OF LIFE SCIENCE,DNA和RNA的核苷酸,DNA的核苷酸含2脱氧核糖及腺嘌啉(A)、胞嘧啶(C)、鸟嘌啉(G)、胸腺嘧啶(T) 4种碱基。 RNA的核苷酸含核糖及与DNA相似的4种碱基,但其中胸腺嘧啶(T) 被换成脲嘧啶(U,COLLEGE OF LIFE SCIENCE,DNA的二级结构,DNA在活细胞中为双链结构,两个DNA单链通过碱基配对(遵循AT、GC的原则),靠氢键结合在一起,相互缠绕,形成反向平行的双螺旋结构,COLLEGE OF LIFE SCIENCE,DNA双螺旋,核糖和磷酸构成双螺旋骨架 ,具亲水性,处于外侧;碱基具疏水性,处于内侧。 螺旋直径20。 螺距34,含 10 个核苷酸对。 大沟宽而深,扇形 180;小沟窄而浅,扇形 180,COLLEGE OF LIFE SCIENCE,生物中心法则DNA RNA 蛋白质,COLLEGE OF LIFE SCIENCE,Genomic DNA 基因组DNA,即染色体DNA,为完整的基因全序列, 包括内含子,外显子及调控序列等,COLLEGE OF LIFE SCIENCE,蛋白质的结构与生物学,COLLEGE OF LIFE SCIENCE,一级结构蛋白质分子中多肽链的氨基酸排列顺序称为蛋白质的一级结构,它决定着蛋白质分子的二级、三级等高级结构。 二级结构是指多肽链骨架盘绕折叠所形成的有规律性的结构,如-螺旋结构和-折叠结构。 三级结构是整个多肽链的三维构象,它是在二级结构的基础上,多肽链进一步折叠卷曲形成复杂的球状分子结构,COLLEGE OF LIFE SCIENCE,结构域是介于二级结构和三级结构之间的一种结构层次,是指蛋白质亚基结构中明显分开的紧密球状结构区域。 四级结构指数条具有独立的三级结构的多肽链通过非共价键相互连接而成的聚合体结构。在具有四级结构的蛋白质中,每一条具有三级结构的肽链称为亚基或亚单位,缺少一个亚基或亚基单独存在都不具有活性。维持蛋白质空间结构的作用力主要是氢键、离子键、疏水作用力和范德华力等非共价键,又称次级键,多肽链的结构,COLLEGE OF LIFE SCIENCE,右手螺旋,COLLEGE OF LIFE SCIENCE,COLLEGE OF LIFE SCIENCE,COLLEGE OF LIFE SCIENCE,COLLEGE OF LIFE SCIENCE,COLLEGE OF LIFE SCIENCE,COLLEGE OF LIFE SCIENCE,COLLEGE OF LIFE SCIENCE,COLLEGE OF LIFE SCIENCE,COLLEGE OF LIFE SCIENCE,COLLEGE OF LIFE SCIENCE,蛋白质结构预测问题 序列结构功能,Gly-Ala-Glu-Phe,FUNCTION,COLLEGE OF LIFE SCIENCE,1.2 基因组序列复杂性 真核生物与原核生物基因组的区别,COLLEGE OF LIFE SCIENCE,基因组的大小,基因组的大小指的是物种单倍体基因组的大小,可以通过C值来表示,C值的大小通过DNA双链解开与复合的速率来测算,COLLEGE OF LIFE SCIENCE,基因组的大小 C Value,基因组越大,DNA重复序列越多,DNA双链退火重合所需时间越长,C值越高,COLLEGE OF LIFE SCIENCE,基因组大小(C值)与遗传信息量,生物进化从低等到高等,从简单到复杂,遗传信息量不断增加,因而基因组(C 值)也应该相应不断增大。 推论C 值与遗传信息量应该是平行的,二者是成正比的。 从大的进化尺度看,这个规律是成立的;从小的进化尺度看,在进化早期(低等生物进化阶段)也是成立的,但在高等生物进化阶段显然不成立,COLLEGE OF LIFE SCIENCE,进化程度低的生物 C 值反而更高。 亲缘关系相近的物种间 C 值差异很大。 C 值远远超过了遗传信息量的需要。 结论C 值并不反映遗传复杂性的高低,C值悖理(C value paradox,COLLEGE OF LIFE SCIENCE,C值悖理暗示基因组中存在大量的无用序列,COLLEGE OF LIFE SCIENCE,物种之间基因组大小的差别,物种间基因组的大小差别巨大,在哺乳动物之中,最大的基因组只是最小的基因组的两倍;而在植物界,物种之间基因组的大小差异达100倍之多,COLLEGE OF LIFE SCIENCE,部分植物基因组大小之比较,COLLEGE OF LIFE SCIENCE,基因组序列的重复性,在一种生物类别中,基因的数目其实并不相差太大,而基因组的大小的差别却有100倍之多。例如,在开花的植物之中,基因数目在3-5万个之间,而基因组的大小却相差巨大,拟南芥的基因组是小麦的百分之一。因为在大型的基因组中存在着大量的重复区域,COLLEGE OF LIFE SCIENCE,基因组的组成,基因组,单拷贝序列 中等重复序列 高度重复序列,COLLEGE OF LIFE SCIENCE,重复序列的组成与分类 1按重复序列在基因组中的分布 a 串联重复序列 b 散布重复序列 2按重复序列的长度 a 卫星DNA b 小卫星DNA c 微卫星DNA 通常由简单重复序列Simple sequence repeat,SSR构成,在真核生物的基因组中广泛存在,目前多称为简单重复序列SSR,COLLEGE OF LIFE SCIENCE,1.3 基因与基因家族,基因的概念 编码RNA基因 rRNA基因、tRNA基因、 scRNA基因、snRNA基因、 snoRNA基因、 miRNA基因。 编码蛋白质基因 基因家族超基因家族supergene family 异常结构基因 重叠基因overlapping gene、基因内基因genes-within-genes、反义基因antisence gene 假基因pseudogene,COLLEGE OF LIFE SCIENCE,思考题 1.基因组学的定义,研究内容,及基 因组研究特点 2.基因组计划的意义 3. 请根据微卫星DNA的特点,分析其在 基础理论研究和应用研究中的用途 4. 基因组的大小与生命的复杂程度呈显 一定的正相关,那么,能否得出结 论,基因组越小,物种越原始,COLLEGE OF LIFE SCIENCE,Thank you Questions