基因组学与医学 Genomics and Medicine 吴坤陆 wukunlu@163.com 分子生物学研究中心 http://www.xysm.net/mbrc/
第 一 节 基因组学(Genomics) 一、基因组学概念及范畴 二、结构基因组学 三、功能基因组学 四、比较基因组学
一、基因组学概念及范畴 (一)基因组学的提出 基因组(genome) 泛指一个有生命体、病毒或细胞器的全部遗传物质;在真核生物,基因组是指一套染色体(单倍体)DNA。
1. 病毒基因组 DNA病毒 RNA病毒 多数为双链(ds)、环状或线性 多数为单链(ss)、线性
单链环状DNA病毒 5386nt 5386nt 2500氨基酸 噬菌体phiX174 1977,Sanger
开环部分双链DNA病毒 HBsAg HBcAg 聚合酶 乙型肝炎病毒(HBV)
乙型肝炎病毒基因组 --开环部分双链DNA HBsAg 聚合酶 HBcAg
单链RNA病毒 血凝素(HA) 8节段-ssRNA 神经氨酸酶(N) 禽流感病毒(H5N1) avian influenza A virus . 禽流感病毒(H5N1) avian influenza A virus
逆转录病毒(单链RNA病毒) RNA 人类免疫缺陷病毒(HIV) (human Immunodeficiency virus )
2. 原核生物基因组 以大肠杆菌(Escherichia coli)为例 细菌染色体DNA 质粒DNA
类核(nucleoid):细菌染色体在 细胞内形成的一个致密区域 质粒plasmid 大肠杆菌细胞结构
大肠杆菌染色体DNA 由一条环状双链DNA分子组成, 通常只有一个DNA复制起点。 OriC 4639221bp TerC 4000K OriC 4639221bp TerC 由一条环状双链DNA分子组成, 通常只有一个DNA复制起点。
质粒DNA 质粒是存在于细菌染色体外的,具有自主复制能力的环状双链DNA分子;大小为几kb。
3. 真核生物基因组 染色体DNA线粒体DNA
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 X Y 人类染色体基因组
人类线粒体基因组 2个rRNA基因和22个tRNA基因,13个编码蛋白质基因,编码序列占93%。
(二)基因组学的概念 基因组学(genomics) 就是发展和应用DNA制图、测序新技术以及计算机程序,分析生命体(包括人类)全部基因组结构及功能。
基因组学包括3个不同的亚领域 亚领域 内容 结构基因组学 整个基因组的 遗传制图、物理制图、DNA测序 亚领域 内容 结构基因组学 整个基因组的 遗传制图、物理制图、DNA测序 功能基因组学 认识、分析整个基因组所包含的 基因、非基因序列及其功能 比较基因组学 比较不同物种的整个基因组,增 强对各个基因组功能及发育相 关性的认识
二、结构基因组学 人类基因 组计划 结构基因组学(structural genomics) 是通过HGP的实施来完成的。
人类基因组计划: (Human genome project,HGP) HGP的内容就是制作高分辨率的人类遗传图和物理图,最终完成人类和其它重要模式生物全部基因组DNA序列测定,因此HGP属于结构基因组学范畴。
Initial sequencing and analysis of the human genome International Human Genome Sequencing Consortium NATURE VOL 409 15 FEBRUARY 2001 860-921
The Sequence of the Human Genome Celera Genomics 16 FEBRUARY 2001 SCIENCE VOL 291 1304-1351
Chr. Mb 人类染色体DNA大小
HGP包括以下研究内容 (一)物理制图 (二)遗传制图 (三)基因组DNA序列测定 (四)创建计算机分析管理系统
(一)物理制图(physical mapping) 绘制物理图谱(physical map): 利用已知序列的DNA片段为基因组分区,位点距离用bp表示。 作图标志称为序列标志位点 (sequence tagged sites,STSs)。
克隆载体: Cosmid(粘粒) YAC(酵母人工染色体) BAC(细菌人工染色体)
Y号
(二)遗传制图(genetic mapping) 利用人类基因组中自然存在的一些特殊位点作为遗传标志,确定标志位点在一条染色体DNA上的线性排列顺序,标志位点间的距离用cM表示 。
遗传标志: RFLP(限制性片段长度多态性) VNTR(可变数目串联重复序列) STR(短串联重复序列) SNP(单核苷酸多态性)
1.遗传图谱(genetic map) 两对等位基因之间重组互换的频率即遗传距离 A E D b A E d B A E d b D B 10% 两对等位基因之间重组互换的频率即遗传距离
物理图距离( Mb )与 遗传学距离 ( cM ) 的对应关系 cM / Mb Chromosome Male Female 1.12 1.76 0.78 1.40 0.86 1.30 0.67 1.40
(三)基因组DNA序列测定 人类基因组的全部核苷酸(3X109)排列顺序
DNA测序基本步骤 限制性内切酶将大片段DNA切成小的片段 小片段插入(连接)到测序载体中 用测序仪对小片段DNA测序 超级计算机分析测序结果,进行拼接得到 一致序列
DNA 切下的片段插入(连接)到载体中 大量的重叠片段 叠连群测序后得出一致序列 gtatgtacatttttaa tttaaaaggccagtta agttaaaatgg ttttaaaatctcattttaa gtatgtacatttttaaaatctcattttaaaaggccagttaaaatgg
模 式 生 物 大肠杆菌 (Escherichia coli) 酿酒酵母 (Saccharomyces cerevisiae) 拟南芥(Arabidopsis thaliana) 秀丽小杆线虫 (Caenorhabditis elegans) 果蝇 (Drosophila melanogaster) 小鼠 (Mus musculus)
(四)创建计算机分析管理系统 主要的人类基因组数据库 美国国家生物技术信息中心 NCBI: http://www.ncbi.nih.gov/ 日本国立遗传学研究所 DDBJ: http://www.ddbj.nig.ac.jp/ 欧洲生物信息学研究所 EMBL: http://www.embl.org/
HGP主要任务及内容 主要任务 内容 物理制图 确定染色体上诸如限制性内切 遗传制图 确定标志位点在一条染色体 主要任务 内容 物理制图 确定染色体上诸如限制性内切 (physical mapping) 核酸酶识别位点,或序列标志 位点(STSs)等的位置图。 遗传制图 确定标志位点在一条染色体 (physical mapping) 上的线性排列顺序。标志位点 间的图距以遗传学距离表示, 单位为分摩尔根(cM) 基因组DNA序列 测定人类24条染色体的、由 3X109个核苷酸组成的全部DNA 序列,绘制人类基因组图谱。
HGP的意义 通过HGP获得的广泛基因组信息组成了结构基因组学的基本内容,是开展功能基因组学的研究的基础; 同时为详尽研究每一个单基因遗传病提供“平台”,并将成为复杂的多基因遗传病研究的发端。
三、功能基因组学 (functional genomics) 完成一个生物体全部基因组测序后即进入后基因组测序阶段——详尽分析序列,描述基因组所有基因的功能,包括研究基因的表达及其调控模式,这就是功能基因组学。
主要具体内容包括以下方面 (一)鉴定DNA序列中的基因 (二)同源搜索设计基因功能 (三)实验性设计基因功能 (四)描述基因表达模式
(一)鉴定DNA序列中的基因 对基因组序列进行注释,包括鉴定和描述推测的基因、非基因序列及其功能。
(二)同源搜索设计基因功能 同源基因在进化中来自共同的祖先,通过核苷酸序列或氨基酸序列的同源性比较推测基因组内相似功能的基因。
(三)实验性设计基因功能 对基因进行缺失或剔除,观察表型 变化推测基因功能。
(四)描述基因表达模式 转录组(transcriptome): 一个细胞内的一套mRNA转录物,包含了某一环境条件、某一生命阶段、某一生理或病理(功能)状态下,生命体的细胞或组织所表达的基因种类和水平。 这一研究领域叫转录组学(transcriptomics)。
转录组学的研究方法-DNA芯片技术
蛋白质组(proteom): 一个细胞内的全套蛋白质,反映了特殊阶段、环境、状态下细胞或组织在翻译水平的蛋白质的表达谱。 这一研究领域叫蛋白质组学(proteomics)。
蛋白质组学的研究方法 双向电泳(two dimension electrophoresis,2-DE): 蛋白质具有等电点和分子量的特异性,将蛋白质混合物在电荷(等电聚焦,IEF)和分子量(变性聚丙烯酰胺凝胶电泳,SDS-PAGE)两个水平上进行分离。
生物质谱技术 Mass Spectrometry: 通过测定样品离子的质荷比(m/z)来进行成分和结构分析。 Moleculars Ions
功能基因组学研究策略及主要内容 鉴定(注释)基因: 通过“ORF搜索”,发现理论性蛋白 质编码序列 分析基因功能: 利用计算机进行同源搜索,根据已 知序列、进化相关性,发现重要的 蛋白质功能域。也可对DNA序列进 行突变或剔除后,结合功能、表型 变化的实验鉴定基因功能 描述基因表达模式: 采用DNA微点阵进行整体基因表达 谱--转录组分析;采用蛋白质或 多肽微点阵、改进的双向电泳结 合飞行质谱技术分析蛋白质表达 谱----蛋白质组分析。
四、比较基因组学 比较基因组学(comparative genomics)涉及比较不同物种的整个基因组,以便深入理解每个基因组的功能和进化关系。
进化树(系统发生树)
小鼠 (Mus musculus) “微型人” 生理系统与人非常相似 90%的基因与人类同源
基因共线性
The Relation between Genomics and Medicine 第 二 节 基因组学与医学关系 The Relation between Genomics and Medicine
基因组计划的应用 医学相关问题 结构基因组学 功能基因组学 蛋白质组学
疾病的分子机制:病原,病理和预后, 疾病的易感性, 遗传与环境的影响。
分子诊断:疾病的预测,药物耐受性, 疾病的分型。
分子治疗:药物靶, 基因治疗
一、基因病的概念 基因病:以基因组学为基础,从疾病 和健康的角度考虑,人类疾 病大多直接或间接地与基因 相关。 人类疾病大致分为三类: 基因病:以基因组学为基础,从疾病 和健康的角度考虑,人类疾 病大多直接或间接地与基因 相关。 人类疾病大致分为三类: (一)单基因病 (二)多基因病 (三)获得性基因病
二、疾病相关基因的鉴定 (一)检测人类基因变异或突变 (二)疾病时基因组差异表达分析 (三)染色体制图定位及疾病相关基因克隆
(一)检测人类基因变异或突变 单链构象多态性(SSCP)、 限制性片段长度多态性(RFLP), 变性梯度电泳(DGGE), 单核苷酸多态性(SNPs)
单核苷酸多态性 (single nucleotide polymorphism, SNP) 等位型1 等位型2 在人类两个个体之间大约每500—1000bp就有一个碱基差异,如果一个碱基位置发生的变异在上%以上的人群存在,这个位点就被定义为SNP位点。
寡核苷酸杂交分析 SNP和等位基因特异 寡核苷酸杂交
(二)疾病时基因组差异表达分析 某一疾病或综合征基因组与正常 基因组表达差异的比较。
DNA芯片检测的差异表达谱
(三)染色体制图定位及疾病相关基因克隆 疾病基因定位: 染色体原位杂交、染色体畸形分析、 连锁分析。 疾病相关基因的克隆: 已掌握疾病相关基因或及其产物的确切信息;已掌握与疾病可能相关的基因预测资料;对疾病相关基因毫无所知。
疾病相关基因克隆策略: 功能基因克隆 候选基因克隆 定位基因克隆 定位-候选基因克隆。
三、基因组学与肿瘤病因学 致癌因子引起DNA损伤,可引起突变, 如果关键基因功能改变,导致细胞异常 增殖而发生肿瘤。
鉴定隐性癌基因(肿瘤抑制基因)和显性癌基因。 制图策略,鉴定标志物。
肿瘤基因组解剖工程, 基因重排常导致癌基因失活。 http://cgap.nci.nih.gov/