第七章 蛋白质结构预测 主讲人:孙 啸 制作人 : 刘志华 东南大学 吴健雄实验室 第一节 引言.

Slides:



Advertisements
Similar presentations
首 页 首 页 上一页 下一页 本讲内容 投影法概述三视图形成及其投影规律平面立体三视图、尺寸标注 本讲内容 复习: P25~P31 、 P84~P85 作业: P7, P8, P14[2-32(2) A3 (1:1)]
Advertisements

第十二章 常微分方程 返回. 一、主要内容 基本概念 一阶方程 类 型 1. 直接积分法 2. 可分离变量 3. 齐次方程 4. 可化为齐次 方程 5. 全微分方程 6. 线性方程 类 型 1. 直接积分法 2. 可分离变量 3. 齐次方程 4. 可化为齐次 方程 5. 全微分方程 6. 线性方程.
在近年的高考地理试题中,考查地球上 两点间最短航线的方向问题经常出现,由于 很多学生对这类问题没有从本质上搞清楚, 又缺乏空间想象能力,只是机械地背一些结 论,造成解这类题目时经常出错。 地球上两点间的最短航线方向问题.
概率统计( ZYH ) 节目录 3.1 二维随机变量的概率分布 3.2 边缘分布 3.4 随机变量的独立性 第三章 随机向量及其分布 3.3 条件分布.
数据挖掘实验 1 Apriori 算法编程实现. 数据挖掘实验一 (20’) 实验目的:了解关联规则在数据挖掘中的 应用,理解和掌握关联挖掘的经典算法 Apriori 算法的基本原理和执行过程并完成程 序设计。 实验内容:对给定数据集用 Apriori 算法进行 挖掘,找出其中的频繁集并生成关联规则。
HistCite 结果分析示例 罗昭锋. By:SC 可能原因:文献年度过窄,少有相互引用.
位置相关查询处理 研究背景及意义 移动计算、无线通信以及定位技术的快速发展,使 得位置相关的查询处理及基于位置的信息服务技术 已经成为一个热点研究领域 。 大量的应用领域 ( 如地理信息系统、智能导航、交 通管制、天气预报、军事、移动电子商务等 ) 均迫 切需要有效地查询这些数据对象。
细分曲面 傅孝明 SA 目录 细分曲面的基本思想 两个关键问题 一些基本概念 几种简单的细分曲面算法 细分曲面方法分类.
一、拟合优度检验 二、变量的显著性检验 三、参数的置信区间
计算机 在分析化学的应用 ( 简介 ) 陈辉宏. 一. 概述 信息时代的来临, 各门学科的研究方法都 有了新的发展. 计算机的介入, 为分析化学的进展提供了 一种更方便的研究方法.
4 第四章 矩阵 学时:  18 学时。 教学手段:  讲授和讨论相结合,学生课堂练习,演练习题与辅导答疑相结合。 基本内容和教学目的:  基本内容: 矩阵的运算,可逆矩阵,初等矩阵及其性质和意义, 分块矩阵。  教学目的:  1 .使学生理解和掌握矩阵等价的相关理论  2 .能熟练地进行矩阵的各种运算.
第二章 质点组力学 质点组:许多(有限或无限)相 互联系的质点组成的系统 研究方法: 1. 分离体法 2. 从整体考虑 把质点的三个定理推广到质点组.
两极异步电动机示意图 (图中气隙磁场形象地 用 N 、 S 来表示) 定子接三相电源上,绕组中流过三相对称电流,气 隙中建立基波旋转磁动势,产生基波旋转磁场,转速 为同步速 : 三相异步电动机的简单工作原理 电动机运行时的基本电磁过程: 这个同步速的气隙磁场切割 转子绕组,产生感应电动势并在 转子绕组中产生相应的电流;
Graphene Double Quantum Dot Transport Property Zhan Su Jan. 12, 2011.
地理信息系统概述. 数据和信息 (Data & Information) 数据 原始事实 如:员工姓名, 数据可以有数值、图形、声音、视觉数据等 信息 以一定规则组织在一起的事实的集合。
吉林大学远程教育课件 主讲人 : 杨凤杰学 时: 64 ( 第六十二讲 ) 离散数学. 最后,我们构造能识别 A 的 Kleene 闭包 A* 的自动机 M A* =(S A* , I , f A* , s A* , F A* ) , 令 S A* 包括所有的 S A 的状态以及一个 附加的状态 s.
2.1 结构上的作用 作用及作用效应 作用的分类 荷载分类及荷载代表值.
1 为了更好的揭示随机现象的规律性并 利用数学工具描述其规律, 有必要引入随 机变量来描述随机试验的不同结果 例 电话总机某段时间内接到的电话次数, 可用一个变量 X 来描述 例 检测一件产品可能出现的两个结果, 也可以用一个变量来描述 第五章 随机变量及其分布函数.
数 学 系 University of Science and Technology of China DEPARTMENT OF MATHEMATICS 第 3 章 曲线拟合的最小二乘法 给出一组离散点,确定一个函数逼近原函数,插值是这样 的一种手段。在实际中,数据不可避免的会有误差,插值函 数会将这些误差也包括在内。
11-8. 电解质溶液的 活度和活度系数 电解质是有能力形成可以 自由移动的离子的物质. 理想溶液体系 分子间相互作用 实际溶液体系 ( 非电解质 ) 部分电离学说 (1878 年 ) 弱电解质溶液体系 离子间相互作用 (1923 年 ) 强电解质溶液体系.
主讲教师:陈殿友 总课时: 124 第八讲 函数的极限. 第一章 机动 目录 上页 下页 返回 结束 § 3 函数的极限 在上一节我们学习数列的极限,数列 {x n } 可看作自变量 为 n 的函数: x n =f(n),n ∈ N +, 所以,数列 {x n } 的极限为 a, 就是 当自变量 n.
吉林大学远程教育课件 主讲人 : 杨凤杰学 时: 64 ( 第三十八讲 ) 离散数学. 第八章 格与布尔代数 §8.1 引 言 在第一章中我们介绍了关于集 合的理论。如果将 ρ ( S )看做 是集合 S 的所有子集组成的集合, 于是, ρ ( S )中两个集合的并 集 A ∪ B ,两个集合的交集.
第十一章 曲线回归 第一节 曲线的类型与特点 第二节 曲线方程的配置 第三节 多项式回归.
线性代数习题课 吉林大学 术洪亮 第一讲 行 列 式 前面我们已经学习了关 于行列式的概念和一些基本 理论,其主要内容可概括为:
第二章 随机变量及其分布 第一节 随机变量及其分布函数 一、随机变量 用数量来表示试验的基本事件 定义 1 设试验 的基本空间为 , ,如果对试验 的每一个基 本事件 ,规定一个实数记作 与之对应,这样就得到一个定义在基本空 间 上的一个单值实函数 ,称变量 为随机变量. 随机变量常用字母 、 、 等表示.或用.
数 学 系 University of Science and Technology of China DEPARTMENT OF MATHEMATICS 第 3 章 曲线拟合的最小二乘法 给出一组离散点,确定一个函数逼近原函数,插值是这样的一种手段。 在实际中,数据不可避免的会有误差,插值函数会将这些误差也包括在内。
聚合物在生物高分子分离中的应用 王延梅 中国科学技术大学高分子科学与工程系 Tel
实验三: 用双线性变换法设计 IIR 数字滤波器 一、实验目的 1 熟悉用双线性变换法设计 IIR 数字滤波器的原理与方法。 2 掌握数字滤波器的计算机仿真方法。 3 通过观察对实际心电图信号的滤波作用, 获得数字滤波的感性知 识。
1 第 7 章 专家控制系统 概述 专家系统的起源与发展 专家系统的一般结构 专家系统的知识表示和获取 专家系统的特点及分类.
信息利用与学术论文写作 Library of Jiangsu University, Zhenjiang Sha Zhenjiang
第二章 贝叶斯决策理论 3学时.
流态化 概述 一、固体流态化:颗粒物料与流动的流体接触,使颗粒物料呈类 似于流体的状态。 二、流态化技术的应用:流化催化裂化、吸附、干燥、冷凝等。 三、流态化技术的优点:连续化操作;温度均匀,易调节和维持; 气、固间传质、传热速率高等。 四、本章基本内容: 1. 流态化基本概念 2. 流体力学特性 3.
非均相物系的分离 沉降速度 球形颗粒的 :一、自由沉降 二、沉降速度的计算 三、直径计算 1. 试差法 2. 摩擦数群法 四、非球形颗粒的自由沉降 1. 当量直径 de :与颗粒体积相等的圆球直径 V P — 颗粒的实际体积 2. 球形度  s : S—— 与颗粒实际体积相等的球形表面积.
量子化学 第四章 角动量与自旋 (Angular momentum and spin) 4.1 动量算符 4.2 角动量阶梯算符方法
数 学 系 University of Science and Technology of China DEPARTMENT OF MATHEMATICS 第 5 章 解线性方程组的直接法 实际中,存在大量的解线性方程组的问题。很多数值方 法到最后也会涉及到线性方程组的求解问题:如样条插值的 M 和.
在发明中学习 线性代数 概念的引入 李尚志 中国科学技术大学. 随风潜入夜 : 知识的引入 之一、线性方程组的解法 加减消去法  方程的线性组合  原方程组的解是新方程的解 是否有 “ 增根 ” ?  互为线性组合 : 等价变形  初等变换  高斯消去法.
§2.2 一元线性回归模型的参数估计 一、一元线性回归模型的基本假设 二、参数的普通最小二乘估计( OLS ) 三、参数估计的最大或然法 (ML) 四、最小二乘估计量的性质 五、参数估计量的概率分布及随机干 扰项方差的估计.
第2章 激光器的工作原理 回顾 ——产生激光的三个必要条件: 1. 工作物质 2. 激励能源 3. 光学谐振腔
第一节 相图基本知识 1 三元相图的主要特点 (1)是立体图形,主要由曲面构成; (2)可发生四相平衡转变; (3)一、二、三相区为一空间。
量子力学教程 ( 第二版 ) 3.4 连 续 谱 本 征 函 数 的 归 一 化 连续谱本征函数是不能归一化的 一维粒子的动量本征值为的本征函数 ( 平面波 ) 为 可以取 中连续变化的一切实数值. 不难看出,只要则 在量子力学中, 坐标和动量的取值是连续变化 的 ; 角动量的取值是离散的.
吉林大学远程教育课件 主讲人 : 杨凤杰学 时: 64 ( 第五十三讲 ) 离散数学. 定义 设 G= ( V , T , S , P ) 是一个语法结构,由 G 产生的语言 (或者说 G 的语言)是由初始状态 S 演绎出来的所有终止符的集合, 记为 L ( G ) ={w  T *
目录 上页 下页 返回 结束 第八章 第八章 一、空间曲线的一般方程 二、空间曲线的参数方程 三、空间曲线在坐标面上的投影 第四节 空间曲线及其方程.
编译原理总结. 基本概念  编译器 、解释器  编译过程 、各过程的功能  编译器在程序执行过程中的作用  编译器的实现途径.
§8-3 电 场 强 度 一、电场 近代物理证明:电场是一种物质。它具有能量、 动量、质量。 电荷 电场 电荷 电场对外的表现 : 1) 电场中的电荷要受到电场力的作用 ; 2) 电场力可移动电荷作功.
第六章 系统发生分析 主讲人:孙 啸 制作人:刘志华 东南大学 吴健雄实验室.
Department of Mathematics 第二章 解析函数 第一节 解析函数的概念 与 C-R 条件 第二节 初等解析函数 第三节 初等多值函数.
模式识别 – 成分分析与核函数 第八章 成分分析与核函数. 模式识别 – 成分分析与核函数 8.0 问题的提出 降低特征维数 : Dimension Reduction  提高泛化能力:减少模型的参数数量;  减少计算量: 主要方法: 1. 主成分分析 (PCA): Principle Component.
首 页 首 页 上一页 下一页 本讲内容本讲内容 视图,剖视图(Ⅰ) 复习: P107 ~ P115 作业: P48(6-2,6-4), P49( 去 6-6) P50, P51(6-13), P52 P50, P51(6-13), P52 P53 (6-18,6-20) P53 (6-18,6-20)
1-4 节习题课 山东省淄博第一中学 物理组 阚方海. 2 、位移公式: 1 、速度公式: v = v 0 +at 匀变速直线运动规律: 4 、平均速度: 匀变速直线运动 矢量式 要规定正方向 统一单位 五个量知道了三 个量,就能求出 其余两个量 3 、位移与速度关系:
《 UML 分析与设计》 交互概述图 授课人:唐一韬. 知 识 图 谱知 识 图 谱知 识 图 谱知 识 图 谱.
1 、如果 x + 5 > 4 ,那么两边都 可得 x >- 1 2 、在- 3y >- 4 的两边都乘以 7 可得 3 、在不等式 — x≤5 的两边都乘以- 1 可得 4 、将- 7x — 6 < 8 移项可得 。 5 、将 5 + a >- 2 a 移项可得 。 6 、将- 8x < 0.
1 物体转动惯量的测量 南昌大学理学院
§10.2 对偶空间 一、对偶空间与对偶基 二、对偶空间的有关结果 三、例题讲析.
请同学们仔细观察下列两幅图有什么共同特点? 如果两个图形不仅形状相同,而且每组对应点所在的直线 都经过同一点, 那么这样的两个图形叫做位似图形, 这个点叫做位 似中心.
综合性问题 距离和角度的度量 画法几何及机械制图 精品资源共享课 换面法应用 工程图学教研室. 工程实际抽象出来的几何问题,如距离、角度的度量;点、线、面 的定位等,并不是单纯的平行、相交、垂直问题,而多是较复杂的综 合问题,其突出特点是要受若干条件的限制,求解时往往要同时满足 几个条件。 解决此类问题的方法通常是:分析、确定解题方案及投影图上实.
7 生产费用在完工产品与在产 品之间分配的核算. 2 第七章 生产费用在完工产品与在产品之 间的分配  知识点 :  理解在产品的概念  掌握生产费用在完工产品与在产品之间的分 配.
力的合成 力的合成 一、力的合成 二、力的平行四边形 上一页下一页 目 录 退 出. 一、力的合成 O. O. 1. 合力与分力 我们常常用 一个力来代替几个力。如果这个 力单独作用在物体上的效果与原 来几个力共同作用在物体上的效 果完全一样,那么,这一个力就 叫做那几个力的合力,而那几个 力就是这个力的分力。
个体 精子 卵细胞 父亲 受精卵 母亲 人类生活史 问题:人类产生配子(精、卵 细胞)是不是有丝分裂?
逻辑设计基础 1 第 7 章 多级与(或)非门电路 逻辑设计基础 多级门电路.
1 第 4 章 速度瞬心及其应用 ● 利用速度瞬心进行机构的速度分析 ● 将低副机构转变为高副机构 ( 瞬心线机 构,共轭曲线机构) ● 用低副机构的分析方法对高副机构进 行结构和运动分析 ( 高副低代 )
八. 真核生物的转录 ㈠ 特点 ① 转录单元为单顺反子( single cistron ),每 个蛋白质基因都有自身的启动子,从而造成在功能 上相关而又独立的基因之间具有更复杂的调控系统。 ② RNA 聚合酶的高度分工,由 3 种不同的酶催化转 录不同的 RNA 。 ③ 需要基本转录因子与转录调控因子的参与,这.
人 有 悲 欢 离 合, 月有阴晴圆缺。月有阴晴圆缺。 华师大版七年级数学第二册 海口市第十中学 数学组 吴锐.
欢 迎 使 用 《工程流体力学》 多媒体授课系统 燕 山 大 学 《工程流体力学》课程组. 第九章 缝隙流动 概述 9.1 两固定平板间的层流流动 9.2 具有相对运动的两平行平板 间的缝隙流动 9.3 环形缝隙中的层流流动.
1 第三章 数列 数列的概念 考点 搜索 ●数列的概念 ●数列通项公式的求解方法 ●用函数的观点理解数列 高考 猜想 以递推数列、新情境下的 数列为载体, 重点考查数列的通 项及性质, 是近年来高考的热点, 也是考题难点之所在.
第二节. 广告牌为什么会被风吹倒? 结构的稳定性: 指结构在负载的作用下 维持其原有平衡状态的能力。 它是结构的重要性质之一。
§9. 恒定电流场 第一章 静电场 恒定电流场. 电流强度  电流:电荷的定向移动  正负电荷反方向运动产生的电磁效应相同 ( 霍尔效应 特例 ) 规定正电荷流动的方向为正方向  电流方向:正方向、反方向  电流强度 ( 电流 ) A 安培 标量 单位时间通过某一截面的电荷.
第二节 财政的基本特征 第二节 财政的基本特征 一、财政分配以政府为主体 二、财政分配一般具有强制性 三、财政分配一般具有无偿性 第一章 财政概论 四、财政分配一般具有非营利性.
目录 上页 下页 返回 结束 二、无界函数反常积分的审敛法 * 第五节 反常积分 无穷限的反常积分 无界函数的反常积分 一、无穷限反常积分的审敛法 反常积分的审敛法  函数 第五章 第五章.
本章讨论有限自由度结构系统,在给定载荷和初始条件激励下的系统动力响应计算方法。 第 六 章
§7.2 估计量的评价标准 上一节我们看到,对于总体 X 的同一个 未知参数,由于采用的估计方法不同,可 能会产生多个不同的估计量.这就提出一 个问题,当总体的一个参数存在不同的估 计量时,究竟采用哪一个好呢?或者说怎 样评价一个估计量的统计性能呢?下面给 出几个常用的评价准则. 一.无偏性.
Presentation transcript:

第七章 蛋白质结构预测 主讲人:孙 啸 制作人 : 刘志华 东南大学 吴健雄实验室

第一节 引言

蛋白质结构预测问题 序列 —— 结构 —— 功能 ….-Gly-Ala-Glu-Phe-…. FUNCTION

结构预测问题 ….-Gly-Ala-Glu-Phe-…. FUNCTION ?

解决方法 ….-Gly-Ala-Glu-Phe-…. FUNCTION !

寻找一种从蛋白质的氨基酸线性 序列到蛋白质所有原子三维坐 标的一种映射

蛋白质结构预测主要有两大类方法: ( 1 )理论分析方法 – 通过理论计算(如分子力学、分子动力学计算) 进行结构预测。 ( 2 )统计的方法 – 对已知结构的蛋白质进行统计分析,建立序列到 结构的映射模型,进而对未知结构的蛋白质根据 映射模型直接从氨基酸序列预测结构。 – 包括: 经验性方法 结构规律提取方法 同源模型化方法

第二节 蛋白质二级结构预测 蛋白质 序列: ↓ 二级结构:

二级结构预测 蛋白质 序列: 二级结构: QLMGERIRARRKKLK → STHHHHHHHHHHHHT

1 、二级结构预测概述 – 蛋白质的二级结构预测的基本依据是: 每一段相邻的氨基酸残基具有形成一定二 级结构的倾向。 – 二级结构预测问题是模式分类问题 – 二级结构预测的目标: 判断每一段中心的残基是否处于  螺旋、  折叠、 转角(或其它状态)之一的二级结构态,即三 态。

基本策略( 1 ) 相似序列 → 相似结构 QLMGERIRARRKKLKQLMGAERIRARRKKLK 结构?

基本策略( 2 ) 分类分析 α 螺旋 提取样本 聚类分析 学习分类规则 预测 ….-Gly-Ala-Glu-Phe-….

二级结构预测的方法大体分为三代: – 第一代是基于单个氨基酸残基统计分析 从有限的数据集中提取各种残基形成特定二级结构的 倾向,以此作为二级结构预测的依据。 – 第二代预测方法是基于氨基酸片段的统计分析 统计的对象是氨基酸片段 片段的长度通常为 片段体现了中心残基所处的环境 在预测中心残基的二级结构时,以残基在特定环境形 成特定二级结构的倾向作为预测依据

这些算法可以归为几类: ( 1 )基于统计信息 ( 2 )基于物理化学性质 ( 3 )基于序列模式 ( 4 )基于多层神经网络 ( 5 )基于多元统计 ( 6 )基于机器学习的专家规则 ( 7 )最邻近算法

第一代和第二代预测方法对三态预测的准确 率都小于 70% ,而对  折叠预测的准确率仅为 28  48% – 其主要原因是只利用局部信息 第三代方法(考虑多条序列) – 运用长程信息和蛋白质序列的进化信息 – 准确度有了比较大的提高

2 、蛋白质二级结构预测方法 (1) 经验参数法 蛋白质二级结构的组成规律性比较强 三种基本二级结构平均占氨基酸残基的 85% 各种二级结构非均匀地分布在蛋白质中

– 有些蛋白质中含有大量的  螺旋 如血红蛋白和肌红蛋白 – 而一些蛋白质中则不含或者仅含很少的  螺旋 如铁氧蛋白 – 有些蛋白质的二级结构以  折叠为主 如免疫球蛋白 例:肽链 Ala(A)-Glu(E)-Leu(L)-Met(M) 倾向于形成  螺旋 肽链 Pro(P)-Gly(G)-Tyr(Y)-Ser(S) 则不会形成  螺旋

每种氨基酸出现在各种二级结构中倾向或者 频率是不同的 例如: Glu 主要出现在  螺旋中 Asp 和 Gly 主要分布在转角中 Pro 也常出现在转角中,但是绝不会出现在  螺旋中 可以根据每种氨基酸残基形成二级结构的倾 向性或者统计规律进行二级结构预测

经验参数法由 Chou 和 Fasman 在 70 年代提出 来 是一种基于单个氨基酸残基统计的经验预测 方法。通过统计分析,获得的每个残基出现 于特定二级结构构象的倾向性因子,进而利 用这些倾向性因子预测蛋白质的二级结构。

一个氨基酸残基的构象倾向性因子定义为 P i = A i / T i (i= ,β,c, t) 式中下标 i 表示构象态 如  螺旋、 β 折叠、转角、无规卷曲等; T i 是所有被统计残基处于构象态 i 的比例; A i 是第 A 种残基处于构象态 i 的比例; P i 大于 1.0 表示该残基倾向于形成二级结构构象 i , 小于 1.0 则表示倾向于形成其它构象。

发现关于二级结构的经验规则 基本思想是在序列中寻找规则二级结构的成核 位点和终止位点。 扫描输入的氨基酸序列,利用一组规则发现可能成 为特定二级结构成核区域的短序列,然后对于成核 区域进行扩展,不断扩大成核区域,直到倾向性因 子小于 1.0 为止。 规则: – ( i ) α 螺旋规则 – ( ii ) β 折叠规则 – ( iii )转角规则 – (iv) 重叠规则 延伸 成核区 延伸

( i ) α 螺旋规则 沿蛋白质序列寻找 α 螺旋核 – 相邻的 6 个残基中如果有至少 4 个残基倾向于形成 α 螺旋,则认为是螺旋核。 从螺旋核向两端延伸 – 直至四肽片段的 α 螺旋倾向性因子的平均值 {P  }<1.0 为止。 将螺旋两端各去掉 3 个残基 – 剩余部分若长于 6 个残基,而且 {P  } >1.03 ,则 预测为螺旋。 延伸 螺旋核 延伸

( ii ) β 折叠规则 相邻 6 个残基中若有 4 个倾向于形成 β 折叠,则 认为是折叠核。 折叠核向两端延伸直至 4 个残基的平均折叠倾 向性因子 {P  }<1.0 。 若延伸后的片段的 {P  }>1.05 ,则预测为 β 折 叠。

( iii )转角规则 转角的模型为四肽 四肽片段 Pt 的平均值大于 100 ,并且 Pt 的均值同时 大于 P  的均值以及 P  的均值,则可以预测这样连 续的 4 个残基形成转角。 则可以预测这样连续的 4 个氨基酸形成转角。

(iv) 重叠规则 对于螺旋和折叠的重叠区域,按 {P a } 和 {P  } 的 相对大小进行预测 若 {P a } 大于 {P  } ,则预测为螺旋; 反之,预测为折叠。

(2) GOR 方法 是一种基于信息论和贝叶斯统计学的方法 GOR 将蛋白质序列当作一连串的信息值来处 理 GOR 方法不仅考虑被预测位置本身氨基酸残 基种类的影响,而且考虑相邻残基种类对该 位置构象的影响

序列窗口 中心残基 窗口中各个残基对中心残基二级结构的支持程度

两个事件 S 和 R 的条件概率 P(S|R) 即在 R 发生的条件下, S 发生的概率 定义信息为: 若 S 和 R 无关,则 I(S; R)=0 若 R 的发生有利于 S 的发生,则 I(S; R)>0 若 R 的发生不利于 S 的发生,则 I(S; R)<0

I(S; R) 在二级结构预测中的含义 –R 代表中心氨基酸及其所处环境 –S 代表二级结构类型 –I(S; R) 代表中心氨基酸处于 S 的信息值

例如:假定数据库中有 1830 个残基, 780 个 处于螺旋态, 1050 个处于非螺旋态 库中共有 390 个丙氨酸( A ),有 240 个 A 处于 螺旋态,其余 150 个 A 处于非螺旋态。 可得:

(3) Lim 方法 —— 立体化学方法 氨基酸的理化性质对二级结构影响较大 在进行结构预测时考虑氨基酸残基的物理化学性 质 – 如疏水性、极性、侧链基团的大小等,根据残基各方 面的性质及残基之间的组合预测可能形成的二级结构。 “ 疏水性 ” 是氨基酸的一种重要性质,疏水性的氨 基酸倾向于远离周围水分子,将自己包埋进蛋白 质的内部。

α 螺旋的形成规律: 在一段序列中发现第 i 、 i+3 、 i+4 位(如 1 、 4 、 5 )是疏水残基时,这一片段就被预测 为 α 螺旋; 当发现第 i 、 i+1 、 i+4 位(如 7 , 8 , 11 ) 为疏水残基时,这一片段也被预测为 α 螺 旋。

对于 β 折叠的形成规律: 对于 β 折叠,也存在着一些特征的亲疏水 残基间隔模式,埋藏的 β 折叠通常由连续 的疏水残基组成,一侧暴露的 β 折叠则通 常具有亲水 - 疏水的两残基重复模式。 原则上,通过在序列中搜寻特殊的亲疏水 残基间隔模式,就可以预测 α 螺旋和 β 折叠。

点模式方法: 将 20 种氨基酸残基分为亲水、疏水以及两性残 基三类 用八残基片段表征亲疏水间隔模式 以一个二进制位代表一个残基,疏水为 1 ,亲 水为 0 ,共八位。 这样,八残基片段的亲疏水模式可用 0  255 的 数值来表示

α 螺旋的特征模式对应的值为: 9 , 12 , 13 , 17 , …… , 201 , 205 , 217 , 219 , 237 。 β 折叠的特征模式: 由连续的 1 或交替的 01 构成。

疏水性定量计算

(4) 同源分析法 将待预测的片段与数据库中已知二级结构的 片段进行相似性比较,利用打分矩阵计算出 相似性得分,根据相似性得分以及数据库中 的构象态,构建出待预测片段的二级结构。 该方法对数据库中同源序列的存在非常敏感, 若数据库中有相似性大于 30% 的序列,则预 测准确率可大大上升。

假设已知二级结构的氨基酸片段 T=STNGIYW T 的二级结构为 CHHHHHT H 代表  螺旋, T 代表转角, C 代表无规卷曲 待预测二级结构的氨基酸片段 U=ATSGVFL 序列比对: T = S T N G I Y W U = A T S G V F L 直接将 T 的构象态赋予 U

更为合理的方法: 是将待预测二级结构的蛋白质 U 与多个同源 序列进行多重比对,对于 U 的每个残基位置, 其构象态由多个同源序列对应位置的构象态 决定,或取出现次数最多的构象态,或对各 种可能的构象态给出得分值。

(5) 人工神经网络方法

(6) 综合方法 综合方法不仅包括各种预测方法的综合,而 且也包括结构实验结果、序列对比结果、蛋 白质结构分类预测结果等信息的综合。 – 多个程序同时预测,综合评判  一致结果 – 序列比对与二级结构预测 – 双重预测 首先预测蛋白质的结构类型 然后再预测二级结构

3 、利用进化信息预测蛋白质的二级结构 蛋白质序列家族中氨基酸的替换模式是高度 特异的,如何利用这样的进化信息是二级结 构预测的关键。 蛋白质二级结构预测软件系统 PHD – 第一步工作是形成同源序列的多重对比排列 – 第二步工作是将得到的多重比对的统计结果送 到一个神经网络中计算。

4 、 RNA 二级结构的预测 RNA 的结构可以分为三个层次 – 一级结构 – 二级结构 – 空间结构

RNA二级结构的预测方法 – 点矩阵法作图 – 动态规划法 – 最大匹配法 – 最小自由能法等。

第三节 二维结构中的预测 残基之间的距离 只要给出所有残基之间的距离,就可以利 用距离几何或分子动力学方法构建蛋白质 的三维结构。 预测残基之间距离