Beyond Database Search PTMs, Mutations & Full Sequence Coverage Bin Ma Professor, University of Waterloo 从搜库到蛋白全序列分析.

Slides:



Advertisements
Similar presentations
第十二章 常微分方程 返回. 一、主要内容 基本概念 一阶方程 类 型 1. 直接积分法 2. 可分离变量 3. 齐次方程 4. 可化为齐次 方程 5. 全微分方程 6. 线性方程 类 型 1. 直接积分法 2. 可分离变量 3. 齐次方程 4. 可化为齐次 方程 5. 全微分方程 6. 线性方程.
Advertisements

In-depth Analysis of Protein Amino Acid Sequence and PTMs with High-resolution Mass Spectrometry Lian Yang 2 ; Baozhen Shan 1 ; Bin Ma 2 1 Bioinformatics.
在近年的高考地理试题中,考查地球上 两点间最短航线的方向问题经常出现,由于 很多学生对这类问题没有从本质上搞清楚, 又缺乏空间想象能力,只是机械地背一些结 论,造成解这类题目时经常出错。 地球上两点间的最短航线方向问题.
数据挖掘实验 1 Apriori 算法编程实现. 数据挖掘实验一 (20’) 实验目的:了解关联规则在数据挖掘中的 应用,理解和掌握关联挖掘的经典算法 Apriori 算法的基本原理和执行过程并完成程 序设计。 实验内容:对给定数据集用 Apriori 算法进行 挖掘,找出其中的频繁集并生成关联规则。
HistCite 结果分析示例 罗昭锋. By:SC 可能原因:文献年度过窄,少有相互引用.
Game Theory 窦衍旭. 什么是博弈论 博弈论,经济学中很著名的理论, 就是在 信息不对称的情况下根据对手可能作出的 决策作出决策,通俗地说,如果我这样做, 那么对手会怎样做,而对手基于我的做法 作出决策,我又该怎么做来应对。
细分曲面 傅孝明 SA 目录 细分曲面的基本思想 两个关键问题 一些基本概念 几种简单的细分曲面算法 细分曲面方法分类.
一、拟合优度检验 二、变量的显著性检验 三、参数的置信区间
计算机 在分析化学的应用 ( 简介 ) 陈辉宏. 一. 概述 信息时代的来临, 各门学科的研究方法都 有了新的发展. 计算机的介入, 为分析化学的进展提供了 一种更方便的研究方法.
两极异步电动机示意图 (图中气隙磁场形象地 用 N 、 S 来表示) 定子接三相电源上,绕组中流过三相对称电流,气 隙中建立基波旋转磁动势,产生基波旋转磁场,转速 为同步速 : 三相异步电动机的简单工作原理 电动机运行时的基本电磁过程: 这个同步速的气隙磁场切割 转子绕组,产生感应电动势并在 转子绕组中产生相应的电流;
Fitting (special modeling) 董小波 预习 BR2003, Chap. 7.
嵌入式操作系统 陈香兰 Fall 系统调用 10/27/09 嵌入式 OS 3/12 系统调用的意义  操作系统为用户态进程与硬件设备进行交互提供 了一组接口 —— 系统调用  把用户从底层的硬件编程中解放出来  极大的提高了系统的安全性  使用户程序具有可移植性.
地理信息系统概述. 数据和信息 (Data & Information) 数据 原始事实 如:员工姓名, 数据可以有数值、图形、声音、视觉数据等 信息 以一定规则组织在一起的事实的集合。
吉林大学远程教育课件 主讲人 : 杨凤杰学 时: 64 ( 第六十二讲 ) 离散数学. 最后,我们构造能识别 A 的 Kleene 闭包 A* 的自动机 M A* =(S A* , I , f A* , s A* , F A* ) , 令 S A* 包括所有的 S A 的状态以及一个 附加的状态 s.
分析化学与无机化学中溶液 pH 值计算的异同比较 谢永生  分析化学是大学化学系的一门基础课,课 时较少,其内容主要是无机物的化学分析。 分析化学是以无机化学作为基础的,我们 都是在已掌握一定的无机化学知识后才学 习分析化学 。所以在分析 化学的学习中会 重复许多无机化学内容,造成学习没有兴.
关于离子加热的探讨. 两个要探讨的基本问题 如何定义等离子体的加热过程 ? 等离子体加热是否必然牵涉到耗散 ?
1 为了更好的揭示随机现象的规律性并 利用数学工具描述其规律, 有必要引入随 机变量来描述随机试验的不同结果 例 电话总机某段时间内接到的电话次数, 可用一个变量 X 来描述 例 检测一件产品可能出现的两个结果, 也可以用一个变量来描述 第五章 随机变量及其分布函数.
数 学 系 University of Science and Technology of China DEPARTMENT OF MATHEMATICS 第 3 章 曲线拟合的最小二乘法 给出一组离散点,确定一个函数逼近原函数,插值是这样 的一种手段。在实际中,数据不可避免的会有误差,插值函 数会将这些误差也包括在内。
11-8. 电解质溶液的 活度和活度系数 电解质是有能力形成可以 自由移动的离子的物质. 理想溶液体系 分子间相互作用 实际溶液体系 ( 非电解质 ) 部分电离学说 (1878 年 ) 弱电解质溶液体系 离子间相互作用 (1923 年 ) 强电解质溶液体系.
主讲教师:陈殿友 总课时: 124 第八讲 函数的极限. 第一章 机动 目录 上页 下页 返回 结束 § 3 函数的极限 在上一节我们学习数列的极限,数列 {x n } 可看作自变量 为 n 的函数: x n =f(n),n ∈ N +, 所以,数列 {x n } 的极限为 a, 就是 当自变量 n.
质谱分析仪 扬州大学生物科学与技术学院. 质谱分析原理 质谱方法 (Mass Spectroscope,MS) 是通过正确测定蛋白质 分子的质量而进行蛋白质分子鉴定、蛋白质分子的修饰和 蛋白质分子相互作用的研究。质谱仪通过测定离子化生物 分子的质荷比便可得到相关分子的质量。但长期以来,质 谱方法仅限于小分子和中等分子的研究,因为要将质谱应.
实验一: 信号、 系统及系统响应 1 、实验目的 1 熟悉连续信号经理想采样前后的频谱变化关系, 加深对时 域采样定理的理解。 2 熟悉时域离散系统的时域特性。 3 利用卷积方法观察分析系统的时域特性。 4 掌握序列傅里叶变换的计算机实现方法, 利用序列的傅里 叶变换对连续信号、 离散信号及系统响应进行频域分析。
线性代数习题课 吉林大学 术洪亮 第一讲 行 列 式 前面我们已经学习了关 于行列式的概念和一些基本 理论,其主要内容可概括为:
吉林大学远程教育课件 主讲人 : 杨凤杰学 时: 64 ( 第二十五讲 ) 离散数学. 定理 群定义中的条件 ( 1 )和( 2 )可以减弱如下: ( 1 ) ’ G 中有一个元素左壹适合 1 · a=a; ( 2 ) ’ 对于任意 a ,有一个元素左逆 a -1 适 合 a -1 ·
数 学 系 University of Science and Technology of China DEPARTMENT OF MATHEMATICS 第 3 章 曲线拟合的最小二乘法 给出一组离散点,确定一个函数逼近原函数,插值是这样的一种手段。 在实际中,数据不可避免的会有误差,插值函数会将这些误差也包括在内。
聚合物在生物高分子分离中的应用 王延梅 中国科学技术大学高分子科学与工程系 Tel
实验三: 用双线性变换法设计 IIR 数字滤波器 一、实验目的 1 熟悉用双线性变换法设计 IIR 数字滤波器的原理与方法。 2 掌握数字滤波器的计算机仿真方法。 3 通过观察对实际心电图信号的滤波作用, 获得数字滤波的感性知 识。
外文文献检索示例. 实验目的: 掌握利用计算机网络检索外文文献的基本方法; 了解熟悉下列数据库的结构、内容并掌握其检索方 法 ; 掌握检索的主要途径:出版物( Publication )、关键 词( Keyword )、作者( Author )等。
数 学 系 University of Science and Technology of China DEPARTMENT OF MATHEMATICS 第 5 章 解线性方程组的直接法 实际中,存在大量的解线性方程组的问题。很多数值方 法到最后也会涉及到线性方程组的求解问题:如样条插值的 M 和.
主讲教师:陈殿友 总课时: 124 第十一讲 极限的运算法则. 第一章 二、 极限的四则运算法则 三、 复合函数的极限运算法则 一 、无穷小运算法则 机动 目录 上页 下页 返回 结束 §5 极限运算法则.
§2.2 一元线性回归模型的参数估计 一、一元线性回归模型的基本假设 二、参数的普通最小二乘估计( OLS ) 三、参数估计的最大或然法 (ML) 四、最小二乘估计量的性质 五、参数估计量的概率分布及随机干 扰项方差的估计.
第一节 相图基本知识 1 三元相图的主要特点 (1)是立体图形,主要由曲面构成; (2)可发生四相平衡转变; (3)一、二、三相区为一空间。
9的乘法口诀 1 .把口诀说完全。 二八( ) 四六( ) 五八( ) 六八( ) 三七( ) 三八( ) 六七( ) 五七( ) 五六( ) 十六 四十八 四十二 二十四 二十一 三十五 四十 二十四 三十 2 .口算, 并说出用的是哪句口诀。 8×8= 4×6= 7×5= 6×8= 5×8=
第 3 章 控制流分析 内容概述 – 定义一个函数式编程语言,变量可以指称函数 – 以 dynamic dispatch problem 为例(作为参数的 函数被调用时,究竟执行的是哪个函数) – 规范该控制流分析问题,定义什么是可接受的控 制流分析 – 定义可接受分析在语义模型上的可靠性 – 讨论分析算法.
吉林大学远程教育课件 主讲人 : 杨凤杰学 时: 64 ( 第五十三讲 ) 离散数学. 定义 设 G= ( V , T , S , P ) 是一个语法结构,由 G 产生的语言 (或者说 G 的语言)是由初始状态 S 演绎出来的所有终止符的集合, 记为 L ( G ) ={w  T *
RT-PCR 扬州大学 生物科学与技术学院. 背景介绍 DNA 存在于细胞核中并编码了基因 转录 : 双链 DNA 解链后利用其中一条链(编 码链)合成信使 RNA ( mRNA ) mRNA 从细胞核转移到细胞质中 mRNA 结合上核糖体开始翻译成蛋白质 蛋白执行基因的功能.
平行线的平行公理与判定 九年制义务教育七年级几何 制作者:赵宁睿. 平行线的平行公理与判定 要点回顾 课堂练习 例题解析 课业小结 平行公理 平行判定.
Relevance Theory Lecture 12. Relevance Theory 交际研究的对象是交际的概念、内容、 性质、功能、方法和交际行为、交际参 加者之间的关系等的认识和阐述。 20 世 纪 70 年代末以来, Sperber & Wilson 把认 知与交际结合起来,于 1986.
第七章 蛋白质结构预测 主讲人:孙 啸 制作人 : 刘志华 东南大学 吴健雄实验室 第一节 引言.
周期信号的傅里叶变换. 典型非周期信号 ( 如指数信号, 矩形信号等 ) 都是满足绝对可 积(或绝对可和)条件的能量信号,其傅里叶变换都存在, 但绝对可积(或绝对可和)条件仅是充分条件, 而不是必 要条件。引入了广义函数的概念,在允许傅里叶变换采用 冲激函数的前提下, 使许多并不满足绝对可积条件的功率.
Department of Mathematics 第二章 解析函数 第一节 解析函数的概念 与 C-R 条件 第二节 初等解析函数 第三节 初等多值函数.
氧 族 元 素 第一课时. 氧族元素 包含元素 氧族元素包括 氧 ( 8 O) 、硫 ( 16 S) 、硒 ( Se) 、碲 ( Te) 、钋 ( Po) 等 氧 ( 8 O) 、硫 ( 16 S) 、硒 ( Se) 、碲 ( Te) 、钋 ( Po) 等 氧族元素。 它们的最外层电子、化学性质相似统称为.
《 UML 分析与设计》 交互概述图 授课人:唐一韬. 知 识 图 谱知 识 图 谱知 识 图 谱知 识 图 谱.
光合作用的发现. ? 你知道吗 …… 光合作用是怎样发现的? 光合作用的发现及研究 1 、 1771 年,英国科学家普里斯特利的实验 1 、 1771 年,英国科学家普里斯特利的实验 指 出:植物可以更新空气。 如果是你今天做的实验,你得出什么结论? 绿色植物在光照下吸收了二氧化碳,产生了氧气。
1 、如果 x + 5 > 4 ,那么两边都 可得 x >- 1 2 、在- 3y >- 4 的两边都乘以 7 可得 3 、在不等式 — x≤5 的两边都乘以- 1 可得 4 、将- 7x — 6 < 8 移项可得 。 5 、将 5 + a >- 2 a 移项可得 。 6 、将- 8x < 0.
? 小数乘整数 制作人:吴运粮 复习 1.下面乘积得多少? 8 × 3= 8 × 3用加法表示什么意思? 3个8相加 24.
1 物体转动惯量的测量 南昌大学理学院
第 7 章说明 经典的单方程计量经济学模型理论与方法,限于常参数、 线性、揭示变量之间因果关系的单方程模型,被解释变量 是连续的随机变量,其抽样是随机和不受限制的,在模型 估计过程中或者只利用时间序列样本,或者只利用截面数 据样本,主要依靠对经济理论和行为规律的理解确定模型 的结构形式。 本章中,将讨论几种扩展模型,主要包括将被解释变量抽.
请同学们仔细观察下列两幅图有什么共同特点? 如果两个图形不仅形状相同,而且每组对应点所在的直线 都经过同一点, 那么这样的两个图形叫做位似图形, 这个点叫做位 似中心.
力的合成 力的合成 一、力的合成 二、力的平行四边形 上一页下一页 目 录 退 出. 一、力的合成 O. O. 1. 合力与分力 我们常常用 一个力来代替几个力。如果这个 力单独作用在物体上的效果与原 来几个力共同作用在物体上的效 果完全一样,那么,这一个力就 叫做那几个力的合力,而那几个 力就是这个力的分力。
8.1 二元一次方程组. 篮球联赛中,每场比赛都要分出胜负,每队 胜一场得 2 分,负一场得 1 分. 如果某队为了争取 较好名次,想在全部 22 场比赛中得 40 分,那么这 个队胜负场数应分别是多少 ? 引 言引 言 用学过的一元一次方 程能解决此问题吗? 这可是两个 未知数呀?
第四章 不定积分. 二、 第二类换元积分法 一、 第一类换元积分法 4.2 换元积分法 第二类换元法 第一类换元法 基本思路 设 可导, 则有.
数学广角——优化 沏茶问题.
个体 精子 卵细胞 父亲 受精卵 母亲 人类生活史 问题:人类产生配子(精、卵 细胞)是不是有丝分裂?
向日葵的花盘 画一画 用圆规画圆用圆规画圆 用圆规画圆用圆规画圆 用圆规画圆的方法: ( 1 )把圆规的两脚分开,定好两脚间 的距离(定长) ( 2 )把有针尖的一只脚固定在一点上 (定点) ( 3 )把装有铅笔尖的一只脚旋转一周 ,就画出一个圆(旋转)
算得清写的准 —— 物业费公示报告的编写 讲师:朱芸 物业费的 构成? 哪些是管 理人员工 资呢? 哪些算工程费 用? 怎样才能核 算的清楚呢?
◆ ▲ ★ ★ ▲ ◆ ●★ ▲ ◆ ●★ ▲ ◆ ●★ ▲ ◆ ● ▲ ◆▲ ◆▲ ◆▲ ◆▲ ◆▲ ◆ ▲ ● ◆ ★ ★ ▲ ◆ ★● ◆ ★ ★ ▲ ◆ ★ 猜一猜下一个图形是什么.
逻辑设计基础 1 第 7 章 多级与(或)非门电路 逻辑设计基础 多级门电路.
“ 百链 ” 云图书馆. 什么是百链云图书馆?1 百链云图书馆的实际效果?2 百链云图书馆的实现原理?3 百链云图书馆的价值?44 图书馆要做什么?55 提 纲.
同分母分数加、减法 分数的初步认识 绿色圃中小学教育网
用 9 加几解决问题 北京小学 石 颖 第八单元 20 以内的进位加法. 一、口算练习,复习旧知 9+5 = 9+7 = 109 快来算一算! 我们一起看算式,抢答结果,看谁算得又对又快! 说一说你是怎么计算 9+5 这道题的。 2+9 = 5+9 =
异核编辑谱 生物大分子波谱学原理 吴季辉 一般异核编辑谱由同核 NOESY 或 TOCSY 同 HSQC 或 HMQC 串接成,提供的信息 类似同核谱,但是谱峰在与 1 H 核相关的 13 C 或 15 N 核的化学位移上展开以解决同 核谱重叠的问题。其中异核编辑的 NOESY 谱是最后结构计算所需的.
表内除法(一) 用 2 ~ 6 的乘法口诀 求商( 2 ). 填一填,并说出用哪句乘法口诀。 12÷6 = 6÷2 = 12÷4 = 8÷4 = 9÷3 = 10÷2 = ×7 = 6×6 = 7×2 = 4×8 = 5×6 = 7×4 =
八. 真核生物的转录 ㈠ 特点 ① 转录单元为单顺反子( single cistron ),每 个蛋白质基因都有自身的启动子,从而造成在功能 上相关而又独立的基因之间具有更复杂的调控系统。 ② RNA 聚合酶的高度分工,由 3 种不同的酶催化转 录不同的 RNA 。 ③ 需要基本转录因子与转录调控因子的参与,这.
U niversity of S cience and T echnology of C hina VxWorks 及其应用开发 陈香兰 年 7 月.
人 有 悲 欢 离 合, 月有阴晴圆缺。月有阴晴圆缺。 华师大版七年级数学第二册 海口市第十中学 数学组 吴锐.
§5.6 利用希尔伯特 (Hilbert) 变换 研究系统的约束特性 希尔伯特变换的引入 可实现系统的网络函数与希尔伯特变换.
1 第三章 数列 数列的概念 考点 搜索 ●数列的概念 ●数列通项公式的求解方法 ●用函数的观点理解数列 高考 猜想 以递推数列、新情境下的 数列为载体, 重点考查数列的通 项及性质, 是近年来高考的热点, 也是考题难点之所在.
目录 上页 下页 返回 结束 二、无界函数反常积分的审敛法 * 第五节 反常积分 无穷限的反常积分 无界函数的反常积分 一、无穷限反常积分的审敛法 反常积分的审敛法  函数 第五章 第五章.
§7.2 估计量的评价标准 上一节我们看到,对于总体 X 的同一个 未知参数,由于采用的估计方法不同,可 能会产生多个不同的估计量.这就提出一 个问题,当总体的一个参数存在不同的估 计量时,究竟采用哪一个好呢?或者说怎 样评价一个估计量的统计性能呢?下面给 出几个常用的评价准则. 一.无偏性.
Presentation transcript:

Beyond Database Search PTMs, Mutations & Full Sequence Coverage Bin Ma Professor, University of Waterloo 从搜库到蛋白全序列分析

蛋白质鉴定的搜库手段 1. 酶切, 2.LC-MS/MS , 3. 对每个 MS/MS 谱通过搜库鉴定多肽, 4. 报告含有多个特异多肽的蛋白。 “ 多个 ” ?

多乎哉 ?

提要 两个极端:从头测序 & 搜库 二者结合 修饰( PTM ) 变异( Mutation ) 实例

一个目的,两种做法

同一样的原理 定义一个打分函数,找一个得分最优的多肽。 “ 最优 ” ?

生物和计算机的差异 最优解 ≠ 真实解。

听谁的? 我找到最优解了 是真的吗?

只报高置信度的解 score false true

An Idea to Improve Score Function 要是这两个结果相等你怎么想?

score false true before after 把 de novo 和搜库结果相似程度考虑到搜库的打分函数里面。

… far better than what I could ever squeeze out of my data – Stefano Gotta, Siena Biotech “ ” Zhang et al., PEAKS DB: De Novo Assisted Database Search. MCP 2012.

提要 两个极端:从头测序 & 搜库 二者结合 修饰( PTM ) 变异( Mutation ) 实例

Usual PTM Search All possible modification forms of a database peptide are tried to match the spectra. Can’t blindly search with all 600+ PTMs in Unimod. PEPTIDEPTM PEPT(+80)IDEPTM PEPTIDEPT(+80)M PEPT(+80)IDEPT(+80)M PEPTIDEPTM(+16) PEPT(+80)IDEPTM(+16) PEPTIDEPT(+80)M(+16) PEPT(+80)IDEPT(+80)M(+16) Ox-M Phos-T

De Novo Assisted PTM “Blind Search” Search for PTM when there is a tag match. X. Han et al. PeaksPTM. JPR 2011, 10(7): DB: …VK.LVNELTEFAK… Denovo: LVNGELTEFAK

De Novo Enabled Mutation Discovery 问题:从头测序有错、数据库有突变。 Ma and Johnson. De Novo Sequencing and Homology Searching. MCP : O (denovo) X: [LS]C[FA]K (real) Y: [SL]C[AF]K || || | (homolog) Z: [SL]A[AF]K de novo error mutation (denovo) X: LSCFAK | (homolog) Z: SLAAFK 答案:用最少的测序错和突变来解释二者差异. Y. Han, B. Ma, and K. Zhang. SPIDER. JBCB 3(3):

BSA Experiment “Pure” BSA protein ordered from Sigma. Three digests with Trypsin, LysC, GluC. Orbitrap (orbi-orbi) and typical LC-MS/MS protocol.

1. Contaminants: Bacteria, Keratin, Other Bovine Protein

2. Protein N-term The N-terminal region of bovine serum albumin (Asp-Thr-His-Lys) provides a specific binding site for Cu(II) ions. – T. Peters Jr., F.A. Blumenstock. J. Biol. Chem., 242 (1967), p. 1574

3. Frequent PTMs

4. A Mutation 214 th amino acid A  T

4. A Mutation 214 th amino acid A  T

5. Unexplained De Novo Tags After filtration of DB, PTM, SPIDER, there were still “de novo only” tags. KK.QTALVELLK.HK ||||||| DPALVELLKK

结论 1. 既要利用数据库,又不能拘泥于数据 库。 2. 蛋白全序列分析(包括修饰和突变) 很有必要。 3. 通过多个酶切和多个算法结合,全序 列分析是可行的。

To those who ignore mutations and PTMs in their protein study: It takes less than 1% amino acid mutations to change between most chimpanzee and human proteins.