A Simple Model for Protein Structure 施奇廷(東海大學物理系).

Slides:



Advertisements
Similar presentations
1 生物計算期末作業 暨南大學資訊工程系 2003/05/13. 2 compare f1 f2  只比較兩個檔案 f1 與 f2 ,比完後將結果輸出。 compare directory  以兩兩比對的方式,比對一個目錄下所有檔案的相 似程度。  將相似度很高的檔案做成報表輸出,報表中至少要.
Advertisements

1 Chemical and Engineering Thermodynamics Chapter 2 Conservation of mass and energy Sandler.
布林代數的應用--- 全及項(最小項)和全或項(最大項)展開式
第七章 抽樣與抽樣分配 蒐集統計資料最常見的方式是抽查。這 牽涉到兩個問題: 抽出的樣本是否具有代表性?是否能反應出母體的特徵?
1 Q10276: Hanoi Tower Troubles Again! 星級 : ★★★ 題組: Online-judge.uva.es PROBLEM SET Volume CII 題號: Q10276: Hanoi Tower Troubles Again! 解題者:薛祖淵 解題日期: 2006.
Section 1.2 Describing Distributions with Numbers 用數字描述分配.
空間中有景物 第一組 B 陳思 廷 B 陳湘 惠. 內容大綱 1. 什麼是空間 ? 2. 什麼是景物 ? 3. 問題 - 什麼是空間中有景物 ? 4. 什麼樣類型的空間需要放置景物 ? 5. 設計原則 6. 研究結論 7. 參考文獻.
第二章 太陽能電池的基本原理 及其結構 2-1 太陽能電池的基本原理 2-2 太陽能電池的基本結構 2-3 太陽能電池的製作.
Advanced Chemical Engineering Thermodynamics
指導教授:陳淑媛 學生:李宗叡 李卿輔.  利用下列三種方法 (Edge Detection 、 Local Binary Pattern 、 Structured Local Edge Pattern) 來判斷是否為場景變換,以方便使用者來 找出所要的片段。
: Boxes ★★★☆☆ 題組: Problem Set Archive with Online Judge 題號: 11003: Boxes 解題者:蔡欣燁 解題日期: 2007 年 3 月 19 日.
1 Advanced Chemical Engineering Thermodynamics Appendix BK The Generalized van der Waals Partition Function.
Review of Chapter 3 - 已學過的 rules( 回顧 )- 朝陽科技大學 資訊管理系 李麗華 教授.
: OPENING DOORS ? 題組: Problem Set Archive with Online Judge 題號: 10606: OPENING DOORS 解題者:侯沛彣 解題日期: 2006 年 6 月 11 日 題意: - 某間學校有 N 個學生,每個學生都有自己的衣物櫃.
Chapter 2 聯立線性方程式與矩陣 緒言 線性方程式組 (systems of linear equations) 出現 在多數線性模式 (linear model) 中。根據以往解 題的經驗,讀者們也許已發現方程式的解僅與 該方程式的係數有關,求解的過程也僅與係數 的運算有關,只要係數間的相關位置不改變,
STAT0_sampling Random Sampling  母體: Finite population & Infinity population  由一大小為 N 的有限母體中抽出一樣本數為 n 的樣 本,若每一樣本被抽出的機率是一樣的,這樣本稱 為隨機樣本 (random sample)
5.1 Rn上之長度與點積 5.2 內積空間 5.3 單範正交基底:Gram-Schmidt過程 5.4 數學模型與最小平方分析
MATLAB 程式設計 第 11 章 多維陣列 多維陣列的定義 在 MATLAB 的資料型態中,向量可視為 一維陣列,矩陣可視二維陣列,對於維 度 (Dimensions) 超過 1 的陣列則均可視 為「多維陣列」 (Multidimesional Arrays , 簡稱 N-D Arrays)
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆 資料分析與表達.
: The Playboy Chimp ★★☆☆☆ 題組: Problem Set Archive with Online Judge 題號: 10611: The Playboy Chimp 解題者:蔡昇宇 解題日期: 2010 年 2 月 28 日 題意:給一已排序的數列 S( 升冪.
基礎物理總論 基礎物理總論 熱力學與統計力學(三) Statistical Mechanics 東海大學物理系 施奇廷.
Department of Air-conditioning and Refrigeration Engineering/ National Taipei University of Technology 模糊控制設計使用 MATLAB 李達生.
1 政治大學東亞所選修 -- 計量分析與中國大陸研究黃智聰 政治大學東亞所選修 課程名稱:計量分析與中國大陸研究 (量化分析) 授課老師:黃智聰 授課內容:時間序列與橫斷面資料的共用 參考書目: Hill, C. R., W. E. Griffiths, and G. G. Judge, (2001),
1 蛋白質簡介 暨南大學資訊工程系 2003/05/06. 2 蛋白質是由 20 種胺基酸所組成.
2009fallStat_samplec.i.1 Chap10 Sampling distribution (review) 樣本必須是隨機樣本 (random sample) ,才能代表母體 Sample mean 是一隨機變數,隨著每一次抽出來的 樣本值不同,它的值也不同,但會有規律性 為了要知道估計的精確性,必需要知道樣本平均數.
JAVA 程式設計與資料結構 第十章 GUI Introdution III. File Chooser  File Chooser 是一個選擇檔案的圖形介面, 無論我們是要存檔還是要開啟檔案,使 用這個物件都會讓我們覺得容易且舒適。
桁架分析.
1 第四章 多變數函數的微分學 § 4.1 偏導數定義 定義 極限值 ■. 2 定理 極限值的基本定理 (1) 極限值的唯一性 : 若 存在,則 其值必為唯一。 (2) 若 且 ( 與 為常數 ) , 則 且 為常數且.
:Problem D: Bit-wise Sequence ★★★☆☆ 題組: Problem Set Archive with Online Judge 題號: 10232: Problem D: Bit-wise Sequence 解題者:李濟宇 解題日期: 2006 年 4 月 16.
第三部分:研究設計 ( 二): 研究工具的信效度 與研究效度 (第九章之第 306 頁 -308 頁;第四章)
: Fast and Easy Data Compressor ★★☆☆☆ 題組: Problem Set Archive with Online Judge 題號: 10043: Fast and Easy Data Compressor 解題者:葉貫中 解題日期: 2007 年 3.
選舉制度、政府結構與政 黨體系 Cox (1997) Electoral institutions, cleavage strucuters, and the number of parties.
: Problem A : MiniMice ★★★★☆ 題組: Contest Archive with Online Judge 題號: 11411: Problem A : MiniMice 解題者:李重儀 解題日期: 2008 年 9 月 3 日 題意:簡單的說,題目中每一隻老鼠有一個編號.
: Multisets and Sequences ★★★★☆ 題組: Problem Set Archive with Online Judge 題號: 11023: Multisets and Sequences 解題者:葉貫中 解題日期: 2007 年 4 月 24 日 題意:在這個題目中,我們要定義.
公司加入市場的決定. 定義  平均成本 = 總成本 ÷ 生產數量 = 每一單位產量所耗的成本  平均固定成本 = 總固定成本 ÷ 生產數量  平均變動成本 = 總變動成本 ÷ 生產數量.
資訊教育 東海大學物理系施奇廷 92 學年度第一學期. 物理研究的新方法 傳統:理論與實驗 傳統:理論與實驗 現在:理論、實驗、計算 現在:理論、實驗、計算 計算 vs. 實驗:計算物理可視為在所有的條 件皆能完美調控之下的「數值實驗室」 計算 vs. 實驗:計算物理可視為在所有的條 件皆能完美調控之下的「數值實驗室」
政治大學公企中心必修課-- 社會科學研究方法(量化分析)--黃智聰
觀測量的權 權的觀念與計算.
公用品.  該物品的數量不會因一人的消費而受到 影響,它可以同時地被多人享用。 角色分配  兩位同學當我的助手,負責:  其餘各人是投資者,每人擁有 $100 , 可以投資在兩種資產上。  記錄  計算  協助同學討論.
Section 4.2 Probability Models 機率模式. 由實驗看機率 實驗前先列出所有可能的實驗結果。 – 擲銅板:正面或反面。 – 擲骰子: 1~6 點。 – 擲骰子兩顆: (1,1),(1,2),(1,3),… 等 36 種。 決定每一個可能的實驗結果發生機率。 – 實驗後所有的實驗結果整理得到。
JAVA 程式設計與資料結構 第二十章 Searching. Sequential Searching Sequential Searching 是最簡單的一種搜尋法,此演 算法可應用在 Array 或是 Linked List 此等資料結構。 Sequential Searching 的 worst-case.
資料結構實習-二.
演算法 8-1 最大數及最小數找法 8-2 排序 8-3 二元搜尋法.
Chapter 3 Entropy : An Additional Balance Equation
845: Gas Station Numbers ★★★ 題組: Problem Set Archive with Online Judge 題號: 845: Gas Station Numbers. 解題者:張維珊 解題日期: 2006 年 2 月 題意: 將輸入的數字,經過重新排列組合或旋轉數字,得到比原先的數字大,
介紹不同坐標系之間的轉換 以LS平差方式求解坐標轉換參數
Learning Method in Multilingual Speech Recognition Author : Hui Lin, Li Deng, Jasha Droppo Professor: 陳嘉平 Reporter: 許峰閤.
Chapter 10 m-way 搜尋樹與B-Tree
演算法課程 (Algorithms) 國立聯合大學 資訊管理學系 陳士杰老師 Course 7 貪婪法則 Greedy Approach.
1/17 A Study on Separation between Acoustic Models and Its Application Author : Yu Tsao, Jinyu Li, Chin-Hui Lee Professor : 陳嘉平 Reporter : 許峰閤.
Chapter 7 Sampling Distribution
資訊教育 吳桂光 東海大學物理系助理教授 Tel: 3467 Office: ST223 Office hour: Tue, Fri. (10-11am)
第十二章 變異數分析 12.1 單因子變異數分析 1-way ANOVA Subject : 比較三組以上的母體平均數 k 組資料,母體平均數為 μ 1, …, μ i, …, μ k Data : k 組資料,樣本數為 n 1,…, n k. x ij --- 第 i 組的第 j 個觀察值 N =
2005/7 Linear system-1 The Linear Equation System and Eliminations.
Cluster Analysis 目的 – 將資料分成幾個相異性最大的群組 基本問題 – 如何衡量事務之間的相似性 – 如何將相似的資料歸入同一群組 – 如何解釋群組的特性.
冷凍空調自動控制 - 系統性能分析 李達生. Focusing here … 概論 自動控制理論發展 自控系統設計實例 Laplace Transform 冷凍空調自動控制 控制系統範例 控制元件作動原理 控制系統除錯 自動控制理論 系統穩定度分析 系統性能分析 PID Controller 自動控制實務.
行銷研究 單元七 態度的衡量. 態度 (attitude) 的涵義  態度的衡量 認知 :如,毒品有害健康 情感 :如,我不喜歡吸毒的人 行為 :如,我不吸毒.
: Problem E Antimatter Ray Clearcutting ★★★★☆ 題組: Problem Set Archive with Online Judge 題號: 11008: Problem E Antimatter Ray Clearcutting 解題者:林王智瑞.
東海大學物理系‧計算科學總論 Some Simple Analysis of Statistical Properties of Biological Sequences 計算科學總論 東海大學數學系/物理系/環科系 施奇廷.
連續隨機變數 連續變數:時間、分數、重量、……
: Searching for Nessy ★☆☆☆☆ 題組: Problem Set Archive with Online Judge 題號: 11044: Searching for Nessy 解題者:王嘉偉 解題日期: 2007 年 5 月 22 日 題意: 給定 case 數量.
: Finding Paths in Grid ★★★★☆ 題組: Contest Archive with Online Judge 題號: 11486: Finding Paths in Grid 解題者:李重儀 解題日期: 2008 年 10 月 14 日 題意:給一個 7 個 column.
:Problem E.Stone Game ★★★☆☆ 題組: Problem Set Archive with Online Judge 題號: 10165: Problem E.Stone Game 解題者:李濟宇 解題日期: 2006 年 3 月 26 日 題意: Jack 與 Jim.
幼兒行為觀察與記錄 第八章 事件取樣法.
1 Chemical and Engineering Thermodynamics Chapter 1 Introduction Sandler.
: How many 0's? ★★★☆☆ 題組: Problem Set Archive with Online Judge 題號: 11038: How many 0’s? 解題者:楊鵬宇 解題日期: 2007 年 5 月 15 日 題意:寫下題目給的 m 與 n(m
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆 資料分析與表達.
1 柱體與錐體 1. 找出柱體與錐體的規則 2. 柱體的命名與特性 3. 柱體的展開圖 4. 錐體的命名與特性 5. 錐體的展開圖
Presentation transcript:

A Simple Model for Protein Structure 施奇廷(東海大學物理系)

The Models HP Model: p i is H or P and  =1 for contacts E HH =-2.3, E HP =-1, and E PP =0 (Li et al., Science 273, 666) For “additive” case: E HH =-2, E HP =-1, and E pipj =0: E pq =- (p i +p j ) where p i =1 (0) for H (P) residues HP Model (2 nd type):

尋找最低能量態 對於每一種氨基酸序列,將之放入所有可 能的構形中,計算其能量,找出能量最低 者為其基態。注意基態能量不可簡併,否 則為不穩定之構形,將被演化淘汰。例如 在 4x4 晶格中,一序列為: HHPHHPHPPPPHHPHH HHPHHPHPPPPHHPHH

HP Model (1st Type)

第二個模型可以視為 HP 模型之「平均場 近似」:將晶格點的位置分為兩類,一種 是表面的( S ),一種是核心的( C ),若 一疏水氨基酸出現在核心(不與水接觸), 則能量可降低一個單位。在此近似下,可 將一種形狀用一個 N 維向量()表示,以 0 表 S ,以 1 表 C ,氨基酸序列亦同( ): 以 0 表 P ,以 1 表 H 。 Second Model: A Mean-Field Approximation

HP Model (2nd Type)

可設計度( Designability ) 長度為 N 的序列,一共 有 2 N 種,每一個序列都 找出其對應的基態構形 (基態簡併者除外), 計算每種構形被選為基 態的次數,即為該構形 的可設計度。

Designability of a given structure: Number of peptide sequences choosing a particular geometric structure as its non- degenerate ground state.

Geometrical under- standing of the HP model (2 nd type)

LS Model: (C. Micheletti et al., PRL 80, 4987) σ i =L (0, large) or S(1, small); z(σ i )=1 (2) for L (S) residues inside the chain and z(σ i )=2 (3) for L (S) residues at the ends of the chain; z i (  ) is number of contacts at site I; A(x)=1 for x ≧ 0 and –a otherwise (a>0, a= ∞ in the Ref.).

In the N×N square lattices: Notations: n  z is the number of  (L or S) on the z-type sites, z=o (s,c) for corner (side, core) sites, n  =  z n  z for a >> 1 but finite, we get: for a= ∞, L is prohibited to be on the core sites→n L c =0

The most encodable compact structures for the LS model for 6×6 lattice. The shape of the one with highest score is identical to the case of HP model

Geometrical Properties of the 2D Square Lattices n 00 (n 10, n 11 ): number of peptide bonds connecting 00 (10, 11) residues. The 1-0 bonds partition the sequence into n segments of contiguous 1’s or 0’s. Constraints for N>4: 1.An isolated single 1 may only occur at an end of a path 2.An isolated single 0 may only either occur at or be one 1-segment away from an end of a path 3.Each of the four corners on the lattice belongs to a 0- segment with at least 4 sites, except when the corner is an end of a path

4.For a path (1…1), 2n 00 + n 10 = 8N-8 and 2 ≦ n 10 ≦ 4N-12 5.( …1): 2n 00 + n 10 = 8N-9, and 5 ≦ n 10 ≦ 4N-11 6.( … ): 2n 00 + n 10 = 8N-10; and 10 ≦ n 10 ≦ 4N-10 for N>6, and 8 ≦ n 10 ≦ 4N-10 for N ≦ 6 7.( …0) but not 6., 2n 00 + n 10 = 8N-10, and 4 ≦ n 10 ≦ 4N-12 8.(0…0) but not 6. and 7., 2n 00 + n 10 = 8N-10, 4 ≦ n 10 ≦ 4N-12 9.(0…1) but not 5., 2n 00 + n 10 = 8N-9, 1 ≦ n 10 ≦ 4N-13 Geometrical Properties of the 2D Square Lattices (conti.)

Example: Constraint 4: (1……1) type Left: maximum n 10 =12 and Right: minimum n 10 =2

Distribution of the Allowed Structures in the Hyperspace More possible binary sequences with larger n 10 are not allowed to be a structure s than those with smaller n 10 from the combinatorial point of view.

Minimal Hamming distance d H (s 1,s 2 ) between two path s 1,s 2 is approximately 4k (2k for triangular lattices) if  n 10 =4k or 4k-2: 1. (… … …)→( … …) 2. (… … …)→( … …)

On the average, the designability of s with larger n10 will be larger. And the results will also be true for other shape of 2D lattices.

Comparison with Protein Data Bank Metric representation of a sequence p with length l=2k: For a set of sequences collected by the models, calculate the frequency distribution of the subsequences with length 2k of the sequences. And plot it in a unit square. And then Calculate the correlation of the distribution function: where F i (l) (m) is the normalized frequency of the mth subsequence with length l in the set i.

Results and Discussion Average designabilities of the paths vs. n 10 for the (c) 4×7 and (d) 6×6 lattices, respectively.

The frequencies of all the subsequences with length 12 observed in (a)all proteins in PDB, (b) the alpha-helix parts of (a), (c)the sequences belong to the highly designable structures, (d)the sequences belong to the low designable structures of HP model.

The frequencies of all the subsequences with length 12 observed in (a)all proteins in PDB, (b) the sequences belong to highly designable structures of LS model. (c) normalized frequencies of (a), (d) normalized frequencies of (b).

Summary HP model 為研究蛋白質結構最簡單之模型,只 考慮親梳水作用 HP model 為研究蛋白質結構最簡單之模型,只 考慮親梳水作用 可設計度之研究,可以解釋許多不同的蛋白質, 折疊成類似形狀的現象 可設計度之研究,可以解釋許多不同的蛋白質, 折疊成類似形狀的現象 可設計度高的結構,擁有叫「縐摺」的表面 → 可以自然給出表面的  - 螺旋二級結構,與實驗 結果吻合 可設計度高的結構,擁有叫「縐摺」的表面 → 可以自然給出表面的  - 螺旋二級結構,與實驗 結果吻合 LS model 在數學上與 HP model 是等價的,但 是物理意義卻不同 LS model 在數學上與 HP model 是等價的,但 是物理意義卻不同 藉由與實際蛋白質序列與結構的比較,我們可 以判別各個不同的簡化模型之優劣 藉由與實際蛋白質序列與結構的比較,我們可 以判別各個不同的簡化模型之優劣