指導老師:李宗夷 專題製作: 961472 陳少川 961531 林世偉 Acetyllysine 與 Methyllysine 之分類.

Slides:



Advertisements
Similar presentations
1 生物計算期末作業 暨南大學資訊工程系 2003/05/13. 2 compare f1 f2  只比較兩個檔案 f1 與 f2 ,比完後將結果輸出。 compare directory  以兩兩比對的方式,比對一個目錄下所有檔案的相 似程度。  將相似度很高的檔案做成報表輸出,報表中至少要.
Advertisements

McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆 資料分析與表達.
: Arrange the Numbers ★★★☆☆ 題組: Contest Archive with Online Judge 題號: 11481: Arrange the Numbers 解題者:李重儀 解題日期: 2008 年 9 月 13 日 題意: 將數列 {1,2,3, …,N}
布林代數的應用--- 全及項(最小項)和全或項(最大項)展開式
第七章 抽樣與抽樣分配 蒐集統計資料最常見的方式是抽查。這 牽涉到兩個問題: 抽出的樣本是否具有代表性?是否能反應出母體的特徵?
Event Sampling 事件取樣法. 關心重點為「事件」本身明確的焦點 行為 清楚掌握主題 - 當「事件」出現時才開 始記錄 記錄程序 等待目標事件的發生 開始記錄 事件結束,停止記錄.
如何將數字變成可用之資訊 現代化資料處理與應用概念. 如何將數字變成可用之資訊 人最容易接受的訊息是圖像化資訊。 在一堆數字中,要進行比較分析,一般會使用表格形 式計算與分析。 所以一般我們會將數字依關聯性, 轉換成表格計算與分析。 此表格一般稱試算表或稱表格。 再將結果轉換為圖表,進行比較與分析。
目的 「升學調查系統」,幫助某一學校調查並記錄 其歷屆畢業生報考研究所的情況、未來提供給 學弟妹作參考,以及學校推廣之相關工作。 功能需求 紀錄並追蹤歷屆畢業生升學的狀態 協助畢業生做升學輔導 未來提供學弟妹作查詢、參考 計算上榜率、前十大學校上榜率.
序列分析工具:MDDLogo 謝勝任 林宗慶 指導教授:李宗夷 教授.
指導教授:陳淑媛 學生:李宗叡 李卿輔.  利用下列三種方法 (Edge Detection 、 Local Binary Pattern 、 Structured Local Edge Pattern) 來判斷是否為場景變換,以方便使用者來 找出所要的片段。
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 參 實驗法.
五小專案 黃詩晴 章乃云. 目錄 計算機 智慧盤 拼圖 記憶大挑戰 數學題庫 心得 參考文獻.
亂數產生器安全性評估 之統計測試 SEC HW7 姓名:翁玉芬 學號:
Stat_chi21 類別資料 (Categorical data) 一種質性資料, 其觀察值可歸類於數個不相交的項目內, 例 : 性別, 滿意度, …, 一般以各項的統計次數表現. 分析此種資料,通常用卡方檢定 類別資料分析 卡方檢定 卡方檢定基本理論 一個含有 k 項的試驗,設 p i.
指導教授:李宗夷 學生姓名:簡婉竹、陳昱宏、胡堞
: OPENING DOORS ? 題組: Problem Set Archive with Online Judge 題號: 10606: OPENING DOORS 解題者:侯沛彣 解題日期: 2006 年 6 月 11 日 題意: - 某間學校有 N 個學生,每個學生都有自己的衣物櫃.
STAT0_sampling Random Sampling  母體: Finite population & Infinity population  由一大小為 N 的有限母體中抽出一樣本數為 n 的樣 本,若每一樣本被抽出的機率是一樣的,這樣本稱 為隨機樣本 (random sample)
1. 假設以下的敘述為一未提供 “ 捷徑計算 ” 能力的程式段,試用程 式設計的技巧,使此敘述經此改 寫的動作後,具有與 “ 捷徑計算 ” 之 處理方法相同之處理模式。 if and then E1 else E2 endif.
高效率太陽能車 指導教授 : 蔡志成, 王國禎 組員 : 張友倫 ( ) 溫承豫 ( ) 溫承豫 ( ) 李志健 ( ) 李志健 ( ) 第十三週 (2005/5/18)
Monte Carlo Simulation Part.2 Metropolis Algorithm Dept. Phys. Tunghai Univ. Numerical Methods C. T. Shih.
Role of specific hemagglutinin amino acids in the immunogenicity and protection of H5N1 influenza virus vaccines Hoffmann E et al(2005)PNAS vol
1 蛋白質簡介 暨南大學資訊工程系 2003/05/06. 2 蛋白質是由 20 種胺基酸所組成.
具備人臉追蹤與辨識功能的一個 智慧型數位監視系統 系統架構 在巡邏模式中 ,攝影機會左右來回巡視,並 利用動態膚色偵測得知是否有移動膚色物體, 若有移動的膚色物體則進入到追蹤模式,反之 則繼續巡視。
實驗十一 有機酸在水與有機溶劑間之分佈.
Chapter 13 塑模靜態觀點:物件圖 Static View : Object Diagram.
Introduction to Java Programming Lecture 17 Abstract Classes & Interfaces.
:Problem D: Bit-wise Sequence ★★★☆☆ 題組: Problem Set Archive with Online Judge 題號: 10232: Problem D: Bit-wise Sequence 解題者:李濟宇 解題日期: 2006 年 4 月 16.
24-6 設定開始與結束場景中的 程式 最後我們要替這個遊戲收個尾, 幫它把開始 的等待畫面跟結束畫面處理一下。
最新計算機概論 第 5 章 系統程式. 5-1 系統程式的類型 作業系統 (OS) : 介於電腦硬體與 應用軟體之間的 程式,除了提供 執行應用軟體的 環境,還負責分 配系統資源。
3-3 使用幾何繪圖工具 Flash 的幾何繪圖工具包括線段工具 (Line Tool) 、橢圓形工具 (Oval Tool) 、多邊星形 工具 (Rectangle Tool) 3 種。這些工具畫出 來的幾何圖形包括了筆畫線條和填色區域, 將它們適當地組合加上有技巧地變形與配 色, 不但比鉛筆工具簡單,
Matlab Assignment Due Assignment 兩個 matlab 程式 : Eigenface : Eigenvector 和 eigenvalue 的應用. Fractal : Affine transform( rotation, translation,
: Happy Number ★ ? 題組: Problem Set Archive with Online Judge 題號: 10591: Happy Number 解題者:陳瀅文 解題日期: 2006 年 6 月 6 日 題意:判斷一個正整數 N 是否為 Happy Number.
: Fast and Easy Data Compressor ★★☆☆☆ 題組: Problem Set Archive with Online Judge 題號: 10043: Fast and Easy Data Compressor 解題者:葉貫中 解題日期: 2007 年 3.
: Ahoy, Pirates! ★★★★☆ 題組: Contest Archive with Online Judge 題號: 11402: Ahoy, Pirates! 解題者:李重儀 解題日期: 2008 年 8 月 26 日 題意:有一個海盜島有 N 個海盜,他們的編號 (id)
Fugacity Coefficient and Fugacity
: Multisets and Sequences ★★★★☆ 題組: Problem Set Archive with Online Judge 題號: 11023: Multisets and Sequences 解題者:葉貫中 解題日期: 2007 年 4 月 24 日 題意:在這個題目中,我們要定義.
生產系統導論 生產系統簡介 績效衡量 現代工廠之特徵 管理機能.
:Nuts for nuts..Nuts for nuts.. ★★★★☆ 題組: Problem Set Archive with Online Judge 題號: 10944:Nuts for nuts.. 解題者:楊家豪 解題日期: 2006 年 2 月 題意: 給定兩個正整數 x,y.
The application of boundary element evaluation on a silencer in the presence of a linear temperature gradient Boundary Element Method 期末報告 指導老師:陳正宗終身特聘教授.
資料結構實習-一 參數傳遞.
6-2 認識元件庫與內建元件庫 Flash 的元件庫分兩種, 一種是每個動畫專 屬的元件庫 (Library) ;另一種則是內建元 件庫 (Common Libraries), 兩者皆可透過 『視窗』功能表來開啟, 以下即為您說明。
研究資料的分析. 資料分析的基本策略  General data analysis strategies 1.Sketching ideas 2.Taking notes 3.Summarize field nores 4.Getting feedback on ideas 5.Working with.
Section 4.2 Probability Models 機率模式. 由實驗看機率 實驗前先列出所有可能的實驗結果。 – 擲銅板:正面或反面。 – 擲骰子: 1~6 點。 – 擲骰子兩顆: (1,1),(1,2),(1,3),… 等 36 種。 決定每一個可能的實驗結果發生機率。 – 實驗後所有的實驗結果整理得到。
Analyzing Case Study Evidence
演算法 8-1 最大數及最小數找法 8-2 排序 8-3 二元搜尋法.
資訊理論 授課老師 : 陳建源 研究室 : 法 401 網站
845: Gas Station Numbers ★★★ 題組: Problem Set Archive with Online Judge 題號: 845: Gas Station Numbers. 解題者:張維珊 解題日期: 2006 年 2 月 題意: 將輸入的數字,經過重新排列組合或旋轉數字,得到比原先的數字大,
Structural Equation Modeling Chapter 6 CFA 根據每個因素有多重指標,以減少 測量誤差並可建立問卷的構念效度 驗證性因素分析.
廣電新聞播報品質電腦化 評估系統之研發 國立政治大學 資訊科學系 指導教授:廖文宏 學生:蘇以暄.
Chapter 10 m-way 搜尋樹與B-Tree
演算法課程 (Algorithms) 國立聯合大學 資訊管理學系 陳士杰老師 Course 7 貪婪法則 Greedy Approach.
E XPLOITING R ANDOM F OREST TO P REDICT S ULFATED T YROSINE 宋孟純 洪敏華 洪瑜珊.
概念性產品企劃書 呂學儒 李政翰.
Probability Distribution 機率分配 汪群超 12/12. 目的:產生具均等分配的數值 (Data) ,並以 『直方圖』的功能計算出數值在不同範圍內出現 的頻率,及繪製數值的分配圖,以反應出該 機率分配的特性。
1/17 A Study on Separation between Acoustic Models and Its Application Author : Yu Tsao, Jinyu Li, Chin-Hui Lee Professor : 陳嘉平 Reporter : 許峰閤.
1 Introduction to Java Programming Lecture 2: Basics of Java Programming Spring 2009.
專題成果報告 胺基酸功能預測開發環境 指導教授:歐昱言 邱彥豪 邱顯鈞.
SQL 進階查詢.
Teacher : Ing-Jer Huang TA : Chien-Hung Chen 2015/6/30 Course Embedded Systems : Principles and Implementations Weekly Preview Question CH7.1~CH /12/26.
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 壹 企業研究導論.
:Commandos ★★★☆☆ 題組: Contest Archive with Online Judge 題號: 11463: Commandos 解題者:李重儀 解題日期: 2008 年 8 月 11 日 題意: 題目會給你一個敵營區內總共的建築物數,以及建築物 之間可以互通的路有哪些,並給你起點的建築物和終點.
-Artificial Neural Network- Matlab操作介紹 -以類神經網路BPN Model為例
NVivo 7在文件分析應用.
資料結構實習-六.
: Finding Paths in Grid ★★★★☆ 題組: Contest Archive with Online Judge 題號: 11486: Finding Paths in Grid 解題者:李重儀 解題日期: 2008 年 10 月 14 日 題意:給一個 7 個 column.
:Problem E.Stone Game ★★★☆☆ 題組: Problem Set Archive with Online Judge 題號: 10165: Problem E.Stone Game 解題者:李濟宇 解題日期: 2006 年 3 月 26 日 題意: Jack 與 Jim.
幼兒行為觀察與記錄 第八章 事件取樣法.
CH 14-可靠度工程之數學基礎 探討重點 失效時間之機率分配 指數模式之可靠度工程.
: How many 0's? ★★★☆☆ 題組: Problem Set Archive with Online Judge 題號: 11038: How many 0’s? 解題者:楊鵬宇 解題日期: 2007 年 5 月 15 日 題意:寫下題目給的 m 與 n(m
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆 資料分析與表達.
Presentation transcript:

指導老師:李宗夷 專題製作: 陳少川 林世偉 Acetyllysine 與 Methyllysine 之分類

Outline Background Motivation Goal Materials and Methods Expected results

專題研究背景 N-acetylation orchestrates a variety of cellular processes, including transcription regulation, DNA repair, apoptosis, cytokine signaling, and nuclear import. N- 甲基離胺酸 (N-methyllysine) 被發現於肌 凝蛋白 (myosin) 中,為一種與肌肉收縮有關 之蛋白質。

研究動機 Acetyllysine & Methyllysine 皆為蛋白質後轉譯修飾裡 其中兩個重要的機制,若能預測出發生此兩機制的基 因片段,對生物界以及醫學界都有很大的幫助。

研究目的 在未處理的蛋白質序列中,預測出發生 Acetyllysine 或 Methyllysine 的基因片段。

實驗材料 來源 Database : UniProt 蛋白質序列: 會發生 Acetyllysine 有 2003 條 會發生 Methyllysine 有 158 條

實驗方法 先將會發生 Acetyllysine 和 Methyllysine 反應的蛋白質 胺基酸序列一比例取出當作 independent( 測試樣本 ) , 剩下的用來做 trainning model 。 將給定發生分別會發生的 Acetyllysine 和 Methyllysine 的 positive 的基因片段,用來對蛋白質序列刪選出 positive 和 negative 基因片段。 皆以 K 胺基酸為中心分別分段來分析,切成一定長度 19/25 的 windows sizes 。 把重複的片段刪除。

實驗方法 將基因片段作編碼 (feature) Trainning model 使用 5-foldcross validation 後,再使 用分類工具分類。 將 independent 加入 Trainning model 裡,使用 5- foldcross validation ,再用分類工具分類。 評測結果

System Flow

評測方法 Negative Positive TN TPFNFP Predic t

實作流程

STEP1 Acetyllysine_protein 和 Methyllysine_protein 中有重 複的蛋白質序列, 將重複的序列捨去 Acetyllysine_protein 部分並留下 Methyllysine_protein 的部分。 #Acetyllysine_protein 和 Methyllysin_proteine 重複的有 46 條 。

STEP2 將 STEP1 處理後的 Acetyllysine_protein 和 Methyllysine_protein 分別依比例以 1:5 取出,分成兩 部份 independent 和 training 。 # 為了 independent 和 training model 都能取到

比例 1:5

STEP3 把給定的 Acetyllysine_pos 和 Methyllysine_pos 中有完 全相同的取出另存 # 會同時發生 Acetyllysine 和 Methyllysine 的 K ,在作分類的時候不易處理。

STEP4 利用 step3 處理過的 Acetyllysine_pos 和 Methyllysine_pos ,將 independent 和 trainning model 的這兩類的蛋白質序列切 windows size 。並分 成 positive 和 negative

取出 Positive & Negitive 將給定會發生 Acetyllysine/ Methyllysine 反應的 K 位置, 將會發生反應的蛋白質序列片段篩選出 Positive & Negative ,並把 Negative 部分取出另存。

Windows sizes 將處理後的基因片段,皆以 K 胺基酸為中心分別分段 來分析,切成每段 windows sizes 長度為 25 的胺基酸片 段。 格式 : ID_ 位置 _ 基因片段 (fragment) 基因片段 : 以 K 胺基酸為中心,左右各 12 個胺基酸

STEP5 切好後 WINDOWS SIZE 的 independent_Acetyllysine_SEQ 和 independent_Methyllysine_SEQ 刪除重複片段。 Trainning Model 亦將兩類作同樣處理。

STEP6 上步處理重複後的 independent_Acetyllysine_SEQ 和 independent_Methyllysine_SEQ 轉編碼合併成 independent 部分。 上步處理重複後的 train_Acetyllysine_SEQ 和 train_Methyllysine_SEQ 轉編碼合併成 trainning Model 部分。

編碼 1- 0 / 1 將 20 種胺基酸以 0 和 1 為組成,組成 20 個不同的編碼。 格式 : 屬性 (pos/neg)_ 編碼 1_1: 0 _2:1_~~499:1_500:0 #windos sizes 長度為 25 所以有 25*20=500 個編碼數 屬性 :pos/neg pos 為 1 neg 為 2

編碼 2-BLOSUM62 格式 : 屬性 _ 編碼 屬性 :pos/neg (pos 為 1 neg 為 2) 編碼 : 給定的編碼對照表 長度 25*20

編碼 - 範例 範例 CST 1:9_2:-1_3:-1_4:-3_......_19:-2_20:-2_21:- 1_22:4_ _39:-2_40:-3_41:-1_42:1_......_59:- 2_60:-3

CSTPAGNDEQHRKMILVFYW C S T P A G N D E Q H R K M I L V F Y W

STEP7 trainning Model 和 independent 用 5-fold Cross Validation 做 quickrbf 分類處理。

評測預測結果 將 QuickRBF 分類器分類出來的預測結果和 positive 發 生反應的胺基酸片段作資料作比對,將比對的結果作 統計機率的分析,算出評測的效果表現。

實驗結果