指導老師：李宗夷專題製作： 961472 陳少川 961531 林世偉 Acetyllysine 與 Methyllysine 之分類.

Slides:

Advertisements

Similar presentations

1 生物計算期末作業暨南大學資訊工程系 2003/05/13. 2 compare f1 f2  只比較兩個檔案 f1 與 f2 ，比完後將結果輸出。 compare directory  以兩兩比對的方式，比對一個目錄下所有檔案的相似程度。  將相似度很高的檔案做成報表輸出，報表中至少要.

Advertisements

McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆資料分析與表達.

: Arrange the Numbers ★★★☆☆ 題組： Contest Archive with Online Judge 題號： 11481: Arrange the Numbers 解題者：李重儀解題日期： 2008 年 9 月 13 日題意：將數列 {1,2,3, …,N}

布林代數的應用--- 全及項(最小項)和全或項(最大項)展開式

第七章抽樣與抽樣分配蒐集統計資料最常見的方式是抽查。這牽涉到兩個問題：抽出的樣本是否具有代表性?是否能反應出母體的特徵?

Event Sampling 事件取樣法. 關心重點為「事件」本身明確的焦點行為清楚掌握主題 - 當「事件」出現時才開始記錄記錄程序等待目標事件的發生開始記錄事件結束，停止記錄.

如何將數字變成可用之資訊現代化資料處理與應用概念. 如何將數字變成可用之資訊人最容易接受的訊息是圖像化資訊。在一堆數字中，要進行比較分析，一般會使用表格形式計算與分析。所以一般我們會將數字依關聯性，轉換成表格計算與分析。此表格一般稱試算表或稱表格。再將結果轉換為圖表，進行比較與分析。

目的「升學調查系統」，幫助某一學校調查並記錄其歷屆畢業生報考研究所的情況、未來提供給學弟妹作參考，以及學校推廣之相關工作。功能需求紀錄並追蹤歷屆畢業生升學的狀態協助畢業生做升學輔導未來提供學弟妹作查詢、參考計算上榜率、前十大學校上榜率.

序列分析工具:MDDLogo 謝勝任林宗慶指導教授:李宗夷教授.

指導教授：陳淑媛學生：李宗叡李卿輔.  利用下列三種方法 (Edge Detection 、 Local Binary Pattern 、 Structured Local Edge Pattern) 來判斷是否為場景變換，以方便使用者來找出所要的片段。

McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 參實驗法.

五小專案黃詩晴章乃云. 目錄計算機智慧盤拼圖記憶大挑戰數學題庫心得參考文獻.

亂數產生器安全性評估之統計測試 SEC HW7 姓名：翁玉芬學號：

Stat_chi21 類別資料 (Categorical data) 一種質性資料, 其觀察值可歸類於數個不相交的項目內，例 : 性別, 滿意度, …, 一般以各項的統計次數表現. 分析此種資料，通常用卡方檢定類別資料分析卡方檢定卡方檢定基本理論一個含有 k 項的試驗，設 p i.

指導教授：李宗夷學生姓名：簡婉竹、陳昱宏、胡堞

: OPENING DOORS ? 題組： Problem Set Archive with Online Judge 題號： 10606: OPENING DOORS 解題者：侯沛彣解題日期： 2006 年 6 月 11 日題意： - 某間學校有 N 個學生，每個學生都有自己的衣物櫃.

STAT0_sampling Random Sampling  母體： Finite population & Infinity population  由一大小為 N 的有限母體中抽出一樣本數為 n 的樣本，若每一樣本被抽出的機率是一樣的，這樣本稱為隨機樣本 (random sample)

1. 假設以下的敘述為一未提供 “ 捷徑計算 ” 能力的程式段，試用程式設計的技巧，使此敘述經此改寫的動作後，具有與 “ 捷徑計算 ” 之處理方法相同之處理模式。 if and then E1 else E2 endif.

高效率太陽能車指導教授 : 蔡志成, 王國禎組員 : 張友倫 ( ) 溫承豫 ( ) 溫承豫 ( ) 李志健 ( ) 李志健 ( ) 第十三週 (2005/5/18)

Monte Carlo Simulation Part.2 Metropolis Algorithm Dept. Phys. Tunghai Univ. Numerical Methods C. T. Shih.

Role of specific hemagglutinin amino acids in the immunogenicity and protection of H5N1 influenza virus vaccines Hoffmann E et al(2005)PNAS vol

1 蛋白質簡介暨南大學資訊工程系 2003/05/06. 2 蛋白質是由 20 種胺基酸所組成.

具備人臉追蹤與辨識功能的一個智慧型數位監視系統系統架構在巡邏模式中，攝影機會左右來回巡視，並利用動態膚色偵測得知是否有移動膚色物體，若有移動的膚色物體則進入到追蹤模式，反之則繼續巡視。

實驗十一有機酸在水與有機溶劑間之分佈.

Chapter 13 塑模靜態觀點：物件圖 Static View : Object Diagram.

Introduction to Java Programming Lecture 17 Abstract Classes & Interfaces.

:Problem D: Bit-wise Sequence ★★★☆☆ 題組： Problem Set Archive with Online Judge 題號： 10232: Problem D: Bit-wise Sequence 解題者：李濟宇解題日期： 2006 年 4 月 16.

24-6 設定開始與結束場景中的程式最後我們要替這個遊戲收個尾, 幫它把開始的等待畫面跟結束畫面處理一下。

最新計算機概論第 5 章系統程式. 5-1 系統程式的類型作業系統 (OS) ：介於電腦硬體與應用軟體之間的程式，除了提供執行應用軟體的環境，還負責分配系統資源。

3-3 使用幾何繪圖工具 Flash 的幾何繪圖工具包括線段工具 (Line Tool) 、橢圓形工具 (Oval Tool) 、多邊星形工具 (Rectangle Tool) 3 種。這些工具畫出來的幾何圖形包括了筆畫線條和填色區域, 將它們適當地組合加上有技巧地變形與配色, 不但比鉛筆工具簡單,

Matlab Assignment Due Assignment 兩個 matlab 程式 : Eigenface ： Eigenvector 和 eigenvalue 的應用. Fractal ： Affine transform( rotation, translation,

: Happy Number ★ ? 題組： Problem Set Archive with Online Judge 題號： 10591: Happy Number 解題者：陳瀅文解題日期： 2006 年 6 月 6 日題意：判斷一個正整數 N 是否為 Happy Number.

: Fast and Easy Data Compressor ★★☆☆☆ 題組： Problem Set Archive with Online Judge 題號： 10043: Fast and Easy Data Compressor 解題者：葉貫中解題日期： 2007 年 3.

: Ahoy, Pirates! ★★★★☆ 題組： Contest Archive with Online Judge 題號： 11402: Ahoy, Pirates! 解題者：李重儀解題日期： 2008 年 8 月 26 日題意：有一個海盜島有 N 個海盜，他們的編號 (id)

Fugacity Coefficient and Fugacity

: Multisets and Sequences ★★★★☆ 題組： Problem Set Archive with Online Judge 題號： 11023: Multisets and Sequences 解題者：葉貫中解題日期： 2007 年 4 月 24 日題意：在這個題目中，我們要定義.

生產系統導論生產系統簡介績效衡量現代工廠之特徵管理機能.

:Nuts for nuts..Nuts for nuts.. ★★★★☆ 題組： Problem Set Archive with Online Judge 題號： 10944:Nuts for nuts.. 解題者：楊家豪解題日期： 2006 年 2 月題意：給定兩個正整數 x,y.

The application of boundary element evaluation on a silencer in the presence of a linear temperature gradient Boundary Element Method 期末報告指導老師：陳正宗終身特聘教授.

資料結構實習-一參數傳遞.

6-2 認識元件庫與內建元件庫 Flash 的元件庫分兩種, 一種是每個動畫專屬的元件庫 (Library) ；另一種則是內建元件庫 (Common Libraries), 兩者皆可透過『視窗』功能表來開啟, 以下即為您說明。

研究資料的分析. 資料分析的基本策略  General data analysis strategies 1.Sketching ideas 2.Taking notes 3.Summarize field nores 4.Getting feedback on ideas 5.Working with.

Section 4.2 Probability Models 機率模式. 由實驗看機率實驗前先列出所有可能的實驗結果。 – 擲銅板：正面或反面。 – 擲骰子： 1~6 點。 – 擲骰子兩顆： (1,1),(1,2),(1,3),… 等 36 種。決定每一個可能的實驗結果發生機率。 – 實驗後所有的實驗結果整理得到。

Analyzing Case Study Evidence

演算法 8-1 最大數及最小數找法 8-2 排序 8-3 二元搜尋法.

資訊理論授課老師 : 陳建源研究室 : 法 401 網站

845: Gas Station Numbers ★★★ 題組： Problem Set Archive with Online Judge 題號： 845: Gas Station Numbers. 解題者：張維珊解題日期： 2006 年 2 月題意：將輸入的數字，經過重新排列組合或旋轉數字，得到比原先的數字大，

Structural Equation Modeling Chapter 6 CFA 根據每個因素有多重指標，以減少測量誤差並可建立問卷的構念效度驗證性因素分析.

廣電新聞播報品質電腦化評估系統之研發國立政治大學資訊科學系指導教授：廖文宏學生：蘇以暄.

Chapter 10 m-way 搜尋樹與B-Tree

演算法課程 (Algorithms) 國立聯合大學資訊管理學系陳士杰老師 Course 7 貪婪法則 Greedy Approach.

E XPLOITING R ANDOM F OREST TO P REDICT S ULFATED T YROSINE 宋孟純洪敏華洪瑜珊.

概念性產品企劃書呂學儒李政翰.

Probability Distribution 機率分配汪群超 12/12. 目的：產生具均等分配的數值 (Data) ，並以『直方圖』的功能計算出數值在不同範圍內出現的頻率，及繪製數值的分配圖，以反應出該機率分配的特性。

1/17 A Study on Separation between Acoustic Models and Its Application Author : Yu Tsao, Jinyu Li, Chin-Hui Lee Professor : 陳嘉平 Reporter : 許峰閤.

1 Introduction to Java Programming Lecture 2: Basics of Java Programming Spring 2009.

專題成果報告胺基酸功能預測開發環境指導教授:歐昱言邱彥豪邱顯鈞.

SQL 進階查詢.

Teacher : Ing-Jer Huang TA : Chien-Hung Chen 2015/6/30 Course Embedded Systems : Principles and Implementations Weekly Preview Question CH7.1~CH /12/26.

McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 壹企業研究導論.

:Commandos ★★★☆☆ 題組： Contest Archive with Online Judge 題號： 11463: Commandos 解題者：李重儀解題日期： 2008 年 8 月 11 日題意：題目會給你一個敵營區內總共的建築物數，以及建築物之間可以互通的路有哪些，並給你起點的建築物和終點.

-Artificial Neural Network- Matlab操作介紹 -以類神經網路BPN Model為例

NVivo 7在文件分析應用.

資料結構實習-六.

: Finding Paths in Grid ★★★★☆ 題組： Contest Archive with Online Judge 題號： 11486: Finding Paths in Grid 解題者：李重儀解題日期： 2008 年 10 月 14 日題意：給一個 7 個 column.

:Problem E.Stone Game ★★★☆☆ 題組： Problem Set Archive with Online Judge 題號： 10165: Problem E.Stone Game 解題者：李濟宇解題日期： 2006 年 3 月 26 日題意： Jack 與 Jim.

幼兒行為觀察與記錄第八章事件取樣法.

CH 14-可靠度工程之數學基礎探討重點失效時間之機率分配指數模式之可靠度工程.

: How many 0's? ★★★☆☆ 題組： Problem Set Archive with Online Judge 題號： 11038: How many 0’s? 解題者：楊鵬宇解題日期： 2007 年 5 月 15 日題意：寫下題目給的 m 與 n(m

McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆資料分析與表達.

Presentation transcript:

指導老師：李宗夷專題製作：陳少川林世偉 Acetyllysine 與 Methyllysine 之分類

Outline Background Motivation Goal Materials and Methods Expected results

專題研究背景 N-acetylation orchestrates a variety of cellular processes, including transcription regulation, DNA repair, apoptosis, cytokine signaling, and nuclear import. N- 甲基離胺酸 (N-methyllysine) 被發現於肌凝蛋白 (myosin) 中，為一種與肌肉收縮有關之蛋白質。

研究動機 Acetyllysine & Methyllysine 皆為蛋白質後轉譯修飾裡其中兩個重要的機制，若能預測出發生此兩機制的基因片段，對生物界以及醫學界都有很大的幫助。

研究目的在未處理的蛋白質序列中，預測出發生 Acetyllysine 或 Methyllysine 的基因片段。

實驗材料來源 Database ： UniProt 蛋白質序列：會發生 Acetyllysine 有 2003 條會發生 Methyllysine 有 158 條

實驗方法先將會發生 Acetyllysine 和 Methyllysine 反應的蛋白質胺基酸序列一比例取出當作 independent( 測試樣本 ) ，剩下的用來做 trainning model 。將給定發生分別會發生的 Acetyllysine 和 Methyllysine 的 positive 的基因片段，用來對蛋白質序列刪選出 positive 和 negative 基因片段。皆以 K 胺基酸為中心分別分段來分析，切成一定長度 19/25 的 windows sizes 。把重複的片段刪除。

實驗方法將基因片段作編碼 (feature) Trainning model 使用 5-foldcross validation 後，再使用分類工具分類。將 independent 加入 Trainning model 裡，使用 5- foldcross validation ，再用分類工具分類。評測結果

System Flow

評測方法 Negative Positive TN TPFNFP Predic t

實作流程

STEP1 Acetyllysine_protein 和 Methyllysine_protein 中有重複的蛋白質序列, 將重複的序列捨去 Acetyllysine_protein 部分並留下 Methyllysine_protein 的部分。 #Acetyllysine_protein 和 Methyllysin_proteine 重複的有 46 條。

STEP2 將 STEP1 處理後的 Acetyllysine_protein 和 Methyllysine_protein 分別依比例以 1:5 取出，分成兩部份 independent 和 training 。 # 為了 independent 和 training model 都能取到

比例 1:5

STEP3 把給定的 Acetyllysine_pos 和 Methyllysine_pos 中有完全相同的取出另存 # 會同時發生 Acetyllysine 和 Methyllysine 的 K ，在作分類的時候不易處理。

STEP4 利用 step3 處理過的 Acetyllysine_pos 和 Methyllysine_pos ，將 independent 和 trainning model 的這兩類的蛋白質序列切 windows size 。並分成 positive 和 negative

取出 Positive & Negitive 將給定會發生 Acetyllysine/ Methyllysine 反應的 K 位置，將會發生反應的蛋白質序列片段篩選出 Positive & Negative ，並把 Negative 部分取出另存。

Windows sizes 將處理後的基因片段，皆以 K 胺基酸為中心分別分段來分析，切成每段 windows sizes 長度為 25 的胺基酸片段。格式 : ID_ 位置 _ 基因片段 (fragment) 基因片段 : 以 K 胺基酸為中心，左右各 12 個胺基酸

STEP5 切好後 WINDOWS SIZE 的 independent_Acetyllysine_SEQ 和 independent_Methyllysine_SEQ 刪除重複片段。 Trainning Model 亦將兩類作同樣處理。

STEP6 上步處理重複後的 independent_Acetyllysine_SEQ 和 independent_Methyllysine_SEQ 轉編碼合併成 independent 部分。上步處理重複後的 train_Acetyllysine_SEQ 和 train_Methyllysine_SEQ 轉編碼合併成 trainning Model 部分。

編碼 1- 0 / 1 將 20 種胺基酸以 0 和 1 為組成，組成 20 個不同的編碼。格式 : 屬性 (pos/neg)_ 編碼 1_1: 0 _2:1_~~499:1_500:0 #windos sizes 長度為 25 所以有 25*20=500 個編碼數屬性 :pos/neg pos 為 1 neg 為 2

編碼 2-BLOSUM62 格式 : 屬性 _ 編碼屬性 :pos/neg (pos 為 1 neg 為 2) 編碼 : 給定的編碼對照表長度 25*20

編碼 - 範例範例 CST 1:9_2:-1_3:-1_4:-3_......_19:-2_20:-2_21:- 1_22:4_ _39:-2_40:-3_41:-1_42:1_......_59:- 2_60:-3

CSTPAGNDEQHRKMILVFYW C S T P A G N D E Q H R K M I L V F Y W

STEP7 trainning Model 和 independent 用 5-fold Cross Validation 做 quickrbf 分類處理。

評測預測結果將 QuickRBF 分類器分類出來的預測結果和 positive 發生反應的胺基酸片段作資料作比對，將比對的結果作統計機率的分析，算出評測的效果表現。

實驗結果