Physical Mapping Problem

Slides:



Advertisements
Similar presentations
1 生物計算期末作業 暨南大學資訊工程系 2003/05/13. 2 compare f1 f2  只比較兩個檔案 f1 與 f2 ,比完後將結果輸出。 compare directory  以兩兩比對的方式,比對一個目錄下所有檔案的相 似程度。  將相似度很高的檔案做成報表輸出,報表中至少要.
Advertisements

光的反射、折射 n1n1 n2n2 法線 反射定律 折射定律. 光的折射方向與介質疏密 n1n1 n2n2 法線 n1n1 n2n2 n1n1 n2n2 相同介質 密介質到疏介質 疏介質到密介質.
基因工程學 產物 : 重組蛋白質 蛋白質 DNA( 基因 ) mRNA 胰島素缺乏糖尿病 如胰島素, 干擾素等 (93 億美元, 北美,1997)
Economics, 6th, Parkin, 2004, Chapter 1: 什麼是經濟學? [ 第 1 頁 ] 經濟學的定義 經濟學的定義 ~ 1-1 ~ 經濟學 (economics) 經濟學 ( economics) 是探討個人、企業、政府或整個社 會在稀少性 (scarcity) 時所面臨的.
布林代數的應用--- 全及項(最小項)和全或項(最大項)展開式
EBI European Bioinformatics Institute. EBI The European Bioinformatics Institute (EBI) part of EMBL is a centre for research and services in bioinformatics.
第七章 抽樣與抽樣分配 蒐集統計資料最常見的方式是抽查。這 牽涉到兩個問題: 抽出的樣本是否具有代表性?是否能反應出母體的特徵?
: A-Sequence 星級 : ★★☆☆☆ 題組: Online-judge.uva.es PROBLEM SET Volume CIX 題號: Problem D : A-Sequence 解題者:薛祖淵 解題日期: 2006 年 2 月 21 日 題意:一開始先輸入一個.
Teacher : Ing-Jer Huang TA : Chien-Hung Chen 2015/6/2 Course Embedded Systems : Principles and Implementations Weekly Preview Question CH6.1~CH /12/05.
Section 1.2 Describing Distributions with Numbers 用數字描述分配.
Reference, primitive, call by XXX 必也正名乎 誌謝 : 部份文字取於前輩 TAHO 的文章.
What is static?. Static? 靜態 ? class Test { static int staticX; int instanceX; public Test(int var1, int var2) { this.staticX = var1; this.instanceX =
自由進入及離開. 定義  長期 ─ 是指生產者能夠改變所有生產因素的情況。  自由進入及離開 ─ 是指公司能夠自由進入及離開市場而不受限 制。
Lecture 8 Median and Order Statistics. Median and Order Statistics2 Order Statistics 問題敘述 在 n 個元素中,找出其中第 i 小的元素。 i = 1 ,即為找最小值。 i = n ,即為找最大值。 i = 或 ,即為找中位數。
: ShellSort ★★☆☆☆ 題組: Problem D 題號: 10152: ShellSort 解題者:林一帆 解題日期: 2006 年 4 月 10 日 題意:烏龜王國的烏龜總是一隻一隻疊在一起。唯一改變烏龜位置 的方法為:一隻烏龜爬出他原來的位置,然後往上爬到最上方。給 你一堆烏龜原來排列的順序,以及我們想要的烏龜的排列順序,你.
: Problem E - Beverages ★★★☆☆ 題組: Contest Archive with Online Judge 題號: 11060: Problem E - Beverages 解題者:李重儀 解題日期: 2008 年 3 月 4 日 題意: Dilbert 大學剛畢業,他決定要和朋友出去。他有奇怪的嗜好,
1.1 電腦的特性 電腦能夠快速處理資料:電腦可在一秒內處理數百萬個 基本運算,這是人腦所不能做到的。原本人腦一天的工 作量,交給電腦可能僅需幾分鐘的時間就處理完畢。 電腦能夠快速處理資料:電腦可在一秒內處理數百萬個 基本運算,這是人腦所不能做到的。原本人腦一天的工 作量,交給電腦可能僅需幾分鐘的時間就處理完畢。
MATLAB 程式設計 第 11 章 多維陣列 多維陣列的定義 在 MATLAB 的資料型態中,向量可視為 一維陣列,矩陣可視二維陣列,對於維 度 (Dimensions) 超過 1 的陣列則均可視 為「多維陣列」 (Multidimesional Arrays , 簡稱 N-D Arrays)
Part 1 Understanding Data Chapter 1 Examining Distributions Chapter 2 Examining Relationships Chapter 3 Producing Data.
Department of Air-conditioning and Refrigeration Engineering/ National Taipei University of Technology 模糊控制設計使用 MATLAB 李達生.
Role of specific hemagglutinin amino acids in the immunogenicity and protection of H5N1 influenza virus vaccines Hoffmann E et al(2005)PNAS vol
1 蛋白質簡介 暨南大學資訊工程系 2003/05/06. 2 蛋白質是由 20 種胺基酸所組成.
具備人臉追蹤與辨識功能的一個 智慧型數位監視系統 系統架構 在巡邏模式中 ,攝影機會左右來回巡視,並 利用動態膚色偵測得知是否有移動膚色物體, 若有移動的膚色物體則進入到追蹤模式,反之 則繼續巡視。
The construction of cells DNA or RNA (dNTP or NTP) Protein (amino acid) Carbohydrates ( 單醣 雙醣 多醣 ) Lipid etc. ( 生物膜 )
Introduction to Java Programming Lecture 5: Using Java Classes : String & Math Spring 2009.
© The McGraw-Hill Companies, Inc., 2008 第 6 章 製造流程的選擇與設計.
第 1 章 PC 的基本構造. 本章提要 PC 系統簡介 80x86 系列 CPU 及其暫存器群 記憶體: Memory 80x86 的分節式記憶體管理 80x86 的 I/O 結構 學習組合語言的基本工具.
Chapter 13 塑模靜態觀點:物件圖 Static View : Object Diagram.
Introduction to Java Programming Lecture 17 Abstract Classes & Interfaces.
: The largest Clique ★★★★☆ 題組: Contest Archive with Online Judge 題號: 11324: The largest Clique 解題者:李重儀 解題日期: 2008 年 11 月 24 日 題意: 簡單來說,給你一個 directed.
微生物應用工業 緒論 ( 續 ) 阮雪芬 Sep 23, 2002 NTUT
Distributed Video Coding. Outline Distributed video coding Lossless compression Lossy compression Low complexity video encoding Distributed image coding.
: Multisets and Sequences ★★★★☆ 題組: Problem Set Archive with Online Judge 題號: 11023: Multisets and Sequences 解題者:葉貫中 解題日期: 2007 年 4 月 24 日 題意:在這個題目中,我們要定義.
公司加入市場的決定. 定義  平均成本 = 總成本 ÷ 生產數量 = 每一單位產量所耗的成本  平均固定成本 = 總固定成本 ÷ 生產數量  平均變動成本 = 總變動成本 ÷ 生產數量.
生產系統導論 生產系統簡介 績效衡量 現代工廠之特徵 管理機能.
從此處輸入帳號密碼登入到管理頁面. 點選進到檔案管理 點選「上傳檔案」上傳資料 點選瀏覽選擇電腦裡的檔案 可選擇公開或不公開 為平台上的資料夾 此處為檔案分類,可顯示在展示頁面上,若要參加 MY EG 競賽,做品一律上傳到 “ 98 MY EG Contest ” 點選此處確定上傳檔案.
資料結構實習-一 參數傳遞.
The construction of cells
系統安全期末報告 第 6 組 資訊隱藏技術鄔正男林岑威巴柏仁. 大綱  一. 簡介  二. 相關技術  三. 資訊影藏工具使用  四. 相關破解方法  五. 與數位浮水印之差別  六. 未來發展  七. 結論  八. 參考資料.
Lecture 7 Sorting in Linear Time. Sorting in Linear Time2 7.1 Lower bounds for sorting 本節探討排序所耗用的時間複雜度下限。 任何一個以比較為基礎排序的演算法,排序 n 個元 素時至少耗用 Ω(nlogn) 次比較。
: Efficient Solutions ★★★☆☆ 題組: Problem Set Archive with Online Judge 題號: 11020: Efficient Solutions 解題者:陳宜佐 解題日期: 2007 年 4 月 24 日 題意:給定 M 個 case.
基因微陣列分類系統 組 員 : 陳昭瑋 李進旗 何榮倫 陳勇達 指導教授 : 張玉盈 教授. Outline  目的  系統簡介  演算法說明  DEMO 2.
公用品.  該物品的數量不會因一人的消費而受到 影響,它可以同時地被多人享用。 角色分配  兩位同學當我的助手,負責:  其餘各人是投資者,每人擁有 $100 , 可以投資在兩種資產上。  記錄  計算  協助同學討論.
Teacher : Ing-Jer Huang TA : Chien-Hung Chen 2015/6/25 Course Embedded Systems : Principles and Implementations Weekly Preview Question CH 2.4~CH 2.6 &
: Automatic correction of misspellings ★★★☆☆ 題組: Problem Set Archive with Online Judge 題號: 11048: Automatic correction of misspellings 解題者:陳宜佐 解題日期:
Chapter 6 線性規劃 緒言 如何在有限的經濟資源下進行最有效的調配與 選用,以求發揮資源的最高效能。此問題愈來 愈受到重視,也就是以最低的代價,獲取最大 的效益。 茲列舉如下: – 決定緊急設備與人員的地點,使反應時間最短化。 – 決定飛機、飛行員、地勤人員的飛航最佳日程安排。
逆向選擇和市場失調. 定義  資料不對稱 在交易其中,其中一方較對方有多些資料。  逆向選擇 出現在這個情況下,就是當買賣雙方隨意在 市場上交易,與比較主動交易者作交易為佳 。
845: Gas Station Numbers ★★★ 題組: Problem Set Archive with Online Judge 題號: 845: Gas Station Numbers. 解題者:張維珊 解題日期: 2006 年 2 月 題意: 將輸入的數字,經過重新排列組合或旋轉數字,得到比原先的數字大,
Chapter 10 m-way 搜尋樹與B-Tree
生物技術 基因工程 阮雪芬 Sep24&25, 2002 NTUT
簡介基因體 註解工具.
描述統計 描述統計(Descriptive Statistics)-將蒐集到的資料加以整理和記錄,並以數字和統計圖表的方式來分析及解釋資料所具有的特性. 基本統計值(平均數,中位數,標準差,變異量….) 相關性測量(卡方,相關係數,迴歸…)
E XPLOITING R ANDOM F OREST TO P REDICT S ULFATED T YROSINE 宋孟純 洪敏華 洪瑜珊.
概念性產品企劃書 呂學儒 李政翰.
05 DNA Chip 學生:李漢軒 指導老師:侯劭毅.
Chapter 7 Sampling Distribution
Reporter gene. Figure DNA chip 簡介 DNA chip 的操作原 理是利用 DNA 序列的配 對特性, 讓樣品與晶片上 對應的鹼基 (base) 進行 雜合反應 (hybridization), 藉以檢測樣品中的基因 表現, 晶片上每平方公分.
專題成果報告 胺基酸功能預測開發環境 指導教授:歐昱言 邱彥豪 邱顯鈞.
Teacher : Ing-Jer Huang TA : Chien-Hung Chen 2015/6/30 Course Embedded Systems : Principles and Implementations Weekly Preview Question CH7.1~CH /12/26.
1 Recombinant DNA 暨南大學資訊工程系 2003/04/29. 2 大綱 Cut — 限制酶 Paste —DNA 接合酶 Copy —PCR Search —Southern Blotting Reading —Sanger Method.
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 參 資料蒐集的方法.
: SAM I AM ★★★★☆ 題組: Contest Archive with Online Judge 題號: 11419: SAM I AM 解題者:李重儀 解題日期: 2008 年 9 月 11 日 題意: 簡單的說,就是一個長方形的廟裡面有敵人,然 後可以橫的方向開砲或縱向開砲,每次開砲可以.
: Finding Paths in Grid ★★★★☆ 題組: Contest Archive with Online Judge 題號: 11486: Finding Paths in Grid 解題者:李重儀 解題日期: 2008 年 10 月 14 日 題意:給一個 7 個 column.
第12章 團體溝通情境中的領導者.
著作權所有 © 旗標出版股份有限公司 第 14 章 製作信封、標籤. 本章提要 製作單一信封 製作單一郵寄標籤.
1 Chemical and Engineering Thermodynamics Chapter 1 Introduction Sandler.
第 1 章 PC 的基本構造. 本章提要 PC 系統簡介 80x86 系列 CPU 及其暫存器群 記憶體: Memory 80x86 的分節式記憶體管理 80x86 的 I/O 結構 學習組合語言的基本工具.
啤酒遊戲- 供應鍊模擬 Dr. CK Farn 2006 Spring. 中央大學。范錚強 2 模擬設定 過度簡化的供應鍊 銷售桶裝啤酒 角色 工廠(倉庫) 配銷商 大盤商 零售商.
Introduction to DNA Computing Introducer: 黃宏偉 Adviser: 楊昌彪 教授.
Instruction Encoding Synthesis for Architecture Exploration using Hierarchical Processor Modes Achim Nohl, Volker Greive, Rainer Leupers, Oliver Schliebusch,
Presentation transcript:

Physical Mapping Problem

Problem Definition Physical mapping 的定義

A B C D E F G H J K L M N O P Q H J DNA Fragment of DNA

Why We Need Physical Mapping 可以利用這個地圖將 DNA 做完全排序 可以知道基因到底如何對人類產生作用 利用人造蛋白質... 等等來改進遺傳體質

AGACTAGTCGTAACGATCGCTAATTTAAGGCTACT..... 人類染色體 ( 約 bp) Physical map ( 約 bp) DNA Sequencing ( 約 bp)

Why We Need Physical Mapping 可以利用這個地圖將 DNA 做完全排序 可以知道基因到底如何對人類產生作用 利用人造蛋白質... 等等來改進遺傳體質 可以得知基因 ( 或標記 ) 的大約位置 對於一些遺傳疾病可以得到較多的資訊 可以幫助偵測是否具有遺傳疾病

A B C D E F G H J K L M N O P Q H J DNA Fragment of DNA α

target DNA 加入酵素

Partial Digest Problem by single enzyme A restriction sites: a1< a2< a3<.....< ap multiset of fragment lengths {aj- ai,i<j}

target DNA

Double Digest Problem (DDP) Clones first completely digested by enzyme A,then by B, finally A and B together restriction sites: by A: a 1 < a 2 < a 3 <.....< a p by B: b 1 < b 2 < b 3 <.....< b q by A+B : c 1 < c 2 < c 3 <.....< c p+q Reconstruct the restriction sites from these multisets

Example : DDP Enzyme A Enzyme B Enzyme A+B

Solution

Double Digest Problem (DDP)

target DNA

By Probe Approach

ATGCGCTAACTGGACTTCAAGCCTAAACTGCATCAGACTT TACGCGATTGACCTGAAGT Complementary probe target DNA The Spirit of Hybridization

target DNA A B C D E F GHGH I J

12345 A B C D E F G H I J

12345 A111 B1 C111 D11 E11 F11 G11 H111 I111 J1

JDFIEGACHBJDFIEGACHB

12345 B1 H11 C111 A111 G11 E11 I111 F111 D11 J1

A、CA、C C、D、EC、D、E E、FE、F A、F、GA、F、G G、H、IG、H、I E、F、I、J、KE、F、I、J、K A、B、CA、B、C C、D、EC、D、E E、FE、F F、GF、G G、H、IG、H、I I、J、KI、J、K False Negative

A、CA、C C、D、EC、D、E E、FE、F A、F、GA、F、G G、H、IG、H、I E、F、I、J、KE、F、I、J、K A、B、CA、B、C C、D、EC、D、E E、FE、F F、GF、G G、H、IG、H、I I、J、KI、J、K False Positive

A、CA、C C、D、EC、D、E E、FE、F A、F、GA、F、G G、H、IG、H、I E、F、I、J、KE、F、I、J、K A、B、CA、B、C C、D、EC、D、E E、FE、F F、GF、G G、H、IG、H、I I、J、KI、J、K Chimeric Clones

A、B、CA、B、C C、D、EC、D、E E、FE、F F、GF、G I、J、KI、J、K G、H、IG、H、I Clones Probes A B C D E F G H I J K

A、B、CA、B、C C、D、EC、D、E E、F、KE、F、K I、J、K、F、GI、J、K、F、G I、J、KI、J、K G、H、IG、H、I Clones Probes A B C D E F G H I J K

How To Use Traveling Salesman Problem to Solve Physical Mapping Problem

How to Convert to TSP? Hamming distance

ABCDEFGHIJ A0 B20 C020 D3330 E23320 F G H I J A111 B1 C111 D11 E11 F11 G11 H111 I111 J1

How to Convert to TSP? Hamming distance Cycle weight = number of gaps transitions +2n

ABCDEFGHIJ A0 B20 C020 D3330 E23320 F G H I J A111 B1 C111 D11 E11 F11 G11 H111 I111 J1

How to Convert to TSP? Hamming distance Cycle weight = number of gaps transitions +2n So, minimize the cycle weight is to the gap number

Our approach We also convert it to optimization problem Using more complicated model Using Genetic Algorithm to solve it. F(A) = X*C(A)+Y*P(A)+Z*N(A)+T*M(A)+ P*L(A).

(a) (b) The results of our approach tested on simulated data. The false negative rate is set as 0.1. The false positive rate is The false negative rate is set as 0.1. The false positive rate is 0.01.

Experimental Results of our GA tested on Real data from chromosome 1 (a) It shows the results of our GA run with the data which is a contig with about 95 clones and about 120 probes (b) It shows the results of our GA run with the data which is a contig with about 172 clones and about 136 probes