SPEAKER : TZU-CHUN LO ADVISOR : YAO-TING HAUNG RNA sequencing for differential expression genes.

Slides:



Advertisements
Similar presentations
資料蒐集的方法(三):實驗法(實驗設計) (第七章)
Advertisements

Chapter Four Parameter Estimation and Statistical Inference.
基因工程學 產物 : 重組蛋白質 蛋白質 DNA( 基因 ) mRNA 胰島素缺乏糖尿病 如胰島素, 干擾素等 (93 億美元, 北美,1997)
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆 資料分析與表達.
Chapter 10 馬可夫鏈 緒言 如果讀者仔細觀察日常生活中所發生的 諸多事件,必然會發現有些事件的未來 發展或演變與該事件現階段的狀況全然 無關,這種事件稱為獨立試行過程 (process of independent trials) ;而另一些 事件則會受到該事件現階段的狀況影響。
Stata教學 第六講 變異數分析ANOVA ©Ming-chi Chen 社會統計.
第七章 抽樣與抽樣分配 蒐集統計資料最常見的方式是抽查。這 牽涉到兩個問題: 抽出的樣本是否具有代表性?是否能反應出母體的特徵?
Section 1.2 Describing Distributions with Numbers 用數字描述分配.
第九章 運銷通路 授課老師 簡立賢. 授課大綱 運銷通路之涵意及其基本結構  何謂運銷通路  運銷通路的基本結構 影響農產品運銷通路選擇之因素  產品因素  市場因素  廠商因素  法規因素 運銷效率之判斷  通路中階段數目與運銷效率  通路競爭與運銷效率.
第二章 太陽能電池的基本原理 及其結構 2-1 太陽能電池的基本原理 2-2 太陽能電池的基本結構 2-3 太陽能電池的製作.
指導教授:陳淑媛 學生:李宗叡 李卿輔.  利用下列三種方法 (Edge Detection 、 Local Binary Pattern 、 Structured Local Edge Pattern) 來判斷是否為場景變換,以方便使用者來 找出所要的片段。
自由進入及離開. 定義  長期 ─ 是指生產者能夠改變所有生產因素的情況。  自由進入及離開 ─ 是指公司能夠自由進入及離開市場而不受限 制。
Stat_chi21 類別資料 (Categorical data) 一種質性資料, 其觀察值可歸類於數個不相交的項目內, 例 : 性別, 滿意度, …, 一般以各項的統計次數表現. 分析此種資料,通常用卡方檢定 類別資料分析 卡方檢定 卡方檢定基本理論 一個含有 k 項的試驗,設 p i.
研究法簡介 何明洲 中山醫學大學心理系. Single Factor – Two Levels Independent groups design: use random assignment –IV, manipulated –Between-subject Matched groups design:
Review of Chapter 3 - 已學過的 rules( 回顧 )- 朝陽科技大學 資訊管理系 李麗華 教授.
建立靜態資料成員 關鍵字: static 靜態資料成員不屬於特定物件,而是該類物件 所共同擁有的,可做為類別範圍裡的靜態變數。
貨幣創造與控制 CHAPTER 27 學習本章後,您將能: C H A P T E R C H E C K L I S T 解釋銀行如何藉由放款而創造貨幣 1 解釋中央銀行如何影響貨幣數量 2.
消費者物價指數反映生活成本。當消費者物價指數上升時,一般家庭需要花費更多的金錢才能維持相同的生活水準。經濟學家用物價膨脹(inflation)來描述一般物價持續上升的現象,而物價膨脹率(inflation rate)為物價水準的變動百分比。
STAT0_sampling Random Sampling  母體: Finite population & Infinity population  由一大小為 N 的有限母體中抽出一樣本數為 n 的樣 本,若每一樣本被抽出的機率是一樣的,這樣本稱 為隨機樣本 (random sample)
政治大學社科院通識課程 課程名稱 婚姻與戀愛的經濟分析 Economics of Love and Marriage 授課內容:情侶、夫妻的相處之道 日期: 2003 年 10 月 9 日.
11 基因工程學 產物 : 重組蛋白質 蛋白質 DNA( 基因 ) mRNA 胰島素缺乏糖尿病 如胰島素, 干擾素等 (93 億美元, 北美,1997)
基礎物理總論 基礎物理總論 熱力學與統計力學(三) Statistical Mechanics 東海大學物理系 施奇廷.
CH22 可靠性加速測試方法 目的 基本假設 加速試驗模式 Inverse Power Model
Young/Freeman University Physics 11e. Ch 18 Thermal Properties of Matter © 2005 Pearson Education.
2-group1 第十一章 二組平均數的比較 【應用】 暴露在一氧化碳和暴露在一般空氣下,發生狹心 症情況是否有差異? 新藥的治療是否比較有效? 健康孩童與罹病孩童血清鐵濃度是否不同? 兩種測量儀器的準確性是否有差異? 洗腎病人透析前後體重比較.
Department of Air-conditioning and Refrigeration Engineering/ National Taipei University of Technology 模糊控制設計使用 MATLAB 李達生.
Monte Carlo Simulation Part.2 Metropolis Algorithm Dept. Phys. Tunghai Univ. Numerical Methods C. T. Shih.
Role of specific hemagglutinin amino acids in the immunogenicity and protection of H5N1 influenza virus vaccines Hoffmann E et al(2005)PNAS vol
2009fallStat_samplec.i.1 Chap10 Sampling distribution (review) 樣本必須是隨機樣本 (random sample) ,才能代表母體 Sample mean 是一隨機變數,隨著每一次抽出來的 樣本值不同,它的值也不同,但會有規律性 為了要知道估計的精確性,必需要知道樣本平均數.
桁架分析.
民意調查的分析 II 蔡佳泓 政大選舉研究中心 副研究員. 課程大綱 假設的檢定 研究假設 H1: 研究假設 ( 例: X 與 Y 相關 ) H0: 虛無假設 ( 例: X 與 Y 無關 ) 檢定結果:接受虛無假設或拒斥虛無假 設,但不代表接受研究假設.
變異數分析 檢定 類型 One Way ANOVA Two way ANOVA Three way ANOVA ..five..
© The McGraw-Hill Companies, Inc., 2008 第 6 章 製造流程的選擇與設計.
1 第四章 多變數函數的微分學 § 4.1 偏導數定義 定義 極限值 ■. 2 定理 極限值的基本定理 (1) 極限值的唯一性 : 若 存在,則 其值必為唯一。 (2) 若 且 ( 與 為常數 ) , 則 且 為常數且.
BEM 特論 - 第一次討論 指導教授 : 陳正宗 終身特聘教授 指導學長 : 高聖凱、謝祥志、林羿州 學生 : 吳建鋒 日期 :2015/6/16 Fundamental Solution Green’s Function Green’s Theorem.
第三部分:研究設計 ( 二): 研究工具的信效度 與研究效度 (第九章之第 306 頁 -308 頁;第四章)
Matlab Assignment Due Assignment 兩個 matlab 程式 : Eigenface : Eigenvector 和 eigenvalue 的應用. Fractal : Affine transform( rotation, translation,
選舉制度、政府結構與政 黨體系 Cox (1997) Electoral institutions, cleavage strucuters, and the number of parties.
14 基因工程學 產物 : 重組蛋白質 蛋白質 DNA( 基因 ) mRNA 胰島素缺乏糖尿病 如胰島素, 干擾素等 (93 億美元, 北美,1997)
: Problem A : MiniMice ★★★★☆ 題組: Contest Archive with Online Judge 題號: 11411: Problem A : MiniMice 解題者:李重儀 解題日期: 2008 年 9 月 3 日 題意:簡單的說,題目中每一隻老鼠有一個編號.
微生物應用工業 緒論 ( 續 ) 阮雪芬 Sep 23, 2002 NTUT
短缺,盈餘與均衡. 遊戲規則  老師想出售一些學生喜歡的小食。  老師首先講出價錢,有興趣買的請舉手。
Analysis of Variance (ANOVA) CH 13 變異數分析. What is ANOVA? n 檢定 3 個或 3 個以上的母體平均數是否相等的統計檢定 n 檢定多個母體平均數是否相同 n 比較大二、大三、大四學生實習滿意度是否一樣 ? ( 來 自相同的 population)
The application of boundary element evaluation on a silencer in the presence of a linear temperature gradient Boundary Element Method 期末報告 指導老師:陳正宗終身特聘教授.
觀測量的權 權的觀念與計算.
宏觀經濟學之均衡點. 定義  非自願性失業 當工人預備以現有的名義工資水平去接受工作,但 未能找到工作時,這種稱為非自願性失業。  通貨膨脹 所有名義價格持續上升。
溶劑可以溶解反應物,形成均勻的反應系統; 溶劑用來調整反應物的濃度與反應溫度,控制速率與方向; 溶劑萃取,分離特定的化合物。 溶劑,特別是有機溶劑,是環境污染的主要來源。 綠色(永續)化學逐漸形成一種新的科學理念。溶劑的選擇 與化學反應的設計,必須加上環境因素的考量。 化學家已發展出許多有機溶劑替代液體及綠色的合成方法:
Density and control Reproduction curve 劉耀仁. Density :濃度、密度 ► 1 號區是 High-Density 區、 2 號是 Middle-density 區、 3 號區是 Low- Density 區。 ► 計算反射率( R )或透射率( T )
845: Gas Station Numbers ★★★ 題組: Problem Set Archive with Online Judge 題號: 845: Gas Station Numbers. 解題者:張維珊 解題日期: 2006 年 2 月 題意: 將輸入的數字,經過重新排列組合或旋轉數字,得到比原先的數字大,
萬獸之王 ─ 獅子 作著:楊紹芃 作著:楊紹芃. 關於獅子 學名 分類特徵 Panthera leo 哺乳綱 毛色變化大,從淡黃褐色、銀灰色、橘色一直到暗棕赭色都有 分布 非洲地區.
Probability Distribution 機率分配 汪群超 12/12. 目的:產生具均等分配的數值 (Data) ,並以 『直方圖』的功能計算出數值在不同範圍內出現 的頻率,及繪製數值的分配圖,以反應出該 機率分配的特性。
Chapter 7 Sampling Distribution
第十二章 變異數分析 12.1 單因子變異數分析 1-way ANOVA Subject : 比較三組以上的母體平均數 k 組資料,母體平均數為 μ 1, …, μ i, …, μ k Data : k 組資料,樣本數為 n 1,…, n k. x ij --- 第 i 組的第 j 個觀察值 N =
2005/7 Linear system-1 The Linear Equation System and Eliminations.
大腸桿菌 Escherichia coli 報告同學 : 工三 A 楊禾慈 工三 B 張容慈.
第三章 涉入理論.
連續隨機變數 連續變數:時間、分數、重量、……
1 Recombinant DNA 暨南大學資訊工程系 2003/04/29. 2 大綱 Cut — 限制酶 Paste —DNA 接合酶 Copy —PCR Search —Southern Blotting Reading —Sanger Method.
第五章IIR數位濾波器設計 濾波器的功能乃對於數位信號進行處理﹐ 以滿足系統的需求規格。其作法為設計一 個系統的轉移函數﹐或者差分方程式﹐使 其頻率響應落在規格的範圍內。本章探討 的是其中一種方法﹐稱為Infinite impulse register(IIR)。 IIR架構說明。 各種不同頻帶(Band)濾波器的設計方法。
PART 2 近觀市場 5 需求與供給彈性 CHAPTER. PART 2 近觀市場 5 需求與供給彈性 CHAPTER.
Set Theory Sets 許多數學上的討論中(例如: algebra 、 analysis 、 geometric 等等) 經常藉助集合論中的符號或術語來說 明。集合論是十九世紀後期由 Boole ( 布爾; 1815~1864) 及 Cantor ( 康托爾; 1845 ~ 1918) 所發展出來的。
Ch 11 建立研究工具的效度與信度.
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆 資料分析與表達.
平流層臭氧與氟氯碳化物 (CFC) 林小杏. 對流層 平流層 ( 氣溫 )( 臭氧濃度 ) ( 臭氧層 ) 紫外線 平流層中,一百萬個氣體分子大約只有 10 個是臭氧分子 。這些少量的氣體分子不斷的吸收對生物有害的紫外線 ,而且與其他氣體分子不斷的作用,透過氣體分子之間 的碰撞,臭氧分子再將所吸收的熱量傳給其他氣體分子.
Application of Support Vector Machine to detect an association between a disease or trait and multiple SNP variations Author: Gene Kim,MyungHo Kim Advisor:
第三單元 3.7 土壤 1 . 生物對地理環境作用的根本原 因是什麼? 2 .生物圈對其他三大圈層有何作 用? 3 .綠色植物對環境具有哪些保護 作用? 複習提問.
無添加刀切饅頭. 好處一︰消除疲勞 饅頭中富含維生素 B1 、維生素 B6 、維生素 B12 等 B 族維生素。 好處二︰能緩解壓力 饅頭中有比大米中多得多的硒、谷胱,它們具有抗脂質過氧化 的作用,增強人體免疫能力,從而可以緩解心理和生理上的壓 力。 好處三︰不容易長胖 饅頭的熱量是米飯的 70%
Physical Mapping Problem
Genes Code for Proteins
Large-scale Packet Classification on FPGA
Presentation transcript:

SPEAKER : TZU-CHUN LO ADVISOR : YAO-TING HAUNG RNA sequencing for differential expression genes

Outline Molecular Central Dogma RNA Sequencing Differential Expression Gene Case–Control Study Negative Binomial Distribution Hypothesis Testing Rice SNP, QTL, Pathway

Molecular Central Dogma The central dogma of molecular biology describes the flow of genetic information within a biological system. Forest Branches BBQ

DNA RNA Alignment RNA Sequencing Gene 1Gene 2 reads exons mRNA Finding differential expression genes via read counts each gene. Spliced alignment Alignment Read counts DEG process

Differential Expression Gene We want to find the cold-resistant genes in rice. Rice genome We should compare with two conditions.  Room temperature  Low temperature Gene 1 Gene 2 Gene 3 Gene 1 Gene 2 Gene 3 Gene 1 Gene 2 Gene Cole-resistant differential expression genes :

Strategy for DEG Case–control study  Two existing groups differing in outcome are identified and compared on the basis of some supposed causal attribute. Question  Is the number adequate to the gene?  How to define the gene is differential expression? conditioncasecontrol Gene Gene Gene  69 v.s 71Almost the same  86 v.s 56  66 v.s 111 Possible DEG More likely DEG ……… Gene  80 v.s 60How to judge? It is just one of sample in condition. ? Negative binomial distribution Hypothesis test

Negative Binomial Distribution NB is a count data distribution that can substitute Poisson distribution for better variance. i j Gene abundance parameterSmooth function 3 j=1~mi=1~n 69 Library size parameter Smooth function is more complex, so let us forget it. 

FPKM An indicator used to represent mRNA expression. Fragments Per Kilobase of transcript per Million mapper reads. Genome Gene 1 Gene 2 Exon length: bases 10 4 reads

FPKM Before hypothesis testing, we have to get FPKM and variance of FPKM. K-Readscasecontrol Gene Gene Gene ……… Var(K)casecontrol Gene 1106 Gene Gene ……… FPKMcasecontrol Gene Gene Gene ……… Var(FPKM)casecontrol Gene Gene Gene ………

Hypothesis Testing Step 1 : You find some observations or clues support a novel idea. Step 2 : Assume a against opinion that you want to fight it. Step 3 : Go to test it and take a stand. p-value

T-test

FPKMcasecontrol Gene Gene Gene ……… Var(FPKM)casecontrol Gene Gene Gene ……… T-testGene 1Gene 2Gene 3… p-value …

Result Investigating Discussing alpha=0.05 with read counts & p-value. If alpha=0.04 or 0.03 ? We don’t know which alpha is the best, but we can do some subsequent processing. If alpha=0.05casecontrolp-valueresult Gene X Gene V Gene V Gene V

RNA sequencing for Rice Plan  Cold-resistant genes Samples  Japonica (TN67): room temperature (R), low temperature (L)  Indica (IR64): room temperature (R), low temperature (L) Rice  粳稻 (TN67) : 米粒闊而短,黏性較大, Q 彈,如 : 蓬萊米。  秈稻 (IR64) : 米粒細而長,黏性較小,易碎,如 : 在來米。 Zone  TN67 : High-latitude, or high altitude  IR64 : Low-latitude, or low altitude

TN67R IR64R TN67L IR64L Strategy for DEG Case–control study  Four combinations  Different varieties or distinct temperatures  Four sets of differential expression genes  The DEGs above combination (A,B,C,D) Negative binomial  Inference probability situation by sample Hypothesis test  Which is the DEG that we want Subsequent processing  SNP, QTL, Pathway A B C D

SNP A single-nucleotide polymorphism is a sequence variation occurring when a single nucleotide differs between members of a biological species. Case Control Assembly ATGCCCTCGTAA TTACTGCGT ATGCGCTCGAAA TTACTCCGT ATGCCCTCGTAA TTACTGCGT SNP

QTL Quantitative traits refer to phenotypes (characteristics) that vary in degree and can be attributed to polygenic effects (product of two or more genes) Quantitative trait loci (QTLs) are stretches of DNA containing or linked to the genes that underlie a quantitative trait. Ex : QT(cold) Loci : 599~799 (base) DNA Cold tolerance (29) & pollen fertility (43) QTL length : ~million bases genes QTL

Pathway Pathway is a collection of manually drawn pathway maps representing molecular interaction and reaction networks. Gene No.2 Gene No.55 Gene No.99 Rice Cold-resistant

Conclusion Review  RNA Sequencing  Differential Expression Gene  Case–Control Study  Negative Binomial Distribution  Hypothesis Testing Rice  SNP  QTL  Pathway

Variance of negative binomial NB is a count data distribution that can substitute poisson distribution for better variance.

Strategy for DEG

QTL 生物的另一類性狀例如人類的身高、體重、高 血壓、糖尿病;水稻株高及產量對疾病的抵抗程度;老鼠 的體脂肪百分比;乳牛的乳產量;雞的產卵量,由 於其變異性是連續性的,不易分類,且易受環境影響,故 稱為數量性狀( quantitative trait )。數量性狀是由多 個基因所控制,由於每個基因對數量性狀均有影響,所以 每一基因的作用便相對地小。這些控制數量性狀的 基因稱為微效基因( polygenes )或又稱為數量性狀基因 座 (quantitative trait loci , QTL) 。 Rice genome size 430Mb

QTL

Negative binomial distribution NB is a count data distribution that can inference adequate number by sample. i j Smooth function

Negative binomial distribution NB is a count data distribution that can substitute Poisson distribution for better variance.

Hypothesis test Step 1 : You find some observations or clues support a novel idea.() Step 2 : Assume a against opinion that you want to fight it. Step 3 : Go to test it and take a stand. p-value

Case-control example Example Question  Is the number adequate to the gene?  Negative binomial  How to define the gene is differential expression?  Hypothesis test conditioncasecontrol Gene Gene Gene ………  69 v.s 71Almost the same  86 v.s 56  66 v.s 111 Possible DEG More likely DEG

Variance of negative binomial NB is a count data distribution that can substitute Poisson distribution for better variance.

DNA RNA Alignment RNA sequencing Gene 1Gene 2 reads exons mRNA DNA We should align with regions above blue. Spliced alignment

RNA sequencing Spliced alignment  TopHat  Condition 1 : caseCondition 2 : control Sample123…123… Gene …737168… Gene …315649… Gene … … ………………………

Readscasecontrol Gene Gene Gene ……… Variancecasecontrol Gene Gene Gene ………