Quantitative Data Analysis Social Research Methods 2109 & 6507 Spring, 2006 March 6 2006.

Slides:



Advertisements
Similar presentations
03/19/2003 Week #4 江支弘 Chapter 4 Making Predictions: Regression Analysis.
Advertisements

McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆 資料分析與表達.
1 Chemical and Engineering Thermodynamics Chapter 2 Conservation of mass and energy Sandler.
布林代數的應用--- 全及項(最小項)和全或項(最大項)展開式
Section 1.2 Describing Distributions with Numbers 用數字描述分配.
第二章 太陽能電池的基本原理 及其結構 2-1 太陽能電池的基本原理 2-2 太陽能電池的基本結構 2-3 太陽能電池的製作.
Chapter Two Data Summary and Presentation. Statistics II2 敘述統計 Vs. 推論統計 n 敘述統計 : 使用分析方法或圖形來描述一組來自於母 體或樣本之資料 n 推論統計 : 利用抽樣方法取得一樣本, 並針對此樣本 計算樣本統計量, 以推論未之母體之參數.
1 Simple Regression ( 簡單迴歸分析 ) Social Research Methods 2109 & 6507 Spring, 2006 March 8, 9, 13, 2006.
©Ming-chi Chen 社會統計 Page.1 社會統計 第十講 相關與共變. ©Ming-chi Chen 社會統計 Page.2 Covariance, 共變量 當 X, Y 兩隨機變數不互為獨立時,表示 兩者間有關連。其關連的形式有很多種, 最常見的關連為線性的共變關係。 隨機變數 X,Y.
Section 2.3 Least-Squares Regression 最小平方迴歸
STAT0_sampling Random Sampling  母體: Finite population & Infinity population  由一大小為 N 的有限母體中抽出一樣本數為 n 的樣 本,若每一樣本被抽出的機率是一樣的,這樣本稱 為隨機樣本 (random sample)
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆 資料分析與表達.
第一章 信號與系統初論 信號的簡介與DSP的處理方式。 系統特性與穩定性的判定方法。 以MATLAB驗證系統的線性、非時變、因果等特性。
STAT0_corr1 二變數的相關性  變數之間的關係是統計研究上的一大目標  討論二分類變數的相關性,以列聯表來表示  討論二連續隨機變數時,可以作 x-y 散佈圖觀察它 們的關係強度  以相關係數來代表二者關係的強度.
Section 2.2 Correlation 相關係數. 散佈圖 1 散佈圖 2 散佈圖的盲點 兩座標軸的刻度不同,散佈圖的外觀呈 現的相聯性強度,會有不同的感受。 散佈圖 2 相聯性看起來比散佈圖 1 來得強。 以統計數字相關係數做為客觀標準。
Chapter 9 Hypothesis tests with the t statistic. 當母體  為未知時 ( 我們通常不知 ) ,用樣本 s 來取代 因為用 s 來估計  ,所呈現出來的分佈已不 是 z distribution ,而是 t distribution.
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆 資料分析與表達.
03/05/2003 Week #2 江支弘 Measuring Center or Average 量度中心或平均 Stemplot: Mean: 平均數 arithmetic average of observations Median: 中位數 middle value of... (in increasing.
1 Part IC. Descriptive Statistics Multivariate Statistics ( 多變量統計 ) Focus: Multiple Regression ( 多元迴歸、複迴歸 ) Spring 2007.
BEM 特論 - 第一次討論 指導教授 : 陳正宗 終身特聘教授 指導學長 : 高聖凱、謝祥志、林羿州 學生 : 吳建鋒 日期 :2015/6/16 Fundamental Solution Green’s Function Green’s Theorem.
基準特徵 基準面 基準座標系 基準點 基準線 基準軸 基準特徵顯示之控制. 基準特徵 基準面 基準座標系 基準點 基準線 基準軸 基準特徵顯示之控制.
Statistics: An Introduction Alan Monroe: Chapter 6.
Distributed Video Coding. Outline Distributed video coding Lossless compression Lossy compression Low complexity video encoding Distributed image coding.
緒論 統計的範圍 敘述統計 推論統計 有母數統計 無母數統計 實驗設計 統計的本質 大量 數字 客觀.
Analysis of Variance (ANOVA) CH 13 變異數分析. What is ANOVA? n 檢定 3 個或 3 個以上的母體平均數是否相等的統計檢定 n 檢定多個母體平均數是否相同 n 比較大二、大三、大四學生實習滿意度是否一樣 ? ( 來 自相同的 population)
第七章 連續機率分配.
觀測量的權 權的觀念與計算.
SOWK 6003 Social Work Research Week 10 Quantitative Data Analysis
變異數分析 迴歸分析 因素分析 區別分析 集區分析
Section 4.2 Probability Models 機率模式. 由實驗看機率 實驗前先列出所有可能的實驗結果。 – 擲銅板:正面或反面。 – 擲骰子: 1~6 點。 – 擲骰子兩顆: (1,1),(1,2),(1,3),… 等 36 種。 決定每一個可能的實驗結果發生機率。 – 實驗後所有的實驗結果整理得到。
1 第七章 植基於可調整式量化表及離散餘 弦轉換之浮水印技術. 2 Outlines 介紹 介紹 灰階浮水印藏入 灰階浮水印藏入 灰階浮水印取回 灰階浮水印取回 實驗結果 實驗結果.
C7_prob_2 1 Chap 7 機率論 隨機變數 (random variable) :一群數量的 代表,它們的值是由機會決定的,通常以 大寫英文字母表示 隨機變數分為離散型與連續型兩種。 機率分布 (probability distribution) : 描述 隨機變數值的機率變化 離散型變數的分布直接以.
描述統計 描述統計(Descriptive Statistics)-將蒐集到的資料加以整理和記錄,並以數字和統計圖表的方式來分析及解釋資料所具有的特性. 基本統計值(平均數,中位數,標準差,變異量….) 相關性測量(卡方,相關係數,迴歸…)
1 Part IB. Descriptive Statistics Multivariate Statistics ( 多變量統計 ) Focus: Multiple regression Spring 2007.
03/05/2003 Week #2 江支弘 Chapter Two Describing, Displaying, and Exploring Statistical Data.
Chapter 2 Frequency Distributions 次數分配
ArcINFO &Geodatabase 由 ESRI 產生 1970 ArcINFO 一開始被設計在迷你電 腦上, 後來逐漸發展, 在 UNIX 系統上也能 執行, 直到今天, 已經可以在不同的平台上 運作.
Cluster Analysis 目的 – 將資料分成幾個相異性最大的群組 基本問題 – 如何衡量事務之間的相似性 – 如何將相似的資料歸入同一群組 – 如何解釋群組的特性.
冷凍空調自動控制 - 系統性能分析 李達生. Focusing here … 概論 自動控制理論發展 自控系統設計實例 Laplace Transform 冷凍空調自動控制 控制系統範例 控制元件作動原理 控制系統除錯 自動控制理論 系統穩定度分析 系統性能分析 PID Controller 自動控制實務.
Ch 3 Central Tendency 中央集中趨勢測量.
連續隨機變數 連續變數:時間、分數、重量、……
Quantitative Data Analysis Definitions Examples of a data set Creating a data set Displaying and presenting data – frequency distributions Grouping and.
Inference for Simple Regression Social Research Methods 2109 & 6507 Spring 2006 March 15, 16, 2006.
Social Research Methods
單因子變異數分析 多重比較 雙因子變異數分析
Regression 相關 –Cross table –Bivariate –Contingency Cofficient –Rank Correlation 簡單迴歸 多元迴歸.
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆 資料分析與表達.
Summary of Quantitative Analysis Neuman and Robson Ch. 11
CHAPTER 14, QUANTITATIVE DATA ANALYSIS. Chapter Outline  Quantification of Data  Univariate Analysis  Subgroup Comparisons  Bivariate Analysis  Introduction.
Quantifying Data.
Chapter 1 Descriptive Analysis. Statistics – Making sense out of data. Gives verifiable evidence to support the answer to a question. 4 Major Parts 1.Collecting.
Statistics for Education Research Statistics for Education Research Lecture 1 Scales/Graph/Central Tendency Instructor: Dr. Tung-hsien He
A P STATISTICS LESSON 3 – 2 CORRELATION.
6.1 What is Statistics? Definition: Statistics – science of collecting, analyzing, and interpreting data in such a way that the conclusions can be objectively.
1.  DATA ANALYSIS  PROCESSING DATA  Editing Data  Process for coding 2.
The Practice of Social Research Chapter 14 – Quantitative Data Analysis.
1 1 Slide The Simple Linear Regression Model n Simple Linear Regression Model y =  0 +  1 x +  n Simple Linear Regression Equation E( y ) =  0 + 
Regression and Least Squares The need for a mathematical construct… Insert fig 3.8.
I. Introduction to Data and Statistics A. Basic terms and concepts Data set - variable - observation - data value.
Notes Chapter 7 Bivariate Data. Relationships between two (or more) variables. The response variable measures an outcome of a study. The explanatory variable.
取樣 3.1 量化 3.2 向量量化 第1頁第1頁 3.1 取樣  數位影像:  數位影像:在空間座標和亮度都離散化的影像  取樣:  取樣:取不同空間位置的函數 ( 灰階 ) 值當樣本  量化:  量化:用一組整數值來表示這些樣本.
Chapter15 Basic Data Analysis: Descriptive Statistics.
Correlation.
Chapter 1 & 3.
Distributions and Graphical Representations
Unit 1 - Graphs and Distributions
Basics of Statistics.
Social Research Methods
Chapter 14 Quantitative Data Analysis
Presentation transcript:

Quantitative Data Analysis Social Research Methods 2109 & 6507 Spring, 2006 March

Quantitative Analysis: convert data to a numerical form and statistical analyses quantification ( 量化 ): the process of converting data to a numerical format ( 將資料轉換成數字形式 )

Quantification of Data Develop codes and a codebook Coding data ( 資料編碼 ) Data entry ( 資料輸入 ) Data file construction ( 資料檔的建立 ) Statistical Analyses

Quantitative Data Analyses Univariate analyses ( 單變量分析 ): a single variable –Distributions, central tendency, dispersion, subgroup comparisons Bivariate analyses ( 雙變量分析 ): the analysis of two variables Multivariate analyses ( 多變量分析 ): analyzing more than two variables simultaneously

Univariate Analysis Distributions ( 分配 ) –Frequency distribution (can use a graph) Central tendency (the form of an average) ( 集中趨勢 ) –The arithmetic mean ( 算數平均數 ) –The mode (the most frequently occurring attribute) ( 眾數 ) –The median (the middle attribute in the ranked distribution of observed attributes) ( 中位數 )

Univariate Analysis Dispersion ( 離差 ): the way values are distributed around some central value (ex: an average) –The simplest measure: the range –Standard deviation: an index of the amount of variability

Examples of Dispersion

Please note: some calculations are not suitable to all variables Continuous variables (quantitative variables) ( 連續變數 ): a variable whose attributes form a steady progression –Ex: age Discrete variables (qualitative variables) ( 間斷變 數 ): a variable whose attributes are separate from one another, or discontinuous –Ex: gender –Nominal or ordinal variables

Bivariate Analysis Explanatory bivariate analyses: consider causal relationships ( 考慮 兩個變數的因果關係 ) Explanatory or Independent Variables vs. Response or Dependent Variables

Measures of association The basic idea: proportionate reduction of error (PRE) ( 消減錯誤的比例 ) If you know the relationship between the two variables, you will make fewer errors in guessing values of one variable if you know values of the other. Today: focus on correlation ( 相關係數 )

A Scatterplot ( 散佈圖 ): display the relationship between two quantitative variables measured on the same individuals ( 能顯示二量化變數的關係 )

Looking at a scatterplot Look for direction, form, and strength of the relationship Direction ( 方向 ): –Positive association ( 正相關 ) –Negative association ( 負相關 )

Looking at a scatterplot Form ( 形式 ): what shape or pattern? – 直線 ? 曲線 ? 集中 ? 分散 ? Strength: the points in the scatterplot lie to a simple form (a line or a curve?) ( 圖中各 點多接近一直線或曲線 ?)

Outlier ( 極端值 ): an individual obs. falling outside the overall pattern of the graph

The correlation coefficient (r) Correlation (r): a measure of the strength and direction of the linear relationship between two quantitative variables ( 二量化 變數直線關係的強度及方向 ) r can take on values from -1 to 1

Facts about correlation: A positive value of r: a positive association A negative value of r: a negative association r closer to 1 or -1: stronger association r = 0 : no association r : measures the strength of linear association r (y, x) = r (x, y) r: sensitive to outliers

Examples of correlations

More about correlations How big is a correlation? No hard and fast rule In general: abs(r) > strong association But in social sciences, r is usually not strong in terms of its value (< 0.7)

Formula of the correlation coefficient

To get r in SPSS: 分析 (A) → 相關 (C) → 雙變量

Conclusions about correlation: Scatterplots: the first step when considering the association between two quantitative variables r: summarize the strength of linear association Distinct (but related) to the slope of the regression line