Regresijos lygties parametrų vertinimas

Slides:



Advertisements
Similar presentations
Topic 12: Multiple Linear Regression
Advertisements

Linear Regression Using Excel 2010 Linear Regression Using Excel ® 2010 Managerial Accounting Prepared by Diane Tanner University of North Florida Chapter.
LINEAR REGRESSION: Evaluating Regression Models. Overview Assumptions for Linear Regression Evaluating a Regression Model.
LINEAR REGRESSION: Evaluating Regression Models. Overview Standard Error of the Estimate Goodness of Fit Coefficient of Determination Regression Coefficients.
Every achievement originates from the seed of determination. 1Random Effect.
Lesson #32 Simple Linear Regression. Regression is used to model and/or predict a variable; called the dependent variable, Y; based on one or more independent.
No Intercept Regression and Analysis of Variance.
Business Statistics: A First Course, 5e © 2009 Prentice-Hall, Inc. Chap 12-1 Correlation and Regression.
Business Statistics: A Decision-Making Approach, 6e © 2005 Prentice-Hall, Inc. Chap 13-1 Introduction to Regression Analysis Regression analysis is used.
Statistics for Business and Economics 8 th Edition Chapter 11 Simple Regression Copyright © 2013 Pearson Education, Inc. Publishing as Prentice Hall Ch.
Environmental Modeling Basic Testing Methods - Statistics III.
 Input parameters 1, 2, …, n  Values of each denoted X 1, X 2, X n  For each setting of X 1, X 2, X n observe a Y  Each set (X 1, X 2, X n,Y) is one.
Business Statistics, 4e, by Ken Black. © 2003 John Wiley & Sons Business Statistics, 4e by Ken Black Chapter 14 Multiple Regression Analysis.
Regression Modeling Applications in Land use and Transport.
Tutorial 5 Thursday February 14 MBP 1010 Kevin Brown.
Lecturer: Ing. Martina Hanová, PhD..  How do we evaluate a model?  How do we know if the model we are using is good?  assumptions relate to the (population)
Vaizdinė užduotis. Kuriose iš šių valstybių galima pamatyti tokius gyvenamuosius namus? Jemene Tanzanijoje Mongolijoje Indonezijoje A B C D 1.
Chapter 13 Simple Linear Regression
EXCEL: Multiple Regression
Chapter 14 Introduction to Multiple Regression
*Bring Money for Yearbook!
Regression Analysis AGEC 784.
Inference for Least Squares Lines
*Bring Money for Yearbook!
Chapter 12 Simple Linear Regression and Correlation
From t-test to multilevel analyses Del-2
CHAPTER 7 Linear Correlation & Regression Methods
Jihye Chun Kyungjin Lee Rick Jantz Yang Song
Statistical Analysis of the Randomized Block Design
Algoritmai ir duomenų struktūros (ADS)
Chapter 11 Simple Regression
Regression model with multiple predictors
Parengė prof. S.Puškorius Strateginio valdymo ir politikos fakultetas
Regresijos determinuotumas
Regression Statistics
Chapter 13 Simple Linear Regression
Simple Linear Regression
BIVARIATE REGRESSION AND CORRELATION
Programavimo ir IT pagrindai
SSGG (SWOT): Organizacijos stiprybės ir silpnybės, galimybės ir grėsmės (nustatymas, grupavimas, vertinimas, rezultatas) Pagrindinė literatūra: Lietuvos.
MAUDYKLŲ VANDENS KOKYBĖS STEBĖSENOS
Panelinių duomenų modeliai
REGRESSION/LS FORMULAS
TẠI SAO PHẢI NGHIÊN CỨU MÔ HÌNH HỒI QUY ĐA BIẾN?
Paprasti skaičiavimai. Uždavinių sprendimas
Duomenų struktūros ir algoritmai
ARMA/ARIMA modeliai Literatūra:
Regresijos determinuotumas
ARMA/ARIMA modeliai Literatūra:
Console Editeur : myProg.R 1
Statistics in WR: Lecture 12
Др Наташа Папић-Благојевић
Lygčių sistemos modeliai
Logistic Regression --> used to describe the relationship between
Assumptions of Variance Analysis
Funkcijos 9 paskaita.
Operacinė sistema Testas 9 klasė
Studijų pasirinkimas Lietuvoje ir užsienyje: ką svarbu žinoti?
3D skenavimo metodas, jo privalumai. Kam reikalingi avalynės įdėklai?
PENGOLAHAN DAN PENYAJIAN
Pseudo (fiktyvūs) kintamieji
Klaipėdos Simono Dacho progimnazija
Simple Linear Regression
Obtaining the Regression Line in R
Business Statistics, 4e by Ken Black
Example on the Concept of Regression . observation
Table 2. Regression statistics for independent and dependent variables
Regression Models - Introduction
Presentation transcript:

Regresijos lygties parametrų vertinimas 2014-02-19 D.Gujarati Part 1 “ Single-Eguation regression Models” 3 skyrelis “Two –variable Regression model:The Problem of Estimation” ir 4 skyrelis The Normality Assumption: CNLRM) VU EF V.Karpuškienė

Porinė tiesinė regresija: parametrų vertinimas Grafinė ir statistinė duomenų analizė Parametrų vertinimas mažiausių kvadratų metodu Porinė tiesinė regresija Dauginė tiesinė regresija Klasikinio regresinio modelio prielaidos Gauso-Markovo teorema Įverčių savybės Regresijos paklaida ir jos įvertis Maksimalaus tikėtinumo metodas VU EF V.Karpuškienė 2

Pvz. VU EF V.Karpuškienė

Grafinė studento-motinos ūgio priklausomybės analizė VU EF V.Karpuškienė

Regresijos parametrų vertinimo metodai Regresinis modelis – bendras atvejis Porinė tiesinė regresija Yi = β0 + β2Xi + εi = β0 + β1 Xi + εi Yi Sisteminė/dėsningoji dalis Atsitiktinė dalis VU EF V.Karpuškienė

Regresijos parametrų vertinimo metodai MKM – rasti tokius parametrų β1, β2 įverčius, kurie minimizuoja modelio paklaidas, t.y atsitiktinę modelio dalį. MTM – rasti tokius parametrų įverčius β1, β2, kurie maksimizuoja sisteminės dalies ir Yi atitikimo tikimybę VU EF V.Karpuškienė

Parametrų įverčių nustatymas mažiausių kvadratų metodu Yi=0+1Xi+i Yi = b0+ b1Xi +ei MKM Įrodymas auditorijoje VU EF V.Karpuškienė

Y . Y4 e4 { . e3 Y3 } . Y2 e2 { } e1 . Y1 x1 x2 x3 x4 x Y, e ir tiesinė regresijos lygtis VU EF V.Karpuškienė 8

Parametrų įverčių nustatymas mažiausių kvadratų metodu Formulių išvedimas paskaitos metu VU EF V.Karpuškienė

Parametrų įverčių nustatymas mažiausių kvadratų metodu Galimos b1 matematinės išraiškos Įrodymas auditorijoje VU EF V.Karpuškienė

Pvz. Matavimo vienetų įtaka koeficientams YSŪ ir XMŪ - cm YSŪ ir XMŪ - metrais YSŪ- cm , XMŪ - m YSŪ- m , XMŪ - cm VU EF V.Karpuškienė

Dauginės regresijos įverčių nustatymas mažiausių kvadratų metodu Yi=0 +1X1i + 2X2i +i Yi = b0+ b1Xi + b2X2i+ ei MKM VU EF V.Karpuškienė

MKM dviems kintamiesiems Yi = 0 + 1X1 + 2X2 + ei Pasižymime : VU EF V.Karpuškienė 13

MKM dviems kintamiesiems b1 = yi xi1xi2 yi xi2xi1xi2 2 xi1 xi2 xi1xi2 b2 = yi xi2xi1 yi xi1xi2xi1 2 xi1 xi2 xi1xi2 VU EF V.Karpuškienė 14

1-4 grupių studentų ūgiai 2014 Regression Statistics Multiple R 0,37 R Square 0,14 Adjusted R Square 0,11 Standard Error 7,73 Observations 76,00 ANOVA   df SS MS F Significance F Regression 2,00 699,04 349,52 5,85 0,00 Residual 73,00 4357,95 59,70 Total 75,00 5056,99 Coefficients t Stat P-value Lower 95% Upper 95% Lower 95,0% Upper 95,0% Intercept 57,60 35,26 1,63 -12,67 127,87 MŪ 0,60 0,19 3,19 0,22 0,98 TŪ 0,08 0,13 0,62 0,54 -0,17 0,33 VU EF V.Karpuškienė

MKM įverčių savybės Įverčiai yra atsitiktiniai dydžiai Įverčiai yra tiesiniai, nepaslinkti, efektyvūs ir suderinti VU EF V.Karpuškienė

Įverčiai atsitiktiniai dydžiai Įverčiai, kaip ir visi atsitiktiniai dydžiai, charakterizuojami vidurkiu ir dispersija VU EF V.Karpuškienė

Gauso-Markovo teorema Jeigu yra tenkinamos klasikinio regresinio modelio prielaidos, tai mažiausių kvadratų metodu apskaičiuoti regresijos įverčiai yra tiesiniai, nepaslinkti ir turi mažiausią dispersiją nepaslinktų tiesinių įverčių klasėje. VU EF V.Karpuškienė 18

Klasikinio regresinio modelio prielaidos Prielaida Prielaidos matematinė išraiška 1. Regresijos funkcija koeficientų ir paklaidų atžvilgiu yra tiesinė (tiesiškumas) yi =1 +2Xi2+...+nXim+i 2. Paklaidų vidurkis lygus nuliui (nulinis vidurkis) E(i) = 0 3. Paklaidos neautokoreliuoja (likučių ne autokoreliuotumas) Cov(i j) = 0, i,j / ij 4. Paklaidų dispersija yra pastovi (Homoskedastiškumas) 2(i) = const. 5. Nepriklausomi veiksniai nėra tiesinės kitų nepriklausomų veiksnių kombinacijos (ne multikolinearumas) Xi  θ0+θjXj, i,j / ij 6. Paklaidos pasiskirsčiusios pagal normalųjį pasiskirstymo dėsnį (normalumas). i ~ N (0, 2) VU EF V.Karpuškienė

Klasikinės regresijos prielaidos Prielaidos matematinė išraiška Prielaida Prielaidos matematinė išraiška 7. Regresijos nepriklausomi kintamieji nėra atsitiktiniai dydžiai Cov(XjI i) = 0, j 8. Stebėjimų skaičius turi būti didesnis negu vertinamų parametrų skaičius N>M 9. Nepriklausomų kintamųjų reikšmės turi būti įvairios, negali įgyti tik vieną reikšmę Xj≠const 10. Regresijos modelis yra teisingai sudarytas kintamųjų parinkimo ir parametrų vertinimo požiūriu VU EF V.Karpuškienė

Sąvokos Suderinti Tiesiniai įverčiai Gauti įverčiai yra apskaičiuoti pagal tiesinę Y atžvilgiu lygtį Nepaslinkti įverčiai Įverčių bj, apskaičiuotų skirtingų duomenų imčių pagrindu, vidurkis yra lygus tikrajai parametro reikšmei E(bj)= j Efektyvūs Efektyvus įvertis –tai įvertis turintis mažiausią dispersiją nepaslinktų įverčių klasėje, t.y., įvertis, esantis arčiausiai tikrosios parametro reikšmės Suderinti Suderintas - tai toks įvertis, kurio reikšmės artėja prie tikrosios parametro reikšmės, didėjant stebėjimų skaičiui VU EF V.Karpuškienė 21

Svarbios skaitinės savybės     VU EF V.Karpuškienė

MKM įverčių savybių įrodymas Tiesiškumas Suma lygi 0 Konstanta VU EF V.Karpuškienė

MKM įverčių savybių įrodymas Nepaslinktumas =0 =0 =1 VU EF V.Karpuškienė

Mažos imties įverčių pageidaujamos savybės Nepaslinktumas Tikimybių tankis 1bj 2bj βj Tikroji parametro reikšmė VU EF Vita Karpuškienė

3.15 Efektyvūs įverčiai Įverčių efektyvumas Efektyvus Tikimybių tankis Neefektyvūs βj

3.15 Suderinti įverčiai Suderinamumas N=10 Tikimybių tankis N=1000

Įverčiai tiesiniai nepaslinkti ir efektyvūs yi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi VU EF V.Karpuškienė

Įverčiai tiesiniai paslinkti yi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi VU EF V.Karpuškienė

Gauss –Markov teoremos įrodymas Efektyvumas Tarkim turime tiesinį nepaslinktą įvertį, kurio dispersija yra mažiausia Tiesinis Efektyvumas Min pasiekiamas tuo atveju, kai VU EF V.Karpuškienė

Porinės regresijos paklaida ir jos įvertis Modelio paklaidos įvertis yra atsitiktinis dydis, kuris apibūdinamas vidurkiu ir dispersija; Vidurkis E(e)=0 Dispersijos įvertis Standartinė modelio paklaida VU EF V.Karpuškienė 31

Dauginės regresijos paklaida ir jos įvertis Modelio paklaidos įvertis yra atsitiktinis dydis, kuris apibūdinamas vidurkiu ir dispersija; Vidurkis E(e)=0 Dispersijos įvertis Standartinė modelio paklaida VU EF V.Karpuškienė 32

Modelio paklaidos ei VU EF V.Karpuškienė

Modelio paklaidos ei VU EF V.Karpuškienė

Maksimalaus tikėtinumo metodas Idėja: Rasti tokius parametrų β0, β1 įverčius, kurie maksimizuoja sisteminės dalies ir Yi atitikimo tikimybę Neatsitiktiniai dydžiai Yi = β0 + β1Xi+ εi Atsitiktiniai dydžiai VU EF V.Karpuškienė

Y ~ N( ,s2) - exp f(y) = y Normalusis skirstinys (y - )2 2 s2 2 p s2 2.48 Normalusis skirstinys Y ~ N( ,s2) 2 s2 (y - )2 - 1 exp f(y) = 2 p s2 f(y) y VU EF V.Karpuškienė 

Maksimalaus tikėtinumo metodas Tarkim nagrinėjame porinę priklausomybę, kurios Yi – atsitiktinis dydis pasiskirstęs N(, σ2) Yi = β0 + β1Xi +εi i = E(Yi) = β0 + β1Xi MTM – esmė VU EF V.Karpuškienė

Maksimalaus tikėtinumo metodas Iš tikimybių teorijos žinom, jeigu Y – nepriklausomas atsitiktinis dydis, tai ... ... VU EF V.Karpuškienė

Maksimalaus tikėtinumo metodas = Įsistatom į tankio f-jos lygtį VU EF V.Karpuškienė

Maksimalaus tikėtinumo funkcija LF – maksimalaus tikėtinumo funkcija max LF= VU EF V.Karpuškienė

Maksimalaus tikėtinumo funkcija (Imties koeficientai) Ieškome LF maksimalios reikšmės duomenų imties koeficientams, skaičiuodami dalines išvestines, prilygintas 0 VU EF V.Karpuškienė

Maksimalaus tikėtinumo funkcija Dalinių išvestinių skaičiavimo rezultatai VU EF V.Karpuškienė

Maksimalaus tikėtinumo funkcija VU EF V.Karpuškienė

Maksimalaus tikėtinumo metodo įverčiai VU EF V.Karpuškienė

MKM ir MTM palyginimas MKM privalumai: MKM trūkumai Idėjos akivaizdumas Skaičiavimų paprastumas MKM trūkumai Kad įverčiai turėtų pageidaujamas savybes: tiesiškumą, nepaslinktumą, suderinamumą, turi būti tenkinamos klasikinio regresinio modelio prielaidos, kurias reikia tikrinti kiekviename modelyje) VU EF V.Karpuškienė

MKM ir MTM palyginimas MTM privalumai: MTM trūkumai Apskaičiuoja tiesinių ir netiesinių regresinių modelių parametrų įvarčius Esant didelėms stebėjimų imtims, apskaičiuoti įverčiai turi pageidaujamas savybes MTM trūkumai Būtina žinoti priklausomojo kintamojo tikimybių pasiskirstymą. Sudėtingi skaičiavimai MKM ir MTM tiesinės regresinės lygties parametrų įverčiai sutampa, kai Y turi normalųjį tikimybių skirstinį VU EF V.Karpuškienė