Lineárny regresný model

Slides:



Advertisements
Similar presentations
Ma.
Advertisements

Faktorová analýza (FA). Viacrozmerné metódy U3U3 U 10 U7U7 U4U4 U8U8 U9U9 U6U6 U5U5 U 11 U1U1 U2U n URUR Metódy analýzy skrytých vzťahov premenné.
Predikcia DJIA pomocou neurónových sietí Martin Tkáč Miroslav Týnovský.
HOW TO EXPRESS YOURSELF. Why is it important to express your point of view? You show that you know exactly what you are talking about You show that you.
Click on each of us to hear our sounds.
GABRIEL GARCÍA MÁRQUEZ
Paneurópsky prieskum verejnej mienky o ochrane zdravia a bezpečnosti pri práci Výsledky z celej Európy a Slovenska - Máj 2013 Reprezentatívne výsledky.
Štatistika je vedecký nástroj pre poznávanie objektívnej reality. je náuka ako získať informácie z numerických dát. je veda... Mgr. Martin Vaváček, PhD.
. Čo je Minicool COMPACT Minicool compact je klimatizácia, ktorá pracuje pri vypnutom motore vozidla a je určená na nočnú prevádzku. Použitie Klimatizácia.
Publikácia o hĺbkovej analýze údajov, teda o data miningu Mgr. Ing. Adriana Horníková, PhD Inovace 2010, Praha
Slovak University of Technology in Bratislava Faculty of Civil Engineering Prof. Ing.Jan Szolgay, PhD. Vice-dean for Science, Research and Foreign Relations.
Príznaky Znižovanie dimenzie: viac príznakov => viac informácie, vyššia presnosť viac príznakov => zložitejšia extrakcia viac príznakov => zložitejší tréning.
Fuzzy ES - Fuzzy množiny_ stručný náhľad Približne dva alebo aj trochu viac /matematizácia neurčitosti/ Fuzzy logic is a very powerful technique that enables.
Discrete-time controllers structures and tuning Š. Kozák 2000, Department of Automatic Control Systems For Vienna University.
HORIZON RNDr. Eva Majkova, DrSc. SAV Štefánikova 49 SK Bratislava Mobil Kontakt.
1 Global Positioning System (GPS) Joe Montana IT Fall 2003 pp.0-17 preklad: R. Vislai, r.2010, Košice.
Atomic Force Microscopy
„METÓDY OHODNOCOVANIA PODNIKOV V ZNALECKEJ PRAXI SR A V TEÓRII
FUNCTIONAL FORMS OF REGRESSION MODELS
Analyzing dichotomous dummy variables
THE LINEAR REGRESSION MODEL: AN OVERVIEW
IX. VIACVÝBEROVÉ TESTY.
Jednorozmerný a dvojrozmerný chí-kvadrát test (krížové tabuľky)
NADOBUDNUTÉ SKÚSENOSTI Z PREDCHÁDZAJÚCICH VÝZIEV
Časová segmentácia videa a sumarizácia videa
Zariadenia na ochranu pred predpätím a výpadkom napätia.
Dátové štruktúry pre analýzu obrazu
Nobelova cena 2006 Andrew Z. Fire Craig C. Mello
3. Algoritmy a programovanie v jazyku Pascal Syntax
6. prednáška 27. október 2003.
Regresia a korelácia Iveta Waczulíková Peter Slezák
Lucia Pániková Ekonomický ústav SAV
Sme produkty, musíme sa predať
Podnikové komunikačné systémy Dušan Kováč
Prednáška 8 podprogramy typy podprogramov lokálne a globálne objekty
Navrhovanie experimentov – DOE (Design of Experiment) 1
ANALYSIS OF THE FACTORS AFFECTING STUDENTS’ ATTITUDE TO MATHEMATICS
Procedurálne programovanie: 2. prednáška
Prehľadávanie (searching) UI. I Markošová Mária
Základná charakteristika médií Stavba CD-R, CD-RW a DVD
Štatistické testovanie hypotéz. Porovnanie dvoch výberov
RELAČNÝ DÁTOVÝ MODEL princíp relačného dátového modelu bol prvýkrát navrhnutý E.F.Coddom Základné pojmy: RM - databáza ako množina relácií každá.
Formáty grafických súborov
Umelá inteligencia 1 Heuristické prehľadávanie
Procedurálne riadenie letovej prevádzky
Človek vo sfére peňazí ročník.
KVANTITATÍVNE METÓDY V MARKETINGU
Integritné obmedzenia v SQL
Navrhovanie experimentov – DOE (Design of Experiment) 2
Spresnenie požiadaviek pri hodnotení kvality veterinárnych liekov
Metódy tvorby evolučných stromov
Vlastnosti kvantitatívnych dát
Metódy kĺzavých priemerov (MA – moving averages) - Marcel Kocifaj
ROC - Receiver Operating Characteristic
PET/CT s Flurocholínom(18F) pri uzlovitých léziách v pečeni: môže včasná dynamická akvizícia zlepšiť špecifickosť? S Balogova §+, V Huchet+, F Bumsel,
INCITES: Journal Citation Reports
Informované, heuristické prehľadávanie
Heuristické optimalizačné procesy
Smelý Palko v Ohiu alebo pán Turing ide voliť
VYSOKOFREKVENČNÁ INDUKČNÁ PEC
Open Access v H2020 Barbora Kubíková Národný kontaktný bod
Patrik Ort Acount Executive , Stredná Európa
Práca vývojárskeho tímu
Prečo je variabilita vhodným ukazovateľom rizika
Metóda Konečných Prvkov vo výrobných technológiach
ROVINNÉ (2D) SYMBOLY DWG
10 NAJKRAJŠÍCH MIEST SVETA
Andrej Lúčny Témy bakalárskych prác Andrej Lúčny
Je modrá veľryba najväčšia vec na svete?
Je modrá veľryba najväčšia vec na svete?
Presentation transcript:

Lineárny regresný model Damodar Gujarati Econometrics by Example

Pri regresenej a korelačnej analýze pôjde skúmanie príčinnej - kauzálnej závislosti,skúmanie vzťahov medzi príčinou a účinkom kedy jeden resp viac javov (znakov, nezávisle prememnných veličín ) vyvoláva účinok - výsledný jav - závisle prememnnú veličinu Y = f (X1 X2…... Xk ,Bo , B1 ,….Bp ) +e Nezávislé premenné veličiny - príčiny Neznáme parametre funkčného vzťahu Náhodné, Nešpecifikované vplyvy Závislé premenná - účinok

Príklad zdanlivej korelácie Jedna z preslávených zdanlivých korelácií : ak sa dĺžka sukní skracuje kurzy akcií stúpajú . Odhliadnúc od toho, že to nie vždy platí, išlo by skutočneo zdanlivú, alebo nezmyselnú koreláciu

Damodar Gujarati Econometrics by Example

Opakom štatistickej závislosti je funkčná závislosť Y = f(X1 X2…... Xk ,Bo , B1 ,…., Bp) kedy je závisle prememnná veličina jednoznačne určená funkčným vzťahom, príklady z fyziky, chémie - takýto druh vzťahov nie je predmetom štatistického skúmania

Regresná analýza regresná úloha (RÚ) jej podstatou je a) nájsť funkčný vzťah podľa ktorého sa mení závislé premenná so zmenou nezávisle premenných - nájsť vhodnú regresnú funkciu. b) Súčasne je potrebné odhadnúť parametre regresnej funkcie.

Lineárny regresný model Všeobecná forma viacnásobného regresného modelu: Yi = B1 + B2X2i + B3X3i + … + BkXki + ui Skrátená forma: Yi = BX + ui Y vysvetlovaná premenná (regressand), X je vektor vysvetlujúcich premenných (regressorov), and u je náhodná chyba (reziduá). Damodar Gujarati Econometrics by Example

Regresné koeficienty B1 je lokujúca konštanta - vyjadruje očakávanú úroveň závislé premennej pri nulovej hodnote nezávisle premennej B2 až Bk sú regresné koeficienty (smernice) Každý regresný koeficient meria (parciálnu) mieru zmeny v priemernej hodnote Y pri jednotkovej zmene v hodnote vysvetlujúcej premennej, ceteris paribus. Damodar Gujarati Econometrics by Example

Typy údajov Časové rady Súbor pozorovaní ktoré nadobúda premenná v rôznych časových obdobiach ako napríklad denné (napr. ceny akcií), Týždenné (napr. ponuka peňazí), mesačné (napr. miera nezamestnanosti), kvartálne čiže štvrťročné (napr. HDP), ročné (napr. štátny rozpočet), päťročné (napr. sčítanie výrobcov), alebo desaťročné (napr. sčítanie obyvateľov). Damodar Gujarati Econometrics by Example

Typy údajov Prierezové údaje Údaje o jednej alebo viacerých premenných získané v jednom bode v čase. Príkladom sú napríklad sčítanie obyvateľov vykonávané štatistickým úradom, rôzne prieskumy preferencií, či namerané teploty v danom čase na rôznych miestach. Damodar Gujarati Econometrics by Example

Typy údajov Panelové, longitudálne alebo mikropanelové údaje Kombinujú prvky oboch predchádzajúcich, tak časových radov ako aj prierezových údajov Rovnaké prierezové jednotky sú sledované v čase Damodar Gujarati Econometrics by Example

Metóda najmenších štvorcov Metóda najmenších štvorcov (MNŠ) neminimalizuje sumu odchýlok, ale minimalizuje sumu štvorcov odchýlok: Pre získanie regresných koeficientov sú parciálne derivácie podla jednotlivých regresných koeficientov dané do rovnosti s nulou. Damodar Gujarati Econometrics by Example

Klasický lineárny regresný model Predpoklady klasického lineárneho regresného modelu (CLRM): A-1: Model je lineárny v parametroch. A-2: Vysvetľujúce premenné sú nestochastické a konštantné v opakovaných výberoch. A-3: Pre dané X, stredná hodnota reziduí je 0, alebo E(ui |X) = 0. Damodar Gujarati Econometrics by Example

Klasický lineárny regresný model Predpoklady klasického lineárneho regresného modelu: A-4: Homoskedastický, alebo konštantný rozptyl ui, zapísané ako var(ui|X) = σ2. A-5: Žiadna autokorelácia rezíduí, alebo cov(ui,uj|X) = 0, i ≠ j. A-6: Žiadna multikolinearita, teda žiadna perfektná lineárna závislosť medzi vysvetľujúcimi premennými. A-7: Žiadne chyby špecifikácie. Damodar Gujarati Econometrics by Example

GAUSS-MARKOV TEORÉM Na základe predpokladov A-1 až A-7, dáva MNŠ najlepšie lineárne nevychýlené odhady ak: (1) Estimátory sú lineárnou funkciou závisle premennej Y. (2) Estimátory sú nevychýlené; pri opakovanom použití metódy dosahujú odhady svoje skutočné hodnoty. (3) V kategórii lineárnych odhadov, estimátory majú estimátory získané metódou najmenších štvorcov minimálny rozptyl; teda sú efektívnymi alebo aj „najlepšími“ odhadmi. Damodar Gujarati Econometrics by Example

Testovanie hypotéz: t TEST Testujeme nasledujúce hypotézy: H0: Bk = 0 H1: Bk ≠ 0 vypočítame testovaciu štatistiku podľa nasledujúceho vzorca a použijeme tabuľky studentovho rozdelenia aby sme získali t kritické s n-k stupňami voľnosti pre danú hladinu významnosti (alebo α, rovné 10%, 5%, alebo 1%): Pokiaľ je táto hodnota vačšia ako t kritické, zamietneme H0. Damodar Gujarati Econometrics by Example

Testovanie hypotéz: t TEST Alternatívnou metódou je určiť, či sa v intervale spolahlivosti nachádza 0: Pokiaľ nula leží v intervale spoľahlivosti nemôžeme zamietnuť H0. p-value označuje presnú hladinu významnosti, alebo najnižšiu hladinu významnosti na ktorej môžeme zamietnuť H0. Damodar Gujarati Econometrics by Example

Koeficient determinácie, R2 Koeficient determinácie je všeobecnou mierou presnosti modelu. Percentuálny podiel celkovej variability závislej premennej ktorá je vysvetlená nezávislými premennými. Nadobúda hodnoty medzi 0 a 1 <0% , 100%>. Nech: Potom: Damodar Gujarati Econometrics by Example

Index korelácie a index determinácie V základnom súbore Iyx odhadom z výberových údajov je iyx est Iyx = iyx . Princíp spočíva v rozklade variability závisle premennne Y Variabilita nevysvetlená regresnou funkciou - reziduálna variabilita Variabilita závisle premennej vysvetlená regresnou funkciou Celková variabilita závisle premennej

Index korelácie iyx Index determinácie iyx2 v %

Testovanie hypotéz: F TEST Testovanie nasledujúcich hypotéz je ekvivalentné testovaniu hypotéz že sú všetky regresné koeficienty rovné 0: H0: R2 = 0 H1: R2 ≠ 0 Vypočítame nasledujúcí vzťah a použijeme tabuľky F rozdelenia pre získanie kritickej F hodnoty s k-1 stupňami voľnosti v čitateli a n-k stupňami voľnosti v menovateli pre danú hladinu významnosti: Pokiaľ je vypočítaná hodnota vyššia ako F kritické zamietame, H0. Damodar Gujarati Econometrics by Example

Funkčné formy regresných modelov Damodar Gujarati Econometrics by Example

LOG-LINEÁRNY, LOG-LOG, ALEBO MODEL S KONŠTANTNOU ELASTICITOU Cobb-Douglasova produkčná funkcia: môže byť transformovaná na lineárny tvar po zlogarigmovaní oboch strán: Regresné koeficienty môžu byť interpretované ako elasticity. Ak (B2 + B3) = 1, konštantné výnosy z rozsahu. Ak (B2 + B3) > 1, rastúce výnosy z rozsahu. Ak (B2 + B3) < 1, klesajúce výnosy z rozsahu. Damodar Gujarati Econometrics by Example

LOG-LIN alebo rastový model Miera rastu reálneho GDP: môže byť transformovaný na lineárny po zlogaritmovaní oboch strán: Pokiaľ B1 = ln RGDP1960 a B2 = ln (l+r), môžeme to prepísať nasledovne: ln RGDPt = B1 +B2 t B2 je semi-elasticita, alebo aj okamžitá miera rastu. Zložená miera rastu (r) je rovná (eB2 – 1). Damodar Gujarati Econometrics by Example

LIN-LOG MODEL Lin-log má všeobecnú formu: Všimnite si že B2 je absolútnou zmenou vY zodpovedajúcou percentuálnej (alebo relatívnej) zmene v X Ak X vzrastie o 100%, predikované Y vzrastie o B2 jednotiek Používané pri odhade Engelovej výdajovej funkcie: “Celkové výdavky vynaložené na potraviny rastú aritmetickou mierou zatial čo celkové výdavky rastú geometrickou mierou.” Damodar Gujarati Econometrics by Example

Reciproký regresný model (hyperbola) Všeobecná forma modelu: Všimnite si že: Ak X vzrastie nekonečne, člen dosiahne nulu a Y dosiahne limitnú teda asymptotickú hodnotu B1. Sklon sa vypočíta: Platí teda, ak B2 je pozitívne, sklon je negatívny, a pokiaľ B2 je negatívne, sklon je pozitívny. Damodar Gujarati Econometrics by Example

POLYNOMICKÉ REGRESNÉ MODELY Nasledujúci príklad modelu predikujúceho HDP je príklad kvadratickej funkcie, alebo vo všeobecnosti, polynóm druhého stupňa vysvetlujúcej premennej čas: Sklon je nelineárny: Damodar Gujarati Econometrics by Example

Zhrnutie funkčných foriem Damodar Gujarati Econometrics by Example

Štandardizované premenné Problému s premennými meranými v rozdielnych jednotkách môžeme predísť ich vyjadrením v štandardizovanom tvare: kde SY a SX sú výberové štandardné odchýlky a sú výberové priemery Y a X Stredná hodnota štandardizovanej premennej je vždy nulová a jej štandardná odchýlka je vždy 1. Damodar Gujarati Econometrics by Example

Miery kvality modelu R2: Meria podiel variability závisle premennej ktorá je vysvetlená nezávisle premennými, resp. modelom. Korigovaný R2: označuje sa ako , zohľadňuje počet vysvetľujúcich premenných v modeli: Akaikeho informačné kritérium (AIC): Tvrdšie penalizuje pridanie ďalších premenných do modelu: Zvyčajne je vybratý model s najnižšou hodnotou AIC. Schwarzove informačné kritérium (SIC): Alternatíva k AIC kritériu vyjadrená ako: Penalizačný faktor je prísnejší ako pri AIC. Damodar Gujarati Econometrics by Example