Presentation is loading. Please wait.

Presentation is loading. Please wait.

R programavimo kalbos taikymas aplinkos tyrimuose

Similar presentations


Presentation on theme: "R programavimo kalbos taikymas aplinkos tyrimuose"— Presentation transcript:

1 R programavimo kalbos taikymas aplinkos tyrimuose

2 Temos 1.Įvadas Kas yra R programavimo kalba? R ir R Studio įdiegimas. R Studio vartotojo sąsaja. R programavimo kalbos pagalbą. Darbo erdvė. Objektų valdymas. Plėtiniai. 2. Duomenų objektai R programavimo kalboje Duomenų tipai. Skaitiniai duomenų tipai. Loginiai duomenys. Simboliai. Faktoriai. Data ir laikas. Trūkstami duomenys. Vektoriai. Matricos. Masyvai. Duomenų lentelės. Laiko eilutės. Sąrašai. 3. Duomenų valdymas Duomenų importavimas. Teksto bylos. Excel bylos. Duomenų atranka vektoriuose ir matricose. Duomenų atranka duomenų lentelėse. Stulpelio įterpimas duomenų lentelėse. Duomenų lentelių suderinimas ir sujungimas. Duomenų agregavimas duomenų lentelėse. Duomenų transformavimas duomenų lentelėse. Duomenų lentelių transformavimas į/iš ilgo, plataus formato. Atributai. Manipuliacijos su tekstiniais duomenimis. Faktorių sukūrimas iš tolydžių duomenų.

3 Temos 4. Vartotojo sukurtos funkcijos
Funkcijos R programavimo kalboje. Argumentai ir kintamieji. Sąlyginiai veiksmai. Ciklai R kalboje. R funkcijų tikrinimas. Vektoriniai skaičiavimai. „Apply“ funkcijų šeima. 5. Vizualizacija Vizualizacija R programavimo kalboje. „Plot“ funkcija. Sklaidos grafikai. Dviejų ir daugiau kintamųjų vizualizacija. Grafiniai įrenginiai. Grafiniai parametrai. Daugelio dalių paveikslai. Spalvų paletė. Paveikslų komponentai. Paveikslų ašys ir užrašai. „ggplot2“ plėtinys, jo „Aesthetics“, „Geoms“, „Facetting“ savybės ir funkcijos. Kelių sluoksnių grafikai. 6. Statistika Aprašomosios statistikos funkcijos ir apibendrinančios lentelės. Skirstiniai ir atsitiktiniai skaičiai. Regresijos modeliai. Tiesinės regresijos modeliai. Modelių savybės ir parametrai. Kategoriniai kintamieji regresijos modeliuose. Modelio tinkamumo rodiklių vertinimas. Ne tiesinė regresija.

4 Temos 7. Aplinkos duomenų masyvai
NetCDF ir HDF duomenys ir jų struktūra. R plėtiniai NetCDF ir HDF duomenų formatams. NetCDF ir HDF duomenų įsikėlimas į R darbo aplinką. Metaduomenys. Dimensijos. Atributai. Kintamieji. Laiko dimensijos transformavimas. Trūkstamų reikšmių užpildymas. Duomenų dalies įsikėlimas į R aplinką. 8. Erdviniai duomenys R programavimo kalboje Pagrindo žemėlapiai. Erdvinės projekcijos. Vektoriniai erdviniai duomenys R. Vektorinių erdvinių duomenų įsikėlimas. Vektorinių erdvinių duomenų atributinė informacija. Vektorini erdvinių duomenų persidengimas. Rastriniai duomenys. Rastrinių duomenų kūrimas ir importavimas. Rastro ląstelių duomenys. Rastrų algebra ir persidengimas. Apibendrinimo funkcijos. Rastro algebra ir persidengimo analizė. Erdvinių duomenų vizualizavimas.

5 Atsiskaitymai Vertinimo strategija Svoris proc. Atsiskaity mo laikas
Vertinimo kriterijai Seminarai Seminaru metu kiekvienas studentas per semestrą turi pristatyti 2 atliktas užduotis susidedančias iš 3 dalių. 60 Semestro metu Užduočių rezultatų pristatymas vertinamas nuo 1 iki 10 balų. Ribinius balus atitinkantys kriterijai: 10 balų: Problema išsamiai išanalizuota. Darbo struktūra logiška. Daromos išvados pagrįstos. Darbas parengtas pagal moksliniam darbui keliamus reikalavimus. Studentas gali interpretuoti ir paaiškinti užduoties rezultatus. 5 balai: Problema išanalizuota neišsamiai ir yra trūkumų susijusių su darbo struktūra. Studentas gali sunkiai interpretuoti ir paaiškinti užduoties rezultatus. 1 balas: problema išanalizuota netinkamai. Studentas nesupranta gautų rezultatų. 0 balų: Darbas nepateiktas Bendras balas už seminarus apskaičiuojamas kaip visų užduočių rezultatų pristatymo įvertinimų vidurkįs. Egzaminas (testas) 40 Sesijos metu 40 klausimų testas. Kiekvienas teisingas atsakymas į klausimą vertinamas 0.1 balo.

6 Literatūra Autorius Leidimo metai Pavadinimas
Peri- odinio leid. Nr., tomas Leidimo vieta ir leidykla, ar internetinė nuoroda Privalomoji literatūra Longhow Lam 2010 An introduction to R IntroductionToR_LHL.pdf Robin Lovelace, James Cheshire, Rachel Oldroyd et al. 2017 Introduction to visualising spatial data in R maps-in-R Robert J. Hijmans 2016 Introduction to the 'raster' package project.org/web/packages/raster/vignettes/Rast er.pdf Papildoma literatūra W. N. Venables, D. M. Smith and the R Core Team An Introduction to R release/R-intro.pdf University of Oregon. Department of Geography NetCDF in R 607/Rmd/netCDF_01.htm Emmanuel Paradis 2005 R for Beginners rdebuts_en.pdf Pavel Michna, Milton Woods 2013 RNetCDF – A Package for Reading and Writing NetCDF Datasets 2/michna-woods.pdf RStudio RStudio IDE Cheat Sheet content/uploads/2016/01/rstudio-IDE- cheatsheet.pdf Base R Cheat Sheet content/uploads/2016/10/r-cheat-sheet-3.pdf Data Visualization with ggplot2 Cheat Sheet content/uploads/2015/03/ggplot2- cheatsheet.pdf

7 Kas yra R programavimo kalba?
R – programavimo klaba skirta duomenų analizei ir vizualizavimui. R sukurta 1995 m. Ross Ihaka and Robert Gentlema Oklendo universitete, Naujojoje Zelandijoje. Nuo m. viešai prieinama vartotojams. R yra nemokamas S kalbos skirtos statistinei duomenų analizei dialektas, populiarumu ir patogumu ženkliai pranokstantis S.

8 Populiariausios programavimo kalbos, garantuojančios darbą
Populiariausios programavimo kalbos, garantuojančios darbą. Verslo žinios „Java“yra viena iš populiariausių programavimo kalbų versle, ypač kliento- serverio interneto taikomųjų programų ir vartotojų naudojamos „Android“ programinės įrangos dalies bei programėlių kūrimo srityse. Su „C“ parašyti operacinių sistemų (OS) branduoliai. Ši kalba taip pat labai svarbi dirbantiems su duomenų bazėmis ir įterptinėmis sistemomis, tokiomis, kaip bankomatų OS. „Python“ dažnai naudojama kurti taikomąsias interneto programas. Ši kalba neretai naudojama smulkių procesų automatizacijai. „PHP“ Viena iš populiariausių kalbų, naudojamų interneto svetainių kūrimui. „JavaScript“ dažniausiai naudojama interneto svetainių ir atskirų puslapių interaktyvumui padidinti. „R“ renkasi statistikos ir duomenų analitikai. Iš didžiųjų pasaulio kompanijųR naudoja „Google“. Pasak „Google“ R suteikia „didžiulę galią kompanijos matematikams ir analizės įrankių kūrėjams“. Kitos minimos kalbos („Go“, „Swift“, „Ruby“, „Groovy“, „Perl“), mažiau populiarios ir kartoja populiaresnių programų savybes. „MATLAB“ komercinė programinė kalba skirta duomenų analizei ir vizualizavimui.

9 Duomenų analitikų darbo pasiūlymai pagal programavimo kalbą
Robert A. Muenchen The Popularity of Data Science Software

10 Moksliniai straipsniai pagal programavimo kalbą 2016
Robert A. Muenchen The Popularity of Data Science Software

11 Moksliniai straipsniai pagal programavimo kalbą skaičiaus kaita
R straipsnių daugiau (aukščiau ir žemiau iki MATLAB nepopuliarios kalbos – absoliutus straipsnių skaičius padidėjo nedaug nors procentai dideli) Robert A. Muenchen The Popularity of Data Science Software

12 Kalbos naudojamos duomenų analitikų
Robert A. Muenchen The Popularity of Data Science Software

13 Duomenų analizės programavimo kalbų vartotojų aktyvumas
Robert A. Muenchen The Popularity of Data Science Software

14 R paketų (išplečiančių kalbos galimybes) skaičiaus dinamika
Robert A. Muenchen The Popularity of Data Science Software

15 R privalumai ir trūkumai
+ - Nemokama Labai plačios galimybės papildomos naujomis bibliotekomis Analizės procesas interaktyvus, galima sekti visų veiksmų rezultatus. Vizualizacija nusileidžia tik MATLAB Aktyvi vartotojų bendruomenė Sunki kalba pradedantiesiems Norint suprasti pagalbą reikia turėti patirties Labai daug galimybių – lengva jose pasimesti Reikalauja daug RAM dirbant su didesniais duomenų kiekiais

16 R ir R Studio įdiegimas R – programavimo aplinka/kalba
R Studio - vartotojo sąsaja palengvinanti darbą su R

17 R Studio vartotojo sąsaja
Darbinėje aplinkoje (laikinoje atmintyje) esantys objektai. Veiksmų istorija Kodas (script) – iš eilės vykdomų komandų rinkinys, kurį galima išsaugoti ir redaguoti. 1D ir 2D duomenų peržiūra Files - darbinės direktorijos turinys Plots - paveikslai, Packages - paketų valdymas Help - pagalba, Viewer – vietinio „web“ turinio peržiūra. Konsolė – joje rašomos atskiros komandos ir pateikiami komandų įvykdymo rezultatai

18 R Studio projektai Dirbant su R kiekvienam tyrimui rekomenduojama sukurti naują projektą „File-> New project...“. Projekto duomenys saugomi jo darbinėje direktorijoje. Projekte išsaugoma darbinė aplinka ir veiksmų istorija.

19 R Studio darbinė aplinka
Darbinėje aplinkoje saugomi sukurti objektai arba į ją įkelti objektai. Aplinką galima išsaugoti (.Rdata faile bus išsaugoti visi joje esantis objektai) arba galima išsaugoti vieną iš objektų (komandos priklauso nuo duomenų formato). „Data“ objektus galima atsidaryti peržiūrai. Su „šluotele galima ištrinti visus objektus. Darbinės aplinkos turinys gali būti rodomas dviem būdais „List“ arba „Grid“ „Grid“ pateiktyje galima ištrinti pasirinktus objektus

20 R Studio veiksmų istorija
Veiksmų istorijoje išsaugomos visos įvykdytos komandos. Komandas iš veiksmų istorijos galima perkelti į konsolę arba kodą. Iš istorijos komandas galima pašalinti visas arba po vieną.

21 R Studio kodas R kode eilės tvarka surašomos komandos kurias norima įvykdyti. „Run“ įvykdo pažymėtas komandas, o „Source“ visą kodą

22 R Studio paketai/bibliotekos
Paketai yra R plėtiniai, kuriose pateikiamos papildomos R funkcijos ir komandos. Paketai prieš naudojant reikia instaliuoti, o vėliau aktyvuoti. Paspaudus ant paketo pavadinimo atsidaro jo pagalba. Aktyvuotas paketas

23 R Studio paveikslai R galima vizualizuoti duomenis ir analizės rezultatus. Paveikslai sukuriami įvykdant komandas (pvz. plot. Hist ir t.t.). R Studio paveikslai vaizduojami jiems skirtame skirtuke. Sukūrus kelis paveikslus juos galima pamatyti pasitelkus rodykles. Paveikslus galima eksportuoti pasirinktu formatu.

24 Sukurkite naują kodo dokumentą ir jame parašykite šias komandas:
duomenys<-mtcars galia<-mtcars$hp sanaudos<-mtcars$mpg plot(galia) plot(sanaudos) plot(galia, sanaudos)

25 R pagalba R pagalba yra (per)sudėtinga, ypač, pradedantiesiems!
Nuorodos į R vadovus, FAQ ir t.t help.start(). Informacija apie konkrečia funkciją help(funkcija) arba ?funkcija. Informacija pagal tekstą help.search(„tekstas“) arba ??tekstas.

26 R pagalba Patogiai pateiktoje R funkcijų ir bibliotekų dokumentacijoje internete Gerai parengti paketai turi savo vartotojų vadovus ir„vinjetes“ RStudio ruošinukai Internete, paieškoje pridedant „r“  Vartotojų diskusijose galima prašyti pagalbos arba pasinaudoti atsakymais į ankstesnius klausimus (pvz.,

27 Išbandykite help.start() funkciją
Suraskite funkcijos mean pagalbą. Suraskite pagalbą pagal tekstą „Standard Deviation“. Suraskite funkciją skirtą apskaičiuoti kvadratinę šaknį.


Download ppt "R programavimo kalbos taikymas aplinkos tyrimuose"

Similar presentations


Ads by Google