R programavimo kalbos taikymas aplinkos tyrimuose

Slides:



Advertisements
Similar presentations
NORĖDAMI PAKEISTI SKAIDRĖS STILIŲ – SPUSTELĖKIT E DEŠINIUOJU PELĖS KLAVIŠU ANT SKAIDRĖS FONO IR PASIRINKITE > LAYOUT ARBA DARBALAUKI O ĮRANKIŲ JUOSTOJE.
Advertisements

Vaizdinė užduotis. Kuriose iš šių valstybių galima pamatyti tokius gyvenamuosius namus? Jemene Tanzanijoje Mongolijoje Indonezijoje A B C D 1.
PROJEKTAS LIETUVOS IR NORVEGIJOS POLICIJOS BENDRADARBIAVIMAS IR GEBĖJIMŲ STIPRINIMAS KOVOJANT SU SMURTU ARTIMOJE APLINKOJE IR SMURTU LYTIES PAGRINDU.
Tekstų redaktorius MS Word 200x
Regresijos determinuotumas
Smart none of us are as smart as all of us. smart none of us are as smart as all of us.
Funkcijos R.
Kaip parengti ir pristatyti mokslinį straipsnį
Įvadas Testavimo įrankių naudojimas padaro testavimą lengvesnį, efektyvesnį ir produktyvesnį, padeda valdyti procesą Reikalinga žinoti kokias užduotis.
1 paskaita: Įvadas į 3D grafiką OpenGL GLSL = OpenGL Shading Language
Darbą parengė: Viktorija Drūteikaitė IT2
SSGG (SWOT): Organizacijos stiprybės ir silpnybės, galimybės ir grėsmės (nustatymas, grupavimas, vertinimas, rezultatas) Pagrindinė literatūra: Lietuvos.
MAUDYKLŲ VANDENS KOKYBĖS STEBĖSENOS
Robert Andruškevič AT27D.   Tai yra operacinė sistema, daugiausia naudojama išmaniuosiuose telefonuose, nors ją galima įdiegti ir kituose mobiliuosiuose.
Universitetų reitingai
CLIL, MY OPEN WINDOW ON THE WORLD AROUND ME
Video kūrimas su Windows Movie Maker 2.0
Kompiuterio sandara, programinė įranga
Įvadas į dinaminių interneto puslapių kūrimą
Dialogo langai Benas Ragauskas, PS m.
Elektroninių viešųjų paslaugų teikimo pavyzdžių analizė
CC BY-SA mascil consortium 2014
Tekstų redaktorius MS Word 200x
LIETUVOS VARTOTOJŲ GALIMYBĖS NAUDOTIS VISATEKSTĖMIS DUOMENŲ BAZĖMIS
Ugdymo plėtotės centras
PHP „CodeIgniter“ karkaso saugumas
Panelinių duomenų modeliai
Pagrindinės sąvokos Hipertekstas ir multimedija
PROGRAMAVIMO PAGRINDAI
Lotus Notes pagrindai Notes darbalaukis.
Atliko: Jokūbas Rusakevičius VU MIF PS 3k 3g
Daiktavardis Dalykas, ugdymo sritis: Tema: Klasė: Priemonės paskirtis:
R paketas ir jo įdiegimas
JavaScript kalbos apžvalga
Programinė įranga.
inovatyvioms mokykloms
IPod MENIU.
Paprasti skaičiavimai. Uždavinių sprendimas
HIPERTEKSTINĖS TECHNOLOGIJOS
Failai ir jų tvarkymas.
INTERAKTYVIŲ UŽDUOČIŲ KŪRIMO PROGRAMA
Programų sistemų gyvavimo ciklo procesai
Regresijos determinuotumas
Tekstiniai uždaviniai
VLKK ir MELC projektas „Pasaulio vietovardžiai“
Saulius Ragaišis, VU MIF
Biomedicinos mokslų informacijos šaltiniai ir paieška
Programų kūrimo metodai
Virtualus kompiuteris
CCAB –Centre Borschette, Rue Froissart 36 room AB-0A
Duomenų struktūros ir algoritmai
Programų sistemų testavimas
1. Learning from the first year of the project
MS Word 2007.
Funkcijos 9 paskaita.
Operacinė sistema Testas 9 klasė
Projekto apžvalga Mokymosi sritis Amžius Uždaviniai Anglų kalba
Studijų pasirinkimas Lietuvoje ir užsienyje: ką svarbu žinoti?
Mobilus turinys, jaunimas, bibliotekos
PARTNERIŲ PAIEŠKA UŽSIENYJE
Projektas “Saugesnis internetas”
Aplinkos duomenų masyvai
Studijos užsienyje.
Windows Ribbon Framework
Pseudo (fiktyvūs) kintamieji
Klaipėdos Simono Dacho progimnazija
Grupinio darbo programinė įranga Lotus Notes
Pranešėjas Jurij Kuznecov
Presentation transcript:

R programavimo kalbos taikymas aplinkos tyrimuose

Temos 1.Įvadas Kas yra R programavimo kalba? R ir R Studio įdiegimas. R Studio vartotojo sąsaja. R programavimo kalbos pagalbą. Darbo erdvė. Objektų valdymas. Plėtiniai. 2. Duomenų objektai R programavimo kalboje Duomenų tipai. Skaitiniai duomenų tipai. Loginiai duomenys. Simboliai. Faktoriai. Data ir laikas. Trūkstami duomenys. Vektoriai. Matricos. Masyvai. Duomenų lentelės. Laiko eilutės. Sąrašai. 3. Duomenų valdymas Duomenų importavimas. Teksto bylos. Excel bylos. Duomenų atranka vektoriuose ir matricose. Duomenų atranka duomenų lentelėse. Stulpelio įterpimas duomenų lentelėse. Duomenų lentelių suderinimas ir sujungimas. Duomenų agregavimas duomenų lentelėse. Duomenų transformavimas duomenų lentelėse. Duomenų lentelių transformavimas į/iš ilgo, plataus formato. Atributai. Manipuliacijos su tekstiniais duomenimis. Faktorių sukūrimas iš tolydžių duomenų.

Temos 4. Vartotojo sukurtos funkcijos Funkcijos R programavimo kalboje. Argumentai ir kintamieji. Sąlyginiai veiksmai. Ciklai R kalboje. R funkcijų tikrinimas. Vektoriniai skaičiavimai. „Apply“ funkcijų šeima. 5. Vizualizacija Vizualizacija R programavimo kalboje. „Plot“ funkcija. Sklaidos grafikai. Dviejų ir daugiau kintamųjų vizualizacija. Grafiniai įrenginiai. Grafiniai parametrai. Daugelio dalių paveikslai. Spalvų paletė. Paveikslų komponentai. Paveikslų ašys ir užrašai. „ggplot2“ plėtinys, jo „Aesthetics“, „Geoms“, „Facetting“ savybės ir funkcijos. Kelių sluoksnių grafikai. 6. Statistika Aprašomosios statistikos funkcijos ir apibendrinančios lentelės. Skirstiniai ir atsitiktiniai skaičiai. Regresijos modeliai. Tiesinės regresijos modeliai. Modelių savybės ir parametrai. Kategoriniai kintamieji regresijos modeliuose. Modelio tinkamumo rodiklių vertinimas. Ne tiesinė regresija.

Temos 7. Aplinkos duomenų masyvai NetCDF ir HDF duomenys ir jų struktūra. R plėtiniai NetCDF ir HDF duomenų formatams. NetCDF ir HDF duomenų įsikėlimas į R darbo aplinką. Metaduomenys. Dimensijos. Atributai. Kintamieji. Laiko dimensijos transformavimas. Trūkstamų reikšmių užpildymas. Duomenų dalies įsikėlimas į R aplinką. 8. Erdviniai duomenys R programavimo kalboje Pagrindo žemėlapiai. Erdvinės projekcijos. Vektoriniai erdviniai duomenys R. Vektorinių erdvinių duomenų įsikėlimas. Vektorinių erdvinių duomenų atributinė informacija. Vektorini erdvinių duomenų persidengimas. Rastriniai duomenys. Rastrinių duomenų kūrimas ir importavimas. Rastro ląstelių duomenys. Rastrų algebra ir persidengimas. Apibendrinimo funkcijos. Rastro algebra ir persidengimo analizė. Erdvinių duomenų vizualizavimas.

Atsiskaitymai Vertinimo strategija Svoris proc. Atsiskaity mo laikas Vertinimo kriterijai Seminarai Seminaru metu kiekvienas studentas per semestrą turi pristatyti 2 atliktas užduotis susidedančias iš 3 dalių. 60 Semestro metu Užduočių rezultatų pristatymas vertinamas nuo 1 iki 10 balų. Ribinius balus atitinkantys kriterijai: 10 balų: Problema išsamiai išanalizuota. Darbo struktūra logiška. Daromos išvados pagrįstos. Darbas parengtas pagal moksliniam darbui keliamus reikalavimus. Studentas gali interpretuoti ir paaiškinti užduoties rezultatus. 5 balai: Problema išanalizuota neišsamiai ir yra trūkumų susijusių su darbo struktūra. Studentas gali sunkiai interpretuoti ir paaiškinti užduoties rezultatus. 1 balas: problema išanalizuota netinkamai. Studentas nesupranta gautų rezultatų. 0 balų: Darbas nepateiktas   Bendras balas už seminarus apskaičiuojamas kaip visų užduočių rezultatų pristatymo įvertinimų vidurkįs. Egzaminas (testas) 40 Sesijos metu 40 klausimų testas. Kiekvienas teisingas atsakymas į klausimą vertinamas 0.1 balo.

Literatūra Autorius Leidimo metai Pavadinimas Peri- odinio leid. Nr., tomas Leidimo vieta ir leidykla, ar internetinė nuoroda Privalomoji literatūra Longhow Lam   2010 An introduction to R https://cran.r-project.org/doc/contrib/Lam- IntroductionToR_LHL.pdf Robin Lovelace, James Cheshire, Rachel Oldroyd et al. 2017 Introduction to visualising spatial data in R https://github.com/Robinlovelace/Creating- maps-in-R Robert J. Hijmans 2016 Introduction to the 'raster' package https://cran.r- project.org/web/packages/raster/vignettes/Rast er.pdf Papildoma literatūra W. N. Venables, D. M. Smith and the R Core Team An Introduction to R https://cran.r-project.org/doc/manuals/r- release/R-intro.pdf University of Oregon. Department of Geography NetCDF in R http://geog.uoregon.edu/bartlein/courses/geog 607/Rmd/netCDF_01.htm Emmanuel Paradis 2005 R for Beginners https://cran.r-project.org/doc/contrib/Paradis- rdebuts_en.pdf Pavel Michna, Milton Woods 2013 RNetCDF – A Package for Reading and Writing NetCDF Datasets https://journal.r-project.org/archive/2013- 2/michna-woods.pdf RStudio RStudio IDE Cheat Sheet https://www.rstudio.com/wp- content/uploads/2016/01/rstudio-IDE- cheatsheet.pdf Base R Cheat Sheet https://www.rstudio.com/wp- content/uploads/2016/10/r-cheat-sheet-3.pdf Data Visualization with ggplot2 Cheat Sheet https://www.rstudio.com/wp- content/uploads/2015/03/ggplot2- cheatsheet.pdf

Kas yra R programavimo kalba? R – programavimo klaba skirta duomenų analizei ir vizualizavimui. R sukurta 1995 m. Ross Ihaka and Robert Gentlema Oklendo universitete, Naujojoje Zelandijoje. Nuo 2000 m. viešai prieinama vartotojams. R yra nemokamas S kalbos skirtos statistinei duomenų analizei dialektas, populiarumu ir patogumu ženkliai pranokstantis S.

Populiariausios programavimo kalbos, garantuojančios darbą Populiariausios programavimo kalbos, garantuojančios darbą. Verslo žinios 2016-11-12. „Java“yra viena iš populiariausių programavimo kalbų versle, ypač kliento- serverio interneto taikomųjų programų ir vartotojų naudojamos „Android“ programinės įrangos dalies bei programėlių kūrimo srityse. Su „C“ parašyti operacinių sistemų (OS) branduoliai. Ši kalba taip pat labai svarbi dirbantiems su duomenų bazėmis ir įterptinėmis sistemomis, tokiomis, kaip bankomatų OS. „Python“ dažnai naudojama kurti taikomąsias interneto programas. Ši kalba neretai naudojama smulkių procesų automatizacijai. „PHP“ Viena iš populiariausių kalbų, naudojamų interneto svetainių kūrimui. „JavaScript“ dažniausiai naudojama interneto svetainių ir atskirų puslapių interaktyvumui padidinti. „R“ renkasi statistikos ir duomenų analitikai. Iš didžiųjų pasaulio kompanijųR naudoja „Google“. Pasak „Google“ R suteikia „didžiulę galią kompanijos matematikams ir analizės įrankių kūrėjams“. Kitos minimos kalbos („Go“, „Swift“, „Ruby“, „Groovy“, „Perl“), mažiau populiarios ir kartoja populiaresnių programų savybes. „MATLAB“ komercinė programinė kalba skirta duomenų analizei ir vizualizavimui.

Duomenų analitikų darbo pasiūlymai pagal programavimo kalbą Robert A. Muenchen 2017 The Popularity of Data Science Software http://r4stats.com/articles/popularity/

Moksliniai straipsniai pagal programavimo kalbą 2016 Robert A. Muenchen 2017 The Popularity of Data Science Software http://r4stats.com/articles/popularity/

Moksliniai straipsniai pagal programavimo kalbą skaičiaus kaita R - 5300 straipsnių daugiau (aukščiau ir žemiau iki MATLAB nepopuliarios kalbos – absoliutus straipsnių skaičius padidėjo nedaug nors procentai dideli) Robert A. Muenchen 2017 The Popularity of Data Science Software http://r4stats.com/articles/popularity/

Kalbos naudojamos duomenų analitikų Robert A. Muenchen 2017 The Popularity of Data Science Software http://r4stats.com/articles/popularity/

Duomenų analizės programavimo kalbų vartotojų aktyvumas Robert A. Muenchen 2017 The Popularity of Data Science Software http://r4stats.com/articles/popularity/

R paketų (išplečiančių kalbos galimybes) skaičiaus dinamika Robert A. Muenchen 2017 The Popularity of Data Science Software http://r4stats.com/articles/popularity/

R privalumai ir trūkumai + - Nemokama Labai plačios galimybės papildomos naujomis bibliotekomis Analizės procesas interaktyvus, galima sekti visų veiksmų rezultatus. Vizualizacija nusileidžia tik MATLAB Aktyvi vartotojų bendruomenė Sunki kalba pradedantiesiems Norint suprasti pagalbą reikia turėti patirties Labai daug galimybių – lengva jose pasimesti Reikalauja daug RAM dirbant su didesniais duomenų kiekiais

R ir R Studio įdiegimas R – programavimo aplinka/kalba https://www.r-project.org R Studio - vartotojo sąsaja palengvinanti darbą su R https://www.rstudio.com

R Studio vartotojo sąsaja Darbinėje aplinkoje (laikinoje atmintyje) esantys objektai. Veiksmų istorija Kodas (script) – iš eilės vykdomų komandų rinkinys, kurį galima išsaugoti ir redaguoti. 1D ir 2D duomenų peržiūra Files - darbinės direktorijos turinys Plots - paveikslai, Packages - paketų valdymas Help - pagalba, Viewer – vietinio „web“ turinio peržiūra. Konsolė – joje rašomos atskiros komandos ir pateikiami komandų įvykdymo rezultatai

R Studio projektai Dirbant su R kiekvienam tyrimui rekomenduojama sukurti naują projektą „File-> New project...“. Projekto duomenys saugomi jo darbinėje direktorijoje. Projekte išsaugoma darbinė aplinka ir veiksmų istorija.

R Studio darbinė aplinka Darbinėje aplinkoje saugomi sukurti objektai arba į ją įkelti objektai. Aplinką galima išsaugoti (.Rdata faile bus išsaugoti visi joje esantis objektai) arba galima išsaugoti vieną iš objektų (komandos priklauso nuo duomenų formato). „Data“ objektus galima atsidaryti peržiūrai. Su „šluotele galima ištrinti visus objektus. Darbinės aplinkos turinys gali būti rodomas dviem būdais „List“ arba „Grid“ „Grid“ pateiktyje galima ištrinti pasirinktus objektus

R Studio veiksmų istorija Veiksmų istorijoje išsaugomos visos įvykdytos komandos. Komandas iš veiksmų istorijos galima perkelti į konsolę arba kodą. Iš istorijos komandas galima pašalinti visas arba po vieną.

R Studio kodas R kode eilės tvarka surašomos komandos kurias norima įvykdyti. „Run“ įvykdo pažymėtas komandas, o „Source“ visą kodą

R Studio paketai/bibliotekos Paketai yra R plėtiniai, kuriose pateikiamos papildomos R funkcijos ir komandos. Paketai prieš naudojant reikia instaliuoti, o vėliau aktyvuoti. Paspaudus ant paketo pavadinimo atsidaro jo pagalba. Aktyvuotas paketas

R Studio paveikslai R galima vizualizuoti duomenis ir analizės rezultatus. Paveikslai sukuriami įvykdant komandas (pvz. plot. Hist ir t.t.). R Studio paveikslai vaizduojami jiems skirtame skirtuke. Sukūrus kelis paveikslus juos galima pamatyti pasitelkus rodykles. Paveikslus galima eksportuoti pasirinktu formatu.

Sukurkite naują kodo dokumentą ir jame parašykite šias komandas: duomenys<-mtcars galia<-mtcars$hp sanaudos<-mtcars$mpg plot(galia) plot(sanaudos) plot(galia, sanaudos)

R pagalba R pagalba yra (per)sudėtinga, ypač, pradedantiesiems! Nuorodos į R vadovus, FAQ ir t.t help.start(). Informacija apie konkrečia funkciją help(funkcija) arba ?funkcija. Informacija pagal tekstą help.search(„tekstas“) arba ??tekstas.

R pagalba Patogiai pateiktoje R funkcijų ir bibliotekų dokumentacijoje internete https://www.rdocumentation.org/ Gerai parengti paketai turi savo vartotojų vadovus ir„vinjetes“ https://cran.r-project.org/web/packages RStudio ruošinukai Internete, paieškoje pridedant „r“  Vartotojų diskusijose galima prašyti pagalbos arba pasinaudoti atsakymais į ankstesnius klausimus (pvz., https://stackoverflow.com/)

Išbandykite help.start() funkciją Suraskite funkcijos mean pagalbą. Suraskite pagalbą pagal tekstą „Standard Deviation“. Suraskite funkciją skirtą apskaičiuoti kvadratinę šaknį.