Presentation is loading. Please wait.

Presentation is loading. Please wait.

Curs 2 - Introducere în SAS

Similar presentations


Presentation on theme: "Curs 2 - Introducere în SAS"— Presentation transcript:

1 Curs 2 - Introducere în SAS
2.1 Pachetul integrat SAS 2.2 Lucrul cu date într-un proiect

2 Curs 2 - Introducere în SAS
2.1 Pachetul integrat SAS 2.2 Lucrul cu date într-un proiect

3 Cuprins Pachetul software integrat SAS
Facilităţi şi caracteristici ale SAS Enterprise Guide Paşii unei sesiuni tipice de lucru Scopul diferitelor zone ale spaţiului de lucru Lucrul cu date în cadrul unui proiect Definirea tabelelor de date SAS Accesarea datelor locale

4 Pachetul software integrat SAS
Accesarea şi managementul datelor Rapoarte şi Grafice Interfeţe utilizator Base SAS Dezvoltare de aplicaţii Analize SAS este un produs software integrat furnizat de SAS Institute Inc, care oferă utilizatorilor facilităţi precum: introducerea, accesarea şi managementul datelor; 2. data mining (extragerea de informaţii din date); realizarea de rapoarte şi grafice; analize statistice ; planificarea afacerilor, prognoză, precum şi suport de decizie; cercetări operaţionale şi managementul proiectelor; dezvoltarea de aplicaţii; “data warehousing” (lucrul cu depozite de date); lucrul lucrul independent de platforma hardware şi de locaţie În plus, SAS oferă multe soluţii de business şi soluţii software pentru domenii cum ar fi managementul IT, managementul resurselor umane, management financiar, business intelligence, managementul relaţiilor cu clienţii etc. Vizualizare şi Descoperire Capabilităţi Web Soluţii de business

5 Componentele produsului SAS
SAS constă dintr-un număr mare de componente, pe care organizaţiile le pot achiziţiona şi instala separat, în funcţie de necesităţi. În centrul soluţiilor SAS se află produsul software Base SAS. Acesta este un mediu software integrat, având facilităţi pentru accesul la date, analiza datelor, crearea de rapoarte etc. Base SAS beneficiază şi de suportul unui limbaj de programare proprietar de generaţia a patra (Notă: Limbajele de generaţia a patra sunt orientate pe rezolvarea unei anumite clase de probleme. Exemple sunt SQL sau PL/SQL sau cele folosite de alte pachete software ca Matlab sau SPSS). Bibliotecile SAS/STAT, SAS/Graph şi SAS/OR extind capabilităţile motorului de bază Base SAS. SAS/STAT oferă o gamă largă de instrumente pentru analiza statistică a datelor. SAS/Graph este modulul care permite vizualizarea datelor sub formă de grafice sau hărţi. SAS/OR este o componentă care are ca scop susţinerea procesului decizional prin intermediul unor tehnici de optimizare, simulare sau planificare a proiectelor.  SAS Add-inn for MS Office permite utilizatorilor să beneficieze de facilităţile analitice, de raportare şi pentru accesul la date oferite de SAS direct din Microsoft Office prin intermediul unor meniuri şi bare de instrumente integrate în produsele Office.

6 Prelucrări bazate pe date
Funcţionalitatea produsului este construită în jurul a patru tipuri de prelucrări bazate pe date, prelucrări comune pentru aproape toate tipurile de aplicaţii software: Accesarea date Managementul datelor Analiza datelor Prezentarea datelor Accesarea datelor se referă la obţinerea accesului la datele cerute de aplicaţie. Managementul datelor presupune pregătirea datelor astfel încât acestea să aibă forma cerută de aplicaţie. Analiza datelor rezumă sau transformă datele primare în informaţii utile şi care au o semnificaţie pentru analist. Prezentarea datelor comunică informaţiile într-o manieră care demonstrează clar semnificaţia acestora.

7 Transformarea datelor în informaţii
Produsul lucrează prin intermediul programelor SAS (programe scrise într-un limbaj specific, aşa cum aminteam şi mai devreme) care definesc o succesiune de operaţii ce trebuiesc efectuate asupra datelor stocate în tabele. Un program SAS este compus din trei părţi majore, secţiunea de DATE, secţiunile de PROCEDURI, precum şi un limbaj macro. Deşi există interfeţe grafice destinate utilizatorilor care nu deţin cunoştinţe de programare SAS (cum este SAS Enterprise Guide), de cele mai multe ori aceste interfeţe sunt doar un mijloc pentru a automatiza sau a facilita generarea de programe SAS.

8 SAS Enterprise Guide SAS Enterprise Guide este o aplicaţie Windows uşor de utilizat care furnizează următoarele facilităţi: o interfaţă vizuală intuitivă; acces la modulele SAS;acces transparent la date ;prelucrări pentru analiză şi raportare ; exportul facil al datelor şi al rezultatelor în alte aplicaţii; facilităţi de scripting şi automatizare. Utilizatorii având diverse niveluri de experienţă (de la începători până la experţi) pot utiliza SAS Enterprise Guide pentru a obţine rapid rezultate semnificative.

9 Interfaţa SAS Enterprise Guide
Interfaţa de ultimă generaţie a SAS Enterprise Guide oferă: funcţionalitate de tip drag-and-drop; ferestre de dialog pentru introducerea parametrilor prelucrărilor şi efectuarea de setări; instrumente de tip wizard; editor de sintaxă pentru scrierea programelor, cu evidenţierea în culori diferite a elementelor codului; facilităţi de Help Online, help senzitiv la context şi tutorial de iniţiere

10 Interfaţa de programare
 Utilizând SAS Enterprise Guide, se pot accesa modulele SAS fără să fie nevoie să se înveţe limbajul de programare SAS. Dacă utilizatorul este programator SAS, el poate utiliza editorul de cod al pachetului de programe pentru a crea cod nou sau pentru a modifica programe SAS existente.

11 Structura SAS Enterprise Guide
Pentru a lucra cu SAS Enterprise Guide, trebuie parcurşi următorii paşi: crearea unui nou proiect adăugarea de date la proiect executarea de prelucrări asupra datelor Opţional, se pot realiza: 4. personalizarea rezultatelor 5. automatizarea procesului

12 Ceea ce nu se vede SAS Enterprise Guide poate utiliza puterea unui server SAS pentru a accesa datele şi a rula procedurile, urmând ca apoi rezultatele să fie returnate maşinii client. SAS on Windows Cod SAS on Mainframe Pe măsură pe accesaţi date şi realizaţi prelucrări, SAS Enterprise Guide generează cod SAS. Atunci când rulaţi o prelucrare, codul generat este primis motorului SAS pentru procesare, iar rezultatele sunt returnate către SAS Enterprise Guide. Pachetul se poate conecta la motorul SAS pe calculatorul local, sau pe un alt calculator numit server SAS. SAS on UNIX SAS Enterprise Guide

13 Ceea ce nu se vede SAS Enterprise Guide poate utiliza puterea unui server SAS pentru a accesa datele şi a rula procedurile, urmând ca apoi rezultatele să fie returnate maşinii client. SAS on Windows Rezultate SAS on Mainframe Pe măsură pe accesaţi date şi realizaţi prelucrări, SAS Enterprise Guide generează cod SAS. Atunci când rulaţi o prelucrare, codul generat este primis motorului SAS pentru procesare, iar rezultatele sunt returnate către SAS Enterprise Guide. Pachetul se poate conecta la motorul SAS pe calculatorul local, sau pe un alt calculator numit server SAS. SAS on UNIX SAS Enterprise Guide

14 Ceea ce nu se vede Pe măsură ce se efectuează prelucrări, SAS Enterprise Guide generează cod SAS. Utilizatorul poate modifica codul SAS generat de pachet pentru a personaliza rezultatele şi pentru a accesa facilităţile SAS care nu sunt disponibile în cadrul interfeţei grafice. De asemenea, utilizatorul poate salva codul şi să îl execute într-un mediu de tip batch.

15 Zonele de lucru Implicit, SAS Enterprise Guide afişează trei ferestre principale. Acestea sunt: fereastra arborelui proiectului (Project Tree), fereastra fluxului de proces (Process Flow) şi fereastra prelucrărilor (Task Status). Ferestra Project Tree afişează o structură ierarhică a proiectului activ. Atunci când creaţi un nou proiect, ferestra Project Tree este goală. Pe măsură ce adăugaţi date, rulaţi prelucrări sau generaţi rezultate, în această ferestră vor fi adăugate iconiţe pentru fiecare dintre aceste obiecte. Ele sunt văzute ca obiecte ale unui proiect.

16 Obiectele unui proiect
SAS EG are la un moment dat un singur proiect activ. Fiecare proiect conţine unul sau mai multe fluxuri de proces. Un flux de proces reprezintă vizual relaţiile dintre obiectele unui proiect. Într-un proiect se pot crea noi fluxuri pe proces şi se pot muta sau copia obiecte între fluxurile de proces. De asemenea, se poate executa doar o porţiune a unui flux de proces, sau întregul flux.

17 Curs 2 - Introducere în SAS
2.1 Pachetul integrat SAS 2.2 Lucrul cu date într-un proiect

18 Formate comune de date SAS Enterprise Guide poate citi şi utiliza date dintr-o variatate de formate . Fisiere text cu lăţime fixă şi delimitate Fişiere dBASE Foi de calcul Microsoft Excel Date compatibile ODBC Tabele HTML Înainte de a realiza orice în SAS EG este necesar să adăugaţi datele pe care doriţi sa le analizaţi în proiect. Pe lângă fişierele de date SAS, SAS EG poate citi majoritatea tipurilor de fişiere de date ca HTML, Microsoft Access, dBASE sau Microsoft Excel. Aveţi posibilitatea să deschideţi date care se află local pe calculatorul vostru sau pe orice alt server pe care sunteţi autorizat să îl accesaţi. Fişiere ale furnizorilor OLE DB Tabele SAS Tabele Microsoft Access

19 Tabele de date SAS O tabelă de date SAS este o tabelă rectangulară formată din linii şi coloane. Rânduri (observaţii) Pentru a putea fi accesate de SAS EG, datele trebuie să fie reprezentate în format tabelar (ca o mulţime de linii şi coloane). O linie reprezintă o instanţă a unei entităţi. Entitatea poate fi un produs, un client, o comandă sau orice alt lucru. Fiecare coloană descrie caracteristicile entităţii, cum ar fi codul de identificare a unui produs, numele clientului sau cantitatea vândută. Coloane (variabile)

20 Numele poate avea lungimea între 1 si 32 caractere
Tabele de date SAS Toate coloanele trebuie să aiba un nume, tip şi o lungime. Numele poate avea lungimea între 1 si 32 caractere Toate coloanele trebuie să aibă un nume, un tip şi o lungime. Numele pot avea o lungime de la 1 la 32 de caractere. Eticheta ataşată unei coloane poate avea lungimea de maxim 265 de caractere.

21 Tabele de date SAS Coloana poate fi de tip caracter sau numeric. Tipul are şi rol în determinarea lungimii. Valorile de tip caracter pot avea lungimea între 1 si 32,767 caractere (octeţi). Unul dintre cele mai importante lucruri pe care trebuie să le ştiţi despre date este ce tip de date conţine fiecare coloană (sau variabilă). SAS priveşte datele ca fiind fie de tip caracter, fie de tip numeric. În cazul în care datele dintr-o coloană conţin doar litere, aceasta are date de tip caracter. În cazul în care datele dintr-o coloană conţin numere, aceasta poate fi de tip caracter sau numeric. Datele numerice sunt grupate în patru categorii de date, în funcţie de modul în care acestea sunt afişate. Tabela arată ce simbol este asociat fiecărui tip de dată. Aceste pictograme apar în titlurile de coloană ale tabelei de date. De asemenea, aceste pictograme se pot vedea atunci când se rulează o prelucrare. Aceste simboluri constituie un indiciu despre modul în care pot fi folosite coloanele sau varibilele în prelucrări. Valorile numerice sunt stocare pe 8 octeţi în virgulă mobilă şi pot fi de tip: Numeric Monedă Dată (zile de la 1 Ianuarie 1960) Timp (secunde de al miezul nopţii)

22 Formate de afişare Formatul de afişare (Format) este folosit pentru a controla modul în care sunt afişate valorile. Formatul de afişare nu afectează modul de stocare a valorilor. Un format de afişare (Format) este o „instrucţiune” care se aplică unei coloane, indicând produsului SAS Enterprise Guide cum să afişeze valorile datelor. Format: DOLLAR Latime: 10 Numar zeximale: 0 Valoare stocata: 76806 Format: MMDDYY Latime: 10 Valoare stocata: 15060

23 Formate de afişare

24 Formate de intrare Sunt folosite pentru a citi într-o variabilă date din surse externe. Sunt de trei tipuri: caracter: $INFORMATw. numeric: INFORMATw.d dată/timp: INFORMATw. w semnifică lăţimea unei variabile (în octeţi sau număr de coloane) INFORMAT este un nume opţional de format de intrare SAS d este folosit în cazul datelor numerice pentru a specifica numărul de cifre ale părţii zecimale $ indică prezenţa unui caracter Formatele de intrare (Informat) sunt, de obicei, folosite pentru a citi într-o variabilă date din surse externe numite fişiere flat (fişiere text, fişiere ASCII sau fişiere secvenţiale). Formatele de intrare instruiesc aplicaţiile SAS despre modul în care trebuie să citească datele într-o variabilă SAS. Sunt, de obicei, grupate în trei categorii: caracter, numeric şi dată/timp. Toate formatele de intare trebuie să conţină punctul zecimal (.), astfel încât să se poată face diferenţa între un format de intrare şi o variabilă SAS.

25 Valori lipsă Dacă într-o coloană, valoarea unei date nu există pentru un anumit rând, ea este considerată lipsă. O valoare lipsă de tip caracter este afişată ca spaţiu. O valoare lipsă de tip numeric este afişată ca virgulă sau punct. . . În SAS Enterprise Guide sunt multe funcţii care furnizează opţiuni pentru modul de manipulare a valorilor lipsă, în scopul raportării sau analizei. .

26 Accesarea datelor locale
Fişierul software conţine metadate. Fişierul software nu conţine metadate. Multe formate de fişiere care memorează date sub formă tabelară includ metadate ca parte a tabelei. Metadatele reprezintă informaţii despre datele în sine, cum ar fi originea/sursa datelor, dimensiunea sau formatul lor. Tabelele SAS, MS Access sau dBASE sunt exemple de fişiere care conţin metadate stocate în interiorul lor. Atunci când accesează un astfel de fişier, SAS EG poate accesa metadatele pentru a determina numele unei coloane, tipul (caracter sau numeric) şi lungimea (dimensiunea). Există şi cîteva formate de fişiere, cum ar fi foile de calcul, tabelele HTML sau fişierele text care nu conţin metadate. Pentru aceste tipuri de fişiere, SAS EG trebuie să facă anumite deducţii referitoare la atributele fiecărei coloane. Implicit, SAS EG caută numele coloanei în primul rând al fişierului şi analizează valorile stocate în câmpuri sau celule pentru a stabili dacă o anumită coloană trebuie memorată ca şir de caractere sau ca număr. Dacă se stabileşte că o coloană este de tip caracter, atunci lungimea ei este setată în mod automat ca fiind 255 (octeţi), care este numărul maxim de caractere permis de motorul de baze de date Microsoft Jet.

27 Lucru la seminar Crearea unui proiect nou şi lucrul cu tabele SAS
Adăugarea unei foi de calcul Excel într-un proiect Adăugarea unui fişier text într-un proiect


Download ppt "Curs 2 - Introducere în SAS"

Similar presentations


Ads by Google