FUNDAMENTE STATISTICE ale CONTROLULUI CALITATII

Slides:



Advertisements
Similar presentations
Exemple de bune practici în domeniul SCMI Endre-Sandor ERDŐDI, Manager public, Direcţia de politici publice.
Advertisements

În general exist ă 2 forme mari de conservare : “in situ” şi “ex situ” 1. Conservarea “ in situ” Aceast ă metod ă de conservare const ă în.
Batalia sexelor O lume dominata de barbati vs o lume dominata de femei.
Fizica statistică şi termodinamică Noţiuni din fizica statistică Fizica moleculară studiază proprietăţile fizice ale stărilor de agregare ale corpurilor.
1 const #define DIMENSIUNE 1000 const int DIMENSIUNE = 1000; Utilizarea valorilor constante este importantă, de exemplu, în declararea tablourilor de date.
Present Perfect Continuous prezentare. schema Afirmativ: S + have/has + been + V-ing… Negativ: S + have/has + not + been + V-ing… Interogativ: have/has.
Present Perfect Simple prezentare. Schema de formare: Afirmativ: S + have/has + V(III)/ V(-ed)… Negativ: S + have/has + not + V(III)/ V(-ed)… Interogativ:
-Modelul Entitate-Legatura (ER)-
ACTIVITATEA 1 -,, PROFESOR IT LA PAPI’’
Subinterogări multiple
Subinterogari.
Oracle Academy Lead Adjunct
Funcţii Excel definite de utilizator (FDU) în VBA
Instrumente CASE Curs nr. 7.
PROF. DR. ISAIC- MANIU ALEXANDRU
SOFTWARE Tipuri de software.
Dispozitive de stocare
CREATE, DROP,ALTER INSERT, UPDATE, DELETE
Despre Topologie Ciprian Manolescu UCLA
Structura pipeline a unui procesor MIPS
Paxos Made Simple Autor: Puşcaş Radu George
CURSUL 4 ECONOMETRIE TESTUL HI PATRAT.
EFECTUL LASER.
Reflexia luminii.
METODA BACKTRACKING Examenul de bacalaureat 2012
Amplificatoare operationale Functia de transfer Laplace
Cursul 3 Cautare peste siruri problema cautarea naiva
Algoritmi de combatere a congestiei
Software product management
Generarea modelelor fractale
CONVERSII INTRE SISTEME DE NUMERATIE
Recapitulare La Logica si argumentare
WebSite Social Tema 2 WebSite Social.
MICROSOFT EXCEL.
Analiza erorilor datelor experimentale
Tipuri structurate Tipul tablou
Mase Plastice Capet Vasile Daniel.
Web Form BuilDer Coffee Cup.
Algoritm de crawling optimizat pe similaritate în documente HTML
MICROSOFT EXCEL Notiuni introductive
Formatarea paragrafului
Funcții C/C++ continuare
Erorile de tip I şi II, puterea si marimea esantionului
prof. mrd. Negrilescu Nicolae Colegiul National Vlaicu Voda
Past Perfect Simple prezentare.
ADULTUL DE MIJLOC (continuare).
Biletul la ordin internațional – explicații
INTERNET SERVICII INTERNET.
Eclipsele de soare si de luna
Forms (Formulare).
EFECTUL LASER Achim Anamaria,Vlad Lenuta Clasa a XII a D
A great way to create a channel of communication
SUBSTANTE PURE SI AMESTECURI DE SUBSTANTE
Functia de documentare
Raspunsul la frecventa
Sisteme de recomandare
Programarea in limbajul Java 2004 Lecturer: Gavrila Cristian
Managementul datelor experimentale in investigarea materialelor electrotehnice Compararea performantelor materialelor electrotehnice utilizand datele.
Realizarea prezentarilor cu Microsoft PowerPoint
Software open source in industria software
PARE IMPOSIBIL! GENERALUL DWIGHT D. EISENHOWER A AVUT
Student:Dvornic Mihaela Grupa:342 C5
CECUL INTERNAȚIONAL.
Sistemul de control intern managerial
Refracţia luminii.
XIII. Regimurile politice postbelice
Harti de imagini, Cadre, Stiluri
Despre lamaie.net De ce sunt lamaile acre? Realizatori: Cristina Cazan
Tabele WEB.
ALGORITMI ŞI SCHEME LOGICE
Presentation transcript:

FUNDAMENTE STATISTICE ale CONTROLULUI CALITATII PROF. DR. ISAIC- MANIU ALEXANDRU web www.amaniu.ase.ro e-mail AL.ISAIC-MANIU@CSIE.ASE.RO

STATISTICA -elemente recapitulative Media aritmetică de sondaj (sample average, sample mean-value) Raportul dintre suma tuturor valorilor x observate în eşantionul considerat şi numărul total n al acestora: Observaţii În cazul valorilor observate, aranjate în ordine crescătoare sau descrescătoare: în care: n - numărul total al valorilor observate; ni - frecvenţa absolută corespunzătoare valorii xi; fi - frecvenţa relativă corespunzătoare valorii xi.

Dispersie de sondaj (s2) (Sample variance) Moment centrat de ordinul doi: Valoarea numerică a acestui indicator sintetic caracterizează în modul cel mai adecvat împrăştierea repartiţiei statistice Dispersia de sondaj poate fi folosită ca estimaţie aproximativă a dispersiei din populaţia originară, considerându-se formula corectă:

Dispersie de sondaj (s2) (Sample variance) 1. În cazul valorilor observate, aranjate în ordine crescătoare sau descrescătoare: 2. În cazul valorilor observate, grupate în k clase:

Legea normală (Gauss-Laplace) Una din ipotezele fundamentale in controlul calitatii fiind normalitatea (apartenenţa la legea Gauss-Laplace) a caracterizării investigate este necesar să discutăm despre această lege statistică. Modelul Gauss-Laplace uzual, din punct de vedere matematic reprezintă o repartiţie statistică definită de funcţia de repartitie unde Respectiv functia de frecventa

sau funcţia de densitate a repartitiei variabilei aleatoare X X – mărimea fizică măsurată şi care reprezentată grafic are binecunoscuta formă de „clopot” (aşa-zisul „clopot al lui Gauss”): Se ştie că o funcţie de densitate trebuie să îndeplinească următoarele cerinţe: (i) şi (ii) unde D este domeniul de definiţie al variabilei X, în cazul nostru dreapta reală, R.

Scurt istoric – legea normala (1) Originea acestui model o găsim în lucrarea „Dialog despre cele două sisteme fundamentale ale lumii” a lui Galileo GALILEI (1564-1642), în care el îşi expune părerile referitoare la măsurarea distanţelor dintre diferite corpuri cereşti: Galilei considera că: erorile întâmplătoare sunt inevitabile în observaţiile obţinute cu diverse mijloace de măsurare erorile mici au şanse mai mari de apariţie decât cele mari sau foarte mari măsurările tind să se distribuie aproximativ egal la stânga şi la dreapta unei valori „de referinţă” majoritatea valorilor observate tind să se grupeze („să se aciuiască”) în jurul acestei valori de referinţă erorile aleatoare prezente în procesul măsurării/observării sunt diferite (distincte) de cele ce pot apărea în calculele efectuate de experimentator

( 2 ) Repartiţia normală apare de fapt pentru prima oară în 1733 într-o lucrare a lui Abraham de MOIVRE (1667-1754), matematician cunoscut mai curând prin „formula Moivre” referitoare la numerele complexe Abia odată cu lucrările lui Carl Friedrich GAUSS (1777-1855) şi cele ale lui Pierre Simon, Marquis de LAPLACE (1749-1827) se pun în lumină proprietăţile şi importanţa deosebită a acestei legi statistice ca descriptor – iniţial al comportării erorilor de observaţie (Gauss, 1809 în „Theoria Motus Corpum Caelestium” Laplace (1810/1811 în „Theorie analitique des Probabilites” din 1812) arată rolul teoretic (şi practic) excepţional jucat de legea normală prin aşa-numita TEOREMĂ LIMITĂ CENTRALĂ

(3) Teorema Limita Centrala Această teoremă, menţionată azi şi în diverse documente ISO (de exemplu ISO Guide 13434, Anexa G. pp. 74-75) a constituit fundamentul construirii fişelor de control de tip SHEWHART destinate verificării unui proces (vezi SRISO 8258/1999). Într-o formulare „populară” Teorema Limită Centrală afirmă că: dacă sunt variabile aleatoare continue, identic repartizate cu aceeaşi medie (m) şi aceeaşi dispersie (D2), atunci variabila medie este aproximativ normal repartizată, cu aceeaşi medie (m) dar cu dispersia mai mică şi anume Acest fapt are loc chiar pentru valori modeste ale lui n .

Teorema Limita Centrala Teorema Limită Centrală a deschis drumul spre „universalizarea” legii normale Demograful belgian Adolphe QUETELET (1796-1874) a aplicat repartiţia Gauss-Laplace în cazul măsurărilor antropometrice (1846 „Theorie des Probabilites appliquee aux Science Morale set Politiques”). F.W. BESSEL (1784-18469 opera în mod uzual în această repartiţie la prelucrarea datelor provenite din măsurătorile astronomice. J.C. MAXWELL (1831-1879), creatorul teoriei cinetice a gazelor, este probabil primul fizician care a încercat să modeleze mişcare a gazelor folosind statistica. Iată ce scria el: „Vitezele unor particule care se mişcă în vid sunt repartizate după aceeaşi lege ce guvernează comportarea erorilor în metoda celor mai mici pătrate”

Cateva proprietati ale legii normale ( 1 ) graficul funcţiei are un singur maximum pentru si două inflexiuni de abscise parametrii descriptori şi au semnificaţia mediei şi dispersia teoretice: ; intervalul conţine aproximativ 99,73% din valorile mărimii X.

Cateva proprietati ale legii normale (2) Funcţia de repartiţie, definită ca: Are expresia

Aceste funcţii au fost tabelate iniţial de către Laplace. Variabila se zice variabila normală standard (sau standardizată) şi are funcţia de densitate respectiv de repartiţie sub adică variabila U are media O şi dispersia 1 Aceste funcţii au fost tabelate iniţial de către Laplace.

Momentele centrate de ordin impar sunt toate nule. Valoarea medie, mediana şi moda (valoarea modală) a unei variabile sunt toate egale cu ; Momentele centrate de ordin impar sunt toate nule. Momentele centrate de ordin par au expresia coeficientul de asimetrie (Skewness) este coeficientul de exces (Kurtosis) este Funcţia eroare – erf (x) – are forma: şi corespunde unei densităţi de medie 0 şi dispersie ½ Coeficientul lui GEARY are valoarea:

Grafice ale legii normale

Estimarea parametrilor m şi sigma se face de regulă cu indicatorii de eşantionaj respectiv Legea normală este stabilă, adică dacă sunt variabile de tipul , atunci este tot o variabilă normală, cu media si dispersia

Repartiţia t (STUDENT) dacă sunt independente, cu parametrii variabila se numeşte variabila STUDENT (sau „t”) şi joacă un rol important în experimentele privind compararea a două medii normale (adică a mediilor a două populaţii caracterizate de legea normală )

Repartiţia t (STUDENT) Densitatea de tip t are forma: unde este binecunoscuta funcţie GAMMA a lui EULER (1707-1783).

Repartiţia t (STUDENT) Denumirea STUDENT provine de la chimistul şi statisticianul britanic William Sealy GOSSET (1876-1937) care a lucrat la o celebră fabrică de bere din Dublin, în calitate de supervizor al procesului de fabricaţie al acestui produs, apreciat azi pe întreg mapamondul ,Gosset a avut ca „sarcină de serviciu” – printre altele – şi compararea calităţii berii produse de firma respectivă cu cea a concurenţilor acesteia.

Repartiţia t (STUDENT) Astfel s-au născut primele experimente de comparare a calităţii medii, folosind un instrument statistic. Din cauză că patronii fabricii respective nu permiteau angajaţilor o activitate publicistică sub propriul nume, Gosset şi-a ales pseudonimul STUDENT, cu care şi-a semnat toate lucrările, publicate în principal în celebra revistă” BIOMETRIA” >înfiinţată în 1900 de GALTON şi PEARSON.

Testarea normalităţii Verificarea faptului că datele experimentale obţinute sunt repartizate după legea Gauss-Laplace se poate face în mai multe moduri, şi anume: algebric (utilizând indicatorii de eşantionaj cu proprietăţile lor specifice în cazul legii normale); grafic (folosind aşa-numitele „hârtii” sau reţele de tip probabilist) analitic (utilizând procedee statistice speciale – aşa numitele „teste de concordanţă”).

Testarea normalităţii Metoda algebrică este foarte simplă dar este relativ subiectivă deoarece calculând indicatorii de eşantionaj şi anume: Media: mediana: coeficientul de asimetrie coeficientul de exces coeficientul lui Geary

Testarea normalităţii (1) este dificil de dat o marjă a aproximărilor şi care ar caracteriza legea normală. Oricum, dacă „apropierile” respective nu au loc (de ex. este limpede că nu mai are rost să facem apel la metode mai sofisticate pentru a depista normalitatea, deoarece valorile asimetriei şi excesului indică tocmai nenormalitatea datelor.

Testarea normalităţii ( 2) Metoda grafică sau „metoda RP” (a reţetelor probabiliste) a fost pe larg descrisă în limba română în monografia Wiener-Isaic-Maniu şi Vodă (1983) Pe scurt, RP normală este o hârtie format A4 Într-un anume mod, pe axa verticală fiind fixate valorile (estimaţii ale funcţiei de repartiţie) datele pe care experimentatorul s-i le calculează în cazul său concret, datele fiind ordonate şi înregistrate pe axa orizontală.

RETELE PROBABILISTE

Testarea normalităţii ( 4 ) Metodele analitice fac apel la un capitol special al teoriei verificării ipotezelor statistice, şi anume la testele de concordanţă („goodness-of-fit” tests) care realizează verificarea concordanţei repartiţiei emprice (pusă în evidenţă de datele experimentale) cu repartiţia teoretică presupusă că „îmbracă” adecvat, că „se mulează„ cel mai bine pe această repartiţie empirică.

Testarea normalităţii ( 5 ) Verificarea concordanţei se poate face fie cu teste generale, adică procedee aplicabile pentru orice model statistic presupus potrivit pentru datele observate, fie teste speciale, destinate unui anume tip de model statistic – de exemplu, cel normal. Aceste teste se numesc chiar teste de normalitate sau verificarea normalităţii. Există evident şi teste pentru verificarea exponeţiabilităţii a weibullităţii *etc *) de la numele inginerului suedez W.WEIBULL (1900-1979) care în 1939 a propus o repartiţie statistică pentru descrierea fenomenului defectării care azi îi poartă numele (vezi Al. Isaic-Maniu, METODA WEIBULL,Ed.Academiei Romane ,1986 )

Testarea normalităţii( 6 ) Cele mai cunoscute teste generale sunt testul (HI-PĂTRAT), creat de Karl Pearson încă în 1899 şi aplicabil pentru eşantioane de efectiv mare (de dorit valori măsurate; Pearson este „responsabil” şi de inventarea tremenului goodness-of-fit, în 1895 în lucrarea sa „Contributions to the mathematical theory of evolution. II. Skew variation in hemogeneous material”, în Phil. Trans. Roy. Soc. London, Ser. A, vol. 186, pp. 343-414). Respectiv testul KOLMOGOROV-SMIRNOV aparţinând matematicienilor ruşi Andrei Nicolaevici Kolmogorov (1903-1987) şi Nikolai Vasilevici Smirnov (1900-1966) în două lucrări şi anume „Sulla determinazione empirica di una legge di distribuzione” (Kolmogorov, în „Giornale dell’Instituto Italiano degli Attanari”, 1933, vol. 4, pp. 83-91) şi „Sur la distribution de ” (Smirnov, în „Comptes Rendue de l’Academic des sciences de Paris”, 1936, vol. 202, pp. 449-452).

Testarea normalităţii ( 7 ) Teste speciale de normalitate le putem clasifica în funcţie de efectivul eşantionului pe care se lucrează: teste pentru eşantioane mici (de regulă, ) – de exemplu testul Shapiro-Wilk (1965) sau testul Filliben (1975); teste pentru eşantioane moderate (de obicei – de pildă testul lui D’Agostino (1971); teste pentru eşantioane mari (eventual ) – de exemplu testul coeficienţilor pearsonieni şi . Toate aceste procedee au fost prezentate în literatura de specialitate înlimba română, aşa că nu le mai reluăm aici. Mai menţionăm existenţa documentului ISO 5479-1997 „Tests for departure from the normal distributin” – tradus şi în limba română sub titlul „Teste pentru verificarea depărtării de la normalitate” (SRISO 5479).

Testul HI - patrat Regiunea critică a testului pentru verificarea ipotezei p1 = p2 = … = pm se construieşte pe baza indicatorului statistic de forma: care pentru are repartiţia cu n – 1 grade de libertate

Echivalenţii englezeşti ai termenilor specifici ANOVA, DOE cât şi a celor conecşi se află în recentul apărut „Dicţionar de statistică generală”(coordonator Al. Isaic-Maniu, Bucureşti, Editura Economică, 2003