1 L’analyse de variance Philippe DELEPORTE UMR Eco&Sols.

Slides:



Advertisements
Similar presentations
Quelques fois tu te sens un peu hors du temps. Tu sens ton espace vital rétrécir ?
Advertisements

Mars 2011 ATELIER EPIGENETIQUE Utilisation de la Q-PCR pour analyser des données de ChIP ou de MeDIP Emmanuèle Mouchel-Vielh.
2.2:Les courants océaniques
Exercice n°1 a) Pour un faisceau de photons mono-énergétiques traversant un écran D’épaisseur « x » on a : N (x) = N 0 e -  x Avec N (x) = nombre de.
En plein désert de Karakoum (Turkménistan ) près de la petite localité de Darvaza, se trouve un cratère d’une cinquantaine de mètres de diamètre et.
1 Le C.C.F. en Baccalauréat Professionnel T.I.S.E.C. T.I.S.E.C. T.M.S.E.C T.M.S.E.C T.F.C.A T.F.C.A.
Perles d’avocats Voici une sélection de questions réellement posées à des témoins par des avocats durant des procès aux Etats-Unis et, dans certains.
Cours 9 Les protocoles de niveau trame. La trame LAP-B Le protocole LAP-B (Link Access Protocol - channel B) est une trame qui a été normalisée pour transporter.
TICE 2 ième Semestre Fonctions « logiques ». Février 2006TICE 2ième Semestre - Les fonctions logiques2 Petits rappels… Une formule est toujours de la.
EuropeanEuropean SectionsSections Sommaire Slide 1 : Interview de M Bulow – professeur d’anglais ; Slide 2 : Présentation des deux sections : HG-IGC-management.
Estimer La somme et la différence de grands nombres.
Génération de résidus Par observateur d’état (1)
La Charte de la laïcité expliquée par les élèves de 5ème B, C et D.
Clic. Après chaque vol, les pilotes établissent un formulaire dans lequel ils informent les mécaniciens au sol des problèmes qu‘ils ont rencontrés pendant.
Edit the text with your own short phrases. The animation is already done for you; just copy and paste the slide into your existing presentation. This animation.
Activités mathématiques autour du jeu de bridge Séance 1 1.
INSTITUT NATIONAL DE LA STATISTIQUE DU CAMEROUN COMMISSION ECONOMIQUES DES NATIONS UNIES POUR L’AFRIQUE Port Louis juillet 2010.
1 Cours UBO 2007 UE – BASES DE DONNEES OCEANOGRAPHIQUES Le portail NAUTILUS accès en ligne aux données et site WEB du SISMER Michèle FICHAUT.
ESPACE NUMERIQUE PERSONNEL (ex-coffre fort numérique) 1 PRESENTATION.
MIGRATION VERS ATRIUM Présentation Etapes Attentes / Objectifs.
TEST QUIZ Grammaire Conjugaisons & Les groupes des verbes À quel groupe appartient le verbe: aimer ? Premier groupe Premier groupeaimer Deuxième groupe.
Enregistrement de la paie Gestion sociale P2 LYCEE CAMUS Nantes.
Un bon cœur vaut plus que toutes les têtes du monde.
Capteurs de vitesse de rotation de roue ATE. 2 Pourquoi utiliser les capteurs de vitesse de rotation de roue ATE ? Un besoin de plus en plus grand de.
UniGe | FPSE | Pratiques pédagogiques et institutions scolaires Prochains ateliers de lecture : Lu 04.04, 12h15, M5020 Ma 12.04, 12h15, M3389 Texte : Mottier.
Pour plus de modèles : Modèles Powerpoint PPT gratuitsModèles Powerpoint PPT gratuits Page 1 Définition d’une tâche complexe.
Règle de non-contradiction Mgr Dominika Topa-Bryniarska Université de Silésie.
Titre: L’analyse des facteurs influents la production de coton en Afrique de l’Ouest 1. Les contraintes de la filière 2. La Dimension économétrique de.
Chapitre 24 Vérifiez votre compréhension p Morholt est important parce qu’il est à l’origine de toute cette histoire.
Réalisé par : Sébastien Lachance MATHS 3 E SECONDAIRE Les figures SEMBLABLES.
Les écarts entre prise de décision et dynamique de changement dans l’usage de l’information chiffrée à l’échelle de l’établissement scolaire Romuald Normand.
Monsieur le maître d’école. Monsieur le maître d’école. Une chanson de Bourvil en hommage à tous les maîtres des écoles. Une production de.
Mathématiques CST MODULE 6 L’optimisation de GRAPHES.
Dedicated Research Avenue Brugmann 216Tel: www.dedicated.be B-1050 Brussels - BelgiumFax: Etude sur l’évaluation.
Le système politique français Une démocratie parlementaire (mais…)
26/09/2007 La participation des enfants de 10 à 18 ans 1 Introduction La participation: un des quatre principes fondamentaux de la CIDE Les enfants sont-ils.
Fonctionnement de notre nouvelle Q-PCR
Le lion De Candice 1. L’identité du lion : Le mâle s’appelle le lion, la femelle la lionne et le petit le lionceau. Le lion pèse 150 kg à 220 kg. Il mesure.
Voitures aux carrières longues. La Volkswagen Coccinelle (1938 – 2003) : Vendue à plus de 25 millions d’exemplaires, la « Cox » est la star de ce top.
Utilisation du spectrophotomètre. Allumer l’appareil Puis allumer l’ordinateur (commun au spectro et à la Q-PCR) Utilisation du spectrophotomètre Ouvrir.
Février 2014 GPU / Xeon Phi Calcul de fonction de corrélation à 2 points sur un grand nombre de galaxies Image : collaboration SDSS Problème : pour effectuer.
Présente ….. Accédez ici à votre compte une fois inscrit(e) Nouvel utilisateur? Créez votre compte
Début Illustration dans le plan complexe du repliement spectral lors de l’échantillonnage d’un mouvement régulier de rotation dont on modifie la fréquence.
AMPERES Enseigner de façon dynamique le produit scalaire en 1re S ?
1 TRAAM 2011 Domaine d’application Confort et domotique Domaine d’application Confort et domotique Présenté Par Grégory ANGUENOT.
Première rencontre internationale des territoires de coresponsabilité Intervenants : M. RICHERT – Mme ROESSLINGER-KACEM – Mlle BOUFELAAS Vendredi 25 septembre.
Association canadienne des optométristes Myopie. La myopie est un problème visuel qui fait que l’œil peut voir clairement les objets proches, mais ne.
Retour aux sources (Back to basics) Partie 1. Introduction Those who don’t know statistics are condemned to reinvent it… David Freedman David Freedman.
IFT359 – Programmation fonctionnelle Thème 10 Extension syntaxique II pattern  motif template  gabarit 1.
Guide de l'enseignant SolidWorks, leçon 4 Nom de l'établissement Nom de l'enseignant Date.
En informatique dans les nuages, des éléments de l'informatique interne deviennent un service que les entreprises et les administrations louent comme.
Les Facteurs qui influencent l’accroissement de la population CGC1D ~ Géographie du Canada.
TP2: Statistique & Probabilité. avec f i fréquence absolue (cf. WONNACOTT et WONNACOTT, 4e éd., chapitre 2) Une station balnéaire décide de réaliser une.
Changement de sonorité Utilisation de S.A., etc. Edition de multi-pads.
Hospitalisations de plus de 24h des patients VIH+ suivis à Cochin de juin 2009 à juin 2010 Pr Dominique SALMON CERON Dr Valérie PERUT Dr Gwenaëlle VIDAL.
La synthèse des protéines
Introduction. Multi-Tâches Création de CPU virtuelles Economique en matériel Nécessite une couche de logicielMulti-Cœur L’UC fait « plusieurs choses.
Modifications des règles de fonctionnement Séance plénière de la CLE Réunion du 11 janvier 2016.
Un module éducatif du district de l’est du Canada et des Caraïbes
Tâche 4 Quelques propositions méthodologiques pour suivre le(s) cycle(s) de vie d’une ressource Séminaire ReVEA, juillet 2015, Loriol Catherine Loisy et.
1 "Le Multimédia dans l'enseignement aux FUNDP : nouveaux plaisirs d'apprendre ?"
CopiesEnLigne (CEL) TUTORIEL INTERACTIF
Le détecteur BiPo pour la mesure de la radio-pureté des sources ββ de SuperNEMO Jérémy ARGYRIADES, LAL Orsay.
Les résultats obtenus de l'enquête sur les médias sont exprimés avec porcentages pour faciliter son observation et analyse.
Nahela Robert & Lisa Goll. Qu'est ce que Twitter ? Twitter est un réseau social, permettant de suivre les actualités d’une personne, d’une association,
Les 8 types de nuages les plus spectaculaires qui flottent au- dessus de votre tête par Paulajo.
L’objectif est de connaitre l’anatomie de l’abdomen et d’en prendre en charge les pathologies. Traumatisme de l’abdomen.Objectifs  Introduction  Rappels.
Densité et masse volumique. Imaginons que nous prenions deux cylindres, de même volume, constitués avec des métaux différents. En les pesant, nous trouvons.
Dynamic Host Configuration Protocol 1 DHCP. Introduction Lorsque vous connectez une machine à un réseau Ethernet TCP/IP, cette machine, pour fonctionner.
LES TOLERANCES ET AJUSTEMENTS Suite ENPEI. LES TOLERANCES 1- LES AJUSTEMENTS 2- ALESAGE - TOLERANCES FONDAMENTALES 3- ARBRE - TOLERANCES FONDAMENTALES.
Presentation transcript:

1 L’analyse de variance Philippe DELEPORTE UMR Eco&Sols

2 Le modèle statistique Quel est le modèle statistique du plan à un facteur (effets fixés) ? Quel est le modèle statistique du plan à un facteur (effets fixés) ? Y ij est le résultat mesuré sur la j ième UE de la i ième modalité Y ij est le résultat mesuré sur la j ième UE de la i ième modalité = modèle de l’échantillonnage stratifié = modèle de l’échantillonnage stratifié = modèle « complètement aléatoire » = modèle « complètement aléatoire » Effet moyen Effet de la modalité i résidu

3 But Rejeter l’hypothèse nulle : Rejeter l’hypothèse nulle : Absence totale d’effet du facteur Absence totale d’effet du facteur Hypothèses alternatives Hypothèses alternatives

4 La décomposition des sommes de carrés d’écarts Considérons un écart à la moyenne des valeurs observées Considérons un écart à la moyenne des valeurs observées Intercalons dans cet écart la moyenne des individus d’une modalité Intercalons dans cet écart la moyenne des individus d’une modalité

5 Graphiquement Modalité 1 Modalité 2 Modalité 3 (i )

6 Elevons au carré

7 Sommons Sur toutes les unités Sur toutes les unités

8 Et finalement

9 Notations commodes SCE T : Somme des carrés des écarts totale SCE T : Somme des carrés des écarts totale SCE B : Somme des Carrés des Ecarts Inter (Between) SCE B : Somme des Carrés des Ecarts Inter (Between) Ou factorielle Ou factorielle SCE W : Somme des Carrés des Ecarts Intra (Within) SCE W : Somme des Carrés des Ecarts Intra (Within) Ou résiduelle Ou résiduelle SCE T = SCE B + SCE W SCE T = SCE B + SCE W T = B + W T = B + W

10 Sous H o Au produit par les « degrés de liberté » près Au produit par les « degrés de liberté » près Toutes ces sommes de carré mesurent la même chose Toutes ces sommes de carré mesurent la même chose

11 En particulier Sous H 0, « variance » inter et « variance » intra sont égales en espérance Sous H 0, « variance » inter et « variance » intra sont égales en espérance Et donc

12 Sous H 1

13 D’où la statistique F de Fisher : F de Fisher : Si F est « assez grand », on décidera que le facteur a un effet Si F est « assez grand », on décidera que le facteur a un effet

Cela dépend des hypothèses sur les erreurs Cela dépend des hypothèses sur les erreurs Si les erreurs sont : Si les erreurs sont : indépendantes deux à deux indépendantes deux à deux distribuées normalement distribuées normalement avec une espérance nulle avec une espérance nulle et une variance uniforme   indépendante de la modalité i et une variance uniforme   indépendante de la modalité i Le numérateur est distribué comme un  2 à p – 1 degrés de liberté Le numérateur est distribué comme un  2 à p – 1 degrés de liberté Le dénominateur est distribué comme un  2 à n – p degrés de liberté Le dénominateur est distribué comme un  2 à n – p degrés de liberté F est alors distribué comme une variable de Fisher – Snedecor à (p – 1) et (n – p) degrés de liberté F est alors distribué comme une variable de Fisher – Snedecor à (p – 1) et (n – p) degrés de liberté 14 Comment est distribué F ?

15 Pour rejeter H o ? Pour rejeter H o ? On peut utiliser une table On peut utiliser une table Exemple : F =4.8, dl1 = 4, dl2 = 44 Exemple : F =4.8, dl1 = 4, dl2 = 44 F est-il assez grand

16 Décision Sur la base de la table précédente Sur la base de la table précédente la valeur supérieure limite est 2.58 la valeur supérieure limite est 2.58 le seuil de la table est  = 0.05 le seuil de la table est  = est supérieur à est supérieur à 2.58 on déclare l’effet du facteur significatif au seuil  = 0.05 on déclare l’effet du facteur significatif au seuil  = 0.05

17 Le tableau d’analyse de variance Source SCE (SSQ) ddl (df) CM (MS) Fp Totaln-1 SCE T /(n-1) Inter (B) p-1 SCE B /(p-1) CM B /CM W p (F>=Fobs) Intra (W) n-p SCE W /(n-p) Note : R ne fournit pas la somme des carrés des écarts totale. On sait qu’on peut la retrouver en additionnant les autres sources de variation

18 Ecriture matricielle Y = Xβ + ε = modèle linéaire Y = vecteur des Y ij X = matrice d’incidence (0 ; 1) β = vecteur des régresseurs (paramètres) ε = vecteur des résidus

19 Validité des résultats ε ij sont iid i = indépendants id= identiquement distribués loi normale (0, σ)

Graphiques Graphiques Histogramme des résidus Histogramme des résidus Droite de Henry des résidus Droite de Henry des résidus Résidus en fonction de l’estimée Résidus en fonction de l’estimée Résidus en fonction de l’ordre des données Résidus en fonction de l’ordre des données Tests Tests Normalité des résidus Normalité des résidus Kolmogorov, Shapiro-Wilks, … Kolmogorov, Shapiro-Wilks, … Egalité des variances (homoscédasticité) Egalité des variances (homoscédasticité) Bartlett, Hartley, Levene, … Bartlett, Hartley, Levene, … A relativiser (Anova « robuste » aux écarts aux hypothèses) (en particulier quand plan équilibré) A relativiser (Anova « robuste » aux écarts aux hypothèses) (en particulier quand plan équilibré) 20 Comment contrôler la validité des résultats ?

21 Résumé L’analyse de variance permet de juger l’effet de tout un ensemble de modalités L’analyse de variance permet de juger l’effet de tout un ensemble de modalités On compare une estimation de la variance interindividuelle On compare une estimation de la variance interindividuelle à partir de la somme des carrés des écarts inter (B) à partir de la somme des carrés des écarts inter (B) et à partir de la somme des carrés des écarts intra (W) et à partir de la somme des carrés des écarts intra (W) par la statistique F de Fisher par la statistique F de Fisher Il nous reste à comparer les modalités Il nous reste à comparer les modalités

22 Plans à deux facteurs Croisement, hiérarchie, interaction, orthogonalité

23 Les facteurs peuvent être Croisés Emboîtés (nested) ou hiérarchiques Fixes ou aléatoires Etudiés ou contrôlés

24 A) Facteurs croisés A1 : modèle additif A1 : modèle additif Effets indépendants Effets indépendants A2 : modèle interactif A2 : modèle interactif Effets particulier de chaque combinaison de modalités Effets particulier de chaque combinaison de modalités A3 : modèles croisés non orthogonaux A3 : modèles croisés non orthogonaux

25 Modèle croisé additif Deux facteurs sont dits croisés si on peut classifier leurs modalités dans une table à double entrée Deux facteurs sont dits croisés si on peut classifier leurs modalités dans une table à double entrée Exemple : Sexe et altitude dans le jeu de données anatalanta Exemple : Sexe et altitude dans le jeu de données anatalanta Les moyennes par ligne et par colonne de la table obtenue ont un sens Les moyennes par ligne et par colonne de la table obtenue ont un sens

26 Ecriture du modèle (fixe) Effets fixes Effets fixes Effet « moyen » Effet du facteur 1 Effet du facteur 2 Aléatoire erreur résidu

27 Ecriture du modèle (aléatoire) Effets aléatoires Effets aléatoires Effet « moyen » Effet du facteur 1 (aléatoire) Effet du facteur 2 (aléatoire) Aléatoire erreur résidu

28 Modèle mixte Effets fixés et aléatoires Effets fixés et aléatoires Effet « moyen » Effet du facteur 1 (fixé) Effet du facteur 2 (aléatoire) Aléatoire erreur résidu

29 Votre responsabilité Déclarer un facteur comme fixe ou aléatoire est de votre responsabilité Déclarer un facteur comme fixe ou aléatoire est de votre responsabilité Fixe : chaque modalité vous intéresse Fixe : chaque modalité vous intéresse Aléatoire : chaque modalité n’est pour vous qu’une unité d’échantillonnage (grappe) Aléatoire : chaque modalité n’est pour vous qu’une unité d’échantillonnage (grappe) Exemple : choix judicieux pour anatalanta Exemple : choix judicieux pour anatalanta Sexe : facteur fixé Sexe : facteur fixé Altitude : facteur fixé Altitude : facteur fixé Station : facteur Station : facteur Fixé si chaque station est un objet d’étude Fixé si chaque station est un objet d’étude Aléatoire si les stations ne représentent que la variabilité du terrain Aléatoire si les stations ne représentent que la variabilité du terrain

30 Exemple Littoral(1)Altitude(2) Mâles(1) X 111 X 112 x 113 X 121 X 122 x 123 Femelles(2) X 211 X 212 x 213 X 221 X 222 X 223

31 Exemple > read.table("anatal.txt",h=T)->anatal > attach(anatal) > anatal$sexe anatal$sexe<-factor(sexe) > anatal$station anatal$station<-factor(station) > anatal$altitude anatal$altitude<-factor(altitude) > summary(anatal) Sexe, station et altitude doivent apparaître comme des facteurs Sexe, station et altitude doivent apparaître comme des facteurs

32 Exemple : facteurs croisés > Analysis of Variance Table Response: Lo Df Sum Sq Mean Sq F value Pr(>F) Df Sum Sq Mean Sq F value Pr(>F) sexe * altitude e-05 *** Residuals Signif. codes: 0 `***' `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1

33 Orthogonalité Deux facteurs croisés sont dits orthogonaux si leurs nombres de répétitions par ligne, colonne et case vérifient la relation suivante : Deux facteurs croisés sont dits orthogonaux si leurs nombres de répétitions par ligne, colonne et case vérifient la relation suivante : L’équilibre est un cas particulier

34 Conséquence de l’orthogonalité Si deux facteurs croisés sont orthogonaux, les sommes de carrés d’écart correspondants sont additifs et ajustés Si deux facteurs croisés sont orthogonaux, les sommes de carrés d’écart correspondants sont additifs et ajustés Le type I est absolument correct pour chaque facteur Le type I est absolument correct pour chaque facteur Sinon, ils sont partiellement confondus (confounding) et doivent être analysés en type III Sinon, ils sont partiellement confondus (confounding) et doivent être analysés en type III

35 Orthogonalité et planification expérimentale On utilise couramment des plans non orthogonaux par construction On utilise couramment des plans non orthogonaux par construction Plans en blocs incomplets équilibrés (BIE) Plans en blocs incomplets équilibrés (BIE) Plans en blocs incomplets partiellement équilibrés (BIPE) Plans en blocs incomplets partiellement équilibrés (BIPE) Plans fractionnaires Plans fractionnaires

36 Interaction dans le modèle croisé Et test de l’interaction

37 Exemple : facteurs croisés >anatal.mod1<-lm(Lo~sexe*alt,data=anatal) > anova(anatal.mod1,ssTypes=3) Analysis of Variance Table Response: Lo Df Sum Sq Mean Sq F value Pr(>F) Df Sum Sq Mean Sq F value Pr(>F) sexe * altitude e-05 *** sexe:altitude Residuals

38 Modèle additif et interactif mâles femelles Littoral altitude mâles femelles Littoral altitude

39 Ecriture Modèle additif Modèle additif Modèle interactif Modèle interactif

40 Ordre des interactions Ordre 1 : facteurs deux à deux Ordre 1 : facteurs deux à deux Ordre 2 : facteurs trois à trois Ordre 2 : facteurs trois à trois … etc … etc Notations logicielles Notations logicielles R : f1:f2, f1:f2:f3, f1*f2 = f1+f2+f1:f2 R : f1:f2, f1:f2:f3, f1*f2 = f1+f2+f1:f2 SAS, minitab : f1*f2, f1*f2*f3 SAS, minitab : f1*f2, f1*f2*f3

41 b) Facteurs hiérarchisés Représentation par un arbre Représentation par un arbre Facteur 1 (hiérarchisant) Facteur 2 (hiérarchisé)

42 Modèle hiérarchique Comment écrit-on le modèle ? Comment écrit-on le modèle ? Effet du facteur 1 (hiérarchisant) Effet du facteur 2 (hiérarchisé)

43 Anatalanta  : sexe  : sexe  : altitude  : altitude D : station D : station Aléatoire Aléatoire Hiérarchisée sous altitude Hiérarchisée sous altitude

44 Analyse d’un facteur hiérarchisé > attach(anatal) > mod5<-lm(Lo~sexe+altitude+station %in% altitude) > anova(mod5) Analysis of Variance Table Response: Lo Df Sum Sq Mean Sq F value Pr(>F) sexe ** altitude e-06 *** altitude:station < 2.2e-16 *** Residuals Signif. codes: 0 `***' `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1

Quand les conditions de l’analyse de variance non respectées ? 45 Si les erreurs ne sont pas Si les erreurs ne sont pas Indépendantes deux à deux Indépendantes deux à deux Distribuées normalement Distribuées normalement Avec une espérance nulle Avec une espérance nulle Et une variance uniforme   indépendante de la modalité i Et une variance uniforme   indépendante de la modalité i

Si les erreurs ne sont pas Si les erreurs ne sont pas Distribuées normalement Distribuées normalement  modèle linéaire généralisé (GLM)  L’erreur  Loi Binomiale, Loi exponentielle (Beta, Exponentielle, Gamma, Poisson, ….)  Même modèle que l’analyse de variance, mais fonction de lien, erreur modélisée différemment et procédure ML ou REML  Test H 0 (F) différent : test de Wald, … Indépendantes Indépendantes  modèle mixte (lme4, lmer, GLIMMIX)  Structure de dépendance des erreurs (nombreux types comme AR(1), VC (variance components), UN (unstructured)  ! Prend des DDL Une variance uniforme indépendante des traitements Une variance uniforme indépendante des traitements  modèle mixte (lme4, lmer, GLIMMIX) 46

47

48 Mesures répétées (dans le temps ou/et espace) Mesures répétées (dans le temps ou/et espace) MANOVA MANOVA Plusieurs variables « réponses » (y) Plusieurs variables « réponses » (y) Modèles mixtes Modèles mixtes 1 seule var. réponse 1 seule var. réponse Structure de dépendance des y à différentes dates, …. Structure de dépendance des y à différentes dates, ….