StatEL : Analyse de la Covariance (ANCOVA)
 
Cette commande lance la procédure d'Ancova qui découle à la fois de l'Anova à 1 facteur et de la régression linéaire simple. Elle peut être utilisée dans 2 cas de figure qui, bien que différents d'un premier abord, résultent en fait de la même problématique :
  • la comparaison de moyennes d'un paramètre quantitatif mesuré entre différents groupes, dont on aurait fixé l'influence d'une seconde variable quantitative,
  • la comparaison de plusieurs modèles de régression linéaire simple.


1 - Principes du test d'Ancova

Considérons la variable quantitative "Fréquence Cardiaque" (FC) dont on souhaite comparer la valeur moyenne mesurée chez K groupes de sujets, soumis chacun à une médicament différent. On décide d'effectuer une Anova à 1 facteur pour comparer les K moyennes de FC afin de détecter s'il existe un groupe dont la moyenne de FC diffère significativement des autres. Une fois réalisée, cette Anova à 1 facteur montre qu'aucun des K groupes étudiés ne présente une FC moyenne différente des autres groupes. On en conclut l'absence d'influence des différents médicaments testés.

Toutefois, l'échantillonnage réalisé, comme il se doit, de façon aléatoire, a naturellement conduit à répartir des sujets d'âges différents au sein de chaque échantillon. Or, la FC étant un paramètre largement influencé par l'âge du sujet, la conclusion de notre Anova à 1 facteur a été biaisée. Cela s'explique par le fait que, dans chaque groupe, la variabilité inter-sujets est suffisament importante pour "masquer" l'influence du facteur qualitatif étudié par l'Anova, à savoir la nature du médicament.

Pour réduire ce biais induit par la variable âge, on est amené à réaliser une Ancova qui permet de fixer l'influence de l'âge sur notre mesure de FC. On appelle la variable âge la "covariable" de notre Ancova. Au final, les mesures de variances liées au facteur étudié (nature du médicament) et résiduelle (dûe à la variabilité entre les sujets) sont calculées de telle sorte qu'on a supprimé l'influence liée à l'âge ; un peu comme si on avait réalisé tout le protocole avec des sujets qui auraient eu le même âge. Les mesures de FC sont "ajustées" sur la covariable âge.

L'analogie avec la comparaison de plusieurs modèles de régression linéaire simple résulte du raisonnement suivant :

  • si la variable quantitative étudiée (FC) est influencée par une covariable (âge), il existe un modèle de régression entre les 2 avec l'âge en abscisse et la FC en ordonnée (l'Ancova impose comme condition qu'il s'agisse de modèles de régression linéaire simple),
  • chaque modèle de régression linéaire simple est caractérisé par une des modalités du facteur qualitatif étudié (chaque modèle "FC = Age x Pente + Constante" correspond à un médicament étudié),
  • fixer l'influence de la covariable revient à calculer pour chaque modèle la valeur de FC ajustée par rapport à l'âge, c'est à dire pour une valeur de "Age" = 0 ; au niveau des modèles de régression, cela conduit à comparer les valeurs des constantes (ou ordonnées à l'origine) puisqu'elles représentent la valeur de Y (ici FC) lorsque X = 0 (ici l'âge),
  • la comparaison des constantes des modèles de régression linéaire n'est envisageable que si les pentes des différents modèles sont homogènes car si celles-ci sont au départ significativement différentes, il n'est plus possible de comparer les ordonnées à l'origine ; on est donc amené à comparer les pentes de différents modèles de régression linéaire.



1.1. Conditions d'utilisation de l'Ancova

Celles-ci sont nombreuses à réaliser et malmènent souvent la significativité des conclusions de l'Ancova.

  • Il doit exister une relation linéaire entre la variable quantitative étudiée (qui servira de Y sur un graphique) et la covariable (qui servira de X sur un graphique). Vous êtes donc invités à réaliser des études des différents modèles de régression linéaire simple entre variable et covariable pour chacune des modalités du facteur qualitatif étudié, via la fonction ad hoc de StatEL.
  • La covariable doit impérativement être libre de toute influence du paramètre qualitatif étudié (dans notre exemple ci-dessus, l'âge n'est pas influencé par la nature du médicament).
  • La liaison entre variable (Y) et covariable (X) ne doit pas être influencée par le paramètre qualitatif étudié, cela revient à comparer les pentes des différents modèles de régression linéaire entre Y et X et s'assuer que celles-ci ne diffèrent pas significativement les unes des autres.
  • A ces conditions d'utilisationspécifiques à l'Ancova s'ajoutent bien évidemment les conditions inhérentes aux tests paramétriques, à savoir la normalité des distributions et l'homogénéité des variances



1.2. Hypothèses testées au cours de l'Ancova

Concernant l'étude de relations linéaires simples entre Y et X, il s'agit de tester la significativité les K pentes des K modèles par rapport à 0.

  • Hypothèse nulle : "H0 = la pente "a" du modèle Y = aX + b n'est pas significativement différente de 0"
  • Hypothèse alternative : "H1 = la pente "a" du modèle Y = aX + b est significativement différente de 0"


Concernant l'influence du paramètre qualitatif étudié sur la covariable, il s'agit de tester s'il existe une différence significative entre les K moyennes de la covariable.

  • Hypothèse nulle : "H0 = µXi = µXj = ... = µXk"
  • Hypothèse alternative : "H1 = il existe au moins une moyenne de la covariable significativement différente des autres"


Concernant l'influence du paramètre qualitatif étudié sur la relation entre la variable et la covariable, il s'agit de tester s'il existe une différence significative entre les K pentes des K modèles de régression linéaire.

  • Hypothèse nulle : "H0 = ai = aj = ... = ak"
  • Hypothèse alternative : "H1 = il existe au moins une pente significativement différente des autres"


Concernant l'influence du paramètre qualitatif étudié sur la variable, il s'agit de tester s'il existe une différence significative entre les K moyennes de la variable, ajustées sur la covariable.

  • Hypothèse nulle : "H0 = µYi = µYj = ... = µYk"
  • Hypothèse alternative : "H1 = il existe au moins une moyenne ajustée de la variable significativement différente des autres"



2 - Lancement du test d'Ancova :

Vous êtes invités à préciser dans quel but vous êtes amenés à réaliser une Ancova, le seul intérêt est de vous proposer l'affichage des résultats sous la forme la plus pertinente. Quel que soit votre choix, vous pouvez préciser si les mesures de la covariable sont fixées a priori, cela permettra d'éviter l'analyse de la normalité de leurs distributions.

ancova

Vous êtes ensuite invités à préciser le format des données sur lesquelles vous travaillez.

ancova

Vous avez la possibilité de travailler sur des données agencées sur 3 colonnes (une par variable) ou ordonnées selon la K modalités du facteur qualitatif étudié.

ancova

ancova

La procédure se poursuit par une boîte de dialogue vous permettant de préciser les modalités réunies par la variable qualitative étudiée :

ancova

Il vous est ensuite demandé de sélectionner la plage de cellules correspondant à chacune des variables. Pour procéder à la sélection, il vous suffit de cliquer sur la première cellule de votre série de données et de faire glisser la souris jusqu'à la dernière valeur.

En cas d'erreur, refaîtes simplement votre sélection, celle-ci viendra effacer votre précédente sélection dans la boîte de dialogue sans que vous ayez à annuler quoi que ce soit.

ancova

En cas de rejet de l'hypothèse H0 concernant l'influence du paramètre qualitatif étudié sur la variable, une boîte de dialogue vous propose de pratiquer 5 tests a posteriori. Vous êtes libre de choisir parmi :
  • le test de Fisher accompagné des corrections de Bonferroni et de Sidak,
  • le test HSD de Tuckey,
  • le test de Stdent, Newman & Keuls,
  • le test de Ryan,
  • le test de Dunnett particulier à la situation où un groupe sert de témoin parmi ceux étudiés, dans ce cas, StatEL attendra que vous ayez sélectioné le nom de celui-ci dans la liste déroulante avant d'exécuter les tests à pratiquer.

anova test posteriori Fisher Bonferroni Sidak Tuckey HSD Dunnett Student Newman Keuls Ryan REGW

Une fois le choix du témoin effectué, il vous suffit de le valider en cliquant sur "OK", le test se poursuit automatiquement. Si vous ne souhaitez pas définir de groupe témoin, il vous suffit de laisser l'option "Aucune" mise par défaut dans la boîte de dialogue et de cliquer sur le bouton "OK" ou bien de cliquer sur le bouton "Sortir".



3 - Résultats du test d'Ancova :

Ceux-ci sont affichés dans une nouvelle feuille qui vient se placer juste après celle contenant les données que vous avez sélectionnées pour procéder au test.

  • Sur la partie gauche de la feuille sont affichés, sous forme de tableau, les données sélectionnées.
  • Sur la partie droite de la feuille sont affichés le tableau des moyenne et écart-type des valeurs originales et des valeurs ajustées, les résultats des vérifications des conditions d'utilisation de l'Ancova, et les résultats des calculs intermédiaires, ainsi que les conclusions du test. En cas de résultat permettant de rejeter significativement l'hypothèse H0, les conclusions sont écrites en rouge.

résultats ancova

Les conditions d'utilisations de l'Ancova sont toutes respectées (de justesse en ce qui concerne l'homogénéité des pentes des différents modèles de régression linéaire).

résultats ancova

Dans l'exemple présenté, le logiciel StatEL explique clairement qu'il existe au moins une moyenne qui diffère significativement des autres, et que le risque de se tromper est inférieur à 0,0018.

Il est notamment précisé à l'utilisateur que les conditions d'utilisation de ce test sont respectées (conditions vérifiées par StatEL de façon transparente à l'utilisateur) ; il peut donc se fier à la conclusion présentée.

  • En cas de rejet de l'hypothèse H0, les tests a posteriori sont présentés à la suite des conclusions de l'Ancova, à condition que la variable qualitative étudiée présentait plus que 2 modalités.

ancova test posteriori Fisher Bonferroni Sidak Tuckey HSD Dunnett Student Newman Keuls Ryan REGW

Dans l'exemple présenté, le logiciel StatEL explique clairement que vis à vis du médicament témoin, seuls les sujets à qui on a administré le médicament N°2 présentent une moyenne significativement différente, avec risque de se tromper inférieur à 0,01 (cf. Test de Dunnett).

Les autres tests a posteriori complètent cette information en précisant que la moyenne issue des sujets ayant pris le médicament N°2 est également significativement différente de la moyenne issue des sujets ayant pris le médicament N°3. Cela permet de procéder au regroupement des moyennes du groupe témoin et du groupe 3 (non significativement différentes), distinctes de la moyenne du groupe 2.


Des graphiques en "Boîte à Moustaches" viennent automatiquement illustrer ces résultats :

ancova boite moustache

 

Société ad Science - 46, Rue Marx Dormoy, 75018 Paris