StatEL : Test de Kruskal & Wallis
 
Cette commande de StatEL lance le test de comparaison des moyennes (d'un paramètre) issues de groupes de sujets différents et dont la distribution des mesures ne répond pas aux exigences de normalité des tests paramétriques. Il est le pendant non-paramétrique du test d'ANOVA pour séries indépendantes.

Exemple : on dispose de 3 milieux de culture différents pour le développement de microalgues et on souhaite savoir si le rendement est différent entre ces 3 milieux. Malheureusement, pour des raisons économiques, l'expérimentateur n'a pu disposer que de 5 essais sur chaque milieu. L'analyse préliminaire a révélé que les distributions des mesures ne suivent pas toutes la loi Normale. Le recours au test paramétrique de l'ANOVA est donc prohibé. On est donc contraint de se retourner vers un test non-paramétrique.



1 - Principes du test de Kruskal & Wallis :

On dispose de plusieurs échantillons (K>2) dont les moyennes (mi, mj, ...) et les variances (s²i, s²j, ...) sont des estimateurs des moyennes (µi, µj, ...) et variances (θ²i, θ²j, ...) des populations d'où sont issus les échantillons. La question posée est : si mi, mj, ... sont différents (ce qui est facile à vérifier), en est-il de même pour µi, µj, ... ?

  • Hypothèse nulle : "H0 : µi = µj = ..."
  • Hypothèse alternative : "H1 : il existe au moins une moyenne différente des autres"


Comme dans chaque test non-paramétrique, et à la différence des tests paramétriques, le calcul ne porte pas sur les valeurs numériques des mesures issues des échantillons représentatifs des populations, mais sur leurs rangs attribués suite au classement des valeurs par ordre croissant. On s'affranchit ainsi des conditions de normalité des distributions et d'homogénéité des variances indispensables à la fiabilité des tests paramétriques.

  • On commence donc par classer dans l'ordre croissant l'ensemble des mesures de tous les groupes étudiés.

  • On calcule les sommes des rangs (Tk) des valeurs de chacun des k groupes ainsi que la somme totale des rangs de tous les groupes (T).

  • On calcule les rangs moyens (Rk = Tk/nk) pour chaque groupe ainsi que le rang moyen total (R = T/N). Ainsi, dans l'hypothèse nulle, l'écart moyen entre les Rk et R doit être minime, contrairement au cas où l'un des groupes se distingue des autres.

  • La formule ci-dessous suit la loi de probabilité du Chi², à condition que chaque groupe dispose d'un effectif au moins égal à 5 mesures :


formule test kruskal wallis

  • Pas de conditions d'utilisation du test (hormis l'échantillonnage aléatoire bien évidemment).


La fin du test de Kruskal/Wallis de l'utilitaire StatEL fournit en supplément un test a posteriori afin de préciser les conclusions si celles-ci révèlent que l'un au moins des groupes se distingue des autres. En effet, dans un tel cas, le test de Kruskal/Wallis ne permet pas de détecter quelle(s) moyenne(s) est (sont) différente(s) des autres.

Pour pallier cette lacune, on procède au test dit de "la méthode des moyennes classées". Ce test consiste tout d'abord à classer par ordre croissant les moyennes des différents groupes étudiés. Puis, on compare chaque couple de moyennes successives en recourant au test de Mann/Whitney. Ainsi, on procède seulement à (k-1) comparaisons au lieu des k(k-1)/2 comparaisons possibles.

Au final, on obtient un résultat du type : m5 = m1 < m4 < m3 = m2.

Remarque : il peut arriver que ce test a posteriori conclue sans information supplémentaire (m1 = m3 = m2) ; ce résultat cache le fait que la différence se situe entre m1 et m2 et non pas entre m1 et m3 ou entre m3 et m2.


2 - Lancement du test de Kruskal & Wallis :

StatEL vous demande d'abord de préciser le nombre de groupes que vous souhaitez comparer. Puis, vous devez sélectionner successivement les plages de cellules correspondant aux mesures relatives à chacun des groupes de données. Cette boîte de sélection sera affichée autant de fois que le nombre de groupes de données à étudier. Pour procéder à la sélection, il vous suffit de cliquer sur la première cellule de la série de données et de faire glisser la souris jusqu'à la dernière valeur.

Nota bene : afin d'identifier au mieux les différents groupes de mesures, la première cellule de chaque série doit impérativement contenir le nom du groupe. Ce nom servira d'entête aux groupes étudiés sur la feuille des résultats.

test kruskal wallis



3 - Résultats du test de Kruskal & Wallis :

Le résultat du test de Kruskal & Wallis apparaît sur une nouvelle feuille de votre classeur Excel :

  • Sur la partie gauche de la feuille sont affichés, sous forme de tableau, les données sélectionnées.

  • Sur la partie droite de la feuille sont affichés les tableaux des moyennes, écart-types et les résultats des calculs intermédiaires, ainsi que les conclusions du test. En cas de résultat permettant de rejeter significativement l'hypothèse H0, c'est à dire si le test conclue qu'une moyenne au moins se distingue significativement des autres, les conclusions ainsi que la probabilité d'erreur sont écrites en rouge.

test kruskal wallis


Dans l'exemple présenté, le logiciel StatEL explique clairement qu'il existe au moins une moyenne qui diffère significativement des autres, et que le risque de se tromper est inférieur à 0,049.

Il est également précisé à l'utilisateur que la présence de rangs ex-aequo a justifié l'utilisation d'un facteur correctif quant au calcul de l'indice de Kruskal & Wallis. Le test a posteriori de comparaisons multiples sur les moyennes classées a permis d'identifier le Milieu 2 comme étant celui qui présente une moyenne significativement différente des 2 autres.

Des graphiques en "Boîte à Moustaches" viennent automatiquement illustrer ces résultats :

test kruskal wallis boite moustache

 

Société ad Science - 46, Rue Marx Dormoy, 75018 Paris