StatEL : Analyse Factorielle de Correspondances - AFC
 
Cette commande lance la procédure d'analyse d'un tableau de contingence (tableau d'effectifs calculés en croisant les modalités de 2 variables qualitatives présentes sur un échantillon d'observations) :

AFC analyse factorielle correspondance


1 - Principe de l'Analyse Factorielle des Correspondances :

Le principe de l'AFC est de synthétiser l'information contenue dans un tableau de contingence (C colonnes x L lignes), en s'intéressant non pas aux valeurs absolues mais aux valeurs relatives, c'est à dire aux correspondances entre les modalités des 2 variables.

L'AFC permet de détecter les axes (ou facteurs) selon lesquels le nuage de points s'éloigne le plus de son centre d'inertie. Ces axes "synthétiques" peuvent être la résultante de l'influence d'une ou plusieurs modalités des 2 variables.

Ainsi, par projection des points (modalités) sur les plans définis par ces nouveaux axes, on a une "photographie" du nuage de points sous l'angle le plus intéressant : celui qui apporte le plus d'informations.

Par analogie, imaginez que quelqu'un tente de vous faire deviner l'identité d'un animal dessiné sur une feuille de papier (à savoir un chameau) en ne vous montrant que sa silhouette vue de face. Rien ne vous garantit qu'il ne s'agit pas en fait d'un dromadaire, simplement parce que l'angle d'analyse n'est pas le plus informatif. Il vous aurait fallu disposer d'une vue de profil pour pouvoir conclure avec certitude qu'il s'agit bien d'un chameau. De la même manière, l'AFC vous fournit les axes (et donc les plans) susceptibles de vous renseigner au mieux sur la forme du nuage de points : ceux qui vous permettront les meilleures photographies.

D'un point de vue technique, il faut recourir au calcul matriciel et à la diagonalisation de la matrice d'inertie. On procède à la transformation du tableau de contingence de la façon suivante, soient :

  • un tableau de contingence rassemblant c colonnes et l lignes,
  • xij est l'effectif pour la colonne i et la ligne j,
  • N est l'effectif total,
  • i varie de 1 à c, j varie de 1 à l,
  • fij est la proportion de l'effectif pour la colonne i et la ligne j :

formule AFC analyse factorielle correspondance

On calcule les éléments fi. et f.j :

formule AFC analyse factorielle correspondanceformule AFC analyse factorielle correspondance

On peut ensuite calculer les éléments zij :

formule AFC analyse factorielle correspondance

Ces éléments fournissent la matrice Z (l x c) qui nous permet de calculer la matrice d'inertie In en prémultipliant Z par sa transposée :

formule inertie AFC analyse factorielle correspondance

Nous ne détaillerons pas les détails de la diagonalisation de cette matrice d'inertie, mais l'utilisateur intéressé pourra se référer à de nombreux ouvrages qui présentent les techniques d'analyse de données multidimensionnelles, tels que :

  • Initiation à l'analyse des données, Jean de Lagarde, 162p, Editions Dunod, 2000.
  • Analyses factorielles simples et multiples, Brigite Escoffier et Jérôme Pagès, 284p, Editions Dunod, 2002.
  • Analyses factorielles simples, Xavier Bry, 112p, Editions Economica, 1995.
  • Analyses factorielles multiples, Xavier Bry, 112p, Editions Economica, 1996.
  • etc...


De la diagonalisation, on extrait les C-1 (ou L-1 si L inférieur à C) valeurs propres (x) et la matrice des vecteurs propres (u) qui vont caractériser les nouveaux axes. Les vecteurs propres serviront à la projection des points sur les plans définis par les nouveaux axes, tandis que les valeurs propres (1 par axe) évaluent la quantité de variance (ou d'inertie) du nuage de points expliquée par chaque axe.

A l'issue de l'AFC, on pourra aussi bien représenter les modalités de la variable 1 que les modalités de la variable 2. Ces représentations serviront à détecter quelles modalités influencent le plus les axes extraits par l'AFC.

Enfin, il est possible d'ajouter dans ces représentations des points supplémentaires ou illustratifs. Ces points ne sont pas utilisés pour définir les caractéristiques des nouveaux axes, mais injectés dans les représentations graphiques pour aider à l'interprétation de ces nouveaux axes.

Nota bene : l'AFC menée à partir d'un même jeu de données sur différents logiciels peut ne pas fournir les mêmes représentations graphiques, mais des représentations inversées sur certains axes. Il n'y a pas d'erreurs, tout résulte de la façon dont la procédure de diagonalisation a été menée et des hypothèses de calcul qui ont été posées au départ.

En dépit des différences dans l'allure générale des graphiques, vous noterez toutefois que les positions relatives des points restent rigoureusement les mêmes (de même que les résultats des calculs de corrélation,contribution, qualité et distance - cf. ci-après). La particularité d'une ACP est effectivement de procéder à l'analyse de données les unes par rapport aux autres. En analyse factorielle en général, tout est relatif, on n'apporte pas de conclusions à caractère absolu.



2 - Lancement de l'Analyse Factorielle des Correspondances :

La boîte de dialogue initiale (partiellement dévoilée) vous permet de sélectionner les intitulés des modalités de la variable 1 (organisée en colonnes).

AFC analyse factorielle correspondance

Cliquez sur le bouton et sélectionnez les cellules contenant les intitulés de chaque colonne.

AFC analyse factorielle correspondance

Le nom des modalités de la variable 1 apparaît dans la liste de la boîte de dialogue qui, par ailleurs, se dévoile pour vous permettre de sélectionner les intitulés des modalités de la variable 2 (organisée en lignes).

AFC analyse factorielle correspondance

De la même façon que précédement, cliquez sur le bouton "Sélectionner..." et selectionnez les cellules contenant les intitulés des modalités de la variable 2.

AFC analyse factorielle correspondance

Ceux-ci viennent d'afficher dans la liste ad-hoc tout en dévoilant encore un peu plus la boîte de dialogue.

AFC analyse factorielle correspondance

Il ne vous reste plus qu'à sélectionner les cellules contenant les effectifs du tableau de contingence en cliquant sur le bouton "Sélectionner le tableau".

AFC analyse factorielle correspondance

La case à cocher en bas à droite de la boîte de dialogue permet de dévoiler sa partie droite et offre ainsi la possibilité de transformer une ou plusieurs modalités de l'une ou l'autre des 2 varaibles en item supplémentaire (ou illustratif). Il vous suffit pour cela de sélectionner la modalité en question et de cliquer sur la flèche ">" pour la basculer en item supplémentaire.



3 - Résultats de l'Analyse Factorielle des Correspondances :

Ceux-ci sont affichés dans une nouvelle feuille qui vient se placer juste après celle contenant les données que vous avez sélectionnées pour procéder à l'AFC.

Notez que certaines cellules sont munies de commentaires explicatifs du contenu des cellules concernées (triangle rouge).

En haut à gauche sont rappelés les détails de l'analyse :

  • nb de modalités de la variable 1 (organisée en colonnes),
  • nb de modalités de la variable 2 (organisée en lignes),
  • nb de facteurs (axes) extraits de l'AFC,
  • nb de modalités supplémentaires (relatives à la variable 1),
  • nb de modalités supplémentaires (relatives à la variable 2).

Au centre de la feuille des résultats s'affichent les 3 représentations graphiques selon le plan composé des 2 premiers facteurs de l'AFC :

  • graphique représentant conjointement les modalités des 2 variables,
  • graphique des modalités de la variable 1 (où la taille des points est fonction de la taille de l'effectif présentant chaque modalité),
  • graphique des modalités de la variable 2 (où la taille des points est fonction de la taille de l'effectif présentant chaque modalité).

Vous disposerez, au dessus de ces graphiques, de la possibilité de modifier les axes des représentations graphiques (abscisse et ordonnée) en agissant sur les flèches "Haut/Bas". Cette fonctionnalité est uniquement accessible s'il y a plus de 2 facteurs extraits de l'AFC, c'est à dire si la plus petite des 2 dimensions du tableau de contingence (L ou C) est supérieure à 3.

Une case à cocher vous permet d'afficher l'intitulé des points sur les 2 représentations graphiques. Par ailleurs, si vous avez défini certains points supplémentaires, une seconde case à cocher vous permet de les visualiser sur les représentations.

graphique statel AFC analyse factorielle correspondance



Sur la partie droite de la feuille des résultats sont affichés toutes les données numériques nécessaires à l'analyse des résutats de l'AFC :

  • le rappel du tableau de contingence étudié,
  • les données relatives à la représentation des modalités de la variable 1,
  • les données relatives à la représentation des modalités de la variable 2.

Pour ces 2 derniers items, les données numériques sont de même nature :

  • les poids relatifs de chaque modalité,
  • les coordonnées servent à la construction des graphiques,
  • les contributions expriment l'importance que revêt chaque modalité dans la variance de chaque facteur,
  • les qualités de représentation (ou cos²) informent sur l'angle que fait la droite reliant le centre du nuage et le point étudié, avec l'axe considéré. Si ce cos est proche de 1, cela implique que l'angle en question est proche de 0 ; donc si la projection du point est proche de l'axe, le point sera, dans l'espace, effectivement proche de l'axe. Il s'agit donc d'une information capitale dans l'interprétation des axes,
  • les distances des points par rapport au centre de gravité du nuage,
  • l'inertie exprime le pourcentage de variance du nuage de points expliquée par la modalité considérée.

résultat statel AFC analyse factorielle correspondance



 

Société ad Science - 46, Rue Marx Dormoy, 75018 Paris