FACULTE DES SCIENCES
Mémoire Master en Math´ematiques
Option : Probabilit´es-Statistique
Analyse discriminante
| Analyse discriminante.pdf |
En statistique, les analyses multivari´ees ont pour caract´eristique de s’int´eresser `a des lois de probabilit´e `a plusieurs variables. Elles sont diverses selon l’objectif recherch´e, la nature des variables et la mise en œuvre formelle. On peut identifier deux grandes familles : celle des m´ethodes descriptives visant `a structurer et r´esumer l’information (ACP, AFC, ACM, etc...) et celle des m´ethodes explicatives visant `a expliquer une ou des variables dites variables `a expliquer par un ensemble de variables dites variables explicatives (Analyse de r´egression, ANOVA, Analyse canonique des corr´elations, ...etc). Le premier chapitre est consacr´e aux trois m´ethodes les plus courantes en statistique descriptive multidimensionnelle : l’ACP, l’AFC et l’ACM. Sous le nom d’analyse discriminante, on distingue toute une s´erie de m´ethodes explicatives, descriptives et surtout pr´edictives destin´ees `a ´etudier une population de n individus comportant K classes. Chaque individu est caract´eris´e par un ensemble de p variables quantitatives et une variable qualitative identifiant la classe `a laquelle appartient cet individu. Cette analyse est l’objet du second chapitre. Le troisi`eme chapitre est r´eserv´e `a l’application de l’analyse discriminante sous R sur des donn´ees r´eelles.
Nous avons pr´esent´e dans le premier chapitre le principe g´en´eral des analyses factorielles. Cette approche permet de repr´esenter g´eom´etriquement de grands tableaux de donn´ees dans des sous-espaces sans perte d’information importante. La dimension de ces sous-espaces se fait en cherchant `a minimiser la perte d’information. Une fois la dimension du sous-espace choisie, les donn´ees sont repr´esent´ees graphiquement par des projections sur les diff´erents plans qui constituent le sous-espace. Bien sˆur les premiers plans principaux sont ceux contenant le plus d’information. Avant d’appliquer cette approche g´en´erale `a un tableau quelconque, il est important de tenir compte des donn´ees de d´epart. Pour se faire, il faut appliquer des transformations en fonction de leur type. En effet, nous avons vu comment transformer des donn´ees quantitatives dans le cadre de l’analyse en composantes principales et des donn´ees qualitatives dans les cas de l’analyse factorielle de correspondances et de celle des correspondances multiples. Dans le second chapitre nous avons pr´esent´e l’une des m´ethodes les plus utilis´ees de nos jours : l’analyse discriminante. La simplicit´e de sa mise en œuvre fait que nous la retrouvons dans de nombreux logiciels. Elle est ad´equate pour la repr´esentation des donn´ees dans des espaces qui discriminent au mieux les individus selon des classes connues. Cette repr´esentation permet de d´egager des informations `a partir d’un grand nombre de donn´ees souvent difficile `a interpr´eter. Elle permet ´egalement l’affectation de nouveaux individus dans les classes existantes. Il est alors possible de rendre la m´ethode adaptative pour tenir compte de ces nouvelles observations. Le troisi`eme chapitre est consacr´e `a l’application de l’analyse lin´eaire discriminante sur des donn´ees d’agronomie. Les r´esultats obtenus semblent adapt´es `a la r´ealit´e

0 تعليقات