Modèle de Mixture Gaussienne
algorithme EM 

Introduction

L'algorithme EM (Expectation-Maximization algorithm) est basé sur une optimisation itérative des centres et de la largeur des noyeaux Gaussiens. Le but est d'optimiser la ressemblance entre un ensemble de points donnés et une mixture gaussienne. Les nombres affichés à côté des gaussiennes donnent l'importance relative (amplitude) de chaque composant.

Remerciements

Cette applete a été développée par S. Akaho. Tout commentaire doit être adressé (en anglais ou en japonais) à akaho@etl.go.jp.

Instructions

  1. Vous pouvez sélectionner le mode d'approximation par mixture gaussienne en choisissant "GaussMix" ou par lignes en choisissant "LineMix".
  2. Cliquez dans l'image pour ajouter des points.
  3. Vous pouvez aussi ajouter des points de manière uniforme en cliquant sur "RandomPts".
  4. "ClearPts" permet d'effacer tous les points.
  5. Vous pouvez choisir le nombre de noyeaux en sélectionnant 1 à 5 dans le deuxième bouton à droite.
  6. L'initialisation se fait en cliquant sur "InitKernels".
  7. L'algorithme EM démarre en sélectionnant "EM RUN" ou "EM 1 Step" (un pas)
  8. Pour l'arrêter, sélectionnez "EM Stop".

Questions

  1. Définitssez environ 30 points situés dans 3 groupes différents. Un des groupes peut être un peu plus gros que les autres. Fixez le nombre de noyeaux à trois. Executez un pas à l'aide du bouton le plus à droite ("EM 1 Step"). Cliquez plusieurs fois sur ce bouton pour observer comment les noyeaux convergent vers les groupes.
  2. Avec le même jeu de points, réinitialisez le sytème et passer à "EM Run". Observer la convergence et réinitialisez. Répétez cela plusieurs fois dans le but d'établir la fiabilité de l'algorithme EM pour trouver les trois groupes de points.
  3. Avec toujours les mêmes points, autorisez 5 noyeaux. Cela converge-t-il toujours vers une solution raisonnable ? Répétez l'expérience plusieurs fois.
  4. Ajoutez des points aléatoire en appuyant sur le bouton correspondant une seule fois. Redémarrez l'agorithme. Tropuve-t-il toujours les mêmes groupes ? (testez plusieurs fois). Ajoutez encore plus de points aléatoires et répétez l'expérience.
  5. Gardez le même ensemble de points, mais réduisez le nombre de noyeaux à trois. L'algorithme trouve-t-il toujours les groupes ?
  6. Effacez tous les points et recommencez avec deux groupes de 10 points chacun de deux noyeaux. Ajoutez de plus en plus de points à l'un des groupes et observez l'évolution de l'importance des deux noyeaux.

Bugs

Si les gaussiennes ou les lignes disparaissent, initialisez les noyeaux en cliquant sur "InitKernels". Il se peut que l'algorithme EM s'arrête par une erreur d'exception d'Applet dans Netscape Navigator. Il faut alors le recharger.