De l'identification de structure de réseaux bayésiens à la reconnaissance de formes à partir d'informations complètes ou incomplètes

Date de soutenance : Mardi 28 novembre 2006

Jury

back

Documents

  • Mémoire de thèse [.pdf (249 pages, 3.7 Mo, 171 pages hors annexes et bibliographie)]
  • Transparents de présentation [.pdf ]
back

Abstract

We have performed an empirical study of various deterministic Bayesian networks structure learning algorithms. The first test step has allowed us to emphasise which learning technics need a specific initialisation et we have proposed a way to do this. In the second stage of this doctoral study, we have adapted some learning technics to incomplete datasets. Then, we have proposed an efficient algorithm to learn a tree-augmented naive Bayes classifier in a general way from an incomplete dataset. We have also introduced an original formalism to model incomplete dataset generation processes with MCAR or MAR assumptions. Finally, various synthetic datasets and real datasets have been used to empirically compare structure learning methods from incomplete datasets.

Résumé

Durant ces travaux de thèse, une comparaison empirique de différentes techniques d'apprentissage de structure de réseaux bayésiens a été effectuée, car même s'il peut en exister très ponctuellement, il n'existe pas de comparaisons plus globales de ces algorithmes. De multiples phases de tests nous ont permis d'identifier quelles méthodes souffraient de difficultés d'initialisation et nous avons proposé une technique pour les résoudre. Nous avons ensuite adapté différentes méthodes d'apprentissage de structure aux bases de données incomplètes et avons notamment introduit une technique pour apprendre efficacement une structure arborescente. Cette méthode est ensuite adaptée à la problématique plus spécifique de la classification et permet d'apprendre efficacement et en toute généralité un classifieur de Bayes Naïf augmenté. Un formalisme original permettant de généer des bases de données incomplètes ayant des données manquantes vérifiant les hypothèses MCAR ou MAR est également introduit. De nombreuses bases synthétiques ou réelles ont alors été utilisées pour tester ces méthodes d'apprentissage de structure à partir de bases incomplètes.

top