Metalearning guided by domain knowledge in distributed and decentralized applications - TEL - Thèses en ligne
[go: up one dir, main page]

Thèse Année : 2022
Metalearning guided by domain knowledge in distributed and decentralized applications Méta-apprentissage guidé par les connaissances du domaine
1 LIPN - Laboratoire d'Informatique de Paris-Nord (Institut Galilée, Université Paris 13, 99 avenue Jean-Baptiste Clément, F-93430, Villetaneuse - France)
"> LIPN - Laboratoire d'Informatique de Paris-Nord
Massinissa Hamidi
  • Fonction : Auteur
  • PersonId : 1250783
  • IdRef : 269428445

Résumé

This thesis is concerned with learning in distributed applications such as IoT, industry 4.0, or connected health. We are interested in the different challenges, both theoretical and practical, that arise in these types of applications. These challenges are mainly related to the specificities of the domain and strongly influence the performance of learning processes. We pursue a meta-modeling strategy to account for all the constituent elements of the learning pipelines, from the sensors that generate measures up to the learning phase and their interactions. We attach paramount importance, in our work, to the exploitation of a priori knowledge from the domain. This knowledge can be, for example, equational models or topological structures of sensor deployments that can be integrated through hyperparameters in the learning process.After describing the applicative context and a state of the art around meta-learning and federated learning, we will present our contributions which revolve around three axes. We first propose two novel approaches that leverage domain knowledge to select and augment learning examples. The main problems dealt with in this axis are the heterogeneity of the data sources and the cost of the measurements made by the sensors and their transmission. Then, we propose two approaches that take advantage of the semantics of the label space for organizing the learning process. The idea is to decompose the learning process into several sub-problems that are easier to solve while maximizing the notions of reuse, sharing, and transfer between these sub-problems.Finally, we focus on the collaborative aspects of the massively distributed sensing nodes and the ways the conciliation of decentralized learners can be improved. We investigate approaches that can efficiently fuse the relative views provided by the sensing environments, abstract them from their contextual bias, and conciliate the decisions taken by decentralized learners while considering their relativity. All our contributions are validated by the development of practical approaches evaluated on datasets from concrete real-world applications.
Cette thèse porte sur l'apprentissage dans les applications distribuées telles que l'IoT, l'industrie 4.0 ou la santé connectée. Nous nous intéressons aux différents défis, tant théoriques que pratiques, qui se posent dans ces types d'applications. Ces défis sont principalement liés aux spécificités du domaine et influencent fortement les performances des processus d'apprentissage. Nous poursuivons une stratégie de méta-modélisation pour considérer tous les éléments constitutifs des pipelines d'apprentissage, à partir des capteurs qui génèrent des mesures jusqu'à la phase d'apprentissage et leurs interactions. Nous accordons une importance capitale, dans notre travail, à l'exploitation des connaissances a priori issues du domaine. Ces connaissances peuvent être, par exemple, des modèles équationnels ou des structures topologiques de déploiement de capteurs qui peuvent être intégrés à travers des hyperparamètres dans le processus d'apprentissage. Après avoir exposé le contexte applicatif et un état de l'art du méta-apprentissage et de l'apprentissage fédéré, nous présenterons les contributions qui s'articulent autour de trois axes. Nous proposons, dans un premier temps, deux nouvelles approches qui tirent parti des connaissances du domaine pour sélectionner et augmenter les exemples d'apprentissage. Les principaux problèmes traités dans cet axe sont l'hétérogénéité des sources de données et le coût des mesures effectuées par les capteurs et de leur transmission. Ensuite, nous proposons deux approches qui tirent parti de la sémantique de l'espace des étiquettes pour organiser le processus d'apprentissage. L'idée est de décomposer le processus d'apprentissage en plusieurs sous-problèmes plus faciles à résoudre tout en maximisant la notion de réutilisation, de partage, et de transfert entre ces sous-problèmes. Enfin, nous nous concentrons sur les aspects collaboratifs des capteurs massivement distribués et sur les moyens d'améliorer la conciliation des apprenants décentralisés. Nous étudions des approches qui peuvent fusionner efficacement les vues relatives fournies par les déploiements de capteurs, les abstraire de leurs biais contextuels et réconcilier les décisions prises par les apprenants décentralisés tout en tenant compte de leur relativité. Toutes nos contributions sont validées par le développement d'approches pratiques évaluées sur des jeux de données provenant d'applications concrètes du monde réel.
Fichier principal
Vignette du fichier
edgalilee_th_2022_hamidi.pdf (11.96 Mo) Télécharger le fichier
Origine Version validée par le jury (STAR)

Dates et versions

tel-04083690 , version 1 (27-04-2023)
Identifiants
  • HAL Id : tel-04083690 , version 1

Citer

Massinissa Hamidi. Metalearning guided by domain knowledge in distributed and decentralized applications. Technology for Human Learning. Université Paris-Nord - Paris XIII, 2022. English. ⟨NNT : 2022PA131090⟩. ⟨tel-04083690⟩
160 Consultations
93 Téléchargements

Partager

More