« Techniques d’apprentissage automatique efficientes pour la localisation indoor dans les systèmes de communication sans fil »
dirigés par Monsieur Jocelyn FIORINA et Monsieur Raul de LACERDA
Soutenance prévue le 20 décembre 2022 à 10h30
Lieu : CentraleSupélec – Bâtiment Eiffel – Université Paris-Saclay
8 Rue Joliot Curie, 91190 Gif-sur-Yvette
Salle : Amphi II, Bât. Eiffel
Composition du jury
Mme Fouzia Boukour Université Gustave Eiffel Rapporteuse
M. Jean-Marie Gorce INSA Lyon Rapporteur
M. Christophe Le Martret Thales Examinateur
M. Jean-Philippe Ovarlez Onera Examinateur
M. Luca De Nardis Université de Rome La Sa-pienza Examinateur
Mots clés: Localisation indoor, empreinte digitale, puissance du signal reçu, apprentissage automatique, apprentissage fédéré
Résumé
Avec le développement rapide de l’Internet des objets (IoT), le besoin de services de localisation en intérieur, tels que la gestion des actifs, la navigation et le suivi, a également augmenté au fil du temps. Pour la localisation indoor, les systèmes de navigation par satellite tels que le GPS ont un usage limité par l’absence de visibilité directe avec les satellites.
Diverses solutions ont été proposées pour la localisation en intérieur, telles que la trilatération, la triangulation et la navigation à l’estime, mais leurs performances sont limitées par les conditions du canal intérieur, telles que masquage et l’évanouissement par trajets multiples. En exploitant la correspondance entre les mesures des caractéristiques du signal sans fil et les positions, les méthodes basées sur l’empreinte digitale ont montré qu’elles pouvaient fournir de bonnes performances de localisation avec suffisamment de données. Cependant, la localisation indoor est toujours confrontée à des défis tels que l’évolutivité, le coût et la complexité, la confidentialité, etc.
L’objectif de cette thèse est d’améliorer l’efficience de la localisation indoor en utilisant des techniques d’apprentissage automatique. Nous divisons le processus de localisation en deux phases : la phase de cartographie radio hors ligne et la phase de localisation en ligne. Pendant la phase hors ligne, nous introduisons l’analyse des jeux de données comme une étape intermédiaire entre la création des jeux de données et la localisation. Nous proposons deux indicateurs numériques de qualité des jeux de données qui peuvent fournir un retour d’information pour améliorer la carte radio. De plus, l’extraction de caractéristiques et le traitement des données à l’aide d’outils d’apprentissage automatique sont intégrés dans un but d’efficience, en réduisant la taille des données et la complexité de calcul, tout en améliorant les performances de localisation. Pour être plus précis, nous proposons une méthode de cartographie radio basée sur les k-means qui peut réduire le nombre d’empreintes de plus de 90 $\%$ sans perdre d’informations utiles dans la carte radio ni dégrader les performances de localisation. En explorant la nature hiérarchique des grands ensembles de données, nous proposons une méthode d’extraction de caractéristiques hiérarchiques qui peut réduire davantage la complexité de la localisation sans en compromettre les performances.
Pour la phase de localisation en ligne, nous explorons à la fois l’apprentissage automatique traditionnel et l’apprentissage profond. Nous présentons d’abord plusieurs méthodes traditionnelles d’apprentissage automatique et comparons les performances de localisation sur des ensembles de données publiques. Nous cherchons à améliorer les performances de localisation des méthodes traditionnelles.
Pour faire face aux problèmes de confidentialité et de complexité, nous introduisons un cadre d’apprentissage fédéré pour le problème de la localisation indoor. Dans ce cadre, les clients partagent uniquement leurs modèles locaux avec le serveur central au lieu des données d’empreintes radios. Nous comparons d’abord les performances de l’apprentissage fédéré et centralisé. Ensuite, nous étudions l’impact du nombre de clients et de la taille des données locales. Toujours dans un objectif d’efficience, afin d’économiser les ressources, nous cherchons à réduire le coût de communication pendant le processus d’apprentissage. Nous évaluons différentes techniques, notamment la sélection des clients, l’accumulation du gradient et la compression du modèle. Une méthode de compression efficace est proposée pour compresser les modèles locaux, ce qui permet de réduire le coût de communication de la liaison montante de 91,5 $\%$ sans compromettre les performances de localisation. Enfin, nous considérons des limites sur la capacité des liens montants et évaluons différentes stratégies de compression.