Évènements

Soutenance de thèse de Abdelhak BOUDEHANE

Date : 13/12/2022
Catégorie(s) :

Titre de la thèse : Estimation structurée-couplée des facteurs pour les tenseurs d’ordre élevé et de grande taille


Soutenance prévue le mardi 13 décembre 2022 à 9h00
Lieu :   Univers simulation, rez-de-chaussée Bâtiment Francis Bouygues, CentraleSupélec 9 Rue Joliot Curie, 91190 Gif-sur-Yvette
Salle : Amphi sc.071 Bât. Bouygues


Composition du jury proposé

M. Arthur TENENHAUS CentraleSupélec – Université Paris-Saclay Directeur de thèse
M. Eric MOREAU Université de Toulon Rapporteur
M. Vicente ZARZOSO Université Côte d’Azur Rapporteur
Mme Sylvie MARCOS CNRS/Université Paris-Saclay Examinatrice
M. Gérard FAVIER CNRS/Université de Nice Sophia Antipolis Examinateur
M. Karim ABED-MERAIM Université d’Orléans Examinateur
M. Mohamed Nabil EL KORSO Université Paris-Saclay Examinateur
M. Rémy BOYER Université de Lille Invité
M. Laurent LE BRUSQUET CentraleSupélec – Université Paris-Saclay Invité
Mots-clés :Decomposition Tensorielle,Algèbre Multilinéaire,Ordres Élevés,Grandes Dimensions,Réduction de la Dimension,
Keywords:  Tensor Decomposition,Multilinear Algebra,High-Orders,Large-Scales,Dimensionality Reduction,
Résumé :  
Les données et les signaux multidimensionnels occupent une place importante dans les applications modernes. La décomposition tensorielle est un outil mathématique puissant permettant de modéliser les données et les signaux multidimensionnels, tout en préservant les relations interdimensionnelles. Le modèle Canonique Polyadique (CP), un modèle de décomposition tensorielle largement utilisé, est unique à des indéterminations d’échelle et de permutation près. Cette propriété facilite l’interprétation physique, ce qui a encouragé l’intégration du modèle CP dans divers contextes. Le défi auquel est confrontée la modélisation tensorielle est la complexité de calcul et l’espace mémoire requis. Les tenseurs d’ordre élevé représentent un problème délicat, car la complexité de calcul et l’espace mémoire requis augmentent de façon exponentielle en fonction de l’ordre. Les tenseurs de grandes tailles (lorsque le nombre de variables selon une ou plusieurs dimensions du tenseur est important) ajoute un fardeau supplémentaire. La théorie des réseaux de tenseurs (Tensor Networks – TN) est une piste prometteuse, permettant de réduire les problèmes d’ordre élevé en un ensemble de problèmes d’ordre réduit. En particulier, le modèle Tensor-Train (TT), l’un des modèles TN, est un terrain intéressant pour la réduction de la dimensionnalité. Cependant, représenter un modèle CP par une représentation TT est extrêmement coûteux dans le cas des tenseurs de grande taille, car il nécessite la matricisation complète du tenseur, ce qui peut dépasser la capacité mémoire. Dans cette thèse, nous étudions la réduction de la dimensionnalité dans le contexte de la décomposition tensorielle sous-contrainte de sparsité et la décomposition couplée d’ordre élevé. Sur la base des résultats du schéma JIRAFE (Joint dImensionality Reduction And Factor rEtrieval), nous utilisons la flexibilité du modèle TT pour intégrer les contraintes physiques et les connaissances préalables sur les facteurs, dans le but de réduire le temps de calcul. Pour les problèmes de grandes tailles, nous proposons un schéma permettant de paralléliser et de randomiser les différentes étapes, i.e., la réduction de dimensionnalité et l’estimation des facteurs du modèle CP. Nous proposons également une stratégie basée sur la grille de tenseur, permettant un traitement entièrement parallèle pour le cas des très grandes tailles et de la décomposition tensorielle dynamique.
 
Summary:  
Multidimensional data sets and signals occupy an important place in recent application fields. Tensor decomposition represents a powerful mathematical tool for modeling multidimensional data and signals, without losing the interdimensional relations. The Canonical Polyadic (CP) model, a widely used tensor decomposition model, is unique up to scale and permutation indeterminacies. This property facilitates the physical interpretation, which has led the integration of the CP model in various contexts. The main challenge facing the tensor modeling is the computational complexity and memory requirements. High-order tensors represent a important issue, since the computational complexity and the required memory space increase exponentially with respect to the order. Another issue is the size of the tensor in the case of large-scale problems, which adds another burden to the complexity and memory. Tensor Networks (TN) theory is a promising framework, allowing to reduce high-order problems into a set of lower order problems. In particular, the Tensor-Train (TT) model, one of the TN models, is an interesting ground for dimensionality reduction. However, respresenting a CP tensor using a TT model, is extremely expensive in the case of large-scale tensors, since it requires full matricization of the tensor, which may exceed the memory capacity. In this thesis, we study the dimensionality reduction in the context of sparse-coding and high-order coupled tensor decomposition. Based on the results of Joint dImensionality Reduction And Factor rEtrieval (JIRAFE) scheme, we use the flexibility of the TT model to integrate the physical driven constraints and the prior knowledge on the factors, with the aim to reduce the computation time. For large-scale problems, we propose a scheme allowing to parallelize and randomize the different steps, i.e., the dimensionality reduction and the factor estimation. We also propose a grid-based strategy, allowing a full parallel processing for the case of very large scales and dynamic tensor decomposition.