Les stages

PDF
Apprentissage d'un modèle pour cartographie de paramètres, appliqué à des données hyperspectrales en astrophysique.
Model learning for parameter cartography applied to hyperspectral data in astrophysics.

Spécialité

Traitement d'image

Niveau d'étude

Bac+5

Formation

Master 2

Unité d'accueil

Candidature avant le

31/01/2024

Durée

5 mois

Poursuite possible en thèse

non

Contact

LASCAR JULIA
00

Résumé/Summary
Le but du stage sera de développer un modèle de Machine Learning pour estimer des cartes de paramètres physiques à partir de données hyperspectrales, appliqué à l’astrophysique.
The goal of the internship will be to develop a Machine Learning model to estimate physical parameter maps from hyperspectral data, applied to astrophysics.
Sujet détaillé/Full description
Contexte
En astrophysique et en télédétection, les spectro-imageurs peuvent enregistrer des cubes de données appelés images hyperspectrales. Ces cubes de données ont deux dimensions spatiales, et une dimension spectrale. Souvent, ces données sont en réalité un mélange de plusieurs composantes physiques. L’objectif est d’identifier la contribution individuelle de chacune de ces sources.

Les techniques habituelles de séparation de sources sont dites ‘stationnaires’ : elles présument que, pour chaque source, il y a une seule forme spectrale, modulée par un facteur spatial d’amplitude. Cette hypothèse n’est pas appropriée pour de nombreux cas, notamment dans les images de vestiges de supernova, où les paramètres physiques (température, vitesse du gaz, etc) changent la forme du spectre de manière non-négligeable.

Pour pallier ce problème, nous avons développé SUSHI (Semi-blind Unmixing with Sparsity for Hyperspectral Images), un algorithme de démélange non-stationnaire. La méthode SUSHI se base sur une architecture d’optimisation classique de descente de gradient proximale, avec un modèle génératif physique basé sur un Auto-Encodeur (précisément, un Interpolateur Auto Encodeur, IAE) et une contrainte de régularisation spatiale sur les paramètres du modèle.

Actuellement, SUSHI reconstruit la contribution de chaque composante physique, mais ne permet pas encore d’avoir accès directement aux cartes de paramètres physiques associés aux spectres.

Objectif
Le but du stage est d’adapter la méthode SUSHI afin qu’elle retourne des cartes de paramètres physiques. Plus précisément :
• Étendre l’architecture de l’IAE pour l’estimation directe de paramètres physiques, et tester ses performances sur des données simulées.
• Incorporer ce nouveau modèle dans SUSHI pour la cartographie de paramètres physiques à partir de cubes hyperspectraux, test et validation sur des données simulées.
• Application à des données réelles en astrophysique en rayons X.

Candidat.e : La personne recrutée doit être en formation de Master 2 (ou équivalent) et devra posséder des connaissances en analyse de données (e.g. traitement du signal/des images), ainsi qu'en apprentissage automatique (machine learning). Le langage utilisé sera Python, et la connaissance de modules d'apprentissage tels PyTorch ou JAX est souhaitable.
Des connaissances en astrophysiques ne sont pas nécessaires, mais un intérêt pour le sujet est un plus.
Le stagiaire obtiendra une expertise en Machine Learning, plus spécifiquement sur les auto-encodeurs pour la résolution de problèmes inverses, en particulier la séparation de sources.

Le stage (4-6 mois) se déroulera au CEA, et sera encadré par Julia Lascar (analyse de donnée et astrophysique), Jérôme Bobin (analyse de données) et Fabio Acero (astrophysique).

Contact: julia.lascar@cea.fr, fabio.acero@cea.fr, jerome.bobin@cea.fr
Background
In astrophysics and remote sensing, spectro-imagers can record data cubes called hyperspectral images. These data cubes have two spatial dimensions, and one spectral dimension. Often, these data are actually a mixture of several physical components. The goal is to identify the individual contribution of each of these sources.

Classic source separation techniques are deemed ‘stationary’: they assume that, for each source, there is a single spectral shape, modulated by a spatial amplitude factor. This assumption is not appropriate for many cases, notably in images of supernovae, where physical parameters (temperature, gas velocity, etc.) change the shape of the spectrum in non-negligible ways.

To overcome this problem, we have developed SUSHI (Semi-blind Unmixing with Sparsity for Hyperspectral Images), a non-stationary unmixing algorithm. The SUSHI method is based on a classic proximal gradient descent optimization architecture, with a physical generative model based on an auto-encoder (precisely, an Interpolatory Auto Encoder, IAE ) and a spatial regularization constraint on the model parameters.

Currently, SUSHI reconstructs the contribution of each physical component, but does not yet allow direct access to the physical parameter maps associated with the spectra.

Objective
The aim of the internship is to adapt the SUSHI method so that it returns physical parameter maps.
• Extend the SUSHI architecture for direct estimation of physical parameters, and test its performance on simulated data.
• Incorporate this new model into SUSHI for mapping physical parameters from hyperspectral cubes, test and validate on simulated data.
• Application to real X-ray astrophysics data.

Candidate
The person recruited must be a Master 2 student (or equivalent) with knowledge of data analysis (e.g. signal/image processing) and Machine Learning. The language used will be Python, and knowledge of learning modules such as PyTorch or JAX is desirable.
Knowledge of astrophysics is not necessary, but an interest in the subject is a plus.
The intern will gain expertise in Machine Learning, more specifically on auto-encoders for inverse problem solving, in particular source separation.

The internship (4-6 months) will take place at the CEA, and will be supervised by Julia Lascar (data science and astrophysics), Jérôme Bobin (data science) and Fabio Acero (astrophysics).

Contact: julia.lascar@cea.fr, fabio.acero@cea.fr, jerome.bobin@cea.fr
Mots clés/Keywords
Données hyperspectrales ; machine learning ; séparation de sources
Hyperspectral data; machine learning; source separation
Logiciels
Python, PyTorch or JAX

 

Retour en haut