De la lumière Tcherenkov aux objets célestes

De la lumière Tcherenkov aux objets célestes

Préparation à l’analyse des données

Un rayon gamma issu d’une source lointaine, ou un noyau du rayonnement cosmique, interagit dans l’atmosphère et crée une gerbe de particules. Les particules les plus énergiques de la gerbe se déplacent à une vitesse supérieure à celle de la lumière dans l’air et produisent un effet Tcherenkov. Ce flash de lumière de quelques dizaines de milliardième de seconde se propage vers les miroirs des télescopes qui renvoient son image vers des caméras composées de milliers de photomultiplicateurs. La lumière y est transformée en impulsion électrique puis est numérisée et enregistrée par le système d’acquisition.

Contrairement aux télescopes observant directement le ciel, les caméras de CTA détectent la trace lumineuse ténue laissée par la gerbe de particules produite lors de l’interaction des rayons gamma dans l’atmosphère. Le traitement des données est d’autant plus complexe que ces gerbes ne sont pas exclusivement dues à des rayons gamma de l’objet étudié, mais majoritairement à des particules du rayonnement cosmique, essentiellement des protons. Pour une source brillante comme la nébuleuse du Crabe on compte 10000 interactions par seconde dans le champ de vue dont seulement une pour 100000 provient d’un rayon gamma.

Un proton de 3 TeV illumine le réseau Sud de CTA (vu de dessus). Les points représentent les télescopes de différente taille, les axes indiquent la distance en mètres, et l’échelle de bleu l’intensité lumineuse de la lumière Tcherenkov au sol.

Un enjeu crucial du traitement des données est de réduire d’un facteur 100 leur volume, initialement de 1000 peta-octets par an, soit dix fois plus que le trafic engendré par les moteurs de recherche sur le web. Cette réduction est obtenue en filtrant les informations qui ne sont pas dues aux rayons gamma. Les données peuvent ensuite être transférées des sites de CTA vers les centres de calcul en Europe pour être traitées sur la grille (Plus d’infos).

Moteur dans le développement de la chaîne d’analyse, le CEA-Irfu met au point un prototype préfigurant le logiciel officiel de l’Observatoire CTA. Il permet de sélectionner les rares rayons gamma parmi les gerbes Tcherenkov détectées. Fondé sur une librairie appelée ctapipe dont l‘équipe du DAp est à l’origine, cette chaîne de traitement est inspirée de celles mises au point pour la génération précédente de télescope Tcherenkov (H.E.S.S., Magic et Veritas). Elle est aujourd’hui développée à partir de données simulées.

Une fois les rayons cosmiques filtrés, des cartes du ciel peuvent être réalisées afin d’étudier la région du ciel vers laquelle pointait le réseau de télescopes. À ce stade du traitement elles comportent approximativement autant de rayons gamma que de rayons cosmiques. Les analyses des cartes du ciel sont réalisées à partir de logiciels en cours de développement dans le consortium CTA et qui contribueront à définir l’outil scientifique officiel fourni, à terme, aux utilisateurs de l’observatoire. Le groupe du DAp s’investit aujourd’hui dans le développement du logiciel Gammapy.

Identifier les rayons gamma

Le groupe du DAp développe une chaîne d’analyse complète permettant de sélectionner les rayons gamma et d’obtenir leurs caractéristiques à partir des informations enregistrées par caméras des télescopes. Cette chaîne est basée sur le logiciel ctapipe dont le développement est coordonné par le groupe. L’ensemble est écrit en Python, utilise les librairies numpy, matplotlib et astropy (avec la possibilité de compiler les parties les plus consommatrices de temps en utilisant Numba). Les données sont stockées au format HDF5. La chaîne d’analyse comporte plusieurs étapes successives :

  • L’application des fonctions d’étalonnage des caméras qui permettent d’estimer le nombre de photons Tcherenkov (photoélectrons) vu par chaque pixel à partir des signaux électroniques mesurés;
  • Le filtrage des images pour isoler la lumière Tcherenkov du bruit du fond du ciel;
  • La détermination des caractéristiques morphologiques des images, et l’assemblage « stéréoscopique » des différentes images du réseau pour reconstruire les caractéristiques de la gerbe atmosphérique;
  • L’estimation de l’énergie de la particule et une mesure de sa « ressemblance » avec un rayon gamma plutôt qu’un rayon cosmique ;
  • L’optimisation de la sélection des rayons gamma pour le but scientifique recherché.
Image détectée Image sans bruit (simulation) Image filtrée
Exemple d’une image de rayon gamma de faible énergie dans une caméra de CTA, de gauche à droite : telle que détectée, simulée sans le bruit de fond du ciel et après application du filtrage en ondelette développé au DAp (le code couleur indique l’intensité en nombre équivalent à des photons).

Isoler les gerbes atmosphériques. Le premier algorithme de la chaîne d’analyse permet d'isoler dans les images de chaque caméra les signaux dus à la gerbe de ceux produits par le fond diffus de lumière nocturne, inévitable, malgré le soin apporté à la sélection des sites. La Lune peut également augmenter sensiblement le fond de ciel pour les observations qui ne peuvent éviter sa présence (sources inaccessibles lors des nuits sans Lune). Cette étape du filtrage doit conserver les irrégularités caractéristiques des gerbes de protons qui permettront ensuite de les différencier (Cf. plus bas). Le groupe étudie en particulier une méthode innovante de filtrage « en ondelettes » avec des gains prometteurs sur les performances globales de CTA.

Caractériser les gerbes atmosphériques. Une fois filtrée l’image de chaque télescope est modélisée sous la forme d’une ellipse (paramètres de Hillas). Toutes les images, une dizaine en moyenne par événement, sont ensuite combinées pour obtenir une vue « stéréoscopique » de laquelle sont extraites l’intensité lumineuse et la direction de la gerbe dans l’atmosphère.

Figure: Sur cette illustration de la méthode stéréoscopique, les images de chacun des télescopes sont superposées sur une vue unique. Elles convergent vers un même point correspondant à la provenance du rayon gamma dans le ciel (les ellipses caractérisent la géométrie de chacune des images individuelles). Les intensités de chacune des images permettent d’estimer la lumière émise dans la gerbe de particules.

Filtrer les rayons cosmiques. Les rayons gamma interagissent sur les noyaux de l’atmosphère et crée une gerbe électromagnétique composée d’électrons et d’antiélectrons et de rayon gamma secondaires. Les rayons cosmiques produisent une gerbe essentiellement composée de hadrons, majoritairement des pions, qui peuvent initier eux-mêmes des gerbes hadroniques secondaires. Pour une énergie de particule incidente donnée, ces dernières contribuent à élargir l’image de la gerbe et à y créer des irrégularités.

La discrimination entre le signal, les rayons gamma, et le bruit de fond, les rayons cosmiques, utilise les différentes caractéristiques des images des gerbes (intensité, largeur, longueur…) dans une méthode de « machine learning » (Boosted Decision Tree ou Random Forest) qui renvoie au final un critère quantitatif de ressemblance avec un rayon gamma et une estimation de l’énergie.

Une gerbe de particules créée par un rayon gamma (à gauche) et un proton (à droite) pour des énergies comparables (Ref. Völk, H.J. & Bernlöhr, K. Exp Astron (2009) 25: 173)

Mesurer les performances. Le bruit de fond résiduel acceptable de rayons cosmiques dépend de l’objectif scientifique. Parmi les sujets possibles, citons : la mesure du spectre en énergie d’une source ponctuelle dans le champ de vue, la caractérisation d’une source étendue à la morphologie complexe révélant les zones d’accélération du rayonnement cosmique, ou la recherche d’un signal intense mais très bref en contrepartie à la réception d’une explosion (sursaut gamma) ou d’une onde gravitationnelle… (Cf. les performances de CTA sur le site web de l'observatoire).

Étudier les sources de rayons gamma

Carte de significativité (nombre de déviations standards dans l’hypothèse du fond diffus) pour la région du centre de galactique vue avec CTA en une heure et demie, obtenue avec Gammapy. Les cercles indiquent des accumulations à plus de 5 déviations standards, correspondant à des sources de rayons gamma. (Ref. : Christoph Deil et al., Proc. 35th ICRC, Busan, South Korea, PoS(ICRC2017)766).

Des cartes du ciel peuvent être créées à partir de la liste de rayons gamma obtenue de la chaine de traitement des données. Elles sont analysées pour rechercher des sources de rayons gamma et les caractériser. Avec une sensibilité dix fois supérieure aux générations précédentes de télescopes Tcherenkov au sol, le nombre de sources accessibles devrait passer d’une centaine à un millier quelques années. Grâce à une résolution angulaire inégalée dans ce domaine, beaucoup d’entre elles apparaitront « étendues ». Dans les régions densément peuplées comme le plan galactique, plusieurs sources pourront se chevaucher dans le champ de l’observation.

Pour répondre à ce problème de superposition de source, en particulier pour les sources diffuses et étendues, il est nécessaire de modéliser toutes les sources présentes dans le champ de vue conjointement. Le groupe du DAp développe des algorithmes spécifiques en exploitant l’information 3D formée par l’image (x,y) de l’objet et la distribution en énergie en chaque point de l’image. Ces développements sont réalisés dans le cadre du logiciel Gammapy, prototype de ce que pourrait être le futur logiciel scientifique mis à disposition de la communauté par l’observatoire CTA.

Thierry Stolarczyk