PDF
Hyper optimisation of neural networks parameterising fragmentation functions

Spécialité

Physique théorique, mécanique quantique

Niveau d'étude

Bac+5

Formation

Master 2

Unité d'accueil

Candidature avant le

01/06/2021

Durée

4 mois

Poursuite possible en thèse

oui

Contact

BERTONE Valerio
+33 1 69 08 87 19

Résumé/Summary
Le projet consiste à développer un réseau neuronal artificiel qui sera affiné afin d'extraire les propriétés des hadrons, comme par exemple les fonctions de fragmentation, à partir des données disponibles de collisions lepton-proton.
The project consists in developing an artificial neural network that will be tuned to extract hadron properties like fragmentation functions from available lepton-proton collision data.
Sujet détaillé/Full description
L'un des principaux défis de la physique théorique des particules est la compréhension quantitative de la structure des hadrons. Actuellement, il est largement admis que la chromodynamique quantique (QCD) est la théorie qui décrit le mieux les hadrons et leurs interactions. Les éléments constitutifs de la QCD, les quarks et les gluons, sont considérés comme responsables de la plupart des propriétés de base des hadrons telles que la masse, la charge, le spin, etc. Par conséquent, il est crucial pour une compréhension complète de la structure des hadrons d'avoir une image claire de la distribution des quarks et des gluons à l'intérieur des hadrons. Malheureusement, cette tâche est compliquée par le fait que la QCD est fortement couplée à des énergies pertinentes pour l'étude de la structure des hadrons, ce qui empêche l'utilisation de la théorie des perturbations. Malgré le développement d'outils théoriques permettant en principe de calculer ces distributions à partir des principes de base, à l'heure actuelle, la manière la plus précise de les déterminer repose sur des ajustements aux données expérimentales.
Plus précisément, la distribution des quarks et des gluons à l'intérieur des hadrons est paramétrée et déterminée par comparaison avec les données expérimentales. Il est donc important de minimiser autant que possible tout biais découlant de la forme paramétrique particulière choisie pour ajuster les données. À cet égard, les réseaux de neurones artificiels (ANN) [1], grâce à leur flexibilité, constituent un outil puissant pour une détermination fidèle de la structure hadronique. Une des plus importantes incarnations des distributions mentionnées ci-dessus est représentée par les fonctions de fragmentation (FF) qui décrivent comment les quarks et les gluons se transforment en hadrons (hadronisation). Les FF sont pertinentes dans les collisions à haute énergie dans lesquelles un quark ou un gluon de l'hadron cible interagit avec une sonde externe et, en raison du confinement, le quark ou le gluon sortant "hadronise" et l'hadron résultant est détecté à l'état final.
Le sujet du présent projet de stage est l'étude des FF des hadrons légers (principalement des pions et des kaons) et leur détermination à partir des ajustements aux données expérimentales en utilisant les ANN comme paramétrage flexible. Il est important de noter que l'extrême flexibilité des ANN les rend particulièrement difficiles à manipuler et qu'un choix minutieux de leur architecture est crucial pour rentabiliser leur application à cette tâche. En général, dans de nombreuses applications, le choix éclairé des paramètres pertinents d'un cadre impliquant des ANN, souvent appelé hyper-optimisation, est un aspect important qui influence fortement la qualité du résultat. C'est également le cas dans ce contexte et l'hyper-optimisation d'un cadre qui utilise les ANN pour déterminer les FF à partir des ajustements aux données est la tâche à laquelle le candidat sera confronté.

Le candidat du présent projet de stage participera à la détermination des FF à l'aide d'ANN via un ajustement avec diverses données expérimentales. Le but principal de ce projet spécifique est l'hyper-optimisation de l'ANN utilisé pour cette tâche dans le but d'identifier l'architecture optimale pour une extraction fidèle des FF. Deux étapes principales sont envisagées :

1. Dans la première étape préparatoire, le candidat se familiarisera avec le cadre scientifique. Au cours de cette phase, le candidat apprendra à obtenir et à interpréter les résultats d'ANN.
2. Sur la base des connaissances acquises lors de la première étape, le candidat sera en mesure d'ajuster les paramètres pertinents du problème (architecture ANN, fonctions d'activation, taux d'apprentissage, etc.) afin d'obtenir une configuration optimale qui permettra une détermination fidèle des FF.

Si elle est couronnée de succès, cette étude permettra de rationaliser considérablement la détermination des FF à partir de données expérimentales utilisant des ANN et ouvrira la voie à des applications de la même technologie pour déterminer d'autres quantités intéressantes pertinentes pour une compréhension plus approfondie de la structure hadronique.

Bibliographie:

[1] R. Abdul Khalek and V. Bertone, “On the derivatives of feed-forward neural networks”, arXiv:2005.07039.

[2] V. Bertone et al., “A determination of the fragmentation functions of pions, kaons, and protons with faithful uncertainties”, Eur.Phys.J.C 77 (2017) 8, 516.
One of the main challenges of theoretical particle physics is the quantitative understanding of the structure of hadrons. Currently, it is widely accepted that Quantum Chromodynamics (QCD) is the theory that best describes hadrons and their interactions. The building blocks of QCD, quarks and gluons, are believed to be responsible for most of the basic properties of hadrons such as: mass, charge, spin, etc.. Therefore, it is of crucial importance for a full understanding of the hadron structure to make a clear picture of the distribution of quarks and gluons inside the hadrons. Unfortunately, this task is complicated by the fact that QCD is strongly coupled at energies relevant for the study of the hadron structure, preventing the use of perturbation theory. Despite theoretical tools are being developed allowing in principle for the computation of these distributions from first principles, at present the most accurate way to determine them relies on fits to experimental data.
More specifically, the distribution of quarks and gluons inside the hadrons are parameterised and determined by comparison to experimental data. It is therefore important to minimise as much as possible any bias deriving from the particular parametric form chosen to fit the data. In this respect, artificial neural networks (ANN) [1], thanks to their flexibility, provide a powerful tool towards a faithful determination of the hadronic structure. One of the most important incarnations of the distributions mentioned above is represented by fragmentation functions (FFs) that describe how quarks and gluons turn into hadrons (hadronisation). FFs are relevant in high-energy collisions in which a quark or a gluon from the target hadron interacts with an external probe and, due to confinement, the outgoing quark or gluon “hadronises” and the resulting hadron is detected in the final state.
The subject of the present internship project is the study of the FFs of light hadrons (mostly pions and kaons) and their determination from fits to experimental data using ANNs as a flexible parameterisation. Importantly, the extreme flexibility of ANNs makes them particularly hard to handle and a careful choice of their architecture is crucial to make their application to this task profitable. Generally, in many applications the educated choice of the relevant parameters of a framework involving ANNs, often referred to as hyper-optimisation, is an important aspect that heavily influences the quality of the result. This is the case also in this context and the hyper-optimisation of a framework that employs ANNs to determine FFs from fits to data is the task that the candidate will be confronted with.

The candidate of the present internship project will be involved in the determination of light-hadron FFs from a fit to a variety of experimental data using ANNs. The main goal of this specific project is the hyper-optimisation of the ANN employed for this task with the aim of identifying the optimal architecture for a faithful extraction of FFs. Two main steps are envisioned:

1. In the first preparatory step, the candidate will be introduced to the framework. In this phase, the candidate will learn how to obtain and interpret the results.
2. Building upon the knowledge acquired in the first step, the candidate will be in the position to adjust the relevant parameters of the problem (ANN architecture, activation functions, learning rates, etc.) to achieve an optimal configuration that will allow for a faithful determination of FFs.

If successful, this study will significantly streamline the determination of FFs from experimental data using ANNs and pave the way to applications of the same technology to determine other interesting quantities relevant to a deeper understanding of the hadronic structure.

References

[1] R. Abdul Khalek and V. Bertone, “On the derivatives of feed-forward neural networks”, arXiv:2005.07039.

[2] V. Bertone et al., “A determination of the fragmentation functions of pions, kaons, and protons with faithful uncertainties”, Eur.Phys.J.C 77 (2017) 8, 516.
Mots clés/Keywords
Physique hadronique, QCD
Hadron Physics, QCD
Compétences/Skills
Une connaissance de base des techniques numériques est importante. Une connaissance pratique de C++ et de Python est nécessaire pour pouvoir utiliser le cadre de calcul. Une connaissance de base de la mécanique quantique et de la théorie quantique des champs est nécessaire pour comprendre le contexte scientifique, mais pas pour effectuer le travail numérique proprement dit.
Basic knowledge of numerical techniques is important. Working knowledge of C++ and Python is required to be able to use the computational framework. Basic knowledge of quantum mechanics and quantum field theory is instead needed to understand the scientific context, but not to perform the actual numerical work.
Logiciels
C++, Python

 

Retour en haut