18 avril 2024
Réduire les incertitudes théoriques sur la structure du nucléon à l’aide des simulations

Une équipe de physiciens de l’Irfu, en partenariat avec le centre de physique nucléaire de Varsovie et l’université Williams & Mary aux États-Unis a mis au point une technique pour combiner efficacement données de simulations et expérimentales dans le but d’extraire la structure multidimensionnelle du nucléon en termes de quarks et gluons. Fondée sur la repondération bayésienne, cette technique permet de réduire fortement le coût de calcul par rapport aux approches standards. Les premières évaluations estiment que combiner données expérimentales et de simulation permettrait de réduire de près de 50 % [1] les incertitudes et permettent d’espérer une cartographie précise des quarks et des gluons dans le proton pour la seconde moitié de la décennie. C’est précisément l’objectif du projet CompToN financé par l’ANR qui a débuté à l’Irfu le 1 avril 2024.

 

La structure multidimensionnelle du nucléon en termes de quarks et de gluons est une des questions majeures de la physique hadronique moderne. Elle peut être étudiée pour des nucléons voyageant à une vitesse proche de celle de la lumière. En effet, dans ce cas très particulier, à haute énergie, on peut définir des densités 3D de quarks et de gluons à l’intérieur du nucléon. Cette information est encodée dans des fonctions mathématiques particulières appelées Distributions de Parton Généralisées (GPD). Ces GPD peuvent être extraites des données expérimentales obtenues lors de la mesure à haute énergie de processus exclusifs, c’est-à-dire de processus dans lesquels l’état final est entièrement caractérisé. Plusieurs installations expérimentales actuelles et à venir autour du globe ont des programmes de physique dédiés à l’extraction des GPD. L’Irfu est d’ailleurs fortement investi dans cette campagne expérimentale, particulièrement à travers le programme CLAS12 mené au Jefferson Laboratory aux États-Unis. Cependant, comme expliqué dans un précédent fait marquant, les processus exclusifs considérés filtrent une partie de l’information relative à la structure multidimensionnelle. En conséquence, l’extraction de la structure multidimensionnelle du nucléon est entachée de grandes incertitudes d’origine théorique. 

 

En parallèle des développements théoriques et expérimentaux, la dernière décennie a été fructueuse du point de vue de la simulation numérique de l’interaction forte. Les progrès réalisés en termes de puissance de calculs et d’efficacité algorithmique ont rendu les simulations actuelles réalistes. De plus, de nouvelles idées ont permis de connecter les calculs issus de simulation numériques à la structure multidimensionnelle du nucléon. Cependant, le calcul direct de la structure du nucléon même unidimensionnelle reste impossible pour l’instant, du fait de verrous mathématiques et algorithmiques. Les nouvelles méthodes évoquées ici proposent un contournement de ce problème via une détermination indirecte. On parle alors d’extraire les GPD à partir d’observables de simulation, de manière très similaire à ce qui est fait en pratique avec les observables expérimentales. Et comme dans le cas expérimental, une partie de l’information multidimensionnelle est filtrée. Mais les natures des filtres dans le cadre des expériences et des simulations sont très différentes et laissent passer des informations complémentaires.

 

Une équipe de l’Irfu, en collaboration avec des physiciens du laboratoire national de physique nucléaire (NCBJ) de Varsovie et de l’université Williams & Mary aux États-Unis, s’est donc posé la question de savoir si ces informations pouvaient être combinées de manière à réduire les incertitudes théoriques pesant sur l’extraction de la structure multidimensionnelle du nucléon. Pour ce faire, un modèle de GPD reposant sur un réseau de neurones a été spécialement conçu [2] pour : 

  • être capable, par construction, de respecter l’ensemble des propriétés théoriques qui s’imposent aux GPD ;
  • être capable de correctement tenir compte des incertitudes de reconstruction dues à l’information partielle obtenue via les processus expérimentaux.

À l’aide de ce modèle, les physiciens ont produit une centaine de répliques, c’est-à-dire une centaine de solutions acceptables, en accord avec les données expérimentales disponibles. L’épaisseur du paquet caractérise les incertitudes théoriques d’extraction. C’est cette bande d’incertitude que l’on va chercher à réduire, en combinant données expérimentales et données de simulation. 

 

À l’heure actuelle, il n’existe pas de données publiques de simulations liées à la structure multidimensionnelle du nucléon, mais plusieurs groupes, aux États-Unis comme en Europe se sont lancés dans la course à leur production. Pour pallier ce manque temporaire, des données factices sont générées aléatoirement autour de la valeur centrale du paquet de répliques, mimant l’extension cinématique, la précision et le niveau de corrélation attendus de données de simulation réelles. Ces caractéristiques sont construites sur la base des données de simulation unidimensionnelles déjà disponibles. Idéalement, on voudrait alors réentraîner le réseau de neurone en incluant ces données factices pour étudier l’impact potentiel des données de simulation. Cependant, une des propriétés théoriques des GPD, appelée positivité, n’a pas pu être encastrée dans l’architecture du réseau. Elle est garantie au niveau de l’entraînement, ce qui augmente très significativement le temps d’apprentissage. Une étude d’impact reposant sur de multiples entraînements successifs du modèle se révélerait trop coûteuse. 

 

Pour pallier ce problème de coût de calcul, on fait appel à une technique de repondération bayésienne. Pour chaque réplique, on associe un poids ω compris entre 0 et 1. Plus l’accord entre la réplique et les nouvelles données est grand, plus le poids de cette réplique est important. À l’inverse, les répliques en désaccord avec les nouvelles données se verront attribuer un poids proche de 0. On définit ainsi le paquet de répliques repondérées, et on peut à nouveau calculer la valeur centrale et l’intervalle de confiance tous les deux repondérés.

 
Réduire les incertitudes théoriques sur la  structure du nucléon à l’aide des simulations

Figure 1: Diagramme supérieur: les cent répliques générées via le modèle de GPD. Les valeurs centrales et intervalle de confiance à 68% sont représentés selon la prise en compte des données factices de simulation (??, ??) ou non (?, ?). Diagramme inférieur : ratio ? des intervalles de confiance ??/? (trait plein violet) en fonction de x, et valeur moyenne de réduction des incertitudes sur l'intervalle cinématique (pointillé vert).

Les résultats de cette procédure sont illustrés sur la figure 1, qui représente une coupe unidimensionnelle des GPD. La variable cinématique x représente la fraction d’impulsion portée par le quark sondé dans la direction de déplacement du nucléon. Les cent répliques sont réprésentées par des traits pleins verts. Des répliques atypiques (très éloignées de la valeur centrale) sont clairement visibles, justifiant le traitement spécifique évoqué précédemment. Les valeurs centrales sans (μ, trait pointillé bleu) et avec (μω, trait plein rose) repondération bayésienne sont très proches l’une de l’autre, comme attendu. En revanche, l’intervalle de confiance σω (traits pleins violets) de la distribution de répliques repondérée est bien plus étroit que celui de la distribution originale (σ, traits pointillés rouges), mettant ainsi en lumière une réduction significative des incertitudes. Cette réduction peut être quantifiée par le ratio Σ = σω pour toute valeur de x, et dont la valeur moyenne est de l’ordre de 0.5 sur l’intervalle logarithmique choisi en x. Cette étude permet donc de conclure qu’en combinant données expérimentales et données de simulations, on peut espérer jusqu’à un facteur deux de réduction des incertitudes. 

 

Ce résultat est important car, on s’attend à ce qu’une grande quantité de données expérimentales reliées aux GPDs soit produite, et ce, à une précision inégalée, notamment au Jefferson Laboratory (USA).  Or ces données sont attendues dans la région cinématique 0.05< x < 0.5, c’est-à-dire là où l’impact de la repondération semble être maximal (figure 1). En combinant ces nouvelles données expérimentales avec les données de simulations à venir, on peut ainsi espérer réduire significativement les incertitudes théoriques sur la structure multidimensionnelle du nucléon. C’est l’objectif principal du projet ANR CompToN qui débutera à l’Irfu en avril prochain.

 

Contact : Cédric Mezrag et Michael Riberdy

[1] M. Riberdy et al.Combining lattice QCD and phenomenological inputs on generalised parton distributions at moderate skewness , Eur. Phys. J. C 84, 201 (2024), e-Print: 2306.01647

[2] H. Dutrieux et al., Artificial neural network modelling of generalised parton distributionsEur. Phys. J. C 82 (2022) 3, e-Print: 2112.10528

 
#5246 - Màj : 24/04/2024

 

Retour en haut