Une intelligence artificielle retrouve des lois physiques à partir de données scientifiques

Résultat scientifique Univers

L'apprentissage profond est-il inévitablement synonyme de "boîtes noires"? On reproche souvent à ces méthodes leur absence de transparence résultant en des modèles inintelligibles. C’est un problème qui se pose tout particulièrement en physique, domaine dans lequel on cherche à modéliser les lois régissant notre Univers sous la forme d’équations compréhensibles et non pas de réseaux de neurones opaques constitués de millions de nombres. Une équipe de recherche internationale comprenant des scientifiques du CNRS-INSU (voir encadré), s’est attaquée à ce problème en créant un algorithme d’intelligence artificielle produisant des modèles physiques analytiques à partir de données scientifiques brutes. 

Manipuler des symboles mathématiques même élémentaires tels que l’addition ou la division peut s’avérer un défi complexe pour les réseaux de neurones. Toutefois, grâce aux progrès réalisés dans les techniques d'intelligence artificielle liées au traitement du langage et en s’appuyant sur les approches utilisées en calcul symbolique, il est désormais possible de créer des réseaux de neurones générant des équations. Néanmoins, la quête de l’équation idéale modélisant parfaitement un jeu de données  en ayant la liberté conjuguer pléthore de symboles mathématiques peut rapidement devenir un enfer combinatoire. Comme on vous l’a peut être répété mainte fois à l’école, en physique on ne peut pas “additionner des patates et des carottes”, par exemple on ne peut pas additionner une longueur et une vitesse car cela n’a pas de sens physiquement. Ces règles dites d’analyse dimensionnelle interdisent certaines combinaisons de symboles mathématiques lors de l’écriture d’une équation physique et permettent de grandement réduire l'espace combinatoire.

La méthode d’intelligence artificielle baptisée “PhySO” acronyme d’Optimisation Symbolique Physique élabore des milliers d’équations par seconde et apprend de façon autonome à formuler des équations de qualité croissante par essai erreur tout en capitalisant sur ces règles d’analyse dimensionnelle. Il convient de souligner l'absence de préjugés de ce type de méthode non supervisée quant à la configuration précise des équations recherchées. Ce type d’impartialité intrinsèque pourrait-il un jour conduire à une recherche scientifique plus agnostique ?

Laboratoires impliqués

Laboratoire CNRS : 

  • Observatoire astronomique de Strasbourg (ObAS)

Tutelles : CNRS / Univ. Strasbourg

Autre laboratoire : 

  • Agence scientifique nationale australienne, CSIRO

 

Illustration de la réduction de l’espace combinatoire offerte par l’analyse dimensionnelle© Référence

PhySO l’intelligence artificielle développée par la collaboration franco-australienne retrouvant l’équation du cas d’école de l'oscillateur harmonique à partir d’un jeu de données.

Audiodescription

Pour en savoir plus

Wassim Tenachi, Rodrigo Ibata, Foivos Diakogiannis, Deep symbolic regression for physics guided by units constraints: toward the automated discovery of physical laws, The Astrophysical Journal, 2023. 

Contact

Rodrigo Ibata
Directeur de recherche CNRS à l'Observatoire astronomique de Strasbourg
Wassim Tenachi
Doctorant à l'Observatoire astronomique de Strasbourg