Les fils de la pensée

Paramètres de recherches

Filtres

Citation

Catégorie

Tag – étiquette

Auteur

Info

Recherche avancée

Détail auteurs

Présentation, tri

Dictionnaire analogique intriqué pour extraits. Recherche mots ou phrases tous azimuts. Aussi outil de précision sémantique et de réflexion communautaire. Voir la rubrique mode d'emploi. Jetez un oeil à la colonne "chaînes". ATTENTION, faire une REINITIALISATION après une recherche complexe. Et utilisez le nuage de corrélats !!!!..... Lire la suite >>

Nuage de corrélats

[...] accord à soi-même audimat calcul conservation curiosité non contrainte différences dormir esprit faire faveur faveurs historique inculture nations personnes plaisir pourquoi pouvoir progression savent silence système temps temps libre toujours trouver vacherie vérité éducation

Résultat(s): 233

Temps de recherche: 0.0455s

« Précédent
1
…
20
21
22
23
24
Suivant »

univers protonique

Forces tourbillonnantes et pressions d’écrasement mesurées dans le proton

Des expériences très attendues qui utilisent la lumière pour imiter la gravité révèlent pour la première fois la répartition des énergies, des forces et des pressions à l’intérieur d’une particule subatomique.

(Image : Les forces poussent dans un sens près du centre du proton et dans l’autre sens près de sa surface.)

Les physiciens ont commencé à explorer le proton comme s’il s’agissait d’une planète subatomique. Les cartes en coupe affichent de nouveaux détails de l'intérieur de la particule. Le noyau du proton présente des pressions plus intenses que dans toute autre forme connue de matière. À mi-chemin de la surface, des tourbillons de force s’affrontent les uns contre les autres. Et la " planète " dans son ensemble est plus petite que ne le suggéraient les expériences précédentes.

Les recherches expérimentales marquent la prochaine étape dans la quête visant à comprendre la particule qui ancre chaque atome et constitue la majeure partie de notre monde.

"Nous y voyons vraiment l'ouverture d'une direction complètement nouvelle qui changera notre façon de considérer la structure fondamentale de la matière", a déclaré Latifa Elouadrhiri , physicienne au Thomas Jefferson National Accelerator Facility à Newport News, en Virginie, qui participe à l'effort.

Les expériences jettent littéralement un nouvel éclairage sur le proton. Au fil des décennies, les chercheurs ont méticuleusement cartographié l’influence électromagnétique de la particule chargée positivement. Mais dans la nouvelle recherche, les physiciens du Jefferson Lab cartographient plutôt l'influence gravitationnelle du proton, à savoir la répartition des énergies, des pressions et des contraintes de cisaillement, qui courbent le tissu espace-temps dans et autour de la particule. Pour ce faire, les chercheurs exploitent une manière particulière par laquelle des paires de photons, des particules de lumière, peuvent imiter un graviton, la particule supposée qui transmet la force de gravité. En envoyant un ping au proton avec des photons, ils déduisent indirectement comment la gravité interagirait avec lui, réalisant ainsi un rêve vieux de plusieurs décennies consistant à interroger le proton de cette manière alternative.

"C'est un tour de force", a déclaré Cédric Lorcé , physicien à l'Ecole Polytechnique en France, qui n'a pas participé aux travaux. "Expérimentalement, c'est extrêmement compliqué."

Des photons aux gravitons

Les physiciens ont appris énormément sur le proton au cours des 70 dernières années en le frappant à plusieurs reprises avec des électrons. Ils savent que sa charge électrique s’étend sur environ 0,8 femtomètre, ou quadrillionièmes de mètre, à partir de son centre. Ils savent que les électrons entrants ont tendance à être projetés sur l’un des trois quarks – des particules élémentaires avec des fractions de charge – qui bourdonnent à l’intérieur. Ils ont également observé la conséquence profondément étrange de la théorie quantique où, lors de collisions plus violentes, les électrons semblent rencontrer une mer mousseuse composée de bien plus de quarks ainsi que de gluons, porteurs de la force dite forte, qui colle les quarks ensemble.

Toutes ces informations proviennent d’une seule configuration : vous lancez un électron sur un proton, et les particules échangent un seul photon – le porteur de la force électromagnétique – et se repoussent. Cette interaction électromagnétique indique aux physiciens comment les quarks, en tant qu'objets chargés, ont tendance à s'organiser. Mais le proton a bien plus à offrir que sa charge électrique.

(Photo : Latifa Elouadrhiri, scientifique principale du laboratoire Jefferson, a dirigé la collecte de données à partir desquelles elle et ses collaborateurs calculent désormais les propriétés mécaniques du proton.)

" Comment la matière et l'énergie sont-elles distribuées ? " a demandé Peter Schweitzer , physicien théoricien à l'Université du Connecticut. "Nous ne savons pas."

Schweitzer a passé la majeure partie de sa carrière à réfléchir au côté gravitationnel du proton. Plus précisément, il s'intéresse à une matrice de propriétés du proton appelée tenseur énergie-impulsion. " Le tenseur énergie-impulsion sait tout ce qu'il y a à savoir sur la particule ", a-t-il déclaré.

Dans la théorie de la relativité générale d'Albert Einstein, qui présente l'attraction gravitationnelle comme des objets suivant des courbes dans l'espace-temps, le tenseur énergie-impulsion indique à l'espace-temps comment se plier. Elle décrit, par exemple, la disposition de l'énergie (ou, de manière équivalente, de la masse) – la source de ce qui est la part du lion de la torsion de l'espace-temps. Elle permet également d'obtenir des informations sur la répartition de la dynamique, ainsi que sur les zones de compression ou d'expansion, ce qui peut également donner une légère courbure à l'espace-temps.

Si nous pouvions connaître la forme de l'espace-temps entourant un proton, élaborée indépendamment par des physiciens russes et américains dans les années 1960, nous pourrions en déduire toutes les propriétés indexées dans son tenseur énergie-impulsion. Celles-ci incluent la masse et le spin du proton, qui sont déjà connus, ainsi que l'agencement des pressions et des forces du proton, une propriété collective que les physiciens nomment " Druck term ", d'après le mot " pression" en allemand. Ce terme est " aussi important que la masse et la rotation, et personne ne sait ce que c'est ", a déclaré Schweitzer – même si cela commence à changer.

Dans les années 60, il semblait que la mesure du tenseur énergie-momentum et le calcul du terme de Druck nécessiteraient une version gravitationnelle de l'expérience de diffusion habituelle : On envoie une particule massive sur un proton et on laisse les deux s'échanger un graviton - la particule hypothétique qui constitue les ondes gravitationnelles - plutôt qu'un photon. Mais en raison de l'extrême subtilité de la gravité, les physiciens s'attendent à ce que la diffusion de gravitons se produise 39 fois plus rarement que la diffusion de photons. Les expériences ne peuvent pas détecter un effet aussi faible.

"Je me souviens avoir lu quelque chose à ce sujet quand j'étais étudiant", a déclaré Volker Burkert , membre de l'équipe du Jefferson Lab. Ce qu’il faut retenir, c’est que " nous ne pourrons probablement jamais rien apprendre sur les propriétés mécaniques des particules ".Gravitation sans gravité

Les expériences gravitationnelles sont encore inimaginables aujourd’hui. Mais les recherches menées en fin des années 1990 et au début des années 2000 par les physiciens Xiangdong Ji et, travaillant séparément, feu Maxim Polyakov, ont révélé une solution de contournement.

Le schéma général est le suivant. Lorsque vous tirez légèrement un électron sur un proton, il délivre généralement un photon à l'un des quarks et le détourne. Mais lors d’un événement sur un milliard, quelque chose de spécial se produit. L’électron entrant envoie un photon. Un quark l'absorbe puis émet un autre photon un battement de cœur plus tard. La principale différence est que cet événement rare implique deux photons au lieu d’un : des photons entrants et sortants. Les calculs de Ji et Polyakov ont montré que si les expérimentateurs pouvaient collecter les électrons, protons et photons résultants, ils pourraient déduire des énergies et des impulsions de ces particules ce qui s'est passé avec les deux photons. Et cette expérience à deux photons serait essentiellement aussi informative que l’impossible expérience de diffusion de gravitons.

Comment deux photons pourraient-ils connaître la gravité ? La réponse fait appel à des mathématiques très complexes. Mais les physiciens proposent deux façons de comprendre pourquoi cette astuce fonctionne.

Les photons sont des ondulations dans le champ électromagnétique, qui peuvent être décrites par une seule flèche, ou vecteur, à chaque emplacement de l'espace indiquant la valeur et la direction du champ. Les gravitons seraient des ondulations dans la géométrie de l’espace-temps, un domaine plus complexe représenté par une combinaison de deux vecteurs en chaque point. Capturer un graviton donnerait aux physiciens deux vecteurs d’informations. En dehors de cela, deux photons peuvent remplacer un graviton, puisqu’ils transportent également collectivement deux vecteurs d’information.

Une interprétation mathématiques alternative est celle-ci. Pendant le moment qui s'écoule entre le moment où un quark absorbe le premier photon et celui où il émet le second, le quark suit un chemin à travers l'espace. En sondant ce chemin, nous pouvons en apprendre davantage sur des propriétés telles que les pressions et les forces qui entourent le chemin.

"Nous ne faisons pas d'expérience gravitationnelle", a déclaré Lorcé. Mais " nous devrions obtenir un accès indirect à la manière dont un proton devrait interagir avec un graviton ".

Sonder la planète ProtonEn 2000, les physiciens du Jefferson Lab ont réussi à obtenir quelques résultats de diffusion à deux photons. Cette démonstration de faisabilité les a incités à construire une nouvelle expérience et, en 2007, ils ont fait entrer des électrons dans des protons suffisamment de fois pour obtenir environ 500 000 collisions imitant les gravitons. L'analyse des données expérimentales a pris une décennie de plus.

À partir de leur index des propriétés de flexion de l’espace-temps, l’équipe a extrait le terme insaisissable de Druck, publiant son estimation des pressions internes du proton dans Nature en 2018.

Ils ont découvert qu’au cœur du proton, la force puissante génère des pressions d’une intensité inimaginable : 100 milliards de milliards de milliards de pascals, soit environ 10 fois la pression au cœur d’une étoile à neutrons. Plus loin du centre, la pression chute et finit par se retourner vers l'intérieur, comme c'est nécessaire pour que le proton ne se brise pas. "Voilà qui résulte de l'expérience", a déclaré Burkert. "Oui, un proton est réellement stable." (Cette découverte n’a cependant aucune incidence sur la désintégration des protons , ce qui implique un type d’instabilité différent prédit par certaines théories spéculatives.)

Le groupe Jefferson Lab a continué à analyser le terme Druck. Ils ont publié une estimation des forces de cisaillement (forces internes poussant parallèlement à la surface du proton) dans le cadre d'une étude publiée en décembre. Les physiciens ont montré que près de son noyau, le proton subit une force de torsion qui est neutralisée par une torsion dans l’autre sens plus près de la surface. Ces mesures soulignent également la stabilité de la particule. Les rebondissements étaient attendus sur la base des travaux théoriques de Schweitzer et Polyakov. "Néanmoins, le voir émerger de l'expérience pour la première fois est vraiment stupéfiant", a déclaré Elouadrhiri.

Ils utilisent désormais ces outils pour calculer la taille du proton d'une nouvelle manière. Dans les expériences de diffusion traditionnelles, les physiciens avaient observé que la charge électrique de la particule s'étendait à environ 0,8 femtomètre de son centre (c'est-à-dire que les quarks qui la composent bourdonnent dans cette région). Mais ce " rayon de charge " présente quelques bizarreries. Dans le cas du neutron, par exemple — l'équivalent neutre du proton, dans lequel deux quarks chargés négativement ont tendance à rester profondément à l'intérieur de la particule tandis qu'un quark chargé positivement passe plus de temps près de la surface — le rayon de charge apparaît comme un nombre négatif. "Cela ne veut pas dire que la taille est négative ; ce n'est tout simplement pas une mesure fiable ", a déclaré Schweitzer.

La nouvelle approche mesure la région de l’espace-temps considérablement courbée par le proton. Dans une prépublication qui n'a pas encore été évaluée par des pairs, l'équipe du Jefferson Lab a calculé que ce rayon pourrait être environ 25 % plus petit que le rayon de charge, soit seulement 0,6 femtomètre.

Les limites de la planète Proton

D'un point de vue conceptuel, ce type d'analyse adoucit la danse floue des quarks pour en faire un objet solide, semblable à une planète, avec des pressions et des forces agissant sur chaque point de volume. Cette planète gelée ne reflète pas entièrement le proton bouillonnant dans toute sa gloire quantique, mais c'est un modèle utile. "C'est une interprétation", a déclaré M. Schweitzer.

Et les physiciens soulignent que ces cartes initiales sont approximatives, pour plusieurs raisons.

Premièrement, mesurer avec précision le tenseur énergie-impulsion nécessiterait des énergies de collision beaucoup plus élevées que celles que Jefferson Lab peut produire. L’équipe a travaillé dur pour extrapoler soigneusement les tendances à partir des énergies relativement faibles auxquelles elles peuvent accéder, mais les physiciens ne sont toujours pas sûrs de la précision de ces extrapolations.

(Photo : Lorsqu'il était étudiant, Volker Burkert a lu qu'il était impossible de mesurer directement les propriétés gravitationnelles du proton. Aujourd'hui, il participe à une collaboration au laboratoire Jefferson qui est en train de découvrir indirectement ces mêmes propriétés.)

De plus, le proton est plus que ses quarks ; il contient également des gluons, qui se déplacent sous leurs propres pressions et forces. L'astuce à deux photons ne peut pas détecter les effets des gluons. Une autre équipe du Jefferson Lab a utilisé une astuce analogue ( impliquant une interaction double-gluon ) pour publier l'année dernière une carte gravitationnelle préliminaire de ces effets des gluons dans Nature, mais elle était également basée sur des données limitées et à faible énergie.

"C'est une première étape", a déclaré Yoshitaka Hatta, physicien au Brookhaven National Laboratory qui a eu l'idée de commencer à étudier le proton gravitationnel après les travaux du groupe Jefferson Lab en 2018.

Des cartes gravitationnelles plus précises des quarks du proton et de ses gluons pourraient être disponibles dans les années 2030, lorsque le collisionneur électron-ion, une expérience actuellement en construction à Brookhaven, entrera en activité.

Pendant ce temps, les physiciens poursuivent leurs expériences numériques. Phiala Shanahan, physicienne nucléaire et des particules au Massachusetts Institute of Technology, dirige une équipe qui calcule le comportement des quarks et des gluons à partir des équations de la force forte. En 2019, elle et ses collaborateurs ont estimé les pressions et les forces de cisaillement, et en octobre, en ont estimé le rayon, entre autres propriétés. Jusqu'à présent, leurs résultats numériques ont été largement alignés sur les résultats physiques du Jefferson Lab. "Je suis certainement très excitée par la cohérence entre les résultats expérimentaux récents et nos données", a déclaré Mme Shanahan.

Même les aperçus flous du proton obtenus jusqu'à présent ont légèrement remodelé la compréhension des chercheurs sur la particule.

Certaines conséquences sont pratiques. Au CERN, l'organisation européenne qui gère le Grand collisionneur de hadrons, le plus grand broyeur de protons au monde, les physiciens pensaient auparavant que dans certaines collisions rares, les quarks pouvaient se trouver n'importe où dans les protons en collision. Mais les cartes inspirées par la gravitation suggèrent que les quarks ont tendance à rester près du centre dans de tels cas.

"Les modèles utilisés au CERN ont déjà été mis à jour", a déclaré François-Xavier Girod, physicien du Jefferson Lab qui a travaillé sur les expériences.

Les nouvelles cartes pourraient également offrir des pistes pour résoudre l’un des mystères les plus profonds du proton : pourquoi les quarks se lient en protons. Il existe un argument intuitif selon lequel, comme la force puissante entre chaque paire de quarks s'intensifie à mesure qu'ils s'éloignent, comme un élastique, les quarks ne peuvent jamais échapper à leurs camarades.

Mais les protons sont fabriqués à partir des membres les plus légers de la famille des quarks. Et les quarks légers peuvent également être considérés comme de longues ondes s'étendant au-delà de la surface du proton. Cette image suggère que la liaison du proton pourrait se produire non pas via la traction interne de bandes élastiques, mais par une interaction externe entre ces quarks ondulés et étirés. La cartographie de pression montre l’attraction de la force forte s’étendant jusqu’à 1,4 femtomètres et au-delà, renforçant ainsi l’argument en faveur de ces théories alternatives.

"Ce n'est pas une réponse définitive", a déclaré Girod, "mais cela indique que ces simples images avec des bandes élastiques ne sont pas pertinentes pour les quarks légers."

Auteur: Internet

Info: https://filsdelapensee.ch - Charlie Bois, 14 mars 2024

[ chromodynamique quantique ]

Commenter

Commentaires: 0

Ajouté à la BD par miguel

intelligence artificielle

Apprendre l'anglais n'est pas une tâche facile, comme le savent d'innombrables étudiants. Mais lorsque l'étudiant est un ordinateur, une approche fonctionne étonnamment bien : Il suffit d'alimenter un modèle mathématique géant, appelé réseau neuronal, avec des montagnes de textes provenant d'Internet. C'est le principe de fonctionnement des modèles linguistiques génératifs tels que ChatGPT d'OpenAI, dont la capacité à tenir une conversation cohérente (à défaut d'être toujours sincère) sur un large éventail de sujets a surpris les chercheurs et le public au cours de l'année écoulée.

Mais cette approche présente des inconvénients. D'une part, la procédure de "formation" nécessaire pour transformer de vastes archives textuelles en modèles linguistiques de pointe est coûteuse et prend beaucoup de temps. D'autre part, même les personnes qui forment les grands modèles linguistiques ont du mal à comprendre leur fonctionnement interne, ce qui, à son tour, rend difficile la prévision des nombreuses façons dont ils peuvent échouer.

Face à ces difficultés, certains chercheurs ont choisi d'entraîner des modèles plus petits sur des ensembles de données plus restreints, puis d'étudier leur comportement. "C'est comme le séquençage du génome de la drosophile par rapport au séquençage du génome humain", explique Ellie Pavlick, chercheuse sur les modèles de langage à l'université de Brown.

Dans un article récemment publié sur le serveur scientifique arxiv.org, deux chercheurs de Microsoft ont présenté une nouvelle méthode pour former de minuscules modèles de langage : Les élever avec un régime strict d'histoires pour enfants.

RÉSEAUX NEURONAUX

Des chercheurs acquièrent une nouvelle compréhension à partir d'une simple IA

Les chercheurs en apprentissage automatique ont compris cette leçon. GPT-3.5, le grand modèle linguistique qui alimente l'interface ChatGPT, compte près de 200 milliards de paramètres et a été entraîné sur un ensemble de données comprenant des centaines de milliards de mots (OpenAI n'a pas publié les chiffres correspondants pour son successeur, GPT-4). L'entraînement de modèles aussi vastes nécessite généralement au moins 1 000 processeurs spécialisés, appelés GPU, fonctionnant en parallèle pendant des semaines. Seules quelques entreprises peuvent réunir les ressources nécessaires, sans parler de l'entraînement et de la comparaison de différents modèles.

Les deux chercheurs ont montré que des modèles linguistiques des milliers de fois plus petits que les systèmes de pointe actuels apprenaient rapidement à raconter des histoires cohérentes et grammaticalement justes lorsqu'ils étaient formés de cette manière. Leurs résultats indiquent de nouvelles pistes de recherche qui pourraient être utiles pour former des modèles plus importants et comprendre leur comportement.

"J'ai trouvé tout ça très instructif", a déclaré Chandra Bhagavatula, chercheur sur les modèles de langage à l'Allen Institute for Artificial Intelligence de Seattle. "Le concept lui-même est très intéressant.

Il était une fois

Les réseaux neuronaux au cœur des modèles de langage sont des structures mathématiques vaguement inspirées du cerveau humain. Chacun d'entre eux contient de nombreux neurones artificiels disposés en couches, avec des connexions entre les neurones des couches adjacentes. Le comportement du réseau neuronal est régi par la force de ces connexions, appelées paramètres. Dans un modèle linguistique, les paramètres contrôlent les mots que le modèle peut produire ensuite, compte tenu d'une invite initiale et des mots qu'il a déjà générés.

Un modèle ne prend véritablement vie qu'au cours de la formation, lorsqu'il compare de manière répétée ses propres résultats au texte de son ensemble de données de formation et qu'il ajuste ses paramètres afin d'accroître la ressemblance. Un réseau non entraîné avec des paramètres aléatoires est trivialement facile à assembler à partir de quelques lignes de code, mais il ne produira que du charabia. Après l'entraînement, il peut souvent poursuivre de manière plausible un texte peu familier. Les modèles de plus grande taille sont souvent soumis à des réglages plus fins qui leur apprennent à répondre à des questions et à suivre des instructions, mais l'essentiel de la formation consiste à maîtriser la prédiction des mots.

Pour réussir à prédire des mots, un modèle linguistique doit maîtriser de nombreuses compétences différentes. Par exemple, les règles de la grammaire anglaise suggèrent que le mot suivant le mot "going" sera probablement "to", quel que soit le sujet du texte. En outre, un système a besoin de connaissances factuelles pour compléter "la capitale de la France est", et compléter un passage contenant le mot "not" nécessite une connaissance rudimentaire de la logique.

"Le langage brut est très compliqué", explique Timothy Nguyen, chercheur en apprentissage automatique chez DeepMind. "Pour que des capacités linguistiques intéressantes apparaissent, les gens ont eu recours à l'idée que plus il y a de données, mieux c'est".

(photo) Ronen Eldan s'est rendu compte qu'il pouvait utiliser les histoires d'enfants générées par de grands modèles linguistiques pour en entraîner rapidement de plus petits.

Introduction

Ronen Eldan, mathématicien qui a rejoint Microsoft Research en 2022 pour étudier les modèles de langage génératifs, souhaitait développer un moyen moins coûteux et plus rapide d'explorer leurs capacités. Le moyen naturel d'y parvenir était d'utiliser un petit ensemble de données, ce qui signifiait qu'il devait entraîner les modèles à se spécialiser dans une tâche spécifique, afin qu'ils ne s'éparpillent pas. Au départ, il voulait entraîner les modèles à résoudre une certaine catégorie de problèmes mathématiques, mais un après-midi, après avoir passé du temps avec sa fille de 5 ans, il s'est rendu compte que les histoires pour enfants convenaient parfaitement. "L'idée m'est venue littéralement après lui avoir lu une histoire", a-t-il déclaré.

Pour générer des histoires cohérentes pour les enfants, un modèle de langage devrait apprendre des faits sur le monde, suivre les personnages et les événements, et observer les règles de grammaire - des versions plus simples des défis auxquels sont confrontés les grands modèles. Mais les grands modèles formés sur des ensembles de données massives apprennent d'innombrables détails non pertinents en même temps que les règles qui comptent vraiment. Eldan espérait que la brièveté et le vocabulaire limité des histoires pour enfants rendraient l'apprentissage plus gérable pour les petits modèles, ce qui les rendrait à la fois plus faciles à former et plus faciles à comprendre.

Dans le monde des modèles de langage, cependant, le terme "petit" est relatif : Un ensemble de données mille fois plus petit que celui utilisé pour former GPT-3.5 devrait encore contenir des millions d'histoires. "Je ne sais pas combien d'argent vous voulez dépenser, mais je suppose que vous n'allez pas engager des professionnels pour écrire quelques millions de nouvelles", a déclaré M. Nguyen.

Il faudrait un auteur extraordinairement prolifique pour satisfaire des lecteurs aussi voraces, mais Eldan avait quelques candidats en tête. Qui peut mieux écrire pour un public de petits modèles linguistiques que pour de grands modèles ?

Toys stories

Eldan a immédiatement entrepris de créer une bibliothèque d'histoires synthétiques pour enfants générées par de grands modèles linguistiques. Mais il a rapidement découvert que même les modèles de pointe ne sont pas naturellement très créatifs. Si l'on demande à GPT-4 d'écrire des histoires adaptées à des enfants de 4 ans, explique Eldan, "environ un cinquième des histoires concernera des enfants qui vont au parc et qui ont peur des toboggans". C'est apparemment la quintessence des histoires pour enfants d'âge préscolaire, selon l'Internet.

La solution a consisté à ajouter un peu d'aléatoire dans le message. Tout d'abord, Eldan a utilisé le GPT-4 pour générer une liste de 1 500 noms, verbes et adjectifs qu'un enfant de 4 ans pourrait connaître - suffisamment courte pour qu'il puisse facilement la vérifier lui-même. Il a ensuite écrit un programme informatique simple qui demanderait à plusieurs reprises à GPT-3.5 ou à GPT-4 de générer une histoire adaptée à l'âge de l'enfant, comprenant trois mots aléatoires de la liste, ainsi qu'un détail supplémentaire choisi au hasard, comme une fin heureuse ou un rebondissement de l'intrigue. Les histoires obtenues, heureusement, étaient moins axées sur des diapositives effrayantes.

Eldan disposait désormais d'une procédure pour produire des données de formation à la demande, mais il n'avait aucune idée du nombre d'histoires dont il aurait besoin pour former un modèle fonctionnel, ni de la taille de ce modèle. C'est alors qu'il s'est associé à Yuanzhi Li, chercheur en apprentissage automatique chez Microsoft et à l'université Carnegie Mellon, pour essayer différentes possibilités, en tirant parti du fait que les petits modèles peuvent être formés très rapidement. La première étape consistait à décider comment évaluer leurs modèles.

Introduction

Dans la recherche sur les modèles de langage - comme dans toute salle de classe - la notation est un sujet délicat. Il n'existe pas de rubrique parfaite qui englobe tout ce que les chercheurs veulent savoir, et les modèles qui excellent dans certaines tâches échouent souvent de manière spectaculaire dans d'autres. Au fil du temps, les chercheurs ont mis au point divers critères de référence standard basés sur des questions dont les réponses ne sont pas ambiguës, ce qui est une bonne approche si vous essayez d'évaluer des compétences spécifiques. Mais Eldan et Li se sont intéressés à quelque chose de plus nébuleux : quelle doit être la taille réelle des modèles linguistiques si l'on simplifie le langage autant que possible ?

"Pour vérifier directement si le modèle parle anglais, je pense que la seule chose à faire est de laisser le modèle générer de l'anglais de manière ouverte", a déclaré M. Eldan.

Il n'y a que deux façons de mesurer les performances d'un modèle sur des questions aussi qualitatives : S'appuyer sur des évaluateurs humains ou se tourner à nouveau vers le GPT-4. Les deux chercheurs ont opté pour cette dernière solution, laissant les grands modèles à la fois rédiger les manuels et noter les dissertations.

Bhagavatula a déclaré qu'il aurait aimé voir comment les évaluations de GPT-4 se comparaient à celles des correcteurs humains - GPT-4 peut être biaisé en faveur des modèles qu'il a aidé à former, et l'opacité des modèles de langage rend difficile la quantification de tels biais. Mais il ne pense pas que de telles subtilités affecteraient les comparaisons entre différents modèles formés sur des ensembles similaires d'histoires synthétiques - l'objectif principal du travail d'Eldan et Li.

Eldan et Li ont utilisé une procédure en deux étapes pour évaluer chacun de leurs petits modèles après la formation. Tout d'abord, ils ont présenté au petit modèle la première moitié d'une histoire distincte de celles de l'ensemble des données d'apprentissage, de manière à ce qu'il génère une nouvelle fin, en répétant ce processus avec 50 histoires de test différentes. Ensuite, ils ont demandé à GPT-4 d'évaluer chacune des fins du petit modèle en fonction de trois catégories : créativité, grammaire et cohérence avec le début de l'histoire. Ils ont ensuite fait la moyenne des notes obtenues dans chaque catégorie, obtenant ainsi trois notes finales par modèle.

Avec cette procédure en main, Eldan et Li étaient enfin prêts à comparer les différents modèles et à découvrir quels étaient les étudiants les plus brillants.

Résultats des tests

Après quelques explorations préliminaires, les deux chercheurs ont opté pour un ensemble de données de formation contenant environ 2 millions d'histoires. Ils ont ensuite utilisé cet ensemble de données, baptisé TinyStories, pour entraîner des modèles dont la taille varie de 1 million à 30 millions de paramètres, avec un nombre variable de couches. Le travail a été rapide : En utilisant seulement quatre GPU, l'entraînement du plus grand de ces modèles n'a pas pris plus d'une journée.

Les plus petits modèles ont eu du mal. Par exemple, l'une des histoires testées commence par un homme à l'air méchant qui dit à une fille qu'il va lui prendre son chat. Un modèle à un million de paramètres s'est retrouvé bloqué dans une boucle où la fille répète sans cesse à l'homme qu'elle veut être son amie. Mais les modèles plus grands, qui sont encore des milliers de fois plus petits que GPT-3.5, ont obtenu des résultats surprenants. La version à 28 millions de paramètres racontait une histoire cohérente, même si la fin était sinistre : "Katie s'est mise à pleurer, mais l'homme s'en fichait. Il a emporté le chat et Katie n'a plus jamais revu son chat. Fin de l'histoire".

En plus de tester leurs propres modèles, Eldan et Li ont soumis le même défi au GPT-2 d'OpenAI, un modèle de 1,5 milliard de paramètres publié en 2019. Le résultat a été bien pire - avant la fin abrupte de l'histoire, l'homme menace d'emmener la jeune fille au tribunal, en prison, à l'hôpital, à la morgue et enfin au crématorium.

Introduction

Selon M. Nguyen, il est passionnant que des modèles aussi petits soient aussi fluides, mais il n'est peut-être pas surprenant que GPT-2 ait eu du mal à accomplir la tâche : il s'agit d'un modèle plus grand, mais loin de l'état de l'art, et il a été formé sur un ensemble de données très différent. "Un enfant en bas âge qui ne s'entraînerait qu'à des tâches d'enfant en bas âge, comme jouer avec des jouets, obtiendrait de meilleurs résultats que vous ou moi", a-t-il fait remarquer. "Nous ne nous sommes pas spécialisés dans cette chose simple.

Les comparaisons entre les différents modèles de TinyStories ne souffrent pas des mêmes facteurs de confusion. Eldan et Li ont observé que les réseaux comportant moins de couches mais plus de neurones par couche étaient plus performants pour répondre aux questions nécessitant des connaissances factuelles ; inversement, les réseaux comportant plus de couches et moins de neurones par couche étaient plus performants pour garder en mémoire les personnages et les points de l'intrigue situés plus tôt dans l'histoire. Bhagavatula a trouvé ce résultat particulièrement intriguant. S'il peut être reproduit dans des modèles plus vastes, "ce serait un résultat vraiment intéressant qui pourrait découler de ce travail", a-t-il déclaré.

Eldan et Li ont également étudié comment les capacités de leurs petits modèles dépendaient de la durée de la période de formation. Dans tous les cas, les modèles maîtrisaient d'abord la grammaire, puis la cohérence. Pour Eldan, ce schéma illustre comment les différences dans les structures de récompense entraînent des différences dans les schémas d'acquisition du langage entre les réseaux neuronaux et les enfants. Pour les modèles de langage, qui apprennent en prédisant des mots, "l'incitation pour les mots "je veux avoir" est aussi importante que pour les mots "crème glacée"", a-t-il déclaré. Les enfants, en revanche, "ne se soucient pas de savoir s'ils disent 'j'aimerais avoir de la glace' ou simplement 'glace, glace, glace'".

Qualité contre quantité

Eldan et Li espèrent que cette étude incitera d'autres chercheurs à entraîner différents modèles sur l'ensemble des données de TinyStories et à comparer leurs capacités. Mais il est souvent difficile de prédire quelles caractéristiques des petits modèles apparaîtront également dans les plus grands.

"Peut-être que les modèles de vision chez la souris sont de très bons substituts de la vision humaine, mais les modèles de dépression chez la souris sont-ils de bons modèles de la dépression chez l'homme ? a déclaré M. Pavlick. "Pour chaque cas, c'est un peu différent.

Le succès des modèles TinyStories suggère également une leçon plus large. L'approche standard pour compiler des ensembles de données de formation consiste à aspirer des textes sur l'internet, puis à filtrer les déchets. Le texte synthétique généré par des modèles de grande taille pourrait constituer une autre façon d'assembler des ensembles de données de haute qualité qui n'auraient pas besoin d'être aussi volumineux.

"Nous avons de plus en plus de preuves que cette méthode est très efficace, non seulement pour les modèles de la taille de TinyStories, mais aussi pour les modèles plus importants", a déclaré M. Eldan. Ces preuves proviennent d'une paire d'articles de suivi sur les modèles à un milliard de paramètres, rédigés par Eldan, Li et d'autres chercheurs de Microsoft. Dans le premier article, ils ont entraîné un modèle à apprendre le langage de programmation Python en utilisant des extraits de code générés par GPT-3.5 ainsi que du code soigneusement sélectionné sur l'internet. Dans le second, ils ont complété l'ensemble de données d'entraînement par des "manuels" synthétiques couvrant un large éventail de sujets, afin d'entraîner un modèle linguistique à usage général. Lors de leurs tests, les deux modèles ont été comparés favorablement à des modèles plus importants formés sur des ensembles de données plus vastes. Mais l'évaluation des modèles linguistiques est toujours délicate, et l'approche des données d'entraînement synthétiques n'en est qu'à ses balbutiements - d'autres tests indépendants sont nécessaires.

Alors que les modèles linguistiques de pointe deviennent de plus en plus volumineux, les résultats surprenants de leurs petits cousins nous rappellent qu'il y a encore beaucoup de choses que nous ne comprenons pas, même pour les modèles les plus simples. M. Nguyen s'attend à ce que de nombreux autres articles explorent l'approche inaugurée par TinyStories.

"La question est de savoir où et pourquoi la taille a de l'importance", a-t-il déclaré. "Il devrait y avoir une science à ce sujet, et cet article est, je l'espère, le début d'une riche histoire.

Auteur: Internet

Info: https://www.quantamagazine.org/ Ben Brubaker, 5 octobre 2023

[ synthèse ]

Commenter

Commentaires: 0

Ajouté à la BD par miguel

dichotomie

De quoi l'espace-temps est-il réellement fait ?

L'espace-temps pourrait émerger d'une réalité plus fondamentale. La découverte de cette réalité pourrait débloquer l'objectif le plus urgent de la physique

Natalie Paquette passe son temps à réfléchir à la manière de faire croître une dimension supplémentaire. Elle commence par de petits cercles, dispersés en tout point de l'espace et du temps - une dimension en forme de boucle, qui se referme sur elle-même. Puis on rétrécit ces cercles, de plus en plus petits, en resserrant la boucle, jusqu'à ce qu'une curieuse transformation se produise : la dimension cesse de sembler minuscule et devient énorme, comme lorsqu'on réalise que quelque chose qui semble petit et proche est en fait énorme et distant. "Nous réduisons une direction spatiale", explique Paquette. "Mais lorsque nous essayons de la rétrécir au-delà d'un certain point, une nouvelle et grande direction spatiale émerge à la place."

Paquette, physicien théoricien à l'université de Washington, n'est pas le seul à penser à cette étrange sorte de transmutation dimensionnelle. Un nombre croissant de physiciens, travaillant dans différents domaines de la discipline avec des approches différentes, convergent de plus en plus vers une idée profonde : l'espace - et peut-être même le temps - n'est pas fondamental. Au contraire, l'espace et le temps pourraient être émergents : ils pourraient découler de la structure et du comportement de composants plus fondamentaux de la nature. Au niveau le plus profond de la réalité, des questions comme "Où ?" et "Quand ?" n'ont peut-être aucune réponse. "La physique nous donne de nombreux indices selon lesquels l'espace-temps tel que nous le concevons n'est pas la chose fondamentale", déclare M. Paquette.

Ces notions radicales proviennent des derniers rebondissements de la chasse à la théorie de la gravité quantique, qui dure depuis un siècle. La meilleure théorie des physiciens sur la gravité est la relativité générale, la célèbre conception d'Albert Einstein sur la façon dont la matière déforme l'espace et le temps. Leur meilleure théorie sur tout le reste est la physique quantique, qui est d'une précision étonnante en ce qui concerne les propriétés de la matière, de l'énergie et des particules subatomiques. Les deux théories ont facilement passé tous les tests que les physiciens ont pu concevoir au cours du siècle dernier. On pourrait penser qu'en les réunissant, on obtiendrait une "théorie du tout".

Mais les deux théories ne s'entendent pas bien. Demandez à la relativité générale ce qui se passe dans le contexte de la physique quantique, et vous obtiendrez des réponses contradictoires, avec des infinis indomptés se déchaînant sur vos calculs. La nature sait comment appliquer la gravité dans des contextes quantiques - cela s'est produit dans les premiers instants du big bang, et cela se produit encore au cœur des trous noirs - mais nous, les humains, avons encore du mal à comprendre comment le tour se joue. Une partie du problème réside dans la manière dont les deux théories traitent l'espace et le temps. Alors que la physique quantique considère l'espace et le temps comme immuables, la relativité générale les déforme au petit déjeuner.

D'une manière ou d'une autre, une théorie de la gravité quantique devrait concilier ces idées sur l'espace et le temps. Une façon d'y parvenir serait d'éliminer le problème à sa source, l'espace-temps lui-même, en faisant émerger l'espace et le temps de quelque chose de plus fondamental. Ces dernières années, plusieurs pistes de recherche différentes ont toutes suggéré qu'au niveau le plus profond de la réalité, l'espace et le temps n'existent pas de la même manière que dans notre monde quotidien. Au cours de la dernière décennie, ces idées ont radicalement changé la façon dont les physiciens envisagent les trous noirs. Aujourd'hui, les chercheurs utilisent ces concepts pour élucider le fonctionnement d'un phénomène encore plus exotique : les trous de ver, connexions hypothétiques en forme de tunnel entre des points distants de l'espace-temps. Ces succès ont entretenu l'espoir d'une percée encore plus profonde. Si l'espace-temps est émergent, alors comprendre d'où il vient - et comment il pourrait naître de n'importe quoi d'autre - pourrait être la clé manquante qui ouvrirait enfin la porte à une théorie du tout.

LE MONDE DANS UN DUO DE CORDES

Aujourd'hui, la théorie candidate à la gravité quantique la plus populaire parmi les physiciens est la théorie des cordes. Selon cette idée, les cordes éponymes sont les constituants fondamentaux de la matière et de l'énergie, donnant naissance à la myriade de particules subatomiques fondamentales observées dans les accélérateurs de particules du monde entier. Elles sont même responsables de la gravité - une particule hypothétique porteuse de la force gravitationnelle, un "graviton", est une conséquence inévitable de la théorie.

Mais la théorie des cordes est difficile à comprendre : elle se situe dans un territoire mathématique que les physiciens et les mathématiciens ont mis des décennies à explorer. Une grande partie de la structure de la théorie est encore inexplorée, des expéditions sont encore prévues et des cartes restent à établir. Dans ce nouveau domaine, la principale technique de navigation consiste à utiliser des dualités mathématiques, c'est-à-dire des correspondances entre un type de système et un autre.

La dualité évoquée au début de cet article, entre les petites dimensions et les grandes, en est un exemple. Si vous essayez de faire entrer une dimension dans un petit espace, la théorie des cordes vous dit que vous obtiendrez quelque chose de mathématiquement identique à un monde où cette dimension est énorme. Selon la théorie des cordes, les deux situations sont identiques : vous pouvez aller et venir librement de l'une à l'autre et utiliser les techniques d'une situation pour comprendre le fonctionnement de l'autre. "Si vous gardez soigneusement la trace des éléments fondamentaux de la théorie, dit Paquette, vous pouvez naturellement trouver parfois que... vous pourriez faire croître une nouvelle dimension spatiale."

Une dualité similaire suggère à de nombreux théoriciens des cordes que l'espace lui-même est émergeant. L'idée a germé en 1997, lorsque Juan Maldacena, physicien à l'Institute for Advanced Study, a découvert une dualité entre une théorie quantique bien comprise, connue sous le nom de théorie des champs conforme (CFT), et un type particulier d'espace-temps issu de la relativité générale, appelé espace anti-de Sitter (AdS). Ces deux théories semblent très différentes : la CFT ne comporte aucune gravité, tandis que l'espace AdS intègre toute la théorie de la gravité d'Einstein. Pourtant, les mêmes mathématiques peuvent décrire les deux mondes. Lorsqu'elle a été découverte, cette correspondance AdS/CFT a fourni un lien mathématique tangible entre une théorie quantique et un univers complet comportant une gravité.

Curieusement, l'espace AdS dans la correspondance AdS/CFT comportait une dimension de plus que la CFT quantique. Mais les physiciens se sont délectés de ce décalage, car il s'agissait d'un exemple parfaitement élaboré d'un autre type de correspondance conçu quelques années plus tôt par les physiciens Gerard 't Hooft de l'université d'Utrecht aux Pays-Bas et Leonard Susskind de l'université de Stanford, connu sous le nom de principe holographique. Se fondant sur certaines des caractéristiques particulières des trous noirs, Gerard 't Hooft et Leonard Susskind soupçonnaient que les propriétés d'une région de l'espace pouvaient être entièrement "codées" par sa frontière. En d'autres termes, la surface bidimensionnelle d'un trou noir contiendrait toutes les informations nécessaires pour savoir ce qui se trouve dans son intérieur tridimensionnel, comme un hologramme. "Je pense que beaucoup de gens ont pensé que nous étions fous", dit Susskind. "Deux bons physiciens devenusdingues".

De même, dans la correspondance AdS/CFT, la CFT quadridimensionnelle encode tout ce qui concerne l'espace AdS à cinq dimensions auquel elle est associée. Dans ce système, la région entière de l'espace-temps est construite à partir des interactions entre les composants du système quantique dans la théorie des champs conforme. Maldacena compare ce processus à la lecture d'un roman. "Si vous racontez une histoire dans un livre, il y a les personnages du livre qui font quelque chose", dit-il. "Mais tout ce qu'il y a, c'est une ligne de texte, non ? Ce que font les personnages est déduit de cette ligne de texte. Les personnages du livre seraient comme la théorie [AdS] globale. Et la ligne de texte est la [CFT]."

Mais d'où vient l'espace de l'espace AdS ? Si cet espace est émergent, de quoi émerge-t-il ? La réponse est un type d'interaction spécial et étrangement quantique dans la CFT : l'intrication, une connexion à longue distance entre des objets, corrélant instantanément leur comportement de manière statistiquement improbable. L'intrication a beaucoup troublé Einstein, qui l'a qualifiée d'"action étrange à distance".

Connaîtrons-nous un jour la véritable nature de l'espace et du temps ?

Pourtant, malgré son caractère effrayant, l'intrication est une caractéristique essentielle de la physique quantique. Lorsque deux objets interagissent en mécanique quantique, ils s'intriquent généralement et le resteront tant qu'ils resteront isolés du reste du monde, quelle que soit la distance qui les sépare. Dans des expériences, les physiciens ont maintenu l'intrication entre des particules distantes de plus de 1 000 kilomètres et même entre des particules au sol et d'autres envoyées vers des satellites en orbite. En principe, deux particules intriquées pourraient maintenir leur connexion sur des côtés opposés de la galaxie ou de l'univers. La distance ne semble tout simplement pas avoir d'importance pour l'intrication, une énigme qui a troublé de nombreux physiciens pendant des décennies.

Mais si l'espace est émergent, la capacité de l'intrication à persister sur de grandes distances n'est peut-être pas si mystérieuse - après tout, la distance est une construction. Selon les études de la correspondance AdS/CFT menées par les physiciens Shinsei Ryu de l'université de Princeton et Tadashi Takayanagi de l'université de Kyoto, l'intrication est ce qui produit les distances dans l'espace AdS en premier lieu. Deux régions d'espace proches du côté AdS de la dualité correspondent à deux composantes quantiques hautement intriquées de la CFT. Plus elles sont intriquées, plus les régions de l'espace sont proches les unes des autres.

Ces dernières années, les physiciens en sont venus à soupçonner que cette relation pourrait également s'appliquer à notre univers. "Qu'est-ce qui maintient l'espace ensemble et l'empêche de se désagréger en sous-régions distinctes ? La réponse est l'intrication entre deux parties de l'espace", déclare Susskind. "La continuité et la connectivité de l'espace doivent leur existence à l'intrication quantique-mécanique". L'intrication pourrait donc sous-tendre la structure de l'espace lui-même, formant la chaîne et la trame qui donnent naissance à la géométrie du monde. "Si l'on pouvait, d'une manière ou d'une autre, détruire l'intrication entre deux parties [de l'espace], l'espace se désagrégerait", déclare Susskind. "Il ferait le contraire de l'émergence. Il désémergerait."

Si l'espace est fait d'intrication, l'énigme de la gravité quantique semble beaucoup plus facile à résoudre : au lieu d'essayer de rendre compte de la déformation de l'espace de manière quantique, l'espace lui-même émerge d'un phénomène fondamentalement quantique. Susskind pense que c'est la raison pour laquelle une théorie de la gravité quantique a été si difficile à trouver en premier lieu. "Je pense que la raison pour laquelle elle n'a jamais très bien fonctionné est qu'elle a commencé par une image de deux choses différentes, [la relativité générale] et la mécanique quantique, et qu'elle les a mises ensemble", dit-il. "Et je pense que l'idée est qu'elles sont beaucoup trop étroitement liées pour être séparées puis réunies à nouveau. La gravité n'existe pas sans la mécanique quantique".

Pourtant, la prise en compte de l'espace émergent ne représente que la moitié du travail. L'espace et le temps étant si intimement liés dans la relativité, tout compte rendu de l'émergence de l'espace doit également expliquer le temps. "Le temps doit également émerger d'une manière ou d'une autre", déclare Mark van Raamsdonk, physicien à l'université de Colombie-Britannique et pionnier du lien entre intrication et espace-temps. "Mais cela n'est pas bien compris et constitue un domaine de recherche actif".

Un autre domaine actif, dit-il, consiste à utiliser des modèles d'espace-temps émergent pour comprendre les trous de ver. Auparavant, de nombreux physiciens pensaient que l'envoi d'objets à travers un trou de ver était impossible, même en théorie. Mais ces dernières années, les physiciens travaillant sur la correspondance AdS/CFT et sur des modèles similaires ont trouvé de nouvelles façons de construire des trous de ver. "Nous ne savons pas si nous pourrions le faire dans notre univers", dit van Raamsdonk. "Mais ce que nous savons maintenant, c'est que certains types de trous de ver traversables sont théoriquement possibles". Deux articles - l'un en 2016 et l'autre en 2018 - ont conduit à une rafale de travaux en cours dans ce domaine. Mais même si des trous de ver traversables pouvaient être construits, ils ne seraient pas d'une grande utilité pour les voyages spatiaux. Comme le souligne Susskind, "on ne peut pas traverser ce trou de ver plus vite qu'il ne faudrait à [la lumière] pour faire le chemin inverse."

Si les théoriciens des cordes ont raison, alors l'espace est construit à partir de l'intrication quantique, et le temps pourrait l'être aussi. Mais qu'est-ce que cela signifie vraiment ? Comment l'espace peut-il être "fait" d'intrication entre des objets, à moins que ces objets ne soient eux-mêmes quelque part ? Comment ces objets peuvent-ils s'enchevêtrer s'ils ne connaissent pas le temps et le changement ? Et quel type d'existence les choses pourraient-elles avoir sans habiter un espace et un temps véritables ?

Ces questions frisent la philosophie, et les philosophes de la physique les prennent au sérieux. "Comment diable l'espace-temps pourrait-il être le genre de chose qui pourrait être émergent ?" demande Eleanor Knox, philosophe de la physique au King's College de Londres. Intuitivement, dit-elle, cela semble impossible. Mais Knox ne pense pas que ce soit un problème. "Nos intuitions sont parfois catastrophiques", dit-elle. Elles "ont évolué dans la savane africaine en interagissant avec des macro-objets, des macro-fluides et des animaux biologiques" et ont tendance à ne pas être transférées au monde de la mécanique quantique. En ce qui concerne la gravité quantique, "Où sont les objets ?" et "Où vivent-ils ?" ne sont pas les bonnes questions à poser", conclut Mme Knox.

Il est certainement vrai que les objets vivent dans des lieux dans la vie de tous les jours. Mais comme Knox et bien d'autres le soulignent, cela ne signifie pas que l'espace et le temps doivent être fondamentaux, mais simplement qu'ils doivent émerger de manière fiable de ce qui est fondamental. Prenons un liquide, explique Christian Wüthrich, philosophe de la physique à l'université de Genève. "En fin de compte, il s'agit de particules élémentaires, comme les électrons, les protons et les neutrons ou, plus fondamental encore, les quarks et les leptons. Les quarks et les leptons ont-ils des propriétés liquides ? Cela n'a aucun sens... Néanmoins, lorsque ces particules fondamentales se rassemblent en nombre suffisant et montrent un certain comportement ensemble, un comportement collectif, alors elles agiront d'une manière qui ressemble à un liquide."

Selon Wüthrich, l'espace et le temps pourraient fonctionner de la même manière dans la théorie des cordes et d'autres théories de la gravité quantique. Plus précisément, l'espace-temps pourrait émerger des matériaux que nous considérons habituellement comme vivant dans l'univers - la matière et l'énergie elles-mêmes. "Ce n'est pas que nous ayons d'abord l'espace et le temps, puis nous ajoutons de la matière", explique Wüthrich. "Au contraire, quelque chose de matériel peut être une condition nécessaire pour qu'il y ait de l'espace et du temps. Cela reste un lien très étroit, mais c'est juste l'inverse de ce que l'on aurait pu penser à l'origine."

Mais il existe d'autres façons d'interpréter les dernières découvertes. La correspondance AdS/CFT est souvent considérée comme un exemple de la façon dont l'espace-temps pourrait émerger d'un système quantique, mais ce n'est peut-être pas vraiment ce qu'elle montre, selon Alyssa Ney, philosophe de la physique à l'université de Californie, à Davis. "AdS/CFT vous donne cette capacité de fournir un manuel de traduction entre les faits concernant l'espace-temps et les faits de la théorie quantique", dit Ney. "C'est compatible avec l'affirmation selon laquelle l'espace-temps est émergent, et une certaine théorie quantique est fondamentale." Mais l'inverse est également vrai, dit-elle. La correspondance pourrait signifier que la théorie quantique est émergente et que l'espace-temps est fondamental, ou qu'aucun des deux n'est fondamental et qu'il existe une théorie fondamentale encore plus profonde. L'émergence est une affirmation forte, dit Ney, et elle est ouverte à la possibilité qu'elle soit vraie. "Mais, du moins si l'on s'en tient à AdS/CFT, je ne vois toujours pas d'argument clair en faveur de l'émergence."

Un défi sans doute plus important pour l'image de la théorie des cordes de l'espace-temps émergent est caché à la vue de tous, juste au nom de la correspondance AdS/CFT elle-même. "Nous ne vivons pas dans un espace anti-de Sitter", dit Susskind. "Nous vivons dans quelque chose de beaucoup plus proche de l'espace de Sitter". L'espace de Sitter décrit un univers en accélération et en expansion, comme le nôtre. "Nous n'avons pas la moindre idée de la façon dont [l'holographie] s'y applique", conclut M. Susskind. Trouver comment établir ce type de correspondance pour un espace qui ressemble davantage à l'univers réel est l'un des problèmes les plus urgents pour les théoriciens des cordes. "Je pense que nous allons être en mesure de mieux comprendre comment entrer dans une version cosmologique de ceci", dit van Raamsdonk.

Enfin, il y a les nouvelles - ou l'absence de nouvelles - provenant des derniers accélérateurs de particules, qui n'ont trouvé aucune preuve de l'existence des particules supplémentaires prévues par la supersymétrie, une idée sur laquelle repose la théorie des cordes. Selon la supersymétrie, toutes les particules connues auraient leurs propres "superpartenaires", ce qui doublerait le nombre de particules fondamentales. Mais le Grand collisionneur de hadrons du CERN, près de Genève, conçu en partie pour rechercher des superpartenaires, n'en a vu aucun signe. "Toutes les versions vraiment précises de [l'espace-temps émergent] dont nous disposons se trouvent dans des théories supersymétriques", déclare Susskind. "Une fois que vous n'avez plus de supersymétrie, la capacité à suivre mathématiquement les équations s'évapore tout simplement de vos mains".

LES ATOMES DE L'ESPACE-TEMPS

La théorie des cordes n'est pas la seule idée qui suggère que l'espace-temps est émergent. La théorie des cordes "n'a pas réussi à tenir [ses] promesses en tant que moyen d'unir la gravité et la mécanique quantique", déclare Abhay Ashtekar, physicien à l'université d'État de Pennsylvanie. "La puissance de la théorie des cordes réside désormais dans le fait qu'elle fournit un ensemble d'outils extrêmement riche, qui ont été largement utilisés dans tout le spectre de la physique." Ashtekar est l'un des pionniers originaux de l'alternative la plus populaire à la théorie des cordes, connue sous le nom de gravité quantique à boucles. Dans la gravité quantique à boucles, l'espace et le temps ne sont pas lisses et continus, comme c'est le cas dans la relativité générale, mais ils sont constitués de composants discrets, ce qu'Ashtekar appelle des "morceaux ou atomes d'espace-temps".

Ces atomes d'espace-temps sont connectés en réseau, avec des surfaces unidimensionnelles et bidimensionnelles qui les réunissent en ce que les praticiens de la gravité quantique à boucle appellent une mousse de spin. Et bien que cette mousse soit limitée à deux dimensions, elle donne naissance à notre monde quadridimensionnel, avec trois dimensions d'espace et une de temps. Ashtekar compare ce monde à un vêtement. "Si vous regardez votre chemise, elle ressemble à une surface bidimensionnelle", dit-il. "Si vous prenez une loupe, vous verrez immédiatement qu'il s'agit de fils unidimensionnels. C'est juste que ces fils sont si denses que, pour des raisons pratiques, vous pouvez considérer la chemise comme une surface bidimensionnelle. De même, l'espace qui nous entoure ressemble à un continuum tridimensionnel. Mais il y a vraiment un entrecroisement par ces [atomes d'espace-temps]".

Bien que la théorie des cordes et la gravité quantique à boucles suggèrent toutes deux que l'espace-temps est émergent, le type d'émergence est différent dans les deux théories. La théorie des cordes suggère que l'espace-temps (ou du moins l'espace) émerge du comportement d'un système apparemment sans rapport, sous forme d'intrication. Pensez à la façon dont les embouteillages émergent des décisions collectives des conducteurs individuels. Les voitures ne sont pas faites de la circulation - ce sont les voitures qui font la circulation. Dans la gravité quantique à boucles, par contre, l'émergence de l'espace-temps ressemble davantage à une dune de sable en pente émergeant du mouvement collectif des grains de sable dans le vent. L'espace-temps lisse et familier provient du comportement collectif de minuscules "grains" d'espace-temps ; comme les dunes, les grains sont toujours du sable, même si les gros grains cristallins n'ont pas l'apparence ou le comportement des dunes ondulantes.

Malgré ces différences, gravité quantique à boucles et théorie des cordes suggèrent toutes deux que l'espace-temps émerge d'une réalité sous-jacente. Elles ne sont pas non plus les seules théories proposées de la gravité quantique qui vont dans ce sens. La théorie de l'ensemble causal, un autre prétendant à une théorie de la gravité quantique, postule que l'espace et le temps sont également constitués de composants plus fondamentaux. "Il est vraiment frappant de constater que, pour la plupart des théories plausibles de la gravité quantique dont nous disposons, leur message est, en quelque sorte, que l'espace-temps relativiste général n'existe pas au niveau fondamental", déclare Knox. "Les gens sont très enthousiastes lorsque différentes théories de la gravité quantique s'accordent au moins sur quelque chose."

L'AVENIR DE L'ESPACE AUX CONFINS DU TEMPS

La physique moderne est victime de son propre succès. La physique quantique et la relativité générale étant toutes deux d'une précision phénoménale, la gravité quantique n'est nécessaire que pour décrire des situations extrêmes, lorsque des masses énormes sont entassées dans des espaces insondables. Ces conditions n'existent que dans quelques endroits de la nature, comme le centre d'un trou noir, et surtout pas dans les laboratoires de physique, même les plus grands et les plus puissants. Il faudrait un accélérateur de particules de la taille d'une galaxie pour tester directement le comportement de la nature dans des conditions où règne la gravité quantique. Ce manque de données expérimentales directes explique en grande partie pourquoi la recherche d'une théorie de la gravité quantique par les scientifiques a été si longue.

Face à l'absence de preuves, la plupart des physiciens ont placé leurs espoirs dans le ciel. Dans les premiers instants du big bang, l'univers entier était phénoménalement petit et dense - une situation qui exige une gravité quantique pour le décrire. Et des échos de cette époque peuvent subsister dans le ciel aujourd'hui. "Je pense que notre meilleure chance [de tester la gravité quantique] passe par la cosmologie", déclare Maldacena. "Peut-être quelque chose en cosmologie que nous pensons maintenant être imprévisible, qui pourra peut-être être prédit une fois que nous aurons compris la théorie complète, ou une nouvelle chose à laquelle nous n'avions même pas pensé."

Les expériences de laboratoire pourraient toutefois s'avérer utiles pour tester la théorie des cordes, du moins indirectement. Les scientifiques espèrent étudier la correspondance AdS/CFT non pas en sondant l'espace-temps, mais en construisant des systèmes d'atomes fortement intriqués et en observant si un analogue à l'espace-temps et à la gravité apparaît dans leur comportement. De telles expériences pourraient "présenter certaines caractéristiques de la gravité, mais peut-être pas toutes", déclare Maldacena. "Cela dépend aussi de ce que l'on appelle exactement la gravité".

Connaîtrons-nous un jour la véritable nature de l'espace et du temps ? Les données d'observation du ciel ne seront peut-être pas disponibles de sitôt. Les expériences en laboratoire pourraient être un échec. Et comme les philosophes le savent bien, les questions sur la véritable nature de l'espace et du temps sont très anciennes. Ce qui existe "est maintenant tout ensemble, un, continu", disait le philosophe Parménide il y a 2 500 ans. "Tout est plein de ce qui est". Parménide insistait sur le fait que le temps et le changement étaient des illusions, que tout partout était un et le même. Son élève Zénon a créé de célèbres paradoxes pour prouver le point de vue de son professeur, prétendant démontrer que le mouvement sur n'importe quelle distance était impossible. Leurs travaux ont soulevé la question de savoir si le temps et l'espace étaient en quelque sorte illusoires, une perspective troublante qui a hanté la philosophie occidentale pendant plus de deux millénaires.

Le fait que les Grecs de l'Antiquité aient posé des questions telles que "Qu'est-ce que l'espace ?", "Qu'est-ce que le temps ?", "Qu'est-ce que le changement ?" et que nous posions encore des versions de ces questions aujourd'hui signifie qu'il s'agissait des bonnes questions à poser", explique M. Wüthrich. "C'est en réfléchissant à ce genre de questions que nous avons appris beaucoup de choses sur la physique".

Auteur: Becker Adam

Info: Scientific American, février 2022

[ monde de l'observateur humain ] [ univers nanomonde ]

Commenter

Commentaires: 0

Ajouté à la BD par miguel

« Précédent
1
…
20
21
22
23
24
Suivant »