Les fils de la pensée

citation s'appliquant à ce logiciel

Voyons FLP comme une sorte de "bibliothèque des idées". Mais, une bibliothèque, pour paraphraser Michel Melot, devrait être "une symphonie, pas un vacarme".

Pas ici. Dans les "Fils de la pensée" sont intégrés des concepts courts et des extraits plus longs, tous choisis et tagués avec une bonne dose de subjectivité.

Donc point d'ordre au-sens du livre avec un début et une fin. Encore moins du "chef-d'oeuvre arrêté", mais un agencement différent, correspondant à une quête - ou des quêtes -, croisées, comme dans une immense forêt des idées où, à force de passages du promeneur chercheur compilateur, commenceraient à se dessiner des pistes. Certaines rebattues donc bien marquées, parce que correspondants à des évidences de la pensée humaine (prenez les sentiers "mort" et "définitif" ou "mourir" et "libération"...) d'autres à peine marquées parce que plus orientées et définies (au hasard de ces percées forestières : "confort" et "abrutissement" ou "langage" et "limitation").

Quelques vieux sages, (certains jamais nés, d'autres peut-être morts temporairement) experts des ballades dans cette infinie sylve, fille des mots, phrases, paragraphes, chapitres... certains engloutis à jamais, comme avalés et assimilés par ces touffeurs végétale de syllabes, d'autres réfugiés dans des clairières qui n'existent plus, s'accordent cependant sur ce constat : "Trois sortes de quêtes sont possibles dans ces entrelacs". Par ordre d'importance : celle de la beauté qu'on déguste, celle de l'objet que l'on recherche pour un usage. Et la plus hasardeuse : celle de la vérité.

Les créateurs de ce monde de lettres préfèrent quand à eux les intoxiqués de formules et de littérature, explorateurs désintéressés, absorbés-distraits, au point qu'ils abandonneront quelques vivres, comme par mégarde, quelque part dans ce site jungle. Propositions ou appréciations... Tant ludiques que nutritives , comme autant d'indices nourriciers qui pourront étancher au passage quelque visiteur égaré sur les même sentes. Et l'aideront à vivre.

Auteur: Mg

Info: 10 mai 2015. En hommage admiratif à "Le jardins aux sentiers qui bifurquent" de JL Borges.

[ web ] [ présentation ]

Commenter

Commentaires: 2

linguistique

Byzance tomba aux mains des Turcs tout en discutant du sexe des anges.

Le français achèvera de se décomposer dans l’illettrisme pendant que nous discuterons du sexe des mots.

La querelle actuelle découle de ce fait très simple qu’il n’existe pas en français de genre neutre comme en possèdent le grec, le latin et l’allemand. D’où ce résultat que, chez nous, quantité de noms, de fonctions, métiers et titres, sémantiquement neutres, sont grammaticalement féminins ou masculins. Leur genre n’a rien à voir avec le sexe de la personne qu’ils concernent, laquelle peut être un homme.

Homme, d’ailleurs, s’emploie tantôt en valeur neutre, quand il signifie l’espèce humaine, tantôt en valeur masculine quand il désigne le mâle. Confondre les deux relève d’une incompétence qui condamne à l’embrouillamini sur la féminisation du vocabulaire. Un humain de sexe masculin peut fort bien être une recrue, une vedette, une canaille, une fripouille ou une andouille.

De sexe féminin, il lui arrive d’être un mannequin, un tyran ou un génie. Le respect de la personne humaine est-il réservé aux femmes, et celui des droits de l’homme aux hommes ?

Absurde!

Ces féminins et masculins sont purement grammaticaux, nullement sexuels.

Certains mots sont précédés d’articles féminins ou masculins sans que ces genres impliquent que les qualités, charges ou talents correspondants appartiennent à un sexe plutôt qu’à l’autre. On dit: "Madame de Sévigné est un grand écrivain" et "Rémy de Goumont est une plume brillante". On dit le garde des Sceaux, même quand c’est une femme, et la sentinelle, qui est presque toujours un homme.

Tous ces termes sont, je le répète, sémantiquement neutres. Accoler à un substantif un article d’un genre opposé au sien ne le fait pas changer de sexe. Ce n’est qu’une banale faute d’accord.

Certains substantifs se féminisent tout naturellement: une pianiste, avocate, chanteuse, directrice, actrice, papesse, doctoresse. Mais une dame ministresse, proviseuse, médecine, gardienne des Sceaux, officière ou commandeuse de la Légion d’Honneur contrevient soit à la clarté, soit à l’esthétique, sans que remarquer cet inconvénient puisse être imputé à l’antiféminisme. Un ambassadeur est un ambassadeur, même quand c’est une femme. Il est aussi une excellence, même quand c’est un homme. L’usage est le maître suprême.

Une langue bouge de par le mariage de la logique et du tâtonnement, qu’accompagne en sourdine une mélodie originale. Le tout est fruit de la lenteur des siècles, non de l’opportunisme des politiques. L’Etat n’a aucune légitimité pour décider du vocabulaire et de la grammaire. Il tombe en outre dans l’abus de pouvoir quand il utilise l’école publique pour imposer ses oukases langagiers à toute une jeunesse.

J’ai entendu objecter: "Vaugelas, au XVIIe siècle, n’a-t-il pas édicté des normes dans ses remarques sur la langue française ?". Certes. Mais Vaugelas n’était pas ministre. Ce n’était qu’un auteur, dont chacun était libre de suivre ou non les avis. Il n’avait pas les moyens d’imposer ses lubies aux enfants. Il n’était pas Richelieu, lequel n’a jamais tranché personnellement de questions de langues.

Si notre gouvernement veut servir le français, il ferait mieux de veiller d’abord à ce qu’on l’enseigne en classe, ensuite à ce que l’audiovisuel public, placé sous sa coupe, n’accumule pas à longueur de soirées les faux sens, solécismes, impropriétés, barbarismes et cuirs qui, pénétrant dans le crâne des gosses, achèvent de rendre impossible la tâche des enseignants. La société française a progressé vers l’égalité des sexes dans tous les métiers, sauf le métier politique. Les coupables de cette honte croient s’amnistier (ils en ont l’habitude) en torturant la grammaire.

Ils ont trouvé le sésame démagogique de cette opération magique: faire avancer le féminin faute d’avoir fait avancer les femmes.

Auteur: Revel Jean-François

Info: Fin du siècle des ombres, Fayard, 1999

[ vocables sexués ]

Commenter

Commentaires: 2

Ajouté à la BD par miguel

satellite naturel

A Villers, de ma fenêtre, je regarde la plage pour savoir si elle est en marée haute ou basse…grâce au travail incessant de la Lune. C’est la banlieue de la Terre et ses 384 000 km de distance ne sont plus un problème pour aller s’y balader (en fusée) en attendant de s’y établir, sinon pour y habiter, construire une base pour la conquête de l’espace.

Est-ce à cause de Pierrot que la Lune tourne autour de la Terre en 27,3 jours et sur elle-même également en 27,3 jours ? Sans doute, car Pierrot veut toujours nous regarder, alors la Lune, à cause de cette égalité de rotation, présente toujours la même face à la Terre. La Lune n’émet pas de lumière propre, mais réfléchit les rayons du soleil et donc seule une moitié de sa surface est éclairée et vue depuis notre planète. Ce qui permet à Pierrot de nous réserver ses phases lunaires : la pleine lune lorsque sa face visible est totalement éclairée par le Soleil puis complètement plongée dans la nuit à la nouvelle lune. Le reste du temps sous forme de croissant et de quartier où il se balance dessus pour s’amuser. Ces phases se reproduisent tous les 29,5 jours, berçant ainsi non seulement Pierrot sur son croissant de Lune, mais règlant sur Terre nos activités rurales, de la pêche… sans oublier, mesdames, votre coupe de cheveux en phase croissante.

Mais l’influence principale exercée par Pierrot (la Lune) sur la Terre est les marées. C’est le moment où il joue les marionnettistes et tire les ficelles. Bien que quatre fois plus petite que la Terre, elle exerce sur notre planète une force de gravité attirant à elle les océans. Le Soleil a également un rôle à jouer. Et comme la Terre tourne, la force de gravité de la lune fait que le renflement des océans de part et d’autre du globe terrestre fait monter et descendre les marées deux fois par jour. Il s’écoule donc un laps de temps d’environ 6 heures entre la marée haute et la marée basse. A noter que le magma présent sous la croûte terrestre subit lui aussi des mouvements correspondants au passage de la Lune… heureusement de moindres amplitudes que les marées océaniques. Pierrot, de sa Lune, à cause des marées, exerce aussi une influence sur la course du temps de la Terre. Comment ? L’énergie dissipée par les marées ralentit la rotation terrestre et la durée du jour s’allonge petit à petit. De six heures à l’origine de la Terre (il y a 4,5 milliards d’années) elle est passée à vingt- quatre heures aujourd’hui et dans quelques milliards d’années, une journée vaudra cinquante de nos jours actuels. Dans ce temps lointain, le problème des 35 heures ou 30 (ou moins !) par semaine dans le cadre d’une journée qui dure 1200 heures est définitivement résolu, mais une question demeure : combien d’heures par jour devront-ils alors travailler ? Le problème ne se posera pas, car au cours de ce temps, le couple Terre-Lune se séparera progressivement. A qui la faute de ce divorce annoncé ? Il faut sans doute le demander à Pierrot. En attendant cette échéance lointaine, le couple s’entend à merveille et nous pouvons toujours chanter : au clair de la lune, mon ami Pierrot et je puis avec sa plume (devenu clavier d’ordinateur) continuer à écrire un mot. La lune assure le maintien de l’axe de rotation terrestre, dont l’angle avec la verticale reste "coincé" entre 21 et 24°. Mais au fur et à mesure de leur séparation annoncée, la Lune agira de moins en moins sur le renflement de l’équateur, la stabilité axiale disparaîtra, et, en quelques millions d’années l’axe de la Terre se balancera de façon chaotique selon des angles allant de 0 à 85° détruisant toute stabilité climatique et rendant ainsi la vie sur Terre…impossible (vraisemblablement).

Est-ce pour cette raison lointaine que parfois Pierrot pleure sur son croissant de Lune ?

Auteur: Anonyme

Info: Publication facebook du 04.03.2021

[ astronomie ] [ effets ] [ futur ]

Commenter

Commentaires: 0

Ajouté à la BD par Coli Masson

humaine syntonisation

À la suite de Bernard d’Espagnat qui a proposé une interprétation permettant de résoudre les problèmes soulevés par la théorie des états relatifs d’Everett, j’ai développé une position, le solipsisme convivial, qui s’intègre dans le cadre de la théorie de la décohérence. Cette position suppose qu’on refuse de se placer dans le cadre du réalisme empirique pragmatique. Bien que défendant par ailleurs une position différente qu’il serait trop long de détailler ici, je me placerai ici dans le cadre du réalisme métaphysique.

La décohérence est alors le mécanisme qui explique l’apparence classique pour nous d’une réalité qui demeure essentiellement quantique, c’est-à-dire enchevêtrée. Le solipsisme convivial fait entrer l’observateur lui-même dans le grand système. Le raisonnement que nous avons décrit conduit alors à considérer que l’observateur est aussi dans un état enchevêtré avec le système, l’appareil et l’environnement. Du point de vue de la réalité profonde (et non de l’apparence de cette réalité pour nous), seule une fonction d’ondes globale superposée "existe". Dans cette fonction d’ondes, les différents résultats possibles de mesure sont présents et sont corrélés ainsi que tous les états correspondants de l’observateur. La décohérence intervient et permet de régler un certain nombre de problèmes que nous n’avons pas eu la possibilité d'évoquer : quelle est la grandeur mesurée par exemple, ce qui a pour effet de résoudre la difficulté que nous avons signalée à propos de l’interprétation d’Everett. Le solipsisme convivial consiste alors à considérer que la conscience de l’observateur est "accrochée" à l’une des branches de la fonction d’ondes ne lui permettant d’observer que la partie classique correspondante. La conscience joue en quelque sorte le rôle d’un filtre ne permettant de voir qu’une partie de la fonction d’ondes globale.

Une définition précise de ce processus permet de montrer que les prédictions habituelles de la mécanique quantique sont respectées malgré le fait que la fonction d’ondes n’est jamais rigoureusement réduite. Le point surprenant est alors que rien n’oblige deux observateurs différents à être accrochés à la même branche. Pour une mesure donnée, un observateur peut être accroché à la branche donnant le résultat A alors qu’un autre le sera à la branche donnant le résultat B. Comment peut-il en être ainsi alors qu’on sait que deux observateurs de la même expérience sont ”en général” d’accord sur le résultat ? La raison en est que la communication entre observateurs est elle-même un processus de mesure et que le mécanisme d’accrochage garantit la cohérence des observations pour un observateur.

Supposons qu’André a observé le résultat A et Bernard le résultat B. Les deux observations ne sont que l’accrochage de la conscience d’André et de Bernard à leur branche propre de la fonction d’ondes globale qui contient les deux possibilités. Si André demande à Bernard ce qu’il a vu, l’interaction entre André et Bernard qui en résulte contient la totalité des possibilités, donc à la fois une branche où Bernard répond A et une branche où Bernard répond B. La fonction d’ondes d’André sera après l’interaction avec Bernard dans un état enchevêtré contenant les deux réponses mais la conscience d’André s’accrochera à la branche correspondant à la réponse cohérente avec son observation précédente, il entendra donc Bernard répondre A conformément à son attente. C’est la raison pour laquelle cette interprétation porte le nom de solipsisme convivial : chaque observateur vit dans son monde qui peut être totalement différent de celui des autres, mais il n’existe aucun moyen de se rendre compte des désaccords et les observateurs sont en parfait accord. Ceci fournit une nouvelle explication de l’intersubjectivité : il n’y a aucun moyen de constater un désaccord.

Signalons pour terminer une conséquence étrange sur l’indéterminisme de la mécanique quantique. La fonction d’ondes de l’Univers évolue de manière parfaitement déterministe par l'équation de Schrödinger, seul le mécanisme d’accrochage tire au sort la branche à laquelle chaque observateur s’accroche. Ce n’est donc plus Dieu qui joue aux dés, c’est l’homme, mais avec le constat étrange que deux joueurs peuvent voir le même dé tomber sur une face différente.

Auteur: Zwirn Hervé

Info: Mécanique quantique et connaissance du réel.

[ prospective scientifique ]

Commenter

Commentaires: 0

Ajouté à la BD par miguel

cognition

L'Étude d'une obscure tribu d'Amazonie jette un nouvel éclairage sur la façon dont le langage affecte la perception

En fin des années 30, le linguiste amateur Benjamin Lee Whorf posa la théorie que la langue peut déterminer la nature et la teneur de la pensée. Mais y a il des concepts dans une culture que les gens d'une autre culture ne peuvent pas simplement pas comprendre parce que leur langue n'a aucun mot pour elle ?

Personne n'a jamais répondu définitivement à cette question, mais les nouveaux résultats du Dr. Peter Gordon, scientifique bio-comportemental à Columbia University, vont vers une réponse positive.

Gordon a passé plusieurs années à étudier les Pirahã, une tribu isolée d'Amazonie comprenant moins de 200 personnes. Leur langue ne contient aucun mot pour les nombres au delà de "un", "deux" et "beaucoup." Même le mot Pirahã pour "un" semble se rapporter plutôt à "approximativement un" voire à "une petite quantité", par opposition à la connotation exacte du "un" dans les langues en général. Selon Gordon, ce que ces expériences montrent, c'est qu'avoir d’autres ressources linguistiques peut sculpter différemment la réalité.

Whorf indique que la langue divise le monde en différentes catégories. Il dit. "Qu'une langue choisisse de distinguer une chose contre une autres affecte la manière qu’ont les individu de percevoir la réalité." Quand Gordon donna aux gens de la tribu des tâches numériques dans lesquelles ils étaient invités à assortir de petits ensembles d'objets dans des configurations variables, les membres adultes répondirent avec précision jusqu'à deux ou trois articles, mais leur performance diminua une fois l'exercice passant de 8 à 10 articles, pour tomber à zéro avec de plus grands ensembles d'objets.

La seule exception à ce résultat fut lorsque les tâches impliquèrent des objets inégalement espacés. Ici, la performance des participants se détériora lorsque le nombre d'articles grimpa à 6 articles. Pourtant pour des ensembles de 7 à 10 objets, l'exécution était presque parfaite, alors que ces tâches étaient considérées comme plus difficiles. Gordon présume que l'espacement inégal permet aux sujets de percevoir les articles comme des parties "amas" de 2 ou 3 articles qu'ils peuvent ensuite assortir aux groupes correspondants.

Selon l'étude, l’exercice des Pirahã fut médiocre pour des tailles au-dessus de 2 ou 3, (qui n'étaient pas aléatoire). "Les participants Pirahã essayèrent réellement très dur d'obtenir les réponses correctes et ils avaient clairement compris les tâches" dit Gordon. Ces participants ont donc mis en évidence qu'ils utilisent des méthodes d'évaluation "par paquets" pour évaluer des quantités de plus grandes tailles. En moyenne, ils répondirent aux taches à peu près aussi bien que des étudiants d'université utilisant des estimations numérique bien plus complexes.

Leurs niveaux de compétence étant semblables à ceux d’enfants en bas âge (pré-linguistiques), à ceux des singes, d'oiseaux et de rongeurs, ceci semble se corréler avec les études récentes d'imagerie cérébrale qui montrent parfois une capacité différente de compétence numérique, différence qui apparaît être indépendante de la privation du langage.

De manière intéressante Gordon note que si les adultes Pirahã eurent des difficulté pour apprendre de grands nombres, leurs enfants non. Alors que les mots Pirahã pour "un" et "deux" ne se rapportent pas nécessairement à ces montants spécifiques. Gordon a également constaté que les membres de la tribu n'ont jamais l'habitude d'utiliser ces mots en association pour dénoter de plus grandes quantités. Dans l'étude, ils utilisèrent également leurs doigts en plus de leurs rapport verbaux de quantités, mais cette pratique s’avéra aussi fortement imprécise même pour les petits nombres de moins de cinq. La langue Pirahã n'a aucun mot pour "nombre," et les pronoms n'indiquent pas de quantité. "Lui" et "eux" sont le même mot. La plupart des quantificateurs standard comme "plus" "plusieurs" "tous" et "chacun" n'existent pas.

De manière générale, tout en utilisant une structure très complexe de verbes commune à beaucoup de langues américaines indigènes, la langue Pirahã ne tient pas compte de certains genres de constructions comparatives. Par exemple, il ne fut pas possible de demander aux participants si un groupe d'objets "avait plus de volume que l'autre" en raison du manque de cette construction grammaticale dans leur idiome. Cependant, le mot qu'ils emploient pour "beaucoup" - qui dans leur langue est dérivé d'un forme de la signification de verbe "rassembler" - est très distinct d'un mot qui signifie quelque chose comme "plus de".

Auteur: Fortean Times

Info: Les détails de cette étude paraîtront dans le journal Science du jeudi 19 août 2004. Source, Teachers College, Columbia University

[ idiomes ] [ sciences ] [ compter ] [ comptage ] [ termes quasi-esprit ]

Commenter

Commentaires: 0

linguistique de masse

L'intelligence artificielle travaille-t-elle en anglais ?

Des scientifiques de l’EPFL ont montré que les grands modèles de langage semblent utiliser l’anglais en interne même lorsqu’ils sont sollicités dans une autre langue, ce qui pourrait avoir des conséquences en termes de biais linguistiques et culturels.

Les grands modèles de langage (LLM), tels que ChatGPT d’Open AI et Gemini de Google, ont conquis le monde et surprennent par leur capacité à comprendre les utilisatrices et utilisateurs et à leur répondre avec un discours en apparence naturel.

Bien qu’il soit possible d’interagir avec ces LLM dans n’importe quelle langue, ces derniers sont entraînés avec des centaines de milliards de paramètres textuels, principalement en anglais. Certaines personnes ont émis l’hypothèse qu’ils effectuaient la majeure partie de leur traitement interne en anglais et traduisaient ensuite dans la langue cible au tout dernier moment. Mais il y avait peu de preuves de cela, jusqu’à aujourd’hui.

Tests de Llama

Des chercheuses et chercheurs du Laboratoire de science des données (DLAB) de la Faculté informatique et communications de l’EPFL ont étudié le LLM open source Llama-2 (grand modèle de langage IA développé par Meta) pour essayer de déterminer quelles langues étaient utilisées à quels stades de la chaîne informatique.

" Les grands modèles de langage sont entraînés pour prédire le mot suivant. Pour cela, ils font correspondre chaque mot à un vecteur de nombres, c’est-à-dire à un point de données multidimensionnel. Par exemple, l’article le se trouvera toujours exactement à la même coordonnée fixe des nombres ", explique le professeur Robert West, responsable du DLAB.

" Les modèles enchaînent environ 80 couches de blocs de calcul identiques, chacun transformant un vecteur qui représente un mot en un autre vecteur. À la fin de cette séquence de 80 transformations, on obtient un vecteur représentant le mot suivant. Le nombre de calculs est déterminé par le nombre de couches de blocs de calcul. Plus il y a de calculs, plus votre modèle est puissant et plus le mot suivant a de chances d’être correct. "

Comme l’explique la prépublication intitulée Do Llamas Work in English? On the Latent Language of Multilingual Transformers, Robert West et son équipe ont forcé le modèle à répondre après chaque couche chaque fois qu’il essayait de prédire le mot suivant au lieu de le laisser effectuer les calculs à partir de ses 80 couches. Ils ont ainsi pu voir quel mot le modèle aurait prédit à ce moment-là. Ils ont mis en place différentes tâches telles que demander au modèle de traduire une série de mots français en chinois.

" Nous lui avons donné un mot français, puis la traduction en chinois, un autre mot français et la traduction en chinois, etc., de sorte que le modèle sache qu’il est censé traduire le mot français en chinois. Idéalement, le modèle devrait donner une probabilité de 100% pour le mot chinois. Mais lorsque nous l’avons forcé à faire des prédictions avant la dernière couche, nous avons remarqué que la plupart du temps, il prédisait la traduction anglaise du mot français, bien que l’anglais n’apparaisse nulle part dans cette tâche. Ce n’est qu’au cours des quatre ou cinq dernières couches que le chinois est en fait plus probable que l’anglais ", affirme Robert West.

Des mots aux concepts

Une hypothèse simple serait que le modèle traduit la totalité de l’entrée en anglais et la traduit à nouveau dans la langue cible juste à la fin. Mais en analysant les données, les chercheuses et chercheurs sont parvenus à une théorie bien plus intéressante.

Dans la première phase des calculs, aucune probabilité n’est attribuée à l’un ou l’autre mot. Selon eux, le modèle s’attache à résoudre les problèmes d’entrée. Dans la seconde phase, où l’anglais domine, les chercheuses et chercheurs pensent que le modèle se trouve dans une sorte d’espace sémantique abstrait où il ne raisonne pas sur des mots isolés mais sur d’autres types de représentations qui concernent davantage des concepts, sont universels dans toutes les langues et représentent plus un modèle du monde. C’est important car, pour bien prédire le mot suivant, le modèle doit en savoir beaucoup sur le monde et l’un des moyens d’y parvenir est d’avoir cette représentation des concepts.

" Nous supposons que cette représentation du monde en termes de concepts est biaisée en faveur de l’anglais, ce qui serait très logique car les données utilisées pour entraîner ces modèles sont à environ 90% en anglais. Ils cartographient les mots en entrée à partir d’un espace de mots superficiel, dans un espace de signification plus profond avec des représentations de la façon dont ces concepts sont liés les uns aux autres dans la réalité – et les concepts sont représentés de la même manière que les mots anglais, plutôt que les mots correspondants dans la langue d’entrée réelle ", déclare Robert West.

Monoculture et biais

Cette domination de l’anglais amène à se poser la question suivante: " est-ce important "? Les chercheuses et chercheurs pensent que oui. D’après de nombreuses recherches, les structures qui existent dans le langage influencent la manière dont nous construisons la réalité et les mots que nous employons sont profondément liés à la façon dont nous pensons le monde. Robert West suggère de commencer à étudier la psychologie des modèles de langage en les traitant comme des êtres humains et, dans différentes langues, en les interrogeant, en les soumettant à des tests de comportement et en évaluant leurs biais.

" Je pense que cette recherche a vraiment touché un point sensible, car les gens s’inquiètent de plus en plus de ce genre de problème de monoculture potentielle. Les modèles étant meilleurs en anglais, bon nombre de chercheuses et chercheurs étudient aujourd’hui la possibilité d’introduire un contenu en anglais et de le traduire dans la langue souhaitée. D’un point de vue technique, cela pourrait fonctionner, mais je pense que nous perdons beaucoup de nuances, car ce que vous ne pouvez pas exprimer en anglais ne sera pas exprimé ", conclut Robert West.

Auteur: Internet

Info: https://actu.epfl.ch/news/l-intelligence-artificielle-travaille-t-elle-en--2/#:~:text=Les%20chercheuses%20et%20chercheurs%20pensent%20que%20oui.,dont%20nous%20pensons%20le%20monde.

[ anglocentrisme ] [ spécificités des idiomes ] [ homme-machine ] [ symboles univers ] [ ethnocentrisme ]

Commenter

Commentaires: 0

Ajouté à la BD par miguel

colonialisme

Un groupe de motards surgit de nulle part, alors que j'étais occupé à faire mes besoins loin du douar, à la tombée du soir, moment propice pour se cacher des regards, s'accroupir quelque part, à ses risques et périls descendre son pantalon dans le noir, rester ainsi camouflé, à l'orée du village, comme pour voler des poules fait le renard, à guetter le vide, à scruter le ciel, ou à sonder le brouillard. Le temps d'un gargouillement, d'une contorsion, d'un soulagement, avant de repartir vers sa case qui, comme toutes les habitations autour, n'avait ni robinet, ni bidet, ni baignoire ; Ils étaient quatre, deux hommes, deux femmes, avec de gros casques, des blousons et des pantalons en cuir, des bottes qui leur montaient aux genoux, Ils allaient dans le désert, mais s'étant égarés quelque part, et voyant que bientôt la nuit allait devenir noire, ils étaient venus chercher asile chez-nous,

Et bien que m'ayant surpris dans une posture peu honorable, ils semblaient contents de voir que je parlais leur langue comme je remontais mon pantalon, aisément. Hospitalité oblige, après quelques politesses, une blague ou deux, je les invitai dans mon gourbi, une chambre en pisé, qui en même temps me servait de salle de classe et de logement. Je n'avais pas parlé français à quelqu'un, hormis à mes pauvres élèves, depuis longtemps, et tout fier, pour une fois que j'avais de la compagnie, je profitais joyeusement de l'occasion. À la lumière blafarde d'une bougie, nous discutâmes des choses de la vie, et j'étais déçu de constater que mes hôtes étaient surpris de voir que j'avais un jeu d'échecs, une guitare, que je connaissais Pétrarque, Ronsard, que sur ma table de chevet, les Contemplations voisinaient avec les Illuminations, les Rêveries, Les Méditations... Ils s'en étonnaient exagérément, échangeaient des clins d'oeil un peu sceptiques, un peu moqueurs, multipliaient les compliments, comme fait le maître pour flatter un bon élève au moment où il lui rend son devoir.

Soudain, j'avais honte d'enseigner leur langue, me sentis être un animal étrange, un curieux spécimen. J'étais jeune, débutant, peu initié aux secrets de la nature humaine, mais ce soir-là, j'eus la désagréable sensation d'être leur bon apôtre. Un déchirement viscéral scinda mon âme qui, tant bien que mal, à son exil absurde avait jusque-là survécu, tenace, brave, pareille au taureau que dans une arène à qui mieux mieux on malmène.

À une fausse identité, une autre, ni meilleure, ni pire, allait s'ajouter, la quête de soi devenir une réclusion à perpétuité, et le " je " éclater pour enfanter de beaucoup d' "Autres".

Seuls ceux qui, répondant à l'appel de leur coeur, ont honoré le métier de professeur, maintenu allumé le flambeau légué par leurs vaillants prédécesseurs. Contre les idées reçues, la vindicte de l'Histoire, ils avaient choisi d'aimer la langue de Molière, de l'adopter, de la chérir, de la transmettre à leurs frères et soeurs, ou dans des contrées arides, ou dans de lointaines montagnes, ou dans d'hostiles campagnes, ou dans la redoutable faune citadine. Par des temps où l'ignorance était aveugle, l'intolérance assassine, où les problèmes de l'enseignement étaient graves, où la cherté de la vie, le manque de moyens, la pression sociale s'ajoutaient au stress, à la fatigue, à la routine ;

Seuls ceux-ci, disais-je, se rappellent lorsqu'ils ils étaient jeunes, élèves de professeurs étrangers, qui étaient différents, courtois, humains, cultivés, sérieux, qui au lieu de leur service militaire chez-eux, venaient chez-nous enseigner cette matière, ceux qu'à l'époque on appelait " coopérants ".

Grâce à eux, ils découvriront les grands noms de cette littérature, l'esprit cartésien, la société laïque, la pensée marxiste. Avec eux, de tout ils parleront librement, à l'occasion d'un passage de La Nausée, de L'Étranger, de Huis-clos ou de La Peste, aux temps de la mouvance existentialiste. Ces personnages itinérants, altruistes, tolérants, souvent bienveillants, furent pour beaucoup dans les choix que leurs disciples allaient faire. Il faut dire que le monde qu'ils représentaient leur semblait être plus avancé, plus policé que celui dans lequel les maintenaient prisonniers leurs parents. Les tabous n'étaient plus des tabous, les chaînes du conservatisme archaïque, anachronique, se brisaient contre le savoir libérateur.

Alors leurs initiateurs, souvent rescapés de La Révolution estudiantine de mai 68, adeptes du mouvement hippie, amoureux de la nature, défenseurs de la paix, les invitèrent de bonne heure à cette conquête ;

Ils choisirent alors, confiants, d'aller sur ces chemins heureux, d'explorer cette civilisation nouvelle qui, parmi les leurs, avait fait des écrivains rebelles : Chraïbi, Khatibi, Laâbi, Khaïr-Eddine, Kateb Yacine, Fatéma Mernissi, Taos Amrouche, Moloud Feroun, Maammeri, Dib, Boudjedra, Mimouni, Assia Djebbar, pour ne citer que ceux-là,

Des antiques poètes bédouins d'Arabie, des anciens penseurs d'un empire musulman chimérique, en ruines, ils oublièrent les satires, les panégyriques, du souk Okad les joutes verbales et toutes les éternelles querelles, pour, de Baudelaire, humer ses maléfiques Fleurs, avec Musset veiller ses longues Nuits, d'extase et de plaisir mourir dans les romans de Balzac, de Flaubert, de Stendhal, de Maupassant ou de Zola.

Plus ils avançaient dans ces terres fertiles, prospères, plus ils comprenaient les constructions des phrases, le rythme des vers, les alittérations, les assonances, les figures de rhétorique, les tonalités, les registres, les formes verbales et leur concordance, les connotations et les nuances. Quant à leurs idées, elles devenaient au fur et à mesure plus libérales, et révoltés, insoumis, ils rompirent définitivement avec leur Moyen Âge, pour épouser l'esprit rationnel - devant les clichés, les préjugés, les croyances et la superstition de leur société - de La Raison qui toujours prône l'arbitrage.

Puis, ils furent appelés à transmettre ces bagages, après un long parcours qui les avait complètement remodelés. À un public qui à ses convictions séculaires restait sourdement lié, comme l'enfant au sein qui l'abreuve de bon lait, tandis que les conservateurs les regardaient d'un mauvais oeil, que les détracteurs de la modernité pensaient que leur âme leur avait été volée... Que souvent, d'athées, d'hérétiques, de pervers furent taxés les professeurs de français par les esprits sclérosés, dans leur propre patrie étrangers, bannis, exilés.

Pendant des décennies, le derrière entre deux chaises, l'esprit déchiré entre authenticité et modernité, ils ont lutté contre l'obscurantisme, l'ignorance, colportant les principes de La Liberté, de La Fraternité, de L'Égalité, dans des régions qui n'avaient ni la même devise, ni la même foi, ni le même type de gouvernance. De même que jadis leurs grands-parents, sans comprendre pourquoi, blancs-becs partirent guerroyer en Indochine, pour le drapeau tricolore en piètres héros, pour périr pendant les Deux Guerres,

De même eux sacrifiaient leur culture, sans comprendre pourquoi les français n'enseignaient pas en retour la langue berbère dans leurs écoles, pourtant ceux-ci allaient et venaient chez-eux comme ils voulaient, alors qu'eux devaient mendier un visa pour de l'Hexagone franchir les frontières.

Si arbitrage de La Raison il doit y avoir, si la réalité ressemblait à ce mirifique savoir, si après de houleux combats Les Lumières, Les principes de La Charte ont dressé l'inventaire, de L'Égalité entre les peuples esquissé une tentative salutaire, est-ce seulement pour que leur langue soit enseignée vidée de toutes ses valeurs, chargée de principes qui avec les décisions que prennent les dirigeants ne sont jamais correspondants ?

Comme si les peuples étaient aveugles, comme s'ils étaient bêtes, comme s'ils n'étaient pas en mesure de comprendre qu'à la vérité, avec leur vis-à-vis, ils ne sont pas égaux, que dans le monde actuel, il est difficile, voire impossible d'être indépendant...

Auteur: Talbi Mohamed

Info:

[ francophone ] [ non réciprocité ] [ frustration ]

Commenter

Commentaires: 0

Ajouté à la BD par miguel

bêtise bipolaire

Il ne fait aucun doute que les IA sont biaisées. Mais beaucoup déclarent que ces problématiques de l'IA existent parce que nous humains sommes imparfaits, plus que les machines. "Les machines sont-elles condamnées à hériter des préjugés humains ?", titrent les journaux. "Les préjugés humains sont un énorme problème pour l'IA. Voilà comment on va arranger ça." Mais ces récits perpétuent une dangereuse erreur algorithmique qu'il faut éviter.

Oui, les humains sont subjectifs. Oui, malgré les efforts conscients et inconscients de ne pas l'être, nous faisons de la discrimination, nous stéréotypons et portons toutes sortes de jugements de valeur sur les gens, les produits et la politique. Mais nos préjugés ne sont pas correctement mesurés ou modélisés par les machines. Non, les tendances machine sont dues à la logique même de la collecte des données : le système binaire.

Le système binaire est la chaîne de 0 et 1 à la base de tous les systèmes informatiques. Cette méthode mathématique permet de réduire et de calculer efficacement les grands nombres et, deuxièmement, elle permet la conversion de l'alphabet et de la ponctuation en ASCII (American Standard Code for Information Interchange).

Mais ne vous laissez pas berner : Ces 0 et 1 ne signifient pas que la machine comprend le monde et les langages comme nous le faisons : "La plupart d'entre nous, la plupart du temps, suivons des instructions qui nous sont données par ordinateur plutôt que l'inverse ", explique l'historien des technologies George Dyson. Afin de pouvoir communiquer avec les ordinateurs, nous sommes ajustés et orientés vers leur logique, et non vers la nôtre.

Le système binaire réduit tout à des 0 et des 1 insignifiants, quand la vie et l'intelligence font fonctionner XY en tandem. lui rend la lecture et le traitement des données quantitatives plus pratiques, plus efficaces et plus rentables pour les machines. Mais c'est au détriment des nuances, de la richesse, du contexte, des dimensions et de la dynamique de nos langues, cultures, valeurs et expériences.

Il ne faut pas accabler ici les développeurs de la Silicon Valley pour ce système binaire biaisé - mais plutôt Aristote.

Le parti pris binaire d'Aristote
Si vous pensez à Aristote, vous pensez probablement au philosophe grec antique comme à un des pères fondateurs de la démocratie, et non comme l'ancêtre de siècles de logique mécanique et de méthodes scientifiques erronées. C'est cependant sa théorie du "dualisme", selon laquelle quelque chose est soit vrai soit faux, logique ou illogique, qui nous a mis dans cette situation délicate en premier lieu.

Vers 350 av. J.-C., Aristote voulut réduire et structurer la complexité du monde. Pour ce faire, il fit des emprunts à la Table des Opposés de Pythagore, dans laquelle deux éléments sont comparés :

fini, infini... impair, pair... un, beaucoup... droite, gauche... repos, mouvement... droit, tordu... etc.

Mais au lieu d'appliquer ce dualisme à la géométrie neutre comme l'avait fait Pythagore, Aristote l'appliqua aux personnes, aux animaux et à la société. Ce faisant, il conçut un patriarcat hiérarchique social polarisé clivant, enraciné dans ses valeurs internes et ses préjugés : Les objets qu'il ordonnait avoir plus de valeur devinrent des 1, et ceux de moindre importance des 0. En ce qui concerne les femmes, par exemple, il écrivit : "La relation de l'homme à la femme est par nature une relation de supérieur à inférieur et de souverain à gouverné."

Hélas, le système de classification hiérarchique d'Aristote a été implémenté dans l'IA, la pondérant en faveur d'hommes comme lui. Le système même sur lequel toute la technologie moderne est construite contient les artefacts du sexisme d'il y a 2 000 ans.

1 = vrai = rationnel = droit = masculin
0 = faux = émotionnel = gauche = féminin
Si Aristote avait créé la démocratie - et la démocratie est censée être une véritable représentation - femmes et gens de couleur auraient dû avoir un accès égal à l'éducation, avoir voix au chapitre dans les forums et avoir le droit de vote en 350 av. JC. Il n'aurait pas été nécessaire de se battre jusqu'en 1920 pour que le vote féminin soit ratifié aux Etats-Unis. Il n'y aurait pas eu d'esclavage et pas besoin du mouvement pour les droits civiques. Tout le monde aurait été classé et considéré comme égal dès le départ.

Le classement biaisé d'Aristote est maintenant verrouillé et renforcé par plus de 15 millions d'ingénieurs.
Aristote aurait dû lire les notes de son prédécesseur, Socrate. Selon les souvenirs de Platon, Socrate considérait les oracles féminins de Delphes comme "un guide essentiel du développement personnel et de l'état". De plus, dans le Symposium de Platon, Socrate se souvient de l'époque où il était l'élève de Diotima de Mantinea, une femme philosophe dont il tenait en haute estime l'intelligence. Dans le livre V, Socrate est crédité d'avoir suggéré que les femmes sont également qualifiées pour diriger et gouverner : "Il n'y a pas de pratique des gouverneurs d'une ville qui appartient à une femme parce qu'elle est une femme, ou à un homme parce qu'il est un homme."

Mais au lieu que les idées de Socrate sur l'égalité enracinent les idées occidentales sur l'intelligence, nous nous sommes retrouvés avec la logique d'Aristote et son classement biaisé sans être conscients de ses origines binaires et anti-démocratiques.

Mais ne blâmons pas seulement Aristote. Deux autres coquins ont contribué à ces problèmes sociaux et scientifiques : Descartes et Leibniz.

Descartes - philosophe français du XVIIe siècle qui a inventé l'expression "je pense, donc je suis" -, a implanté l'idée qu'un sujet n'a ni matière ni valeur autre que ce que le visiteur attribue et déduit. (S'il avait dit "Nous pensons, donc nous sommes", cela aurait mieux reflété comment nous sommes symbiotiquement informés par les perceptions les uns et des autres.)

En outre, Descartes a proposé une plus grande séparation de l'esprit du corps et des émotions dans son traité de 1641, Méditations sur la Première Philosophie. Il a soutenu que nos esprits sont dans le domaine du spirituel tandis que nos corps et nos émotions sont dans le domaine du physique, et que les deux royaumes ne peuvent pas s'influencer mutuellement. Ce qui a causé des problèmes en IA parce que maintenant nous empilons des unités d'émotions sur des couches de classification binaires d'une manière artificielle et non intégrée. Encore du binaire.

La logique déductive-inductive de Descartes, qu'il explora dans son discours sur la méthode de 1637, fut créée parce qu'il était désabusé par les méthodes non systématiques des scientifiques de son temps. Il fit valoir que les mathématiques ont été construites sur une "base solide", et a donc cherché à établir un nouveau système de vérité fondée sur Aristote 1 = vrai = valide, et 0 = faux = invalide. La différence étant qu'il a mis les lignes de la logique syllogistique d'Aristote au sein d'une structure arborescente. Structures arborescentes qui sont maintenant utilisées dans les réseaux neuronaux récurrents du NLP (Natural Language Processing)

Vint ensuite Leibniz, le philosophe et avocat allemand inventa le calcul indépendamment de son contemporain, Newton. Il créa le système binaire entre 1697 et 1701 afin d'obtenir des verdicts "oui/non" plus rapides et ainsi réduire les grands nombres en unités plus faciles à gérer de 0 et 1.

Contrairement aux autres, Leibniz était sinophile. En 1703, le prêtre jésuite Bouvet lui avait envoyé une copie du Yi King (le Livre des Changements), artefact culturel chinois dont l'origine remonte à 5.000 ans. Il était fasciné par les similitudes apparentes entre les lignes horizontales et les intervalles des hexagrammes du Yi King et les 0 et 1 des lignes verticales de son système binaire. Il interpréta faussement ces intervalles comme étant du vide (donc zéro) croyant (à tort) que les hexagrammes confirmaient que son système binaire était la bonne base pour un système logique universel.

Leibniz fit trois autres erreurs majeures. Tout d'abord, il a fit pivoter les hexagrammes de leurs positions horizontales naturelles vers les positions verticales pour les faire correspondre à ses lignes binaires. Deuxièmement, il les sépara du contexte des symboles chinois et des chiffres correspondants. Troisièmement, puisqu'il n'était pas chinois et qu'il ne comprenait pas l'héritage philosophique ou la langue, il supposa que les hexagrammes représentaient les nombres 0 et 1 lorsqu'ils représentent des énergies négatives et positives, Yin Yang, homme et femme. Erreurs qui signifient que Leibniz perdit beaucoup d'informations et de connaissances venant des codes du Yi King et de la vraie signification de ses hexagrammes.

Au lieu de créer un système universel cohérent, le système binaire de Leibniz renforça les modèles de pensée occidentale de Descartes amplifiant la base biaisée d'Aristote, nous verrouillant davantage, nous et les machines que nous avons créées, vers une logique non naturelle.

Le système binaire dans l'informatique moderne
Les classifications binaires d'Aristote sont donc maintenant évidentes dans tous les systèmes de données d'aujourd'hui, servant, préservant, propageant et amplifiant les biais partout dans les couches d'apprentissage machine.

Exemples de biais binaires dans les front-end utilisateur et le traitement des données :

glissement à droite = 1, glissement à gauche = 0
cliquer sur "like" sur Facebook = 1, pas cliquer sur like = 0
nos émotions complexes étant attribuées grossièrement comme positives = 1, négatives = 0 dans les cadres du NPL
convertir des paires d'objets comparés et leurs caractéristiques en 0 ou 1, par exemple pomme = 1, orange = 0, ou lisse = 1, bosselé = 0
lignes et colonnes pleines de 0 et de 1 dans des graphes géants "big data"
Mais le problème de la logique binaire est qu'elle ne permet pas de comprendre et de modéliser pourquoi et comment les gens ont choisi une option plutôt qu'une autre. Les machines enregistrent simplement que les gens ont fait un choix, et qu'il y a un résultat

Les machines sont donc étalonnées à partir de ces biais binaires, pas à partir des nôtres. Bien sûr, nous sommes remplis de nos propres défauts et faiblesses très humains, mais les cadres conceptuels informatiques existants sont incapables de corriger ces erreurs (et les ingénieurs n'écrivent que du code qui correspond aux limites de l'ancienne logique).

Heureusement, il existe une alternative. Les philosophies occidentales d'Aristote, de Descartes et de Leibniz sont opposées aux philosophies orientales, elles fondées sur l'équilibre naturel, la cohérence et l'intégration. Le concept chinois de Yin Yang, par exemple, met l'accent sur la dynamique égale et symbiotique du masculin et du féminin en nous et dans l'univers. Ces idées décrites dans le Yi King, que Leibniz n'a pas reconnues.

La nature rejette également le binaire. Des milliards d'années avant que le parti pris d'Aristote ne s'imprime dans la logique informatique occidentale, la nature codifiait l'intelligence comme la coexistence entrelacée de la femme X et de l'homme Y dans notre ADN. De plus, la recherche quantique a montré que les particules peuvent avoir des états de superposition enchevêtrés où elles sont à la fois 0 et 1 en même temps, tout comme le Yin Yang. La nature ne fonctionne pas en binaire, pas même avec les pigeons. Alors pourquoi le faisons-nous en informatique ?

Nous ne classons et ne qualifions pas nécessairement le monde qui nous entoure avec les préjugés hiérarchiques binaires d'Aristote. Mais la façon dont les données sont recueillies est noir (0) et blanc (1), avec des nuances de gris fournies par des pourcentages de ces données, alors que la nature et les philosophies orientales montrent que nos perceptions ne sont que vagues de couleurs mélangées ou arc-en-ciel.

Tant que nous n'aurons pas conçu des modes de catégorisation non binaires et plus holistiques en IA, les ordinateurs ne seront pas en mesure de modéliser l'image animée en technicolor de notre intelligence. Ce n'est qu'alors que les machines représenteront nos divers langages, raisonnements, valeurs, cultures, qualités et comportements humains.

Auteur: Twain Liu

Info: https://qz.com/1515889/aristotles-binary-philosophies-created-todays-ai-bias/?utm_source=facebook&utm_medium=partner-share&utm_campaign=partner-bbc

[ rationalisme occidental ] [ logique formelle ] [ intelligence artificielle ] [ Asie ] [ sciences ]

Commenter

Commentaires: 1

Ajouté à la BD par miguel

intelligence artificielle

Apprendre l'anglais n'est pas une tâche facile, comme le savent d'innombrables étudiants. Mais lorsque l'étudiant est un ordinateur, une approche fonctionne étonnamment bien : Il suffit d'alimenter un modèle mathématique géant, appelé réseau neuronal, avec des montagnes de textes provenant d'Internet. C'est le principe de fonctionnement des modèles linguistiques génératifs tels que ChatGPT d'OpenAI, dont la capacité à tenir une conversation cohérente (à défaut d'être toujours sincère) sur un large éventail de sujets a surpris les chercheurs et le public au cours de l'année écoulée.

Mais cette approche présente des inconvénients. D'une part, la procédure de "formation" nécessaire pour transformer de vastes archives textuelles en modèles linguistiques de pointe est coûteuse et prend beaucoup de temps. D'autre part, même les personnes qui forment les grands modèles linguistiques ont du mal à comprendre leur fonctionnement interne, ce qui, à son tour, rend difficile la prévision des nombreuses façons dont ils peuvent échouer.

Face à ces difficultés, certains chercheurs ont choisi d'entraîner des modèles plus petits sur des ensembles de données plus restreints, puis d'étudier leur comportement. "C'est comme le séquençage du génome de la drosophile par rapport au séquençage du génome humain", explique Ellie Pavlick, chercheuse sur les modèles de langage à l'université de Brown.

Dans un article récemment publié sur le serveur scientifique arxiv.org, deux chercheurs de Microsoft ont présenté une nouvelle méthode pour former de minuscules modèles de langage : Les élever avec un régime strict d'histoires pour enfants.

RÉSEAUX NEURONAUX

Des chercheurs acquièrent une nouvelle compréhension à partir d'une simple IA

Les chercheurs en apprentissage automatique ont compris cette leçon. GPT-3.5, le grand modèle linguistique qui alimente l'interface ChatGPT, compte près de 200 milliards de paramètres et a été entraîné sur un ensemble de données comprenant des centaines de milliards de mots (OpenAI n'a pas publié les chiffres correspondants pour son successeur, GPT-4). L'entraînement de modèles aussi vastes nécessite généralement au moins 1 000 processeurs spécialisés, appelés GPU, fonctionnant en parallèle pendant des semaines. Seules quelques entreprises peuvent réunir les ressources nécessaires, sans parler de l'entraînement et de la comparaison de différents modèles.

Les deux chercheurs ont montré que des modèles linguistiques des milliers de fois plus petits que les systèmes de pointe actuels apprenaient rapidement à raconter des histoires cohérentes et grammaticalement justes lorsqu'ils étaient formés de cette manière. Leurs résultats indiquent de nouvelles pistes de recherche qui pourraient être utiles pour former des modèles plus importants et comprendre leur comportement.

"J'ai trouvé tout ça très instructif", a déclaré Chandra Bhagavatula, chercheur sur les modèles de langage à l'Allen Institute for Artificial Intelligence de Seattle. "Le concept lui-même est très intéressant.

Il était une fois

Les réseaux neuronaux au cœur des modèles de langage sont des structures mathématiques vaguement inspirées du cerveau humain. Chacun d'entre eux contient de nombreux neurones artificiels disposés en couches, avec des connexions entre les neurones des couches adjacentes. Le comportement du réseau neuronal est régi par la force de ces connexions, appelées paramètres. Dans un modèle linguistique, les paramètres contrôlent les mots que le modèle peut produire ensuite, compte tenu d'une invite initiale et des mots qu'il a déjà générés.

Un modèle ne prend véritablement vie qu'au cours de la formation, lorsqu'il compare de manière répétée ses propres résultats au texte de son ensemble de données de formation et qu'il ajuste ses paramètres afin d'accroître la ressemblance. Un réseau non entraîné avec des paramètres aléatoires est trivialement facile à assembler à partir de quelques lignes de code, mais il ne produira que du charabia. Après l'entraînement, il peut souvent poursuivre de manière plausible un texte peu familier. Les modèles de plus grande taille sont souvent soumis à des réglages plus fins qui leur apprennent à répondre à des questions et à suivre des instructions, mais l'essentiel de la formation consiste à maîtriser la prédiction des mots.

Pour réussir à prédire des mots, un modèle linguistique doit maîtriser de nombreuses compétences différentes. Par exemple, les règles de la grammaire anglaise suggèrent que le mot suivant le mot "going" sera probablement "to", quel que soit le sujet du texte. En outre, un système a besoin de connaissances factuelles pour compléter "la capitale de la France est", et compléter un passage contenant le mot "not" nécessite une connaissance rudimentaire de la logique.

"Le langage brut est très compliqué", explique Timothy Nguyen, chercheur en apprentissage automatique chez DeepMind. "Pour que des capacités linguistiques intéressantes apparaissent, les gens ont eu recours à l'idée que plus il y a de données, mieux c'est".

(photo) Ronen Eldan s'est rendu compte qu'il pouvait utiliser les histoires d'enfants générées par de grands modèles linguistiques pour en entraîner rapidement de plus petits.

Introduction

Ronen Eldan, mathématicien qui a rejoint Microsoft Research en 2022 pour étudier les modèles de langage génératifs, souhaitait développer un moyen moins coûteux et plus rapide d'explorer leurs capacités. Le moyen naturel d'y parvenir était d'utiliser un petit ensemble de données, ce qui signifiait qu'il devait entraîner les modèles à se spécialiser dans une tâche spécifique, afin qu'ils ne s'éparpillent pas. Au départ, il voulait entraîner les modèles à résoudre une certaine catégorie de problèmes mathématiques, mais un après-midi, après avoir passé du temps avec sa fille de 5 ans, il s'est rendu compte que les histoires pour enfants convenaient parfaitement. "L'idée m'est venue littéralement après lui avoir lu une histoire", a-t-il déclaré.

Pour générer des histoires cohérentes pour les enfants, un modèle de langage devrait apprendre des faits sur le monde, suivre les personnages et les événements, et observer les règles de grammaire - des versions plus simples des défis auxquels sont confrontés les grands modèles. Mais les grands modèles formés sur des ensembles de données massives apprennent d'innombrables détails non pertinents en même temps que les règles qui comptent vraiment. Eldan espérait que la brièveté et le vocabulaire limité des histoires pour enfants rendraient l'apprentissage plus gérable pour les petits modèles, ce qui les rendrait à la fois plus faciles à former et plus faciles à comprendre.

Dans le monde des modèles de langage, cependant, le terme "petit" est relatif : Un ensemble de données mille fois plus petit que celui utilisé pour former GPT-3.5 devrait encore contenir des millions d'histoires. "Je ne sais pas combien d'argent vous voulez dépenser, mais je suppose que vous n'allez pas engager des professionnels pour écrire quelques millions de nouvelles", a déclaré M. Nguyen.

Il faudrait un auteur extraordinairement prolifique pour satisfaire des lecteurs aussi voraces, mais Eldan avait quelques candidats en tête. Qui peut mieux écrire pour un public de petits modèles linguistiques que pour de grands modèles ?

Toys stories

Eldan a immédiatement entrepris de créer une bibliothèque d'histoires synthétiques pour enfants générées par de grands modèles linguistiques. Mais il a rapidement découvert que même les modèles de pointe ne sont pas naturellement très créatifs. Si l'on demande à GPT-4 d'écrire des histoires adaptées à des enfants de 4 ans, explique Eldan, "environ un cinquième des histoires concernera des enfants qui vont au parc et qui ont peur des toboggans". C'est apparemment la quintessence des histoires pour enfants d'âge préscolaire, selon l'Internet.

La solution a consisté à ajouter un peu d'aléatoire dans le message. Tout d'abord, Eldan a utilisé le GPT-4 pour générer une liste de 1 500 noms, verbes et adjectifs qu'un enfant de 4 ans pourrait connaître - suffisamment courte pour qu'il puisse facilement la vérifier lui-même. Il a ensuite écrit un programme informatique simple qui demanderait à plusieurs reprises à GPT-3.5 ou à GPT-4 de générer une histoire adaptée à l'âge de l'enfant, comprenant trois mots aléatoires de la liste, ainsi qu'un détail supplémentaire choisi au hasard, comme une fin heureuse ou un rebondissement de l'intrigue. Les histoires obtenues, heureusement, étaient moins axées sur des diapositives effrayantes.

Eldan disposait désormais d'une procédure pour produire des données de formation à la demande, mais il n'avait aucune idée du nombre d'histoires dont il aurait besoin pour former un modèle fonctionnel, ni de la taille de ce modèle. C'est alors qu'il s'est associé à Yuanzhi Li, chercheur en apprentissage automatique chez Microsoft et à l'université Carnegie Mellon, pour essayer différentes possibilités, en tirant parti du fait que les petits modèles peuvent être formés très rapidement. La première étape consistait à décider comment évaluer leurs modèles.

Introduction

Dans la recherche sur les modèles de langage - comme dans toute salle de classe - la notation est un sujet délicat. Il n'existe pas de rubrique parfaite qui englobe tout ce que les chercheurs veulent savoir, et les modèles qui excellent dans certaines tâches échouent souvent de manière spectaculaire dans d'autres. Au fil du temps, les chercheurs ont mis au point divers critères de référence standard basés sur des questions dont les réponses ne sont pas ambiguës, ce qui est une bonne approche si vous essayez d'évaluer des compétences spécifiques. Mais Eldan et Li se sont intéressés à quelque chose de plus nébuleux : quelle doit être la taille réelle des modèles linguistiques si l'on simplifie le langage autant que possible ?

"Pour vérifier directement si le modèle parle anglais, je pense que la seule chose à faire est de laisser le modèle générer de l'anglais de manière ouverte", a déclaré M. Eldan.

Il n'y a que deux façons de mesurer les performances d'un modèle sur des questions aussi qualitatives : S'appuyer sur des évaluateurs humains ou se tourner à nouveau vers le GPT-4. Les deux chercheurs ont opté pour cette dernière solution, laissant les grands modèles à la fois rédiger les manuels et noter les dissertations.

Bhagavatula a déclaré qu'il aurait aimé voir comment les évaluations de GPT-4 se comparaient à celles des correcteurs humains - GPT-4 peut être biaisé en faveur des modèles qu'il a aidé à former, et l'opacité des modèles de langage rend difficile la quantification de tels biais. Mais il ne pense pas que de telles subtilités affecteraient les comparaisons entre différents modèles formés sur des ensembles similaires d'histoires synthétiques - l'objectif principal du travail d'Eldan et Li.

Eldan et Li ont utilisé une procédure en deux étapes pour évaluer chacun de leurs petits modèles après la formation. Tout d'abord, ils ont présenté au petit modèle la première moitié d'une histoire distincte de celles de l'ensemble des données d'apprentissage, de manière à ce qu'il génère une nouvelle fin, en répétant ce processus avec 50 histoires de test différentes. Ensuite, ils ont demandé à GPT-4 d'évaluer chacune des fins du petit modèle en fonction de trois catégories : créativité, grammaire et cohérence avec le début de l'histoire. Ils ont ensuite fait la moyenne des notes obtenues dans chaque catégorie, obtenant ainsi trois notes finales par modèle.

Avec cette procédure en main, Eldan et Li étaient enfin prêts à comparer les différents modèles et à découvrir quels étaient les étudiants les plus brillants.

Résultats des tests

Après quelques explorations préliminaires, les deux chercheurs ont opté pour un ensemble de données de formation contenant environ 2 millions d'histoires. Ils ont ensuite utilisé cet ensemble de données, baptisé TinyStories, pour entraîner des modèles dont la taille varie de 1 million à 30 millions de paramètres, avec un nombre variable de couches. Le travail a été rapide : En utilisant seulement quatre GPU, l'entraînement du plus grand de ces modèles n'a pas pris plus d'une journée.

Les plus petits modèles ont eu du mal. Par exemple, l'une des histoires testées commence par un homme à l'air méchant qui dit à une fille qu'il va lui prendre son chat. Un modèle à un million de paramètres s'est retrouvé bloqué dans une boucle où la fille répète sans cesse à l'homme qu'elle veut être son amie. Mais les modèles plus grands, qui sont encore des milliers de fois plus petits que GPT-3.5, ont obtenu des résultats surprenants. La version à 28 millions de paramètres racontait une histoire cohérente, même si la fin était sinistre : "Katie s'est mise à pleurer, mais l'homme s'en fichait. Il a emporté le chat et Katie n'a plus jamais revu son chat. Fin de l'histoire".

En plus de tester leurs propres modèles, Eldan et Li ont soumis le même défi au GPT-2 d'OpenAI, un modèle de 1,5 milliard de paramètres publié en 2019. Le résultat a été bien pire - avant la fin abrupte de l'histoire, l'homme menace d'emmener la jeune fille au tribunal, en prison, à l'hôpital, à la morgue et enfin au crématorium.

Introduction

Selon M. Nguyen, il est passionnant que des modèles aussi petits soient aussi fluides, mais il n'est peut-être pas surprenant que GPT-2 ait eu du mal à accomplir la tâche : il s'agit d'un modèle plus grand, mais loin de l'état de l'art, et il a été formé sur un ensemble de données très différent. "Un enfant en bas âge qui ne s'entraînerait qu'à des tâches d'enfant en bas âge, comme jouer avec des jouets, obtiendrait de meilleurs résultats que vous ou moi", a-t-il fait remarquer. "Nous ne nous sommes pas spécialisés dans cette chose simple.

Les comparaisons entre les différents modèles de TinyStories ne souffrent pas des mêmes facteurs de confusion. Eldan et Li ont observé que les réseaux comportant moins de couches mais plus de neurones par couche étaient plus performants pour répondre aux questions nécessitant des connaissances factuelles ; inversement, les réseaux comportant plus de couches et moins de neurones par couche étaient plus performants pour garder en mémoire les personnages et les points de l'intrigue situés plus tôt dans l'histoire. Bhagavatula a trouvé ce résultat particulièrement intriguant. S'il peut être reproduit dans des modèles plus vastes, "ce serait un résultat vraiment intéressant qui pourrait découler de ce travail", a-t-il déclaré.

Eldan et Li ont également étudié comment les capacités de leurs petits modèles dépendaient de la durée de la période de formation. Dans tous les cas, les modèles maîtrisaient d'abord la grammaire, puis la cohérence. Pour Eldan, ce schéma illustre comment les différences dans les structures de récompense entraînent des différences dans les schémas d'acquisition du langage entre les réseaux neuronaux et les enfants. Pour les modèles de langage, qui apprennent en prédisant des mots, "l'incitation pour les mots "je veux avoir" est aussi importante que pour les mots "crème glacée"", a-t-il déclaré. Les enfants, en revanche, "ne se soucient pas de savoir s'ils disent 'j'aimerais avoir de la glace' ou simplement 'glace, glace, glace'".

Qualité contre quantité

Eldan et Li espèrent que cette étude incitera d'autres chercheurs à entraîner différents modèles sur l'ensemble des données de TinyStories et à comparer leurs capacités. Mais il est souvent difficile de prédire quelles caractéristiques des petits modèles apparaîtront également dans les plus grands.

"Peut-être que les modèles de vision chez la souris sont de très bons substituts de la vision humaine, mais les modèles de dépression chez la souris sont-ils de bons modèles de la dépression chez l'homme ? a déclaré M. Pavlick. "Pour chaque cas, c'est un peu différent.

Le succès des modèles TinyStories suggère également une leçon plus large. L'approche standard pour compiler des ensembles de données de formation consiste à aspirer des textes sur l'internet, puis à filtrer les déchets. Le texte synthétique généré par des modèles de grande taille pourrait constituer une autre façon d'assembler des ensembles de données de haute qualité qui n'auraient pas besoin d'être aussi volumineux.

"Nous avons de plus en plus de preuves que cette méthode est très efficace, non seulement pour les modèles de la taille de TinyStories, mais aussi pour les modèles plus importants", a déclaré M. Eldan. Ces preuves proviennent d'une paire d'articles de suivi sur les modèles à un milliard de paramètres, rédigés par Eldan, Li et d'autres chercheurs de Microsoft. Dans le premier article, ils ont entraîné un modèle à apprendre le langage de programmation Python en utilisant des extraits de code générés par GPT-3.5 ainsi que du code soigneusement sélectionné sur l'internet. Dans le second, ils ont complété l'ensemble de données d'entraînement par des "manuels" synthétiques couvrant un large éventail de sujets, afin d'entraîner un modèle linguistique à usage général. Lors de leurs tests, les deux modèles ont été comparés favorablement à des modèles plus importants formés sur des ensembles de données plus vastes. Mais l'évaluation des modèles linguistiques est toujours délicate, et l'approche des données d'entraînement synthétiques n'en est qu'à ses balbutiements - d'autres tests indépendants sont nécessaires.

Alors que les modèles linguistiques de pointe deviennent de plus en plus volumineux, les résultats surprenants de leurs petits cousins nous rappellent qu'il y a encore beaucoup de choses que nous ne comprenons pas, même pour les modèles les plus simples. M. Nguyen s'attend à ce que de nombreux autres articles explorent l'approche inaugurée par TinyStories.

"La question est de savoir où et pourquoi la taille a de l'importance", a-t-il déclaré. "Il devrait y avoir une science à ce sujet, et cet article est, je l'espère, le début d'une riche histoire.

Auteur: Internet

Info: https://www.quantamagazine.org/ Ben Brubaker, 5 octobre 2023

[ synthèse ]

Commenter

Commentaires: 0

Ajouté à la BD par miguel

interrogation

Pourquoi cet univers ? Un nouveau calcul suggère que notre cosmos est typique.

Deux physiciens ont calculé que l’univers a une entropie plus élevée – et donc plus probable – que d’autres univers possibles. Le calcul est " une réponse à une question qui n’a pas encore été pleinement comprise ".

(image : Les propriétés de notre univers – lisse, plat, juste une pincée d’énergie noire – sont ce à quoi nous devrions nous attendre, selon un nouveau calcul.)

Les cosmologues ont passé des décennies à chercher à comprendre pourquoi notre univers est si étonnamment vanille. Non seulement il est lisse et plat à perte de vue, mais il s'étend également à un rythme toujours plus lent, alors que des calculs naïfs suggèrent que – à la sortie du Big Bang – l'espace aurait dû se froisser sous l'effet de la gravité et détruit par une énergie noire répulsive.

Pour expliquer la planéité du cosmos, les physiciens ont ajouté un premier chapitre dramatique à l'histoire cosmique : ils proposent que l'espace se soit rapidement gonflé comme un ballon au début du Big Bang, aplanissant toute courbure. Et pour expliquer la légère croissance de l’espace après cette première période d’inflation, certains ont avancé que notre univers n’est qu’un parmi tant d’autres univers moins hospitaliers dans un multivers géant.

Mais maintenant, deux physiciens ont bouleversé la pensée conventionnelle sur notre univers vanille. Suivant une ligne de recherche lancée par Stephen Hawking et Gary Gibbons en 1977, le duo a publié un nouveau calcul suggérant que la clarté du cosmos est attendue plutôt que rare. Notre univers est tel qu'il est, selon Neil Turok de l'Université d'Édimbourg et Latham Boyle de l'Institut Perimeter de physique théorique de Waterloo, au Canada, pour la même raison que l'air se propage uniformément dans une pièce : des options plus étranges sont concevables, mais extrêmement improbable.

L'univers " peut sembler extrêmement précis, extrêmement improbable, mais eux disent : 'Attendez une minute, c'est l'univers préféré' ", a déclaré Thomas Hertog , cosmologue à l'Université catholique de Louvain en Belgique.

"Il s'agit d'une contribution nouvelle qui utilise des méthodes différentes de celles utilisées par la plupart des gens", a déclaré Steffen Gielen , cosmologue à l'Université de Sheffield au Royaume-Uni.

La conclusion provocatrice repose sur une astuce mathématique consistant à passer à une horloge qui tourne avec des nombres imaginaires. En utilisant l'horloge imaginaire, comme Hawking l'a fait dans les années 70, Turok et Boyle ont pu calculer une quantité, connue sous le nom d'entropie, qui semble correspondre à notre univers. Mais l’astuce du temps imaginaire est une manière détournée de calculer l’entropie, et sans une méthode plus rigoureuse, la signification de la quantité reste vivement débattue. Alors que les physiciens s’interrogent sur l’interprétation correcte du calcul de l’entropie, beaucoup le considèrent comme un nouveau guide sur la voie de la nature quantique fondamentale de l’espace et du temps.

"D'une manière ou d'une autre", a déclaré Gielen, "cela nous donne peut-être une fenêtre sur la microstructure de l'espace-temps."

Chemins imaginaires

Turok et Boyle, collaborateurs fréquents, sont réputés pour avoir conçu des idées créatives et peu orthodoxes sur la cosmologie. L’année dernière, pour étudier la probabilité que notre Univers soit probable, ils se sont tournés vers une technique développée dans les années 1940 par le physicien Richard Feynman.

Dans le but de capturer le comportement probabiliste des particules, Feynman a imaginé qu'une particule explore toutes les routes possibles reliant le début à la fin : une ligne droite, une courbe, une boucle, à l'infini. Il a imaginé un moyen d'attribuer à chaque chemin un nombre lié à sa probabilité et d'additionner tous les nombres. Cette technique de " l’intégrale du chemin " est devenue un cadre puissant pour prédire le comportement probable d’un système quantique.

Dès que Feynman a commencé à faire connaître l’intégrale du chemin, les physiciens ont repéré un curieux lien avec la thermodynamique, la vénérable science de la température et de l’énergie. C'est ce pont entre la théorie quantique et la thermodynamique qui a permis les calculs de Turok et Boyle.

La thermodynamique exploite la puissance des statistiques afin que vous puissiez utiliser seulement quelques chiffres pour décrire un système composé de plusieurs éléments, comme les milliards de molécules d'air qui s'agitent dans une pièce. La température, par exemple – essentiellement la vitesse moyenne des molécules d’air – donne une idée approximative de l’énergie de la pièce. Les propriétés globales telles que la température et la pression décrivent un " macrostate " de la pièce.

Mais ce terme de un macro-état est un compte rendu rudimentaire ; les molécules d’air peuvent être disposées d’un très grand nombre de manières qui correspondent toutes au même macroétat. Déplacez un peu un atome d’oxygène vers la gauche et la température ne bougera pas. Chaque configuration microscopique unique est appelée microétat, et le nombre de microétats correspondant à un macroétat donné détermine son entropie.

L'entropie donne aux physiciens un moyen précis de comparer les probabilités de différents résultats : plus l'entropie d'un macroétat est élevée, plus il est probable. Il existe bien plus de façons pour les molécules d'air de s'organiser dans toute la pièce que si elles étaient regroupées dans un coin, par exemple. En conséquence, on s’attend à ce que les molécules d’air se propagent (et restent dispersées). La vérité évidente selon laquelle les résultats probables sont probables, exprimée dans le langage de la physique, devient la célèbre deuxième loi de la thermodynamique : selon laquelle l’entropie totale d’un système a tendance à croître.

La ressemblance avec l'intégrale du chemin était indubitable : en thermodynamique, on additionne toutes les configurations possibles d'un système. Et avec l’intégrale du chemin, vous additionnez tous les chemins possibles qu’un système peut emprunter. Il y a juste une distinction assez flagrante : la thermodynamique traite des probabilités, qui sont des nombres positifs qui s'additionnent simplement. Mais dans l'intégrale du chemin, le nombre attribué à chaque chemin est complexe, ce qui signifie qu'il implique le nombre imaginaire i , la racine carrée de −1. Les nombres complexes peuvent croître ou diminuer lorsqu’ils sont additionnés, ce qui leur permet de capturer la nature ondulatoire des particules quantiques, qui peuvent se combiner ou s’annuler.

Pourtant, les physiciens ont découvert qu’une simple transformation peut vous faire passer d’un domaine à un autre. Rendez le temps imaginaire (un mouvement connu sous le nom de rotation de Wick d'après le physicien italien Gian Carlo Wick), et un second i entre dans l'intégrale du chemin qui étouffe le premier, transformant les nombres imaginaires en probabilités réelles. Remplacez la variable temps par l'inverse de la température et vous obtenez une équation thermodynamique bien connue.

Cette astuce de Wick a conduit Hawking et Gibbons à une découverte à succès en 1977, à la fin d'une série éclair de découvertes théoriques sur l'espace et le temps.

L'entropie de l'espace-temps

Des décennies plus tôt, la théorie de la relativité générale d’Einstein avait révélé que l’espace et le temps formaient ensemble un tissu unifié de réalité – l’espace-temps – et que la force de gravité était en réalité la tendance des objets à suivre les plis de l’espace-temps. Dans des circonstances extrêmes, l’espace-temps peut se courber suffisamment fortement pour créer un Alcatraz incontournable connu sous le nom de trou noir.

En 1973, Jacob Bekenstein a avancé l’hérésie selon laquelle les trous noirs seraient des prisons cosmiques imparfaites. Il a estimé que les abysses devraient absorber l'entropie de leurs repas, plutôt que de supprimer cette entropie de l'univers et de violer la deuxième loi de la thermodynamique. Mais si les trous noirs ont de l’entropie, ils doivent aussi avoir des températures et rayonner de la chaleur.

Stephen Hawking, sceptique, a tenté de prouver que Bekenstein avait tort, en se lançant dans un calcul complexe du comportement des particules quantiques dans l'espace-temps incurvé d'un trou noir. À sa grande surprise, il découvrit en 1974 que les trous noirs rayonnaient effectivement. Un autre calcul a confirmé l'hypothèse de Bekenstein : un trou noir a une entropie égale au quart de la surface de son horizon des événements – le point de non-retour pour un objet tombant.

Dans les années qui suivirent, les physiciens britanniques Gibbons et Malcolm Perry, puis plus tard Gibbons et Hawking, arrivèrent au même résultat dans une autre direction . Ils ont établi une intégrale de chemin, additionnant en principe toutes les différentes manières dont l'espace-temps pourrait se plier pour former un trou noir. Ensuite, ils ont fait tourner le trou noir, marquant l'écoulement du temps avec des nombres imaginaires, et ont scruté sa forme. Ils ont découvert que, dans la direction du temps imaginaire, le trou noir revenait périodiquement à son état initial. Cette répétition semblable au jour de la marmotte dans un temps imaginaire a donné au trou noir une sorte de stase qui leur a permis de calculer sa température et son entropie.

Ils n’auraient peut-être pas fait confiance aux résultats si les réponses n’avaient pas correspondu exactement à celles calculées précédemment par Bekenstein et Hawking. À la fin de la décennie, leur travail collectif avait donné naissance à une idée surprenante : l’entropie des trous noirs impliquait que l’espace-temps lui-même était constitué de minuscules morceaux réorganisables, tout comme l’air est constitué de molécules. Et miraculeusement, même sans savoir ce qu’étaient ces " atomes gravitationnels ", les physiciens ont pu compter leurs arrangements en regardant un trou noir dans un temps imaginaire.

"C'est ce résultat qui a laissé une très profonde impression sur Hawking", a déclaré Hertog, ancien étudiant diplômé et collaborateur de longue date de Hawking. Hawking s'est immédiatement demandé si la rotation de Wick fonctionnerait pour autre chose que les trous noirs. "Si cette géométrie capture une propriété quantique d'un trou noir", a déclaré Hertog, "alors il est irrésistible de faire la même chose avec les propriétés cosmologiques de l'univers entier."

Compter tous les univers possibles

Immédiatement, Hawking et Gibbons Wick ont fait tourner l’un des univers les plus simples imaginables – un univers ne contenant rien d’autre que l’énergie sombre construite dans l’espace lui-même. Cet univers vide et en expansion, appelé espace-temps " de Sitter ", a un horizon au-delà duquel l’espace s’étend si rapidement qu’aucun signal provenant de cet espace ne parviendra jamais à un observateur situé au centre de l’espace. En 1977, Gibbons et Hawking ont calculé que, comme un trou noir, un univers de De Sitter possède également une entropie égale au quart de la surface de son horizon. Encore une fois, l’espace-temps semblait comporter un nombre incalculable de micro-états.

Mais l’entropie de l’univers réel restait une question ouverte. Notre univers n'est pas vide ; il regorge de lumière rayonnante et de flux de galaxies et de matière noire. La lumière a provoqué une expansion rapide de l'espace pendant la jeunesse de l'univers, puis l'attraction gravitationnelle de la matière a ralenti les choses pendant l'adolescence cosmique. Aujourd’hui, l’énergie sombre semble avoir pris le dessus, entraînant une expansion galopante. "Cette histoire d'expansion est une aventure semée d'embûches", a déclaré Hertog. "Il n'est pas si facile d'obtenir une solution explicite."

Au cours de la dernière année, Boyle et Turok ont élaboré une solution aussi explicite. Tout d'abord, en janvier, alors qu'ils jouaient avec des cosmologies jouets, ils ont remarqué que l'ajout de radiations à l'espace-temps de De Sitter ne gâchait pas la simplicité requise pour faire tourner l'univers par Wick.

Puis, au cours de l’été, ils ont découvert que la technique résisterait même à l’inclusion désordonnée de matière. La courbe mathématique décrivant l’histoire plus complexe de l’expansion relevait toujours d’un groupe particulier de fonctions faciles à manipuler, et le monde de la thermodynamique restait accessible. "Cette rotation de Wick est une affaire trouble lorsque l'on s'éloigne d'un espace-temps très symétrique", a déclaré Guilherme Leite Pimentel , cosmologiste à la Scuola Normale Superiore de Pise, en Italie. "Mais ils ont réussi à le trouver."

En faisant tourner Wick l’histoire de l’expansion en montagnes russes d’une classe d’univers plus réaliste, ils ont obtenu une équation plus polyvalente pour l’entropie cosmique. Pour une large gamme de macroétats cosmiques définis par le rayonnement, la matière, la courbure et une densité d'énergie sombre (tout comme une plage de températures et de pressions définit différents environnements possibles d'une pièce), la formule crache le nombre de microétats correspondants. Turok et Boyle ont publié leurs résultats en ligne début octobre.

Les experts ont salué le résultat explicite et quantitatif. Mais à partir de leur équation d’entropie, Boyle et Turok ont tiré une conclusion non conventionnelle sur la nature de notre univers. "C'est là que cela devient un peu plus intéressant et un peu plus controversé", a déclaré Hertog.

Boyle et Turok pensent que l'équation effectue un recensement de toutes les histoires cosmiques imaginables. Tout comme l'entropie d'une pièce compte toutes les façons d'arranger les molécules d'air pour une température donnée, ils soupçonnent que leur entropie compte toutes les façons dont on peut mélanger les atomes de l'espace-temps et se retrouver avec un univers avec une histoire globale donnée. courbure et densité d’énergie sombre.

Boyle compare le processus à l'examen d'un gigantesque sac de billes, chacune représentant un univers différent. Ceux qui ont une courbure négative pourraient être verts. Ceux qui ont des tonnes d'énergie sombre pourraient être des yeux de chat, et ainsi de suite. Leur recensement révèle que l’écrasante majorité des billes n’ont qu’une seule couleur – le bleu, par exemple – correspondant à un type d’univers : un univers globalement semblable au nôtre, sans courbure appréciable et juste une touche d’énergie sombre. Les types de cosmos les plus étranges sont extrêmement rares. En d’autres termes, les caractéristiques étrangement vanille de notre univers qui ont motivé des décennies de théorie sur l’inflation cosmique et le multivers ne sont peut-être pas étranges du tout.

"C'est un résultat très intrigant", a déclaré Hertog. Mais " cela soulève plus de questions que de réponses ".

Compter la confusion

Boyle et Turok ont calculé une équation qui compte les univers. Et ils ont fait l’observation frappante que des univers comme le nôtre semblent représenter la part du lion des options cosmiques imaginables. Mais c’est là que s’arrête la certitude.

Le duo ne tente pas d’expliquer quelle théorie quantique de la gravité et de la cosmologie pourrait rendre certains univers communs ou rares. Ils n’expliquent pas non plus comment notre univers, avec sa configuration particulière de parties microscopiques, est né. En fin de compte, ils considèrent leurs calculs comme un indice permettant de déterminer quels types d’univers sont préférés plutôt que comme quelque chose qui se rapproche d’une théorie complète de la cosmologie. "Ce que nous avons utilisé est une astuce bon marché pour obtenir la réponse sans connaître la théorie", a déclaré Turok.

Leurs travaux revitalisent également une question restée sans réponse depuis que Gibbons et Hawking ont lancé pour la première fois toute l’histoire de l’entropie spatio-temporelle : quels sont exactement les micro-états que compte l’astuce bon marché ?

"L'essentiel ici est de dire que nous ne savons pas ce que signifie cette entropie", a déclaré Henry Maxfield , physicien à l'Université de Stanford qui étudie les théories quantiques de la gravité.

En son cœur, l’entropie résume l’ignorance. Pour un gaz constitué de molécules, par exemple, les physiciens connaissent la température – la vitesse moyenne des particules – mais pas ce que fait chaque particule ; l'entropie du gaz reflète le nombre d'options.

Après des décennies de travaux théoriques, les physiciens convergent vers une vision similaire pour les trous noirs. De nombreux théoriciens pensent aujourd'hui que la zone de l'horizon décrit leur ignorance de ce qui s'y trouve, de toutes les façons dont les éléments constitutifs du trou noir sont disposés de manière interne pour correspondre à son apparence extérieure. (Les chercheurs ne savent toujours pas ce que sont réellement les microétats ; les idées incluent des configurations de particules appelées gravitons ou cordes de la théorie des cordes.)

Mais lorsqu’il s’agit de l’entropie de l’univers, les physiciens se sentent moins sûrs de savoir où se situe leur ignorance.

En avril, deux théoriciens ont tenté de donner à l’entropie cosmologique une base mathématique plus solide. Ted Jacobson , physicien à l'Université du Maryland réputé pour avoir dérivé la théorie de la gravité d'Einstein de la thermodynamique des trous noirs, et son étudiant diplômé Batoul Banihashemi ont explicitement défini l'entropie d'un univers de Sitter (vacant et en expansion). Ils ont adopté la perspective d’un observateur au centre. Leur technique, qui consistait à ajouter une surface fictive entre l'observateur central et l'horizon, puis à rétrécir la surface jusqu'à ce qu'elle atteigne l'observateur central et disparaisse, a récupéré la réponse de Gibbons et Hawking selon laquelle l'entropie est égale à un quart de la surface de l'horizon. Ils ont conclu que l’entropie de De Sitter compte tous les microétats possibles à l’intérieur de l’horizon.

Turok et Boyle calculent la même entropie que Jacobson et Banihashemi pour un univers vide. Mais dans leur nouveau calcul relatif à un univers réaliste rempli de matière et de rayonnement, ils obtiennent un nombre beaucoup plus grand de microétats – proportionnels au volume et non à la surface. Face à ce conflit apparent, ils spéculent que les différentes entropies répondent à des questions différentes : la plus petite entropie de De Sitter compte les microétats d'un espace-temps pur délimité par un horizon, tandis qu'ils soupçonnent que leur plus grande entropie compte tous les microétats d'un espace-temps rempli d'espace-temps. matière et énergie, tant à l’intérieur qu’à l’extérieur de l’horizon. "C'est tout un shebang", a déclaré Turok.

En fin de compte, régler la question de savoir ce que comptent Boyle et Turok nécessitera une définition mathématique plus explicite de l’ensemble des microétats, analogue à ce que Jacobson et Banihashemi ont fait pour l’espace de Sitter. Banihashemi a déclaré qu'elle considérait le calcul d'entropie de Boyle et Turok " comme une réponse à une question qui n'a pas encore été entièrement comprise ".

Quant aux réponses plus établies à la question " Pourquoi cet univers ? ", les cosmologistes affirment que l’inflation et le multivers sont loin d’être morts. La théorie moderne de l’inflation, en particulier, est parvenue à résoudre bien plus que la simple question de la douceur et de la planéité de l’univers. Les observations du ciel correspondent à bon nombre de ses autres prédictions. L'argument entropique de Turok et Boyle a passé avec succès un premier test notable, a déclaré Pimentel, mais il lui faudra trouver d'autres données plus détaillées pour rivaliser plus sérieusement avec l'inflation.

Comme il sied à une grandeur qui mesure l’ignorance, les mystères enracinés dans l’entropie ont déjà servi de précurseurs à une physique inconnue. À la fin des années 1800, une compréhension précise de l’entropie en termes d’arrangements microscopiques a permis de confirmer l’existence des atomes. Aujourd'hui, l'espoir est que si les chercheurs calculant l'entropie cosmologique de différentes manières peuvent déterminer exactement à quelles questions ils répondent, ces chiffres les guideront vers une compréhension similaire de la façon dont les briques Lego du temps et de l'espace s'empilent pour créer l'univers qui nous entoure.

"Notre calcul fournit une énorme motivation supplémentaire aux personnes qui tentent de construire des théories microscopiques de la gravité quantique", a déclaré Turok. "Parce que la perspective est que cette théorie finira par expliquer la géométrie à grande échelle de l'univers."

Auteur: Internet

Info: https://www.quantamagazine.org/ - Charlie Wood, 17 nov 2022

[ constante fondamentale ] [ 1/137 ]

Commenter

Commentaires: 0

Ajouté à la BD par miguel

Paramètres de recherches