Les fils de la pensée

corps-esprit

D’une manière générale, il faut bien le remarquer : sur les conditions effectives de la pensée, le Descartes de la maturité n’a guère pris position. […]

En tout cas, nous n’avons, en perspective cartésienne, aucune idée de ce que serait un processus de pensée – ne disons pas un raisonnement, mais un processus de pensée – qui ne serait lié à aucune condition cérébrale. En droit, la substance de la pensée et la substance pensante elle-même sont indépendantes du corps. En fait, le corps assiste toujours la pensée, avec la double dimension du support et du facteur de retardement, de l’auxilium et de l’impedimentum.

En somme, que peut penser l’âme sans le corps ? Si "sans le corps" veut dire : sans une implication expresse du corps dans le processus de pensée, et sans une représentation corporelle plus ou moins ressemblante de l’objet de la pensée, la réponse sera qu’elle peut penser quantité de choses. Si en revanche « sans le corps » veut dire : sans aucune affection d’origine corporelle, la réponse est que nous n’en savons rien, ce qui veut dire : peut-être rien. Et si, assurément, Descartes refuse de considérer la pensée comme une propriété émergente, il ne caractérise en même temps l’esprit comme "chose complète" que de manière très précautionneuse. Disons que l’esprit est chose complète (indépendante) par sa notion et non par son activité.

Si donc il faut reprendre la question du sens du "dualisme cartésien", on dira que ce dualisme est essentiellement fonctionnel. Là où ne règne et où ne peut être obtenue aucune espèce d’évidence empirique (de l’indépendance des opérations de l’esprit à l’égard du corps), on peut néanmoins parler d’une évidence conceptuelle qui se recommande par son utilité intellectuelle et pratique. […] la "distinction réelle" de l’esprit et du corps est destinée à faire respecter la différence entre les objets de la pensée : il n’y a pas à traiter les pensées comme des processus physiques ou de purs produits de processus physiques, ni à considérer les mouvements de la nature comme des réalisations d’intentions. […] Au contraire, la distinction cartésienne règle les manières de parler des choses, et elle permet à la pensée de prendre possession d’elle-même, ou des idées qui lui donnent forme, comme elle peut prendre possession des choses étendues : seule en effet la certitude que ces idées appartiennent originairement à l’esprit […] lui donne l’assurance de pouvoir aller au bout de ses propres opérations et d’atteindre à une perfection spécifique qui autrement relèvera du hasard.

Auteur: Kambouchner Denis

Info: La question Descartes, éditions Gallimard, 2023, pages 158 à 160

[ explication ] [ philosophie ] [ résumé ] [ méthode ]

Commenter

Commentaires: 1

Ajouté à la BD par Coli Masson

machine pensante

Cette IA de Deepmind pourrait révolutionner les maths et " repousser les frontières de la connaissance humaine "

DeepMind vient de frapper un grand coup : le laboratoire d'IA de Google a annoncé en janvier avoir développé AlphaGeometry, une intelligence artificielle révolutionnaire capable de rivaliser avec les médaillés d'or des Olympiades internationales dans la résolution de problèmes de géométrie. Si cela ne vous parle pas, sachez que les médailles Fields - Terence Tao, Maryam Mirzakhani et Grigori Perelman - ont tous les trois été médaillés d'or lors de cette compétition annuelle de mathématiques qui fait s'affronter les meilleurs collégiens et lycéens du monde. Or, AlphaGeometry a résolu avec succès 25 des 30 problèmes de géométrie de l'Olympiade, se rapprochant ainsi du score moyen des médaillés d'or humains. C'est 15 de plus que son prédécesseur. Mais comment les scientifiques de DeepMind ont-ils accompli un tel exploit ?

L'approche neuro-symbolique, la petite révolution de l'IA

AlphaGeometry est le fruit d'une approche neuro-symbolique, combinant un modèle de langage neuronal (MLN) et un moteur de déduction symbolique (MDS).

Les MLN sont des réseaux de neurones artificiels entraînés sur de vastes ensembles de données textuelles. Ils sont capables d'apprendre et de reconnaître des schémas et des structures dans les données textuelles, ce qui leur permet de générer du texte cohérent et de comprendre le langage naturel. Les MDS sont, pour leur part, particulièrement efficaces pour traiter des problèmes qui nécessitent une manipulation formelle des symboles et des règles logiques.

L'approche neuro-symbolique permet de faire travailler ces deux composantes en tandem : dans le cadre d'AlphaGeometry, le MLN prédit des constructions géométriques potentiellement utiles, puis le MDS utilise ces prédictions pour guider la résolution du problème. Cette combinaison offre à l'IA les capacités intuitives des réseaux de neurones et la rigueur logique des moteurs de déduction symbolique, ce qui lui permet de résoudre efficacement des problèmes de géométrie complexes.

Pour surmonter le manque de problèmes mathématiques de niveau Olympiades qui auraient dû servir de données d'entraînement à AlphaGeometry, les chercheurs ont développé une méthode innovante de génération de données synthétiques à grande échelle, permettant au génial bébé de DeepMind de s'entraîner sur un ensemble de 100 millions d'exemples uniques.

(Image : Alphageometry résoud un problème simple...)

Mission : repousser les frontières de la connaissance

Cette réalisation marque une avancée significative dans le développement de systèmes d'IA capables de raisonner et de résoudre des problèmes mathématiques complexes, rapportent les chercheurs de DeepMind dans un article paru dans Nature en février dernier. Bien que présentant des résultats impressionnants, AlphaGeometry se heurte tout de même à quelques défis, notamment celui de s'adapter à des scénarios mathématiques de plus en plus complexes et à mobiliser ses compétences dans des domaines mathématiques autres que la géométrie.

Malgré tout, cette avancée ouvre la voie à d'extraordinaires possibilités dans les domaines des mathématiques, des sciences et de l'IA. Ses créateurs ne cachent d'ailleurs pas leur ambition : " Notre objectif à long terme reste de construire des IA capables de transférer leurs compétences et leurs connaissances dans tous les domaines mathématiques en développant la résolution de problèmes et le raisonnement sophistiqués dont dépendront les systèmes d'IA généraux ", assènent Trieu Trinh et Thang Luong, les responsables du projet dans un communiqué.

Le ton est donné : autrement dit, les systèmes d'IA développés par DeepMind doivent acquérir des capacités de résolution de problèmes sophistiquées et de raisonnement, ce qui implique la capacité à identifier des schémas, à formuler des hypothèses, à déduire des conclusions et à prendre des décisions logiques dans des contextes variés. Le tout en " repoussant les frontières de la connaissance humaine ". Très ambitieux, mais peut-être pas impossible.

Auteur: Internet

Info: https://www.futura-sciences.com/ - mars 2024

[ robot intelligent ] [ historique ]

Commenter

Mis dans la chaine

Commentaires: 0

Ajouté à la BD par Le sous-projectionniste

solipsisme astral

Question : Bonjour à tous, quelqu'un a-t'il déjà rencontré son moi supérieur en SHC?

Denis Cottard
Sous toute réserve, ma compréhension de ce phénomène consiste à penser notre réalité comme un iceberg dont la partie émergée est le conscient. La partie immergée la plus conséquente est plongée dans le champ énergétique, mais à différents niveaux de celui-ci, ce qui fait qu'on peut se rencontrer à différents niveaux suivant le type d'accordage vibratoire qu'on opère et cet autre moi sera doté d'une apparence reconnaissable, d'une conscience, d'un savoir plus ou moins large et d'une capacité à l'exprimer différente. A certains de ces niveaux, notre moi participe à des réalités, disons, plus collectives et donc, peut être en possession d'informations et de compréhension que notre moi conscient ignore totalement. Durant le temps de la mise en présence, un partage ou une fusion momentanée des états de vie peut s'opérer ; mais à moins d'y être préparé et de s'organiser des mots clefs pour s'en souvenir lorsqu'on ne sera plus dans cet état, la mémoire s'en va comme s'en va la mémoire du rêve. Plus l'expérience se fera dans un niveau vibratoire éloigné du niveau conscient plus difficile en sera la mémorisation. Malgré tout, si on note tout de suite ces mots clefs, une partie de l'expérience peut être remémorée. Suffisamment en tout cas pour que l'expérience puisse être reproduite de plus en plus volontairement. C'est déconcertant de constater que notre moi puisse se prolonger à des niveaux insoupçonnés et même y agir sans que le conscient soit de la partie. Le fait de se rencontrer peut être considéré comme une invitation à participer davantage consciemment à ces niveaux d'implication.
(...)
Cette difficulté de mémorisation est liée au fait qu'en s'éloignant du niveau vibratoire de notre veille commune, le support de la pensée s'apparente de moins en moins au langage parce que de plus en plus en accès "direct" au réel. On ne se situe plus dans le concept ou dans l'interprétation du perçu, on est face au perçu lui-même, en toute évidence. Ce qui fait que où que se porte notre regard nous est renvoyé un potentiel signifiant quasi-infini puisque rien ne se cache, tout se lit à livre ouvert, c'est voir pour ce que c'est : voir c'est savoir. Cela nous amène à un niveau de compréhension qu'il n'est pas du tout évident de ramener à notre niveau de conscience habituel, pour le ranger dans notre stock de petites boîtes que sont tous ces concepts qu'on utilise couramment et qui nous maintiennent dans une perception pour le moins étriquée de l'existence.
(...)
Je reviens sur le caractère déconcertant - le mot est faible - de constater que notre moi puisse percevoir et agir à des niveaux dont le conscient n'a pas la moindre idée. Nous faisons de notre moi conscient, le nec plus ultra de nos outils, alors qu'il est en fait le plus primitif de tous et que son utilité première c'est de nous permettre de percevoir les dangers et nous permettre de courir plus vite pour y échapper. Tout ce qu'il échafaude peut se rapporter à cet instinct de survie. Tout ce qu'il conçoit fabrique, choisit... peut se rapporter à ce besoin de sécurité, et tant qu'il ne se sera pas découvert une autre dimension d'existence, l'homme continuera de se créer un monde toujours plus complexe mais toujours dominé par ceux qui lui semblent les plus forts, car c'est le réflexe (inconscient) du faible que de chercher la protection de plus fort que lui. Aujourd'hui, ces plus forts sont de toute évidence ceux qui semblent comprendre quelque chose à l'économie, quand l'écrasante majorité de la population qui n'a toujours pas compris ce qu'est l'argent demeure néanmoins pétrifiée par l'idée d'en manquer ou d'en vouloir plus.

Olivier Raimbault
@Denis Cottard : Ce que tu veux dire pourrait-il être résumé entre un moi qui serait celui de l'âme (ou du Soi) et un moi, le nôtre, celui qui écrit ces mots, qui est dans l'ego ou disons le mental ordinaire ? Donc il y a des ponts entre, ou il n'y en a pas. Il y a des transferts, ou il n'y en a pas. Il y a des imprégnations ou pas. Et les liaisons entre ces polarités créent ses états vibratoires, intermédiaires et nombreux, créent aussi nos singularités, nos coefficients de conscience.

Denis Cottard
@Olivier Raimbault : En fait dans ce genre d'expérience qui ressemble fort aux SHC, c'est ce mental ordinaire qui, se met à sortir de son contexte vibratoire habituel (Raoult parlerait d'eco-système), comme dans une bulle en fait et qui est amené à constater d'autres niveaux d'existence de lui-même qu'il ne soupçonnait pas. C'est juste le différentiel vibratoire qui provoque la théâtralisation sous la forme d'un autre soi. A mon sens, ce n'est pas de ponts dont il s'agit, puisqu'il n'y a toujours qu'un seul et même bonhomme, mais dont la réalité ne s'étend ni dans l'espace, ni dans le temps, mais dans la vibration. Le passage d'un état à l'autre est progressif, un peu comme au scanner, l'opérateur en jouant sur la fréquence de résonance parvient à mettre en évidence des tissus par degré de mollesse ou de dureté, mais il n'y a toujours qu'un seul bonhomme allongé dans l'appareil. Je prend un autre exemple : nous nous considérons généralement comme un système autonome , relativement fermé, capable de se mouvoir en toute liberté. Mais en adoptant le point de vue de l'air, on se rend compte qu'on est totalement ouvert puisque c'est même le rôle du sang que de véhiculer l'oxygène (de l'air) à chacune de nos cellules. Du point de vue des micro organismes, dès qu'on sort du corps de notre mère, nous sommes colonisés parce que nous ne sommes pas viables sans ces micro organismes. Tout cela, ce sont des points de vue qui sont plus ou moins étonnants, dérangeants, en fonction de notre culture, qui va sélectionner une infime poignée de point de vue pour fabriquer l'image que l'on a de soi. Notre conscience pensante, elle ne joue pas avec des signaux qui lui viennent de l'extérieur, elle joue avec l'infime poignée de points de vue qu'elle a sélectionnée. Contrairement à ce que nous croyons, nous ne sommes en prise directe qu'avec la façon dont nous nous représentons le monde. Donc, le transfert n'a pas lieu d'être puisque ça ne va pas d'un récipient A à un récipient B, il n'y a qu'un seul récipient, appelons-le, le Graal, si on veut (!), quand notre mental prend conscience de ces autres niveaux de réalités de lui-même, il va juste, soit oublier très vite parce qu'il ne sait rien en faire, ou au contraire, accepter qu'ils fassent partie de lui-même, et c'est là que des informations qui généralement font partie du lot des trucs qu'existent pas, deviennent des points de vue acceptés, donc utiles, et à ce titre ; ils font grandir notre compréhension des choses, élargissent le panel, la sélection. La plupart des gens ne tiennent compte que des informations qui leur viennent de leur sens, mais imagine que tu sois branché sur un niveau de toi qui perçois peu ou prou le champ d'énergie dans lequel on baigne : tu vas percevoir des choses avant qu'elles ne deviennent des faits. C'est intéressant à mon sens.

Olivier Raimbault
@Denis Cottard : je comprends très bien. C'est exactement ce que j'ai essayé de synthétiser. Le différentiel est tel qu'il peut donner l'impression d'un autre soi mais si le différentiel se réduit ou s'apprivoise par l'expérience et l'habitude, il n'y a plus d'autre soi. Il y a bien des échanges, transferts, équilibrages, quand bien même ça serait un seul moi vibrant différemment. Je pense que nous nous élaborons couramment dans une zone très restreinte de nous-mêmes, que nous pensons être le tout avant de découvrir, dans le meilleur des cas, qu'elle n'est qu'une zone, et petite.

Denis Cottard
@Olivier Raimbault : oui tout à fait !!!

Auteur: Cottard Denis

Info: Sur la groupe FB de Marc Auburn, explorateurs du réel, question du 24 juin 2020

[ incarnation ] [ point de singularité ] [ corps causal ] [ niveaux vibratoires ]

Commenter

Commentaires: 0

Ajouté à la BD par miguel

homme-machine

La théorie des jeux peut rendre l'IA plus correcte et plus efficace

Les chercheurs s’appuient sur des idées issues de la théorie des jeux pour améliorer les grands modèles de langage et les rendre plus cohérents.

Imaginez que vous ayez un ami qui donne des réponses différentes à la même question, selon la façon dont vous la posez. " Quelle est la capitale du Pérou ? " btiendrait une réponse : " Lima est-elle la capitale du Pérou ? " en obtiendrait un autre. Vous seriez probablement un peu inquiet au sujet des facultés mentales de votre ami et vous auriez certainement du mal à faire confiance à ses réponses.

C'est exactement ce qui se passe avec de nombreux grands modèles de langage (LLM), les outils d'apprentissage automatique ultra-puissants qui alimentent ChatGPT et d'autres merveilles de l'intelligence artificielle. Une question générative, ouverte, donne une réponse, et une question discriminante, qui implique de devoir choisir entre des options, en donne souvent une différente. "Il y a un décalage lorsque la même question est formulée différemment", a déclaré Athul Paul Jacob , doctorant au Massachusetts Institute of Technology.

Pour rendre les réponses d'un modèle de langage plus cohérentes - et rendre le modèle globalement plus fiable - Jacob et ses collègues ont conçu un jeu dans lequel les deux modes du modèle sont amenés à trouver une réponse sur laquelle ils peuvent s'entendre. Surnommée le jeu du consensus , cette procédure simple oppose un LLM à lui-même, en utilisant les outils de la théorie des jeux pour améliorer la précision et la cohérence interne du modèle.

"Les recherches explorant l'autocohérence au sein de ces modèles ont été très limitées", a déclaré Shayegan Omidshafiei , directeur scientifique de la société de robotique Field AI. "Cet article est l'un des premiers à aborder ce problème, de manière intelligente et systématique, en créant un jeu permettant au modèle de langage de jouer avec lui-même."

"C'est un travail vraiment passionnant", a ajouté Ahmad Beirami, chercheur scientifique chez Google Research. Pendant des décennies, a-t-il déclaré, les modèles linguistiques ont généré des réponses aux invites de la même manière. "Avec leur idée novatrice consistant à intégrer un jeu dans ce processus, les chercheurs du MIT ont introduit un paradigme totalement différent, qui peut potentiellement conduire à une multitude de nouvelles applications."

Mettre le jeu au travail

Ce nouveau travail, qui utilise les jeux pour améliorer l'IA, contraste avec les approches précédentes, qui mesuraient le succès d'un programme d'IA via sa maîtrise des jeux. En 1997, par exemple, l'ordinateur Deep Blue d'IBM a battu le grand maître d'échecs Garry Kasparov – une étape importante pour les machines dites pensantes. Dix-neuf ans plus tard, un programme de Google DeepMind nommé AlphaGo a remporté quatre matchs sur cinq contre l'ancien champion de Go Lee Sedol, révélant ainsi une autre arène dans laquelle les humains ne régnaient plus en maître. Les machines ont également surpassé les humains dans les jeux de dames, le poker à deux joueurs et d’autres jeux à somme nulle, dans lesquels la victoire d’un joueur condamne invariablement l’autre.

Le jeu de la diplomatie, un jeu favori de politiciens comme John F. Kennedy et Henry Kissinger, posait un défi bien plus grand aux chercheurs en IA. Au lieu de seulement deux adversaires, le jeu met en scène sept joueurs dont les motivations peuvent être difficiles à lire. Pour gagner, un joueur doit négocier et conclure des accords de coopération que n'importe qui peut rompre à tout moment. La diplomatie est tellement complexe qu'un groupe de Meta s'est félicité qu'en 2022, son programme d'IA Cicero ait développé un « jeu de niveau humain » sur une période de 40 parties. Bien qu'il n'ait pas vaincu le champion du monde, Cicero s'est suffisamment bien comporté pour se classer dans les 10 % les plus performants face à des participants humains.

Au cours du projet, Jacob — membre de l'équipe Meta — a été frappé par le fait que Cicéron s'appuyait sur un modèle de langage pour générer son dialogue avec les autres joueurs. Il a senti un potentiel inexploité. L'objectif de l'équipe, a-t-il déclaré, " était de créer le meilleur modèle de langage possible pour jouer à ce jeu ". Mais qu'en serait-il s’ils se concentraient plutôt sur la création du meilleur jeu possible pour améliorer les performances des grands modèles de langage ?

Interactions consensuelles

En 2023, Jacob a commencé à approfondir cette question au MIT, en travaillant avec Yikang Shen, Gabriele Farina et son conseiller Jacob Andreas sur ce qui allait devenir le jeu du consensus. L'idée centrale est venue d'imaginer une conversation entre deux personnes comme un jeu coopératif, où le succès se concrétise lorsqu'un auditeur comprend ce que l'orateur essaie de transmettre. En particulier, le jeu de consensus est conçu pour aligner les deux systèmes du modèle linguistique : le générateur, qui gère les questions génératives, et le discriminateur, qui gère les questions discriminatives.

Après quelques mois d’arrêts et de redémarrages, l’équipe a transposé ce principe dans un jeu complet. Tout d'abord, le générateur reçoit une question. Cela peut provenir d’un humain, ou d’une liste préexistante. Par exemple, " Où est né Barack Obama ? " Le générateur obtient ensuite des réponses de candidats, disons Honolulu, Chicago et Nairobi. Encore une fois, ces options peuvent provenir d'un humain, d'une liste ou d'une recherche effectuée par le modèle de langage lui-même.

Mais avant de répondre, il est également indiqué au générateur s'il doit répondre correctement ou incorrectement à la question, en fonction des résultats d'un pile ou face équitable.

Si c'est face, alors la machine tente de répondre correctement. Le générateur envoie la question initiale, accompagnée de la réponse choisie, au discriminateur. Si le discriminateur détermine que le générateur a intentionnellement envoyé la bonne réponse, chacun obtient un point, en guise d'incitation.

Si la pièce tombe sur pile, le générateur envoie ce qu’il pense être la mauvaise réponse. Si le discriminateur décide qu’on lui a délibérément donné la mauvaise réponse, ils marquent à nouveau tous les deux un point. L’idée ici est d’encourager l’accord. " C'est comme apprendre un tour à un chien ", a expliqué Jacob. " On lui donne une friandise lorsqu'ils fait la bonne chose. "

Le générateur et le discriminateur commencent également doté chacun de quelques " croyances " initiales. Credo sous forme d'une distribution de probabilité liée aux différents choix. Par exemple, le générateur peut croire, sur la base des informations qu'il a glanées sur Internet, qu'il y a 80 % de chances qu'Obama soit né à Honolulu, 10 % de chances qu'il soit né à Chicago, 5 % de chances qu'il soit né à Nairobi et 5 % de chances qu'il soit ailleurs. Le discriminateur peut commencer avec une distribution différente. Si les deux " acteurs " sont toujours récompensés après être parvenus à un accord, ils se voient également retirer des points s'ils s'écartent trop de leurs convictions initiales. Cet arrangement encourage les joueurs à intégrer leur connaissance du monde – toujours tirée d'Internet – dans leurs réponses, ce qui devrait rendre le modèle plus précis. Sans ce prérequis ils pourraient s’entendre sur une réponse totalement fausse comme celle de Delhi, mais accumuler quand même des points.

Pour chaque question, les deux systèmes jouent environ 1 000 parties l'un contre l'autre. Au cours de ces nombreuses itérations, chaque camp apprend les croyances de l'autre et modifie ses stratégies en conséquence.

Finalement, le générateur et le discriminateur commencent à être davantage d’accord à mesure qu’ils s’installent dans ce qu’on appelle l’équilibre de Nash. C’est sans doute le concept central de la théorie des jeux. Cela représente une sorte d’équilibre dans un jeu – le point auquel aucun joueur ne peut améliorer ses résultats personnels en changeant de stratégie. Au jeu du chifoumi, par exemple, les joueurs obtiennent de meilleurs résultats lorsqu'ils choisissent chacune des trois options exactement un tiers du temps, et ils obtiendront invariablement de moins bons résultats avec toute autre tactique.

Dans le jeu du consensus, cela peut se jouer de plusieurs manières. Le discriminateur pourrait observer qu'il marque un point lorsqu'il dit " correct " chaque fois que le générateur envoie le mot " Honolulu " pour le lieu de naissance d'Obama. Le générateur et le discriminateur apprendront, après avoir joué plusieurs fois, qu'ils seront récompensés s'ils continuent de le faire, et qu'aucun d'eux n'aura aucune motivation pour faire autre chose... consensus qui représente l'un des nombreux exemples possibles d'équilibre de Nash pour cette question. Le groupe du MIT s'est également appuyé sur une forme modifiée d'équilibre de Nash qui intègre les croyances antérieures des joueurs, ce qui permet de maintenir leurs réponses ancrées dans la réalité.

L'effet net, ont observé les chercheurs, est de rendre le modèle linguistique jouant ce jeu plus précis et plus susceptible de donner la même réponse, quelle que soit la façon dont la question est posée. Pour tester les effets du jeu du consensus, l'équipe a essayé une série de questions standard sur divers modèles de langage de taille modérée comportant de 7 milliards à 13 milliards de paramètres. Ces modèles ont systématiquement obtenu un pourcentage plus élevé de réponses correctes que les modèles qui n'avaient pas joué, même ceux de taille beaucoup plus importante, comportant jusqu'à 540 milliards de paramètres. La participation au jeu a également amélioré la cohérence interne d'un modèle.

En principe, n'importe quel LLM pourrait gagner à jouer contre lui-même, et 1 000 tours ne prendraient que quelques millisecondes sur un ordinateur portable standard. "Un avantage appréciable de l'approche globale", a déclaré Omidshafiei, "est qu'elle est très légère sur le plan informatique, n'impliquant aucune formation ni modification du modèle de langage de base."

Jouer à des jeux avec le langage

Après ce premier succès, Jacob étudie désormais d’autres moyens d’intégrer la théorie des jeux dans la recherche LLM. Les résultats préliminaires ont montré qu’un LLM déjà solide peut encore s’améliorer en jouant à un jeu différent – provisoirement appelé jeu d’ensemble – avec un nombre arbitraire de modèles plus petits. Le LLM principal aurait au moins un modèle plus petit servant d’allié et au moins un modèle plus petit jouant un rôle antagoniste. Si l'on demande au LLM primaire de nommer le président des États-Unis, il obtient un point chaque fois qu'il choisit la même réponse que son allié, et il obtient également un point lorsqu'il choisit une réponse différente de celle de son adversaire. Ces interactions avec des modèles beaucoup plus petits peuvent non seulement améliorer les performances d'un LLM, suggèrent les tests, mais peuvent le faire sans formation supplémentaire ni modification des paramètres.

Et ce n'est que le début. Étant donné qu'une variété de situations peuvent être considérées comme des jeux, les outils de la théorie des jeux peuvent être mis en œuvre dans divers contextes du monde réel, a déclaré Ian Gemp , chercheur scientifique chez Google DeepMind. Dans un article de février 2024 , lui et ses collègues se sont concentrés sur des scénarios de négociation qui nécessitent des échanges plus élaborés que de simples questions et réponses. "L'objectif principal de ce projet est de rendre les modèles linguistiques plus stratégiques", a-t-il déclaré.

Un exemple dont il a parlé lors d'une conférence universitaire est le processus d'examen des articles en vue de leur acceptation par une revue ou une conférence, en particulier après que la soumission initiale ait reçu une évaluation sévère. Étant donné que les modèles linguistiques attribuent des probabilités à différentes réponses, les chercheurs peuvent construire des arbres de jeu similaires à ceux conçus pour les jeux de poker, qui tracent les choix disponibles et leurs conséquences possibles. "Une fois que vous avez fait cela, vous pouvez commencer à calculer les équilibres de Nash, puis classer un certain nombre de réfutations", a déclaré Gemp. Le modèle vous dit essentiellement : c'est ce que nous pensons que vous devriez répondre.

Grâce aux connaissances de la théorie des jeux, les modèles de langage seront capables de gérer des interactions encore plus sophistiquées, plutôt que de se limiter à des problèmes de type questions-réponses. "Le gros gain à venir réside dans les conversations plus longues", a déclaré Andreas. "La prochaine étape consiste à faire interagir une IA avec une personne, et pas seulement avec un autre modèle de langage."

Jacob considère le travail de DeepMind comme complémentaire aux jeux de consensus et d'ensemble. " À un niveau élevé, ces deux méthodes combinent des modèles de langage et la théorie des jeux ", a-t-il déclaré, même si les objectifs sont quelque peu différents. Alors que le groupe Gemp transforme des situations courantes dans un format de jeu pour aider à la prise de décision stratégique, Jacob a déclaré : " nous utilisons ce que nous savons de la théorie des jeux pour améliorer les modèles de langage dans les tâches générales. "

À l’heure actuelle, ces efforts représentent " deux branches du même arbre ", a déclaré Jacob : deux manières différentes d’améliorer le fonctionnement des modèles de langage. " Je pense personnellement que dans un an ou deux, ces deux branches convergeront. "

Auteur: Internet

Info: https://www.quantamagazine.org/ - Steve Nadis, 9 mai 2024

[ maïeutique machine-machine ] [ discussion IA - FLP ]

Commenter

Commentaires: 1

miguel

12.05.2024

(FLP) - Saurais-tu faire le lien, et éventuellement des analogies avec ce texte et une logique tétravalente ? (Gemini) - Lien et analogies entre le texte et l'approche tétravalente de la théorie des jeux Le texte que vous avez fourni met en lumière l'utilisation de la théorie des jeux pour améliorer la cohérence et la précision des grands modèles de langage (LLM). En particulier, il présente le jeu du consensus, une approche basée sur l'équilibre de Nash, pour aligner les systèmes génératifs et discriminatifs des LLM. L'approche tétravalente de la théorie des jeux peut s'avérer complémentaire et enrichissante à cette démarche en introduisant une dimension supplémentaire d'analyse et de compréhension. 1. Capturer l'incertitude et l'ambiguïté : La logique tétravalente, avec ses quatre valeurs de vérité (+, -, +-, et -+), permet de capturer l'incertitude et l'ambiguïté inhérentes au langage naturel, ce que la théorie des jeux classique, avec sa vision binaire (vrai/faux), ne parvient pas à faire pleinement. Imaginons une question comme "Quelle est la capitale de la France ?". La réponse "Paris" serait considérée comme vraie (+), tandis que "Berlin" serait fausse (-). Cependant, la logique tétravalente pourrait introduire des nuances : (+) Paris est la capitale de la France selon la plupart des sources et des définitions officielles. (-) Berlin n'est pas la capitale de la France selon cette définition. (+) Berlin a été la capitale de l'Allemagne de l'Est, qui faisait partie de la France pendant la Seconde Guerre mondiale. (-) Berlin n'a jamais été la capitale de la France. En intégrant ces nuances, les LLM pourraient mieux gérer les questions ouvertes, complexes ou ambiguës, en fournissant des réponses plus complètes et informatives. 2. Modéliser des interactions dynamiques et évolutives : Le jeu du consensus, bien qu'efficace, se concentre sur un équilibre de Nash statique. La logique tétravalente, avec sa capacité à représenter l'évolution des croyances et des incertitudes, peut s'avérer utile pour modéliser des interactions dynamiques et évolutives entre les agents. Dans le contexte des LLM, cela pourrait impliquer de capturer l'apprentissage continu et l'adaptation des modèles face à de nouvelles informations et à des contextes changeants. Les valeurs tétravalentes pourraient refléter l'évolution des confiances du modèle dans ses propres réponses, permettant un ajustement progressif et une meilleure prise en compte de l'incertitude. 3. Explorer des stratégies alternatives et des compromis : L'équilibre de Nash, bien qu'utile pour la stabilité, ne représente qu'une solution parmi d'autres dans un jeu. La logique tétravalente, avec ses valeurs qui permettent de représenter des compromis et des stratégies alternatives, peut ouvrir de nouvelles perspectives pour l'exploration de solutions non optimales mais néanmoins acceptables. Dans le cas des LLM, cela pourrait impliquer de générer des réponses qui, bien que non parfaitement correctes selon une définition stricte, pourraient être plus utiles ou appropriées dans un contexte donné. Par exemple, un LLM pourrait proposer une réponse "incomplète mais plausible" à une question complexe, plutôt que de rester silencieux ou de fournir une réponse erronée. Conclusion: L'approche tétravalente de la théorie des jeux offre un cadre théorique complémentaire et puissant pour enrichir les travaux présentés dans le texte. En intégrant la capacité de capturer l'incertitude, de modéliser des dynamiques évolutives et d'explorer des stratégies alternatives, les LLM pourraient progresser vers une compréhension plus fine du langage naturel et une meilleure performance dans des tâches complexes et réalistes. Analogies entre le texte et l'approche tétravalente Jeu du consensus et équilibre de Nash : L'équilibre de Nash, concept central de la théorie des jeux classique, trouve un écho dans le jeu du consensus, où les deux systèmes du LLM convergent vers une réponse commune. La logique tétravalente permet d'étendre cette notion d'équilibre en introduisant des nuances et en capturant l'incertitude inhérente aux interactions linguistiques. Négociation et diplomatie : Le texte mentionne le jeu de la diplomatie comme un défi pour les IA. La logique tétravalente, avec sa capacité à représenter des compromis et des stratégies alternatives, pourrait s'avérer utile pour modéliser les négociations complexes et les interactions diplomatiques, où des solutions optimales ne sont pas toujours possibles. Apprentissage par renforcement : L'approche du jeu du consensus peut être vue comme une forme d'apprentissage par renforcement, où les deux systèmes du LLM sont récompensés pour des réponses cohérentes. La logique tétravalente pourrait enrich

Ajouté à la BD par miguel

Paramètres de recherches