Citation
Catégorie
Tag – étiquette
Auteur
Info



nb max de mots
nb min de mots
trier par
Dictionnaire analogique intriqué pour extraits. Recherche mots ou phrases tous azimuts. Aussi outil de précision sémantique et de réflexion communautaire. Voir la rubrique mode d'emploi. Jetez un oeil à la colonne "chaînes". ATTENTION, faire une REINITIALISATION après  une recherche complexe. Et utilisez le nuage de corrélats !!!!..... Lire la suite >>
Résultat(s): 24
Temps de recherche: 0.0379s

tour d'horizon de l'IA

Intelligence artificielle symbolique et machine learning, l’essor des technologies disruptives

Définie par le parlement Européen comme la " reproduction des comportements liés aux humains, tels que le raisonnement, la planification et la créativité ", l’intelligence artificielle s’initie de façon spectaculaire dans nos vies. Théorisée au milieu des années 50, plusieurs approches technologiques coexistent telles que l’approche machine learning dite statistique basée sur l’apprentissage automatique, ou l’approche symbolique basée sur l’interprétation et la manipulation des symboles. Mais comment se différencient ces approches ? Et pour quels usages ?

L’intelligence artificielle, une histoire ancienne

Entre les années 1948 et 1966, l’Intelligence Artificielle a connu un essor rapide, stimulé par des financements importants du gouvernement américain pour des projets de recherche sur l’IA, notamment en linguistique. Des progrès significatifs ont été réalisés dans la résolution de problèmes de logique symbolique, mais la capacité de l’IA à traiter des données complexes et imprécises était encore limitée.

A la fin des années 70, plus précisément lors du deuxième “été de l’IA” entre 1978 et 1987,  l’IA connaît un regain d’intérêt. Les chercheurs ont commencé à explorer de nouvelles approches, notamment l’utilisation de réseaux neuronaux et de systèmes experts. Les réseaux neuronaux sont des modèles de traitement de l’information inspirés par le fonctionnement du cerveau humain, tandis que les systèmes experts sont des programmes informatiques qui simulent l’expertise humaine dans un domaine spécifique.

Il faudra attendre la fin des années 90 pour voir un renouveau de ces domaines scientifiques, stimulé par des avancées majeures dans le traitement des données et les progrès de l’apprentissage automatique. C’est d’ailleurs dans cette période qu’une IA, Deepblue, gagne contre le champion mondial Garry Kasparov aux échecs.$

Au cours des dernières années, cette technologie a connu une croissance exponentielle, stimulée par des progrès majeurs dans le deep learning, la robotique ou la compréhension du langage naturel (NLU). L’IA est maintenant utilisée dans un large éventail de domaines, notamment la médecine, l’agriculture, l’industrie et les services. C’est aujourd’hui un moteur clé de l’innovation et de la transformation de notre monde, accentué par l’essor des generative AIs. 

Parmi ces innovations, deux grandes approches en intelligence artificielle sont aujourd’hui utilisées : 

1 - Le Machine Learning : qui est un système d’apprentissage automatique basé sur l’exploitation de données, imitant un réseau neuronal

2 - L’IA Symbolique : qui se base sur un système d’exploitation de " symboles ”, ce qui inspire des technologies comme le “système expert” basé sur une suite de règles par exemple.

Mais comment fonctionnent ces deux approches et quels sont leurs avantages et leurs inconvénients ? Quels sont leurs champs d’application ? Peuvent-ils être complémentaires ?

Le machine learning

Le Machine Learning est le courant le plus populaire ces dernières années, il est notamment à l’origine de ChatGPT ou bien MidJourney, qui font beaucoup parler d’eux ces derniers temps. Le Machine Learning (ML) est une famille de méthodes d’apprentissage automatique qui permet aux ordinateurs d’apprendre à partir de données, sans être explicitement programmés. En utilisant des algorithmes, le ML permet aux ordinateurs de comprendre les structures et les relations dans les données et de les utiliser pour prendre des décisions.

Le ML consiste à entraîner des modèles informatiques sur de vastes ensembles de données. Ces modèles sont des algorithmes auto apprenant se basant sur des échantillons de données, tout en déterminant des schémas et des relations/corrélations entre elles. Le processus d’entraînement consiste à fournir à l’algorithme des données étiquetées, c’est-à-dire des données qui ont déjà été classifiées ou étiquetées pour leur attribuer une signification. L’algorithme apprend ensuite à associer les caractéristiques des données étiquetées aux catégories définies en amont. Il existe cependant une approche non-supervisée qui consiste à découvrir ce que sont les étiquettes elles-mêmes (ex: tâche de clustering).

Traditionnellement, le machine learning se divise en 4 sous-catégories : 

Apprentissage supervisé : 

Les ensembles de données sont étiquetés, ce qui permet à l’algorithme de trouver des corrélations et des relations entre les caractéristiques des données et les étiquettes correspondantes. 

Apprentissage non supervisé : 

Les ensembles de données ne sont pas étiquetés et l’algorithme doit découvrir les étiquettes par lui-même. 

Apprentissage semi-supervisé : 

L’algorithme utilise un mélange de données étiquetées et non étiquetées pour l’entraînement.

Apprentissage par renforcement : 

L’algorithme apprend à prendre des décisions en interagissant avec son environnement. Il reçoit des récompenses ou des pénalités pour chaque action, ce qui lui permet d’ajuster sa stratégie pour maximiser sa récompense globale.

Un exemple d’application du Machine Learning est la reconnaissance d’images. Des modèles d’apprentissages profonds sont entraînés sur des millions d’images pour apprendre à reconnaître des objets, des personnes, des animaux, etc. Un autre exemple est la prédiction de la demande dans le commerce de détail, où des modèles sont entraînés sur des données de ventes passées pour prédire les ventes futures.

Quels sont les avantages ? 

Étant entraîné sur un vaste corpus de données, le ML permet de prédire des tendances en fonction de données.  

- Le machine learning offre la capacité de détecter des tendances and des modèles dans les données qui peuvent échapper à l’observation humaine.

- Une fois configuré, le machine learning peut fonctionner de manière autonome, sans l’intervention humaine. Par exemple, dans le domaine de la cybersécurité, il peut surveiller en permanence le trafic réseau pour identifier les anomalies.

- Les résultats obtenus par le machine learning peuvent s’affiner et s’améliorer avec le temps, car l’algorithme peut apprendre de nouvelles informations et ajuster ses prédictions en conséquence.

- Le machine learning est capable de traiter des volumes massifs et variés de données, même dans des environnements dynamiques et complexes.

L’intelligence artificielle symbolique

L’IA symbolique est une autre approche de l’intelligence artificielle. Elle utilise des symboles and des règles de traitement de l’information pour effectuer des tâches. Les symboles peuvent être des concepts, des objets, des relations, etc. Les règles peuvent être des règles de déduction, des règles de production, des règles d’inférence…etc.

Un exemple d’application de l’IA symbolique est le système expert. Un système expert est un programme informatique qui utilise des règles de déduction pour résoudre des problèmes dans un domaine spécifique, comme le diagnostic médical ou l’aide à la décision en entreprise. Un autre exemple est la traduction automatique basée sur des règles, les règles de grammaire et de syntaxe sont utilisées pour traduire un texte d’une langue à une autre.

Quelques exemples d’usages de l’IA symbolique :

La traduction

L’IA symbolique a été utilisée pour développer des systèmes de traduction automatique basés sur des règles. Ces systèmes utilisent des règles de grammaire et de syntaxe pour convertir un texte d’une langue à une autre. Par exemple, le système SYSTRAN, développé dans les années 1960, est un des premiers systèmes de traduction automatique basé sur des règles. Ce type de système se distingue des approches basées sur le Machine Learning, comme Google Translate, qui utilisent des modèles statistiques pour apprendre à traduire des textes à partir de corpus bilingues.

Le raisonnement logique

L’IA symbolique est également utilisée pour développer des systèmes capables de raisonnement logique, en exploitant des règles et des connaissances déclaratives pour résoudre des problèmes complexes. Par exemple, les systèmes d’aide à la décision basés sur des règles peuvent être utilisés dans des domaines tels que la finance, l’assurance ou la logistique, pour aider les entreprises à prendre des décisions éclairées. Un exemple concret est le système MYCIN, développé dans les années 1970 pour aider les médecins à diagnostiquer des infections bactériennes et à prescrire des antibiotiques adaptés.

L’analyse de textes

L’IA symbolique peut être utilisée pour l’analyse de textes, en exploitant des règles et des connaissances linguistiques pour extraire des informations pertinentes à partir de documents. Par exemple, les systèmes d’extraction d’information basés sur des règles peuvent être utilisés pour identifier des entités nommées (noms de personnes, d’organisations, de lieux, etc.) et des relations entre ces entités dans des textes. Un exemple d’application est l’analyse et la catégorisation des messages entrants pour les entreprises, cœur de métier de Golem.ai avec la solution InboxCare.

Les avantages de l’IA symbolique 

L’IA symbolique est une approche qui utilise des symboles, et parfois des " règles” basées sur des connaissances, qui comporte plusieurs avantages :

- Explicablilité : Les décisions prises par les systèmes d’IA symbolique sont explicites et peuvent être expliquées en fonction des règles logiques et des connaissances déclaratives utilisées par le système. Cette transparence peut être essentielle dans des applications critiques, comme la médecine ou la défense.

- Frugalité : Contrairement au Machine Learning, l’IA symbolique ne nécessite pas d’entraînement, ce qui la rend moins gourmande en énergie à la fois lors de la conception et de l’utilisation.

- Adaptabilité : Les systèmes d’IA symbolique peuvent être facilement adaptés à de nouveaux domaines en ajoutant de nouvelles règles logiques et connaissances déclaratives à leurs bases de connaissances existantes, leurs permettant de s’adapter rapidement à de nouvelles situations.

L’intelligence artificielle hybride ou le neuro-symbolique 

Les systèmes hybrides combinent les avantages de l’IA symbolique et du Machine Learning en utilisant une approche mixte. Dans ce type de système, l’IA symbolique est utilisée pour représenter les connaissances et les règles logiques dans un domaine spécifique. Les techniques de Machine Learning sont ensuite utilisées pour améliorer les performances de l’IA symbolique en utilisant des ensembles de données pour apprendre des modèles de décision plus précis et plus flexibles. Mais nous pouvons également voir d’autres articulations comme la taxonomie de Kautz par exemple.

L’IA symbolique est souvent utilisée dans des domaines où il est important de comprendre et de contrôler la façon dont les décisions sont prises, comme la médecine, la finance ou la sécurité. En revanche, le Machine Learning est souvent utilisé pour des tâches de classification ou de prédiction à grande échelle, telles que la reconnaissance de voix ou d’image, ou pour détecter des modèles dans des données massives.

En combinant les deux approches, les systèmes hybrides peuvent bénéficier de la compréhensibilité et de la fiabilité de l’IA symbolique, tout en utilisant la flexibilité et la capacité de traitement massif de données du Machine Learning pour améliorer la performance des décisions. Ces systèmes hybrides peuvent également offrir une plus grande précision et un temps de réponse plus rapide que l’une ou l’autre approche utilisée seule.

Que retenir de ces deux approches ?

L’Intelligence Artificielle est en constante évolution et transforme de nombreux secteurs d’activité. Les deux approches principales de l’IA ont leurs avantages et inconvénients et peuvent être complémentaires. Il est donc crucial pour les entreprises de comprendre ces technologies pour rester compétitives. 

Cependant, les implications éthiques et sociales de l’IA doivent également être prises en compte. Les décisions des algorithmes peuvent avoir un impact sur la vie des personnes, leur travail, leurs droits et leurs libertés. Il est donc essentiel de mettre en place des normes éthiques et des réglementations pour garantir que l’IA soit au service de l’humanité. Les entreprises et les gouvernements doivent travailler ensemble pour développer des IA responsables, transparentes et équitables qui servent les intérêts de tous. En travaillant ensemble, nous pouvons assurer que l’IA soit une force positive pour l’humanité dans les années à venir. 



 

Auteur: Merindol Hector

Info: https://golem.ai/en/blog/technologie/ia-symbolique-machinelearning-nlp - 4 avril 2023

[ dualité ]

 

Commentaires: 0

Ajouté à la BD par Le sous-projectionniste

homme-machine

Comment l'IA comprend des trucs que personne ne lui lui a appris

Les chercheurs peinent à comprendre comment les modèles d'Intelligence artificielle, formés pour perroquetter les textes sur Internet, peuvent effectuer des tâches avancées comme coder, jouer à des jeux ou essayer de rompre un mariage.

Personne ne sait encore comment ChatGPT et ses cousins ​​de l'intelligence artificielle vont transformer le monde, en partie parce que personne ne sait vraiment ce qui se passe à l'intérieur. Certaines des capacités de ces systèmes vont bien au-delà de ce pour quoi ils ont été formés, et même leurs inventeurs ne savent pas pourquoi. Un nombre croissant de tests suggèrent que ces systèmes d'IA développent des modèles internes du monde réel, tout comme notre propre cerveau le fait, bien que la technique des machines soit différente.

"Tout ce que nous voulons faire avec ces systèmes pour les rendre meilleurs ou plus sûrs ou quelque chose comme ça me semble une chose ridicule à demander  si nous ne comprenons pas comment ils fonctionnent", déclare Ellie Pavlick de l'Université Brown,  un des chercheurs travaillant à combler ce vide explicatif.

À un certain niveau, elle et ses collègues comprennent parfaitement le GPT (abréviation de generative pretrained transformer) et d'autres grands modèles de langage, ou LLM. Des modèles qui reposent sur un système d'apprentissage automatique appelé réseau de neurones. De tels réseaux ont une structure vaguement calquée sur les neurones connectés du cerveau humain. Le code de ces programmes est relativement simple et ne remplit que quelques pages. Il met en place un algorithme d'autocorrection, qui choisit le mot le plus susceptible de compléter un passage sur la base d'une analyse statistique laborieuse de centaines de gigaoctets de texte Internet. D'autres algorithmes auto-apprenants supplémentaire garantissant que le système présente ses résultats sous forme de dialogue. En ce sens, il ne fait que régurgiter ce qu'il a appris, c'est un "perroquet stochastique", selon les mots d'Emily Bender, linguiste à l'Université de Washington. Mais les LLM ont également réussi à réussir l'examen pour devenir avocat, à expliquer le boson de Higgs en pentamètre iambique (forme de poésie contrainte) ou à tenter de rompre le mariage d'un utilisateurs. Peu de gens s'attendaient à ce qu'un algorithme d'autocorrection assez simple acquière des capacités aussi larges.

Le fait que GPT et d'autres systèmes d'IA effectuent des tâches pour lesquelles ils n'ont pas été formés, leur donnant des "capacités émergentes", a surpris même les chercheurs qui étaient généralement sceptiques quant au battage médiatique sur les LLM. "Je ne sais pas comment ils le font ou s'ils pourraient le faire plus généralement comme le font les humains, mais tout ça mes au défi mes pensées sur le sujet", déclare Melanie Mitchell, chercheuse en IA à l'Institut Santa Fe.

"C'est certainement bien plus qu'un perroquet stochastique, qui auto-construit sans aucun doute une certaine représentation du monde, bien que je ne pense pas que ce soit  vraiment de la façon dont les humains construisent un modèle de monde interne", déclare Yoshua Bengio, chercheur en intelligence artificielle à l'université de Montréal.

Lors d'une conférence à l'Université de New York en mars, le philosophe Raphaël Millière de l'Université de Columbia a offert un autre exemple à couper le souffle de ce que les LLM peuvent faire. Les modèles avaient déjà démontré leur capacité à écrire du code informatique, ce qui est impressionnant mais pas trop surprenant car il y a tellement de code à imiter sur Internet. Millière est allé plus loin en montrant que le GPT peut aussi réaliser du code. Le philosophe a tapé un programme pour calculer le 83e nombre de la suite de Fibonacci. "Il s'agit d'un raisonnement en plusieurs étapes d'un très haut niveau", explique-t-il. Et le robot a réussi. Cependant, lorsque Millière a demandé directement le 83e nombre de Fibonacci, GPT s'est trompé, ce qui suggère que le système ne se contentait pas de répéter ce qui se disait sur l'internet. Ce qui suggère que le système ne se contente pas de répéter ce qui se dit sur Internet, mais qu'il effectue ses propres calculs pour parvenir à la bonne réponse.

Bien qu'un LLM tourne sur un ordinateur, il n'en n'est pas un lui-même. Il lui manque des éléments de calcul essentiels, comme sa propre mémoire vive. Reconnaissant tacitement que GPT seul ne devrait pas être capable d'exécuter du code, son inventeur, la société technologique OpenAI, a depuis introduit un plug-in spécialisé -  outil que ChatGPT peut utiliser pour répondre à une requête - qui remédie à cela. Mais ce plug-in n'a pas été utilisé dans la démonstration de Millière. Au lieu de cela, ce dernier suppose plutôt que la machine a improvisé une mémoire en exploitant ses mécanismes d'interprétation des mots en fonction de leur contexte -  situation similaire à la façon dont la nature réaffecte des capacités existantes à de nouvelles fonctions.

Cette capacité impromptue démontre que les LLM développent une complexité interne qui va bien au-delà d'une analyse statistique superficielle. Les chercheurs constatent que ces systèmes semblent parvenir à une véritable compréhension de ce qu'ils ont appris. Dans une étude présentée la semaine dernière à la Conférence internationale sur les représentations de l'apprentissage (ICLR), le doctorant Kenneth Li de l'Université de Harvard et ses collègues chercheurs en intelligence artificielle, Aspen K. Hopkins du Massachusetts Institute of Technology, David Bau de la Northeastern University et Fernanda Viégas , Hanspeter Pfister et Martin Wattenberg, tous à Harvard, ont créé leur propre copie plus petite du réseau neuronal GPT afin de pouvoir étudier son fonctionnement interne. Ils l'ont entraîné sur des millions de matchs du jeu de société Othello en alimentant de longues séquences de mouvements sous forme de texte. Leur modèle est devenu un joueur presque parfait.

Pour étudier comment le réseau de neurones encodait les informations, ils ont adopté une technique que Bengio et Guillaume Alain, également de l'Université de Montréal, ont imaginée en 2016. Ils ont créé un réseau de "sondes" miniatures pour analyser le réseau principal couche par couche. Li compare cette approche aux méthodes des neurosciences. "C'est comme lorsque nous plaçons une sonde électrique dans le cerveau humain", dit-il. Dans le cas de l'IA, la sonde a montré que son "activité neuronale" correspondait à la représentation d'un plateau de jeu d'Othello, bien que sous une forme alambiquée. Pour confirmer ce résultat, les chercheurs ont inversé la sonde afin d'implanter des informations dans le réseau, par exemple en remplaçant l'un des marqueurs noirs du jeu par un marqueur blanc. "En fait, nous piratons le cerveau de ces modèles de langage", explique Li. Le réseau a ajusté ses mouvements en conséquence. Les chercheurs ont conclu qu'il jouait à Othello à peu près comme un humain : en gardant un plateau de jeu dans son "esprit" et en utilisant ce modèle pour évaluer les mouvements. Li pense que le système apprend cette compétence parce qu'il s'agit de la description la plus simple et efficace de ses données pour l'apprentissage. "Si l'on vous donne un grand nombre de scripts de jeu, essayer de comprendre la règle qui les sous-tend est le meilleur moyen de les comprimer", ajoute-t-il.

Cette capacité à déduire la structure du monde extérieur ne se limite pas à de simples mouvements de jeu ; il apparaît également dans le dialogue. Belinda Li (aucun lien avec Kenneth Li), Maxwell Nye et Jacob Andreas, tous au MIT, ont étudié des réseaux qui jouaient à un jeu d'aventure textuel. Ils ont introduit des phrases telles que "La clé est dans le coeur du trésor", suivies de "Tu prends la clé". À l'aide d'une sonde, ils ont constaté que les réseaux encodaient en eux-mêmes des variables correspondant à "coeur" et "Tu", chacune avec la propriété de posséder ou non une clé, et mettaient à jour ces variables phrase par phrase. Le système n'a aucun moyen indépendant de savoir ce qu'est une boîte ou une clé, mais il a acquis les concepts dont il avait besoin pour cette tâche."

"Une représentation de cette situation est donc enfouie dans le modèle", explique Belinda Li.

Les chercheurs s'émerveillent de voir à quel point les LLM sont capables d'apprendre du texte. Par exemple, Pavlick et sa doctorante d'alors, l'étudiante Roma Patel, ont découvert que ces réseaux absorbent les descriptions de couleur du texte Internet et construisent des représentations internes de la couleur. Lorsqu'ils voient le mot "rouge", ils le traitent non seulement comme un symbole abstrait, mais comme un concept qui a une certaine relation avec le marron, le cramoisi, le fuchsia, la rouille, etc. Démontrer cela fut quelque peu délicat. Au lieu d'insérer une sonde dans un réseau, les chercheurs ont étudié sa réponse à une série d'invites textuelles. Pour vérifier si le systhème ne faisait pas simplement écho à des relations de couleur tirées de références en ligne, ils ont essayé de le désorienter en lui disant que le rouge est en fait du vert - comme dans la vieille expérience de pensée philosophique où le rouge d'une personne correspond au vert d'une autre. Plutôt que répéter une réponse incorrecte, les évaluations de couleur du système ont évolué de manière appropriée afin de maintenir les relations correctes.

Reprenant l'idée que pour remplir sa fonction d'autocorrection, le système recherche la logique sous-jacente de ses données d'apprentissage, le chercheur en apprentissage automatique Sébastien Bubeck de Microsoft Research suggère que plus la gamme de données est large, plus les règles du système faire émerger sont générales. "Peut-être que nous nous constatons un tel bond en avant parce que nous avons atteint une diversité de données suffisamment importante pour que le seul principe sous-jacent à toutes ces données qui demeure est que des êtres intelligents les ont produites... Ainsi la seule façon pour le modèle d'expliquer toutes ces données est de devenir intelligent lui-même".

En plus d'extraire le sens sous-jacent du langage, les LLM sont capables d'apprendre en temps réel. Dans le domaine de l'IA, le terme "apprentissage" est généralement réservé au processus informatique intensif dans lequel les développeurs exposent le réseau neuronal à des gigaoctets de données et ajustent petit à petit ses connexions internes. Lorsque vous tapez une requête dans ChatGPT, le réseau devrait être en quelque sorte figé et, contrairement à l'homme, ne devrait pas continuer à apprendre. Il fut donc surprenant de constater que les LLM apprennent effectivement à partir des invites de leurs utilisateurs, une capacité connue sous le nom d'"apprentissage en contexte". "Il s'agit d'un type d'apprentissage différent dont on ne soupçonnait pas l'existence auparavant", explique Ben Goertzel, fondateur de la société d'IA SingularityNET.

Un exemple de la façon dont un LLM apprend vient de la façon dont les humains interagissent avec les chatbots tels que ChatGPT. Vous pouvez donner au système des exemples de la façon dont vous voulez qu'il réponde, et il obéira. Ses sorties sont déterminées par les derniers milliers de mots qu'il a vus. Ce qu'il fait, étant donné ces mots, est prescrit par ses connexions internes fixes - mais la séquence de mots offre néanmoins une certaine adaptabilité. Certaines personnes utilisent le jailbreak à des fins sommaires, mais d'autres l'utilisent pour obtenir des réponses plus créatives. "Il répondra mieux aux questions scientifiques, je dirais, si vous posez directement la question, sans invite spéciale de jailbreak, explique William Hahn, codirecteur du laboratoire de perception de la machine et de robotique cognitive à la Florida Atlantic University. "Sans il sera un meilleur universitaire." (Comme son nom l'indique une invite jailbreak -prison cassée-, invite à  moins délimiter-verrouiller les fonctions de recherche et donc à les ouvrir, avec les risques que ça implique) .

Un autre type d'apprentissage en contexte se produit via l'incitation à la "chaîne de pensée", ce qui signifie qu'on demande au réseau d'épeler chaque étape de son raisonnement - manière de faire qui permet de mieux résoudre les problèmes de logique ou d'arithmétique en passant par plusieurs étapes. (Ce qui rend l'exemple de Millière si surprenant  puisque le réseau a trouvé le nombre de Fibonacci sans un tel encadrement.)

En 2022, une équipe de Google Research et de l'École polytechnique fédérale de Zurich - Johannes von Oswald, Eyvind Niklasson, Ettore Randazzo, João Sacramento, Alexander Mordvintsev, Andrey Zhmoginov et Max Vladymyrov - a montré que l'apprentissage en contexte suit la même procédure de calcul de base que l'apprentissage standard, connue sous le nom de descente de gradient". 

Cette procédure n'était pas programmée ; le système l'a découvert sans aide. "C'est probablement une compétence acquise", déclare Blaise Agüera y Arcas, vice-président de Google Research. De fait il pense que les LLM peuvent avoir d'autres capacités latentes que personne n'a encore découvertes. "Chaque fois que nous testons une nouvelle capacité que nous pouvons quantifier, nous la trouvons", dit-il.

Bien que les LLM aient suffisamment d'angles morts et autres défauts pour ne pas être qualifiés d'intelligence générale artificielle, ou AGI - terme désignant une machine qui atteint l'ingéniosité du cerveau animal - ces capacités émergentes suggèrent à certains chercheurs que les entreprises technologiques sont plus proches de l'AGI que même les optimistes ne l'avaient deviné. "Ce sont des preuves indirectes que nous en sommes probablement pas si loin", a déclaré Goertzel en mars lors d'une conférence sur le deep learning à la Florida Atlantic University. Les plug-ins d'OpenAI ont donné à ChatGPT une architecture modulaire un peu comme celle du cerveau humain. "La combinaison de GPT-4 [la dernière version du LLM qui alimente ChatGPT] avec divers plug-ins pourrait être une voie vers une spécialisation des fonctions semblable à celle de l'homme", déclare Anna Ivanova, chercheuse au M.I.T.

Dans le même temps, les chercheurs s'inquiètent de voir leur capacité à étudier ces systèmes s'amenuiser. OpenAI n'a pas divulgué les détails de la conception et de l'entraînement de GPT-4, en partie du à la concurrence avec Google et d'autres entreprises, sans parler des autres pays. "Il y aura probablement moins de recherche ouverte de la part de l'industrie, et les choses seront plus cloisonnées et organisées autour de la construction de produits", déclare Dan Roberts, physicien théoricien au M.I.T., qui applique les techniques de sa profession à la compréhension de l'IA.

Ce manque de transparence ne nuit pas seulement aux chercheurs, il entrave également les efforts qui visent à comprendre les répercussions sociales de l'adoption précipitée de la technologie de l'IA. "La transparence de ces modèles est la chose la plus importante pour garantir la sécurité", affirme M. Mitchell.

Auteur: Musser Georges

Info: https://www.scientificamerican.com,  11 mai 2023. *algorithme d'optimisation utilisé dans l'apprentissage automatique et les problèmes d'optimisation. Il vise à minimiser ou à maximiser une fonction en ajustant ses paramètres de manière itérative. L'algorithme part des valeurs initiales des paramètres et calcule le gradient de la fonction au point actuel. Les paramètres sont ensuite mis à jour dans la direction du gradient négatif (pour la minimisation) ou positif (pour la maximisation), multiplié par un taux d'apprentissage. Ce processus est répété jusqu'à ce qu'un critère d'arrêt soit rempli. La descente de gradient est largement utilisée dans la formation des modèles d'apprentissage automatique pour trouver les valeurs optimales des paramètres qui minimisent la différence entre les résultats prédits et les résultats réels. Trad et adaptation Mg

[ singularité technologique ] [ versatilité sémantique ]

 

Commentaires: 0

Ajouté à la BD par miguel

homme-animal

Le processus d’encéphalisation
Parmi l’ensemble des animaux non-humains, les dauphins sont dotés du quotient encéphalique le plus élevé au monde, soit à peu près celui de l’être humain.
A ce petit jeu, d’ailleurs, le cachalot nous dépasse tous largement !
Une telle augmentation du volume cérébral, bien au-delà des simples besoins de la motricité ou de la sensorialité, est qualifiée "d’encéphalisation structurelle".
Ce phénomène n’est pas rare. Il semble que dès le Jurassique, des dinosauriens bipèdes de taille moyenne aient commencé à augmenter de manière encore timide leurs capacités cérébrales.
Au Tertiaire, les ancêtres des éléphants et des cétacés se sont lancés à leur tour dans la course au gros cerveau mais ce n’est qu’au Quaternaire, il y a de cela de trois à six millions d’années, que certains primates hominoïdes développent une boîte crânienne de type néoténique à fontanelles non suturées durant les premiers temps de l’enfance, afin de permettre une croissance ultérieure de l’un des cerveaux les plus puissants du monde.
Ce processus d’encéphalisation apparaît également chez certains oiseaux – corvidés, psittacidés – à peu près vers la même époque. A chaque fois, bien sûr, des comportements très élaborés sont toujours associés à un accroissement spectaculaire du tissu cérébral.
Une si curieuse convergence de formes, la survenance simultanée ou successive de tous ces "grands fronts", pose bien évidemment question en termes darwiniens.
Le ptérodactyle, la mouche, le colibri, la chauve-souris ont des ailes pour voler, la truite, l’ichtyosaure, le marsouin ont un corps fait pour nager, le grillon fouisseur et la taupe ont des pattes en forme de pelles pour creuser, etc.
Mais à quoi rime dès lors un vaste crâne et à quelle fonction est-il dévolu ?
Essentiellement à comprendre le monde et ceux qui le composent, en ce compris les membres de sa propre espèce, avec lesquels il faut sans cesse gérer une relation équilibrée.
Même les gros cerveaux les plus solitaires vivent en fait en société : tigres, baleines bleues, panthères, orangs-outans gardent des liens étroits, bien que distants ou différés, avec leur fratrie et leurs partenaires.
L’intelligence est à coup sûr l’arme suprême contre les aléas du monde, ses mutations incessantes, puisqu’elle permet notamment de gérer un groupe comme un seul corps mais aussi de pénétrer les lois subtiles qui sont à la base du mouvement des choses.
En augmentant d’un degré supérieur ces facultés par le moyen du langage, lequel conserve le savoir des générations mortes, l’homme et le cétacé ont sans doute franchi un nouveau pas vers une plus grande adaptabilité.
Le problème de l’humain, mais nous n’y reviendrons pas davantage, c’est qu’il ne s’est servi jusqu’à ce jour que d’une partie de son intelligence et qu’il se laisse ensevelir vivants dans ses propres déchets, et avec lui les reste du monde, pour n’avoir pas su contrôler sa propre reproduction ni la saine gestion de son environnement.
Intelligents ou non ? (Le point de vue de Ken Levasseur)
Dans un courrier CFN posté en avril 2003 relatif à l’utilisation de dauphins militaires en Irak, Ken Levasseur, l’un des meilleurs spécialistes actuels de cette question, a tenu à faire le point à propos de l’intelligence réelle ou supposée de ces mammifères marins. Aux questions que lui avait adressées un étudiant sur ce thème, Ken répond ici de manière définitive, sur la base de de son expérience et de ses intimes convictions.
Eu égard aux remarquables recherches menées par Ken depuis des années et au fait qu’il a travaillé longtemps aux côtés du professeur Louis Hermann, son point de vue n’est évidemment pas négligeable ni ses opinions sans fondements. On lira d’ailleurs sur ce site même son article en anglais relatif au cerveau du dauphin
Inutile de dire que le gestionnaire de ce site partage totalement le point de vue de Ken Levasseur, dont les travaux l’inspirent depuis de nombreuses années, au même titre que ceux de Wade Doak ou de Jim Nollman : tous ont en commun d’affirmer que les dauphins ne sont pas des animaux au sens strict mais bien l’équivalent marin de l’humanité terrestre.
Q- A quel niveau d’intelligence réelle les dauphins se situent-ils ? A celui du chien ? Du grand singe ? D’un être humain ?
R- Mon meilleur pronostic est qu’un jour prochain, nous pourrons prouver que la plupart des espèces de cétacés disposent d’une intelligence équivalente ou supérieure à celle d’un humain adulte.
Q- Quelles sont les preuves nous permettant d’affirmer que les dauphins sont intelligents ?
R- Il a été démontré depuis longtemps que les dauphins peuvent développer des capacités cognitives qui équivalent ou excèdent les possibilités mentales de l’être humain. Aujourd’hui, nous sommes à même de définir exactement en quoi consiste l’intelligence humaine. Une fois que nous parviendrons à définir l’intelligence d’une manière strictement objective et valable pour toutes les autres espèces, on permettra enfin aux cétacés de faire la preuve de la leur.
Q- Quelles preuves avons-nous que les dauphins ne sont PAS intelligents ?
R- Il n’y a aucune preuve scientifique qui tendrait à prouver que l’intelligence du dauphin serait située entre celle du chien et celle du chimpanzé (comme l’affirment les delphinariums et la marine américaine) .
Q- Est-ce que les dauphins possèdent un langage propre ?
R- La définition d’une "langue", comme celle de l’intelligence, repose sur des bases subjectives définies pour et par les humains. Une fois que nous pourrons disposer d’une définition plus objective de ce qu’est un langage, et que les recherches sur la communication des dauphins ne seront plus "classifiée" par les américains, il est fort probable que les chercheurs puissent enfin conduire les recherches appropriées et qu’ils reconnaissent que les dauphins disposent de langages naturels.
Q- Est-ce leur capacité à apprendre et à exécuter des tours complexes qui les rend plus intelligents ou non ?
R- La capacité du dauphin à apprendre à exécuter des tours complexes est surtout une indication de l’existence d’un niveau élevé des capacités mentales, interprétées comme synonymes d’une intelligence élevée.
Q- Jusqu’à quel point ont été menées les recherches sur les dauphins et leur intelligence ? Que savent vraiment les scientifiques à leur propos ?
R- La US Navy a "classifié" ses recherches sur les dauphins en 1967, au moment où l’acousticien Wayne Batteau est parvenu à développer des moyens efficaces pour communiquer avec des dauphins dressés. La communication et l’intelligence des dauphins constituent donc désormais des données militaires secrètes, qui ne peuvent plus être divulguées au public.
Q- Est-ce que les dauphins disposent d’un langage propre ? Y a t-il des recherches qui le prouvent ?
R- Vladimir Markov et V. M. Ostrovskaya en ont fourni la preuve en 1990 en utilisant la "théorie des jeux" pour analyser la communication des dauphins dans un environnement contrôlé et à l’aide de moyens efficaces. Il est donc très probable que les dauphins aient une langue naturelle.
Q- Les capacités tout à fait spéciales des dauphins en matière d’écholocation ont-elles quelque chose à voir avec leurs modes de communication?
R- A mon sens, les recherches futures fourniront la preuve que le langage naturel des cétacés est fondé sur les propriétés physiques de l’écholocation, de la même manière que les langues humaines se basent sur des bruits et des représentations.
Q- Quelle est VOTRE opinion à propos de l’intelligence des dauphins ?
R- Pendant deux ans, j’ai vécu à quinze pieds (1 Pied : 30 cm 48) d’un dauphin et à trente-cinq pieds d’un autre. À mon avis, les dauphins possèdent une intelligence équivalente à celle d’un être humain. Ils devraient bénéficier dès lors de droits similaires aux Droits de l’Homme et se trouver protégé des incursions humaines dans son cadre de vie.
Q- La ressemblance entre les humains et les dauphins a-t-elle quelque chose à voir avec leur intelligence commune ?
R- Les dauphins sont très éloignés des humains à de nombreux niveaux mais les ressemblances que nous pouvons noter sont en effet fondées sur le fait que les dauphins possèdent des capacités mentales plus élevées (que la plupart des autres animaux) et sont à ce titre interprétés en tant qu’intelligence de type humain.
Q- La grande taille de leur cerveau, relativement à celle de leur corps, est-elle un indicateur de leur haute intelligence ?
R- Le volume absolu d’un cerveau ne constitue pas une preuve d’intelligence élevée. Le coefficient encéphalique (taille du cerveau par rapport à la taille de corps) n’en est pas une non plus. Néanmoins, on pourrait dire que la taille absolue du cerveau d’une espèce donnée par rapport au volume global du corps constitue un bon indicateur pour comparer les capacités mentales de différentes espèces. Souvenons-nous par ailleurs que les cétacés ne pèsent rien dans l’eau, puisqu’ils flottent et qu’une grande part de leur masse se compose simplement de la graisse. Cette masse de graisse ne devrait pas être incluse dans l’équation entre le poids du cerveau et le poids du corps car cette graisse n’est traversée par aucun nerf ni muscle et n’a donc aucune relation de cause à effet avec le volume du cerveau.
Q- Est-ce que la capacité des dauphins à traiter des clics écholocatoires à une vitesse inouïe nous laisse-t-elle à penser qu’ils sont extrêmement intelligents ?
R- On a pu montrer que les dauphins disposaient, et de loin, des cerveaux les plus rapides du monde. Lorsqu’ils les observent, les humains leur semblent se mouvoir avec une extrême lenteur en émettant des sons extrêmement bas. Un cerveau rapide ne peut forcément disposer que de capacités mentales très avancées.
Q- Pensez-vous des scientifiques comprendront un jour complètement les dauphins?
R- Est-ce que nos scientifiques comprennent bien les humains? Si tout va bien, à l’avenir, les dauphins devraient être compris comme les humains se comprennent entre eux.
Q- Le fait que les dauphins possèdent une signature sifflée est-elle une preuve de l’existence de leur langage ?
R- Non. Cette notion de signature sifflée est actuellement mal comprise et son existence même est sujette à caution.
Q- Les dauphins font plein de choses très intelligentes et nous ressemblent fort. Est-ce parce qu’ils sont vraiment intelligents ou simplement très attractifs ?
R- La réponse à votre question est une question d’expérience et d’opinion. Ce n’est une question qui appelle une réponse scientifique, chacun a son opinion personnelle sur ce point.
Q- Pouvons-nous vraiment émettre des conclusions au sujet de l’intelligence des dauphins, alors que nous savons si peu à leur propos et qu’ils vivent dans un environnement si différent du nôtre ?
R- Jusqu’à présent, ce genre de difficultés n’a jamais arrêté personne. Chacun tire ses propres conclusions. Les scientifiques ne se prononcent que sur la base de ce qu’ils savent vrai en fonction des données expérimentales qu’ils recueillent.
Q- Est-ce que nous pourrons-nous jamais communiquer avec les dauphins ou même converser avec eux ?
R- Oui, si tout va bien, et ce seront des conversations d’adulte à adulte, rien de moins.
II. DAUPHIN : CERVEAU ET MONDE MENTAL
"Parmi l’ensemble des animaux non-humains, les dauphins disposent d’un cerveau de grande taille très bien développé, dont le coefficient encéphalique, le volume du néocortex, les zones dites silencieuses (non motrices et non sensorielles) et d’autres indices d’intelligence sont extrêmement proches de ceux du cerveau humain" déclare d’emblée le chercheur russe Vladimir Markov.
Lorsque l’on compare le cerveau des cétacés avec celui des grands primates et de l’homme en particulier, on constate en effet de nombreux points communs mais également des différences importantes :
– Le poids moyen d’un cerveau de Tursiops est de 1587 grammes.
Son coefficient encéphalique est de l’ordre de 5.0, soit à peu près le double de celui de n’importe quel singe. Chez les cachalots et les orques, ce même coefficient est de cinq fois supérieur à celui de l’homme.
– Les circonvolutions du cortex cervical sont plus nombreuses que celles d’un être humain. L’indice de "pliure" (index of folding) est ainsi de 2.86 pour l’homme et de 4.47 pour un cerveau de dauphin de taille globalement similaire.
Selon Sam Ridgway, chercheur "réductionniste de la vieille école", l’épaisseur de ce même cortex est de 2.9 mm en moyenne chez l’homme et de 1.60 à 1.76 mm chez le dauphin. En conséquence, continue-t-il, on peut conclure que le volume moyen du cortex delphinien (560cc) se situe à peu près à 80 % du volume cortical humain. Ce calcul est évidemment contestable puisqu’il ne tient pas compte de l’organisation très particulière du cerveau delphinien, mieux intégré, plus homogène et moins segmenté en zones historiquement distinctes que le nôtre.
Le fait que les cétacés possèdent la plus large surface corticale et le plus haut indice de circonvolution cérébral au monde joue également, comme on s’en doute, un rôle majeur dans le développement de leurs capacités cérébrales.
D’autres scientifiques, décidément troublés par le coefficient cérébral du dauphin, tentent aujourd’hui de prouver qu’un tel développement n’aurait pas d’autre usage que d’assurer l’écholocation. Voici ce que leur répond le neurologue H. Jerison : "La chauve-souris dispose à peu de choses près des mêmes capacités que le dauphin en matière d’écholocation, mais son cerveau est gros comme une noisette. L’outillage écholocatoire en tant que tel ne pèse en effet pas lourd. En revanche, le TRAITEMENT de cette même information "sonar" par les zones associatives prolongeant les zones auditives, voilà qui pourrait expliquer le formidable développement de cette masse cérébrale. Les poissons et tous les autres êtres vivants qui vivent dans l’océan, cétacés mis à part, se passent très bien d’un gros cerveau pour survivre et même le plus gros d’entre eux, le requin-baleine, ne dépasse pas l’intelligence d’une souris…"
La croissance du cerveau d’un cétacé est plus rapide et la maturité est atteinte plus rapidement que chez l’homme.
Un delphineau de trois ans se comporte, toutes proportions gardées, comme un enfant humain de huit ans. Cette caractéristique apparemment "primitive" est paradoxalement contredite par une enfance extrêmement longue, toute dévolue à l’apprentissage. Trente années chez le cachalot, vingt chez l’homme, douze à quinze chez le dauphin et environ cinq ans chez le chimpanzé.
Les temps de vie sont du même ordre : 200 ans en moyenne chez la baleine franche, 100 ans chez le cachalot, 80 chez l’orque, 78 ans chez l’homme, 60 chez le dauphin, sous réserve bien sûr des variations favorables ou défavorables de l’environnement.
Pourquoi un gros cerveau ?
"Nous devons nous souvenir que le monde mental du dauphin est élaboré par l’un des systèmes de traitement de l’information parmi les plus vastes qui ait jamais existé parmi les mammifères" déclare H.Jerison, insistant sur le fait que "développer un gros cerveau est extrêmement coûteux en énergie et en oxygène. Cet investissement a donc une raison d’être en terme d’évolution darwinienne. Nous devons dès lors considérer la manière dont ces masses importantes de tissu cérébral ont été investies dans le contrôle du comportement et de l’expérimentation du monde, ceci en comparaison avec l’usage qu’en font les petites masses cérébrales".
Un cerveau est par essence un organe chargé de traiter l’information en provenance du monde extérieur.
Les grands cerveaux exécutent cette tâche en tant qu’ensemble élaborés de systèmes de traitement, alors que le cerveau de la grenouille ou de l’insecte, par exemple, se contente de modules moins nombreux, dont la finesse d’analyse est comparativement plus simple.
Cela ne nous empêche pas cependant de retrouver des structures neuronales étonnamment semblables d’un animal à l’autre : lorsqu’un promeneur tombe nez à nez avec un crotale, c’est le même plancher sub-thalamique dévolue à la peur qui s’allume chez l’une et l’autre des ces créatures. Quant un chien ou un humain se voient soulagés de leurs angoisses par le même produit tranquillisant, ce sont évidemment les mêmes neuromédiateurs qui agissent sur les mêmes récepteurs neuronaux qui sont la cause du phénomène.
A un très haut niveau de cette hiérarchie, le traitement en question prend la forme d’une représentation ou d’un modèle du monde (Craik, 1943, 1967, Jerison, 1973) et l’activité neuronale se concentre en "paquets d’informations" (chunks) à propos du temps et de l’espace et à propos d’objets, en ce compris les autres individus et soi-même.
" Puisque le modèle du monde qui est construit de la sorte" insiste H.Jerison, "se trouve fondé sur des variables physiquement définies issues directement du monde externe et puisque ces informations sont traitées par des cellules nerveuses et des réseaux neuronaux structurellement semblables chez tous les mammifères supérieurs, les modèles du monde construits par différents individus d’une même espèce ou même chez des individus d’espèces différentes, ont de bonnes chances d’être également similaires".
Et à tout le moins compréhensibles l’un pour l’autre.

Auteur: Internet

Info: http://www.dauphinlibre.be/dauphins-cerveau-intelligence-et-conscience-exotiques

[ comparaisons ]

 

Commentaires: 0

source du vivant

Comment la vie (et la mort) naissent du désordre

On a longtemps pensé que la vie obéissait à ses propres règles. Mais alors que des systèmes simples montrent des signes de comportement réaliste, les scientifiques se demandent si cette apparente complexité n'est pas simplement une conséquence de la thermodynamique.

Quelle est la différence entre physique et biologie ? Prenez une balle de golf et un boulet de canon et déposez-les au sommet de la Tour de Pise. Les lois de la physique vous permettent de prédire leurs trajectoires avec autant de précision que vous pourriez le souhaiter.

Maintenant, refaites la même expérience, mais remplacez le boulet de canon par un pigeon.

Les systèmes biologiques ne défient pas les lois physiques, bien sûr, mais celles-ci ne semblent pas non plus pouvoir les prédire. En revanche, ils sont orientés vers un objectif : survivre et se reproduire. On peut dire qu’ils ont un but – ou ce que les philosophes appellent traditionnellement une téléologie – qui guide leur comportement.De la même manière, la physique nous permet désormais de prédire, à partir de l’état de l’univers un milliardième de seconde après le Big Bang, ce à quoi il ressemble aujourd’hui. Mais personne n’imagine que l’apparition des premières cellules primitives sur Terre a conduit de manière prévisible à la race humaine. Il semble qu'il n'y ait pas de loi qui dicte le cours de l’évolution.

La téléologie et la contingence historique de la biologie, a déclaré le biologiste évolutionniste Ernst Mayr, la rendent uniques qui parmi les sciences. Ces deux caractéristiques découlent peut-être du seul principe directeur général de la biologie : l’évolution. Qui dépend du hasard et des aléas, mais la sélection naturelle lui donne l’apparence d’une intention et d’un but. Les animaux ne sont pas attirés vers l’eau par une attraction magnétique, mais par leur instinct, leur intention de survivre. Les jambes servent, entre autres, à nous emmener à l'eau.

Mayr affirmait que ces caractéristiques rendent la biologie exceptionnelle – une loi en soi. Mais les développements récents en physique hors équilibre, en science des systèmes complexes et en théorie de l’information remettent en question cette vision.

Une fois que nous considérons les êtres vivants comme des agents effectuant un calcul – collectant et stockant des informations sur un environnement imprévisible – les capacités et les considérations telles que la réplication, l’adaptation, l’action, le but et la signification peuvent être comprises comme découlant non pas d’une improvisation évolutive, mais comme d'inévitables corollaires aux lois physiques. En d’autres termes, il semble y avoir une sorte de physique selon laquelle les choses font des choses et évoluent pour faire des choses. Le sens et l’intention – considérés comme les caractéristiques déterminantes des systèmes vivants –  émergeant naturellement à travers les lois de la thermodynamique et de la mécanique statistique.

En novembre dernier, des physiciens, des mathématiciens et des informaticiens se sont réunis avec des biologistes évolutionnistes et moléculaires pour discuter – et parfois débattre – de ces idées lors d'un atelier à l'Institut de Santa Fe au Nouveau-Mexique, la Mecque de la science des " systèmes complexes ". La question était  : à quel point la biologie est-elle spéciale (ou non) ?

Il n’est guère surprenant qu’il n’y ait pas eu de consensus. Mais un message qui est ressorti très clairement est que, s’il existe une sorte de physique derrière la téléologie et l’action biologiques, elle a quelque chose à voir avec le même concept qui semble s’être installé au cœur de la physique fondamentale elle-même : l’information.

Désordre et démons

La première tentative d’introduire l’information et l’intention dans les lois de la thermodynamique a eu lieu au milieu du XIXe siècle, lorsque la mécanique statistique fut inventée par le scientifique écossais James Clerk Maxwell. Maxwell a montré comment l’introduction de ces deux ingrédients semblait permettre de réaliser des choses que la thermodynamique proclamait impossibles.

Maxwell avait déjà montré comment les relations mathématiques prévisibles et fiables entre les propriétés d’un gaz – pression, volume et température – pouvaient être dérivées des mouvements aléatoires et inconnaissables d’innombrables molécules secouées frénétiquement par l’énergie thermique. En d’autres termes, la thermodynamique – la nouvelle science du flux de chaleur, qui unissait les propriétés de la matière à grande échelle comme la pression et la température – était le résultat de la mécanique statistique à l’échelle microscopique des molécules et des atomes.

Selon la thermodynamique, la capacité à extraire du travail utile des ressources énergétiques de l’univers est en constante diminution. Les poches d’énergie diminuent, les concentrations de chaleur s’amenuisent. Dans tout processus physique, une certaine énergie est inévitablement dissipée sous forme de chaleur inutile, perdue au milieu des mouvements aléatoires des molécules. Ce caractère aléatoire est assimilé à la quantité thermodynamique appelée entropie – une mesure du désordre – qui est toujours croissante. C'est la deuxième loi de la thermodynamique. Finalement, l’univers en entier sera réduit à un fouillis uniforme et ennuyeux : un état d’équilibre, dans lequel l’entropie est maximisée et où rien de significatif ne se reproduira plus jamais.

Sommes-nous vraiment condamnés à ce triste sort ? Maxwell était réticent à y croire et, en 1867, il entreprit, comme il le disait, de " faire un trou " dans la deuxième loi. Son objectif était de commencer avec une boîte emplie de molécules désordonnée qui s'agitaient de manière aléatoire, puis de séparer les molécules rapides des molécules lentes, réduisant ainsi l'entropie.

Imaginez une petite créature – le physicien William Thomson l'appellera plus tard, au grand désarroi de Maxwell, un démon – qui peut voir chaque molécule individuelle dans la boîte. Le démon sépare la boîte en deux compartiments, avec une porte coulissante dans le mur entre eux. Chaque fois qu'il aperçoit une molécule particulièrement énergétique s'approcher de la porte depuis le compartiment de droite, il l'ouvre pour la laisser passer. Et chaque fois qu’une molécule lente et "froide " s’approche par la gauche, il la laisse passer également. Enfin, il dispose d'un compartiment de gaz froid à droite et de gaz chaud à gauche : un réservoir de chaleur sur lequel on peut puiser pour effectuer des travaux, compenser, etc.

Cela n'est possible que pour deux raisons. Premièrement, le démon possède plus d’informations que nous : il peut voir toutes les molécules individuellement, plutôt que de se limiter à des moyennes statistiques. Et deuxièmement, il a une intention : un plan pour séparer le chaud du froid. En exploitant intentionnellement ses connaissances, il peut défier les lois de la thermodynamique.

Du moins, semble-t-il. Il a fallu cent ans pour comprendre pourquoi le démon de Maxwell ne peut en fait vaincre la deuxième loi et éviter le glissement inexorable vers un équilibre mortel et universel. Et la raison montre qu’il existe un lien profond entre la thermodynamique et le traitement de l’information – ou en d’autres termes, le calcul. Le physicien germano-américain Rolf Landauer a montré que même si le démon peut recueillir des informations et déplacer la porte (sans friction) sans coût d'énergie, il reste quand même quelque chose à payer. Parce qu'il ne peut pas y avoir une mémoire illimitée de chaque mouvement moléculaire, il faut occasionnellement effacer sa mémoire – oublier ce qu'il a vu et recommencer – avant de pouvoir continuer à récolter de l'énergie. Cet acte d’effacement d’informations a un prix inévitable : il dissipe de l’énergie, et donc augmente l’entropie. Tous les gains réalisés contre la deuxième loi grâce au travail astucieux du démon sont annulés par cette " limite de Landauer " : le coût fini de l'effacement de l'information (ou plus généralement, de la conversion de l'information d'une forme vers une autre).

Les organismes vivants ressemblent plutôt au démon de Maxwell. Alors qu’un récipient empli de produits chimiques en interactions finira par dépenser son énergie pour tomber dans une stase et un équilibre ennuyeux, les systèmes vivants évitent collectivement l’état d’équilibre du non vivant depuis l’origine de la vie il y a environ trois milliards et demi d’années. Ils récupèrent l’énergie de leur environnement pour maintenir cet état de non-équilibre, et ils le font avec " une intention ". Même les simples bactéries se déplacent avec " intention " vers les sources de chaleur et de nutrition. Dans son livre de 1944, Qu'est-ce que la vie ?, le physicien Erwin Schrödinger l’a exprimé en disant que les organismes vivants se nourrissent d’ " entropie négative ".

Ils y parviennent, explique Schrödinger, en capturant et en stockant des informations. Certaines de ces informations sont codées dans leurs gènes et transmises d’une génération à l’autre : un ensemble d’instructions pour continuer de récolter l’entropie négative. Schrödinger ne savait pas où les informations sont conservées ni comment elles sont codées, mais son intuition selon laquelle elles sont écrites dans ce qu'il nomme un " cristal apériodique* " a inspiré Francis Crick, lui-même physicien de formation, et James Watson lorsqu'en 1953, ils pensèrent comment l'information génétique peut être codée dans la structure moléculaire de la molécule d'ADN.

Un génome est donc, au moins en partie, un enregistrement des connaissances utiles qui ont permis aux ancêtres d'un organisme – jusqu'à un passé lointain – de survivre sur notre planète. Selon David Wolpert, mathématicien et physicien de l'Institut de Santa Fe qui a organisé le récent atelier, et son collègue Artemy Kolchinsky, le point clé est que les organismes bien adaptés sont corrélés à cet environnement. Si une bactérie nage de manière fiable vers la gauche ou la droite lorsqu’il y a une source de nourriture dans cette direction, elle est mieux adaptée et s’épanouira davantage qu’une bactérie qui nage dans des directions aléatoires et ne trouve donc la nourriture que par hasard. Une corrélation entre l’état de l’organisme et celui de son environnement implique qu’ils partagent des informations en commun. Wolpert et Kolchinsky affirment que c'est cette information qui aide l'organisme à rester hors équilibre, car, comme le démon de Maxwell, il peut adapter son comportement pour extraire le travail des fluctuations de son environnement. S’il n’acquérait pas cette information, l’organisme retrouverait progressivement cet équilibre : il mourrait.

Vue sous cet angle, la vie peut être considérée comme un calcul visant à optimiser le stockage et l’utilisation d’informations significatives. Et la vie s’avère extrêmement efficace dans ce domaine. La résolution par Landauer de l'énigme du démon de Maxwell a fixé une limite inférieure absolue à la quantité d'énergie requise par un calcul à mémoire finie : à savoir le coût énergétique de l'oubli. Les meilleurs ordinateurs d’aujourd’hui gaspillent bien plus d’énergie que cela, consommant et dissipant généralement plus d’un million de fois plus. Mais selon Wolpert, " une estimation très prudente de l’efficacité thermodynamique du calcul total effectué par une cellule est qu’elle n’est qu’environ 10 fois supérieure à la limite de Landauer ".

L’implication, dit-il, est que " la sélection naturelle s’est énormément préoccupée de minimiser le coût thermodynamique du calcul. Elle fera tout son possible pour réduire la quantité totale de calculs qu’une cellule doit effectuer. En d’autres termes, la biologie (à l’exception peut-être de nous-mêmes) semble prendre grand soin de ne pas trop réfléchir au problème de la survie. Cette question des coûts et des avantages de l'informatique tout au long de la vie, a-t-il déclaré, a été largement négligée en biologie jusqu'à présent.

Darwinisme inanimé

Ainsi, les organismes vivants peuvent être considérés comme des entités qui s’adaptent à leur environnement en utilisant l’information pour récolter de l’énergie et échapper à l’équilibre. On pensera ce qu'on veut de cette phrase mais on remarquera qu'elle ne dit rien sur les gènes et l’évolution, que Mayr, comme de nombreux biologistes, pensait subordonnés à une intention et des but biologiques.

Jusqu’où cette image peut-elle alors nous mener ? Les gènes perfectionnés par la sélection naturelle sont sans aucun doute au cœur de la biologie. Mais se pourrait-il que l’évolution par sélection naturelle ne soit en elle-même qu’un cas particulier d’un impératif plus général vers une fonction et un but apparent qui existe dans l’univers purement physique ? ça commence à ressembler à cela.

L’adaptation a longtemps été considérée comme la marque de l’évolution darwinienne. Mais Jeremy England, du Massachusetts Institute of Technology, a soutenu que l'adaptation à l'environnement peut se produire même dans des systèmes non vivants complexes.

L’adaptation a ici une signification plus spécifique que l’image darwinienne habituelle d’un organisme bien équipé pour survivre. L’une des difficultés de la vision darwinienne est qu’il n’existe aucun moyen de définir un organisme bien adapté sauf rétrospectivement. Les " plus aptes " sont ceux qui se sont révélés meilleurs en termes de survie et de réplication, mais on ne peut pas prédire ce qu'implique les conditions physiques. Les baleines et le plancton sont bien adaptés à la vie marine, mais d’une manière qui n’a que peu de relations évidentes entre eux.

La définition anglaise de " l'adaptabilité " est plus proche de celle de Schrödinger, et même de celle de Maxwell : une entité bien adaptée peut absorber efficacement l'énergie d'un environnement imprévisible et fluctuant. C'est comme la personne qui garde l'équilibre sur un navire qui tangue alors que d'autres tombent parce qu'elle sait mieux s'adapter aux fluctuations du pont. En utilisant les concepts et les méthodes de la mécanique statistique dans un contexte de non-équilibre, England et ses  collègues soutiennent que ces systèmes bien adaptés sont ceux qui absorbent et dissipent l'énergie de l'environnement, générant ainsi de l'entropie.

Les systèmes complexes ont tendance à s’installer dans ces états bien adaptés avec une facilité surprenante, a déclaré England :  "La matière qui fluctue thermiquement se modèle souvent spontanément via des formes qui absorbent bien le travail d'un environnement qui varie dans le temps."

Rien dans ce processus n’implique une adaptation progressive à l’environnement par le biais des mécanismes darwiniens de réplication, de mutation et d’héritage des traits. Il n'y a aucune réplication du tout. "Ce qui est passionnant, c'est que cela signifie que lorsque nous donnons un aperçu physique des origines de certaines des structures d'apparence adaptée que nous voyons, il n'est pas nécessaire qu'elles aient eu des parents au sens biologique habituel", a déclaré England. " On peut expliquer l'adaptation évolutive à l'aide de la thermodynamique, même dans des cas intrigants où il n'y a pas d'auto-réplicateurs et où la logique darwinienne s'effondre " - à condition que le système en question soit suffisamment complexe, polyvalent et sensible pour répondre aux fluctuations de son environnement.

Mais il n’y a pas non plus de conflit entre l’adaptation physique et l’adaptation darwinienne. En fait, cette dernière peut être considérée comme un cas particulier de la première. Si la réplication est présente, alors la sélection naturelle devient la voie par laquelle les systèmes acquièrent la capacité d'absorber le travail – l'entropie négative de Schrödinger – de l'environnement. L’auto-réplication est en fait un mécanisme particulièrement efficace pour stabiliser des systèmes complexes, et il n’est donc pas surprenant que ce soit ce que la biologie utilise. Mais dans le monde non vivant où la réplication ne se produit généralement pas, les structures dissipatives bien adaptées ont tendance à être très organisées, comme les ondulations de sable et les dunes cristallisant à partir de la danse aléatoire du sable soufflé par le vent. Vue sous cet angle, l’évolution darwinienne peut être considérée comme un exemple spécifique d’un principe physique plus général régissant les systèmes hors équilibre.

Machines à prévoir

Cette image de structures complexes s’adaptant à un environnement fluctuant nous permet également de déduire quelque chose sur la manière dont ces structures stockent l’information. En bref, tant que de telles structures – qu’elles soient vivantes ou non – sont obligées d’utiliser efficacement l’énergie disponible, elles sont susceptibles de devenir des " machines à prédiction ".

C'est presque une caractéristique déterminante de la vie que les systèmes biologiques changent d'état en réponse à un signal moteur provenant de l'environnement. Quelque chose se passe ; vous répondez. Les plantes poussent vers la lumière ; elles produisent des toxines en réponse aux agents pathogènes. Ces signaux environnementaux sont généralement imprévisibles, mais les systèmes vivants apprennent de leur expérience, stockant des informations sur leur environnement et les utilisant pour orienter leurs comportements futurs. (Photo : les gènes, sur cette image, donnent simplement les éléments essentiels de base à usage général.)

La prédiction n’est cependant pas facultative. Selon les travaux de Susanne Still de l'Université d'Hawaï, de Gavin Crooks, anciennement du Lawrence Berkeley National Laboratory en Californie, et de leurs collègues, prédire l'avenir semble essentiel pour tout système économe en énergie dans un environnement aléatoire et fluctuant.

Still et ses collègues démontrent que le stockage d'informations sur le passé qui n'ont aucune valeur prédictive pour l'avenir a un coût thermodynamique. Pour être le plus efficace possible, un système doit être sélectif. S'il se souvient sans discernement de tout ce qui s'est passé, il subit un coût énergétique important. En revanche, s'il ne prend pas la peine de stocker la moindre information sur son environnement, il aura constamment du mal à faire face aux imprévus. "Une machine thermodynamiquement optimale doit équilibrer la mémoire et la prédiction en minimisant sa nostalgie - les informations inutiles sur le passé", a déclaré un co-auteur, David Sivak, maintenant à l'Université Simon Fraser à Burnaby, en Colombie-Britannique. En bref, il doit être capable de récolter des informations significatives, celles qui sont susceptibles d'être utiles à la survie future.

On pourrait s’attendre à ce que la sélection naturelle favorise les organismes qui utilisent efficacement l’énergie. Mais même les dispositifs biomoléculaires individuels, comme les pompes et les moteurs de nos cellules, devraient, d’une manière ou d’une autre, tirer les leçons du passé pour anticiper l’avenir. Pour acquérir leur remarquable efficacité, dit Still, ces appareils doivent " implicitement construire des représentations concises du monde qu’ils ont rencontré jusqu’à présent,  afin de pouvoir anticiper ce qui va arriver ".

Thermodynamique de la mort

Même si certaines de ces caractéristiques fondamentales de traitement de l'information des systèmes vivants existent déjà, en l'absence d'évolution ou de réplication, grâce à cette thermodynamique de non-équilibre, on pourrait imaginer que des caractéristiques plus complexes - l'utilisation d'outils, par exemple, ou la coopération sociale - doivent émerger à un certain moment de l'évolution.

Eh bien, ne comptez pas là-dessus. Ces comportements, généralement considérés comme du domaine exclusif de la niche évolutive très avancée qui comprend les primates et les oiseaux, peuvent être imités dans un modèle simple constitué d'un système de particules en interaction. L’astuce est que le système est guidé par une contrainte : il agit de manière à maximiser la quantité d’entropie (dans ce cas, définie en termes de différents chemins possibles que les particules pourraient emprunter) qu’il génère dans un laps de temps donné. 

La maximisation de l’entropie a longtemps été considérée comme une caractéristique des systèmes hors équilibre. Mais le dispositif-système de ce modèle obéit à une règle qui lui permet de maximiser l’entropie sur une fenêtre de temps fixe qui s’étend dans le futur. En d’autres termes, il fait preuve de prévoyance. En effet, le modèle examine tous les chemins que les particules pourraient emprunter et les oblige à adopter le chemin qui produit la plus grande entropie. En gros, c’est généralement la voie qui laisse ouverte le plus grand nombre d’options quant à la manière dont les particules pourraient se déplacer ultérieurement. (mis en italique par Mg)

On pourrait dire que le système de particules éprouve une sorte de besoin de préserver sa liberté d’action future, et que ce besoin guide son comportement à tout moment. Les chercheurs qui ont développé le modèle – Alexander Wissner-Gross de l’Université Harvard et Cameron Freer, mathématicien du Massachusetts Institute of Technology – appellent cela une " force entropique causale ". Dans les simulations informatiques de configurations de particules en forme de disque se déplaçant dans des contextes particuliers, cette force crée des résultats qui suggèrent étrangement l’intelligence.

Dans un cas, un grand disque a pu " utiliser " un petit disque pour extraire un deuxième petit disque d’un tube étroit – un processus qui ressemblait à l’utilisation d’un outil. Libérer le disque augmentait l'entropie du système. Dans un autre exemple, deux disques placés dans des compartiments séparés ont synchronisé leur comportement pour tirer un disque plus grand vers le bas afin qu'ils puissent interagir avec lui, donnant ainsi l'apparence d'une coopération sociale.

Bien entendu, ces simples agents en interaction bénéficient d’un aperçu de l’avenir. La vie, en règle générale, ne le fait pas. Alors, dans quelle mesure est-ce pertinent pour la biologie ? Ce n’est pas clair, même si Wissner-Gross a déclaré qu’il travaillait actuellement à établir " un mécanisme pratique et biologiquement plausible pour les forces entropiques causales ". En attendant, il pense que cette approche pourrait avoir des retombées pratiques, offrant un raccourci vers l’intelligence artificielle. " Je prédis qu'un moyen plus rapide d'y parvenir sera de d'abord  identifier un tel comportement, puis de travailler à rebours à partir des principes et contraintes physiques, plutôt que de travailler vers l'avant à partir de techniques de calcul ou de prédiction particulières ", a-t-il déclaré. En d’autres termes, trouvez d’abord un système qui fait ce que vous voulez qu’il fasse, puis déterminez comment il le fait.

Le vieillissement est également traditionnellement considéré comme un trait dicté par l’évolution. Les organismes ont une durée de vie qui crée des opportunités de reproduction, raconte l'histoire, sans inhiber les perspectives de survie de la progéniture du fait que les parents restent trop longtemps et se disputent les ressources. Cela semble sûrement faire partie de l'histoire, mais Hildegard Meyer-Ortmanns, physicienne à l'Université Jacobs de Brême, en Allemagne, pense qu'en fin de compte, le vieillissement est un processus physique et non biologique, régi par la thermodynamique de l'information.

Ce n’est certainement pas simplement une question d’usure. "La plupart des matériaux souples dont nous sommes constitués sont renouvelés avant d'avoir la chance de vieillir", a déclaré Meyer-Ortmanns. Mais ce processus de renouvellement n'est pas parfait. La thermodynamique de la copie de l'information dicte qu'il doit y avoir un compromis entre précision et énergie. Un organisme dispose d’une réserve d’énergie limitée, donc les erreurs s’accumulent nécessairement avec le temps. L’organisme doit alors dépenser une énergie de plus en plus importante pour réparer ces erreurs. Le processus de renouvellement finit par produire des copies trop défectueuses pour fonctionner correctement ; la mort suit.

Les preuves empiriques semblent le confirmer. On sait depuis longtemps que les cellules humaines en culture semblent capables de se répliquer au maximum 40 à 60 fois (appelée limite de Hayflick ) avant de s'arrêter et de devenir sénescentes. Et des observations récentes sur la longévité humaine suggèrent qu'il pourrait y avoir une raison fondamentale pour laquelle les humains ne peuvent pas survivre bien au-delà de 100 ans .

Il y a un corollaire à ce besoin apparent de systèmes prédictifs, organisés et économes en énergie qui apparaissent dans un environnement fluctuant hors d’équilibre. Nous sommes nous-mêmes système de ce genre, comme le sont tous nos ancêtres jusqu’à la première cellule primitive. Et la thermodynamique hors équilibre semble nous dire que c’est exactement ce que fait la matière dans de telles circonstances. En d’autres termes, l’apparition de la vie sur une planète comme la Terre primitive, imprégnée de sources d’énergie telles que la lumière du soleil et l’activité volcanique qui maintiennent les choses hors d’équilibre, ressemble moins à un événement extrêmement improbable, comme de nombreux scientifiques l’ont supposé, mais pratiquement inévitable. En 2006, Eric Smith et feu Harold Morowitz de l'Institut de Santa Fe ont soutenu que la thermodynamique des systèmes hors équilibre rend l'émergence de systèmes organisés et complexes beaucoup plus probable sur une Terre prébiotique loin de l'équilibre qu'elle ne le serait si les ingrédients chimiques bruts étaient juste assis dans un " petit étang chaud " (comme le disait Charles Darwin) en mijotant doucement.

Au cours de la décennie qui a suivi la première apparition de cet argument, les chercheurs ont ajouté des détails et des perspectives à l’analyse. Les qualités qu’Ernst Mayr considérait comme essentielles à la biologie – le sens et l’intention – pourraient émerger comme une conséquence naturelle des statistiques et de la thermodynamique. Et ces propriétés générales peuvent à leur tour conduire naturellement à quelque chose comme la vie.

Dans le même temps, les astronomes nous ont montré combien de mondes existent – ​​selon certaines estimations, ils se chiffrent en milliards – en orbite autour d’autres étoiles de notre galaxie. Beaucoup sont loin de l’équilibre, et au moins quelques-uns ressemblent à la Terre. Et les mêmes règles s’appliquent sûrement là aussi. 



 

Auteur: Internet

Info: https://www.quantamagazine.org/how-life-and-death-spring-from-disorder-20170126/ Philip Ball, 26 janv 2017 (Trad Mg) *Un cristal apériodique est comme un papier peint dont le motif se répète à grande échelle, mais avec des irrégularités subtiles. Il n'y a pas de motif exact qui se répète à l'infini, mais il y a tout de même un ordre caché dans sa structure.  Comme le Penrose tiling: un pavage avec des formes de pentagones et de losanges,  qui vient des artisans du Moyen-Orient.  Pavage qui ne peut  se répéter à l'infini de manière classique, mais possède un ordre à grande échelle. On peut le diviser en grandes "tuiles" qui se répètent, mais les motifs à l'intérieur de ces tuiles ne s'alignent pas parfaitement. C'est un exemple de cristal apériodique appelé "quasi-cristal". En bref c'est un ordre à grande échelle, mais sans motif répétitif exact à l'infini. (Voir aussi le lien avec les dialogues avec l'ange "aller vers le nouveau")

[ au coeur de FLP ] [ bayésianisme ] [ mémoire tétravalente ] [ épigénétique ] [ filtrage mémoriel ] [ constante ouverture ] [ citation s'appliquant à ce logiciel ] [ expérience accumulée ] [ prospective ouverte ] [ curiosité moteur ] [ scalabilité ] [ entendement ] [ théorie du tout ] [ astrobiologie ] [ orthogenèse ] [ biophysique ] [ philosophie ] [ méta-moteur ] [ principe intégré ]

 

Commentaires: 0

Ajouté à la BD par miguel