homme-machine

La neuroscientifique polyglotte qui élucide le fonctionnement du cerveau dans le traitement du langage

Le langage est-il au cœur de la pensée ou constitue-t-il un processus distinct ? Depuis 15 ans, la neuroscientifique Ev Fedorenko rassemble des preuves de l’existence d’un réseau langagier dans le cerveau humain et y découvre certaines similitudes avec les modèles de langage.

En compréhension humaine du langage, c'est l'inverse. Tout commence par la réception d'ondes sonores dans l'oreille ou de lumière dans la rétine. Un traitement perceptif rudimentaire de ces informations permet d'en extraire une séquence de mots ou un énoncé. Ensuite, le réseau du langage analyse cet énoncé, y repère des segments familiers et les utilise comme points d'accès à des représentations sémantiques stockées.

Dans les deux cas, le réseau langagier constitue un réservoir de ces correspondances forme-sens. Il s'agit d'un réservoir dynamique que nous mettons à jour tout au long de notre vie. Dès que nous connaissons ce code, nous pouvons l'utiliser avec souplesse pour exprimer une pensée, mais aussi pour décoder le sens d'une phrase prononcée par quelqu'un d'autre.

(image : La neuroscientifique cognitive Ev Fedorenko a identifié dans le cerveau un  " réseau du langage "  qui stocke les correspondances entre les mots et leurs significations.)

Même dans un monde où les grands modèles de langage (GML) et les chatbots d'IA sont monnaie courante, il peut être difficile d'accepter pleinement qu'une écriture fluide puisse provenir d'une machine dépourvue de pensée. En effet, pour beaucoup d'entre nous, trouver les mots justes est une composante essentielle de la pensée, et non le résultat d'un processus distinct.

Et si notre réalité neurobiologique incluait un système se comportant comme un LLM ? Bien avant l’avènement de ChatGPT, la neuroscientifique  Ev Fedorenk a commencé à étudier le fonctionnement du langage dans le cerveau humain adulte. Le système spécialisé qu'elle a décrit, qu'elle nomme  " réseau du langage ", établit les correspondances entre les mots et leurs significations. Ses recherches suggèrent que, d'une certaine manière, nous possédons en nous une version biologique d'un réseau du langage – autrement dit, un processeur de langage inconscient.

" On peut se représenter le réseau du langage comme un ensemble de pointeurs " , explique Fedorenko.  " C'est comme une carte qui indique où, dans le cerveau, trouver différents types de sens. C'est en quelque sorte un analyseur syntaxique perfectionné qui nous aide à assembler les pièces du puzzle ; ensuite, toute la réflexion et les choses intéressantes se produisent en dehors de ses limites. " 

Depuis 15 ans, Fedorenko recueille des preuves biologiques de ce réseau langagier dans son laboratoire du Massachusetts Institute of Technology (MIT). Contrairement à un modèle de langage étendu, le réseau langagier humain n'assemble pas les mots en schémas plausibles de manière automatique ; il agit plutôt comme un traducteur entre les perceptions externes (telles que la parole, l'écriture et le langage des signes) et les représentations du sens encodées dans d'autres parties du cerveau (notamment la mémoire épisodique et la cognition sociale, absentes des modèles de langage étendus). De plus, le réseau langagier humain n'est pas particulièrement volumineux : si tous ses tissus étaient rassemblés, il aurait environ la taille d'une fraise. Mais lorsqu'il est endommagé, les conséquences sont profondes. Une lésion du réseau du langage peut entraîner différentes formes d' aphasie dans laquelle une cognition sophistiquée reste intacte mais piégée dans un cerveau incapable de l'exprimer ou de distinguer les mots entrants des autres.

L’intérêt de Fedorenko pour les langues lui est venu très tôt. Dans les années 1980, alors qu’elle grandissait en Union soviétique, sa mère lui a fait apprendre cinq langues (l’anglais, le français, l’allemand, l’espagnol et le polonais) en plus de sa langue maternelle, le russe. Malgré les privations importantes liées à la chute du communisme dans ce pays – Fedorenko a  " connu plusieurs années de faim ", a-t-elle confié,  était une élève brillante et a obtenu une bourse complète pour l’université Harvard. Là-bas, elle prévoyait initialement d’étudier la linguistique, mais elle a ensuite ajouté une deuxième spécialisation en psychologie.  " Les cours [de linguistique] étaient intéressants, mais j’avais l’impression de résoudre des énigmes, sans vraiment comprendre comment les choses fonctionnent dans la réalité ", a-t-elle expliqué.

Après trois ans d'études supérieures au MIT, Fedorenko a opéré un nouveau virage, cette fois-ci vers les neurosciences. Elle a alors commencé à collaborer avec Nancy Kanwisher qui avait identifié en premier l'aire fusiforme des visages, une région du cerveau spécialisée dans la reconnaissance faciale, qui était au cœur des recherches de Fedorenko. Elle souhaitait trouver un équivalent pour le langage. La tâche s'annonçait ardue.  " À l'époque, on pouvait lire quasiment tout ce qui avait été publié sur le sujet, et je trouvais les fondements assez fragiles " , a déclaré Fedorenko.  " Comme vous pouvez l'imaginer, cette opinion n'a pas été bien accueillie. Mais au bout d'un moment, on a compris que je n'allais pas abandonner. " 

Suite à un flux constant de découvertes, Fedorenko a publié en 2024 une explication exhaustive dans un article paru dans Nature Reviews Neuroscience, elle définit le réseau du langage humain comme un  " type naturel "  : un ensemble intégré de régions, exclusivement spécialisées pour le langage, qui réside dans  " chaque cerveau humain adulte typique " , écrit-elle.

Quanta s'est entretenu avec Fedorenko sur la façon dont le réseau langagier est comparable au système digestif, sur ses connaissances concernant le fonctionnement du décodeur langagier et sur sa conviction quant à l'existence de modules langagiers internes. L'entretien a été condensé et remanié pour plus de clarté.

- Qu'est-ce qu'un réseau linguistique ?

Il existe dans le cerveau adulte un ensemble de zones fondamentales qui fonctionnent comme un système interconnecté permettant de traiter la structure linguistique. Elles stockent les correspondances entre les mots et leurs significations, ainsi que les règles de construction des mots. Apprendre une langue, c'est précisément cela : apprendre ces correspondances et ces règles. Et cela nous permet d'utiliser ce  " code "  avec une incroyable flexibilité.

- On peut ainsi passer d'une pensée à une suite de mots dans n'importe quelle langue connue.

C'est tout à fait exact. Ces systèmes que l'on a découverts [dans le cerveau], notamment le réseau du langage et certaines parties du système visuel, sont comparables à des organes. Par exemple, l'aire fusiforme des visages est un exemple typique : elle peut être définie comme une unité cohérente. Dans le réseau du langage, on distingue principalement trois aires dans le cortex frontal chez la plupart des individus. Ces trois aires se situent du côté du lobe frontal gauche. Il existe également quelques aires qui longent le gyrus temporal moyen, cette large structure qui s'étend sur toute la longueur du lobe temporal. Ce sont les aires centrales.

On peut observer une unité de différentes manières. Par exemple, en plaçant des individus dans un scanner IRMf (imagerie par résonance magnétique fonctionnelle), on peut analyser leurs réponses au langage par rapport à une condition contrôle. Ces régions cérébrales sont toujours associées. Nous avons maintenant examiné environ 1 400 personnes et nous pouvons établir une carte probabiliste qui estime la localisation probable de ces régions. La topographie varie légèrement d'une personne à l'autre, mais les tendances générales sont très cohérentes. Dans ces vastes régions frontales et temporales, chaque individu possède des tissus impliqués de manière fiable dans les calculs linguistiques.

- En quoi cela diffère-t-il d'autres parties de l'anatomie cérébrale connues pour être associées au langage, comme l'aire de Broca ? 

L'aire de Broca est en réalité extrêmement controversée. Je ne la qualifierais pas de région du langage ; c'est une région de planification motrice articulatoire. Actuellement, elle est activée pour planifier les mouvements des muscles de ma bouche afin que je puisse articuler ce que je dis. Mais je pourrais dire n'importe quoi, et elle serait tout aussi activée. C'est donc une région qui reçoit une représentation sonore de la parole et détermine l'ensemble des mouvements moteurs nécessaires à sa production. C'est une région en aval du réseau du langage qui envoie des informations.

- Vous avez également dit que le langage n'est pas synonyme de pensée. Si le réseau du langage ne produit ni la parole ni la pensée, à quoi sert-il alors ?

Le réseau du langage est fondamentalement une interface entre les composantes perceptives et motrices de bas niveau et les représentations de haut niveau, plus abstraites, du sens et du raisonnement.

Nous faisons deux choses avec le langage. Lors de la production du langage, il y a d'abord une pensée encore floue, puis un vocabulaire – non seulement des mots, mais aussi des constructions plus complexes et des règles pour les agencer. On explore ce vocabulaire pour trouver comment exprimer le sens voulu à l'aide d'une séquence structurée de mots. Une fois l'énoncé formé, on fait appel au système moteur pour le prononcer à voix haute, l'écrire ou le signer.

- Jusqu'où s'étend cette spécialisation biologique ? Existe-t-il des cellules individuelles dans le réseau du langage qui répondent à certains énoncés, un peu comme les neurones conceptuels ne répondent qu'à des concepts spécifiques ?

Je soupçonne que ce soit assez diffus au sein du système, car le langage est très contextualisé. Mais oui, il est fort possible que certaines cellules réagissent à des aspects particuliers du langage.

Il existe une prépublication des chercheurs du groupe d'Itzhak Fried à l'UCLA, étudiant des cellules individuelles, ils ont constaté certaines des mêmes propriétés que celles observées par imagerie [IRMf] et enregistrements intracrâniens à l'échelle de la population. Par exemple, les cellules réagissent de manière similaire au langage écrit et au langage oral. C'est au sein du réseau du langage que l'on recherche ces cellules.

- Quels types de schémas ou de caractéristiques sont appris ?

Le système cérébral général de reconnaissance des objets se situe au même niveau d'abstraction que le réseau du langage. Il n'est pas si différent de certaines aires visuelles de haut niveau comme le cortex inférotemporal.Le cerveau stocke des fragments de formes d'objets, ou la zone fusiforme du visage stocke un modèle facial de base. Ces représentations vous aident à reconnaître les objets du monde, mais elles sont déconnectées de notre connaissance du monde.

(Image : Le système linguistique décrit par Fedorenko est  " limité en mémoire " , a-t-elle déclaré, et ne traite que  " des groupes de huit à dix mots maximum ". )

Le célèbre modèle du linguiste Noam Chomsky avec l'exemple d'une phrase absurde –  " Des idées vertes incolores dorment furieusement "  – s'avère ici bien utile. On en devine vaguement le sens, mais on ne peut la relier à rien dans le monde réel, car elle n'a aucun sens. Notre équipe et quelques autres ont démontré que le réseau du langage réagit tout aussi fortement à ces phrases de type  " vert incolore "  qu'à des phrases plausibles qui nous apprennent quelque chose de significatif. Je n'oserais pas le qualifier de  " stupide " , mais il s'agit d'un système assez superficiel.

- On dirait presque que vous insinuez qu'il y a un LLM dans le cerveau de chacun. C'est bien ça ?

En gros, oui. Je pense que le réseau du langage est très similaire, à bien des égards, aux premiers neurones du langage, qui apprennent les régularités de la langue et les relations entre les mots. Ce n'est pas si difficile à imaginer, n'est-ce pas ? Vous avez sûrement déjà rencontré des gens qui parlent avec une fluidité incroyable, et quand on les écoute un moment, on se dit :  " Il n'y a rien de cohérent là-dedans. "  Mais ça sonne tellement fluide. Et ce, sans aucune lésion cérébrale !

- Pourtant, l'idée que les humains produisent le langage avec quelque chose d'abrutissant, comme ChatGPT, semble contre-intuitive.

Oui, même pour moi ! Quand j'ai commencé ces recherches, je pensais que le langage était un élément fondamental de la pensée de haut niveau. On avait cette idée que les humains étaient peut-être particulièrement doués pour représenter et extraire des structures hiérarchiques, qui sont bien sûr une caractéristique essentielle du langage, mais aussi présentes dans d'autres domaines comme les mathématiques, la musique et certains aspects de la cognition sociale. Je m'attendais donc à ce que certaines parties de ce réseau soient des processeurs hiérarchiques très généraux. Or, les données empiriques montrent que ce n'est pas le cas. Dès 2011, il était clair que toutes les parties du système étaient très spécialisées pour le langage. En tant que scientifique, on adapte ses convictions et on fait avec.

Auteur: Internet

Info: Quanta magazine, Jean Pavlus, 5 décembre 2025

[ neurophysiologie sémantique ] [ associations poétiques ]

 

Commentaires: 0

Ajouté à la BD par Le sous-projectionniste

Commentaires

No comments