Les fils de la pensée

captage de l'attention

Sur le plan linguistique, précisons aussi, à la suite de C. Schnedecker (2011 : 23-45) faisant un état de la question, que la saillance peut se manifester de façon formelle ou "ontologique" (par le biais de la disposition typographique ou de la prosodie, par exemple), mais aussi de façon cognitive, faisant alors appel à la sémantique lexicale ou à des facteurs discursifs (ces derniers étant hétérogènes).

Cette linguiste distingue en outre une saillance perspectivale, reposant sur un principe d’iconicité puisque l’ordre des unités grammaticales (et donc l’agencement syntaxique) est supposé refléter ce qui est au premier plan, ou encore à l’arrière-plan, dans la perspective du locuteur. Notons que la notion de saillance ontologique est associée à des acceptions différentes selon les auteurs : parfois relative au statut conféré aux mots eux-mêmes (comme le rappelle C. Schnedecker), elle est par ailleurs considérée comme liée aux éléments extralinguistiques ou, du moins, aux concepts qui leur sont associés, et tel est notamment le cas chez H.-J. Schmid (2007 : 120).

Concernant la saillance liée aux paramètres syntaxiques, on rappellera l’importance des travaux de R. W. Langacker (1991 : 301). L’auteur mentionne l’importance des rôles syntaxiques, soulignant que le sujet, tout d’abord, puis l’objet, sont perçus comme les éléments les plus saillants (focal participants) d’une proposition. Ils sont en outre à relier à l’opposition trajector/ landmark (1987 : 217) traduisant le fait qu’un élément est mis davantage en avant (rôle de trajector) que les autres. Ces notion de trajector et landmark peuvent en outre être perçues comme des manifestations spécifiques de ce que L. Talmy (2000 : 311-44) appelle figure et ground, sachant que le premier terme réfère à l’élément le plus saillant, qui se détache sur un fond (désigné par ground). Selon cet auteur également, ce sont les structures grammaticales qui contrôlent la distribution de l’attention portée aux différentes entités présentes.

En lien avec son rôle syntaxique, le rôle sémantique d’une entité est également déterminant, comme l’avait déjà montré C. Fillmore (1968 ; 1977 : 78). Dans la lignée de la grammaire générative et transformationnelle, Fillmore applique la notion de cas aux structures profondes qui se voient réalisées syntaxiquement en structure de surface. Il propose ainsi une base sémantique et universelle des rôles thématiques. Selon l’auteur, il existe une hiérarchie de pertinence en ce qui concerne la sélection des rôles, concernant celui de sujet notamment. Cette hiérarchie peut être représentée ainsi : agent > instrument > patient.

Si l’événement met en scène un agent, celui-ci sera réalisé en position de sujet. S’il n’y a pas d’agent, ce sera l’instrument, ou encore le patient si l’instrument n’est pas réalisé. La grammaire des cas prévoit donc une correspondance relative entre les rôles sémantiques (profonds) et les réalisations syntaxiques (de surface). Notons par ailleurs que la relation entre cette hiérarchie liée aux cas et la notion de saillance est établie par l’auteur, qui évoque une hiérarchie en termes de saillance (salience hierachy, Fillmore 1977 : 78).

Ainsi, les agents jouent clairement les rôles les plus saillants, du moins lorsque les processus sont dynamiques. Sur le plan lexical, par ailleurs, D. Geeraerts (2000 : 90) fournit plus récemment une étude très détaillée de la saillance liée à la sélection du lexique, au cours de laquelle il distingue plusieurs sous-catégories : les formes de saillance perspectivale, sémasiologique, onomasiologique et structurelle.

La première, à savoir la saillance perspectivale, est relative à des paires terminologiques (ex : hand / arm) qui traduisent une hiérarchie pouvant se dessiner dans l’extralinguistique entre le premier plan et le fond. La saillance sémasiologique concerne les relations entre les différentes possibilités sémantiques d’un item lexical donné, certaines valeurs étant plus centrales et prototypiques que d’autres. Si l’on considère maintenant la saillance onomasiologique liée à une certaine catégorie lexicale, elle correspond à la fréquence de l’élément lexical nommant cette catégorie, par contraste avec les autres valeurs sémantiques éventuellement associées à cet item lexical. Enfin, la saillance structurelle est relative à des traits sémantiques récurrents dans la structure du lexique (et pouvant donner lieu à la formation de termes par affixation). L’objectif de l’étude de Geeraerts est, en somme, de déterminer les paramètres responsables des choix lexicaux préférentiels des locuteurs.

Auteur: Pennec Blandine

Info: https://journals.openedition.org/anglophonia/258

[ marketing ] [ linguistique informatisée ] [ secondéité ] [ tiercité ]

Commenter

Commentaires: 0

Ajouté à la BD par miguel

sciences

Notre cerveau: un chaos bien organisé. Une équipe de l'UNIGE décrypte un des mécanismes de la conscience Déchiffrer le mystère de la conscience est le défi majeur des neurosciences actuelles. Dans ce contexte, l'équipe vient de mettre en lumière une caractéristique importante de la pensée consciente. Grâce aux technologies de pointe en neuroimagerie du Brain & Behaviour Laboratory (BBL) et à des méthodes d'analyses mathématiques, cette équipe a montré que la pensée consciente peut se décomposer en une succession de micro-états cérébraux ou "atomes de la pensée". La séquence temporelle de ces micro-états n'est ni aléatoire, ni déterminée, mais chaotique, ce qui signifie qu'elle a une structure, mais qui ne peut pas être anticipée. Cette organisation chaotique de l'activité cérébrale apparaît comme la clef permettant au cerveau de réagir rapidement à des événements inattendus. Cette étude, qui fait l'objet d'une publication dans la revue PNAS, constitue un pas en avant sur la piste de la compréhension de la conscience, ainsi que de certaines maladies mentales. Le fonctionnement de la conscience reste une question encore très mal comprise des scientifiques. Beaucoup ont essayé d'en saisir les fondements en élaborant des modèles théoriques, mais peu ont réellement tenté d'en comprendre l'organisation cérébrale à partir de mesures de l'activité neuronale. Les prof. Dimitri Van De Ville et Christoph Michel, de la Faculté de médecine et du Centre de neurosciences de l'UNIGE, en collaboration avec l'Institut de Bio-ingénierie de l'Ecole polytechnique fédérale de Lausanne (EPFL), ont mis en place une expérience pour mieux saisir comment la pensée spontanée et consciente s'organise. En effet, les chercheurs ont mesuré l'activité cérébrale de volontaires en utilisant simultanément deux méthodes de neuroimagerie du Brain & Behaviour Laboratory (BBL) de l'UNIGE: l'électro-encéphalographie (EEG), qui permet d'obtenir des mesures à des échelles de temps de l'ordre de la milliseconde, et l'imagerie par résonance magnétique fonctionnelle (IRMf), qui permet de suivre l'activité du cerveau sur des échelles de temps de l'ordre de la seconde. Durant les enregistrements, les volontaires devaient laisser libre cours à leurs pensées, sans se focaliser sur une idée particulière. Les signaux provenant de ces enregistrements ont été analysés à l'aide d'outils mathématiques. Les atomes de la pensée A la suite de ces expériences, les scientifiques ont d'abord remarqué que l'activité cérébrale s'organise en une succession de micro-états. Ces micro-états, considérés comme les "atomes de la pensée", sont les éléments constitutifs de la cognition, un peu comme des "morceaux" de pensée. Chaque micro-état correspond à une configuration particulière de l'activité des neurones dans le cerveau. Les chercheurs ont mis en évidence quatre micro-états distincts qui correspondent aux aspects visuels, auditifs, introspectifs et attentionnels de la pensée. Une pensée apparaît donc comme une alternance de composantes visuelles, auditives, introspectives et attentionnelles. Des fractales dans notre cerveau En outre, en appliquant une analyse mathématique avancée sur les mesures faites au moyen de l'EEG et de l'IRMf, les chercheurs ont fait une découverte surprenante: les atomes ou morceaux de pensée se succèdent avec une structure temporelle semblable aux deux échelles de temps. La même structure est ainsi observée tant à l'échelle de l'ordre du dixième de seconde (avec l'EEG) qu'à celle de l'ordre de la dizaine de secondes (avec IRMf). Cette propriété est la caractéristique principale des fractales dans la théorie du chaos. Un objet fractal présente le même motif lorsqu'il est regardé au microscope, à la loupe ou à l'oeil nu. Il semblerait que la durée des micro-états joue un rôle prédominant dans cette organisation fractale de la pensée. "Prenons l'analogie du livre dans lequel les lettres représentent les atomes de la pensée. Ceux-ci se combinent pour former des mots, qui eux-mêmes se combinent pour former des phrases ; les phrases se combinent en paragraphes, et ainsi de suite jusqu'à obtenir un livre, tout cela avec toujours les mêmes règles syntaxiques" explique Christoph Michel, un des auteurs de l'étude. "Ce que nous avons mis en évidence, c'est une syntaxe de la pensée". Fonctionnel grâce au chaos Ce serait donc grâce à cette organisation "chaotique" de la pensée que le cerveau peut se réorganiser et s'adapter très rapidement selon les besoins. Des perturbations dans les micro-états pourraient être à l'origine de certaines maladies mentales. Par exemple, on a observé chez les schizophrènes des micro-états de durée plus courte que la normale, suggérant la présence de pensées inabouties. Suite à cette découverte, les chercheurs vont maintenant pouvoir s'attacher à comprendre cette syntaxe neuronale chez des patients neurologiques et chez des sujets sains qui subissent un changement de l'état de conscience, comme pendant le sommeil.

Auteur: Internet

Info: Université de Genève 21 octobre 2010

[ réflexion ] [ hologramme ] [ désordre ] [ citation s'appliquant à ce logiciel ]

Commenter

Commentaires: 0

orient-ponant

La pensée chinoise archaïque

Quelques éléments sur ce que nous savons aujourd’hui de la pensée chinoise archaïque (XVe – XIe siècles av. J.-C.).

La manière dont les Chinois parlent et écrivent constitue, chacun le sait, un langage dont la structure grammaticale est très éloignée de la nôtre, occidentale. Ce que nous appelons les " mots d’armature " : les articles, les prépositions, les conjonctions, ces mots qui nous permettent de relier entre eux les " mots de contenu " : les substantifs, les verbes, les adjectifs qualificatifs, les adverbes, ces mots d’armature qui constituent à nos yeux le " tissu conjonctif " de la langue, sont pour la plupart absents du chinois.

Alors que nous, Occidentaux, nous attendons à lire ces mots d’armature dans un texte comme la manière requise pour l’articuler, nous constatons à la place en chinois des séquences de noms de choses à la queue leu-leu, lesquels peuvent éventuellement être reliés par quelques éléments syntaxiques mais en tout cas d’une façon beaucoup plus rudimentaire que chez nous.

Il existe en particulier dans la phrase chinoise un mot que nous écrivons dans notre graphie comme " yeh " et que nous qualifions de marqueur d’affirmation, pour préciser la façon dont il sert à relier deux notions. Un philologue de la Chine, Kyril Ryjik, dit à propos de yeh : " … ce caractère entretient, entre son sens original et son emploi opératoire, le type de rapport qu’entretient la notion de “copule” […]. Il opère avec une notion de très forte jonction entre deux termes " (Ryjik 1980 : 218). Deux termes chinois sont rapprochés et il est suggéré à l’aide du terme yeh qu’il existe un lien spécial entre les deux.

Chad Hansen, commentateur éminent de la langue chinoise archaïque, explique :

" Il n’y a pas en chinois de est, pas d’expression prédicative dénotant l’identité ou l’inclusion. La juxtaposition de deux termes (ordinairement suivis de la particule yeh) constitue une phrase relationnelle grossièrement équivalente à une phrase affirmant l’identité ou l’inclusion […] La phrase pai ma ma yeh (blanc cheval cheval “est”) : “(du) cheval blanc ‘est’ (du) cheval”, est un exemple d’une telle structure de phrase " (Hansen 1983 : 45).

Par ailleurs, si je prononce l’un après l’autre les mots chinois pour cheval et pour bœuf et que je fais suivre leur séquence de yeh : " cheval bœuf yeh ", je laisse entendre qu’il existe quelque chose reliant les deux termes, quelque chose fait qu’ils aient été mentionnés ensemble et je réunis ce faisant automatiquement ces deux notions sous un seul concept qui conduit à parler de ce que nous caractérisons nous comme " animal de trait ", parce que l’union établie entre le bœuf et le cheval par la particule yeh met en avant ce qui nous apparaît comme un trait commun aux deux notions évoquées. Si l’on recourt au vocabulaire de la théorie mathématique des ensembles, on dira que leur rapprochement souligné par yeh met en avant l’intersection de leurs caractères propres : le principe de l’animal de trait ne combine pas l’équinité et la bovinité selon leur union, additionnant l’ensemble des chevaux à celui des bœufs, mais selon leur intersection : là où la blancheur recoupe l’équinité, nous avons " du cheval blanc ", là où l’équinité rencontre la bovinité, nous trouvons le principe de l’animal de trait, en l’occurrence le fait qu’ils puissent l’un et l’autre tracter un objet lourd, comme un chariot, une charrue, la meule d’un moulin à grain, etc. Et à partir de là, la conjonction cheval bœuf signifie en chinois " animal de trait ".

Nous disposons dès lors d’éléments susceptibles de nous faire appréhender de plus près cette notion d’affinité qui nous semble propre à la pensée totémique dont je considère, à la suite de Durkheim et de Mauss, qu’il s’agit avec elle des échos de la pensée archaïque chinoise dans le reste de la zone circum-pacifique, échos dus à un processus historique de diffusion à partir de la Chine ou à une identité foncière trouvant sa source dans leur origine commune.

Deux notions sont rapprochées, sans qu’il soit précisé pour quelle raison précise elles le sont, le seul geste posé étant cette suggestion d’un lien entre les deux. Comment opérons-nous, par exemple en français, dans un contexte similaire ? Dans un usage de copule, nous disposons de deux verbes : être et avoir. Le verbe être, nous l’utilisons pour exprimer la nature de la chose : " Le cheval est blanc ", où un élément de l’ordre d’une caractéristique vient compléter la description de la chose jusque-là : une nouvelle qualification est apportée en complément. Mais nous utilisons aussi le verbe être pour dire : " Le cheval est un mammifère ", ce qui nous permet de signaler l’inclusion d’une sorte dans une autre sorte. La sorte " cheval " est l’une des composantes de la sorte " mammifère ".

Le verbe avoir a un sens qui peut être en français celui de la possession mais également celui d’un lien plus lâche, à la façon de ce yeh que je viens d’évoquer. Quand nous disons : " Le pharaon et la pyramide ", nous savons qu’il existe un lien entre les deux sans qu’il soit clair de quel lien précis nous voulons parler. Est-ce le fait que le pharaon a une pyramide ? Que le pharaon a fait bâtir une pyramide ? Quoi qu’il en soit, que nous précisions d’une manière ou d’une autre, nous savons qu’il existe un lien, qu’il existe – pour recourir à ce terme vague que nous utilisons en Occident pour évoquer la pensée totémique ou celle de la Chine archaïque – une affinité entre le pharaon et la pyramide.

Un autre exemple, quand on dit " L’abeille et son miel ", on peut vouloir dire que l’abeille fait du miel ou que l’abeille dispose de miel. On peut dire aussi " le miel de l’abeille ". Là aussi, nous pouvons préciser la relation exacte mais quand on se contente de dire " l’abeille et son miel ", on procède comme le faisait le chinois dans la forme archaïque de sa langue quand il rapprochait, rassemblait, les deux notions à l’aide de ce terme yeh. Un autre exemple encore, fenêtre et verre : " la fenêtre est en verre ", " il y a du verre dans la fenêtre ", " le verre de la fenêtre ", etc. Tout cela demeure de l’ordre du réversible, d’une symétrie essentielle entre les deux notions rapprochées, alors que, par contraste, les langues de l’Occident, aussi haut que nous puissions retracer leur ascendance, sont familières de la relation anti-symétrique d’inclusion, ingrédient indispensable du raisonnement scientifique. L’émergence du discours théorique qu’est la science a permis la naissance d’une technologie qui soit à proprement parler de la " science appliquée ", par opposition à la technologie résultant de la méthode empirique de l’essai et erreur, la seule que connaissait la culture humaine, à l’Ouest comme à l’Est, dans la période qui précéda le XVIIe siècle.

Le moyen de signifier la relation d’inclusion manquait au chinois, du coup quand il s’agissait d’indiquer un rapport entre deux notions, n’existait dans tous les cas de figure que l’option d’indiquer une proximité, un apparentement, ou comme nous nous exprimons, une " affinité ", faute de pouvoir qualifier la relation plus précisément. Impossible dans ce contexte d’opérer une véritable classification de l’ensemble de ces notions : nous ne pouvons au mieux qu’en établir la liste.

H. G. Creel explique : " Le point crucial est que les anciens Chinois n’étaient dans l’ensemble ni des penseurs systématiques ni ordonnés […]. Ils étaient des cataloguistes infatigables ; ils n’étaient pas systématiciens " (in Hansen 1983 : 25).

Pour qu’un classement systématique puisse être opéré dans l’espace d’une langue, il faut qu’elle dispose parmi ses outils de cette relation d’inclusion et qu’elle permette en particulier d’utiliser le verbe être – ou ce qui en tient lieu – dans le sens qui est le sien quand nous disons : " Le cheval est un animal " ou " Le rat est un mammifère ", soit l’inclusion d’une sorte dans une autre.

Si vous êtes familier de l’œuvre de Jorge Luis Borges. Vous n’ignorez pas alors qu’il nous a diverti avec de petits textes mettant habilement en scène certains paradoxes essentiels. Parmi ceux-ci, celui qui est consacré à " Pierre Ménard, auteur du Don Quichotte ". Ménard, explique Borges, est considéré comme l’un des grands auteurs des années 1930 parce qu’il est parvenu à s’imprégner à ce point de l’esprit du temps de de Cervantes, qu’il a pu réécrire à l’identique deux chapitres (et une partie importante d’un troisième) du Don Quichotte. L’idée est ridicule bien sûr parce que l’on peut imaginer aussi bien qu’au lieu de s’imprégner à la perfection de l’esprit d’une époque, le Ménard en question se soit contenté de recopier le texte du Don Quichotte. Borges avait par ailleurs saisi dans l’une de ses petites fables ce qu’avançait Creel quand il rapportait que les Chinois anciens étaient " des cataloguistes infatigables et non des systématiciens ". Selon Borges, on pouvait trouver dans un ancien texte chinois que :

" Les animaux se divisent en : a) appartenant à l’Empereur, b) embaumés, c) apprivoisés, d) cochons de lait, e) sirènes, f) fabuleux, g) chiens en liberté, h) inclus dans la présente classification, i) qui s’agitent comme des fous, j) innombrables, k) dessinés avec un pinceau très fin en poils de chameau, l) etc., m) qui viennent de casser la cruche, n) qui de loin semblent des mouches ".

Un inventaire sans doute, mais privé de tout caractère systématique, au pôle opposé d’une classification fondée sur l’emboîtement des sortes sur plusieurs niveaux, les niveaux étant ici mélangés. Il s’agit d’une plaisanterie bien entendu et non d’un vrai texte chinois, mais Borges a su saisir ce qui caractérisait à nos yeux d’Occidentaux, l’essence de la … chinoiserie.

Lucien Lévy-Bruhl caractérisait de la même manière la " mentalité primitive ", l’autre nom chez lui, nous le verrons, du totémisme, qui est aussi ce que j’appelle, comme leur synonyme, et à la suite de Durkheim et Mauss, la pensée chinoise archaïque :

" … les connaissances ne se hiérarchisent pas en concepts subordonnés les uns aux autres. Elles demeurent simplement juxtaposées sans ordre. Elles forment une sorte d’amas ou de tas " (Lévy-Bruhl 1935 : xiv).

Il s’agit bien avec la " mentalité primitive " selon Lévy-Bruhl, le totémisme et la pensée chinoise archaïque d’une seule et même entité.

Auteur: Jorion Paul

Info: 20 janvier 2024, sur son blog.

[ langues comparées ] [ listes ] [ éparpillement ] [ imprécision sémantique ] [ historique ] [ différences ] [ nord-sud ]

Commenter

Commentaires: 1

miguel

23.01.2024

Synthèse du texte La pensée chinoise archaïque (XVe – XIe siècles av. J.-C.) se caractérise par une approche du monde qui est très différente de la nôtre. Elle est fondée sur une conception de la relation entre les choses qui est basée sur l'affinité plutôt que sur l'inclusion. En chinois archaïque, il n'existe pas de verbe "être" au sens occidental. Pour relier deux notions, on utilise la particule "yeh". Cette particule ne signifie pas que les deux notions sont identiques ou que l'une est incluse dans l'autre. Elle suggère simplement qu'il existe un lien entre elles, un lien qui peut être de nature très variée. Par exemple, si nous disons "cheval bœuf yeh", nous suggérons qu'il existe un lien entre les deux animaux. Ce lien peut être de nature fonctionnelle, comme le fait que les deux animaux peuvent être utilisés comme animaux de trait. Il peut également être de nature symbolique, comme le fait que les deux animaux sont souvent associés à la puissance et à la force. Cette conception de la relation entre les choses a des implications importantes pour la façon dont les Chinois archaïques percevaient le monde. Elle les conduisait à voir le monde comme un ensemble de relations complexes et interconnectées, plutôt que comme un ensemble de catégories bien définies et distinctes. Cette conception du monde est également à l'origine de la tendance des Chinois archaïques à la cataloguisation. Ils s'efforçaient de dresser des listes exhaustives de toutes les choses qui existaient, sans chercher à les classer de manière systématique. Le philosophe français Lucien Lévy-Bruhl a qualifié cette façon de penser de mentalité primitive. Il a soutenu que cette mentalité était caractéristique des sociétés traditionnelles, qui sont souvent caractérisées par une approche holistique du monde. La pensée chinoise archaïque est un exemple de cette mentalité primitive. Elle nous montre que la façon dont nous percevons le monde est influencée par notre langue et notre culture.

Ajouté à la BD par Le sous-projectionniste

homme-machine

Chat GPT ou le perroquet grammairien

L’irruption des IA conversationnelles dans la sphère publique a conféré une pertinence supplémentaire aux débats sur le langage humain et sur ce qu’on appelle parler. Notamment, les IA redonnent naissance à un débat ancien sur la grammaire générative et sur l’innéisme des facultés langagières. Mais les grands modèles de langage et les IA neuronales nous offrent peut-être l’occasion d’étendre le domaine de la réflexion sur l’architecture des systèmes possibles de cognition, de communication et d’interaction, et considérant aussi la façon dont les animaux communiquent.

a capacité de ChatGPT à produire des textes en réponse à n’importe quelle requête a immédiatement attiré l’attention plus ou moins inquiète d’un grand nombre de personnes, les unes animées par une force de curiosité ou de fascination, et les autres, par un intérêt professionnel.

L’intérêt professionnel scientifique que les spécialistes du langage humain peuvent trouver aux Large Language Models ne date pas d’hier : à bien des égards, des outils de traduction automatique comme DeepL posaient déjà des questions fondamentales en des termes assez proches. Mais l’irruption des IA conversationnelles dans la sphère publique a conféré une pertinence supplémentaire aux débats sur ce que les Large Language Models sont susceptibles de nous dire sur le langage humain et sur ce qu’on appelle parler.

L’outil de traduction DeepL (ou les versions récentes de Google Translate) ainsi que les grands modèles de langage reposent sur des techniques d’" apprentissage profond " issues de l’approche " neuronale " de l’Intelligence Artificielle : on travaille ici sur des modèles d’IA qui organisent des entités d’information minimales en les connectant par réseaux ; ces réseaux de connexion sont entraînés sur des jeux de données considérables, permettant aux liaisons " neuronales " de se renforcer en proportion des probabilités de connexion observées dans le jeu de données réelles – c’est ce rôle crucial de l’entraînement sur un grand jeu de données qui vaut aux grands modèles de langage le sobriquet de " perroquets stochastiques ". Ces mécanismes probabilistes sont ce qui permet aussi à l’IA de gagner en fiabilité et en précision au fil de l’usage. Ce modèle est qualifié de " neuronal " car initialement inspiré du fonctionnement des réseaux synaptiques. Dans le cas de données langagières, à partir d’une requête elle-même formulée en langue naturelle, cette technique permet aux agents conversationnels ou aux traducteurs neuronaux de produire très rapidement des textes généralement idiomatiques, qui pour des humains attesteraient d’un bon apprentissage de la langue.

IA neuronales et acquisition du langage humain

Au-delà de l’analogie " neuronale ", ce mécanisme d’entraînement et les résultats qu’il produit reproduisent les théories de l’acquisition du langage fondées sur l’interaction avec le milieu. Selon ces modèles, généralement qualifiés de comportementalistes ou behavioristes car étroitement associés aux théories psychologiques du même nom, l’enfant acquiert le langage par l’exposition aux stimuli linguistiques environnants et par l’interaction (d’abord tâtonnante, puis assurée) avec les autres. Progressivement, la prononciation s’aligne sur la norme majoritaire dans l’environnement individuel de la personne apprenante ; le vocabulaire s’élargit en fonction des stimuli ; l’enfant s’approprie des structures grammaticales de plus en plus contextes ; et en milieu bilingue, les enfants apprennent peu à peu à discriminer les deux ou plusieurs systèmes auxquels ils sont exposés. Cette conception essentiellement probabiliste de l’acquisition va assez spontanément de pair avec des théories grammaticales prenant comme point de départ l’existence de patrons (" constructions ") dont la combinatoire constitue le système. Dans une telle perspective, il n’est pas pertinent qu’un outil comme ChatGPT ne soit pas capable de référer, ou plus exactement qu’il renvoie d’office à un monde possible stochastiquement moyen qui ne coïncide pas forcément avec le monde réel. Cela ne change rien au fait que ChatGPT, DeepL ou autres maîtrisent le langage et que leur production dans une langue puisse être qualifiée de langage : ChatGPT parle.

Mais ce point de vue repose en réalité sur un certain nombre de prémisses en théorie de l’acquisition, et fait intervenir un clivage lancinant au sein des sciences du langage. L’actualité de ces dernières années et surtout de ces derniers mois autour des IA neuronales et génératives redonne à ce clivage une acuité particulière, ainsi qu’une pertinence nouvelle pour l’appréhension de ces outils qui transforment notre rapport au texte et au discours. La polémique, comme souvent (trop souvent ?) quand il est question de théorie du langage et des langues, se cristallise – en partie abusivement – autour de la figure de Noam Chomsky et de la famille de pensée linguistique très hétérogène qui se revendique de son œuvre, généralement qualifiée de " grammaire générative " même si le pluriel (les grammaires génératives) serait plus approprié.

IA générative contre grammaire générative

Chomsky est à la fois l’enfant du structuralisme dans sa variante états-unienne et celui de la philosophie logique rationaliste d’inspiration allemande et autrichienne implantée sur les campus américains après 1933. Chomsky est attaché à une conception forte de la logique mathématisée, perçue comme un outil d’appréhension des lois universelles de la pensée humaine, que la science du langage doit contribuer à éclairer. Ce parti-pris que Chomsky qualifiera lui-même de " cartésien " le conduit à fonder sa linguistique sur quelques postulats psychologiques et philosophiques, dont le plus important est l’innéisme, avec son corollaire, l’universalisme. Selon Chomsky et les courants de la psychologie cognitive influencée par lui, la faculté de langage s’appuie sur un substrat génétique commun à toute l’espèce humaine, qui s’exprime à la fois par un " instinct de langage " mais aussi par l’existence d’invariants grammaticaux, identifiables (via un certain niveau d’abstraction) dans toutes les langues du monde.

La nature de ces universaux fluctue énormément selon quelle période et quelle école du " générativisme " on étudie, et ce double postulat radicalement innéiste et universaliste reste très disputé aujourd’hui. Ces controverses mettent notamment en jeu des conceptions très différentes de l’acquisition du langage et des langues. Le moment fondateur de la théorie chomskyste de l’acquisition dans son lien avec la définition même de la faculté de langage est un violent compte-rendu critique de Verbal Behavior, un ouvrage de synthèse des théories comportementalistes en acquisition du langage signé par le psychologue B.F. Skinner. Dans ce compte-rendu publié en 1959, Chomsky élabore des arguments qui restent structurants jusqu’à aujourd’hui et qui définissent le clivage entre l’innéisme radical et des théories fondées sur l’acquisition progressive du langage par exposition à des stimuli environnementaux. C’est ce clivage qui préside aux polémiques entre linguistes et psycholinguistes confrontés aux Large Language Models.

On comprend dès lors que Noam Chomsky et deux collègues issus de la tradition générativiste, Ian Roberts, professeur de linguistique à Cambridge, et Jeffrey Watumull, chercheur en intelligence artificielle, soient intervenus dans le New York Times dès le 8 mars 2023 pour exposer un point de vue extrêmement critique intitulée " La fausse promesse de ChatGPT ". En laissant ici de côté les arguments éthiques utilisés dans leur tribune, on retiendra surtout l’affirmation selon laquelle la production de ChatGPT en langue naturelle ne pourrait pas être qualifiée de " langage " ; ChatGPT, selon eux, ne parle pas, car ChatGPT ne peut pas avoir acquis la faculté de langage. La raison en est simple : si les Grands Modèles de Langage reposent intégralement sur un modèle behaviouriste de l’acquisition, dès lors que ce modèle, selon eux, est réfuté depuis soixante ans, alors ce que font les Grands Modèles de Langage ne peut être qualifié de " langage ".

Chomsky, trop têtu pour qu’on lui parle ?

Le point de vue de Chomsky, Roberts et Watumull a été instantanément tourné en ridicule du fait d’un choix d’exemple particulièrement malheureux : les trois auteurs avançaient en effet que certaines constructions syntaxiques complexes, impliquant (dans le cadre générativiste, du moins) un certain nombre d’opérations sur plusieurs niveaux, ne peuvent être acquises sur la base de l’exposition à des stimuli environnementaux, car la fréquence relativement faible de ces phénomènes échouerait à contrebalancer des analogies formelles superficielles avec d’autres tournures au sens radicalement différent. Dans la tribune au New York Times, l’exemple pris est l’anglais John is too stubborn to talk to, " John est trop entêté pour qu’on lui parle ", mais en anglais on a littéralement " trop têtu pour parler à " ; la préposition isolée (ou " échouée ") en position finale est le signe qu’un constituant a été supprimé et doit être reconstitué aux vues de la structure syntaxique d’ensemble. Ici, " John est trop têtu pour qu’on parle à [John] " : le complément supprimé en anglais l’a été parce qu’il est identique au sujet de la phrase.

Ce type d’opérations impliquant la reconstruction d’un complément d’objet supprimé car identique au sujet du verbe principal revient dans la plupart des articles de polémique de Chomsky contre la psychologie behaviouriste et contre Skinner dans les années 1950 et 1960. On retrouve même l’exemple exact de 2023 dans un texte du début des années 1980. C’est en réalité un exemple-type au service de l’argument selon lequel l’existence d’opérations minimales universelles prévues par les mécanismes cérébraux humains est nécessaire pour l’acquisition complète du langage. Il a presque valeur de shibboleth permettant de séparer les innéistes et les comportementalistes. Il est donc logique que Chomsky, Roberts et Watumull avancent un tel exemple pour énoncer que le modèle probabiliste de l’IA neuronale est voué à échouer à acquérir complètement le langage.

On l’aura deviné : il suffit de demander à ChatGPT de paraphraser cette phrase pour obtenir un résultat suggérant que l’agent conversationnel a parfaitement " compris " le stimulus. DeepL, quand on lui demande de traduire cette phrase en français, donne deux solutions : " John est trop têtu pour qu’on lui parle " en solution préférée et " John est trop têtu pour parler avec lui " en solution de remplacement. Hors contexte, donc sans qu’on sache qui est " lui ", cette seconde solution n’est guère satisfaisante. La première, en revanche, fait totalement l’affaire.

Le détour par DeepL nous montre toutefois la limite de ce petit test qui a pourtant réfuté Chomsky, Roberts et Watumull : comprendre, ici, ne veut rien dire d’autre que " fournir une paraphrase équivalente ", dans la même langue (dans le cas de l’objection qui a immédiatement été faite aux trois auteurs) ou dans une autre (avec DeepL), le problème étant que les deux équivalents fournis par DeepL ne sont justement pas équivalents entre eux, puisque l’un est non-ambigu référentiellement et correct, tandis que l’autre est potentiellement ambigu référentiellement, selon comment on comprend " lui ". Or l’argument de Chomsky, Roberts et Watumull est justement celui de l’opacité du complément d’objet… Les trois auteurs ont bien sûr été pris à défaut ; reste que le test employé, précisément parce qu’il est typiquement behaviouriste (observer extérieurement l’adéquation d’une réaction à un stimulus), laisse ouverte une question de taille et pourtant peu présente dans les discussions entre linguistes : y a-t-il une sémantique des énoncés produits par ChatGPT, et si oui, laquelle ? Chomsky et ses co-auteurs ne disent pas que ChatGPT " comprend " ou " ne comprend pas " le stimulus, mais qu’il en " prédit le sens " (bien ou mal). La question de la référence, présente dans la discussion philosophique sur ChatGPT mais peu mise en avant dans le débat linguistique, n’est pas si loin.

Syntaxe et sémantique de ChatGPT

ChatGPT a une syntaxe et une sémantique : sa syntaxe est homologue aux modèles proposés pour le langage naturel invoquant des patrons formels quantitativement observables. Dans ce champ des " grammaires de construction ", le recours aux données quantitatives est aujourd’hui standard, en particulier en utilisant les ressources fournies par les " grand corpus " de plusieurs dizaines de millions voire milliards de mots (quinze milliards de mots pour le corpus TenTen francophone, cinquante-deux milliards pour son équivalent anglophone). D’un certain point de vue, ChatGPT ne fait que répéter la démarche des modèles constructionalistes les plus radicaux, qui partent de co-occurrences statistiques dans les grands corpus pour isoler des patrons, et il la reproduit en sens inverse, en produisant des données à partir de ces patrons.

Corrélativement, ChatGPT a aussi une sémantique, puisque ces théories de la syntaxe sont majoritairement adossées à des modèles sémantiques dits " des cadres " (frame semantics), dont l’un des inspirateurs n’est autre que Marvin Minsky, pionnier de l’intelligence artificielle s’il en est : la circulation entre linguistique et intelligence artificielle s’inscrit donc sur le temps long et n’est pas unilatérale. Là encore, la question est plutôt celle de la référence : la sémantique en question est très largement notionnelle et ne permet de construire un énoncé susceptible d’être vrai ou faux qu’en l’actualisant par des opérations de repérage (ne serait-ce que temporel) impliquant de saturer grammaticalement ou contextuellement un certain nombre de variables " déictiques ", c’est-à-dire qui ne se chargent de sens que mises en relation à un moi-ici-maintenant dans le discours.

On touche ici à un problème transversal aux clivages dessinés précédemment : les modèles " constructionnalistes " sont plus enclins à ménager des places à la variation contextuelle, mais sous la forme de variables situationnelles dont l’intégration à la description ne fait pas consensus ; les grammaires génératives ont très longtemps évacué ces questions hors de leur sphère d’intérêt, mais les considérations pragmatiques y fleurissent depuis une vingtaine d’années, au prix d’une convocation croissante du moi-ici-maintenant dans l’analyse grammaticale, du moins dans certains courants. De ce fait, l’inscription ou non des enjeux référentiels et déictiques dans la définition même du langage comme faculté humaine représente un clivage en grande partie indépendant de celui qui prévaut en matière de théorie de l’acquisition.

À l’école du perroquet

La bonne question, en tout cas la plus féconde pour la comparaison entre les productions langagières humaines et les productions des grands modèles de langage, n’est sans doute pas de savoir si " ChatGPT parle " ni si les performances de l’IA neuronale valident ou invalident en bloc tel ou tel cadre théorique. Une piste plus intéressante, du point de vue de l’étude de la cognition et du langage humains, consiste à comparer ces productions sur plusieurs niveaux : les mécanismes d’acquisition ; les régularités sémantiques dans leur diversité, sans les réduire aux questions de référence et faisant par exemple intervenir la conceptualisation métaphorique des entités et situations désignées ; la capacité à naviguer entre les registres et les variétés d’une même langue, qui fait partie intégrante de la maîtrise d’un système ; l’adaptation à des ontologies spécifiques ou à des contraintes communicatives circonstancielles… La formule du " perroquet stochastique ", prise au pied de la lettre, indique un modèle de ce que peut être une comparaison scientifique du langage des IA et du langage humain.

Il existe en effet depuis plusieurs décennies maintenant une linguistique, une psycholinguistique et une pragmatique de la communication animale, qui inclut des recherches comparant l’humain et l’animal. Les progrès de l’étude de la communication animale ont permis d’affiner la compréhension de la faculté de langage, des modules qui la composent, de ses prérequis cognitifs et physiologiques. Ces travaux ne nous disent pas si " les animaux parlent ", pas plus qu’ils ne nous disent si la communication des corbeaux est plus proche de celle des humains que celle des perroquets. En revanche ils nous disent comment diverses caractéristiques éthologiques, génétiques et cognitives sont distribuées entre espèces et comment leur agencement produit des modes de communication spécifiques. Ces travaux nous renseignent, en nous offrant un terrain d’expérimentation inédit, sur ce qui fait toujours système et sur ce qui peut être disjoint dans la faculté de langage. Loin des " fausses promesses ", les grands modèles de langage et les IA neuronales nous offrent peut-être l’occasion d’étendre le domaine de la réflexion sur l’architecture des systèmes possibles de cognition, de communication et d’interaction.

Auteur: Modicom Pierre-Yves

Info: https://aoc.media/ 14 nov 2023

[ onomasiologie bayésienne ] [ sémiose homme-animal ] [ machine-homme ] [ tiercités hors-sol ] [ signes fixés externalisables ]

Commenter

Commentaires: 0

Ajouté à la BD par miguel

Paramètres de recherches