Les fils de la pensée

Paramètres de recherches

Filtres

Citation

Catégorie

Tag – étiquette

Auteur

Info

Recherche avancée

Détail auteurs

Présentation, tri

Dictionnaire analogique intriqué pour extraits. Recherche mots ou phrases tous azimuts. Aussi outil de précision sémantique et de réflexion communautaire. Voir la rubrique mode d'emploi. Jetez un oeil à la colonne "chaînes". ATTENTION, faire une REINITIALISATION après une recherche complexe. Et utilisez le nuage de corrélats !!!!..... Lire la suite >>

Nuage de corrélats

abrutissement avant destin définition ensuite exemple finances grand historique homme humour langage lecteur lecture littérature livre monde oppression plaisir raison religion réflexion spiritualité temps textes toujours vieux écrits écriture évolution

Résultat(s): 324

Temps de recherche: 0.0552s

« Précédent
1
…
29
30
31
32
33
Suivant »

homme-machine

Chat GPT ou le perroquet grammairien

L’irruption des IA conversationnelles dans la sphère publique a conféré une pertinence supplémentaire aux débats sur le langage humain et sur ce qu’on appelle parler. Notamment, les IA redonnent naissance à un débat ancien sur la grammaire générative et sur l’innéisme des facultés langagières. Mais les grands modèles de langage et les IA neuronales nous offrent peut-être l’occasion d’étendre le domaine de la réflexion sur l’architecture des systèmes possibles de cognition, de communication et d’interaction, et considérant aussi la façon dont les animaux communiquent.

a capacité de ChatGPT à produire des textes en réponse à n’importe quelle requête a immédiatement attiré l’attention plus ou moins inquiète d’un grand nombre de personnes, les unes animées par une force de curiosité ou de fascination, et les autres, par un intérêt professionnel.

L’intérêt professionnel scientifique que les spécialistes du langage humain peuvent trouver aux Large Language Models ne date pas d’hier : à bien des égards, des outils de traduction automatique comme DeepL posaient déjà des questions fondamentales en des termes assez proches. Mais l’irruption des IA conversationnelles dans la sphère publique a conféré une pertinence supplémentaire aux débats sur ce que les Large Language Models sont susceptibles de nous dire sur le langage humain et sur ce qu’on appelle parler.

L’outil de traduction DeepL (ou les versions récentes de Google Translate) ainsi que les grands modèles de langage reposent sur des techniques d’" apprentissage profond " issues de l’approche " neuronale " de l’Intelligence Artificielle : on travaille ici sur des modèles d’IA qui organisent des entités d’information minimales en les connectant par réseaux ; ces réseaux de connexion sont entraînés sur des jeux de données considérables, permettant aux liaisons " neuronales " de se renforcer en proportion des probabilités de connexion observées dans le jeu de données réelles – c’est ce rôle crucial de l’entraînement sur un grand jeu de données qui vaut aux grands modèles de langage le sobriquet de " perroquets stochastiques ". Ces mécanismes probabilistes sont ce qui permet aussi à l’IA de gagner en fiabilité et en précision au fil de l’usage. Ce modèle est qualifié de " neuronal " car initialement inspiré du fonctionnement des réseaux synaptiques. Dans le cas de données langagières, à partir d’une requête elle-même formulée en langue naturelle, cette technique permet aux agents conversationnels ou aux traducteurs neuronaux de produire très rapidement des textes généralement idiomatiques, qui pour des humains attesteraient d’un bon apprentissage de la langue.

IA neuronales et acquisition du langage humain

Au-delà de l’analogie " neuronale ", ce mécanisme d’entraînement et les résultats qu’il produit reproduisent les théories de l’acquisition du langage fondées sur l’interaction avec le milieu. Selon ces modèles, généralement qualifiés de comportementalistes ou behavioristes car étroitement associés aux théories psychologiques du même nom, l’enfant acquiert le langage par l’exposition aux stimuli linguistiques environnants et par l’interaction (d’abord tâtonnante, puis assurée) avec les autres. Progressivement, la prononciation s’aligne sur la norme majoritaire dans l’environnement individuel de la personne apprenante ; le vocabulaire s’élargit en fonction des stimuli ; l’enfant s’approprie des structures grammaticales de plus en plus contextes ; et en milieu bilingue, les enfants apprennent peu à peu à discriminer les deux ou plusieurs systèmes auxquels ils sont exposés. Cette conception essentiellement probabiliste de l’acquisition va assez spontanément de pair avec des théories grammaticales prenant comme point de départ l’existence de patrons (" constructions ") dont la combinatoire constitue le système. Dans une telle perspective, il n’est pas pertinent qu’un outil comme ChatGPT ne soit pas capable de référer, ou plus exactement qu’il renvoie d’office à un monde possible stochastiquement moyen qui ne coïncide pas forcément avec le monde réel. Cela ne change rien au fait que ChatGPT, DeepL ou autres maîtrisent le langage et que leur production dans une langue puisse être qualifiée de langage : ChatGPT parle.

Mais ce point de vue repose en réalité sur un certain nombre de prémisses en théorie de l’acquisition, et fait intervenir un clivage lancinant au sein des sciences du langage. L’actualité de ces dernières années et surtout de ces derniers mois autour des IA neuronales et génératives redonne à ce clivage une acuité particulière, ainsi qu’une pertinence nouvelle pour l’appréhension de ces outils qui transforment notre rapport au texte et au discours. La polémique, comme souvent (trop souvent ?) quand il est question de théorie du langage et des langues, se cristallise – en partie abusivement – autour de la figure de Noam Chomsky et de la famille de pensée linguistique très hétérogène qui se revendique de son œuvre, généralement qualifiée de " grammaire générative " même si le pluriel (les grammaires génératives) serait plus approprié.

IA générative contre grammaire générative

Chomsky est à la fois l’enfant du structuralisme dans sa variante états-unienne et celui de la philosophie logique rationaliste d’inspiration allemande et autrichienne implantée sur les campus américains après 1933. Chomsky est attaché à une conception forte de la logique mathématisée, perçue comme un outil d’appréhension des lois universelles de la pensée humaine, que la science du langage doit contribuer à éclairer. Ce parti-pris que Chomsky qualifiera lui-même de " cartésien " le conduit à fonder sa linguistique sur quelques postulats psychologiques et philosophiques, dont le plus important est l’innéisme, avec son corollaire, l’universalisme. Selon Chomsky et les courants de la psychologie cognitive influencée par lui, la faculté de langage s’appuie sur un substrat génétique commun à toute l’espèce humaine, qui s’exprime à la fois par un " instinct de langage " mais aussi par l’existence d’invariants grammaticaux, identifiables (via un certain niveau d’abstraction) dans toutes les langues du monde.

La nature de ces universaux fluctue énormément selon quelle période et quelle école du " générativisme " on étudie, et ce double postulat radicalement innéiste et universaliste reste très disputé aujourd’hui. Ces controverses mettent notamment en jeu des conceptions très différentes de l’acquisition du langage et des langues. Le moment fondateur de la théorie chomskyste de l’acquisition dans son lien avec la définition même de la faculté de langage est un violent compte-rendu critique de Verbal Behavior, un ouvrage de synthèse des théories comportementalistes en acquisition du langage signé par le psychologue B.F. Skinner. Dans ce compte-rendu publié en 1959, Chomsky élabore des arguments qui restent structurants jusqu’à aujourd’hui et qui définissent le clivage entre l’innéisme radical et des théories fondées sur l’acquisition progressive du langage par exposition à des stimuli environnementaux. C’est ce clivage qui préside aux polémiques entre linguistes et psycholinguistes confrontés aux Large Language Models.

On comprend dès lors que Noam Chomsky et deux collègues issus de la tradition générativiste, Ian Roberts, professeur de linguistique à Cambridge, et Jeffrey Watumull, chercheur en intelligence artificielle, soient intervenus dans le New York Times dès le 8 mars 2023 pour exposer un point de vue extrêmement critique intitulée " La fausse promesse de ChatGPT ". En laissant ici de côté les arguments éthiques utilisés dans leur tribune, on retiendra surtout l’affirmation selon laquelle la production de ChatGPT en langue naturelle ne pourrait pas être qualifiée de " langage " ; ChatGPT, selon eux, ne parle pas, car ChatGPT ne peut pas avoir acquis la faculté de langage. La raison en est simple : si les Grands Modèles de Langage reposent intégralement sur un modèle behaviouriste de l’acquisition, dès lors que ce modèle, selon eux, est réfuté depuis soixante ans, alors ce que font les Grands Modèles de Langage ne peut être qualifié de " langage ".

Chomsky, trop têtu pour qu’on lui parle ?

Le point de vue de Chomsky, Roberts et Watumull a été instantanément tourné en ridicule du fait d’un choix d’exemple particulièrement malheureux : les trois auteurs avançaient en effet que certaines constructions syntaxiques complexes, impliquant (dans le cadre générativiste, du moins) un certain nombre d’opérations sur plusieurs niveaux, ne peuvent être acquises sur la base de l’exposition à des stimuli environnementaux, car la fréquence relativement faible de ces phénomènes échouerait à contrebalancer des analogies formelles superficielles avec d’autres tournures au sens radicalement différent. Dans la tribune au New York Times, l’exemple pris est l’anglais John is too stubborn to talk to, " John est trop entêté pour qu’on lui parle ", mais en anglais on a littéralement " trop têtu pour parler à " ; la préposition isolée (ou " échouée ") en position finale est le signe qu’un constituant a été supprimé et doit être reconstitué aux vues de la structure syntaxique d’ensemble. Ici, " John est trop têtu pour qu’on parle à [John] " : le complément supprimé en anglais l’a été parce qu’il est identique au sujet de la phrase.

Ce type d’opérations impliquant la reconstruction d’un complément d’objet supprimé car identique au sujet du verbe principal revient dans la plupart des articles de polémique de Chomsky contre la psychologie behaviouriste et contre Skinner dans les années 1950 et 1960. On retrouve même l’exemple exact de 2023 dans un texte du début des années 1980. C’est en réalité un exemple-type au service de l’argument selon lequel l’existence d’opérations minimales universelles prévues par les mécanismes cérébraux humains est nécessaire pour l’acquisition complète du langage. Il a presque valeur de shibboleth permettant de séparer les innéistes et les comportementalistes. Il est donc logique que Chomsky, Roberts et Watumull avancent un tel exemple pour énoncer que le modèle probabiliste de l’IA neuronale est voué à échouer à acquérir complètement le langage.

On l’aura deviné : il suffit de demander à ChatGPT de paraphraser cette phrase pour obtenir un résultat suggérant que l’agent conversationnel a parfaitement " compris " le stimulus. DeepL, quand on lui demande de traduire cette phrase en français, donne deux solutions : " John est trop têtu pour qu’on lui parle " en solution préférée et " John est trop têtu pour parler avec lui " en solution de remplacement. Hors contexte, donc sans qu’on sache qui est " lui ", cette seconde solution n’est guère satisfaisante. La première, en revanche, fait totalement l’affaire.

Le détour par DeepL nous montre toutefois la limite de ce petit test qui a pourtant réfuté Chomsky, Roberts et Watumull : comprendre, ici, ne veut rien dire d’autre que " fournir une paraphrase équivalente ", dans la même langue (dans le cas de l’objection qui a immédiatement été faite aux trois auteurs) ou dans une autre (avec DeepL), le problème étant que les deux équivalents fournis par DeepL ne sont justement pas équivalents entre eux, puisque l’un est non-ambigu référentiellement et correct, tandis que l’autre est potentiellement ambigu référentiellement, selon comment on comprend " lui ". Or l’argument de Chomsky, Roberts et Watumull est justement celui de l’opacité du complément d’objet… Les trois auteurs ont bien sûr été pris à défaut ; reste que le test employé, précisément parce qu’il est typiquement behaviouriste (observer extérieurement l’adéquation d’une réaction à un stimulus), laisse ouverte une question de taille et pourtant peu présente dans les discussions entre linguistes : y a-t-il une sémantique des énoncés produits par ChatGPT, et si oui, laquelle ? Chomsky et ses co-auteurs ne disent pas que ChatGPT " comprend " ou " ne comprend pas " le stimulus, mais qu’il en " prédit le sens " (bien ou mal). La question de la référence, présente dans la discussion philosophique sur ChatGPT mais peu mise en avant dans le débat linguistique, n’est pas si loin.

Syntaxe et sémantique de ChatGPT

ChatGPT a une syntaxe et une sémantique : sa syntaxe est homologue aux modèles proposés pour le langage naturel invoquant des patrons formels quantitativement observables. Dans ce champ des " grammaires de construction ", le recours aux données quantitatives est aujourd’hui standard, en particulier en utilisant les ressources fournies par les " grand corpus " de plusieurs dizaines de millions voire milliards de mots (quinze milliards de mots pour le corpus TenTen francophone, cinquante-deux milliards pour son équivalent anglophone). D’un certain point de vue, ChatGPT ne fait que répéter la démarche des modèles constructionalistes les plus radicaux, qui partent de co-occurrences statistiques dans les grands corpus pour isoler des patrons, et il la reproduit en sens inverse, en produisant des données à partir de ces patrons.

Corrélativement, ChatGPT a aussi une sémantique, puisque ces théories de la syntaxe sont majoritairement adossées à des modèles sémantiques dits " des cadres " (frame semantics), dont l’un des inspirateurs n’est autre que Marvin Minsky, pionnier de l’intelligence artificielle s’il en est : la circulation entre linguistique et intelligence artificielle s’inscrit donc sur le temps long et n’est pas unilatérale. Là encore, la question est plutôt celle de la référence : la sémantique en question est très largement notionnelle et ne permet de construire un énoncé susceptible d’être vrai ou faux qu’en l’actualisant par des opérations de repérage (ne serait-ce que temporel) impliquant de saturer grammaticalement ou contextuellement un certain nombre de variables " déictiques ", c’est-à-dire qui ne se chargent de sens que mises en relation à un moi-ici-maintenant dans le discours.

On touche ici à un problème transversal aux clivages dessinés précédemment : les modèles " constructionnalistes " sont plus enclins à ménager des places à la variation contextuelle, mais sous la forme de variables situationnelles dont l’intégration à la description ne fait pas consensus ; les grammaires génératives ont très longtemps évacué ces questions hors de leur sphère d’intérêt, mais les considérations pragmatiques y fleurissent depuis une vingtaine d’années, au prix d’une convocation croissante du moi-ici-maintenant dans l’analyse grammaticale, du moins dans certains courants. De ce fait, l’inscription ou non des enjeux référentiels et déictiques dans la définition même du langage comme faculté humaine représente un clivage en grande partie indépendant de celui qui prévaut en matière de théorie de l’acquisition.

À l’école du perroquet

La bonne question, en tout cas la plus féconde pour la comparaison entre les productions langagières humaines et les productions des grands modèles de langage, n’est sans doute pas de savoir si " ChatGPT parle " ni si les performances de l’IA neuronale valident ou invalident en bloc tel ou tel cadre théorique. Une piste plus intéressante, du point de vue de l’étude de la cognition et du langage humains, consiste à comparer ces productions sur plusieurs niveaux : les mécanismes d’acquisition ; les régularités sémantiques dans leur diversité, sans les réduire aux questions de référence et faisant par exemple intervenir la conceptualisation métaphorique des entités et situations désignées ; la capacité à naviguer entre les registres et les variétés d’une même langue, qui fait partie intégrante de la maîtrise d’un système ; l’adaptation à des ontologies spécifiques ou à des contraintes communicatives circonstancielles… La formule du " perroquet stochastique ", prise au pied de la lettre, indique un modèle de ce que peut être une comparaison scientifique du langage des IA et du langage humain.

Il existe en effet depuis plusieurs décennies maintenant une linguistique, une psycholinguistique et une pragmatique de la communication animale, qui inclut des recherches comparant l’humain et l’animal. Les progrès de l’étude de la communication animale ont permis d’affiner la compréhension de la faculté de langage, des modules qui la composent, de ses prérequis cognitifs et physiologiques. Ces travaux ne nous disent pas si " les animaux parlent ", pas plus qu’ils ne nous disent si la communication des corbeaux est plus proche de celle des humains que celle des perroquets. En revanche ils nous disent comment diverses caractéristiques éthologiques, génétiques et cognitives sont distribuées entre espèces et comment leur agencement produit des modes de communication spécifiques. Ces travaux nous renseignent, en nous offrant un terrain d’expérimentation inédit, sur ce qui fait toujours système et sur ce qui peut être disjoint dans la faculté de langage. Loin des " fausses promesses ", les grands modèles de langage et les IA neuronales nous offrent peut-être l’occasion d’étendre le domaine de la réflexion sur l’architecture des systèmes possibles de cognition, de communication et d’interaction.

Auteur: Modicom Pierre-Yves

Info: https://aoc.media/ 14 nov 2023

[ onomasiologie bayésienne ] [ sémiose homme-animal ] [ machine-homme ] [ tiercités hors-sol ] [ signes fixés externalisables ]

Commenter

Commentaires: 0

Ajouté à la BD par miguel

intelligence artificielle

Apprendre l'anglais n'est pas une tâche facile, comme le savent d'innombrables étudiants. Mais lorsque l'étudiant est un ordinateur, une approche fonctionne étonnamment bien : Il suffit d'alimenter un modèle mathématique géant, appelé réseau neuronal, avec des montagnes de textes provenant d'Internet. C'est le principe de fonctionnement des modèles linguistiques génératifs tels que ChatGPT d'OpenAI, dont la capacité à tenir une conversation cohérente (à défaut d'être toujours sincère) sur un large éventail de sujets a surpris les chercheurs et le public au cours de l'année écoulée.

Mais cette approche présente des inconvénients. D'une part, la procédure de "formation" nécessaire pour transformer de vastes archives textuelles en modèles linguistiques de pointe est coûteuse et prend beaucoup de temps. D'autre part, même les personnes qui forment les grands modèles linguistiques ont du mal à comprendre leur fonctionnement interne, ce qui, à son tour, rend difficile la prévision des nombreuses façons dont ils peuvent échouer.

Face à ces difficultés, certains chercheurs ont choisi d'entraîner des modèles plus petits sur des ensembles de données plus restreints, puis d'étudier leur comportement. "C'est comme le séquençage du génome de la drosophile par rapport au séquençage du génome humain", explique Ellie Pavlick, chercheuse sur les modèles de langage à l'université de Brown.

Dans un article récemment publié sur le serveur scientifique arxiv.org, deux chercheurs de Microsoft ont présenté une nouvelle méthode pour former de minuscules modèles de langage : Les élever avec un régime strict d'histoires pour enfants.

RÉSEAUX NEURONAUX

Des chercheurs acquièrent une nouvelle compréhension à partir d'une simple IA

Les chercheurs en apprentissage automatique ont compris cette leçon. GPT-3.5, le grand modèle linguistique qui alimente l'interface ChatGPT, compte près de 200 milliards de paramètres et a été entraîné sur un ensemble de données comprenant des centaines de milliards de mots (OpenAI n'a pas publié les chiffres correspondants pour son successeur, GPT-4). L'entraînement de modèles aussi vastes nécessite généralement au moins 1 000 processeurs spécialisés, appelés GPU, fonctionnant en parallèle pendant des semaines. Seules quelques entreprises peuvent réunir les ressources nécessaires, sans parler de l'entraînement et de la comparaison de différents modèles.

Les deux chercheurs ont montré que des modèles linguistiques des milliers de fois plus petits que les systèmes de pointe actuels apprenaient rapidement à raconter des histoires cohérentes et grammaticalement justes lorsqu'ils étaient formés de cette manière. Leurs résultats indiquent de nouvelles pistes de recherche qui pourraient être utiles pour former des modèles plus importants et comprendre leur comportement.

"J'ai trouvé tout ça très instructif", a déclaré Chandra Bhagavatula, chercheur sur les modèles de langage à l'Allen Institute for Artificial Intelligence de Seattle. "Le concept lui-même est très intéressant.

Il était une fois

Les réseaux neuronaux au cœur des modèles de langage sont des structures mathématiques vaguement inspirées du cerveau humain. Chacun d'entre eux contient de nombreux neurones artificiels disposés en couches, avec des connexions entre les neurones des couches adjacentes. Le comportement du réseau neuronal est régi par la force de ces connexions, appelées paramètres. Dans un modèle linguistique, les paramètres contrôlent les mots que le modèle peut produire ensuite, compte tenu d'une invite initiale et des mots qu'il a déjà générés.

Un modèle ne prend véritablement vie qu'au cours de la formation, lorsqu'il compare de manière répétée ses propres résultats au texte de son ensemble de données de formation et qu'il ajuste ses paramètres afin d'accroître la ressemblance. Un réseau non entraîné avec des paramètres aléatoires est trivialement facile à assembler à partir de quelques lignes de code, mais il ne produira que du charabia. Après l'entraînement, il peut souvent poursuivre de manière plausible un texte peu familier. Les modèles de plus grande taille sont souvent soumis à des réglages plus fins qui leur apprennent à répondre à des questions et à suivre des instructions, mais l'essentiel de la formation consiste à maîtriser la prédiction des mots.

Pour réussir à prédire des mots, un modèle linguistique doit maîtriser de nombreuses compétences différentes. Par exemple, les règles de la grammaire anglaise suggèrent que le mot suivant le mot "going" sera probablement "to", quel que soit le sujet du texte. En outre, un système a besoin de connaissances factuelles pour compléter "la capitale de la France est", et compléter un passage contenant le mot "not" nécessite une connaissance rudimentaire de la logique.

"Le langage brut est très compliqué", explique Timothy Nguyen, chercheur en apprentissage automatique chez DeepMind. "Pour que des capacités linguistiques intéressantes apparaissent, les gens ont eu recours à l'idée que plus il y a de données, mieux c'est".

(photo) Ronen Eldan s'est rendu compte qu'il pouvait utiliser les histoires d'enfants générées par de grands modèles linguistiques pour en entraîner rapidement de plus petits.

Introduction

Ronen Eldan, mathématicien qui a rejoint Microsoft Research en 2022 pour étudier les modèles de langage génératifs, souhaitait développer un moyen moins coûteux et plus rapide d'explorer leurs capacités. Le moyen naturel d'y parvenir était d'utiliser un petit ensemble de données, ce qui signifiait qu'il devait entraîner les modèles à se spécialiser dans une tâche spécifique, afin qu'ils ne s'éparpillent pas. Au départ, il voulait entraîner les modèles à résoudre une certaine catégorie de problèmes mathématiques, mais un après-midi, après avoir passé du temps avec sa fille de 5 ans, il s'est rendu compte que les histoires pour enfants convenaient parfaitement. "L'idée m'est venue littéralement après lui avoir lu une histoire", a-t-il déclaré.

Pour générer des histoires cohérentes pour les enfants, un modèle de langage devrait apprendre des faits sur le monde, suivre les personnages et les événements, et observer les règles de grammaire - des versions plus simples des défis auxquels sont confrontés les grands modèles. Mais les grands modèles formés sur des ensembles de données massives apprennent d'innombrables détails non pertinents en même temps que les règles qui comptent vraiment. Eldan espérait que la brièveté et le vocabulaire limité des histoires pour enfants rendraient l'apprentissage plus gérable pour les petits modèles, ce qui les rendrait à la fois plus faciles à former et plus faciles à comprendre.

Dans le monde des modèles de langage, cependant, le terme "petit" est relatif : Un ensemble de données mille fois plus petit que celui utilisé pour former GPT-3.5 devrait encore contenir des millions d'histoires. "Je ne sais pas combien d'argent vous voulez dépenser, mais je suppose que vous n'allez pas engager des professionnels pour écrire quelques millions de nouvelles", a déclaré M. Nguyen.

Il faudrait un auteur extraordinairement prolifique pour satisfaire des lecteurs aussi voraces, mais Eldan avait quelques candidats en tête. Qui peut mieux écrire pour un public de petits modèles linguistiques que pour de grands modèles ?

Toys stories

Eldan a immédiatement entrepris de créer une bibliothèque d'histoires synthétiques pour enfants générées par de grands modèles linguistiques. Mais il a rapidement découvert que même les modèles de pointe ne sont pas naturellement très créatifs. Si l'on demande à GPT-4 d'écrire des histoires adaptées à des enfants de 4 ans, explique Eldan, "environ un cinquième des histoires concernera des enfants qui vont au parc et qui ont peur des toboggans". C'est apparemment la quintessence des histoires pour enfants d'âge préscolaire, selon l'Internet.

La solution a consisté à ajouter un peu d'aléatoire dans le message. Tout d'abord, Eldan a utilisé le GPT-4 pour générer une liste de 1 500 noms, verbes et adjectifs qu'un enfant de 4 ans pourrait connaître - suffisamment courte pour qu'il puisse facilement la vérifier lui-même. Il a ensuite écrit un programme informatique simple qui demanderait à plusieurs reprises à GPT-3.5 ou à GPT-4 de générer une histoire adaptée à l'âge de l'enfant, comprenant trois mots aléatoires de la liste, ainsi qu'un détail supplémentaire choisi au hasard, comme une fin heureuse ou un rebondissement de l'intrigue. Les histoires obtenues, heureusement, étaient moins axées sur des diapositives effrayantes.

Eldan disposait désormais d'une procédure pour produire des données de formation à la demande, mais il n'avait aucune idée du nombre d'histoires dont il aurait besoin pour former un modèle fonctionnel, ni de la taille de ce modèle. C'est alors qu'il s'est associé à Yuanzhi Li, chercheur en apprentissage automatique chez Microsoft et à l'université Carnegie Mellon, pour essayer différentes possibilités, en tirant parti du fait que les petits modèles peuvent être formés très rapidement. La première étape consistait à décider comment évaluer leurs modèles.

Introduction

Dans la recherche sur les modèles de langage - comme dans toute salle de classe - la notation est un sujet délicat. Il n'existe pas de rubrique parfaite qui englobe tout ce que les chercheurs veulent savoir, et les modèles qui excellent dans certaines tâches échouent souvent de manière spectaculaire dans d'autres. Au fil du temps, les chercheurs ont mis au point divers critères de référence standard basés sur des questions dont les réponses ne sont pas ambiguës, ce qui est une bonne approche si vous essayez d'évaluer des compétences spécifiques. Mais Eldan et Li se sont intéressés à quelque chose de plus nébuleux : quelle doit être la taille réelle des modèles linguistiques si l'on simplifie le langage autant que possible ?

"Pour vérifier directement si le modèle parle anglais, je pense que la seule chose à faire est de laisser le modèle générer de l'anglais de manière ouverte", a déclaré M. Eldan.

Il n'y a que deux façons de mesurer les performances d'un modèle sur des questions aussi qualitatives : S'appuyer sur des évaluateurs humains ou se tourner à nouveau vers le GPT-4. Les deux chercheurs ont opté pour cette dernière solution, laissant les grands modèles à la fois rédiger les manuels et noter les dissertations.

Bhagavatula a déclaré qu'il aurait aimé voir comment les évaluations de GPT-4 se comparaient à celles des correcteurs humains - GPT-4 peut être biaisé en faveur des modèles qu'il a aidé à former, et l'opacité des modèles de langage rend difficile la quantification de tels biais. Mais il ne pense pas que de telles subtilités affecteraient les comparaisons entre différents modèles formés sur des ensembles similaires d'histoires synthétiques - l'objectif principal du travail d'Eldan et Li.

Eldan et Li ont utilisé une procédure en deux étapes pour évaluer chacun de leurs petits modèles après la formation. Tout d'abord, ils ont présenté au petit modèle la première moitié d'une histoire distincte de celles de l'ensemble des données d'apprentissage, de manière à ce qu'il génère une nouvelle fin, en répétant ce processus avec 50 histoires de test différentes. Ensuite, ils ont demandé à GPT-4 d'évaluer chacune des fins du petit modèle en fonction de trois catégories : créativité, grammaire et cohérence avec le début de l'histoire. Ils ont ensuite fait la moyenne des notes obtenues dans chaque catégorie, obtenant ainsi trois notes finales par modèle.

Avec cette procédure en main, Eldan et Li étaient enfin prêts à comparer les différents modèles et à découvrir quels étaient les étudiants les plus brillants.

Résultats des tests

Après quelques explorations préliminaires, les deux chercheurs ont opté pour un ensemble de données de formation contenant environ 2 millions d'histoires. Ils ont ensuite utilisé cet ensemble de données, baptisé TinyStories, pour entraîner des modèles dont la taille varie de 1 million à 30 millions de paramètres, avec un nombre variable de couches. Le travail a été rapide : En utilisant seulement quatre GPU, l'entraînement du plus grand de ces modèles n'a pas pris plus d'une journée.

Les plus petits modèles ont eu du mal. Par exemple, l'une des histoires testées commence par un homme à l'air méchant qui dit à une fille qu'il va lui prendre son chat. Un modèle à un million de paramètres s'est retrouvé bloqué dans une boucle où la fille répète sans cesse à l'homme qu'elle veut être son amie. Mais les modèles plus grands, qui sont encore des milliers de fois plus petits que GPT-3.5, ont obtenu des résultats surprenants. La version à 28 millions de paramètres racontait une histoire cohérente, même si la fin était sinistre : "Katie s'est mise à pleurer, mais l'homme s'en fichait. Il a emporté le chat et Katie n'a plus jamais revu son chat. Fin de l'histoire".

En plus de tester leurs propres modèles, Eldan et Li ont soumis le même défi au GPT-2 d'OpenAI, un modèle de 1,5 milliard de paramètres publié en 2019. Le résultat a été bien pire - avant la fin abrupte de l'histoire, l'homme menace d'emmener la jeune fille au tribunal, en prison, à l'hôpital, à la morgue et enfin au crématorium.

Introduction

Selon M. Nguyen, il est passionnant que des modèles aussi petits soient aussi fluides, mais il n'est peut-être pas surprenant que GPT-2 ait eu du mal à accomplir la tâche : il s'agit d'un modèle plus grand, mais loin de l'état de l'art, et il a été formé sur un ensemble de données très différent. "Un enfant en bas âge qui ne s'entraînerait qu'à des tâches d'enfant en bas âge, comme jouer avec des jouets, obtiendrait de meilleurs résultats que vous ou moi", a-t-il fait remarquer. "Nous ne nous sommes pas spécialisés dans cette chose simple.

Les comparaisons entre les différents modèles de TinyStories ne souffrent pas des mêmes facteurs de confusion. Eldan et Li ont observé que les réseaux comportant moins de couches mais plus de neurones par couche étaient plus performants pour répondre aux questions nécessitant des connaissances factuelles ; inversement, les réseaux comportant plus de couches et moins de neurones par couche étaient plus performants pour garder en mémoire les personnages et les points de l'intrigue situés plus tôt dans l'histoire. Bhagavatula a trouvé ce résultat particulièrement intriguant. S'il peut être reproduit dans des modèles plus vastes, "ce serait un résultat vraiment intéressant qui pourrait découler de ce travail", a-t-il déclaré.

Eldan et Li ont également étudié comment les capacités de leurs petits modèles dépendaient de la durée de la période de formation. Dans tous les cas, les modèles maîtrisaient d'abord la grammaire, puis la cohérence. Pour Eldan, ce schéma illustre comment les différences dans les structures de récompense entraînent des différences dans les schémas d'acquisition du langage entre les réseaux neuronaux et les enfants. Pour les modèles de langage, qui apprennent en prédisant des mots, "l'incitation pour les mots "je veux avoir" est aussi importante que pour les mots "crème glacée"", a-t-il déclaré. Les enfants, en revanche, "ne se soucient pas de savoir s'ils disent 'j'aimerais avoir de la glace' ou simplement 'glace, glace, glace'".

Qualité contre quantité

Eldan et Li espèrent que cette étude incitera d'autres chercheurs à entraîner différents modèles sur l'ensemble des données de TinyStories et à comparer leurs capacités. Mais il est souvent difficile de prédire quelles caractéristiques des petits modèles apparaîtront également dans les plus grands.

"Peut-être que les modèles de vision chez la souris sont de très bons substituts de la vision humaine, mais les modèles de dépression chez la souris sont-ils de bons modèles de la dépression chez l'homme ? a déclaré M. Pavlick. "Pour chaque cas, c'est un peu différent.

Le succès des modèles TinyStories suggère également une leçon plus large. L'approche standard pour compiler des ensembles de données de formation consiste à aspirer des textes sur l'internet, puis à filtrer les déchets. Le texte synthétique généré par des modèles de grande taille pourrait constituer une autre façon d'assembler des ensembles de données de haute qualité qui n'auraient pas besoin d'être aussi volumineux.

"Nous avons de plus en plus de preuves que cette méthode est très efficace, non seulement pour les modèles de la taille de TinyStories, mais aussi pour les modèles plus importants", a déclaré M. Eldan. Ces preuves proviennent d'une paire d'articles de suivi sur les modèles à un milliard de paramètres, rédigés par Eldan, Li et d'autres chercheurs de Microsoft. Dans le premier article, ils ont entraîné un modèle à apprendre le langage de programmation Python en utilisant des extraits de code générés par GPT-3.5 ainsi que du code soigneusement sélectionné sur l'internet. Dans le second, ils ont complété l'ensemble de données d'entraînement par des "manuels" synthétiques couvrant un large éventail de sujets, afin d'entraîner un modèle linguistique à usage général. Lors de leurs tests, les deux modèles ont été comparés favorablement à des modèles plus importants formés sur des ensembles de données plus vastes. Mais l'évaluation des modèles linguistiques est toujours délicate, et l'approche des données d'entraînement synthétiques n'en est qu'à ses balbutiements - d'autres tests indépendants sont nécessaires.

Alors que les modèles linguistiques de pointe deviennent de plus en plus volumineux, les résultats surprenants de leurs petits cousins nous rappellent qu'il y a encore beaucoup de choses que nous ne comprenons pas, même pour les modèles les plus simples. M. Nguyen s'attend à ce que de nombreux autres articles explorent l'approche inaugurée par TinyStories.

"La question est de savoir où et pourquoi la taille a de l'importance", a-t-il déclaré. "Il devrait y avoir une science à ce sujet, et cet article est, je l'espère, le début d'une riche histoire.

Auteur: Internet

Info: https://www.quantamagazine.org/ Ben Brubaker, 5 octobre 2023

[ synthèse ]

Commenter

Commentaires: 0

Ajouté à la BD par miguel

philosophie occidentale

Le symbolique, l'imaginaire et le réel : Lacan, Lévi-Strauss et Freud

" Tout comportement est communication." Gregory Bateson

Contrairement à l'expérience de la psychanalyse aux Etats-Unis, Freud arriva très tard en France où il fut plus ou moins réfuté par Sartre dans Son "Etre et Néant" avant même son arrivée. Curieusement, c'est à l'apogée de l'existentialisme et de la psychanalyse existentielle, dans les années cinquante et au début des années soixante, qu'un analyste français inconnu de la génération Sartre entama une relecture radicale des textes freudiens.
Son travail devait avoir une telle influence dans les années soixante-dix qu'il sauva entièrement Freud de l'orientation médicale positiviste apportée par la société psychanalytique parisienne, et réintégra son travail dans ce que les Français appellent encore les sciences humaines.
Il s'agit de Jacques Lacan, pilier de l'Ecole freudienne de Paris - styliste hermétique et obscur, conférencier envoûtant, penseur intransigeant et inflexible, profondément préoccupé par ses propres écrits et prérogatives - qui fut interdit par la Fédération internationale lorsque lui et ses collègues, principalement du à des rivalités internes, quittèrent la société parisienne en 1953.
Il y a sans doute plus d'anecdotes dénigrantes, et probablement calomnieuses, qui circulent sur Lacan au sein de l'incestueux climat intellectuel parisien que sur tout autre penseur influent. Mais si le travail de Lacan signifie quelque chose, nous devons séparer les idiosyncrasies personnelles bien connues de Lacan de la contribution unique qu'il apporta à notre compréhension de Freud.

Bien que Lacan ait commencé son oeuvre originale à la fin des années trente, sous l'influence de la phénoménologie et de l'existentialisme husserliens, ce n'est que dans les années soixante qu'il commença à être réellement écouté en France, et ses écrits ne commencèrent à arriver en Angleterre et aux Etats-Unis que récemment. S'attaquant à l'"intellectualisme" français et au culte de l'"expert", à l'"empirisme", tout comme à la "biologisation" britanniques et à l'"adaptation" et au "behaviorisme" américains dans une série de polémiques cinglantes, son seul travail a rendu impossible, à tout penseur français qui se respecte, de continuer à ignorer les textes de Freud. L'intégration de ce texte dans la culture du cogito cartésien a déjà eu des résultats surprenants et féconds. Reste à savoir ce que Lacan va faire passer aux Etats-Unis - où l'enthousiasme même de l'acceptation initiale de Freud par les Américains eut tendance à réduire ses idées à des banalités et ses théories quasi au statut de jeu social.

Nous découvrons maintenant, par exemple, un nouveau retour à la théorie de Breuer-Freud sur la catharsis thérapeutique - autrefois popularisée en tant que "psychodrame" - sous une nouvelle forme de "désublimation répressive" : thérapie du "cri primal". Mais les héros des talk-shows de fin de soirée vont et viennent avec une régularité monotone et, en fin de compte, il nous reste toujours les grandes œuvres du génie pour y méditer : Hegel, Marx, Freud, Dostoïevski, Rousseau, Balzac, pour ne citer que quelques-uns de nos prédécesseurs les plus récents. Et ce que nous découvrons, c'est que nous devons apprendre à lire avant de parler, que nous devons apprendre à les lire d'un point de vue social critique, aussi libre de préjugés ethnocentriques, socioéconomiques et culturels que possible.
En un mot, nous devons apprendre à lire dans une perspective non académique, dans la perspective d'une expérience de vie où ces auteurs et leurs quêtes personnelles font partie de notre quête individuelle et collective. Je préférerais lire l'Interprétation des rêves comme un roman, par exemple, ou le célèbre cas du docteur " psychotique " Schreber comme de la philosophie, ou les Frères Karamazov comme une étude métapsychologique, que l'inverse. Lacan a contribué à rendre ce genre de lecture possible.
Une grande partie de ce que Lacan cherchait à accomplir avec ses étudiants dans les années cinquante n'a plus grand intérêt aujourd'hui, car il s'agissait d'attaques contre la technique thérapeutique d'un groupe de psychanalystes français très peu doués, objectivées et liés à la culture. Mais son attaque contre la "psychologie de l'ego" de praticiens comme Hartmann, Kris et Lbwenstein, ou le "behaviorisme " de Massermann, est toujours valable (Lacan, 1956a ; Wilden, 196Sa : 1-87). Et ceux qui s'y sont opposés avec tant de véhémence en France constatent aujourd'hui qu'ils ne peuvent rejeter ses analyses critiques des textes freudiens et s'appeler encore Freudiens. Mais si Lacann inspira une école française d'analyse qui se veut anti-institutionnelle, anti-psychiatrique et profondément critique à la fois à l'égard de "l'ajustement" de l'individu et de ceux que Marcuse nommait "révisionnistes néofreudiens", il n'a probablement pas fait plus pour les pratiques analytiques que ce qui a été réalisé par des thérapeutes comme Laing, Esterson et Cooper, au Royaume-Uni, et par des gens comme Ruesch, Bateson, Haley, Weakland ou Jackson, aux Etats-Unis.
De plus, la psychanalyse est un privilège socio-économique réservé aux personnes qui ont argent et loisirs pour se faire plaisir. La question de "la guérison" est en tout cas tout à fait débattable, et nous savons bien que la psychologie, la psychiatrie et la psychothérapie en général ont toujours été les véhicules des valeurs du statu quo (à l'exception extraordinaire de Wilhelm Reich, dont les théories ne correspondent malheureusement jamais au niveau élevé de son engagement social).
Et comme la plupart d'entre nous apprenons à vivre avec nos blocages, il est alors très peu probable que nous devions apprendre un jour apprendre à vivre avec les effets aliénants de notre société unidimensionnelle et technologique en ayant à nous préoccuper de psychanalyse ? En tout état de cause, personne, en quête d'une perspective véritablement critique, ne tentera de construire une théorie de l'homme et de la femme essentiellement basée sur la psychologie humaine, car le "discours scientifique" de la psychologie vise à nier ou à omettre le contenu socio-économique collectif à l'intérieur duquel les facteurs psychologiques jouent leur rôle.
J'essaierai de montrer plus loin que l'axiomatique fermeture de la plupart des psychanalystes dans la plénitude de ce contexte - et, je crois, dans sa primauté - génère des problèmes purement logiques dans la théorie, problèmes dont elle n'est pas, logiquement, équipée pour les surmonter. Ainsi, ce qui apparaît dans la théorie logico-mathématique de Bateson de la " double liaison " (chapitre V) comme une oscillation, apparaît nécessairement en psychanalyse, sous une forme ou une autre, comme une théorie de la répétition. Lacan, par exemple, fit appel à Kierkegaard (Repetition, 1843) pour étayer son interprétation de Freud, et pourtant si l'on regarde de près les écrits de Kierkegaard, en particulier les siens propres ou ceux également publiés en 1843, on découvre que la théorie entière dépend de l'incapacité de Kierkegaard à dépasser, de manière logique ou existentielle, les injonctions (doubles liens) paradoxales qu'il reçoit de son environnement familial et social. Par conséquent, le voilà condamné à osciller sans cesse entre un "soit" et un "ou". Ce qui apparaît dans la théorie de Bateson comme une réponse nécessaire aux injonctions émanant des rapports de pouvoir et de domination dans l'ordre social, et qui apparaît généralement dans la psychanalyse, et plus particulièrement chez Lacan, comme de la "compulsion itérative". Ainsi, soit la responsabilité est renvoyée à l'individu (par les "instincts" ou quelque autre métaphore de ces constructions biomécaniques), soit, comme chez Lacan, elle se transforme subtilement en une forme "d'ordre naturel des choses", via les paradoxes que le langage crée dans la condition humaine.
Contrairement à la théorie du double lien, les deux points de vue supposent une homogénéité dans la société qui n'existe tout simplement pas et servent à rationaliser les dominations en refusant de traiter la relation entre pouvoir, connaissance et oppression, ils ne voient pas la différence, dans la société, entre ce que Marcuse appela "répression" et "sur-répression". Malgré l'incompréhension de Marcuse à l'égard du Freud "clinique" - et malgré sa dépendance à la théorie bioénergétique des instincts - la distinction est importante. Peu de théoriciens américains, par exemple, envisageraient sérieusement le calvaire des minorités américaines dans leur lutte pour les droits socio-économiques élémentaires, simplement en termes de "compulsion itératives" telle une révolte contre le père (ou la mère).
Il m'est impossible de parler de Freud ou de Lacan sans utiliser les contributions que Bateson et Marcuse - de manières différentes et même mutuellement opposées - ont apportées à notre compréhension des relations humaines. Il faut d'une part traiter la perception de la psychanalyse et de la psychologie comme des rationalisations des valeurs de notre culture (l'oppression des femmes, en particulier), et d'autre part, montrer comment elles peuvent contribuer à une dévalorisation de ces valeurs. L'analyse de Bateson des relations de pouvoir par la double contrainte est, je crois, essentielle à la théorie sociale et psychologique, et je ne sais comment expliquer la théorie de l'imaginaire de Lacan sans elle. En tout cas, Freud décrit la relation entre l'ego et l'idéal de l'ego en des termes similaires à ceux d'une double liaison (double bind, dans The Ego and the I, Standard Edition, XIX, 34) : "Tu devrais être ainsi (comme ton père), mais tu ne dois pas être ainsi (comme ton père)."
Dans le monde contemporain de la contestation, il n'y a aucune réponse à la façon dont la psychanalyse est régulièrement - et nécessairement - remise en question, si le Freud dont nous parlons est le déterminant hydraulique, instinctif, électromagnétique et entropique que nous pensions tous connaître.
Il y a une réponse, cependant, si nous découvrons la perspective communicationnelle et linguistique derrière l'acceptation explicite ou implicite par Freud des principes mécanistes de la science physique et économique du XIXe siècle. Après tout, la psychanalyse est bien la "cure parlante", comme Lacan n'a jamais manqué d'insister dessus, et les pages des écrits de Freud s'intéressent avant tout au langage. Bien plus intéressante que la théorie de l'ego, de la personnalité et du surmoi, par exemple, est la conception que Freud a de l'inconscient et du rêve comme des scènes (Darstellungen) de distorsions (Entstellungen) et de (re)présentations (Vorstellungen). Mieux que coller à la préoccupation contemporaine pour les systèmes et les structures que la "psychologie de l'ego" de Freud, dans son premier modèle de processus primaires et secondaires. Plus significative que son déterminisme il y a sa théorie de la "surdétermination" du symptôme ou du rêve, qui est un concept proche de la redondance en théorie de l'information et de l'équifinalité en gestaltisme et biologie.
Si nous devons rejeter les principes mécanistes du principe du plaisir, nous pouvons encore découvrir le modèle sémiotique des niveaux de communication dans les premiers travaux de Freud. Plus utile que la "deuxième" théorie du symbolisme (dérivée de Stekel), qui assimile les icônes ou les images (analogues) aux symboles sexuels (Jones, Ferenczi, et al.), est la "première" ou théorie "dialectique", qui dépend de la condensation et du déplacement des signes (Zeichen). Le rêve doit être traduit de l'image en texte avant de pouvoir être interprété (par le rêveur), et la refoulement est, comme le disait Freud en 1896, "un échec de la traduction". De plus, aucune théorie actuelle de la mémoire n'est essentiellement différente de la métaphore originale de Freud sur le "traçage" de voies via les traces de mémoire dans le cerveau.Je reviendrai dans un instant sur une description plus précise de l'orientation sémiotique et linguistique de Freud. Le fait est que, sans le travail de Lacan, je doute que nous aurions découvert ce Freud - bien que l'analyse de Karl Pribram du Projet neuropsychologique pour une psychologie scientifique (1895) aille dans le sens d'une relecture de Freud au moins au niveau de la théorie de l'information et du feedback (Pribram, 1962).
Le problème avec Lacan, c'est qu'à première vue, ses écrits sont presque impossibles à comprendre. Ses Ecrits (1966) - et seul un Lacan pouvait avoir l'orgueil d'intituler son oeuvre simplement "Écrits" - titre peut-être plus à lire comme "discours de schizophrène" - ou comme de la poésie ou autres absurdités, selon vos préjugés et votre tendance au transfert positif ou négatif - que tout autre.
L'hermétisme de Lacan ne peut être excusé - pas plus que son attitude envers le lecteur, qui pourrait s'exprimer ainsi : "aime-le" ou "c'est à prendre ou à laisser". Mais bien que la destruction personnelle de la syntaxe française par Lacan le rende assez ardu même pour le lecteur français, il y a au moins une tradition intellectuelle suffisamment homogène à Paris qui fait que Lacan y est bien moins étranger qu'en Grande-Bretagne ou aux Etats Unis. La tradition phénoménologique, existentialiste et hégélienne-marxiste en France rend moins nécessaire d'expliquer ce que vous entendez par Hegel, ou Husserl, ou Heidegger, ou Kojéve, ou Sartre. Et la plupart des gens reconnaîtront de toute façon une idée, même si vous ne mentionnez pas la source, ou si vous citez ou paraphrasez sans référence, car ce genre de "plagiat" est généralement acceptable en France.
Fait assez significatif cependant, Lacan n'aurait pas pu réaliser son analyse de Freud sans l'influence de l'école de linguistique suisso-américano-russe représentée par Roman Jakobson, qui a longtemps témoigné de l'influence du formalisme russe et du linguistique structurel de Saussure aux Etats-Unis. Mais même cette influence est parvenue indirectement à Lacan. L'influence la plus importante sur Lacan fut celle de l'anthropologue structurel français Claude-Lévi-Strauss, qui rencontra et travailla avec Jakobson à la New School for Social Research de New York, en 1942-1945.

Lévi-Strauss tend à ne pas être très apprécié par les anthropologues américains et britanniques qui sont redevables à la tradition analytique et dite empiriste, ce qui en dit long sur lui. Il est à l'origine d'une nouvelle méthodologie et d'une épistémologie d'accompagnement en sciences humaines en France, généralement appelée "structuralisme". (Aujourd'hui, cependant, le terme désigne simplement une mode, un peu comme l'existentialisme.) Le structuralisme, dans le sens d'une méthodologie non empiriste, non atomiste, non positiviste des lois de la relation, est d'autre part complété par les avancées en théorie des systèmes généraux, en cybernétique non mécanique, en théorie de la communication et en études écologiques. Tant la nouvelle approche structurelle que la nouvelle approche systémique-cybernétique semblent parler en fait d'une véritable révolution épistémologique dans les sciences de la vie et les sciences sociales, dont nous entendrons beaucoup plus parler au cours de la prochaine décennie (si nous y survivons, bien sûr).
Lévi-Strauss chercha à utiliser les travaux des phonologues structuraux sur "l'opposition binaire" des phonèmes en tant que modèle pour l'analyse des mythes et des relations et échanges au sein des sociétés dites "primitives" - dont il a ensuite remis en question le supposé "primitivisme". Constatant qu'un nombre relativement faible d'"oppositions" entre "traits distinctifs" (graves/aigus, voix/silence, etc.) sont suffisants pour former l'infrastructure acoustique de toute langue connue, Lévi-Strauss tenta de découvrir des ensembles analogues d'oppositions dans les systèmes de parenté et dans les mythes. Ses travaux les plus récents se sont concentrés sur le mythe en tant que musique.
Avec tous ces machins douteux dans son approche, Lévi-Strauss a néanmoins introduit un type de signification dans l'étude du mythe - auparavant presque exclusivement axé sur le contenu plutôt que sur la forme - là où ça n'existait pas avant. Comme pour l'œuvre de Lacan - ou celle de Freud - le principal problème du structuralisme lévi-straussien ne réside pas dans la méthodologie, mais dans son application, c'est-à-dire dans les revendications universelles formulées en son nom.
Je reviendrai sur la critique plus détaillée du "structuralisme" dans les chapitres suivants. Pour l'instant, il suffira de donner un exemple bref et purement illustratif de l'utilisation par Lévi-Strauss du concept d'"opposition binaire" dans l'étude du mythe (Lévi-Strauss, 1958 : chap. 11).
Pour lui, le mythe est une représentation diachronique (succession dans le temps) d'un ensemble d'oppositions synchroniques (intemporelles). Il croit que la découverte de ces oppositions synchroniques est une déclaration sur la "structure fondamentale de l'esprit humain". Dans les chapitres suivants, j'analyserai et critiquerai le terme "opposition" - qui cache les catégories de "différence", "distinction", "opposition", "contradiction" et "paradoxe" . Je critiquerai également le concept de relations "binaires" " - qui dissimule toute une série de malentendus sur la communication analogique et numérique en général, et plus particulièrement sur "non", "négation", "exclusion", "zéro" et "moins un", ainsi que sur la relation entre "A" et "non-A". J'essaierai également de démontrer l'idée fausse que Lévi-Strauss se fait de la confusion entre "esprit", "cerveau" et "individu". Ceci est étroitement lié à la conception de Piaget de l'organisme comme "structure paradigmatique", et à l'incapacité, dans la plupart des travaux actuels en sciences de la vie et sciences sociales, de comprendre le problème logico-mathématique et existentiel des frontières et des niveaux dans les systèmes ouverts de communication et d'échange (systèmes impliquant ou simulant la vie ou "esprit", systèmes vivants et sociaux).

La méthode de lecture des mythes de Lévi-Strauss est entièrement nouvelle, simple à comprendre, globale et satisfaisante sur le plan esthétique. Il suggère de regarder le mythe comme on regarderait une partition d'orchestre dans laquelle les notes et les mesures à jouer en harmonie simultanée par différents instruments se sont mêlées à la cacophonie d'une succession linéaire. Ainsi, si nous représentons cette succession par les nombres 1, 2, 4, 7, 8, 2, 3, 4, 6, 8, 1, 4, 5, 7, nous pouvons rétablir la partition originale en mettant tous les nombres semblables ensemble en colonnes verticales :

112234444567788

Cette matrice est exactement ce que l'on peut construire dans l'analyse phonologique d'une phrase, où l'on peut montrer qu'une séquence linéaire de mots se construit sur une succession d'oppositions binaires entre des éléments acoustiques distinctifs.
Malheureusement pour ce que Lévi-Strauss considère comme la clé de voûte de sa méthode, l'analogie qu'il fait entre phonologie structurelle et mythe est fausse, alors que sa méthodologie est extrêmement fertile. Ce problème met en évidence la difficulté centrale de l'utilisation de l'œuvre de Lévi-Strauss et de Lacan. Il faut montrer que les sources supposées de leurs nouvelles contributions aux sciences sociales ne sont pas ce qu'elles pensent être ; il faut démontrer où et comment leurs points de vue servent une fonction idéologique répressive ; et il faut montrer l'inadéquation à la fois de nombreux axiomes de la méthode et de nombreuses applications supposées.

Sans développer une critique détaillée à ce stade, on peut dire d'emblée que c'est une erreur de traiter un système d'oppositions sans contexte entre caractéristiques acoustiques des "bits" des informations (traits caractéristiques) comme étant isomorphe avec un mythe, qui est un système avec un contexte. Le mythe est nécessairement contextuel parce qu'il manipule l'information afin d'organiser et de contrôler certains aspects d'un système social, et il ne peut donc être considéré comme isolé de cette totalité. Contrairement aux "mythemes" de Lévi-Strauss ("éléments constitutifs bruts" du mythe, par analogie avec le "phonème"), les phonèmes sont des bits d'information insignifiants et non significatifs. Les phonèmes et les oppositions phonémiques sont les outils d'analyse et d'articulation (dont la caractéristique fondamentale est la différence) dans un système dans lequel signification et sens sont en dehors de la structure phonémique. Mythemes' et oppositions' entre mythemes, au contraire, impliquent à la fois signification et sens : ils ont 'du contenu'. Lévi-Strauss traite le mythe comme s'il s'agissait d'une langue représentative sous la forme d'une grammaire sans contexte, ou traite les mythemes comme des "informations" au sens technique des systèmes quantitatifs fermés de la transmission des informations comme étudiés par Shannon et Weaver. La science de l'information concerne l'étude statistique des processus stochastiques et des chaînes de Markov (chapitre IX) - et Chomsky a démontré qu'aucun langage connu ne peut être correctement généré à partir d'une grammaire modelée sur ces processus. Il a également été démontré que le langage est un système d'un type logique supérieur à celui qui peut être généré par des algorithmes sans contexte (grammaires).

Bien que Lévi-Strauss parle du mytheme comme d'un caractère "supérieur" à tout élément similaire du langage, le modèle de l'opposition phonémique binaire reste ce qu'il considère comme le fondement scientifique de sa méthode. Ainsi le mytheme devient l'équivalent d'un outil d'articulation (un trait distinctif) employé par un système de signification d'un autre type logique (langage). Lorsque nous cherchons à découvrir ce qu'est cet autre système chez Lévi-Strauss, nous trouvons cette catégorie de "pensée mythique". Mais la pensée mythique est déjà définie sur la base des mythemes eux-mêmes. C'est un système d'articulation des oppositions par "une machine à supprimer le temps" (le mythe). Ce qui manque dans ce cercle, c'est le contexte réel et matériel dans lequel le mythe surgit et auquel il fait référence.
Cependant, Lévi-Strauss insistera sur le fait que sa méthodologie, contrairement au formalisme pur, est bien "contextuelle" (Lévi-Strauss, 1960a). Il se réfère constamment aux catégories de parenté, au contexte zoologique et botanique du mythe et aux caractéristiques des entités matérielles ("crues", "cuites", "pourries" et ainsi de suite). En réalité, cependant, toutes les "entités matérielles" et les "relations matérielles" qu'il emploie parviennent à cette analyse déjà définie, de façon tautologique, comme des catégories de pensée mythique. Par conséquent, le "contexte" qu'évoque Lévi-Strauss est invariablement le contexte des "idées" ou de "l'esprit", qu'il conçoit, comme Kant, comme étant un antécédent de l'organisation sociale, tant épistémologiquement qu'ontologiquement. Au sein de ce cadre idéaliste, il fait ensuite un saut rapide vers les catégories matérielles de la physique et de la chimie, qu'il évoque régulièrement comme le fondement ultime de ses catégories idéales.

Mais entre le contexte des idées et le contexte des atomes et des molécules (ou même celui du code génétique) il manque un niveau d'organisation unique mais énorme : le contexte socio-économique de la réalité humaine. Et ce niveau d'organisation contient un paramètre que l'on ne retrouve pas en physique, en biologie, en sciences de l'information, dans les langages, les idées, ou les mythes considérés comme systèmes d'opposition synchrones : la ponctuation du système par le pouvoir de certaines de ses parties à en exploiter les autres (en incluant la "nature" même). Toutes les idées, tous les électrons et "bits" d'information sont en effet égaux, aucun d'entre eux n'est différent des autres, et aucun groupe n'exploite les autres. Et alors que dans les systèmes qui n'impliquent pas l'exploitation sociale, les mythes peuvent à juste titre être considérés comme remplissant une fonction d'organisation "pure" ou "neutre", dans tous les autres systèmes, les mythes deviennent la propriété d'une classe, caste ou sexe. Un mythe qui est la propriété d'une classe est en fait une définition de l'idéologie. Le mythe cesse alors de servir la fonction neutre d'organisation pure et simple ; il sert de rationalisation d'une forme donnée d'organisation sociale.
L'étude structurelle du mythe est, comme Lévi-Strauss l'a souvent dit, une autre variante des mythes qu'il analyse. Comme eux, c'est un système d'oppositions binaires. Mais ce n'est pas une mécanique pour la suppression du temps, mais pour la suppression de l'histoire. Et puisque le "structuralisme" est effectivement la propriété d'une classe, nous pouvons donc l'identifier comme un système de rationalisation idéologique - ce qui n'est pas la même chose, de dire qu'il n'a aucune valeur.

L'analogie erronée de Lévi-Strauss entre un système sans contexte et un système contextuel - et donc tout l'édifice que les structuralistes ont érigé - provient d'une confusion entre langage et communication. D'une part, une telle confusion n'est possible que dans des théories ponctuées de façon à exclure la catégorie sociale objective de l'exploitation. D'autre part, elle dépend d'une unique isomorphie réelle, qui est ensuite utilisée pour réduire les différents niveaux d'organisation les uns par rapport aux autres : le fait que le langage, les systèmes de parenté, l'étude structurelle des mythes et la science de la phonologie soient des communications numériques (discontinues) au sujet de rapports analogues (continus). Une caractéristique unique de la communication numérique, à savoir qu'il s'agit d'un système de communication comportant limites et lacunes, est réifiée par l'argument structuraliste de sorte qu'il peut être appliqué sans distinction, comme catégorie ontologique implicite, à chaque niveau de complexité où apparaissent des "limites et des lacunes ". De telles formes numériques apparaissent nécessairement, comme instrument de communication, à tous les niveaux de complexité biologique et sociale. Par conséquent, l'argument réductionniste des structuralistes est grandement facilité. De plus, le fait que l'opposition binaire soit aussi une catégorie importante en physique classique (électromagnétisme par exemple) autorise les structuralistes à faire l'erreur épistémologique supplémentaire de confondre matière-énergie et information.

Auteur: Wilden Anthony

Info: Extrait de System and Structure (1972) sur http://www.haussite.net. Trad. Mg

[ anti structuralisme ] [ vingtième siècle ]

Commenter

Mis dans la chaine

Commentaires: 0

Ajouté à la BD par miguel

Afrique-Occident

Robert Farris Thompson: les canons du Cool
Une bouteille de Cinzano, une boîte de fixatif, un chandelier à sept branches, une machette et un juke-box cassé sont des objets de dévotion ornant l'autel d'un temple vodun ("vaudou") en périphérie de Port-au-Prince. Le temple est situé dans l'enceinte d'André Pierre, prêtre vodun et peintre, en bordure d'un fossé sur la route du Cap-Haïtien. Il y a des voitures accidentées dans la cour, des chiens, des chèvres et un petit taureau attaché. En arrivant de l'aéroport international François Duvalier, l'esprit prédisposé aux présages, je ne peux m'empêcher de remarquer un grand panneau de signalisation à proximité. On y lit "LA ROUTE TUE ET BLESSE."

Robert Farris Thompson et moi sommes descendus de New York vers Haïti pour passer le week-end avec André Pierre et Madame Nerva, une prêtresse vaudou. Thompson est historien de l'art, professeur titulaire à Yale et maître au Timothy Dwight College. Je suis un de ses anciens élèves, venu voir Bob faire ce qu'il nomme "un petit sondage". André Pierre est le Fra Angelico haïtien, un clerc vodun dont les toiles sont accrochées au musée national de Haïti; des copies de son travail remplissent les porte-cartes de l'aéroport. La femme, les enfants et les enfants des cousins d'André Pierre légument dans l'ombre alors que Thompson fait pénétrer sa voiture de location verte dans l'enceinte, criant: "Bam nouvelle" et "Comment ouyé?"

Nous retrouvons André Pierre, petit, noir, visage marqué, dans la chaleur de son atelier. Les murs sont couverts de brillants motifs vodun - diptyques et triptyques d'Ogûn, dieu du fer; Agoué, seigneur de la mer; Erzuli, déesse de l'amour; et Damballah, dieu serpent de la créativité, de la fécondité et de la pluie. À côté du chevalet, il y a un uniforme militaire à glands pour le Baron Samedi, seigneur des cimetières, soigneusement protégé dans son sac de nettoyage à sec.

Avec la révérence et l'attitude d'un abbé pilotant ses visiteurs dans un vénérable monastère du sud de la France, André Pierre nous fait visiter ce temple d'étain ondulé. Il nous montre des salles-autels contenant des tambours, des bassins, des faux, des cartes à jouer, de l'alcool, des fouets et des lits (dans lesquels André Pierre dort quand il passe la nuit avec une divinité particulière). Il s'exprime via une sorte de flux créole théoloco-vodun tout en marchant et en pointant des choses. Soudain, André Pierre se met à chanter pour illustrer une idée particulière; elle correspond à un tableau et il l'explique, de la même façon qu'un requiem correspond à une crucifixion. Thompson attrape un tambour et commence à tambouriner et à chanter. Lorsqu'ils ont fini, en geste de célébration, ils versent chacun une cuillerée de liqueur de racine sur le sol. Thompson m'avertit à part en anglais de faire attention près des bassins en pierre dans la pièce sombre, car c'est un de ceux dédiés à Damballah, le dieu serpent, et ils contiennent parfois des serpents.

À la tombée de la nuit, Thompson, polo humide de transpiration, a empli un carnet et demi de croquis et de notes, commencé une monographie sur l'iconographie de 10 peintures vodun, tambouriné, bu des coups et pris rendez-vous pour revenir tôt le lendemain. Alors que nous partons à la recherche de notre hôtel, Thompson, excité, m'explique les subtilités morales de tout ce que nous avons vu. Il me parle de notre emploi du temps: nous devons aller demain soir à Jacmel, de l'autre côté des montagnes, voir Madame Nerva célébrer les rites de la déesse de l'amour, Erzuli. Je suis épuisé, ayant trouvé que le voyage de Manhattan au temple d'André Pierre en un après-midi c'est déjà beaucoup. Thompson ne semble ressentir aucune tension suite à cette journée; il entre en Haïti tout en fluidité. En fait il semble juste revenir chez lui.

Blanc de peau, blanc de cheveux et blanc d'origine, d'éducation et de par sa société, Robert Farris Thompson est tombé amoureux de la musique noire, de l'art noir et de la négritude il y a 30 ans et a basé toute sa carrière sur cette passion particulière. Suivant cet instinct, suscité par un mambo entendu en 1950, Thompson a appris couramment le ki-kongo, le yoruba, le français, l'espagnol et le portugais et s'est familiarisé avec une vingtaine de langues créoles et tribales; il a parcouru la forêt de l'Ituri au Zaïre avec des pygmées; est grand connaisseur du vaudou; a écrit quatre livres sur la religion, la philosophie et l'art ouest-africains; a organisé deux grandes expositions à la National Gallery de Washington. Il est également devenu, dansant dans un costume indigo brodé de coquillages pris sur les gésiers de crocodiles morts, "universitaire junioir membre de la Basinjon Society", agence tribale camerounaise qui contrôle la foudre et autres forces naturelles.

Incorporant l'anthropologie, la sociologie, l'ethnomusicologie et ce que Thompson nomme une "bourse scolaire pour guérilla" (il dit : "laissons les crétins se débrouiller avec ça"), la carrière de Thompson tend vers une seule fin: un savant plaidoyer de la civilisation atlantique noire. Il passe sa vie à poursuivre ce frisson cérébral qui est de rendre cohérent et significatif tout ce qui est mal compris, ou vu comme aléatoire, superficiel ou obscur à son sujet. Comme un historien de l'art extrairait des plans détaillés de la basilique une compréhension de l'esprit médiéval ou de la statuaire romaine tardive une compréhension du déclin de l'empire, Thompson travaille sur l'iconographie de la salsa, les pas de danse, les vêtements, la sculpture, le geste et l'argot pour une définition de la négritude. Il aime montrer à quel point le "primitif" est sophistiqué. Comme archéologue, il donne vie à des artefacts; comme critique, il les déchiffre; et comme vrai croyant, il promeut leur valeur artistique et spirituelle.

Le dernier livre de Thompson, Flash of the Spirit, explique les racines de l'influence africaine dans le Nouveau Monde. Il est une sorte de Baedeker du funk. Un critique a écrit: "Ce livre fait pour l'histoire de l'art ce que le dunk shot a fait pour le basket-ball."

Sous la manche droite de sa chemise Brooks Brothers, Bob Thompson porte le bracelet d'initiation en maille de fer de la divinité chasseuse de rivière Yoruba. Avec ses deux enfants, son récent divorce, ses études à Yale et Andover et ses 55 ans, il ressemble à un avocat d'entreprise en pleine forme ou à un brillant dirigeant pétrolier américain qui aurait mené une carrière polyglotte à l'étranger. Il vit à New Haven, dans le manoir géorgien du maître du collège, où l'on peut entendre le son des percussions résonner dans la cour.

En parallèle à Yale, ses élèves, des bonnes bouffes et de ses conférences, au travers de rencontres au coin de la rue et de conversations précieuses, Thompson fait du prosélytisme. Il enseigne à 100 ou 150 étudiants chaque trimestre et possède l'enthousiasme amusé d'un élève de premier cycle. Le reste de l'université connaît Thompson sous le nom de "Mambo". Pour clarifier ils diront même "noir comme Bob". Ce qui compte, c'est que le président de Yale, Bart Giamatti, brillant franc-tireur lui-même, admire suffisamment la singularité intrépide de Thompson pour l'avoir reconduit dans ses fonctions durant cinq ans.

Sur le campus, les affiches du Chubb Fellowship expriment un peu mieux le statut de Thompson et sa particularité majeure. La bourse Chubb est un programme destiné à amener des visiteurs politiques sur le campus, elle est aussi étoffée que les bourses bien dotées peuvent l'être. Pendant le mandat de Thompson, des personnages habituels - Walter Mondale, Alexander Haig, John Kenneth Galbraith - furent parmi les conférenciers invités. Des affiches commémorant leurs visites tapissent les murs de la maison du maître comme des trophées sportifs de conférences. Une affiche, plus grande et plus audacieuse que les autres, est suspendue dans le bureau de Thompson. Elle annonce que la Chubb Fellowship parraine, pour un colloque et une réception au Timothy Dwight College, une visite de Son Altesse le Granman de la Djuka, du Surinam, "roi afro-américain véritable".

Bob Thompson donne des cours à sa classe comme un prédicateur fondamentaliste réveille sa congrégation, genoux pliés, microphone branché, le fil traînant derrière lui. Il marche parmi les 200 étudiants qui débordent de l'auditorium de Street Hall dans le couloir. Le cours d'automne de Thompson, HoA 379a, est intitulé "La structure du New York Mambo: le microcosme de la créativité noire". Sur scène, un magnétophone émet un jog pygmée; du pupitre vacant pend une carte des dominions tribales ouest-africaines; et sur l'écran : des diapositives flash de Harlem, des pygmées, des tissus de motifs syncopés et des sculptures funéraires influencées par le Kongo des cimetières de Caroline du Nord. "Pourquoi" demande Thompson, "les Noirs sont-ils si impertinents ?"

La réponse commence par l'étymologie de l'expression "descendre - get down". Il passe aux concepts yoruba de cool (itutu) et de commandement (àshe); il parle durant une marche latérale et aussi sagittale (d'avant en arrière ou inversément); de l'esthétique de la batterie; de l'importance du phrasé décalé (off-beat/à contre-temps) ; des appels et réponses; et enfin de Muhammad Ali. Puis la voix de Thompson redevient celle du prof sérieux standard et il énumère une litanie d'influences africaines:

"Une grande partie de notre argot fut créée par des gens qui pensent en yoruba et en ki-kongo, tout en parlant en anglais. Les sons de base de l'accord et du désaccord, uh-huh et unh-unh, sont purement ouest-africains. Funky est du Ki-Kongo lu-fuki, "sueur positive". Boogie vient de Ki-Kongo mbugi, qui signifie "diablement bon". Le jazz et le jism dérivent probablement de la même racine Ki-Kongo dinza, qui signifie "éjaculer". Mojo vient du terme Ki-Kongo pour "âme"; juke, comme dans jukebox, de Mande-kan qui veut dire 'mauvais'; et Babalu-Aye - comme pourle disc-jockey Babalu - est du Yoruba pur et simple qui signifie "Père et maître de l'univers".

"La plupart de nos danses de salon sont africanisées" poursuit-il, "la rhumba, le tango, même les claquettes et le Lindy. Le poulet frit est africain. Et le short patchwork J. Press est lié à un tissu d'Afrique. Même le cheerleading incorpore certains gestes Kongo apparents: main gauche sur la hanche, main droite levée faisant tournoyer un bâton. Il s'est développé au travers des groupes Vodun Rara de la Nouvelle-Orléans jusqu'au spectacle de la mi-temps des Cowboys de Dallas."

"Laisse-moi te raconter comment tout ceci s'est mis en marche", explique Thompson, assis dans un restaurant du campus. "J'ai grandi au Texas; J'étais fou de boogie. Je n'étais pas footballeur ou quoi que ce soit, et je me rends compte maintenant que tous les éléments d'attractivité que j'avais pour les filles étaient à la fois musicaux et influencés par les noirs. Durant ma dernière année à l'école préparatoire, je suis allé en voyage à Mexico. Il y avait ce mambo - Mexico était inondé de mambo - j'ai entendu des serveurs le fredonner, je l'ai entendu sur les lèvres des préposés de station-service, je l'ai entendu en arrière-plan lorsque je parlait au téléphone de l'exploitant de l'hôtel. Ce fut mon premier bain complet de musique africaine: polyphonie noire totale, multimétrie mambo. Une femme magnifique s'est arrêtée devant moi dans un café; elle a écouté cette musique et je l'ai entendue dire à son compagnon: "Mais chéri, c'est un rythme si différent."

Un mambo, titré La Camisa de Papel - de Justi Barretto, est l'icône principale de la carrière de Thompson. Une partie brisée du disque mexicain 78 tours, chanté par Perez Prado, est encadré dans son étude. "Plus précisément, il s'agit d'un noir qui porte une chemise littéralement composée de mots effrayants - d'assemblage de titres de journaux. La chanson ne craignait pas d'aborder un sujet fort - celui du début de la guerre de Corée et de la peur de la guerre thermonucléaire. Une phrase dit: "Hé, homme noir, t'as les nouvelles?" J'ai été irradié par cette musique, désespérément accro au mambo."

En 1954, Thompson passa les vacances de Thanksgiving de sa dernière année à Yale enfermé à l'hôtel Carlton House à New York, essayant de commencer un livre. Il l'avait titré : Notes vers une définition de Mambo. "Mon père était chirurgien, et avec ma mère ils étaient un peu déboussolés par ce que je faisais: 'Mon fils le mambologue!!??' Alors que j'essayais de leur expliquer cette passion..."

"La musique questionnait", dit Thompson, "et l'histoire de l'art fut la réponse." Il décida de devenir étudiant à Yale. "Plus j'étudiais, plus je voyais comment le monde avait dissimulé la source de tout cela. Ce n'était pas de la musique latine - c'était de la musique Kongo-Cubano-Brésilienne. Vous pouvez entendre les rythmes Kongo dans "The Newspaper Shirt". Et mambu en Ki-Kongo signifie "questions, questions importantes, texte". Un mambo est un séminaire sur l'entrecroisement des courants africains.

"Ce sont quelques-uns des fils du tissu: la salsa et le reggae partagent l'impulsion du mambo, et la composante mambo est à son tour sortie de Cuba en fin des années 1930. Le yoruba y est encore parlé. Si vous étiez Yoruba et pris en esclavage au XIXe siècle, vous risquiez de vous retrouver à Cuba ou dans le nord-est du Brésil. La culture afro-cubaine a survécu à l'esclavage. Ces rythmes afro-cubains sont chauds, âcres et cahotants. J'ai passé ma vie de critique littéraire", dit-il, "à essayer de rassembler tous les textes pertinents pour décoder "The Newspaper Shirt Mambo".

La prochaine étape importante dans le développement de Thompson fut une bourse de la Fondation Ford pour aller au Yoruba-land (Nigéria) pour un travail sur le terrain; il a fait 14 allers-retours entre Yale et l'Afrique. Thompson habite les deux mondes. Il raconte par exemple comment un grand prêtre de la religion Yoruba à New York est venu le voir à New Haven. La voiture du prêtre yoruba est tombée en panne. Thompson raconte que le prêtre a ouvert le capot, puis a emprunté du rhum à Thompson pour faire une brume de rhum qu'il a soufflé de sa bouche sur le moteur surchauffé (c'est un geste yoruba pour refroidir les choses). Ensuite, le prêtre a sorti sa carte de l'American Automobile Association et a appelé Triple-A.

Dans ce processus pour accéder à Yale, Thompson a publié Black Gods and Kings, The Four Moments of the Sun et African Art in Motion, à propos de l'esthétique entrelacée de la sculpture, du tissu et de la danse ouest-africains. "Flash of the Spirit" atteint maintenant des lecteurs qui ne sont pas des spécialistes, des iconographes ou des universitaires. Son prochain livre, enfin, dans 30 ans, sera le "livre mambo".

"Chaque vague d'immigration successive - dominicaine, porto-ricaine, haïtienne, jamaïcaine - améliore la musique. On peut parler de "conjugaison" d'un battement. C'est explosif. La salsa fut le tournant majeur - en 1968, New York est devenue pratiquement la capitale musicale du monde latin. Et tout cela est en pollinisation croisée avec du jazz et de la pure musique yoruba comme King Sunny Ade, et puis, via des réverbérations secondaires, vers des groupes blancs, comme les Talking Heads.

"La musique est un domaine où l'influence noire est omniprésente. Leurs rythmes secouent ce siècle. Quoi qu'on ait pu refuser aux Noirs, les ondes sont à eux. À l'heure actuelle, d'importantes collisions culturelles ont lieu à New York. La ville est devenue un organe coloré des cultures. Si vous avez manqué le Ballet Russe et le Rite de Stravinsky à Paris au début du siècle, ne vous inquiétez pas. Il y a maintenant des événements de cet ordre stravinskien dans le quartier."

"New York en tant que ville africaine secrète" voilà ce que Thompson appelle son cours de premier cycle à Yale. "Quasi voyage scolaire" que nous entreprenons tous les deux un jour et qui commence à 89th Street et sur Amsterdam Avenue dans un botanica, ou boutique d'articles religieux, où les autels fumants des divinités ouest-africaines partagent l'espace avec Pac-Man et Donkey Kong. Juste au coin de la rue se trouve la Claremont Riding Academy, où les élèves de sixième année des écoles privées prennent des cours, et deux pâtés de maisons plus à l'est se trouvent les coopératives de logements dans lesquelles ils vivent sur Central Park. Cet après-midi, nous traversons le sombre bidonville dominicain sous Columbia University, Harlem, Queens et les bandes jamaïcaines et haïtiennes de Brooklyn. Près de la coupole néoclassique du Musée de Brooklyn se trouve La Boutanique St. Jacques Mejur, qui vend des figurines en cire, des bougies conditionnelles "Du Me", un aérosol "Love", "Success" et "Commanding Do My Will". L'une des bougies est une bougie de vengeance, qui promet de transmettre le mal, le déshonneur, les conflits, l'infidélité, la pauvreté, le danger et les puissants ennemis au nom de celui qui est inscrit sur son côté.

"Ce truc est une combine touristique", dit Thompson. "Le vodun est un système moral de croyance comme les autres, mélange de croyances dahoméennes, kongo et chrétiennes. Nous vivons dans le péché intellectuel avec la culture Kongo et Yoruba. Le Kongo est une culture légale-thérapeutique-visionnaire aussi riche et dense que le christianisme ou le judaïsme; elle me rappelle le judaïsme.

"Mais les Occidentaux restent toujours dans les même zones tempérées lorsqu'ils recherchent la philosophie. Les juifs deviennent bouddhistes, les méthodistes deviennent bahaïs; ils ne vont jamais au sud. Mais maintenant, les religions Kongo et Yoruba prospèrent à New York. Traversez simplement la rue et vous êtes en Afrique. "

Pour Thompson, les trois étapes progressives de la culture atlantique noire sont comme trois versions d'un texte inscrit sur une sorte de pierre de Rosette noire Atlantique. Elle se déplace à New York, intellectuellement péripatéticienne, dans les deux sens via les traces des trois étapes de son sujet. Primo, les tribus dont les esclaves furent pris au Nigeria, au Mali, au Cameroun et au Zaïre. Deuxièmement, les cultures afro-antillaises qui en résultent, y compris les célébrités vodun d'Haïti et les adeptes de Capoera du Brésil. Enfin, les salles de danse, les clubs, la culture ghetto pop de New York.

Au club brésilien SOB's, sur Varick Street, amis, collègues, diffuseurs de livres et éditeurs se rassemblent, un peu sous le charme, alors que cinq batteurs cubo-yoruba tiennent un rythme féroce sur scène. C'est la fête de Random House bool pour le lancement de "Flash of the Spirit" de Thompson. Une démonstration de Capoera suit - mélange brésilien de ballet et d'art martial - produite par deux athlètes torse nu, devant le bar. Thompson danse doucement dans sa combinaison J. Press, tête haute, dos et bras relâchés. C'est intrinsèque à son alternance constante entre participer et observer, de même qu'on peut le voir à la fois donner des conférences et danser durant ces dernières.

"Les religions africaines entremêlent une critique morale élevée doublée d'un délicieux backbeat boogie", dit Thompson. "Elles nous attirent vers une perspicacité morale qui active le corps tout en exigeant une conscience sociale. Les mambos d'Eddie Palmieri peuvent recouper les phrasés musicaux yoruba religieux avec le populaire New York noir."

Alors qu'il danse, Thompson note mentalement le sens et le contenu culturel de ce que tout le monde dans la salle pense n'être qu'une danse. "Derrière toute la viscosité et le groove se cache une philosophie qui dit que dans l'horreur de ces temps qu'il y a un antidote. C'est de ces petits villages ternes de stalles en béton et de générateurs portables que vient cette musique, elle porte un message qui dit que tu peux "rejouer" le désastre - que tu peux le transformer, prendre la mort et l'horreur et les transformer en roue et en carrousel."

Un autre soir, au Château Royal, une salle de danse haïtienne dans le Queens, Thompson est à peu près le seul visage blanc parmi un millier d'élégants Haïtiens. Criant en créole au-dessus du merengue, il est en conversation profonde avec le chef d'orchestre; le groupe a été invité à Yale. Sur la piste de danse, Thompson semble transporté - regard d'un homme dans un bain chaud.

"Il s'agit de libérer les impératifs moraux dans le divertissement", explique Thompson. "La musique est à la fois morale et sournoise; elle porte autant de dandysme et de ruse urbaine que tout ce qui fut écrit à Paris à l'époque de Ravel. L'Occident peut en extraire les parties les plus ambrosiales et se laisser emporter par le rythme vers des sublimités morales."

Bien que Thompson vive et se déplace au sein d'un milieu hip, lui-même n'a rien de particulièrement branché. Il agit de la manière inconsciente et directe du soldat professionnel - marche ordonnée, jamais de pagaille, léger balancement des bras lors de la foulée - qui donne l'impression qu'il est toujours sur le point de faire quelque chose. Sa position et ses perspectives n'ont rien de la morosité typique de l'universitaire. Mais son attention est hautement idiosyncrasique; ses actions semblent dictées par un programme connu de lui seul.

Lorsqu'il est plongé dans une ambiance tout à fait blanche, comme une conférence au Metropolitan Museum of Art de New York ou assis dans cet endroit incongru que sont les salons de la maison du maître de Yale, Thompson perd parfois le rythme. Il s'éloigne, comme privé de l'objet de ses affections. Ensuite, quelque chose de banal - une remarque, le phrasé d'une remarque ou peut-être une scène d'un film diffusé au Showcase Cinema à Orange - lui offre une petite étincelle de négritude, et il est à nouveau attentif. Il donne parfois l'impression d'être en tournée d'inspection, cherchant dans le monde blanc des signes salutaires de culture noire. On sent qu'il suit sans cesse, avec ce qu'il appelle ses "yeux noirs", les contours de l'objet d'un désir spirituel.

Thompson tient à faire la distinction entre pratique de la religion ouest-africaine et l'enseignement de la culture dont elle fait partie. Récemment, quelqu'un qu'il connaissait à peine lui a demandé des conseils spirituels et Thompson en fut consterné. Il se considère comme un médium, mais un médium du genre le plus ordinaire. Il pense que ce qu'il doit enseigner n'est que ce qu'il choisit et filtre de toutes ses "informations" du monde. Dans les livres de Thompson, les sections de notes biographiques contiennent des centaines et des centaines de minuscules petits noms sonores, qui, s'ils sont lus à haute voix, ressemblent aux listes des annuaires téléphoniques de Lagos, Rio, Ouagadougou et New Haven combinés. Telles sont les sources du "flash de l'esprit" sans lequel, Thompson, n'est "que Joe, l'universitaire aux cheveux gris".

S'il y a une partie des croyances africaines auxquelles Thompson adhère, c'est ce qu'il perçoit comme leur génie social. L'épiphanie de Thompson, s'il y en a une dans sa sphère très privée, se distingue par les accents pleine de sens qu' utilise lorsqu'il parle des incendies dans les forêts pygmées, des prêtresses de la rivière au Cameroun, de l'escalade des arbres zaïrois pour le miel et de la dernière veille de Nouvel An sur la plage de Copacabana à Rio, où Thompson a vu des milliers de femmes de chambre, gardiennes, journalières et leurs enfants, creuser des trous dans le sable à minuit pour y mettre des bougies, applaudissant lorsque les lumières furent emportée hors du rivage par la marée.

Ceux qui minimisent l'importance de ces rituels folkloriques noirs et du travail de la vie de Thompson le rendent furieux. "Comment les gens osent-ils fréquenter l'Afrique?" il demande. "Ces gens sont des géants qui nous apprennent à vivre. Il y a une voix morale ancrée dans l'esthétique afro-atlantique que l'Occident est infichu de saisir. Les occidentaux ne voient pas les monuments, juste la philosophie pieds nus venant des anciens du village. Alors que le monument est une grande forme d'art qui réconcilie, qui tente de reconstruire moralement une personne sans l'humilier. "Parfois, lorsque Thompson commence à s'échauffer, sa voix prend des cadences du discours noir."

"Ce sont les canons du cool: il n'y a pas de crise qui ne puisse être pesée et résolue; rien ne peut être réalisé par l'hystérie ou la lâcheté; vous devez porter et montrer votre capacité à réaliser la réconciliation sociale. Sortez du cauchemar. C'est un appel au dialogue, au con-gress et à l'auto con-fiance. "Ce tea-shirt avec ces phrases issue de titres de journaux" ne fait que poser le problème sur ta poitrine. Les formes d'art afro-atlantique sont à la fois juridiques, médicales et esthétiques. C'est une manière intransigeante d'utiliser l'art."

À Jacmel, à 8 h 30 du matin, Thompson et moi déjeunons avec des croissants à bord de la piscine de l'hôtel, discutant au son des tambours qui résonnent sur la plage. La veille au soir, dans son temple en carton ondulé, la charmante prêtresse Madame Nerva, qui aime beaucoup plaisanter, a donné son bâton constellé de bonbons à un homme, avec pour consigne d'appeler les batteurs et la congrégation pour le lendemain matin. Il y a 50 voduistes à l'intérieur du temple vibrant quand nous arrivons, y compris le flic local. Cinq batteurs, dirigés par un homme du nom de "Gasoline", suivent un rythme sauvage et déferlant. Dix-neuf femmes noires vêtues de robes blanches et de turbans blancs sortent en dansant d'une porte de l'autel pour se mettre en en cercle autour de Madame Nerva, qui, vêtue d'une robe dorée, secoue un hochet et une cloche sacrés pour donner le tempo. À tour de rôle, chacune des femmes prend la main de Madame Nerva et tombe dans un geste à la fois révérencieux et prostré, lui tenant la main tout en descendant pour embrasser le sol à ses pieds.

Tandis que deux femmes tenant des drapeaux dansent autour de lui, un jeune homme dessine lentement dans la poudre blanche sur le sol un cœur ou une vulve, avec en superposé des épées et un serpent. Au moment où il termine l'image, la cérémonie double d'intensité et les femmes tournent avec des bougies, puis s'agenouillent. Soudain, l'icône est effacée et Madame Nerva se précipite dans la pièce en tenant une poupée américaine en plastique blanche d'un mètre (elle est faite de rangées de maïs et d'une main droite d'enfant qui fait le salut Kongo). Un à la fois, nous sommes embrassés par la poupée sur nos joues gauches. Une femme, tourbillonnant avec un turban sur la tête, devient possédée et commence à se trémousser et à tanguer. Les autres danseurs la frappent doucement pour la calmer et faire partir l'esprit. Elle s'évanouit et ils la retiennent. La ligne des danseurs s'est rompue; les tambours s'arrêtent.

"Un peu sauvage pour un simple sondage", me dit Thompson alors que nous faisons nos adieux. "Cette femme n'était pas censée être possédée. As-tu entendu comment Mme Nerva a décrit la possession - tel "un dialogue avec l'Afrique"? "

Nous retournons par les montagnes vers Port-au-Prince, pour un retour dans l'après-midi à New York. À 15 heures, après le déjeuner et un saut dans la piscine de l'hôtel, nous sommes en train de prendre un verre dans l'avion, Thompson est en train de remplir ses carnets de croquis et de notes.

"Il y a tout un langage dans la possession", dit-il, "une expression et une position différentes pour chaque dieu. L'Occident a oublié les états de ravissement sacré, mais l'art chrétien s'est construit sur l'extase. Le gothique était extatique - les cathédrales ne peuvent pas être comprises sans référence à lui." Il montre une photo sur la couverture de son cahier qui présente une femme aux yeux retournés. "C'est l'histoire de l'art vivant. Et il faut comprendre les états extatiques pour comprendre l'art extatique."

Thompson se tord sur son siège pour montrer les gestes de possession. Il lève les bras, les plie au coude, puis les lève les paumes vers le haut, doigts écartés. Il projette sa tête en arrière, yeux fermés; puis avance rapidement; puis fait des grimaces, trois façons différentes. Il baisse les bras, prend un verre et dit: "Ce n'est pas si hérétique d'examiner l’extase. Après tout". Ici il dessine dans son cahier une figure d'homme, tête renversée en arrière avec une ligne de visée qui va vers le haut - "la rosace de Chartres ne peut être vue que sous un angle extatique."

Auteur: Iseman Fred

Info: https://www.rollingstone.com 22 novembre 1984. Trad Mg (à peaufiner)

[ transe ] [ portrait ] [ perméabilités ethniques ] [ osmose ] [ nord-sud ]

Commenter

Commentaires: 0

Ajouté à la BD par miguel

« Précédent
1
…
29
30
31
32
33
Suivant »