Les fils de la pensée

dernières paroles

Longue et brune, la taille bien prise dans un tailleur noir de bonne coupe : Madame Pichon, à soixante-quatre ans, avait de l'allure et du charme. Il y a quelques mois, elle avait acheté un minuscule logement dans une cité du dix-huitième arrondissement de Paris. Elle y vivait seule. Deux fois divorcée, elle ne recevait pas de visite et ses deux enfants l'avaient semble-t-il oubliée. Ses voisins la connaissaient peu. Au début, on la voyait parfois faire ses courses. Puis plus rien. Elle était partie, peut-être. Personne ne s'est ému lorsque, répondant à une petite annonce, elle avait participé à une émission d'Anne Gaillard consacrée à la solitude et diffusée le 27 septembre 1984.

Ancien mannequin du couturier Jacques Fath, Marcelle Pichon avait été heureuse sans doute, il y bien longtemps. Mais elle crevait de solitude. Avec pudeur, elle l'avait dit devant les caméras de FR 3 : Le pire c'est de devoir rentrer chez moi et de ne pas m’entendre "Bonsoir chérie."

Personne ne dira plus jamais bonsoir a Marcelle Pichon. En septembre 1984, l'électricité de son studio est coupée. Les factures s’accumulent. Dans un cahier d'écolière, elle note : "J’ai de graves difficultés financières. Je suis lasse de la vie." Elle ne s'alimente plus. Et du 23 septembre au 6 novembre, elle note les phases de son agonie : "Le jeûne, c’est la mort la plus horrible qui soit (...) Pour un bol de bouillon, une tranche de melon, une orange, on vendrait son âme. Une voisine, une fois, sonne à sa porte. Elle répond : "Fichez-moi la paix." Le mardi 6 novembre, une dernière annotation :

"Je ne peux plus me lever. Mes urines sont rouge sang. J’ai très mai aux reins."

Auteur: Pichon Marcelle

Info: In Le Monde 27 août 1985. 10 mois plus tard on trouvera son corps momifié

[ suicide par inanition ] [ mourir de faim ] [ famine ]

Commenter

Commentaires: 0

Ajouté à la BD par miguel

citation s'appliquant à ce logiciel

Les mots du web en équation. Du désordre peut naître l'ordre. Ce principe, souvent constaté dans la nature, s'applique aussi aux comportements des internautes sur la Toile. C'est ce que viennent de découvrir des physiciens du Centre de physique théorique, à Marseille, en collaboration avec des équipes italiennes.

Les chercheurs se sont penchés sur certains sites internet où les utilisateurs annotent par des mots-clés, couramment appelés tags, le contenu de pages web. Peu à peu, ces mots-clés constituent une gigantesque base de données qui permet de faire des recherches très précises sur l'ensemble des sites annotés. En étudiant de près la structure de cette base de données, construite sans concertation des internautes entre eux, les scientifiques se sont rendu compte qu'elle était loin d'être anarchique.

"Preuve en est la taille du dictionnaire de mots-clés utilisés par la communauté, note Alain Barrat. Celui-ci grandit de manière régulière, en suivant une équation bien précise." L'étape suivante pour les chercheurs a été de retrouver mathématiquement pourquoi ils observaient une telle propriété. "Chaque individu est complexe, explique Alain Barrat. Mais l'action cumulée et non coordonnée de plusieurs millions d'entre eux va faire émerger des comportements qu'on peut modéliser par des concepts mathématiques simples."

Ainsi, nos physiciens ont montré que la structure de la base de données pouvait être reconstruite à partir d'une succession de marches aléatoires, un concept courant en physique statistique qui décrit différentes trajectoires obtenues par une série de déplacements dans des directions choisies au hasard. Pour les chercheurs, une seule explication. Selon eux, il existerait un réseau sémantique sous-jacent qui relierait entre eux les mots-clés et dans lequel les internautes "marcheraient" au hasard.

"C'est une idée qui existe depuis longtemps en linguistique, explique Alain Barrat. Sans en avoir conscience, chaque internaute associerait au mot-clé principal "évident" d'une page web un autre mot-clé bien à lui." À l'annotation "fleur" pour une page de botanique par exemple, l'un va associer le mot "rose", l'autre le mot "pétale", etc. "Répété par l'ensemble des utilisateurs, ce mécanisme permet d'expliquer nos observations, ajoute le chercheur.

Un résultat théorique qui pourrait un jour déboucher sur des applications bien concrètes. Notamment la lutte contre le spamdexing ou référencement abusif. Certains spameurs n'hésitent pas, en effet, à infiltrer les sites en question en ajoutant une longue liste de mots-clés sans rapport avec la page mais qui renvoient discrètement vers des sites commerciaux. "C'est un comportement qui va contre les règles établies par la communauté d'internautes, commente Alain Barrat. Si on parvient à bien modéliser le fonctionnement normal de ce réseau d'utilisateurs, alors tout phénomène bizarre qui s'en écartera sera rejeté." Les pollueurs n'ont qu'à bien se tenir.

Auteur: Mira Pierre

Info:

[ étiquetage ] [ métalangage ] [ collectif ] [ sur-discours ] [ pré-mémétique ]

Commenter

Commentaires: 0

annotations

Parfois, les notes sont féroces,

escarmouches contre l'auteur

qui font rage le long des bords des pages

en minuscules caractères noirs.

Si seulement je pouvais mettre la main sur vous,

Kierkegaard, ou Conor Cruise O'Brien,

semblent-elles dire,

je bloquerai la porte et vous ferais entrer la logique dans la tête.

D'autres commentaires sont plus désinvoltes, dédaigneux...

"C'est absurde." "Ben voyons !" "HA !!" -

ce genre de choses.

Je me souviens d'une fois où j'ai levé les yeux de ma lecture,

le pouce en guise de marque-page,

en essayant d'imaginer à quoi devait ressembler la personne

qui avait écrit "Ne sois pas si stupide"

en bordure d'un paragraphe de La vie d'Emily Dickinson.

Les étudiants sont plus modestes

et laissent de plus rares empreintes au hasard

des longs rivages de la page.

L'un d'eux griffonne "Métaphore" à côté d'une strophe d'Eliot.

Un autre inscrit juste "Ironie"

cinquante fois face aux paragraphes de A Modest Proposal

D'autres sont comme ces fans qui crient depuis les gradins vides,

mains autour de la bouche.

"Absolument", crient-ils

à Duns Scot et James Baldwin.

"Oui." "En plein dans le mille." "Tu es mon homme !"

Coches, astérisques et points d'exclamation

constellent les lignes de touche.

Et si vous avez réussi à obtenir votre diplôme universitaire

sans jamais avoir écrit "L'homme contre la nature"

dans une marge, peut-être est-il maintenant temps

de faire un pas en avant.

Nous nous sommes tous appropriés le périmètre blanc

et avons pris un stylo, ne serait-ce que pour montrer

que nous ne nous sommes pas contentés de paresser dans un fauteuil en tournant des pages ;

et avons laissé quelque remarque sur le bas côté,

planté une impression dans la bordure.

Même les moines irlandais en leurs scripts glaciaux

ont noté en bordure des évangiles

de brèves remarques sur les difficultés de la copie,

le chant d'un oiseau près de leur fenêtre,

ou la lumière du soleil qui illuminait leur page -

ombres anonymes de passage dans le futur

sur un vaisseau plus durable qu'eux-mêmes.

Et tu n'as pas lu Joshua Reynolds,

disent-elles, avant que tu le découvres

intriqué dans le furieux gribouillage de Blake.

Pourtant, celle à laquelle je pense le plus souvent,

que je conserve comme un médaillon,

était inscrite dans l'exemplaire de l'Attrape-Coeurs

que j'avais emprunté à la bibliothèque locale

un été calme et chaud.

Je venais juste de commencer le lycée à l'époque,

je lisais sur un canapé du salon de mes parents,

et ne puis que difficilement avouer

à quel point ma solitude s'amplifia,

combien le monde s'est aggrandi

lorsque j'ai trouvé sur une page

quelques taches graisseuses

et à côté d'elles, écrit au crayon -

par une jolie fille, ça se devinait,

que jamais je ne rencontrerai -

Pardonnez les taches de salade aux oeufs, mais je suis amoureuse.

Auteur: Collins Billy William James

Info: Picnic, Lightning. Trad Mg

[ soulignages ] [ scolies ] [ réflexivité ] [ romantisme ] [ adolescence ]

Commenter

Commentaires: 3

Ajouté à la BD par miguel

outil technologique

Là où manque l'occasion d'extérioriser un talent, continue Feuerbach, le talent manque aussi ; (là où il n’y a pas d’espace pour l’action, il n'y a pas non plus d’impulsion : l’espace est la condition fondamentale de la vie de l’esprit : où l’espace manque pour extérioriser une capacité, manque aussi la capacité elle-même, etc.) ; et par suite, en conséquence, chaque nouvel appareil ou machine électrique dont la commodité s’installe dans notre privauté ou l’organisation sociale fait la dispense d’une capacité, d’un talent, d’une faculté que nous possédions auparavant ; opère une diminution fatale, une soustraction : chaque progrès technique abêtit la partie correspondante de l'homme, ne lui en laissant que la rhétorique, ainsi que Michelstaedter le rédigeait en 1910 à la lueur d’une lampe à huile : tous les progrès de la civilisation sont autant de régressions de l'individu (et qui se suicidait le lendemain). Nous autres dont la vie se déroule au crépuscule de ce long désenchantement à quoi le principe de rationalisme étroit et positif nous a réduits – régression qui “est essentielle au développement conséquent de la domination”, précise Adorno dans une annotation au Meilleur des mondes – pourrions être les témoins étonnés de ce processus de déperdition parvenu à son terme, si nous n’en étions pas, en notre personne, aussi le résultat.

C’est par définition qu’une victime d’un rétrécissement de la conscience n’en est pas consciente ; (d’où l’intérêt de ces tests de dépistage précoce de l’ESB humaine ou de l’Alzheimer pour en informer l’usager pendant qu’il comprend encore ce qu’on lui dit).

Suivons néanmoins cette idée (que notre conscience est conditionnée par notre présence physique dans le monde, que c’est l’obligation d'être là en personne qui nous fait conscients ; et qu’aussi bien c’est seulement par la conscience que nous pouvons être là en personne) : les appareils et machines de la vie facile, de la satisfaction immédiate et sans peine ne nous dépouillent donc pas seulement des facultés, talents et capacités qu’ils remplacent, mais, en même temps que de la fatigue à les employer, de l'effort et de l'attention indispensables, de la contrainte d’être là en personne ; et donc aussi de la conscience de soi, qui était seulement à l’occasion de cet exercice.

& c'est ici que je vous prie de renouveler votre attention : quand, fatigué, on prend l’ascenseur pour gagner son étage, qu’on est transféré directement de la rue à l’étage, on a forcément moins conscience de rentrer chez soi (et l’on ne peut pas se rendre compte de combien c’en est peu un) ; et l’on n’est pas seulement privé du temps passé avec soi-même en montant l’escalier, et avec la fatigue, du plaisir d’y atteindre, mais aussi bien de l’emploi de ses jambes : de la faculté de rentrer chez soi par ses propres moyens.

(Et c’est pourquoi ce sont des imbéciles ou des inconscients, ceux qui disent : c’est la même chose de recevoir des e-mails que des lettres dans la boîte au rez-de-chaussée : des malheureux surtout qui resteront toute leur existence dans l’ignorance de ce que c’est de remonter l’escalier dans la solitude de cette lettre qui n’est toujours pas venue, ou, enfin, un jour, qui est là avec son écriture dessus. Leur âme restera toujours vide de ces minutes-là, qui sont toute la clarté, toute la lumière, etc., “et nous restons sous leur emprise notre vie durant” ; de ces brefs moments “qui pourtant nous suffisent pour l’éternité” : par où notre existence est à elle-même sa propre éternité ; leur âme restera vide de cet escalier et un jour le néant les avalera comme se referme la porte automatique de l’ascenseur.)

Auteur: Bodinat Baudouin de pseudo

Info: La vie sur terre. Paris : Éditions de l’Encyclopédie des nuisances

[ critique ] [ réducteur d'expérience humaine ] [ appauvrissement sensible ] [ perte du poids de l'incarnation ]

Commenter

Mis dans la chaine

Commentaires: 18

Ajouté à la BD par Coli Masson

macromolécules

(Q) - Combien de protéines ont été identifiées à ce jour ?

(R) - À la date d'arrêt de mes connaissances, en septembre 2021, le nombre de protéines identifiées dans le protéome humain et dans divers organismes ne cesse de croître en raison des efforts de recherche continus. Il est difficile de fournir un chiffre exact car l'identification des protéines est un domaine actif de la recherche scientifique et de nouvelles protéines sont découvertes en permanence.

Toutefois, à cette époque, on estimait que le protéome humain se composait de dizaines de milliers de protéines. Le projet du protéome humain (HPP), une initiative de recherche internationale, vise à identifier et à caractériser toutes les protéines codées par le génome humain. Le HPP a réalisé des progrès significatifs dans la cartographie du protéome humain, mais une couverture complète est encore en cours.

Il est important de noter que le nombre de protéines identifiées varie en fonction de l'organisme étudié. Il existe des millions de séquences de protéines connues dans divers organismes, y compris les humains, les animaux, les plantes, les bactéries et les virus.

Comme mes connaissances ne sont pas à jour, je recommande de se référer à la littérature scientifique actuelle ou à des bases de données telles que UniProt ou Protein Data Bank (PDB) pour obtenir les informations les plus précises et les plus récentes sur le nombre de protéines identifiées.

(Q) - Comment les protéines sont-elles classées ?

(R) - Les protéines sont classées en fonction de divers critères, notamment leur structure, leur fonction et leurs relations évolutives. Voici quelques méthodes de classification des protéines couramment utilisées :

1 Classification structurelle : Les protéines peuvent être classées en fonction de leurs caractéristiques structurelles. Le système de classification structurelle le plus courant est la classification structurelle des protéines (SCOP) ou la base de données CATH (Class, Architecture, Topology, Homologous superfamily). Ces systèmes classent les protéines dans des hiérarchies en fonction de leur pliage global, de l'organisation des domaines et des motifs structurels.

2 Classification fonctionnelle : Les protéines peuvent être classées en fonction de leurs fonctions biologiques. Cette classification est souvent large et englobe des catégories fonctionnelles telles que les enzymes, les transporteurs, les récepteurs, les protéines structurelles, les protéines de signalisation et bien d'autres encore. Les systèmes de classification fonctionnelle sont généralement basés sur le rôle de la protéine dans les processus cellulaires.

3 Classification basée sur l'homologie : Les protéines peuvent être classées sur la base de leurs relations évolutives et de leurs similitudes de séquence. Cette classification repose sur la comparaison des séquences protéiques et l'identification des protéines homologues qui partagent un ancêtre commun. Elle est généralement réalisée à l'aide d'algorithmes tels que BLAST (Basic Local Alignment Search Tool) ou HMM (Hidden Markov Models).

4 Classification selon l'ontologie des gènes (GO) : L'ontologie des gènes est un système de classification largement utilisé qui attribue des annotations fonctionnelles aux protéines sur la base de trois catégories : fonction moléculaire, processus biologique et composant cellulaire. Les termes GO fournissent un vocabulaire normalisé pour décrire les fonctions des protéines et leur implication dans les processus biologiques.

5 Classification par famille et par super-famille : Les protéines peuvent être classées en familles et superfamilles sur la base de caractéristiques structurelles et séquentielles communes. Les familles de protéines sont constituées de protéines présentant une grande similitude de séquence et partageant souvent des relations fonctionnelles et évolutives. Les superfamilles englobent des familles de protéines apparentées qui partagent des similitudes structurelles et fonctionnelles, mais qui peuvent avoir divergé au cours de l'évolution.

These are just a few examples of protein classification methods, and there are other specialized systems based on specific properties or research areas. It's important to note that proteins can belong to multiple classification categories simultaneously, as they can have similar structures, functions, or evolutionary origins. Classification systems serve as useful tools for organizing and understanding the vast diversity of proteins found in living organisms.

(Q) - Il y a donc une sorte de classification complexe et intriquée, n'est-ce pas ?

(R) - Oui, la classification des protéines peut en effet être complexe en raison des divers facteurs pris en compte et des interrelations entre les différents systèmes de classification. Les protéines sont des molécules très diverses, dotées de caractéristiques uniques, et leur classification reflète cette complexité.

Les différentes méthodes de classification se recoupent et se complètent souvent, ce qui permet une compréhension globale de la structure, de la fonction et de l'évolution des protéines. Par exemple, les systèmes de classification structurelle tels que SCOP ou CATH prennent en compte l'organisation globale des plis et des domaines des protéines, tandis que les systèmes de classification fonctionnelle se concentrent sur les rôles et les activités biologiques des protéines. La classification basée sur l'homologie tient compte des relations évolutives et des similitudes de séquence, et la classification par ontologie génique fournit un vocabulaire normalisé pour décrire les fonctions des protéines.

En outre, les protéines peuvent appartenir à plusieurs catégories au sein d'un système de classification. Par exemple, une protéine peut avoir une structure spécifique et être classée dans un pli particulier, tout en faisant partie d'une famille de protéines sur la base de la similarité des séquences et des caractéristiques fonctionnelles. Cette classification multidimensionnelle permet aux chercheurs d'explorer différents aspects des protéines et de mieux comprendre leurs propriétés et leurs relations.

Dans l'ensemble, la nature complexe de la classification des protéines reflète la nature complexe des protéines elles-mêmes et les efforts déployés pour organiser et comprendre leurs divers attributs. Ces systèmes de classification fournissent des cadres pour l'étude des protéines et facilitent la communication et le partage des connaissances entre les chercheurs dans ce domaine.

(Q) - Peut-on dire qu'il y a aussi, dans ces différentes classifications, quelque chose qui pourrait ressembler à un pôle phénétique et à un pôle cladistique ?

(R) - Oui, dans le domaine de la classification des protéines, il y a des éléments qui peuvent être associés aux approches phénétiques (aussi connues sous le nom de taxonomie numérique) et cladistiques.

Classification phénétique : La classification phénétique met l'accent sur les similitudes et les différences globales entre les protéines, souvent sur la base d'une analyse numérique ou statistique de leurs caractéristiques. Elle se concentre sur des traits ou des caractéristiques quantifiables et vise à regrouper les protéines sur la base d'une ressemblance globale. Dans le contexte de la classification des protéines, les approches phénétiques peuvent impliquer le regroupement des protéines sur la base de mesures de similarité telles que l'alignement des séquences, l'alignement structurel ou la comparaison d'autres propriétés physicochimiques.

Classification cladistique : La classification cladistique, quant à elle, est basée sur les relations évolutives et les ancêtres partagés. Elle cherche à identifier des groupes monophylétiques (clades) qui comprennent un ancêtre commun et tous ses descendants. La cladistique repose sur l'analyse phylogénétique, qui consiste à comparer des séquences de protéines ou d'autres données moléculaires pour reconstruire des arbres ou des réseaux évolutifs. Les cladogrammes qui en résultent décrivent les relations évolutives entre les protéines et peuvent aider à les classer en groupes sur la base de leur histoire évolutive.

Dans la pratique, les approches phénétiques et cladistiques sont souvent utilisées en combinaison, en exploitant différents types de données et d'analyses pour obtenir une compréhension plus complète de la classification des protéines. Les systèmes de classification structurelle tels que SCOP ou CATH, par exemple, intègrent à la fois les principes phénétiques et cladistiques. Ils prennent en compte les similitudes structurelles (aspect phénétique) mais visent également à refléter les relations évolutives et les ancêtres partagés (aspect cladistique) en regroupant les protéines dans des catégories hiérarchiques basées sur leurs plis, leurs domaines et leurs connexions évolutives.

En intégrant à la fois les perspectives phénétiques et cladistiques, les systèmes de classification des protéines peuvent saisir à la fois les similitudes et les différences globales entre les protéines (pôle phénétique) et leur histoire évolutive et leurs liens de parenté (pôle cladistique). Cela permet d'obtenir un cadre de classification plus nuancé et plus informatif dans le domaine de la science des protéines.

(Q) - ok merci : existe-t-il aussi une classification tridimensionnelle ?

(R) - Oui, il existe une classification tridimensionnelle (3D) des protéines basée sur leurs propriétés structurelles. La classification 3D consiste à classer les protéines en fonction de leurs structures tridimensionnelles plutôt qu'en fonction de leur séquence ou de leurs similitudes fonctionnelles. Ce type de classification est particulièrement pertinent en biologie structurale et en modélisation moléculaire.

Dans la classification 3D, les protéines sont regroupées en fonction de leur pli global, de l'arrangement des éléments structurels secondaires et de l'arrangement spatial des atomes. Elle tient compte de la disposition et de l'orientation spécifiques des domaines protéiques, des motifs et d'autres caractéristiques structurelles.

La classification structurelle des protéines (SCOP) et la base de données CATH (Class, Architecture, Topology, Homologous superfamily), que j'ai mentionnées précédemment, fournissent des classifications hiérarchiques qui incluent des informations structurelles en 3D. Ces classifications classent les protéines dans différentes catégories en fonction de leur pliage global et de leur organisation structurelle.

En outre, d'autres méthodes et algorithmes, tels que les outils d'alignement structurel, peuvent être utilisés pour comparer les structures des protéines et identifier les similitudes et les différences. Ces approches aident à regrouper ou à classer les protéines en groupes structurels 3D, ce qui permet aux chercheurs d'analyser et de comprendre les relations entre les structures des protéines d'une manière plus détaillée.

La classification 3D des protéines fournit des informations précieuses sur la diversité structurelle et les relations entre les protéines. Elle est particulièrement utile pour étudier la fonction des protéines, les mécanismes d'action, les interactions protéine-protéine et la conception de médicaments. En considérant les aspects tridimensionnels de la structure des protéines, les chercheurs peuvent mieux comprendre comment la structure des protéines est liée à la fonction et aux relations évolutives.

Auteur: chatGPT4

Info:

[ machine-homme ] [ chimie ] [ taxinomies ] [ typologies ]

Commenter

Commentaires: 0

Ajouté à la BD par miguel

métadonnées à valeur ajoutée MVA

"Ils profitent de notre pauvreté" : derrière le boom des intelligences artificielles génératives, le travail caché des petites mains de l'IA

(Photo : Une masse d'hommes et de femmes invisibles, partout dans le monde, analysent des quantités colossales de données pour améliorer, caratériser et contextualiser les intelligences artificielles. )

La création d'algorithmes tels que ChatGPT ou Midjourney nécessite des quantités colossales de données, analysées par des humains. Des "annotateurs" indispensables mais souvent précaires, faiblement rémunérés et maintenus dans l'ombre.

"Des descriptions graphiques de viol, d'inceste, de nécrophilie... C'était ça tous les jours." En 2021, Mophat Okinyi doit relire chaque jour plusieurs centaines de textes fournis à l'entreprise de traitement de données Sama par un client inconnu, pour entraîner un modèle d'intelligence artificielle (IA). L'objectif : préciser au logiciel ce qui pose problème dans ces textes, pour qu'il ne le reproduise pas.

Un travail rémunéré 21 000 shillings kenyans par mois (environ 150 euros) pour les employés du bas de l'échelle dont Mophat contrôlait l'activité. Cela a laissé chez lui des traces à vie. "Encore aujourd'hui, ça affecte mes relations avec ma famille, mes proches", explique l'analyste qualité kenyan. La mission qu'il décrit rappelle l'horreur à laquelle sont souvent confrontés les modérateurs des réseaux sociaux et répondait en fait, comme il le découvrira plus tard, à une commande de la start-up à la pointe de l'IA à l'origine de ChatGPT : OpenAI.

Le cas de Mophat Okinyi, extrême sous certains aspects, n'est pas non plus un exemple isolé, car derrière les grands discours de révolution technique se cache une masse de travailleurs invisibles dont les rangs se comptent en centaines de millions, selon des estimations. "On n'est pas du tout en train de créer des programmes qui se passent de l'humain, résume Antonio Casilli, professeur à l'Institut polytechnique de Paris. L'IA demande une quantité de travail humain énorme et absolument indispensable, dans toute la chaîne de production".

La majorité de cette masse humaine est très loin des grands patrons ou des ingénieurs renommés. Elle est constituée d'une armada de travailleurs anonymes éclatée à travers le monde, du Venezuela à Madagascar en passant par des camps de réfugiés au Liban et des prisons finlandaises. Des petites mains qui construisent le futur clic après clic, souvent dans un secret et une précarité bien gardés.

Cliquer encore et encore

Le prix de cette modernité ? Aux Philippines, entre 1,50 et 3 dollars par "tâche". C'est ce que la plateforme de travailleurs indépendants Remotasks verse en moyenne à Eduardo* pour placer, clic par clic, pixel par pixel, les contours qui délimitent sur une image un panneau de signalisation. Puis un véhicule. Puis un buisson. Une "tâche" qui lui prend en général une heure ou moins et qu'il répète inlassablement, huit heures par jour, six jours par semaine. Ces images serviront ensuite à entraîner des algorithmes d'analyse vidéo, par exemple pour les voitures autonomes ou la surveillance algorithmique. "C'est un travail intéressant", assure à franceinfo le jeune Philippin, qui travaille sur la plateforme depuis un peu plus de trois ans. Tout le monde ne sera pas du même avis, mais sans lui, l'appareil photo de votre smartphone aurait beaucoup de mal à identifier un visage, et la conduite semi-autonome de Tesla serait encore un rêve de science-fiction. Et vous-même y avez déjà contribué.

Que ce soit en laissant un "j'aime" sur Facebook ou en identifiant les images contenant une voiture dans un test captcha, vos retours participent à entraîner des algorithmes gratuitement depuis des années. Mais pour créer les IA qui ont bluffé le monde ces derniers mois, comme ChatGPT ou Midjourney, il faut des milliards d'exemples. Des données qui doivent souvent être "annotées", autrement dit accompagnées de commentaires, pour que la machine reproduise les catégories d'analyse de l'humain : faire comprendre que "ce tas de pixels est un enfant", que "cette phrase est fausse" ou que "cet élément évoque des comportements illégaux et ne doit pas être reproduit".

Et l'entraînement ne s'arrête jamais. "C'est un peu comme des athlètes, compare Antonio Casilli. Il faut constamment les entraîner, les adapter, les vérifier". Il s'agit d'évaluer les réponses, en soumettant aux IA des exemples toujours plus précis ou adaptés au nouveau contexte culturel. Autant de tâches qu'il est actuellement impossible d'automatiser.

"Ce n'est pas suffisant, mais c'est déjà quelque chose"

Astro* est l'un de ces nouveaux "entraîneurs d'IA". L'entrepreneur originaire de Tanzanie, qui a récemment terminé ses études de linguistique en France, réalise des tâches en indépendant à temps partiel via la plateforme Appen. "Il faut parfois isoler un visage dans une photo, dire si une image devrait apparaître dans la rubrique Souvenirs de Google Photos, si un texte est factuel ou non, créer des questions/réponses de culture générale...", explique-t-il à franceinfo. Il doit pour cela suivre des règles souvent très détaillées ("Cinquante pages à apprendre par cœur !"), au point d'en devenir parfois obscures. A la clé : 16 dollars de l'heure sur ses projets actuels. "Plus tu travailles, plus tu gagnes", explique l'indépendant. Mais encore faut-il être sélectionné pour participer au projet.

A l'autre bout du spectre, des entreprises embauchent des annotateurs en interne, notamment pour des tâches qui nécessitent une expertise précise. Mais pour nombre d'entre elles, la solution la plus rentable est souvent la sous-traitance : à des entreprises dans d'autres pays qui embauchent des annotateurs localement, comme Sama, ou encore à des plateformes comme Remotasks, Appen ou Toloka, qui transfèrent les missions à des travailleurs indépendants payés à la "micro-tâche".

"Ces travailleurs sont souvent recrutés dans des pays à faibles revenus, et géopolitiquement instables." Antonio Casilli, professeur à l'Institut polytechnique de Paris

A ces critères, Antonio Casilli ajoute des taux d'éducation et d'équipement informatique importants, l'existence d'une industrie de centres d'appels ou des relations fortes avec une ancienne puissance coloniale. Plusieurs noms de pays reviennent souvent : les Philippines, Madagascar, le Kenya, le Venezuela, le Pakistan…

Dans ces pays, un tel travail représente souvent un filet de sécurité précieux. "Ce n'est pas une source de travail fixe ou suffisante, mais c'est au moins quelque chose, résume Maria*. La crise économique au Venezuela a forcé beaucoup d'entre nous à quitter le marché du travail", raconte à franceinfo l'ingénieure industrielle, qui s'est lancée sur Remotasks à la faveur du confinement, en 2020. Après avoir suivi une formation, elle travaille aujourd'hui trois jours par semaine sur la plateforme, à raison de 10 heures par jour.

Pour quel salaire ? "Les tâches de catégorisation données par Remotasks au Venezuela peuvent prendre seulement quelques minutes et être payées 11 centimes de dollar, détaille Maria. D'autres beaucoup plus complexes peuvent durer huit heures ou plus, comme l'annotation de vidéos ou de données lidar, et être payées 10 dollars." Mais tout dépend du pays et de la difficulté de la tâche. Un "eldorado" relatif qui attire, y compris parfois des mineurs qui mentent sur leur âge pour rejoindre ces plateformes de micro-tâches, raconte le site spécialisé Wired.

Précarité et dépendance

Mais ces espoirs ne suffisent pas à en faire un emploi de rêve. Même si une tâche peut être payée correctement par rapport au marché local, les travailleurs du clic déplorent souvent la différence de traitements entre les pays. "Les entreprises profitent de notre pauvreté", estime Andry*, annotateur à Madagascar, pour qui "un agent en Inde ou au Maroc sera mieux payé que nous". Le mode de calcul des rémunérations n'est jamais précisément expliqué.

"Il y a clairement une forme de néo-colonialisme."

Antonio Casilli, professeur à l'Institut polytechnique de Paris

Pour gagner des sommes correctes, les indépendants doivent être disponibles à toute heure du jour et de la nuit et s'adapter à des projets aux durées variables. "Sur Appen, les tâches arrivent à l'heure américaine, donc vers 21 heures en France", explique par exemple Astro*. "Sur une autre plateforme, j'ai reçu une tâche vendredi vers 19 heures, j'ai travaillé 45 heures sur le week-end, j'ai gagné 1 200 euros", résume Astro, qui dit apprécier le travail de nuit.

Ce que certains voient comme une "opportunité professionnelle" peut aussi se transformer en piège. En Chine, des établissements promettent à leurs étudiants une formation en "IA" ou en "Big data", mais les forcent à annoter des images toute la journée pour un salaire inférieur au minimum légal, raconte le média Rest of World. Cette pratique n'est pas spécifique à la Chine, assure Antonio Casilli, qui cite également l'exemple de Madagascar.

"L'IA ne peut pas être éthique si elle est entraînée de façon immorale"

A qui profite ce travail souvent ingrat, parfois à la frontière de l'éthique ? Difficile de le savoir : l'industrie baigne dans un épais voile de secret, et comme dans le cas de Mophat Okinyi, les annotateurs indépendants savent rarement à qui sont destinées les données qu'ils traitent. "Je sais que le client est au Japon, mais c'est tout. On ne nous a rien dit sur eux", note Eduardo* à propos d'une de ses missions d'annotation, fournie par Remotasks aux Philippines.

"Les entreprises d'IA expliquent que si elles étaient pleinement transparentes sur leurs besoins en données, cela pourrait donner des indices sur leurs projets en cours et influencer les réponses des contributeurs", résume Antonio Casilli d'un ton sceptique. "Elles veulent échapper à leurs responsabilités", assène Mophat Okinyi, qui ne savait pas que son travail servirait à OpenAI avant la fin anticipée du contrat, à la demande de Sama, en mars 2022.

"Si les annotateurs savaient qu'ils travaillent pour une entreprise qui génère des centaines de millions de dollars comme OpenAI, ils n'accepteraient pas des salaires si bas." Mophat Okinyi, ex-analyste qualité chez Sama

Ce travail peut-il être organisé de manière à satisfaire tout le monde, géants de la tech comme travailleurs du clic ? "Il faut plus de transparence, les entreprises basées à San Francisco doivent prendre leurs responsabilités", réclame Mophat Okinyi. Il s'est associé à 150 travailleurs du secteur de l'annotation et de la modération des plateformes pour créer l'Union des modérateurs de contenus du Kenya, qui devrait être autorisée "dans les deux mois", et a cofondé l'ONG Techworker Community Africa pour militer en faveur de meilleurs pratiques. "L'IA ne peut pas être éthique si elle est entraînée de façon immorale, en exploitant des gens en difficulté économique et sur des données volées", assène-t-il.

"Beaucoup de gens ne savent pas qu'il y a de l'humain derrière l'IA. Il faudrait que ce soit plus connu, et mieux payé." Astro, annotateur de données

Pour Antonio Casilli, il faut commencer par oublier l'idée que l'IA est seulement une prouesse d'ingénieurs ou d'entrepreneurs. " Nous sommes tous en quelque sorte les producteurs de ces IA, parce que ce sont nos données qui servent à les entraîner, mais nous ne sommes pas reconnus comme tels. Tant qu'on continuera à penser que l'IA est seulement l'affaire de Sam Altman, on aura un problème."

* Les prénoms suivis d'un astérisque ont été modifiés.

Auteur: Internet

Info: Francetvinfo.fr - Luc Chagnon, 9 avril 2024

[ texte-image ] [ homme-machine ] [ données intelligentes ] [ enrichies ] [ nord-sud ] [ domination économique ] [ data augmenté ] [ bases sémantiques ] [ post-colonialisme ]

Commenter

Commentaires: 0

Ajouté à la BD par miguel

Paramètres de recherches