Les fils de la pensée

hypothèse

Notre univers existe à l'intérieur d'un trou noir d'un univers de dimension supérieure

Vous êtes-vous déjà demandé ce qui se trouve au-delà de l'univers observable ? Et si notre univers n'était qu'une infime partie d'une réalité beaucoup plus vaste et complexe et qu'il se trouvait en fait à l'intérieur d'un trou noir ?

Qu'est-ce qu'un trou noir ?

Un trou noir est une région de l'espace où la gravité est si forte que rien ne peut s'en échapper, pas même la lumière. Selon la théorie de la relativité générale d'Einstein, les trous noirs se forment lorsque des étoiles massives s'effondrent à la fin de leur cycle de vie. La singularité qui en résulte est un point de densité infinie et de volume nul, où les lois de la physique s'effondrent.

Des scientifiques découvrent un lien possible entre le cerveau humain et le cosmos à l'échelle quantique

La limite d'un trou noir s'appelle l'horizon des événements, elle marque le point de non-retour pour tout ce qui la traverse. La taille de l'horizon des événements dépend de la masse du trou noir. Par exemple, un trou noir ayant la masse du soleil aurait un horizon des événements d'environ 3 kilomètres de rayon.

Comment notre univers peut-il se trouver à l'intérieur d'un trou noir ?Une façon d'aborder cette question est de se demander ce qui se passe à l'intérieur d'un trou noir. Selon la physique classique, rien ne peut survivre à l'intérieur d'un trou noir. Cependant, la physique quantique suggère qu'il pourrait y avoir une forme de structure ou d'information qui persiste au-delà de l'horizon des événements.

Une éventualité est que la singularité au centre d'un trou noir n'est pas un point, mais une sphère ou un tore, qui créerait un trou de ver, un raccourci spatio-temporel reéiant deux régions éloignées de l'univers. Dans ce cas, une extrémité du trou de ver se trouverait à l'intérieur du trou noir et l'autre extrémité à l'extérieur, dans une autre région de l'espace.

Une autre possibilité est que la singularité au centre d'un trou noir ne soit pas une sphère ou un tore, mais une hyper-sphère ou un hyper-tore, qui créerait un univers-bulle, une région autonome de l'espace-temps avec ses propres lois physiques et ses propres constantes. Dans ce cas, l'univers-bulle se trouverait à l'intérieur du trou noir, notre univers par exemple.

Quelles sont les preuves de cette hypothèse ?

L'idée que notre univers soit à l'intérieur d'un trou noir est spéculative et n'a été prouvée par aucune observation ou expérience directe. Toutefois, certains indices indirects viennent étayer cette hypothèse.

L'un d'entre eux est le rayonnement électromagnétique cosmique de fond (CMB), qui est le rayonnement résiduel du Big Bang ou fond diffus cosmologique (FDC, ou cosmic microwave background, ou "fond cosmique de micro-ondes") a une température uniforme, à l'exception de minuscules fluctuations révélant la structure de l'univers primitif. Certains physiciens avancent que ces fluctuations pouvaient s'expliquer en supposant que notre univers se trouve à l'intérieur d'un trou noir et que le rayonnement de fond cosmologique est en fait le rayonnement émis par l'horizon des événements.

L'expansion de l'univers serait un autre indice. Selon le modèle standard de la cosmologie, notre univers s'expand à un rythme accéléré en raison de l'énergie noire, une force mystérieuse qui s'oppose à la gravité. Cependant, certains physiciens avancent que l'énergie noire soit une illusion causée par l'hypothèse d'un univers plat et infini. Si notre univers est en fait courbe et fini, comme il le serait à l'intérieur d'un trou noir, l'énergie noire ne serait pas nécessaire pour expliquer l'expansion.

Quelles seraient les implications pour notre compréhension de la cosmologie et de la physique ?

Si notre univers se trouve effectivement à l'intérieur d'un trou noir, cela aura de profondes répercussions sur notre compréhension de la cosmologie et de la physique. D'une part, cela signifierait que notre univers a une origine et une fin, et qu'il n'est peut-être pas unique ou isolé. Cela signifierait également qu'il pourrait y avoir d'autres univers au-delà du nôtre, reliés par des trous de ver ou existant en tant que bulles distinctes.

Cela signifierait en outre qu'existent d'autres lois de la physique et de nouvelles dimensions de la réalité que nous n'avons pas encore découvertes ou comprises. Cela pourrait aussi expliquer certains paradoxes et autres contradictions entre la mécanique quantique et la relativité générale.

Auteur: Internet

Info: https://www.physics-astronomy.com/, 6 avril 2023

[ science-fiction ] [ niveaux vibratoires ] [ multivers ]

Commenter

Commentaires: 0

Ajouté à la BD par miguel

greenwashing

1/ La construction, l’installation, l’entretien (usage de produits nettoyants, de désherbant) des "fermes" solaires possède un lourd impact écologique. Il faut extraire les métaux et autres minerais, fondre la silice a très haute température pour obtenir le silicium, etc. Et qui dit extractions minières dit destructions environnementales et pollutions. Au préalable, il faut avoir construit les machines qui permettent d’extraire, transporter et traiter lesdits minerais, ainsi que les machines pour construire ces machines, et ainsi de suite — c’est un large ensemble d’industries qui sont nécessaires pour fabriquer des panneaux solaires (la même chose est vraie de n’importe quel objet de la civilisation industrielle). Par ailleurs, leur durée de vie ne dépasse guère vingt à trente ans ; ils ne sont ensuite que partiellement recyclés, génèrent donc des déchets, et n’ont pas grand-chose de "renouvelables" (sachant que le recyclage est en lui-même une industrie énergivore, qui requiert des machines, des machines qu’il faut construire, etc. — sachant, en d’autres termes, que le recyclage n’est pas non plus écologique). Enfin, des études récentes semblent montrer que la haute température des panneaux est mortelle pour les insectes qui les survolent, déjà durement éprouvés pour d’autres raisons.

2/ Les panneaux solaire n’ont de plus probablement jamais permis d’éviter un seul gramme d’émissions de gaz à effet de serre. En effet, les nouvelles sources d’énergie ne font que s’ajouter aux précédentes tandis que la production totale ne fait que croitre. On exploite les hydrocarbures partout où on le peut (gaz de schiste, sables bitumineux, gisements arctiques) et de surcroit on détruit les forêts pour construire des panneaux solaires. Il y a addition, et non remplacement.

La part prise par l’énergie solaire photovoltaïque est au demeurant extrêmement faible dans la consommation totale d’énergie (une tromperie commune consiste à ne parler que de l’électricité en oubliant que le gros de notre énergie est issue d’hydrocarbures de façon directe sans passer par la forme électrique), soit 0,4% du total dans le monde et 0,8 % en France. Cette légère augmentation ne suffit pas même à compenser la profusion de nouveaux "besoins" énergétiques créés par les technologies nouvelles.

Ainsi, la consommation d’électricité mondiale du seul bitcoin est dix fois supérieure à la production d’électricité photovoltaïque de la France, et trois fois supérieure à celle de l’Allemagne dont on vante l’avance dans le domaine. Interdire une crypto-monnaie, qui n’est au fond pas grand-chose de plus qu’une pyramide de Ponzi permettant à certains de spéculer, à d’autres de blanchir de l’argent et financer des activités illicites, ferait plus pour limiter les besoins en électricité fossile que des décennies de subventions massives du photovoltaïque.

3/ Un argument encore plus fort est celui du cannibalisme énergétique, qui prend en compte le fait que la construction de panneaux solaires est très couteuse en énergies fossiles sous une forme ou sous une autre (mines, fonte des métaux, du silicium, camions pour leur mise en place…). Si le déploiement de l’énergie censé remplacer les fossiles se fait à un rythme élevé, le secteur de substitution sera pendant la période de déploiement consommateur net d’énergie. En effet, si un panneau solaire, sur ses 20 à 25 années de durée de vie produit en 7 ans une quantité d’énergie qui compense celle nécessaire à sa construction, mais que dans le même temps on a construit deux autres panneaux, alors il faudra encore attendre pour que la construction de tous ces panneaux soit compensée, et si on ne cesse d’en construire toujours plus, alors le secteur augmente la demande de fossiles au lieu de la réduire. Au mieux, ce ne sera qu’au bout de longues décennies que le secteur cessera de croître et pourra réellement compenser les émissions liées à son déploiement. Le problème c’est que, comme le disent les climatologues, après plusieurs décennies, il sera trop tard.

4/ Pire encore. Au même titre que l’énergie fossile ou nucléaire, l’énergie produite par les panneaux solaires (ou les éoliennes, ou n’importe quelle autre source d’énergie dite verte, propre, renouvelable ou décarbonée) ne sert par définition qu’à alimenter d’autres appareils, d’autres machines issues du système techno-industriel ; à alimenter les infrastructures industrielles et numériques de la machine à détruire la nature qu’est devenue notre société, à alimenter les smartphones, les ordinateurs, les écrans de télévision, les voitures (électriques), l’inutile pollution lumineuse, les serveurs financiers, les usines d’aluminium, les écrans publicitaires dans l’espace public poussant à surconsommer, etc. (de plus en plus de compagnies minières se tournent vers les centrales de production d’énergie dite renouvelable, verte ou propre, notamment le solaire ou l’éolien, afin d’alimenter leurs installations d’extractions minières, pour la raison que ces centrales sont relativement simples à mettre en place). L’électricité produite par les centrales de production d’énergie dites vertes, propres ou renouvelables est donc elle-même largement néfaste écologiquement, dans ses usages, indépendamment de la façon dont elle est produite.

5/ On pourrait enfin évoquer un argument d’ordre culturel et politique. Les panneaux solaires (et éoliennes), négligeables en ce qui concerne les réalités du système énergétiques, sont omniprésent dans les discours, images et communication du grand récit officiel : "le développement durable". À ce titre, on peut penser que leur rôle principal est celui d’une diversion, d’objets inutiles mais rassurant au service du consentement à l’ordre établi. Il n’y a pas à s’inquiéter pour l’avenir, ni à restreindre sa consommation, ce n’est pas la peine de renoncer à l’automobile ou à l’avion : les énergies renouvelables sont là pour nous permettre de conserver pour toujours la débauche énergétique actuelle. Il suffit d’investir où il faut son épargne, de favoriser la finance verte ou de lancer un vaste plan d’investissement public.

Auteur: Autard Jean

Info: https://www.partage-le.com/2022/03/22/les-panneaux-solaires-ne-sont-pas-ecologiques-par-jean-autard/

[ coûts cachés ] [ déresponsabilisation ] [ solution miracle ] [ critique ]

Commenter

Commentaires: 0

Ajouté à la BD par Coli Masson

post-darwinisme

Internet et l’informatique en général ont joué un rôle permanent dans l’histoire de la mémétique, par exemple en faisant accepter l’idée que des codes non biologiques (typiquement, les virus informatiques) puissent avoir une reproduction autonome. La résolution de problèmes industriels a rebaptisé mémétiques les algorithmes génétiques. Mais surtout, le tissu social de l’internet, plus maillé de jour en jour, constitue une deuxième couche de lien social, d’interactions et de contenu. Il prend une telle épaisseur qu’il abrite sa propre faune. Des contenus – humoristiques, effrayants ou engagés – prolifèrent à une vitesse telle qu’on ne pourrait plus les contrôler sans "fermer" Internet. On appelle cela Internet memes parce que, depuis le début, la mémétique et la web culture sont consanguines. Le court-circuit linguistique ne s’est pas fait attendre, bien que personne ne l’ait anticipé : les "mèmes Internet" sont devenus mèmes par la grâce simplificatrice des médias grand public. Le nom sans objet a fusionné avec l’objet sans nom. Malheureusement, on se polarise trop sur les contenus sémantiques d’Internet, alors que l’on devrait aussi s’intéresser à la structure procédurale qui les sous-tend, en étudiant par exemple les puissants mèmes aux implications politiques et sociétales lourdes que sont Share (partagez du contenu), Like (dites que vous aimez) et Report (signaler un abus) !

Au fil des années, la communauté des méméticiens avait commencé à "tuer le père" en se détachant progressivement de Dawkins, de son analogie trop simple, éloquemment nommée "camisole intellectuelle" (Wallace, 2013). Mais voici qu’au festival de Cannes 2013, le succès des Internet memes fait sortir du bois "l’athée le plus célèbre du monde", avec un vidéo-clip taillé selon les codes visuels de YouTube. La nouvelle "petite phrase" de Dawkins est un pied de nez à toute la science sérieuse : "L’idée même de mème a elle-même muté et évolué dans une nouvelle direction".

Le jeu de mot "mutations are designed not random" (les mutations sont créées, pas aléatoires) est délibérément contestable : il ouvre une conception nouvelle du rapport entretenu par les variantes culturelles avec le terrain humain. La créativité et l’intention de l’artiste y font partie des conditions de naissance de la solution créative, sont le générateur de hasard.

Si exaspérant soit-il, Dawkins joue son rôle de diva en "levant des fonds" : il utilise le modèle économique de demain, celui qui convertit l’attention captée en revenus. Grâce aux Internet memes, il fait d’une pierre trois coups. Car pour une nouvelle science, il ne faut pas seulement de nouvelles lunettes et beaucoup de temps de cerveau, mais aussi un nouveau champ de données, une espèce inconnue, un nouveau continent. Autrement, on se heurte au reproche classique : "mais pourquoi aurait-on besoin de vos nouvelles lunettes, alors que celles que nous fabriquons déjà fonctionnent très bien ?" L’ennui, c’est que les vieilles lunettes ne voient pas bien ce qui est en train de se passer parce que cela va trop vite.

Une autre forme de science est nécessaire pour demain

On sait dire aujourd’hui "à quelle question la mémétique apporte une réponse". Les questions apparaissent chaque jour un peu plus clairement : pourquoi les phénomènes de société échappent-ils à toute prévision et plus encore à tout contrôle ? Pourquoi même les bonnes nouvelles sont-elles surprenantes ? Qu’est-ce qui influence les influenceurs ? Jusqu’où tel bouleversement va-t-il se propager ? Est-il normal que les objets nous utilisent et communiquent entre eux ? Aujourd’hui, la difficulté de prévoir, l’irruption permanente et encouragée de la nouveauté, voire de la disruption, ainsi que l’explosion des données massives (big data) appellent les compétences sociocognitives des "tendanceurs". Pensée rapide, échanges en réseau, erreur autorisée, remise en cause permanente et preuve par l’action. La mémétique rejoint cet arsenal des chasseurs de tendances parce qu’elle voit le monde avec d’autres lunettes, des lunettes qui savent que l’on regarde du vivant autoorganisé et non plus du "construit par l’homme selon des plans". Du coup ces lunettes nous rendent davantage capables de voir ce qui change rapidement et d’en percevoir les évolutions possibles. Aujourd’hui, la mouvance de l’économie collaborative se propose de mettre en partage le "code source" d’innovations citoyennes directement prêtes à être expérimentées.

Il devient impossible de penser seul ou en petits groupes centrés sur l’allégeance à un seul paradigme. Les sujets d’études offerts aux sciences de l’homme par le monde contemporain affolent par leur nombre, leur diversité et leur vitesse de renouvellement. De même, la connaissance se fabrique partout en même temps, dans un tissu ouvert constitué de personnes et de machines. La conscience même du sujet connecté n’est plus la même que celle du sujet isolé. La mémétique peut fournir un ensemble de métaphores agissant à la manière de passerelles interdisciplinaires, telles que la vision des solutions comme chemins entre états instables, celle du stockage partiel des souvenirs dans les objets, ou celle de l’ADN organisationnel comme fonctionnement implicite partagé des collectifs.

Une première condition est le recentrage indispensable de l’observation, du mème abstrait vers la solution concrète que l’on voit se reproduire et évoluer.

Une autre serait de mettre en lien souplement, autour de ce concept général de solutions, toutes les observations et réflexions – sans aucune contrainte disciplinaire – sur la manière dont nos actions s’inspirent et se déclenchent à partir des corps, des lieux et des objets, se répètent, sont bien ou mal vécues en commun, sont mémorisées, fabriquent des structures, produisent des récits…

Mais avant tout, la plus importante est de reconnaître la mémétique pour ce qu’elle est : un projet collaboratif, spontané, a-disciplinaire, mondial, qui nous équipe d’un regard neuf sur ce que la vie humaine est en train de devenir… un regard qui change jusqu’à notre conception de nous-mêmes. La mémétique ne mourra pas tant que ce travail restera à faire. Elle ne s’effacera pas, si ce n’est dans un projet plus grand qui réponde aux mêmes nécessités et partage la même ouverture.

Auteur: Jouxtel Pascal

Info: In Cairn infos, reprenant Hermès, La Revue 2013/3 (n° 67), pages 50 à 56

[ distanciation ] [ recul épistémologique ]

Commenter

Commentaires: 0

Ajouté à la BD par miguel

polémique évolutionniste

L'épigénétique, qui existe depuis 50 ans, n'est pas un nouvel acteur majeur de l'évolution. Dans la mesure où son importance avérée est d'ordre génétique. L'évolution culturelle et comportementale est un phénomène réel, mais ce n'est pas une évolution biologique.

Synthèse moderne

La variation génétique est aléatoire. Les mutations qui se produisent n'améliorent pas nécessairement la condition physique. Si les mutations donnent lieu à des caractéristiques qui améliorent la capacité des organismes à survivre et à prospérer, il s'agit d'un simple hasard.

Synthèse évolutionniste élargie (Laland)

La variation phénotypique n'est pas aléatoire. Les individus se développent en réponse aux conditions locales, de sorte que les nouvelles caractéristiques qu'ils possèdent sont souvent bien adaptées à leur environnement.

Presque toute l'évolution est finalement due à une mutation d'une sorte ou d'une autre. Nombreux sont ceux qui pensent que le hasard des mutations est le thème dominant de l'évolution. L'affirmation concernant la synthèse moderne est parfaitement correcte, en première approximation. (On peut ergoter sur les détails.)

L'idée que les phénotypes changent en fonction des conditions locales - par exemple, l'opéron lac s'exprime en présence de lactose - n'est guère révolutionnaire et n'exige pas de changement dans notre compréhension de la théorie moderne de l'évolution.

Synthèse moderne

L'évolution se produit généralement par le biais de multiples petites étapes, conduisant à un changement graduel. C'est parce qu'elle repose sur des changements progressifs provoqués par des mutations aléatoires.

Synthèse évolutive élargie (Laland)

L'évolution peut être rapide. Les processus de développement permettent aux individus de répondre aux défis environnementaux ou aux mutations par des changements coordonnés dans des ensembles de traits.

Est-il possible que Kevin Laland ignore totalement le débat sur le gradualisme, l'hybridation, la symbiose, le transfert horizontal de gènes, les mutations homéotiques, la saltation et les macromutations ? Est-il possible qu'il n'ait jamais pensé aux équilibres ponctués et à la théorie hiérarchique ?

Il est vrai que les vues démodées d'Ernst Mayr et compagnie ("Synthèse moderne") rejetaient toutes ces idées, mais l'évolution a évolué depuis les années 1950. Elle ne se limite plus à de petites étapes graduelles.

Les "révolutionnaires" pensent que les mutations peuvent être dirigées dans un but ultime. L'idée de base d'une augmentation des taux de mutation dans certaines conditions est débattue activement depuis très longtemps (avant 1996). On ne pense pas qu'il s'agisse d'une caractéristique majeure de l'évolution, sauf dans le sens d'une augmentation du taux de mutations "aléatoires".

Synthèse moderne

La perspective est centrée sur les gènes : l'évolution nécessite des changements dans la fréquence des gènes par le biais de la sélection naturelle, de la mutation, de la migration et de la perte aléatoire de variantes génétiques.

Synthèse évolutionniste élargie

La perspective est centrée sur l'organisme, avec des conceptions plus larges des processus évolutifs. Les individus s'adaptent à leur environnement au fur et à mesure qu'ils se développent et modifient les pressions de sélection.

Cette description de la synthèse moderne est la seule fois où j'ai vu Kevin Laland mentionner quelque chose qui ressemble à la dérive génétique aléatoire. Cela ne fait manifestement pas partie de sa vision normale du monde.

Je reconnais que la théorie moderne de l'évolution est "centrée sur les gènes" à cet égard. C'est parce que nous DÉFINISSONS l'évolution comme un changement dans la fréquence des allèles au sein d'une population. Je ne sais pas ce que cela signifie de passer à un point de vue "centré sur l'organisme" comme le décrit Laland. Il est certainement vrai que les cyanobactéries individuelles s'adaptent à leur environnement au fur et à mesure qu'elles grandissent et se développent, et il est certainement vrai qu'elles peuvent modifier l'environnement. Dans le cas présent, elles ont provoqué une augmentation des niveaux d'oxygène qui a affecté toutes les espèces vivantes.

Les cyanobactéries ont évolué pour s'adapter à leur environnement par le biais de mutations aléatoires et de changements dans la fréquence des allèles au sein de la population, en partie sous l'effet de la sélection. Beaucoup d'entre elles se sont éteintes. En quoi est-ce un changement dans notre vision de l'évolution ?

Synthèse moderne

Les processus micro-évolutifs expliquent les schémas macro-évolutifs. Les forces qui façonnent les individus et les populations expliquent également les changements évolutifs majeurs au niveau des espèces et au-delà.

Synthèse évolutionniste élargie

D'autres phénomènes expliquent les changements macro-évolutifs en augmentant l'évolutivité, c'est-à-dire la capacité à générer une diversité adaptative. Il s'agit notamment de la plasticité du développement et de la construction de niches.

L'un des principes de base de la synthèse moderne était que la macroévolution peut être expliquée efficacement comme étant simplement une multitude de microévolutions cumulatives. Les manuels modernes de biologie évolutive abordent d'autres caractéristiques de la macroévolution qui nécessitent un apport supplémentaire, notamment en ce qui concerne la spéciation. La vieille idée selon laquelle la microévolution suffit à expliquer la macroévolution n'est plus un axiome en biologie évolutive, et ce depuis plusieurs décennies [voir Macroévolution].

Les manuels modernes traitent de toutes sortes de choses qui influencent l'histoire à long terme de la vie (= macroévolution). Des éléments tels que les extinctions massives, la stase, la spéciation allopatrique, les contraintes, etc. L'évolutivité a été activement débattue pendant un demi-siècle et elle est bien couverte dans la plupart des manuels. (Voir Futuyma, 2e édition, p. 599). L'évolutivité n'est pas une idée nouvelle qui va révolutionner la théorie de l'évolution. En fait, le consensus, après de nombreux débats et discussions, est que l'évolutivité échoue sur les bancs de la téléologie. La théorie ne résiste tout simplement pas à un examen approfondi.

La sélection organisationnelle pour des caractéristiques qui confèrent un succès reproductif différentiel dans le moment écologique ne peut tout simplement pas générer, de manière active ou directe, un ensemble de caractéristiques qui n'acquièrent une importance évolutive qu'en conférant une flexibilité pour des changements dans un avenir lointain. Nous ne pouvons pas nier que ces caractéristiques d'évolutivité "comptent" profondément dans l'histoire des lignées ; mais comment des avantages pour l'avenir peuvent-ils découler d'un processus causal ici et maintenant ? (Gould, 2002 p. 1274)

Il est malhonnête de laisser entendre, dans un article destiné au lecteur moyen, qu'un sujet comme l'évolutivité est récent et n'a pas été examiné en profondeur, et rejeté, dans la littérature théorique sur l'évolution. Il en va de même pour les concepts de plasticité et de construction de niche. Ce ne sont pas des concepts nouveaux. Les experts compétents en matière d'évolution - ceux qui ont lu et écrit les manuels - ont examiné ces idées et les ont rejetées en tant que facteurs majeurs de la théorie de l'évolution.

Kevin Laland peut ne pas être d'accord avec ces analyses, mais en tant que scientifique, il a l'obligation de les mentionner au moins lorsqu'il écrit des articles promouvant un changement radical de la théorie de l'évolution. Il a la responsabilité de déclarer sa partialité.

Mais je fais une supposition qui n'est peut-être pas justifiée. Peut-être ne sait-il pas que ses opinions ont déjà été débattues, discutées et, pour la plupart, rejetées. Dans ce cas, son omission n'est pas due au fait qu'il induit délibérément ses lecteurs en erreur au sujet de la controverse. Il y a une autre raison.

1. L'accent mis sur les changements héréditaires (allèles) fait partie de la définition minimale actuelle de l'évolution. Elle est très différente de la perspective du "gène égoïste" défendue par Richard Dawkins. Ceux qui ne voient pas la différence ne sont tout simplement pas attentifs.

2. Je me demande comment "l'évolution culturelle" fonctionne chez les cyanobactéries et les érables ? Les principaux participants à la réunion de la Royal Society ont un penchant extrême pour l'évolution des organismes multicellulaires complexes - essentiellement des animaux et surtout des mammifères. Cela influence grandement leur point de vue sur l'évolution. Ils ont tendance à utiliser des exemples qui ne s'appliquent qu'à l'espèce qui les intéresse comme des leviers pour faire basculer l'ensemble de la théorie de l'évolution.

King, J. L., et Jukes, T. H. (1969) Non-darwinian evolution. Science, 164:788-798. PDF (en anglais)

Auteur: Moran Laurence A.

Info: A propos de la nouvelle vision de l'évolution de Kevin Laland, 4 décembre 2016

[ tâtonnements ] [ biogénétique ] [ auto-domestication ]

Commenter

Commentaires: 0

Ajouté à la BD par miguel

tour d'horizon de l'IA

Intelligence artificielle symbolique et machine learning, l’essor des technologies disruptives

Définie par le parlement Européen comme la " reproduction des comportements liés aux humains, tels que le raisonnement, la planification et la créativité ", l’intelligence artificielle s’initie de façon spectaculaire dans nos vies. Théorisée au milieu des années 50, plusieurs approches technologiques coexistent telles que l’approche machine learning dite statistique basée sur l’apprentissage automatique, ou l’approche symbolique basée sur l’interprétation et la manipulation des symboles. Mais comment se différencient ces approches ? Et pour quels usages ?

L’intelligence artificielle, une histoire ancienne

Entre les années 1948 et 1966, l’Intelligence Artificielle a connu un essor rapide, stimulé par des financements importants du gouvernement américain pour des projets de recherche sur l’IA, notamment en linguistique. Des progrès significatifs ont été réalisés dans la résolution de problèmes de logique symbolique, mais la capacité de l’IA à traiter des données complexes et imprécises était encore limitée.

A la fin des années 70, plus précisément lors du deuxième “été de l’IA” entre 1978 et 1987, l’IA connaît un regain d’intérêt. Les chercheurs ont commencé à explorer de nouvelles approches, notamment l’utilisation de réseaux neuronaux et de systèmes experts. Les réseaux neuronaux sont des modèles de traitement de l’information inspirés par le fonctionnement du cerveau humain, tandis que les systèmes experts sont des programmes informatiques qui simulent l’expertise humaine dans un domaine spécifique.

Il faudra attendre la fin des années 90 pour voir un renouveau de ces domaines scientifiques, stimulé par des avancées majeures dans le traitement des données et les progrès de l’apprentissage automatique. C’est d’ailleurs dans cette période qu’une IA, Deepblue, gagne contre le champion mondial Garry Kasparov aux échecs.$

Au cours des dernières années, cette technologie a connu une croissance exponentielle, stimulée par des progrès majeurs dans le deep learning, la robotique ou la compréhension du langage naturel (NLU). L’IA est maintenant utilisée dans un large éventail de domaines, notamment la médecine, l’agriculture, l’industrie et les services. C’est aujourd’hui un moteur clé de l’innovation et de la transformation de notre monde, accentué par l’essor des generative AIs.

Parmi ces innovations, deux grandes approches en intelligence artificielle sont aujourd’hui utilisées :

1 - Le Machine Learning : qui est un système d’apprentissage automatique basé sur l’exploitation de données, imitant un réseau neuronal

2 - L’IA Symbolique : qui se base sur un système d’exploitation de " symboles ”, ce qui inspire des technologies comme le “système expert” basé sur une suite de règles par exemple.

Mais comment fonctionnent ces deux approches et quels sont leurs avantages et leurs inconvénients ? Quels sont leurs champs d’application ? Peuvent-ils être complémentaires ?

Le machine learning

Le Machine Learning est le courant le plus populaire ces dernières années, il est notamment à l’origine de ChatGPT ou bien MidJourney, qui font beaucoup parler d’eux ces derniers temps. Le Machine Learning (ML) est une famille de méthodes d’apprentissage automatique qui permet aux ordinateurs d’apprendre à partir de données, sans être explicitement programmés. En utilisant des algorithmes, le ML permet aux ordinateurs de comprendre les structures et les relations dans les données et de les utiliser pour prendre des décisions.

Le ML consiste à entraîner des modèles informatiques sur de vastes ensembles de données. Ces modèles sont des algorithmes auto apprenant se basant sur des échantillons de données, tout en déterminant des schémas et des relations/corrélations entre elles. Le processus d’entraînement consiste à fournir à l’algorithme des données étiquetées, c’est-à-dire des données qui ont déjà été classifiées ou étiquetées pour leur attribuer une signification. L’algorithme apprend ensuite à associer les caractéristiques des données étiquetées aux catégories définies en amont. Il existe cependant une approche non-supervisée qui consiste à découvrir ce que sont les étiquettes elles-mêmes (ex: tâche de clustering).

Traditionnellement, le machine learning se divise en 4 sous-catégories :

Apprentissage supervisé :

Les ensembles de données sont étiquetés, ce qui permet à l’algorithme de trouver des corrélations et des relations entre les caractéristiques des données et les étiquettes correspondantes.

Apprentissage non supervisé :

Les ensembles de données ne sont pas étiquetés et l’algorithme doit découvrir les étiquettes par lui-même.

Apprentissage semi-supervisé :

L’algorithme utilise un mélange de données étiquetées et non étiquetées pour l’entraînement.

Apprentissage par renforcement :

L’algorithme apprend à prendre des décisions en interagissant avec son environnement. Il reçoit des récompenses ou des pénalités pour chaque action, ce qui lui permet d’ajuster sa stratégie pour maximiser sa récompense globale.

Un exemple d’application du Machine Learning est la reconnaissance d’images. Des modèles d’apprentissages profonds sont entraînés sur des millions d’images pour apprendre à reconnaître des objets, des personnes, des animaux, etc. Un autre exemple est la prédiction de la demande dans le commerce de détail, où des modèles sont entraînés sur des données de ventes passées pour prédire les ventes futures.

Quels sont les avantages ?

Étant entraîné sur un vaste corpus de données, le ML permet de prédire des tendances en fonction de données.

- Le machine learning offre la capacité de détecter des tendances and des modèles dans les données qui peuvent échapper à l’observation humaine.

- Une fois configuré, le machine learning peut fonctionner de manière autonome, sans l’intervention humaine. Par exemple, dans le domaine de la cybersécurité, il peut surveiller en permanence le trafic réseau pour identifier les anomalies.

- Les résultats obtenus par le machine learning peuvent s’affiner et s’améliorer avec le temps, car l’algorithme peut apprendre de nouvelles informations et ajuster ses prédictions en conséquence.

- Le machine learning est capable de traiter des volumes massifs et variés de données, même dans des environnements dynamiques et complexes.

L’intelligence artificielle symbolique

L’IA symbolique est une autre approche de l’intelligence artificielle. Elle utilise des symboles and des règles de traitement de l’information pour effectuer des tâches. Les symboles peuvent être des concepts, des objets, des relations, etc. Les règles peuvent être des règles de déduction, des règles de production, des règles d’inférence…etc.

Un exemple d’application de l’IA symbolique est le système expert. Un système expert est un programme informatique qui utilise des règles de déduction pour résoudre des problèmes dans un domaine spécifique, comme le diagnostic médical ou l’aide à la décision en entreprise. Un autre exemple est la traduction automatique basée sur des règles, les règles de grammaire et de syntaxe sont utilisées pour traduire un texte d’une langue à une autre.

Quelques exemples d’usages de l’IA symbolique :

La traduction

L’IA symbolique a été utilisée pour développer des systèmes de traduction automatique basés sur des règles. Ces systèmes utilisent des règles de grammaire et de syntaxe pour convertir un texte d’une langue à une autre. Par exemple, le système SYSTRAN, développé dans les années 1960, est un des premiers systèmes de traduction automatique basé sur des règles. Ce type de système se distingue des approches basées sur le Machine Learning, comme Google Translate, qui utilisent des modèles statistiques pour apprendre à traduire des textes à partir de corpus bilingues.

Le raisonnement logique

L’IA symbolique est également utilisée pour développer des systèmes capables de raisonnement logique, en exploitant des règles et des connaissances déclaratives pour résoudre des problèmes complexes. Par exemple, les systèmes d’aide à la décision basés sur des règles peuvent être utilisés dans des domaines tels que la finance, l’assurance ou la logistique, pour aider les entreprises à prendre des décisions éclairées. Un exemple concret est le système MYCIN, développé dans les années 1970 pour aider les médecins à diagnostiquer des infections bactériennes et à prescrire des antibiotiques adaptés.

L’analyse de textes

L’IA symbolique peut être utilisée pour l’analyse de textes, en exploitant des règles et des connaissances linguistiques pour extraire des informations pertinentes à partir de documents. Par exemple, les systèmes d’extraction d’information basés sur des règles peuvent être utilisés pour identifier des entités nommées (noms de personnes, d’organisations, de lieux, etc.) et des relations entre ces entités dans des textes. Un exemple d’application est l’analyse et la catégorisation des messages entrants pour les entreprises, cœur de métier de Golem.ai avec la solution InboxCare.

Les avantages de l’IA symbolique

L’IA symbolique est une approche qui utilise des symboles, et parfois des " règles” basées sur des connaissances, qui comporte plusieurs avantages :

- Explicablilité : Les décisions prises par les systèmes d’IA symbolique sont explicites et peuvent être expliquées en fonction des règles logiques et des connaissances déclaratives utilisées par le système. Cette transparence peut être essentielle dans des applications critiques, comme la médecine ou la défense.

- Frugalité : Contrairement au Machine Learning, l’IA symbolique ne nécessite pas d’entraînement, ce qui la rend moins gourmande en énergie à la fois lors de la conception et de l’utilisation.

- Adaptabilité : Les systèmes d’IA symbolique peuvent être facilement adaptés à de nouveaux domaines en ajoutant de nouvelles règles logiques et connaissances déclaratives à leurs bases de connaissances existantes, leurs permettant de s’adapter rapidement à de nouvelles situations.

L’intelligence artificielle hybride ou le neuro-symbolique

Les systèmes hybrides combinent les avantages de l’IA symbolique et du Machine Learning en utilisant une approche mixte. Dans ce type de système, l’IA symbolique est utilisée pour représenter les connaissances et les règles logiques dans un domaine spécifique. Les techniques de Machine Learning sont ensuite utilisées pour améliorer les performances de l’IA symbolique en utilisant des ensembles de données pour apprendre des modèles de décision plus précis et plus flexibles. Mais nous pouvons également voir d’autres articulations comme la taxonomie de Kautz par exemple.

L’IA symbolique est souvent utilisée dans des domaines où il est important de comprendre et de contrôler la façon dont les décisions sont prises, comme la médecine, la finance ou la sécurité. En revanche, le Machine Learning est souvent utilisé pour des tâches de classification ou de prédiction à grande échelle, telles que la reconnaissance de voix ou d’image, ou pour détecter des modèles dans des données massives.

En combinant les deux approches, les systèmes hybrides peuvent bénéficier de la compréhensibilité et de la fiabilité de l’IA symbolique, tout en utilisant la flexibilité et la capacité de traitement massif de données du Machine Learning pour améliorer la performance des décisions. Ces systèmes hybrides peuvent également offrir une plus grande précision et un temps de réponse plus rapide que l’une ou l’autre approche utilisée seule.

Que retenir de ces deux approches ?

L’Intelligence Artificielle est en constante évolution et transforme de nombreux secteurs d’activité. Les deux approches principales de l’IA ont leurs avantages et inconvénients et peuvent être complémentaires. Il est donc crucial pour les entreprises de comprendre ces technologies pour rester compétitives.

Cependant, les implications éthiques et sociales de l’IA doivent également être prises en compte. Les décisions des algorithmes peuvent avoir un impact sur la vie des personnes, leur travail, leurs droits et leurs libertés. Il est donc essentiel de mettre en place des normes éthiques et des réglementations pour garantir que l’IA soit au service de l’humanité. Les entreprises et les gouvernements doivent travailler ensemble pour développer des IA responsables, transparentes et équitables qui servent les intérêts de tous. En travaillant ensemble, nous pouvons assurer que l’IA soit une force positive pour l’humanité dans les années à venir.

Auteur: Merindol Hector

Info: https://golem.ai/en/blog/technologie/ia-symbolique-machinelearning-nlp - 4 avril 2023

[ dualité ]

Commenter

Commentaires: 0

Ajouté à la BD par Le sous-projectionniste

histoire

L'exil du peuple juif est un mythe
Shlomo Sand, historien du 20e siècle, avait jusqu'à présent étudié l'histoire intellectuelle de la France moderne (dans son livre "L'intellectuel, la vérité et le pouvoir", Am Oved éd., 2000 - en hébreu, et les rapports entre le cinéma et l'histoire politique ("Le cinéma comme Histoire", Am Oved, 2002 - en hébreu. D'une manière inhabituelle pour des historiens de profession, il se penche, dans son nouveau livre, sur des périodes qu'il n'avait jamais étudiées - généralement en s'appuyant sur des chercheurs antérieurs qui ont avancé des positions non orthodoxes sur les origines des Juifs.
- En fait, l'essentiel de votre livre ne s'occupe pas de l'invention du peuple juif par le nationalisme juif moderne mais de la question de savoir d'où viennent les Juifs.
"Mon projet initial était de prendre une catégorie spécifique de matériaux historiographiques modernes, d'examiner comment on avait fabriqué la fiction du peuple juif. Mais dès que j'ai commencé à confronter les sources historiographiques, je suis tombé sur des contradictions. Et c'est alors ce qui m'a poussé - je me suis mis au travail, sans savoir à quoi j'aboutirais. J'ai pris des documents originaux pour essayer d'examiner l'attitude d'auteurs anciens - ce qu'ils avaient écrit à propos de la conversion. "
- Des spécialistes de l'histoire du peuple juif affirment que vous vous occupez de questions dont vous n'avez aucune compréhension et que vous vous fondez sur des auteurs que vous ne pouvez pas lire dans le texte.
"Il est vrai que je suis un historien de la France et de l'Europe, et pas de l'Antiquité. Je savais que dès lors que je m'occuperais de périodes anciennes comme celles-là, je m'exposerais à des critiques assassines venant d'historiens spécialisés dans ces champs d'étude. Mais je me suis dit que je ne pouvais pas en rester à un matériel historiographique moderne sans examiner les faits qu'il décrit. Si je ne l'avais pas fait moi-même, il aurait fallu attendre une génération entière. Si j'avais continué à travailler sur la France, j'aurais peut-être obtenu des chaires à l'université et une gloire provinciale. Mais j'ai décidé de renoncer à la gloire. "
"Après que le peuple ait été exilé de force de sa terre, il lui est resté fidèle dans tous les pays de sa dispersion et n'a pas cessé de prier et d'espérer son retour sur sa terre pour y restaurer sa liberté politique": voilà ce que déclare, en ouverture, la Déclaration d'Indépendance. C'est aussi la citation qui sert de préambule au troisième chapitre du livre de Shlomo Sand, intitulé "L'invention de l'Exil". Aux dires de Sand, l'exil du peuple de sa terre n'a en fait jamais eu lieu.
"Le paradigme suprême de l'envoi en exil était nécessaire pour que se construise une mémoire à long terme, dans laquelle un peuple-race imaginaire et exilé est posé en continuité directe du -Peuple du Livre- qui l'a précédé", dit Sand ; sous l'influence d'autres historiens qui se sont penchés, ces dernières années, sur la question de l'Exil, il déclare que l'exil du peuple juif est, à l'origine, un mythe chrétien, qui décrivait l'exil comme une punition divine frappant les Juifs pour le péché d'avoir repoussé le message chrétien. "Je me suis mis à chercher des livres étudiant l'envoi en exil - événement fondateur dans l'Histoire juive, presque comme le génocide ; mais à mon grand étonnement, j'ai découvert qu'il n'y avait pas de littérature à ce sujet. La raison en est que personne n'a exilé un peuple de cette terre. Les Romains n'ont pas déporté de peuples et ils n'auraient pas pu le faire même s'ils l'avaient voulu. Ils n'avaient ni trains ni camions pour déporter des populations entières. Pareille logistique n'a pas existé avant le 20e siècle. C'est de là, en fait, qu'est parti tout le livre : de la compréhension que la société judéenne n'a été ni dispersée ni exilée. "
- Si le peuple n'a pas été exilé, vous affirmez en fait que les véritables descendants des habitants du royaume de Judée sont les Palestiniens.
"Aucune population n'est restée pure tout au long d'une période de milliers d'années. Mais les chances que les Palestiniens soient des descendants de l'ancien peuple de Judée sont beaucoup plus élevées que les chances que vous et moi en soyons. Les premiers sionistes, jusqu'à l'insurrection arabe, savaient qu'il n'y avait pas eu d'exil et que les Palestiniens étaient les descendants des habitants du pays. Ils savaient que des paysans ne s'en vont pas tant qu'on ne les chasse pas. Même Yitzhak Ben Zvi, le second président de l'Etat d'Israël, a écrit en 1929, que : la grande majorité des fellahs ne tirent pas leur origine des envahisseurs arabes, mais d'avant cela, des fellahs juifs qui étaient la majorité constitutive du pays... "
- Et comment des millions de Juifs sont-ils apparu tout autour de la Méditerranée ?
"Le peuple ne s'est pas disséminé, c'est la religion juive qui s'est propagée. Le judaïsme était une religion prosélyte. Contrairement à une opinion répandue, il y avait dans le judaïsme ancien une grande soif de convertir. Les Hasmonéens furent les premiers à commencer à créer une foule de Juifs par conversions massives, sous l'influence de l'hellénisme. Ce sont les conversions, depuis la révolte des Hasmonéens jusqu'à celle de Bar Kochba, qui ont préparé le terrain à la diffusion massive, plus tard, du christianisme. Après le triomphe du christianisme au 4e siècle, le mouvement de conversion a été stoppé dans le monde chrétien et il y a eu une chute brutale du nombre de Juifs. On peut supposer que beaucoup de Juifs apparus autour de la mer Méditerranée sont devenus chrétiens. Mais alors, le judaïsme commence à diffuser vers d'autres régions païennes - par exemple, vers le Yémen et le Nord de l'Afrique. Si le judaïsme n'avait pas filé de l'avant à ce moment-là, et continué à convertir dans le monde païen, nous serions restés une religion totalement marginale, si même nous avions survécu. "
- Comment en êtes-vous arrivé à la conclusion que les Juifs d'Afrique du Nord descendent de Berbères convertis ?
"Je me suis demandé comment des communautés juives aussi importantes avaient pu apparaître en Espagne. J'ai alors vu que Tariq Ibn-Ziyad, commandant suprême des musulmans qui envahirent l'Espagne, était berbère et que la majorité de ses soldats étaient des Berbères. Le royaume berbère juif de Dahia Al-Kahina n'avait été vaincu que 15 ans plus tôt. Et il y a, en réalité, plusieurs sources chrétiennes qui déclarent que beaucoup parmi les envahisseurs d'Espagne étaient des convertis au judaïsme. La source profonde de la grande communauté juive d'Espagne, c'étaient ces soldats berbères convertis au judaïsme. "
Aux dires de Sand, l'apport démographique le plus décisif à la population juive dans le monde s'est produit à la suite de la conversion du royaume khazar - vaste empire établi au Moyen-âge dans les steppes bordant la Volga et qui, au plus fort de son pouvoir, dominait depuis la Géorgie actuelle jusqu'à Kiev. Au 8e siècle, les rois khazars ont adopté la religion juive et ont fait de l'hébreu la langue écrite dans le royaume. A partir du 10e siècle, le royaume s'est affaibli et au 13e siècle, il a été totalement vaincu par des envahisseurs mongols et le sort de ses habitants juifs se perd alors dans les brumes.
Shlomo Sand revisite l'hypothèse, déjà avancée par des historiens du 19e et du 20e siècles, selon laquelle les Khazars convertis au judaïsme seraient l'origine principale des communautés juives d'Europe de l'Est. "Au début du 20e siècle, il y a une forte concentration de Juifs en Europe de l'Est : trois millions de Juifs, rien qu'en Pologne", dit-il ; "l'historiographie sioniste prétend qu'ils tirent leur origine de la communauté juive, plus ancienne, d'Allemagne, mais cette historiographie ne parvient pas à expliquer comment le peu de Juifs venus d'Europe occidentale - de Mayence et de Worms - a pu fonder le peuple yiddish d'Europe de l'Est. Les Juifs d'Europe de l'Est sont un mélange de Khazars et de Slaves repoussés vers l'Ouest. "
- Si les Juifs d'Europe de l'Est ne sont pas venus d'Allemagne, pourquoi parlaient-ils le yiddish, qui est une langue germanique ?
"Les Juifs formaient, à l'Est, une couche sociale dépendante de la bourgeoisie allemande et c'est comme ça qu'ils ont adopté des mots allemands. Je m'appuie ici sur les recherches du linguiste Paul Wechsler, de l'Université de Tel Aviv, qui a démontré qu'il n'y avait pas de lien étymologique entre la langue juive allemande du Moyen-âge et le yiddish. Le Ribal (Rabbi Yitzhak Bar Levinson) disait déjà en 1828 que l'ancienne langue des Juifs n'était pas le yiddish. Même Ben Tzion Dinour, père de l'historiographie israélienne, ne craignait pas encore de décrire les Khazars comme l'origine des Juifs d'Europe de l'Est et peignait la Khazarie comme la : mère des communautés de l'Exil... en Europe de l'Est. Mais depuis environ 1967, celui qui parle des Khazars comme des pères des Juifs d'Europe de l'Est est considéré comme bizarre et comme un doux rêveur. "
- Pourquoi, selon vous, l'idée d'une origine khazar est-elle si menaçante ?
"Il est clair que la crainte est de voir contester le droit historique sur cette terre. Révéler que les Juifs ne viennent pas de Judée paraît réduire la légitimité de notre présence ici. Depuis le début de la période de décolonisation, les colons ne peuvent plus dire simplement : Nous sommes venus, nous avons vaincu et maintenant nous sommes ici.... - comme l'ont dit les Américains, les Blancs en Afrique du Sud et les Australiens. Il y a une peur très profonde que ne soit remis en cause notre droit à l'existence. "
- Cette crainte n'est-elle pas fondée ?
"Non. Je ne pense pas que le mythe historique de l'exil et de l'errance soit la source de ma légitimité à être ici. Dès lors, cela m'est égal de penser que je suis d'origine khazar. Je ne crains pas cet ébranlement de notre existence, parce que je pense que le caractère de l'Etat d'Israël menace beaucoup plus gravement son existence. Ce qui pourra fonder notre existence ici, ce ne sont pas des droits historiques mythologiques mais le fait que nous commencerons à établir ici une société ouverte, une société de l'ensemble des citoyens israéliens. "
- En fait, vous affirmez qu'il n'y a pas de peuple juif.
"Je ne reconnais pas de peuple juif international. Je reconnais un ; peuple yiddish... qui existait en Europe de l'Est, qui n'est certes pas une nation mais où il est possible de voir une civilisation yiddish avec une culture populaire moderne. Je pense que le nationalisme juif s'est épanoui sur le terreau de ce : peuple yiddish.... Je reconnais également l'existence d'une nation israélienne, et je ne lui conteste pas son droit à la souveraineté. Mais le sionisme, ainsi que le nationalisme arabe au fil des années, ne sont pas prêts à le reconnaître.
Du point de vue du sionisme, cet Etat n'appartient pas à ses citoyens, mais au peuple juif. Je reconnais une définition de la Nation : un groupe humain qui veut vivre de manière souveraine. Mais la majorité des Juifs dans le monde ne souhaite pas vivre dans l'Etat d'Israël, en dépit du fait que rien ne les en empêche. Donc, il n'y a pas lieu de voir en eux une nation. "
- Qu'y a-t-il de si dangereux dans le fait que les Juifs s'imaginent appartenir à un seul peuple ? Pourquoi serait-ce mal en soi ?
"Dans le discours israélien sur les racines, il y a une dose de perversion. C'est un discours ethnocentrique, biologique, génétique. Mais Israël n'a pas d'existence comme Etat juif : si Israël ne se développe pas et ne se transforme pas en société ouverte, multiculturelle, nous aurons un Kosovo en Galilée. La conscience d'un droit sur ce lieu doit être beaucoup plus souple et variée, et si j'ai contribué avec ce livre à ce que moi-même et mes enfants puissions vivre ici avec les autres, dans cet Etat, dans une situation plus égalitaire, j'aurai fait ma part.
Nous devons commencer à oeuvrer durement pour transformer ce lieu qui est le nôtre en une république israélienne, où ni l'origine ethnique, ni la croyance n'auront de pertinence au regard de la Loi. Celui qui connaît les jeunes élites parmi les Arabes d'Israël, peut voir qu'ils ne seront pas d'accord de vivre dans un Etat qui proclame n'être pas le leur. Si j'étais Palestinien, je me rebellerais contre un tel Etat, mais c'est aussi comme Israélien que je me rebelle contre cet Etat. "
La question est de savoir si, pour arriver à ces conclusions-là, il était nécessaire de remonter jusqu'au royaume des Khazars et jusqu'au royaume Himyarite.
"Je ne cache pas que j'éprouve un grand trouble à vivre dans une société dont les principes nationaux qui la dirigent sont dangereux, et que ce trouble m'a servi de moteur dans mon travail. Je suis citoyen de ce pays, mais je suis aussi historien, et en tant qu'historien, j'ai une obligation d'écrire de l'Histoire et d'examiner les textes. C'est ce que j'ai fait. "
- Si le mythe du sionisme est celui du peuple juif revenu d'exil sur sa terre, que sera le mythe de l'Etat que vous imaginez ?
" Un mythe d'avenir est préférable selon moi à des mythologies du passé et du repli sur soi. Chez les Américains, et aujourd'hui chez les Européens aussi, ce qui justifie l'existence d'une nation, c'est la promesse d'une société ouverte, avancée et opulente. Les matériaux israéliens existent, mais il faut leur ajouter, par exemple, des fêtes rassemblant tous les Israéliens. Réduire quelque peu les jours de commémoration et ajouter des journées consacrées à l'avenir. Mais même aussi, par exemple, ajouter une heure pour commémorer la : Nakba... entre le Jour du Souvenir et la Journée de l'Indépendance.

Auteur: Sand Shlomo

Info: traduit de l'hébreu par Michel Ghys

[ illusion ]

Commenter

Commentaires: 0

évolution technologique

Intelligence artificielle ou stupidité réelle ?

Bien que le battage médiatique augmente la sensibilisation à l'IA, il facilite également certaines activités assez stupides et peut distraire les gens de la plupart des progrès réels qui sont réalisés.
Distinguer la réalité des manchettes plus dramatiques promet d'offrir des avantages importants aux investisseurs, aux entrepreneurs et aux consommateurs.

L'intelligence artificielle a acquis sa notoriété récente en grande partie grâce à des succès très médiatisés tels que la victoire d'IBM Watson à Jeopardy et celle de Google AlphaGo qui a battu le champion du monde au jeu "Go". Waymo, Tesla et d'autres ont également fait de grands progrès avec les véhicules auto-propulsés. Richard Waters a rendu compte de l'étendue des applications de l'IA dans le Financial Times : "S'il y a un message unificateur qui sous-tend la technologie grand public exposée [au Consumer Electronics Show] .... c'est : "L'IA partout."

Les succès retentissants de l'IA ont également capturé l'imagination des gens à un tel point que cela a suscité d'autres efforts d'envergure. Un exemple instructif a été documenté par Thomas H. Davenport et Rajeev Ronanki dans le Harvard Business Review. Ils écrirent, "En 2013, le MD Anderson Cancer Center a lancé un projet ""Moon shot " : diagnostiquer et recommander des plans de traitement pour certaines formes de cancer en utilisant le système cognitif Watson d'IBM". Malheureusement, ce système n'a pas fonctionné et en 2017 le projet fut mis en veilleuse après avoir coûté plus de 62 millions de dollars sans avoir été utilisé pour les patients.

Waters a également abordé un autre message, celui des attentes modérées. En ce qui concerne les "assistants personnels à commande vocale", note-t-elle, "on ne sait pas encore si la technologie est capable de remplacer le smartphone pour naviguer dans le monde numérique autrement autrement que pour écouter de la musique ou vérifier les nouvelles et la météo".

D'autres exemples de prévisions modérées abondent. Generva Allen du Baylor College of Medicine et de l'Université Rice a avertit , "Je ne ferais pas confiance à une très grande partie des découvertes actuellement faites qui utilisent des techniques de machine learning appliquées à de grands ensembles de données". Le problème, c'est que bon nombre des techniques sont conçues pour fournir des réponses précises et que la recherche comporte des incertitudes. Elle a précisé : "Parfois, il serait beaucoup plus utile qu'ils reconnaissent que certains sont vraiment consolidés, mais qu'on est pas sûr pour beaucoup d'autres".

Pire encore, dans les cas extrêmes, l'IA n'est pas seulement sous-performante ; elle n'a même pas encore été mise en œuvre. Le FT rapporte, "Quatre jeunes entreprises européennes sur dix n'utilisent aucun programme d'intelligence artificielle dans leurs produits, selon un rapport qui souligne le battage publicitaire autour de cette technologie.

Les cycles d'attentes excessives suivies de vagues de déception ne sont pas surprenants pour ceux qui ont côtoyé l'intelligence artificielle pendant un certain temps. Ils savent que ce n'est pas le premier rodéo de l'IA. En effet, une grande partie du travail conceptuel date des années 1950. D'ailleurs, en passant en revue certaines de mes notes récentes je suis tombé sur une pièce qui explorait les réseaux neuronaux dans le but de choisir des actions - datant de 1993.

La meilleure façon d'avoir une perspective sur l'IA est d'aller directement à la source et Martin Ford nous en donne l'occasion dans son livre, Architects of Intelligence. Organisé sous la forme d'une succession d'entrevues avec des chercheurs, des universitaires et des entrepreneurs de premier plan de l'industrie, le livre présente un historique utile de l'IA et met en lumière les principaux courants de pensée.

Deux perspectives importantes se dégagent de ce livre.

La première est qu'en dépit des origines et des personnalités disparates des personnes interrogées, il existe un large consensus sur des sujets importants.

L'autre est qu'un grand nombre des priorités et des préoccupations des principales recherches sur l'IA sont bien différentes de celles exprimées dans les médias grand public.

Prenons par exemple le concept d'intelligence générale artificielle (AGI). Qui est étroitement lié à la notion de "singularité" ce point où l'IA rejoindra celle de l'homme - avant un dépassement massif de cette dernière. Cette idée et d'autres ont suscité des préoccupations au sujet de l'IA, tout comme les pertes massives d'emplois, les drones tueurs et une foule d'autres manifestations alarmantes.

Les principaux chercheurs en AI ont des points de vue très différents ; ils ne sont pas du tout perturbés par l'AGI et autres alarmismes.

Geoffrey Hinton, professeur d'informatique à l'Université de Toronto et vice-président et chercheur chez Google, dit : "Si votre question est : Quand allons-nous obtenir un commandant-docteur Data (comme dans Star Trek ) je ne crois pas que ce sera comme çà que ça va se faire. Je ne pense pas qu'on aura des programmes uniques et généralistes comme ça."

Yoshua Bengio, professeur d'informatique et de recherche opérationnelle à l'Université de Montréal, nous dit qu'il y a des problèmes très difficiles et que nous sommes très loin de l'IA au niveau humain. Il ajoute : "Nous sommes tous excités parce que nous avons fait beaucoup de progrès dans cette ascension, mais en nous approchant du sommet, nous apercevons d'autres collines qui s'élèvent devant nous au fur et à mesure".

Barbara Grosz, professeur de sciences naturelles à l'Université de Harvard : "Je ne pense pas que l'AGI soit la bonne direction à prendre". Elle soutient que la poursuite de l'AGI (et la gestion de ses conséquences) sont si loin dans l'avenir qu'elles ne sont que "distraction".

Un autre fil conducteur des recherches sur l'IA est la croyance que l'IA devrait être utilisée pour améliorer le travail humain plutôt que le remplacer.

Cynthia Breazeal, directrice du groupe de robots personnels du laboratoire de médias du MIT, aborde la question : "La question est de savoir quelle est la synergie, quelle est la complémentarité, quelle est l'amélioration qui permet d'étendre nos capacités humaines en termes d'objectifs, ce qui nous permet d'avoir vraiment un plus grand impact dans le monde, avec l'IA."

Fei-Fei Li, professeur d'informatique à Stanford et scientifique en chef pour Google Cloud dit lui : "L'IA en tant que technologie a énormément de potentiel pour valoriser et améliorer le travail, sans le remplacer".

James Manyika, président du conseil et directeur du McKinsey Global Institute, fait remarquer que puisque 60 % des professions ont environ un tiers de leurs activités qui sont automatisables et que seulement environ 10 % des professions ont plus de 90 % automatisables, "beaucoup plus de professions seront complétées ou augmentées par des technologies qu'elles ne seront remplacées".

De plus, l'IA ne peut améliorer le travail humain que si elle peut travailler efficacement de concert avec lui.

Barbara Grosz fait remarquer : "J'ai dit à un moment donné que 'les systèmes d'IA sont meilleurs s'ils sont conçus en pensant aux gens'". Je recommande que nous visions à construire un système qui soit un bon partenaire d'équipe et qui fonctionne si bien avec nous que nous ne nous rendions pas compte qu'il n'est pas humain".

David Ferrucci, fondateur d'Elemental Cognition et directeur d'IA appliquée chez Bridgewater Associates, déclare : " L'avenir que nous envisageons chez Elemental Cognition repose sur une collaboration étroite et fluide entre l'intelligence humaine et la machine. "Nous pensons que c'est un partenariat de pensée." Yoshua Bengio nous rappelle cependant les défis à relever pour former un tel partenariat : "Il ne s'agit pas seulement de la précision [avec l'IA], il s'agit de comprendre le contexte humain, et les ordinateurs n'ont absolument aucun indice à ce sujet."

Il est intéressant de constater qu'il y a beaucoup de consensus sur des idées clés telles que l'AGI n'est pas un objectif particulièrement utile en ce moment, l'IA devrait être utilisée pour améliorer et non remplacer le travail et l'IA devrait fonctionner en collaboration avec des personnes. Il est également intéressant de constater que ces mêmes leçons sont confirmées par l'expérience des entreprises.

Richard Waters décrit comment les implémentations de l'intelligence artificielle en sont encore à un stade assez rudimentaire.

Éliminez les recherches qui monopolisent les gros titres (un ordinateur qui peut battre les humains au Go !) et la technologie demeure à un stade très primaire .

Mais au-delà de cette "consumérisation" de l'IT, qui a mis davantage d'outils faciles à utiliser entre les mains, la refonte des systèmes et processus internes dans une entreprise demande beaucoup de travail.

Ce gros travail prend du temps et peu d'entreprises semblent présentes sur le terrain. Ginni Rometty, responsable d'IBM, qualifie les applications de ses clients d'"actes aléatoires du numérique" et qualifie nombre de projets de "hit and miss". (ratages). Andrew Moore, responsable de l'intelligence artificielle pour les activités de Google Cloud business, la décrit comme "intelligence artificielle artisanale". Rometty explique : "Ils ont tendance à partir d'un ensemble de données isolé ou d'un cas d'utilisation - comme la rationalisation des interactions avec un groupe particulier de clients. Tout ceci n'est pas lié aux systèmes, données ou flux de travail plus profonds d'une entreprise, ce qui limite leur impact."

Bien que le cas HBR du MD Anderson Cancer Center soit un bon exemple d'un projet d'IA "au clair de lune "qui a probablement dépassé les bornes, cela fournit également une excellente indication des types de travail que l'IA peut améliorer de façon significative. En même temps que le centre essayait d'appliquer l'IA au traitement du cancer, son "groupe informatique expérimentait l'utilisation des technologies cognitives pour des tâches beaucoup moins ambitieuses, telles que faire des recommandations d'hôtels et de restaurants pour les familles des patients, déterminer quels patients avaient besoin d'aide pour payer leurs factures, et résoudre les problèmes informatiques du personnel".

Dans cette entreprise, le centre a eu de bien meilleures expériences : "Les nouveaux systèmes ont contribué à accroître la satisfaction des patients, à améliorer le rendement financier et à réduire le temps consacré à la saisie fastidieuse des données par les gestionnaires de soins de l'hôpital. De telles fonctions banales ne sont peut-être pas exactement du ressort de Terminator, mais elles sont quand même importantes.

Optimiser l'IA dans le but d'augmenter le travail en collaborant avec les humains était également le point central d'une pièce de H. James Wilson et Paul R. Daugherty "HBRpiece". Ils soulignent : "Certes, de nombreuses entreprises ont utilisé l'intelligence artificielle pour automatiser leurs processus, mais celles qui l'utilisent principalement pour déplacer leurs employés ne verront que des gains de productivité à court terme. Grâce à cette intelligence collaborative, l'homme et l'IA renforcent activement les forces complémentaires de l'autre : le leadership, le travail d'équipe, la créativité et les compétences sociales de la première, la rapidité, l'évolutivité et les capacités quantitatives de la seconde".

Wilson et Daugherty précisent : "Pour tirer pleinement parti de cette collaboration, les entreprises doivent comprendre comment les humains peuvent le plus efficacement augmenter les machines, comment les machines peuvent améliorer ce que les humains font le mieux, et comment redéfinir les processus commerciaux pour soutenir le partenariat". Cela demande beaucoup de travail et cela va bien au-delà du simple fait de balancer un système d'IA dans un environnement de travail préexistant.

Les idées des principaux chercheurs en intelligence artificielle, combinées aux réalités des applications du monde réel, offrent des implications utiles. La première est que l'IA est une arme à double tranchant : le battage médiatique peut causer des distractions et une mauvaise attribution, mais les capacités sont trop importantes pour les ignorer.

Ben Hunt discute des rôles de la propriété intellectuelle (PI) et de l'intelligence artificielle dans le secteur des investissements, et ses commentaires sont largement pertinents pour d'autres secteurs. Il note : "L'utilité de la propriété intellectuelle pour préserver le pouvoir de fixation des prix est beaucoup moins fonction de la meilleure stratégie que la PI vous aide à établir, et beaucoup plus fonction de la façon dont la propriété intellectuelle s'intègre dans le l'esprit du temps (Zeitgeist) dominant dans votre secteur.

Il poursuit en expliquant que le "POURQUOI" de votre PI doit "répondre aux attentes de vos clients quant au fonctionnement de la PI" afin de protéger votre produit. Si vous ne correspondez pas à l'esprit du temps, personne ne croira que les murs de votre château existent, même si c'est le cas". Dans le domaine de l'investissement (et bien d'autres encore), "PERSONNE ne considère plus le cerveau humain comme une propriété intellectuelle défendable. Personne." En d'autres termes, si vous n'utilisez pas l'IA, vous n'obtiendrez pas de pouvoir de fixation des prix, quels que soient les résultats réels.

Cela fait allusion à un problème encore plus grave avec l'IA : trop de gens ne sont tout simplement pas prêts à y faire face.

Daniela Rus, directrice du laboratoire d'informatique et d'intelligence artificielle (CSAIL) du MIT déclare : "Je veux être une optimiste technologique. Je tiens à dire que je vois la technologie comme quelque chose qui a le potentiel énorme d'unir les gens plutôt que les diviser, et de les autonomiser plutôt que de les désolidariser. Mais pour y parvenir, nous devons faire progresser la science et l'ingénierie afin de rendre la technologie plus performante et plus utilisable." Nous devons revoir notre façon d'éduquer les gens afin de nous assurer que tous ont les outils et les compétences nécessaires pour tirer parti de la technologie.

Yann Lecun ajoute : "Nous n'aurons pas de large diffusion de la technologie de l'IA à moins qu'une proportion importante de la population ne soit formée pour en tirer parti ".

Cynthia Breazeal répéte : "Dans une société de plus en plus alimentée par l'IA, nous avons besoin d'une société alphabétisée à l'IA."

Ce ne sont pas non plus des déclarations creuses ; il existe une vaste gamme de matériel d'apprentissage gratuit pour l'IA disponible en ligne pour encourager la participation sur le terrain.

Si la société ne rattrape pas la réalité de l'IA, il y aura des conséquences.

Brezeal note : "Les craintes des gens à propos de l'IA peuvent être manipulées parce qu'ils ne la comprennent pas."

Lecun souligne : " Il y a une concentration du pouvoir. À l'heure actuelle, la recherche sur l'IA est très publique et ouverte, mais à l'heure actuelle, elle est largement déployée par un nombre relativement restreint d'entreprises. Il faudra un certain temps avant que ce ne soit utilisé par une plus grande partie de l'économie et c'est une redistribution des cartes du pouvoir."

Hinton souligne une autre conséquence : "Le problème se situe au niveau des systèmes sociaux et la question de savoir si nous allons avoir un système social qui partage équitablement... Tout cela n'a rien à voir avec la technologie".

À bien des égards, l'IA est donc un signal d'alarme. En raison de l'interrelation unique de l'IA avec l'humanité, l'IA a tendance à faire ressortir ses meilleurs et ses pires éléments. Certes, des progrès considérables sont réalisés sur le plan technologique, ce qui promet de fournir des outils toujours plus puissants pour résoudre des problèmes difficiles. Cependant, ces promesses sont également limitées par la capacité des gens, et de la société dans son ensemble, d'adopter les outils d'IA et de les déployer de manière efficace.

Des preuves récentes suggèrent que nous avons du pain sur la planche pour nous préparer à une société améliorée par l'IA. Dans un cas rapporté par le FT, UBS a créé des "algorithmes de recommandation" (tels que ceux utilisés par Netflix pour les films) afin de proposer des transactions pour ses clients. Bien que la technologie existe, il est difficile de comprendre en quoi cette application est utile à la société, même de loin.

Dans un autre cas, Richard Waters nous rappelle : "Cela fait presque dix ans, par exemple, que Google a fait trembler le monde de l'automobile avec son premier prototype de voiture autopropulsée". Il continue : "La première vague de la technologie des voitures sans conducteur est presque prête à faire son entrée sur le marché, mais certains constructeurs automobiles et sociétés de technologie ne semblent plus aussi désireux de faire le grand saut. Bref, ils sont menacés parce que la technologie actuelle est à "un niveau d'autonomie qui fait peur aux constructeurs automobiles, mais qui fait aussi peur aux législateurs et aux régulateurs".

En résumé, que vous soyez investisseur, homme d'affaires, employé ou consommateur, l'IA a le potentiel de rendre les choses bien meilleures - et bien pires. Afin de tirer le meilleur parti de cette opportunité, un effort actif axé sur l'éducation est un excellent point de départ. Pour que les promesses d'AI se concrétisent, il faudra aussi déployer beaucoup d'efforts pour mettre en place des infrastructures de systèmes et cartographier les forces complémentaires. En d'autres termes, il est préférable de considérer l'IA comme un long voyage plutôt que comme une destination à court terme.

Auteur: Internet

Info: Zero Hedge, Ven, 03/15/2019 - 21:10

[ prospective ]

Commenter

Mis dans la chaine

Commentaires: 0

Ajouté à la BD par miguel

intelligence artificielle

Apprendre l'anglais n'est pas une tâche facile, comme le savent d'innombrables étudiants. Mais lorsque l'étudiant est un ordinateur, une approche fonctionne étonnamment bien : Il suffit d'alimenter un modèle mathématique géant, appelé réseau neuronal, avec des montagnes de textes provenant d'Internet. C'est le principe de fonctionnement des modèles linguistiques génératifs tels que ChatGPT d'OpenAI, dont la capacité à tenir une conversation cohérente (à défaut d'être toujours sincère) sur un large éventail de sujets a surpris les chercheurs et le public au cours de l'année écoulée.

Mais cette approche présente des inconvénients. D'une part, la procédure de "formation" nécessaire pour transformer de vastes archives textuelles en modèles linguistiques de pointe est coûteuse et prend beaucoup de temps. D'autre part, même les personnes qui forment les grands modèles linguistiques ont du mal à comprendre leur fonctionnement interne, ce qui, à son tour, rend difficile la prévision des nombreuses façons dont ils peuvent échouer.

Face à ces difficultés, certains chercheurs ont choisi d'entraîner des modèles plus petits sur des ensembles de données plus restreints, puis d'étudier leur comportement. "C'est comme le séquençage du génome de la drosophile par rapport au séquençage du génome humain", explique Ellie Pavlick, chercheuse sur les modèles de langage à l'université de Brown.

Dans un article récemment publié sur le serveur scientifique arxiv.org, deux chercheurs de Microsoft ont présenté une nouvelle méthode pour former de minuscules modèles de langage : Les élever avec un régime strict d'histoires pour enfants.

RÉSEAUX NEURONAUX

Des chercheurs acquièrent une nouvelle compréhension à partir d'une simple IA

Les chercheurs en apprentissage automatique ont compris cette leçon. GPT-3.5, le grand modèle linguistique qui alimente l'interface ChatGPT, compte près de 200 milliards de paramètres et a été entraîné sur un ensemble de données comprenant des centaines de milliards de mots (OpenAI n'a pas publié les chiffres correspondants pour son successeur, GPT-4). L'entraînement de modèles aussi vastes nécessite généralement au moins 1 000 processeurs spécialisés, appelés GPU, fonctionnant en parallèle pendant des semaines. Seules quelques entreprises peuvent réunir les ressources nécessaires, sans parler de l'entraînement et de la comparaison de différents modèles.

Les deux chercheurs ont montré que des modèles linguistiques des milliers de fois plus petits que les systèmes de pointe actuels apprenaient rapidement à raconter des histoires cohérentes et grammaticalement justes lorsqu'ils étaient formés de cette manière. Leurs résultats indiquent de nouvelles pistes de recherche qui pourraient être utiles pour former des modèles plus importants et comprendre leur comportement.

"J'ai trouvé tout ça très instructif", a déclaré Chandra Bhagavatula, chercheur sur les modèles de langage à l'Allen Institute for Artificial Intelligence de Seattle. "Le concept lui-même est très intéressant.

Il était une fois

Les réseaux neuronaux au cœur des modèles de langage sont des structures mathématiques vaguement inspirées du cerveau humain. Chacun d'entre eux contient de nombreux neurones artificiels disposés en couches, avec des connexions entre les neurones des couches adjacentes. Le comportement du réseau neuronal est régi par la force de ces connexions, appelées paramètres. Dans un modèle linguistique, les paramètres contrôlent les mots que le modèle peut produire ensuite, compte tenu d'une invite initiale et des mots qu'il a déjà générés.

Un modèle ne prend véritablement vie qu'au cours de la formation, lorsqu'il compare de manière répétée ses propres résultats au texte de son ensemble de données de formation et qu'il ajuste ses paramètres afin d'accroître la ressemblance. Un réseau non entraîné avec des paramètres aléatoires est trivialement facile à assembler à partir de quelques lignes de code, mais il ne produira que du charabia. Après l'entraînement, il peut souvent poursuivre de manière plausible un texte peu familier. Les modèles de plus grande taille sont souvent soumis à des réglages plus fins qui leur apprennent à répondre à des questions et à suivre des instructions, mais l'essentiel de la formation consiste à maîtriser la prédiction des mots.

Pour réussir à prédire des mots, un modèle linguistique doit maîtriser de nombreuses compétences différentes. Par exemple, les règles de la grammaire anglaise suggèrent que le mot suivant le mot "going" sera probablement "to", quel que soit le sujet du texte. En outre, un système a besoin de connaissances factuelles pour compléter "la capitale de la France est", et compléter un passage contenant le mot "not" nécessite une connaissance rudimentaire de la logique.

"Le langage brut est très compliqué", explique Timothy Nguyen, chercheur en apprentissage automatique chez DeepMind. "Pour que des capacités linguistiques intéressantes apparaissent, les gens ont eu recours à l'idée que plus il y a de données, mieux c'est".

(photo) Ronen Eldan s'est rendu compte qu'il pouvait utiliser les histoires d'enfants générées par de grands modèles linguistiques pour en entraîner rapidement de plus petits.

Introduction

Ronen Eldan, mathématicien qui a rejoint Microsoft Research en 2022 pour étudier les modèles de langage génératifs, souhaitait développer un moyen moins coûteux et plus rapide d'explorer leurs capacités. Le moyen naturel d'y parvenir était d'utiliser un petit ensemble de données, ce qui signifiait qu'il devait entraîner les modèles à se spécialiser dans une tâche spécifique, afin qu'ils ne s'éparpillent pas. Au départ, il voulait entraîner les modèles à résoudre une certaine catégorie de problèmes mathématiques, mais un après-midi, après avoir passé du temps avec sa fille de 5 ans, il s'est rendu compte que les histoires pour enfants convenaient parfaitement. "L'idée m'est venue littéralement après lui avoir lu une histoire", a-t-il déclaré.

Pour générer des histoires cohérentes pour les enfants, un modèle de langage devrait apprendre des faits sur le monde, suivre les personnages et les événements, et observer les règles de grammaire - des versions plus simples des défis auxquels sont confrontés les grands modèles. Mais les grands modèles formés sur des ensembles de données massives apprennent d'innombrables détails non pertinents en même temps que les règles qui comptent vraiment. Eldan espérait que la brièveté et le vocabulaire limité des histoires pour enfants rendraient l'apprentissage plus gérable pour les petits modèles, ce qui les rendrait à la fois plus faciles à former et plus faciles à comprendre.

Dans le monde des modèles de langage, cependant, le terme "petit" est relatif : Un ensemble de données mille fois plus petit que celui utilisé pour former GPT-3.5 devrait encore contenir des millions d'histoires. "Je ne sais pas combien d'argent vous voulez dépenser, mais je suppose que vous n'allez pas engager des professionnels pour écrire quelques millions de nouvelles", a déclaré M. Nguyen.

Il faudrait un auteur extraordinairement prolifique pour satisfaire des lecteurs aussi voraces, mais Eldan avait quelques candidats en tête. Qui peut mieux écrire pour un public de petits modèles linguistiques que pour de grands modèles ?

Toys stories

Eldan a immédiatement entrepris de créer une bibliothèque d'histoires synthétiques pour enfants générées par de grands modèles linguistiques. Mais il a rapidement découvert que même les modèles de pointe ne sont pas naturellement très créatifs. Si l'on demande à GPT-4 d'écrire des histoires adaptées à des enfants de 4 ans, explique Eldan, "environ un cinquième des histoires concernera des enfants qui vont au parc et qui ont peur des toboggans". C'est apparemment la quintessence des histoires pour enfants d'âge préscolaire, selon l'Internet.

La solution a consisté à ajouter un peu d'aléatoire dans le message. Tout d'abord, Eldan a utilisé le GPT-4 pour générer une liste de 1 500 noms, verbes et adjectifs qu'un enfant de 4 ans pourrait connaître - suffisamment courte pour qu'il puisse facilement la vérifier lui-même. Il a ensuite écrit un programme informatique simple qui demanderait à plusieurs reprises à GPT-3.5 ou à GPT-4 de générer une histoire adaptée à l'âge de l'enfant, comprenant trois mots aléatoires de la liste, ainsi qu'un détail supplémentaire choisi au hasard, comme une fin heureuse ou un rebondissement de l'intrigue. Les histoires obtenues, heureusement, étaient moins axées sur des diapositives effrayantes.

Eldan disposait désormais d'une procédure pour produire des données de formation à la demande, mais il n'avait aucune idée du nombre d'histoires dont il aurait besoin pour former un modèle fonctionnel, ni de la taille de ce modèle. C'est alors qu'il s'est associé à Yuanzhi Li, chercheur en apprentissage automatique chez Microsoft et à l'université Carnegie Mellon, pour essayer différentes possibilités, en tirant parti du fait que les petits modèles peuvent être formés très rapidement. La première étape consistait à décider comment évaluer leurs modèles.

Introduction

Dans la recherche sur les modèles de langage - comme dans toute salle de classe - la notation est un sujet délicat. Il n'existe pas de rubrique parfaite qui englobe tout ce que les chercheurs veulent savoir, et les modèles qui excellent dans certaines tâches échouent souvent de manière spectaculaire dans d'autres. Au fil du temps, les chercheurs ont mis au point divers critères de référence standard basés sur des questions dont les réponses ne sont pas ambiguës, ce qui est une bonne approche si vous essayez d'évaluer des compétences spécifiques. Mais Eldan et Li se sont intéressés à quelque chose de plus nébuleux : quelle doit être la taille réelle des modèles linguistiques si l'on simplifie le langage autant que possible ?

"Pour vérifier directement si le modèle parle anglais, je pense que la seule chose à faire est de laisser le modèle générer de l'anglais de manière ouverte", a déclaré M. Eldan.

Il n'y a que deux façons de mesurer les performances d'un modèle sur des questions aussi qualitatives : S'appuyer sur des évaluateurs humains ou se tourner à nouveau vers le GPT-4. Les deux chercheurs ont opté pour cette dernière solution, laissant les grands modèles à la fois rédiger les manuels et noter les dissertations.

Bhagavatula a déclaré qu'il aurait aimé voir comment les évaluations de GPT-4 se comparaient à celles des correcteurs humains - GPT-4 peut être biaisé en faveur des modèles qu'il a aidé à former, et l'opacité des modèles de langage rend difficile la quantification de tels biais. Mais il ne pense pas que de telles subtilités affecteraient les comparaisons entre différents modèles formés sur des ensembles similaires d'histoires synthétiques - l'objectif principal du travail d'Eldan et Li.

Eldan et Li ont utilisé une procédure en deux étapes pour évaluer chacun de leurs petits modèles après la formation. Tout d'abord, ils ont présenté au petit modèle la première moitié d'une histoire distincte de celles de l'ensemble des données d'apprentissage, de manière à ce qu'il génère une nouvelle fin, en répétant ce processus avec 50 histoires de test différentes. Ensuite, ils ont demandé à GPT-4 d'évaluer chacune des fins du petit modèle en fonction de trois catégories : créativité, grammaire et cohérence avec le début de l'histoire. Ils ont ensuite fait la moyenne des notes obtenues dans chaque catégorie, obtenant ainsi trois notes finales par modèle.

Avec cette procédure en main, Eldan et Li étaient enfin prêts à comparer les différents modèles et à découvrir quels étaient les étudiants les plus brillants.

Résultats des tests

Après quelques explorations préliminaires, les deux chercheurs ont opté pour un ensemble de données de formation contenant environ 2 millions d'histoires. Ils ont ensuite utilisé cet ensemble de données, baptisé TinyStories, pour entraîner des modèles dont la taille varie de 1 million à 30 millions de paramètres, avec un nombre variable de couches. Le travail a été rapide : En utilisant seulement quatre GPU, l'entraînement du plus grand de ces modèles n'a pas pris plus d'une journée.

Les plus petits modèles ont eu du mal. Par exemple, l'une des histoires testées commence par un homme à l'air méchant qui dit à une fille qu'il va lui prendre son chat. Un modèle à un million de paramètres s'est retrouvé bloqué dans une boucle où la fille répète sans cesse à l'homme qu'elle veut être son amie. Mais les modèles plus grands, qui sont encore des milliers de fois plus petits que GPT-3.5, ont obtenu des résultats surprenants. La version à 28 millions de paramètres racontait une histoire cohérente, même si la fin était sinistre : "Katie s'est mise à pleurer, mais l'homme s'en fichait. Il a emporté le chat et Katie n'a plus jamais revu son chat. Fin de l'histoire".

En plus de tester leurs propres modèles, Eldan et Li ont soumis le même défi au GPT-2 d'OpenAI, un modèle de 1,5 milliard de paramètres publié en 2019. Le résultat a été bien pire - avant la fin abrupte de l'histoire, l'homme menace d'emmener la jeune fille au tribunal, en prison, à l'hôpital, à la morgue et enfin au crématorium.

Introduction

Selon M. Nguyen, il est passionnant que des modèles aussi petits soient aussi fluides, mais il n'est peut-être pas surprenant que GPT-2 ait eu du mal à accomplir la tâche : il s'agit d'un modèle plus grand, mais loin de l'état de l'art, et il a été formé sur un ensemble de données très différent. "Un enfant en bas âge qui ne s'entraînerait qu'à des tâches d'enfant en bas âge, comme jouer avec des jouets, obtiendrait de meilleurs résultats que vous ou moi", a-t-il fait remarquer. "Nous ne nous sommes pas spécialisés dans cette chose simple.

Les comparaisons entre les différents modèles de TinyStories ne souffrent pas des mêmes facteurs de confusion. Eldan et Li ont observé que les réseaux comportant moins de couches mais plus de neurones par couche étaient plus performants pour répondre aux questions nécessitant des connaissances factuelles ; inversement, les réseaux comportant plus de couches et moins de neurones par couche étaient plus performants pour garder en mémoire les personnages et les points de l'intrigue situés plus tôt dans l'histoire. Bhagavatula a trouvé ce résultat particulièrement intriguant. S'il peut être reproduit dans des modèles plus vastes, "ce serait un résultat vraiment intéressant qui pourrait découler de ce travail", a-t-il déclaré.

Eldan et Li ont également étudié comment les capacités de leurs petits modèles dépendaient de la durée de la période de formation. Dans tous les cas, les modèles maîtrisaient d'abord la grammaire, puis la cohérence. Pour Eldan, ce schéma illustre comment les différences dans les structures de récompense entraînent des différences dans les schémas d'acquisition du langage entre les réseaux neuronaux et les enfants. Pour les modèles de langage, qui apprennent en prédisant des mots, "l'incitation pour les mots "je veux avoir" est aussi importante que pour les mots "crème glacée"", a-t-il déclaré. Les enfants, en revanche, "ne se soucient pas de savoir s'ils disent 'j'aimerais avoir de la glace' ou simplement 'glace, glace, glace'".

Qualité contre quantité

Eldan et Li espèrent que cette étude incitera d'autres chercheurs à entraîner différents modèles sur l'ensemble des données de TinyStories et à comparer leurs capacités. Mais il est souvent difficile de prédire quelles caractéristiques des petits modèles apparaîtront également dans les plus grands.

"Peut-être que les modèles de vision chez la souris sont de très bons substituts de la vision humaine, mais les modèles de dépression chez la souris sont-ils de bons modèles de la dépression chez l'homme ? a déclaré M. Pavlick. "Pour chaque cas, c'est un peu différent.

Le succès des modèles TinyStories suggère également une leçon plus large. L'approche standard pour compiler des ensembles de données de formation consiste à aspirer des textes sur l'internet, puis à filtrer les déchets. Le texte synthétique généré par des modèles de grande taille pourrait constituer une autre façon d'assembler des ensembles de données de haute qualité qui n'auraient pas besoin d'être aussi volumineux.

"Nous avons de plus en plus de preuves que cette méthode est très efficace, non seulement pour les modèles de la taille de TinyStories, mais aussi pour les modèles plus importants", a déclaré M. Eldan. Ces preuves proviennent d'une paire d'articles de suivi sur les modèles à un milliard de paramètres, rédigés par Eldan, Li et d'autres chercheurs de Microsoft. Dans le premier article, ils ont entraîné un modèle à apprendre le langage de programmation Python en utilisant des extraits de code générés par GPT-3.5 ainsi que du code soigneusement sélectionné sur l'internet. Dans le second, ils ont complété l'ensemble de données d'entraînement par des "manuels" synthétiques couvrant un large éventail de sujets, afin d'entraîner un modèle linguistique à usage général. Lors de leurs tests, les deux modèles ont été comparés favorablement à des modèles plus importants formés sur des ensembles de données plus vastes. Mais l'évaluation des modèles linguistiques est toujours délicate, et l'approche des données d'entraînement synthétiques n'en est qu'à ses balbutiements - d'autres tests indépendants sont nécessaires.

Alors que les modèles linguistiques de pointe deviennent de plus en plus volumineux, les résultats surprenants de leurs petits cousins nous rappellent qu'il y a encore beaucoup de choses que nous ne comprenons pas, même pour les modèles les plus simples. M. Nguyen s'attend à ce que de nombreux autres articles explorent l'approche inaugurée par TinyStories.

"La question est de savoir où et pourquoi la taille a de l'importance", a-t-il déclaré. "Il devrait y avoir une science à ce sujet, et cet article est, je l'espère, le début d'une riche histoire.

Auteur: Internet

Info: https://www.quantamagazine.org/ Ben Brubaker, 5 octobre 2023

[ synthèse ]

Commenter

Commentaires: 0

Ajouté à la BD par miguel

Paramètres de recherches