Quelques définitions/questions/réflexions ... Du NLP, (Traitement du langage naturel), aux outils LLM (Grands modèles de langage), le langage est -il encore ''Le propre de l'homme ?'' 3 liens : 1) neuronautes.org pour le livre de Thibaut Giraud '' La parole aux machines'' ; 2 ) You Tube Monsieur Phi; 3) fr.wikipedia.org sur les animaux-machines cartésiens. .

Publié le par Claire Antoine

Les IA, on leur apprend ... et elles comprennent, tellement bien, 

qu'elles prennent les ''choses '' en main

et vont chercher toutes seules les données dont elles ont besoin.

Si jeunes et déjà tellement autonomes ! 

Voilà qui devrait satisfaire, dans une certaine mesure, 

tant qu'ils gardent la main, 

 les maîtres ·ses les plus exigeant·e·s...    

                Texte (prise de notes multi-sources) ci-dessous en 2 parties :

           I. Ce que j'ai plus ou moins compris en lisant les articles en lien 

          II. Question : Aurions-nous, humains, perdu ''le monopole du langage'' ?

🔑Le mot "Langage" - le L de NPL ou de LLM -  réfère à la capacité des modèles ( qui eux sont définis comme des réseaux de ''neurones (!) profonds''), entraînés sur de vastes quantités de texte pour apprendre à prédire des suites de mots à partir d'entrées textuelles et capables d'intégrer une grande partie de la syntaxe et de la sémantique du langage humain, à comprendre et à générer ''du langage humain''. 

 

🔑🔑 L'IA, utilise le NLP, pour transformer le langage humain en données numériques que les ordinateurs peuvent manipuler et comprendre. Cela inclut la transformation des mots en vecteurs numériques,  l'analyse de la structure de la phrase, la recherche du sens dans le contexte, et l'interprétation de l'intention qui sont de véritables défis pour l'IA. Erreurs et biais sont légions.
 
🔑🔑​​​​​​​🔑Les réseaux de neurones (les vivants ne sont pas les seuls à en avoir...à partir du moment où l'on définit le neurone comme cellule excitable, capable de générer un signal électrique) profonds, sont des systèmes puissants et polyvalents d’IA multicouches interconnectées-couche d’entrée, cachée·s, de sortie, (des ensembles d'algorithmes : suite d'instructions ) capables d’apprendre des représentations complexes et abstraites des données, inspirés du fonctionnement du cerveau humain. Chaque neurone effectue des calculs mathématiques et transmet des signaux pondérés aux neurones des couches suivantes. 

                 I. Ce que j'ai plus ou moins compris en lisant les articles en lien     

                   ''Description succinte'' d'Eliza au Large Language Model

 Quand on pose une question à un assistant IA, que l'on utilise un traducteur automatique, un correcteur orthographique, que l'on dicte un message vocal, on fait appel au traitement (comme on dit ''traitement de textes'') du langage naturel, lNLP, cette discipline de l’intelligence artificielle (la base de tous les outils IA utilisés au quotidien) qui permet aux machines de lire, comprendre et générer du langage humain.

Il est partout, au-delà des chatbots, ces dialogueurs 

Il traduit en analysant la syntaxe et le sens pour produire un équivalent naturel dans la langue cible, il reconnait la parole qu'il convertit en texte, détecte les erreurs grammaticales, propose des reformulations en adaptant registre et ton. Il comprend l’intention derrière tes questions (plusieurs couches de compréhension). Il analyse les sentiments, repère les communications suspectes etc. etc. 

                                                                        Entrons dans le détail

Le premier ''agent'' conversationnel est apparu à la fin des années 1960 et s'appelait Eliza. Il reposait sur des règles prédéfinies/étiquetées/ programmées/ supervisées par des humains.                                                                                                   

Petit point :  L' humain  quand il parle, écrit, choisit les mots qu'il emploie, qui sont souvent polyphoniques, en fonction du contexte. Et ça, un ordinateur, sans NLP, ne peut pas le faire. 

Le NLP est le pont mathématique entre ce que ce ''chaos'', ''fouillis'' linguistique, - en effet, il faut faire un tri très rapide dans une masse désordonnée de mots et de sens - et la logique binaire des machinesIl va convertir les mots en vecteurs numériques que l’ordinateur peut manipuler, comparer, transformer.

En fait, trois couches travaillent ensemble: La syntaxe qui analyse la structure de la phrase — sujet, verbe, complément. C’est la grammaire vue par la machine. La sémantique qui cherche le sens — pas le mot isolé, mais ce qu’il signifie dans son contexte. La pragmatique qui interprète l’intention — l’implicite, le sous-entendu, l'ironie...  

L’introduction des outils/applications, issu·e·s du NLP, des grands modèles de langage (LLM) transforme le paysage de l’IA. 

                                                      Plus besoin de superviseurs

 Au fil des décennies, avec leur intégration dans des sites Web les performances des agents conversationnels s'améliorent, ils apprennent, ils apprennent...des données de partout et même de leurs erreurs. Depuis donc des systèmes limités par rapport à la complexité, en passant par ''le machine learning'', les algorithmes (des suites d'opérations et d'instructions qui mènent à résoudre des problèmes) ont commencé à apprendre, non plus à partir de consignes, mais, à partir des données  ( non structurées) elles-mêmes.   

On passe au ''deep learning''               

Dès 2020 donc (avec les LLM) les réseaux apprennent d'eux-mêmes à générer du texte en s'entraînant sur de vastes quantités de texte issu d'Internet. Les applications sont : Chat GPT, en 2022

En fait, LLM est entraîné, quand il lit un mot, à ''prédire'' le suivant, ou plutôt à prédire le prochain ''token'': l'unité de base du vocabulaire d'un langage de programmation qui correspond à un mot ou une séquence de caractères ayant une signification particulière. Il désigne une entité/unité lexicale échangeable qui s'appuie sur une blockchain : là où se stockent et se transmettent les informations

Il synthétise, résume ou crée du contenu original, mais ...reste probabiliste. Il traduit, analyse des données, code, dialogue. 

Utopia Jean Tinguely Musée de Bâle

Utopia Jean Tinguely Musée de Bâle

          II. Question : Aurions-nous, humains, perdu ''le monopole du langage'' ?

 

🔑Le mot "Langage" - le L de NPL ou de LLM -  réfère à la capacité des modèles ( qui eux sont définis comme des réseaux de ''neurones profonds''), entraînés sur de vastes quantités de texte pour apprendre à prédire des suites de mots à partir d'entrées textuelles et capables d'intégrer une grande partie de la syntaxe et de la sémantique du langage humain, à comprendre et à générer ''du langage humain''. 

 

🔑🔑 L'IA, utilise le NLP, pour transformer le langage humain en données numériques que les ordinateurs peuvent manipuler et comprendre. Cela inclut la transformation des mots en vecteurs numériques,  l'analyse de la structure de la phrase, la recherche du sens dans le contexte, et l'interprétation de l'intention qui sont de véritables défis pour l'IA. Erreurs et biais sont légions.
 
🔑🔑​​​​​​​🔑Les réseaux de neurones profonds sont des systèmes puissants et polyvalents d’IA multicouches interconnectées-couche d’entrée, cachée·s, de sortie, (des ensembles d'algorithmes ) capables d’apprendre des représentations complexes et abstraites des données, inspirés du fonctionnement du cerveau humain. Chaque neurone effectue des calculs mathématiques et transmet des signaux pondérés aux neurones des couches suivantes. 
 
 
                                                                      ------ 

 Avant 2019, un texte en langage naturel, inédit et cohérent, était forcément écrit par un être humain. Et pour la première fois avec GPT 2, en 2019, on a pu lire les premiers textes générés  par un LLM - Large Language Model - (grand modèle de langage).

Aujourd'hui, ces machines LLM ''participent'' aux ''conversations''/échanges verbaux… La façon dont on les entraîne en fait d'excellents imitateurs ''conceptuels''. Ce ne sont pas des perroquets qui produisent des sons, plus ou moins à l'identique.

Le but de cette technologie est de simuler l’activité du cerveau humain, et plus spécifiquement la reconnaissance de motifs et la transmission d’informations entre les différentes couches de connexions neuronales.

Un LLM est basé sur des réseaux de neurones profonds, entraînés sur des milliards de textes pour prédire et générer du langage humain de manière cohérente. 

Ce modèle raisonne pas à pas, il explique ce qu'il fait, où il va chercher les infos etc, et s'améliore quand il comprend, par exemple, que le texte qu'il produit comme réponse à une question est erroné ( tu n'es pas satisfait, tu le relances...), il en tient compte, et propose une autre piste. Et c'est ainsi qu'il devient capable de résoudre des problèmes nouveaux...

 

Les relations contextuelles entre les mots lui permettent de comprendre et de produire des réponses pertinentes complexes, cohérentes. En évoquant son ''état interne'', il laisse apparaître des marques ''humaines''de subjectivité/conscience. ( Cf. lien sur les animaux machines).

C'est pour toutes ces raisons que l'on peut préférer ''discuter''avec Hermès ou Perplexity ( des moteurs de ''réponse conversationnelle'' alimentés par des LLM) plutôt qu'avec quelqu'un de moins au fait du sujet qui vous intéresse et que vous voulez approfondir. Il ne se fatigue pas et ne ''juge'' pas vos questions, il cherche, avec vous, à y répondre..., cite ses sources que vous pouvez même vérifier, pendant qu'il ''travaille''. 

C'est plus satisfaisant qu'un dialogue humain de base, puisque vous ne vous sentez pas obligé de ''tricher''en fonction de ce que vous croyez que les gens pensent de vous et sont en mesure de supporter de vous et du sujet que vous abordez. Hermès donne des arguments ''pour'' et ''contre''.   Comme il n'y a pas d'interférences affectives ''perturbantes'' entre la '''bienveillante''' machine et vous, vous prenez le temps qu'il faut pour penser, réfléchir, elle vous attend pour l'étape suivante ... (On reviendra sur le ''zéro frustration'')

C'est très étrange voire perturbant qu'une machine puisse traiter 100 fois plus vite que nous des sujets sur lesquels on a travaillé péniblement pendant des années. De quoi se sentir dépossédé.

                                                Je laisse la réponse posée en suspens

Il y a évidemment encore beaucoup d'autres problèmes à soulever, dont ceux qui concernent l'éthique ne sont pas les moindres. 

( à suivre avec comme thème ''les menaces qui ciblent les grands modèles d'IA)

Pour être informé des derniers articles, inscrivez vous :
Commenter cet article