Des scientifiques utilisent l’IA de ChatGPT pour lire passivement les pensées des gens

Des scientifiques ont inventé un décodeur de langage capable de traduire les pensées d’une personne en texte à l’aide d’un transformateur d’intelligence artificielle (IA) similaire à ChatGPT, rapporte une nouvelle étude.
C’est la première fois qu’un langage continu est reconstruit de manière non invasive à partir d’activités cérébrales humaines lues par un appareil d’imagerie par résonance magnétique fonctionnelle (IRMf).
Le décodeur a été capable d’interpréter l’essentiel des histoires que les sujets humains ont regardées ou écoutées – ou même simplement imaginées – en utilisant les schémas cérébraux de l’IRMf, ce qui lui permet essentiellement de lire dans l’esprit des gens avec une efficacité sans précédent. Bien que cette technologie n’en soit qu’à ses débuts, les scientifiques espèrent qu’elle pourra un jour aider les personnes souffrant de troubles neurologiques affectant la parole à communiquer clairement avec le monde extérieur.
Toutefois, l’équipe qui a fabriqué le décodeur a également mis en garde contre le fait que les plateformes de lecture du cerveau pourraient éventuellement avoir des applications néfastes, notamment en tant que moyen de surveillance pour les gouvernements et les employeurs. Bien que les chercheurs aient souligné que leur décodeur nécessite la coopération de sujets humains pour fonctionner, ils ont fait valoir que « les interfaces cerveau-ordinateur devraient respecter la vie privée des personnes », selon une étude publiée lundi dans Nature Neuroscience.
« Notre étude est la première à décoder un langage continu, c’est-à-dire plus que des mots ou des phrases complètes, à partir d’enregistrements cérébraux non invasifs, que nous recueillons à l’aide de l’IRM fonctionnelle », a déclaré Jerry Tang, étudiant diplômé en informatique à l’université du Texas à Austin, qui a dirigé l’étude, lors d’une conférence de presse tenue jeudi dernier, le 27 avril.
« L’objectif du décodage du langage est de prendre les enregistrements de l’activité cérébrale d’un utilisateur et de prédire les mots qu’il a entendus, dits ou imaginés », a-t-il noté. « À terme, nous espérons que cette technologie pourra aider les personnes qui ont perdu l’usage de la parole à la suite de lésions telles que les accidents vasculaires cérébraux, ou de maladies telles que la SLA.
Tang et ses collègues ont pu produire leur décodeur avec l’aide de trois participants humains qui ont chacun passé 16 heures dans une machine IRMf à écouter des histoires. Les chercheurs ont entraîné un modèle d’IA, appelé GPT-1 dans l’étude, sur des commentaires Reddit et des récits autobiographiques afin de relier les caractéristiques sémantiques des récits enregistrés à l’activité neuronale capturée dans les données d’IRMf. Il a ainsi pu apprendre quels mots et quelles phrases étaient associés à certains schémas cérébraux.
Une fois cette phase de l’expérience terminée, le cerveau des participants a été scanné par IRMf pendant qu’ils écoutaient de nouvelles histoires qui ne faisaient pas partie de l’ensemble de données d’entraînement. Le décodeur a pu traduire les récits audio en texte tel que les participants l’entendaient, bien que ces interprétations utilisent souvent des constructions sémantiques différentes des enregistrements originaux. Par exemple, l’enregistrement d’un locuteur prononçant la phrase « Je n’ai pas encore mon permis de conduire » a été décodé à partir des pensées de l’auditeur par les lecteurs IRMf en « Elle n’a même pas encore commencé à apprendre à conduire ».

Ces traductions approximatives résultent d’une différence essentielle entre le nouveau décodeur et les techniques existantes qui utilisent des électrodes invasives implantées dans le cerveau. Les plateformes basées sur les électrodes prédisent généralement le texte à partir d’activités motrices, telles que les mouvements de la bouche d’une personne lorsqu’elle essaie de parler, alors que l’équipe de M. Tang s’est concentrée sur le flux sanguin dans le cerveau, qui est capté par les appareils d’IRMf.
« Notre système fonctionne à un niveau très différent », a déclaré Alexander Huth, professeur adjoint de neurosciences et d’informatique à UT Austin et auteur principal de la nouvelle étude. « Au lieu de s’intéresser à ce moteur de bas niveau, notre système travaille vraiment au niveau des idées, de la sémantique et de la signification. C’est à cela qu’il s’attaque ».
« C’est la raison pour laquelle je pense que ce que nous obtenons, ce ne sont pas les mots exacts que quelqu’un a entendus ou prononcés, c’est l’essentiel », poursuit-il. « C’est la même idée, mais exprimée avec des mots différents.
Cette nouvelle approche a permis à l’équipe de repousser les limites des technologies de lecture de l’esprit en vérifiant si le décodeur pouvait traduire les pensées des participants pendant qu’ils regardaient des films muets ou qu’ils imaginaient des histoires dans leur tête. Dans les deux cas, le décodeur a été capable de déchiffrer ce que les participants voyaient, dans le cas des films, et ce que les sujets pensaient lorsqu’ils jouaient de brèves histoires dans leur imagination.
Le décodeur a produit des résultats plus précis lors des tests avec les enregistrements audio, par rapport au discours imaginé, mais il a tout de même été en mesure de glaner quelques détails de base sur les pensées non exprimées à partir de l’activité cérébrale. Par exemple, lorsqu’un sujet a imaginé la phrase « est allé sur un chemin de terre à travers un champ de blé, a traversé un ruisseau et est passé devant des bâtiments en bois », le décodeur a produit un texte qui disait « il a dû traverser un pont pour aller de l’autre côté et un très grand bâtiment au loin ».
Les participants à l’étude ont effectué tous ces tests à l’intérieur d’un appareil d’IRMf, un équipement de laboratoire encombrant et immobile. Pour cette raison, le décodeur n’est pas encore prêt à être utilisé comme traitement pratique pour les patients souffrant de troubles de la parole, bien que Tang et ses collègues espèrent que les futures itérations du dispositif pourront être adaptées à des plates-formes plus pratiques, telles que des capteurs de spectroscopie dans le proche infrarouge (fNIRS) pouvant être portés sur la tête du patient.
Si les chercheurs ont laissé entrevoir les promesses de cette technologie en tant que nouveau moyen de communication, ils ont également souligné que les décodeurs soulèvent des problèmes éthiques en matière de protection de la vie privée.
« Notre analyse de la vie privée suggère que la coopération du sujet est actuellement requise à la fois pour former et pour appliquer le décodeur », a déclaré l’équipe de Tang dans l’étude. « Toutefois, les développements futurs pourraient permettre aux décodeurs de contourner ces exigences. En outre, même si les prédictions du décodeur sont inexactes sans la coopération du sujet, elles pourraient être intentionnellement mal interprétées à des fins malveillantes ».
« Pour ces raisons et d’autres raisons imprévues, il est essentiel de sensibiliser aux risques de la technologie de décodage du cerveau et d’adopter des politiques qui protègent la vie privée mentale de chaque personne », concluent les chercheurs.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site est protégé par reCAPTCHA et la Politique de confidentialité, ainsi que les Conditions de service Google s’appliquent.

Retour en haut