Persévérer ou explorer : les bases cérébrales du dilemme exploitation-exploration

Recherche Mis en ligne le 8 octobre 2020
les bases cerebrales du dilemme exploitation-exploration
Ouvrir / fermer le sommaire

Dans un article publié dans la prestigieuse revue Science, Philippe Domenech, psychiatre à l’APHP (hôpital Henri Mondor) et chercheur dans l’équipe « Neurophysiologie des comportements répétitifs » à l’Institut du Cerveau, Sylvain Rheims du département de neurologie et d’épileptologie des Hospices civils de Lyon et Etienne Koechlin de l’École normale supérieure – PSL, révèlent les mécanismes cérébraux à l’origine de la décision d’explorer son environnement afin d’établir de nouvelles stratégies. 

Dans notre vie quotidienne, nous faisons face en permanence au choix d’exploiter une stratégie comportementale déjà apprise ou d’en changer pour explorer d’autres alternatives. Je travaille sur mon ordinateur et mes mails ne sont plus envoyés. Dois-je persévérer et continuer à rédiger mes mails en ignorant ces messages d’erreurs ? ou explorer les alternatives : réparer ce dysfonctionnement, s’engager d’en d’autres tâches ne nécessitant pas d’utiliser mon ordinateur ? Résoudre ce genre de dilemme est essentiel pour construire tout un répertoire de stratégies adaptées aux multiples situations que nous pouvons rencontrer dans notre quotidien afin, dans le futur, de réagir plus rapidement face à ce type de choix. Mais par quels mécanismes notre cerveau résout-il ce dilemme entre exploitation et exploration ?

Des recherches antérieures ont identifié une région spécifique du cerveau, le cortex préfrontal médian ventral, impliquée dans ce dilemme, mais les mécanismes cérébraux précis par lesquels nous résolvons le problème et prenons la décision de poursuivre une stratégie ou d’en changer restaient encore inconnus.

 Pour répondre à cette question, les chercheurs ont enregistré par électroencéphalographie l’activité électrique des régions ventrale et dorsale du cortex préfrontal médian chez des patients implantés chirurgicalement avec des électrodes intracrâniennes, car candidat à une chirurgie pour traiter une épilepsie résistante aux médicaments. Les participants devaient effectuer une tâche qui leur demandait de continuellement faire un choix entre appliquer la stratégie de réponse qu’ils avaient apprise ou en changer pour explorer des stratégies alternatives. Ces décisions d’exploration survenaient à certains essais « critiques » à l’issu desquels les patients réalisaient que leur erreur ne devait pas être utilisée pour ajuster et améliorer leur stratégie, mais comme un signal que celle-ci était caduque car leur environnement avait changé.

L’analyse de l’activité du cortex préfrontal médian (mPFC) pendant cette tâche montrent que la résolution du dilemme exploitation-exploration s’effectue en deux étapes sur la base d’un encodage prédictif, qui modifie l’interprétation des erreurs commises par les sujets aux essais critiques afin qu’elles déclenchent l’exploration de stratégies alternatives.

Au cours d’une première étape, la région ventrale du mPFC (vmPFC) – qui surveille par ailleurs en continu la fiabilité de la stratégie utilisée- signale l’arrivée dans un essai critique, c’est-à-dire un essai ou un résultat inattendu qui signifie que la stratégie utilisée doit être changée pour laisser place à une période d’exploration. Dans la deuxième étape, la partie dorsale du PFC (dmPFC) répond à ce signal si la prédiction du vmPFC se réalise, c’est-à-dire si le résultat de l’action s’avère effectivement inattendu afin d’entrer dans une phase d’exploration. En résumé, si le vmPFC signale que la stratégie en cours doit être poursuivie, le dmPFC y répond en utilisant le résultat de nos actions comme un signal d’apprentissage afin d’améliorer la stratégie utilisée. Dans le cas contraire, le dmPFC envoie un signal bloquant la stratégie invalidée et déclenchant l’exploration de nouvelles possibilités.

Il s’agit de la première étude d’électrophysiologie ayant identifié les mécanismes cérébraux sous-jacents à la résolution du dilemme exploitation-exploration chez l’homme. L’identification d’un processus d’encodage prédictif, dont l’importance était déjà connue pour la perception, démontre que ceux-ci sont également essentiels aux processus exécutifs – tels que la prise de décision – suggérant ainsi qu’il s’agit d’un mécanisme général implémenté dans l’ensemble du cortex cérébral.

Source

Neural mechanisms resolving exploitation-exploration dilemmas in the medial prefrontal cortex.

Domenech P, Rheims S, Koechlin E. Science. 2020 Aug 28

 

Equipes scientifiques

Equipe "Neurophysiologie des comportements répétitifs"
Chef d'équipe
Eric BURGUIERE PhD, CR1, CNRS
Régulation des comportements, Circuits cortico - ganglions de la base, DBS/Optogénétique Domaine principal : Neurophysiologie Domaine secondaire : Cognition L’équipe d’Eric Burguière s’intéresse aux mécanismes neuro-fonctionnels qui sont à la base des comportements répétitifs normaux et pathologiques. L’objectif principal étant d’identifier les dynamiques neurophysiologiques qui sous-tendent l’acquisition et la régulation de ces comportements.
Lire la suite