Lorsque vous allez dans votre restaurant préféré, prenez-vous toujours la même chose ou aimez-vous goûter à des saveurs inédites?
D’un côté, le plat favori vous garantit que le contentement sera de la partie, mais vous n’apprendrez rien de nouveau. De l’autre, le choix d’un mets original n’apporte aucune garantie quant à votre satisfaction gustative, mais permet de savoir si vous aimez cette recette différente.
Voilà un exemple du dilemme exploration-exploitation, un dilemme comportemental qui survient chaque fois que notre désir d’information entre en conflit avec notre besoin de récompense. Une dichotomie qui est à la base de la résolution de problème et de la prise de décision.
Ainsi, afin de prendre de meilleures décisions, vaudrait-il mieux miser sur des acquis assurant un gain ou innover pour faire des découvertes? Bref, exploiter des actions qui ont été gratifiantes dans le passé ou, plutôt, explorer des actions qui pourraient être encore meilleures?
«Il existe un compromis intrinsèque entre l’exploration et l’exploitation, un équilibre entre les deux qui varie au cours de la vie», indique Becket Ebitz, chercheur et professeur au Département de neurosciences de l’Université de Montréal.
Un continuum
Dans une revue de la littérature, Becket Ebitz a mis en lumière que certaines formes d’exploration évoluent au cours du développement: elles peuvent être plus fréquentes dans la petite enfance et diminuer avec l’âge.
«Mes collègues qui travaillent sur le développement observent que les tout-petits sont particulièrement motivés pour explorer leur environnement et s’intéresser à tout, dit-il. Ils essaient souvent de nouvelles choses, même si elles ne sont pas très efficaces ou judicieuses. Au fur et à mesure qu’on vieillit, on semble délaisser cet état d’exploration pour s’enfoncer davantage dans l’exploitation des informations qu’on possède déjà.»
Selon le chercheur, cette variation serait très utile à l’apprentissage et fluctue aussi selon le contexte. Par exemple, dans un article récent, le professeur explique que, pendant la pandémie de COVID-19, les travailleurs et travailleuses de la santé ont vu leur capacité d’exploration compromise.
«Lorsque nous sommes stressés – lorsque le monde qui nous entoure est tout simplement trop imprévisible et éprouvant –, il ne nous reste plus assez d’énergie pour découvrir et apprendre. Nous nous contentons d’utiliser les informations dont nous disposons», souligne Becket Ebitz.
Cette fluctuation fait également émerger le dilemme de la stabilité-plasticité, soit le fait que le cerveau est à la fois suffisamment plastique pour faire de nouveaux apprentissages et assez stable pour se les rappeler.
«Pour l’instant, nous pensons que nous n’avons pas à être à la fois plastiques et stables, mentionne Becket Ebitz. Au contraire, nous alternons au fil du temps entre plasticité et stabilité. Il existerait aussi des différences individuelles dans ce processus d’alternance, ce qui pourrait expliquer pourquoi des personnes apprennent mieux dans certains environnements que dans d’autres.»
Une alternance visible
Dans une étude récente, Becket Ebitz et son équipe ont constaté qu’une dilatation de la pupille – signe physiologique de l’excitation, elle-même régie par le système nerveux autonome – annoncerait le début de la phase d’exploration et l’activité neuronale qui y est associée.
Leurs résultats montrent que les mécanismes liés à la dilatation de la pupille conduisent le cortex préfrontal vers un point de basculement critique où des décisions exploratoires deviennent alors possibles.
«Cela suppose que l’état d’excitation, donc la façon dont on est stimulé, peut expliquer à quel point on est proche du seuil de la découverte. En général, quand on se sent excité ou stressé, on tente de stabiliser son état corporel pour revenir à un état neutre. Mais cette percée pourrait vouloir dire que se laisser porter par son excitation pourrait mener à de nouvelles perspectives», avance le chercheur.