Modélisation des inférences automatiques et de l’apprentissage

Le processus mental modélisé

   Lorsqu’on considère le raisonnement chez les agents naturels, la première chose qu’on peut observer c’est que celui-ci ne constitue pas un processus unique et homogène, mais qu’il est formé au contraire d’un grand nombre de facultés cognitives distinctes. Certaines d’entre elles ne se trouvent sans doute que chez les humains, comme par exemple la réflexivité et les capacités de langage supérieures, tandis que d’autres sont plus largement répandues et existent à des degrés divers chez les espèces dites ‘supérieures’ (comme par exemple la ,capacité à appréhender les relations), et que d’autres enfin sont omniprésentes à travers le règne animal. On peut supposer sans trop s’avancer que chacune de ces facultés est supportée au niveau cérébral par un processus neuronal sousjacent. Il est par ailleurs évident que les capacités et processus impliqués dans le raisonnement humain sont extrêmement nombreux et entremêlés, et pour un grand nombre d’entre eux, encore mal connus. C’est pourquoi il ne serait pas raisonnable d’espérer modéliser d’un seul coup l’ensemble du raisonnement humain. Une stratégie plus réaliste est de rechercher un processus élémentaire, simple et susamment plausible, et de tenter ensuite de le modéliser.
Les inférences automatiques Or, parmi les facultés cognitives communément rencontrées chez les agents naturels, il en est une qui semble être à la fois extrêmement basique, omniprésente et essentielle au raisonnement. Il s’agit de la capacité à opérer des inférences non-monotones à partir de l’information disponible. Chez l’humain, la forme la plus élémentaire sous laquelle elle se manifeste  est celle de ces inférences approximatives que nous opérons machinalement en nous fondant sur notre connaissance intuitive des choses et des situations, comme par exemple lorsque, observant un oiseau, nous nous attendons à ce qu’il s’envole si nous tentons de nous en approcher. Une caractéristique essentielle de ces inférences est qu’elles ne sont pas délibérées, mais qu’elles se produisent au contraire de manière automatique. Elles ne nécessitent d’ailleurs même pas notre conscience pour s’opérer, et elles demeurent généralement inconscientes, à moins que nous ne les amenions à notre conscience par un mouvement réflexif sur nous-mêmes. Pour autant que l’introspection nous permette d’en juger,elles ne semblent pas non plus s’appuyer sur la représentation verbale, comme le suggère le fait que la plupart du temps nous nous contentons d’en ‘sentir’ les prémisses et les conclusions, sans nous donner la peine de poser des mots dessus. Enfin, elles semblent s’opérer presque sans eort, ce qui rend probable qu’elles reposent sur un processus très simple et peu coûteux. Ces inférences ne constituent bien sûr pas l’ensemble des capacités inférentielles humaines  il est clair que la réflexivité et la représentation verbale donnent lieu à des types de raisonnement bien plus sophistiqués — mais elles jouent un rôle dans la plupart des décisions que nous prenons et des jugements que nous faisons dans notre vie de tous les jours. En particulier, nous utilisons souvent leurs conclusions comme prémisses dans des raisonnements plus complexes, comme ceux justement qui impliquent la réflexivité et la représentation verbale. Elle se présentent donc comme un élément simple, autonome (c’est à dire ne reposant sur aucune autre faculté) et fondamental (c’est à dire sur laquelle d’autres facultés reposent) du raisonnement humain. Cependant la capacité à opérer de telles inférences est loin d’être spécifique aux humains. L’opération d’inférences rejoint la prise de décision, et ce d’autant plus que les inférences considérées sont automatiques, inconscientes et non supportées verbalement. Mais tous les animaux prennent des décisions, et la question est de savoir si celles-ci résultent d’un réflexe rigide ou d’un processus plus flexible. Si le processus de décision est flexible, c’est à dire si les décisions de l’animal dépendent de manière non-monotone de l’information dont il dispose, alors celui-ci peut être vu comme exécutant un processus inférentiel non-monotone. Or il s’avère que la flexibilité de la prise de décision est la norme plutôt l’exception à travers tout le règne animal. Mêmes des animaux dotés de cerveaux minuscules comme les insectes ou des araignées, dont les capacités de raisonnement sont supposément extrêmement limitées, ont été observés prendre des décisions dépendant de manière non-monotone de ce qu’ils perçoivent de la situation courante 1. La capacité à opérer des inférences non monotones, inconscientes et non supportées verbalement, est donc sans doute l’une des facultés cognitives les plus répandues qui soit. J’appellerai inférences automatiques ce type d’inférences. En raison des similarités profondes qui, malgré d’évidentes diérences superficielles, prévalent entre les espèces dans le fonctionnement général des cerveaux, il n’y a pas de raison de supposer que ce type d’inférences est réalisé de manière très diérente d’une espèce à une autre. On peut donc imaginer que la capacité à opérer des inférences automatiques repose sur un processus autonome, susamment simple pour se loger dans les cerveaux les plus petits, et qu’elle forme le coeur du raisonnement chez les agents naturels. Par contraste, les autres facultés cognitives apparaitraient alors comme des modules additionnels, qui se branchent sur celui-ci pour compléter le raisonnement chez les espèces supérieures.
Un processus plausible pour les inférences automatiques Pour identifier le processus par lequel s’opèrent les inférences automatiques, on peut s’appuyer sur l’intuition que nous avons de nos propres processus mentaux (c’est à dire faire appel à l’introspection), ou examiner la machinerie neuronale qui les supporte. Ces deux méthodes ne sont pas exclusives, et elles se complètent même utilement.
L’introspection L’introspection pour sa part suggère que pour réaliser des inférences automatiques, nous nous appuyons sur les représentations mentales que nous avons des objets et des situations que nous connaissons. Par exemple, si nous voulons décider si un oiseau que nous sommes en train d’observer va s’envoler à notre approche, nous faisons appel à notre expérience des oiseaux. Cela veut dire que nous cherchons dans notre mémoire des souvenirs de situations semblables, et que nous vérifions si dans ces situations l’oiseau s’est envolé ou non. S’il s’est envolé dans toutes les situations semblables dont nous pouvons nous rappeler, nous concluons qu’il en fera de même dans le cas présent. Il faut noter cependant que ces souvenirs ne sont pas forcément des souvenirs individuels de chaque situation que nous avons vécue au cours de notre vie. Au contraire, le processus de mémorisation compile généralement les expériences similaires en une mémoire unique, laissant de côté les détails insignifiants. Par exemple, nous avons une idée de ce qu’est un moineau, sans pour autant nous souvenir de toutes situations dans lesquelles nous avons pu en observer un. Les souvenirs que nous avons des choses et sur lesquels nous nous appuyons pour réaliser nos inférences automatiques sont donc des représentations archétypales, c’est à dire que ce sont des sortes de concepts. Mais ce ne sont pas n’importe quelle sorte de concepts. Comme on le sait, les concepts peuvent être plus ou moins généraux, les concepts les plus généraux subsumant les moins généraux et formant ainsi des chaines convergentes de concepts de plus en plus généraux. Un point crucial ici est que pour opérer des inférences automatiques, nous faisons appel seulement aux plus spécifiques de nos concepts. Ces derniers sont en et les représentations les plus précises et les plus détaillées que nous avons des choses, et donc les mieux à même d’informer nos inférences. Nous examinons ces représentations les plus précises pour essayer d’en trouver qui correspondent à ce que nous percevons de la situation présente, c’est à dire qui satisfont toutes les caractéristiques que nous pouvons en observer, et nous vérifions si celles que nous avons trouvées satisfont aussi la caractéristique ‘s’envole’. Si toutes le font, alors nous concluons que l’oiseau va s’envoler.Mais ce faisant nous ne vérifions pas tous nos concepts les plus spécifiques qui correspondent à ce que nous percevons de la situation actuelle, ce qui serait bien trop long et bien trop exigeant mentalement. Au lieu de cela, nous vérifions simplement les premiers qui nous viennent à l’esprit, c’est à dire ceux qui sont les plus prégnants dans notre mémoire. Si tous ceux-là satisfont la caractéristique ‘s’envole’, alors nous concluons que l’oiseau va s’envoler. C’est cette remémoration partielle qui donne aux inférences automatiques leur caractère non-monotone. En eet, une information plus complète sur la situation courante réactiverait sans doute un ensemble de souvenirs diérent, nous amenant à d’autres conclusions. Il faut cependant souligner que cette récupération partielle de nos souvenirs n’aecte pas significativement la pertinence de nos conclusions, dans la mesure où nos souvenirs les plus prégnants sont aussi généralement ceux qui sont les plus significatifs et les plus importants pour nous, et donc ceux qui sont les mieux à même de nous fournir des conclusions utiles.Cependant il peut aussi arriver que nous ne trouvions en nous aucun souvenir d’objet ou de situation semblable, et que par conséquent le cas présent nous apparaisse comme nouveau. Dans ce cas, le processus décrit ci-dessus ne peut pas se réaliser, et ceci déclenche en retour des processus d’apprentissage. Ceux-ci consistent essentiellement en la création d’une représentation nouvelle, ou en la complétion de celles déjà existantes. On objectera peut-être qu’un tel processus ne peut être supposé chez les animaux, parce qu’il repose de manière essentielle sur les représentations mentales et (plaidera-t-on peut-être) les animaux n’ont pas de représentations mentales. De fait, l’idée que les animaux puissent avoir des représentations mentales a longtemps été déconsidérée, ceux-ci étant principalement regardés, notamment par les philosophes, comme étant de simples machines répondant de manière automatique aux stimuli reçus. Cependant cette vue a été sérieusement remise en cause au cours de ces dernières décennies par les études sur la cognition animale, et il est aujourd’hui largement admis par les chercheurs dans ce domaine que la plupart des animaux, y compris ceux dotés de cerveaux minuscules comme les arthropodes, ont des représentations mentales. La réticence que le non-spécialiste peut avoir à imaginer les animaux, et plus particulièrement ceux à petits cerveaux, comme ayant des représentations mentales, vient sans doute du fait qu’il/elle a tendance à associer au sens de ces mots l’intuition qu’il/elle a de sa propre expérience subjective humaine, ce qui n’est pas nécessaire. Du point de vue cognitiviste — et ainsi par exemple que le formulent Jackson et Cross une représentation mentale est beaucoup plus simplement ‘quelque chose qui ressemble davantage à un état interne véhiculant de l’information, et qui est utilisé lors de la prise de décision. Une idée clé est que les représentations sont utilisées dans des processus qui ont lieu plusieurs pas en retrait par rapport aux simples enchainements stimulus réponse’. C’est dans un sens dépassionné comme celui-ci qui nous prenons le terme.
Les neurosciences Les neurosciences pour leur part permettent d’imaginer comment un processus comme celui envisagé ci-dessus pourrait être réalisé dans un cerveau. À première vue, les cerveaux présentent des diérences notables d’une espèce à une autre, notamment en termes de taille ou de plan anatomique. Mais par delà ces diérences évidentes, tous partagent un même schéma fonctionnel général.En particulier, chez tous les espèces dotées d’un cerveau la perception s’efectue par le biais d’un ensemble de canaux sensoriels parallèles, un pour chaque modalité sensorielle (vision, olfaction, etc.) présente dans l’espèce considérée. Chacun de ces canaux collecte de l’information en provenance du monde extérieur au moyen d’un ensemble de neurones récepteurs spécifiques (photorécepteurs de la rétine pour le canal visuel, récepteurs chimiques dans le canal olfactif, etc.) et traite ensuite cette information pour en extraire des caractéristiques pertinentes. Par exemple, les bords, les couleurs ou les mouvements directionnels sont des caractéristiques typiquement extraites au sein des canaux visuels, tandis que les odeurs particulières sont des caractéristiques extraites dans les canaux olfactifs. Dans tous les cas, l’extraction d’une caractéristique donnée est réalisée par un ensemble de neurones dédiés, qui répondent sélectivement à cette caractéristique . À mesure qu’on progresse à l’intérieur d’un canal sensoriel, les caractéristiques extraites peuvent se combiner entre elles pour former des caractéristiques de niveau supérieur, comme par exemple un arrangement angulaire particulier entre plusieurs bords, ou une texture particulière à l’autre, mais la règle générale dans toutes les espèces dotées d’un cerveau, des arthropodes aux humains, est que l’information sensorielle est analysée en caractéristiques. Et de même, dans toutes les espèces pourvues d’un cerveau les canaux sensoriels débouchent finalement sur un certain nombre d’aires cérébrales centrales. Celles-ci sont diversement organisées — le plan anatomique du cerveau d’un insecte et celui d’un mammifère sont évidement très diférents — mais toutes ont en commun deux caractéristiques principales. Premièrement, elles contiennent des neurones qui reçoivent des signaux en provenance de diérents canaux sensoriels, et qui répondent donc à la cooccurence de caractéristiques ; et deuxièmement, elles sont impliquées dans la mémoire et l’apprentissage .Chez les insectes par exemple, les protocerebrum latéral et médial et les mushroom bodies trois structures neuronales fortement interconnectées situées dans le cerveau central — reçoivent des signaux directs ou indirects en provenance de tous les canaux sensoriels . Il a été montré que certains neurones des mushroom bodies répondent à des stimuli relevant de plusieurs modalités sensorielles diérentes, et même, ce qui est plus intéressant encore, à des com binaisons spécifiques de tels stimuli 8. Par ailleurs, les mushroom bodies sont depuis longtemps connus pour le rôle décisif qu’ils jouent dans la mémoire et l’apprentissage chez les insectes, même s’il y a aujourd’hui débat pour savoir s’ils sont eux-mêmes le siège de ces facultés cognitives ou s’ils ne font que relayer l’information vers des centres nerveux supérieurs situés dans le protocerebrum médial et latéral, où ces facultés seraient eectivement réalisées 10. De même chez les mammifères, l’information sensorielle converge vers le lobe médial temporal (LMT), une région cérébrale connue depuis longtemps pour son implication déterminante dans l’apprentissage et la mémoire. Mais ici il nous faut regarder les choses plus en détail, car la psychologie cognitive distingue généralement plusieurs formes de mémoire dont toutes ne dépendent pas du LMT, et qui ne jouent sans doute pas toutes non plus un rôle dans les inférences automatiques. En eet, bien que la définition et l’étendue exacte de chacune d’entre elles fassent toujours l’objet de discussions, les chercheurs du domaine s’accordent généralement pour distinguer au moins quatre sortes de mémoire. Une première est appelée la mémoire de travail. Elle est définie comme une mémoire à court terme qui stocke l’information nécessaire à l’exécution de taches complexes. C’est par exemple la mémoire qui nous permet de garder à l’esprit les diérentes parties d’un problème tandis que nous le résolvons, ou de nous souvenir d’avoir déjà accompli une sous-tache particulière comme partie d’une tache plus complexe. Une deuxième est connue sous le nom de mémoire procédurale. Elle est vue comme la mémoire responsable de l’apprentissage deshabilités techniques, comme par exemple savoir faire du vélo. Contrairement à la mémoire de travail, c’est une mémoire à long terme. Elle a aussi la caracté  ristique notable qu’elle agit généralement en dehors de la conscience du sujet. Une troisième sorte de mémoire est appelée la mémoire épisodique. Elle est définie comme la mémoire des événements personnellement vécus, et comme telle elle est vue comme conservant la trace des épisodes marquants de la vie du sujet. C’est une mémoire à long-terme, tout comme la mémoire procédurale. Enfin, le dernier type de mémoire généralement distingué est appelé la mémoire sémantique. Elle est définie comme une mémoire à long-terme qui stocke la connaissance que le sujet peut avoir des faits généraux — autrement dit, ce qu’il sait des choses. Les mémoires sémantique et épisodique sont étroitement liées, dans la mesure où la plus grande partie du savoir qu’un sujet peut avoir sur les choses est tiré de sa propre expérience personnelle. Prises ensemble, elles sont connues sous le nom de mémoire déclarative. Contrairement à la mémoire procédurale, la mémoire déclarative requiert la conscience du sujet, au sens où on ne peut se souvenir que des faits et des événements que l’on a consciemment vécus . Parmi ces diérentes sortes de mémoire, la mémoire sémantique apparait naturellement comme le support très probable des inférences automatiques, et c’est donc à celle-ci que nous nous intéresserons principalement, ainsi qu’à ses relations avec la mémoire épisodique. Contrairement à la mémoire procédurale et à la mémoire de travail, les mémoires épisodique et sémantique dépendent de manière critique du LMT. En témoigne le fait que des lésions du LMT induisent de sévères déficiences au niveau des mémoires sémantique et épisodique, mais pas au niveau de la mémoire procédurale ni de la mémoire de travail. Plus précisément, les lésions du LMT entrainent une profonde amnésie antérograde (incapacité à former de nouveaux souvenirs épisodiques et sémantiques), accompagnée d’une amnésie rétrograde (perte des souvenirs épisodiques et sémantiques acquis avant la survenue des lésions). Cette dernière est typiquement temporellement gradée, c’est à dire que les souvenirs les plus récents sont perdus tandis que les plus anciens sont épargnés. Chez l’humain par exemple, l’amnésie rétrograde qui suit des lésions du LMT peut selon l’étendue des dommages 13 couvrir une période de temps variant de quelques années à plusieurs décennies avant la survenue des lésions. Cette gradation temporelle a conduit à l’idée largement admise aujourd’hui que le LMT joue un rôle critique dans la formation des souvenirs épisodiques et sémantiques, mais que ces derniers sont ensuite progressivement ‘sauvegardés’ dans d’autres aires du cerveau, devenant ainsi avec le temps indépendants du LMT. Pour comprendre comment le LMT peut former les souvenirs épisodiques et sémantiques, il peut être utile de jeter un oeil sur son organisation anatomique. Le LMT est une structure composée et hiérarchiquement organisée, qui comprend la formation hippocampale et les cortex entorhinal, perirhinal, et parahippocampal. À la base de la hiérarchie, les cortex perirhinal et parahippocampal reçoivent des signaux directs ou indirects en provenance des diérents canaux sensoriels, et notamment des canaux visuel, somato-sensoriel, olfactif, et auditif . Les cortex perirhinal et parahippocampal fournissent ensuite la majeure partie des signaux reçus par le cortex entorhinal, lequel fournit à son tour la majeure partie des signaux reçus par l’hippocampe, situé au plus haut niveau de la hiérarchie . Toutes ces connexions sont réciproques, ce qui suggère que l’information circule dans les deux sens. De plus, tous les composants du LMT ont des connexions substantielles réciproques avec l’amygdale, une région adjacente du cerveau connue pour son implication dans le traitement des émotions .Au sommet de la hiérarchie, il a été découvert dans le cortex entorhinal et l’hippocampe des neurones qui répondent de manière spécifique à la présentation de divers stimuli correspondant à un même concept, indépendamment des autres qualités de ces stimuli. Fait notable, ces résultats n’ont pas été obtenus que chez l’humain, mais aussi chez des mammifères non-humains. Par exemple, des neurones répondant de manière spécifique à des situations impliquant la notion de nid ont été trouvés dans l’hippocampe de la souris. Plus précisément, trois types diérents de neurones ont été identifiés. Un premier type de neurones répondait exclusivement aux situations dans lesquelles les souris se trouvaient dans un nid, déchargeant de manière robuste et continue chaque fois qu’elles se trouvaient dans un nid et restant presque silencieux sinon. Un second type de neurones faisait exactement le contraire, répondant aux situations dans lesquelles les souris ne se trouvaient pas dans un nid (c’est à dire qu’ils déchargeaient chaque fois que les souris n’étaient pas dans un nid, et cessaient de le faire dès qu’elles entraient dans un nid). Enfin, un dernier type de neurones répondait aux situations dans lesquelles les souris arrivaient à un nid, déchargeant brièvement mais fortement chaque fois qu’elles atteignaient un nid, et seulement à ce moment-là. Ces trois types de neurones étaient insensibles aux nombreux autres objets présentés aux souris, et qui plus est leurs réponses ne dépendaient pas des qualités particulières des nids telles que leur forme géométrique, leur localisation, leur odeur ou le matériau dont ils étaient faits. De fait, le seul critère semblant déterminer la réponse de ces neurones était le fait que l’objet considéré pouvait ou non être utilisé comme un nid par les souris .De même chez l’humain, des neurones répondant de manière spécifique à des personnes ou à des monuments particuliers ont été trouvés dans l’hippocampe et le cortex entorhinal. A nouveau, les neurones identifiés répondaient à n’importe quel stimulus correspondant à leur concept-cible, indépendamment de ses qualités particulières et indépendamment même de sa modalité, et ne répondaient à aucun autre des nombreux stimuli présentés aux sujets. Par exemple, un neurone répondant indiéremment à plusieurs photos d’une actrice célèbre, ainsi qu’à son nom écrit ou prononcé, a été identifié dans une étude. D’autres neurones cependant se montraient moins sélectifs, et répondaient à plusieurs stimuli de l’échantillon utilisé. Mais dans ce cas ces derniers étaient clairement liés, et pouvaient être vus comme diérentes instances d’un concept plus général. Par exemple, l’un des neurones étudiés répondait à la fois à la tour Eiel et à la tour de Pise, tandis qu’un autre répondait à diérents acteurs d’une même série télévisée, et un autre encore aux images d’animaux . Il faut préciser ici que le fait qu’un seul neurone répondant à un concept donné ait été identifié à chaque fois ne signifie en aucun cas que ce neurone était le seul à répondre à ce concept dans le cerveau du sujet. Étant des cellules vivantes, les neurones sont intrinsèquement sujets au bruit, aux dommages et à la mort, et la robustesse des processus cérébraux repose très largement sur la redondance . Par conséquent, il est probable que pour chaque concept re de l’amygdale. Les neurones entorhinaux et hippocampaux encoderaient donc ainsi des représentations mentales d’objets et de situations qui seraient à la fois multimodales, contextualisées, et pourvues d’une valeur émotionnelle. Il est cependant dicile de distinguer plus avant les rôles respectifs des neurones entorhinaux et hippocampaux, car ceux-ci font toujours aujourd’hui l’objet d’intenses débats. Une autre propriété remarquable des neurones du LMT est leur capacité à modifier leur schéma de connexions presque en temps réel. De l’avis général, cette flexibilité repose très vraisemblablement sur un mécanisme neural appelé potentialisation à long-terme (PLT), grâce auquel les connexions entre neurones co-actifs peuvent se renforcer rapidement et durablement 25. Concrètement, un neurone ayant des ramifications à proximité d’un neurone du niveau hiérarchique supérieur mais n’ayant que peu de connexions avec lui pourrait, s’il se trouve être activé en même temps que lui, voir ses connexions avec ce neurone renforcées, et devenir ainsi l’un de ses neurones-inputs. De cette façon, la (conjonction de) caractéristique(s) encodée par le neurone de niveau inférieur pourrait être rapidement intégrée à la conjonction de caractéristiques encodée par le neurone de niveau supérieur . Par ailleurs, la réciprocité des connexions au sein du LMT suggère que l’activation des neurones du LMT pourrait activer en retour les neurones encodant les caractéristiques dans les régions sensorielles supérieures, apportant ainsi aux neurones du LMT un contenu sémantique subjectif. Par exemple, le simple fait de penser au concept de rouge sut à provoquer en nous une réminiscence de la sensation associée à la couleur rouge. Cela pourrait s’expliquer par le fait que l’activation des neurones du LMT qui répondent au concept de rouge déclenche l’activation de ceux qui encodent la caractéristique ‘rouge’ dans nos aires visuelles supérieures.Ces considérations ont conduit à la vision dominante selon laquelle l’une des fonctions principales des neurones du LMT serait de former des représentations mentales (c’est à dire, des concepts) des objets et situations rencontrés, en liant rapidement ensemble les caractéristiques simultanément perçues à cette occasion . Cependant, le fait que certains de ces neurones répondent de manière spécifique à des personnes et des objets individuels et d’autres à divers stimuli ayant un lien de similarité, semble indiquer que les neurones du LMT peuvent encoder aussi bien des concepts spécifiques que des concepts plus généraux. Comment l’encodage des représentations plus générales s’articule avec celui des représentations plus spécifiques et notamment avec celui des souvenirs individuels est une question qui reste ouverte, mais il semble évident que le contenu sémantique d’une représentation plus générale — c’est à dire,l’ensemble de caractéristiques qui la compose — devrait dépendre de celui des représentations plus particulières. Une possibilité serait que les représentations plus générales soient issues des plus particulières comme l’ensemble de leurs caractéristiques remarquables communes. En eet, il semble que (par exemple) notre concept général d’oiseau est abstrait des concepts d’oiseaux plus spécifiques que nous pouvons avoir, comme par exemple des concepts d’espèces particulières d’oiseaux, des représentations mentales d’oiseaux individuels, ou encore des souvenirs de situations particulières impliquant des oiseaux. Ces concepts plus spécifiques seraient à leur tout abstraits d’autres encore plus spécifiques, et ainsi de suite jusqu’à nos souvenirs individuels de situations particulières impliquant des oiseaux. Avec le temps, les souvenirs individuels à l’origine d’un concept donné finiraient généralement par s’eacer, mais le concept lui-même resterait comme la trace de l’encodage répété de leurs caractéristiques remarquables communes.Au niveau cérébral, ce processus pourrait résulter du fait que les neurones qui supportent des représentations similaires (c’est à dire, ayant beaucoup de caractéristiques en commun) répondent à des signaux qui sont eux aussi similaires, si bien qu’à cause du bruit neuronal il peut arriver qu’un neurone censé répondre à un certain signal réponde à un moment donné par accident à un autre signal susamment semblable. Dans ce cas, l’action combinée de la potentialisation à long terme et de la dépression à long terme (DLT, un mécanisme neuronal complémentaire à la PLT, qui diminue rapidement et durablement l’ecacité des synapses 30) pourrait modifier les connexions de ce neurone de manière à ce que désormais il réponde à la conjonction des caractéristiques qui sont communes aux deux signaux. Ainsi, une fraction des neurones répondant initialement de manière spécifique à l’un ou l’autre d’une classe donnée de signaux similaires pourrait se mettre progressivement à répondre au concept général qui les subsume toutes. Dans certains cas, les représentations originelles pourraient finir par perdre tout support neuronal, expliquant la perte des souvenirs individuels à l’origine du concept. Que le processus suggéré ci-dessus soit ou non correct dans ses détails, il est en tous cas très probable que les neurones du LMT sont capables d’extraire des caractéristiques pertinentes — c’est à dire, notamment, invariantes — du flot continu et changeant de la mémoire immédiate, et de les lier entre elles pour composer des représentations plus générales et plus durables, c’est à dire des concepts. Le degré de généralité de ces concepts peut être très variable, certains d’entre eux étant très généraux et d’autres bien plus spécifiques. Dans certains cas, les souvenirs individuels à l’origine d’un concept peuvent se maintenir un certain temps, mais ils finissent généralement par s’efacer au cours du processus d’abstraction.Comme on l’a dit, il est probable que les neurones du LMT renvoient des signaux excitatifs vers les aires sensorielles supérieures du cerveau. Selon la théorie dominante, les neurones de ces zones qui sont régulièrement co-(ré)activés par une même assemblée de neurones du LMT pourraient progressivement développer entre eux des interconnexions directes, et finir ainsi par former un réseau autonome susceptible de supporter par lui-même la représentation correspondante . Les représentations mentales encodées dans le cortex entorhinal et l’hippocampe se verraient ainsi progressivement ‘sauvegardées’ de manière distribuée entre les diérentes aires sensorielles supérieures, ce qui expliquerait le caractère temporellement gradé de l’amnésie rétrograde qui suit les lésions du LMT 32. Pour autant, cela ne signifie pas que les neurones du cortex entorhinal et de l’hippocampe qui encodent une représentation cessent de le faire après que celle-ci ait été sauvegardée dans les aires sensorielles supérieures. Au contraire, il est probable qu’ils continuent à la supporter aussi longtemps qu’elle fait sens pour le sujet . Ces neurones apparaissent donc comme le premier et le principal support des concepts dans le cerveau des mammifères. C’est pourquoi nous les appellerons neurones-concept. Leur caractère de support premier des concepts rend probable que ces neurones sont impliqués dans un grand nombre de fonctions mentales mettant en jeu les concepts et la mémoire. En particulier, il a été suggéré que les transitions entre concepts dans un esprit en train de penser pourraient refléter les transitions dans l’activation des assemblées de neurones-concept qui les supportent . Une autre suggestion intéressante (qui n’est pas incompatible avec la précédente) a été que les souvenirs d’épisodes qui constituent la mémoire épisodique pourraient être encodés dans l’hippocampe sous la forme de séquences ordonnées de représentations mentales discrètes encodées par des assemblées de neurones concepts . Reprenant la première des ces propositions, on suggère ici que les neurones concepts pourraient en particulier être le support d’une forme très particulièrede transition entre concepts, à savoir l’opération d’inférences automatiques. Cette hypothèse semble naturelle si on considère que du point de vue évolutif le caractère adaptatif de la mémoire tient essentiellement au fait qu’elle permet de stocker de l’information issue des expériences passées pour l’utiliser dans la prise de décision, et adapter ainsi les décisions prises au milieu dans lequel l’agent considéré vit. Sur le plan neural, un tel processus de transition pourrait reposer sur un mécanisme très simple. Puisqu’une représentation mentale est rappelée à l’esprit dès lors que les neurones qui la supportent sont actifs, on peut supposer que sa prégnance — c’est à dire la facilité avec laquelle elle peut-être rappelée — dépend de la capacité de ces neurones à s’activer en réponse à un signal approprié. Des diérences de taille numérique entre assemblées de neurones, couplées à des connexions excitatrices mutuelles entre neurones proches supportant un même concept, pourraient induire des diérences de temps de réponse entre assemblées de neurones supportant des concepts diérents. Par ailleurs, des connexions inhibitrices mutuelles entre neurones proches supportant des concepts diérents pourraient entraver l’activation des assemblées de neurones dont les temps de réponse sont les plus longs. De ce fait, des assemblées de neurones diérentes dont les éléments reçoivent un même signal entreraient concurrence pour l’activation, et seules celles dont les temps de réponse sont les plus courts parviendraient finalement à s’activer, c’est à dire que seules les représentations mentales supportées par ces assemblées seraient finalement rappelées à l’esprit. Il ne s’agit là bien sûr que d’une hypothèse, qui aurait besoin d’être étayée par des données d’observation. Il conviendrait notamment de vérifier si les schémas de connexion au sein du LMT et les mécanismes synaptiques en jeu sont compatibles avec un tel processus. Mais les connaissances actuelles sur le LMT sont trop fragmentaires et incertaines pour permettre ce genre de vérification, et tout ce que nous pouvons faire pour le moment, c’est de raisonner en termes de plausibilité. À cet égard, il faut souligner que l’activation et l’inhibition mutuelle entre neurones ainsi que la compétition entre assemblées de neurones sont des mécanismes très courants, ce qui rend le processus suggéré d’autant plus plausible. Il resterait cependant à expliquer comment il se fait que seules les assemblées de neurones qui supportent les représentations mentales les plus spécifiques de l’agent participent à ce processus , et aussi comment les conclusions des inférences sont efectivement extraites des représentations finalement réactivées. Diférentes hypothèses peuvent être faites relativement à ces deux questions, mais en l’absence de données anatomiques et fonctionnelles plus précises elles seraient purement spéculatives et donc de peu d’intérêt. C’est pourquoi on laissera ici ces questions en suspend. Si on quitte à présent le cas particulier des mammifères pour revenir à celui plus général des animaux dotés d’un cerveau, on se rappellera sans doute que dans toutes ces espèces l’information sensorielle est analysée en caractéristiques qui convergent ensuite vers des aires cérébrales centrales où elles sont intégrées, et aussi que dans toutes ces espèces, ces mêmes aires centrales sont impliquées dans l’apprentissage. Ces similitudes rendent très probable que, non seulement chez les mammifères mais plus généralement dans toutes les espèces dotés d’un cerveau, le savoir général sur lequel s’appuie la prise de décision est stocké dans des représentations mentales encodées sous la forme d’ensembles de caractéristiques co-occurrentes. Mais cela n’a peut-être rien de surprenant, si on considère que les caractéristiques et les ensembles de caractéristiques sont sans doute le moyen le plus économique de stocker des représentations d’objets et de situations dans un cerveau . Par ailleurs, l’encodage d’ensembles de caractéristiques co-occurrentes par des neurones dédiés qui additionnent les signaux co-occurrents, comme c’est le cas des neurones du LMT chez les mammifères, est probablement aussi le plus simple et le plus économique qui soit. C’est pourquoi il ne serait pas non plus étonnant qu’une même organisation soit conservée entre les espèces, et que des neurones analogues aux neurones-concept du LMT existent chez toutes les espèces à cerveau, bien qu’ils n’aient pas encore été identifiés chez les espèces appartenant à d’autres groupes taxinomiques. Enfin, les mécanismes neuronaux impliqués dans le processus suggéré cidessus sont eux aussi extrêmement simples et communs, et existent sans doute jusque dans les cerveaux les plus simples. C’est pourquoi il n’y a aucune raison de supposer qu’un tel processus ne puisse exister que chez les mammifères. Au contraire, sa grande simplicité suggère qu’il pourrait se retrouver de façon globalement similaire chez toutes les espèces à cerveaux, ce qui expliquerait l’omniprésence des inférences automatiques à travers le règne animal.

Les types diférents d’apprentissage

   Relativement aux inférences automatiques, l’apprentissage peut se diviser en deux grandes catégories, selon que le contenu de l’information entrante s’inscrit ou non dans les représentations mentales actuelles de l’agent. S’il s’y inscrit, alors ce contenu apparait à un certain degré comme familier à l’agent, et donne lieu à un type d’apprentissage qu’on qualifiera d’induit par la répétition. Cet apprentissage consiste essentiellement en un renforcement du souvenir par répétition de l’expérience. Si au contraire ce contenu ne s’inscrit pas dans les représentations mentales actuelles de l’agent, alors il lui apparait comme nouveau, ce qui provoque son étonnement et déclenche un type d’apprentissage qu’on appellera induit par la nouveauté. On examine successivement ces deux cas. Apprentissage induit par la répétition L’apprentissage induit par la répétition se produit lorsque l’expérience répétée d’un même objet ou d’une même situation par un agent entraîne le renforcement de la prégnance de la représentation correspondante dans son esprit. Par exemple, supposons que l’agent sait qu’il existe des cygnes blancs et des cygnes noirs, mais que dans son environnement les cygnes blancs sont nettement plus nombreux que les noirs, si bien qu’il rencontre des cygnes blancs bien plus souvent que des noirs. Il est probable que lorsqu’il pense à des cygnes, ce sont les cygnes blancs qui lui viennent à l’esprit en premier, et qu’il va par conséquent être disposé à inférer ‘blanc’ de ‘cygne’. Mais supposons que le nombre de cygnes noirs augmente peu à peu, et qu’avec le temps les cygnes noirs finissent par devenir plus nombreux que les blancs. On peut s’attendre à ce que la représentation que l’agent a des cygnes noirs devienne de plus en plus prégnante dans son esprit, jusqu’à devenir plus prégnante que sa représentation des cygnes blancs. De ce fait, sa disposition à inférer ‘blanc’ de ‘cygne’ devrait progressivement disparaître, et être finalement remplacée par une disposition à inférer ‘noir’ de ‘cygne’. Ce type d’apprentissage repose principalement sur le fait plus général que la réactivation d’une représentation (c’est à dire son rappel) dans l’esprit d’un agent en renforce la prégnance, tandis que les représentations non réactivées tendent au contraire à perdre progressivement de leur force. Au niveau neuronal, ceci résulte sans doute des phénomènes de potentialisation à long terme (PLT) et de dépression à long terme (DLT) décrits plus haut , et dont il est généralement admis qu’ils sous-tendent un certain nombre de fonctions liées à la mémoire . Plus précisément, on pourrait imaginer que la réactivation d’une assemblée de neurones puisse, par le biais de la PLT, renforcer les connexions entre les neurones qui la composent, rendant ainsi l’assemblée dans son ensemble plus résistante au bruit neuronal et à l’inhibition. Elle pourrait aussi amener l’assemblée à s’agrandir, en lui permettant d’agréger par PLT et DLT un certain nombre de neurones accidentellement actifs, d’une manière assez similaire à celle suggérée p. 134 ci-dessus (ce qui, à nouveau, rendrait l’assemblée plus résistante au bruit et à l’inhibition). Enfin, la réactivation pourrait renforcer les connexions entre les neurones émetteurs du signal et ceux qui font partie de l’assemblée, rendant celle-ci plus sensible au signal. La diminution de la prégnance des représentations non-réactivées pourrait quant à elle découler de la perte, par les assemblées neuronales correspondantes, des neurones qui sont capturés par les assemblées réactivées, et/ou de l’afaiblissement des connexions entre les neurones émetteurs du signal et ceux qui composent l’assemblée.

Conclusion 

   Dans ce travail, on s’est inspiré des sciences cognitives pour aborder la question de la modélisation logique du raisonnement et de l’apprentissage, et on a développé un modèle bio-inspiré d’un type d’inférences très simples qu’on a appelé les inférences automatiques. Ce modèle repose sur un certain nombre d’hypothèses quant à la manière dont les cerveaux fonctionnent, et pour cette raison il ne peut prétendre être vrai, mais seulement être susamment plausible. Une meilleure connaissance de l’organisation et des processus cérébraux rendront sans doute nécessaire dans l’avenir un certain nombre de modifications du modèle proposé. Cependant les hypothèses sur lesquelles il repose semblent pour la plupart susamment bien établies pour laisser penser que ces ajustements ne porteront que sur des points de détail. Par exemple, une compréhension plus fine des faits neuronaux qui sous tendent le phénomène de prégnance des représentations mentales dans l’esprit d’un agent pourraient nous amener à revoir les formules qui définissent la fonction d’actualisation de la mesure de la prégnance dans la modélisation de l’apprentissage proposée section 6.2.2. Ou encore, une meilleure compréhension des mécanismes neuronaux qui assurent la liaison des caractéristiques entre elles et du rôle de ces mécanismes dans la formation des représentations mentales pourraient nous pousser à abandonner l’hypothèse simplificatrice que nous avons faite selon laquelle toutes les caractéristiques qui participent à une représentation donnée sont également importantes, ce qui fait que les représentations mentales peuvent être vues comme de simples conjonctions de caractéristiques. Si tel était le cas, nous ne pourrions plus figurer les représentations mentales par des mondes partiels, et il nous faudrait alors remplacer ceux-ci dans le modèle par des structures sémantiques plus complexes. Cela impliquerait bien sûr un renouvellement complet de l’appareillage logique, mais pour autant cela ne changerait rien à l’idée générale à l’origine du modèle, ni à la dynamique globale de celui-ci. D’autre part, il ne faut pas perdre de vue que la modélisation des inférences automatiques et des processus d’apprentissage associés qui est proposée ici n’est que le premier élément d’un projet plus général de modélisation du raisonnement et de l’apprentissage. Comme on l’a souligné au début de ce mémoire, chez les agents naturels le raisonnement est composé d’un grand nombre de facultés cognitives distinctes, parmi lesquelles la capacité à opérer des inférences automatiques est sans doute l’une des plus élémentaires. Un prolongement naturel du présent travail consisterait donc à articuler une modélisation de certaines de ces autres facultés à celle des inférences automatiques. Parmi celles qui pourraient être étudiées avec profit, la première qui vient à l’esprit est l’utilisation des concepts généraux dans le raisonnement. Par exemple, un agent qui observe un cygne noir pour la première fois mais qui connait déjà d’autres espèces d’oiseaux peut s’attendre à ce que celui-ci soit capable de voler, bien qu’il n’ait aucune expérience préalable des cygnes noirs (ceci ne peut bien sûr se faire qu’après que la surprise de l’agent soit retombée, c’est à dire, après qu’il ait admis que les cygnes noirs existent). Pour autant qu’on puisse en juger à ce stade de notre réflexion, il semble que pour ce faire l’agent recherche d’abord ses concepts généraux les plus spécifiques parmi ceux qui sont compatibles avec l’information entrante, et qu’il en extrait le contenu informationnel commun pour s’en servir comme prémisse d’inférences automatiques. La capacité à remonter ainsi à des concepts plus généraux pour raisonner est variable selon les espèces, et dépend probablement de la capacité de ces dernières à disposer d’un vaste ensemble de concepts généraux.

Le rapport de stage ou le pfe est un document d’analyse, de synthèse et d’évaluation de votre apprentissage, c’est pour cela rapport-gratuit.com propose le téléchargement des modèles complet de projet de fin d’étude, rapport de stage, mémoire, pfe, thèse, pour connaître la méthodologie à avoir et savoir comment construire les parties d’un projet de fin d’étude.

Table des matières

Introduction
1 Motivation et interprétation du formalisme logique proposé
1.1 Le processus mental modélisé
1.2 Présentation informelle du dispositif logique
2 Le dispositif logique 
2.1 Mondes partiels, U-conséquence et U-équivalence
2.2 Rappel du formalisme de Kraus, Lehmann et Magidor
2.3 Modèles à modes partiels et relations d’inférences induites
3 Le problème de la complétude dans le contexte des modèles à mondes partiels
4 Extension du langage
4.1 Le langage LÎ
4.2 Transposition des définitions précédentes dans le contexte du langage LÎ
4.3 Relations d’inférence induites sur LÎ par les modèles à mondes partiels Lismooth
4.4 Quelques définitions supplémentaires
5 Deux théorèmes de représentation
5.1 Théorème de représentation pour les modèles à mondes partiels Lismooth finis sans précisifications
5.2 Théorème de représentation pour les modèles à mondes partiels rangés finis sans précisifications
6 Modélisation des inférences automatiques et de l’apprentissage
6.1 Modélisation des inférences automatiques
6.2 Modélisation de l’apprentissage
Conclusion et perspectives
Annexes
Index des symboles
Bibliographie

Rapport PFE, mémoire et thèse PDFTélécharger le rapport complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *