banner
Maison / Blog / Codage neuronal avec réseau neuronal convolutif à pointe non supervisée
Blog

Codage neuronal avec réseau neuronal convolutif à pointe non supervisée

Dec 10, 2023Dec 10, 2023

Biologie des communications volume 6, Numéro d'article : 880 (2023) Citer cet article

2 Altmétrique

Détails des métriques

Prédire avec précision les réponses du cerveau à divers stimuli constitue un défi important en neurosciences. Malgré les avancées récentes dans le codage neuronal utilisant les réseaux de neurones convolutifs (CNN) dans les études IRMf, il subsiste des écarts critiques entre les règles informatiques des neurones artificiels traditionnels et des neurones biologiques réels. Pour résoudre ce problème, un cadre basé sur le dopage de CNN (SCNN) est présenté dans cette étude afin de réaliser un codage neuronal d'une manière plus biologiquement plausible. Le cadre utilise un SCNN non supervisé pour extraire les caractéristiques visuelles des stimuli d'image et emploie un algorithme de régression basé sur le champ réceptif pour prédire les réponses IRMf à partir des caractéristiques du SCNN. Les résultats expérimentaux sur les caractères manuscrits, les chiffres manuscrits et les images naturelles démontrent que l'approche proposée peut atteindre des performances de codage remarquablement bonnes et peut être utilisée pour des tâches de « lecture cérébrale » telles que la reconstruction et l'identification d'images. Ce travail suggère que le SNN peut constituer un outil prometteur pour le codage neuronal.

L'objectif du codage neuronal est de prédire la réponse du cerveau aux stimuli externes, fournissant ainsi un moyen efficace d'explorer le mécanisme cérébral de traitement des informations sensorielles et servant de base aux systèmes d'interface cerveau-ordinateur (BCI). La perception visuelle, étant l’un des principaux moyens par lesquels nous recevons des informations externes, a été un axe majeur de la recherche sur le codage neuronal. Grâce aux progrès des techniques d'imagerie cérébrale non invasives, telles que l'imagerie par résonance magnétique fonctionnelle (IRMf), les scientifiques ont réalisé des progrès remarquables dans le codage neuronal basé sur la vision1,2,3,4 au cours des deux dernières décennies, ce qui en fait un sujet brûlant dans le monde. neurosciences.

Le processus de codage basé sur la vision implique généralement deux étapes principales : l'extraction de caractéristiques et la prédiction de réponse5. L'extraction de caractéristiques vise à produire des caractéristiques visuelles des stimuli en stimulant le cortex visuel. Un extracteur de caractéristiques précis qui se rapproche des mécanismes visuels réels est crucial pour un encodage réussi. La prédiction de réponse vise à prédire les réponses IRMf au niveau voxel en fonction des caractéristiques visuelles extraites. La régression linéaire6 est couramment utilisée pour cette étape, car la relation entre les caractéristiques et les réponses doit être aussi simple que possible. Des études antérieures ont montré que le cortex visuel précoce traite les informations d'une manière similaire aux ondelettes de Gabor7,8,9. S'appuyant sur ces résultats, des modèles de codage basés sur des filtres de Gabor ont été proposés et appliqués avec succès à des tâches telles que l'identification d'images et la reconstruction de films1,3. Ces dernières années, les réseaux de neurones convolutifs (CNN) ont attiré une attention considérable en raison de leurs réalisations impressionnantes dans le domaine de la vision par ordinateur. Plusieurs études10,11 ont utilisé l'analyse de similarité représentationnelle12 pour comparer les modèles de dissimilarité des représentations CNN et IRMf, révélant que le cortex visuel humain partage des représentations hiérarchiques similaires à celles des CNN. En conséquence, les modèles de codage basés sur CNN sont devenus largement utilisés et ont démontré d’excellentes performances2,4,13,14. Cependant, il est important de noter que malgré le succès des CNN dans les applications de codage, les différences entre les CNN et le cerveau dans le traitement des informations visuelles ne peuvent être négligées15.

En termes de mécanismes informatiques, il existe une distinction fondamentale entre les neurones artificiels des CNN et les neurones biologiques, les premiers propageant des valeurs numériques continues, tandis que les seconds propagent des potentiels d'action (pics). L’introduction des réseaux de neurones à pointe (SNN), considérés comme la troisième génération de réseaux de neurones16, a considérablement réduit cette différence. Contrairement aux réseaux de neurones artificiels (ANN) traditionnels, les SNN transmettent des informations via une synchronisation de pointe. Dans les SNN, chaque neurone intègre les pointes de la couche précédente et émet des pointes vers la couche suivante lorsque sa tension interne dépasse le seuil. L'algorithme de plasticité dépendante du timing des pointes (STDP) 17,18, qui est une méthode non supervisée de mise à jour du poids et qui a été découvert dans le cortex visuel des mammifères 19,20,21, est l'algorithme d'apprentissage le plus couramment utilisé pour les SNN. Des études récentes ont appliqué les SNN basés sur STDP à la reconnaissance d'objets et ont obtenu des performances considérables22,23,24. La plausibilité biologique des SNN leur confère un avantage en matière de codage neuronal.

 0.12, two-tailed two-sample t-test) for V2 and V3. For the colorful natural image dataset, we compared the encoding performance of SCNN with CNN and GWP and selected 500 voxels with the highest encoding performance for each subject for comparison. As depicted in Fig. 2f, the accuracies of SCNN were significantly higher than those of CNN (p < \({10}^{-36}\), one-tailed two-sample t-test) for all subjects. Moreover, SCNN demonstrated comparable results to GNet for subject1 (SCNN higher than GNet, \({{{{{\rm{p}}}}}}=1.58\times {10}^{-19}\), one-tailed two sample t-test) and subject4 (no significant difference, p = 0.725, two-tailed two-sample t-test)./p>