
En tant qu’humains, le symbolisme est la clé pour comprendre le monde qui nous entoure, c’est la façon dont nous interprétons les objets, les idées et les relations entre eux.
Nous dépendons entièrement de l’analogie, ce qui rend notre technologie informatique actuelle extrêmement alambiquée, complexe et, à ce stade, archaïque.
La popularité croissante de l’intelligence artificielle (IA) et les cas d’utilisation que nous observons déjà avec ChatGPT d’OpenAI ne sont pas nécessairement les meilleures applications qui vont au-delà du simple « battage médiatique » et de l’inflation boursière.
Dans le cadre de l’informatique traditionnelle, nous ne comprenons pas pleinement ce que font ces réseaux de neurones artificiels (ANN) ni pourquoi ils fonctionnent aussi bien. Le manque total de transparence constitue également un inconvénient majeur dans notre compréhension de la manière dont les données sont collectées et analysées pour produire les résultats auxquels nous nous attachons si désespérément et que nous en venons à qualifier de « progrès ».
Prenons l'exemple suivant d'un ANN capable de distinguer les « cercles » et les « carrés » les uns des autres.
Une façon d’obtenir cette distinction est évidente : si une couche de sortie indique un cercle et l’autre un carré.
Mais que se passerait-il si vous vouliez que l'ANN discerne la « couleur » de cette forme particulière : est-elle « rouge » ou « bleue » ?
Étant donné que la « couleur » est un ensemble de données entièrement distinct, des neurones de sortie supplémentaires sont nécessaires pour pouvoir prendre en compte cette caractéristique dans le résultat final. Dans ce cas, il faudrait quatre neurones de sortie – un pour le cercle bleu, le carré bleu, le cercle rouge et le carré rouge.
Et si nous voulions un calcul prenant également en compte des informations supplémentaires, telles que la « taille » ou la « position/emplacement » ?
Plus de fonctionnalités signifie plus de neurones qui doivent prendre en compte chaque possibilité associée à la définition de cette fonctionnalité particulière (ou combinaison de fonctionnalités) avec le « cercle » et le « carré ».
En d’autres termes, cela devient incroyablement complexe.
Bruno Olshausen, neuroscientifique à l'Université de Californie à Berkeley, a récemment évoqué la nécessité de disposer d'un neurone pour chaque combinaison possible de caractéristiques.
« Cela ne peut pas être la façon dont notre cerveau perçoit le monde naturel, avec toutes ses variations. Vous devez proposer… un neurone pour toutes les combinaisons », a-t-il déclaré, expliquant en outre que nous aurions essentiellement besoin d'un « détecteur Volkswagen violet » ou de quelque chose d'aussi obscur pour rendre compte de toutes les combinaisons possibles d'informations que nous espérons prendre en compte dans une situation donnée. expérience.
Entrez dans « informatique hyperdimensionnelle ».
Qu’est-ce que « l’informatique hyperdimensionnelle » ?
Le cœur de l’informatique hyperdimensionnelle réside dans la capacité de l’algorithme à déchiffrer des informations spécifiques à partir d’images complexes (pensez aux métadonnées), puis à représenter ces informations collectives comme une entité unique, connue sous le nom de « vecteur hyperdimensionnel ».
Contrairement à l’informatique traditionnelle, l’informatique hyperdimensionnelle nous permet de résoudre des problèmes de manière symbolique et, dans un sens, d’être capable de « prédire » efficacement et précisément le résultat d’un problème particulier sur la base des données contenues dans le vecteur hyperdimensionnel.
Ce que soutient Olshausen, entre autres collègues, c'est que l'information dans le cerveau est représentée par l'activité d'une tonne de neurones, ce qui rend la perception de notre « Volkswagen violette » fictive impossible à contenir par les actions d'un seul neurone, mais plutôt par des milliers de neurones. de neurones qui, collectivement, forment une Volkswagen violette.
Avec le même ensemble de neurones agissant différemment, nous pourrions voir un concept ou un résultat totalement différent, comme une Cadillac rose.
La clé, selon une discussion récente dans WIRED, est que chaque élément d'information, tel que l'idée d'une voiture ou sa marque, son modèle, sa couleur ou tous ces éléments combinés, est représenté comme une seule entité - un vecteur hyperdimensionnel ou hypervecteur.
Un « vecteur » est simplement un tableau ordonné de nombres – 1, 2, 3, etc. – où un vecteur 3D est constitué de trois nombres – les coordonnées x, y et z d’un point exact dans l’espace 3D.
Un « hypervecteur », en revanche, pourrait être un tableau de milliers ou de centaines de milliers de nombres qui représentent un point dans cette quantité d'espace dimensionnel. Par exemple, un hypervecteur qui représente un tableau de 10 000 nombres représente un point dans un espace à 10 000 dimensions.
Ce niveau d'abstraction nous offre la flexibilité et la capacité de faire évoluer l'informatique moderne et de l'harmoniser avec les technologies émergentes, telles que l'intelligence artificielle (IA).
"C'est la chose qui m'a le plus enthousiasmé, pratiquement tout au long de ma carrière", a déclaré Olshausen. Pour lui et pour bien d’autres, l’informatique hyperdimensionnelle promet un nouveau monde dans lequel l’informatique serait efficace et robuste et où les décisions prises par les machines seraient entièrement transparentes.
Transformer les « métadonnées » en algorithmes hyperdimensionnels pour générer des résultats complexes
L’algèbre sous-jacente nous explique pourquoi le système a choisi cette réponse particulière, ce qui n’est pas le cas des réseaux neuronaux traditionnels.
Dans le développement de systèmes hybrides dans lesquels ces réseaux de neurones peuvent cartographier les choses en hypervecteurs, puis permettre à l'algèbre hyperdimensionnelle de prendre le relais, c'est au cœur de la façon dont l'IA devrait être utilisée pour nous permettre de mieux comprendre le monde qui nous entoure.
"C'est ce que nous devrions attendre de tout système d'IA", déclare Olshausen. "Nous devrions être capables de le comprendre comme nous comprenons un avion ou un téléviseur."
En revenant à l’exemple des « cercles » et des « carrés » et en l’appliquant à des espaces de grande dimension, nous avons besoin de vecteurs pour représenter les variables de « forme » et de « couleur » – mais nous avons également besoin de vecteurs pour représenter les valeurs qui peuvent être affecté aux variables – « CERCLE », « CARRÉ », « BLEU » et « ROUGE ».
Plus important encore, ces vecteurs doivent être suffisamment distincts pour quantifier réellement ces variables.
Tournons maintenant notre attention vers Eric Weiss, un étudiant d'Olshausen, qui, en 2015, a démontré un aspect des capacités uniques de l'informatique hyperdimensionnelle dans la meilleure façon de représenter une image complexe sous la forme d'un seul vecteur hyperdimensionnel contenant des informations sur TOUS les objets de l'image : couleurs, positions, tailles.
Autrement dit, une représentation extrêmement avancée des métadonnées d’une image.
"Je suis pratiquement tombé de ma chaise", a déclaré Olshausen. "Tout d'un coup, l'ampoule s'est allumée."
À ce moment-là, de plus en plus d’équipes ont commencé à concentrer leurs efforts sur le développement d’« algorithmes hyperdimensionnels » pour reproduire les tâches « simples » que les réseaux neuronaux profonds avaient déjà accomplies deux décennies auparavant, comme la classification d’images.
Création d'un « hypervecteur » pour chaque image
Par exemple, si vous deviez prendre un ensemble de données annotées composé d’images de chiffres manuscrits, cet algorithme hyperdimensionnel analyserait les caractéristiques spécifiques de chaque image, créant un « hypervecteur » pour chaque image.
Création d'une « classe » d'hypervecteurs pour chaque chiffre
À partir de là, l’algorithme ajouterait les hypervecteurs pour toutes les images de « zéro » pour créer un hypervecteur pour « l’idée de zéro », et répéterait cela pour tous les chiffres, générant 10 hypervecteurs de « classe » – un pour chaque chiffre.
Ces classes d'hypervecteurs stockées sont maintenant mesurées et analysées par rapport à l'hypervecteur créé pour une nouvelle image non étiquetée afin que l'algorithme détermine quel chiffre correspond le plus à la nouvelle image (en fonction de la classe d'hypervecteurs prédéterminée pour chaque chiffre).
La recherche IBM se lance
En mars, Abbas Rahimi et deux collègues d'IBM Research à Zurich ont utilisé l'informatique hyperdimensionnelle avec des réseaux de neurones pour résoudre un problème classique de raisonnement visuel abstrait – ce qui représente un défi de taille pour les ANN typiques, et même pour certains humains.
L’équipe a d’abord créé un « dictionnaire » d’hypervecteurs pour représenter les objets de chaque image, où chaque hypervecteur du dictionnaire représentait un objet spécifique et une combinaison de ses attributs.
À partir de là, l’équipe a formé un réseau neuronal pour examiner une image afin de générer un hypervecteur bipolaire – où un attribut ou un élément particulier peut être un +1 ou un -1.
"Vous guidez le réseau neuronal vers un espace conceptuel significatif", a déclaré Rahimi.
La valeur ici est qu'une fois que le réseau a généré des hypervecteurs pour chacune des images contextuelles et pour chaque candidat pour l'emplacement vide, un autre algorithme est utilisé pour analyser les hypervecteurs afin de créer des « distributions de probabilité » pour un certain nombre d'objets dans l'image.
En d’autres termes, l’algèbre peut être utilisée pour prédire l’image candidate la plus susceptible d’occuper l’emplacement vacant. Et l’approche de l’équipe a donné une précision de près de 88 % sur un ensemble de problèmes, là où les solutions basées uniquement sur les réseaux neuronaux étaient précises à moins de 61 %.
Nous en sommes encore à nos balbutiements
Malgré ses nombreux avantages, l'informatique hyperdimensionnelle en est encore à ses balbutiements et nécessite des tests sur des problèmes du monde réel et à des échelles bien plus grandes que ce que nous avons vu jusqu'à présent – par exemple, la nécessité de rechercher efficacement plus d'un milliard d'éléments ou de résultats. et trouver un résultat spécifique.
En fin de compte, cela viendra avec le temps, mais cela soulève la question de savoir où et comment appliquer et intégrer l’utilisation de l’intelligence artificielle.
Découvrez comment un service religieux de 40 minutes, alimenté par l'IA, a attiré plus de 300 participants en Allemagne dans le cadre d'une expérience unique en son genre.
Cliquez ici pour voir la galerie complète sur Hypemoon


