Comment les réseaux neuronaux liquides peuvent réduire le monde de l’IA

Fiabilité
POINTS CLÉS À RETENIR

Les réseaux neuronaux liquides constituent un élément essentiel et distinctif dans le paysage de l'IA en raison de leur approche non linéaire et créative, semblable à celle du cerveau humain, contrairement aux réseaux neuronaux linéaires. Ils excellent à relever des défis complexes tels que les prévisions météorologiques, l'analyse des marchés boursiers et la reconnaissance vocale, qui étaient auparavant dominés par des experts humains.

Les réseaux neuronaux liquides comptent parmi les composants émergents les plus importants et les plus uniques du paysage de l’intelligence artificielle (IA).

Lorsqu’une machine ou un robot doit réagir à un stimulus ou à des données externes, il peut être extrêmement gourmand en ressources. Ce qui provoque un goulot d’étranglement si l’on essaie de faire tenir de l’intelligence dans un espace très restreint.

VentureBeat décrit comment un réseau neuronal classique pourrait avoir besoin de 100 000 neurones artificiels pour maintenir la voiture stable dans une tâche telle que la conduite d’un véhicule sur une route.

Cependant, l’équipe du CSAIL du MIT, qui développe des réseaux neuronaux liquides, est parvenue à réaliser la même tâche avec seulement 19 neurones.

L’inspiration derrière les réseaux de neurones liquides

Les réseaux neuronaux liquides sont un type d’architecture d’apprentissage en profondeur mis au point pour résoudre le problème des robots effectuant des tâches et des apprentissages complexes, dans le but de contourner le problème de la dépendance à l’égard du cloud ou du stockage interne limité.

Daniela Rus, directrice du MIT CSAIL, a déclaré à VentureBeat : “L’inspiration pour les réseaux neuronaux liquides a été de réfléchir aux approches existantes de l’apprentissage automatique et de voir comment elles s’adaptent au type de systèmes critiques en matière de sécurité qu’offrent les robots et les appareils de pointe.

“Sur un robot, il n’est pas possible d’exécuter un modèle linguistique de grande taille, car il n’y a pas vraiment la [puissance] de calcul et l’espace [de stockage] nécessaires.

L’équipe de chercheurs a trouvé une solution à leur problème dans la recherche sur les neurones biologiques présents dans de minuscules organismes.

Qu’est-ce qu’un réseau de neurones liquides ?

Les réseaux de neurones liquides sont comparables aux cellules interconnectées d’un cerveau humain qui s’unissent pour traiter des informations et produire des résultats.

Le cerveau humain est un agencement de cellules très complexe qui effectue des calculs extrêmement complexes.

Les réseaux de neurones liquides se concentrent sur les applications critiques pour la sécurité, telles que les véhicules et les robots autopilotés, qui ont besoin d’un flux continu de données.

Selon Daniela Rus, “en général, les réseaux liquides donnent de bons résultats lorsque nous disposons de séries de données temporelles… il faut une séquence pour que les réseaux liquides fonctionnent bien”.

“Cependant, si vous essayez d’appliquer la solution du réseau liquide à une base de données statique comme ImageNet, cela ne fonctionnera pas très bien.”

Avantages et limites

L’équipe de recherche du Computer Science and Artificial Intelligence Laboratory du MIT (CSAIL) a constaté les avantages suivants sur la base de son expérience.

  • Compacité

Les réseaux neuronaux liquides peuvent fonctionner avec un nombre de neurones nettement inférieur à celui des réseaux neuronaux classiques.

Comme indiqué plus haut, un réseau neuronal classique à apprentissage profond aurait besoin de 100 000 neurones pour maintenir une voiture autopilotée dans sa voie, alors qu’un réseau neuronal liquide n’a besoin que de 19 neurones.

  • Causalité

Les réseaux neuronaux liquides gèrent mieux la causalité que les réseaux neuronaux classiques à apprentissage profond. Ils peuvent repérer une relation claire entre la cause et les effets, ce que les réseaux neuronaux classiques d’apprentissage profond ont du mal à faire.

Par exemple, les réseaux neuronaux classiques à apprentissage profond peuvent identifier de manière cohérente les relations de cause à effet entre les événements dans divers contextes, et ce plus efficacement que les réseaux neuronaux classiques.

  • Interprétabilité

Comprendre l’interprétation des données par un système d’IA est l’un des plus grands défis de l’IA.

Les modèles d’apprentissage profond classiques présentent souvent des bases d’interprétation des données peu profondes, peu claires ou erronées, alors que les réseaux neuronaux liquides peuvent expliquer leur base d’interprétation des données.

  • Cependant…

Les réseaux neuronaux liquides ne constituent pas une solution complète pour tout.

S’ils gèrent bien les flux de données continus tels que les flux audio, les données de température ou les flux vidéo, ils ont du mal avec les données statiques ou fixes, qui conviennent mieux à d’autres modèles d’IA.

La ligne de fond

Dans le paysage de l’IA, les réseaux neuronaux liquides font partie des modèles émergents les plus critiques.

Ils coexistent avec les réseaux neuronaux classiques à apprentissage profond, mais semblent mieux adaptés à des tâches extrêmement complexes telles que les véhicules autonomes, la lecture de la température ou du climat, ou les évaluations boursières, alors que les réseaux neuronaux classiques à apprentissage profond sont plus performants avec les données statiques ou ponctuelles.

Les chercheurs du Computer Science and Artificial Intelligence Laboratory du MIT (CSAIL) ont essayé d’étendre les capacités des réseaux neuronaux liquides à d’autres cas d’utilisation, mais cela prendra du temps.

Les réseaux neuronaux liquides et les réseaux neuronaux classiques d’apprentissage profond ont tous deux leur rôle défini dans le cadre plus large de l’IA, et il s’agit certainement d’un cas où deux modèles valent mieux qu’un.

Kaushik Pal
Technology writer
Kaushik Pal
Expert en technologie

Kaushik est un architecte technique et un consultant en logiciels, possédant plus de 23 ans d'expérience dans le secteur de l'analyse, du développement, de l'architecture, de la conception, des tests et de la formation de logiciels. Il s'intéresse aux nouvelles technologies et aux domaines d'innovation. Il se concentre sur l'architecture web, les technologies web, Java/J2EE, l'open source, WebRTC, le big data et les technologies sémantiques. Il a démontré son expertise en analyse des exigences, en conception et mise en œuvre d'architecture, en préparation de cas d'utilisation technique et en développement de logiciels. Son expérience a couvert différents domaines comme l'assurance,…