L’apprentissage automatique vient aux puces-systèmes SoC à ultrabasse consommation

[EDITION ABONNES] Logiciels d’intelligence artificielle, algorithmes d’apprentissage automatique et autres réseaux de neurones ne font pas forcément bon ménage avec sobriété énergétique et objets connectés alimentés sur piles ou batteries. Mais cet état de fait touche à son terme… ...car des approches se font jour ici ou là qui laissent présager l’émergence de dispositifs embarqués à ultrabasse consommation capables d’effectuer des tâches telles que classement d’images, reconnaissance vocale ou détection de mots d’activation. On citera notamment les avancées de la start-up grenobloise GreenWaves avec son processeur d’application IoT GAP8 de classe microcontrôleur (lire notre article ici) ou les initiatives plus ou moins abouties de sociétés comme Gyrfalcon, Hailo, Syntiant ou XNOR.  

La récente annonce de la société Eta Compute participe également de cette tendance. Lors de la conférence Arm TechCon qui s’est tenue mi-octobre, cette start-up californienne créée en 2015 a dévoilé une puce-système ultrasobre capable d’effectuer de l’apprentissage automatique de manière totalement autonome, sans recours donc à des ressources dans le cloud.

Baptisé Tensai, ce circuit implémente la troisième génération de l’architecture à logique asynchrone DIAL (Delay Insensitive Asynchrnous Logic) de la jeune pousse qui permet un fonctionnement en mode « deep subthreshold » sous des tensions d’alimentation très basses (lire notre article ici). Une technologie qui s’avère également insensible aux variations des processus de gravure, aux imprécisions des modèles de conception et aux variations de délais sur les chemins de données et qui, selon Eta Compute, permet aux équipements de fonctionner de manière fiable sous la tension la plus basse possible pour une consommation réduite à son minimum.

« Notre architecture matérielle brevetée, une fois associée à nos algorithmes personnalisables reposant à la fois sur des réseaux de neurones à convolution CNN et à impulsions SNN, permet d’effectuer les fonctions d’inférence de l’apprentissage automatique dans une enveloppe énergétique de quelques centaines de microwatts, indique Nara Srinivasa, le directeur technique d’Eta Compute. Nous avons commencé de livrer des échantillons de notre circuit à des utilisateurs qui les intègrent dans des produits tels que des enceintes connectées ou des plates-formes de détection d’objets afin qu’ils puissent instiller de l’intelligence machine en périphérie de réseau. »

Dans le détail, la puce-système Tensai, dont la production en volume doit être lancée dans le courant du premier trimestre 2019, s’articule autour d’un cœur de microcontrôleur Arm Cortex-M3 flanqué d’un CoolFlux DSP16 d’origine NXP dévolu à l’apprentissage automatique. On se souviendra à cet égard qu’Eta Compute dispose déjà à son catalogue d’implémentations asynchrones de cœurs Cortex-M3 consommant moins de 5 µW sous une tension de l’ordre de 0,3 V une fois gravés en technologie 90 nm ou 55 nm basse consommation. Le SoC Tensai embarque également des blocs présents traditionnellement dans les microcontrôleurs tels que de la mémoire flash, des entrées/sorties analogiques et une unité de gestion de l’alimentation (PMIC).

Cette carte de détection bâtie sur le processeur Tensai est alimentée par cellules photovoltaïques

Selon la start-up, le processeur peut être préalablement entraîné avec des frameworks d’apprentissage automatique populaires comme TensorFlow ou Caffe et les modèles ainsi définis peuvent être par la suite optimisés par le noyau maison d’Eta Compute. Dans ce cadre, le SoC de la société californienne est utilisable dans un grand nombre d’applications dotées de fonctions de traitement du signal, éventuellement audio et vidéo, où la consommation doit être réduite au minimum : terminaux mobiles, dispositifs électroniques portés sur soi, capteurs industriels, caméras, etc.

A ce titre Eta Compute précise qu’avec le SoC Tensai, une application de classification d’images sollicite une énergie de seulement 0,4 mJ par image (soit 30 fois moins que des approches concurrentes). Une application toujours active d’activation sur mot-clé ne consommerait, elle, que 500 µA durant le processus de classification et seulement 50 µA en période de silence, de quoi satisfaire les strictes contraintes des dispositifs portés sur soi et autres appareils d’électronique grand public fonctionnant sur piles ou batteries, assure Eta Compute.