Eliminer les goulots d'étranglement inhérents aux transferts volumineux de données lors du traitement vocal par des algorithmes d’intelligence artificielle (IA) en périphérie de réseau (Edge IA). Tel est l’objectif premier mis en avant par Microchip avec sa mémoire neuromorphique embarquée de type SuperFlash, baptisée memBrain, une innovation dans le domaine du calcul en mémoire (Computing-in-Memory). Issue de sa filiale Silicon Storage Technology (SST), cette solution mémoire est capable d’effectuer simultanément le traitement d’un réseau neuronal et le stockage des “poids synaptiques”, et ce tout en étant intégrée dans une puce-système SoC.
Ce que vient d'ailleurs de réaliser la société chinoise Witinmem, créée en 2017, en produisant ce qu’elle estime être le premier circuit SoC du marché à utiliser cette technologie. Selon son concepteur, le circuit fabriqué en série et disponible dès cette année commercialement permettra à des systèmes à très basse consommation, typiquement sous le mA, de réduire le bruit vocal et de reconnaître des centaines de mots de commande, en temps réel, et ce dès la mise sous tension. Applications visées : le traitement par réseau neuronal de la reconnaissance vocale, la reconnaissance d’empreintes vocales, la réduction de bruit vocal, la détection de scènes et la surveillance de l’état de santé de patients.
Dans le détail, la mémoire neuromorphique memBrain de Microchip est optimisée pour la multiplication de matrices vectorielles (VMM, Vector Matrix Multiplication), nécessaire aux réseaux de neurones. Elle permet à des processeurs installés dans des dispositifs edge à haut niveau d’intégration et alimentés par batterie d'assurer des performances élevées en matière d'inférences IA par watt. Ce qui est possible en stockant les poids du modèle neuronal sous forme de valeurs dans la matrice mémoire, et en utilisant simultanément cette matrice mémoire comme élément de calcul neuronal. Avec à la clé, selon Microchip, une consommation d'énergie de 10 à 20 fois inférieure à celle des autres approches, ainsi qu'une réduction des coûts globaux de nomenclature du processeur, puisqu’aucune mémoire DRam ou NOR externe n’est nécessaire.
Le stockage permanent des modèles neuronaux à l'intérieur de la solution memBrain permet en outre l'activation instantanée du traitement par réseau neuronal en temps réel. A ce niveau Witinmem tire parti de la non-volatilité des cellules à grille flottante SuperFlash, pour mettre les macros de calcul en mémoire hors tension en phase d'inactivité, afin de réduire encore la consommation liée aux fuites, dans les cas d'usage IoT les plus exigeants.
« Witinmem innove grâce à la solution memBrain de Microchip pour répondre aux besoins de calcul intensif lié au traitement vocal par IA en temps réel au niveau edge, en s’appuyant sur des modèles avancés de réseaux de neurones, explique Shaodi Wang, président exécutif de Witinnem. Nous avons été les premiers à développer une puce de calcul en mémoire pour l'audio en 2019. Et aujourd'hui nous franchissons une nouvelle étape avec la production en série de la technologie de Microchip dans notre SoC de traitement neuronal à ultrabasse consommation, qui rationalise et améliore les performances dans les produits intelligents pour le traitement vocal et les applications de santé. »