La détection vocale pilotée par l’IA atteint des consommations très faibles, inférieures à 35 µW

La société israélienne Polyn Technology qui a développé sous forme d’IP un bloc de traitement du signal analogique de type neuromorphique (NASP, Neuromorphic Analog Signal Processor) et qui propose des frontaux neuromorphiques (NFE, Neuromorphic Front End) pour capteurs, profite de la tenue du CES du 6 au 9 janvier 2026 à Las Vegas (Etats-Unis) pour montrer la première application pratique de détection d'activité vocale en continu avec une consommation d'énergie de quelques microwatts.


Fondée super son processeur analogique NASP, la démonstration de Polyn porte sur un système de détection de la voix même dans les environnements bruyants avec une latence de l'ordre de la microseconde.

Pour rappel, NeuroVoice de Polyn est un frontal neuromorphique qui cible les aides auditives et qui permet d’isoler la voix de n’importe quel fond sonore bruyant. La société affirme être la première à mettre en œuvre l’association de la détection et de l’isolation de la voix sur une puce neuromorphique analogique unique à ultrabasse consommation (entre 35 et 100 microwatts, selon les modes d'utilisation) ) avec en sus une faible latence d'inférence de quelques microsecondes.

Cette puce de type NFE est fondée sur le modèle de neurones artificiels NASP de la société, constitué de neurones artificiels (nœuds effectuant des calculs) et d’axones (connexions avec des poids entre les nœuds) et qui prend en charge des algorithmes d’IA sans avoir recours à des logiciels dans le cloud, directement sur les appareils IoT – voitures connectées, électronique grand public, systèmes industriels – garantissant de ce fait un niveau de confidentialité des données élevé.

 

 

Polyn indique que sa technologie NeuroVoice VAD (Voice Activity Detection) cible les télécommandes intelligentes à commande vocale, les écouteurs, les objets connectés, l'accès vocal, l'Internet des objets (IoT), l'industrie 4.0, la robotique, la maison/l'usine intelligente, la mobilité…

Dans ce cadre, la puce de détection d'activité vocale NeuroVoice VAD (NV-VAD 100) transmet la voix et coupe les bruits de fond tandis qu’une commande de détection de mot (WWD, Wake Word Detection) active la notion d’inversion vocale. De plus, une fonction spécifique améliore l’intelligibilité de la parole et des commandes dans les environnements bruyants par repérage de mots clés (KWS, Keyword Spoting).

Les interfaces audio PDM/I2S (Pulse Density Modulation/Inter-IC Sound) affichent un délai vocal de 25 ms, tandis que les interfaces SPI/I2C sont utilisées pour la configuration initiale et la lecture de l’état du circuit. Le circuit dispose d’un cœur numérique à 1,2 V et d’un coeur analogique à 1,8 V pour une consommation électrique allant de 30 à 35 µW (en fonctionnement).

En mode veille, il est possible d’arrêter complètement toutes les horloges d’alimentation. En mode sommeil, le microphone MEMS est maintenu en veille avec la possibilité d’un réveil rapide tandis que le mode faible consommation est utilisé lorsque le microphone MEMS doit fonctionner, mais que les fonctionnalités du cœur neuronal du VAD sont désactivées. Le cœur du processeur analogique fonctionne par trames de 8 ms, et l’intervalle entre les trames peut être augmenté jusqu’à 8 trames pour réduire la consommation d’énergie.

Enfin, Polyn indique qu’un autre paramètre configurable est le niveau de sensibilité du système de détection de voix peut être réglé entre 0 et 1. Ce qui permet d’ajuster le cœur du réseau neuronal pour un meilleur équilibre entre les faux positifs et les faux négatifs dans la détection vocale.

Lors du CES, l'entreprise prévoit de présenter des informations sur les kits d'évaluation NeuroVoice ainsi que sur les programmes d'accès anticipé destinés aux entreprises développant des produits à commande vocale ultra basse consommation.