« A l’horizon 2025, il pourrait y avoir plus d’une centaine d’objets connectés au sein d’une maison d’habitation et l’idée qu’il existera une App sur smartphone pour chacun de ces objets ne tient pas la route. Une nouvelle interface utilisateur sera requise et cette interface sera vocale ...comme le laisse présager le succès d’estime rencontré par les produits Amazon Echo ou Google Home. » C’est en ces termes que Paul Neil, vice-président marketing de la firme britannique Xmos explique la volonté de sa société de se positionner dès aujourd’hui sur le marché naissant des processeurs de détection et de capture des signaux vocaux, capables de fonctionner dans un environnement à 360° à des distances pouvant atteindre jusqu’à 5 mètres et avec un locuteur pouvant éventuellement se déplacer…
Spécialiste des microcontrôleurs multicœurs à vocation temps réel utilisés notamment dans le domaine audio, Xmos lance donc sous la référence XVF3000 les premiers membres d’une nouvelle famille de processeurs conçus pour répondre à ce besoin, avec la capacité de capturer et de traiter un signal vocal « lointain » une fois connecté à quatre microphones Mems.
Bâtis sur l’architecture de microcontrôleur multicœur propriétaire xCore-200 du Britannique (qui y a ajouté des instructions DSP supplémentaires), ces circuits peuvent ainsi effectuer des fonctions de prétraitement telles que la formation adaptative de faisceau pour la capture d’un signal vocal émis par une « cible » mouvante (beamforming), l’annulation de bruit, l’annulation d’écho acoustique (AEC) full duplex, voire la détection de mots clés grâce à la prise en charge de la technologie TrulyHandsfree de Sensory (sur le modèle XVF3100).
Les XVF3000 disposent aussi d’interfaces USB ou I2S pour la connexion à un processeur d’application externe (pour des applications de type reconnaissance vocale par exemple). A cet égard, Xmos souligne la flexibilité de programmation des entrées/sorties, typique de l’architecture xCore, qui permet de configurer le comportement de chaque broche sous contrôle logiciel et donc d’associer aux circuits de la société n’importe quel processeur hôte voire d’autres types de capteurs. On rappellera d’ailleurs que la société de semi-conducteurs Infineon s’est associée à Xmos pour proposer une brique de base commune visant à garantir, à partir d’un radar et d’un microphone Mems, une reconnaissance des sons optimale dans les applications d’assistance vocale numérique sur des marchés aussi divers que les appareils domotiques, les TV et décodeurs intelligents, les systèmes d’accès sécurisé sans clé et les équipements d’électronique grand public contrôlables à la voix (lire notre article ici).
Ajoutons que le Britannique proposera à partir du mois de juillet un design de référence pour haut-parleur avec fonctions de détection et de capture de la voix. Du nom de VocalFusion Speaker, ce kit de développement s’appuie sur deux cartes, l’une bâtie sur le processeur XVF3000 et l’autre hébergeant un réseau circulaire de six microphones Mems (dont quatre seulement sont utilisés).