Ambiq utilise l’intelligence artificielle pour éliminer en local le bruit de fond dans les applications vocales de l’Internet des objets

Ambiq-Noise

Connu pour ses microcontrôleurs, puces-systèmes et horloges temps réel à ultrabasse consommation, Ambiq étoffe la bibliothèque de modèles IA (Model Zoo) de son kit de développement logiciel (SDK) neuralSPOT avec un modèle optimisé pour séparer le bruit de fond des commandes vocales (et le supprimer en temps réel) dans les objets connectés. L’idée étant de disposer d’une capture vocale "propre" dans les environnements bruyants.

Comme tous les composants Model Zoo, le modèle NNSE (Neural Network Speech Enhancer)  - c'est son nom -inclut des scripts et des outils pour aider les développeurs à ajouter des fonctionnalités de débruitage vocal à leurs applications. Il se compose également d'une interface utilisateur graphique simple permettant aux utilisateurs d'enregistrer et de sauvegarder la parole améliorée, ainsi que l'audio bruité d'origine, sur un PC à des fins de démonstration.

Pour rappel, NeuralSPOT, lancé en début d’année et disponible en open source, est un kit de développement logiciel de fonctionnalités IA et une boîte à outils pensée pour les plates-formes matérielles Ambiq. Ce SDK comprend des bibliothèques (pour communiquer avec les capteurs, gérer les blocs périphériques des puces SoC, contrôler les configurations d'alimentation et de mémoire…), des outils pour déboguer les modèles IA sur des PC ou des portables et des exemples optimisés, le tout dans le but d’aider au développement d’applications intégrant des algorithmes IA sur des microcontrôleurs. Et plus particulièrement sur les tout récents circuits Apollo4 Plus d'Ambiq.

Selon la société américaine, le débruitage de la parole est indispensable dans les environnements bruités ou bruyants, tels que les cabines de véhicules, les usines, certains bureaux d’entreprise et l'extérieur. Et, à ce titre, NNSE peut être mis en œuvre pour des applications telles que l'enregistrement de mémos vocaux, le chat vocal ou la reconnaissance vocale. Le tout en temps réel, avec une latence et une consommation d'énergie minimales, assure Ambiq.

Bien que le modèle pré(entraîné soit prêt à être utilisé sur les plates-formes de développement de l’entreprise américaine, NNSE comprend également un logiciel pour entraîner, convertir et déployer des modèles personnalisés si nécessaire.

« NSSE est peut-être la seule implémentation open source TinyML de débruitage de la parole reposant sur l'IA et adaptée aux contraintes des terminaux IoT, indique Carlos Morales, vice-président en charge de l'IA chez Ambiq. Ce modèle IA particulièrement optimisé aidera les développeurs à se lancer dans les applications de débruitage vocal sur le SoC Ambiq Apollo4 Plus en quelques minutes. » Pour l'heure, NSSE est disponible sous forme d'aperçu technique (Technical Preview) à télécharger pour démarrer un développement dès aujourd'hui. 

Vous pouvez aussi suivre nos actualités sur la vitrine LinkedIN de L'Embarqué consacrée à l’intelligence artificielle dans l’embarqué : Embedded-IA