SensiML adopte une technologie d’IA générative pour démocratiser la reconnaissance vocale dans les petits appareils

[EDITION ABONNES] Filiale de QuickLogic et spécialiste des outils facilitant l’intégration de l’intelligence artificielle (IA) dans les nœuds d’extrémité de l’Internet des objets (IoT), SensiML reste fidèle à son objectif de démocratiser la reconnaissance vocale sur les appareils compacts bâtis sur des microcontrôleurs basse consommation. La société vient d’intégrer une technologie vocale dopée à l’IA générative dans son outil Data Studio, une application de gestion de jeux de données (datasets) pour produits IoT en périphérie de réseau (edge).

Selon SensiML, cette fonctionnalité permet aux développeurs d'appareils embarqués d'utiliser la synthèse vocale (TTS, Text-to-Speech) et la génération de voix renforcées par l’IA pour créer rapidement des jeux de données vocales synthétiques hyperréalistes qui sont essentiels pour la mise en place de modèles robustes de reconnaissance de mots-clés, de commandes vocales et d'identification du locuteur.

Grâce à ces jeux de données vocales générés rapidement, les développeurs peuvent désormais créer facilement des modèles IA de reconnaissance vocale à l'aide des outils de développement AutoML de SensiML. Ces modèles sont spécifiquement optimisés pour fonctionner de manière autonome et efficace sur des microcontrôleurs à faible consommation utilisés dans les applications edge IoT, assure l’entreprise.

On rappellera que le paradigme AutoML vise à simplifier et à accélérer considérablement le processus de création de modèles d'apprentissage automatique, afin notamment de le rendre accessible aux développeurs qui n’ont peut-être pas de connaissances spécifiques dans la science de la donnée. Or la création de modèles ML pour les microcontrôleurs IoT et les puces-systèmes edge s’avère d’autant plus complexe qu’elle nécessite de combiner la science de la donnée avec l'optimisation du code embarqué pour les appareils dotés d'une capacité mémoire et d'une puissance de traitement limitées.

La fonctionnalité vocale dopée à l’IA générative proposée par SensiML, qui s’appuie sur la technologie de génération vocale du newyorkais ElevenLabs, est censée simplifier la création de grands jeux de données de haute qualité. Les développeurs devraient ainsi pouvoir générer des données vocales synthétiques avec un réalisme inégalé et des attributs vocaux personnalisés tels que la hauteur vocale, la cadence et le ton pour répondre aux exigences spécifiques des applications.

Le but est donc d’éliminer le processus long et coûteux d'enregistrement manuel de phrases à partir de grandes populations de locuteurs divers, et d’accélérer le temps de mise sur le marché des appareils IoT à commande vocale.

Les jeux de données ainsi créés sont compatibles avec SensiML Analytics Studio, plate-forme de développement de bout en bout couvrant la collecte et l'étiquetage de données, la génération automatique d'algorithmes et de firmware et les tests, ainsi qu’avec l'outil AutoML open source Piccolo AI, qui vise notamment à simplifier la création de modèles d'apprentissage automatique pour les données des capteurs avec une intervention manuelle minimale (lire notre article).

Vous pouvez aussi suivre nos actualités sur la vitrine LinkedIN de L'Embarqué consacrée à l’intelligence artificielle dans l’embarqué : Embedded-IA