La technologie NLU (Natural Language Understanding pour compréhension du langage naturel) permet à des assistants vocaux de comprendre n’importe quelle commande émise par la voix, tant que l’intention de l’usager est claire. Aujourd’hui, l’intelligence artificielle pousse les limites de cette technologie, en autorisant de réelles interactions entre l’humain et la machine.
Dans ce cadre, la société française Vivoka, spécialiste des technologies vocales (reconnaissance vocale, synthèse vocale, biométrie vocale…), annonce une technologie NLU qui serait aussi puissante que celle installée dans le cloud, mais fonctionnant directement au sein d’un assistant vocal embarqué, donc hors ligne.
« Les limites actuelles des assistants vocaux embarqués résident dans leur manque de capacité à comprendre des phrases complexes, explique William Simonin, cofondateur et P-DG de l’entreprise basée à Metz. Le NLU sur lequel nous travaillons permettra aux assistants de demain d’être aussi performants que ceux disponibles dans le cloud, mais contribuera également à limiter l’impact énergétique et à protéger les données des utilisateurs. De fait, nous apportons à l'industrie et aux appareils électroniques grand public la possibilité de contrôler leurs interfaces à la voix, sans avoir à les rendre dépendants d'internet. C’est la suite logique de notre développement qui va permettre à Vivoka de montrer que le cloud n’est pas une obligation, et qu’une entreprise ne devrait pas avoir à choisir entre performance et protection de ses données. »
Ce faisant, Vivoka concurrence désormais directement les plus grandes sociétés impliquées dans ce domaine en plein développement du contrôle par la voix - un marché estimé à quelque 22 milliards de dollars en 2026 - avec les technologies Siri d’Apple, Alexa d’Amazon ou encore Google Assistant.
D’un point de vue technologique, l’assistant vocal de Vivoka se concentre sur l’intention et non pas sur les mots en particulier. La machine, qui apprend grâce à des exemples, va affiner sa compréhension pour interagir plus efficacement avec les humains. Cette approche de type machine learning se différencie, selon Vivoka, des assistants vocaux embarqués classiques qui intègrent des phrases prédéfinies dans un cadre fixe, au sein duquel les commandes vocales ne peuvent pas sortir.
La particularité de Vivoka, depuis la création de son VDK (Voice Development Kit), est le fait que toute cette technologie fonctionne hors de toute connexion Internet. Conséquence, les assistants vocaux de la société implémentés dans n’importe quel appareil sont utilisables sans connexion au cloud, assurant de ce fait une indépendance totale pour le produit final.
Parmi les exemples d’usage d’un NLU embarqué dans un cadre professionnel, Vivoka cite les fauteuils de cabinets dentaires qui vont permettre aux praticiens de contrôler à la voix et naturellement la hauteur et l’inclinaison du patient, ou encore les robots de nouvelle génération procurant une interaction naturelle avec les opérateurs pour répliquer des actions humaines dans de nombreux domaines comme l’éducation, l’industrie ou la santé. Dans un cadre privé, un NLU embarqué va permettre le contrôle par la voix d’appareils ménagers sans que la maison ait besoin d’être connectée et sans connexion Internet pour ces appareils.