Sous le nom de Voice Interoperability Initiative, Amazon, déjà soutenu par une trentaine de sociétés (de Baidu à Tencent en passant par BMW, Intel, Microsoft, Orange, Qualcomm et Sony), lance un programme dont la finalité est d’assurer à terme qu’un appareil commandé à la voix puisse permettre à un utilisateur d’accéder à différents services vocaux et ce au travers de mots clés d’activation ad hoc ...comme Alexa (Amazon), Cortana (Microsoft), Django (Orange), Einstein (Salesforce), etc.
Selon Amazon, les entreprises membres de la Voice Interoperability Initiative vont collaborer les unes avec les autres pour que les consommateurs aient la liberté d’interagir avec différents services vocaux afin de sélectionner celui à même de leur assurer la meilleure interaction pour chaque cas d’usage particulier. Dans ce cadre Amazon, Baidu, BMW, Bose, Cerence, ecobee, Free, Harman, Microsoft, Orange, Salesforce, SFR, Sonos, Sound United, Sony, Spotify et Tencent se sont engagés à adopter une approche technologique similaire, qu’ils élaborent des produits commandés à la voix ou qu’ils développent des services et des assistants vocaux eux-mêmes.
« Nous avons été la première société à avoir permis le fonctionnement de deux assistants vocaux simultanément sur le même appareil et nous ferons tout notre possible pour qu’un jour il soit possible que de multiples assistants vocaux soient accessibles à partir d’un même équipement », a indiqué Patrick Spence, le CEO de Sonos.
Afin d’abaisser les coûts de développement et la charge mémoire des appareils embarquant des technologies permettant l’activation sur de nombreux mots clés, la Voice Interoperability Initiative a accueilli à son bord des fournisseurs de semi-conducteurs comme Amlogic, Intel, MediaTek, NXP et Qualcomm, des ODM comme InnoMedia, Tonly et SGW Global, ainsi que des intégrateurs système comme CommScope, DiscVision, Libre, Linkplay, MyBox, Sagemcom, StreamUnlimited et Sugr.
Parallèlement, des travaux vont être engagés avec des chercheurs et des universités pour améliorer rapidement l’état de l’art dans les domaines de l’apprentissage automatique et de l’activation sur mot-clé. Sont ainsi prévus le développement d’algorithmes permettant aux fonctions d’activation de tourner sur des produits portables et basse consommation et l’amélioration des fonctions de cryptage et des API assurant que les messages vocaux soient routés à la bonne destination en toute sécurité.