MediaTek table sur le modèle de langage Llama 2 de Meta pour améliorer l’IA générative en périphérie de réseau

Llama 2

La société de semi-conducteurs MediaTek compte utiliser le modèle de langage de grande taille (LLM, Large Langage Model) Llama 2 de Meta pour bâtir, en association avec ses puces APU (AI Processor Unit) de dernière génération et sa plateforme IA NeuroPilot, un écosystème complet pour les traitements en périphérie de réseau. Lidée étant d’accélérer le développement d’applications d’intelligence artificielle (IA) générative pour les smartphones, l’Internet des objets, les véhicules, la maison connectée et autres équipements edge.

Pour rappel, les modèles de langage, qui se cachent généralement derrière les agents conversationnels, permettent à une machine de comprendre et de générer du texte en langage naturel. Dévoilé en juillet dernier et présenté comme concurrent de GPT-4 (OpenAI), Llama 2 est un modèle de langage de grande taille au sens où il s’appuie sur de vastes corpus de textes de diverses sources ; open source, il est en outre gratuit pour un usage commercial.

Selon MediaTek, la plupart des traitements de l’IA générative sont actuellement effectués dans le nuage mais la société taiwanaise estime que son utilisation des modèles Llama 2 permettra également aux applications GenAI de s'exécuter directement sur un équipement de périphérie de réseau (edge). Avec plusieurs avantages à la clé pour les développeurs et les utilisateurs. Et MediaTek de citer une plus grande confidentialité, une sécurité et une fiabilité améliorées, une latence plus faible, la possibilité de travailler dans des zones avec peu ou pas de connectivité et des coûts opérationnels inférieurs.

Pour véritablement profiter de la technologie d’IA générative intégrée dans les équipements edge, les fabricants devront toutefois adopter des processeurs d’IA à hautes performances et à faible consommation et tabler sur une connectivité haut débit et fiable pour améliorer les capacités de traitement. A ce titre, MediaTek rappelle que ses puces-systèmes pour smartphones 5G livrées actuellement sont équipées d'APU conçues pour exécuter une grande variété de fonctionnalités d'IA générative, telles que la réduction du bruit, la super-résolution ou les traitements de fluidité de type MEMC (Motion Estimation Motion Compensation), toutes dopées par l’IA.

Dans le détail, la société de semi-conducteurs compte lancer d’ici à la fin de l’année une puce dotée d’une pile logicielle optimisée pour exécuter Llama 2 et d’une APU améliorée pour l’accélération d’architectures de transformeurs (modèles sur lesquels s’appuie notamment Llama 2). Dans ce cadre, MediaTek s’attend à ce que des applications IA reposant sur Llama 2 soient rapidement disponibles sur les smartphones motorisés par cette nouvelle puce.

Vous pouvez aussi suivre nos actualités sur la vitrine LinkedIN de L'Embarqué consacrée à l’intelligence artificielle dans l’embarqué : Embedded-IA