L’accélérateur IA éco-efficace pour applications edge d’EdgeCortix évolue pour satisfaire l’IA générative

[EDITION ABONNES] Créé en 2019 et basé au Japon, EdgeCortix, qui a développé une architecture de traitement IA (intelligence artificielle) hautes performances, éco-efficace et à très faible latence pour la périphérie de réseau (edge), vient de dévoiler une puce d’accélération Edge AI de nouvelle génération, baptisée Sakura-II. Cette plate-forme, associée à l'architecture DNA (Dynamic Neural Accelerator) de deuxième génération de la société, est conçue pour s'attaquer aux tâches d'IA générative les plus complexes de l’industrie, affirme la jeune entreprise.

Elle doit permettre à ses utilisateurs de gérer notamment les grands modèles de langage (LLM), les grands modèles de vision (LVM) et les applications multimodales reposant sur des transformeurs (ou modèles auto-adaptatifs), même dans les environnements contraints de périphérie de réseau (edge).

Bien adapté à de nombreux cas d'usage dans les secteurs de la fabrication, de l'industrie 4.0, de la sécurité, de la robotique, de l'aérospatial et des télécommunications, le circuit Sakura-II sera disponible dans le courant du second semestre 2024 en tant que puce autonome sur deux modules M.2 différents (avec des capacités mémoire variables) ou sur des cartes PCIe (équipées d’une ou de deux puces).

Selon EdgeCortix, l’architecture estampillée DNA (Dynamic Neural Accelarator) a été conçue dès l’origine dans une optique de "co-exploration" automatisée des modèles IA et de la structure matérielle sous-jacente sur silicium. Par co-exploration, la start-up entend la conception et l’optimisation en parallèle de l’architecture hardware et des modèles afin d’obtenir les métriques attendues au niveau de la bande passante, de la latence, de la consommation et de l’empreinte silicium.

La puce Sakura-II est dans la pratique dotée du moteur de traitement neuronal reconfigurable de deuxième génération DNA-II et offrirait efficacité énergétique et capacités de traitement en temps réel tout en exécutant simultanément plusieurs modèles de réseaux de neurones profonds avec une faible latence. Selon les données fournies par EdgeCortix, elle offre jusqu’à 60 Tops (téraopérations par seconde) de performances sur les entiers 8 bits et jusqu’à 30 Tflops sur les formats 16 bits à virgule flottante, tout en prenant également en charge une précision mixte pour gérer les exigences rigoureuses des tâches IA de nouvelle génération.

La plate-forme s’accompagne de la suite logicielle de compilation, de quantification et de calibration de modèles Mera d’EdgeCortix qui inclut le support natif de frameworks de développement IA populaires comme PyTorch, TensorFlow Lite et ONNX. Le moteur d'exécution de Mera est capable de s'adapter à des systèmes monopuces, multipuces et multicartes en périphérie de réseau et son intégration avec la bibliothèque de modèles Mera, dotée d'une interface sans couture avec Hugging Face Optimum, offre aux utilisateurs l'accès à une large gamme des modèles de transformeurs les plus récents, en garantissant une transition en douceur de la phase d’apprentissage à l'inférence embarquée.

« Les performances affichées de 60 Tops de la puce Sakura-II pour une consommation d'énergie typique de 8 W, combinées à ses capacités de précision mixte et de compression mémoire intégrées, la positionnent comme une technologie essentielle pour les plus récentes solutions d'IA générative en périphérie, assure Sakyasingha Dasgupta, CEO et fondateur d'EdgeCortix. Qu'il s'agisse de modèles IA traditionnels ou de modèles dernier cri du type Llama 2/3, Stable Diffusion, Whisper ou transformeurs de vision ViT, Sakura-II offre une flexibilité de déploiement avec des performances par watt supérieures. » Selon la start-up, la puce se distingue aussi par une bande passante DRAM jusqu’à quatre fois supérieure à celle des accélérateurs IA concurrents, caractéristique garante de performances supérieures pour les grands modèles LLM et LVM.

Vous pouvez aussi suivre nos actualités sur la vitrine LinkedIN de L'Embarqué consacrée à l’intelligence artificielle dans l’embarqué : Embedded-IA