Créée en 2018, la start-up canadienne Untether AI, positionnée sur le marché des puces d’accélération IA (intelligence artificielle) pour centres de données, équipements de périphérie de réseau et systèmes embarqués, propose depuis quelques mois une carte d’accélération animée par son circuit de première génération, estampillé runAI 200. Selon la société, cette puce est conçue pour l'apprentissage profond en temps réel et s’avère adaptée au traitement de réseaux de neurones à convolution axés vision, à l’inférence de réseaux de "transformeurs" pour le traitement du langage naturel, à l'analyse financière de séries chronologiques et à l'algèbre linéaire à usage général pour le calcul à hautes performances (HPC). Dotée de 511 processeurs Risc maison et 204 Mo de mémoire SRam, elle délivre jusqu'à 502 Tops et affiche une efficacité jusqu'à 8 Tops par watt.
Rappelons qu’Untether AI, qui a levé plus de 150 millions de dollars depuis sa création, développe des circuits qui associent l’éco-efficacité du "near-memory computing" et la robustesse du traitement numérique (dixit la start-up). Cette approche architecturale éliminerait les goulets d’étranglement dans les échanges des données qui impactent négativement la consommation et les performances dans les architectures traditionnelles. Ainsi, l’architecture de "near-memory computing", qui consiste à rapprocher spatialement la mémoire de là où sont effectués les traitements sur les données, serait capable de transférer les données mille fois plus rapidement que les approches traditionnelles.
Dans ce cadre, estime Untether AI, la carte d’accélération tsunAImi tsn200 marque un pas significatif vers la démocratisation de l'IA en offrant un point d'entrée plus accessible dans le monde de l'intelligence artificielle haut de gamme grâce à ses performances de 500 Tops et à une consommation qui n’excède pas 40 W dans des applications typiques.
Livrée dans un format PCIe compact et économique, la carte assure des traitements de classe datacenter sans nécessité de connexion au cloud, ajoute la firme canadienne. « Les entreprises souhaitant déployer l’IA au-delà du centre de données ont été historiquement limitées à l’usage de réseaux de neurones plus petits et moins efficaces en raison de contraintes liées aux ressources en périphérie de réseau, rappelle Arun Iyengar, le CEO d’Untether AI. C'est pourquoi nous avons ajouté à nos offres d'inférence IA la carte accélératrice tsn200. Son format plus petit et sa consommation limitée ne compromettent pas les performances et permettent aux entreprises de déployer des modèles IA plus grands et plus puissants en périphérie sans avoir à dépasser leurs budgets financier et énergétique. »
La carte tsunAImi tsn200 est spécialement conçue pour répondre aux exigences des analyses vidéo en temps réel qui nécessitent à la fois consommation raisonnée, latence réduite et traitement précis des données vidéo. Untether AI propose à ce titre une conception de référence multi-caméras pour applications de ville intelligente bâtie sur sa carte. Elle comprend une pile logicielle complète fournie avec le code source, comprenant l'acquisition vidéo, le prétraitement, l'accélération IA et le post-traitement.
Le design de référence est livré avec un modèle de segmentation d'instance optimisé, formé pour la détection de piétons et de véhicules. Cependant, d'autres réseaux de neurones, tels que la détection d'objets ou la segmentation sémantique, peuvent être facilement ajoutés pour étendre les cas d'usage aux magasins de détail, à l’analyse géospatiale ou à d'autres applications d'analyse vidéo nécessitant des performances multi-caméras, haute définition et temps réel.
A noter qu'Untether AI compte commercialiser à partir de cette année une puce de deuxième génération.
Vous pouvez aussi suivre nos actualités sur la vitrine LinkedIN de L'Embarqué consacrée à l’intelligence artificielle dans l’embarqué : Embedded-IA