Kioxia veut faire progresser l’IA RAG en vue d’optimiser l’utilisation des disques SSD

Kioxia IA RAG pour es disques SSD

Dans le cadre d’un effort visant à améliorer la facilité d’utilisation des recherches de bases de données vectorielles par l’intelligence artificielle (IA) au sein de systèmes de génération augmentée par récupération ou RAG (*) le japonais Kioxia annonce une mise à jour de son logiciel AiSAQ (All-in-Storage ANNS with Product Quantization) dans l’optique d’optimiser l’utilisation des disques SSD (Solid-State Drives) dans les systèmes embarqués.

Cette version open source du logiciel  introduit notamment des contrôles flexibles permettant aux architectes système de définir le point d’équilibre entre les performances de recherche et le nombre de vecteurs qui sont des facteurs opposés dans la capacité stockage d’un disque SSD.

En d’autres termes, selon Kioxia, l’avantage qui résulte de l’utilisation de sa technologie permet à ces architectes systèmes d’affiner l’équilibre optimal entre des charges de travail spécifiques vis-à-vis de la mémoire et leurs exigences, sans aucune modification matérielle.

Pour rappel, introduit pour la première fois en janvier 2025, le logiciel AiSAQ de Kioxia utilise un algorithme de recherche du voisin le plus proche ou ANNS (approximate nearest neighbour search) optimisé pour les SSD en vue d’éliminer le besoin de stocker les données d’index dans la mémoire Dram d’un système.

En autorisant les recherches vectorielles directement sur les SSD et en réduisant les besoins en mémoire hôte, la technologie de Kioxia permet, selon la société, aux bases de données vectorielles d’évoluer sans tenir compte des restrictions liées aux capacités limitées des Dram.

Lorsque la capacité installée du SSD dans le système est fixe, l’augmentation des performances de recherche (requêtes par seconde) nécessite une plus grande capacité de la mémoire SSD consommée par vecteur. À l’inverse, pour optimiser le nombre de vecteurs, la consommation de capacité de la mémoire SSD par vecteur doit être réduite, ce qui entraîne une baisse des performances.

Cet équilibre optimal entre ces deux pôles opposés varie en fonction de la charge de travail spécifique. Dans ce cadre, cette mise à jour du logiciel AiSAQ permet aux administrateurs de sélectionner l’équilibre optimal pour une variété de charges de travail au sein d’un système RAG.

Cette évolution fait d’AiSAQ un ANNS adapté non seulement aux applications RAG, mais également à d’autres applications gourmandes en vecteurs, telles que les recherches sémantiques hors ligne.

Selon Kioxia, avec la demande croissante de services d’IA évolutifs, les mémoires SSD offrent une alternative pratique à la Dram pour gérer le débit élevé et la faible latence requis par les systèmes RAG. A ce niveau, le logiciel AiSAQ permet de répondre efficacement à cette évolution grâce à l’utilisation d’une IA générative à grande échelle sans être limitée par des ressources mémoire restreintes.

Au-delà, le logiciel AiSAQ en open source, renforce l’engagement de Kioxia envers la communauté autour de l’IA en faisant la promotion des architectures centrées sur le SSD pour une IA évolutive.

« Nous cherchons à aider les développeurs et les architectes système à affiner les performances et les capacités mémoire de manière innovante, commente Axel Störmann, vice-président et directeur de la technologie pour les produits de mémoire et de SSD chez Kioxia. Aujourd’hui, avec l’introduction de la dernière version du logiciel AiSAQ, les utilisateurs peuvent compter sur la puissance des SSD pour construire des systèmes RAG évolutifs de manière flexible »

(*) Le modèle RAG (retrieval augmented generation, génération augmentée de récupération) est une technique de traitement du langage naturel qui combine les forces des modèles d’IA fondés sur la récupération et la génération de données. L’IA RAG fournit des résultats qui tirent parti des connaissances préexistantes, et peut également traiter et consolider ces connaissances pour créer réponses, instructions ou explications uniques, adaptées au contexte et rédigées dans un langage naturel.