Plus de 1,8 milliard de puces IA hétérogènes seront vendues d’ici à 2030 grâce à l’IA générative embarquée [EDITION ABONNES] Traditionnellement cantonnées aux environnements cloud, les charges de travail liées à l’intelligence artificielle générative peuvent désormais s’exécuter directement sur des équipements ou terminaux architecturés sur des puces IA hétérogènes. Associés à une couche d'abstraction capable de répartir efficacement les charges de travail IA entre les différentes architectures de traitement (CPU, GPU, NPU…) et à des grands modèles de langage (LLM) compressés avec moins de 15 milliards de paramètres, ces circuits électroniques sont en effet capables d’effectuer localement des inférences d'IA générative, affirme ABI Research. La société d'études estime en conséquence que plus de 1,8 milliard de puces IA hétérogènes seront commercialisées d’ici à 2030. Ordinateurs portables, smartphones et autres produits à différents formats vont de fait être de plus en plus souvent livrés avec des capacités IA intégrées. « Le déploiement dans le cloud constitue à terme un goulot d'étranglement pour la généralisation à grande échelle de l'IA générative en raison de préoccupations liées à la confidentialité des données, à la latence et aux coûts réseau, anticipe Paul Schell, analyste chez ABI Research. Il faut donc rapprocher l'inférence IA de l'utilisateur final. C'est là que l'IA embarquée présente une proposition de valeur claire, car elle élimine ces risques et peut assurer un déploiement à grande échelle plus efficace des applications IA qui améliorent la productivité. Ce qui est nouveau, c’est la possibilité de faire exécuter l'IA générative sur des chipsets hétérogènes avec une répartition des charges de travail au niveau matériel entre les cœurs de traitement généralistes (CPU), les cœurs graphiques GPU et les moteurs neuronaux NPU. Qualcomm, MediaTek et Google ont été les premiers à se lancer avec des puces capables de traiter des grands modèles de langage LLM à bord. » Le matériel seul ne suffira pas, nuance toutefois la société d’études. Construire une proposition de valeur solide en matière d’IA embarquée nécessite des partenariats forts entre les acteurs du matériel et les éditeurs de logiciels pour créer des propositions unifiées. Ces collaborations vont stimuler la demande et raccourcir les cycles de remplacement des produits finaux comme les smartphones et les PC, prédit ABI Research. Et ainsi entraîner une accélération du nombre de livraisons de puces IA hétérogènes entre 2025 et 2028 au fur et à mesure de la maturation de l’écosystème logiciel, insufflant de ce fait une nouvelle impulsion à des marchés qui stagnent. Les marchés de l’automobile et des serveurs de périphérie (edge) sont également impactés mais dans une moindre mesure, ajoute l’analyste. Vous pouvez aussi suivre nos actualités sur la vitrine LinkedIN de L'Embarqué consacrée à l’intelligence artificielle dans l’embarqué : Embedded-IA

Plus de 1,8 milliard de puces IA hétérogènes seront vendues d’ici à 2030 grâce à l’IA générative embarquée

[EDITION ABONNES] Traditionnellement cantonnées aux environnements cloud, les charges de travail liées à l’intelligence artificielle générative peuvent désormais s’exécuter directement sur des équipements ou terminaux architecturés sur des puces IA hétérogènes. Associés à une couche d'abstraction capable de répartir efficacement les charges de travail IA entre les différentes architectures de traitement (CPU, GPU, NPU…) et à des grands modèles de langage (LLM) compressés avec moins de 15 milliards de paramètres, ces circuits électroniques sont en effet capables d’effectuer localement des inférences d'IA générative, affirme ABI Research. La société d'études estime en conséquence que plus de 1,8 milliard de puces IA hétérogènes seront commercialisées d’ici à 2030.

Ordinateurs portables, smartphones et autres produits à différents formats vont de fait être de plus en plus souvent livrés avec des capacités IA intégrées. « Le déploiement dans le cloud constitue à terme un goulot d'étranglement pour la généralisation à grande échelle de l'IA générative en raison de préoccupations liées à la confidentialité des données, à la latence et aux coûts réseau, anticipe Paul Schell, analyste chez ABI Research. Il faut donc rapprocher l'inférence IA de l'utilisateur final. C'est là que l'IA embarquée présente une proposition de valeur claire, car elle élimine ces risques et peut assurer un déploiement à grande échelle plus efficace des applications IA qui améliorent la productivité. Ce qui est nouveau, c’est la possibilité de faire exécuter l'IA générative sur des chipsets hétérogènes avec une répartition des charges de travail au niveau matériel entre les cœurs de traitement généralistes (CPU), les cœurs graphiques GPU et les moteurs neuronaux NPU. Qualcomm, MediaTek et Google ont été les premiers à se lancer avec des puces capables de traiter des grands modèles de langage LLM à bord. »

Le matériel seul ne suffira pas, nuance toutefois la société d’études. Construire une proposition de valeur solide en matière d’IA embarquée nécessite des partenariats forts entre les acteurs du matériel et les éditeurs de logiciels pour créer des propositions unifiées. Ces collaborations vont stimuler la demande et raccourcir les cycles de remplacement des produits finaux comme les smartphones et les PC, prédit ABI Research. Et ainsi entraîner une accélération du nombre de livraisons de puces IA hétérogènes entre 2025 et 2028 au fur et à mesure de la maturation de l’écosystème logiciel, insufflant de ce fait une nouvelle impulsion à des marchés qui stagnent.

Les marchés de l’automobile et des serveurs de périphérie (edge) sont également impactés mais dans une moindre mesure, ajoute l’analyste.

Vous pouvez aussi suivre nos actualités sur la vitrine LinkedIN de L'Embarqué consacrée à l’intelligence artificielle dans l’embarqué : Embedded-IA