J'ai passé plus de 25 ans dans l'industrie des semi-conducteurs. Voici pourquoi je suis convaincu que nous pouvons relever le défi de l'IA
Nous nous dirigeons vers un avenir où l’intelligence artificielle (IA) jouera un rôle dans tout ce que nous faisons, pour chaque personne sur la planète. Cette ampleur est incroyablement excitante, mais des défis de taille nous attendent, depuis les énormes demandes informatiques jusqu'aux problèmes de sécurité et de confidentialité. Pour les résoudre, nous devons comprendre un fait : le chemin vers l’IA à grande échelle passe par nos appareils quotidiens.
Au cours des dernières décennies, nos ordinateurs portables, téléphones et autres appareils ont été le lieu où les technologies transformatrices sont devenues des outils auxquels les gens font confiance et sur lesquels ils comptent. Cela est sur le point de se reproduire, mais avec un impact plus grand que jamais : l’IA va transformer, remodeler et restructurer ces expériences de manière profonde.
Même si l’IA centrée sur le cloud est impressionnante et là pour rester, elle est confrontée à des limites en matière de latence, de sécurité et de coûts. L’IA exécutée localement peut répondre à ces trois domaines. Il intègre l’IA dans les applications que nous utilisons déjà, là où nous les utilisons déjà, le tout directement intégré aux appareils dont nous disposons toujours.
Cependant, à mesure que les applications d’IA se développent, nous devons nous assurer que nos PC, téléphones et appareils sont prêts pour l’IA. Cela signifie concevoir des moteurs informatiques traditionnels – l’unité centrale de traitement (CPU) et l’unité de traitement graphique (GPU) – pour exécuter des charges de travail d’IA complexes, ainsi que créer de nouveaux moteurs d’IA dédiés comme les unités de traitement neuronal (NPU). Notre industrie n'est qu'au début d'une boucle de rétroaction sur plusieurs années où un meilleur matériel d'IA engendre un meilleur logiciel d'IA, qui engendre un meilleur matériel d'IA, ce qui… vous voyez l'idée.
C'est l'avenir de l'IA à grande échelle, et cela offre également une feuille de route pour l'avenir. Fort de mes près de trois décennies d’expérience dans l’industrie des semi-conducteurs, je vois trois vérités durables sur la manière dont ces types de changements se produisent et sur la manière dont nous pouvons tirer le meilleur parti de ce moment.
Une innovation significative commence par les besoins quotidiens des gens. Pensez à l’essor du Wi-Fi dans les années 2000, à l’explosion de la visioconférence dans les années 2010 ou au passage plus récent au travail hybride. Dans chaque cas, l’industrie devait trouver la meilleure manière pour la technologie de s’intégrer dans la vie des gens. Les applications utiles alimentent l’adoption et les progrès ultérieurs jusqu’à ce que la nouvelle technologie devienne indispensable.
Nous commençons déjà ce processus pour l’IA sur PC. Microsoft intègre l'IA dans les expériences de collaboration pour les 1,4 milliard d'utilisateurs de Windows. Mais dans un avenir proche, l’IA s’intégrera dans des centaines d’applications, et éventuellement dans des milliers d’applications dont nous n’avons même pas encore connaissance. Cela améliorera non seulement les expériences existantes, mais élèvera également tout ce que nous faisons en termes de travail, de créativité et de collaboration.
Nous devons discuter franchement des défis pour obtenir de meilleurs résultats. C'est la seule façon de trouver les bonnes solutions qui répondent aux besoins des clients en haut et en bas de la pile. Pour l’IA, les deux principaux obstacles sont les performances et la sécurité. Considérez que GPT-3 est d'un ordre de grandeur supérieur à GPT-2, passant de 1,5 milliard de paramètres à 175 milliards de paramètres. Imaginez maintenant que ces types de demandes de calcul soient multipliées dans chaque application, souvent exécutées simultanément. Seules les puces conçues pour l’IA peuvent garantir que ces expériences sont rapides, fluides et économes en énergie.
Il s’agit de l’un des points d’inflexion les plus marquants pour l’industrie des semi-conducteurs depuis des décennies. Nous devons faire évoluer la conception de notre matériel et créer de nouveaux moteurs accélérateurs d’IA intégrés pour offrir des capacités d’IA à une consommation bien inférieure, avec le juste équilibre entre puissance et performances de la plateforme. Dans le même temps, nous aurons besoin d’une sécurité matérielle pour protéger les données et la propriété intellectuelle qui transiteront par l’IA.
Il faut un écosystème ouvert pour créer une technologie qui change le monde. Nous savons que les nouvelles innovations prennent véritablement leur essor lorsqu’elles sont mises entre les mains des fabricants et des développeurs. Un bon exemple est le jeu. Les ordinateurs portables de jeu dotés de processeurs et de GPU puissants apportent une informatique intensive, que les développeurs de jeux utilisent ensuite pour créer des visuels immersifs et participer au jeu. Tout cela fait partie d'un processus collaboratif visant à atteindre un objectif commun.