Apple intensifie ses efforts pour promouvoir l'intelligence artificielle intégrée aux appareils et s'efforce de rompre avec le fonctionnement du cloud model

Lors de la conférence annuelle des développeurs d’Apple le mois prochain, une série de mises à niveau des fonctionnalités d’intelligence artificielle de l’iPhone, longtemps retardées, sera le point culminant. Dans le même temps, on s’attend à ce qu’Apple souligne l’un de ses avantages potentiels pour rattraper son retard sur l’IA : s’appuyer sur le nombre massif d’appareils Apple dans le monde pour exécuter des modèles d’IA directement sur les terminaux.

Selon des personnes familières avec les projets de la conférence mondiale des développeurs d'Apple, Apple devrait présenter ses quinze années d'accumulation de technologies dans des puces personnalisées auto-développées pour les iPhones, les montres Apple et les ordinateurs Mac. Cette accumulation deviendra son principal avantage dans l’exécution de modèles d’IA localement sur les terminaux. L’approche dominante actuelle consiste à exécuter des modèles d’IA dans de grands centres de données équipés de puces d’IA hautes performances. Les coûts de construction et d’exploitation de telles installations sont élevés.

Limitées par la complexité informatique et la nécessité de récupérer des informations réseau massives, de nombreuses instructions d'IA émises par les appareils Apple doivent encore être traitées par le cloud. Par exemple, selon l'accord de coopération entre Apple et Google, certaines des nouvelles commandes Siri s'appuieront sur Google Cloud Platform et feront appel à la version autorisée du grand modèle Google Gemini pour s'exécuter. Une autre personne proche du dossier a déclaré qu'Apple avait récemment approuvé l'utilisation de la technologie de protection de la vie privée de Nvidia dans ce scénario, ce qui signifie qu'Apple utilisera les puces IA de Nvidia pour répondre aux besoins de puissance de calcul interne de Google Cloud.

Cependant, l'exécution de modèles d'IA localement sur le terminal peut non seulement réduire le risque de fuite de données utilisateur, mais également empêcher les agences de publicité d'utiliser les informations personnelles pour réaliser des bénéfices. Pour les entreprises clientes, l’informatique locale peut également réduire l’utilisation de jetons, qui sont l’unité de mesure textuelle sur la base de laquelle les fournisseurs de services d’IA cloud sont facturés, réduisant ainsi les coûts. Pour Apple lui-même, en déléguant davantage de tâches informatiques d’IA aux terminaux, il n’a pas besoin d’investir d’énormes sommes d’argent dans les centres de données comme d’autres géants de la technologie.

Des personnes proches du dossier ont déclaré que conformément à l'accord de coopération entre les deux parties, Apple utilise la version complète du grand modèle Gemini de Google pour former des modèles légers pouvant fonctionner localement sur les appareils Apple grâce à la technologie de distillation de modèles. En outre, Apple recherche également de petites entreprises qui peuvent l'aider à achever la transformation légère des modèles d'IA et à les adapter pour fonctionner sur des terminaux. Selon des personnes familiarisées avec les stratégies pertinentes, Liquid AI, une startup dont le siège est à Cambridge, dans le Massachusetts, qui se concentre sur la technologie d'IA de bout en bout, est entrée sur la liste d'acquisition d'Apple.

Dès 2024, lorsque Apple a lancé la série de fonctions d'IA Apple Intelligence, elle a été la première à promouvoir les avantages de l'IA de bout en bout en matière de protection de la vie privée. Mais depuis, les progrès de ce secteur sont devenus calmes : la réponse du marché aux nouvelles fonctions d'IA a été médiocre, le lancement de la nouvelle version de Siri a encore été retardé et les problèmes successifs ont mis Apple dans une situation embarrassante.

Dans le même temps, les grands géants de la technologie ont dépensé d’énormes sommes d’argent pour construire des systèmes de calcul d’IA dans le cloud, mais Apple est resté en dehors du processus. L'année dernière, les dépenses d'investissement annuelles de Yuanverse Platform Company ont atteint 72 milliards de dollars, dont la majeure partie a été utilisée pour la construction de centres de données ; Les dépenses en capital de Microsoft ont atteint 88 milliards de dollars. Au cours de la même période, les dépenses en capital d'Apple n'étaient que de 12,72 milliards de dollars.

L'approche conservatrice d'Apple en matière d'investissement dans le domaine de l'IA a déjà été critiquée par les investisseurs et les commentateurs du secteur. Ils estiment qu'à une époque où l'intelligence artificielle est devenue la capacité essentielle des terminaux intelligents, Apple pourrait prendre du retard. Aujourd’hui, l’ensemble du secteur technologique investit dans l’IA à une échelle sans précédent, Microsoft prévoyant à lui seul des dépenses en capital de 190 milliards de dollars cette année. Au lieu de cela, certains praticiens de la technologie ont commencé à s'inquiéter de l'accumulation aveugle de la puissance du cloud computing par l'industrie et ont donc changé d'avis sur la configuration relativement prudente d'Apple.

David Stott, PDG de la start-up d'Austin AI webAI, a déclaré : « Je pense qu'il y a un malentendu dans le boom actuel des investissements dans les centres de données. La technologie de l'IA se développe dans une direction légère. Les centres de données ne disparaîtront pas complètement, mais la grande majorité des tâches informatiques seront finalement transférées vers des terminaux de périphérie. Apple parie sur la bonne direction sur ce point.

De nos jours, de plus en plus de développeurs d’IA choisissent de créer leur propre entreprise en s’appuyant sur le matériel Apple, et Stout en fait partie. webAI développe principalement des applications d'IA end-side exclusives pour les entreprises, telles que la création d'outils d'exploitation et de maintenance pour le domaine de l'aviation : formation de modèles d'IA basés sur un ensemble complet de manuels de maintenance des moteurs Boeing Dreamliner pour aider le personnel dans la maintenance des moteurs.

Ces modèles peuvent être exécutés directement sur un iPad ou un Mac hors ligne, sans avoir besoin d'une connexion Internet. Les appareils Apple sont également appréciés des passionnés de technologie, et de nombreuses personnes les utilisent pour exécuter l'outil open source OpenClaw, qui peut créer des agents d'IA capables de contrôler les ordinateurs de manière autonome.

Richard Cramer, analyste technologique chez Arete Research, a estimé dans un récent rapport de recherche destiné aux investisseurs que la puissance de calcul rassemblée par les puces des terminaux Apple dans le monde entier équivaut à un ensemble de ressources informatiques d'une valeur de 50 milliards de dollars américains, et que cet ensemble de puissance de calcul est entièrement véhiculé par les utilisateurs mondiaux.

Mark Suman a déjà occupé le poste de chef de projet d'ingénierie principal chez Apple et était responsable de la recherche et du développement du système d'IA interne de l'entreprise avant de quitter l'entreprise en 2024. Il a déclaré que l'intégration de milliards d'appareils Apple constitue en soi une puissante puissance de calcul d'IA.

Suman, actuellement co-fondateur de la start-up Maple, a déclaré : « Apple a la capacité de construire le plus grand système d'IA informatique de pointe au monde. Ce n'est qu'une question de temps. Tôt ou tard, ils libéreront ce potentiel. Maple fournit principalement aux utilisateurs un accès crypté aux modèles d'IA cloud.

Bien entendu, la stratégie d’IA d’Apple ne peut pas être mise en œuvre entièrement en s’appuyant uniquement sur le modèle côté appareil. La version complète de Google du modèle Gemini comporte des milliards de paramètres (le nombre de paramètres est un indicateur important de la complexité du modèle d'IA) et nécessite une puissance de calcul extrêmement élevée. Des personnes proches du dossier ont déclaré que même si l'architecture de serveur d'Apple, Private Cloud Compute, utilise la même puce développée par Apple que celle de Mac, elle ne sera pas en mesure de transporter la version complète de Gemini.

Plusieurs anciens ingénieurs d'Apple estiment qu'Apple doit encore s'appuyer sur l'infrastructure Google Cloud pour exécuter certaines fonctions de la nouvelle version de Siri. Malgré cela, Apple explore toujours des solutions combinant des services d’IA cloud avec une protection de haut niveau de la confidentialité. Selon des personnes proches de la coopération entre les deux parties, Apple a récemment autorisé l'utilisation du système informatique confidentiel de Nvidia dans Google Cloud pour traiter certaines opérations complexes basées sur le grand modèle Gemini. C'est l'une de ces tentatives.

L'informatique confidentielle est une technologie de sécurité équipée de cartes graphiques NVIDIA qui peuvent crypter l'intégralité du processus de fonctionnement des données et du modèle d'IA. Après avoir activé cette fonctionnalité, la vitesse de traitement des instructions de l'IA dans le cloud sera légèrement réduite, mais cela peut aider Apple à remplir son engagement en matière de protection de la vie privée des utilisateurs.

Lorsque Apple a lancé pour la première fois les fonctionnalités intelligentes d'Apple, il a déclaré que toutes les commandes d'IA qui ne sont pas traitées localement sur le terminal seraient traitées par un système de cloud computing privé équipé des puces développées par Apple. Cet arrangement a maintenant été ajusté, mais des sources compétentes ont déclaré qu'Apple conserverait très probablement le nom de marque « Private Cloud Computing ».