Exécuter un modèle IA sur Xbox 360 : découvrez comment ! 🚀
L'utilisateur X (anciennement Twitter) Andreï David Je viens d'installer et d'exécuter un modèle d'IA basé sur llama2.c d'Andrej Karpathy sur une console Xbox 360 vieille de près de 20 ans. Malgré son âge, David a utilisé un chargeur de démarrage pour charger le modèle dans l'ancienne console et exécuter une invite « Sleep Joe a dit ». Selon le message, la tentative réussie d'EXO Lab de faire fonctionner Llama sur un PC avec Fenêtres 98 a inspiré David à réaliser sa propre expérience. 🚀
Bien que l'AI LLM utilisé par la Xbox 360 soit basé sur le même que celui utilisé par le PC Pentium II d'EXO Lab, David a mentionné qu'il devait optimiser le code pour l'architecture PowerPC de la console et ses fonctionnalités de gestion uniques. mémoire (qui étaient innovants à l'époque). La différence la plus significative est que PowerPC est une architecture big-endian, qui stocke en premier la valeur la plus significative. 🖥️
D'un autre côté, le Processeur Intel Le Pentium II utilisé dans l'implémentation d'EXO Lab est petit-boutiste, ce qui signifie qu'il donne la priorité au stockage de la plus petite valeur en premier. Ainsi, pour s'assurer que le modèle fonctionnait correctement, il a dû mettre en œuvre un système d'échange d'octets et assurez-vous que toutes les données créé et stocké avait un alignement de mémoire approprié de 128 octets, comme l'exige le sous-système de mémoire Xbox 360 ⚙️.
LLM fonctionnant sur Xbox 360 avec un processeur Xenon (PowerPC 3,2 GHz avec 3 cœurs) et 512 Mo de RAM unifiée. Basé sur @karpathy's🩷llama2.c, adapté pour fonctionner sur la puissante implémentation Pure C de Microsoft 2005 optimisée pour l'architecture PowerPC et la gestion de la mémoire Xbox. Inspiré par… pic.twitter.com/e9oMLaWIyi10 janvier 2025
Un autre défi auquel David a dû faire face était l'utilisation de mémoire unifiée depuis la console. Bien que cela soit courant aujourd'hui sur les consoles et les APU modernes, au moment de la sortie de la Xbox 360, il s'agissait d'un nouveau territoire, obligeant les développeurs à des jeux pour optimiser l’utilisation du matériel depuis la console. Malgré 512 Mo de RAM, Andrei devait s'assurer que le modèle de 60 Mo s'inscrivait dans l'espace que le système allait allouer au Processeur ou GPU, puisqu'ils partageaient le même pool de RAM. 🕹️
Cependant, grâce à une gestion minutieuse de la mémoire et à des ajustements du fonctionnement de PowerPC, il a réussi à rendre l'ancien console Xbox 360 exécutera le LLM. Il s'agit d'une nouvelle étape vers l'objectif d'EXO Lab de donner aux gens accès à l'IA. commun, sans se limiter aux mégaentreprises qui dépensent des milliards de dollars en équipements de pointe et consomment des mégawatts d’énergie. 🌟
Exécuter un modèle d’intelligence artificielle (IA) basé sur Llama 2 sur un appareil vieux de plusieurs décennies est déjà, sans aucun doute, un exploit impressionnant qui démontre l’évolution et l’adaptabilité de la technologie. Cependant, lors d'un échange en ligne intéressant, un utilisateur a fait un commentaire intéressant : il a soutenu que disposer de 512 Mo de RAM unifiée devrait être plus que suffisant pour faire fonctionner des modèles plus petits et plus efficaces, tels que le SmolLM de Hugging Face ou le Qwen2.5, qui fonctionne sur 4 bits et a une taille de 0,5B.
Ce commentaire met non seulement en évidence le potentiel des modèles d’IA plus légers, mais soulève également des questions intrigantes sur la capacité des appareils plus anciens à gérer les technologies avancées. Andrei David, un passionné d'IA, a répondu avec enthousiasme en disant « Défi accepté ! » :)', ce qui suggère que vous êtes prêt à explorer et à expérimenter ces technologies sur des plateformes qui, à première vue, peuvent sembler inadaptées.
L’idée de voir de puissants modèles d’IA fonctionner sur une Xbox 360, une console de jeux vidéo sortie en 2005, est passionnante et promet d’ouvrir de nouvelles possibilités. Ce type d'expérimentation pourrait non seulement revitaliser les appareils plus anciens, mais pourrait également inciter la communauté technologique à trouver des moyens innovants d'optimiser les modèles d'IA pour qu'ils fonctionnent sur du matériel aux ressources limitées.
Nous attendons avec impatience les progrès et les résultats de ces tests, car ils pourraient ouvrir la voie à un avenir où l’intelligence artificielle sera accessible et fonctionnelle sur une variété d’appareils, quels que soient leur âge ou leurs limitations techniques. La combinaison de la créativité des développeurs et de la polyvalence des modèles d’IA pourrait conduire à des découvertes fascinantes et à des applications inattendues. 👀