Apple M4 et training d’IA : le Neural Engine dévoile son potentiel caché

Danny Weber

Un développeur a contourné les limites logicielles d’Apple et montré que le Neural Engine des puces M4 peut faire plus que de l’inférence.

Un chercheur en sécurité et développeur connu sous le pseudonyme 0X0SOJALSEC affirme avoir contourné des restrictions d’Apple qui empêchent normalement d’utiliser le Neural Engine des puces M4 pour l’entraînement complet de modèles d’intelligence artificielle.

Le moteur neuronal d’Apple sert d’habitude surtout d’accélérateur pour des modèles déjà entraînés et pour des fonctions d’IA exécutées directement sur l’appareil. Mais l’enthousiaste a réussi à l’utiliser dans des scénarios bien plus complexes, dont l’entraînement de modèles transformer avec rétropropagation.

Pour y parvenir, il a créé une couche de compilation personnalisée basée sur le Model Intermediate Language (MIL). Elle permet d’accéder directement au Neural Engine, en contournant les outils habituels d’Apple comme Core ML et Metal. Pendant l’exécution, les données restent en mémoire vive, ce qui limite les ralentissements liés aux écritures répétées sur le stockage.

Le développeur a aussi mis en place un mécanisme de reprise de l’entraînement : si le processus se fige ou s’interrompt, le système peut repartir du dernier point de contrôle sans perdre les progrès déjà réalisés.

Le code source du projet est déjà disponible sur GitHub. Selon son auteur, les premiers essais ont montré une vitesse élevée : certaines étapes d’entraînement de modèles de type transformer sur des puces M4 se terminaient en quelques millisecondes.

Apple ne propose pas officiellement aux développeurs d’entraîner des réseaux neuronaux avec le Neural Engine et présente surtout ce bloc comme un accélérateur d’inférence. Ce travail de rétro-ingénierie suggère pourtant que le potentiel matériel des puces est bien plus large que ne le laissent entendre les outils publics de l’entreprise.

Si cette approche confirme son intérêt pratique, les ordinateurs Mac et les tablettes iPad pourraient devenir une plateforme plus séduisante pour développer et tester localement de petits modèles d’IA, sans dépendre systématiquement des services cloud.

Cette découverte relance aussi la question du nombre de capacités cachées dans le matériel Apple, et de celles qui restent inaccessibles non pas à cause du silicium, mais des limites logicielles imposées par l’entreprise.

© T. Feodor