Danny Weber
18:26 27-09-2025
© A. Krivonosov
Découvrez Apple Manzano, IA multimodale avec tokenizer hybride pour l’analyse et la génération d’images. Malgré les progrès, iOS 26 s’appuie sur GPT‑5.
Apple met au point un nouveau modèle d’IA baptisé Manzano, capable non seulement d’analyser des images mais aussi d’en générer. Le terrain est parmi les plus exigeants du secteur, et la plupart des prétendants restent pour l’instant à bonne distance des poids lourds commerciaux comme GPT‑4o d’OpenAI et Gemini 2.5 Flash Image Generation de Google (anciennement Nano Banana).
Au cœur de Manzano se trouve un tokenizer hybride : un seul encodeur produit des jetons continus pour la compréhension visuelle et des tokens discrets pour la création. L’idée est de réduire les frictions entre ces deux tâches afin qu’un même système les maîtrise avec assurance. L’architecture associe ce tokenizer à un modèle de langage unifié et à un module autonome de décodage d’images. Plusieurs tailles sont prévues — de 900 millions à 35 milliards de paramètres — afin de travailler avec des images de dimensions variées.
L’entraînement s’est déroulé en trois étapes sur 1,6 billion de tokens, incluant 2,3 milliards de paires texte‑image et 1 milliard de paires image‑texte. Une partie du jeu de données a été générée avec DALL‑E 3 et ShareGPT‑4o. Lors de tests internes, Manzano a obtenu de solides résultats sur ScienceQA, MathVista et MMMU, notamment pour l’analyse de graphiques et de documents très chargés en texte. Côté génération, il suit des consignes complexes, gère les changements de style et réalise même de la reconstruction de profondeur. Comme pour tout benchmark maison, ces chiffres sont encourageants mais appellent une lecture mesurée.
Malgré ces avancées, Apple indique que ses modèles de base restent derrière les leaders du marché. En conséquence, iOS 26 continuera d’utiliser GPT‑5 d’OpenAI au sein d’Apple Intelligence, en parallèle des travaux internes. Dans ce contexte, Manzano apparaît comme une étape stratégique pour réduire la dépendance aux technologies tierces et bâtir la propre IA multitâche d’Apple.