IA et données · 3 min read · Mar 26, 2026
Le nouveau jeu de données Pico-Banana-400K d'Apple prépare le terrain pour un montage d'images AI plus intelligent

Apple a publié un nouveau jeu de données de recherche appelé Apple Pico-Banana-400K, et c’est l’un des plus grands mouvements que l’entreprise ait réalisés récemment dans la recherche en IA.
Le jeu de données contient 400 000 images éditées, chacune réalisée et examinée avec soin pour entraîner des systèmes d’IA capables d’éditer des images en fonction d’instructions textuelles écrites.
Cette nouvelle publication aide à résoudre l’un des principaux problèmes dans l’édition d’images par IA, qui est le manque de jeux de données ouverts et de bonne qualité pour la recherche.
Ce qui rend cela encore plus intéressant, c’est qu’Apple a utilisé les modèles Gemini-2.5 de Google pour aider à générer et filtrer les données.
Cela montre comment les deux entreprises sont ouvertes à travailler au-delà des frontières de la recherche pour améliorer l’avenir de l’IA.
Pourquoi ce jeu de données est-il important ?
Dans leur article intitulé “Pico-Banana-400K : un jeu de données à grande échelle pour l’édition d’images guidée par texte”, l’équipe d’Apple a mentionné que la plupart des jeux de données d’édition AI existants sont soit petits, peu diversifiés, soit verrouillés derrière des systèmes propriétaires.
À cause de cela, les chercheurs ont souvent du mal à entraîner ou tester de nouveaux modèles de manière cohérente.
Le jeu de données Apple Pico-Banana résout directement ce problème. Il est ouvert à l’utilisation non commerciale, ce qui signifie que les chercheurs peuvent y accéder librement depuis GitHub, l’étudier et l’utiliser dans leurs projets d’IA. Cependant, il ne peut pas être utilisé à des fins commerciales ou lucratives.

Comment Apple a-t-il construit le jeu de données Pico-Banana ?
Les chercheurs d’Apple ont commencé par collecter un grand ensemble d’images réelles à partir du jeu de données OpenImages, qui comprend des personnes, des objets et des scènes avec du texte.
Ensuite, ils ont préparé 35 instructions d’édition différentes divisées en huit catégories principales. Certaines modifications étaient simples, comme l’application d’un filtre, tandis que d’autres étaient complexes, comme transformer une personne en personnage de dessin animé ou en version style jouet.

Pour créer effectivement les images éditées, Apple a utilisé le modèle Nano-Banana de Google (Gemini-2.5-Flash-Image).
Après cela, chaque image générée a été examinée par un autre modèle, Gemini-2.5-Pro, qui a vérifié à quel point l’édition correspondait à l’invite et à quel point l’image semblait réaliste.
Seules les images ayant réussi les deux vérifications ont été ajoutées au jeu de données final Apple Pico-Banana-400K. Ce processus a permis de garantir que le jeu de données maintenait une forte qualité et variété.
Lectures complémentaires :
Apple M5 vs. M4 : principales différences pour vous aider à mieux choisir
Google Vibe Coding inaugure une nouvelle ère de créativité AI dans Gemini Studio
Microsoft dévoile MAI Image 1, un générateur d’images AI révolutionnaire
Qu’est-ce qui rend le jeu de données Apple Pico-Banana unique ?
Contrairement à d’autres jeux de données qui ne montrent qu’une paire d’images avant et après, Pico-Banana-400K inclut également des modifications multi-tours, où une image subit une série de jusqu’à cinq changements. Cela aide les modèles à apprendre comment suivre un processus d’édition plus long et étape par étape.
Il comprend également des paires de préférences, qui comparent une bonne édition à une mauvaise. Cela aide les modèles d’IA à apprendre ce qu’il faut éviter, améliorant ainsi la précision et la fiabilité dans les tâches du monde réel.
Apple a admis qu’il y a encore quelques problèmes mineurs, notamment avec les détails fins ou le texte à l’intérieur des images, mais dans l’ensemble, le jeu de données est solide.
Il est conçu pour aider à construire de meilleurs systèmes d’édition d’images guidés par texte qui comprennent mieux les invites et produisent des modifications plus propres et plus naturelles. Les chercheurs peuvent lire l’étude complète sur arXiv et télécharger le jeu de données directement depuis GitHub.
Recevez de nouveaux articles dans votre boîte de réception.
Aucun spam. Désabonnez-vous à tout moment.