AI研究 · 1 min read · Mar 26, 2026
Appleの新しいPico-Banana-400KデータセットがよりスマートなAI画像編集の舞台を整える

Appleは、Apple Pico-Banana-400Kという新しい研究データセットを発表しました。これは、最近のAI研究における同社の最大の動きの一つです。
このデータセットには、400,000枚の編集された画像が含まれており、各画像は慎重に作成され、レビューされて、テキスト指示に基づいて画像を編集できるAIシステムのトレーニングに使用されます。
この新しいリリースは、AI画像編集における主要な問題の一つである、研究のためのオープンで高品質なデータセットの不足を解決するのに役立ちます。
さらに興味深いのは、AppleがGoogleのGemini-2.5モデルを使用してデータを生成およびフィルタリングしたことです。
これは、両社がAIの未来を改善するために研究の境界を越えて協力することにオープンであることを示しています。
このデータセットが重要な理由は?
Appleのチームは、「Pico-Banana-400K: テキストガイドによる画像編集のための大規模データセット」という論文の中で、既存のAI編集データセットのほとんどが小規模で多様性がなく、または専有システムにロックされていると述べています。
そのため、研究者は新しいモデルを一貫した方法でトレーニングまたはテストするのが難しいと感じることがよくあります。
Apple Pico-Bananaデータセットは、その問題を直接解決します。これは非商業利用のためにオープンであり、研究者はGitHubから自由にアクセスし、研究し、AIプロジェクトに使用できます。ただし、ビジネスや利益を目的とした用途には使用できません。

AppleはどのようにPico-Bananaデータセットを構築したのか?
Appleの研究者は、OpenImagesデータセットから人々、物体、テキストのあるシーンを含む大量の実画像を収集することから始めました。
次に、8つの主要カテゴリに分けられた35種類の異なる編集指示を準備しました。いくつかの編集はフィルターを適用するような簡単なものであり、他のものは人を漫画のキャラクターやおもちゃスタイルのバージョンに変えるような複雑なものでした。

実際に編集された画像を作成するために、AppleはGoogleのNano-Banana (Gemini-2.5-Flash-Image)モデルを使用しました。
その後、生成された各画像は別のモデルであるGemini-2.5-Proによってレビューされ、編集がプロンプトにどれだけ合致しているか、画像がどれだけリアルに見えるかがチェックされました。
両方のチェックを通過した画像のみが最終的なApple Pico-Banana-400Kデータセットに追加されました。このプロセスにより、データセットは高い品質と多様性を維持することができました。
さらに読む:
Apple M5 vs. M4: より良い選択を助けるための重要な違い
Google Vibe CodingがGemini StudioにおけるAIクリエイティビティの新時代を切り開く
Microsoftがゲームを変えるAI画像生成器MAI Image 1を発表
Apple Pico-Bananaデータセットのユニークな点は?
他のデータセットが1つのビフォーアフター画像ペアのみを示すのに対し、Pico-Banana-400Kは、画像が最大5回の変更を経るマルチターン編集も含まれています。これにより、モデルは長い段階的な編集プロセスに従う方法を学ぶことができます。
また、良い編集と悪い編集を比較する好みペアも含まれています。これにより、AIモデルは何を避けるべきかを学び、実世界のタスクにおける精度と信頼性を向上させます。
Appleは、特に画像内の細部やテキストに関してまだいくつかの小さな問題があることを認めていますが、全体としてデータセットは堅実です。
これは、プロンプトをより明確に理解し、よりクリーンで自然な編集を生成するより良いテキストガイドによる画像編集システムを構築するのに役立つように設計されています。研究者はarXivで完全な研究を読むことができ、GitHubから直接データセットをダウンロードできます。
新しい投稿を受信箱で受け取る
スパムはありません。いつでも購読を解除できます。