AI 연구 · 2 min read · Mar 26, 2026
애플의 새로운 Pico-Banana-400K 데이터셋이 더 스마트한 AI 이미지 편집의 무대를 마련하다

애플은 Apple Pico-Banana-400K라는 새로운 연구 데이터셋을 발표했으며, 이는 최근 회사가 AI 연구에서 취한 가장 큰 조치 중 하나입니다.
이 데이터셋은 400,000개의 편집된 이미지로 구성되어 있으며, 각 이미지는 AI 시스템이 텍스트 지침에 따라 이미지를 편집할 수 있도록 훈련하기 위해 신중하게 제작되고 검토되었습니다.
이 새로운 출시는 AI 이미지 편집에서 가장 큰 문제 중 하나인 연구를 위한 개방적이고 양질의 데이터셋 부족 문제를 해결하는 데 도움을 줍니다.
더 흥미로운 점은 애플이 구글의 Gemini-2.5 모델을 사용하여 데이터를 생성하고 필터링했다는 것입니다.
이는 두 회사가 AI의 미래를 개선하기 위해 연구 경계를 넘어 협력할 의향이 있음을 보여줍니다.
이 데이터셋이 중요한 이유는 무엇인가요?
애플 팀은 “Pico-Banana-400K: 텍스트 기반 이미지 편집을 위한 대규모 데이터셋”이라는 제목의 논문에서 대부분의 기존 AI 편집 데이터셋이 작거나 다양성이 부족하거나 독점 시스템에 잠겨 있다고 언급했습니다.
이로 인해 연구자들은 종종 새로운 모델을 일관되게 훈련하거나 테스트하기 어려워합니다.
Apple Pico-Banana 데이터셋은 이러한 문제를 직접 해결합니다. 이는 비상업적 사용을 위해 개방되어 있어 연구자들이 GitHub에서 자유롭게 접근하고 연구하며 AI 프로젝트에 사용할 수 있습니다. 그러나 상업적 또는 이익 기반 목적으로 사용할 수는 없습니다.

애플은 Pico-Banana 데이터셋을 어떻게 구축했나요?
애플의 연구자들은 OpenImages 데이터셋에서 사람, 물체 및 텍스트가 포함된 장면의 실제 이미지 세트를 대량으로 수집하는 것부터 시작했습니다.
그런 다음 8개의 주요 카테고리로 나누어진 35개의 다양한 편집 지침을 준비했습니다. 일부 편집은 필터 적용과 같은 간단한 것이었고, 다른 편집은 사람을 만화 캐릭터나 장난감 스타일 버전으로 바꾸는 것과 같은 복잡한 것이었습니다.

실제로 편집된 이미지를 생성하기 위해 애플은 구글의 Nano-Banana (Gemini-2.5-Flash-Image) 모델을 사용했습니다.
그 후, 생성된 각 이미지는 Gemini-2.5-Pro라는 다른 모델에 의해 검토되어 편집이 프롬프트와 얼마나 잘 일치하는지, 이미지가 얼마나 현실적으로 보이는지를 확인했습니다.
두 가지 검사를 모두 통과한 이미지만 최종 Apple Pico-Banana-400K 데이터셋에 추가되었습니다. 이 과정은 데이터셋이 강력한 품질과 다양성을 유지하도록 보장했습니다.
추가 읽기:
애플 M5 vs. M4: 더 나은 선택을 돕기 위한 주요 차이점
구글 Vibe 코딩이 Gemini 스튜디오에서 AI 창의성의 새로운 시대를 열다
마이크로소프트, 게임 체인저 AI 이미지 생성기 MAI 이미지 1 공개
Apple Pico-Banana 데이터셋의 독특한 점은 무엇인가요?
하나의 전후 이미지 쌍만 보여주는 다른 데이터셋과 달리, Pico-Banana-400K는 이미지가 최대 5번의 변경을 거치는 다중 턴 편집도 포함합니다. 이는 모델이 더 긴 단계별 편집 프로세스를 따르는 방법을 배우는 데 도움을 줍니다.
또한 좋은 편집과 나쁜 편집을 비교하는 선호 쌍도 포함되어 있습니다. 이는 AI 모델이 피해야 할 것을 배우는 데 도움을 주어 실제 작업에서의 정확성과 신뢰성을 향상시킵니다.
애플은 특히 이미지 내부의 세부 사항이나 텍스트와 관련하여 여전히 일부 사소한 문제가 있다고 인정했지만, 전반적으로 데이터셋은 견고합니다.
이는 프롬프트를 더 명확하게 이해하고 더 깨끗하고 자연스러운 편집을 생성하는 더 나은 텍스트 기반 이미지 편집 시스템을 구축하는 데 도움을 주도록 설계되었습니다. 연구자들은 arXiv에서 전체 연구를 읽고 GitHub에서 데이터셋을 직접 다운로드할 수 있습니다.
새 게시물을 받은 편지함에서 받기
스팸은 없습니다. 언제든지 구독 해지 가능합니다.