구글(Google)은 이마젠 3(Imagen 3) 이미지 생성기를 앱과 모든 언어로 확장하면서 사람 사진 생성 기능을 복원하고 있다.
구글은 “향후 며칠”에 걸쳐 인물 이미지 생성 기능을 출시할 예정이다. 영어를 사용하는 제미니(Gemini) 고급, 비즈니스 및 엔터프라이즈 사용자에게 우선적으로 제공될 예정이다. 조만간 더 많은 사용자와 언어가 추가될 예정이다.
구글은 더 나은 평가 데이터 세트를 사용하고, 명확한 ‘제품 원칙’을 수립하고, AI 모델을 깨뜨리려는 레드티밍(red teaming) 연습을 실시하는 등 ‘기술적 개선’을 통해 문제를 해결했다고 밝혔다.
제미니의 이마젠 3는 사실적이고 식별 가능한 사람 이미지를 생성하지 못한다고 회사는 밝혔다. 또한 미성년자의 사진이나 “지나치게 잔인하거나 폭력적이거나 성적인” 콘텐츠도 허용되지 않는다. 구글은 이미지가 완벽하지는 않겠다고 경고했으며, 피드백에도 귀를 기울일 것이라고 주장했다.
새로운 생성 AI 시스템은 이전 버전인 이마젠 2보다 전반적으로 더 높은 품질을 제공한다고 한다. 특정 아트 스타일로 이미지를 만들 수 있으며, 결과물은 사용자가 프롬프트에 작성한 내용에 더 가깝다. 프로덕트 매니저 데이브 시트론(Dave Citron)에 따르면 다른 이미지 생성기에 비해 “유리하게” 실행되는 것으로 추정된다.
구글은 지난 2월 사용자가 유색인종을 2차 세계대전 독일군으로 묘사하는 등 역사적으로 부정확한 이미지를 생성한 후 제미니의 인물 생성 기능을 중단했다. 선다 피차이(Sundar Pichai CEO는 직원들에게 “받아들일 수 없는 결과”라고 말했고, 프라바카르 라그하반(Prabhakar Raghavan) 수석 부사장은 이 모델이 다양성이 현실적이지 않은 상황을 고려하지 않았다고 말했다.
구글이 이마젠의 문제를 완전히 해결했다고 말하기는 아직 이르다. 생성 AI 모델에서 발견된 많은 문제들은 더 많은 사람들이 사용해보고 약점을 발견하면서 드러난 것일 뿐이다.
그럼에도 불구하고 이 접근 방식은 xAI의 Grok과 뚜렷한 대조를 이룬다. 일론 머스크가 지원하는 이 생성기는 상대적으로 가드 레일이 적고 사람들이 다른 사람들을 오도하는 데 사용할 수 있는 딥페이크를 만들 수 있다. 구글은 픽셀 9의 픽셀 스튜디오와 같은 주요 기능이 제미니를 중심으로 작동하기 때문에 사람을 만드는 데 있어 안전한 접근 방식을 채택하고 있다.