구글, 제미니 AI의 인물 이미지 생성 문제 해결했다고 주장

테코피디아 신뢰성
핵심 내용

  • 구글의 제미니는 앞으로 다시 한번 사람들의 이미지를 생성할 것이다.
  • 구글은 논란의 여지가 있는 이미지 문제를 해결했다고 주장한다.
  • 구글의 접근 방식은 xAI와 극명한 대조를 이룬다.

구글(Google)은 이마젠 3(Imagen 3) 이미지 생성기를 앱과 모든 언어로 확장하면서 사람 사진 생성 기능을 복원하고 있다.

구글은 “향후 며칠”에 걸쳐 인물 이미지 생성 기능을 출시할 예정이다. 영어를 사용하는 제미니(Gemini) 고급, 비즈니스 및 엔터프라이즈 사용자에게 우선적으로 제공될 예정이다. 조만간 더 많은 사용자와 언어가 추가될 예정이다.

구글은 더 나은 평가 데이터 세트를 사용하고, 명확한 ‘제품 원칙’을 수립하고, AI 모델을 깨뜨리려는 레드티밍(red teaming) 연습을 실시하는 등 ‘기술적 개선’을 통해 문제를 해결했다고 밝혔다.

제미니 이마젠 3는 사실적이고 식별 가능한 사람 이미지를 생성하지 못한다고 회사는 밝혔다. 또한 미성년자의 사진이나 지나치게 잔인하거나 폭력적이거나 성적인콘텐츠도 허용되지 않는다. 구글은 이미지가 완벽하지는 않겠다고 경고했으며, 피드백에도 귀를 기울일 것이라고 주장했다.

새로운 생성 AI 시스템은 이전 버전인 이마젠 2보다 전반적으로 더 높은 품질을 제공한다고 한다. 특정 아트 스타일로 이미지를 만들 수 있으며, 결과물은 사용자가 프롬프트에 작성한 내용에 더 가깝다. 프로덕트 매니저 데이브 시트론(Dave Citron)에 따르면 다른 이미지 생성기에 비해 “유리하게” 실행되는 것으로 추정된다.

구글은 지난 2월 사용자가 유색인종을 2차 세계대전 독일군으로 묘사하는 등 역사적으로 부정확한 이미지를 생성한 후 제미니의 인물 생성 기능을 중단했다. 선다 피차이(Sundar Pichai CEO는 직원들에게 “받아들일 수 없는 결과”라고 말했고, 프라바카르 라그하반(Prabhakar Raghavan) 수석 부사장은 이 모델이 다양성이 현실적이지 않은 상황을 고려하지 않았다고 말했다.

구글이 이마젠의 문제를 완전히 해결했다고 말하기는 아직 이르다. 생성 AI 모델에서 발견된 많은 문제들은 더 많은 사람들이 사용해보고 약점을 발견하면서 드러난 것일 뿐이다.

그럼에도 불구하고 이 접근 방식은 xAI의 Grok과 뚜렷한 대조를 이룬다. 일론 머스크가 지원하는 이 생성기는 상대적으로 가드 레일이 적고 사람들이 다른 사람들을 오도하는 데 사용할 수 있는 딥페이크를 만들 수 있다. 구글은 픽셀 9의 픽셀 스튜디오와 같은 주요 기능이 제미니를 중심으로 작동하기 때문에 사람을 만드는 데 있어 안전한 접근 방식을 채택하고 있다.

James Park
IT 전문가
James Park
IT 전문가

본 작가는 IT, 사이버보안, 스파이웨어 관련 기사를 작성하는 작가로 활동하고 있습니다. Georgia Institute of Technology에서 컴퓨터 공학을 전공한 후 구글에서 오랜 경험을 바탕으로 실리콘 밸리에서 스타트업 사이버보안 컨설팅을 통해 실무적인 전문성을 키웠습니다. 현재는 사이버보안 분야에서의 오랜 경험을 토대로 기술 동향과 보안 측면에서의 최신 정보를 정확하게 파악하고, 독자들에게 전달하는 역할을 수행하고 있습니다. 이 작가는 자체적인 기술적 통찰력과 독자들에게 혜택을 주는 독특한 관점을 제공하여, IT 및 사이버보안 분야에서 공신력 있는 정보를 전달하고 있습니다.