구글 제미니 AI: 챗GPT의 강력한 경쟁자

핵심 내용

알파고에서 영감을 얻은 기술을 통합한 대규모 언어 모델(LLM) 세트인 구글 제미니의 출시는 챗GPT에 대한 구글의 전략적 대응이다. 제미니는 멀티 모달 기능과 다양한 서비스에서 수집한 구글의 방대한 독점 학습 데이터에 대한 잠재적 액세스를 통해 생성형 AI 분야에서 챗GPT의 지배력에 도전하는 것을 목표로 한다. 이러한 움직임은 2032년까지 1조 3,000억 달러의 가치가 있을 것으로 예상되는 급성장하는 생성형 AI 시장에서 AI 혁신과 경쟁에 대한 구글의 노력을 강조한다.

작년 11월 챗GPT의 출시는 구글의 근간을 뒤흔들었다. 이 인기 챗봇은 회사의 비즈니스에 심각한 위협이 되어 구글이 코드 레드를 선언하고 생성형 AI 트렌드를 따라잡기 위한 투자를 시작했다. 이러한 노력의 결과로 구글 바드 (Google Bard)뿐만 아니라 구글 제미니 (Gemini AI)도 출시되었다.

구글 제미니 (Google Gemini)란?

구글 제미니는 강화 학습과 트리 검색 등 알파고에서 가져온 훈련 기법을 활용하는 대규모 언어 모델(LLM)의 집합으로, 챗GPT를 제치고 지구상에서 가장 지배적인 생성 AI 솔루션으로 자리 잡을 잠재력을 가지고 있다.

이 소식은 구글이 브레인과 딥마인드 AI 연구소를 통합하여 구글 딥마인드라는 새로운 연구팀을 만든 지 불과 몇 달 만에, 그리고 바드와 차세대 PaLM 2 LLM을 출시한 지 몇 달 만에 나온 것이다.

2032년까지 생성형 AI 시장의 규모가 1조 3,000억 달러에 달할 것으로 예상되는 가운데, 구글이 AI 개발 분야의 리더로서 입지를 유지하기 위해 이 분야에 투자하는 것은 분명한 사실이다.

구글 제미니에 대해 지금까지 알려진 모든 것

많은 사람들이 구글 제미니가 2024년 가을에 출시될 것으로 예상하고 있지만, 이 모델의 기능에 대해서는 알려진 바가 많지 않다.

지난 5월, 구글과 알파벳의 CEO인 선다 피차이는 블로그 포스팅을 통해 LLM에 대한 개략적인 내용을 공개하며 다음과 같이 설명했다:

“제미니는 처음부터 멀티 모달, 도구 및 API 통합에 매우 효율적이며 메모리 및 계획과 같은 미래 혁신이 가능하도록 설계되었다.”

또한 피차이는 “아직 초기 단계이지만 이전 모델에서는 볼 수 없었던 인상적인 멀티 모달 기능을 이미 확인하고 있다.

“미세 조정과 엄격한 안전성 테스트가 끝나면 제미니는 PaLM 2와 마찬가지로 다양한 크기와 기능으로 제공될 것이다.”

그 이후로 구글 딥마인드 CEO 데미스 허사비스가 와이어드(Wired)와의 인터뷰에서 제미니가 “알파고 유형 시스템의 강점과 대형 모델의 놀라운 언어 능력을 결합할 것”이라고 언급한 것 외에는 출시에 대해 공식적으로 알려진 바가 많지 않다.

또한 Android Police는 제품과 관련된 익명의 소식통이 제미니 가 텍스트와 문맥에 맞는 이미지를 생성할 수 있으며 YouTube 동영상 스크립트와 같은 소스를 학습할 것이라고 언급했다고 주장했다.

구글 제미니는 챗GPT를 능가할 수 있을까?

제미니 출시와 관련하여 가장 큰 화두 중 하나는 이 미스터리 언어 모델이 올해 월간 활성 사용자 수 1억 명을 돌파한 챗GPT를 능가할 수 있을지에 대한 것이다.

처음에 구글은 GPT4와 차별화하기 위해 제미니의 텍스트 및 이미지 생성 기능을 사용했지만, 2024년 9월 25일 오픈AI (OpenAI)는 사용자가 챗GPT에 음성 및 이미지 쿼리를 입력할 수 있게 될 것이라고 발표했다.

이제 오픈AI 가 멀티 모달 모델 접근 방식을 실험하고 챗GPT를 인터넷에 연결했으므로, 이 둘을 가장 위협적으로 차별화하는 요소는 아마도 구글의 방대한 독점 학습 데이터다. 구글 제미니는 구글 검색, 유튜브, 구글 도서, 구글 학술 검색 등 여러 서비스에서 수집한 데이터를 처리할 수 있다.

제미니 모델 훈련에 이 독점 데이터를 사용하면 데이터 세트에서 얻을 수 있는 인사이트와 추론의 정교함에서 뚜렷한 우위를 점할 수 있다. 특히 제미니가 GPT4보다 두 배 많은 토큰으로 훈련되었다는 초기 보고가 정확하다면 더욱 그렇다.

또한, 올해 구글 공동 창립자 세르게이 브린과 구글 딥마이느 ( Google DeepMind)수석 AI 과학자이자 머신러닝 전문가인 폴 바햄을 비롯한 세계적 수준의 AI 연구팀과 오픈AI가 맞붙게 되면서 구글 딥마인드와 브레인 팀 간의 파트너십도 과소평가할 수 없는 중요한 성과다.

이 팀은 강화 학습 및 트리 검색과 같은 기술을 적용하여 피드백을 수집하고 시간이 지남에 따라 문제 해결 능력을 향상시킬 수 있는 AI 프로그램을 만드는 방법을 깊이 이해하고 있는 숙련된 팀으로, 딥마인드 팀이 2016년 바둑 세계 챔피언을 이긴 알파고를 가르치는 데 사용한 기술을 보유하고 있다.

AI  군비 경쟁

제미니의 멀티 모달 기능, 강화 학습 사용, 텍스트 및 이미지 생성 기능, 구글의 독점 데이터는 모두 제미니가 GPT-4를 능가하는 데 필요한 요소다.

결국 학습 데이터는 핵심 차별화 요소이며, 누가 더 크고 풍부한 데이터 세트로 모델을 학습시키고, LLM 군비 경쟁에서 승리하는 조직이 결정될 것이다.

그렇긴 하지만 오픈AI가 Gobi라는 새로운 차세대 멀티 모달 LLM을 개발 중인 것으로 알려졌기 때문에, 아직 이 거대 AI 기업을 완전히 배제할 수는 없다. 이제 문제는 누가 멀티 모달 AI를 더 잘 실행하는지 지켜보는 것이다.

Tim Keary

본 작가는 2017년 1월부터 기업 테크 및 사이버 보안을 다루는 독립 기술 작가이자 리포터로 활동하고 있습니다.