구글 제미니란?
구글 제미니 또는 제미니 AI는 현재 구글 AI에서 개발 중인 대규모 언어 모델(LLM)의 통합 제품군이다. Google CEO 순다르 피차이에 따르면 제미니의 기본 모델은 처음부터 멀티모달로 설계되었다고 한다.
즉, 사용자는 단일 사용자 인터페이스(UI)를 통해 텍스트, 이미지, 코드, 오디오 콘텐츠를 처리하고 생성할 수 있게 된다.
제미니는 현재 소수의 기업에서 엄선된 개발자 그룹을 대상으로 베타 테스트를 진행하고 있다. 제미니는 2023년 말까지 현재 구글 바드를 구동하는 LLM인 PaLM 2를 대체할 것으로 예상된다.
구글 제미니 특징
구글 딥마인드의 부사장인 주빈 가라마니는 제미니가 PaLM 2와 동일한 네 가지 크기인 Gecko, Otter, Bison, Unicorn으로 제공될 것이라고 말했다.
- Gecko는 가볍고 모바일 기기에서 사용하기에 적합할 것으로 예상된다.
- Otter는 Gecko보다 더 강력하게 설계되었다. 다양한 언모달 작업에 적합할 것으로 예상된다.
- Bison은 Otter보다 더 크고 다용도로 사용할 수 있도록 설계되었다. 제한된 수의 멀티모달 작업에 적합할 것으로 보이며 시장 점유율을 놓고 Chat GPT-4와 경쟁할 것으로 예상된다.
- Unicorn은 제미니 사이즈 중 가장 크고 강력하며 다용도로 사용할 수 있도록 설계되었다. 광범위한 멀티모달 작업에 적합할 것으로 예상되며 Chat GPT 또는 경쟁사의 기능을 훨씬 뛰어넘을 것으로 예상한다.
구글 제미니 작동 방식
Gemini는 Google Pathways 아키텍처를 사용할 가능성이 높다. 이러한 유형의 AI 아키텍처에서는 일련의 모듈식 머신 러닝(ML) 모델이 처음에 특정 작업을 수행하는 방법을 학습한다. 학습이 완료되면 모듈이 연결되어 네트워크를 형성한다.
네트워크로 연결된 모듈은 독립적으로 작동하거나 함께 작동하여 다양한 유형의 출력을 생성할 수 있다. 백엔드에서 인코더는 다양한 유형의 데이터를 공통 언어로 변환하고, 디코더는 인코딩된 입력과 당면한 작업에 따라 다양한 양식의 출력을 생성한다.
구글은 듀엣AI를 제미니의 프런트엔드로 사용할 것으로 예상된다. 이 사용자 친화적인 인터페이스는 제미니 아키텍처의 복잡성을 숨기고 다양한 기술 수준을 가진 사람들이 생성형AI 목적으로 제미니 모델을 사용할 수 있게 해줄 것이다.
Gemini AI의 학습 방법
Gemini LLM 모델은 다음과 같은 기법의 조합으로 훈련된 것으로 알려져 있다:
- 지도 학습: Gemini AI 모듈은 레이블이 지정된 학습 데이터에서 학습한 패턴을 사용하여 새로운 데이터의 출력을 예측하도록 학습되었다.
- 비지도 학습: Gemini AI 모듈은 레이블이 지정된 예제 없이도 데이터 내에서 패턴, 구조 또는 관계를 자율적으로 발견하도록 학습되었다.
- 강화 학습: Gemini AI 모듈은 보상을 극대화하고 페널티를 최소화하도록 모듈을 학습시키는 시행착오 과정을 통해 의사 결정 전략을 반복적으로 개선했다.
일부 업계 전문가들은 구글이 클라우드 TPU v5e 칩에서 제미니 모듈을 훈련하기 위해 인간 피드백을 통한 강화 학습(RLHF)에 크게 의존했다고 추측하고 있다. Google에 따르면 TPU는 챗GPT를 훈련하는 데 사용되는 칩보다 5배 더 많은 연산 능력을 가지고 있다.
아직까지 구글은 제미니 AI가 학습한 데이터 세트에 대한 구체적인 정보를 공개하지 않았다. 하지만 구글 엔지니어들이 최근 PaLM 2를 학습시키는 데 사용한 LangChain 프레임워크와 용도가 변경된 데이터를 사용했을 가능성이 높다.
이 데이터는 책과 기사, 코드 저장소, 웹사이트, 동영상 및 팟캐스트 녹취록, 소셜 미디어 게시물, Google 내부 데이터 등 다양한 출처에서 가져온 것이다.
구글 제미니 출시 일정은?
Gemini AI의 출시일과 최종 기능은 아직 알려지지 않았다. 그러나 확인된 것은 Google이 소수의 회사에서 제한된 수의 개발자에게 Gemini를 미리 사용할 수 있는 권한을 부여했다는 것이다.
이는 제미니가 2023년 말까지 출시되어 구글 클라우드 버텍스 AI 서비스에 통합될 준비가 될 수 있음을 시사한다. 모든 것이 순조롭게 진행되면 제미니 AI는 구글 검색, 구글 번역, 구글 어시스턴트 등 인공지능(AI)을 사용하는 모든 구글 엔터프라이즈 및 소비자 클라우드 서비스에도 통합될 것이다.
제미니 AI가 출시되면 유연한 도구 및 API(애플리케이션 프로그래밍 인터페이스) 통합 기능과 함께 확장성이 뛰어나 다양한 실시간 데스크톱 및 모바일 애플리케이션에서 사용하기에 적합할 것이다.
구글 제미니 AI의 이름 유래
일부 언론 매체에서는 제미니가 “일반화된 다중 모드 인텔리전스 네트워크 인터페이스”의 약자라고 보도했지만, 해당 정보는 확인할 수 없었다.
구글 바드에 따르면, 구글 개발자들이 별자리 쌍둥이자리와 이 별자리에 영감을 준 고대 그리스 신화인 피마자자리와 폴룩스의 이름을 따서 통합 LLM 제품군의 이름을 지었을 가능성이 더 높다고 한다.