구글 제미니

테코피디아 신뢰성

구글 제미니란?

구글 제미니 또는 제미니 AI는 현재 구글 AI에서 개발 중인 대규모 언어 모델(LLM)의 통합 제품군이다. Google CEO 순다르 피차이에 따르면 제미니의 기본 모델은 처음부터 멀티모달로 설계되었다고 한다.

즉, 사용자는 단일 사용자 인터페이스(UI)를 통해 텍스트, 이미지, 코드, 오디오 콘텐츠를 처리하고 생성할 수 있게 된다.

제미니는 현재 소수의 기업에서 엄선된 개발자 그룹을 대상으로 베타 테스트를 진행하고 있다. 제미니는 2023년 말까지 현재 구글 바드를 구동하는 LLM인 PaLM 2를 대체할 것으로 예상된다.

구글 제미니 특징

구글 딥마인드의 부사장인 주빈 가라마니는 제미니가 PaLM 2와 동일한 네 가지 크기인 Gecko, Otter, Bison, Unicorn으로 제공될 것이라고 말했다.

  • Gecko는 가볍고 모바일 기기에서 사용하기에 적합할 것으로 예상된다.
  • Otter는 Gecko보다 더 강력하게 설계되었다. 다양한 언모달 작업에 적합할 것으로 예상된다.
  • Bison은 Otter보다 더 크고 다용도로 사용할 수 있도록 설계되었다. 제한된 수의 멀티모달 작업에 적합할 것으로 보이며 시장 점유율을 놓고 Chat GPT-4와 경쟁할 것으로 예상된다.
  • Unicorn은 제미니 사이즈 중 가장 크고 강력하며 다용도로 사용할 수 있도록 설계되었다. 광범위한 멀티모달 작업에 적합할 것으로 예상되며 Chat GPT 또는 경쟁사의 기능을 훨씬 뛰어넘을 것으로 예상한다.

구글 제미니 작동 방식

Gemini는 Google Pathways 아키텍처를 사용할 가능성이 높다. 이러한 유형의 AI 아키텍처에서는 일련의 모듈식 머신 러닝(ML) 모델이 처음에 특정 작업을 수행하는 방법을 학습한다. 학습이 완료되면 모듈이 연결되어 네트워크를 형성한다.

네트워크로 연결된 모듈은 독립적으로 작동하거나 함께 작동하여 다양한 유형의 출력을 생성할 수 있다. 백엔드에서 인코더는 다양한 유형의 데이터를 공통 언어로 변환하고, 디코더는 인코딩된 입력과 당면한 작업에 따라 다양한 양식의 출력을 생성한다.

구글은 듀엣AI를 제미니의 프런트엔드로 사용할 것으로 예상된다. 이 사용자 친화적인 인터페이스는 제미니 아키텍처의 복잡성을 숨기고 다양한 기술 수준을 가진 사람들이 생성형AI 목적으로 제미니 모델을 사용할 수 있게 해줄 것이다.

Gemini AI의 학습 방법

Gemini LLM 모델은 다음과 같은 기법의 조합으로 훈련된 것으로 알려져 있다:

  • 지도 학습: Gemini AI 모듈은 레이블이 지정된 학습 데이터에서 학습한 패턴을 사용하여 새로운 데이터의 출력을 예측하도록 학습되었다.
  • 비지도 학습: Gemini AI 모듈은 레이블이 지정된 예제 없이도 데이터 내에서 패턴, 구조 또는 관계를 자율적으로 발견하도록 학습되었다.
  • 강화 학습: Gemini AI 모듈은 보상을 극대화하고 페널티를 최소화하도록 모듈을 학습시키는 시행착오 과정을 통해 의사 결정 전략을 반복적으로 개선했다.

일부 업계 전문가들은 구글이 클라우드 TPU v5e 칩에서 제미니 모듈을 훈련하기 위해 인간 피드백을 통한 강화 학습(RLHF)에 크게 의존했다고 추측하고 있다. Google에 따르면 TPU는 챗GPT를 훈련하는 데 사용되는 칩보다 5배 더 많은 연산 능력을 가지고 있다.

아직까지 구글은 제미니 AI가 학습한 데이터 세트에 대한 구체적인 정보를 공개하지 않았다. 하지만 구글 엔지니어들이 최근 PaLM 2를 학습시키는 데 사용한 LangChain 프레임워크와 용도가 변경된 데이터를 사용했을 가능성이 높다.

이 데이터는 책과 기사, 코드 저장소, 웹사이트, 동영상 및 팟캐스트 녹취록, 소셜 미디어 게시물, Google 내부 데이터 등 다양한 출처에서 가져온 것이다.

구글 제미니 출시 일정은?

Gemini AI의 출시일과 최종 기능은 아직 알려지지 않았다. 그러나 확인된 것은 Google이 소수의 회사에서 제한된 수의 개발자에게 Gemini를 미리 사용할 수 있는 권한을 부여했다는 것이다.

이는 제미니가 2023년 말까지 출시되어 구글 클라우드 버텍스 AI 서비스에 통합될 준비가 될 수 있음을 시사한다. 모든 것이 순조롭게 진행되면 제미니 AI는 구글 검색, 구글 번역, 구글 어시스턴트 등 인공지능(AI)을 사용하는 모든 구글 엔터프라이즈 및 소비자 클라우드 서비스에도 통합될 것이다.

제미니 AI가 출시되면 유연한 도구 및 API(애플리케이션 프로그래밍 인터페이스) 통합 기능과 함께 확장성이 뛰어나 다양한 실시간 데스크톱 및 모바일 애플리케이션에서 사용하기에 적합할 것이다.

구글 제미니 AI의 이름 유래

일부 언론 매체에서는 제미니가 “일반화된 다중 모드 인텔리전스 네트워크 인터페이스”의 약자라고 보도했지만, 해당 정보는 확인할 수 없었다.

구글 바드에 따르면, 구글 개발자들이 별자리 쌍둥이자리와 이 별자리에 영감을 준 고대 그리스 신화인 피마자자리와 폴룩스의 이름을 따서 통합 LLM 제품군의 이름을 지었을 가능성이 더 높다고 한다.

Margaret Rouse
기술 전문가

본 작가는 수상 경력에 빛나는 기술 작가이자 강사로, 복잡한 기술 주제를 비전문가인 비즈니스 청중에게 설명하는 능력으로 유명합니다. 지난 20년 동안 그녀의 설명은 TechTarget 웹사이트에 게재되었으며, 뉴욕 타임즈, 타임 매거진, USA 투데이, ZDNet, PC 매거진, 디스커버리 매거진의 기사에서 권위자로 인용되었습니다. 마가렛은 IT 및 비즈니스 전문가가 서로의 고도로 전문화된 언어를 사용하는 법을 배우도록 돕는 것을 즐겨합니다. 새로운 정의에 대한 제안이 있거나 기술 설명을 개선할 방법이 있으면 다음과 같이 알려주세요. 이메일, LinkedIn, Twitter.