알렉사란?
알렉사(Alexa)는 아마존(Amazon)에서 개발한 클라우드 기반 음성 비서로, 사용자가 자연어로 아마존 에코(Amazon Echo) 장치에 질문하거나 명령할 수 있게 해준다. 이는 아마존 및 다양한 타사 공급업체에서 제공하는 1억 개 이상의 디바이스에서 사용가능하다.
오늘날 이 어시스턴트는 스피커와 헤드폰부터 컴퓨터, TV, 차량, 가정과 사무실의 스마트 장치에 이르기까지 다양한 전자제품에 사용되고 있으며, 사용자가 원격으로 장치와 상호 작용할 수 있는 기능을 제공한다.
알렉사는 세계에서 가장 널리 사용되는 가상 비서 중 하나로, 2022년 기준 7,160만 명의 사용자를 보유하고 있으며, 8,150만 명이 사용하는 구글 어시스턴트(Google Assistant)와 7,760만 명이 사용하는 시리(Siri)의 뒤를 잇고 있다.
알렉사는 어떻게 작동하나?
아마존 계정과 지원 디바이스를 보유한 사용자는 장치를 인터넷에 연결할 수 있다. 연결 및 구성이 완료되면, 장치는 사용자가 깨우기 단어(wake word)를 말할 때까지 대기 상태가 된다.
아마존 에코 장치에서 사용자는 알렉사, 아마존, 컴퓨터, 에코, 지기(Ziggy) 등 여러 옵션 중에서 깨우기 단어를 선택할 수 있다.
가상 어시스턴트가 듣기 모드로 전환되면, 사용자의 질문이나 명령과 같은 추가 자연어 입력을 기다린다.
사용자가 질문을 하거나 명령을 내리면 알렉사는 자연어 처리(NLP)를 사용하여 사용자의 음성을 처리하고, 음성을 텍스트로 변환하여 사용자의 요청을 이해하기 위해 알렉사 보이스 서비스(자동 음성 인식(ASR) 및 자연어 이해(NLU) 솔루션)에 오디오를 보낸다.
그런 다음, 질문에 대한 답변을 하거나 요청된 콘텐츠나 동작을 제공하는 형태로 사용자에게 응답한다.
작업을 완료할 수 없는 경우 “죄송합니다, 그렇게 할 수 없습니다”와 같은 메시지를 사용자에게 전달한다.
알렉사 명령어 예시
알렉사는 사용자에게 오늘이 무슨 요일인지, 날씨가 어떤지 알려주는 것부터 Netflix 및 YouTube와 같은 앱 실행, 영화 재생, 로컬 환경의 스마트 장치와 상호 작용하는 것까지 광범위한 음성 명령에 응답할 수 있다.
지원되는 명령어의 수는 집이나 사무실 환경에서 접근할 수 있는 앱과 디바이스에 따라 다르다.
명령어의 종류가 너무 다양하여 모두 나열하기는 어렵지만, 다음은 가상 비서의 핵심 기능을 설명하기 위한 몇 가지 주요 예시다. 여기에는 깨우기 단어인 “알렉사”가 포함된다.
- 알렉사, 오늘이 무슨 요일이야?
- 알렉사, 오늘 날씨 어때?
- 알렉사, [시간]에 알람 설정해줘.
- 알렉사, [이름]에게 전화해줘.
- 알렉사, 오늘 날짜 알려줘.
- 알렉사, [아티스트/노래/앨범] 재생해줘.
- 알렉사, [제목/영화/비디오] 틀어줘.
- 알렉사, [앱] 열어줘.
- 알렉사, [아마존 상품] 주문해줘.
- 알렉사, [Uber]에서 차량 서비스를 요청해줘.
- 알렉사, 조명을 25% 어둡게 해줘.
- 알렉사, 현관문 잠가줘.
- 알렉사, [장치]를 켜/꺼줘.
- 알렉사, 농담 하나 해줘.
알렉사 LLM
2023년 9월, 아마존은 알렉사 대규모 언어 모델(LLM)로 구동되는 새로운 알렉사 음성 어시스턴트를 출시한다고 발표했다. 아마존은 생성형 AI를 사용하여 사용자의 자연어 요청의 맥락을 더 잘 추론하고 알렉사의 전반적인 대화 기능을 업그레이드하는 것을 목표로 하고 있다.
개발자들은 LLM을 통해 콘텐츠와 API를 통합하여 알렉사 지원 장치에서 추가적인 대화 기능을 만들 수 있다.
아마존은 또한 발화 및 긴 형식의 대화에 대해 학습된, 수십억 개의 매개변수를 가진 새로운 ASR(자동 음성 인식) 모델로 ASR 시스템을 업그레이드한다고 발표했다.
사용자 개인정보 보호에 대한 논란
과거에 아마존은 알렉사가 사용자의 음성을 녹음하고 항상 사용자의 활동을 엿듣는다는 비판을 받아왔다.
아마존은 성능을 개선하고 사용자의 목소리와 선호도에 더 잘 적응하기 위해 사용자 데이터를 수집한다고 주장하지만, 연구자들은 사용자의 스마트 스피커에서 수집한 데이터가 광고를 타겟팅하는 데 사용되었다는 사실을 발견했다.
이에 따라 아마존은 사용자에게 자연어 입력을 통해 음성 녹음을 삭제할 수 있는 기능을 제공하고 사용자가 음성 녹음을 저장할 기간을 선택할 수 있는 기능을 제공한다.