비지도학습이란?
비지도 학습 (Unsupervised Learning)은 알고리즘에 대상에 대한 사전 정보를 제공하지 않고도 알고리즘이 유형 및 무형 대상을 모두 분류할 수 있도록 하는 데 사용되는 방법이다.
알고리즘이 분류해야 하는 대상은 고객의 구매 습관, 박테리아의 행동 패턴, 해커의 공격 등 다양하다. 비지도 학습의 기본 개념은 알고리즘이 대량의 다양한 데이터에 노출되어 데이터를 통해 학습하고 추론할 수 있도록 하는 것이다. 하지만 먼저 알고리즘이 데이터를 통해 학습하도록 프로그래밍해야 한다.
테코피디아가 설명하는 비지도 학습
컴퓨터 시스템은 대량의 정형 및 비정형 데이터를 이해하고 인사이트를 제공해야 한다. 실제로 컴퓨터 시스템이 일정 기간 동안 수신할 수 있는 모든 유형의 데이터에 대한 사전 정보를 제공하는 것은 불가능할 수 있다. 이러한 점을 염두에 두면 컴퓨터 시스템에 새로운 유형의 데이터에 대한 지속적인 정보가 필요한 경우 지도 학습이 적합하지 않을 수 있다.
예를 들어 금융 시스템이나 은행 서버에 대한 해킹공격은 그 성격과 패턴이 자주 바뀌는 경향이 있으며, 이러한 경우 시스템이 공격 데이터를 빠르게 학습하여 향후 공격 유형을 추론하고 선제 조치를 제안할 수 있도록 해야 하므로 비지도 학습이 더 적합할 수 있다.