비지도학습에 대해 정리하기 전에 비지도학습에 해당하는 학습 방법을 2가지 공부해보자.
군집화(clustering)
군집화란 비슷한 것들을 찾아서 그룹을 만드는 것이다.
그럼 이러한 의문이 들 수 있다
"군집화와 분류의 차이점이 뭐야...?"
예를 들어보자.
우리가 책상을 정리한다고 가정해보자.
그럼 책상을 정리하기 전에 여러 그룹으로 나뉠 수 있을 것이다.
필기구 | 책 | ... |
펜 샤프 지우개 연필 샤프심 ... |
국어책 수학책 영어책 고3 관련 고2 관련 단순 독서 ... |
... |
이때 비슷한 것들끼리 모아 적당한 그룹을 만드는 것을 군집화라고 하고,
각각의 물건을 적당한 위치에 두는 것을 분류라고 한다.
즉, 정리하자면 아래와 같다.
어떤 대상들을 구분해서 그룹을 만드는 것은 군집화
어떤 대상, 어떤 그룹에 속하는지 판단하는 것은 분류
이러한 군집화를 사용하는 예시가 바로 아마존 서비스를 예로 들 수 있다.
아마존은 최대 규모의 인터넷 쇼핑몰 업체로 사용하는 사람의 수는 이루 말할 수 없을 정도로 많은 사람들이 사용한다.
이때, 비슷한 지역에 사는 사람들끼리 그룹을 지어 배달하는 것이 효율적이므로 다음과 같이 좌표평면 상에서 표현한 후
동일한 그룹에 위치한 사람들이 주문한 상품을 한꺼번에 처리하는 것이다.
아래 사진을 참고하라.
즉, 군집화 도구에게 1000개의 데이터를 주고 100개의 클러스터를 만들어 달라고 요청했을 때
100개의 군집을 만들어 그룹핑지어주는 것이 가능하다는 뜻이다.
연관 규칙 학습(association rule)
연관 규칙 학습은 위와 동일한 아마존 서비스 예시를 들어 설명하면 이해하기 쉬울 것이다.
예를 들어 사람들이 어떤 물품을 구해했는가에 대한 많은 데이터들을 모았다고 생각해보자.
그럼 그 많은 데이터 중 A라는 제품을 샀을 때 B라는 제품을 살 확률을 구할 수 있을 것이고,
이를 통해 A 제품을 산 사람에게 B 제품을 추천해 줌으로써 더 많은 상품을 판매할 수 있을 것이다.
이렇게 두 물품간의 연관성을 찾아 결론을 도출하는 것이 연관 규칙 학습이다.
즉, 군집화와 연관 규칙 학습의 차이점은 아래와 같다.
관측치를 그룹핑해주는 것은 군집화
관측치의 특성(상관관계)을 그룹핑해주는 것 연관 규칙
마지막으로 비지도학습을 정리하자면 다음과 같다.
비지도학습은 지도학습과 다르게 원인인 독립변수와 결과인 종속변수가 필요없이 그저 많은 데이터만 있으면 된다.
즉, 원인을 통해 결과를 아는 과거 데이터가 있는 상태에서 이를 학습시켜 미래를 예측하는 지도학습과 달리,
비지도학습은 이미 존재하는 데이터를 가지고 데이터의 특성, 특징(일종의 결과)을 얻어 이를 활용하는 것이다.
'AI > ML Basic' 카테고리의 다른 글
보안에 사용되는 AI (0) | 2022.01.29 |
---|---|
머신러닝 EP5. 강화학습 (0) | 2021.12.22 |
머신러닝 EP3. 지도학습 (0) | 2021.12.22 |
머신러닝 EP2. 표와 머신러닝의 카테고리 (0) | 2021.07.14 |
머신러닝 EP1. 교양 (0) | 2021.07.12 |
댓글