본문 바로가기
AI/ML Basic

머신러닝 EP2. 표와 머신러닝의 카테고리

by reindeer002 2021. 7. 14.
728x90

이번 시간에 우리는 표가 무엇인지, 어떤 단어들을 사용하여 표현하는지 알아볼 것이다.

개발자라면 당연히 알아야하는 용어...

당신이 개발자라면 당연히 다음 용어에 큰 친숙함을 느낄 것이다. 그러나 산업계에서 사용하는 용어는 아니라고 한다.

아래에 용어 정리 한 번 하고 계속 이야길 이어 나가겠다!

우리가 알고 있는 단어 산업계에서 표현하는 법
데이터셋(dataset)
1. 개체(instance)
2. 관측치(observed value)
3. 기록(record)
4. 사례(example)
5. 경우(case)
1. 특성(feature)
2. 속성(attribute)
3. 변수(variable)
4. field

위와 같은 용어를 사용하기로 약속아닌 약속이 되어 있으니 이제 위의 단어들에 익숙해지도록 하자!

그리고 추가적으로 아래 그림을 보자.

오른쪽의 그림처럼 첫 번째 행에 변수를 나열하고
그 아래 행부터 관측치를 적는 것이 표를 작성하는 암묵적인 기준이다.


독립변수종속변수라는 단어를 정리해보자.

독립변수는 원인과 유사한 의미를 지니고, 종속변수는 결과와 유사한 의미를 지닌다.
아래의 그림을 보자.

다음과 같은 표가 있을 때 이제 우리가 생각해봐야 할 점은 다음과 같다.

"이 표에서 서로 상관있는 특성은 무엇일까?"

즉, 상관관계를 지니는 변수를 찾아야 하는 것이다.

단, 이때 주의 해야할 점은 상관관계를 찾더라도 이것이 무.조.건 인과관계를 만족하는 것은
아닐 수 있다는 것이다.

이를 유의하라!


머신러닝에는 어떤 종류의 기술들이 있을까?
아래 그림을 참고하도록 하자! 물론 그 기술엔 무수히 많은 종류가 존재하지만 3가지 정도로 소개하겠다.

머신 러닝의 기술과 종류

그럼 지도학습, 비지도학습, 강화학습의 의미가 무엇인지 한문장으로 간단하게 정리하고
일단 넘어가도록 하자.

지도학습 정답이 있는 문제를 해결하는 것
비지도학습 무언가를 보고 통찰력을 통해 새로운 의미나 관계를 밝히는 것
강화학습 더 좋은 보상을 받기 위해 수련하는 것

위의 3가지 기술은 앞으로 공부해 나갈 것이므로 일단 맛만 보고 다음 글을 보도록 하자.

728x90

'AI > ML Basic' 카테고리의 다른 글

보안에 사용되는 AI  (0) 2022.01.29
머신러닝 EP5. 강화학습  (0) 2021.12.22
머신러닝 EP4. 비지도학습  (0) 2021.12.22
머신러닝 EP3. 지도학습  (0) 2021.12.22
머신러닝 EP1. 교양  (0) 2021.07.12

댓글