이번 시간에 우리는 표가 무엇인지, 어떤 단어들을 사용하여 표현하는지 알아볼 것이다.
당신이 개발자라면 당연히 다음 용어에 큰 친숙함을 느낄 것이다. 그러나 산업계에서 사용하는 용어는 아니라고 한다.
아래에 용어 정리 한 번 하고 계속 이야길 이어 나가겠다!
우리가 알고 있는 단어 | 산업계에서 표현하는 법 |
표 | 데이터셋(dataset) |
행 | 1. 개체(instance) 2. 관측치(observed value) 3. 기록(record) 4. 사례(example) 5. 경우(case) |
열 | 1. 특성(feature) 2. 속성(attribute) 3. 변수(variable) 4. field |
위와 같은 용어를 사용하기로 약속아닌 약속이 되어 있으니 이제 위의 단어들에 익숙해지도록 하자!
그리고 추가적으로 아래 그림을 보자.
오른쪽의 그림처럼 첫 번째 행에 변수를 나열하고
그 아래 행부터 관측치를 적는 것이 표를 작성하는 암묵적인 기준이다.
독립변수와 종속변수라는 단어를 정리해보자.
독립변수는 원인과 유사한 의미를 지니고, 종속변수는 결과와 유사한 의미를 지닌다.
아래의 그림을 보자.
다음과 같은 표가 있을 때 이제 우리가 생각해봐야 할 점은 다음과 같다.
"이 표에서 서로 상관있는 특성은 무엇일까?"
즉, 상관관계를 지니는 변수를 찾아야 하는 것이다.
단, 이때 주의 해야할 점은 상관관계를 찾더라도 이것이 무.조.건 인과관계를 만족하는 것은
아닐 수 있다는 것이다.
머신러닝에는 어떤 종류의 기술들이 있을까?
아래 그림을 참고하도록 하자! 물론 그 기술엔 무수히 많은 종류가 존재하지만 3가지 정도로 소개하겠다.
그럼 지도학습, 비지도학습, 강화학습의 의미가 무엇인지 한문장으로 간단하게 정리하고
일단 넘어가도록 하자.
지도학습 | 정답이 있는 문제를 해결하는 것 |
비지도학습 | 무언가를 보고 통찰력을 통해 새로운 의미나 관계를 밝히는 것 |
강화학습 | 더 좋은 보상을 받기 위해 수련하는 것 |
위의 3가지 기술은 앞으로 공부해 나갈 것이므로 일단 맛만 보고 다음 글을 보도록 하자.
'AI > ML Basic' 카테고리의 다른 글
보안에 사용되는 AI (0) | 2022.01.29 |
---|---|
머신러닝 EP5. 강화학습 (0) | 2021.12.22 |
머신러닝 EP4. 비지도학습 (0) | 2021.12.22 |
머신러닝 EP3. 지도학습 (0) | 2021.12.22 |
머신러닝 EP1. 교양 (0) | 2021.07.12 |
댓글