-
머신러닝 이해하기 - 랜덤변수,확률분포AI&ML 2022. 11. 18. 21:35반응형
최근에 머신러닝에 대한 관심이 많아지면서, 나 같은 일반인이 겁없이ㅋㅋ 머신러닝에 도전하다가
벽에 부딪히곤하는데 그것이 바로 확률과 통계와 같은 수학의 개념을 알아야하기 때문인것 같다.
이 말을 듣는 순간 바로 포기하는 사람이 있을지도 모르겠다.
나도 그 많은 수포자중에 하나였으니^^
하지만, 약간의 희망이 있을지도 모르겠다. 확률의 모든 개념을 100%이해하지 못하더라도,
머신러닝과 관련된 개념들만이라도 조금씩 살펴보면 기본적인 머신러닝을 이해할수 있을거라 생각한다.
아래는 가장 기초적인 개념이다.
💡 랜덤변수,확률변수
- 랜덤변수 : 어떤 사건에 대해서 값이 달라지는 변수. 여기서 변수는 함수를 나타낸다.
- 확률변수 : 어떤 사건에 대한 변수를 상수처럼 나타내는것
F(A) = 0.1 A는 주사위 1이 나오는 사건이라고 함.
F(1) = 0.1 A라는 사건을 1이라는 상수처럼 나타내는것을 확률변수라고함.
💡 확률분포(probability distribution)은 확률변수가 특정한 값을 가질 확률을 나타내는 함수를 의미한다.
확률분포는 두가지가 있음.
- 이산확률분포
이산확률분포(discrete probability distribution)는 이산확률변수의 확률분포를 의미한다.
여기서 이산확률변수는 확률변수가 가질 수 있는 값의 개수를 셀 수 있다는 의미입니다.
예를 들어, 확률변수 X를 주사위를 던져서 나오는 눈의 개수라고 하면 X는 1,2,3,4,5,6 여섯가지 경우를 가질 수 있다.
그리고 이 경우 확률변수가 가질 수 있는 값이 6개로 ‘셀 수 있는’ 경우 이므로 이는 이산확률변수에 해당한다고 볼수 있다.
- 연속확률분포
연속확률분포(continuous probability distribution)은 연속확률변수의 확률분포를 의미한다.
여기서 연속확률변수는 확률변수가 가질 수 있는 값의 개수를 셀 수 없다는 의미이다.
예를 들어, 확률변수 X를 중학교 1학년 학생의 평균 키라고 했을 때, X는 키이므로 실수값을 가지며 이는 ‘셀 수 없는’ 경우에 해당한다.
따라서 이 경우 확률변수 X는 연속확률변수에 해당한다고 할 수 있다.
반응형'AI&ML' 카테고리의 다른 글
챗GPT(Chat GPT)를 이용한 SQL쿼리 작성! (0) 2023.02.01 챗GPT(Chat GPT)를 이용한 블로그 만들기 (0) 2023.01.29 ChatGPT는 지금 휴식중!! (0) 2023.01.14 IoT + AML 활용한 Predictive maintenance(예측유지관리) (0) 2022.12.29 머신러닝이란? (0) 2022.04.12