ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 머신러닝 이해하기 - 랜덤변수,확률분포
    AI&ML 2022. 11. 18. 21:35
    반응형

    최근에 머신러닝에 대한 관심이 많아지면서, 나 같은 일반인이 겁없이ㅋㅋ 머신러닝에 도전하다가

    벽에 부딪히곤하는데 그것이 바로 확률과 통계와 같은 수학의 개념을 알아야하기 때문인것 같다.

     

    이 말을 듣는 순간 바로 포기하는 사람이 있을지도 모르겠다. 

    나도 그 많은 수포자중에 하나였으니^^

     

    하지만, 약간의 희망이 있을지도 모르겠다. 확률의 모든 개념을 100%이해하지 못하더라도,

    머신러닝과 관련된 개념들만이라도 조금씩 살펴보면 기본적인 머신러닝을 이해할수 있을거라 생각한다.

     

    아래는 가장 기초적인 개념이다.

     

    💡 랜덤변수,확률변수

    • 랜덤변수 : 어떤 사건에 대해서 값이 달라지는 변수. 여기서 변수는 함수를 나타낸다.
    • 확률변수 : 어떤 사건에 대한 변수를 상수처럼 나타내는것

    F(A) = 0.1 A는 주사위 1이 나오는 사건이라고 함.

    F(1) = 0.1 A라는 사건을 1이라는 상수처럼 나타내는것을 확률변수라고함.

     

    💡 확률분포(probability distribution)은 확률변수가 특정한 값을 가질 확률을 나타내는 함수를 의미한다.

     

    확률분포는 두가지가 있음.

    • 이산확률분포

    이산확률분포(discrete probability distribution)는 이산확률변수의 확률분포를 의미한다.

    여기서 이산확률변수는 확률변수가 가질 수 있는 값의 개수를 셀 수 있다는 의미입니다.

    예를 들어, 확률변수 X를 주사위를 던져서 나오는 눈의 개수라고 하면 X는 1,2,3,4,5,6 여섯가지 경우를 가질 수 있다.

    그리고 이 경우 확률변수가 가질 수 있는 값이 6개로 ‘셀 수 있는’ 경우 이므로 이는 이산확률변수에 해당한다고 볼수 있다.

     

    • 연속확률분포

    연속확률분포(continuous probability distribution)은 연속확률변수의 확률분포를 의미한다.

    여기서 연속확률변수는 확률변수가 가질 수 있는 값의 개수를 셀 수 없다는 의미이다.

    예를 들어, 확률변수 X를 중학교 1학년 학생의 평균 키라고 했을 때, X는 키이므로 실수값을 가지며 이는 ‘셀 수 없는’ 경우에 해당한다.

    따라서 이 경우 확률변수 X는 연속확률변수에 해당한다고 할 수 있다.

    반응형

    댓글

Designed by Tistory.