본문 바로가기
무모한 도전-주식 인공지능 만들기/통계학 공부

확률분포의 균일분포

by 인터넷떠돌이 2020. 2. 25.
반응형

안녕하세요?

 

이번 포스팅에서는 다른게 아니라 오랫만에 통계학 도감이라는 책을 보고서 포스팅할 만한 분량을 겨우 확보했기에 한번 그 내용을 포스팅 해 보고자 합니다. 여기서 먼저 언급해야 하는 것은 확률에 대한 이야기 입니다. 예를 들어서 주사위를 던지면 일반적으로 6개의 눈중에 하나가 나오는데, 만약 주사위를 던져서 1의 눈이 나왔다면 이 나왔는 1이라는 눈이 '사상'이라고 하는 실험이나 관측등에 행위에 의한 결과라고 할 수 있습니다.

 

그럼 확률이 무엇이냐 하면, 바로 이 사상이 일어나기 얼마나 쉬운지를 수치화한 것 입니다. 그리고 지난번 포스티에서 다루었는 변수라는 개념에서 실행해 봐야만 비로서 결과를 알 수 있는 이 변수를 '확률변수'라고 합니다.

 

대표적으로 룰렛을 돌리게 되는데, 룰렛을 실제로 돌리기 전에 그 결과를 알 수는 없고, 돌리고 나서야 결과를 확인할 수 있기 때문에, 룰렛에 있는 모든 칸들은 확률변수라고 할 수 있습니다. 그런데 이 확률변수도 위 스크린샷과 같이 2가지 종류로 나뉘게 됩니다. 우선 산활률분포의 경우에는, 위 그림에서 묘사가 된 것과 같이, 어느색에 멈추게 될지 경계가 뚜렷한 - 경우의 수가 한정된 - 유한하기 때문에 이렇게 불립니다.

 

그런데 연속활률변수는 무슨 차이가 있느냐 하면, 룰렛을 잘 보시면, 경계면이 뚜렷하지 않아서 경우의 수가 무한하다는 것을 알 수 있습니다. 즉 활률변수가 나올 수 있는 값의 수가 무한하기 때문에 이렇게 연속활률변수라고 불리게 되는 것 입니다.

 

 

그럼 확률분포란 무엇이냐고 하실 것인데, 일단 확률변수가 취하는 값과, 그 값이 실현되는 확률의 관계를 나타낸 것인데, 일단 이 확률분포 안에는 균일분포라는 것이 포함되어 있다는 것을 알 수 있습니다. 균일분포라는 것은 각각의 사상이 일어나는 확률이 모두 같은 분포입니다. 그리고 균일분포에 있어서는 아래의 그림과 같이 2가지 종류로 나뉠 수 있습니다.

 

균일분포에는 위에서 언급한 이산확률변수가 분포된 분포를 보여주는 이산균일분포라는 것이 있으며, 연속확률변수가 분보된 것을 보여주는 것은 연속균일분포라는 것을 알 수 있습니다. 그리고 이 둘의 평균과 분산을 구하는 공식도 약간의 차이가 있습니다.

 

일단 이산균일분포에서 먼저 모든 변수를 저장한 집합을 X라고 치면, 여기서 나오는 값은 n까지 유한하게 정해져 있습니다. 그래서 평균과 분산을 구하는 공식도 위 그림에서 묘사되고 있는 것과 같습니다.

 

마지막으로 연속균일분퍼는 취할 수 있는 값이 무한해서 집합인 X를 어떻게 정의하느냐 하는 것이 남아 있는데, 위 스크린샷과 같이 범위를 정해서 구할 수 있습니다. 다만 이렇게 한느 이유도 역시 연속확률변수가 가지고 있는 특징때문에 이렇게 된 것으로 생각이 됩니다.

반응형