1. 확률분포란
수학의 정석에 나오는 확률변수와 확률분포 정의를 가지고오자.
X=x_i |
x_1 |
x_2 |
... |
x_n |
P(X=x_i) |
p_1 |
p_2 |
... |
p_n |
변수 X가 취할 수 있는 값이 x_1, x_2, ... , x_n이고, X가 이들 값을 취할 확률 p_1, p_2, ... , p_n이 정해져 있을 때, 이 변수 X를 확률변수라 하고, 확률변수 X가 취하는 값 x_i와 확률 p_i의 대응관계를 확률변수 X의 확률분포라 한다.
이 때 이 대응관계는 P(X=x_i)=p_i와 같은 식으로 나타낼 수도 있고, 위와 같은 표(이 표를 확률분포표라 한다)로 나타낼 수도 있으며, 때로는 그래프로 나타낼 수도 있다.
어려운 말이 잔뜩인 것 같지만 그 실상은 단순하다.
예를 들어 두 개의 동전을 동시에 던진다고 해보자.(동전당 앞면확률은 1/2) 보통의 확률구하기 연습문제라면
1) 두 동전 모두 뒷면이 나올 확류른?
2) 하나는 앞면, 하나는 뒷면이 나올 확률은?
과 같이 문제를 제시할 것이다. 그러면 푸는 사람은 스스럼 없이
1) 각 동전이 뒷면이 나올 확률은 모두 1/2이다. 두 사건은 독립적이므로 서로 곱하면 1/2*1/2=1/4가 된다.
2) 동전이 두 개이므로 하나를 '가', 다른 하나를 '나'라고 하자. 문제의 요구사항에서 (가,나)=(앞,뒤) 또는 (뒤,앞)인 두 상황을 생각해야함을 알 수 있다. 각 경우 모두 1/4의 확률을 갖고 있는데, 서로 배타적이므로 이 둘을 더해 1/4+1/4=1/2라는 답을 얻는다.
와 같이 문제를 풀 것이다.
좀 더 호기심이 많은 사람은 다음과 같이 생각할 것이다.
'두 동전을 던졌을 때 (1)모두 뒷면, (2)앞면&뒤면 만 물었는데 (3)모두 앞면의 경우도 있구나, 이 때 확률은 얼마지?'
그리고는 1/4라는 답을 얻어낼 것이다.
좀 더 계량적인 사람은 다음과 같이 생각할 것이다.
'지금 전체 가능성을 다 생객해보았는데 이를 '앞면이 나온 동전의 개수'로 정리할 수 있을 것 같아. 말이 기니까 앞면동전개수를 X라고 쓰자. (1)모두 뒷면은 X=0, (2)앞면&뒷면은 X=1, (3)모두 앞면은 X=2.
각 경우마다 확률을 구했는데, 이를 보기좋게 표로 써야겠군.'
그리하여 다음과 같은 표를 그릴 것이다.
X |
0 |
1 |
2 |
P(X) |
1/4 |
1/2 |
1/4 |
그리고는 스스로 뿌듯해 할 것이다.
이것이 확률분표의 개념이다. X라고 하는 값에 대해 가능성을 다 조사에 표로 적은 것이 불과하다. 모든 가능성을 체크하였으므로 P(X)에 있는 모든 확률값을 더하면 1이 될 것이다.
2. 확률분포의 평균
확률이란 전체 사건중 특정 사건의 비율이다. 위 동전의 예시에서 전체 사건은 (앞,앞), (앞,뒤), (뒤,앞), (뒤,뒤)로 총 4이다. 고로 이 4란 숫자를 확률에 곱해주면 특정 사건의 경우의 수를 얻을 수 있다.
X |
0 |
1 |
2 |
경우의 수 |
1 |
2 |
1 |
이 경우의 수를 토대로 X의 평균을 구해보자. X는 앞면이 나온 동전의 개수이니까 우리가 구할 평균은 '두 동전을 던졌을 때 평균앞면수'가 될 것이다.
평균의 정의해 의해 m=1이라는 결론을 얻었다. 동전을 두 개 던지고, 동전당 앞면 확률이 1/2니까 매우 합당해보인다.
그런데 위 식은 다음과 같이 펼쳐 쓸 수 있다.
즉, 확률분포표에서 다음과 같이 계산하면 X의 평균이 나오게 된다.
여기서 E(X)의 E는 Expectation이다. 고로 평균 대신 기대값이라는 말을 써도 좋다.
3. 확률분포의 평균의 성질
확률분포의 평균은 몇가지 성질을 가지고 있다.
(1) E(X)=m이면 E(aX+b)=am+b
(2) X와 Y가 서로 독립일 때, E(X+Y)=E(X)+E(Y)
각 성질 모두 sigma식을 이용하면 금방 증명되지만 의미론적으로 혹은 직관적으로 받아들이는 편이 훨씬 낫다.
(1) 10점 만점 시험의 평균이 8점이라고 하자. 이를 100점만점으로 환산하려면 점수를 10배해주면 되는데, 그러면 자연히 평균도 10배가 되어 80점이 될것이다. 여기에 추가로 보너스 50점을 더하면 150점 만점이 되는데 평균도 정확히 50점이 더해져 80+50=130점이 될 것이다.
(2) 국어, 수학이 모두 100점만점 시험이었다고 하자. 추가로, 독립적으로 시험점수가 나왔다고 가정하자.(즉 서로 점수에 영향을 주지 않음) 그러면 국어수학 총 합계는 200점 만점이 되고 이 합산점수의 평균은 자연스럽게 각 시험의 평균점수의 합이 된다.
증명은 생략한다.
'수학 정리들' 카테고리의 다른 글
오일러 직선 (0) | 2020.10.04 |
---|---|
실베스터의 삼각형 문제 (0) | 2020.09.27 |
조합적 증명(Combinatorial proof) (2) | 2017.10.08 |
메네라우스의 정리와 체바의 정리 (5) | 2013.12.23 |
비둘기집 원리(Pigeonhole Principle) (5) | 2013.11.10 |