본문 바로가기
수학/응용통계학

[응용통계학] 4장. 확률변수와 확률분포

by judy@ 2021. 3. 28.

응용통계학 4장 확률변수와 확률분포는 다음 목차로 구성

 

4.1 확률변수

4.2 이산형 확률분포

4.3 연속형 확률분포

4.4 결합확률분포

4.5 주변확률분포

4.6 두 확률변수의 독립성

4.7 확률변수의 기대값

4.8 확률변수의 분산

4.9 공분산과 상관계수

4.10 기대값, 분산의 성질

 


4.1 확률변수

확률 변수 개념이 필요한 이유를 예로 들어 이해해보자.

 

1) 표본공간의 각각의 표본점을 하나의 실수로 대응시키면, 표본공간의 표현의 임의성을 배제할 수 있음.

 

1개의 동전을 1회 던지는 실험에서 앞면이 나타나는 경우를 표본점 H, 뒷면이 나타나는 경우를 표본점 T로 표기하면,

표본공간 S = {H, T} 로 표기할 수 있음.

그러나 표현에 따라 H와 T를 각각 앞, 뒤로 표기 가능하며, 이런 경우 S = {앞, 뒤}로도 표기 가능

 

즉, 같은 표본 공간 S는 표현하는 사람에 따라 다르게 표현될 수 있음.

 

수학적 정의 시에는 이러한 표현상의 임의성을 배제할 필요가 있으며, 

가장 확실한 방법은 '함수를 사용하여 표본공간의 표본점을 숫자로 변환'하는 것

 

X를 앞면에 대응하는 표본점에서 '0'의 값을 가지고, 뒷면에 대응하는 표본점에서 '1'의 값을 가지는 함수로 정의하면,

앞면이 나오는 사상을 정의할 때 X=0인 사상으로 단순하고 유일하게 표현 가능.

앞면이 나올 확률 정의 시에도 P(X=0) = 1/2 이라 할 수 있음.

 

2) 또한, 실험이나 조사에서 대상이 되는 중요한 부분에 분석의 초점을 맞출 수 있음

 

예를 들어, 1개의 동전을 2회 던지는 실험에서 '앞면이 1회 이상 나타날 확률'에 관심이 있다면,

기호를 사용하는 경우 S = {HT, HH, TH, TT} 중 P({HT, HH, TH}) = 3/4 으로 나타낼 수 있다.

 

그러나 확률 변수 X를 각 표본점에서 앞면이 출현하는 회수로 정의하면,

P(X>= 1) = 3/4 로 표기할 수 있어, 분석이나 논의가 간단하고 명확해진다.

 

확률변수(Random Variable)

표본공간 S에서 각각의 표본점을 실수로 변환시키는 함수
확률변수의 값(Value of Random Variable)

각각의 표본점이 변환된 실수

- 확률변수는 일반적으로 X, Y와 같이 대문자를 사용하여 표기

- 확률변수의 값은 일반적으로 x, y와 같이 소문자로 표기

 

예시) X=x는, X가 x를 가지는 사상으로 해석됨

 

확률변수로 표현된 사상(Event Defined by Random Variable)

표본공간 S 위에 정의된 사상 B에 대하여
확률변수 X가 B의 표본점을 집합 A로 변환시키면 사상 B를 X∈A로 표기하고
확률변수 X로 표현된 사상 혹은 간단히 사상이라고 표현

** 집합 A가 하나의 값 a를 가지면 사상 X∈A를 간단히 X=a라 표현

    집합 A가 연속된 구간 [a, b]이면 X∈A를 a <= X <= b라 표현

 

- 확률 변수의 분류

이산형 확률변수(Discrete Random Variable)

하나씩 셀 수 있는 값을 가지는 확률변수
연속형 확률변수(Continuous Random Variable)

하나씩 셀 수 없는 값을 가지는 확률변수

 


4.2 이산형 확률분포

이산형 확률 변수 X가 값 x를 가지면, X로 표현된 사상 X=x의 확률 P(X=x)를 계산할 수 있음

따라서 모든 x에서 P(X=x)를 정의할 수 있으며, 이 대응 관계를 확률변수 X의 이산형 확률 분포(discrete probability distribution)라 함

이산형 확률분포는 하나의 함수 관계이므로 표나 그림으로 정의하는 것이 편리하며, 그 예가 확률분포표와 확률히스토그램

 

이산형 확률밀도함수 정의/ 성질

반응형