먼지뭉치 Data Analysis

[확률&통계] 확률의 공리(표본공간, 사건) 본문

수학/확률&통계

[확률&통계] 확률의 공리(표본공간, 사건)

데이터분석과 개발 2023. 6. 4. 22:48

* 공부한 것을 정리한 글이므로 틀린 내용이 있을 수 있습니다.

* 더 좋은 방법 또는 틀린부분이 발견될 시 계속 수정하며 업데이트 할 예정입니다.

 

안녕하세요 오늘은 확률의 기초 표본공간과 사건에 대해 정리해보려 합니다.

최근 모델들을 보면 정확한 예측값을 도출하는 결정론적(Deterministic)한 방식에서 시계열의 확률분포를 추정하여 해당분포에서 예측값을 도출하는 방식을 많이 사용하고 있습니다.

이를 위해 데이터분포에 대한 포스팅을 하기 전 확률 공리에 대한 기본개념을 정리해보려고 합니다! 

표본공간의 개념에 대해 알고 나면 확률변수,확률분포를 이해할 때 좋은 것 같습니다.

 

*표본공간(S)

표본공간은 어떤 실험에서 나올 수 있는 모든 사건의 집합을 의미합니다.

예를 들어 동전을 한번 던지면 앞면(H), 뒷면(T)이 나올 수 있겠죠??

이걸 집합으로 표현하면 표본공간 S = {앞면(H), 뒷면(T) } 으로 표현할 수 있습니다.

 

깊은 이해를 위해 다른 예시들을 쭉 써보겠습니다

동전을 두번 던지는 실험의 표본공간 S = {(H,H), (H,T), (T,H), (T,T)}

신생아의 성별을 추측하는 실험의 표본공간 S = {남자 , 여자 }

어떤 장비의 수명을 예측하는 실험의 표본공간 S = {x: 0<=x < ∞ } 으로 음이 아닌 실수가 됩니다.

 

* 사건(E)

사건이란 표본공간의 부분집합입니다. 쉽게 풀어서 쓰면 일어날 수 있는 모든 사건에서 특정사건이라고 생각하면 됩니다!

마찬가지로 예를 들어보겠습니다.

동전 두번을 던지는 실험에서 첫번째 동전이 앞면이 나오는 사건은 (앞면,앞면), (앞면,뒷면) 이겠죠?

그럼 사건 E = {(H,H), (H,T)} 로 표현할 수 있습니다. 

 

* 확률의 공리

확률에서 당연하다고 여겼던 것이지만 사실 공리로 정의하고 있던 내용입니다. 하나의 약속을 한 것이죠!

 

1. 0 ≤ P(E) ≤ 1 : 모든 사건의 확률은 0에서 1 사이

2. P(S) = 1 : 모든 사건의 확률 합은 1

3. P(∪Ei) = ∑ P(Ei) : 모든 사건의 확률은 각 사건의 확률의 합과 같다

 

이 3가지의 공리를 가지고 우리가 그전에 했던 합집합, 교집합, 여집합을 계산했었네요. 

 

* 균등 확률 결과를 갖는 표본공간

동전을 던지면 앞면이 나올 확률이 50%라고 가정하지만 사실 정확하지 않죠!

하지만 많은 실험에서 표본공간에 속하는 모든 결과가 균등하게 발생한다고 가정하는 게 합리적이고 자연스럽기 때문에

P({1}) = P({2}) = P({3}) = ... P({N}) 이 되고

공리 2와 공리 3으로부터 임의의 사건의 확률은 1/N 이 됩니다!

 

지금까지 알면 좋은 확률의 기본 개념을 정리해보았습니다. 데이터분포에 관한 포스팅을 앞으로 이어나가겠습니다~

감사합니다!

 

참고:

확률의 입문

'수학 > 확률&통계' 카테고리의 다른 글

[확률&통계] 확률변수  (0) 2023.06.04