David의 개발 이야기!

표본분산과 불편분산의 차이에 대해 알아보자! 본문

통계공부

표본분산과 불편분산의 차이에 대해 알아보자!

david.kim2028 2023. 9. 30. 23:34
반응형

1. 표본분산과 불편분산의 차이점

 

 

표본분산과 불편 분산의 정의는 위와 같으며, 식은 위와 같이 정의된다.

 

2. 불편분산이 필요한 이유

 

위 그림은, 분산이 과소평가되는 이유를 보여주는데, 예시를 들어보면,

 

낚시꾼이 낚시를 했는데, 잡은 물고기가 총 7마리 이며, 7마리의 몸 길이는, 

[1,2,3,4,5,6,7]이라고 하자.

여기서 모평균은, 4가 된다.

 

이제 이를 팔기위해 3마리를 다른 장바구니에 임의로 옮겼더니(표본)

[1,2,3]이라고 하자.

여기서 표본평균은 2가 된다.

 

분산은, "데이터와 평균간의 거리"임으로 모평균간의 거리를 계산해야한다.

하지만, 모평균을 모르기 때문에, 표본 평균과 거리를 계산하게 되며, 이는 분산이 과소평가 되는 결과를 내게된다. 

이러한 문제를 보완하기 위해, 불편분산이, 표본분산보다, 조금 더 크게 되도록 보정하는 것이다. (n-1로 나누는 이유)

 

3. 수식을 통한 설명

3-1 표본분산과 모분산의 오차

- 표본분산과 모분산 사이의 오차를 구해보고자한다. 

 

반응형
Comments