점추정의 비교 - 평균제곱오차 증명
- 점추정량의 비교
- 가장 좋은 추정량은 값의 변동 없이 모수와 일치하는 추정량. 그러나 추정량은 확률변수이므로 그 값이 변동하고 모수와 일치하기 어렵다.
- 추정값들의 확률분포가 모수를 중심으로 밀집되어야 할 것이다.
- 밀집성의 정도는 평균제곱오차(mean squared error, MSE)로 측정할 수 있다.
- MSE 공식 유도
통계량 T가 θ의 추정통계량일 때 통계량 T에 대한 평균제곱오차는 다음과 같이 정의할 수 있다.
MSE(T) = E[(T−θ)^2]
왜 위의 식을 증명할 때 다음 식에서 중간항이 사라지는가?
E[T−E(T)]^2+2E[(T−E(T))[E(T)−θ]]+[E(T)−θ]^2
다음 중간 항에서 E[T−E(T)] 부분이 0이기 때문이다.
2E[T−E(T)][E(T)−θ]]
그렇다면 왜 다음 첫번째 항은 사라지지 않는가?
E[T−E(T)]^2
첫번째 항은 엄밀히 표현하면 ‘평균의 제곱’이 아니라 ‘제곱의 평균’이기 때문이다.
E[(T−E(T))^2]
예를 들어 T−E(T)가 −1 또는 +1로 나올 확률이 반반이라면,
E[T−E(T)] = {(-1) + 1}/2 = 0 E[(T−E(T))^2] = {(−1)^2+(1)^2}/2 = 1
즉, 흔들림(변동성)이 존재하기 때문에 E[(T−E(T))^2]의 값은 0이 아니다.
따라서 다음과 같이 표현할 수 있다.
MSE(T) = E[(T−θ)^2] = Var(T) + bias(T)^2
- 이때 θ의 추정량 T의 편의(bias)는 다음과 같다.
bias(T) = E(T) − θ
댓글남기기