• 점추정량의 비교
    • 가장 좋은 추정량은 값의 변동 없이 모수와 일치하는 추정량. 그러나 추정량은 확률변수이므로 그 값이 변동하고 모수와 일치하기 어렵다.
    • 추정값들의 확률분포가 모수를 중심으로 밀집되어야 할 것이다.
    • 밀집성의 정도는 평균제곱오차(mean squared error, MSE)로 측정할 수 있다.
    • MSE 공식 유도

통계량 T가 θ의 추정통계량일 때 통계량 T에 대한 평균제곱오차는 다음과 같이 정의할 수 있다.

MSE(T) = E[(T−θ)^2]

왜 위의 식을 증명할 때 다음 식에서 중간항이 사라지는가?

E[T−E(T)]^2+2E[(T−E(T))[E(T)−θ]]+[E(T)−θ]^2

다음 중간 항에서 E[T−E(T)] 부분이 0이기 때문이다.

2E[T−E(T)][E(T)−θ]]

그렇다면 왜 다음 첫번째 항은 사라지지 않는가?

E[T−E(T)]^2

첫번째 항은 엄밀히 표현하면 ‘평균의 제곱’이 아니라 ‘제곱의 평균’이기 때문이다.

E[(T−E(T))^2]

예를 들어 T−E(T)가 −1 또는 +1로 나올 확률이 반반이라면,

E[T−E(T)] = {(-1) + 1}/2 = 0 E[(T−E(T))^2] = {(−1)^2+(1)^2}/2 = 1

즉, 흔들림(변동성)이 존재하기 때문에 E[(T−E(T))^2]의 값은 0이 아니다.

따라서 다음과 같이 표현할 수 있다.

MSE(T) = E[(T−θ)^2] = Var(T) + bias(T)^2

  • 이때 θ의 추정량 T의 편의(bias)는 다음과 같다.

    bias(T) = E(T) − θ

참고자료

댓글남기기