점추정량의 비교 - 완비통계량
완비통계량에 대한 다음 두 문제의 풀이를 통해 해당 개념을 이해해본다.
문제 상황 1
- \(X_1, X_2, \dots, X_n\) 은 각각 베르누이분포 B(1, p)를 따름
- 즉, 각각이 0 또는 1만 나오는 독립 확률변수
- \[T(X) = \sum_{i=1}^n X_i\]
- 이 T(X)가 모수 p에 대한 완비통계량임을 보이기
완비통계량이란
- 어떤 수를 계산했을 때 그 수만 보면 더 이상 숨겨진 정보가 없는 상태, 즉, 모든 정보를 다 담고 있는 숫자를 말한다.
- 예컨대, 사과 5개가 있을 때, 누군가 “사과 개수가 몇 개야?”라고 묻는다면 ‘5개’가 완비통계량이다.
- 사과를 어떤 순서로 들고 있었는지, 사과가 크고 작고 어땠는지, 색깔이 약간 달랐는지는 궁금하지 않다.
- 왜냐하면 “사과 개수”라는 정보만으로 알고 싶은 모든 정보가 끝이기 때문이다.
- 이게 바로 완벽한 정보라 해서 “완비”라고 한다.
- 어떤 함수를 통계량에 적용했을 때, 그 함수의 기댓값이 항상 0이면, 그 함수는 사실 항상 0이어야만 한다
- 그럴 때 그 통계량은 “완비(complete)”다
이면 T(X)는 완비통계량이다.
완비 확인 과정
\(T(X) = \sum X_i\)이고,
\(T(X) \sim B(n, p)\)일 때
-
임의의 함수 g(T) 를 생각하고
-
기댓값이 항상 0이라고 가정 \(E[g(T)] = \sum_{x=0}^{n} g(x)\binom{n}{x} p^x (1-p)^{n-x} = 0 \quad \text{(모든 (p)에서)}\)
-
이 식을 정리하면
- 0이 될 수 없는 양수이므로 양변을 \((1-p)^n\) 으로 나누어도 문제가 없다. 따라서,
- 이는 \(p/(1-p)\)에 대한 다항식이므로 이 식이 모든 \(p\in (0,1)\)에서 0, 즉 E[g(T)] = 0이 항상 성립하려면 g가 항상 0인 함수밖에 없다. \(g(0)=g(1)=\dots=g(n)=0\)
결론
- T(X) 는 완비통계량이며, 따라서 베르누이 합 T가 주는 정보는 p에 대한 정보가 더 줄어들 수 없을 정도로 완전하다
문제 상황 2
- \(X_1, X_2, \dots, X_n\) 모두 정규분포 \(N(\mu, 1)\)을 따를 때
- 통계량 \(T(X) = (X_1, X_2, X_3, X_4)\)가 \(\mu\)에 대한 완비통계량이 아니다 를 보여라.
문제 분석
- 통계량 \(T(X) = (X_1, X_2, X_3, X_4)\)라는 건 앞의 4개 데이터만 사용한다는 것이다.
- 사과가 총 10개 있는데 앞의 4개만 보고 전체 개수 정보를 “사과 개수는 4개이다.”라고 한다면 뒤에 더 있을 수 있으므로 정보가 부족하다.
- 즉 앞의 4개 표본만으로는 완벽한 정보(완비) 가 아니다.
반례
\(E[g(T(X))] = 0 \ \text{(모든 }\mu\text{에 대해)}\) 이지만 \(g(T(X)) \neq 0\ \text{(항상은 아님)}\)
- 기댓값은 0인데, 함수 자체는 항상 0이 아닌 예를 찾으면 된다.
기댓값을 계산해보면
\[E[g(T)] = E[X_3] + E[X_4] - E[X_2] - E[X_1] = \mu + \mu - \mu - \mu = 0\]항상 0이 된다
그러나 다음과 같은 데이터에서는
\[X_1=3,\ X_2=5,\ X_3=10,\ X_4=2\] \[g = 10 + 2 - 5 - 3 = 4 \neq 0\]-
항상 0은 아니다.
-
즉. 어떤 함수 g(T(X))가 \(\mu\)에 대해 기대값이 0이 아니게 만들 수 있다.
-
예를 들어 g(T(X))가 다음과 같다면
- 이 함수는 어떤 경우 기댓값이 0이고, 어떤 경우 기댓값이 0이 아니다.
결론
- 일부 데이터만 사용하면 전체 평균 \(\mu\) 정보를 모두 담을 수 없으므로 T(X)는 완비통계량이 아니다.
댓글남기기