수학 95% 및 99% 신뢰구간 공식 완벽 정리
통계학에서 신뢰구간은 특정 확률로 모수(모평균, 모분산 등 모집단의 특성을 나타내는 값)가 존재할 것으로 예상되는 범위를 의미합니다. 특히, 95% 신뢰구간과 99% 신뢰구간은 가장 흔하게 사용되는 신뢰수준입니다. 이 두 신뢰구간을 구하는 공식은 표본의 크기, 표본 평균, 표준편차, 그리고 해당 신뢰수준에 해당하는 z-값 또는 t-값을 이용하여 계산됩니다. 본 글에서는 95%와 99% 신뢰구간을 구하는 공식과 그 의미를 자세히 설명하겠습니다.
신뢰구간의 기본 공식
신뢰구간을 구하는 기본적인 공식은 다음과 같습니다. 표본 평균을 $\bar{x}$라고 할 때,
신뢰구간 = 표본 평균 ± (신뢰수준에 따른 임계값) × (표준 오차)
여기서 표준 오차(Standard Error, SE)는 표본의 표준편차(s)를 표본 크기($n$)의 제곱근으로 나눈 값입니다. 즉, $SE = s / \sqrt{n}$ 입니다.
임계값은 우리가 설정한 신뢰수준에 따라 달라지며, 주로 정규분포표나 t-분포표를 이용하여 찾습니다. 모집단의 표준편차($\sigma$)를 알고 있고 표본 크기가 충분히 크다면(일반적으로 n>30) z-값을 사용하고, 모집단의 표준편차를 모르거나 표본 크기가 작다면 t-값을 사용합니다.
95% 신뢰구간 공식
95% 신뢰구간은 우리가 추출한 표본을 이용하여 계산했을 때, 100번 중 95번은 모수가 해당 구간 안에 포함될 것이라고 기대하는 범위입니다. 모집단의 표준편차($\sigma$)를 알거나 표본 크기가 충분히 클 때 (n>30) z-값을 사용한 95% 신뢰구간 공식은 다음과 같습니다.
$95% CI = \bar{x} \pm z_{\alpha/2} \times \frac{s}{\sqrt{n}}$
여기서 $z_{\alpha/2}$는 양측 검정에서 유의수준 $\alpha$에 해당하는 z-값입니다. 95% 신뢰수준의 경우, $\alpha = 1 - 0.95 = 0.05$이므로, $\alpha/2 = 0.025$가 됩니다. 표준 정규분포표에서 0.025에 해당하는 z-값은 약 1.96입니다. 따라서 95% 신뢰구간 공식은 다음과 같이 쓸 수 있습니다.
$95% CI = \bar{x} \pm 1.96 \times \frac{s}{\sqrt{n}}$
만약 모집단의 표준편차를 모르고 표본 크기가 작다면 (n<30), t-분포를 사용하며, 이때의 공식은 다음과 같습니다.
$95% CI = \bar{x} \pm t_{\alpha/2, n-1} \times \frac{s}{\sqrt{n}}$
여기서 $t_{\alpha/2, n-1}$은 유의수준 $\alpha$와 자유도 $n-1$에 해당하는 t-값입니다. 자유도는 표본 크기에서 1을 뺀 값입니다.
99% 신뢰구간 공식
99% 신뢰구간은 95% 신뢰구간보다 더 높은 신뢰수준을 나타냅니다. 즉, 100번 중 99번은 모수가 해당 구간 안에 포함될 것이라고 기대하는 범위입니다. 이 때문에 99% 신뢰구간은 95% 신뢰구간보다 더 넓은 범위를 가지게 됩니다. 모집단의 표준편차($\sigma$)를 알거나 표본 크기가 충분히 클 때 (n>30) z-값을 사용한 99% 신뢰구간 공식은 다음과 같습니다.
$99% CI = \bar{x} \pm z_{\alpha/2} \times \frac{s}{\sqrt{n}}$
99% 신뢰수준의 경우, $\alpha = 1 - 0.99 = 0.01$이므로, $\alpha/2 = 0.005$가 됩니다. 표준 정규분포표에서 0.005에 해당하는 z-값은 약 2.576입니다. 따라서 99% 신뢰구간 공식은 다음과 같이 쓸 수 있습니다.
$99% CI = \bar{x} \pm 2.576 \times \frac{s}{\sqrt{n}}$
마찬가지로 모집단의 표준편차를 모르고 표본 크기가 작다면, t-분포를 사용하며, 이때의 공식은 다음과 같습니다.
$99% CI = \bar{x} \pm t_{\alpha/2, n-1} \times \frac{s}{\sqrt{n}}$
여기서 $t_{\alpha/2, n-1}$은 유의수준 $\alpha$와 자유도 $n-1$에 해당하는 t-값입니다.
95%와 99% 신뢰구간 비교 및 활용
95% 신뢰구간과 99% 신뢰구간의 가장 큰 차이점은 신뢰수준의 높이와 그에 따른 구간의 너비입니다. 99% 신뢰구간은 95% 신뢰구간보다 더 높은 신뢰도를 제공하지만, 그만큼 구간의 범위가 더 넓어집니다. 반대로 95% 신뢰구간은 99% 신뢰구간보다 구간이 좁아져 더 정확한 추정이 가능하지만, 신뢰도는 상대적으로 낮습니다.
어떤 신뢰구간을 선택할지는 연구의 목적과 중요도에 따라 달라집니다. 만약 잘못된 판단으로 인한 위험이 매우 크다면 99%와 같이 더 높은 신뢰수준을 선택하는 것이 합리적일 수 있습니다. 반면에, 더 정밀한 추정치가 필요하다면 95% 신뢰구간을 고려해 볼 수 있습니다. 실제 데이터 분석에서는 이 두 가지 신뢰구간을 모두 계산하여 비교하고, 연구 결과의 의미를 해석하는 경우가 많습니다.