평균편차와 표준편차는 데이터의 흩어진 정도를 나타내는 중요한 통계 지표입니다. 두 용어가 비슷하게 들리지만, 계산 방식과 의미하는 바에는 차이가 있습니다. 이 글에서는 평균편차와 표준편차의 정의, 계산 공식, 그리고 실제 활용 예시까지 자세히 알아보겠습니다. 이를 통해 데이터 분석 능력을 한층 더 향상시킬 수 있을 것입니다.
평균편차란 무엇인가?
평균편차(Mean Absolute Deviation, MAD)는 각 데이터 값에서 평균값을 뺀 값들의 절댓값의 평균입니다. 즉, 데이터가 평균으로부터 얼마나 떨어져 있는지를 평균적으로 나타내는 값입니다. 평균편차는 계산이 비교적 간단하고 직관적으로 이해하기 쉽다는 장점이 있습니다.
평균편차 계산 공식
평균편차를 구하는 공식은 다음과 같습니다.
- 평균 계산: 주어진 데이터 값들의 합을 데이터 개수로 나누어 평균(μ)을 계산합니다. μ = (x₁ + x₂ + ... + xn) / n
- 편차 계산: 각 데이터 값(xi)에서 평균(μ)을 뺍니다. 편차 = xi - μ
- 절댓값 편차 계산: 계산된 편차의 절댓값을 구합니다. 절댓값 편차 = |xi - μ|
- 평균편차 계산: 모든 데이터 값에 대한 절댓값 편차의 합을 데이터 개수로 나눕니다. 평균편차 = (|x₁ - μ| + |x₂ - μ| + ... + |xn - μ|) / n
예를 들어, 데이터 {2, 4, 6, 8}의 평균편차를 구해봅시다. 평균은 (2+4+6+8)/4 = 5입니다. 각 데이터 값의 절댓값 편차는 |2-5|=3, |4-5|=1, |6-5|=1, |8-5|=3입니다. 따라서 평균편차는 (3+1+1+3)/4 = 8/4 = 2입니다.
표준편차란 무엇인가?
표준편차(Standard Deviation, SD)는 데이터 값들이 평균으로부터 얼마나 떨어져 있는지를 나타내는 또 다른 지표입니다. 평균편차와 유사하지만, 편차를 제곱한 후 평균을 구하고 다시 제곱근을 취하는 과정을 거칩니다. 이 과정 때문에 표준편차는 평균편차보다 더 널리 사용되며, 통계학에서 매우 중요한 역할을 합니다.
표준편차 계산 공식
표준편차를 구하는 공식은 다음과 같습니다.
- 평균 계산: 주어진 데이터 값들의 합을 데이터 개수로 나누어 평균(μ)을 계산합니다. (평균편차와 동일)
- 편차 계산: 각 데이터 값(xi)에서 평균(μ)을 뺍니다. (평균편차와 동일)
- 제곱 편차 계산: 계산된 편차를 제곱합니다. 제곱 편차 = (xi - μ)²
- 분산 계산: 모든 데이터 값에 대한 제곱 편차의 평균을 구합니다. 이를 분산(Variance, σ²)이라고 합니다. 분산 (σ²) = [(x₁ - μ)² + (x₂ - μ)² + ... + (xn - μ)²] / n 모집단이 아닌 표본을 다룰 때는 n 대신 n-1로 나누어 표본분산을 계산합니다. (n-1로 나누는 경우를 ' Bessel's correction'이라고 합니다.)
- 표준편차 계산: 분산의 제곱근을 구합니다. 표준편차 (σ) = √분산
앞서 예시로 들었던 데이터 {2, 4, 6, 8}의 표준편차를 구해봅시다. 평균은 5입니다. 각 데이터 값의 편차는 -3, -1, 1, 3입니다. 각 편차를 제곱하면 9, 1, 1, 9입니다. 분산은 (9+1+1+9)/4 = 20/4 = 5입니다. 따라서 표준편차는 √5 ≈ 2.236입니다.