평균편차와 표준편차 구하는 공식 완벽 정리

평균편차와 표준편차는 데이터의 흩어진 정도를 나타내는 중요한 통계 지표입니다. 두 용어가 비슷하게 들리지만, 계산 방식과 의미하는 바에는 차이가 있습니다. 이 글에서는 평균편차와 표준편차의 정의, 계산 공식, 그리고 실제 활용 예시까지 자세히 알아보겠습니다. 이를 통해 데이터 분석 능력을 한층 더 향상시킬 수 있을 것입니다.

평균편차란 무엇인가?

평균편차(Mean Absolute Deviation, MAD)는 각 데이터 값에서 평균값을 뺀 값들의 절댓값의 평균입니다. 즉, 데이터가 평균으로부터 얼마나 떨어져 있는지를 평균적으로 나타내는 값입니다. 평균편차는 계산이 비교적 간단하고 직관적으로 이해하기 쉽다는 장점이 있습니다.

평균편차 계산 공식

평균편차를 구하는 공식은 다음과 같습니다.

평균 계산: 주어진 데이터 값들의 합을 데이터 개수로 나누어 평균(μ)을 계산합니다. μ = (x₁ + x₂ + ... + xn) / n
편차 계산: 각 데이터 값(xi)에서 평균(μ)을 뺍니다. 편차 = xi - μ
절댓값 편차 계산: 계산된 편차의 절댓값을 구합니다. 절댓값 편차 = |xi - μ|
평균편차 계산: 모든 데이터 값에 대한 절댓값 편차의 합을 데이터 개수로 나눕니다. 평균편차 = (|x₁ - μ| + |x₂ - μ| + ... + |xn - μ|) / n

예를 들어, 데이터 {2, 4, 6, 8}의 평균편차를 구해봅시다. 평균은 (2+4+6+8)/4 = 5입니다. 각 데이터 값의 절댓값 편차는 |2-5|=3, |4-5|=1, |6-5|=1, |8-5|=3입니다. 따라서 평균편차는 (3+1+1+3)/4 = 8/4 = 2입니다.

표준편차란 무엇인가?

표준편차(Standard Deviation, SD)는 데이터 값들이 평균으로부터 얼마나 떨어져 있는지를 나타내는 또 다른 지표입니다. 평균편차와 유사하지만, 편차를 제곱한 후 평균을 구하고 다시 제곱근을 취하는 과정을 거칩니다. 이 과정 때문에 표준편차는 평균편차보다 더 널리 사용되며, 통계학에서 매우 중요한 역할을 합니다.

표준편차 계산 공식

표준편차를 구하는 공식은 다음과 같습니다.

평균 계산: 주어진 데이터 값들의 합을 데이터 개수로 나누어 평균(μ)을 계산합니다. (평균편차와 동일)
편차 계산: 각 데이터 값(xi)에서 평균(μ)을 뺍니다. (평균편차와 동일)
제곱 편차 계산: 계산된 편차를 제곱합니다. 제곱 편차 = (xi - μ)²
분산 계산: 모든 데이터 값에 대한 제곱 편차의 평균을 구합니다. 이를 분산(Variance, σ²)이라고 합니다. 분산 (σ²) = [(x₁ - μ)² + (x₂ - μ)² + ... + (xn - μ)²] / n 모집단이 아닌 표본을 다룰 때는 n 대신 n-1로 나누어 표본분산을 계산합니다. (n-1로 나누는 경우를 ' Bessel's correction'이라고 합니다.)
표준편차 계산: 분산의 제곱근을 구합니다. 표준편차 (σ) = √분산

앞서 예시로 들었던 데이터 {2, 4, 6, 8}의 표준편차를 구해봅시다. 평균은 5입니다. 각 데이터 값의 편차는 -3, -1, 1, 3입니다. 각 편차를 제곱하면 9, 1, 1, 9입니다. 분산은 (9+1+1+9)/4 = 20/4 = 5입니다. 따라서 표준편차는 √5 ≈ 2.236입니다.

평균편차와 표준편차의 차이점

가장 큰 차이점은 계산 방식에 있습니다. 평균편차는 편차의 절댓값을 사용하지만, 표준편차는 편차를 제곱한 후 제곱근을 취합니다. 이로 인해 표준편차는 평균에서 멀리 떨어진 값에 더 큰 가중치를 부여하게 됩니다. 즉, 극단적인 값이 있을 경우 표준편차가 평균편차보다 더 크게 나타나는 경향이 있습니다.

또한, 표준편차는 통계학에서 더 근본적인 개념으로 간주됩니다. 정규분포와 같은 많은 통계적 이론들이 표준편차를 기반으로 합니다. 반면 평균편차는 계산이 간단하고 직관적이어서 특정 상황에서 유용하게 사용될 수 있습니다.

실제 활용 예시

시험 성적 분석: 학생들의 시험 성적 분포를 파악하는 데 사용될 수 있습니다. 표준편차가 크다면 성적 분포가 넓게 퍼져 있음을, 작다면 성적이 평균 근처에 몰려 있음을 의미합니다.
주식 시장 분석: 주식 가격 변동성을 측정하는 데 표준편차가 사용됩니다. 표준편차가 높을수록 주가 변동성이 크다는 것을 의미하며, 이는 투자 위험을 나타낼 수 있습니다.
제품 품질 관리: 생산된 제품의 치수나 무게 등이 얼마나 균일한지를 파악하는 데 사용됩니다. 표준편차가 작을수록 품질이 일정하다고 볼 수 있습니다.

결론

평균편차와 표준편차는 데이터의 산포도를 이해하는 데 필수적인 도구입니다. 평균편차는 직관적인 이해에 용이하며, 표준편차는 통계학적으로 더 중요하고 널리 활용됩니다. 두 지표의 차이점을 명확히 이해하고, 데이터의 특성과 분석 목적에 맞게 적절한 지표를 선택하여 활용하는 것이 중요합니다. 이 글을 통해 평균편차와 표준편차의 계산 방법과 활용법을 익히셨기를 바랍니다.