log2 값, 정확히 무엇일까요?
컴퓨터 과학, 정보 이론, 통계 등 다양한 분야에서 자주 등장하는 'log2 값'은 밑이 2인 로그 값을 의미합니다. 간단히 말해, 어떤 수를 2의 거듭제곱으로 표현했을 때 그 지수가 바로 log2 값입니다. 예를 들어, log2 8의 값은 3입니다. 왜냐하면 8은 2를 세 번 곱한 값(2^3)이기 때문입니다. 이처럼 log2 값은 어떤 정보가 몇 비트(bit)의 데이터로 표현될 수 있는지를 나타내는 척도로 활용될 수 있어 '정보량'과도 깊은 관련이 있습니다.
log2 값의 기본 원리 이해하기
로그의 기본 정의를 떠올려봅시다. 'log_b a = c'는 'b^c = a'와 같은 의미입니다. 여기서 밑(b)이 2인 경우가 바로 log2입니다. 따라서 log2 a = c는 2^c = a를 의미합니다. 이 원리를 이용하면 다양한 log2 값을 쉽게 계산할 수 있습니다. 예를 들어, log2 16 = 4 (2^4 = 16), log2 32 = 5 (2^5 = 32) 입니다. 만약 log2 값이 정수가 아닌 경우, 예를 들어 log2 10은 2와 3 사이의 값이며, 약 3.32입니다. 이는 10을 2의 거듭제곱으로 정확히 나타낼 수 없기 때문입니다.
왜 log2 값을 사용할까요? 컴퓨터 과학과의 밀접한 관계
컴퓨터는 모든 정보를 0과 1, 즉 이진수로 처리합니다. 이진수는 두 가지 상태(0 또는 1)만을 가지므로, 하나의 비트(bit)는 두 가지 정보를 표현할 수 있습니다. 두 개의 비트로는 4가지(00, 01, 10, 11), 세 개의 비트로는 8가지(000부터 111까지)의 정보를 표현할 수 있습니다. 즉, n개의 비트로는 2^n가지의 정보를 표현할 수 있습니다. 여기서 log2 값은 'n 비트로 표현할 수 있는 정보의 개수'를 역으로 계산하는 데 사용됩니다. 예를 들어, 1024가지의 서로 다른 정보를 표현하기 위해서는 몇 비트가 필요할까요? log2 1024 = 10 이므로, 10비트가 필요합니다. 이처럼 log2는 컴퓨터 시스템에서 데이터의 크기, 저장 공간, 전송 속도 등을 계산하는 데 필수적인 역할을 합니다.
정보량과 엔트로피: log2 값의 핵심 활용
정보 이론에서 '정보량'은 어떤 사건이 발생했을 때 얻게 되는 놀라움의 정도를 의미하며, 이는 확률의 역수에 비례합니다. 특정 사건의 확률이 p일 때, 그 사건이 주는 정보량은 -log2(p)로 정의됩니다. 확률이 낮을수록(더 놀라운 사건일수록) 정보량은 커집니다. 예를 들어, 동전을 던져 앞면이 나올 확률은 1/2입니다. 이때 앞면이 나왔을 때의 정보량은 -log2(1/2) = -(-1) = 1 비트입니다. 반면, 주사위를 던져 특정 숫자가 나올 확률은 1/6입니다. 이때의 정보량은 -log2(1/6) ≈ 2.58 비트입니다. '엔트로피'는 어떤 확률 분포에서 얻을 수 있는 정보량의 기댓값을 의미하며, 시스템의 불확실성을 나타내는 척도입니다. 엔트로피 계산에도 log2 값이 핵심적으로 사용됩니다.