요약

  • 기댓값은 상황이 반복될 때 예상되는 값으로 샘플 평균이 아닌 모집단 확률분포의 평균을 의미함
  • Mean은 무한한 샘플이 아닌 유한한 샘플들에 대한 평균을 뜻하며 주로 수학이나 통계학에서 사용됨
  • Average는 일상적인 대화에서 사용되며 다양한 평균의 종류 중에서 산술 평균을 지칭하는 용어임
  • 기하 평균은 넓이나 부피 그리고 경제성장률과 같이 합이 아닌 곱으로 계산되는 값들의 평균을 구할 때 사용됨

1. 기댓값

기댓값(expectation)어떤 상황이 반복해서 일어날 때 평균으로 예상되는 기댓값을 의미한다. 단, 기댓값은 샘플의 평균이 아니라 모집단이 따르는 확률분포의 평균을 뜻한다. 즉, 유한 개의 샘플들을 통해 모집단을 유추 가능하다고 할 때, 이 샘플들을 모아서 평균을 낸 거시 기댓값이다.

예를 들어, 주사위의 각 눈이 나온 횟수를 이라고 하자. 이 때 샘플 크기를 무한히 늘리면 각 눈이 나올 확률인 1/6 가 된다. 따라서, 샘플들을 모아서 평균을 낸 기댓값()은 아래와 같다. 모든 샘플들에 대한 평균이다. (헷갈리지말자! 각 샘플들의 평균값인 샘플 평균에 관한 내용은 중심극한정리)


2. 평균

평균은 mean과 average로 표현된다.

mean일 때 평균은 샘플에 집중한다. 기댓값은 샘플들을 무한히 늘렸을 때 모든 샘플들에 대한 평균이라면, mean은 유한한 샘플(내가 가진 샘플)에 대한 평균이다. 즉, 샘플들의 평균을 의미하고 샘플 평균(sample mean)이라고도 한다.

average도 평균을 의미한다. 단, mean이 내포한 평균은 산술 평균(arithmetric mean)과 기하 평균(geometric mean)과 같이 다양한 종류의 평균(mean)을 의미한다. 이중에서 average는 산술 평균을 의미하며, 앞서 설명한 mean과 동일하게 샘플에 대한 평균을 의미한다.

맥락적으로 average는 일상 대화에서 사용되고, mean은 수학이나 통계학과 같은 분야에서 사용된다.

기하 평균이란?

기하 평균(geometric mean, G)은 양수 값을 모두 곱한 값의 제곱근으로 주로 넓이, 부피 등 곱으로 계산되는 값들의 평균을 구할 때 사용된다.

예를 들어 2020년 경제성장률이 3%, 2021년 경제성장률이 12%이라고 할 때, 연평균 경제성장률은?

단순히 (3+12)/2 = 7.5(%) 라고 계산하면 안된다. 왜냐하면, 2021년의 경제성장률은 3% 성장한 2020년 기준 성장률을 의미한다.

각 1년 단위로 계산된 2년 간의 평균성장률은 총 2년동안의 경제성장률과 같아야한다. 2019년 경제성장률을 라고 할때, 2년간의 경제성장률(%)은 이다. 이제 2년간의 경제성장률(%)을 연평균으로 나눠줘야한다.

위와 같이이처럼 곱으로 계산된 값이기 때문에 일반적인 산술평균이 아닌 기하평균을 사용한다. 따라서, 연평균 경제성장률(%)은 이다.


참고자료