문서의 각 단락이 어느 리비전에서 마지막으로 수정되었는지 확인할 수 있습니다. 왼쪽의 정보 칩을 통해 작성자와 수정 시점을 파악하세요.

평균 | |
정의 | 주어진 자료에서 대푯값(representative value)을 찾는 방법들의 일종 |
주요 종류 | 산술 평균 기하 평균 조화 평균 제곱평균제곱근 멱평균 대수 평균 |
산술 평균 | AM = 1/n ∑(i=1 to n) a_i = (a₁ + a₂ + ... + a_n) / n |
관련 분야 | 통계학 수리통계학 |
영문 명칭 | mean, average |
상세 정보 | |
명칭 설명 | 영어 'mean'은 주로 통계/학술적 맥락에서 사용되며, 'average'는 구어적 뉘앙스가 강함. 일반적으로 언급되는 평균은 산술 평균(arithmetic mean)을 의미. |
산술 평균 하위 유형 | 모평균 표본 평균 가중 평균 절사 평균 |
기하 평균 | 산술 평균 ≥ 기하 평균 ≥ 조화 평균 (모든 변량이 양수일 때 성립) |
조화 평균 | 산술 평균 ≥ 기하 평균 ≥ 조화 평균 (모든 변량이 양수일 때 성립) |
기호 | Ø (독일어 'der Durchschnitt'에서 유래) |
이상점 영향 | 이상점(outlier)에 의해 왜곡될 수 있음. |
이상점 보정 방법 | 중간값 정리 응용 절사 평균 윈저화 평균 |

평균은 주어진 자료에서 대푯값을 찾는 방법들의 일종이다. 통계학과 수리통계학을 비롯한 다양한 분야에서 널리 사용되는 기본적인 개념으로, 자료의 중심 경향을 요약하여 나타내는 역할을 한다. 영어로는 주로 mean 또는 average라고 부르며, 학술적 맥락에서는 mean이, 일상적 맥락에서는 average가 더 자주 쓰인다.
평균에는 여러 종류가 존재한다. 가장 일반적으로 알려진 것은 산술 평균으로, 모든 값을 더한 후 값의 개수로 나누어 계산한다. 이 외에도 값을 모두 곱한 후 거듭제곱근을 취하는 기하 평균, 역수의 산술 평균을 다시 역수로 취하는 조화 평균, 제곱의 평균에 제곱근을 적용하는 제곱평균제곱근 등이 있다. 이러한 다양한 평균들은 멱평균이라는 일반화된 개념으로 통합될 수 있으며, 각각은 자료의 특성과 분석 목적에 따라 적절히 활용된다.
평균은 자료를 대표하는 유용한 지표이지만, 극단적으로 크거나 작은 값, 즉 이상점에 민감하게 반응하여 왜곡될 수 있는 한계를 지닌다. 이러한 왜곡을 보정하기 위해 중앙값이나 절사 평균과 같은 다른 대푯값을 함께 고려하는 경우가 많다.

평균을 가리키는 용어는 사용 맥락에 따라 다소 차이가 있다. 영어에서는 통계학 및 학술적 맥락에서는 주로 mean이라는 용어가 사용되며, 이는 대푯값을 구하는 여러 방법 자체를 포괄적으로 지칭하는 의미가 강하다. 반면 average는 일상적인 구어체에서 더 널리 쓰이는 단어이다. 두 용어 모두 특별한 설명 없이 사용될 경우, 가장 일반적인 평균인 산술 평균을 우선적으로 의미하는 경우가 많다.
한국어에서 '평균'이라는 단어 역시 수학적 정의와 일상적 의미가 혼재되어 있다. 일상 용어로서의 평균은 반드시 수학적 평균만을 의미하지 않으며, '중도'나 '대다수'를 뜻하는 관용 표현으로도 기능한다. 수학 및 통계 분야에서는 대푯값을 찾는 방법의 하나로 정의된다.
평균을 나타내는 기호로는 Ø를 종종 사용하는데, 이는 독일어로 평균을 의미하는 'der Durchschnitt'에서 유래하였다. 'Durchschnitt'는 영어로 'cut-through(가로지르다)'로 해석되는 데에서 기인한다.

산술 평균은 주어진 수들을 모두 더한 후 그 개수로 나누어 구하는 가장 일반적인 평균이다. 통계학과 수리통계학에서 대표적인 대푯값 계산 방법 중 하나로, 표본 평균이나 모평균을 구할 때 기본이 된다. 일상생활에서 '평균'이라고 하면 대부분 이 산술 평균을 의미하며, 초등학교 수학 과정에서 가장 먼저 접하는 평균 개념이기도 하다.
산술 평균은 모든 자료값을 동등하게 반영하기 때문에 이상점이나 극단값의 영향을 매우 크게 받는다는 특징이 있다. 예를 들어, 대부분의 값이 비슷한 수준이지만 그중 하나만 매우 크거나 작은 값이 포함되어도 평균값이 크게 왜곡될 수 있다. 이러한 한계를 보완하기 위해 중앙값이나 절사 평균 같은 다른 대푯값을 함께 사용하기도 한다.
산술 평균의 변형으로는 각 자료에 중요도에 따라 다른 비중을 부여하는 가중 평균이 있다. 이는 성적 계산, 여론조사, 경제 지표 산출 등 다양한 분야에서 활용된다. 또한, 표본을 추출해 평균을 내는 표본 평균은 모집단의 특성을 추정하는 추론통계학의 핵심 개념이다.
산술 평균은 계산이 간단하고 직관적으로 이해하기 쉬워 데이터 분석의 첫 단계에서 널리 사용된다. 그러나 자료의 분포 형태나 이상점 유무를 고려하지 않고 맹목적으로 적용할 경우 잘못된 결론을 이끌어낼 수 있으므로 주의가 필요하다.
기하 평균은 주어진 양수들의 곱의 거듭제곱근으로 구하는 대푯값이다. 산술 평균이 값들을 더하는 연산에 기반한다면, 기하 평균은 값들을 곱하는 연산에 기반한다는 점이 특징이다. n개의 양수 a₁, a₂, ..., aₙ에 대한 기하 평균(GM)은 ∛(a₁ × a₂ × ... × aₙ)으로 정의된다.
이 평균은 특히 비율이나 변화율의 평균을 계산할 때 유용하다. 예를 들어, 연간 경제 성장률이나 투자 수익률처럼 시간에 따라 누적되어 곱해지는(복리 효과) 계열 데이터의 평균 변화율을 구할 때 산술 평균 대신 기하 평균을 사용해야 정확한 평균을 얻을 수 있다. 또한 기하학적으로는 주어진 직사각형과 넓이가 같은 정사각형의 한 변의 길이, 또는 주어진 직육면체와 부피가 같은 정육면체의 한 변의 길이를 구하는 것과 동일한 의미를 가진다.
기하 평균을 계산할 때는 모든 자료값이 양수여야 하며, 하나라도 0이 포함되면 결과값이 0이 되어 대푯값으로서의 의미를 잃을 수 있다는 점에 유의해야 한다. 산술 평균, 기하 평균, 조화 평균 사이에는 모든 자료값이 양수일 때 '산술 평균 ≥ 기하 평균 ≥ 조화 평균'이라는 부등식이 성립하며, 이는 산술·기하 평균 부등식으로 일반화된다.
한편, 멱평균이라는 개념에서 매개변수 k를 0에 극한으로 보내면 기하 평균에 수렴한다는 성질이 있어, 기하 평균은 멱평균의 특수한 경우(k=0)로도 이해될 수 있다.
조화 평균은 주어진 양수 값들의 역수를 산술 평균한 후, 그 결과를 다시 역수로 취하여 구하는 대푯값이다. 산술 평균이나 기하 평균과 함께 자주 비교되는 평균의 한 종류로, 특히 각 값의 역수가 의미를 가질 때 유용하게 적용된다. 예를 들어, 속도나 효율처럼 단위 시간당 비율을 나타내는 데이터를 평균낼 때, 단순히 산술 평균을 내면 왜곡된 결과가 나올 수 있어 조화 평균이 적합하다.
조화 평균은 역수의 산술 평균의 역수로 정의되므로, 계산 과정에서 값들 중에 0이 포함되면 정의되지 않는다. 또한 모든 값이 양수여야 의미 있는 결과를 얻을 수 있다. 이 평균은 조화수열의 중앙값을 찾는 데서 유래했으며, 두 수 a와 b의 조화 평균은 2ab/(a+b)의 공식으로 간단히 구할 수 있다.
실제 적용 사례로는 병렬로 연결된 저항의 등가 저항을 계산할 때나, 여러 구간에서의 평균 속도를 구할 때 조화 평균이 사용된다. 대한민국에서는 영화 평점 서비스인 왓챠피디아가 일정 평점 수 이상을 넘어가면 조화 평균을 사용하여 최종 평점을 산출하는 것으로 알려져 있다.
제곱평균제곱근은 주어진 자료의 각 값을 제곱한 후, 그 제곱값들의 산술 평균을 구하고, 다시 그 평균의 제곱근을 취하여 얻는 대푯값이다. 영어로는 root mean square(RMS) 또는 quadratic mean이라고도 불린다. 이는 멱평균의 특수한 경우로, 지수 k가 2일 때에 해당한다. 전기공학에서 교류 전압이나 전류의 실효값을 구할 때, 통계학에서 표준 편차를 계산할 때, 그리고 물리학에서 운동 에너지와 관련된 평균을 다룰 때 널리 활용된다.
제곱평균제곱근은 계산 과정에서 각 값의 제곱을 사용하기 때문에, 산술 평균에 비해 큰 값의 영향력을 상대적으로 더 크게 반영하는 특성이 있다. 예를 들어, -3, 1, 4라는 세 숫자가 있을 때, 산술 평균은 약 0.67이지만, 제곱평균제곱근은 약 3.1로 계산되어 절댓값이 큰 -3과 4의 영향을 더 강하게 받는다. 이 특징 덕분에 신호 처리에서 신호의 평균 전력을 계산하거나, 기계공학에서 진동의 크기를 평가하는 데 유용하게 사용된다.
평균 종류 | 공식 (n=3, 값: a, b, c) |
|---|---|
산술 평균 | (a + b + c) / 3 |
제곱평균제곱근 | √((a² + b² + c²) / 3) |
다른 주요 평균들과의 관계에서, 모든 변량이 양수일 때 일반적으로 산술 평균 ≥ 기하 평균 ≥ 조화 평균의 부등식이 성립하지만, 제곱평균제곱근은 이들보다 항상 크거나 같다. 구체적으로, 산술 평균 이상의 값을 가지며, 이는 코시-슈바르츠 부등식과 연결 지어 이해할 수 있다. 따라서 데이터의 분산이 클수록, 즉 값들이 평균으로부터 멀리 퍼져 있을수록 제곱평균제곱근은 산술 평균보다 현저히 커지게 된다.
멱평균은 산술 평균, 기하 평균, 조화 평균, 제곱평균제곱근을 하나의 공식으로 일반화한 개념이다. 이는 통계학에서 대푯값을 구하는 다양한 방법을 통합하여 이해하는 데 유용한 틀을 제공한다.
멱평균은 매개변수 k의 값에 따라 다양한 평균의 형태를 취한다. 구체적으로, k=1일 때는 산술 평균, k=0으로 극한을 취하면 기하 평균, k=-1일 때는 조화 평균, k=2일 때는 제곱평균제곱근이 된다. 이처럼 하나의 공식이 여러 평균을 포괄하기 때문에 일반화 평균이라고도 불린다. 멱평균의 이러한 특성은 수리통계학과 실해석학에서 평균 개념을 체계적으로 연구하는 데 중요한 기초가 된다.
멱평균 공식은 주어진 자료값들을 k제곱한 후 그 산술 평균을 구하고, 다시 그 결과의 k제곱근을 취하는 방식으로 정의된다. 모든 자료값이 양수라는 전제 하에서, 매개변수 k의 값이 증가함에 따라 멱평균의 값도 단조 증가하는 성질을 가진다. 특히 k를 양의 무한대로 보내면 자료의 최댓값에 수렴하고, 음의 무한대로 보내면 최솟값에 수렴한다.
멱평균의 개념은 표준 편차(편차의 제곱평균제곱근) 계산을 비롯하여, 에너지나 파동의 세기와 관련된 물리량의 평균을 구할 때 등 다양한 분야에서 응용된다. 이를 통해 산술 평균이나 기하 평균과는 다른 관점에서 자료의 중심 경향성을 파악할 수 있다.
대수 평균은 두 양수에 대해서만 정의되는 특수한 형태의 평균이다. 로그 평균이라고도 불리며, 두 수의 차를 두 수의 자연로그 값의 차로 나눈 값으로 계산된다. 이는 다른 평균들과 달리 변수가 오직 두 개일 때만 적용된다는 점이 특징이다.
대수 평균은 주로 공학 분야에서 활용된다. 대표적인 예로는 원통형 벽에서의 열전도 현상 분석, 이중 열 교환기에서의 평균 온도 차 계산, 그리고 원통형 콘덴서의 평균 축전량을 구할 때 사용된다. 다만, 두 수의 크기 차이가 크지 않아 큰 수가 작은 수의 두 배 미만인 경우에는 계산의 편의를 위해 대수 평균 대신 산술 평균을 사용하기도 한다.
두 수의 크기 차이가 커질수록 대수 평균의 값은 상대적으로 작아지는 특성을 보인다. 예를 들어, 100과 10의 대수 평균은 약 39.1로, 산술 평균인 55보다 작다. 그러나 이 값은 항상 기하 평균보다는 크게 유지된다. 같은 예시에서 100과 10의 기하 평균은 약 31.6이다. 이처럼 대수 평균은 두 양수 사이의 관계를 나타내는 하나의 척도로, 특히 비율이나 변화율과 관련된 현상을 분석할 때 유용하다.

산술 평균은 이상점에 매우 민감하다. 이상점은 다른 대부분의 데이터 포인트들과 현저히 다른 값을 가지는 관측치로, 평균값을 실제 데이터의 중심 경향성을 대표하지 못하도록 크게 왜곡시킬 수 있다. 예를 들어, 소득이나 재산 분포에서 극소수의 극단적으로 높은 값이 전체 평균을 급격히 상승시키는 경우가 대표적이다. 이러한 현상은 통계학에서 평균의 한계로 자주 지적되며, 데이터 해석 시 주의를 요한다.
이상점의 영향을 완화하기 위해 여러 보정 방법이 사용된다. 대표적인 방법으로 중앙값이 있으며, 이는 데이터를 크기순으로 나열했을 때 정중앙에 위치하는 값으로 정의된다. 중앙값은 극단값의 영향을 받지 않아 이상점이 존재하는 데이터 집합의 대푯값으로 더 적합할 수 있다. 또한, 절사 평균은 데이터의 상하위 일정 비율(예: 각각 10%)을 제외한 나머지 값들로 산술 평균을 계산하는 방법이다.
다른 보정 기법으로는 윈저화 평균이 있다. 이 방법은 절사 평균과 유사하게 상하위 일정 비율을 정하지만, 해당 값을 제거하는 대신 그 다음 순위의 값(예: 하위 10%는 10번째 백분위수 값으로, 상위 10%는 90번째 백분위수 값으로)으로 대체한 후 평균을 계산한다. 이를 통해 이상점의 영향을 줄이면서도 원본 데이터의 개수 정보를 유지할 수 있다. 이상점 처리는 데이터 분석과 통계학에서 중요한 과정이며, 맥락에 따라 적절한 대푯값과 방법을 선택해야 한다.
평균 드립은 통계학에서 사용되는 평균이라는 개념을 사회적 맥락에서 비유적으로 사용하는 인터넷 밈이다. 주로 특정 집단이나 현상을 설명할 때, 개개인의 다양성이나 극단적인 사례를 무시하고 단순히 평균값만을 제시함으로써 발생하는 오해나 역설을 지적하는 데 사용된다. 이는 평균이 이상점에 의해 쉽게 왜곡될 수 있다는 점과, 평균 하나로는 전체 분포를 이해하기 어렵다는 통계의 함정을 드러내는 경우가 많다.
대표적인 예로 "인류의 평균 고환 개수는 1개다"라는 문장이 있다. 이는 인구의 절반인 남성은 2개, 나머지 절반인 여성은 0개를 가지고 있다는 사실을 근거로 한 계산이다. 이 드립은 수학적으로는 정확한 산술 평균을 내놓지만, 이 평균값이 실제 개인의 경험을 전혀 대표하지 못한다는 점을 비꼬아서 보여준다. 이와 유사하게, 한 기업의 평균 연봉이 매우 높게 나온다 하더라도, 이는 소수의 고액 연봉자(이상점) 때문에 대다수 직원의 실제 소득을 왜곡할 수 있음을 지적하는 데에도 활용된다.
이러한 표현은 단순한 유머를 넘어, 데이터를 해석할 때는 중앙값이나 최빈값 같은 다른 대푯값을 함께 고려해야 하며, 특히 소득 분포나 성적 분포와 같이 불균형이 큰 자료를 다룰 때 주의해야 함을 상기시키는 역할을 한다. 결국 평균 드립은 복잡한 현상을 지나치게 단순화한 수치에 의존하는 태도에 대한 경고이자, 보다 정확한 이해를 위한 비판적 사고를 촉구하는 도구로 기능한다.