문서의 각 단락이 어느 리비전에서 마지막으로 수정되었는지 확인할 수 있습니다. 왼쪽의 정보 칩을 통해 작성자와 수정 시점을 파악하세요.

절대평가 | |
정의 | 학생의 성취 수준을 상대평가와 달리 미리 정해진 절대적인 기준에 따라 평가하는 방식 |
분류 | 교육 평가 방법 |
대표적 예시 | |
평가 기준 | 사전에 명확히 설정된 객관적 기준 (예: 90점 이상 A등급) |
주요 특징 | 학생 간 서열화가 아닌 목표 도달 여부에 초점 |
도입 배경 | 과열 경쟁 완화 및 학생의 자기주도적 학습 유도 |
상세 정보 | |
상대평가와의 차이 | 상대평가는 집단 내 상대적 서열에 따라 평가하며, 절대평가는 절대적 기준 충족도에 따라 평가 |
장점 | 과도한 경쟁 완화, 명확한 학습 목표 제시, 개별 학생의 진정한 성취도 파악 가능 |
단점 | 기준 설정의 난해함, 평가 기준이 너무 쉬우면 동기 부여 저하, 너무 어려우면 좌절감 유발 가능 |
국내 도입 현황 | 2014년 이후 일부 고등학교 내신 평가에 부분 도입 (학교 자율 선택) |
적용 과목 | |
평가 등급 | A, B, C, D, E 등 (기준 점수대에 따라 부여) |
관련 정책 | |
논란 | |
해외 사례 | 미국, 영국, 핀란드 등에서 다양한 형태로 활용 (표준화 시험 등) |

절대평가는 평가 대상의 성취 수준이나 능력을 미리 정해진 절대적인 기준에 따라 평가하는 방식을 말한다. 이는 평가 대상들 간의 상대적인 서열을 매기는 상대평가와 구분되는 개념이다. 절대평가에서는 모든 평가 대상이 기준을 충족할 경우 모두 높은 성적을 받을 수 있으며, 반대로 기준에 미치지 못하면 모두 낮은 성적을 받을 수 있다.
절대평가는 교육 평가에서 널리 논의되며 적용된다. 학습자가 교육 목표나 성취 기준을 어느 정도 달성했는지를 판단하는 데 초점을 맞춘다. 따라서 평가의 목적은 학습의 질을 관리하고 개선하며, 학습자 개개인의 성장을 돕는 데 있다.
이 평가 방식은 대학수학능력시험의 일부 영역, 많은 고등학교의 내신 평가, 그리고 다양한 자격증 시험 등에서 활용된다. 절대평가의 도입은 과도한 경쟁 완화와 교육의 정상화를 꾀하는 사회적 요구에서 비롯된 경우가 많다.
절대평가의 운영은 명확한 평가 기준과 성취 수준을 사전에 정의하는 것이 핵심이다. 이 기준에 따라 학습자의 수행 결과가 '달성' 또는 '미달성', 혹은 세분화된 등급으로 판정된다.

절대평가는 학습자의 성취 수준을 미리 설정된 절대적인 기준에 따라 평가하는 방식을 말한다. 평가의 초점은 학습자가 특정 교육 목표나 성취 기준을 얼마나 달성했는지에 맞춰진다. 따라서 평가 결과는 다른 학습자들의 성취와 무관하게, 오직 개인이 설정된 기준에 도달했는지 여부와 그 정도에 따라 결정된다. 이 방식의 핵심 원리는 모든 학습자가 충분한 노력을 기울이면 우수한 성적을 받을 수 있다는 가능성에 기반을 둔다.
이것은 학습자들 간의 서열을 매기는 상대평가와 근본적으로 다르다. 상대평가는 집단 내에서의 상대적 위치에 따라 성적이 부여되므로, 평가 결과는 경쟁 집단의 전반적인 수준에 크게 영향을 받는다. 반면 절대평가는 개별 학습자의 절대적 능력이나 지식 습득량을 측정하려는 의도를 가진다. 다음은 두 평가 방식의 주요 차이점을 보여준다.
비교 요소 | 절대평가 | 상대평가 |
|---|---|---|
평가 기준 | 미리 설정된 절대적 기준(성취 목표) | 다른 응시자들 간의 상대적 서열 |
결과의 의미 | 기준에 대한 개인의 달성도 | 집단 내에서의 상대적 위치 |
성적 분포 | 기준 달성도에 따라 자유로움, 모두 높은 점수를 받을 수 있음 | 일반적으로 정해진 비율(예: 상위 10%)에 따라 강제됨 |
주요 목적 | 교육 목표의 달성도 진단 | 제한된 자원(입학 정원 등)을 배분하기 위한 선발 |
절대평가의 구현은 명확하고 타당한 평가 기준을 설정하는 것에서 시작한다. 이 기준은 '90점 이상은 A등급', '주어진 실험 절차를 정확히 3가지 이상 설명할 수 있다'와 같이 구체적이고 측정 가능한 형태로 정의된다. 따라서 평가는 학습자가 무엇을 알고 할 수 있는지에 대한 직접적인 증거를 수집하고, 그 증거를 사전에 합의된 기준과 비교하는 과정이다.
절대평가는 학습자의 성취 수준이 미리 설정된 절대적인 기준에 도달했는지를 평가하는 방식을 의미한다. 평가의 초점은 다른 학습자와의 상대적 위치가 아니라, 학습 목표나 교육 목표라는 객관적 기준 자체에 맞춰진다. 따라서 평가 결과는 학습자가 기준을 충족했는지 여부, 즉 '합격/불합격'이나 특정 '등급'으로 나타난다.
이 방식의 기본 원리는 모든 학습자가 충분한 학습 기회를 가진다면 설정된 기준에 도달할 수 있다는 전제에 기반한다. 평가의 목적은 학습자 간 서열을 매기는 것이 아니라, 각 학습자의 학습 성과를 진단하고 피드백을 제공하여 교육의 질을 개선하는 데 있다. 대표적인 예로 운전면허 필기시험이나 다양한 자격증 시험을 들 수 있다.
절대평가의 핵심은 명확하고 타당한 평가 기준의 설정에 있다. 이 기준은 일반적으로 교육과정에서 제시하는 학습 목표나 성취 기준을 바탕으로 구성된다. 기준은 평가가 이루어지기 전에 모든 이해관계자에게 공개되어야 하며, 평가 결과의 해석은 이 공개된 기준에 의해서만 이루어진다.
평가 방식 | 비교 대상 | 평가 목적 | 결과 해석 |
|---|---|---|---|
절대평가 | 미리 설정된 절대적 기준 | 학습 목표 도달도 확인 | 기준 대비 성취 수준 |
다른 학습자 집단 | 학습자 간 서열화 | 집단 내 상대적 위치 |
이러한 원리 때문에 절대평가는 교육 현장에서 형성평가나 총괄평가 모두에 활용될 수 있다. 학습 과정 중 이해도를 점검하거나 최종적으로 교육 목표를 달성했는지를 판단하는 데 적합한 방식이다.
절대평가와 상대평가의 핵심적 차이는 평가의 기준이 학습자의 절대적 성취도에 있는지, 아니면 집단 내 상대적 위치에 있는지에 있다.
절대평가는 미리 설정된 객관적 기준이나 목표 성취도에 따라 학습자의 성과를 평가한다. 예를 들어, 90점 이상은 A등급, 80점 이상은 B등급과 같이 기준 점수나 숙달 수준이 정해져 있으며, 모든 학생이 그 기준을 충족하면 전원 높은 등급을 받을 수 있다. 반면 상대평가는 특정 집단(예: 한 학급, 한 학년) 내에서 학습자의 상대적 서열에 따라 평가한다. 상위 일정 비율의 학생만 높은 등급을 받을 수 있도록 정규분포 곡선을 적용하는 것이 일반적이다.
이러한 기준의 차이는 평가의 목적과 결과에 직접적인 영향을 미친다. 절대평가는 교육과정에서 제시한 목표 달성 여부에 초점을 맞추어, 개별 학습자의 성장과 숙달도를 진단하는 데 유리하다. 모든 학생이 기준을 넘을 수 있도록 교육하는 것을 지향한다. 상대평가는 제한된 등급 비율을 통해 집단 내에서의 우열을 가리는 데 주력하며, 경쟁을 유발하고 변별력을 확보하는 것을 주요 목적으로 한다.
다음 표는 두 평가 방식의 주요 차이점을 요약한 것이다.
비교 항목 | 절대평가 | 상대평가 |
|---|---|---|
평가 기준 | 미리 정해진 절대적 기준(점수, 숙달도) | 집단 내 상대적 위치(서열) |
평가 목적 | 목표 달성도 확인, 개인 성장 진단 | 집단 내 순위 결정, 변별 |
등급 결정 | 기준 충족 여부에 따라 개별적으로 결정 | 정해진 비율에 따라 상대적으로 결정 |
교육적 효과 | 자기 목표 달성에 집중, 협력 학습 유도 | 동료와의 경쟁 유발, 서열화 |
대표적 적용 | 과거 수능 표준점수, 일부 경쟁적 입시 |

절대평가의 도입은 기존 상대평가 체제의 여러 문제점에 대한 반성과 새로운 교육 패러다임의 요구에서 비롯되었다. 20세기 후반까지 한국 교육 현장에서는 경쟁을 유발하고 서열화를 강화하는 상대평가가 주류를 이루었다. 이로 인해 과도한 사교육 열풍, 입시 위주 교육의 심화, 학생들의 심리적 스트레스 증가 등 다양한 부작용이 사회 문제로 대두되었다. 교육계와 사회 전반에서는 점수와 등수에 매몰된 경쟁 중심의 평가가 창의성과 자기 주도적 학습 능력을 저해한다는 비판이 지속적으로 제기되었다.
이러한 배경에서, 학습자의 절대적 성취 수준에 주목하고 개별 발전을 중시하는 교육평가 방식에 대한 요구가 높아졌다. 1990년대 말부터 본격화된 한국의 제7차 교육과정 개정은 '학습자 중심 교육'과 '다양성 존중'을 강조하며 절대평가 도입의 이론적 토대를 마련했다. 특히 2000년대 초반에는 대학수학능력시험의 등급제 도입 논의와 함께 공교육 정상화를 위한 정책적 노력의 일환으로 절대평가에 대한 관심이 구체화되었다.
절대평가 도입의 직접적인 정책적 동인은 고교 평준화 정책의 연장선상에서 학교 간, 지역 간 서열화를 완화하고, 내신 평가의 공정성과 신뢰성을 제고하려는 목적이었다. 또한, PISA와 같은 국제 학업성취도 평가에서 드러난 한국 학생들의 낮은 정의적 영역(흥미, 자신감 등) 점수를 높이기 위해 평가 문화 자체를 경쟁에서 협력으로, 타인과의 비교에서 자기 성장으로 전환해야 한다는 인식이 확산되었다. 이는 단순한 평가 방법의 변경을 넘어 교육의 목적과 방향성을 재정립하려는 시도로 이해된다.

절대평가의 가장 큰 장점은 학습자 개개인의 성취 수준에 초점을 맞춘다는 점이다. 학생들은 정해진 기준에 도달하기 위해 노력하며, 다른 학생들과의 경쟁에서 벗어나 자신의 학습 목표를 설정하고 달성하는 데 집중할 수 있다. 이는 학습 동기를 내재화하고, 교육 과정에서의 진정한 이해와 숙달을 촉진한다. 또한, 모든 학생이 충분한 시간과 기회를 가질 경우 기준을 달성할 수 있다는 믿음은 교육적 형평성을 높이는 데 기여한다.
교육적 효과 측면에서, 절대평가는 과목에 대한 실질적인 이해도와 능력을 평가하도록 유도한다. 상대적인 서열보다는 절대적인 기준 충족이 중요하기 때문에, 학생들은 시험 범위 전반에 걸쳐 고른 학습을 하게 되고, 단순히 상대방보다 점수를 높이기 위한 전략적 학습에서 벗어날 수 있다. 이는 평가가 교육 과정의 일부로 자연스럽게 통합되게 하여, '시험을 위한 교육'이 아닌 '교육을 위한 평가'의 실현을 돕는다.
사회적으로는 과도한 경쟁을 완화하고 교육 스트레스를 줄일 수 있다는 기대가 따른다. 상대평가 체제에서는 일정 비율의 학생이 낮은 등급을 받을 수밖에 없어 불필요한 불안감과 좌절감을 유발하지만, 절대평가는 모든 학생이 성공할 가능성을 열어둔다. 이는 학습에 대한 긍정적인 태도 형성과 더불어, 학교 생활 전반의 만족도를 높이는 효과를 가져올 수 있다.
장점 유형 | 주요 내용 |
|---|---|
교육적 효과 | 개인 성취 중심 학습 촉진, 학습 동기 내재화, 교육 과정과 평가의 통합 |
사회적 효과 | 과도한 경쟁 완화, 교육 스트레스 감소, 교육 형평성 제고 |
또한, 평가 결과가 명확한 기준에 따라 산출되므로, 학생과 교사 모두에게 학습의 강점과 약점에 대한 구체적인 피드백을 제공할 수 있다. 이는 향후 학습 방향을 설정하는 데 유용한 정보가 되며, 궁극적으로 교육의 질 개선으로 이어진다.
절대평가의 교육적 효과는 학습자 개인의 성취에 초점을 맞춘 평가 방식에서 비롯된다. 학습자가 특정 성취 기준을 달성했는지 여부를 평가하기 때문에, 학생들은 자신의 현재 수준과 목표 간의 격차를 명확히 인식하고 그 격차를 메우는 데 집중할 수 있다. 이는 경쟁보다는 자기 발전을 촉진하는 학습 환경을 조성한다.
이 방식은 학습 동기를 내재화하는 데 긍정적인 영향을 미친다. 상대적인 서열을 결정하는 상대평가에서는 동료보다 높은 점수를 받는 것이 목표가 될 수 있으나, 절대평가에서는 명확한 기준에 도달하는 것이 목표가 된다. 따라서 학생들은 점수나 등급에 대한 불필요한 불안감에서 벗어나 학습 내용 자체의 숙달에 더 많은 에너지를 투입할 수 있다. 교사 역시 모든 학생이 기준을 달성할 수 있도록 지도하는 데 교육적 자원을 집중할 수 있다.
구체적인 효과는 다음과 같이 정리할 수 있다.
효과 영역 | 주요 내용 |
|---|---|
학습 목표 명확성 | 사전에 공개된 평가 기준을 통해 학생이 달성해야 할 구체적인 목표를 인지하게 한다. |
맞춤형 학습 지원 | 개별 학생의 부족한 부분을 진단하고, 그에 따른 보충 학습이나 심화 학습이 가능해진다. |
평가의 투명성 증대 | 평가 결과가 객관적인 기준에 따라 산출되므로, 평가 과정과 결과에 대한 신뢰도가 높아진다. |
성취감 고취 | 절대적인 기준을 통과했다는 사실 자체가 학습자에게 성취감과 자신감을 제공한다. |
결과적으로, 절대평가는 교육 과정을 '선발'의 도구가 아닌 '교육' 그 자체의 수단으로 회복시키는 효과를 가진다. 이는 모든 학생에게 균등한 성공 기회를 제공하려는 교육 평등의 이념과도 연결된다.
절대평가의 도입은 단순한 평가 방식의 변화를 넘어, 교육 현장과 사회 전반에 특정한 변화를 기대하며 추진되는 경우가 많다. 이러한 사회적 기대 효과는 주로 경쟁 완화와 교육의 본질 회복에 초점을 맞춘다.
첫째, 과열된 경쟁을 완화하여 학생들의 정신적 부담을 줄이고, 보다 건강한 학습 환경을 조성할 것을 기대한다. 상대평가 하에서는 다른 학생보다 더 높은 점수를 받아야 좋은 성적을 얻을 수 있어, 필연적으로 동료 간의 과도한 경쟁을 유발한다. 절대평가는 미리 설정된 기준에 도달하는 것에 초점을 맞추므로, '남을 이겨야 한다'는 압박에서 벗어나 자신의 학습 목표에 집중할 수 있도록 돕는다. 이는 학생들의 스트레스와 불안을 감소시키고, 협력적 학습 분위기를 조성하는 데 기여할 것으로 기대된다.
둘째, 교육의 목적을 '선발'에서 '성장'으로 전환시키는 효과를 기대한다. 상대평가는 제한된 상위 등급 비율로 인해 소수의 성공자와 다수의 실패자를 만들어내는 '제로섬 게임'의 성격을 가진다. 반면, 절대평가는 모든 학생이 충분한 노력과 지원을 통해 기준을 충족할 수 있는 가능성을 열어둔다. 이는 교육이 모든 학습자의 잠재력을 개발하고 기본 소양을 함양하는 데 초점을 맞추도록 유도하며, 결과적으로 사회 구성원 전체의 기초 학력 수준을 높이는 데 기여할 것으로 전망된다.

절대평가의 가장 큰 도전 과제는 명확하고 공정한 평가 기준을 설정하는 어려움이다. 기준이 모호하거나 교사에 따라 해석이 다르면 동일한 성취도라도 다른 등급을 받을 수 있어 평가의 신뢰도가 떨어진다. 특히 주관식 평가나 수행 평가에서 이 문제는 두드러지게 나타난다. 또한 교육 과정이나 평가 내용이 변경될 때마다 기준을 재설정하고 모든 평가자가 이를 공유하는 데 추가적인 비용과 노력이 필요하다.
절대평가 체제에서는 대부분의 학생이 높은 등급을 받을 가능성이 커져 성적의 변별력이 약화된다는 비판이 있다. 이는 특히 선발을 목적으로 하는 대학 입시나 취업 시장에서 문제가 된다. 높은 등급에 다수의 학생이 몰리면, 오히려 사소한 점수 차이로 합격 여부가 갈리는 '미세점수 경쟁'을 부추길 수 있다. 결과적으로 상대평가보다 부담을 덜어준다는 본래 목적과 달리, 오히려 더 치열한 경쟁을 유발할 수 있다는 역설이 존재한다.
절대평가 하에서는 평가의 난이도 조절이 평가 결과에 직접적인 영향을 미친다. 시험이 너무 쉬우면 대다수 학생이 높은 점수를 받아 등급 간 변별이 어려워지고, 반대로 너무 어려우면 기준 점수에 도달하는 학생이 극소수에 그칠 수 있다. 이로 인해 평가를 출제하는 측은 난이도를 안정적으로 유지하는 데 큰 부담을 안게 된다. 이러한 난이도 불균형은 매년 시험 결과의 등급 분포를 예측하기 어렵게 만들어 체제의 안정성을 해칠 수 있다.
마지막으로, 절대평가는 학생들의 학습 동기를 저하시킬 수 있다는 지적도 있다. 일정 수준만 달성하면 더 이상의 노력이 성적 향상으로 직접 연결되지 않기 때문에, 최상위권을 목표로 하는 학생들을 제외하면 학업에 대한 의욕이 줄어들 수 있다. 또한 '남보다 잘해야 한다'는 압박에서 벗어나게 해준다는 장점이, 오히려 '자기만의 기준'에 안주하게 만드는 부작용으로 이어질 수 있다.
절대평가에서 평가 기준을 설정하는 것은 가장 핵심적이면서도 어려운 과제이다. 기준이 명확하지 않거나 모호하면 평가의 공정성과 신뢰성이 크게 훼손된다. 기준 설정의 어려움은 주로 평가 목표를 얼마나 구체적이고 측정 가능하게 정의할 수 있는지, 그리고 그 기준을 모든 평가자에게 일관되게 적용할 수 있는지에 달려 있다.
첫째, 학업 성취의 목표를 객관적으로 정의하고 측정 가능한 기준으로 세분화하는 작업이 복잡하다. 예를 들어, '문제 해결 능력을 평가한다'는 목표는 추상적이기 때문에, 이를 '주어진 조건에서 적절한 공식을 선택하여 계산을 수행한다'와 같은 관찰 가능하고 검증 가능한 행동 기준으로 전환해야 한다. 이 과정에서 교육 내용의 본질을 왜곡하지 않으면서도 정량화 가능한 지표를 만드는 데 어려움이 따른다. 특히 창의성이나 비판적 사고와 같은 고차원적 사고 능력은 평가 기준을 명확히 설정하기 더욱 까다롭다.
둘째, 설정된 기준을 실제 채점이나 평가 과정에서 일관되게 적용하는 것이 쉽지 않다. 평가자가 다수인 경우, 각 평가자마다 기준에 대한 해석과 적용의 엄격함에 차이가 발생할 수 있다. 이를 완화하기 위해 상세한 채점 기준표(루브릭)를 만들고 평가자 훈련을 실시하지만, 여전히 주관성이 개입될 여지가 남아 있다. 다음 표는 기준 설정에서 발생할 수 있는 문제점을 정리한 것이다.
문제 유형 | 설명 | 예시 |
|---|---|---|
기준의 모호성 | 성취 수준을 설명하는 언어가 추상적이어서 해석의 차이가 큼 | '양호한 이해'와 '충분한 이해'의 경계가 불분명 |
기준의 공정성 | 특정 배경 지식이나 문화적 맥락을 전제하여 일부 학생에게 불리하게 작용할 수 있음 | 일상 예시가 도시 생활에 편중되어 농촌 지역 학생이 이해하기 어려움 |
기준 적용의 불일치 | 동일한 기준을 두 평가자가 다르게 적용함 | 한 평가자는 표현의 정확성을, 다른 평가자는 아이디어의 독창성을 더 중시함 |
마지막으로, 기준의 적절한 난이도 수준을 결정하는 것도 과제이다. 기준이 너무 높게 설정되면 대다수 학생이 낮은 등급을 받아 동기 부여를 떨어뜨릴 수 있고, 반대로 너무 낮게 설정되면 변별력이 약화되어 평가의 의미가 퇴색한다. 따라서 교육과정의 목표, 학생의 평균적 수준, 사회적 기대 등을 종합적으로 고려하여 합리적인 절대 기준을 찾는 작업이 지속적으로 필요하다.
절대평가에서 변별력 문제는 평가 결과가 수험생들의 능력 차이를 충분히 반영하지 못할 수 있다는 점에서 제기된다. 상대평가는 응시자 집단 내 상대적 서열에 따라 성적이 결정되므로 자연스럽게 변별이 이루어지지만, 절대평가에서는 미리 설정된 절대적 기준에 도달한 학생들이 모두 높은 등급을 받게 되어 성적 분포가 왜곡될 수 있다.
이로 인해, 특히 선발을 목적으로 하는 대입과 같은 시험에서는 합격자 선정에 어려움을 겪을 수 있다. 예를 들어, 상위권 대학에 지원하는 다수의 학생이 수능 특정 과목에서 만점에 가까운 점수를 받게 되면, 해당 과목은 합격자 결정에서 사실상 변별 기능을 상실하게 된다. 이는 결국 다른 과목의 비중을 비정상적으로 높이거나, 서류 평가나 면접 등 다른 전형 요소에 지나친 부담을 주는 결과를 초래할 수 있다.
변별력 부족 문제는 평가의 난이도와 직접적으로 연관된다. 평가가 너무 쉬우면 고득점자가 대량 발생하고, 너무 어려우면 저득점자가 대량 발생하여 양극화 현상이 나타난다. 이를 완화하기 위해 평가 주체는 정교한 문항 분석과 평가 기준 설정을 통해 적정한 난이도를 유지하려 노력하지만, 매 시험마다 완벽한 변별력을 확보하는 것은 현실적으로 어려운 과제이다.
변별력에 미치는 요소 | 설명 |
|---|---|
평가 난이도 | 시험이 지나치게 쉬우거나 어려우면 점수가 몰리는 현상이 발생한다. |
기준점(컷트라인) 설정 | 등급 구분을 위한 절대적 기준점 설정이 변별력에 직접적인 영향을 미친다. |
응시자 집단의 수준 | 응시자 전반의 실력 분포가 균일하면 변별이 더 어려워질 수 있다. |
문항의 질 | 변별도가 높은 문항의 비중이 변별력 확보에 중요하다. |
이러한 변별력 문제는 절대평가가 지닌 근본적인 특성에서 비롯된 것으로, 단순히 평가 방식의 전환만으로는 해결하기 어렵다. 따라서 절대평가를 도입할 때는 평가 목적과 선발의 공정성을 어떻게 조화시킬 것인지에 대한 깊은 고민이 필요하다.

대학수학능력시험(수능)은 절대평가와 상대평가가 혼합되어 적용되는 대표적인 사례이다. 2017학년도 수능부터 영어 영역과 한국사 영역이 절대평가로 전환되었다. 영어는 1등급(90점 이상)부터 9등급까지, 한국사는 '합격/불합격'의 2등급 체계로 운영된다[2]. 이는 과도한 경쟁을 완화하고 학생들의 기본 학력 보장에 초점을 맞추기 위한 조치였다. 반면, 국어, 수학, 탐구 영역 등은 여전히 원점수에 따른 상대평가를 유지하고 있어, 한 시험 안에서 두 평가 방식이 공존하는 독특한 구조를 보인다.
학교 내신(학교생활기록부 성적) 평가에서도 절대평가의 적용이 확대되고 있다. 많은 고등학교가 교과목별로 성취 기준을 마련하고, 학생이 해당 기준을 달성한 정도에 따라 A, B, C 등의 등급을 부여한다. 이는 동일 학교 내 학생들 간의 서열화보다는 개별 학생의 학습 목표 달성도에 주목하는 방식이다. 예를 들어, 특정 단원의 이해도나 수행 과제의 완성 수준이 평가의 주요 척도가 된다.
적용 분야 | 주요 평가 방식 | 등급 체계 예시 | 비고 |
|---|---|---|---|
수능 영어 | 절대평가 | 1~9등급 (90점 이상=1등급) | 2017학년도부터 도입 |
수능 한국사 | 절대평가 | 합격/불합격 (2025학년도부터 9등급) | 필수 영역 |
학교 내신 (일부 교과) | 절대평가 (성취도 평가) | A, B, C, D, E 등 | 학교 및 교육청 정책에 따라 다름 |
수능 국어/수학 | 상대평가 | 표준점수, 백분위, 등급 | 원점수를 변환 |
절대평가의 적용은 시험의 성격과 목적에 따라 달라진다. 공인 어학 시험인 TOEIC이나 TOEFL은 전 세계적으로 통용되는 절대평가의 대표적 예시이다. 이 시험들은 특정 점수가 일정한 언어 능력 수준을 의미하도록 설계되어 있다. 국내에서도 자격증 시험이나 일부 대학의 논술 고사, 교원임용시험의 일부 영역 등에서 절대평가 원리가 활용된다.
대학수학능력시험(수능)에서 절대평가는 주로 영어와 한국사 영역에서 적용되었다. 2018학년도 수능부터 영어 영역이 절대평가로 전환되었고, 한국사 영역은 2017학년도 수능부터 이미 절대평가를 실시하고 있었다[3]. 이는 학생들이 극심한 경쟁에서 벗어나 해당 과목의 기초 소양을 충실히 함양하도록 유도하기 위한 정책적 선택이었다.
절대평가가 도입된 영역은 시험의 난이도와 관계없이 미리 설정된 기준 점수에 따라 등급이 결정된다. 예를 들어, 영어 영역의 경우 원점수 90점 이상이면 1등급을 받게 된다. 이로 인해 시험이 쉬운 해에는 고득점자가 많아져 다수의 학생이 높은 등급을 받을 수 있지만, 변별력은 낮아지는 결과를 초래하기도 했다.
수능 절대평가의 도입은 상대평가에 따른 과도한 경쟁과 조기교육, 사교육 확대 등의 문제를 완화하려는 목적이 있었다. 특히 영어의 경우, 절대평가 전환 이후 일부 학생들 사이에서 영어 학습에 대한 부담이 줄어들었다는 평가도 존재한다. 그러나 동시에 주요 대학의 입시에서 영어 등급의 변별력이 약화되면서, 다른 영역이나 학생부종합전형 등의 비중이 상대적으로 높아지는 효과도 나타났다.
시행 연도 | 영역 | 평가 방식 | 주요 내용 |
|---|---|---|---|
2017학년도 | 한국사 | 절대평가 | 필수 영역으로 지정되며 9등급제 절대평가 실시 |
2018학년도 | 영어 | 절대평가 | 9등급제 절대평가로 전환, 1등급 커트라인 90점 |
2021학년도 | - | - | 영어 절대평가 유지 논란 지속[4] |
수능의 절대평가 제도는 꾸준한 논쟁의 대상이 되어 왔다. 변별력 부족으로 인한 대학 입시의 공정성 문제, 난이도 조정의 실패 가능성, 그리고 오히려 상위권 학생들 사이에서의 미세한 점수 차이를 위한 경쟁을 유발할 수 있다는 비판이 제기된다. 이러한 논의는 수능 제도 개편을 둘러싼 정책 결정 과정에서 중요한 고려 사항이 되고 있다.
학교 내신 평가에서 절대평가는 학생의 학업 성취도를 미리 설정된 명확한 기준에 따라 평가하는 방식을 의미한다. 이는 전통적으로 사용되던 상대평가 방식, 즉 학생들 간의 서열에 따라 성적을 부여하는 방식에서 벗어나, 학생 개개인이 학습 목표를 어느 정도 달성했는지에 초점을 맞춘다. 대한민국의 중등교육 현장에서는 2010년대 중반 이후 내신 평가에 절대평가를 도입하는 학교가 늘어나는 추세를 보였다.
학교 내신 절대평가의 운영은 일반적으로 다음과 같은 특징을 가진다. 교사는 학기 초에 학생들에게 평가 기준(예: 점수 구간별 등급 기준, 수행 과제의 채점 기준표)을 공개한다. 학생의 시험 점수, 보고서, 수행 평가 결과 등은 이 공개된 기준에 직접 대조되어 등급이 결정된다. 예를 들어, 100점 만점에 90점 이상은 A등급, 80점 이상 90점 미만은 B등급과 같은 방식으로 산출된다. 이는 같은 시험에서 90점을 받은 학생이 많으면 모두 A등급을 받을 수 있음을 의미하며, 정규분포를 가정하고 상위 일정 비율만 높은 등급을 주는 상대평가와 근본적으로 다르다.
절대평가 방식의 내신은 학생들 간의 과도한 경쟁을 완화하고, 교수-학습 과정을 정상화하려는 목적을 가진다. 학생들은 동료보다 잘 보이기보다는 교과 내용 자체를 이해하고 숙달하는 데 집중할 수 있게 된다. 또한 평가 기준이 투명하게 공개되므로 학생의 성적에 대한 예측 가능성이 높아지고, 불필요한 성적 인플레이션이나 특정 교사의 주관적 편향이 개입될 여지가 줄어든다는 장점이 있다.
그러나 학교 내신 절대평가도 몇 가지 현실적인 과제에 직면한다. 가장 큰 문제는 교과목과 학교, 지역에 따라 평가 기준의 엄격함이 달라질 수 있다는 점이다. 이는 대학 입시에서 내신 성적을 비교할 때 공정성 문제를 제기할 수 있다. 또한, 모든 학생이 높은 등급을 받을 가능성이 있어 변별력이 약화될 수 있으며, 이는 다시 대학 입시에서 내신의 신뢰도를 떨어뜨릴 수 있다는 비판으로 이어진다. 따라서 많은 학교는 절대평가와 상대평가를 혼합하거나, 절대평가를 적용하되 등급별 비율에 일정한 제한을 두는 방식 등 다양한 변형 모델을 시도하고 있다.

절대평가의 운영은 크게 평가 기준을 설정하는 단계와, 그 기준에 따라 학습자의 성취 수준을 판단하여 등급이나 합격/불합격을 결정하는 단계로 나뉜다.
평가 기준 설정은 절대평가 운영의 핵심이다. 일반적으로 교육과정에서 제시된 학습 목표나 성취 기준을 바탕으로, 학생이 '얼마나' 달성해야 특정 등급을 받을 수 있는지 명확한 성취 수준을 사전에 정의한다. 이 기준은 평가 도구(시험, 수행 평가 등)의 내용과 직접적으로 연결된다. 예를 들어, 특정 단원의 개념 이해도, 문제 해결 능력, 특정 기능의 숙련도 등을 측정할 수 있는 문항이나 과제를 개발하고, 각 문항의 정답률이나 수행 수준에 따라 등급을 부여하는 절단점(cut-off score)을 설정한다. 기준 설정은 교사, 교육 전문가, 평가 전문가 등이 협의하여 이루어지며, 평가의 타당도와 신뢰도를 확보하기 위해 중요하게 다뀐다.
기준이 설정되면, 학생의 실제 수행 결과를 그 기준에 대입하여 등급을 산출한다. 가장 일반적인 방식은 백분율 점수에 따라 미리 정해진 등급을 부여하는 것이다. 예를 들어, 90점 이상은 A등급, 80점 이상 90점 미만은 B등급과 같은 방식이다. 또 다른 방식은 평가 문항이나 과제 자체를 특정 등급의 기준을 반영하도록 설계하여, 학생이 그 문항을 해결하면 해당 등급의 능력을 갖췄다고 판단하는 것이다. 이때 등급 간 변별을 위해 종종 부분 점수나 세부 평가 기준(rubric)이 활용된다. 절대평가에서는 다른 학생들의 성적 분포와 관계없이 오직 사전 설정된 기준만이 등급 결정의 유일한 척도가 된다.
절대평가에서 기준 설정은 평가의 공정성과 타당성을 결정하는 가장 핵심적인 절차이다. 기준은 일반적으로 성취기준 또는 평가준거라고 불리며, 학습자가 도달해야 할 구체적인 지식, 기능, 태도의 수준을 명시적으로 정의한다.
기준 설정의 주요 방법으로는 전문가 합의법, 규준집단법, 그리고 절대적 기준법이 널리 사용된다. 전문가 합의법은 해당 교과의 전문가들이 모여 합의를 통해 합격점수나 등급 경계점을 결정하는 방식이다. 규준집단법은 사전에 정의된 우수한 학습자 집단(예: 상위 10%)의 수행 수준을 분석하여 기준을 설정한다. 절대적 기준법은 평가 문항의 내용과 난이도를 면밀히 분석하여, 각 문항을 정답으로 맞혀야 할 최소한의 비율이나 총점을 사전에 정하는 방식이다.
방법 | 주요 특징 | 적용 예시 |
|---|---|---|
전문가 합의법 | 전문가 패널의 논의와 합의에 의존 | 대학수학능력시험의 등급 구분 점수 설정 |
규준집단법 | 특정 집단의 수행도를 참조 기준으로 활용 | 특정 교육과정을 완벽히 이수한 집단의 평균 점수 기준 |
절적적 기준법 | 평가 문항 자체의 내용과 기대 정답률에 기반 | 100점 만점 중 기초 문항 60점 이상 획득 시 '기본 성취' 판정 |
이러한 기준은 단일한 절대적 점수(예: 100점 만점에 80점)로 설정되거나, 또는 여러 개의 성취 수준(예: '우수', '보통', '기초', '미흡')으로 구분되어 등급 경계선(cut score)의 형태로 나타난다. 기준 설정 후에는 실제 시험 응시자들의 점수 분포를 확인하는 예비 채점(pre-testing)을 통해 기준의 적절성을 검증하고, 필요시 조정하는 과정을 거친다.
절대평가에서 등급은 미리 설정된 절대적인 기준에 따라 학습자의 성취 수준을 판단하여 부여된다. 등급 산출의 핵심은 모든 평가 대상자가 동일한 기준에 의해 측정된다는 점이다. 따라서 특정 등급을 받을 수 있는 인원이나 비율에 제한이 없다.
구체적인 등급 산출 방식은 평가의 목적과 내용에 따라 다양하게 설계된다. 일반적으로는 점수 구간을 기준으로 하거나, 명시된 성취 기준에 대한 도달 여부를 확인하는 방식이 사용된다. 예를 들어, 90점 이상을 A등급, 80점 이상 90점 미만을 B등급으로 구분하는 점수 구간 방식이 있다. 또는 '주어진 문제를 80% 이상 정확하게 해결할 수 있다', '실험 절차를 안전하게 수행할 수 있다'와 같은 구체적인 성취 기준을 제시하고, 그 기준을 충족하는지에 따라 합격/불합격 또는 여러 단계의 등급을 부여하는 방식도 있다.
등급 산출 방식 유형 | 주요 특징 | 예시 |
|---|---|---|
점수 구간 방식 | 미리 정해진 점수 범위에 따라 등급을 결정한다. | 90~100점: A, 80~89점: B |
성취 기준 도달 방식 | 구체적인 수행 기준을 설정하고, 그 충족 여부에 따라 등급을 판정한다. | '세 가지 근거를 들어 논증할 수 있다'는 기준 충족 시 '우수' 등급 부여 |
혼합 방식 | 점수 구간과 성취 기준을 결합하여 등급을 산출한다[5]. |
이러한 방식은 상대평가가 집단 내에서의 상대적 서열에 따라 등급을 부여하는 것과 근본적으로 다르다. 절대평가의 등급은 동일한 기준 하에서 개별 학생이 보여준 절대적인 성취 수준을 반영하며, 이는 교육 과정의 목표 달성도를 진단하고 피드백을 제공하는 데 주안점을 둔다.

절대평가의 도입과 운영을 둘러싼 논쟁은 교육계와 사회 전반에서 지속적으로 제기된다. 주요 논쟁점은 평가의 공정성, 변별력, 그리고 교육 과정에 미치는 실제 영향에 집중된다.
가장 첨예한 논쟁은 평가 기준의 설정과 그에 따른 공정성 문제다. 절대평가에서는 모든 학생이 동일한 절대적 기준에 의해 평가받는다는 원칙이지만, 이 기준 자체를 어떻게 설정하느냐가 논란의 중심이다. 평가 기준이 지나치게 높게 설정되면 많은 학생이 낮은 성취를 받게 되어 학습 의욕을 저하시킬 수 있다. 반대로 기준이 너무 낮으면 높은 등급을 받는 학생이 과도하게 많아져 평가의 의미가 퇴색된다. 또한, 평가 문항의 난이도가 매번 달라지는 시험에서 동일한 절대 기준을 유지하는 것은 기술적으로 어려우며, 이는 시험의 연도별 또는 과목별 불공정성으로 이어질 수 있다는 비판이 있다[6].
다른 한편에서는 절대평가가 상대평가에 비해 변별력이 부족하다는 점이 대입 선발 등의 현실적 장벽으로 작용한다고 지적한다. 특히 대학수학능력시험의 일부 영역에서 절대평가를 도입한 이후, 높은 등급을 받은 학생들이 다수 발생하면서 상위권 대학의 합격자를 가리는 데 한계가 나타났다. 이는 결국 대학이 별도의 내신이나 논술, 면접 등 다른 요소에 더 큰 비중을 두도록 유도하여, 오히려 학생의 부담을 가중시킬 수 있다는 주장이다. 또한, '절대적 기준 달성'에 초점이 맞춰지면 학생들 간의 경쟁이 완화되는 긍정적 효과도 있지만, 일부에서는 이로 인해 학습 동기가 약화되고 '적당한 수준'에서 안주하는 현상이 발생할 수 있다고 우려한다.

절대평가의 미래 전망은 교육 패러다임의 변화와 기술 발전, 그리고 사회적 요구에 따라 진화할 것으로 예상된다. 인공지능과 빅데이터 분석 기술의 발달은 평가 기준 설정과 채점 과정에 혁신을 가져올 가능성이 있다. 예를 들어, 학습자의 개별 성취 데이터를 실시간으로 분석하여 맞춤형 피드백을 제공하거나, 평가 문항의 난이도를 보다 과학적으로 조정하는 데 활용될 수 있다. 이는 현재 절대평가가 직면한 평가 기준 설정의 어려움을 완화하는 데 기여할 수 있다.
교육의 목적이 단순한 지식 습득을 넘어 비판적 사고력, 협업 능력, 창의성 등 복합적 역량을 기르는 방향으로 전환됨에 따라, 절대평가의 형태도 다변화될 전망이다. 기존의 지필고사 중심 평가에서 벗어나, 프로젝트 결과물, 포트폴리오, 수행 평가 등 과정 중심의 다양한 평가 방법이 절대평가의 원리 하에 통합될 수 있다. 이는 학습자의 성장을 보다 종합적으로 측정하는 방향으로 나아갈 것이다.
변화 동인 | 예상되는 발전 방향 | 기대 효과 |
|---|---|---|
기술 발전 (AI, 빅데이터) | 평가 기준의 과학화, 개인화된 피드백 시스템 구축 | 평가 공정성 및 유효성 제고 |
교육 패러다임 변화 (역량 중심) | 수행 평가, 포트폴리오 등 다각적 평가 도구 통합 | 학습자의 종합적 성장 측정 |
사회적 요구 (포용과 공정) | 표준화와 개별화의 균형 모색, 교육격차 해소 노력 | 교육 기회의 평등 증진 |
또한, 교육격차 해소와 포용적 교육에 대한 사회적 요구는 절대평가가 표준화와 개별화 사이에서 새로운 균형점을 모색하도록 할 것이다. 모든 학습자에게 동일한 기준을 적용하는 동시에, 개인의 출발점과 배경을 고려한 맞춤형 학습 목표 설정이 결합된 하이브리드 형태의 평가 모델이 등장할 수도 있다. 궁극적으로 절대평가의 미래는 단순한 성적 매기기의 도구를 넘어, 모든 학습자의 잠재력을 발견하고 성장을 지원하는 학습 시스템의 핵심 구성 요소로 자리 잡는 데 있을 것이다.