평가 개선은 서술형 평가라는 환상에서 벗어나기

2015.07.08. 예전 블로그에 발행했던 글을 옮겼습니다. 


평가 개선에 정답은 없다 

요즘 서술형 평가가 대세다. 서술형 평가를 주축으로 한 평가 개선은 새 교육의 모범 답안으로 자주 이야기된다. 물론 서술형 평가가 제대로 이루어진다면 교육 현장의 아픈 부분들이 상당수 치유될 것이다. 하지만 모든 평가를 서술형 평가로 바꿔야 한다거나, 평가가 바뀌면 교육이 바뀐다는 문구들은 매우 자극적으로 다가온다.

우리에게는 객관식과 단답형 문제들도 여전히 필요하다. 또한 평가로 교육을 바꾸려는 것은 용기 있는 시도이지만, 섣부른 앞서감은 학교 현장에 혼란을 줄 수 있다. 물론 구더기 무서워서 장 담그지 말자는 건 아니다. 그저 서술형 평가가 전부는 아닐 수 있고, 만일 한다면 제대로 해보고 싶다는 이야기다.

(주로 지필 평가에 한정하여 생각하였으나, 관찰이나 포트폴리오 평가에 대해서도 다양성을 존중해야 한다는 맥락은 동일하게 적용될 수 있다.)



그림 출처: https://www.pexels.com/photo/art-assess-communication-conceptual-462360


측정선행교수의 도박 

평가는 더 나은 교육을 위해 이루어진다. 그리고 평가는 가르치고 배우는 과정 전반을 평가한다. 평가는 학생에게만 한정되지 않으며, 교육활동 전체가 평가의 대상이 된다.

많은 교육자들이 교육을 변화시키기 위해 평가에 먼저 손을 댄다. 교육 변화에 대한 저항이 심할 경우 평가 방법으로 변화를 유도하는 것을 측정선행교수(Measurement Driven Instruction)라 한다. 교육의 흐름이 오랜 시간 고착되었거나 현상유지가 유리한 집단이 많은 등의 이유로, 합리적 방법으로도 혁신이 어려울 때 측정선행교수가 사용된다. 1994년도부터 시행한 대학수학능력시험이 그 예이다.

그런데 측정선행교수가 성공하기란 생각보다 쉽지 않다. 측정선행교수는 기회 비용이 많이 들고, 학교 현장의 부적응이나 사회적 혼란 등으로 성공 가능성이 낮은 편이다. 그래서 평가를 바꾸면 교육이 바뀐다는 생각이 항상 옳지는 않다. 물론 교수학습의 환류 과정에서 평가가 매우 중요한 위치를 차지하지만, 교육 혁신을 위해서라면 더 포괄적이고 신중한 진단과 처방이 필요하다.

객관식 문제에 대한 오해 

객관식 평가는 입시 위주 교육의 대표적 상징이 되었다. 그래서 객관식 중심의 시험이 학생들의 창의적 사고를 저해하고 주입식 교육을 유도한다는 생각이 많다. 하지만 객관식 즉, 선다형 평가 입장에서는 매우 억울한 오해다. 선다형 문항을 풀다 보면 여러 답지 중 정답이 아닌 답지들을 걸러내는 사고 과정을 거친다. 그래서 정답이 아닌 답지를 어떻게 제작하는가에 따라 문항 난이도가 다양해진다. 만약 답지를 단순하게 만들면 단순 기억 능력을 측정하게 되고, 복합적인 답지를 만들면 고등 정신 능력까지 측정할 수 있다. 또, 선다형 평가는 다른 유형들보다 넓은 범위에서도 대표성 있는 내용을 포괄적으로 추출하여 문제지를 구성할 수 있다. 그리고 채점 과정에서 주관성이 개입할 여지가 적어 채점이 명확한 편이다. 이런 이유로 객관식 유형은 내용 타당도가 높은 평가 방식이라 할 수 있다.

그리고 단답형 평가에도 장점이 있다. 객관식 문제의 보기, 또는 서술형 문제의 지문 등과 같은 주변 요소들이 다소 적어서 학생 입장에서는 답에 대한 추측 요인이 적다. 정확히 알아야 정답을 쓸 수 있으므로 평가의 타당도와 신뢰도가 높은 편이다.

완벽해 보이지만 

서술형 평가는 복잡한 학습 내용의 인지 여부는 물론이고 종합적 사고력 등 학생의 고등정신능력을 측정할 수 있다. 문항에 대한 자유 반응도가 높고 교과 내용의 전체적 통합이 강조되기 때문에 융합적 사고를 기를 수 있다. 하지만 완벽해 보이는 서술형 평가에도 단점은 있다.

  • 학생이 제한된 시간에 깊게 생각하여 쓸 수 있는 내용이 한정적이므로, 한 번에 많은 문제를 낼 수 없다. 따라서 매우 제한된 내용만 평가하게 될 가능성이 있다.
  • 구체적 사고 단계의 학생들에게 자칫하면 지나치게 추상적인 답변을 요구할 수 있다.
  • 철자법 준수나 문장력 등 간접적인 요인들이 응시나 채점에 영향을 줄 수 있다.
  • 문제가 제대로 출제되지 않으면 선다형 평가보다 더 단순 지식 습득 여부만 확인하는 것에 그칠 수 있다. ‘무엇에 대해 써라’의 형태로 자꾸 묻다 보면 단순 사실이나 기억만 묻게 될 수도 있는 것이다.
  • 채점 시 후광 효과 및 시행 효과 등으로 신뢰도 문제가 발생할 수 있다.

더 나은 서술형 평가를 위해 

채점에 따른 문제점을 해결하기 위해서 점수 부여 기준을 명료화하고 채점 방법을 체계화해야 한다. 특히 서술형 평가를 채점할 때는 후광 효과와 시행 효과 등에 유의해야 한다.

후광 효과(Halo Effect)는 평소 학생의 생활 모습이나 학습 성취도를 알기 때문에 채점에 영향을 받게 되는 일이다. 모범생의 답지에는 후한 미소로 문제아의 답지에는 폭탄 찾기로 대응하게 되는 일반적이고 인간적인 현상이다. 후광 효과를 방지하기 위해서는 번거롭더라도 답안지에서 학생 이름을 가리고 채점해야 한다.

시행 효과(Carry Over Effect)는 앞 문제의 채점 결과가 다음 문제의 채점 과정에 영향을 주는 것이다. 맨 처음 문제에서 마지막 문제까지 주르륵 채점하다 보면 나도 모르게 동그라미를 계속 치게 되는 물리적 잔상처럼, 처음 문제에 좋은 답을 썼으니 다음 문제도 잘 썼을 것이라 자연스레 넘어가게 된다. 시행 효과를 방지하기 위해서는 시험지별로 채점하지 말고, 각각 문제별로 일관성 있게 채점해야 한다. 모든 학생의 1번을 한꺼번에 채점하고 다음 문제를 같은 방식으로 채점하면 된다.

그리고 서술형 평가를 적용할 때는 전체적 내용을 분석하거나 견해를 논리적으로 피력해야 하는 등, 그 방식이 가장 적합한 부분에 도입하는 것이 바람직하다. 모든 범위를 서술형 평가로 해결하는 것은 무리일 수 있으며, 다른 평가 방식이 더 효과적인 부분이 있을 수 있기 때문이다. 또, 서술형 평가를 출제할 때는 질문을 분명하게 구조화하여 학생에게 명쾌히 물어볼 수 있도록 유의해야 할 것이다.

더 다양하고 더 제대로 

평가를 개선하려는 노력은 끊임없이 이루어지고 있다. 처음에는 평가 방식을 다양화하는 맥락에서 서술형 평가가 강조되기 시작했다. 그런데 시소의 균형을 잡으려다 보니 가벼웠던 쪽에 무게가 더 실려서 이야기가 오간다. 하지만 모든 평가 방식에는 장단점이 있으므로 상황에 따라 다양하게 선택할 수 있어야 한다. 어떤 경우에 어떤 유형이 적절할 것인지 고민하여 다양한 평가 유형을 상호보완적으로 이용해야 할 것이다.

잘못 만들어진 문제들이 시험지를 채우면 어떤 유형으로 문제를 내더라도 문제가 생긴다. 마감 시한에 쫓기다 보면 그저 단순 지식을 묻는 문제들만 출제될 수도 있고, 정성이 부족한 선택지들은 찍기 기술을 허용한다. 그래서 더 신중해야 하고 더 연구해야 하고 평가를 통해 평가가 평가받으며 점차 나아져야 한다.

교사는 계속 가르치고 평가하고 배운다. 그렇지만 평가는 어렵기도 하다. 평가를 위해서는 교육 목표, 교과 내용, 교육 과정을 명확히 이해해야 한다. 그리고 교수학습이론과 검사이론을 알아야 하고 인지심리학도 고려해야 한다. 또 학생들의 개별적 특성과 집단적 특성에 맞춰 적절한 문제를 내야 한다. 그리고 재치있는 문장력과 편견 없이 오롯한 시선이 있어야 좋은 평가가 이루어진다.

제대로 평가하려면 어렵다. 그렇지만 평가는 계속 도전할만한 가치 있는 일이다. 학생은 문제에 도전하고 교사는 출제에 도전하니 서로 재미있다. 앞으로 더 다양하게 평가하고 더 제대로 평가하는 실천들이 계속 더해지길 바란다.

- 송은정

댓글