전문가 칼럼
입시전략연구소의 입시 전문가들이 전하는
고입, 대입 대비 전략부터 학부모 지도 Tip까지!
학생과 학부모들에게 꼭 필요한 교육 정보를 제공합니다.
 

 
알파고도 칭찬받는데...95점에 우는 아이들 성장과 변화 중심의 학습지도가 중요하다
2016-04-22

 

알파고도 칭찬받는데…95점에 우는 아이들
성장과 변화 중심의 학습지도가 중요하다

 

 

알파고가 바둑으로 이세돌 9단을 이긴지 한 달여가 지났다. 알파고가 인간계 바둑의 최고수를 이기고 난 후에 국내에서는 인공지능에 대한 연구를 국가에서 지원한다고 하기도 하고, 알파고의 몬테카를로 알고리즘과 신경망 구조에 대한 여러 분석과 사회적 파장에 대한 기사가 쏟아져 나왔다. 그러나 정작 알파고가 어떤 학습을 했는지에 대해서는 그렇게 큰 이슈가 되지 못했다. 너무나도 고전적인 학습 방법을 사용하고 있었기 때문이다. 학습이라는 것은 어떤 자극에 대해 어떤 방식으로 반응하는가가 핵심이다. 고전적인 학습의 정의는 긍정적인 반응과 부정적인 반응으로 인한 행동변화 모두를 포함하여 학습이라고 부른다. 교육이라고 부르는 것은 긍정적인 학습에 대한 방법을 뜻하는 말이다.

 

알파고는 바둑실력 향상을 위해 세 가지 학습전략을 사용하고 있다. 첫째는 심층학습(Deep learning), 둘째는 자기주도학습 (Self learning), 셋째는 강화전략 (Reinforcement) 이다. 조금 쉽게 말하면 자신이 관심 있는 분야에 대해 핵심적인 방법을 탐색하여 스스로 더 많은 정보를 획득하고 주제를 설정해서 공부했다는 뜻이다. 비슷하지만 우리 학생들이 방학마다 다음 학기, 다음 연도에 배울 내용을 공부하는 선행학습과는 매우 다른 의미다. 선행학습이라는 것은 단순히 배울 내용을 당겨서 배우는 것을 의미한다. 학습 성취도가 높은 영재교육에는 학생의 관심과 성취만 있다면 선행학습에 대한 것도 독이 되지 않는다고 이야기한다. 그러나 가장 좋은 방식은 학생이 관심 있는 영역에 대해서 더 많은 것을 알아보려고 노력하고 이에 대한 학습을 스스로 하는 것이다. 위에서 말하는 심층학습과 자기주도학습을 통해서 말이다. 이렇게 학생이 호기심을 바탕으로 더 많은 노력을 더하기 위해 반드시 필요한 것이 주변의 칭찬과 처벌이라는 강화전략이다.

 

강화전략은 쉽게 이야기하면 잘하면 칭찬과 보상으로 학생의 자존감을 높이고, 부정적인 행동을 할 경우 처벌을 통해 그 행동을 멈추게 하는 것을 말한다. 칭찬과 보상을 정적 강화(+)라고 하고 처벌을 부적(-)강화라고 말하기도 한다. 알파고 역시 이런 방식으로 자신의 실력을 키웠는데 알파고 프로그램안에 바둑을 통해 승리할 때는 (+1)을 주고 패했을 때는(-1)을 주는 함수를 만들어 놓고 승리할 때의 요인들을 분석하여 필승전략을 가다듬었다고 한다.

 

사람이 아니기에 이길 때 칭찬받아서 기분이 좋았을지는 모르지만 칭찬점수가 알파고를 더 빠르 게 학습시킨 것은 확실하다. 사람에게도 이런 칭찬에 대한 보상기재가 내부에서도 존재한다. 특히 지식에 대한 탐구와 호기심 충족, 도전에 대한 보상은 뇌 자체에서 생산되는 도파민이라는 호르몬에 영향을 받는다. 스스로 어떤 보상이 없어도 자신의 탐구에 뛰어들어가서 집중하는 사람들은 모두 이런 내적 보상에 따라 움직이는 자유인인 셈이다.

 

그러나 아직 자아가 완성되지 않은 어린 학생들에게서는 주변의 칭찬이 큰 역할을 하게 된다. 특히 아직 부모와의 자아정체성이 분리되지 않은 초등학생들에게 부모의 칭찬은 자기가 스스로 칭찬을 하는 것과 마찬가지의 효과를 가지고 있다. 농담처럼 초등학생들이 가장 많이 스트레스를 받는 점수가 있다고 말한다. ‘바로 95점’ 한 문제를 틀렸을 때다. 95점은 절대평가로 학업성취도를 기록할 때 A+에 해당하는 높은 점수지만 학부모 입장에서는 100점에서 5점 빠진 완벽하지 못한 수로 보게 된다. 사람들은 보통 어떤 이익을 획득하는 것보다 자신이 가진 것이 사라질 때 더 많은 상실감을 느끼게 된다. 이를 손실 회피 편향(Loss Aversion bias)라고 부르는데 95점에 느끼는 학부모의 감정은 95점이라는 획득보다는 100점에서 하나를 손해봤다는 감정이 크기 때문에 발생하는 것이다. 카네만(Kahneman)이라는 심리학자가 밝혀낸 인간의 비합리적인 감정에 대한 실험을 살펴보면, 실제로 사람들은 돈의 가치로 볼 때 손실이 획득보다 두 배나 더 심리적인 가치를 지니는 것으로 조사됐다. 그러나 한국에서는 95점보다 -5점이 더 많은 가치를 가지게 되니, 실로 가공할 손실회피가 자녀 교육에서 발생하고 있는 셈이다. 하지만 학생의 입장에서는 어떨까? 그렇게 높은 성취를 보이고서도 스쳐가는 부모의 찌푸린 얼굴을 보거나 100점 맞은 옆집 아이에게 비교될 때 마음이….

 

사람은 죽을 때까지 변화한다는 것이 최근의 발달과 성장의 개념이다. 입시전형에서도 학생들의 평가를 완성된 사람을 평가하는 것이 아니라, 과거의 노력과 미래의 가능성을 평가하는 것으로 변화하고 있다. 100점에만 칭찬하는 것이 아니라 학생의 성취를 통해 좀 더 완벽해질 수 있도록 그 노력을 칭찬하라는 것이 칭찬의 기술이다. 95점을 맞았다면 우선 A+를 칭찬해 주고 다음 시험에 100점을 맞기 위해 뭘 해야 하는지? 한 문제는 왜 틀렸는지? 부모가 먼저 이야기하지 말고 학생의 이야기를 들어보자. 학생이 웃을 때 성적도 올라가기 마련이다. 인생도 길고, 입시도 이제 길어졌기 때문이다. 우리 학생들이 기계인 알파고보다 칭찬받지 못한다면, 그 사실이 어쩌면 알파고 승리 이후에 그토록 언론에서 떠들었던 인간의 존엄성 상실과 미래의 기계문명에 대한 디스토피아(dystopis)적 풍경일지도 모르겠다.

 

 

| 참고문헌
    
David Silver외(2016), Mastering the game of Go with deep neural networks and tree search,
 NATURE, Vol 529
Daniel Kahneman외(1991), The Endowment Effect, Loss Aversion, and Status Quo Bias,
Journal of Economic Perspectives, Vol 5.