Top
검색버튼 메뉴버튼

비교평가, 좋든 나쁘든 나태를 부른다

우정이 | 65호 (2010년 9월 Issue 2)

우리는 모든 것을 비교하고 평가해서 등급을 내리고 점수를 매기는 세상에 살고 있다. 이는 소비자가 최신 전자제품을 비교할 때나 학부모와 정책가들이 학교나 공공제도를 평가할 때, 스포츠 팬이 응원 팀의 전력을 파악할 때에도 많이 이용된다. 만약 직원 성과를 평가할 때도 등급을 매긴다면 어떤 일이 벌어질까?
 
동료 직원과 비교해서 등급을 결정하면, 높은 등급을 받은 직원은 자신의 위치를 유지하기 위해, 낮은 등급을 받은 직원은 등급을 올리기 위해 더 열심히 노력한다는 속설이 있다. 그러나 와튼 경영대학원 경영학 교수 이완 바란케이(Iwan Barankay)는 최근 발표한 논문 ‘현장 실험을 통한 사회적 등급 및 평가 제도의 효과 검증(Ranking and Social Tournament: Evidence from a Field Experiment)’에서 이런 속설에 의문을 제기한다.
 
동료 직원과 비교해서 성과를 평가할 때 직원들이 동료를 따라잡거나 추월하기 위해 일에 매진한다고 생각하는 경영진이 많다. 그러나 실제로는 정반대의 결과가 나온다”고 인사 및 노동경제학을 전공한 바란케이는 말했다.
 
직원들은 오히려 나태해지거나 의욕을 상실할 수 있다. 높은 등급을 받은 직원은 ‘이미 최고인데, 더 노력할 필요가 있나?’라고 생각하고, 낮은 등급을 받은 직원은 자신의 능력에 좌절해서 아예 손을 놓아버릴 수 있다.”
 
바란케이는 2008년 금융위기 여파로 경제가 비틀거릴 때부터 직원 평가가 동기부여에 어떤 영향을 미치는지에 깊은 관심을 가졌다. 그는 금융위기 직전 월스트리트 금융인들이 천정부지의 보너스를 받아갔던 사실을 지적하며 금융위기는 직원의 실적을 기준으로 금전적 인센티브를 제공하는 관행이 의도치 않은 결과를 낳는 사실을 명확히 보여준 사례라고 말했다.
 
금전적 인센티브가 더 이상 효과적이지 않은 상황에서 직원이 더 열심히 일하도록 독려하려면 어떻게 해야 하는지 알고 싶었다. 사람은 타인과 비교한 자신의 상대적 지위에 민감하다는 통념이 있다. 다시 말해, 사람은 비교 기준의 집단보다 자신이 우월하거나 혹은 떨어진다고 느낄 때, 행복이나 불만을 느낀다”고 그는 말했다. “물론 금전적 보상과 연계될 경우, 등급은 중요해진다. 그러나 여기에서 나는 등급 자체를 하나의 보상으로 간주했다. 또 근로자들이 동료와 비교한 자신의 등급을 진정으로 알고 싶어하는지 확인하려고 했다. 더불어 이들이 자신의 평가 등급을 알게 됐을 때 등급을 올리기 위해 더 많은 노력을 기울이는지도 궁금했다.”

의도치 않은 결과
바란케이는 집단 노동력 활용을 위한 아마존닷컴의 웹서비스인 ‘미캐니컬 터크(Mechanical Turk)’를 통해 330명의 직원을 모집했다. 미캐니컬 터크는 온라인 상에서 특정 업무를 수행할 근로자를 모집하고 업무 결과물을 전달받는 플랫폼이다. 미캐니컬 터크 구인란에 고용주들이 게시하는 업무는 보통 사진 파일 분류, 텍스트 만들기 및 편집, 기본 데이터 입력 등 단순 반복 업무다. 일을 원하는 사람은 목록에서 자신이 원하는 업무를 선택하면 된다. 미캐니컬 터크를 통해 일을 구하는 사람들을 ‘터커(turker)’라고 부르는데, 작업은 터커들이 원하는 업무를 클릭하면 업무를 전달하는 웹 페이지로 연결되고, 업무를 마치면 다음 업무를 계속할지 물어보는 방식으로 이뤄진다. 미캐니컬 터크에 올라오는 업무의 급료는 보통 작업당 0.030.5달러고, 소요 시간은 짧게는 몇 분, 길어봤자 1시간이다. 미캐니컬 터크에 단순 반복 업무를 올리는 기업으로는 구글과 야후, 온라인 의류·신발 쇼핑몰 자포스닷컴 등이 있다.
 
바란케이는 미캐니컬 터크가 “업무 방식의 신지평을 연 플랫폼”이라고 말했다. “목록에 있는 과제는 인간의 판단력이 필요해서 컴퓨터가 수행하기는 불가능하지만, 그렇다고 정규직으로 만들기엔 부족한 업무들이다. 고용주는 자질구레한 지원 업무를 해결할 수 있고, 노동자는 용돈을 벌 수 있다.”
 
미캐니컬 터크는 많은 면에서 현장 실험에 적합했다고 바란케이는 말했다. 첫째, 자연적 환경이기 때문에 실험실 환경의 한계로 관찰이 불가능한 인간 행동양식을 볼 수 있다. 둘째, 실험 기간이 짧다. 미캐니컬 터크에는 12시간이면 끝나는 업무가 대부분이기 때문에 실험 시간을 크게 단축시킬 수 있었다. 물론 필요한 경우에는 장기적인 실험도 가능했다. 마지막으로, 터커들은 특정 회사 직원이나 실험 참여자보다 다양한 인구구조학적 배경과 특성을 갖추고 있었다. “가장 중요한 점은 미캐니컬 터크를 통해 실제 현장의 자료를 얻었다는 것이다. 얻기가 너무 힘들 뿐이지, 실제 환경에 대한 자료만큼 실험에 도움이 되는 건 없다”고 바란케이는 덧붙였다.
2주간 계속된 실험에서 바란케이는 이미지 파일을 분석하는 작업을 미캐니컬 터크에 게시했다. 구글이나 야후 등의 기업이 제안하는 업무와 조금도 다를 게 없는 작업이었다. 요율은 완성도와 상관없이 작업 4개당 0.05달러였다. 다시 말해, 작업 결과가 어떻든 간에 터커들은 같은 돈을 받아갔다.
 
실험 1단계에서 바란케이는 2개의 동일한 업무를 게시했다. 그러나 첫 번째 경우에는 작업이 완성됐을 때 작업의 정확도에 대한 평가 결과를 알려줬고, 두 번째 경우에는 그렇게 하지 않았다. 직원들이 자신의 평가 등급을 알고 싶어 한다는 기존 통념을 감안하면, 첫 번째 그룹의 업무는 당연히 더 높은 인기를 끌어야 했다. 그러나 결과는 그렇지 않았다. 정확도 결과를 알려주지 않은 두 번째 업무에는 총 254명의 근로자가 몰렸던 반면, 평가 결과를 알려 준 첫 번째 업무에는 76명의 근로자만이 자원했다.
 
놀라운 결과였지만, 이를 통해 ‘감춰진 선호도 이론(The paradigm of revealed preferences)’이 입증된 셈”이라고 바란케이는 말했다. “경제학자들은 사람들이 스스로 무엇을 원한다고 밝히는 말을 잘 믿지 않고, 실제로 무엇을 선택하는지 살핀다. 선택이야말로 이들이 진짜 원하는 것을 알려주기 때문이다. 이 경우 사람들은 자신의 평가 등급에 대해 모르는 쪽을 택했다. 업무 완성도를 알고 싶다고 답한 사람이 74%에 달했던 실험 후 설문조사 결과와 모순되는 선택이다.”
 
평가 등급이 업무 의욕에 미친 영향
실험 2단계에서 바란케이는 작업자들을 무작위로 2개의 그룹에 배정했다. 첫 번째 그룹은 등급을 받지 않는 대조군이었고, 두 번째 그룹은 등급과 함께 평가 내용을 알려주는 실험군이었다. 이후 그는 작업자 모두에게 e메일을 보내 추가 작업을 요청했다. e메일 내용은 동일했다. 하지만 실험군에 속한 작업자에게는 작업의 정확도와 함께 평가 순위를 추가로 알려줬다. 사람들에게 평가 등급을 알려주는 행위가 향후 이들의 작업 의욕과 함께 작업의 양과 질에 어떤 영향을 미치는지 알기 위해서였다.
 
작업의 정확도를 알려주지 않은 대조군의 경우 66%가 추가 작업에 응했다. 하지만, 실험군에서는 42%만이 추가 작업에 응했다. 또 추가 작업을 위해 돌아온 실험군 참여자들은 대조군보다 생산성이 22% 낮았다. 직원에게 평가 등급을 알려주면 뛰어난 직원은 더욱 열심히 노력하고 뒤떨어진 직원은 분발한다는 기존 관념과는 다른 결과였다. “사람들은 일을 잘한다고 인정 받으면 느슨해지고, 못한다고 질책 받으면 의욕이 꺾인다”고 바란케이는 말했다.
 
이번 연구 결과는 업무 성과가 낮은 직원에게 안 좋은 평가를 주면 직원이 스스로 퇴사해서 고용인이 직접 해고하는 수고를 덜게 된다는 기존 통념에도 반론을 제기했다.
 
사람들은 평가 결과를 공개하면 하위권에 있는 직원은 자신이 그 자리에 맞지 않는다는 사실을 깨닫고 얌전히 물러나서 결국 회사에 이득이 된다고 믿는다”고 바란케이는 말했다. “또 평가 등급을 공개하면 최고의 직원을 붙잡아둘 수 있다고 생각한다. 그러나 이는 사실이 아니다. 유능한 직원은 새로운 도전을 찾아 떠나는 반면, 성과가 낮은 직원은 달리 갈 데가 없기 때문이다.”
 
물론, 특정 경우에는 평가 내용을 공개해서 직원의 근로 의욕을 고취시킬 수도 있다. 그러나 전체적으로는 전혀 그렇지 않다”고 그는 덧붙였다. “그렇기 때문에 (직원에게 평가 등급을 매기는 일이) 그만한 가치가 있는지 반드시 따져봐야 한다.”
 
바란케이는 자신의 논문에서 앞으로 평가 등급의 영향을 다양한 근로 환경에서 실험할 필요가 있다고 설명하며 다음과 같이 덧붙였다. “데이터의 상세 메커니즘을 알려줄 숨은 변수가 무엇인지 알아내야 한다. 그렇게 해야만 눈에 띄지 않는 직원 간 차이를 감안한 평가가 직원의 성과를 개선할 수 있는지 여부를 예측할 수 있다.” 그러나 현 단계에서는 “등급과 함께 평가 내용을 알려주면 직원 성과에 오히려 해가 된다는 결과만 나왔을 뿐”이라고 그는 말한다.
 
바란케이는 연구를 통해 평가 등급 공개가 생산성 향상으로 이어지지 않는다는 사실을 확인했다. 그러나 평가 등급이 보너스나 승진 등의 보상과 연결되면 직원 생산성 및 성과가 향상된다는 사실은 이미 여러 자료로 입증됐다. 이렇게 전혀 다른 2개의 상황을 조합하면 새로운 사실이 발견된다고 바란케이는 말했다.
 
경영진이 굳이 개입하지 않아도 평가 등급과 상대적인 성과가 투명하게 밝혀지는 업종에서는 평가 등급과 재정적 보상을 연계하는 것이 좋다. 보상없이 직원을 서로 비교하면 의욕 하락으로 이어질 가능성이 있기 때문”이라고 바란케이는 제안했다. “그러나 직원이 자신과 동료의 성과를 비교하지 못하는 사무 환경에서 보상과 연계하지 않고 직원의 평가 결과만 게시한다면 이는 결코 현명하지 못하다.”
 
따라서 고용주는 직원 개개인이 평가에 어떻게 반응할지 예측해서 평가 결과의 공개 여부를 결정해야 한다. “훌륭한 고용주라면 자신의 직원을 잘 파악하고 이들이 평가에 어떻게 반응할지 정확히 예측할 수 있다”고 바란케이는 말했다. “우선 평가 내용을 공개할 것인지, 그렇다면 직원 개개인은 어떻게 반응할지 곰곰이 생각해야 한다. 만약 직원이 평가 등급에 긍정적으로 반응하고 일에 더 매진할 것 같다면, 평가 내용을 공개하라. 그러나 이런 결정은 직원에 따라 달라져야 한다는 사실을 유념해야 한다.”
 
편집자주 이 글은 미국 펜실베이니아대 와튼 MBA스쿨의 온라인 매거진 <Knowledge @ Wharton>에 실린 ‘Ranking Employees: Why Comparing Working to Their Peers Can Backfire’ 기사 전문을 번역한 것입니다.
관련기사