우리는 모든 것을 비교하고 평가해서 등급을 내리고 점수를 매기는 세상에 살고 있다. 이는 소비자가 최신 전자제품을 비교할 때나 학부모와 정책가들이 학교나 공공제도를 평가할 때, 스포츠 팬이 응원 팀의 전력을 파악할 때에도 많이 이용된다. 만약 직원 성과를 평가할 때도 등급을 매긴다면 어떤 일이 벌어질까?
동료 직원과 비교해서 등급을 결정하면, 높은 등급을 받은 직원은 자신의 위치를 유지하기 위해, 낮은 등급을 받은 직원은 등급을 올리기 위해 더 열심히 노력한다는 속설이 있다. 그러나 와튼 경영대학원 경영학 교수 이완 바란케이(Iwan Barankay)는 최근 발표한 논문 ‘현장 실험을 통한 사회적 등급 및 평가 제도의 효과 검증(Ranking and Social Tournament: Evidence from a Field Experiment)’에서 이런 속설에 의문을 제기한다.
“동료 직원과 비교해서 성과를 평가할 때 직원들이 동료를 따라잡거나 추월하기 위해 일에 매진한다고 생각하는 경영진이 많다. 그러나 실제로는 정반대의 결과가 나온다”고 인사 및 노동경제학을 전공한 바란케이는 말했다.
“직원들은 오히려 나태해지거나 의욕을 상실할 수 있다. 높은 등급을 받은 직원은 ‘이미 최고인데, 더 노력할 필요가 있나?’라고 생각하고, 낮은 등급을 받은 직원은 자신의 능력에 좌절해서 아예 손을 놓아버릴 수 있다.”
바란케이는 2008년 금융위기 여파로 경제가 비틀거릴 때부터 직원 평가가 동기부여에 어떤 영향을 미치는지에 깊은 관심을 가졌다. 그는 금융위기 직전 월스트리트 금융인들이 천정부지의 보너스를 받아갔던 사실을 지적하며 금융위기는 직원의 실적을 기준으로 금전적 인센티브를 제공하는 관행이 의도치 않은 결과를 낳는 사실을 명확히 보여준 사례라고 말했다.
“금전적 인센티브가 더 이상 효과적이지 않은 상황에서 직원이 더 열심히 일하도록 독려하려면 어떻게 해야 하는지 알고 싶었다. 사람은 타인과 비교한 자신의 상대적 지위에 민감하다는 통념이 있다. 다시 말해, 사람은 비교 기준의 집단보다 자신이 우월하거나 혹은 떨어진다고 느낄 때, 행복이나 불만을 느낀다”고 그는 말했다. “물론 금전적 보상과 연계될 경우, 등급은 중요해진다. 그러나 여기에서 나는 등급 자체를 하나의 보상으로 간주했다. 또 근로자들이 동료와 비교한 자신의 등급을 진정으로 알고 싶어하는지 확인하려고 했다. 더불어 이들이 자신의 평가 등급을 알게 됐을 때 등급을 올리기 위해 더 많은 노력을 기울이는지도 궁금했다.”
의도치 않은 결과
바란케이는 집단 노동력 활용을 위한 아마존닷컴의 웹서비스인 ‘미캐니컬 터크(Mechanical Turk)’를 통해 330명의 직원을 모집했다. 미캐니컬 터크는 온라인 상에서 특정 업무를 수행할 근로자를 모집하고 업무 결과물을 전달받는 플랫폼이다. 미캐니컬 터크 구인란에 고용주들이 게시하는 업무는 보통 사진 파일 분류, 텍스트 만들기 및 편집, 기본 데이터 입력 등 단순 반복 업무다. 일을 원하는 사람은 목록에서 자신이 원하는 업무를 선택하면 된다. 미캐니컬 터크를 통해 일을 구하는 사람들을 ‘터커(turker)’라고 부르는데, 작업은 터커들이 원하는 업무를 클릭하면 업무를 전달하는 웹 페이지로 연결되고, 업무를 마치면 다음 업무를 계속할지 물어보는 방식으로 이뤄진다. 미캐니컬 터크에 올라오는 업무의 급료는 보통 작업당 0.03∼0.5달러고, 소요 시간은 짧게는 몇 분, 길어봤자 1시간이다. 미캐니컬 터크에 단순 반복 업무를 올리는 기업으로는 구글과 야후, 온라인 의류·신발 쇼핑몰 자포스닷컴 등이 있다.
바란케이는 미캐니컬 터크가 “업무 방식의 신지평을 연 플랫폼”이라고 말했다. “목록에 있는 과제는 인간의 판단력이 필요해서 컴퓨터가 수행하기는 불가능하지만, 그렇다고 정규직으로 만들기엔 부족한 업무들이다. 고용주는 자질구레한 지원 업무를 해결할 수 있고, 노동자는 용돈을 벌 수 있다.”
미캐니컬 터크는 많은 면에서 현장 실험에 적합했다고 바란케이는 말했다. 첫째, 자연적 환경이기 때문에 실험실 환경의 한계로 관찰이 불가능한 인간 행동양식을 볼 수 있다. 둘째, 실험 기간이 짧다. 미캐니컬 터크에는 1∼2시간이면 끝나는 업무가 대부분이기 때문에 실험 시간을 크게 단축시킬 수 있었다. 물론 필요한 경우에는 장기적인 실험도 가능했다. 마지막으로, 터커들은 특정 회사 직원이나 실험 참여자보다 다양한 인구구조학적 배경과 특성을 갖추고 있었다. “가장 중요한 점은 미캐니컬 터크를 통해 실제 현장의 자료를 얻었다는 것이다. 얻기가 너무 힘들 뿐이지, 실제 환경에 대한 자료만큼 실험에 도움이 되는 건 없다”고 바란케이는 덧붙였다.