Management Information Systems

알고리즘이 어떻게 성차별적 결과를 불러올까

309호 (2020년 11월 Issue 2)

014


Based on “Algorithmic Bias? An Empirical Study of Apparent Gender-Based Discrimination in the Display of STEM Career Ads.” by Anja Lambrecht & Catherine Tucker (2019) in Management Science, 65(7): pp.2966-2981.

무엇을, 왜 연구했나?

의사결정을 자동화하기 위한 인공지능 알고리즘의 활용이 늘어나고 있는 다른 한편으로 알고리즘의 편향 및 공정성 문제가 대두하고 있다. 특히 선행 연구에 따르면 알고리즘 기반 디지털 광고의 경우 역사적으로 차별을 받아온 여성, 흑인 및 소외계층은 원하지 않는 광고에 노출될 확률이 높은 반면 정작 필요로 하는 광고에는 노출될 확률이 낮은 것으로 나타났다. 그로 인해 검색 엔진에서 흑인 이름을 검색하면 신원 조회 관련 광고를 볼 확률이 높고, 여성은 임원 대상 비즈니스 코칭 관련 광고를 보게 될 확률이 낮은 현상이 발생한다. 하지만 이 같은 현상이 프로그래머의 편향된 가치관 또는 무의식적 편향 때문인지, 아니면 알고리즘이 편향된 데이터를 학습한 결과 때문인지 등 알고리즘이 어떻게 편향된 결과를 야기하는지에 대한 연구는 없었다.

런던비즈니스스쿨과 매사추세츠공과대 연구진으로 구성된 본 연구팀은 과학, 기술, 공학, 수학(STEM) 관련 인력 교육 및 구인 광고를 활용한 실험을 통해 알고리즘이 어떻게 편향된 결과를 이끌어 내는지를 연구했다. STEM 인력 양성은 특히 정책 입안자에게 중요한 이슈이다. 많은 정책 입안자가 STEM 분야에 여성 인력이 부족한 문제를 해결하기 위해 보다 많은 여성에게 STEM 관련 교육 및 구인 정보를 전달하고, 해당 분야로의 진출을 장려하고 있다. 본 연구는 STEM 인력 교육 및 구인 광고에 초점을 맞춰 전 세계를 대상으로 알고리즘 편향 현상을 분석했다.

016


무엇을 발견했나?

연구팀은 전 세계 191개 국가의 페이스북 사용자를 대상으로 ‘STEM 커리어에 대한 정보’ 광고를 집행했다. 광고의 타깃은 18세 이상의 남성과 여성인데 사전 검증을 통해 남성과 여성의 해당 광고에 대한 반응률이 동일함을 밝혔다. 연구 결과, 해당 광고는 여성보다 남성에게 20% 이상 더 많이 노출됐다. 또 광고 노출의 남녀 간 차이는 25∼44살 사이의 그룹에 있어서 가장 두드러지게 나타났다. 그렇다면 남녀 간 사전 광고 반응률의 차이가 없음에도 불구하고 광고 노출 정도에는 차이가 난 이유가 무엇일까? 연구팀은 세 가지 잠재적 이유를 설명하고 분석했다.

첫째, 알고리즘은 실제 사용자의 광고 반응 데이터로부터 편향된 결과를 학습했을 것이다. 다시 말해, 남녀 간 광고 노출 정도의 차이는 사용자 데이터에 대한 알고리즘의 학습된 결과로 여성의 낮은 광고 클릭 확률에 기인할 수 있다. 그러나 여성이 광고 클릭을 덜 한다면 알고리즘은 여성의 클릭을 늘리기 위해 남성보다 여성에게 더 많은 광고를 노출시킬 것이다. 또 연구 결과에 따르면 광고에 노출됐을 때 여성의 광고 클릭 확률이 남성보다 높은 것으로 나타나 알고리즘이 사용자 데이터로부터 편향된 결과를 학습했다는 설명은 성립되지 않음을 증명했다.

둘째, 알고리즘이 광고 반응 이외의 데이터로부터 서로 다른 지역과 문화에 따른 성차별을 학습했을 것이다. 이 경우 광고 알고리즘은 각 국가의 문화적 차이에 따른 성 역할을 학습했을 가능성이 있다. 그러나 연구 결과, 각 국가의 여성 교육, 여성의 노동 시장 참여, 성 불평등 정도는 남녀 간 광고 노출 차이에 영향을 미치지 않음이 나타났다. 이는 알고리즘이 서로 다른 지역과 문화에 따른 성차별을 학습했다는 설명 또한 성립하지 않음을 보여준다.

마지막으로, 알고리즘에 따른 남녀 간 광고 노출 차이는 광고 생태계의 경제적 원리 때문일 수 있다. 온라인 광고 시장에서는 서로 다른 제품 또는 서비스의 광고가 고객의 눈길을 사로잡기 위해 경쟁한다. 즉, 타깃에 따라 광고의 경쟁 구도가 달라지고, 이는 비용으로 연결된다. 연구 결과, 전 세계적으로 여성을 타깃으로 한 광고 비용이 남성 타깃 광고 비용보다 비싼 것으로 나타났다. 전 세계적으로 온라인에서 여성의 구매력 및 광고 클릭 확률이 남성보다 높기 때문에 같은 광고라도 여성을 타깃으로 하게 되면 더 많은 비용을 지불해야 한다. 한정된 광고 비용으로 최대의 광고 효율을 위해서 알고리즘은 비용이 적게 들고 클릭 확률이 낮은 남자들에게는 더 많은 광고를 노출하고, 비용이 많이 들고 클릭 확률이 높은 여자들에게는 광고를 덜 노출시켰던 것이다. 특히, STEM 인력 교육 및 구인 광고 노출에서 남녀 간 차이가 크게 발생한 25∼44살 사이의 연령대에서 남성과 여성 사이의 비용 차이 또한 크게 나타나 남녀 간 광고 노출 차이는 광고 비용 차이에 의한 알고리즘의 광고 효율 최적화 때문임을 확인할 수 있었다.

연구 결과, 페이스북뿐만 아니라 구글 애드워즈, 인스타그램, 트위터를 통해서도 같은 실험을 반복한 결과 남녀 간 광고 노출 정도에 차이가 발생했다. 이런 성차별적 결과는 알고리즘이 광고 전달에 있어서 비용 대비 효율을 최적화하기 때문인 것으로 나타났다.

연구 결과가 어떤 교훈을 주나?

알고리즘으로 인한 성차별적 결과를 방지하려면 이론적으로는 성별에 따라 광고 캠페인을 관리하고 광고비를 각각 집행하면 될 것이다. 이 경우 실무자는 남녀 차이 없이 광고를 관리하고 노출시킬 수 있다. 이에 따라 연구팀은 검증 차원에서 페이스북에서 STEM 인력 교육 및 구인 광고를 성별에 따라 집행하고자 했으나 연방법에 어긋나는 성차별적 채용 광고라는 이유로 승인되지 않았다. 과거 차별을 방지하기 위해 채용에 특정 그룹을 타깃하거나 배제하는 것을 금지하도록 만든 정책이 오히려 오늘날 알고리즘으로 인한 편향을 보완하는 대책을 방해한다고 볼 수 있다. 날이 갈수록 디지털 콘텐츠의 노출과 확산에 있어 알고리즘의 중요성이 커지는 흐름을 감안해 정책 입안자는 플랫폼 사업자가 알고리즘으로 인한 편향을 보완하기 위해 적극적으로 데이터와 디지털 기술을 활용할 수 있도록 규제를 완화할 필요가 있다.

최근 많은 국가에서 정부 주도로 알고리즘 편향을 해결하고 투명성을 높이기 위해 플랫폼 사업자들에게 알고리즘 코드를 대중에게 공개할 것을 요구하고 있다. 그러나 본 연구는 알고리즘의 투명성이 담보될지라도 알고리즘으로 인한 편향된 결과가 도출될 수 있음을 보여준다. 알고리즘의 경제적인 효율 최적화 메커니즘과 알고리즘에 따른 편향 사이의 트레이드 오프가 발생하는 것이다. 따라서 정부기관은 플랫폼 또는 광고주에게 알고리즘으로 인한 편향된 결과에 대한 책임을 일방적으로 전가하기 보다 이처럼 알고리즘으로 인한 편향을 야기하는 잠재적인 경제 요인을 이해할 필요가 있다.

오늘날 기업에 디지털 광고는 필수적인 마케팅 채널이다. 디지털 광고를 통해 보다 효율적인 타깃 그룹 선정, 알고리즘을 통한 광고 효율 최적화 등이 가능해졌지만 본 연구는 이런 기술이 원치 않는 편향된 결과를 야기할 수 있음을 시사한다. 광고 실무자는 디지털 광고를 집행할 때 이런 기술적 한계를 적시하고 지속적으로 광고 결과를 모니터링할 뿐 아니라 편향된 결과를 바로잡을 수 있는 방안을 모색해야 한다.


이동원 홍콩과학기술대 경영대학 정보시스템(ISOM) 교수 dongwon@ust.hk
필자는 KAIST에서 컴퓨터공학 학사, IT 비즈니스 석사를 받고 미국 메릴랜드대에서 정보시스템 박사 학위를 받았다. 메릴랜드대에서 강의했으며 2017년부터 홍콩과기대 경영대학에서 조교수로 재직 중이다. 주요 연구 분야는 비즈니스 데이터 분석, 모바일 커머스, 디지털 넛지 디자인, 정보 시스템 경제 등이다.
동아비즈니스리뷰 310호 Ontact Entertainment 2020년 12월 Issue 1 목차보기