241호 (2018년 1월 Issue 2)
‘진짜 예측’을 하기 위해 데이터과학자에게 요구되는 역량은 엄청나게 많아졌다는 것이다. 현시점에서 완벽한 데이터과학자가 되기 위해 필요한 모든 기술과 학문을 지하철 노선도처럼 순서대로 나눈 걸 보면 거의 서울 지하철 수준이다. (그림 2) 그렇다면 정말 저 모든 것을 한 사람이 다 알아야 하는가. 물론 아니다. 각각의 노선도가 그려져 있듯이 비즈니스별로 하나의 노선을 택하고 각 기업 내에서 교육할 수 있는 것만 하고 자유롭게 필요한 인력을 갖다 쓰면 된다. 이 중에 기업에서 빅데이터 활용 전략을 고민하는 분들이 있다면, 내 회사에 필요한 데이터 분석이 어떤 것인지, 저 노선도 중에 어떤 노선인지를 파악하고 ‘도메인’ 지식, 즉 그 산업과 비즈니스와 연결돼 꼭 필요한 지식이 있다면 교육과 육성을 하고 다른 역량은 외부에서 그때그때 영입해서 쓰거나 아웃소싱을 하는 방식으로 해결해나가면 된다. 저 노선도에 그려진 모든 지식을 한 사람이 다 배우는 건 평생 걸려도 불가능하다. 최근에는 자신의 비즈니스 영역 지식을 근간으로 데이터 전문가와 충분히 소통하고 업무 지시와 관리를 할 수 있는, 또 협업할 수 있는 수준의 ‘시티즌 데이터과학자’라는 용어도 나왔다. 또 엄청난 코딩능력이 없어도 웬만큼 데이터를 분석하고 다룰 수 있는 프로그램이 나왔다. 중요한 건 영역의 지식과 데이터 분석 관점의 제대로 된 결합이지 지금까지 나와 있는 모든 데이터과학 지식의 섭렵이 아니라는 의미다.