로그인|회원가입|고객센터
Top
검색버튼 메뉴버튼

데이터 표현 단위

241호 (2018년 1월 Issue 2)

고승연 고승연
고승연
동아일보 기자
seanko@donga.com
데이터 표현 단위

데이터란 무엇인가. 예전에는 데이터를 놓고 스몰데이터, 빅데이터로 나누는 경우가 많았다. 10페타바이트는 돼야 빅데이터로 분류할 수 있다고 말하는 데이터과학자들도 있었다. 그보다 작으면 스몰데이터라는 얘기였다. 그런데 이제는 그런 구분 자체도 의미가 없다. 2017년 한 해 동안 생산된 데이터가 150억 테라바이트다. 10페타바이트는 겨우 1만 테라바이트일 뿐이다. (그림 1) 인식 자체를 바꿔야 한다. 빅데이터를 ‘Big Data’, 즉 ‘Big’을 형용사로 놓고 생각하고 접근하면 안 된다. 이제는 그냥 데이터가 빅데이터다. 영어로 ‘Bigdata’라고 하나의 일반명사로 쓰는 게 맞다. 빅데이터 분석 방법, 빅데이터 처리 기술은 그냥 큰 데이터를 처리하고 분석하는 방법과 기술이 아니라 빠르고 스마트하게 처리하고 분석하는 것을 의미한다. 차라리 ‘fast data’ ‘smart data’라는 말이 더 어울릴지도 모른다.