로그인|회원가입|고객센터
Top
검색버튼 메뉴버튼

공공 분야 빅데이터 전략

교통 빅데이터엔 시간-공간 정보 가득,‘스마트시티 구축 전략’에 필수적

허정우,고승연 | 250호 (2018년 6월 Issue 1)
Article at a Glance

교통 분야 공공 데이터는 ‘데이터 수집의 용이성’ ‘정보 공유의 용이성’ ‘반복성과 대표성’ ‘인과관계보다 현 상황에 대한 이해 위주’ 등의 이유로 수집과 분석이 상당히 쉬운 데이터로 분류됐다. 그러나 최근 빅데이터 분석을 위한 데이터 통합과 ‘예측’에 대한 니즈가 커지면서 문제점이 나타나기 시작했다. 이렇게 나타난 문제점을 정책적으로 해결하기만 한다면 교통 분야 빅데이터는 공공정책 분야는 물론 민간 비즈니스 영역에서도 큰 가치를 창출할 수 있다. 서울시 심야버스, 영국과 싱가포르의 교통 정책 등 이미 성공 사례가 존재하며, 미국에서는 민간 교통정보 업체가 정책과 비즈니스에 도움을 주는 새로운 가치를 창출하고 있다. 교통 정보 데이터는 단순히 교통 당국과 교통수단 이용자만이 아니라 전혀 다른 영역의 비즈니스에서도 활용될 수 있다.

미국의 실업률 증가는 누가 가장 먼저 예측했을까?

2011년, 금융위기를 넘기면서 점차 회복되던 미국의 경제가 주춤하기 시작했다. 물론 정치인들은 이를 부정하고 있었다. 당연히 정부가 발표하는 수치에도 실업률 증가 추세는 나타나지 않았다. 하지만 미국의 여러 자동차회사로부터 운행 중 차량 데이터를 얻어 이를 종합하고 가공하는 민간 교통정보 업체가 이를 정확하게 잡아냈다. 러시아워에 길이 덜 붐빈다는 걸 보고 ‘실업률 증가 가능성’을 제기했다. 그리고 몇 달 뒤 이는 사실로 드러났다.1

실제 사람들이 실업 상태에 들어가면 실업수당을 신청하고 새로운 직장을 알아보면서 지역과 중앙정부 산하의 기관에 접촉하기 전 한두 달 휴식을 취하는 경우가 많다. 그런데 이런 휴식 기간은 공식 실업률 통계에 전혀 반영되지 않는다. 교통정보 업체는 러시아워 시간대의 교통정보를 보고 실업률 증가를 거의 실시간으로 예측했지만 정부 공식 통계로 나타나기 전까지 시차가 있던 셈이다. 이렇듯 교통 정보를 교통에만 국한된 정보로 보지 않고 다른 관점에서 접근하면 새로운 통찰을 얻을 수 있다. 실제 미국 실업률 증가를 예측했던 기업 인릭스(Inrix)는 교통정보를 활용해 지역 경제의 건강을 측정하기도 한다. 이 업체의 데이터를 통해 소매 업체의 판매실적이나 레저활동의 패턴 등을 읽을 수 있다. 이번 호에서는 이처럼 다양한 영역에서 활용할 수 있는 ‘전통의 빅데이터’ 교통 정보의 데이터 특성에 대해 알아보고, 정책과 비즈니스 영역에서의 활용 사례, 그리고 정책과 비즈니스가 맞물리는 지점에 대해 설명하고자 한다.

113


교통정보의 특성: 일기예보와 교통 예측

우리는 뉴스를 통해 어떤 사건이 발생했는지를 알게 된다. 뉴스의 대부분은 당일 혹은 전일에 발생한 다양한 사건을 종합해 시청자에게 제공한다. 그런데 이렇게 제공하는 정보 중 일기예보와 교통정보는 일반적인 뉴스와 약간 이질적인 면이 있다. 우선 뉴스가 과거의 정보를 제공하는 데 비해 일기예보는 미래의 가능성을 제공한다. 이런 측면에서 일기예보는 ‘시점의 이질성’을 갖고 있다. 또 뉴스가 제공하는 정보는 사건 발생 직후부터 짧게는 수 시간에서 길게는 하루 이상 유효한 데 비해 교통정보는 1시간만 지나도 그 정보의 효용성이 떨어진다. 따라서 교통정보는 ‘정보 유효 시간의 이질성’도 지니고 있다. 그뿐만 아니라 이 두 정보는 매일 반복되기 때문에 사람들이 어느 정도 예측할 수 있지만 매일 다른 상황이 발생한다는 특징도 있다. 특히 교통정보는 정보 제공 후의 짧은 유효 시간 내에 정보 이용자의 의사결정을 바꿀 수 있기 때문에 예상하지 못한 새로운 상황을 유발하기도 한다.

일기예보 및 교통정보는 매일 반복된다는 특성을 갖고 있기 때문에 과거 데이터와 인공지능을 활용해 예측 정확성을 높이려는 시도가 이어지고 있다. 하지만 일기예보는 인공지능이 활용하는 방법론(과거 데이터를 기반으로 미래를 예측)의 정확도가 수치예보모델2 보다 높지 않아 아직까지는 유의미한 성과를 내지 못하고 있다. 물론 꽃가루 고농도일 예측과 같은 일부 영역에서는 인공지능을 활용한 예측이 이뤄지고 있다. 하지만 기상 분야는 수치예보모델의 예측 정확성 향상이 우선 과제다. 인공지능은 수치예보모델의 예측 결과를 예보관이 해석할 때의 오류를 줄이기 위해 보조적으로 활용하는 방향으로 발전하고 있다.

역할 측면에서 보조적 성격이 강한 일기예보와는 달리 교통 분야에서는 빅데이터 시대가 도래하기 전인 1990년대 이전부터 과거 데이터를 기반으로 예측하려는 시도가 이어져왔다. 교통 분야에서 데이터 분석과 활용이 활발했던 이유는 다음의 네 가지 요인으로 정리해 볼 수 있다.

교통 분야에서 데이터 분석과 활용이 활발했던 이유와 최근 나타난 문제점

과거 교통 데이터 분석·활용을 활발하게 했던 첫 번째 요인은 ‘데이터 수집의 용이성’이다. 이는 과거 교통 데이터가 [그림 1]에서의 ‘특정 지점 A’나 ‘구간 A-B’와 같은 특정 구간, 즉 ‘폐구간’을 기준으로 수집됐기 때문이다. 여기서 폐구간은 ‘선분 A-B’와 같은 ‘복잡성이 없는’ 구간을 말한다.

114


이렇게 데이터는 차곡차곡 쌓이고 있었지만 시대가 변하면서 문제가 발생했다. 도로가 이전보다 훨씬 촘촘하게 건설되면서 폐구간 외에 [그림 1]의 ‘구간 A-E’처럼 ‘개구간’ 데이터의 중요성이 급부상했기 때문이다. 이러한 개구간은 폐구간과 많은 차이가 난다. 우선, 지점A 통과자와 지점E의 통과자가 같지 않고, 지점A를 출발하는 특정인은 지점 B와 C를 통과해 E로 이동할 수도, B만을 통과해 갈 수도 있다. 즉, 경로의 다양성이 발생한다. 이러한 두 가지 특성이 결합됐을 때, 지점A에서 E로의 이동 정보를 분석하려면 ‘최악의 경우’ 데이터 수집 시 특정인의 이동경로를 개별적으로 추적해야 한다. 만약 ‘구간 A-E’가 폐구간이었다면 도착지 E의 통과자만 조사하면 된다. 하지만 개구간에서는 E를 통과한 사람이 어떤 경로로 도달했는지를 중간 지점마다 역추적해야 한다. 이 경우 데이터 수집 방법은 크게 조사자(또는 조사장치)가 표본과 함께 이동하거나 혹은 조사자(또는 장치)를 경로상에 촘촘히 배치하는 등의 새로운 방법을 모색해야 한다. 이 두 방식 모두 데이터 수집 비용의 급증을 가져온다. 정보량이 n배 증가할 때 데이터의 양은 최대 2의 n제곱으로 증가하기 때문이다.

과거 교통 데이터 분석 및 활용이 활발했던 두 번째 요인은 ‘정보 공유의 용이성’ 때문이었다. 교통 데이터는 정보 생성의 경로 차원에서 크게 다음의 네 가지 데이터로 구분할 수 있다.

1) 통행자 : 교통카드 기록과 같이 각 개인의 움직임에 따라 생성되는 데이터
2) 운행수단 : 교통수단의 움직임에 대한 데이터
3) 인프라 : 교통수단이 교통 인프라를 이용함에 따라 생성되는 데이터
4) 운영자 : 교통 인프라 운영자가 시스템 관리·운영 차원에서 수집하는 데이터

폐구간에서는 이들 교통 데이터의 상호 연계 수준은 높지 않았다. 따라서 대부분 ‘독립적이고 개별적인 데이터’가 주를 이뤘다. 예를 들면 통행자 데이터와 교통수단 데이터는 별도로 수집되고 공유돼왔다. 하지만 이런 관행은 최근 들어 문제를 야기하고 있다. 폐구간보다 개구간의 중요성이 높아지면서 과거에 독립적으로 산출됐던 데이터들이 동시에 취합·산출되거나 기존에 산출된 데이터 간 통합이 필요해졌기 때문이다. 과거에는 데이터의 수집 주체가 다양하고 이들의 수집 목적과 방식, 구조 등이 다양했는데 이 역시 문제로 지적되고 있다. 데이터 구조가 달라 개별 정보를 통합하기가 어렵기 때문이다. 예를 들어 통행자 데이터와 운행수단 데이터를 통합할 때 통행자 데이터는 ‘분 단위’로, 운행수단은 ‘12시간 단위’로 취합됐다면 정보 통합 과정에서 문제가 발생한다. 설사 데이터 구조가 표준화돼 있더라도 상이한 데이터를 통합하기 위해서는 특정한 연결고리가 필요하다. 그런데 교통정보의 경우 ‘개인정보’가 그 연결고리가 될 가능성이 상당히 높다. 그런데 개인정보보호 관련 규정 등으로 인해 정보 확보나 활용이 어려운 상황이 생길 수 있다. 그뿐만 아니라 민간기관들은 수집한 정보를 자사의 이익 극대화에 활용하기 위해 타인과의 공유를 꺼리는 사례도 많다.

과거 교통 데이터 분석·활용을 활발하게 했던 세 번째 요인은 ‘반복성’과 ‘대표성’이었다. 비슷한 형태의 데이터가 일관되게 오랜 기간 축적되면 활용도가 매우 높아진다. 의료와 범죄예방 영역에서 빅데이터 분석이 우선 적용된 이유 중 하나는 과거부터 일관된 형태로 데이터가 관리됐기 때문이었다. 과거에는 도로 등 기반 인프라의 변화 속도가 더뎠을 뿐만 아니라 데이터 취합과 분석의 대전제로 ‘폐구간’ 개념이 주를 이뤘다. 즉, 과거에는 분석자가 원하는 체계로 데이터가 취합되지 않았어도 새로 데이터를 취합해 분석하는 데 어려움이 별로 없었다는 얘기다. 그리고 데이터의 획기적 변화를 가져오는 요인 역시 많지 않았다. 이로 인해 모집단의 극히 일부를 활용한 표본조사만 실시해도 일정 수준의 대표성을 확보할 수 있었다. 하지만 도로망이 복잡해지면서 개구간 분석의 필요성이 커진데다 교통 데이터 정보의 생성 경로가 다양해지면서 데이터의 구조적 변화를 야기하는 요인이 자주 발생하고 있다. 따라서 짧은 시간 동안 확보한 교통 데이터는 과거만큼의 대표성을 가질 수 없다.

과거 교통 데이터 분석·활용을 활발하게 했던 마지막 요인은 교통 분야에서 데이터 분석 모형이 ‘인과관계 규명을 토대로 한 예측’보다 ‘현 상황에 대한 이해’를 중심으로 발전했기 때문이다. 앞서 언급한 세 가지 요인은 과거에 데이터 취합이나 분석을 용이하게 했지만 현재는 제약이 되는 요인으로 작용하고 있다면 마지막 요인은 현시점에서도 일정 수준 유지되고 있다는 점에서 차이가 있다. 교통 분야에서 많이 활용되는 분석은 국민의 교통 이용 현황에 대한 파악, 통행패턴 분석 후 문제가 상습적으로 발생하는 지역이나 수단에 대한 잠재수요 및 대안 모색 등을 목적으로 하는 경우다. 실제 데이터 분석을 통해 나타난 문제점을 정책적으로 해결해나간다면 교통 분야 공공 빅데이터 분석은 엄청난 가치를 창출할 수 있다. (‘DBR minbox: 교통정보 빅데이터 활용을 위해 선행돼야 할 일’ 참고.)
DBR mini box I 
교통정보 빅데이터 활용을 위한 선행 과제

우리나라는 1994년 고속도로 지능형교통체계(이하 ITS) 시범사업을 시작한 이래 2001년부터 약 10년간 2조 원이 넘는 돈을 투자해 전국적으로 공공 부문 ITS 구축사업을 수행했다. 그 결과 인구 10만 명 이상의 도시 대부분에서 교통과 관련한 빅데이터 수집이 이뤄지고 있다. 하지만 서울시 등의 극히 일부 사례를 제외하면 현재 교통상황을 보여주는 것 이외에 공공 부문에서 이를 활용한 사례는 거의 없는 것도 사실이다. 앞서 언급했던 주요 사례를 기반으로 교통 부문에서 성공적인 빅데이터 활용을 위한 시사점을 정리하면 다음과 같다.

첫 번째, 데이터의 정책 활용 측면에서의 접근을 강화해야 한다. 초기 ITS 도입 목적이 ‘이용자에게 실시간 교통정보를 제공하는 것’에 있었기에 최근 각광받는 방식으로 빅데이터를 분석하고 이를 관리할 수 있는 운영 시스템을 갖추는 데는 다소 어려움을 겪고 있다. 장기적으로는 교통정보 제공 기능 외에도 이를 분석해 정책적으로 활용하는 역량 확보(구체적으로는 교통 데이터를 기반으로 시사점을 도출하고 전문적으로 분석하고 활용할 수 있는 인력 확보와 이를 가능케 하는 소프트웨어에 대한 투자 등)가 필요하다. 특히 교통 정책에 기본적인 데이터가 되는 가구통행실태조사는 5년을 주기로 1%의 표본을 추출해 하루 동안의 교통수단 이용 내역과 행선지에 대한 설문조사를 수행한다. 그리고 이러한 표본의 대표성, 비용 투입의 필요성, 결과의 정확성 등에 대해서는 많은 논란이 벌어지는 것도 사실이다. 우리나라뿐만 아니라 미국에서도 유사한 형태의 논란이 벌어졌는데 현재 생산되는 교통 빅데이터를 활용할 경우 ‘표본의 문제’를 해결할 가능성이 높아지는 것으로 나타나 활발한 연구가 진행되고 있다.

두 번째, 빅데이터 취합·저장·관리에 대한 표준 확립이 필요하다. 서울시가 대중교통 체계를 개편할 수 있었던 가장 큰 이유는 분절돼 있던 이용자와 공급자 간 데이터를 통합해 새로운 가치를 찾아냈기 때문이다. 이렇게 통합할 수 있었던 것은 취합되는 데이터의 주기와 그 내용 측면에서 일정 수준 이상 유사성을 확보했기 때문이다. 미국의 경우 국가표준을 설정해 ITS 자료를 관리하고 있는 반면 우리나라는 자료 처리·저장·관리에 대한 명시적 표준지침이 존재하지 않는다. 따라서 현재 각 지자체가 구축하고 있는 분석 시스템 간의 상호 연계를 통한 국가 차원의 자료 수집 분석 시에는 장애가 발생할 가능성이 높다. 특히 현재까지는 지역 단위로 ‘실시간 교통정보 제공’ 및 ‘폐구간’ 중심의 분석이 주로 이뤄졌고 지자체들은 자체적 판단에 의해 짧은 기간(15일∼6개월)의 데이터만 보관하고 있다. 국가 차원의 정책 입안을 위해서 지자체에서의 폐구간 조건을 완화할 필요가 있으며 연 단위 DB로 통합이 이뤄져야 한다. 또 장기적으로는 공공과 민간 데이터 공유를 위한 데이터 표준화 방안까지도 생각해볼 필요가 있다.

교통 데이터, 어떻게 활용되고 있는가?

우선 국내외 교통 부문에서 현재 이뤄지고 있는, 혹은 이미 성공한 데이터 분석 사례를 살펴보자. 우리가 가장 손쉽게 접할 수 있는 사례는 현재 교통상황에 대한 정보를 제공하면서 대안 경로와 비교 분석해주는 서비스다. 최근 급속히 발전한 차량 내비게이션을 생각하면 이해가 쉽다. 전국 어디에서나 현 위치에서 주요 지점까지 걸리는 평균 시간과 속도를 알 수 있는데 이는 사실 가장 간단한 교통 부문의 데이터 분석에 해당한다.

이를 확장한 개념은 ‘통행패턴에 대한 분석’이다. 특정 지점에서의 (혹은 특정 지점 간) 통행량이나 통행 유형을 분석하는 것이다. 즉, 특정 시간대의 통행 수준 혹은 특정 지역으로의 통근자 수 등과 같은 것들을 보여주는 것이다. 최근 들어 대부분의 교통 데이터 분석은 이 통행패턴 자료를 기반으로 이뤄지고 있으며 대부분 도로를 중심으로 이뤄지고 있다. 이는 교통 분야에서 도로가 차지하는 비중이 높기 때문만은 아니다. 항공·철도·선박과 같은 분야는 발권 수 등을 집계하고 명확한 형태의 ‘폐구간’으로 이뤄져 있어 이용 인원, 물동량, 평균 속도 등을 분석하기가 매우 쉽다. 하지만 도로는 고속도로와 같은 유료도로가 아닌 한 기초 자료 수집이 어렵고 개구간으로 돼 있어 데이터 수집 분석이 무척 어렵다. 미국에서는 고속도로 자동 수납 시스템에서 수집된 정보를 활용해 시점과 종점 분석을 수행하는 동시에 번호판 인식 시스템을 통해 진출입 기록을 확보해 보완적 정보를 얻고 있다. 또 자동 수납 시스템 이용자를 대상으로 온라인 설문을 수행하는 등 통행자의 특성을 수집하는 노력도 병행하고 있다. 이를 통해 구간별로 어디에서 어떤 형태의 통행량이 많은지, 정체를 해소하기 위해 어떤 구간에 대안을 마련해야 하는지 등을 파악한다. 이러한 분석은 하이패스 시스템 데이터를 토대로 국내에서도 이뤄진 바 있다.

최근 들어 통신사의 이동통신 신호 정보와 GPS 정보를 연계해 통행정보를 유추하거나(미국·한국), 심지어 출퇴근 시의 소셜미디어 위치 정보를 수집·활용함으로써 특정 지역의 통행량을 분석(미국)하는 시도도 이어지고 있다. 이러한 통행패턴에 대한 조사는 교통 인프라 운영자(혹은 교통 관련 정책운영자)에게 교통량·속도·차량 정체·첨두시간(하루 중 차량의 도로 점유율이 가장 높은 시간) 등의 정보를 제공함으로써 단기적으로는 신호 체계 등 교통 정책의 개선의 근거로, 장기적으로는 도로의 확장 및 대안 인프라의 투자 기반의 근거로 활용되고 있다.

1. 공공 분야에서의 활용

앞서 설명한 통행패턴 조사 결과를 교통정책 개선에 활용한 대표적인 예로 영국과 싱가포르 사례를 들 수 있다. 영국의 런던교통국은 오이스터카드(교통카드) 정보, 시내 교통 상황 정보, 인프라 정보 및 교통국을 팔로하는 시민들의 소셜미디어 기록 등을 통합해 데이터베이스화한 후 이를 교통 정책 개선에 활용한다. 예를 들어 교량 보강작업을 수행할 경우 해당 교량 통제로 인해 영향을 받을 것으로 예상되는 시민들을 대상으로 대안 경로를 안내하거나 지하철 이용객 특성을 분석해 첨두시간 수요를 분산하기 위한 정보를 제공한다. 이를 통해 시민의 불편을 최소화하고 있다. 싱가포르교통부 역시 대중교통의 수요-공급이 불일치한 지점을 선별해 노선을 신설하거나 첨두시간에만 운영하는 셔틀을 추가함으로써 수요와 공급을 일치시킨다. 또 택시가 승객 없이 배회하는 시간을 줄이기 위해 승객이 택시를 필요로 하는 지역과 택시가 승객을 찾아 운행할 수 있도록 정보를 제공해 ‘승객의 편의’와 ‘교통수단의 운영효율’을 높이는 효과를 얻었다.

국내에서는 서울시의 심야버스 노선 도입이 대표적 사례다. 서울시는 버스·지하철 운행이 종료되는 시점 이후 택시의 승차 거부 민원이 많아지자 2013년 심야버스 도입을 결정했다. 지하철의 경우 노선 변경이 어렵고 운행을 위해서는 버스보다 상대적으로 많은 사람이 필요하기 때문에 버스를 활용하기로 한 것이다. 서울시는 더 많은 시민이 이를 활용할 수 있도록 시민의 통행패턴 분석 자료를 활용해 최적 노선을 설계했다. 구체적으로는 서울시가 이미 구축해 확보하고 있는 택시의 시종점 분석 데이터 중 심야시간의 운행기록을 기반으로 초기 노선을 도출했다. 그리고 택시의 시종점 데이터가 전체 시민의 이동을 대표하는지를 검증하기 위해 이동통신사의 데이터를 활용해 심야 통신기록 및 요금청구지 주소를 비교하고, 유동인구 밀집도를 분석해 2개 노선을 확정했다. 2017년 현재 서울에는 9개 노선의 심야버스가 운행 중인데 버스 1대당 평균 승차 인원은 주간보다 많고 시민의 만족도도 높은 것으로 나타났다.3 (DBR minibox: ‘대중교통 체계 개선 성공요인’ 참고.)

DBR mini box II 
대중교통 체계 개선 성공 요인

서울·런던·싱가포르가 대중교통 체계 개선과 관련한 성공 사례를 확보한 것은 다음 세 가지 이유와 관련이 있다. 첫 번째, 정책당국이 모수에 가까운 이용자 및 공급자 데이터를 확보하고 있었기 때문이다. 서울 버스의 98.7%, 지하철의 100%는 교통카드로 결제되는데 이를 통해 승하차 정류장 및 이용 시간, 이동경로 등과 같은 수요자의 대중교통 활용 정보를 실시간으로 확보할 수 있었다. 그뿐만 아니라 2004년부터 버스정보시스템을 도입·운영함으로써 개별 버스의 정류장 출발·도착 시간 정보를 20초 단위로 확보하고 있었다. 또한 택시 민원에 대응해 택시운행정보 통합관리시스템을 2012년부터 구축·운영하면서 위치·속도·차량의 움직임에 대한 정보 역시 10초 단위로 축적하는 등 순도 높은 공급자 데이터를 확보하고 있었기에 효과적인 개편을 수행할 수 있었다. 이와 같이 모수에 가까운 이용자 및 공급자 데이터 수집과 관리는 런던과 싱가포르 역시 크게 다르지 않았다.

두 번째, 데이터 간 통합을 통해 기존에 없었던 새로운 가치를 창출할 수 있었다. 서울시는 앞에서 언급한 두 데이터를 통합함으로써 교통 분야의 미충족 수요를 해결한다는 새로운 가치를 창출했다. 구체적으로는 대중교통 소외지역 파악, 심야버스 노선 개발, 대중교통 서비스 개선, 환승 거점센터 선정 등에 성공했다. 세 번째, 원데이터에 가까운 데이터를 확보했더라도 데이터 통합 과정에서 나타날 수 있는 보유 정보의 오류를 최소화하기 위해 별도의 방안을 활용해 검증했다. 서울시의 경우 통신사의 통화기록 등을 활용해 유동인구 밀집지역과 대중교통 소외지역을 파악했으며, 런던의 경우 오이스터카드를 승차 시에만 태그함에 따라 하차 지점을 알 수 없다는 문제를 해결하기 위해 하차지점을 추론하는 알고리즘을 개발해 적용하기도 했다. 이를 통해 데이터 통합에서 발생할 수 있는 오류를 최소화하고 새로운 가치 창출 가능성을 높였다.

2. 비즈니스 분야에서의 활용

교통 데이터는 주로 공공 분야와 정책 개발에 많이 활용되지만 미국 인릭스 사례처럼 비즈니스에도 적용할 수 있다. 인릭스 사례를 좀 더 살펴보면 이들은 운전에 영향을 줄 수 있는 요소를 분석하고 예측해 그 결과를 자동차 제조업체에 판매한다. 또 상품 및 서비스 유통 업체에는 교통 흐름을 예측한 정보를 판매한다. 유통 분야에서는 더욱 다양한 비즈니스를 진행하는데 입점 예정 지역과 경쟁 상점 지역의 교통량, 이동정보, 상권, 러시아워 패턴 등을 제공하고 상점을 위한 주차관리 시스템 구축, 근처 도로 교통량 정보와 평균 속력을 바탕으로 한 옥외광고판 설치 등을 도우며 서비스 제공료를 받는다. ‘도로교통정보 기반 컨설팅 서비스’라고 정의할 수 있다.

인릭스는 또 자동차 보험회사와도 함께 일을 하는데 우선 보험사 고객에게 교통정보 및 안전 관련 알림 서비스가 포함된 모바일 앱을 제공하는 한편 이 앱을 활용해 (동의한 고객들에 한해) 운전행동을 측정하고 위험등급 고객을 관리하는 서비스를 제공하며 수익을 창출하고 있다. 부동산 분야에도 진출해 주택매입자를 위한 교통 데이터 제공 서비스, 부동산 대리인을 위한 교통 데이터 제공(통근거리 정보 등)을 통해 새로운 시장을 개척하고 있다.

한국에도 인릭스와 유사한 블루시그널이란 회사가 있다. 인릭스보다 10년 늦게 창업했지만 기술력은 인릭스와 견줄 만하다. 얼핏 보면 평범한 ‘길 안내’ 서비스 같지만 속을 들여다보면 한 차원 높은 데이터 전략이 숨어 있음을 알 수 있다. 국내에도 교통정보 빅데이터 분석을 통한 길 안내 서비스는 많지만 블루시그널처럼 교통 흐름과 사고 위험까지 예측해주는 경우는 없다. 기존 내비게이션 서비스는 길이 막히는 곳을 피하도록 알려주고 최단시간, 최소거리 등 경로를 알려주지만 블루시그널 예측 엔진은 단순한 길 안내 서비스를 넘어 가장 안전하고 편리한 주행경로를 예측해 주는데 국내 고속도로 교통사고 ‘예측’ 정확도는 98%에 이른다. 글로벌 자동차 회사에 예측 엔진 탑재 계약을 성사시켰고, 최근에는 자율주행차 센서 분야에도 도전하고 있다.4

최근 충돌이나 사고 위험을 알려주는 ‘운전자 전용 신호등’인 스마트 안전 비컨을 활용해 비즈니스 모델을 만들고 있는 업체도 국내에 등장했다. 아파트, 대학, 마트 등의 주차장과 공장, 병원 등의 도로와 구역은 대부분 사유지다. 도로교통법의 적용을 받지 않기에 안전대책도 수립하기 어렵다. 알트에이라는 스타트업은 아파트 단지 내 도로와 마트 주차장 등 독립형 생활공간에서 운전자 사각지대로 인해 발생하는 보행자 교통사고를 줄이기 위해 스마트 안전 비컨을 개발했다. 교차로, 건널목, 사유지 등 자동차가 다니는 길 중에서도 사각지대에 설치된 별도의 신호등이다. 운전자가 진입할 때 충돌대상이 있는지 확인해 알려준다. 이러한 공간에서 교통 데이터를 수집하고 자율주행자동차 회사나 내비게이션 회사 등이 갖고 있지 못한 사유지 교통데이터 부재를 해결하는 비즈니스 모델이다.5

이처럼 교통 데이터 활용을 통한 비즈니스는 정책이나 규제의 허점을 채워주거나 방치된 데이터를 활용하는 방식으로 가치를 창출하고 있다. 중요한 건 ‘교통’ 자체가 ‘개개인들의 사적인 행위’가 ‘공공의 공간’에서 벌어지는 것이기에 ‘정책’과 ‘비즈니스’를 따로 떼어 생각하기도 어렵다는 점이다. 정책으로만 해결할 수 없는 문제를 비즈니스가 해결하고, 비즈니스가 스스로 취합한 데이터만으로 해결할 수 없는 문제를 지역정부, 중앙정부와 함께 해결하면서 또다시 새로운 비즈니스가 창출되는 선순환 구조가 만들어져야 한다. 결론 부분에서 다시 언급하겠지만 향후 도시 전략의 핵심인 ‘스마트시티 구축 전략’에는 특히 이 선순환 구조가 필수적이다.

교통 분야 빅데이터의 미래

장기적으로 교통 분야에서 빅데이터의 미래는 어떻게 될까? 교통 분야는 크게 두 가지 방향으로 변화할 가능성이 높다. 첫째, 폐구간이라는 가정을 완화하며 다양한 교통정보가 통합돼 분석될 가능성이다. 이미 이런 변화는 시작됐다. 둘째, 다른 시공간 정보와 통합돼 새로운 가치를 창출할 가능성이다. 교통 분야는 단순하게는 교통수단의 흐름을 보여주지만 이 데이터 안에는 시간정보와 공간정보가 내재돼 있다. 즉, 시간과 관련된 빅데이터나 공간과 관련된 빅데이터와 연계하면 새로운 가치를 창출할 가능성이 높다.

현재 가장 가능성 있는 변화는 스마트시티의 매개로 작용하는 것이다. 스마트시티에 대해서는 국가별로 다양한 정의6 를 내리고 있지만 대체로 ‘ICT를 기반으로 도시자원의 효율적 활용을 통해 도시화의 문제의 해결’이라는 방향으로 정리되고 있다. 도시에서 발생하는 문제들을 수집·분석한 후 신규 인프라 건설 및 인력 투입을 지양하고 기존 자원의 효율적 활용을 통해 문제를 해결하는 것이 핵심이다. 또 문제 발생 이후가 아닌 문제가 예상되는 시점에 자원을 투입함으로써 도시화에 따른 문제를 선제적으로 해결할 수 있는 체제를 만드는 것이 스마트시티 전략의 목표다. 스마트시티 프로젝트의 70% 이상은 도시의 교통, 에너지, 안전의 3개 영역으로 집중되고 있는데 이 중 교통 부문 빅데이터는 타 데이터와는 달리 도시 문제의 핵심 원인인 ‘사람의 흐름’을 파악하고 개개인이나 지역별 인구 동향 및 변화 방향성을 확인하는 데 도움을 줄 수 있다. 따라서 도시문제의 파악과 미래 예측을 할 수 있게 하는 도구로서의 역할을 수행하는 데 적격이다.

민간에서는 시공간 데이터와 합쳐져 개별 기업의 유통망을 개선하는 등의 직접 활용 외에도 공공 부문의 스마트시티 구현 시 요구되는 인프라 구축, 스마트시티에서 필요한 서비스 구현 등 신시장 창출이라는 기회를 제공해 주는 데이터로서 작용할 확률이 높다. 이렇게 되면 개개인은 스마트시티 구현으로 인한 삶의 질 개선이라는 혜택을 누릴 수 있다. 이미 우리는 교통과 관련한 수많은 빅데이터의 혜택을 경험하고 있다. 교통 부문은 개인정보를 최소한으로 활용하면서도 개인에게 보다 많은 서비스를 제공할 여지가 있다. 타 분야와는 달리 교통 부문은 빅데이터를 이용한 정책 변화로 발생할 수 있는 개인의 피해가 명확하지 않은 반면 혜택은 많을 것으로 예상되는 영역이다. 다른 데이터와의 통합을 통한 새로운 가치 창출을 지속적으로 모색해야 한다.

편집자주

4차 산업혁명과 인공지능이 화두가 되면서 근간이 되는 ‘빅데이터’에 대한 관심이 커졌습니다. 각 기업에 쌓이는 민간 영역의 데이터도 중요하지만 공공 분야 데이터가 더해질 경우 더 큰 가치를 창출할 수 있습니다. 허정우 JCDA파트너즈 대표와 고승연 동아일보 미래전략연구소 공공전략센터장이 공공 분야 빅데이터 활용 전략을 함께 연재합니다.

허정우 JCDA파트너즈 대표 lukehur@jcda.co.kr
고승연 기자 seanko@donga.com

허정우 대표는 연세대에서 경제학 석사 학위를 받았다. 공군사관학교(경제경영학과) 전임 강사를 거쳐 공공 분야 및 교육·의료 분야 전문 컨설팅 업체 갈렙앤컴퍼니에서 매니저로 약 10년간 일했다. 2017년 JCDA파트너즈를 설립해 현재 국내 공공기관 및 대학, 병원 등의 혁신 및 프로세스 개선을 돕고 있다.
인기기사