이번에 개발한 모델은 승객 하차 지점과 하차 인원 추정을 통해 실제와 가까운 교통 수요량을 산출하고, 대중교통 잠재 수요를 찾아내는 것을 주요 기능으로 설계했다. 실질적 교통 수요를 파악할 수 있는 분석 모델을 통해, 고령화와 인구 감소로 대중교통 노선 운영 효율화 조치가 필요한 지자체의 대중교통 노선 개편에 활용도가 높을 것으로 기대된다.
모델 개발 과정에는 교통카드 사용 이력 데이터, 통신사 유동인구 데이터, 신용카드 사용 데이터 등 약 3억 건의 공공·민간 데이터를 활용했다.
거주지 추정 방식의 경우 7일 중 3일 이상 최초 출발 지점이 동일한 경우 해당 출발 지점을 거주지(전날 최종 하차 지점)로 추정하는 방식이다. 동승자 이력 추적 방식은 동일 정류장에서 탑승한 타 승객들의 이력을 추적해 하차 인원이 가장 많았던 정류장을 하차 지점으로 추정하는 식이다.
이 같은 단계별 분석 결과를 토대로 정류장별, 교통 유형별 실제 이용자 규모를 산출하고, 통신사 유동인구 데이터, 신용카드 사용 데이터 등을 활용해 교통 잠재 수요까지 도출했다. 이는 기존 운영 노선의 합리성 평가와 심야 버스 노선 개설 등에 활용할 수 있다.
김준희 행정안전부 공공데이터국장은 “그동안 파악이 어려웠던 승객 규모를 데이터 분석을 통해 찾아냄으로써 과학적 교통 정책의 토대를 마련했다는 측면에서 의미가 크다”며 “앞으로도 데이터를 통해 행정 역량을 높이고 국민의 생활이 실질적으로 바뀔 수 있도록 노력하겠다”고 말했다.