|
국내 스포츠 데이터 산업의 최일선에서 활약 중인 장성호 스포츠데이터에볼루션(SDE) 대표는 지난 도쿄올림픽을 돌아보면서 이같이 소감을 밝혔다. 심지어 이스라엘과의 조별리그 첫 경기를 보면서 “우리 대표팀이 어렵겠구나”라는 것을 직감적으로 느꼈다고 한다.
이스라엘 선수들은 개인 기량은 확실히 떨어졌다. 대신 한국 선수들의 특징을 잘 알고 이를 파고들었다. 원태인(삼성)이 잘 던지다 한 타순이 돈 뒤 집중공략 당한 것도 이와 무관하지 않았다. 반면 이스라엘 선수들에 제대로 알지 못한 한국은 그들의 생소함에 막판까지 고전했다. 이는 올림픽 기간 내내 이어졌고 결국 아쉬운 성적표를 받아야 했다.
장성호 대표는 이데일리와 인터뷰에서 “한국 야구는 데이터 싸움에서 다른 나라에게 완패했다”면서 “데이터를 활용한 상대 분석에서 너무 안이하게 준비했다”고 지적했다.
아울러 “우리도 상대 선수에 대한 데이터를 충분히 활용할 수 있었지만 그렇지 못했다”며 “단순히 원천 데이터를 많이 갖고 있는 것이 중요한게 아니라 실제 선수가 이해할 수 있도록 정리하고 가공해서 바로 입혀주는 것이 스포츠데이터 기술의 핵심이다”고 강조했다.
다음은 장성호 SDE 대표와 인터뷰 일문일답.
-이번 도쿄올림픽 야구에서 우리나라가 미국, 일본 등에 비해 데이터 활용 능력이 떨어졌다는 지적이 많았다.
△첫 번째는 데이터를 얼마나 보유하고 있었냐가 핵심이다. 원천 데이터가 있어야 그다음에 분석과 가공이 들어갈 수 있다. 한국 대표팀이 상대 팀 전력에 대한 데이터를 얼마나 확보했는지는 알 수 없다. 가장 아쉬웠던 점은 데이터 양이 부족하지 않았나라는 점이다. 두 번째는 많은 데이터가 있다고 해도 어떤 종류 영역의 데이터를 가지고 있었느냐다. 세 번째는 국가대표팀 분석 쪽에 얼마나 지원을 했느냐다. 결과적으로 다른 팀들은 충분한 분석을 하고 올림픽에 나온 것으로 보인다. 미국, 일본 등 다른 나라들은 시프트를 과감하게 운영한다던지 코스 공략을 잘하고 나왔다. 단순히 ‘안쪽이 강하다, 바깥쪽이 강하다’를 넘어 각 구종의 구속별 특성까지 세밀하게 나눠서 치밀하게 분석했다.
-미국이나 일본선수들이 우리 선수들의 특성을 자세하게 알 수 있었던 기술은 무엇인가.
△기존 국내에서 활용되고 있는 트래킹 데이터는 선수 특성을 확인하는데 특화된 기술이다. 하지만 트래킹 데이터만으로 모든 것을 분석하기는 어렵다. 미국은 말할 것도 없고 도미니카공화국이나 이스라엘 등은 미국에서 사용되는 데이터 분석 툴을 충분히 활용한 것으로 보인다. 미국에는 ‘시너지’라는 회사가 있다. 이 회사는 중계영상을 통해 선수를 분석하는 기술을 가지고 있다. 국내 중계영상도 분석용으로 확보하고 있다. 시너지는 미국프로농구 NBA에서 공식 데이터를 오랫동안 제공하고 있다. AI 기술을 활용해 코트 위 선수들의 움직임이나 슛 정확도, 수비 영역 등을 매우 상세하게 파악하고 있다. 시너지의 기술과 유사한 방법을 통해 우리나라 선수들의 특징을 속속들이 파악했을 가능성이 크다고 본다.
-SDE도 이 회사의 파트너인 것으로 알고 있다. 그렇다면 우리도 이 기술을 사용해 다른 나라 선수들을 분석할 수 있었는데 활용하지 못했다는 뜻인가.
△우리도 시너지사를 통해 메이저리그는 물론 일본프로야구, 미국 마이너리그 트리플A, 심지어 중남미 윈터리그 자료까지 보유하고 있다. 올림픽에 출전했던 마이너리그 선수들이나 일본 선수들의 데이터도 가지고 있었다. 그런데 이 데이터를 사용하지 못했다. 우리가 지난 4월에 제안을 했는데 대표팀에서 따로 우리에게 요청한 적은 없다.
△대표팀 내부사정을 다 알 수는 없지만 기사 내용 등을 보면 기존 기술을 활용해서 데이터를 분석했다고 한다. 하지만 데이터를 오랫동안 다룬 전문가 입장에서 봤을 때 다른 나라는 우리나라에서 쓰이는 기존 기술을 뛰어넘는 공략법을 들고 나왔다. 시프트만 보더라도 단순히 타자 성향을 뛰어넘는 과감한 시프트가 펼쳐졌다. 예를 들어 다른 나라는 우리 타자들의 구종이나 구속 대처 능력을 코스별로 세분화해 분석한 뒤 특정 코스를 집중 공략했다. 그쪽으로 공을 던지게 하고 예상되는 타구 방향에 맞춰 시프트를 실시했다.
-기존 우리나라에서 사용된 트래킹 기술의 한계는 무엇인가.
△트래킹 데이터는 공을 던졌을 때 공이 어떻게 움직이는지 물리적인 값을 측정하는 기술이다. 전력을 분석하기 위해선 코스, 구종을 모두 파악해야 한다. 트래킹 데이터만으로는 곧바로 구종을 알기 어렵다. 공의 위치나 변화만 나오는 것이다. 경기에서 실질적으로 이기기 위해 전력분석을 해야 한다면 상대할 타자별로 어느 코스에 어떤 공에 약하고, 어떤 구속에 대해 어떤 반응을 나타내는지까지 확실히 알아야 한다. 예를 들어 강백호의 경우 국내에서 4할에 육박하는 타율을 기록 중이지만 올림픽에선 철저히 간파당했다는 느낌을 받았다. 강백호는 모든 스트라이크존에 들어오는 모든 속구에 강하다. 코스별 타율이 3할대 후반에서 5할대까지 나온다. 그런데 바깥쪽 낮은 오프스피드의 경우 1할대로 가장 취약하다. 같은 오프스피드라고 해도 더 느린 볼을 잘 못쳤다. 이스라엘전에서 상대 투수는 강백호에게 대놓고 바깥쪽 낮은 쪽으로 느린 직구와 변화구만 던졌다. 그 모습을 보면서 올림픽 야구 첫날부터 다른 나라 투수들이 우리 타자들을 완벽히 분석했다는 것을 알 수 있었다.
-우리가 가진 데이터 분석 기술과 미국, 일본의 기술의 수준 차이가 컸다는 의미인가.
△일단 데이터 보유 양의 차이다. 프로 구단 관계자들도 이 부분을 충분히 이해하고 있다. 다만 국가대표팀에서 그만큼의 이해도를 가지고 준비했는가라고 묻는다면 그것은 아니라고 본다. 우리가 보유한 데이터의 양이나 성격이 어떤 것인가가 중요한데 너무 안일하게 기존 트래킹 데이터에만 의존한 것 아닌가라는 생각이 든다. 물론 영상도 확보했겠지만 이 영상을 분석하는 능력아 떨어졌다고 본다.
-그렇다면 데이터 싸움에서 우리 야구가 완패했다고 말할 수 있는가.
△그렇다. 데이터 싸움에서 졌다는 말은 데이터를 구하지 못했다는 의미가 아니다. 데이터 자체에 대한 이해도가 많이 부족했다는 뜻이다. 전력 분석을 위한 데이터 이해도가 높아야 내가 어떤 데이터를 구해야 하는지, 그 데이터가 어떤 기능이 있는지를 알 수 있다. 올림픽 같은 단기전은 급조된 팀이 나오기 때문에 상대 선수 개개인에 대한 공략법을 찾아야 한다. 그러기 위해선 단순히 트래킹 데이터를 넘어 영상이나 기록으로도 분석이 이뤄져야 한다. 그것도 단순히 몇 경기로 일관성을 찾을 수 없다. 최소 2~3년 치 기록을 확보해서 세밀히 분석해야 했는데 그런 노력이 없었다. 반면 상대 팀은 그런 노력을 충분히 했던 것 같다. 기술적인 솔루션을 확보해서 그에 맞춰 대처를 잘한 것이다.
-그럼 데이터 면에서 어떻게 준비를 했어야한다고 보는가.
△선수가 개인 능력으로 경기에서 벌어지는 상황을 모두 커버하는 것은 한계가 있다. 선수들에게 코스별 공략법이나 카운트별 공략법 등 상황에 맞는 세밀한 데이터를 던져줬어야 했다. 경기에서 필요한 상황별 데이터를 주고 선수들이 대처하도록 도왔어야 했다. 원천 데이터를 많이 갖고 있다고 해도 실제 선수가 이해할 수 있도록 정리하고 가공해서 바로 입혀주는 것이 핵심이다. 그것이 데이터의 기술적인 능력이다. 메이저리그 선수는 베이스볼서번트 정도의 홈페이지만 보더라도 그런 데이터들을 알 수 있을 것이다. 하지만 마이너리그 선수들 데이터는 알기 어렵다. 그래서 더 많은 준비가 필요했지만 결과적으로 그러지 못했다.
-SDE이 가진 기술이 기존 데이터 시스템와 비교해 어떤 차이점이 있나.
-지난 대학야구 U리그 왕중왕전에서도 SDE의 기술이 처음 도입됐다. 반응이 어땠나.
△반응이 굉장히 좋았던 것으로 들었고 직접 연락을 주신 분들도 있다. 왕중왕전 자료는 대학스포츠협의회(KUSF)에 데이터를 가공해서 모두 전달했다. 기본적인 트래킹 데이터는 선수들이 KUSF 홈페이지 등을 통해 볼 수 있다. 중계방송에 관련 데이터를 노출할 때의 과정까지도 저희가 직접 기술을 지원하고 제공했다.
-SDE이 팬들에게 다가설 만한 서비스를 준비하는 것이 있다면.
△어플리케이션 제작을 완료해 출시했다. 7월 중순 경에 완성해 무료로 오픈했다. 특별한 홍보는 하지 않았다. 8월 말부터는 유료화로 전환된다. 어플리케이션은 KBO 5경기. MLB 15경기, NPB 6경기 등 하루 최대 26경기에 대한 데이터를 내보내고 있다. 불법이나 사행성을 조장하는 것이 아니라 스포츠토토나 프로토를 즐기는 분들을 위한 알찬 내용의 데이터 분석, 구독 서비스를 준비했다.
-기존에 나와 있는 서비스와 차별점을 설명한다면.
△우선 데이터 뎁스 자체가 다르다. 경기를 미리 예측하거나 경기 전 양 팀 전력을 분석해 승부를 예측할만한 충분한 데이터가 들어 있다. 예를 들면 타순별 타율을 비롯하여, 특히 핵심적인 것이 불펜 투수에 대한 정보, 예를 들면 이닝이나 투구수 등을 최근 5일간 데이터를 정리해서 팬들이 예측하는데 도움을 주고자 했다. 최근 국내 프로야구가 경기 중후반에 승부 갈리는 경우가 워낙 많아 그런 부분에 대한 갈증을 해소해주려는 노력을 했다. 단순하게 스탯을 비교하는 수준을 넘어 투수와 타자에 대해 세심한 기록을 포함시켰다. 일단 어플리케이션으로 서비스를 시작했다.
-야구팬들을 위한 서비스를 위해 앞으로 어떤 점을 더 발전시킬 계획인가.
△어플리케이션이다 보니 웹사이트에 넣을 수 있는 기술적인 부분을 다 녹일 수는 없었다. 예를 들어 트래킹 데이터 중계를 제공한다던지 화려한 디자인이나 재밌는 컨텐츠를 추가적으로 보여줄 생각이다. 또한 뉴스픽이라는 서비스를 통해 주요뉴스를 리그별, 팀별로 정리해서 제공하고자 한다.
-앞으로 프로야구 데이터 분야의 기술적인 발전을 위해 가진 계획이 있다면.
△SDE는 미국 시너지사가 가지고 있는 분석 시스템을 이미 갖춰놓고 있다. 시너지사와 장기간 독점계약 관계를 맺고 있다. 시너지사의 기술은 AI로 중계 영상을 쪼개서 자동으로 분류한 뒤 320개에 이르는 필터를 통해 경기에서 벌어질 수 있는 모든 상황에 대해 심도 깊은 스플릿 데이터까지 끄집어낼 수 있다. 우리는 여기에 기존 레이더를 활용한 트래킹 시스템까지 더해 빠른 시일내에 이를 뛰어넘는 자체 기술을 통한 통합 솔루션을 만들려고 한다. 팬들에게 서비스할 수 있도록 SDE 고유의 다양한 데이터베이스를 구축하고 발전시키고 있다. 지금까지의 경험치와 꾸준한 노력을 바탕으로 세계 최고 수준의 빅데이터 회사로 성장 할 수 있다고 믿는다. 한국에서 그렇게 할 수 있는 유일한 회사라고 평가를 받고 있고, 앞으로도 스포츠빅데이터 분야에서 선구자가 될 것으로 확신한다.