|
[이데일리 이대호 기자] 데이터 라벨러. 인공지능(AI) 시대 들어 주목받고 있는 직업이다. AI가 학습 데이터를 쉽게 인식할 수 있도록 전처리(前處理)하는 작업자를 일컫는다. 강아지는 강아지, 고양이는 고양이 이런 방식으로 데이터에 라벨(정보표시)을 붙인다고 보면 된다.
이 데이터 라벨링은 관련 전문가만 하는 작업이 아니다. 일반 대중도 할 수 있다. 국내에선 크라우드웍스가 이러한 시장 흐름을 주도하고 있다. 지난 2017년 4월 설립된 이 회사가 데이터 라벨링 작업에 크라우드소싱(대중참여) 방식을 처음 채택한 뒤 우후죽순 뒤따르는 기업이 생겼다. 정부에서도 혁신 사례로 주목해 대통령 산업포장을 수여하는 등 수많은 수상 실적을 확보했다.
|
◇수백개 객체 가공하기도…전업 시 4000만원 넘는 수익도
박민우 크라우드웍스 대표는 최근 서울시 강남구 테헤란로 사무실에서 가진 인터뷰를 통해 “데이터 라벨링 작업을 ‘인형 눈알 붙이기’로 오해한다”며 데이터 라벨러 직업에 대한 잘못된 인식을 털어놨다.
앞서 국회 과방위 야당 의원들은 “디지털 뉴딜 일자리를 21세기형 인형 눈알 붙이기다라는 말이 있다”며 “단기 일자리 논란을 아는가”라고 공격하기도 했다.
크라우드웍스에 따르면 전업 수준으로 데이터 라벨링 작업에 참여하는 노동자는 연 기준 4000만원 이상 벌어가기도 한다. 이 정도로 작업에 참여하려면 여러 교육 프로그램을 통과해야 한다. 이 기준을 충족하는 크라우드웍스의 데이터 라벨러는 3만명 정도다. 누적 확보한 전체 라벨러는 25만명이 넘는다. 이 중 5만명 가량이 한 달에 한 건 이상 작업에 참여하고 있다.
|
◇여전히 데이터 부족…인적 자원 필요
박 대표는 “AI 기술 보편화 진행이 빨리 안 됐던 이유가 데이터 부족 때문”이라며 “소스 데이터가 부족한 게 아니라 사진 속 고양이를 레이블링(표시)해야 학습이 되는데 이러한 데이터는 수많은 인적 자원을 필요로 했다”고 데이터 라벨링 활성화 전 상황을 전했다.
당시 기업들이 매번 수십명의 계약직을 뽑고 데이터 전처리를 가르치는 번거로운 과정을 겪고 있었다. 교육을 마친 인력의 공유도 안 돼 비용 측면에서 낭비가 심했다. 크라우드웍스가 이 과정을 보다 전문화해 선제적으로 시장에 뛰어들었고 플랫폼 경제를 탄생시켰다.
|
크라우드웍스는 데이터 정확도 99%를 자신했다. 그 이유를 100% 전수 검사로 꼽았다. 박 대표는 “크라우드소싱 방식으로 데이터를 전처리하면 평균 정확도가 70% 이하로 나온다”며 “크라우드웍스에선 100% 전수 검수한다”고 강조했다.
AI 데이터 전처리 작업만큼 검수 과정도 중요하다. 반려가 몇 번 이상 반복되면 검수 작업을 못 하도록 하는 사업모델(BM) 특허 등을 갖추고 있다. 현재 130개 특허(국내외 등록 104건, 출원 26건)를 보유 중이다.
알바? NO 실력자들 연결한다…‘크라우드잡스(가칭)’ 준비
크라우드웍스는 올해 말 ‘크라우드잡스(가칭)’를 선보인다. 여러 프로젝트에 참여하면서 검증을 거친 데이터 라벨러들을 적재적소의 일자리에 중개해주는 플랫폼이다.
박 대표는 기업보다는 데이터 라벨러의 입장에서 크라우드잡스의 성격을 정의했다. 그는 “활동 기록 로그도 있고 평가지표도 있어 우수한 사람들을 파견이나 재택으로 일할 수 있도록 하는 것이 가능하다”며 “크라우드웍스 회원들이 더 좋은 조건에서 많은 이익을 얻을 수 있도록 잡과 매칭하는 사업을 한다고 보면 될 것”이라고 힘줘 말했다.