[이데일리 김정유 기자]
네이버(035420) 커넥트재단은 엔트리, 에드위드, 부스트캠프 등 소프트웨어(SW)·인공지능(AI) 교육 플랫폼을 운영하며 쌓아온 데이터를 29일 공개했다.
이번에 공개되는 것은 학술 연구 목적으로 활용할 수 있는 연구용 교육 데이터와 AI 모델 개발과 성능 개선에 활용할 수 있는 AI 모델 학습용 데이터다. 네이버 커넥트재단 홈페이지에 신청서 작성 후 클라우드를 통해 열람할 수 있다. 모든 데이터는 연구 및 비영리 목적에 한해 활용 가능하며, 모든 개인정보는 비식별화 처리돼 안전하게 제공된다.
연구용 교육 데이터는 석박사 과정 연구자, 대학교수, 연구 기관 전문가를 대상으로 공개된다. 데이터 활용 협약서 체결 후 데이터를 받을 수 있다. 그간 교육 분야는 디지털화된 데이터가 부족했다. 이에 국내 최대 온라인 교육 플랫폼 엔트리, 에드위드 등을 통해 축적된 데이터가 공개되면 교육 발전과 학술 연구에도 큰 도움이 될 것으로 기대된다.
또한 AI모델 학습용 데이터도 공개했다. 커넥트재단은 재활용 쓰레기와 수식 인식기 이미지 데이터, 대화 시스템 및 검색 엔진 개발에 필요한 텍스트 데이터 등 총 7종의 데이터셋을 구축했다. 이날 재활용 쓰레기 및 수식 인식 이미지 데이터가 공개됐으며 이외 5종의 데이터도 순차적으로 공개할 예정이다.
앞서 네이버 커넥트재단은 지난 6월 학술 연구를 지원하는 연구 과제 공모를 개최한 바 있다. 현재 학생간의 상호작용과 성장, 온라인 수업 과정 설계, 엔트리에서 활용되는 블록 명령어 분석 등 연구용 교육 데이터를 활용해 총 5개팀이 학술 연구를 진행하고 있으며 연구 결과는 재단홈페이지를 통해 공개될 예정이다.