과기정통부 "사이버 보안 분야 AI 학습 데이터 8억건 구축"

악성코드, 침해사고 분야 각각 4억건
  • 등록 2022-07-21 오후 5:30:02

    수정 2022-07-21 오후 5:30:02

[이데일리 김국배 기자] 과학기술정보통신부는 사이버 보안 분야에 특화된 인공지능(AI) 학습 데이터셋 8억건을 구축했다고 21일 밝혔다.

그간 국내 보안 기업들은 AI 기술 도입·학습을 위한 양질의 학습용 데이터셋이 없어 어려움을 겪어왔다. 과기정통부와 한국인터넷진흥원(KISA)은 이런 문제를 해결하기 위해 지난해부터 이 분야 학습용 AI 데이터셋 구축 사업을 시작했다.

(자료=과기정통부)


해당 사업은 △악성코드 △침해사고 2개 분야로 나눠 추진됐다. 악성코드 분야 데이터셋은 백신 진단명, 속성 정보(제작 도구, 유포·경유지 등), 사회적 관심(코로나, 랜섬웨어, 비트코인 채굴 등) 등을, 침해사고 분야 데이터셋은 침해 행위, 침해사고 단계, 최신 침해사고 각본 등을 기반으로 구축됐다. 각각 약 4억건에 달한다.

과기정통부는 이 데이터셋이 침해 대응에 실효성이 있는지도 검증했다. 실제로 넥슨코리아의 경우 이를 활용한 AI 기반 악성코드 탐지 모델을 도입해 내부 생성 데이터의 악성 여부 분석율이 2배 증가했다. KT도 이메일 서비스 첨부파일 내 악성코드 탐지 정확도를 기존 95%에서 98%로 높였다.

김정삼 과기정통부 정보보호네트워크정책관은 “고도화되는 사이버 위협에 대응하기 위해 사이버 보안 분야에도 AI 기술 활용 증가가 예상되는 상황”이라며 “이번에 구축된 데이터셋이 민간 부분의 사이버 대응능력을 한 단계 도약시킬 수 있는 마중물이 될 것”이라고 말했다.

이데일리
추천 뉴스by Taboola

당신을 위한
맞춤 뉴스by Dable

소셜 댓글

많이 본 뉴스

바이오 투자 길라잡이 팜이데일리

왼쪽 오른쪽

스무살의 설레임 스냅타임

왼쪽 오른쪽

재미에 지식을 더하다 영상+

왼쪽 오른쪽

두근두근 핫포토

  • "사장님 제가 해냈어요!"
  • 아찔한 눈맞춤
  • 한강, 첫 공식석상
  • 박주현 '복근 여신'
왼쪽 오른쪽

04517 서울시 중구 통일로 92 케이지타워 18F, 19F 이데일리

대표전화 02-3772-0114 I 이메일 webmaster@edaily.co.krI 사업자번호 107-81-75795

등록번호 서울 아 00090 I 등록일자 2005.10.25 I 회장 곽재선 I 발행·편집인 이익원 I 청소년보호책임자 고규대

ⓒ 이데일리. All rights reserved