|
고려대 컴퓨터학과 연구팀이 의학, 생물학 질문에 답하는 인공지능 시스템 경진 국제대회인 BioASQ 대회에서 미국 캘리포니아대학 샌디에고(UCSD), 매사추세츠대학 (UMass), 중국 푸단대학 (Fudan Univ), 일본 도쿄대학(University of Tokyo)를 제치고 2년 연속 우승했다.
고려대 팀은 정민별, 성무진, 김강우, 윤원진, 유재효 등 대학원생과 졸업생인 김동현 박사(현대자동차 AIR Lab), 그리고 지도교수인 강재우 교수로 구성된 7인 팀이다.
올해로 8번째를 맞는 BioASQ 대회는 가장 오래된 의생명 분야 질의응답 시스템 경진대회다. 구글(Google), 미국 국립보건원(NIH), 유럽연합 등이 후원한다. 이 연구팀이 참여한 BioASQ 8b Phase B챌린지는 주어진 논문에서 질문에 대한 답을 찾아내는 문제들로 구성돼 있다.
예를 들어 폐암에 관련된 논문을 주고 “폐암의 전이에 관여하는 유전자 변이는 무엇인가?”라는 질문을 하는 방식이다.
이 대회에 출전하는 인공지능모델들은 3개월에 거쳐 모두 5번의 시험을 보게 되며, 결과는 의사, 생물학자 등 해당 분야 전문가가 만들어 놓은 정답을 이용하여 평가되고, 전문가의 재검토를 거쳐서 발표되므로 신뢰도가 높다.
올해 연구팀은 ‘Exact’ 종목 (정민별 석박통합과정 주도)에서 총 5회의 평가회차 중 1위 4회, 2위 1회로 매사추세츠대학(1위 1회), 후단대(2위 1회)을 꺾고 압도적인 성적으로 지난해에 이어 우승을 이어나갔다.
특히 올해는 이에 더불어 ‘BRAF V600E 유전자 변이는 전이성 비소세포폐암과 연관이 있습니다.’와 같이 서술형 문장으로 답을 만들어 제출하는 ‘Ideal’ 종목(윤원진 박사과정 주도)까지 참여하여 5회 중 1위 3회, 2위 1회로 캘리포니아대 샌디에이고(UCSD), 호주 맥쿼리대를 압도하며 우승하여 두 종목 모두를 석권했다.
이번 결과는 인공지능 모델 BioBERT(고려대)와 BART(페이스북)를 이용하여 얻은 성과다.
특히, BioBERT는 강재우 교수 연구팀(이진혁 박사와 윤원진 박사과정의 공동주도)이 개발한 의생명 분야 문헌에 특화된 딥러닝 언어모델로, 지난 1월 생명정보학 최고 권위지인 Bioinformatics에 게재된 이래 9월 말 기준 현재까지 440회 이상의 피인용횟수를 기록하고 있다.
이 논문은 Bioinformatics 저널의 가장 많이 읽힌 논문목록에 포함되었고(올해 8월), 국제의학정보학협회(IMIA) 연보의 BioNLP분야 올해의 논문 3편 중 하나로 선정됐다.
이번 연구는 의생명 도메인의 텍스트를 학습한 결과를 바탕으로 기존의 의생명 질의응답 시스템의 성능을 유의미한 수준까지 큰 폭으로 개선했다는 점에서 큰 의의가 있다.
사람이 읽기에 자연스러운 문장으로 질문에 대한 답을 할 수 있는 인공지능 시스템이라는 점에서 앞으로 임상적으로 유의한 의사결정 지원 도구를 개발하는데 활용될 수 있을 것으로 기대된다.
대회의 결과는 학계와 구글, 글로벌 제약회사 등 산업계의 많은 관심 속에서 온라인으로 진행된 BioASQ워크샵에서 지난 9월 23일 발표됐다.