|
이번 연구 결과는 오픈 액세스 저널인 ‘유전체 의학(Genome Medicine)’ 온라인판에 10월 22일 자로 게재됐다.
동북아시아인 참조 유전체 데이터베이스에는 한국인 850명, 몽골인 384명, 일본인 396명, 중국인 91명, 홍콩인 58명 등 총 1779명의 전장 유전체 분석(WGS) 정보와 유전변이 정보가 포함돼 있다.
이는 한국, 몽골, 일본, 중국 등 동북아시아 4개국을 대표할 수 있는 참조 유전체 데이터베이스 중 최대 규모다. 현재까지 국내외에서 공개된 참조 유전체 데이터베이스 중 동북아시아인 유전체 분석에서 정확도를 크게 높일 수 있는 것으로 나타났다.
분당서울대학교병원 서정선 석좌교수는 “이번 연구를 통해 동북아시아인의 유전적 특성을 확인했을 뿐만 아니라 전 세계적으로 독보적인 정확도를 자랑하는 참조 유전체 데이터베이스를 구축하는 데 성공했다”며 “현재 1만 명 규모의 동북아시아인 2차 참조 유전체 데이터베이스 분석이 마무리돼 내년 초 추가로 공개할예정이고 이를 통해 동북아시아인 질병 관련 유전자 발굴 및 질병 예측에 크게 기여할 수 있을 것으로 기대한다”고 밝혔다.
특히 결실값 예측 기법(임퓨테이션)에서 결과의 정확도를 높이는 중요한 역할을 하는 것으로 알려져 있다. 결실값 예측기법이란 참조 유전체를 활용해 유전변이 정보를 통계적으로 유추해낼 수 있는 기법이다.
결실값 예측기법을 활용하면 적은 비용으로 한 개인의 유전체 정보 대부분을 확인할 수 있다는 장점이 있다. 이때 참조 유전체에 포함된 개인의 샘플 수가 많을수록 그리고 참조 유전체와 연구대상자의 인종이 일치할수록 결실값 예측기법의 정확도는 향상되며 유의미한 연구 결과 또한 도출해낼 수 있다.
이에 따라 공동 연구팀은 이번에 구축한 동북아시아 최대 규모의 참조 유전체 데이터베이스가 결실값 예측기법의 정확도를 향상할 뿐만 아니라 나아가 다중유전자위험점수(PRS) 기반의 질병 예측에 중요한 역할을 할 것으로 예상하고 있다.
다중유전자위험점수는 2018년 MIT가 뽑은 10대 혁신기술 중 하나로, 결실값 예측기법을 통해 도출한 특정 질환에 영향을 미치는 수백 개 유전자의 위치 및 해당 질환의 위험성을 수치화해 발병 위험을 예측하는 방법이다.
즉, 대규모 참조 유전체 데이터베이스를 활용한 결실값 예측기법의 정확도가 높으면 다중유전자위험점수에서도 정확도 높은 결과를 산출할 수 있는 것이다. 이를 통해 이번에 구축한 데이터베이스가 동북아시아인의 유전체 정보 기반 정밀의료 실현에 중요한 역할을 할 것이라는 게 연구진의 설명이다