인간의 유전체는 30억쌍의 DNA로 구성됐다. 2003년 처음 염기서열 정보가 공개됐는데 이를 위해 13년 간 총 38억달러(약 4조 2000억원)가 투입됐다. 한번에 하나의 DNA 조각을 읽어야 했기 때문이다. 이후 IT(정보기술)가 급격히 발달하면서 염기서열 정보를 분석하는데 2007년 4개월에 100만달러로, 2011년에는 48시간에 3000달러로 급격히 떨어졌다. 박 교수는 “2008년 한국인 유전체 전체 염기서열 분석에 4억원이 들었지만 이제는 60만원 정도면 가능하다”며 “염기서열 분석 비용이 줄어들면서 다양한 활용법이 나오게 됐다”고 말했다.
유전정보는 태어날 때 부모 양쪽에서 절반씩 받는데 이 때 7000여개의 단백질 구조가 변경된다. 박 교수는 “대부분 바뀌어도 큰 차이가 없지만 극히 일부 유전자는 유전질환을 일으킨다”고 말했다. 대부분 유전질환은 희귀질환이다. 그만큼 극소수에서만 돌연변이가 일어나기 때문이다. 제약사 입장에서는 환자 수가 너무 적으면 수지타산이 맞지 않는다. 이 때 쓸 수 있는 게 유전자 편집 기술이다.
박 교수는 “그야말로 자료가 너무 방대한 빅데이터이다 보니 사람의 힘으로 할 수 없어 컴퓨터에 맡기는 것이 인공지능”이라고 말했다. 따라서 인공지능을 이용한 신약개발에서 가장 중요한 것은 정확한 인공지능 알고리즘 개발이다. 유전체 정보를 비롯한 빅데이터는 얻을 수 있으면 얼마든지 얻을 수 있는 시대가 됐기 때문이다.