로리 필그림(Rory Pilgrim) 구글 리서치 소프트웨어 엔지니어는 27일 서울 포시즌스호텔에서 열린 ‘리서치앳 코리아’ 기자회견에서 ‘메드-제미나이’를 소개하며 이같이 밝혔다. 리서치앳은 구글이 전 세계 연구 커뮤니티를 대상으로 최신 연구 주제를 공유하는 프로그램인데 한국에서만 작년에 이어 올해 두 번째 개최됐다.
|
◇ 제미나이, 의료에 결합해보니…“의사 절반 이상 ‘유용’”
메드-제미나이는 구글의 대규모 언어모델(LLM)인 제미나이를 의료·건강 분야와 결합해 만든 모델이다. 필그림 엔지니어는 “메드-제미나이는 덱스트 뿐 아니라 이미지, 유전정보 등 다양한 형태의 의료 데이터를 학습해 방사선학 보고서 생성, 유전체 위험 예측 등 복잡한 의료 작업을 수행할 수 있다”고 밝혔다. 의사가 질병을 진단하는 과정에서 다양한 시각 정보, 첨단 영상, 후각, 청각 등을 활용하는데 메드-제미나이의 멀티모달(multimodal) 기능이 유용하게 적용될 수 있다는 분석이다.
이를 위해 구글은 메드-제미나이가 CT사진 등 2D 이미지를 해석하고 수술 영상, 심전도 신호 등 3D 이미지를 해석하게 하고 흉부 엑스레이, 여러 초음파 등을 텍스트와 함께 해석하도록 훈련시켰다. 게놈 시퀀스(인간 유전자 정보를 나타내는 DNA 염기서열의 순서) 정보를 제미나이가 이해할 수 있도록 이미지로 전환하고 관련 MRI에 연령·성별 정보를 더해 학습시켰다.
필그림 엔지니어는 “메드-제미나이가 3D 이미지를 해석하는 데 유용하다”며 “처음인데도 고무적인 결과를 냈다고 생각한다”고 밝혔다. 이어 “관련해 여러 기관과 협업을 하고 있는데 이들은 자체 데이터를 활용해 메드-제미나이를 평가하고 싶어한다”며 “2D 이미지를 시작으로 다양하게 확대 분석하기를 원한다”고 덧붙였다.
메드-제미나이는 소리 등을 토대로 질병을 진단하거나 전염병이 어떻게 옮겨가는지를 추적하는 데도 유용하다. 필그림 엔지니어는 “기침을 한다면 음향 소리를 분석해 병명을 진단할 수 있고 질병이 어떻게 옮겨가는지 추적할 수 있다”고 밝혔다. 다만 “기침 소리로 질병을 분석하는 기술은 아직 초기 단계”라며 “파운데이션 모델을 갖고 있기는 하나 현재 연구단계에 있는 모델로 어떻게 적용될 수 있는 지 평가하는 단계에 있다”고 설명했다.
|
◇ “가장 효율적인 기관, 뇌…AI 에너지 절감에 도움될 수도”
리지 도프만(Lizzie Dorfman) 구글 리서치 그룹프로덕트 매니저는 커넥토믹스(Connectomics)에 대해 발표했다. 인간의 뇌 세포가 서로 어떻게 연결돼 있는지를 밝히는 것으로 매우 얇은 조각으로 돼 있는 인간의 대뇌피질을 촬영한 후 이를 세분화하고 어떻게 연결돼 있는 지를 살펴봤다. 도프만 매니저는 “5만 7000개의 세포를 발견했고 수 억개의 시냅스, 230미터가 넘는 혈관을 발견했다”며 “뉴런이 밀접하게 연결됐지만 어떤 뉴런은 더 강력하게 연결돼 있다. 한 쌍의 뉴런은 50개 이상의 개별 뉴런과 연결돼 있기도 하다”고 설명했다. 이어 “인간 뇌의 커넥토믹스를 완전하게 이해하기 위해선 100만배 노력해야 한다”며 “쥐의 뇌에서 기억을 저장하고 공간 정보를 처리하는 ‘해마’부터 연구를 시작하고 있다”고 덧붙였다.
특히 도프만 매니저는 “인간의 뇌는 약 860억개의 뉴런으로 구성돼 있는데 이 모든 뉴런들이 활동하면서도 약 20와트만 전력을 소모해 매우 효율적인 기관”이라고 짚었다. AI개발에 전력 소모가 많다는 지적이 있는데 관련 연구를 발전시킬 경우 전력을 줄이는 데도 효과를 낼 수 있다고 언급했다.
이날 구글은 제미나이 1.5프로를 활용해서 만든 노트북LM(NotebookLM)에 대해서도 소개했다. 노트북LM은 PDF, 인터넷 링크 등 개인 문서를 업로드하면 자동으로 요약본을 생성해주고 해당 문서 관련 질문과 답변을 하도록 설계된 개인화된 AI서비스다.
라이자 마틴(Raiza Martin) 구글 리서치 프로덕트 매니저는 “AI 기반 연구 및 글쓰기 도구인 노트북LM은 최근 200여 개국에서 출시되고 35개 이상의 언어를 지원하고 있다”며 “한국에도 두 달 전 출시됐고 영어 문서를 업로드해도 한글로 물어보면 한글로 답변해준다. 현재 무료로 이용 가능하다”고 밝혔다. 이어 “50만개 소스를 스캔하고 문서화 과정을 간소하게 만든다”며 “업로드한 자료를 토대도 트위터 등 다양한 툴에 적합한 결과물을 생성한다”고 덧붙였다.