스테이블 디퓨전 공개 이후 두 달도 채 지나지 않았지만 ‘오픈 소스’의 강력함을 보여주기에는 충분했다. 지난 18일에는 이 프로그램을 개발한 회사 스태빌리티AI가 1억 100만달러(약 1453억원) 규모의 투자를 받아 유니콘 기업(기업가치 10억달러 이상 스타트업) 반열에 올랐다. 스테이블 디퓨전 모델을 다운받은 개발자만 20만 명 이상이고, 일반 사용자는 100만 명을 넘어섰다.
◆ 취미에서 의료영상 분야까지
오픈 소스의 힘은 ‘확장성’이다. 글자를 이미지로 바꿔주는 AI프로그램은 여럿 있지만, 소스코드를 모두 공개한 것은 스태빌리티AI의 스테이블 디퓨전이 유일하다. 스테이블 디퓨전 소스 공개 이후, 전 세계에서는 개인 취향의 이미지 제작부터 의료영상 이미지 처리 분야까지 다양한 시도가 이어지고 있다.
기존 프로그램에 스테이블 디퓨전을 연동해서 디자이너의 수고를 덜어주기도 한다. 전 어도비 개발자인 크리스찬 켄트렐(Christian Cantrell)은 지난달 9일 자신의 트위터에 포토샵과 스테이블 디퓨전을 연동하는 방법을 자신의 트위터에 소개했다. 포토샵 창을 켜서 원하는 이미지를 글자로 써주기만 하면, 곧바로 이미지를 생성해 작업을 할 수 있도록 한 것이다.
의료영상 분야에서는 의사가 직접 사진을 보지 않아도 AI가 빠르게 신체적 이상을 잡아주는 연구가 활발히 진행되고 있지만, 아직까지는 AI를 학습시킬 데이터가 부족한 상황이다. AI를 이용해 ‘진짜처럼 보이는’ 의료 영상 데이터를 얻을 수 있다면, 의료 분야 AI를 더 빠르게 고도화시킬 수 있는 길이 열린다.
하지만 현재까지 AI이미지 출력 기술로는 실제 의료현장에서 쓰는 이미지를 출력하기 어려웠다. 블루젠 교수는 지난 11일 자신의 트위터에 “특별히 훈련되지 않은 AI에 ‘폐 엑스레이 사진’같은 간단한 명령어를 입력하면 진짜처럼 보이는 엑스레이 사진을 얻을 수 없다. AI에게 흉부 엑스레이 사진을 학습시켜도 의료 현장에서 사용되는 이미지를 출력하지는 않는다”고 짚었다.
그러나 연구진이 스테이블 디퓨전 모델을 이용해 미세 조정한 AI는 실제 흉부 엑스레이와 비슷한 이미지를 출력해냈다. 연구진은 “임상적 맥락을 충실하게 묘사하는 의료 이미지를 만들어낼 수 있다면, 의료 데이터 부족 문제를 완화하는 데 도움이 될 수 있다”고 설명했다.