마노하 팔루리(Manohar Paluri) 메타 생성형AI 부사장은 10일 서울 강남 센터필드 메타 오피스에서 열린 ‘AI 미디어 브리핑 행사’에서 이 같이 밝혔다.
|
메타는 최근 거대 언어모델(LLM)인 생성형AI 라마(Llama) 3.2를 포함해 총 네 번의 LLM모델을 오픈소스로 공개했다. 라마 모델은 4억회 이상 다운로드됐다. 이는 작년 대비 10배 이상 증가한 수치다. 팔루리 부사장은 “라마 모델은 교육, 헬스케어 분야 등 스타트업부터 대기업까지 수 많은 비즈니스에 다양한 용도로 활용되고 있다”며 “라마도 파생된 AI모델은 약 6만 5000개 이상에 달한다”고 밝혔다.
구글의 제미나이 등이 오픈소스를 공개하지 않는 것과 달리 메타는 라마 시리즈를 오픈소스로 공개하고 있다. 팔루리 부사장은 메타가 오픈소스 접근 방식을 추구하는 이유에 대해 “개방형 생태계가 기술 혁신의 속도를 가속화하고 안전성과 투명성을 높이는 데 기여할 수 있기 때문”이라며 “오픈소스 모델은 개발자로 하여금 본인만의 모델을 훈련하고 미세조정할 수 있도록 해 오랫동안 지속가능한 시스템을 구축할 수 있도록 돕는다”고 설명했다. ‘라마’ 파운데이션 모델을 기초로 개발자들이 본인들이 원하는 데이터 등을 파인튜닝(Fine tuning)해 원하는 모델을 커스터마이징(Customizing)할 수 있다.
실제로 한국과학기술정보연구원(KISTI)은 라마 모델을 기반으로 과학기술 데이터를 추가 학습시킨 ‘고니(KONI)’라는 AI모델을 만들기도 했다. 장광선 KISTI 선임연구원은 “국내 연구기관, 공공기관에 특화된 과학기술정보 서비스를 제공하는 것을 목표로 하고 있다”며 “내년 1월부터 과학기술 정보에 특화된 연구자용 AI 에이전트를 만들 것”이라고 밝혔다. 이어 “다른 파운데이션 모델도 있지만 라마를 했을 때 가장 우수한 성능을 보였고 오픈AI의 챗GPT보다 정보 유출 우려가 낮았다”고 덧붙였다. 에임인텔리전스는 라마의 오픈소스를 바탕으로 AI취약점을 탐지, 최소화하는 솔루션을 개발, ‘라마 임팩트 이노베이션 어워즈’에서 수상을 하기도 했다.
내년엔 ‘젠 라마’ 출시…“뮤비 젠, 딥페이크 악용보다 긍정 측면 많아”
라마는 내년께 ‘gen Llama’로 긴 문장의 글을 제공하고 이미지와 오디오, 비디오, 텍스트 등 서로 다른 정보의 종류를 연관성있게 학습하는 ‘크로스 모달리티’를 가능하게끔 하고 다른 나라의 언어도 쉽게 통합할 수 있도록 하는 AI모델을 출시할 예정이다. 팔루리 부사장은 “미래 기반이 될 메타AI는 모든 앱과 웹을 포괄하는 어시스던트가 될 것”이라며 “모든 앱, 웹에서 매일 40억명의 사람들을 지원하는 엔진이 라마가 될 것”이라고 밝혔다.
최근 메타가 공개한 ‘동영상 생성형AI’ 뮤비 젠은 기존 이미지와의 합성이 용이해 딥페이크(허위 영상물)를 만들기 쉬워지고 그로 인해 성범죄물로 활용되는 것 아니냐는 우려도 제기된다. 팔루리 부사장은 “AI영상물을 생성하는 경우 워터마크가 삽인된다”며 “신기술이 어떤 것이든 좋은 사례도 있겠지만 나쁜 사례도 존재하기 때문에 이런 부분을 완화하는 것이 중요하다”고 설명했다.
뮤비 젠에는 메타 ‘FAIR연구팀’이 개발한 영상 속에 특정 ‘물체’를 탐색하고 추축하는 기술이나 새 소리 등 소리를 생성하고 추출하는 기술 등이 활용됐다. 특히 특정 ‘물체’를 추출하는 기술은 해양과학, 의료 분야에도 활용된다.
메타가 ‘라마’ 등 AI를 통한 수익화에 대한 질문도 나왔다. 팔루리 부사장은 “메타는 근본 기술에 투자하는데 이는 수 십년이 필요하다. 그 결과 데이터센터, 파이토치(PyTorch) 등 혁신 기술을 업계 최초로 소개해왔고 이러한 연구를 통해 일상에서 제품이 사용되도록 해 수익화를 이뤄왔다”며 “AI역시 근본 기술에서 시작해 제품 확장, 수익화로 이어질 것”이라고 밝혔다.