|
일론 머스크 트위터 최고경영자(CEO)는 지난 20일(현지시간) 마이크로소프트가 허락 없이 AI 모델을 학습시키는 데 트위터 데이터를 사용했다고 주장하며 법정 다툼을 예고했다. 머스크는 이날 “그들(MS)은 트위터 데이터를 사용해 불법적으로 AI를 훈련시켰다”며 “이제 소송할 시간(Lawsuit time)”이라는 트윗을 올렸다. 앞서 머스크는 지난해 말 “오픈AI가 AI 학습을 위해 트위터 데이터베이스에 접근할 수 있다는 것을 알게 됐다”며 이를 막겠다고 밝힌 바 있다.
아예 AI 모델 학습에 제공되는 데이터에 비용을 청구하겠다는 사례도 나오고 있다. 미국 온라인 커뮤니티 레딧은 18일(현지시간) 레딧의 이용자 간 대화(데이터)를 AI 모델에 제공하는 데 사용하는 API를 유료화하겠다는 계획을 밝혔다.
잇단 데이터 소유권 갈등이 벌어지는 건 이유 중 하나로는 수많은 웹사이트가 AI 학습에 사용되지만, 오픈AI 등 AI 업체들이 AI가 학습하는 데이터에 대해 자세히 공개하지 않고 있다는 점이 꼽힌다. 즉, 투명성이 떨어진다는 얘기다. 실제로 한국의 개인정보보호위원회도 오픈AI의 챗GPT 모델에 한국어 데이터가 활용됐는지 등 파악에 나선 상황이다.
한국인공지능법학회장을 맡고 있는 최경진 가천대 교수는 “기업들은 저작권 침해 가능성을 우려해 학습 데이터를 투명하게 공개하지 않고, 투명성이 확보되지 않으니 저작권법 준수가 잘 안 되는 악순환의 고리가 만들어지는 것”이라며 “결국 AI 데이터 학습을 위한 저작권 이용은 유연화하되, 저작권자 이익을 보호하는 생태계 개선이 함께 이뤄져야 한다”고 말했다.