인공신경망 번역(NMT: Neural Machine Translation) 방식은 최근 딥러닝 기반으로 주목 받고 있는 기술로, 기존에 많이 활용되고 있는 통계 기반 번역(SMT: Statistical Machine Translation)에서 한 단계 진화한 방식이다.
SMT 방식이 단어나 몇 개의 단어가 모인 구(Phrase) 단위의 학습 번역 방식이었다면, NMT 방식은 문장 전체의 맥락에서 그 안의 구성 요소들을 변환하면서 해석해 번역하는 방식이다.
이를 통해 문장 안에서 단어의 순서, 의미, 문맥에서의 의미 차이 등을 반영하며 보다 효율적이고 정확하게 번역할 수 있다.
예를 들어, “나는 아침 일찍 아침 준비를 했다”라는 문장이 있을 때, 단순히 통계 정보만 사용하면 ‘아침’이라는 단어가 나왔을 때, ‘in the morning’으로 번역해야 하는지 ‘breakfast’로 번역해야 하는지 구분이 쉽지 않다. 반면, 문장 전체로 살펴보면 그런 의미적인 차이까지 녹아 들어있기 때문에 ‘in the morning’과 ‘breakfast’를 상황에 맞게 구분 할 수 있다.
1. SMT: I prepared early in the morning the morning.
2. NMT: I prepared breakfast early in the morning.
번역 품질 외에도 OCR 인식 정확도를 높이는 작업을 진행 중이며, 일본어나 중국어의 발음 기호 정보를 함께 보여주는 부분도 준비하고 있다.
NMT 기술을 개발한 네이버는 파파고 외에 beta형태로 오픈한 한영번역 페이지 (labspace.naver.com/nmt/)를 통해 NMT 방식의 테스트 버전을 제공 중에 있으며, 네이버 번역 서비스 전반으로 전환해나갈 예정이다.
또, NMT방식의 품질을 높이기 위한 다방면의 리서치를 진행하고 있고, NMT방식의 문제점 보완에도 노력해나간다는 계획이다.
▶ 관련기사 ◀
☞네이버, 24~25일 개발자 컨퍼런스 개최
☞[재송]20일 장마감 후 주요 종목 뉴스
☞20일 장마감 후 주요 종목 뉴스