네이버, ‘2021 HCLT’서 독보적인 한국어 AI 기술력 입증

네이버, ‘2021 HCLT’서 독보적인 한국어 AI 기술력 입증

초대규모 한국어 AI ‘하이퍼클로바’ 포함해 웹, 모바일, 음성 검색에 사용된 한국어 처리 기술과 연구 성과 발표

네이버㈜(대표이사 한성숙)가 지난 10월 14일부터 15일까지 진행된 ‘2021 한글 및 한국어 정보처리 학술대회(이하 HCLT, Human&Cognitive Language Technology)’에서 초대규모 한국어 AI ‘하이퍼클로바’ 등을 개발하기 위해 수년간 진행해온 연구 과정과 성과가 포함된 다양한 한국어 처리 기술과 연구 성과를 논문으로 발표했다.

매년 한글날 전후로 개최되는 HCLT는 한국어 처리 기술과 연구 성과를 공유하는 국내에서 가장 권위 있는 학술대회다. 네이버는 국내 대표 AI 기술 플랫폼 기업으로 2014년부터 꾸준히 한국어 처리 기술 관련 최신 연구 성과를 이 자리에서 공유하고 있다. 

네이버는 이번 학회 발표를 통해 네이버의 독보적인 한국어 처리 기술 및 연구 수준을 선보였을 뿐 아니라, 외부 연구자들과 활발히 연구 성과를 공유하며 국내 AI 연구 수준 향상에도 기여했다는 평가를 받았다. 
 

▲ 네이버 초대규모 한국어 AI '하이퍼클로바' (사진출처=네이버 클로바)

한국어 처리 기술은 사람이 사용하는 언어인 한국어를 컴퓨터가 이해하도록 만드는 기술로, 네이버 검색의 핵심 기술 중 하나다. 올해 네이버는 HCLT에서 총 15건의 논문을 발표했는데, 전년 대비 2.5배 증가한 성과를 올렸다. 

특히, 이번에 채택된 15개 논문중 ▲언어처리 신뢰성 분야의 자연어 생성 모델을 이용한 준지도 학습 기반 한국어 사실 확인 자료 구축▲질의 응답 분야의 Span Matrix를 이용한 다중 범위 추출 기계독해 시스템▲대화 시스템 분야의 자기 학습 방법을 이용한 음성 대화 시스템의 슬롯 교정’ 논문은 우수 논문으로 선정됐다.   

네이버가 HCLT에서 발표한 연구 중 일부는 네이버 검색 서비스에 적용돼 사용자들에게 새로운 경험을 제공하고 있다.  

▲음성 대화 시스템의 슬롯 교정에 대한 연구는 AI 스피커의 음악 재생 기능에 적용되었으며, ▲Large Pre-trained Language Model의 P-tuning을 이용한 질의 정규화 연구는 네이버앱 음성 검색의 검색 결과 및 질의 추천에 적용됐다.

▲검색의도에 적합한 스니펫 추출 연구는 사용자들에게 보다 빠르게 정확한 정보를 제공하는 지식스니펫 서비스에 적용됐으며, ▲위키데이터 기반 분류체계 연구와 ▲ 메타블로킹 연구는 사용자가 노래 제목을 검색했을 때 지식베이스에서 음원사이트로 바로 연결되는 기능으로 구현됐다.

​네이버 서치(Search) CIC 강인호 책임리더는 “네이버가 AI 연구 개발에 적극 투자해온 결과들이 본격적으로 국내외 학회에서 인정받고 있으며, 음성, 대화, 스니펫 등 네이버 검색 서비스에 적용되어 사용자들에게 새로운 검색 경험을 선사하고 있다”며 “독보적인 한국어 정보 처리 기술력을 기반으로 국내 서비스를 개선해 나가는 한편, 글로벌 빅테크와 경쟁하는 AI 기술 플랫폼으로 거듭나기 위해 연구 개발에도 정진할 것”이라고 말했다. 

한편, 네이버는 한국어 AI 기술 개발로 서비스를 고도화하는 동시에, 글로벌 수준의 인프라, 데이터, 기술력을 기반으로 글로벌 AI 리더십을 확보할 계획이다. 네이버는 아시아와 유럽, 미국을 잇는 글로벌 R&D 벨트를 확장시키며 세계 전역의 우수한 연구진과 협업하며 기술 성장을 도모하고 있으며, 최근 세계 최고 권위의 머신러닝 및 AI 학회 ‘NeurIPS(Neural Information Processing systems, 신경정보처리시스템학회) 2021’에서도 8개 논문이 채택된 바 있다. 

글. 김효정 기자 needhj@naver.com | 사진 및 자료출처 = 네이버

ⓒ 브레인미디어 무단전재 및 재배포 금지