보도자료

2022년 상반기 글로벌 탑티어 AI 학회 논문 17건 등재

“대한민국 AI 기술력 빛낸 글로벌 주역” 

– 카카오엔터프라이즈, 2022년 상반기 글로벌 탑티어 AI 학회 논문 17건 등재
– 자연어 처리, 음성 처리 분야 두각…사람 처럼 말하고 감정 인지하는 AI 개발
– 글로벌 탑티어 AI 얼굴인식 대회서 1위…미국, 중국 등 전 세계 내로라하는 AI 업체 제치며 한국 AI 기술력 입증
– 코쿼드1.0 1위 이어 2.0서도 1위 쾌거…더 이상 경쟁 상대 없는 한국어 기계독해 분야
– 글로벌 AI 기술력으로 더 나은 세상 발판…AI 챗봇・AI 컨택센터・스마트 시티까지

[2022-7-19] 2022년 상반기, 글로벌 AI 업계가 국내 대표 IT 플랫폼 기업 카카오엔터프라이즈에 주목했다.

카카오엔터프라이즈(대표 백상엽)는 2022년 상반기 인공지능(AI) 분야 탑티어 글로벌 학회에서 논문 17건을 등재했다고 19일 밝혔다. 카카오엔터프라이즈는 △자연어 처리 △음성 처리 △컴퓨터 비전 분야를 아우르는 연구 성과를 발표했고, 이번 해에는 새롭게 강화학습, 지식그래프(knowledge graph) 분야에서도 논문을 발표하며 국가대표 AI 기술 기업으로서의 입지를 강화했다. 

이중 자연어 처리, 음성 처리 분야에서 특히 두각을 나타내며 사람 처럼 말하고 감정을 인지하는 AI를 선보였다. 

카카오엔터프라이즈는 자연어 처리 분야 세계 최고 학회인 NAACL에서 기존 사전학습 언어모델(Pretrained Language Model)을 대화 속 감정을 추출하는 데에 활용하는 방법론을 발표했다. 최근 자연어처리 분야에서는 대화 속 감정을 인식하기 위해 상식이나 감정에 대한 외부지식을 이용한 방식이 활용되고 있다. 하지만 비영어권 언어에서는 영어에 비해 축적된 사전지식이 적기 때문에 이 방식을 그대로 적용하기 어렵다는 문제가 있다. 카카오엔터프라이즈는 이를 해결할 새로운 방법론을 제안하며 한국어에서 외부지식에 의존하지 않고도 감정 인식에서 높은 성능을 낼 수 있음을 증명했다. 이번 방법론으로 한국어 뿐만 아니라 기타 비영어권 언어에서도 대화 내 감정을 인식하는 기술을 적용할 수 있을 것으로 기대된다.

음성 처리 분야 세계 최대 규모 학술대회인 인터스피치(INTERSPEECH)에서는 총 4편의 연구 성과를 발표했다. 이 중 ‘E2E(End to End)-TTS(종단간 TTS)’ 기법을 응용해 기존 ‘뉴럴(Neural) TTS(Text to Speech)’ 개발 과정을 단순화하는 방법이 특히 업계의 주목을 받았다. 기존 뉴럴 TTS 방식이 음성 처리를 위해 2개의 모델(acoustic feature generator, neural vocoder)을 따로 학습해야 했다면 E2E-TTS 기법을 활용하면 두 모델을 한번에 학습할 수 있게 되어 학습 과정을 단축하는 것은 물론 더욱 고품질의 음성을 만들어 낼 수 있다. 카카오엔터프라이즈는 새로운 방법을 적용해 실제 사람과 구별하기 어려운 수준의 자연스러운 고품질의 음성을 개발하고 실시간 서비스에서 더욱 깨끗한 음성을 낼 수 있었다. 

카카오엔터프라이즈는 ‘실용적인 AI’에 집중하며 글로벌 기술력을 다양한 서비스로 연결시키는 데에도 많은 노력을 기울이고 있다. 감정 분석 및 합성음 기술을 통해 실제 사람 처럼 자연스러운 일상 대화를 나눌 수 있는 AI 챗봇을 선보이는 것은 물론, AI 컨택센터인 ‘카카오 i 커넥트 센터(Kakao i Connect Center)’를 더욱 고도화시켜 고객 상담을 지원하고 상담원의 업무를 효율화시키는 데에 힘쓸 계획이다. 

논문 발표 외에도 글로벌 탑티어 AI 대회에서도 전 세계가 주목할 성적을 거두었다. 카카오엔터프라이즈는 지난 6월 전 세계 기술 표준을 선도하는 미국 국립표준기술연구소(NIST, National Institute of Standards and Technology)가 주관하는 ‘얼굴 인식 기술 대회(FRVT, Face Recognition Vendor Test)’의 1:1 검증(verification) ‘키오스크(kiosk)’ 부문에서 카카오엔터프라이즈가 전 세계 1위를 차지했다. 미국, 중국 등 얼굴 인식 기술을 선도하는 전 세계의 유명 AI 업체들의 선전 속에서 카카오엔터프라이즈가 선두를 거머쥐며 한국 AI 기술력을 입증했다. 

지난 3월에는 자체 개발한 자연어처리 AI 모델로 한국어 기계독해 데이터셋 ‘코쿼드2.0(KorQuAD 2.0, The Korean Question Answering Dataset 2.0)’ 성능 평가에서 1위를 차지했다. 2019년 코쿼드1.0 1위에 이어 2022년 난이도가 더 높아진 코쿼드2.0에서도 1위를 기록하며 한국어 기계독해 분야에서는 더 이상 경쟁 상대가 없다고 할 수 있을 정도로 이 분야 강자 자리를 굳혔다. 1위에 오른 ‘리틀버드-라지(LittleBird-large)’ 모델은 정확도 90.22점을 기록했으며 처리 속도 역시 기존 1위 모델 대비 약 1.7배 빨라졌다.

백상엽 카카오엔터프라이즈 대표는 “카카오엔터프라이즈가 전 세계 탑티어 학회에서 논문을 발표하고 세계적인 기업과의 기술 경쟁에서 1등을 하는 등 우수한 성과를 거두면서, 이 같은 결과가 한 기업에 국한된 것이 아닌 한국의 AI 기술력을 알리는 것이라는 생각에 무한한 책임감을 느낀다. 반도체가 한국의 제조 경쟁력을 견인했던 것처럼 AI가 한국 디지털산업의 씨드(seed) 기술로 자리잡을 수 있도록 많은 투자와 노력을 아끼지 않겠다”면서 “카카오엔터프라이즈는 AI 기술력을 더욱 고도화시켜 이를 AI 챗봇, 컨택센터, 더 나아가 스마트시티를 구성하는 실제 서비스로 연결시킴으로써 사용자에게 더 나은 삶을 선사할 수 있는 기술 제공에 집중할 계획”이라고 밝혔다.

카카오톡 상담