핵심 AI 요소기술 기반 솔루션
방대한 데이터를 기반으로 대화를 이해하고 이미지와 음성을
인식하며 예측 및 최적화를 실행하는 핵심 AI 요소기술입니다.
모듈 방식으로 여러가지 조합을 생성하고 연결함으로써
최적화된 AI 서비스를 구현할 수 있습니다.
주요 엔진 소개
-
컴퓨터비전
사람의 얼굴과 동작, 자세 등 이미지와 영상에 담긴 다양한
정보를 인식하고 분석합니다. 온라인 상품 이미지를 분석해
추천을 해주고, 사진 속 글자를 인식하기도 합니다. -
자연어처리
일상 속 자연어를 이해하고 분석합니다. 질문에 대한 정답을 찾아주고,
대화의 의도와 맥락, 감정 등을 분석합니다. 번역, 스몰톡, 문서요약 등
다양한 언어 서비스의 기반이 됩니다. -
음성처리
음성을 텍스트로 변환하거나 텍스트를 음성으로로 생성합니다.
특정 키워드로 기기를 호출하고 사용자의 목소리를 구별하는 등
음성 서비스를 고도화합니다. -
예측 및 최적화
정교한 데이터 분석을 통해 상품의 수요를 예측하고 이상 데이터를
탐지합니다. 자원 배치 및 네트워크를 최적화해 비즈니스 리소스를
효율적으로 관리하도록 돕습니다.
컴퓨터비전
-
얼굴검출
이미지에서 모든 얼굴의 위치를 찾고, 각 얼굴의 특징점/포즈/
나이/성별을 예측합니다. 매대에서 제품을 체험하는 고객의
나이 및 성별을 예측하여 고객 행태정보에 세그먼트 정보를
더할 수 있습니다. -
얼굴인식
이미지에서 얼굴을 인식하고 누구의 얼굴인지 식별합니다.
이를 활용해 인증된 사용자에게만 자동으로 문을
열어줄 수 있습니다. -
문서이해
문서를 이해하고 문서에서 사용자가 필요로 하는 Key와
Value를 추출합니다. -
글자인식(OCR)
이미지에서 문자 영역을 검출하고 영역 내의 글자를
인식합니다. -
유사상품 검색
입력이미지로부터 상품을 검출하고 이와 유사한 상품을
검색하여 추천합니다. -
멀티태깅
이미지에서 자동으로 100여종의 다양한 태그를 생성합니다.
이미지에 포함된 사물, 사람, 동식물 등의 대상을 인식하여
이미지 속 장면에 관련된 태그를 뽑아낼 수 있습니다. -
다중카메라 사람 추적
다중 카메라 영상에서 동일 인물을 추적하고, ID를
특정하는 기술입니다. 하나의 디바이스에서 여러 인물의
동시추적이 가능해 운영을 효율화할 수 있습니다. -
가상 피팅
의류, 신발, 모자 등 패션 상품을 가상현실에서
착용할 수 있도록 지원하는 기술입니다. -
음식인식
이미지에서 음식 영역을 검출하고 어떤 종류의 음식인지
식별합니다. 총 1,000여 종의 음식이 인식 가능합니다. -
성인이미지 판별
이미지가 성인물에 해당하는지 판별합니다. 전연령 대상
서비스에 적용 시 성인 이미지를 필터링할 수 있습니다. -
스마트썸네일
입력된 이미지를 가장 잘 표현할 수 있는 썸네일을
자동으로 생성합니다.
자연어처리
-
질의교정
사용자가 입력한 질의문에 있는 오타를 교정해주는
기술입니다. -
대화이해
목적지향 챗봇 등에서 발화의 의미를 이해하고 도메인
에이전트에 필요한 슬롯을 태깅하기 위한 기술입니다. -
문장유사도 분석
사용자의 질문과 의미적으로 가장 유사한 문장을 찾아주기
위한 인코딩 기술입니다. 예시로 들자면, 고객센터 챗봇에
질문을 하면 나의 질문과 유사한 FAQ와 답변을 받아볼 수 있습니다. -
질의응답
사용자가 질문을 입력하면 수십억 개의 문서에서 검색 엔진의
도움으로 문서를 검색한 후, 검색된 수십 개의 문서에서 사용자의
질문에 맞는 답변을 질의응답 기술을 이용해 찾아주는 기술입니다. -
기계독해
주어진 지문에 대해 질문을 하면 적합한 답변을
찾아주기 위한 기술입니다. -
스몰톡
앞선 대화 문맥을 보고 상황에 맞는 답변을 제공하는
모델입니다. 스몰톡 답변 생성 모델을 활용해 일상 대화
기능을 쉽게 구현할 수 있습니다. -
대화 감정분석
대화 속에 나타난 화자의 감정(호/불호, 긍정/부정, 모호 등)을
분석하는 기술입니다. -
위험발화 분류
대화 문맥을 참고하여 혐오, 유해어, 사회적으로 이슈가
될 만한 발화 여부를 판별하는 기술입니다. -
키워드 매칭
문서와 함께 키워드를 전달하면, 일치하는 키워드 또는
의미상 유사한 키워드 매칭 결과를 제공하는 기술입니다. -
맞춤법 검사
사용자가 입력한 문서에서 철자 오류, 띄어쓰기 오류 등의
맞춤법을 검사하고 자동으로 교정해주는 기술입니다. -
형태소 분석
텍스트가 주어지면 이를 의미의 최소 단위인 형태소로
분석하는 기술입니다. 'khaiii'라는 이름으로 github에
공개되어 있습니다. -
NL2SQL
자연어 질의문을 SQL 질의문으로 변환하는 기술입니다.
관계형 데이터베이스에 대해 자연어로 질의 가능한
시스템 개발에 사용됩니다. -
대화번역
채팅이나 대화체에 적합한 번역 기술입니다.
-
문서번역
하나의 언어로 된 문장이 입력되면 이를 원하는
언어로 번역해 줍니다. 현재 19개 언어를 지원합니다. -
키워드 추출
사용자가 입력한 문서에서 중요하고 의미있는 키워드를
자동으로 추출하는 기술입니다.
음성처리
-
음성인식
사람의 말소리를 분석하여 문자로 자동 변환해주는
기술입니다. Kakao의 다양한 음성 서비스에 사용되고 있습니다. -
음성합성
텍스트를 인식하여 자연스러운 억양과 발음의
목소리로 읽어줍니다. -
화자인식
미리 내 목소리를 등록해 두면, 내 목소리가 입력되었을 때
DB와 비교하여 화자가 나인 것을 인식합니다 -
영어발음평가
입력된 영어 발화 음성의 발음을 평가하고 이에 따른 점수를
산출하는 기술입니다. 영어 학습자를 대상으로 하는
영어문장 발음 자동 평가 시스템을 구축에 활용됩니다. -
핵심어검출
입력된 음성에 미리 설정된 키워드가 포함되어 있으면
이를 추출하여 인식합니다. 카카오미니를 "헤이, 카카오!" 하고
불러서 깨울 때 사용됩니다 -
음악인식
재생 중인 음악의 일부를 인식하여 곡 정보를 찾아줍니다.
지나가다 맘에 드는 음악이 들리면 누구의 어떤 노래인지
검색할 수 있습니다 -
잡음제거
딥러닝 기반 음성 전처리 기술로, 다양한 소음 환경에서
잡음을 제거하고 음성인식 성능을 향상시킵니다.
예측 및 최적화
-
수요예측
과거 수요 및 내/외부 데이터를 이용해 미래 수요를
예측하는 기술입니다. 이를 통해 재고의 위치나 상품 가격
최적화등에 활용할 수 있습니다. -
재고배치 최적화
어떤 재고를 어떤 위치에 어떤 형태로 얼마만큼
배치할지를 결정하는 기술입니다. -
리소스 관리
시계열 데이터를 분석하여 인력 배치, 광고,
에너지 소비 및 서버 용량에 계획을 수립합니다.
주요 소식
-
세계 최대 음성 처리 AI 학술 대회 ‘인터스피치’서 논문성과 발표
– 오랄(oral) 포함 4편 논문 발표 진행하며 글로벌 AI 기술력 입증 – 사람처럼 말하고 느끼고 이해하는 AI 개발 방법론 제안 – ‘실용적인 AI’ 집중…AI 챗봇⋅AI 컨택센터 등 다양한 서비스 기반 기술 기대 [2022-9-19] 카카오엔터프라이즈(대표 백상엽)가 인공지능(AI) 음성 처리 분야 세계 최대 규모 학술대회인 인터스피치(INTERSPEECH)에서 총 4편의 연구 성과를 발표한다고 19일 밝혔다. 올해로 23회를 맞은 인터스피치는 […]
-
2022년 상반기 글로벌 탑티어 AI 학회 논문 17건 등재
2022년 상반기, 글로벌 AI 업계가 국내 대표 IT 플랫폼 기업 카카오엔터프라이즈에 주목했다. 카카오엔터프라이즈(대표 백상엽)는 2022년 상반기 인공지능(AI) 분야 탑티어 글로벌 학회에서 논문 17건을 등재했다고 19일 밝혔다.
-
카카오엔터프라이즈, AI 얼굴 인식 기술 글로벌 대회 1위
카카오엔터프라이즈(대표 백상엽)가 인공지능 얼굴 인식 분야의 글로벌 탑티어 기술 대회 1위라는 영예를 얻었다. 미국, 중국 등 얼굴 인식 기술을 선도하는 전 세계의 유명 AI 업체들이 맞붙는 글로벌 컴퓨터 비전 기술 대회에서 국내 기업인 카카오엔터프라이즈가 1위를 차지하며 글로벌 AI 업계의 주목을 받았다.
-
자체 AI모델로 한국어 기계독해 평가 1위 기록
– 한국어 특성에 최적화된 자체 개발 모델로 ‘KorQuAD 2.0’에서 최고점, 2019년에 이어 두번째 1위 기록 – 기존 1위 모델 대비 1.7배 처리 속도 향상, 분량이 많은 문서도 빠르게 처리 가능 – 향후 검색/챗봇/AI 컨택센터 등에 적용해 서비스 고도화 목표 [2022-03-22] 카카오엔터프라이즈의 AI 기술이 다시 한번 인정 받았다. 카카오엔터프라이즈(대표 백상엽)는 22일, 자체 개발한 자연어처리 AI 모델이 […]
-
고객 맞춤형 AI 음성인식 서비스 ‘커스텀 STT’ 공개
– 고객의 상황에 따라 직접 쉽고 빠르게 실시간 적용/개발 가능 장점 – 기존 STT 대비 문장 인식율 대폭 향상 – ‘카카오 i 커넥트 센터’ (AICC) 문의응대/상담 업무에 도입 예정 – 향후 문자인식(OCR), 음성합성(TTS) 기술도 커스텀이 가능한 서비스형 AI(AIaaS)로 공개 [2022.01.25] 카카오엔터프라이즈(대표 백상엽)가 기업용 AI 음성 인식-변환 모델 ‘커스텀 STT(Custom Speech-to-Text)’를 공개했다. STT는 AI를 활용해 음성을 […]