카카오 i 엔진

카카오 i 엔진

대화를 이해하고 이미지와 음성을
인식하는 AI 핵심 요소 기술입니다

카카오 i 엔진

핵심 AI 요소기술 기반 솔루션

방대한 데이터를 기반으로 대화를 이해하고 이미지와 음성을
인식하며 예측 및 최적화를 실행하는 핵심 AI 요소기술입니다.
모듈 방식으로 여러가지 조합을 생성하고 연결함으로써
최적화된 AI 서비스를 구현할 수 있습니다.

주요 엔진 소개

  • 컴퓨터비전

    사람의 얼굴과 동작, 자세 등 이미지와 영상에 담긴 다양한
    정보를 인식하고 분석합니다. 온라인 상품 이미지를 분석해
    추천을 해주고, 사진 속 글자를 인식하기도 합니다.

  • 자연어처리

    일상 속 자연어를 이해하고 분석합니다. 질문에 대한 정답을 찾아주고,
    대화의 의도와 맥락, 감정 등을 분석합니다. 번역, 스몰톡, 문서요약 등
    다양한 언어 서비스의 기반이 됩니다.

  • 음성처리

    음성을 텍스트로 변환하거나 텍스트를 음성으로로 생성합니다.
    특정 키워드로 기기를 호출하고 사용자의 목소리를 구별하는 등
    음성 서비스를 고도화합니다.

  • 예측 및 최적화

    정교한 데이터 분석을 통해 상품의 수요를 예측하고 이상 데이터를
    탐지합니다. 자원 배치 및 네트워크를 최적화해 비즈니스 리소스를
    효율적으로 관리하도록 돕습니다.

컴퓨터비전

  • 얼굴검출

    이미지에서 모든 얼굴의 위치를 찾고, 각 얼굴의 특징점/포즈/
    나이/성별을 예측합니다. 매대에서 제품을 체험하는 고객의
    나이 및 성별을 예측하여 고객 행태정보에 세그먼트 정보를
    더할 수 있습니다.

  • 얼굴인식

    이미지에서 얼굴을 인식하고 누구의 얼굴인지 식별합니다.
    이를 활용해 인증된 사용자에게만 자동으로 문을
    열어줄 수 있습니다.

  • 문서이해

    문서를 이해하고 문서에서 사용자가 필요로 하는 Key와
    Value를 추출합니다.

  • 글자인식(OCR)

    이미지에서 문자 영역을 검출하고 영역 내의 글자를
    인식합니다.

  • 유사상품 검색

    입력이미지로부터 상품을 검출하고 이와 유사한 상품을
    검색하여 추천합니다.

  • 멀티태깅

    이미지에서 자동으로 100여종의 다양한 태그를 생성합니다.
    이미지에 포함된 사물, 사람, 동식물 등의 대상을 인식하여
    이미지 속 장면에 관련된 태그를 뽑아낼 수 있습니다.

  • 다중카메라 사람 추적

    다중 카메라 영상에서 동일 인물을 추적하고, ID를
    특정하는 기술입니다. 하나의 디바이스에서 여러 인물의
    동시추적이 가능해 운영을 효율화할 수 있습니다.

  • 가상 피팅

    의류, 신발, 모자 등 패션 상품을 가상현실에서
    착용할 수 있도록 지원하는 기술입니다.

  • 음식인식

    이미지에서 음식 영역을 검출하고 어떤 종류의 음식인지
    식별합니다. 총 1,000여 종의 음식이 인식 가능합니다.

  • 성인이미지 판별

    이미지가 성인물에 해당하는지 판별합니다. 전연령 대상
    서비스에 적용 시 성인 이미지를 필터링할 수 있습니다.

  • 스마트썸네일

    입력된 이미지를 가장 잘 표현할 수 있는 썸네일을
    자동으로 생성합니다.


자연어처리

  • 질의교정

    사용자가 입력한 질의문에 있는 오타를 교정해주는
    기술입니다.

  • 대화이해

    목적지향 챗봇 등에서 발화의 의미를 이해하고 도메인
    에이전트에 필요한 슬롯을 태깅하기 위한 기술입니다.

  • 문장유사도 분석

    사용자의 질문과 의미적으로 가장 유사한 문장을 찾아주기
    위한 인코딩 기술입니다. 예시로 들자면, 고객센터 챗봇에
    질문을 하면 나의 질문과 유사한 FAQ와 답변을 받아볼 수 있습니다.

  • 질의응답

    사용자가 질문을 입력하면 수십억 개의 문서에서 검색 엔진의
    도움으로 문서를 검색한 후, 검색된 수십 개의 문서에서 사용자의
    질문에 맞는 답변을 질의응답 기술을 이용해 찾아주는 기술입니다.

  • 기계독해

    주어진 지문에 대해 질문을 하면 적합한 답변을
    찾아주기 위한 기술입니다.

  • 스몰톡

    앞선 대화 문맥을 보고 상황에 맞는 답변을 제공하는
    모델입니다. 스몰톡 답변 생성 모델을 활용해 일상 대화
    기능을 쉽게 구현할 수 있습니다.

  • 대화 감정분석

    대화 속에 나타난 화자의 감정(호/불호, 긍정/부정, 모호 등)을
    분석하는 기술입니다.

  • 위험발화 분류

    대화 문맥을 참고하여 혐오, 유해어, 사회적으로 이슈가
    될 만한 발화 여부를 판별하는 기술입니다.

  • 키워드 매칭

    문서와 함께 키워드를 전달하면, 일치하는 키워드 또는
    의미상 유사한 키워드 매칭 결과를 제공하는 기술입니다.

  • 맞춤법 검사

    사용자가 입력한 문서에서 철자 오류, 띄어쓰기 오류 등의
    맞춤법을 검사하고 자동으로 교정해주는 기술입니다.

  • 형태소 분석

    텍스트가 주어지면 이를 의미의 최소 단위인 형태소로
    분석하는 기술입니다. 'khaiii'라는 이름으로 github에
    공개되어 있습니다.

  • NL2SQL

    자연어 질의문을 SQL 질의문으로 변환하는 기술입니다.
    관계형 데이터베이스에 대해 자연어로 질의 가능한
    시스템 개발에 사용됩니다.

  • 대화번역

    채팅이나 대화체에 적합한 번역 기술입니다.

  • 문서번역

    하나의 언어로 된 문장이 입력되면 이를 원하는
    언어로 번역해 줍니다. 현재 19개 언어를 지원합니다.

  • 키워드 추출

    사용자가 입력한 문서에서 중요하고 의미있는 키워드를
    자동으로 추출하는 기술입니다.


음성처리

  • 음성인식

    사람의 말소리를 분석하여 문자로 자동 변환해주는
    기술입니다. Kakao의 다양한 음성 서비스에 사용되고 있습니다.

  • 음성합성

    텍스트를 인식하여 자연스러운 억양과 발음의
    목소리로 읽어줍니다.

  • 화자인식

    미리 내 목소리를 등록해 두면, 내 목소리가 입력되었을 때
    DB와 비교하여 화자가 나인 것을 인식합니다

  • 영어발음평가

    입력된 영어 발화 음성의 발음을 평가하고 이에 따른 점수를
    산출하는 기술입니다. 영어 학습자를 대상으로 하는
    영어문장 발음 자동 평가 시스템을 구축에 활용됩니다.

  • 핵심어검출

    입력된 음성에 미리 설정된 키워드가 포함되어 있으면
    이를 추출하여 인식합니다. 카카오미니를 "헤이, 카카오!" 하고
    불러서 깨울 때 사용됩니다

  • 음악인식

    재생 중인 음악의 일부를 인식하여 곡 정보를 찾아줍니다.
    지나가다 맘에 드는 음악이 들리면 누구의 어떤 노래인지
    검색할 수 있습니다

  • 잡음제거

    딥러닝 기반 음성 전처리 기술로, 다양한 소음 환경에서
    잡음을 제거하고 음성인식 성능을 향상시킵니다.


예측 및 최적화

  • 수요예측

    과거 수요 및 내/외부 데이터를 이용해 미래 수요를
    예측하는 기술입니다. 이를 통해 재고의 위치나 상품 가격
    최적화등에 활용할 수 있습니다.

  • 재고배치 최적화

    어떤 재고를 어떤 위치에 어떤 형태로 얼마만큼
    배치할지를 결정하는 기술입니다.

  • 리소스 관리

    시계열 데이터를 분석하여 인력 배치, 광고,
    에너지 소비 및 서버 용량에 계획을 수립합니다.


주요 소식

리소스 센터

카카오 i 엔진에 대해 궁금하신가요?
지금 바로 문의하세요
카카오톡 상담