KR20200009332A - 음성 명령 기반의 서비스를 제공하는 공용 단말, 방법 및 컴퓨터 프로그램 - Google Patents

음성 명령 기반의 서비스를 제공하는 공용 단말, 방법 및 컴퓨터 프로그램 Download PDF

Info

Publication number
KR20200009332A
KR20200009332A KR1020180083553A KR20180083553A KR20200009332A KR 20200009332 A KR20200009332 A KR 20200009332A KR 1020180083553 A KR1020180083553 A KR 1020180083553A KR 20180083553 A KR20180083553 A KR 20180083553A KR 20200009332 A KR20200009332 A KR 20200009332A
Authority
KR
South Korea
Prior art keywords
user
service
agent
services
voice command
Prior art date
Application number
KR1020180083553A
Other languages
English (en)
Inventor
이지인
김원우
임미숙
Original Assignee
주식회사 케이티
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 케이티 filed Critical 주식회사 케이티
Priority to KR1020180083553A priority Critical patent/KR20200009332A/ko
Publication of KR20200009332A publication Critical patent/KR20200009332A/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/04Segmentation; Word boundary detection
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/225Feedback of the input speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

음성 명령 기반의 서비스를 제공하는 공용 단말은 공용 단말에서 제공하는 복수의 서비스를 사용자의 히스토리 데이터에 기초하여 분류하는 서비스 분류부, 상기 분류된 복수의 서비스를 각 서비스의 유형에 따라 복수의 카테고리로 분류하는 카테고리 분류부, 상기 분류된 복수의 카테고리에 대응하는 에이전트를 각각 설정하는 에이전트 설정부 및 상기 설정된 에이전트를 통해 상기 사용자로부터 입력받은 음성 명령에 대응하는 서비스를 제공하는 서비스 제공부를 포함한다.

Description

음성 명령 기반의 서비스를 제공하는 공용 단말, 방법 및 컴퓨터 프로그램{COMMON DEVICE, METHOD AND COMPUTER PROGRAM FOR PROVIDING SERVICE BASED ON VOICE COMMAND}
본 발명은 음성 명령 기반의 서비스를 제공하는 공용 단말, 방법 및 컴퓨터 프로그램에 관한 것이다.
지능형 개인 비서는 사용자가 요구하는 작업을 처리하고, 사용자에게 특화된 서비스를 제공하는 소프트웨어 에이전트이다. 지능형 개인 비서는 인공 지능(AI) 엔진과 음성 인식을 기반으로 사용자에게 맞춤 정보를 수집하여 제공하고, 사용자의 음성 명령에 따라 일정 관리, 이메일 전송, 식당 예약 등 여러 기능을 수행하는 점에서 사용자의 편의성을 향상시키는 장점을 갖는다.
이러한 지능형 개인 비서는 주로 스마트폰에서 맞춤형 개인 서비스의 형태로 제공되고 있으며, 대표적으로 애플의 시리(siri), 구글의 나우(now), 삼성의 빅스비 등이 이에 포함된다. 이와 관련하여, 선행기술인 한국공개특허 제 2016-0071111호는 전자 장치에서의 개인 비서 서비스 제공 방법을 개시하고 있다.
그러나 지능형 개인 비서는 지능형 개인 비서에서 제공하는 각 서비스마다 사용 명령어가 상이하며, 사용자는 각 서비스를 제공받기 위해 모든 사용 명령어를 기억해야 한다. 이로 인해, 사용자는 지능형 개인 비서의 사용법에 불편함을 느끼게 된다는 단점을 갖는다.
공용 단말에서 제공하는 복수의 서비스를 유형별로 카테고리화여 분류하고, 분류된 카테고리 별로 에이전트를 부여함으로써, 사용자에게 사용 편의성 및 지속성을 향상시키는 음성 명령 기반의 서비스를 제공하는 공용 단말, 방법 및 컴퓨터 프로그램을 제공하고자 한다.
사용자가 각 서비스의 유형별로 에이전트를 설정함으로써, 개인 맞춤형의 음성 명령 기반의 서비스를 통해 사용자에게 기기 친밀도 및 수용도를 높일 수 있도록 하는 음성 명령 기반의 서비스를 제공하는 공용 단말, 방법 및 컴퓨터 프로그램을 제공하고자 한다.
사용자의 히스토리 데이터와 상황 데이터의 조합을 통해 사용자의 상황에 맞는 서비스를 에이전트가 능동적으로 추천하는 음성 명령 기반의 서비스를 제공하는 공용 단말, 방법 및 컴퓨터 프로그램을 제공하고자 한다.
사용자가 에이전트명을 호출하고, 호출된 에이전트명에 대응하는 에이전트가 실행되어 사용자의 상황에 맞는 서비스를 자동으로 제공되도록 함으로써, 서비스의 진입까지의 뎁스(depth)를 단축시킬 수 있는 음성 명령 기반의 서비스를 제공하는 공용 단말, 방법 및 컴퓨터 프로그램을 제공하고자 한다.
다만, 본 실시예가 이루고자 하는 기술적 과제는 상기된 바와 같은 기술적 과제들로 한정되지 않으며, 또 다른 기술적 과제들이 존재할 수 있다.
상술한 기술적 과제를 달성하기 위한 수단으로서, 본 발명의 일 실시예는, 공용 단말에서 제공하는 복수의 서비스를 사용자의 히스토리 데이터에 기초하여 분류하는 서비스 분류부, 상기 분류된 복수의 서비스를 각 서비스의 유형에 따라 복수의 카테고리로 분류하는 카테고리 분류부, 상기 분류된 복수의 카테고리에 대응하는 에이전트를 각각 설정하는 에이전트 설정부 및 상기 설정된 에이전트를 통해 상기 사용자로부터 입력받은 음성 명령에 대응하는 서비스를 제공하는 서비스 제공부를 포함하는 공용 단말을 제공할 수 있다.
본 발명의 다른 실시예는, 복수의 서비스를 사용자의 히스토리 데이터에 기초하여 분류하는 단계, 상기 분류된 복수의 서비스를 각 서비스의 유형에 따라 복수의 카테고리로 분류하는 단계, 상기 분류된 복수의 카테고리에 대응하는 에이전트를 각각 설정하는 단계 및 상기 설정된 에이전트를 통해 상기 사용자로부터 입력받은 음성 명령에 대응하는 서비스를 제공하는 단계를 포함하는 서비스 제공 방법을 제공할 수 있다.
본 발명의 또 다른 실시예는, 컴퓨터 프로그램은 컴퓨팅 장치에 의해 실행될 경우, 복수의 서비스를 사용자의 히스토리 데이터에 기초하여 분류하고, 상기 분류된 복수의 서비스를 각 서비스의 유형에 따라 복수의 카테고리로 분류하고, 상기 분류된 복수의 카테고리에 대응하는 에이전트를 각각 설정하고, 상기 설정된 에이전트를 통해 상기 사용자로부터 입력받은 음성 명령에 대응하는 서비스를 제공하도록 하는 명령어들의 시퀀스를 포함하는 매체에 저장된 컴퓨터 프로그램을 제공할 수 있다.
상술한 과제 해결 수단은 단지 예시적인 것으로서, 본 발명을 제한하려는 의도로 해석되지 않아야 한다. 상술한 예시적인 실시예 외에도, 도면 및 발명의 상세한 설명에 기재된 추가적인 실시예가 존재할 수 있다.
전술한 본 발명의 과제 해결 수단 중 어느 하나에 의하면, 공용 단말에서 제공하는 복수의 서비스를 유형별로 카테고리화여 분류하고, 분류된 카테고리별로 에이전트를 부여함으로써, 사용자에게 사용 편의성 및 지속성을 향상시키는 음성 명령 기반의 서비스를 제공하는 공용 단말, 방법 및 컴퓨터 프로그램을 제공할 수 있다.
사용자가 각 서비스의 유형별로 에이전트를 설정함으로써, 개인 맞춤형의 음성 명령 기반의 서비스를 통해 사용자에게 기기 친밀도 및 수용도를 높일 수 있도록 하는 음성 명령 기반의 서비스를 제공하는 공용 단말, 방법 및 컴퓨터 프로그램을 제공할 수 있다.
사용자의 히스토리 데이터와 상황 데이터의 조합을 통해 사용자의 상황에 맞는 서비스를 에이전트가 능동적으로 추천하는 음성 명령 기반의 서비스를 제공하는 공용 단말, 방법 및 컴퓨터 프로그램을 제공할 수 있다.
사용자가 에이전트명을 호출하고, 호출된 에이전트명에 대응하는 에이전트가 실행되어 사용자의 상황에 맞는 서비스를 자동으로 제공되도록 함으로써, 서비스의 진입까지의 뎁스(depth)를 단축시킬 수 있는 음성 명령 기반의 서비스를 제공하는 공용 단말, 방법 및 컴퓨터 프로그램을 제공할 수 있다.
도 1은 본 발명의 일 실시예에 따른 서비스 제공 시스템의 구성도이다.
도 2는 본 발명의 일 실시예에 따른 공용 단말의 구성도이다.
도 3은 본 발명의 일 실시예에 따른 공용 단말에서 제공하는 복수의 서비스를 복수의 카테고리로 분류하는 과정을 설명하기 위한 예시적인 도면이다.
도 4는 본 발명의 일 실시예에 따른 공용 단말에서 복수의 에이전트에 대해 속성 정보를 설정하는 방법의 순서도이다.
도 5는 본 발명의 일 실시예에 따른 공용 단말에서 음성 명령 기반의 서비스를 제공하는 방법의 순서도이다.
아래에서는 첨부한 도면을 참조하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 발명의 실시예를 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "전기적으로 연결"되어 있는 경우도 포함한다. 또한 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미하며, 하나 또는 그 이상의 다른 특징이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
본 명세서에 있어서 '부(部)'란, 하드웨어에 의해 실현되는 유닛(unit), 소프트웨어에 의해 실현되는 유닛, 양방을 이용하여 실현되는 유닛을 포함한다. 또한, 1 개의 유닛이 2 개 이상의 하드웨어를 이용하여 실현되어도 되고, 2 개 이상의 유닛이 1 개의 하드웨어에 의해 실현되어도 된다.
본 명세서에 있어서 단말 또는 디바이스가 수행하는 것으로 기술된 동작이나 기능 중 일부는 해당 단말 또는 디바이스와 연결된 서버에서 대신 수행될 수도 있다. 이와 마찬가지로, 서버가 수행하는 것으로 기술된 동작이나 기능 중 일부도 해당 서버와 연결된 단말 또는 디바이스에서 수행될 수도 있다.
이하 첨부된 도면을 참고하여 본 발명의 일 실시예를 상세히 설명하기로 한다.
도 1은 본 발명의 일 실시예에 따른 서비스 제공 시스템의 구성도이다. 도 1을 참조하면, 서비스 제공 시스템(1)은 공용 단말(110), 디스플레이 장치(115) 및 대화 서버(120)를 포함할 수 있다. 공용 단말(110), 디스플레이 장치(115) 및 대화 서버(120)는 서비스 제공 시스템(1)에 의하여 제어될 수 있는 구성요소들을 예시적으로 도시한 것이다.
도 1의 서비스 제공 시스템(1)의 각 구성요소들은 일반적으로 네트워크(network)를 통해 연결된다. 예를 들어, 도 1에 도시된 바와 같이, 공용 단말(110)은 디스플레이 장치(115) 또는 대화 서버(120)와 동시에 또는 시간 간격을 두고 연결될 수 있다.
네트워크는 단말들 및 서버들과 같은 각각의 노드 상호 간에 정보 교환이 가능한 연결 구조를 의미하는 것으로, 근거리 통신망(LAN: Local Area Network), 광역 통신망(WAN: Wide Area Network), 인터넷 (WWW: World Wide Web), 유무선 데이터 통신망, 전화망, 유무선 텔레비전 통신망 등을 포함한다. 무선 데이터 통신망의 일례에는 3G, 4G, 5G, 3GPP(3rd Generation Partnership Project), LTE(Long Term Evolution), WIMAX(World Interoperability for Microwave Access), 와이파이(Wi-Fi), 블루투스 통신, 적외선 통신, 초음파 통신, 가시광 통신(VLC: Visible Light Communication), 라이파이(LiFi) 등이 포함되나 이에 한정되지는 않는다.
공용 단말(110)은 음성 AI를 기반으로 하여 복수의 서비스를 사용자(100)에게 제공할 수 있다. 사용자(100)는 예를 들어, 리모트 컨트롤과 같은 외부 제어 장치를 통해 공용 단말(110)을 제어할 수 있지만, 사용자(100)가 발화하는 음성 명령에 의해서도 공용 단말(110)을 제어할 수 있다.
공용 단말(110)은 공용 단말(110)에서 제공하는 복수의 서비스를 사용자(100)의 히스토리 데이터에 기초하여 분류할 수 있다. 히스토리 데이터는 예를 들어, 서비스 제공 이력, 사용자(100)로부터 수신한 음성 명령 및 사용자(100)에게 제공된 음성 대화 이력 등을 포함할 수 있다. 예를 들어, 공용 단말(110)은 사용자(100)의 히스토리 데이터에 기초하여 공용 단말(110)에서 제공하는 복수의 서비스에 대해 각 서비스가 이용되는 빈도수에 따라 가중치를 부여하고, 부여된 가중치에 기초하여 복수의 서비스를 분류할 수 있다.
공용 단말(110)은 분류된 복수의 서비스를 각 서비스의 유형에 따라 복수의 카테고리로 분류할 수 있다.
공용 단말(110)은 분류된 복수의 카테고리에 대응하는 에이전트를 각각 설정할 수 있다.
공용 단말(110)은 사용자(100)로부터 복수의 에이전트 각각에 대해 속성 정보를 설정받을 수 있다. 예를 들어, 공용 단말(110)은 사용자(100)로부터 복수의 에이전트 각각에 대해 캐릭터, 이미지, 목소리 유형, 에이전트명 등을 설정받을 수 있다.
공용 단말(110)은 설정된 에이전트를 통해 사용자(100)로부터 입력받은 음성 명령에 대응하는 서비스를 제공할 수 있다.
공용 단말(110)은 음성 명령에 에이전트명이 포함된 경우, 에이전트명에 대응하는 에이전트를 통해 서비스를 제공할 수 있다.
공용 단말(110)은 에이전트명에 대응하는 에이전트를 통해 히스토리 데이터 및 상황 데이터에 기초하여 이용 가능한 서비스를 추천할 수 있다. 여기서, 상황 데이터는 예를 들어, 사용자(100)의 위치 정보 및 주변 소음 정도 등을 포함할 수 있다.
공용 단말(110)은 사용자(100)로부터 발화된 음성 명령을 입력받을 수 있다.
이러한 공용 단말(110)은 음성 명령 기반의 서비스를 제공하는 명령어들의 시퀀스를 포함하는 매체에 저장된 컴퓨터 프로그램에 의해 실행될 수 있다. 컴퓨터 프로그램은 컴퓨팅 장치에 의해 실행될 경우, 복수의 서비스를 사용자(100)의 히스토리 데이터에 기초하여 분류하고, 분류된 복수의 서비스를 각 서비스의 유형에 따라 복수의 카테고리로 분류하고, 분류된 복수의 카테고리에 대응하는 에이전트를 각각 설정하고, 설정된 에이전트를 통해 사용자(100)로부터 입력받은 음성 명령에 대응하는 서비스를 제공하도록 하는 명령어들의 시퀀스를 포함할 수 있다.
디스플레이 장치(115)는 공용 단말(110)에서 사용자(100)로부터 입력받은 음성 명령에 대응하는 서비스를 디스플레이를 통해 표시할 수 있다.
디스플레이 장치(115)는 공용 단말(110)에서 사용자(100)로부터 에이전트명을 포함하는 음성 명령을 수신한 경우, 에이전트명에 대응하는 에이전트를 실행시키고, 해당 에이전트에 설정된 캐릭터 또는 이미지를 디스플레이에 표시할 수 있다.
대화 서버(120)는 공용 단말(110)로부터 사용자(100)의 음성 명령을 수신할 수 있다. 대화 서버(120)는 수신한 사용자(100)의 음성 명령을 텍스트로 변환하고, 변환된 음성 명령에 대응하는 텍스트를 공용 단말(110)로 제공할 수 있다.
대화 서버(120)는 텍스트로 변환된 사용자(100)의 음성 명령에 대해 문맥 분석 및 해석을 통해 답변을 도출할 수 있고, 도출된 답변을 텍스트로 변환하여 공용 단말(110)로 제공할 수 있다.
이와 같이, 대화 서버(120)는 공용 단말(110)로 사용자(100)로부터 입력된 음성 명령에 대한 답변을 생성하고, 생성된 음성 명령에 대한 답변을 공용 단말(110)로 제공함으로써, 사용자(100)에게 대화 서비스 기능을 제공할 수 있다.
공용 단말(110)로부터 제공되는 대화 서비스 기능에 의해 사용자(100) 및 대화 서버(120) 간의 대화 이력이 저장되어 본원 발명이 제안하는 기술을 위해 사용될 수 있다.
도 2는 본 발명의 일 실시예에 따른 공용 단말의 구성도이다. 도 2를 참조하면, 공용 단말(110)은 서비스 분류부(210), 카테고리 분류부(220), 에이전트 설정부(230), 설정부(240), 서비스 제공부(250) 및 입력부(260)를 포함할 수 있다.
서비스 분류부(210)는 공용 단말(110)에서 제공하는 복수의 서비스를 사용자(100)의 히스토리 데이터에 기초하여 분류할 수 있다. 히스토리 데이터는 예를 들어, 서비스 제공 이력, 사용자(100)로부터 수신한 음성 명령 및 사용자(100)에게 제공된 음성 대화 이력 등을 포함할 수 있다.
서비스 분류부(210)는 사용자(100)의 히스토리 데이터에 기초하여 공용 단말(110)에서 제공하는 복수의 서비스에 대해 각 서비스가 이용되는 빈도수에 따라 가중치를 부여하고, 부여된 가중치에 기초하여 복수의 서비스를 분류할 수 있다.
카테고리 분류부(220)는 분류된 복수의 서비스를 각 서비스의 유형에 따라 복수의 카테고리로 분류할 수 있다. 복수의 카테고리는 예를 들어, 정보성, 유희성 및 편의성으로 구성될 수 있다. 이 때, 분류된 서비스는 사용자(100)의 목적에 의해 서비스가 다른 카테고리로 변경되거나, 추가될 수도 있다.
에이전트 설정부(230)는 분류된 복수의 카테고리에 대응하는 에이전트를 각각 설정할 수 있다. 예를 들어, 에이전트 설정부(230)는 정보성 카테고리에 대해 제 1 에이전트를 설정하고, 유희성 카테고리에 대해 제 2 에이전트를 설정하고, 편의성 카테고리에 대해 제 3 에이전트를 설정할 수 있다.
설정부(240)는 사용자(100)로부터 복수의 에이전트 각각에 대해 속성 정보를 설정받을 수 있다. 설정부(240)는 사용자(100)로부터 복수의 에이전트 각각에 대해 캐릭터, 이미지, 목소리 유형 등을 설정받을 수 있다.
이 때, 공용 단말(110)이 디스플레이를 구비하거나 디스플레이 장치(115)와 연동됨으로써 화면을 구비한 경우, 복수의 에이전트 각각은 캐릭터, 아바타, 이미지 등을 설정받을 수 있으며, 공용 단말(110)이 디스플레이를 구비하지 않거나 디스플레이 장치(115)와 연동되지 않음으로써 화면을 구비하지 않은 경우, 복수의 에이전트 각각은 목소리, 톤, 어조, 억양 등을 설정받아 각 에이전트 별로 음성에 변화를 주도록 할 수 있다.
설정부(240)는 사용자(100)로부터 복수의 에이전트 각각에 대해 에이전트명을 설정받을 수 있다. 예를 들어, 설정부(240)는 사용자(100)로부터 제 1 에이전트에 대해 '토끼'라는 에이전트명을 설정받고, 제 2 에이전트에 대해 '거북이'라는 에이전트명을 설정받고, 제 3 에이전트에 대해 '코끼리'라는 에이전트명을 설정받을 수 있다.
서비스 제공부(250)는 설정된 에이전트를 통해 사용자(100)로부터 입력받은 음성 명령에 대응하는 서비스를 제공할 수 있다.
서비스 제공부(250)는 음성 명령에 에이전트명이 포함된 경우, 에이전트명에 대응하는 에이전트를 통해 서비스를 제공할 수 있다. 예를 들어, 서비스 제공부(250)는 음성 명령에 '코끼리'라는 에이전트명이 포함된 경우, '코끼리'라는 에이전트명에 대응하는 제 3 에이전트를 실행시켜 서비스를 제공하도록 할 수 있다.
서비스 제공부(250)는 에이전트명에 대응하는 에이전트를 통해 히스토리 데이터 및 상황 데이터에 기초하여 사용자(100)에게 장소 및 시간 별로 상황에 따라 이용 가능한 서비스를 추천할 수 있다. 여기서, 상황 데이터는 예를 들어, 사용자(100)의 위치 정보 및 주변 소음 정도 등을 포함할 수 있다. 예를 들어, 입력부(260)에서 사용자(100)로부터 "거북이"라는 에이전트명을 포함하는 음성 명령을 입력받고, 사용자(100)가 주말 2시에 집에 있는 상황인 경우, 서비스 제공부(250)는 "거북이"라는 에이전트명에 대응하는 제 2 에이전트에서 사용자(100)가 주말 2시에 집에서 주로 이용한 서비스인 '게임 서비스'를 추천할 수 있다.
입력부(260)는 사용자(100)로부터 발화된 음성 명령을 입력받을 수 있다. 이 때, 입력부(260)는 사용자(100)로부터 에이전트명을 포함하는 음성 명령을 입력받을 수 있다. 예를 들어, 입력부(260)는 사용자(100)로부터 제 1 에이전트를 호출하기 위한 "토끼야"라는 음성 명령을 입력받을 수 있다.
도 3은 본 발명의 일 실시예에 따른 공용 단말에서 제공하는 복수의 서비스를 복수의 카테고리로 분류하는 과정을 설명하기 위한 예시적인 도면이다. 도 3을 참조하면, 공용 단말(110)은 공용 단말(110)에서 제공하는 복수의 서비스를 사용자(100)의 히스토리 데이터에 기초하여 분류할 수 있다. 예를 들어, 공용 단말(110)은 사용자(100)의 히스토리 데이터에 기초하여 공용 단말(110)에서 제공하는 복수의 서비스에 대해 각 서비스가 이용되는 빈도수에 따라 가중치를 부여하고, 부여된 가중치에 기초하여 복수의 서비스를 분류할 수 있다.
이후, 공용 단말(110)은 분류된 복수의 서비스(310)를 각 서비스의 유형에 따라 복수의 카테고리(300)로 분류할 수 있다. 복수의 카테고리(300)는 예를 들어, 제 1 유형(301), 제 2 유형(302), 제 3 유형(303)으로 구성될 수 있다.
제 1 유형(301)은 정보성 서비스로, 예를 들어, 날씨, 교통 및 생활 정보, 뉴스, 사전, 교육, 어학 등의 서비스를 포함할 수 있다.
제 2 유형(302)은 유희성 서비스로, 음악, 라디오, 영상 재생, 게임, 감성 대화 등의 서비스를 포함할 수 있다.
제 3 유형(303)은 편의성 서비스로, 타이머, 알람, 일정관리, IoT 기기 제어, 쇼핑 및 주문, 금융 등의 서비스를 포함할 수 있다.
도 4는 본 발명의 일 실시예에 따른 공용 단말에서 복수의 에이전트에 대해 속성 정보를 설정하는 방법의 순서도이다. 도 4에 도시된 공용 단말(110)에서 복수의 에이전트에 대해 속성 정보를 설정하는 방법은 도 1 내지 도 3에 도시된 실시예에 따른 서비스 제공 시스템(1)에 의해 시계열적으로 처리되는 단계들을 포함한다. 따라서, 이하 생략된 내용이라고 하더라도 도 1 내지 도 3에 도시된 실시예에 따른 공용 단말(110)에서 복수의 에이전트에 대해 속성 정보를 설정하는 방법에도 적용된다.
공용 단말(110)은 공용 단말(110)에서 제공하는 복수의 서비스를 사용자(100)의 히스토리 데이터에 기초하여 분류한 후, 분류된 복수의 서비스를 각 서비스의 유형에 따라 복수의 카테고리로 분류할 수 있다(S410).
공용 단말(110)은 분류된 복수의 카테고리에 대응하는 에이전트를 각각 설정할 수 있다(S420).
공용 단말(110)은 공용 단말(110)의 UI 화면이 존재하는지 여부를 판단할 수 있다(S430). 예를 들어, 공용 단말(110)의 UI 화면이 존재하는 경우(S431), 공용 단말(110)은 에이전트별로 캐릭터 또는 이미지를 설정하고(S440), 에이전트별로 목소리 유형을 설정하고(S450), 에이전트별로 에이전트명을 설정할 수 있다(S460). 다른 예를 들어, 공용 단말(110)의 UI 화면이 존재하지 않는 경우(S432), 공용 단말(110)은 에이전트별로 목소리 유형을 설정하고(S450), 에이전트별로 에이전트명을 설정할 수 있다(S460).
상술한 설명에서, 단계 S410 내지 S460은 본 발명의 구현예에 따라서, 추가적인 단계들로 더 분할되거나, 더 적은 단계들로 조합될 수 있다. 또한, 일부 단계는 필요에 따라 생략될 수도 있고, 단계 간의 순서가 전환될 수도 있다.
도 5는 본 발명의 일 실시예에 따른 공용 단말에서 음성 명령 기반의 서비스를 제공하는 방법의 순서도이다. 도 5에 도시된 공용 단말(110)에서 음성 명령 기반의 서비스를 제공하는 방법은 도 1 내지 도 4에 도시된 실시예에 따른 서비스 제공 시스템(1)에 의해 시계열적으로 처리되는 단계들을 포함한다. 따라서, 이하 생략된 내용이라고 하더라도 도 1 내지 도 4에 도시된 실시예에 따른 공용 단말(110)에서 음성 명령 기반의 서비스를 제공하는 방법에도 적용된다.
단계 S510에서 공용 단말(110)은 복수의 서비스를 사용자(100)의 히스토리 데이터에 기초하여 분류할 수 있다.
단계 S520에서 공용 단말(110)은 분류된 복수의 서비스를 각 서비스의 유형에 따라 복수의 카테고리로 분류할 수 있다.
단계 S530에서 공용 단말(110)은 분류된 복수의 카테고리에 대응하는 에이전트를 각각 설정할 수 있다.
단계 S540에서 공용 단말(110)은 설정된 에이전트를 통해 사용자(100)로부터 입력받은 음성 명령에 대응하는 서비스를 제공할 수 있다.
상술한 설명에서, 단계 S510 내지 S540은 본 발명의 구현예에 따라서, 추가적인 단계들로 더 분할되거나, 더 적은 단계들로 조합될 수 있다. 또한, 일부 단계는 필요에 따라 생략될 수도 있고, 단계 간의 순서가 전환될 수도 있다.
도 1 내지 도 5를 통해 설명된 공용 단말에서 음성 명령 기반의 서비스를 제공하는 방법은 컴퓨터에 의해 실행되는 매체에 저장된 컴퓨터 프로그램 또는 컴퓨터에 의해 실행 가능한 명령어를 포함하는 기록 매체의 형태로도 구현될 수 있다. 또한, 도 1 내지 도 5를 통해 설명된 공용 단말에서 음성 명령 기반의 서비스를 제공하는 방법은 컴퓨터에 의해 실행되는 매체에 저장된 컴퓨터 프로그램의 형태로도 구현될 수 있다.
컴퓨터 판독 가능 매체는 컴퓨터에 의해 액세스될 수 있는 임의의 가용 매체일 수 있고, 휘발성 및 비휘발성 매체, 분리형 및 비분리형 매체를 모두 포함한다. 또한, 컴퓨터 판독가능 매체는 컴퓨터 저장 매체를 포함할 수 있다. 컴퓨터 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보의 저장을 위한 임의의 방법 또는 기술로 구현된 휘발성 및 비휘발성, 분리형 및 비분리형 매체를 모두 포함한다.
전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.
본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
100: 사용자
110: 미디어 재생 장치
115: 디스플레이 장치
120: 대화 서버
210: 서비스 분류부
220: 카테고리 분류부
230: 에이전트 설정부
240: 설정부
250: 서비스 제공부
260: 입력부

Claims (17)

  1. 음성 명령 기반의 서비스를 제공하는 공용 단말에 있어서,
    공용 단말에서 제공하는 복수의 서비스를 사용자의 히스토리 데이터에 기초하여 분류하는 서비스 분류부;
    상기 분류된 복수의 서비스를 각 서비스의 유형에 따라 복수의 카테고리로 분류하는 카테고리 분류부;
    상기 분류된 복수의 카테고리에 대응하는 에이전트를 각각 설정하는 에이전트 설정부; 및
    상기 설정된 에이전트를 통해 상기 사용자로부터 입력받은 음성 명령에 대응하는 서비스를 제공하는 서비스 제공부
    를 포함하는, 공용 단말.
  2. 제 1 항에 있어서,
    상기 히스토리 데이터는 서비스 제공 이력, 상기 사용자로부터 수신한 음성 명령 및 상기 사용자에게 제공된 음성 대화 이력 중 어느 하나 이상을 포함하는 것인, 공용 단말.
  3. 제 2 항에 있어서,
    상기 서비스 분류부는 상기 사용자의 히스토리 데이터에 기초하여 상기 공용 단말에서 제공하는 복수의 서비스에 대해 각 서비스가 이용되는 빈도수에 따라 가중치를 부여하고,
    상기 부여된 가중치에 기초하여 상기 복수의 서비스를 분류하는 것인, 공용 단말.
  4. 제 1 항에 있어서,
    상기 사용자로부터 복수의 에이전트 각각에 대해 속성 정보를 설정받는 설정부를 더 포함하는, 공용 단말.
  5. 제 4 항에 있어서,
    상기 설정부는 상기 사용자로부터 상기 복수의 에이전트 각각에 대해 캐릭터, 이미지, 목소리 유형, 에이전트명 중 어느 하나 이상을 설정받는 것인, 공용 단말.
  6. 제 5 항에 있어서,
    상기 사용자로부터 발화된 음성 명령을 입력받는 입력부를 더 포함하되,
    상기 서비스 제공부는 상기 음성 명령에 상기 에이전트명이 포함된 경우, 상기 에이전트명에 대응하는 에이전트를 통해 서비스를 제공하는 것인, 공용 단말.
  7. 제 6 항에 있어서,
    상기 서비스 제공부는 상기 에이전트명에 대응하는 에이전트를 통해 상기 히스토리 데이터 및 상황 데이터에 기초하여 이용 가능한 서비스를 추천하는 것인, 공용 단말.
  8. 제 7 항에 있어서,
    상기 상황 데이터는 상기 사용자의 위치 정보 및 주변 소음 정도 중 어느 하나를 포함하는 것인, 공용 단말.
  9. 공용 단말에서 음성 명령 기반의 서비스를 제공하는 방법에 있어서,
    복수의 서비스를 사용자의 히스토리 데이터에 기초하여 분류하는 단계;
    상기 분류된 복수의 서비스를 각 서비스의 유형에 따라 복수의 카테고리로 분류하는 단계;
    상기 분류된 복수의 카테고리에 대응하는 에이전트를 각각 설정하는 단계; 및
    상기 설정된 에이전트를 통해 상기 사용자로부터 입력받은 음성 명령에 대응하는 서비스를 제공하는 단계
    를 포함하는, 서비스 제공 방법.
  10. 제 9 항에 있어서,
    상기 히스토리 데이터는 서비스 제공 이력, 상기 사용자로부터 수신한 음성 명령 및 상기 사용자에게 제공된 음성 대화 이력 중 어느 하나 이상을 포함하는 것인, 서비스 제공 방법.
  11. 제 10 항에 있어서,
    상기 복수의 서비스를 분류하는 단계는, 상기 사용자의 히스토리 데이터에 기초하여 상기 공용 단말에서 제공하는 복수의 서비스에 대해 각 서비스가 이용되는 빈도수에 따라 가중치를 부여하고,
    상기 부여된 가중치에 기초하여 상기 복수의 서비스를 분류하는 것인, 서비스 제공 방법.
  12. 제 9 항에 있어서,
    상기 사용자로부터 복수의 에이전트 각각에 대해 속성 정보를 설정받는 단계를 더 포함하는, 서비스 제공 방법.
  13. 제 12 항에 있어서,
    상기 속성 정보를 설정받는 단계는 상기 사용자로부터 상기 복수의 에이전트 각각에 대해 캐릭터, 이미지, 목소리 유형, 에이전트명 중 어느 하나 이상을 설정받는 것인, 서비스 제공 방법.
  14. 제 13 항에 있어서,
    상기 사용자로부터 발화된 음성 명령을 입력받는 단계를 더 포함하되,
    상기 서비스를 제공하는 단계는 상기 음성 명령에 상기 에이전트명이 포함된 경우, 상기 에이전트명에 대응하는 에이전트를 통해 서비스를 제공하는 것인, 서비스 제공 방법.
  15. 제 14 항에 있어서,
    상기 서비스를 제공하는 단계는 상기 에이전트명에 대응하는 에이전트를 통해 상기 사용자의 히스토리 데이터 및 상황 데이터에 기초하여 이용 가능한 서비스를 추천하는 것인, 서비스 제공 방법.
  16. 제 15 항에 있어서,
    상기 상황 데이터는 상기 사용자의 위치 정보 및 주변 소음 정도 중 어느 하나를 포함하는 것인, 서비스 제공 방법.
  17. 음성 명령 기반의 서비스를 제공하는 명령어들의 시퀀스를 포함하는 매체에 저장된 컴퓨터 프로그램에 있어서,
    상기 컴퓨터 프로그램은 컴퓨팅 장치에 의해 실행될 경우,
    복수의 서비스를 사용자의 히스토리 데이터에 기초하여 분류하고,
    상기 분류된 복수의 서비스를 각 서비스의 유형에 따라 복수의 카테고리로 분류하고,
    상기 분류된 복수의 카테고리에 대응하는 에이전트를 각각 설정하고,
    상기 설정된 에이전트를 통해 상기 사용자로부터 입력받은 음성 명령에 대응하는 서비스를 제공하도록 하는 명령어들의 시퀀스를 포함하는, 매체에 저장된 컴퓨터 프로그램.
KR1020180083553A 2018-07-18 2018-07-18 음성 명령 기반의 서비스를 제공하는 공용 단말, 방법 및 컴퓨터 프로그램 KR20200009332A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180083553A KR20200009332A (ko) 2018-07-18 2018-07-18 음성 명령 기반의 서비스를 제공하는 공용 단말, 방법 및 컴퓨터 프로그램

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180083553A KR20200009332A (ko) 2018-07-18 2018-07-18 음성 명령 기반의 서비스를 제공하는 공용 단말, 방법 및 컴퓨터 프로그램

Publications (1)

Publication Number Publication Date
KR20200009332A true KR20200009332A (ko) 2020-01-30

Family

ID=69321515

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180083553A KR20200009332A (ko) 2018-07-18 2018-07-18 음성 명령 기반의 서비스를 제공하는 공용 단말, 방법 및 컴퓨터 프로그램

Country Status (1)

Country Link
KR (1) KR20200009332A (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022149661A1 (ko) * 2021-01-06 2022-07-14 주식회사 헤이스타즈 인물 사진으로부터 생성된 아바타를 이용한 어학 콘텐츠 제공 방법 및 장치
EP4064279A4 (en) * 2021-01-28 2022-12-21 Samsung Electronics Co., Ltd. DEVICE AND METHOD FOR PROVIDING RECOMMENDED SENTENCES ASSOCIATED WITH USER STATEMENT INPUT

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022149661A1 (ko) * 2021-01-06 2022-07-14 주식회사 헤이스타즈 인물 사진으로부터 생성된 아바타를 이용한 어학 콘텐츠 제공 방법 및 장치
EP4064279A4 (en) * 2021-01-28 2022-12-21 Samsung Electronics Co., Ltd. DEVICE AND METHOD FOR PROVIDING RECOMMENDED SENTENCES ASSOCIATED WITH USER STATEMENT INPUT

Similar Documents

Publication Publication Date Title
US11076007B2 (en) Multi-modal conversational intercom
US20210304075A1 (en) Batching techniques for handling unbalanced training data for a chatbot
Steglich I-Centric User Interaction
US9160690B2 (en) Systems and methods for event-based profile building
CN109196464A (zh) 基于上下文的用户代理
JP2017533527A (ja) 動的コード管理
CN110785970B (zh) 使网页的机器人创建自动化的技术
Zulkernain et al. A mobile intelligent interruption management system
Jimenez et al. Alexa-based voice assistant for smart home applications
KR100311081B1 (ko) 에이전트기능을갖는정보처리장치
WO2022115291A1 (en) Method and system for over-prediction in neural networks
KR20200009332A (ko) 음성 명령 기반의 서비스를 제공하는 공용 단말, 방법 및 컴퓨터 프로그램
US20180330305A1 (en) Determining a candidate to respond to an issue
KR102324215B1 (ko) 대화형 서비스를 제공하는 챗봇 검색 서버, 사용자 단말 및 방법
US11206236B2 (en) Systems and methods to prioritize chat rooms using machine learning
US20230206130A1 (en) Interactive and dynamic mapping engine (idme)
CN107547356A (zh) 即时通讯会话群组的建立方法、设备及存储介质
JPH10293709A (ja) 情報処理装置及び記憶媒体
CN109165990A (zh) 一种提高房产行业客户端用户粘性的方法和系统
KR102544405B1 (ko) 마이데이터를 이용한 개인 맞춤형 대행 포털 서비스 제공 시스템 및 그 방법
US11593445B2 (en) Social communities assistant
US20220336053A1 (en) Inherited machine learning model
KR20170087147A (ko) 가상 대화 서비스 제공 서버 및 방법
Ko et al. Place-aware opportunistic service recommendation scheme in a smart space with internet of things
KR20220168536A (ko) 인공지능 대화 엔진 학습 방법 및 그 시스템

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal