KR102034220B1 - 인공지능 컴퓨팅 플랫폼 및 그 개인화 설정 방법 - Google Patents

인공지능 컴퓨팅 플랫폼 및 그 개인화 설정 방법 Download PDF

Info

Publication number
KR102034220B1
KR102034220B1 KR1020170132639A KR20170132639A KR102034220B1 KR 102034220 B1 KR102034220 B1 KR 102034220B1 KR 1020170132639 A KR1020170132639 A KR 1020170132639A KR 20170132639 A KR20170132639 A KR 20170132639A KR 102034220 B1 KR102034220 B1 KR 102034220B1
Authority
KR
South Korea
Prior art keywords
voice command
voice
personalization
response
computing platform
Prior art date
Application number
KR1020170132639A
Other languages
English (en)
Other versions
KR20190041264A (ko
Inventor
박성준
Original Assignee
에스케이텔레콤 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 에스케이텔레콤 주식회사 filed Critical 에스케이텔레콤 주식회사
Priority to KR1020170132639A priority Critical patent/KR102034220B1/ko
Publication of KR20190041264A publication Critical patent/KR20190041264A/ko
Application granted granted Critical
Publication of KR102034220B1 publication Critical patent/KR102034220B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/16Speech classification or search using artificial neural networks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Tourism & Hospitality (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Biomedical Technology (AREA)
  • Software Systems (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Telephonic Communication Services (AREA)

Abstract

본 발명은 인공지능 컴퓨팅 플랫폼 및 그 개인화 설정 방법에 관한 것으로서, 개시된 인공지능 컴퓨팅 플랫폼은 사용자의 음성명령을 인식하고, 음성명령에 대응하는 응답을 출력하는 음성 대화부와, 사용자를 대상으로 하여 음성명령과 연관된 서비스를 제공하는 서비스 제공부를 포함하며, 서비스 제공부는, 음성 대화부에 의해 제 1 음성명령이 인식되면 제 1 응답을 출력하도록 제어하고, 음성 대화부에 의해 제 1 응답에 대응한 제 2 음성명령이 인식되면 기 설정된 긍정 기준 키워드와의 비교 결과를 기초로 긍정적인 의미를 갖는지를 파악하며, 제 2 음성명령이 긍정적인 의미를 갖는 경우에 제 1 음성명령 또는 제 2 음성명령과 연관된 특정 서비스에 대한 개인화 설정을 수행할 수 있다.

Description

인공지능 컴퓨팅 플랫폼 및 그 개인화 설정 방법{ARTIFICIAL INTELLIGENCE COMPUTING PLATFORM AND PERSONALIZATION SETTING METHOD THEREOF}
본 발명은 인공지능 컴퓨팅 플랫폼 및 그 개인화 설정 방법에 관한 것으로, 더욱 상세하게는 음성 대화 기반의 인공지능 컴퓨팅 플랫폼과 이러한 인공지능 컴퓨팅 플랫폼이 수행하는 개인화 설정 방법에 관한 것이다.
전자 장치에 대한 기술이 고도화되면서, 사용자의 음성명령을 이용하여 전자 장치의 기능을 활성화하거나 실행시킬 수 있는 음성 대화 기능이 각종의 전자 장치에 탑재되고 있으며, 이러한 음성 대화 기능은 음성 대화 기반의 인공지능 컴퓨팅 플랫폼에 의해 제공될 수 있다.
이러한 음성 대화 기반의 인공지능 컴퓨팅 플랫폼은 사용자의 음성명령으로부터 문자열을 추출하고, 문자열에 대한 자연어 이해 처리를 하며, 음성명령에 대응하는 응답을 생성하여 출력함으로써, 사용자와 음성 대화를 수행한다.
한편, 최근에는 이동통신 단말 등과 같은 정보통신기기가 고사양화 되면서 높은 컴퓨팅 처리능력을 갖추게 되었고, 이로 인해 각종 정보통신기기에 음성 대화 기반의 인공지능 컴퓨팅 플랫폼을 탑재할 수 있게 되었다. 그런데, 이동통신 단말처럼 개인용으로 운용되는 정보통신기기의 경우에는 개인별 맞춤형 서비스에 대한 요구가 높으며, 이러한 개인용 정보통신기기에 탑재되는 음성 대화 기반의 인공지능 컴퓨팅 플랫폼은 개인화 설정 기능을 제공하게 된다.
종래 기술에 따라 음성 대화 기반의 인공지능 컴퓨팅 플랫폼이 수행하는 개인화 설정 과정에 의하면, 단순히 음성명령의 내용에 따라 관련된 기능에 대한 개인화 설정이 이루어지고, 개인화 설정 결과에 대한 응답을 사용자에게 제공하였다. 사용자의 음성명령으로부터 문자열(String)을 추출하고, 추출된 문자열로부터 의도(Intent)를 파악한 후, 파악된 의도에 대응하는 서비스를 제공하였다. 여기서, 사용자는 개인화 설정이 필요한 경우에 개인화 설정에 대한 내용이 포함된 음성명령을 발화하여야 하며, 인공지능 컴퓨팅 플랫폼은 인식된 개인화 설정에 대한 내용을 기초로 개인화 설정을 수행하였다.
그러나, 이러한 종래 기술에 의하면 개인화 설정을 위해서는 사용자가 개인화 설정에 대한 내용이 포함된 음성명령을 반드시 발화하여야만 하였다. 따라서, 사용자가 인공지능 컴퓨팅 플랫폼에 개인화 설정 기능이 존재한다는 것을 인지하고 있어야만 개인화 설정 기능을 제공할 수 있었다. 또한, 사용자가 인공지능 컴퓨팅 플랫폼에 개인화 설정 기능이 존재한다는 것을 인지하고 있다고 하더라도 사용자가 개인화 설정에 대한 내용이 포함된 음성명령을 정확히 발화하여야만 하는 문제점이 있었다. 더욱이, 행동 유도성(Affordance)을 가지는 GUI(Graphical User Interface)와는 달리 음성 대화 기반의 인터페이스는 정보의 휘발성 때문에 사용자에게 특정 음성명령을 학습시키기가 매우 어렵다.
대한민국 등록특허공보 제10-1699720호, 등록일자 2017년 01월 19일.
본 발명의 일 실시예에 의하면, 사용자와의 음성 대화 중에 음성명령이 긍정적인 의미를 가지는 것으로 파악되면 음성명령과 연관된 특정 서비스에 대한 개인화 설정을 수행하는 인공지능 컴퓨팅 플랫폼과 그 개인화 설정 방법을 제공한다.
본 발명의 해결하고자 하는 과제는 이상에서 언급한 것으로 제한되지 않으며, 아래의 기재로부터 본 발명이 속하는 통상의 지식을 가진 자에게 명확하게 이해될 수 있는 범위의 언급되지 않은 또 다른 해결하고자 하는 과제까지 포함되는 것이다.
본 발명의 일 관점에 따른 인공지능 컴퓨팅 플랫폼은, 사용자의 음성명령을 인식하고, 상기 음성명령에 대응하는 응답을 출력하는 음성 대화부와, 상기 사용자를 대상으로 하여 상기 음성명령과 연관된 서비스를 제공하는 서비스 제공부를 포함하며, 상기 서비스 제공부는, 상기 음성 대화부에 의해 제 1 음성명령이 인식되면 제 1 응답을 출력하도록 제어하고, 상기 음성 대화부에 의해 상기 제 1 응답에 대응한 제 2 음성명령이 인식되면 기 설정된 긍정 기준 키워드와의 비교 결과를 기초로 긍정적인 의미를 갖는지를 파악하며, 상기 제 2 음성명령이 긍정적인 의미를 갖는 경우에 상기 제 1 음성명령 또는 제 2 음성명령과 연관된 특정 서비스에 대한 개인화 설정을 수행할 수 있다.
본 발명의 다른 관점에 따라 인공지능 컴퓨팅 플랫폼이 수행하는 개인화 설정 방법은, 제 1 음성명령을 인식하여 제 1 응답을 출력하는 단계와, 상기 제 1 응답에 대응한 제 2 음성명령을 인식하여, 기 설정된 긍정 기준 키워드와의 비교 결과를 기초로 상기 제 2 음성명령이 긍정적인 의미를 갖는지를 파악하는 단계와, 상기 제 2 음성명령이 긍정적인 의미를 갖는 경우에 상기 제 1 음성명령 또는 제 2 음성명령과 연관된 특정 서비스에 대한 개인화 설정을 수행하는 단계를 포함한다.
본 발명의 실시예에 의하면, 사용자와의 음성 대화 중에 음성명령이 긍정적인 의미를 가지는 것으로 파악되면 음성명령과 연관된 특정 서비스에 대한 개인화 설정을 수행한다. 이때, 음성명령이 긍정적인 의미를 가지는 경우에 음성명령과 연관된 정황 정보를 추출하고, 추출된 정황 정보를 기초로 특정 서비스를 결정할 수 있다.
그리고, 특정 서비스에 대한 개인화 설정을 수행할 때에 개인화 설정을 수행할지를 질의하는 형태의 응답을 제공할 수 있으며, 질의에 대해 확인하여 주는 정도의 비교적 간단한 음성명령만으로도 개인화 설정이 수행되도록 할 수 있다.
도 1은 본 발명의 일 실시예에 따른 인공지능 컴퓨팅 플랫폼을 포함하는 장치의 블록 구성도이다.
도 2는 본 발명의 일 실시예에 따른 인공지능 컴퓨팅 플랫폼이 수행하는 개인화 설정 방법을 설명하기 위한 흐름도이다.
본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하고, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다.
본 발명의 실시예들을 설명함에 있어서 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략할 것이다. 그리고 후술되는 용어들은 본 발명의 실시예에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례 등에 따라 달라질 수 있다. 그러므로 그 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.
도 1은 본 발명의 일 실시예에 따른 인공지능 컴퓨팅 플랫폼의 블록 구성도이다.
도 1을 참조하면, 일 실시예에 따른 인공지능 컴퓨팅 플랫폼(100)을 포함하는 장치는 음성 대화부(110) 및 서비스 제공부(120)를 포함한다.
ASR(Automatic Speech Recognition)(111), NLU(Natural Language Understanding)(112) 및 TTS(Text To Speech)(113)를 포함한다. 이러한 음성 대화부(110)는 사용자의 음성명령을 인식하고, 음성명령에 대응하는 응답을 출력한다.
ASR(111)는 사용자의 음성명령에 대해 전처리 과정을 통해 잡음을 제거한 후에 문자열을 추출한다.
NLU(112)는 ASR(111)에 의해 추출된 문자열로부터 서비스 도메인(Service Domain), 의도(Intent), 속성값(Entity)을 추출하여 서비스 제공부(120)에게 전달한다.
음성 대화부(110)의 TTS(113)는 서비스 제공부(120)로부터 제공받은 텍스트에 대응하는 응답을 음성형태로 생성하여 출력한다.
서비스 제공부(120)는 서비스 제어부(121), 정보 저장부(122) 및 응용프로그램 실행부(123)를 포함한다. 이러한 서비스 제공부(120)는 사용자를 대상으로 하여 음성명령과 연관된 서비스를 제공한다.
이를 위해, 서비스 제어부(121)는 음성 대화부(110)에 의해 제 1 음성명령이 인식되면 제 1 응답을 출력하도록 음성 대화부(110)를 제어하고, 음성 대화부(110)에 의해 제 1 응답에 대응한 제 2 음성명령이 인식되면 정보 저장부(122)에 기 설정된 긍정 기준 키워드와의 비교 결과를 기초로 긍정적인 의미를 갖는지를 파악하며, 제 2 음성명령이 긍정적인 의미를 갖는 경우에 제 1 음성명령 또는 제 2 음성명령과 연관된 특정 서비스에 대한 개인화 설정을 수행할 수 있다. 여기서, 서비스 제어부(121)는 정보 저장부(122)에 기 설정된 개인화 키워드가 제 2 음성명령에 포함된 경우에 제 2 음성명령이 긍정적인 의미를 갖는지를 파악할 수 있다. 아울러, 서비스 제어부(121)는 제 2 음성명령이 긍정적인 의미를 가지는 경우에 제 1 음성명령 또는 제 2 음성명령과 연관된 정황 정보를 추출하고, 추출된 정황 정보를 기초로 특정 서비스를 결정할 수 있다. 이때, 응용프로그램 실행부(123)는 결정된 특정 서비스에 대응하는 응용프로그램을 실행하여 해당 서비스를 제공한다. 또는, 서비스 제어부(121)는 제 2 음성명령이 긍정적인 의미를 갖는 경우에 개인화 설정에 대한 질의를 포함하는 제 2 응답을 음성 대화부(110)가 출력하도록 제어하고, 음성 대화부(110)에 의해 제 2 응답에 대응한 제 3 음성명령이 인식되면 정보 저장부(122)에 기 설정된 승인 기준 키워드와의 비교 결과를 기초로 제 3 음성명령이 개인화 설정에 대한 승인 의미를 갖는지를 파악하며, 제 3 음성명령이 개인화 설정에 대한 승인 의미를 갖는 경우에 개인화 설정을 수행할 수 있다. 예를 들어, 서비스 제공부(120)는 CPU(Central Processing Unit) 등과 같은 프로세서를 포함할 수 있다. 정보 저장부(122)는 서비스 제공부(120)의 내부 메모리로서 구현할 수 도 있으며, 별도의 외부 메모리로 구현할 수도 있다. 예를 들어, 별도의 외부 메모리로 구현할 경우에, 정보 저장부(122)는 플래시 메모리 타입(flash memory type), 하드디스크 타입(hard disk type), 멀티미디어 카드 마이크로 타입(multimedia card micro type), 카드 타입의 메모리, 램, 롬 중 적어도 하나의 타입의 컴퓨터로 읽을 수 있는 기록매체를 포함할 수 있다.
도 2는 본 발명의 일 실시예에 따른 인공지능 컴퓨팅 플랫폼이 수행하는 개인화 설정 방법을 설명하기 위한 흐름도이다.
도 2를 참조하면, 일 실시예에 따른 인공지능 컴퓨팅 플랫폼이 수행하는 개인화 설정 방법은 사용자에 의해 발화된 제 1 음성명령을 인식하고, 인식된 제 1 음성명령에 대응하는 제 1 응답을 출력하는 단계(S201 및 S202)를 포함한다.
그리고, 일 실시예에 따른 인공지능 컴퓨팅 플랫폼이 수행하는 개인화 설정 방법은 제 1 응답에 대응하여 사용자에 의해 발화된 제 2 음성명령을 인식하는 단계(S203)를 더 포함한다.
아울러, 일 실시예에 따른 인공지능 컴퓨팅 플랫폼이 수행하는 개인화 설정 방법은 제 2 음성명령에 기 설정된 개인화 키워드가 포함되어 있는지를 판단하는 단계(S204)를 더 포함한다.
이어서, 일 실시예에 따른 인공지능 컴퓨팅 플랫폼이 수행하는 개인화 설정 방법은 제 2 음성명령에 기 설정된 개인화 키워드가 포함되어 있는 경우에, 제 2 음성명령과 기 설정된 긍정 기준 키워드와의 비교 결과를 기초로 제 2 음성명령이 긍정적인 의미를 갖는지를 파악하는 단계(S205)를 더 포함한다.
그리고, 일 실시예에 따른 인공지능 컴퓨팅 플랫폼이 수행하는 개인화 설정 방법은 제 2 음성명령이 긍정적인 의미를 갖는 것으로 파악되면 제 1 음성명령 또는 제 2 음성명령과 연관된 정황 정보를 추출하고, 추출된 정황 정보를 기초로 특정 서비스를 결정하는 단계(S206)를 더 포함한다.
이어서, 일 실시예에 따른 인공지능 컴퓨팅 플랫폼이 수행하는 개인화 설정 방법은 정황 정보를 기초로 결정된 특정 서비스의 개인화 설정에 대한 질의를 포함하는 제 2 응답을 출력하는 단계(S207)를 더 포함한다.
아울러, 일 실시예에 따른 인공지능 컴퓨팅 플랫폼이 수행하는 개인화 설정 방법은 제 2 응답에 대응하여 사용자에 의해 발화된 제 3 음성명령을 인식한 후, 제 3 음성명령과 기 설정된 승인 기준 키워드와의 비교 결과를 기초로 제 3 음성명령이 개인화 설정에 대한 승인 의미를 갖는지를 파악하는 단계(S208 및 S209)를 더 포함한다.
다음으로, 일 실시예에 따른 인공지능 컴퓨팅 플랫폼이 수행하는 개인화 설정 방법은 제 3 음성명령이 개인화 설정에 대한 승인 의미를 갖는 것으로 파악되면 정황 정보를 기초로 결정된 특정 서비스에 대한 개인화 설정을 수행하는 단계(S210)를 더 포함한다.
도 2를 참조하여 설명한 인공지능 컴퓨팅 플랫폼이 수행하는 개인화 설정 방법은 일 실시예에 불과하며, 각 단계들은 그 수행 순서가 뒤바뀌거나 복수의 단계들이 병합되거나 단일의 단계가 분할될 수 있고, 일부의 단계는 생략될 수도 있다. 예를 들어, 단계 S203 이후에 단계 S204를 생략하여, 제 2 음성명령에 개인화 키워드가 포함되어 있는지를 판단하지 않고 곧바로 단계 S205를 수행할 수 있다. 아울러, 단계 S206 이후에 단계 S207 내지 단계 S209를 생략하여, 제 2 응답을 출력하여 제 3 음성명령을 인식하는 과정을 수행하지 않을 수도 있다. 또는, 단계 S206를 생략하여, 단계 S210에서는 기 설정된 서비스에 대해 개인화 설정을 수행할 수도 있다.
이하, 도 1 및 도 2를 참조하여 본 발명의 일 실시예에 따른 인공지능 컴퓨팅 플랫폼 장치가 수행하는 개인화 설정 방법에 대해 더 자세히 살펴보기로 한다.
먼저, 음성 대화부(110)는 사용자에 의해 발화된 제 1 음성명령을 인식하고, 인식된 제 1 음성명령을 서비스 제공부(120)에게 전달한다(S201).
그러면, 서비스 제공부(120)는 제 1 음성명령을 분석하고, 제 1 음성명령에 따라 특정 기능을 실행하여야 할 경우에는 응용프로그램 실행부(123)가 대응하는 응용프로그램을 실행하여 해당 기능을 수행하며, 제 1 음성명령에 대응하는 제 1 응답을 출력하기 위해 제 1 응답에 해당하는 텍스트를 생성하여 음성 대화부(110)에게 제공하고, 음성 대화부(110)는 서비스 제공부(120)로부터 제공된 텍스트에 해당하는 음성을 제 1 응답으로서 출력한다. 예를 들어, 『무드등 켜줘』라는 제 1 음성명령이 발화되어 인식되면 서비스 제공부(120)는 무드등을 자동으로 켜는 기능을 수행한 후에 『무드등을 켰어요』에 해당하는 텍스트를 생성하며, 음성 대화부(110)는 『무드등을 켰어요』라는 제 1 응답을 출력한다. 또는, 『나갔다가 올게』라는 제 1 음성명령이 발화되면 서비스 제공부(120)는 기상정보를 검색한 후에 검색된 기상정보를 기초로 『잘 다녀오세요. 참 오늘 저녁에 비소식이 있어요』에 해당하는 텍스트를 생성하며, 음성 대화부(110)는 『잘 다녀오세요. 참 오늘 저녁에 비소식이 있어요』라는 제 1 응답을 출력한다(S202). 이처럼 음성 대화부(110)가 사용자와 주고받는 대화를 할 때에, ASR(111)는 사용자의 음성명령에 대해 전처리 과정을 통해 잡음을 제거한 후에 문자열을 추출하며, NLU(112)는 ASR(111)에 의해 추출된 문자열로부터 서비스 도메인, 의도, 속성값을 추출하여 서비스 제공부(120)에게 전달하고, TTS(113)는 서비스 제공부(120)로부터 제공받은 텍스트에 대응하는 응답을 음성형태로 생성하여 출력한다. 이후에 이루어지는 음성 대화부(110)와 사용자 사이의 대화 과정에서도 ASR(111)와 NLU(112) 및 TTS(113)는 동일한 처리를 수행할 것이며, 이하에서는 중복 설명을 회피하고자 관련된 기재를 생략할 것이다.
이후, 사용자에 의해 제 2 음성명령이 발화되면 음성 대화부(110)가 제 2 음성명령을 인식하여 서비스 제공부(120)에게 제공하며(S203), 서비스 제공부(120)는 제 2 음성명령에 기 설정된 개인화 키워드가 포함되어 있는지를 판단한다. 여기서, 서비스 제어부(121)는 제 2 음성명령과 정보 저장부(122)에 기 저장된 개인화 키워드를 비교하여 일치하는 경우에 사용자가 개인화 키워드에 대응하는 음성명령을 발화한 상태인 것으로 판단할 수 있다. 예를 들어, 개인화 키워드로는 『고마워』, 『잘했어』, 『수고했어』, 『좋아』, 『좋았어』 등과 같이 짧고 단순한 키워드로 선정하여 개인화 키워드에 대응하는 음성명령을 사용자가 쉽게 학습할 수 있도록 할 수 있다(S204). 이러한 단계 S204에 의한 개인화 키워드 확인 과정은 생략될 수도 있다.
아울러, 서비스 제어부(121)는 정보 저장부(122)에 기 저장된 긍정 기준 키워드와 제 2 음성명령을 비교하며, 제 2 음성명령에 긍정 기준 키워드가 포함된 경우에 제 2 음성명령이 긍정적인 의미를 갖는 것으로 파악한다. 예를 들어, 긍정 기준 키워드로는 『좋아』, 『좋았어』, 『그래』, 『O.K.』, 『응』 등이 선정될 수 있으며, 긍정 기준 키워드를 2개 이상 포함하는 경우에 제 2 음성명령이 긍정적인 의미를 갖는 것으로 판단할 수도 있다(S205). 이러한 단계 S205는 이전의 단계 S204와 병합하여, 긍정 기준 키워드를 모두 개인화 키워드로 이용할 수도 있다.
다음으로, 서비스 제어부(121)는 제 2 음성명령이 긍정적인 의미를 갖는 경우에, 제 1 음성명령 또는 제 2 음성명령과 연관된 정황 정보를 추출하고, 추출된 정황 정보를 기초로 특정 서비스를 결정한다. 여기서, 서비스 제어부(121)는 날짜, 시간, 기상정보, 위치정보, 이전 음성명령 등을 정황 정보로서 추출할 수 있으며, 응용프로그램 실행부(123)를 통해 제공 가능한 서비스들 중에서 추출된 정황 정보와 비교할 때에 관련성이 가장 높은 서비스를 선택할 수 있다. 예를 들어, 서비스 제어부(121)는 이전 음성명령에 『무드등 켜줘』라는 명령이 포함되어 있는 경우에 『무드등 자동 점화 서비스』를 선택할 수 있으며, 이전 음성명령에 『나갔다가 올게』라는 명령이 포함되어 있는 경우에 『기상정보 안내 서비스』를 선택할 수 있다(S206).
이어서, 서비스 제어부(121)는 정황 정보를 기초로 결정된 특정 서비스의 개인화 설정에 대한 질의를 포함하는 제 2 응답에 해당하는 텍스트를 음성 대화부(110)에게 제공하며, 음성 대화부(110)는 제 2 응답에 해당하는 음성을 출력한다. 예를 들어, 음성 대화부(110)는 『앞으로도 이 시간에 무드등을 켜 드릴까요』, 『앞으로도 외출할 때 날씨를 알려드릴까요』라는 제 2 응답을 출력할 수 있다(S207).
이후, 사용자가 제 2 응답에 대응하여 제 3 음성명령을 발화하면, 음성 대화부(110)가 제 3 음성명령을 인식하여 서비스 제공부(120)에게 제공하며(S208), 서비스 제어부(121)는 정보 저장부(122)에 기 저장된 승인 기준 키워드와 제 3 음성명령을 비교하며, 제 3 음성명령에 승인 기준 키워드가 포함된 경우에 제 3 음성명령이 개인화 설정에 대한 승인 의미를 갖는 것으로 파악한다. 예를 들어, 승인 기준 키워드로는 『그래』, 『O.K.』, 『응』 등이 선정될 수 있으며, 승인 기준 키워드를 2개 이상 포함하는 경우에 제 3 음성명령이 긍정적인 의미를 갖는 것으로 판단할 수도 있다(S209). 이러한 단계 S207 내지 단계 S209에 의한 개인화 설정 질의 및 승인 과정은 생략될 수도 있다.
다음으로, 서비스 제어부(121)는 제 3 음성명령이 개인화 설정에 대한 승인 의미를 갖는 것으로 파악되면 정황 정보를 기초로 단계 S206에서 결정된 특정 서비스에 대한 개인화 설정을 수행한다. 만약, 단계 S207 내지 단계 S209에 의한 개인화 설정 질의 및 승인 과정이 생략된 경우라면, 서비스 제어부(121)는 단계 S205에서 제 2 음성명령이 긍정적인 의미를 갖는 것으로 파악된 경우에 단계 S206에서 결정된 특정 서비스에 대한 개인화 설정을 수행한다. 예를 들어, 응용프로그램 실행부(123)의 응용프로그램 중에서 『무드등 자동 점화 서비스』를 수행하는 응용프로그램이 서비스 제어부(121)의 제어에 따라 무드등 자동 점등 시각을 설정하거나, 『기상정보 안내 서비스』를 수행하는 응용프로그램이 서비스 제어부(121)의 제어에 따라 기상정보 자동 안내 시각을 설정할 수 있다(S210).
한편, 단계 S209에서 서비스 제어부(121)는 제 3 음성명령과 정보 저장부(122)에 기 저장된 불허 기준 키워드를 비교할 수 있으며, 제 3 음성명령에 불허 기준 키워드가 포함된 경우에 제 3 음성명령이 개인화 설정에 대한 불허 의미를 갖는 것으로 파악할 수도 있다. 예를 들어, 불허 기준 키워드로는 『아니』, 『하지마』 등이 선정될 수 있으며, 불허 기준 키워드를 2개 이상 포함하는 경우에 제 3 음성명령이 개인화 설정에 대한 불허 의미를 갖는 것으로 판단할 수도 있다. 또는, 단계 S209에서 서비스 제어부(121)는 제 3 음성명령과 정보 저장부(122)에 기 저장된 승인 기준 키워드 및 불허 기준 키워드를 모두 비교할 수 있으며, 제 3 음성명령이 승인 기준 키워드와 불허 기준 키워드를 모두 포함하지 않는 경우에는 사용자가 제 3 음성명령을 바꿔서 발화하도록 유도할 수 있다. 서비스 제어부(121)는 제 3 음성명령을 수정 발화할 것을 유도하는 내용의 텍스트를 음성 대화부(110)에게 제공하며, 음성 대화부(110)는 제 3 음성명령을 수정 발화할 것을 유도하는 내용의 음성을 출력한다. 예를 들어, 음성 대화부(110)는 『제가 이해할 수 있도록 '응' 또는 '아니'라고 말씀해 주세요』라고 출력한 후, 제 3 음성명령이 수정 발화되면, 음성 대화부(110)가 수정된 제 3 음성명령을 인식하여 서비스 제공부(120)에게 제공할 수 있다.
지금까지 설명한 바와 같이, 본 발명의 실시예에 따르면 사용자와의 음성 대화 중에 음성명령이 긍정적인 의미를 가지는 것으로 파악되면 음성명령과 연관된 특정 서비스에 대한 개인화 설정을 수행한다. 이때, 음성명령이 긍정적인 의미를 가지는 경우에 음성명령과 연관된 정황 정보를 추출하고, 추출된 정황 정보를 기초로 특정 서비스를 결정할 수 있다.
그리고, 특정 서비스에 대한 개인화 설정을 수행할 때에 개인화 설정을 수행할지를 질의하는 형태의 응답을 제공할 수 있으며, 질의에 대해 확인하여 주는 정도의 비교적 간단한 음성명령만으로도 개인화 설정이 수행되도록 할 수 있다.
본 발명에 첨부된 블록도의 각 블록과 흐름도의 각 단계의 조합들은 컴퓨터 프로그램 인스트럭션들에 의해 수행될 수도 있다. 이들 컴퓨터 프로그램 인스트럭션들은 범용 컴퓨터, 특수용 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비의 프로세서에 탑재될 수 있으므로, 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비의 프로세서를 통해 수행되는 그 인스트럭션들이 블록도의 각 블록 또는 흐름도의 각 단계에서 설명된 기능들을 수행하는 수단을 생성하게 된다. 이들 컴퓨터 프로그램 인스트럭션들은 특정 방식으로 기능을 구현하기 위해 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비를 지향할 수 있는 컴퓨터 이용 가능 또는 컴퓨터 판독 가능 메모리에 저장되는 것도 가능하므로, 그 컴퓨터 이용가능 또는 컴퓨터 판독 가능 메모리에 저장된 인스트럭션들은 블록도의 각 블록 또는 흐름도 각 단계에서 설명된 기능을 수행하는 인스트럭션 수단을 내포하는 제조 품목을 생산하는 것도 가능하다. 컴퓨터 프로그램 인스트럭션들은 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비 상에 탑재되는 것도 가능하므로, 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비 상에서 일련의 동작 단계들이 수행되어 컴퓨터로 실행되는 프로세스를 생성해서 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비를 수행하는 인스트럭션들은 블록도의 각 블록 및 흐름도의 각 단계에서 설명된 기능들을 실행하기 위한 단계들을 제공하는 것도 가능하다.
또한, 각 블록 또는 각 단계는 특정된 논리적 기능(들)을 실행하기 위한 하나 이상의 실행 가능한 인스트럭션들을 포함하는 모듈, 세그먼트 또는 코드의 일부를 나타낼 수 있다. 또, 몇 가지 대체 실시예들에서는 블록들 또는 단계들에서 언급된 기능들이 순서를 벗어나서 발생하는 것도 가능함을 주목해야 한다. 예컨대, 잇달아 도시되어 있는 두 개의 블록들 또는 단계들은 사실 실질적으로 동시에 수행되는 것도 가능하고 또는 그 블록들 또는 단계들이 때때로 해당하는 기능에 따라 역순으로 수행되는 것도 가능하다.
이상의 설명은 본 발명의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다. 따라서, 본 발명에 개시된 실시예들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다. 본 발명의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.
본 발명의 실시예에 따르면, 사용자와의 음성 대화 중에 음성명령이 긍정적인 의미를 가지는 것으로 파악되면 음성명령과 연관된 특정 서비스에 대한 개인화 설정을 수행한다.
이러한 본 발명은 음성 인식 기능이 탑재된 이동통신 단말이나 음성 인식 기능이 탑재된 스마트 스피커 등과 같은 각종 스마트 장치처럼 음성 인식 기능이 탑재된 전자장치를 이용하는 기술 분야에 널리 이용할 수 있다.
100 : 인공지능 컴퓨팅 플랫폼 110 : 음성 대화부
111 : ASR 112 : NLU
113 : TTS 120 : 서비스 제공부
121 : 서비스 제어부 122 : 정보 저장부
123 : 응용프로그램 실행부

Claims (5)

  1. 사용자의 음성명령을 인식하고, 상기 음성명령에 대응하는 응답을 출력하는 음성 대화부와,
    상기 사용자를 대상으로 하여 상기 음성명령과 연관된 서비스를 제공하는 서비스 제공부를 포함하며,
    상기 서비스 제공부는, 상기 음성 대화부에 의해 제 1 음성명령이 인식되면 제 1 응답을 출력하도록 제어하고, 상기 음성 대화부에 의해 상기 제 1 응답에 대응한 제 2 음성명령이 인식되면, 상기 제 2 음성명령에 기 설정된 개인화 키워드가 포함되어 있는지를 판단하고, 상기 개인화 키워드가 포함되어 있는 것으로 판단되면, 상기 제 2 음성명령과 기 설정된 긍정 기준 키워드와의 비교 결과를 기초로 긍정적인 의미를 갖는지를 파악하며, 상기 제 2 음성명령이 긍정적인 의미를 갖는 경우에 상기 제 1 음성명령 또는 제 2 음성명령과 연관된 특정 서비스에 대한 개인화 설정을 수행할 수 있는
    인공지능 컴퓨팅 플랫폼을 포함하는 장치.
  2. 삭제
  3. 제 1 항에 있어서,
    상기 서비스 제공부는, 상기 제 2 음성명령이 긍정적인 의미를 가지는 경우에 상기 제 1 음성명령 또는 제 2 음성명령과 연관된 정황 정보를 추출하고, 추출된 상기 정황 정보를 기초로 상기 특정 서비스를 결정하는
    인공지능 컴퓨팅 플랫폼을 포함하는 장치.
  4. 제 1 항에 있어서,
    상기 서비스 제공부는, 상기 제 2 음성명령이 긍정적인 의미를 갖는 경우에 상기 개인화 설정에 대한 질의를 포함하는 제 2 응답을 상기 음성 대화부가 출력하도록 제어하고, 상기 음성 대화부에 의해 상기 제 2 응답에 대응한 제 3 음성명령이 인식되면 승인 기준 키워드와의 비교 결과를 기초로 상기 제 3 음성명령이 상기 개인화 설정에 대한 승인 의미를 갖는지를 파악하며, 상기 제 3 음성명령이 상기 승인 의미를 갖는 경우에 상기 개인화 설정을 수행하는
    인공지능 컴퓨팅 플랫폼을 포함하는 장치.
  5. 인공지능 컴퓨팅 플랫폼이 수행하는 개인화 설정 방법으로서,
    제 1 음성명령을 인식하여 제 1 응답을 출력하는 단계와,
    상기 제 1 응답에 대응한 제 2 음성명령을 인식하여, 상기 제 2 음성명령에 기 설정된 개인화 키워드가 포함되어 있는지를 판단하는 단계와,
    상기 제 2 음성명령에 상기 개인화 키워드가 포함되어 있는 것으로 판단되면, 상기 제 2 음성명령과 기 설정된 긍정 기준 키워드와의 비교 결과를 기초로 상기 제 2 음성명령이 긍정적인 의미를 갖는지를 파악하는 단계와,
    상기 제 2 음성명령이 긍정적인 의미를 갖는 경우에 상기 제 1 음성명령 또는 제 2 음성명령과 연관된 특정 서비스에 대한 개인화 설정을 수행하는 단계를 포함하는
    개인화 설정 방법.
KR1020170132639A 2017-10-12 2017-10-12 인공지능 컴퓨팅 플랫폼 및 그 개인화 설정 방법 KR102034220B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020170132639A KR102034220B1 (ko) 2017-10-12 2017-10-12 인공지능 컴퓨팅 플랫폼 및 그 개인화 설정 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170132639A KR102034220B1 (ko) 2017-10-12 2017-10-12 인공지능 컴퓨팅 플랫폼 및 그 개인화 설정 방법

Publications (2)

Publication Number Publication Date
KR20190041264A KR20190041264A (ko) 2019-04-22
KR102034220B1 true KR102034220B1 (ko) 2019-10-18

Family

ID=66283168

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170132639A KR102034220B1 (ko) 2017-10-12 2017-10-12 인공지능 컴퓨팅 플랫폼 및 그 개인화 설정 방법

Country Status (1)

Country Link
KR (1) KR102034220B1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020226213A1 (ko) * 2019-05-09 2020-11-12 엘지전자 주식회사 음성 인식 기능을 제공하는 인공 지능 기기, 인공 지능 기기의 동작 방법

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005505961A (ja) 2001-10-03 2005-02-24 アジャイル ティーヴィー コーポレーション グローバルな音声ユーザーインターフェース

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101044747B1 (ko) * 2009-06-23 2011-06-27 아주대학교산학협력단 Iptⅴ용 ip 셋탑 박스 및 이를 이용한 epg 화면 표시 방법
KR101699720B1 (ko) 2010-08-03 2017-01-26 삼성전자주식회사 음성명령 인식 장치 및 음성명령 인식 방법
KR20170014353A (ko) * 2015-07-29 2017-02-08 삼성전자주식회사 음성 기반의 화면 내비게이션 장치 및 방법

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005505961A (ja) 2001-10-03 2005-02-24 アジャイル ティーヴィー コーポレーション グローバルな音声ユーザーインターフェース

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
IT NEWS-구글홈, 최대 6명의 사용자 목소리 인식(2017.04.21.)출처: http://www.itnews.or.kr/?p=21566*
음성인식을 이용한 상황정보 기반의 스마트 홈 개인화 서비스, 김종훈, 송창우, 김주현, 정경용, 임기욱, 이정현, 한국콘텐츠학회논문지 9(11), 80-89페이지, 2009.11.출처: http://www.dbpia.co.kr/journal/articleDetail?nodeId=NODE01291350*

Also Published As

Publication number Publication date
KR20190041264A (ko) 2019-04-22

Similar Documents

Publication Publication Date Title
US11562736B2 (en) Speech recognition method, electronic device, and computer storage medium
US12051408B2 (en) Promoting voice actions to hotwords
CN108984529B (zh) 实时庭审语音识别自动纠错方法、存储介质及计算装置
EP3039531B1 (en) Display apparatus and controlling method thereof
US10074363B2 (en) Method and apparatus for keyword speech recognition
WO2020253509A1 (zh) 面向情景及情感的中文语音合成方法、装置及存储介质
US20150221305A1 (en) Multiple speech locale-specific hotword classifiers for selection of a speech locale
US20160163314A1 (en) Dialog management system and dialog management method
US20140379334A1 (en) Natural language understanding automatic speech recognition post processing
US20120290298A1 (en) System and method for optimizing speech recognition and natural language parameters with user feedback
JP2018054791A (ja) 音声対話システムおよび発話意図理解方法
CN105549841A (zh) 一种语音交互方法、装置及设备
KR102060775B1 (ko) 음성 입력에 대응하는 동작을 수행하는 전자 장치
KR20190068021A (ko) 감정 및 윤리 상태 모니터링 기반 사용자 적응형 대화 장치 및 이를 위한 방법
CN108231063A (zh) 一种语音控制指令的识别方法及装置
KR20190093962A (ko) 화자 인식을 수행하기 위한 음성 신호 처리 방법 및 그에 따른 전자 장치
CN112346697A (zh) 一种对设备进行控制的方法、装置和存储介质
WO2015188454A1 (zh) 一种快速进入ivr菜单的方法及装置
CN105353957A (zh) 一种信息显示方法及终端
CN104269170A (zh) 一种erp权限语音识别方法
KR102034220B1 (ko) 인공지능 컴퓨팅 플랫폼 및 그 개인화 설정 방법
US9779722B2 (en) System for adapting speech recognition vocabulary
KR20210042520A (ko) 전자 장치 및 이의 제어 방법
CN104751856A (zh) 一种语音语句识别方法及装置
Lojka et al. Multi-thread parallel speech recognition for mobile applications

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant