KR20140089863A - 디스플레이 장치, 및 이의 제어 방법, 그리고 음성 인식 시스템의 디스플레이 장치 제어 방법 - Google Patents

디스플레이 장치, 및 이의 제어 방법, 그리고 음성 인식 시스템의 디스플레이 장치 제어 방법 Download PDF

Info

Publication number
KR20140089863A
KR20140089863A KR1020130001807A KR20130001807A KR20140089863A KR 20140089863 A KR20140089863 A KR 20140089863A KR 1020130001807 A KR1020130001807 A KR 1020130001807A KR 20130001807 A KR20130001807 A KR 20130001807A KR 20140089863 A KR20140089863 A KR 20140089863A
Authority
KR
South Korea
Prior art keywords
voice
user
display device
interactive server
control information
Prior art date
Application number
KR1020130001807A
Other languages
English (en)
Inventor
박은희
한상진
김재권
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020130001807A priority Critical patent/KR20140089863A/ko
Priority to EP19185019.7A priority patent/EP3588966A3/en
Priority to CN201480012854.XA priority patent/CN105027574B/zh
Priority to EP24171428.6A priority patent/EP4379713A3/en
Priority to MX2015008747A priority patent/MX353738B/es
Priority to CN201811168329.3A priority patent/CN109508167B/zh
Priority to EP14735227.2A priority patent/EP2941895B1/en
Priority to US14/149,487 priority patent/US9880808B2/en
Priority to CN201811168338.2A priority patent/CN109343819B/zh
Priority to PCT/KR2014/000119 priority patent/WO2014107076A1/en
Publication of KR20140089863A publication Critical patent/KR20140089863A/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/4227Providing Remote input by a user located remotely from the client device, e.g. at work
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/32Multiple recognisers used in sequence or in parallel; Score combination systems therefor, e.g. voting systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42203Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42204User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/4722End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for requesting additional data associated with the content
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • User Interface Of Digital Computer (AREA)
  • Telephonic Communication Services (AREA)

Abstract

디스플레이 장치, 및 이의 제어 방법, 그리고 음성 인식 시스템의 제어 방법이 제공된다. 본 디스플레이 장치의 제어 방법은 디스플레이 장치를 제어하기 위한 사용자 음성이 입력되면, 사용자 음성이 디스플레이 장치에 기 저장된 명령어인지 여부를 판단하면서 사용자 음성을 대화형 서버로 전송하고, 사용자 음성이 디스플레이 장치에 기 저장된 명령어가 아닌 경우, 대화형 서버로부터 사용자 음성에 대응되는 제어 정보 및 사용자 음성과 동일한 기능을 수행할 수 있는 기 저장된 명령어를 안내하는 제1 가이드 정보가 전송되면, 대화형 서버로부터 전송된 제어 정보에 따라 디스플레이 장치의 기능을 수행하고, 제1 가이드 정보를 디스플레이한다.

Description

디스플레이 장치, 및 이의 제어 방법, 그리고 음성 인식 시스템의 디스플레이 장치 제어 방법 {Display apparatus, Method for controlling display apparatus and Method for controlling display apparatus in Voice recognition system thereof}
본 발명은 디스플레이 장치, 및 이의 제어 방법, 그리고 음성 인식 시스템의 디스플레이 장치 제어 방법에 관한 것으로서, 더욱 상세하게는 입력되는 사용자 음성에 따라 디스플레이 장치의 기능을 제어할 수 있는 디스플레이 장치, 및 이의 제어 방법, 그리고 음성 인식 시스템의 디스플레이 장치 제어 방법에 관한 것이다.
일반적으로, 음성 인식이 가능한 디스플레이 장치는 크게 임베디드(Embedded) 방식과 대화형 방식이 있다.
임베디드 방식의 디스플레이 장치는 한정된 사용자 음성만을 인식할 수 있다. 즉, 임베디드 방식의 디스플레이 장치는 기저장된 명령어에 대응되는 사용자 음성이 입력된 경우에만 사용자 음성에 대응되는 기능을 수행할 수 있다. 이와 같은 임베디드 방식의 디스플레이 장치는 입력된 사용자 음성에 대응되는 기능을 빠르게 수행한다는 점에서 장점이 있으나, 기 저장된 명령어에 대응되는 사용자 음성만을 인식한다는 점에서 사용자 음성을 인식하는데 매우 한정적이다.
대화형 방식의 디스플레이 장치는 외부의 대화형 서버를 통해 다양한 사용자 음성을 인식하여 사용자 의도를 파악하고, 그 파악된 사용자 의도에 적합한 동작을 수행한다. 이 같은 대화형 방식의 디스플레이 장치는 사용자 음성이 입력되면, 대화형 서버로부터 사용자 음성에 대응되는 제어 정보 또는 응답 정보(예를 들어, 컨텐츠 검색 정보)를 수신하고, 제어 정보 또는 응답 정보에 기초하여 사용자 음성에 대응되는 기능을 수행한다. 이 같은 대화형 방식의 디스플레이 장치는 임베디드 방식의 디스플레이 장치에 비해 다양한 사용자 발화를 인식하고, 인식한 사용자 발화에 대응되는 동작을 수행한다는 점에서 장점이 있으나, 대화형 서버를 이용하여 사용자 음성에 대응되는 기능을 수행하기 때문에 임베디드 방식의 디스플레이 장치에 비해 응답 속도가 느린 문제가 있다.
특히, 근래에는 상술한 두 가지 방식을 모두 이용하는 디스플레이 장치가 개발되고 있다. 그러나, 두 가지 방식을 모두 이용하더라도 사용자가 디스플레이 장치에 임베디드된 명령어를 발화하지 않고, 임베디드된 명령어와 유사한 명령어를 발화하는 경우, 디스플레이 장치는 대화형 방식을 이용하여 사용자 음성을 인식하고 사용자 음성에 대응되는 기능을 수행하게 된다. 예를 들어, 디스플레이 장치의 볼륨 업 기능을 수행하기 위해 임베디드된 명령어가 "볼륨 키워"이나, 사용자가 "볼륨을 높여주세요"라고 발화한 경우, 디스플레이 장치는 응답 속도가 빠른 임베디드 방식이 아닌 응답 속도가 느린 대화형 방식을 이용해야 볼륨 레벨을 증가시키는 기능을 수행해야 하는 문제점이 발생하였다.
즉, 사용자가 두 가지 음성 인식 방법 중 어느 방법을 이용해야 더욱 신속하게 음성 인식을 수행할 수 있을지 모르는 경우, 디스플레이 장치의 작업량이 불필요하게 증가하며, 사용자 음성에 대한 응답이 늦어지는 문제점이 발생하게 된다.
본 발명은 상술한 문제점을 해결하기 위해 안출된 것으로, 본 발명의 목적은 사용자 음성을 신속하게 응답하여 디스플레이 장치의 기능을 제어할 수 있도록 사용자에게 음성 가이드 정보를 제공하는 디스플레이 장치, 및 이의 제어 방법, 그리고 음성 인식 시스템의 제어 방법을 제공함에 있다.
상기 목적을 달성하기 위한 본 발명의 일 실시예에 따른, 디스플레이 장치의 제어 방법은, 상기 디스플레이 장치를 제어하기 위한 사용자 음성을 입력받는 단계; 상기 사용자 음성이 상기 디스플레이 장치에 기 저장된 명령어인지 여부를 판단하면서 상기 사용자 음성을 대화형 서버로 전송하는 단계; 및 상기 사용자 음성이 상기 디스플레이 장치에 기 저장된 명령어가 아닌 경우, 상기 대화형 서버로부터 상기 사용자 음성에 대응되는 제어 정보 및 상기 사용자 음성과 동일한 기능을 수행할 수 있는 기 저장된 명령어를 안내하는 제1 가이드 정보가 전송되면, 상기 대화형 서버로부터 전송된 제어 정보에 따라 상기 디스플레이 장치의 기능을 수행하고, 상기 제1 가이드 정보를 디스플레이하는 단계;를 포함한다.
그리고, 상기 대화형 서버는, 상기 사용자 음성에 대응되는 제어 정보를 검색하고, 상기 사용자 음성에 대응되는 제어 정보를 검색하는 동안 상기 제어 정보와 동일한 기능을 수행할 수 있는 상기 디스플레이 장치에 기저장된 명령어가 있는지 여부를 판단하며, 상기 제어 정보와 동일한 기능을 수행할 수 있는 상기 디스플레이 장치에 기저장된 명령어가 있는 경우, 상기 기 저장된 명령어를 안내하는 제1 가이드 정보를 생성하여 상기 제어 정보와 함께 상기 디스플레이 장치에 전송할 수 있다.
또한, 상기 사용자 음성이 기 저장된 명령어인 경우, 상기 기 저장된 명령어와 대응되는 제어 정보를 검색하는 단계; 및 상기 검색된 제어 정보에 따라 상기 디스플레이 장치의 기능을 우선적으로 수행하는 단계;를 더 포함할 수 있다.
그리고, 상기 사용자 음성이 기 저장된 명령어이며, 상기 사용자 음성이 복수의 계층구조를 가지는 디스플레이 장치의 기능을 제어하기 위한 명령어인 경우, 상기 사용자 음성과 동일한 기능을 수행할 수 있는 대화형 명령어를 안내하는 제2 가이드 정보를 디스플레이하는 단계;를 포함할 수 있다.
또한, 상기 대화형 서버는, 상기 사용자 음성을 텍스트 정보로 변환하는 제1 대화형 서버 및 상기 텍스트 정보에 따라 제어 정보 및 제1 가이드 정보를 생성하는 제2 대화형 서버를 포함할 수 있다.
한편, 상기 목적을 달성하기 위해 안출된 본 발명의 일 실시예에 따른, 디스플레이 장치는, 상기 디스플레이 장치를 제어하기 위한 사용자 음성을 입력받는 음성 입력부; 대화형 서버와 통신을 수행하는 통신부; 명령어와 제어 정보를 매칭하여 저장하는 저장부; 디스플레이부; 및 상기 음성 입력부를 통해 입력된 사용자 음성이 상기 저장부에 기 저장된 명령어인지 여부를 판단하면서 상기 사용자 음성을 상기 통신부를 통해 상기 대화형 서버로 전송하고, 상기 사용자 음성이 상기 저장부에 기 저장된 명령어가 아닌 경우, 상기 대화형 서버로부터 상기 사용자 음성에 대응되는 제어 정보 및 상기 사용자 음성과 동일한 기능을 수행할 수 있는 기 저장된 명령어를 안내하는 제1 가이드 정보가 전송되면, 상기 대화형 서버로부터 전송된 제어 정보에 따라 상기 디스플레이 장치의 기능을 수행하고, 상기 제1 가이드 정보를 디스플레이하도록 상기 디스플레이부를 제어하는 제어부;를 포함한다.
그리고, 상기 대화형 서버는, 상기 사용자 음성에 대응되는 제어 정보를 검색하고, 상기 사용자 음성에 대응되는 제어 정보를 검색하는 동안 상기 제어 정보와 동일한 기능을 수행할 수 있는 상기 디스플레이 장치에 기저장된 명령어가 있는지 여부를 판단하며, 상기 제어 정보와 동일한 기능을 수행할 수 있는 상기 디스플레이 장치에 기저장된 명령어가 있는 경우, 상기 기 저장된 명령어를 안내하는 제1 가이드 정보를 생성하여 상기 제어 정보와 함께 상기 디스플레이 장치에 전송할 수 있다.
또한, 상기 제어부는, 상기 사용자 음성이 상기 저장부에 기 저장된 명령어인 경우, 상기 저장부에 저장된 상기 사용자 음성에 대응되는 제어 정보를 검색하고, 상기 검색된 제어 정보에 따라 상기 디스플레이 장치의 기능을 우선적으로 수행할 수 있다.
그리고, 상기 제어부는, 상기 사용자 음성이 기 저장된 명령어이며, 상기 사용자 음성이 복수의 계층구조를 가지는 디스플레이 장치의 기능을 제어하기 위한 명령어인 경우, 상기 사용자 음성과 동일한 기능을 수행할 수 있는 대화형 명령어를 안내하는 제2 가이드 정보를 디스플레이하도록 상기 디스플레이부를 제어할 수 있다.
또한, 상기 대화형 서버는, 상기 입력된 사용자 음성을 텍스트 정보로 변환하는 제1 대화형 서버 및 상기 텍스트 정보에 따라 제어 정보 및 제1 가이드 정보를 생성하는 제2 대화형 서버를 포함하며, 상기 제어부는, 상기 입력된 사용자 음성을 상기 제1 대화형 서버로 전송하며, 상기 제1 대화형 서버로부터 전송된 텍스트 정보를 상기 제2 대화형 서버로 전송하도록 상기 통신부를 제어할 수 있다.
한편, 상기 목적을 달성하기 위한 본 발명의 일 실시예에 따른, 대화형 서버 및 디스플레이 장치를 포함하는 음성 인식 시스템의 제어 방법은, 상기 디스플레이 장치가, 사용자 음성을 입력받는 단계; 상기 디스플레이 장치가, 상기 사용자 음성이 상기 디스플레이 장치에 기 저장된 명령어인지 여부를 판단하면서 상기 사용자 음성을 상기 대화형 서버로 전송하는 제1 전송 단계; 상기 대화형 서버가, 상기 사용자 음성에 대응되는 제어 정보 및 상기 제어 정보와 동일한 기능을 수행할 수 있는 상기 디스플레이 장치에 기 저장된 명령어를 안내하는 제1 가이드 정보 중 적어도 하나를 생성하여 상기 디스플레이 장치로 전송하는 제2 전송 단계; 및 상기 사용자 음성이 상기 디스플레이 장치에 기 저장된 명령어가 아닌 경우, 상기 디스플레이 장치가, 상기 대화형 서버로부터 전송된 제어 정보에 따라 디스플레이 장치의 기능을 수행하고 상기 제1 가이드 정보를 디스플레이하는 단계;를 포함한다.
그리고, 상기 사용자 음성이 상기 디스플레이 장치에 기 저장된 명령어인 경우, 상기 디스플레이 장치가, 상기 사용자 음성에 대응되는 제어 정보를 검색하고, 상기 검색된 제어 정보에 따라 상기 디스플레이 장치의 기능을 수행하는 단계;를 더 포함할 수 있다.
또한, 상기 사용자 음성이 기 저장된 명령어이며, 상기 사용자 음성이 복수의 계층구조를 가지는 디스플레이 장치의 기능을 제어하기 위한 명령어인 경우, 상기 디스플레이 장치가, 상기 사용자 음성과 동일한 기능을 수행할 수 있는 대화형 명령어를 안내하는 제2 가이드 정보를 디스플레이하는 단계;를 더 포함할 수 있다.
그리고, 상기 대화형 서버는, 상기 입력된 사용자 음성을 텍스트 정보로 변환하는 제1 대화형 서버 및 상기 텍스트 정보에 따라 제어 정보 및 제1 가이드 정보를 생성하는 제2 대화형 서버를 포함하며, 상기 제1 전송 단계는, 상기 디스플레이 장치가, 상기 사용자 음성을 디지털 신호로 변환하는 단계; 상기 디스플레이 장치가, 상기 디지털 신호를 제1 대화형 서버로 전송하는 단계; 상기 제1 대화형 서버가, 상기 디지털 신호에 대응되는 텍스트 정보를 생성하여 상기 디스플레이 장치로 전송하는 단계; 및 상기 디스플레이 장치가, 상기 텍스트 정보를 상기 제2 대화형 서버로 전송하는 단계;를 포함할 수 있다.
또한, 상기 제2 전송 단계는, 상기 사용자 음성이 상기 대화형 서버에 저장된 대화 패턴이 아닌 경우, 상기 대화형 서버가, 상기 사용자 음성과 동일한 기능을 수행하면서 상기 대화형 서버에 저장된 대화 패턴에 따르는 사용자 음성을 안내하는 제3 가이드 정보를 생성하여 상기 디스플레이 장치로 전송하는 단계;를 더 포함하며, 상기 디스플레이 장치가 상기 제3 가이드 정보를 디스플레이하는 단계;를 더 포함할 수 있다.
그리고, 상기 제2 전송 단계는, 상기 사용자 음성이 상기 대화형 서버가 응답할 수 없는 대화형 음성인 경우, 상기 대화형 서버가 상기 사용자 음성으로부터 키워드를 추출하여 상기 키워드와 관련된 정보를 안내하는 제4 가이드 정보를 생성하여 상기 디스플레이 장치로 전송하는 단계;를 더 포함하며, 상기 디스플레이 장치가 상기 제4 가이드 정보를 디스플레이하는 단계;를 더 포함할 수 있다.
상술한 바와 같은 본 발명의 다양한 실시예에 의해, 효율적인 음성 인식을 위한 가이드 정보를 제공함으로써, 사용자는 음성 인식을 이용하여 더욱 효율적이고 신속하게 디스플레이 장치의 기능을 수행할 수 있게 된다.
도 1은 본 발명의 일 실시예에 따른, 음성 인식 시스템을 도시한 도면,
도 2는 본 발명의 일 실시예에 따른, 디스플레이 장치의 구성을 나타내는 블럭도,
도 3은 본 발명의 일 실시예에 따른, 음성 입력부의 구성을 나타내는 블럭도,
도 4 내지 도 7은 본 발명의 다양한 실시예에 따른, 가이드 정보를 도시한 도면,
도 8은 본 발명의 일 실시예에 따른, 대화형 서버의 구성을 나타내는 블럭도,
도 9는 본 발명의 일 실시예에 따른, 디스플레이 장치의 제어 방법을 설명하기 위한 흐름도,
도 10은 본 발명의 일 실시예에 따른, 음성 인식 시스템의 디스플레이 장치 제어 방법을 설명하기 위한 시퀀스도, 그리고,
도 11은 본 발명의 다른 실시예에 따른, 음성 인식 시스템을 도시한 도면이다.
이하에서는 도면을 참조하여 본 발명에 대해 상세히 설명하도록 한다. 도 1은 본 발명의 일 실시예에 따른, 음성 인식 시스템을 도시한 도면이다. 도 1에 도시된 바와 같이, 음성 인식 시스템(10)은 디스플레이 장치(100) 및 대화형 서버(200)를 포함한다. 이때, 디스플레이 장치는 스마트 TV로 구현될 수 있으나, 이는 일 실시예에 불과할 뿐, 스마트폰, 데스크 탑 PC, 태블릿 PC, 노트북 PC, 내비게이션 등과 같은 다양한 전자 장치로 구현될 수 있다.
디스플레이 장치(100)는 사용자 음성을 인식하여 인식된 사용자 음성을 바탕으로 디스플레이 장치(100)의 기능을 수행할 수 있다. 특히, 디스플레이 장치(100)는 임베디드 방식 및 대화형 방식을 이용하여 사용자 음성에 따라 디스플레이 장치(100)의 기능을 수행할 수 있다.
구체적으로, 디스플레이 장치(100)는 사용자 음성을 인식하여 디스플레이 장치(100)의 기능을 수행하기 위한 명령어를 제어 정보와 매칭하여 저장한다. 예를 들어, 디스플레이 장치(100)는 "볼륨 올려"라는 명령어와 "오디오 볼륨 레벨을 기 설정된 레벨 증가"라는 제어 정보를 매칭하여 저장할 수 있다.
디스플레이 장치(100)에 사용자 음성이 입력되면, 디스플레이 장치(100)는 사용자 음성을 외부의 대화형 서버(200)에 전송하는 동시에 사용자 음성이 디스플레이 장치(100)에 기 저장된 명령어인지 여부를 판단할 수 있다.
대화형 서버(200)는 데이터베이스를 이용하여 디스플레이 장치(100)로부터 수신된 사용자 음성에 대응되는 제어 정보를 검색할 수 있다. 예를 들어, 수신된 사용자 음성이 "볼륨을 높여줘"인 경우, 대화형 서버(200)는 키워드인 "볼륨" 및 "높여"를 이용하여 "디스플레이 장치(100)에서 출력되는 오디오의 볼륨 레벨을 기설정된 레벨(예를 들어, 3 레벨)만큼 증가"라는 제어 정보를 검색할 수 있다.
이때, 대화형 서버(200)는 사용자 음성에 대응되는 제어 정보를 검색하는 동안 제어 정보와 동일한 기능을 수행할 수 있는 디스플레이 장치(100)에 기저장된 명령어가 있는지 여부를 판단할 수 있다. 제어 정보와 동일한 기능을 수행할 수 있는 디스플레이 장치(100)에 기저장된 명령어가 있는 경우, 대화형 서버(200)는 디스플레이 장치(100)에 기 저장된 명령어를 안내하는 제1 가이드 정보를 생성하여 제어 정보와 함께 디스플레이 장치(100)에 전송할 수 있다. 예를 들어, 대화형 서버(200)는 수신된 사용자 음성인 "볼륨을 높여줘"와 동일한 기능을 수행할 수 있는 디스플레이 장치(100)에 기 저장된 명령어를 검색하고, 검색된 명령어인 "볼륨 올려"라는 명령어를 사용자에게 안내하는 제1 가이드 정보를 생성할 수 있다. 그리고, 대화형 서버(200)는 제1 가이드 정보를 기설정된 레벨만큼 디스플레이 장치(100)의 오디오 볼륨 레벨을 증가시키는 제어 정보와 함께 디스플레이 장치(100)로 전송할 수 있다. 제1 가이드 정보를 통해 디스플레이 장치(100)에 기 저장된 명령어를 사용자가 발화하도록 유도함으로써, 디스플레이 장치(100)는 더욱 신속하게 사용자 음성에 응답할 수 있게 된다.
한편, 사용자 음성이 디스플레이 장치(100)에 기 저장된 명령어가 아닌 경우, 디스플레이 장치(100)는 대화형 서버(200)로부터 전송되는 제어 정보에 따라 디스플레이 장치(100)의 기능을 수행할 수 있다. 예를 들어, 기 저장된 명령어가 "볼륨 올려"이나, 사용자가 "볼륨을 높여줘"라고 발화한 경우, 디스플레이 장치(100)는 대화형 서버(200)로부터 전송된 제어 정보를 바탕으로 기 설정된 레벨만큼 디스플레이 장치(100)에서 출력되는 오디오의 볼륨 레벨을 증가시키는 기능을 수행할 수 있다. 그리고, 디스플레이 장치(100)는 대화형 서버(200)로부터 전송된 제1 가이드 정보를 디스플레이할 수 있다.
사용자 음성이 디스플레이 장치(100)에 기 저장된 명령어인 경우, 디스플레이 장치(100)는 대화형 서버(200)로부터 전송되는 제어 정보와 무관하게 기 저장된 명령어와 대응되는 제어 정보를 검색할 수 있다. 그리고, 디스플레이 장치(100)는 제어 정보에 따라 디스플레이 장치(100)의 기능을 수행할 수 있다. 예를 들어, 디스플레이 장치(100)에 기저장된 명령어인 "볼륨 올려"라는 사용자 음성이 입력된 경우, 디스플레이 장치(100)는 기 저장된 명령어에 대응되는 제어 정보를 검색하고, 검색된 제어 정보에 따라 디스플레이 장치(100)의 오디오 레벨을 기설정된 레벨만큼 증가시키는 기능을 수행할 수 있다.
특히, 사용자 음성이 디스플레이 장치(100)에 기 저장된 명령어이나, 복수의 계층 구조를 가지는 디스플레이 장치의 기능을 수행하기 위한 명령어인 경우, 디스플레이 장치(100)는 사용자 음성과 동일한 기능을 수행할 수 있는 대화형 명령어를 안내하는 제2 가이드 정보를 디스플레이할 수 있다. 이는 기저장된 명령어를 이용하여 복수의 계층 구조를 가지는 디스플레이 장치의 기능을 수행하는 경우, 여러 번의 사용자 음성을 입력받아야 하는 불편함이 존재하므로, 한 번의 대화형 명령을 통해 더욱 간편하게 디스플레이 장치(100)의 기능을 제어할 수 있게 하기 위함이다.
상술한 바와 같이 더욱 효율적이고 신속한 음성 인식 방법을 안내하는 가이드 정보를 제공함으로써, 사용자는 더욱 효율적이고 신속하게 디스플레이 장치(100)를 제어할 수 있게 된다.
한편, 상술한 실시예에서는 사용자 음성이 기 저장된 명령어인지 여부와 무관하게 사용자 음성이 대화형 서버(200)로 전송되는 것으로 설명하였으나, 이는 일 실시예에 불과할 뿐, 사용자 음성이 기 저장된 명령어가 아닌 경우에만 사용자 음성을 대화형 서버(200)로 전송할 수 있다.
이하에서는 도 2 내지 도 7을 참조하여 디스플레이 장치(100)에 대해 더욱 상세히 설명하기로 한다. 도 2는 본 발명의 일 실시예에 따른, 디스플레이 장치(100)의 구성을 나타내는 블럭도이다. 디스플레이 장치(100)는 음성 입력부(110), 통신부(120), 저장부(130), 디스플레이부(140) 및 제어부(150)를 포함한다.
한편, 도 2는 디스플레이 장치(100)가 음성 인식 기능, 통신 기능, 디스플레이 기능 등과 같이 다양한 기능을 구비한 장치인 경우를 예로 들어, 각종 구성 요소들을 종합적으로 도시한 것이다. 따라서, 실시 예에 따라서는, 도 2에 도시된 구성 요소 중 일부는 생략 또는 변경될 수도 있고, 다른 구성요소가 더 추가될 수도 있다.
음성 입력부(110)는 사용자 음성이 포함된 오디오 신호를 입력받고, 오디오 신호를 처리하여 사용자 음성 신호를 생성한다. 이때, 음성 입력부(110)는 디스플레이 장치(100)의 본체에 구비될 수 있으나, 이는 일 실시예에 불과할 뿐, 본체의 외부(예를 들어, 리모컨 또는 별도의 마이크 등)에 구비될 수 있다. 음성 입력부(110)가 본체의 외부에 구비되는 경우, 음성 입력부(110)는 유/무선 인터페이스(예를 들어, Wi-Fi, 블루투스 등)을 통해 생성된 사용자 음성 신호를 디스플레이 장치(100)의 본체에 전송할 수 있다.
음성 입력부(110)가 사용자 음성이 포함된 오디오 신호를 입력받아 사용자 음성 신호를 생성하는 방법에 대해서는 도 3을 참조하여 설명하기로 한다. 도 3은 본 발명의 일 실시예에 따른, 음성 입력부의 구성을 나타내는 블럭도이다. 도 3에 도시된 바와 같이, 음성 입력부(110)는 마이크(111), ADC(Analog-Digital Converter)(112), 에너지 판단부(113), 노이즈 제거부(114) 및 음성신호 생성부(115)를 포함한다.
마이크(111)는 사용자 음성이 포함된 아날로그 형태의 오디오 신호를 입력받는다.
그리고, ADC(112)는 마이크로부터 입력된 다채널 아날로그 신호를 디지털 신호로 변환한다.
그리고, 에너지 판단부(113)는 변환된 디지털 신호의 에너지를 계산하여, 디지털 신호의 에너지가 기설정된 값 이상인지 여부를 판단한다. 디지털 신호의 에너지가 기설정된 값 이상인 경우, 에너지 판단부(113)는 입력된 디지털 신호를 노이즈 제거부(114)로 전송하고, 디지털 신호의 에너지가 기설정된 값 미만인 경우, 에너지 판단부(113)는 입력된 디지털 신호를 외부로 출력하지 않고, 다른 입력을 기다린다. 이에 의해, 음성 신호가 아닌 소리에 의해 전체 오디오 처리 과정이 활성화되지 않아, 불필요한 전력 소모를 방지할 수 있다.
노이즈 제거부(114)에 입력된 디지털 신호가 입력된 경우, 노이즈 제거부(114)는 노이즈 성분과 사용자 음성 성분이 포함된 디지털 신호 중 노이즈 성분을 제거한다. 이때, 노이즈 성분은 가정 환경에서 발생할 수 있는 돌발성 잡음으로써, 에어컨 소리, 청소기 소리, 음악 소리 등이 포함될 수 있다. 그리고, 노이즈 제거부(114)는 노이즈 성분이 제거된 디지털 신호를 음성 신호 생성부(115)로 출력한다.
음성 신호 생성부(115)는 Localization/Speaker Tracking 모듈을 이용하여 음성 입력부(110)를 기준으로 360˚ 범위 내에 존재하는 사용자의 발화 위치를 추적하여 사용자 음성에 대한 방향 정보를 구한다. 그리고, 음성 신호 생성부(115)는 Target Spoken Sound Extraction 모듈을 통해 노이즈가 제거된 디지털 신호와 사용자 음성에 대한 방향 정보를 이용하여 음성 입력부(110)를 기준으로 360˚ 범위 내에 존재하는 목표 음원을 추출하여 음성 신호를 생성할 수 있다.
한편, 상술한 바와 같이, 불필요한 주변의 노이즈를 제거하여 음성 신호를 생성하는 것은 일 실시예에 불과할 뿐, 사용자 음성에 키워드가 존재하는지 여부를 판단하여 음성 신호를 생성하는 실시예 역시 본 발명의 기술적 사상이 적용될 수 있다.
다시 도 2에 대해 설명하면, 통신부(120)는 대화형 서버(200)와 통신을 수행한다. 특히, 통신부(120)는 음성 입력부(110)에서 생성된 사용자 음성 신호를 대화형 서버(200)에 전송하며, 대화형 서버(200)로부터 제어 정보 및 가이드 정보 중 적어도 하나를 수신할 수 있다. 이때, 통신부(120)는 이더넷(Ethernet), 무선랜, Wi-Fi 등으로 구현될 수 있으나, 이에 한정되는 것은 아니다.
저장부(130)는 디스플레이 장치(100)를 구동하기 위한 다양한 프로그램 및 데이터를 저장하고 있다. 특히, 저장부(130)는 명령어와 제어 정보가 매칭되어 저장되는 음성 인식 데이터베이스를 포함할 수 있다.
디스플레이부(130)는 제어부(150)의 제어에 의해 영상 데이터를 디스플레이한다. 특히, 디스플레이부(130)는 기 저장된 가이드 정보 및 대화형 서버(200)로부터 수신된 가이드 정보 중 하나를 디스플레이할 수 있다.
제어부(150)는 사용자 명령에 따라 디스플레이 장치(100)의 전반적인 동작을 제어한다. 특히, 제어부(150)는 음성 입력부(110)를 통해 입력된 사용자 음성에 따라 디스플레이 장치(100)의 전반적인 동작을 제어할 수 있다.
구체적으로, 제어부(150)는 음성 입력부(110)를 통해 입력된 사용자 음성이 저장부(130)에 기 저장된 명령어인지 여부를 판단한다. 그와 동시에, 제어부(150)는 사용자 음성을 통신부(120)를 통해 대화형 서버(200)로 전송할 수 있다. 예를 들어, 음성 입력부(110)를 통해 "볼륨을 높여줘"라는 사용자 음성이 입력되면, 제어부(150)는 입력된 "볼륨을 높여줘"가 기 저장된 명령어인지 여부를 판단한다. 그리고, 제어부(150)는 "볼륨을 높여줘"를 외부의 대화형 서버(200)로 전송하도록 통신부(120)를 제어할 수 있다.
특히, 사용자 음성이 저장부에 기 저장된 명령어가 아닌 경우, 대화형 서버(200)로부터 사용자 음성에 대응되는 제어 정보 및 사용자 음성과 동일한 기능을 수행할 수 있는 기 저장된 명령어를 안내하는 제1 가이드 정보가 전송되면, 제어부(150)는 대화형 서버(200)로부터 전송된 제어 정보에 따라 디스플레이 장치(100)의 기능을 수행하고, 제1 가이드 정보를 디스플레이하도록 디스플레이부(120)를 제어할 수 있다. 예를 들어, 사용자 음성이 "볼륨을 높여줘"인 경우, 대화형 서버(200)로부터 "오디오 볼륨 레벨을 기설정된 레벨 증가"라는 제어 정보 및 "볼륨을 높여줘"와 동일한 기능을 수행하며 저장부(130)에 저장된 명령어인 "볼륨 올려"를 안내하는 제1 가이드 정보가 수신되면, 제어부(150)는 오디오 볼륨 레벨을 기설정된 레벨만큼 증가시키는 기능을 수행할 수 있으며, 도 4에 도시된 바와 같이, "다음부터는 "볼륨 올려"로 말해주세요."라는 텍스트 정보가 포함된 제1 가이드 정보(410)를 디스플레이하도록 디스플레이부(120)를 제어할 수 있다.
반면, 사용자 음성이 저장부(130)에 기 저장된 명령어인 경우, 제어부(150)는 저장부(130)에 저장된 명령어에 대응되는 제어 정보를 검색하고, 검색된 제어 정보에 따라 디스플레이 장치의 기능을 수행할 수 있다. 예를 들어, 음성 입력부(110)를 통해 입력된 사용자 음성이 "볼륨 올려"인 경우, 제어부(150)는 입력된 사용자 음성인 "볼륨 올려"와 대응되는 제어 정보인 "오디오 볼륨 레벨을 기설정된 레벨 증가"를 검색하고, 검색된 제어 정보에 따라 오디오 볼륨 레벨을 기설정된 레벨만큼 증가시키는 기능을 수행할 수 있다. 이때, 제어부(150)는 외부 대화형 서버(200)로부터 제어 정보가 수신되더라도 우선적으로 임베디드된 명령어에 따라 디스플레이 장치(100)의 기능을 수행할 수 있다.
또한, 음성 입력부(110)를 통해 입력된 사용자 음성이 저장부(130)에 저장된 명령어이며, 사용자 음성이 복수의 계층구조를 가지는 디스플레이 장치의 기능을 제어하기 위한 명령어인 경우, 제어부(150)는 사용자 음성과 동일한 기능을 수행할 수 있는 대화형 명령어를 안내하는 제2 가이드 정보를 디스플레이하도록 디스플레이부(120)를 제어할 수 있다. 예를 들어, 기 저장된 명령어를 이용하여 디스플레이 장치(100)의 취침 기능을 설정하기 위해, 사용자로부터 "취침 설정"이라는 1단계 사용자 음성이 입력되면, 제어부(150)는 취침 설정을 위한 메뉴를 디스플레이하고, 사용자로부터 "30분"이라는 2단계 사용자 음성이 입력되면, 제어부(150)는 30분 뒤 디스플레이 장치(100)의 전원을 끄는 기능을 수행할 수 있다. 즉, 사용자는 기 저장된 명령어를 이용하여 복수의 계층 구조를 가지는 디스플레이 장치의 기능을 수행하는 경우 복수의 사용자 음성을 입력해야 하는 불편함이 존재한다. 그러나, "30분 후에 깨워줘"라는 대화형 방식의 사용자 음성이 입력된 경우, 제어부(150)는 대화형 서버(200)를 이용하여 복수의 사용자 음성을 입력하는 것과 동일한 기능을 수행할 수 있다. 즉, 복수의 계층 구조를 가지는 디스플레이 장치의 기능을 수행하는 경우, 제어부(150)는 한 번의 사용자 음성을 통해 디스플레이 장치(100)의 기능을 수행할 수 있도록 도 5에 도시된 바와 같은 대화형 명령어를 안내하는 제2 가이드 정보(510)를 디스플레이하도록 디스플레이부(120)를 제어할 수 있다.
뿐만 아니라, 음성 입력부(110)를 통해 입력된 사용자 음성이 대화형 서버(200)에 저장된 대화 패턴이 아닌 경우, 대화형 서버(200)로부터 사용자 음성과 동일한 기능을 수행하면서 대화형 서버(200)에 저장된 대화 패턴에 따르는 사용자 음성을 안내하는 제3 가이드 정보가 전송되면, 제어부(150)는 제3 가이드 정보를 디스플레이하도록 디스플레이부(120)를 제어할 수 있다. 예를 들어, "바꿔 채널"이라는 사용자 음성이 입력된 경우, 대화형 서버(200)로부터 대화형 서버(200)에 저장된 대화 패턴의 명령어인 "채널을 ooo로 바꿔줘"라는 사용자 음성을 안내하는 제3 가이드 정보가 전송되면, 제어부(150)는 도 6에 도시된 바와 같은 제3 가이드 정보(610)를 디스플레이하도록 디스플레이부(120)를 제어할 수 있다.
또는, 음성 입력부(110)를 통해 입력된 사용자 음성이 대화형 서버(200)가 응답할 수 없는 대화형 음성인 경우, 대화형 서버(200)로부터 사용자 음성에 포함된 키워드와 관련된 정보를 안내하는 제4 가이드 정보가 전송되면, 제어부(150)는 제4 가이드 정보를 디스플레이부(120)에 디스플레이하도록 제어할 수 있다. 예를 들어, 음성 입력부(110)를 통해 "유재석 어때"라는 사용자 음성이 입력된 경우, 대화형 서버(200)는 입력된 사용자 음성을 통해 응답 정보를 생성할 수 없으므로, 입력된 사용자 음성으로부터 키워드인 "유재석"을 추출하고, 추출된 키워드와 관련된 정보(예를 들어, 직업, 출연작 등)를 안내하는 제4 가이드 정보를 생성하여 디스플레이 장치(100)로 전송할 수 있다. 대화형 서버(200)로부터 제4 가이드 정보가 디스플레이되면, 제어부(150)는 도 7에 도시된 바와 같은 제4 가이드 정보(710)를 디스플레이하도록 디스플레이부(120)를 제어할 수 있다. 또 다른 예로, 음성 입력부(110)를 통해 "맛집 갈까"라는 사용자 음성이 입력된 경우, 대화형 서버(200)는 입력된 사용자 음성을 통해 응답 정보를 생성할 수 없으므로, 입력된 사용자 음성으로부터 키워드인 "맛집"을 추출하고, 추출된 키워드와 관련된 정보(예를 들어, 오늘의 추천 맛집)를 안내하는 제 4 가이드 정보를 생성하여 디스플레이 장치(100)로 전송할 수 있다.
이때, 제4 가이드 정보(710)는 키워드와 관련된 정보뿐만 아니라, 새로운 사용자 음성의 입력을 요구하는 메시지를 포함할 수 있다.
상술한 바와 같은 디스플레이 장치(100)에 의해, 사용자는 음성 인식을 이용하여 더욱 효율적이고 신속하게 디스플레이 장치(100)를 제어할 수 있게 된다.
도 8은 본 발명의 일 실시예에 따른, 대화형 서버(200)의 구성을 나타내는 블럭도이다. 도 8에 도시된 바와 같이, 대화형 서버(200)는 통신부(210), 데이터베이스(220) 및 제어부(230)를 포함한다.
통신부(210)는 디스플레이 장치(100)와 통신을 수행한다. 특히, 통신부(210)디스플레이 장치(100)로부터 사용자 음성 신호를 수신하며, 제어 정보 및 가이드 정보 중 적어도 하나를 디스플레이 장치(100)로 전송할 수 있다. 이때, 통신부(120)는 이더넷(Ethernet), 무선랜, Wi-Fi 등과 같은 통신 방식을 이용하여 디스플레이 장치(100)와 통신을 수행할 수 있다.
데이터베이스(220)는 대화형 음성을 이용하여 디스플레이 장치(100)의 기능을 제어하거나 컨텐츠를 검색하기 위하여, 다양한 데이터를 저장한다. 특히, 데이터베이스(220)는 사용자 음성 이력 정보 및 EPG 정보와 같은 정보를 저장할 수 있다. 또한, 데이터베이스(22)는 사용자 음성 및 제어 정보를 매칭하여 저장할 수 있다.
또한, 대화형 서버(200)가 제1 가이드 정보를 제공할 수 있도록 데이터베이스(220)는 디스플레이 장치(100)에 기 저장된 명령어와 유사한 명령어를 표 1과 같이, 저장할 수 있다.
디스플레이 장치에 기 저장된 명령어 유사 명령어
볼륨 올려 볼륨 높여, 볼륨 키워, 볼륨 증가, 소리 키워, 소리 높여, 크게 틀어줘 등
음소거 소리 꺼, 볼륨 꺼 등등
제어부(230)는 대화형 서버(200)의 전반적인 동작을 제어한다.
특히, 디스플레이 장치(100)로부터 사용자 음성이 수신되면, 제어부(230)는 사용자 음성에 대응되는 제어 정보를 검색한다. 구체적으로, 제어부(230)는 사용자 음성을 텍스트 정보로 변환한 후, 사용자 음성의 발화 요소를 분류할 수 있다. 그리고, 제어부(230)는 발화 요소를 이용하여 사용자 음성이 디스플레이 장치(100)의 기능을 제어하기 위한 사용자 음성인지, 컨텐츠 검색을 위한 사용자 음성인지 여부를 판단할 수 있다. 그리고, 사용자 음성이 디스플레이 장치(100)의 기능을 제어하기 위한 사용자 음성인 경우, 제어부(230)는 데이터베이스(220)를 이용하여 사용자 음성에 대응되는 제어 정보를 검색할 수 있다.
제어부(230)는 사용자 음성에 대응되는 제어 정보를 검색하는 동안 제어 정보와 동일한 기능을 수행할 수 있는 디스플레이 장치(100)에 기저장된 명령어가 있는지 여부를 판단한다. 그리고, 제어 정보와 동일한 기능을 수행할 수 있는 디스플레이 장치(100)에 기저장된 명령어가 존재하는 경우, 제어부(230)는 기 저장된 명령어를 안내하는 제1 가이드 정보를 생성하여 제어 정보와 함께 디스플레이 장치(100)에 전송하도록 통신부(210)를 제어할 수 있다. 예를 들어, 사용자 음성이 "볼륨 높여"인 경우, 제어부(230)는 "볼륨 높여"와 동일한 기능을 수행할 수 있는 디스플레이 장치(100)에 기 저장된 명령어가 있는지 여부를 검색하고, "볼륨 높여"와 동일한 기능을 수행하면서 디스플레이 장치(100)에 기 저장된 명령어인 "볼륨 올려"를 안내하는 제1 가이드 정보를 생성할 수 있다.
또한, 디스플레이 장치(100)로부터 전송된 사용자 음성이 대화형 서버(200)에 저장된 대화 패턴이 아닌 경우, 제어부(230)는 사용자 음성과 동일한 기능을 수행하면서 대화형 서버(200)에 저장된 대화 패턴에 따르는 사용자 음성을 안내하는 제3 가이드 정보를 생성하여 디스플레이 장치로 전송하도록 통신부(210)를 제어할 수 있다. 예를 들어, "바꿔 채널"이라는 사용자 음성이 입력된 경우, 제어부(230)는 데이터베이스(220)에 저장된 대화 패턴이 아님을 판단한다. 그리고, 제어부(230)는 데이터베이스(220)에 저장된 대화 패턴으로 사용자가 발화하는 것을 유도하기 위해, "채널을 ooo로 바꿔줘"라는 사용자 음성을 안내하는 제3 가이드 정보를 생성할 수 있다.
또한, 디스플레이 장치(100)로부터 전송된 사용자 음성이 대화형 서버(200)가 응답할 수 없는 대화형 음성인 경우, 제어부(230)는 대화형 사용자 음성으로부터 키워드를 추출하고, 키워드와 관련된 정보를 안내하는 제4 가이드 정보를 생성하여 디스플레이 장치(100)로 전송하도록 통신부(210)를 제어할 수 있다.
예를 들어, 디스플레이 장치(100)로부터 "유재석 어때"라는 사용자 음성이 전송된 경우, 제어부(230)는 입력된 사용자 음성을 통해 응답 정보를 생성할 수 없으므로, 입력된 사용자 음성으로부터 키워드인 "유재석"을 추출하고, 추출된 키워드와 관련된 정보(예를 들어, 직업, 출연작 등)를 안내하는 제4 가이드 정보를 생성하여 디스플레이 장치(100)로 전송할 수 있다. 또 다른 예로, 디스플레이 장치(100)로부터 "맛집 갈까"라는 사용자 음성이 입력된 경우, 제어부(230)는 입력된 사용자 음성을 통해 응답 정보를 생성할 수 없으므로, 입력된 사용자 음성으로부터 키워드인 "맛집"을 추출하고, 추출된 키워드와 관련된 정보(예를 들어, 오늘의 추천 맛집)를 안내하는 제 4 가이드 정보를 생성하여 디스플레이 장치(100)로 전송할 수 있다.
상술한 바와 같이 대화형 서버(200)가 다양한 가이드 정보를 제공함으로써, 사용자는 음성 인식을 이용하여 더욱 효율적이고 신속하게 디스플레이 장치(100)의 기능을 제어할 수 있게 된다.
도 9는 본 발명의 일 실시예에 따른, 디스플레이 장치(100)의 제어 방법을 설명하기 위한 흐름도이다.
디스플레이 장치(100)는 사용자 음성을 입력받는다(S910). 이때, 사용자 음성은 볼륨 제어, 채널 제어, 전원 제어와 같은 디스플레이 장치(100)의 기능을 제어하기 위한 명령어일 수 있다.
그리고, 디스플레이 장치(100)는 사용자 음성을 대화형 서버(200)로 전송한다(S920). 그리고, 디스플레이 장치(100)는 사용자 음성이 기 저장된 명령어인지 여부를 판단한다(S930). 이때, S920 단계 및 S930 단계는 동시에 수행될 수 있다.
사용자 음성이 기 저장된 명령어인 경우(S930-Y), 디스플레이 장치(100)는 기 저장된 명령어에 따라 디스플레이 장치(100)의 기능을 수행한다(S940).
사용자 음성이 기 저장된 명령어가 아닌 경우, 디스플레이 장치(100)는 대화형 서버(200)로부터 제어 정보 및 제1 가이드 정보를 수신한다(S950). 이때, 제1 가이드 정보는 사용자 음성과 동일한 기능을 수행하면서 디스플레이 장치(100)에 기 저장된 명령어를 안내하는 정보일 수 있다.
디스플레이 장치(100)는 수신된 제어 정보에 따라 디스플레이 장치의 기능을 수행하고, 제1 가이드 정보를 디스플레이한다(S960).
한편, 기저장된 명령어에 따라 디스플레이 장치(100)의 기능을 수행하는 경우, 디스플레이 장치(100)는 디스플레이 장치(100)의 복수의 계층 구조를 가지는 디스플레이 장치(100)의 기능인지 여부를 판단한다(S970).
복수의 계층 구조를 가지는 디스플레이 장치(100)의 기능인 경우(S970-Y), 디스플레이 장치(100)는 제2 가이드 정보를 디스플레이한다(S980). 이때, 제2 가이드 정보는 사용자 음성과 동일한 기능을 수행하면서 대화형 서버(200)를 이용할 수 있는 대화형 명령어를 안내하는 정보일 수 있다.
도 10은 본 발명의 일 실시예에 따른, 음성 인식 시스템의 디스플레이 장치 제어 방법을 설명하기 위한 시퀀스도이다.
우선, 디스플레이 장치(100)는 사용자 음성을 입력받는다(S1010).
그리고, 디스플레이 장치(100)는 입력된 사용자 음성을 대화형 서버(200)로 전송한다(S1020). 그와 동시에, 디스플레이 장치(100)는 사용자 음성이 기 저장된 명령어인지 여부를 판단한다(S1030).
대화형 서버(200)는 사용자 음성에 대응되는 제어 정보 및 가이드 정보를 생성한다(S1040). 구체적으로, 대화형 서버(200)는 사용자 음성의 발화 요소를 분석하여 사용자 음성에 대응되는 제어 정보를 생성할 수 있으며, 사용자 음성의 유형에 따라 다양한 가이드 정보를 생성할 수 있다. 예를 들어, 사용자 음성이 디스플레이 장치(100)에 기 저장된 명령어가 아닌 경우, 대화형 서버(200)는 사용자 음성과 동일한 기능을 수행할 수 있는 디스플레이 장치에 기 저장된 명령어를 안내하는 제1 가이드 정보를 생성할 수 있다. 또는, 사용자 음성이 대화형 서버(200)에 저장된 대화 패턴이 아닌 경우, 대화형 서버(200)는 사용자 음성과 동일한 기능을 수행하면서 대화형 서버에 저장된 대화 패턴에 따르는 사용자 음성을 안내하는 제3 가이드 정보를 생성할 수 있다. 또는, 사용자 음성이 대화형 서버가 응답할 수 없는 대화형 음성인 경우, 대화형 서버(200)는 사용자 음성으로부터 키워드를 추출하여 키워드와 관련된 정보를 안내하는 제4 가이드 정보를 생성할 수 있다.
그리고, 대화형 서버(200)는 제어 정보 및 가이드 정보를 디스플레이 장치(100)로 전송한다(S1050).
디스플레이 장치(100)는 사용자 음성에 따라 디스플레이 장치의 기능을 수행하고, 가이드 정보를 디스플레이한다(S1060). 구체적으로, 디스플레이 장치(100)는 사용자 음성이 기 저장된 명령어인지 여부에 따라 상이한 제어 정보를 이용하여 디스플레이 장치(100)의 기능을 수행할 수 있다. 사용자 음성이 기 저장된 명령어인 경우, 디스플레이 장치(100)는 기 저장된 명령어에 대응되는 제어 정보를 검색하여 검색된 제어 정보에 따라 디스플레이 장치(100)의 기능을 수행할 수 있다. 반면, 사용자 음성이 기 저장된 명령어가 아닌 경우, 디스플레이 장치(100)는 대화형 서버(200)로부터 전송된 제어 정보에 따라 디스플레이 장치(100)의 기능을 수행할 수 있다. 또한, 디스플레이 장치(100)는 사용자가 더욱 효율적이고 신속하게 음성 인식을 수행할 수 있도록 도 4 내지 도 7에서 설명한 바와 같은 가이드 정보(410,510,610,710)를 디스플레이할 수 있다.
상술한 바와 같이, 효율적인 음성 인식을 위한 가이드 정보를 제공함으로써, 사용자는 음성 인식을 이용하여 더욱 효율적이고 신속하게 디스플레이 장치의 기능을 수행할 수 있게 된다.
한편, 상술한 실시예에서는 대화형 서버(200)가 하나의 서버로 구현되는 것으로 설명하였으나, 이는 일 실시예에 불과할 뿐, 복수의 서버로 구현될 수 있다. 예를 들어, 도 11에 도시된 바와 같이, 대화형 서버(200)는 입력된 사용자 음성을 텍스트 정보로 변환하는 제1 대화형 서버(200-1) 및 텍스트 정보에 따라 제어 정보 및 제1 가이드 정보를 생성하는 제2 대화형 서버(200-2)를 포함할 수 있다. 이 경우, 디스플레이 장치(100)는 입력된 사용자 음성을 제1 대화형 서버(200-1)로 전송하며, 제1 대화형 서버(200-1)로부터 전송된 텍스트 정보를 제2 대화형 서버(200-2)로 전송할 수 있다. 제2 대화형 서버(200-2)는 전송된 텍스트 정보를 이용하여 도 8에서 설명한 바와 같이, 제어 정보 및 가이드 정보 중 적어도 하나를 생성할 수 있다.
이상과 같은 다양한 실시 예에 따른 제어 방법을 수행하기 위한 프로그램 코드는 비일시적 판독 가능 매체(non-transitory computer readable medium)에 저장될 수 있다. 비일시적 판독 가능 매체란 레지스터, 캐쉬, 메모리 등과 같이 짧은 순간 동안 데이터를 저장하는 매체가 아니라 반영구적으로 데이터를 저장하며, 기기에 의해 판독(reading)이 가능한 매체를 의미한다. 구체적으로는, 상술한 다양한 어플리케이션 또는 프로그램들은 CD, DVD, 하드 디스크, 블루레이 디스크, USB, 메모리카드, ROM 등과 같은 비일시적 판독 가능 매체에 저장되어 제공될 수 있다.
또한, 이상에서는 본 발명의 바람직한 실시예에 대하여 도시하고 설명하였지만, 본 발명은 상술한 특정의 실시예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형실시들은 본 발명의 기술적 사상이나 전망으로부터 개별적으로 이해되어져서는 안될 것이다.
110: 음성 입력부 120: 통신부
130: 저장부 140: 디스플레이부
150: 제어부

Claims (16)

  1. 디스플레이 장치의 제어 방법에 있어서,
    상기 디스플레이 장치를 제어하기 위한 사용자 음성을 입력받는 단계;
    상기 사용자 음성이 상기 디스플레이 장치에 기 저장된 명령어인지 여부를 판단하면서 상기 사용자 음성을 대화형 서버로 전송하는 단계; 및
    상기 사용자 음성이 상기 디스플레이 장치에 기 저장된 명령어가 아닌 경우, 상기 대화형 서버로부터 상기 사용자 음성에 대응되는 제어 정보 및 상기 사용자 음성과 동일한 기능을 수행할 수 있는 기 저장된 명령어를 안내하는 제1 가이드 정보가 전송되면, 상기 대화형 서버로부터 전송된 제어 정보에 따라 상기 디스플레이 장치의 기능을 수행하고, 상기 제1 가이드 정보를 디스플레이하는 단계;를 포함하는 제어 방법.
  2. 제1항에 있어서,
    상기 대화형 서버는,
    상기 사용자 음성에 대응되는 제어 정보를 검색하고,
    상기 사용자 음성에 대응되는 제어 정보를 검색하는 동안 상기 제어 정보와 동일한 기능을 수행할 수 있는 상기 디스플레이 장치에 기저장된 명령어가 있는지 여부를 판단하며,
    상기 제어 정보와 동일한 기능을 수행할 수 있는 상기 디스플레이 장치에 기저장된 명령어가 있는 경우, 상기 기 저장된 명령어를 안내하는 제1 가이드 정보를 생성하여 상기 제어 정보와 함께 상기 디스플레이 장치에 전송하는 것을 특징으로 하는 제어 방법.
  3. 제1항에 있어서,
    상기 사용자 음성이 기 저장된 명령어인 경우, 상기 기 저장된 명령어와 대응되는 제어 정보를 검색하는 단계; 및
    상기 검색된 제어 정보에 따라 상기 디스플레이 장치의 기능을 우선적으로 수행하는 단계;를 더 포함하는 제어 방법.
  4. 제3항에 있어서,
    상기 사용자 음성이 기 저장된 명령어이며, 상기 사용자 음성이 복수의 계층구조를 가지는 디스플레이 장치의 기능을 제어하기 위한 명령어인 경우, 상기 사용자 음성과 동일한 기능을 수행할 수 있는 대화형 명령어를 안내하는 제2 가이드 정보를 디스플레이하는 단계;를 포함하는 제어 방법.
  5. 제1항에 있어서,
    상기 대화형 서버는,
    상기 사용자 음성을 텍스트 정보로 변환하는 제1 대화형 서버 및 상기 텍스트 정보에 따라 제어 정보 및 제1 가이드 정보를 생성하는 제2 대화형 서버를 포함하는 것을 특징으로 하는 제어 방법.
  6. 디스플레이 장치에 있어서,
    상기 디스플레이 장치를 제어하기 위한 사용자 음성을 입력받는 음성 입력부;
    대화형 서버와 통신을 수행하는 통신부;
    명령어와 제어 정보를 매칭하여 저장하는 저장부;
    디스플레이부; 및
    상기 음성 입력부를 통해 입력된 사용자 음성이 상기 저장부에 기 저장된 명령어인지 여부를 판단하면서 상기 사용자 음성을 상기 통신부를 통해 상기 대화형 서버로 전송하고,
    상기 사용자 음성이 상기 저장부에 기 저장된 명령어가 아닌 경우, 상기 대화형 서버로부터 상기 사용자 음성에 대응되는 제어 정보 및 상기 사용자 음성과 동일한 기능을 수행할 수 있는 기 저장된 명령어를 안내하는 제1 가이드 정보가 전송되면, 상기 대화형 서버로부터 전송된 제어 정보에 따라 상기 디스플레이 장치의 기능을 수행하고, 상기 제1 가이드 정보를 디스플레이하도록 상기 디스플레이부를 제어하는 제어부;를 포함하는 디스플레이 장치.
  7. 제6항에 있어서,
    상기 대화형 서버는,
    상기 사용자 음성에 대응되는 제어 정보를 검색하고,
    상기 사용자 음성에 대응되는 제어 정보를 검색하는 동안 상기 제어 정보와 동일한 기능을 수행할 수 있는 상기 디스플레이 장치에 기저장된 명령어가 있는지 여부를 판단하며,
    상기 제어 정보와 동일한 기능을 수행할 수 있는 상기 디스플레이 장치에 기저장된 명령어가 있는 경우, 상기 기 저장된 명령어를 안내하는 제1 가이드 정보를 생성하여 상기 제어 정보와 함께 상기 디스플레이 장치에 전송하는 것을 특징으로 하는 디스플레이 장치.
  8. 제6항에 있어서,
    상기 제어부는,
    상기 사용자 음성이 상기 저장부에 기 저장된 명령어인 경우, 상기 저장부에 저장된 상기 사용자 음성에 대응되는 제어 정보를 검색하고,
    상기 검색된 제어 정보에 따라 상기 디스플레이 장치의 기능을 우선적으로 수행하는 것을 특징으로 하는 디스플레이 장치.
  9. 제8항에 있어서,
    상기 제어부는,
    상기 사용자 음성이 기 저장된 명령어이며, 상기 사용자 음성이 복수의 계층구조를 가지는 디스플레이 장치의 기능을 제어하기 위한 명령어인 경우, 상기 사용자 음성과 동일한 기능을 수행할 수 있는 대화형 명령어를 안내하는 제2 가이드 정보를 디스플레이하도록 상기 디스플레이부를 제어하는 것을 특징으로 하는 디스플레이 장치.
  10. 제6항에 있어서,
    상기 대화형 서버는,
    상기 입력된 사용자 음성을 텍스트 정보로 변환하는 제1 대화형 서버 및 상기 텍스트 정보에 따라 제어 정보 및 제1 가이드 정보를 생성하는 제2 대화형 서버를 포함하며,
    상기 제어부는,
    상기 입력된 사용자 음성을 상기 제1 대화형 서버로 전송하며, 상기 제1 대화형 서버로부터 전송된 텍스트 정보를 상기 제2 대화형 서버로 전송하도록 상기 통신부를 제어하는 것을 특징으로 하는 디스플레이 장치.
  11. 대화형 서버 및 디스플레이 장치를 포함하는 음성 인식 시스템의 제어 방법에 있어서,
    상기 디스플레이 장치가, 사용자 음성을 입력받는 단계;
    상기 디스플레이 장치가, 상기 사용자 음성이 상기 디스플레이 장치에 기 저장된 명령어인지 여부를 판단하면서 상기 사용자 음성을 상기 대화형 서버로 전송하는 제1 전송 단계;
    상기 대화형 서버가, 상기 사용자 음성에 대응되는 제어 정보 및 상기 제어 정보와 동일한 기능을 수행할 수 있는 상기 디스플레이 장치에 기 저장된 명령어를 안내하는 제1 가이드 정보 중 적어도 하나를 생성하여 상기 디스플레이 장치로 전송하는 제2 전송 단계; 및
    상기 사용자 음성이 상기 디스플레이 장치에 기 저장된 명령어가 아닌 경우, 상기 디스플레이 장치가, 상기 대화형 서버로부터 전송된 제어 정보에 따라 디스플레이 장치의 기능을 수행하고 상기 제1 가이드 정보를 디스플레이하는 단계;를 포함하는 제어 방법.
  12. 제11항에 있어서,
    상기 사용자 음성이 상기 디스플레이 장치에 기 저장된 명령어인 경우, 상기 디스플레이 장치가, 상기 사용자 음성에 대응되는 제어 정보를 검색하고, 상기 검색된 제어 정보에 따라 상기 디스플레이 장치의 기능을 수행하는 단계;를 더 포함하는 제어 방법.
  13. 제12항에 있어서,
    상기 사용자 음성이 기 저장된 명령어이며, 상기 사용자 음성이 복수의 계층구조를 가지는 디스플레이 장치의 기능을 제어하기 위한 명령어인 경우, 상기 디스플레이 장치가, 상기 사용자 음성과 동일한 기능을 수행할 수 있는 대화형 명령어를 안내하는 제2 가이드 정보를 디스플레이하는 단계;를 더 포함하는 제어 방법.
  14. 제11항에 있어서,
    상기 대화형 서버는,
    상기 입력된 사용자 음성을 텍스트 정보로 변환하는 제1 대화형 서버 및 상기 텍스트 정보에 따라 제어 정보 및 제1 가이드 정보를 생성하는 제2 대화형 서버를 포함하며,
    상기 제1 전송 단계는,
    상기 디스플레이 장치가, 상기 사용자 음성을 디지털 신호로 변환하는 단계;
    상기 디스플레이 장치가, 상기 디지털 신호를 제1 대화형 서버로 전송하는 단계;
    상기 제1 대화형 서버가, 상기 디지털 신호에 대응되는 텍스트 정보를 생성하여 상기 디스플레이 장치로 전송하는 단계; 및
    상기 디스플레이 장치가, 상기 텍스트 정보를 상기 제2 대화형 서버로 전송하는 단계;를 포함하는 제어 방법.
  15. 제11항에 있어서,
    상기 제2 전송 단계는,
    상기 사용자 음성이 상기 대화형 서버에 저장된 대화 패턴이 아닌 경우, 상기 대화형 서버가, 상기 사용자 음성과 동일한 기능을 수행하면서 상기 대화형 서버에 저장된 대화 패턴에 따르는 사용자 음성을 안내하는 제3 가이드 정보를 생성하여 상기 디스플레이 장치로 전송하는 단계;를 더 포함하며,
    상기 디스플레이 장치가 상기 제3 가이드 정보를 디스플레이하는 단계;를 더 포함하는 것을 특징으로 하는 제어 방법.
  16. 제11항에 있어서,
    상기 제2 전송 단계는,
    상기 사용자 음성이 상기 대화형 서버가 응답할 수 없는 대화형 음성인 경우, 상기 대화형 서버가 상기 사용자 음성으로부터 키워드를 추출하여 상기 키워드와 관련된 정보를 안내하는 제4 가이드 정보를 생성하여 상기 디스플레이 장치로 전송하는 단계;를 더 포함하며,
    상기 디스플레이 장치가 상기 제4 가이드 정보를 디스플레이하는 단계;를 더 포함하는 것을 특징으로 하는 제어 방법.
KR1020130001807A 2013-01-07 2013-01-07 디스플레이 장치, 및 이의 제어 방법, 그리고 음성 인식 시스템의 디스플레이 장치 제어 방법 KR20140089863A (ko)

Priority Applications (10)

Application Number Priority Date Filing Date Title
KR1020130001807A KR20140089863A (ko) 2013-01-07 2013-01-07 디스플레이 장치, 및 이의 제어 방법, 그리고 음성 인식 시스템의 디스플레이 장치 제어 방법
EP19185019.7A EP3588966A3 (en) 2013-01-07 2014-01-07 Display apparatus and method of controlling a display apparatus in a voice recognition system
CN201480012854.XA CN105027574B (zh) 2013-01-07 2014-01-07 在语音识别系统中控制显示装置的显示装置和方法
EP24171428.6A EP4379713A3 (en) 2013-01-07 2014-01-07 Display apparatus and method of controlling a display apparatus in a voice recognition system
MX2015008747A MX353738B (es) 2013-01-07 2014-01-07 Aparato de despliegue y metodo para controlar un aparato de despliegue en un sistema de reconocimiento de voz.
CN201811168329.3A CN109508167B (zh) 2013-01-07 2014-01-07 显示装置和在语音识别系统中控制显示装置的方法
EP14735227.2A EP2941895B1 (en) 2013-01-07 2014-01-07 Display apparatus and method of controlling a display apparatus in a voice recognition system
US14/149,487 US9880808B2 (en) 2013-01-07 2014-01-07 Display apparatus and method of controlling a display apparatus in a voice recognition system
CN201811168338.2A CN109343819B (zh) 2013-01-07 2014-01-07 在语音识别系统中控制显示装置的显示装置和方法
PCT/KR2014/000119 WO2014107076A1 (en) 2013-01-07 2014-01-07 Display apparatus and method of controlling a display apparatus in a voice recognition system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020130001807A KR20140089863A (ko) 2013-01-07 2013-01-07 디스플레이 장치, 및 이의 제어 방법, 그리고 음성 인식 시스템의 디스플레이 장치 제어 방법

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020170059480A Division KR102045539B1 (ko) 2017-05-12 2017-05-12 디스플레이 장치, 및 이의 제어 방법, 그리고 음성 인식 시스템의 디스플레이 장치 제어 방법

Publications (1)

Publication Number Publication Date
KR20140089863A true KR20140089863A (ko) 2014-07-16

Family

ID=51060576

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020130001807A KR20140089863A (ko) 2013-01-07 2013-01-07 디스플레이 장치, 및 이의 제어 방법, 그리고 음성 인식 시스템의 디스플레이 장치 제어 방법

Country Status (6)

Country Link
US (1) US9880808B2 (ko)
EP (3) EP4379713A3 (ko)
KR (1) KR20140089863A (ko)
CN (3) CN109508167B (ko)
MX (1) MX353738B (ko)
WO (1) WO2014107076A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112102820A (zh) * 2019-06-18 2020-12-18 北京京东尚科信息技术有限公司 交互方法、交互装置、电子设备和介质

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE112015001468T5 (de) * 2014-03-27 2016-12-15 Sony Corporation Elektronische Vorrichtung und Verfahren zum Identifizieren von Eingabebefehlen eines Benutzers
KR102261552B1 (ko) * 2014-06-30 2021-06-07 삼성전자주식회사 음성 명령어 제공 방법 및 이를 지원하는 전자 장치
KR102298767B1 (ko) * 2014-11-17 2021-09-06 삼성전자주식회사 음성 인식 시스템, 서버, 디스플레이 장치 및 그 제어 방법
CN105912296A (zh) * 2016-04-08 2016-08-31 宇龙计算机通信科技(深圳)有限公司 语音控制方法及系统
KR20180028703A (ko) * 2016-09-09 2018-03-19 삼성전자주식회사 디스플레이 장치 및 이를 이용한 원격 제어 장치 설정 방법
CN108010523B (zh) * 2016-11-02 2023-05-09 松下电器(美国)知识产权公司 信息处理方法以及记录介质
JP6908461B2 (ja) * 2016-11-02 2021-07-28 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 情報処理方法及びプログラム
KR102519165B1 (ko) * 2016-11-24 2023-04-07 삼성전자주식회사 원격 제어 장치, 디스플레이 장치 및 그들의 제어 방법
TWI656523B (zh) * 2016-12-16 2019-04-11 群邁通訊股份有限公司 語音控制裝置、系統及控制方法
US10574825B2 (en) * 2017-02-15 2020-02-25 Microsoft Technology Licensing, Llc Assisted-communication with intelligent personal assistant
CN107155121B (zh) * 2017-04-26 2020-01-10 海信集团有限公司 语音控制文本的显示方法及装置
CN107122160A (zh) * 2017-04-26 2017-09-01 海信集团有限公司 用于语音输入控制指令的显示方法、装置和终端
KR102380717B1 (ko) * 2017-04-30 2022-03-31 삼성전자주식회사 사용자 발화를 처리하는 전자 장치 및 이 전자 장치의 제어 방법
KR102392087B1 (ko) * 2017-07-10 2022-04-29 삼성전자주식회사 원격 조정 장치 및 원격 조정 장치의 사용자 음성 수신방법
CN107277630B (zh) * 2017-07-20 2019-07-09 海信集团有限公司 语音提示信息的显示方法及装置
JP2019066702A (ja) * 2017-10-02 2019-04-25 東芝映像ソリューション株式会社 対話型電子装置制御システム、対話型電子装置、対話型電子装置制御方法
CN107919120B (zh) * 2017-11-16 2020-03-13 百度在线网络技术(北京)有限公司 语音交互方法及装置,终端,服务器及可读存储介质
KR102519635B1 (ko) 2018-01-05 2023-04-10 삼성전자주식회사 음성 명령을 처리하기 위한 전자 문서 표시 방법 및 그 전자 장치
KR102540001B1 (ko) * 2018-01-29 2023-06-05 삼성전자주식회사 디스플레이 장치 및 디스플레이 장치의 화면 표시방법
KR102458336B1 (ko) * 2018-05-18 2022-10-25 삼성전자주식회사 공기 조화 장치 및 이의 제어 방법
CN109218843B (zh) * 2018-09-27 2020-10-23 四川长虹电器股份有限公司 基于电视设备的个性化智能语音提示方法
CN109920413A (zh) * 2018-12-28 2019-06-21 广州索答信息科技有限公司 一种厨房场景触屏语音对话的实现方法及存储介质
CN110134235B (zh) * 2019-04-25 2022-04-12 广州智伴人工智能科技有限公司 一种引导式互动的方法
CN112312181A (zh) * 2019-07-26 2021-02-02 深圳Tcl新技术有限公司 一种智能电视语音识别方法、系统及可读存储介质

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9619165D0 (en) * 1996-09-13 1996-10-23 British Telecomm Training apparatus and method
KR100305320B1 (ko) 1998-10-30 2001-11-22 전주범 음성다중텔레비전에서의음성제어방법
US6937984B1 (en) 1998-12-17 2005-08-30 International Business Machines Corporation Speech command input recognition system for interactive computer display with speech controlled display of recognized commands
US7206747B1 (en) * 1998-12-16 2007-04-17 International Business Machines Corporation Speech command input recognition system for interactive computer display with means for concurrent and modeless distinguishing between speech commands and speech queries for locating commands
FR2788615B1 (fr) * 1999-01-18 2001-02-16 Thomson Multimedia Sa Appareil comportant une interface utilisateur vocale ou manuelle et procede d'aide a l'apprentissage des commandes vocales d'un tel appareil
ATE281689T1 (de) * 1999-03-26 2004-11-15 Scansoft Inc Client-server spracherkennungssystem
JP3997459B2 (ja) * 2001-10-02 2007-10-24 株式会社日立製作所 音声入力システムおよび音声ポータルサーバおよび音声入力端末
EP1322111B1 (en) * 2001-12-18 2007-10-10 Matsushita Electric Industrial Co., Ltd. Television apparatus having speech recognition function
US6898567B2 (en) * 2001-12-29 2005-05-24 Motorola, Inc. Method and apparatus for multi-level distributed speech recognition
KR100540326B1 (ko) * 2003-02-14 2006-01-10 에스케이 텔레콤주식회사 네비게이션 서비스 제공 시스템 및 방법
KR100567828B1 (ko) 2003-08-06 2006-04-05 삼성전자주식회사 향상된 음성인식 장치 및 방법
CN101090413A (zh) * 2006-06-14 2007-12-19 华为技术有限公司 一种电话呼叫的方法和系统
JP5127201B2 (ja) 2006-11-08 2013-01-23 キヤノン株式会社 情報処理装置及び方法並びにプログラム
JP2009109586A (ja) * 2007-10-26 2009-05-21 Panasonic Electric Works Co Ltd 音声認識制御装置
US20090271200A1 (en) * 2008-04-23 2009-10-29 Volkswagen Group Of America, Inc. Speech recognition assembly for acoustically controlling a function of a motor vehicle
US7933777B2 (en) * 2008-08-29 2011-04-26 Multimodal Technologies, Inc. Hybrid speech recognition
KR20120020853A (ko) * 2010-08-31 2012-03-08 엘지전자 주식회사 이동 단말기 및 그 제어방법
CN102063901A (zh) * 2010-12-02 2011-05-18 深圳市凯立德欣软件技术有限公司 位置服务设备的语音识别方法及位置服务设备
KR101828273B1 (ko) * 2011-01-04 2018-02-14 삼성전자주식회사 결합기반의 음성명령 인식 장치 및 그 방법
US9953653B2 (en) * 2011-01-07 2018-04-24 Nuance Communications, Inc. Configurable speech recognition system using multiple recognizers
KR20120117148A (ko) * 2011-04-14 2012-10-24 현대자동차주식회사 음성 명령어 처리 장치 및 그 방법
CN102316162A (zh) * 2011-09-01 2012-01-11 深圳市子栋科技有限公司 基于语音命令的车辆远程控制方法、装置及系统
CN102724310B (zh) * 2012-06-18 2016-06-08 深圳市Tcl云创科技有限公司 一种通过移动终端实现云搜索的方法
CN106937984A (zh) * 2015-12-30 2017-07-11 于秀珍 一种治疗滴虫性阴道炎的中药配方

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112102820A (zh) * 2019-06-18 2020-12-18 北京京东尚科信息技术有限公司 交互方法、交互装置、电子设备和介质

Also Published As

Publication number Publication date
EP4379713A2 (en) 2024-06-05
CN105027574B (zh) 2018-11-02
US20140191949A1 (en) 2014-07-10
CN105027574A (zh) 2015-11-04
EP2941895A4 (en) 2016-08-17
EP2941895B1 (en) 2019-08-14
EP3588966A3 (en) 2020-03-18
CN109343819B (zh) 2022-06-10
CN109508167A (zh) 2019-03-22
EP4379713A3 (en) 2024-07-03
EP2941895A1 (en) 2015-11-11
CN109343819A (zh) 2019-02-15
CN109508167B (zh) 2022-08-19
WO2014107076A1 (en) 2014-07-10
MX353738B (es) 2018-01-26
MX2015008747A (es) 2015-11-06
US9880808B2 (en) 2018-01-30
EP3588966A2 (en) 2020-01-01

Similar Documents

Publication Publication Date Title
KR20140089863A (ko) 디스플레이 장치, 및 이의 제어 방법, 그리고 음성 인식 시스템의 디스플레이 장치 제어 방법
KR102429436B1 (ko) 사용자의 입력 입력에 기초하여 타겟 디바이스를 결정하고, 타겟 디바이스를 제어하는 서버 및 그 동작 방법
US10803869B2 (en) Voice enablement and disablement of speech processing functionality
EP3195310B1 (en) Keyword detection using speaker-independent keyword models for user-designated keywords
KR101309794B1 (ko) 디스플레이 장치, 디스플레이 장치의 제어 방법 및 대화형 시스템
KR102411619B1 (ko) 전자 장치 및 그 제어 방법
JP6244560B2 (ja) 音声認識処理装置、音声認識処理方法、および表示装置
KR20140089861A (ko) 디스플레이 장치 및 그의 제어 방법
KR101971513B1 (ko) 전자 장치 및 이의 음성 인식 오류 수정 방법
KR20140093303A (ko) 디스플레이 장치 및 그의 제어 방법
WO2016157782A1 (ja) 音声認識システム、音声認識装置、音声認識方法、および制御プログラム
US20150127353A1 (en) Electronic apparatus and method for controlling electronic apparatus thereof
KR20130105219A (ko) 음성 인식을 이용하여 전원을 제어하는 전자 장치 및 이의 전원 제어 방법
CN103546763A (zh) 用于提供内容信息的方法和广播接收设备
KR102124396B1 (ko) 디스플레이 장치, 및 이의 제어 방법, 그리고 음성 인식 시스템의 디스플레이 장치 제어 방법
KR102089593B1 (ko) 디스플레이 장치, 및 이의 제어 방법, 그리고 음성 인식 시스템의 디스플레이 장치 제어 방법
KR20200042627A (ko) 전자 장치 및 그 제어 방법
KR102051480B1 (ko) 디스플레이 장치, 및 이의 제어 방법, 그리고 음성 인식 시스템의 디스플레이 장치 제어 방법
KR102045539B1 (ko) 디스플레이 장치, 및 이의 제어 방법, 그리고 음성 인식 시스템의 디스플레이 장치 제어 방법
KR20210098250A (ko) 전자 장치 및 이의 제어 방법
KR20190104773A (ko) 전자 장치, 제어 방법 및 컴퓨터 판독 가능 매체
KR102091006B1 (ko) 디스플레이 장치 및 그의 제어 방법
KR20160022326A (ko) 디스플레이 장치 및 그의 제어 방법
KR20200053290A (ko) 전자 장치 및 그 제어 방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
A107 Divisional application of patent