CN109508167B - 显示装置和在语音识别系统中控制显示装置的方法 - Google Patents

显示装置和在语音识别系统中控制显示装置的方法 Download PDF

Info

Publication number
CN109508167B
CN109508167B CN201811168329.3A CN201811168329A CN109508167B CN 109508167 B CN109508167 B CN 109508167B CN 201811168329 A CN201811168329 A CN 201811168329A CN 109508167 B CN109508167 B CN 109508167B
Authority
CN
China
Prior art keywords
user
voice
information
control command
stored
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811168329.3A
Other languages
English (en)
Other versions
CN109508167A (zh
Inventor
朴恩姬
韩尚珍
金在权
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of CN109508167A publication Critical patent/CN109508167A/zh
Application granted granted Critical
Publication of CN109508167B publication Critical patent/CN109508167B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/4227Providing Remote input by a user located remotely from the client device, e.g. at work
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/32Multiple recognisers used in sequence or in parallel; Score combination systems therefor, e.g. voting systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42203Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42204User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/4722End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for requesting additional data associated with the content
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Abstract

提供一种显示装置的显示方法,所述方法包括:接收用户的语音;向外部服务器发送所述用户的语音;基于与所述用户的语音相对应的控制信息被预存在所述外部服务器中,从所述外部服务器接收与所述用户的语音相对应的控制信息;以及基于与所述用户的语音相对应的控制信息未被预存在所述外部服务器中,从所述外部服务器接收关于所述用户的语音中包括的关键词的第一指引信息并显示所述第一指引信息。

Description

显示装置和在语音识别系统中控制显示装置的方法
本申请是申请日为2014年1月7日,申请号为201480012854.X,发明名称为“在语音识别系统中控制显示装置的显示装置和方法”的发明专利申请的分案申请。
技术领域
本公开涉及一种在语音识别系统中控制显示装置的显示装置和方法。更具体地,示例性实施例涉及根据用户语音来控制显示装置的功能的显示装置以及在语音识别系统中控制显示装置的方法。
背景技术
一般而言,能够识别语音的显示装置被划分为嵌入式装置和交互式装置。
根据嵌入式方案的显示装置只能识别有限数目的用户的语音。具体地,根据嵌入式方案的显示装置只有在输入与预存命令相对应的用户的语音时才能执行与用户的语音相对应的功能。根据嵌入式方案的显示装置具有快速地执行与输入的用户的语音相对应的功能的优点;然而,该装置具有识别用户的语音的能力有限的缺点,因为该装置只识别与预存命令相对应的用户的语音。
根据交互式方案的显示装置通过经由外部交互式服务器识别各种用户的语音来识别用户的意图,并且执行适合于所识别的用户的意图的操作。当输入用户的语音时,根据交互式方案的显示装置从交互式服务器接收与用户的语音相对应的控制信息或响应信息(例如,内容搜索信息),并且基于该控制信息或响应信息来执行与用户的语音相对应的功能。与根据嵌入式方案的显示装置相比,根据交互式方案的显示装置具有会识别各种种类的用户的言语并执行与所识别的用户的言语相对应的操作的优点,然而,它与根据嵌入式方案的显示装置相比,具有响应速度较慢的缺点,因为根据交互式方案的显示装置通过使用交互式服务器来执行与用户的语音相对应的功能。
具体地,已开发使用这两种方案的显示装置。然而,即使使用了两种方案,但如果用户没有说出嵌入在显示装置中的命令,而是说出与所嵌入的命令类似的命令,该显示装置也还是基于交互式方案来识别用户的语音并且执行与用户的语音相对应的功能。例如,响应于被嵌入来执行显示装置的增加音量功能的命令为“增加音量”,但用户说出“请增加音量”,该显示装置将使用具有较低响应速度的交互式方案,而不是具有较快响应速度的嵌入式方案,来执行“增加音量”功能。
换言之,当用户不知道两种识别方案中的哪种允许语音识别更迅速地被执行时,显示装置的工作量被不必要地增加并且对用户的语音的响应变慢。
发明内容
技术问题
本发明提供一种向用户提供语音指引信息从而快速地响应于被输入的用户的语音来控制显示装置的功能的显示装置;一种控制该显示装置的方法以及控制语音识别系统的方法。
解决问题的方案
根据示例性实施例的一方面,提供一种控制显示装置的方法。该方法可以包括:接收用于控制显示装置的用户的语音;确定用户的语音是否为预存在显示装置中的命令并且向交互式服务器发送用户的语音;以及当在用户的语音不是在显示装置中预存的命令的情况下从交互式服务器发送与用户的语音相对应的控制信息和第一指引信息时,基于从交互式服务器发送的控制信息来执行显示装置的功能并显示第一指引信息,第一指引信息指引能够执行与用户的语音相同的功能的预存命令。
交互式服务器可以搜索与用户的语音相对应的控制信息;在搜索与用户的语音相对应的控制信息的时候,确定是否存在能够执行与控制信息相同的功能的、在显示装置中预存的命令;以及当存在能够执行与控制信息相同的功能的、在显示装置中的预存的命令时,生成指引该预存的命令第一指引信息,并且将该指引信息与控制信息一起发送给显示装置。
该方法还可以包括:当用户的语音为预存的命令时,搜索与预存的命令相对应的控制信息;以及优先地基于所搜索的控制信息来执行显示装置的功能。
该方法还可以包括:当用户的语音为预存的命令并且用户的语音为用于控制具有多个层次结构的显示装置的功能的命令时,显示第二指引信息,其指引能够执行与用户的语音相同的功能的交互式命令。
交互式服务器可以包括将用户的语音转换成文本信息的第一交互式服务器;以及基于文本信息生成控制信息和第一指引信息的第二交互式服务器。
根据示例性实施例的一方面,在此提供了一种显示装置。该装置可以包括:语音输入部,被配置为接收用于控制显示装置的用户的语音;通信器,被配置为执行与交互式服务器的通信;存储装置,被配置为使命令和控制信息相匹配以存储它们;显示器;以及控制器,被配置为当确定经由用户输入进行输入的用户的语音是否为在存储装置中预存的命令的时候,经由通信器向交互式服务器发送用户的语音,并且在用户的语音不是在存储装置中预存的命令的情况下,并且当从交互式服务器发送与用户的语音相对应的控制信息和能够执行与用户的语音相同的功能的预存命令的第一指引信息时,控制器被配置为基于从交互式服务器发送的控制信息来执行显示装置的功能,并控制显示器以便显示第一指引信息。
交互式服务器可以搜索与用户的语音相对应的控制信息;在搜索与用户的语音相对应的控制信息的时候,确定是否存在能够执行与控制信息相同的功能的、预存在显示装置中的命令;以及当存在能够执行与控制信息相同的功能的、在显示装置中的预存的命令时,生成指引该预存的命令的第一指引信息,并且将该指引信息与控制信息一起发送给显示装置。
控制器可以在用户的语音为存储装置中的预存命令时,搜索存储装置中预存的、与用户的语音相对应的控制信息;以及优先地基于所搜索的控制信息来执行显示装置的功能。
当用户的语音为预存的命令并且用户的语音为控制具有多个层次结构的显示装置的功能的命令时,控制器可以控制显示器显示第二指引信息,其指引能够执行与用户的语音相同的功能的交互式命令。
交互式服务器可以包括将用户的语音转换成文本信息的第一交互式服务器;以及基于文本信息生成控制信息和第一指引信息的第二交互式服务器,并且控制器可以向第一交互式服务器发送用户的语音,并且控制通信器向第二交互式服务器发送已从第一交互式服务器发送的文本信息。
根据示例性实施例的一方面,在此提供一种控制包括交互式服务器和显示装置的语音识别系统的方法。该方法可以包括:由显示装置接收用户的语音;当确定经由用户输入进行输入的用户的语音是否为预存在存储装置中的命令的时候,由显示装置经由通信器向交互式服务器发送用户的语音;由交互式服务器通过生成与用户的语音相对应的控制信息和第一指引信息中的至少一个来向显示装置发送信息,第一指引信息指引能够执行与控制信息相同的功能的、预存在显示装置中的命令;以及当用户的语音不是预存在显示装置中的命令时,由显示装置基于从交互式服务器发送的控制信息来执行显示装置的功能并显示第一指引信息。
该方法还可以包括:当用户的语音是预存在显示装置中的命令时,由显示装置搜索与用户的语音相对应的控制信息,并基于所搜索的控制信息来执行显示装置的功能。
该方法还可以包括:当用户的语音为预存的命令并且用户的语音为用于控制具有多个层次结构的显示装置的功能的命令时,由显示装置显示第二指引信息,其指引能够执行与用户的语音相同的功能的交互式命令。
交互式服务器可以包括将用户的语音转换成文本信息的第一交互式服务器;以及基于文本信息生成控制信息和第一指引信息的第二交互式服务器,并且发送用户的语音可以包括:由显示装置将用户的语音转换成数字信号;由显示装置向第一交互式服务器发送数字信号;由第一交互式服务器生成对应于数字信号的文本信息并向显示装置发送该信息;以及显示装置向第二交互式服务器发送文本信息。
发送信息还可以包括:当用户的语音不是预存在交互式服务器中的对话模式(dialog pattern)时,由交互式服务器执行与用户的语音相同的功能,生成第三指引信息并发送该信息到显示装置,第三指引信息根据存储在交互式服务器中的对话模式来指引用户的语音;并且由显示装置显示第三指引信息。
发送信息还可以包括:当用户的语音是交互式服务器不能响应的交互式语音时,由交互式服务器通过从用户的语音提取关键词来生成第四指引信息,并且向显示装置发送该信息,第四指引信息指引与关键词相关的信息;以及由显示装置显示第四指引信息。
示例性实施例的一方面可以提供一种显示装置,包括:通信器,被配置为与交互式服务器通信;存储装置,被配置为使命令和控制信息相匹配以便存储它们;以及控制器,被配置为当确定经由用户输入进行输入的用户的语音是否为预存的命令的时候,经由通信器向交互式服务器发送用户的语音,当用户的语音不是预存的命令时并且当从交互式服务器发送与用户的语音相对应的控制信息和第一指引信息时,第一指引信息指引能够执行与用户的语音相同的功能的预存命令,控制器被配置为基于从交互式服务器发送的控制信息来执行显示装置的功能,并被配置为控制第一指引信息的显示。
语音输入部可以被提供以接收要用于控制显示装置的用户的语音。
显示器可以被提供以显示第一指引信息。另外,控制器可以在用户的语音为存储装置中预存的命令时,搜索存储装置中的预存的、与用户的语音相对应的控制信息;以及基于所搜索的控制信息来执行显示装置的功能。
根据本公开的示例性实施例的一方面提供了一种显示装置,包括:语音输入部;通信器,被配置为与外部服务器通信;显示器;以及控制器,被配置为:通过所述语音输入部接收用户的语音,控制所述通信器将关于所述用户的语音的信息发送到外部服务器,基于与所述用户的语音相对应的控制信息被预存在所述外部服务器中,通过所述通信器从所述外部服务器接收与所述用户的语音相对应的控制信息,以及基于与所述用户的语音相对应的控制信息未被预存在所述外部服务器中,从所述外部服务器接收关于所述用户的语音中包括的关键词的第一指引信息并控制所述显示器显示所述第一指引信息。
根据本公开的示例性实施例的一方面提供了一种显示装置的显示方法,所述方法包括:接收用户的语音;向外部服务器发送所述用户的语音;基于与所述用户的语音相对应的控制信息被预存在所述外部服务器中,从所述外部服务器接收与所述用户的语音相对应的控制信息;以及基于与所述用户的语音相对应的控制信息未被预存在所述外部服务器中,从所述外部服务器接收关于所述用户的语音中包括的关键词的第一指引信息并显示所述第一指引信息。
根据本公开的示例性实施例的一方面提供了一种服务器,包括:通信器;存储器;以及处理器,被配置为:从显示装置接收关于用户的语音的信息,基于关于所述用户的语音的信息确定与所述用户的语音相对应的控制信息是否被预存,基于与所述用户的语音相对应的控制信息被预存,控制所述通信器将所述控制信息发送到所述显示装置,以及基于与所述用户的语音相对应的控制信息未被预存,控制所述通信器将关于包括在所述用户的语音中的关键词的第一指引信息发送到所述显示装置。
根据本公开的示例性实施例的一方面提供了一种服务器的控制方法,包括:从显示装置接收关于用户的语音的信息;基于关于所述用户的语音的信息确定与所述用户的语音相对应的控制信息是否被预存;以及基于与所述用户的语音相对应的控制信息被预存,将所述控制信息发送到所述显示装置,以及基于与所述用户的语音相对应的控制信息未被预存,将关于包括在所述用户的语音中的关键词的第一指引信息发送到所述显示装置。
本公开的额外方面和效用一部分将在接下来的描述中记载,一部分将从描述中变得明显,或者可通过实践示例性实施例来获知。
发明的有益效果
如上所述,根据示例性实施例,示例性实施例提供了向用户指引更有效且迅速的语音识别方法的指引信息,从而用户能够更有效地且迅速地控制显示装置。
附图说明
从接下来结合附图的实施例的描述中,本公开的这些和/或其他方面和效用将变得清楚且更容易理解,附图中:
图1是根据示例性实施例的语音识别系统的视图;
图2是根据示例性实施例的显示装置的框图;
图3是根据示例性实施例的语音输入部的框图;
图4至图7是根据各种示例性实施例的示出指引信息的视图;
图8是根据示例性实施例的交互式服务器的框图;
图9是根据示例性实施例的说明控制显示装置的方法的流程图;
图10是根据示例性实施例的说明控制语音识别系统的显示装置的方法的序列图;并且
图11是根据另一示例性实施例的语音识别系统的视图。
具体实施方式
现将详细参照示例性实施例,实施例的示例在附图中图示出,附图中同样的参考标记始终指代同样的元素。下面通过参考附图来描述示范性实施例以便说明本公开。
图1是根据示例性实施例的语音识别系统的视图。如图1中所述,语音识别系统10包括显示装置100和交互式服务器200。显示装置可以被实现为智能TV,但这仅仅是示例。显示装置可以被实现为各种电子设备,诸如智能电话、桌面PC、平板型PC、膝上型PC和导航设备。
显示装置100可以识别用户的语音,并且可以基于对用户的语音的识别来执行显示装置100的功能。具体地,显示装置100可以通过使用嵌入式方案和交互式方案、根据用户的语音来执行显示装置100的功能。
具体地,显示装置100识别用户的语音,并将用于执行显示装置100的功能的命令匹配到控制信息并且存储它们。例如,显示装置100可以将命令“增加音量”匹配到控制信息“将音频音量等级增加到预定等级”,并且可以存储它们。
响应于被输入到显示装置100的用户的语音,显示装置100可以将用户的语音发送到外部交互式服务器200,并且可以同时确定该用户的语音是否为显示装置100中的预存命令。
交互式服务器200可以基于数据库来搜索与从显示装置100接收到的用户的语音相对应的控制信息。例如,响应于所接收的用户的语音为“请增加音量”,交互式服务器200可以基于关键词“音量”和“增加”来搜索控制信息“将从显示装置100输出的音频的音量等级增加到预定等级(如等级3)”。
交互式服务器200可以在搜索与用户的语音相对应的控制信息的时候,确定是否存在能够执行与控制信息相同功能的、在显示装置中的预存命令。响应于存在能够执行与控制信息相同功能的、在显示装置中的预存命令,交互式服务器200可以生成指引显示装置100中的预存命令的第一指引信息并且将第一指引信息和控制信息一起发送给显示装置100。例如,交互式服务器200可以搜索能够执行与所接收的用户的语音“请增加音量”相同功能的、显示装置中的预存命令,并且可以生成向用户指引所搜索的命令“增加音量”的第一指引信息。交互式服务器200可以发送第一指引信息和控制信息以将显示装置100的音频音量等级增加到预定等级。显示装置100通过第一指引信息诱导用户说出显示装置100中的预存命令,从而显示装置100可以更即时地响应用户的语音。
响应于用户的语音不是显示装置100中的预存命令,显示装置100可以基于从交互式服务器200发送的控制信息来执行显示装置100的功能。例如,响应于预存的命令为“增加音量”但用户说的是“请增加音量”,显示装置100可以基于从交互式服务器200发送的控制信息来执行将从显示装置100输出的音频的音量等级增加到预定等级的功能。显示装置100可以显示从交互式服务器200发送的第一指引信息。
响应于用户的语音为在显示装置100中的预存命令,显示装置100可以搜索与预存的命令相对应的控制信息,而不管从交互式服务器200发送的控制信息。显示装置100可以基于该控制信息来执行显示装置100的功能。例如,响应于陈述了“增加音量”的用户的语音(其为显示装置100中的预存命令)被输入,显示装置100搜索对应于该预存的命令的控制信息,并且可以基于所搜索的控制信息来执行将显示装置100的音频等级增加到预定等级的功能。
具体地,响应于用户的语音为显示装置100中的预存命令,但它是用于执行具有多个层次结构的显示装置的功能的命令,显示装置100可以显示指引能够执行与用户的语音相同的功能的交互式命令的第二指引信息。这是为了更简单地通过单个交互式命令来控制显示装置的功能,因为响应于基于预存的命令而执行的、具有多个层次结构的显示装置的功能,需要输入用户的语音若干次。
如上,交互式服务器向用户提供了指引更有效且迅速的语音识别方法的指引信息,从而用户能够更有效地且迅速地控制显示装置100。
在以上实施例中,已说明了无论用户的语音是否为预存的命令,用户的语音都被发送到交互式服务器200。然而,这仅仅是一个示例,并且用户的语音可以只响应于用户的语音不是预存的命令而被发送到交互式服务器200。
在下文中,将参照图2至图7来更详细地说明显示装置100。图2是根据示例性实施例的显示装置100的框图。显示装置100包括语音输入单元110、通信器120、存储装置130、显示器140和控制器150。
图2是通过建议其中显示装置100包括诸如语音识别功能、通信功能和显示功能的各种功能的示例的显示装置100的各种构成元件的总体视图。因此,依赖于示例性实施例,图2中的构成元件中的一些可以被省略或改变,或者其他构成元件可以被添加,如本领域普通技术人员将理解的那样。
语音输入部110接收包括用户的语音的音频信号、处理该音频信号并生成用户的语音信号。语音输入部110可以被形成在显示装置100的主体中,但这仅仅是一个示例。语音输入部110可以被形成在主体的外部(如遥控器或单独的麦克风)。响应于被提供在主体的外部的语音输入部110,语音输入部单元110可以经由无线/有线接口(如WiFi、
Figure GDA0003618177010000091
等)将所生成的用户的语音信号发送到显示装置100的主体。
将参照图3来说明语音输入部110如何接收包括用户的语音的音频信号并生成用户的语音信号。图3是根据示例性实施例的语音输入部的框图。如图3中所述,语音输入部110包括麦克风111、模拟-数字转换器(ADC)112、能量测定仪113、噪声去除器114以及语音信号生成器115。
麦克风111接收包括用户的语音的模拟音频信号。
ADC 112将从麦克风输入的多通道模拟信号转换成数字信号。
能量测定仪113计算所转换的数字信号的能量,并且确定该数字信号的能量是否大于或等于预定值。响应于数字信号的能量大于或等于预定值,能量测定仪113将输入的数字信号发送到噪声去除器114,并且响应于数字信号的能量小于预定值,能量测定仪113不向外部输出所输入的数字信号,而是等待其他输入。因此,由于全部音频处理不会由不是语音信号的声音来激活,因此可以防止不必要的电力消耗。
响应于数字信号被输入到噪声去除器114,噪声去除器114从包括噪声分量和用户的语音分量的数字信号中去除噪声分量。噪声分量是不可预知的噪声,其可能是例如在家庭环境下产生的,并可能是空调的声音,吸尘器的声音或音乐的声音。噪声去除器114将去除了噪声分量的数字信号输出到语音信号生成器115。
语音信号生成器115使用定位/说话人(speaker)跟踪模块基于语音输入部110来追踪360°范围之内的用户说话位置,并且获得用户的语音的方向信息。语音信号生成器115可以通过目标说话声音提取模块、通过使用去除了噪声的数字信号以及用户的语音的方向信息、基于语音输入单元110来提出360°范围之内的目标声音源,并可以生成语言信号。
如以上所说明的,这仅仅是通过去除不必要的周边噪声来生成语言信号的示例性实施例。本公开的技术理念还可以被应用于通过确定关键词是否出现在用户的语音中来生成语音信号的示例性实施例。
返回参照图2,通信器120执行与交互式服务器200的通信。具体地,通信器120向交互式服务器200发送从语音输入部110生成的用户的语音信号,并且可以接收来自交互式服务器200的控制信息和指引信息中的至少一个。通信器120可以被实现为以太网、无线LAN和WIFI,但这不应被认为是限制性的。
存储装置130在其中存储各种驱动显示装置100的程序和数据。具体地,存储装置130可以包括语音识别数据库,其中命令被匹配到控制信息并且被存储。
显示器130在控制器150的控制下显示图像数据。具体地,显示器130可以显示预存的指引信息和从交互式服务器200接收到的指引信息中的一个。
控制器150根据用户的命令来控制显示装置100的全部操作。具体地,控制器150可以根据经由语音输入部110输入的用户的语音来控制显示装置100的全部操作。
具体地,控制器150确定经由语音输入部110输入的用户的语音是否为存储装置130中的预存命令。同时,控制器150可以经由通信器120将用户的语音发送到交互式服务器200。例如,响应于用户的语音“请增加音量”被经由音频输入110输入,控制器150确定输入的语音“请增加音量”是否为预存的命令。控制器150可以控制通信器120发送“请增加音量”到外部的交互式服务器200。
具体地,响应于用户的语音不是存储装置中的预存命令并且当从交互式服务器200发送与用户的语音相对应的控制信息以及用于指引能够执行与用户的语音相同的功能的预存的命令的第一指引信息时,控制器150根据所发送的控制信息来执行显示装置100的功能,并且可以控制显示器120显示第一指引信息。例如,响应于用户的语音为“请增加音量”并且当从交互式服务器200接收到控制信息“将音频音量等级增加到预定等级”和用于指引能够执行与“请增加音量”相同的功能的、预存在存储装置130中的命令“增加音量”的第一指引信息时,控制器150可以执行将音频音量等级增加到预定等级的功能,并且可以控制显示器120显示包括文本信息“下次,请说增加音量”的第一指引信息410,如图4中所述。
然而,响应于用户的语音为在存储装置130中的预存命令,控制器150搜索存储装置130中对应于该命令的控制信息,并且可以根据所搜索的控制信息来执行显示装置的功能。例如,响应于经由语音输入部110输入的用户的语音为“增加音量”,控制器150搜索与所输入的用户的语音“增加音量”相对应的控制信息“将音频音量等级增加到预定等级”,并且可以根据所搜索的控制信息来执行将音频音量等级增加到预定等级的功能。即使控制信息是从外部的交互式服务器200接收到的,控制器150也可以优先根据嵌入的命令来执行显示装置100的功能。
此外,响应于经由语音输入部110输入的用户的语音为存储在存储装置130中的命令,并且用户的语音为用于控制具有多个层次结构的显示装置的功能的命令,控制器150可以控制显示器120以显示指引能够执行与用户的语音相同的功能的交互式命令的第二指引信息。例如,响应于第一步的用户的语音“设置睡眠”被从用户输入以便使用预存的命令来设置显示装置100的睡眠功能,控制器150显示用于设置睡眠的菜单,并且响应于第二步的用户的语音“30分钟”被从用户输入,控制器150可以执行在30分钟之后关闭控制器150的电源的功能。换言之,响应于使用预存的命令来执行具有多个层次结构的显示装置的功能,用户会有输入语音多次的不便。然而,响应于以交互式形式输入的用户的语音“30分钟之后叫醒我”,控制器150可以使用交互式服务器200来执行与多个用户的语音的输入相同的功能。即,响应于具有多个层次结构的显示装置的功能被执行,控制器150可以控制显示器120显示指引如图5中所描绘的交互式命令的第二指引信息510,从而显示装置100的功能可以通过单个用户的语音来执行。
此外,响应于经由语音输入部110输入的用户的语音不是存储在交互式服务器200中的对话模式,并且当从交互式服务器200接收到第三指引信息(该第三指引信息指引执行与用户的语音相同的功能的根据存储在交互式服务器200中的对话模式的用户的语音)时,控制器150可以控制显示器120以便显示第三指引信息。例如,响应于用户的语音“改变频道”被输入,并且当从交互式服务器200发送了指引用户的语音“请将频道改变为ABC”的第三指引信息(该第三指引信息为具有存储在交互式服务器200中的对话模式的命令)时,控制器150可以控制显示器120显示第三指引信息610,如图6中所述。
或者,响应于经由语音输入部110输入的用户的语音为交互式服务器200不能响应的交互式语言,并且当从交互式服务器200发送了指引与用户的语音中包括的关键词相关的信息的第四指引信息时,控制器150可以控制显示器120显示第四指引信息。例如,响应于用户的语音“刘在石怎么样”被经由语音输入部110输入,交互式服务器200不能经由所输入的用户的语音生成响应信息,因此交互式服务器200可提取关键词“刘在石”,生成指引与所提取的关键词相关的信息(例如,他的工作和他的作品)的第四指引信息,并将该第四指引信息发送到显示装置100。响应于从交互式服务器200发送了第四指引信息,控制器150可以控制显示器120显示如图7中的第四指引信息710。作为另一示例,响应于用户的语音“我们去一家美味的餐馆吧”被经由语音输入部110输入,交互式服务器200不能通过所输入的用户的语音生成响应信息,因此交互式服务器200可提取关键词“美味的餐馆”,生成用于指引与所提取的关键词相关的信息(例如,今日推荐餐厅)的第四指引信息,并将该第四指引信息发送到显示装置100。
第四指引信息710可以包括要求输入新的用户的语音的消息以及与关键词相关的信息。
由于如以上所说明的显示装置100,用户能够基于语音识别更有效地且迅速地控制显示装置100。
图8是根据示例性实施例的交互式服务器200的框图。如图8中所述,交互式服务器200包括通信器210、数据库220和控制器230。
通信器210执行与显示装置100的通信。具体地,通信器210从显示装置100接收用户的语音信号,并且可以发送控制信息和指引信息中的至少一个到显示装置100。通信器210可以根据诸如以太网、无线LAN和WIFI的通信方案来执行与显示装置100的通信。
数据库220存储各种数据以使用交互式语音或搜索内容来控制显示装置100的功能。具体地,数据库220可以存储诸如用户的语音的历史信息和EPG信息的信息。此外,数据库220可以将用户的语音匹配到控制信息并存储它们。
此外,数据库220可以存储与显示装置100中预存的命令类似的命令,从而交互式服务器200能够提供第一指引信息,如表1中那样。
表1
[表1]
Figure GDA0003618177010000121
Figure GDA0003618177010000131
控制器230控制交互式服务器200的全部操作。
具体地,响应于从显示装置100接收到用户的语音,控制器230搜索与用户的语音相对应的控制信息。具体地,控制器230将用户的语音转换成文本信息,并且可以对用户的语音的说话要素(speaking element)分类。控制器230基于说话要素确定用户的语音是用于控制显示装置100的功能的还是用于搜索内容的。响应于用户的语音被用于控制显示装置100的功能,控制器230可以基于数据库220来搜索与用户的语音相对应的控制信息。
控制器230在搜索与用户的语音相对应的控制信息时,确定是否存在能够执行与控制信息相同的功能的、显示装置100中的预存命令。响应于存在能够执行与控制信息相同的功能的、在显示装置中的预存命令,控制器230可以生成指引预存的命令的第一指引信息,并且可以控制通信器210将该第一指引信息和控制信息一起发送给显示装置100。例如,响应于用户的语音为“使音量升高”,控制器230可以搜索能够执行与“使音量升高”相同的功能的、显示装置100中的预存命令,并且可以生成指引执行与“使音量升高”相同的功能的、预存在装置100中的命令“增加音量”的第一指引信息。
此外,响应于从显示装置100发送的用户的语音不是存储在交互式服务器200中的对话模式,控制器230可以控制通信器210生成第三指引信息并发送该信息到显示装置,其中该第三指引信息根据执行与用户的语音相同的功能的、存储在交互式服务器200中的对话模式来指引用户的语音。例如,响应于用户的语音“改变频道”被输入,控制器230确定用户的语音不是存储在数据库220中的模式。控制器230可以生成指引用户的语音“请将频道改变为ABC”的第三指引信息,从而诱导用户依据存储在数据库220中的对话模式来说话。
响应于从显示装置100发送的用户的语音为交互式服务器200不能响应的交互式语音,控制器230可以从交互式的用户的语音中提取关键词,生成指引与关键词相关的信息的第四指引信息并控制通信器210将该信息发送到显示装置100。
例如,响应于从显示装置100发送了用户的语音“刘在石怎么样”,控制器230不能经由所输入的用户的语音生成响应信息,因此控制器230可以从用户的语音中提取关键词“刘在石”,生成用于指引与所提取的关键词相关的信息(例如,他的工作和他的作品)的第四指引信息,并且将该第四指引信息发送到显示装置100。作为另一示例,响应于从显示装置100发送用户的语音“我们去一家餐馆吧”,控制器230不能经由所输入的用户的语音生成响应信息,因此控制器230可以从用户的语音中提取关键词“餐馆”,生成指引与所提取的关键词相关的信息(例如,今日推荐餐厅)的第四指引信息以及将该第四指引信息发送到显示装置100。
如以上所说明的,交互式服务器200提供了各种类型的指引信息,从而用户能够更有效地且迅速地使用语音识别来控制显示装置100的功能。
图9是根据示例性实施例的说明控制显示装置100的方法的流程图。
显示装置接收用户的语音(S910)。用户的语音可以是控制显示装置100的功能的命令,诸如音量控制、频道控制和电力控制。
显示装置100发送用户的语音到交互式服务器200(S920)。
显示装置100确定用户的语音是否为预存的命令(S930)。S920和S930可以同时执行。
响应于用户的语音为预存的命令(S930-是),显示装置100根据预存的命令来执行显示装置100的功能(S940)。
响应于用户的语音不是预存的命令(S930-否),显示装置100从交互式服务器200接收控制信息和第一指引信息(S950)。第一指引信息可以指引执行与用户的语音相同的功能的、显示装置100中的预存命令。
显示装置100根据所接收的控制信息来执行显示装置的功能并显示第一指引信息(S960)。
响应于显示装置100的功能被根据预存的命令来执行,显示装置100确定该功能是否为具有多个层次结构的显示装置100的功能(S970)。
响应于该功能为具有多个层次结构的显示装置100的功能(S970-是),显示装置100显示第二指引信息(S980)。第二指引信息可以指引执行与用户的语音相同的功能的交互式命令并可以使用交互式服务器200。
图10是根据示例性实施例的说明控制语音识别系统的显示装置的方法的序列图。
显示装置100接收用户的语音(S1010)。
显示装置100发送用户的语音到交互式服务器(S1020)。显示装置100确定用户的语音是否为预存的命令(S1030)。
交互式服务器200生成与用户的语音相对应的控制信息和指引信息(S1040)。具体地,交互式服务器200可以通过分析用户的语音的说话要素来生成与用户的语音相对应的控制信息,并且可以根据用户的语音的类型来生成各种种类的指引信息。例如,响应于用户的语音不是显示装置100中的预存命令,交互式服务器200可以生成指引能够执行与用户的语音相同的功能的、显示装置中的预存命令的第一指引信息。或者,响应于用户的语音不是交互式服务器200中存储的模式,交互式服务器200可以生成第三指引信息,所述第三指引信息指引执行与用户的语音相同的功能并遵循交互式服务器中存储的对话模式的用户的语音。响应于用户的语音为交互式服务器200不能响应的交互式语音,交互式服务器200可以从用户的语音中提取关键词,并可以生成与该关键词相关的第四指引信息。
交互式服务器200发送控制信息和指引信息到显示装置100(S1050)。
显示装置100根据用户的语音来执行显示装置的功能并显示指引信息(S1060)。具体地,显示装置100可以使用依赖于用户的语音是否为预存的命令而不同的控制信息来执行显示装置100的功能。响应于用户的语音为预存的命令,显示装置100可以搜索与预存的命令相对应的控制信息,并可以根据所搜索的控制信息来执行显示装置100的功能。然而,响应于用户的语音不是预存的命令,显示装置100可以根据从交互式服务器200发送的控制信息来执行显示装置100的功能。此外,显示装置100可以显示如图4至图7中所说明的指引信息410、510、610、710,从而用户能够更有效地且迅速地执行语音识别。
如上所记载地,本公开提供了提供有效的语音识别的指引信息,从而用户能够更有效地且迅速地执行显示装置的功能。
在以上示例性实施例中,已经说明了交互式服务器200被实现为单个服务器。然而,这仅仅是示例性实施例,并且交互式服务器可以被实现为多个服务器。例如,交互式服务器200可以包含将用户语音转换成文本信息的第一交互式服务器200-1;以及基于所述文本信息生成控制信息和第一指引信息的第二交互式服务器200-2,如图11中所述。显示装置100可以发送用户的语音到第一交互式服务器200-1,并且可以发送从第一交互式服务器200-1发送的文本信息到第二交互式服务器200-2。第二交互式服务器200-2可以基于所发送的文本信息来生成控制信息和指引信息中的至少一个,如图8中所说明的。
用于执行根据各种实施例的控制方法的程序代码可以被存储在非暂态计算机可读存储介质中。非暂态计算机可读介质是指半持久性地存储数据的介质,而不是诸如寄存器、缓存或存储器那样的很短时间地存储数据的介质,并且非暂态计算机可读介质可被装置读取。具体而言,上述各种应用或程序可以被存储在非暂态计算机可读介质中,诸如光盘(CD)、数字多功能盘(DVD)、硬盘、
Figure GDA0003618177010000161
通用串行总线(USB)存储棒、存储卡,和只读存储器(ROM),并且各种应用或程序可以被提供。
显示UI的前述方法可实现为包括可在计算机中执行的算法的程序,并且该程序可通过存储在非暂态计算机可读存储介质中来提供。
虽然已示出并描述了本公开的几个实施例,但本领域技术人员将会明白,在不脱离本发明的原理和精神的情况下,可在这些示范性实施例中作出改变,本发明的范围在所附权利要求及其等同物中定义。

Claims (16)

1.一种显示装置,包括:
通信器,被配置为与外部服务器通信;
显示器;以及
控制器,被配置为:
通过外部语音输入部接收用户的语音,
控制所述通信器将关于所述用户的语音的信息发送到外部服务器,
基于所发送的信息与预存在所述外部服务器中的控制命令相对应,从所述外部服务器接收与所发送的信息相对应的控制命令并根据所述控制命令执行显示装置的功能,以及
基于所发送的信息不与预存在所述外部服务器中的任何控制命令相对应,从所述外部服务器接收关于所述用户的语音中包括的关键词的信息和指引用户输入与所述关键词相关联的新的用户的语音的信息,并控制所述显示器显示关于所述关键词的信息和指引用户输入与所述关键词相关联的新的用户的语音的信息。
2.如权利要求1所述的装置,其中,所述控制器基于所发送的信息与预存在所述外部服务器中的控制命令相对应,接收指引与所发送的信息相对应的控制命令的信息并控制所述显示器显示指引所述控制命令的信息。
3.如权利要求1所述的装置,还包括:
存储装置,
其中,所述控制器,
基于与所述用户的语音相对应的控制命令被存储在所述存储装置中,基于存储在所述存储装置中的控制命令来控制所述显示装置,并且
基于与所述用户的语音相对应的控制命令未被存储在所述存储装置中,控制所述通信器将关于用户的语音的信息发送到外部服务器。
4.如权利要求1所述的装置,其中,关于所述关键词的信息包括用于导出用户的语音的输入的消息,所述用户的语音的输入请求与所述关键词有关的附加信息。
5.如权利要求1所述的装置,其中,关于所述关键词的信息包括关于所述关键词的详细信息。
6.一种显示装置的显示方法,所述方法包括:
接收用户的语音;
向外部服务器发送所述用户的语音;
基于所发送的信息与预存在所述外部服务器中的控制命令相对应,从所述外部服务器接收与所发送的信息相对应的控制命令并根据所述控制命令执行显示装置的功能;以及
基于所发送的信息不与预存在所述外部服务器中的任何控制命令相对应,从所述外部服务器接收关于所述用户的语音中包括的关键词的信息和指引用户输入与所述关键词相关联的新的用户的语音的信息,并显示关于所述关键词的信息和指引用户输入与所述关键词相关联的新的用户的语音的信息。
7.如权利要求6所述的方法,所述方法还包括:
基于所发送的信息与预存在所述外部服务器中的控制命令相对应,接收指引与所发送的信息相对应的控制命令的信息并且控制显示器显示指引所述控制命令的信息。
8.如权利要求6所述的方法,还包括:
基于与所述用户的语音相对应的控制命令被存储在所述显示装置的存储装置中,基于存储在所述存储装置中的控制命令来控制所述显示装置,并且
基于与所述用户的语音相对应的控制命令未被存储在所述存储装置中,将关于用户的语音的信息发送到外部服务器。
9.如权利要求6所述的方法,其中,关于所述关键词的信息包括用于导出用户的语音的输入的消息,所述用户的语音的输入请求与所述关键词有关的附加信息。
10.如权利要求6所述的方法,其中,关于所述关键词的信息包括关于所述关键词的详细信息。
11.一种服务器,包括:
通信器;
存储器;以及
处理器,被配置为:
从显示装置接收关于用户的语音的信息,
确定所接收的信息是否与预存在服务器中的控制命令相对应,
基于所接收的信息与预存在服务器中的控制命令相对应,控制所述通信器将与所接收的信息相对应的控制命令发送到所述显示装置,以及
基于所接收的信息不与预存在服务器中的控制命令相对应,控制所述通信器将关于包括在所述用户的语音中的关键词的信息和指引用户输入与所述关键词相关联的新的用户的语音的信息发送到所述显示装置。
12.如权利要求11所述的服务器,其中,所述处理器基于所接收的信息与预存在服务器中的控制命令相对应,控制所述通信器将指引与所接收的信息相对应的控制命令的信息发送到所述显示装置。
13.如权利要求11所述的服务器,其中,所述处理器基于所接收的信息不与预存在服务器中的控制命令相对应,从所述用户的语音获得关键词以及获取与所获得的关键词有关的信息并使用所述与所获得的关键词有关的信息生成关于所述关键词的信息。
14.一种服务器的控制方法,包括:
从显示装置接收关于用户的语音的信息;
确定所接收的信息是否与预存在服务器中的控制命令相对应;以及
基于所接收的信息与预存在服务器中的控制命令相对应,将与所接收的信息相对应的控制命令发送到所述显示装置;以及
基于所接收的信息不与预存在服务器中的控制命令相对应,将关于包括在所述用户的语音中的关键词的信息和指引用户输入与所述关键词相关联的新的用户的语音的信息发送到所述显示装置。
15.如权利要求14所述的方法,其中,所述发送包括,基于所接收的信息与预存在服务器中的控制命令相对应,将指引与所接收的信息相对应的控制命令的信息发送到所述显示装置。
16.如权利要求14所述的方法,包括:
基于所接收的信息不与预存在服务器中的控制命令相对应,从所述用户的语音获得关键词;以及
获取与所获得的关键词有关的信息并使用所述与所获得的关键词有关的信息生成关于所述关键词的信息。
CN201811168329.3A 2013-01-07 2014-01-07 显示装置和在语音识别系统中控制显示装置的方法 Active CN109508167B (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
KR1020130001807A KR20140089863A (ko) 2013-01-07 2013-01-07 디스플레이 장치, 및 이의 제어 방법, 그리고 음성 인식 시스템의 디스플레이 장치 제어 방법
KR10-2013-0001807 2013-01-07
CN201480012854.XA CN105027574B (zh) 2013-01-07 2014-01-07 在语音识别系统中控制显示装置的显示装置和方法
PCT/KR2014/000119 WO2014107076A1 (en) 2013-01-07 2014-01-07 Display apparatus and method of controlling a display apparatus in a voice recognition system

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201480012854.XA Division CN105027574B (zh) 2013-01-07 2014-01-07 在语音识别系统中控制显示装置的显示装置和方法

Publications (2)

Publication Number Publication Date
CN109508167A CN109508167A (zh) 2019-03-22
CN109508167B true CN109508167B (zh) 2022-08-19

Family

ID=51060576

Family Applications (3)

Application Number Title Priority Date Filing Date
CN201811168338.2A Active CN109343819B (zh) 2013-01-07 2014-01-07 在语音识别系统中控制显示装置的显示装置和方法
CN201480012854.XA Active CN105027574B (zh) 2013-01-07 2014-01-07 在语音识别系统中控制显示装置的显示装置和方法
CN201811168329.3A Active CN109508167B (zh) 2013-01-07 2014-01-07 显示装置和在语音识别系统中控制显示装置的方法

Family Applications Before (2)

Application Number Title Priority Date Filing Date
CN201811168338.2A Active CN109343819B (zh) 2013-01-07 2014-01-07 在语音识别系统中控制显示装置的显示装置和方法
CN201480012854.XA Active CN105027574B (zh) 2013-01-07 2014-01-07 在语音识别系统中控制显示装置的显示装置和方法

Country Status (6)

Country Link
US (1) US9880808B2 (zh)
EP (2) EP2941895B1 (zh)
KR (1) KR20140089863A (zh)
CN (3) CN109343819B (zh)
MX (1) MX353738B (zh)
WO (1) WO2014107076A1 (zh)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11481087B2 (en) * 2014-03-27 2022-10-25 Sony Corporation Electronic device and method for identifying input commands of a user
KR102261552B1 (ko) 2014-06-30 2021-06-07 삼성전자주식회사 음성 명령어 제공 방법 및 이를 지원하는 전자 장치
KR102298767B1 (ko) * 2014-11-17 2021-09-06 삼성전자주식회사 음성 인식 시스템, 서버, 디스플레이 장치 및 그 제어 방법
CN105912296A (zh) * 2016-04-08 2016-08-31 宇龙计算机通信科技(深圳)有限公司 语音控制方法及系统
KR20180028703A (ko) * 2016-09-09 2018-03-19 삼성전자주식회사 디스플레이 장치 및 이를 이용한 원격 제어 장치 설정 방법
JP6908461B2 (ja) * 2016-11-02 2021-07-28 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 情報処理方法及びプログラム
CN108010523B (zh) * 2016-11-02 2023-05-09 松下电器(美国)知识产权公司 信息处理方法以及记录介质
KR102519165B1 (ko) * 2016-11-24 2023-04-07 삼성전자주식회사 원격 제어 장치, 디스플레이 장치 및 그들의 제어 방법
TWI656523B (zh) * 2016-12-16 2019-04-11 群邁通訊股份有限公司 語音控制裝置、系統及控制方法
US10574825B2 (en) * 2017-02-15 2020-02-25 Microsoft Technology Licensing, Llc Assisted-communication with intelligent personal assistant
CN107155121B (zh) * 2017-04-26 2020-01-10 海信集团有限公司 语音控制文本的显示方法及装置
CN107122160A (zh) * 2017-04-26 2017-09-01 海信集团有限公司 用于语音输入控制指令的显示方法、装置和终端
KR102380717B1 (ko) * 2017-04-30 2022-03-31 삼성전자주식회사 사용자 발화를 처리하는 전자 장치 및 이 전자 장치의 제어 방법
KR102392087B1 (ko) * 2017-07-10 2022-04-29 삼성전자주식회사 원격 조정 장치 및 원격 조정 장치의 사용자 음성 수신방법
CN107277630B (zh) * 2017-07-20 2019-07-09 海信集团有限公司 语音提示信息的显示方法及装置
JP2019066702A (ja) * 2017-10-02 2019-04-25 東芝映像ソリューション株式会社 対話型電子装置制御システム、対話型電子装置、対話型電子装置制御方法
CN107919120B (zh) 2017-11-16 2020-03-13 百度在线网络技术(北京)有限公司 语音交互方法及装置,终端,服务器及可读存储介质
KR102519635B1 (ko) * 2018-01-05 2023-04-10 삼성전자주식회사 음성 명령을 처리하기 위한 전자 문서 표시 방법 및 그 전자 장치
KR102540001B1 (ko) * 2018-01-29 2023-06-05 삼성전자주식회사 디스플레이 장치 및 디스플레이 장치의 화면 표시방법
KR102458336B1 (ko) 2018-05-18 2022-10-25 삼성전자주식회사 공기 조화 장치 및 이의 제어 방법
CN109218843B (zh) * 2018-09-27 2020-10-23 四川长虹电器股份有限公司 基于电视设备的个性化智能语音提示方法
CN109920413A (zh) * 2018-12-28 2019-06-21 广州索答信息科技有限公司 一种厨房场景触屏语音对话的实现方法及存储介质
CN110134235B (zh) * 2019-04-25 2022-04-12 广州智伴人工智能科技有限公司 一种引导式互动的方法
CN112102820A (zh) * 2019-06-18 2020-12-18 北京京东尚科信息技术有限公司 交互方法、交互装置、电子设备和介质
CN112312181A (zh) * 2019-07-26 2021-02-02 深圳Tcl新技术有限公司 一种智能电视语音识别方法、系统及可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1261178A (zh) * 1999-01-18 2000-07-26 汤姆森多媒体公司 具有语音手动用户接口的设备和辅助学习语音指令的方法
CN102063901A (zh) * 2010-12-02 2011-05-18 深圳市凯立德欣软件技术有限公司 位置服务设备的语音识别方法及位置服务设备
CN102316162A (zh) * 2011-09-01 2012-01-11 深圳市子栋科技有限公司 基于语音命令的车辆远程控制方法、装置及系统
CN102737632A (zh) * 2011-04-14 2012-10-17 现代自动车株式会社 用于处理语音命令的设备和方法

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9619165D0 (en) * 1996-09-13 1996-10-23 British Telecomm Training apparatus and method
KR100305320B1 (ko) * 1998-10-30 2001-11-22 전주범 음성다중텔레비전에서의음성제어방법
US6937984B1 (en) 1998-12-17 2005-08-30 International Business Machines Corporation Speech command input recognition system for interactive computer display with speech controlled display of recognized commands
US7206747B1 (en) * 1998-12-16 2007-04-17 International Business Machines Corporation Speech command input recognition system for interactive computer display with means for concurrent and modeless distinguishing between speech commands and speech queries for locating commands
EP1181684B1 (en) * 1999-03-26 2004-11-03 Scansoft, Inc. Client-server speech recognition
JP3997459B2 (ja) 2001-10-02 2007-10-24 株式会社日立製作所 音声入力システムおよび音声ポータルサーバおよび音声入力端末
DE60222852D1 (de) * 2001-12-18 2007-11-22 Matsushita Electric Ind Co Ltd Fernsehapparat mit Spracherkennungsfunktion
US6898567B2 (en) 2001-12-29 2005-05-24 Motorola, Inc. Method and apparatus for multi-level distributed speech recognition
KR100540326B1 (ko) * 2003-02-14 2006-01-10 에스케이 텔레콤주식회사 네비게이션 서비스 제공 시스템 및 방법
KR100567828B1 (ko) 2003-08-06 2006-04-05 삼성전자주식회사 향상된 음성인식 장치 및 방법
CN101090413A (zh) * 2006-06-14 2007-12-19 华为技术有限公司 一种电话呼叫的方法和系统
JP5127201B2 (ja) 2006-11-08 2013-01-23 キヤノン株式会社 情報処理装置及び方法並びにプログラム
JP2009109586A (ja) * 2007-10-26 2009-05-21 Panasonic Electric Works Co Ltd 音声認識制御装置
US20090271200A1 (en) * 2008-04-23 2009-10-29 Volkswagen Group Of America, Inc. Speech recognition assembly for acoustically controlling a function of a motor vehicle
US7933777B2 (en) * 2008-08-29 2011-04-26 Multimodal Technologies, Inc. Hybrid speech recognition
KR20120020853A (ko) * 2010-08-31 2012-03-08 엘지전자 주식회사 이동 단말기 및 그 제어방법
KR101828273B1 (ko) 2011-01-04 2018-02-14 삼성전자주식회사 결합기반의 음성명령 인식 장치 및 그 방법
CN102724310B (zh) * 2012-06-18 2016-06-08 深圳市Tcl云创科技有限公司 一种通过移动终端实现云搜索的方法
CN106937984A (zh) * 2015-12-30 2017-07-11 于秀珍 一种治疗滴虫性阴道炎的中药配方

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1261178A (zh) * 1999-01-18 2000-07-26 汤姆森多媒体公司 具有语音手动用户接口的设备和辅助学习语音指令的方法
CN102063901A (zh) * 2010-12-02 2011-05-18 深圳市凯立德欣软件技术有限公司 位置服务设备的语音识别方法及位置服务设备
CN102737632A (zh) * 2011-04-14 2012-10-17 现代自动车株式会社 用于处理语音命令的设备和方法
CN102316162A (zh) * 2011-09-01 2012-01-11 深圳市子栋科技有限公司 基于语音命令的车辆远程控制方法、装置及系统

Also Published As

Publication number Publication date
EP2941895A1 (en) 2015-11-11
US20140191949A1 (en) 2014-07-10
CN105027574B (zh) 2018-11-02
WO2014107076A1 (en) 2014-07-10
CN105027574A (zh) 2015-11-04
EP3588966A2 (en) 2020-01-01
CN109343819A (zh) 2019-02-15
MX2015008747A (es) 2015-11-06
EP2941895A4 (en) 2016-08-17
KR20140089863A (ko) 2014-07-16
EP3588966A3 (en) 2020-03-18
MX353738B (es) 2018-01-26
CN109343819B (zh) 2022-06-10
EP2941895B1 (en) 2019-08-14
US9880808B2 (en) 2018-01-30
CN109508167A (zh) 2019-03-22

Similar Documents

Publication Publication Date Title
CN109508167B (zh) 显示装置和在语音识别系统中控制显示装置的方法
KR102429436B1 (ko) 사용자의 입력 입력에 기초하여 타겟 디바이스를 결정하고, 타겟 디바이스를 제어하는 서버 및 그 동작 방법
CN106796496B (zh) 显示设备及其操作方法
US9721572B2 (en) Device control method and electric device
EP3734596B1 (en) Determining target device based on speech input of user and controlling target device
KR102215579B1 (ko) 대화형 시스템, 디스플레이 장치 및 그 제어 방법
US20140006022A1 (en) Display apparatus, method for controlling display apparatus, and interactive system
KR102392087B1 (ko) 원격 조정 장치 및 원격 조정 장치의 사용자 음성 수신방법
US9230559B2 (en) Server and method of controlling the same
JP6244560B2 (ja) 音声認識処理装置、音声認識処理方法、および表示装置
US20150127353A1 (en) Electronic apparatus and method for controlling electronic apparatus thereof
JP2014132465A (ja) ディスプレイ装置及びその制御方法
KR20140089861A (ko) 디스플레이 장치 및 그의 제어 방법
JPWO2015098109A1 (ja) 音声認識処理装置、音声認識処理方法、および表示装置
KR20140089836A (ko) 대화형 서버, 디스플레이 장치 및 그 제어 방법
KR102089593B1 (ko) 디스플레이 장치, 및 이의 제어 방법, 그리고 음성 인식 시스템의 디스플레이 장치 제어 방법
KR102124396B1 (ko) 디스플레이 장치, 및 이의 제어 방법, 그리고 음성 인식 시스템의 디스플레이 장치 제어 방법
KR102045539B1 (ko) 디스플레이 장치, 및 이의 제어 방법, 그리고 음성 인식 시스템의 디스플레이 장치 제어 방법
KR102051480B1 (ko) 디스플레이 장치, 및 이의 제어 방법, 그리고 음성 인식 시스템의 디스플레이 장치 제어 방법
KR20200042627A (ko) 전자 장치 및 그 제어 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant