CN103945250A - 图像处理设备、其控制方法、以及图像处理系统 - Google Patents
图像处理设备、其控制方法、以及图像处理系统 Download PDFInfo
- Publication number
- CN103945250A CN103945250A CN201410022968.4A CN201410022968A CN103945250A CN 103945250 A CN103945250 A CN 103945250A CN 201410022968 A CN201410022968 A CN 201410022968A CN 103945250 A CN103945250 A CN 103945250A
- Authority
- CN
- China
- Prior art keywords
- voice command
- speech
- simple sentence
- server
- image processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 110
- 238000012545 processing Methods 0.000 title claims abstract description 76
- 238000004891 communication Methods 0.000 claims abstract description 9
- 230000005236 sound signal Effects 0.000 claims description 15
- 230000002452 interceptive effect Effects 0.000 description 36
- 238000006243 chemical reaction Methods 0.000 description 16
- 230000006870 function Effects 0.000 description 14
- 238000010586 diagram Methods 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 6
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 2
- 241001269238 Data Species 0.000 description 2
- 239000002041 carbon nanotube Substances 0.000 description 2
- 229910021393 carbon nanotube Inorganic materials 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000008054 signal transmission Effects 0.000 description 2
- 230000000712 assembly Effects 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 239000002159 nanocrystal Substances 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/422—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
- H04N21/4227—Providing Remote input by a user located remotely from the client device, e.g. at work
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
- H04N21/4394—Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/422—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
- H04N21/42203—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
- H04N21/4396—Processing of audio elementary streams by muting the audio signal
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/472—End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
- H04N21/4722—End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for requesting additional data associated with the content
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/485—End-user interface for client configuration
- H04N21/4852—End-user interface for client configuration for modifying audio parameters, e.g. switching between mono and stereo
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/488—Data services, e.g. news ticker
- H04N21/4882—Data services, e.g. news ticker for displaying messages, e.g. warnings, reminders
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/485—End-user interface for client configuration
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- User Interface Of Digital Computer (AREA)
- Facsimiles In General (AREA)
- Telephonic Communication Services (AREA)
- Details Of Television Systems (AREA)
- General Health & Medical Sciences (AREA)
- Quality & Reliability (AREA)
Abstract
一种图像处理设备、其控制方法、以及图像处理系统,图像处理设备包括:图像处理器;音频输入;存储器,存储至少一个简单句子语音命令和与该简单句子语音命令相应的操作;通信装置,与服务器通信,服务器分析描述性句子语音命令,并确定与该描述性句子语音命令相应的操作;音频处理器,如果与言语相应的第一语音命令是简单句子语音命令,则处理第一语音命令,并进行与简单句子语音命令相应的操作,如果第一语音命令不是简单句子语音命令,则将第一语音命令发送到通信装置;控制器,如果服务器确定的关于第一语音命令的相应操作与存储在存储器中的至少一个简单句子语音命令之一相同,则显示推荐存储在存储器中的简单句子语音命令的第一向导图像。
Description
技术领域
与示例性实施例一致的设备和方法涉及一种对图像信号(包括从外部源接收的广播信号)进行处理以显示图像的图像处理设备、该图像处理设备的控制方法、以及图像处理系统,更具体地讲,涉及一种感知用户的言语并执行与该言语相应的功能或操作的图像处理设备、该图像处理设备的控制方法、以及图像处理系统。
背景技术
图像处理设备根据各种类型的图像处理过程对从外部源接收的图像信号或图像数据进行处理。图像处理设备可在它自己的显示面板上基于所处理的图像信号显示图像,或者将所处理的图像信号输出到包括面板的显示设备以基于图像信号显示图像。也就是说,图像处理设备可包括对图像信号进行处理的任何装置,而不管它是否包括用于显示图像的面板。具有显示面板的图像处理设备的示例是电视(TV),而不具有显示面板的图像处理设备的示例是机顶盒。
随着各种附加的扩展功能随技术发展而被连续地添加到图像处理设备,将用户的期望命令输入到图像处理设备的多种多样的构造和方法被相应地提出。在现有技术中,当用户按下遥控器上的按键或按钮时,遥控器将控制信号发送到图像处理设备,以使得用户的期望操作被执行。目前,提出了基于用户的期望对图像处理设备进行控制的各种构造。例如,图像处理设备检测用户的运动或语音,并对所检测的数据进行分析以执行相关操作。
发明内容
前述和/或其他方面可通过提供一种图像处理设备来实现,该图像处理设备包括:图像处理器,被构造为对图像信号进行处理以显示图像;音频输入,被构造为输入用户的言语;存储器,被构造为存储至少一个简单句子语音命令和与该简单句子语音命令相应的操作;通信装置,被构造为与服务器通信,其中,服务器对描述性句子语音命令进行分析,并确定与该描述句子语音命令相应的操作;音频处理器,被构造为:如果与所述言语相应的第一语音命令是存储在存储器中的简单句子语音命令,则对第一语音命令进行处理以进行存储在存储器中的与所述简单句子语音命令相应的操作,并且如果第一语音命令不是存储在存储器中的简单句子语音命令,则将第一语音命令发送到通信装置;以及控制器,被构造为:如果服务器所确定的相应操作是存储在存储器中的相应操作,则显示推荐存储在存储器中的与相应操作相应的简单句子语音命令的向导图像。
根据示例性实施例,存储器可存储简单句子语音命令和相应操作的列表,并且音频处理器可检索关于第一语音命令是否在该列表中的信息,如果没有从该列表检索到第一语音命令,则将第一语音命令发送到通信装置。
根据示例性实施例的另一方面,控制器可根据从服务器基于第一语音命令发送的控制命令来确定与第一语音命令相应的操作。
根据示例性实施例的另一方面,当第一语音命令是简单句子语音命令时,当言语被输入到音频输入时的时刻到当相应操作被执行时的时刻的时间可比当第一语音命令不是简单句子语音命令时的所述时间更短。
根据示例性实施例,在预设的相应操作设置为当分别与多个言语相应的多个语音命令被顺序地输入时执行或者当预设的第二语音命令被输入时执行的状态下,当所述多个语音命令被顺序地输入时,控制器可显示推荐第二语音命令的向导图像。
根据示例性实施例的另一方面,当言语被输入到音频输入时,通信装置可与用于将言语转换为文本的语音命令的言语到文本(STT)服务器通信,并且控制器可将该言语的音频信号发送到STT服务器,并从STT服务器接收与该言语相应的语音命令。
根据示例性实施例的一方面,图像处理设备还可包括:显示器,将由图像处理器处理的图像信号显示为图像。
根据示例性实施例的另一方面,提供一种图像处理设备的控制方法,该方法包括:输入用户的言语;当与该言语相应的第一语音命令是存储在图像处理器中的简单句子语音命令时,执行存储在图像处理设备中的与该简单句子语音命令相应的操作;并且如果与该言语相应的第一语音命令不是存储在图像处理器中的简单句子语音命令,则将第一语音命令发送到服务器,其中,服务器对描述性句子语音命令进行分析,并确定与该描述句子语音命令相应的操作,如果服务器所确定的相应操作是存储在图像处理设备中的相应操作,则显示推荐与该相应操作相应的简单句子语音命令的向导图像。
根据示例性实施例的另一方面,图像处理设备可存储简单句子语音命令和相应操作的列表,并且将第一语音命令发送到服务器的步骤包括:如果没有从该列表检索到第一语音命令,则发送第一语音命令。
根据示例性实施例的一方面,显示推荐与相应操作相应的简单句子语音命令的向导图像的步骤可包括根据从服务器基于第一语音命令发送的控制命令来确定与第一语音命令相应的操作。
根据示例性实施例的一方面,当第一语音命令是简单句子语音命令时,从当言语被输入到音频输入时的时刻到当相应操作被执行时的时刻的时间可比当第一语音命令不是简单句子语音命令时的所述时间更短。
根据示例性实施例的一方面,显示推荐与相应操作相应的简单句子语音命令的向导图像的步骤可包括:在预设的相应操作被设置为当分别与多个言语相应的多个语音命令被顺序地输入时或者当预设的第二语音命令被输入时执行的状态下,当所述多个语音命令被顺序地输入时,显示推荐第二语音命令的向导图像。
输入用户的言语的步骤可包括:将该言语的音频信号发送到言语到文本(STT)服务器以将该言语转换为文本的语音命令,并从STT服务器接收与该言语相应的语音命令。
根据示例性实施例的另一方面,提供一种图像处理系统,该图像处理系统包括:图像处理设备,被构造为对图像信号进行处理以显示图像;以及服务器,被构造为与图像处理设备通信,其中,图像处理设备包括:音频输入,被构造为输入用户的言语;存储器,被构造为存储至少一个简单句子语音命令和与该简单句子语音命令相应的操作;通信装置,被构造为与服务器通信,其中,服务器对描述性句子语音命令进行分析,并确定与该描述性句子语音命令相应的操作;音频处理器,被构造为如果与所述言语相应的第一语音命令是存储在存储器中的简单句子语音命令,则对第一语音命令进行处理以进行存储在存储器中的与该简单句子语音命令相应的操作,并且被构造为如果第一语音命令不是存储在存储器中的简单句子语音命令,则将第一语音命令发送到通信装置;以及控制器,被构造为如果服务器所确定的相应操作是存储在存储器中的相应操作,则显示推荐存储在存储器中的与相应操作相应的简单句子语音命令的向导图像。
根据示例性实施例的另一方面,提供一种图像处理设备,该图像处理设备包括:显示器;音频输入,被构造为输入用户的言语;以及控制器,被构造为如果与所述言语相应的语音命令是简单句子的第一语音命令和描述性句子的第二语音命令中的任何一个,则执行预设的第一操作,其中,如果语音命令是第二语音命令,则控制器在显示器上显示推荐第一语音命令的向导图像。
附图说明
从以下结合附图对示例性实施例进行的描述,以上和/其他方面将变得明白并且更易于理解,其中:
图1是示出根据第一示例性实施例的图像处理设备的构造的框图。
图2是示出图1的显示设备与服务器之间的交互的框图。
图3示出存储在图1的显示设备中的与语音命令相应的操作的列表。
图4是示出图1的显示设备的控制方法的流程图。
图5示出图1的显示设备和交互服务器的控制过程。
图6示出显示在图1的显示设备上的向导图像。
图7示出根据第二示例性实施例的显示在显示设备上的向导图像。
图8是示出根据第三示例性实施例的显示设备和服务器的构造的框图。
图9是示出根据第四示例性实施例的显示设备的音频处理器的信号传输结构的框图。
具体实施方式
以下,将参照附图详细描述示例性实施例,以便被本领域的普通技术人员容易地认识。示例性实施例可以以各种形式实施,而不限于在此所阐述的示例性实施例。为了清晰和简洁,省去公知部分的描述,并且相似的标号始终指示相似的元件。
图1是示出根据第一示例性实施例的图像处理设备100的构造的框图。
尽管将用自主地显示图像的显示设备100示出本示例性实施例,但是不限于以下描述,本示例性实施例还可应用于不自主地显示图像,而是将图像信号或控制信号输出到单独的显示设备的图像处理设备。在本示例性实施例中,图像处理设备100被构造为TV,但是由于相同的原因,也可采用各种修改和改变。
如图1所示,根据本示例性实施例的图像处理设备100或显示设备100从图像源(未显示)接收图像信号。显示设备100可接收不限于特定类型或特定特性的任何图像信号。例如,显示设备100可接收从广播站的发射机(未显示)发射的广播信号,并对该广播信号进行调谐以显示广播图像。
显示设备100包括:图像接收器110,从图像源(未显示)接收图像信号;图像处理器120,根据预设的图像处理过程对图像接收器110接收的图像信号进行处理;显示器130,基于由图像处理器120处理的图像信号显示图像;通信装置140,与外部装置(诸如服务器10)通信;用户输入150,被用户操纵;音频输入160,从外部源输入语音或声音;音频处理器170,对输入到音频输入160的语音或声音进行解释和处理;存储器180,存储数据或信息;以及控制器190,控制显示设备100的整体操作。
图像接收器110通过电缆或无线地接收图像信号或图像数据,并将该图像信号或图像数据发送到图像处理器120。图像接收器110可被构造为与图像信号的标准和显示设备100的构造相应的各种类型。例如,图像接收器110可根据复合视频、分量视频、超视频、SCART、高清晰度多媒体接口(HDMI)、DisplayPort,、统一显示接口(UDI)或无线HD标准,接收射频(RF)信号或各种图像信号。当图像信号是广播信号时,图像接收器110包括通过每个信道对广播信号进行调谐的调谐器。
图像处理器120对图像接收器110接收的图像信号执行各种图像处理过程。图像处理器120将所处理的图像信号输出到显示面板130,以使得基于图像信号的图像显示在显示面板130上。例如,当图像接收器110将广播信号调谐到特定信道时,图像处理器120从广播信号提取与该信道相应的图像、音频和可选数据,将该数据调整到预设分辨率,并在显示器130上显示该数据。
图像处理器120可执行任何类型的图像处理,例如,与图像数据的图像格式相应的解码、将交织的图像数据转换为逐行格式的去交织、将图像数据调整为预设分辨率的缩放、改进图像质量的降噪、细节增强、帧刷新速率转换等。
图像处理器120可被提供为集成多功能组件(诸如片上系统(SOC)),或者可被提供为通过将独立地进行单个处理的单独组件安装在印刷电路板上而形成的并且被嵌入在显示设备100中的图像处理器板(未显示)。
显示器130基于从图像处理器120输出的图像信号显示图像。显示器130可被构造为使用液晶、等离子体、发光二极管、有机发光二极管、表面传导电子发射器、纳米碳管、纳米晶体等的各种显示模式,但不限于此。
根据显示器130的显示模式,显示器130还可包括附加的组件。例如,当处于使用液晶的显示模式时,显示器130包括液晶显示面板(未显示)、将光提供给显示面板的背光单元(未显示)以及驱动面板的面板驱动板(未显示)。
通信装置140执行数据发送或接收,以使得显示设备100与服务器10进行双向通信。通信装置140通过电缆或者通过广域网(WAN)或局域网(LAN)无线地或者在基于服务器10的通信协议的本地连接模式下与服务器10连接。
用户输入150通过用户的操纵和输入将各种预设的控制命令或信息发送到控制器190。用户输入150可被提供为菜单按键或安装在显示设备100外部的输入面板,或者可被提供为与显示设备100分离的遥控器。可替换地,用户输入150可被构造为具有显示器130的单体。当显示器130是触摸屏时,用户可通过触摸显示在显示器130上的输入菜单(未显示)来将预设命令发送到控制器190。
音频输入160可被构造为麦克风,并且检测在显示设备100的外部环境下产生的各种声音。由音频输入160检测到的声音包括用户的言语和除了用户之外的各种因素产生的声音。
音频处理器170执行显示设备100所进行的各种预设处理之中的对于输入到音频输入160的语音或声音的处理。这里,由音频处理器170处理的术语“语音”是指输入到音频输入160的任何声音。当图像处理器120对图像信号进行处理时,图像信号可包括由图像处理器120处理的音频数据。
当语音或声音被输入到音频输入160时,音频处理器170确定该语音或声音是用户的言语、还是由不同因素生成的声音。这样的确定可以根据各种方法进行,没有特别限制。例如,音频处理器170可确定输入的语音或声音是否对应于与人的语音相应的波长或频带,或者是否对应于预先指定的用户的语音配置文件。
当输入的语音或声音是用户的言语时,音频处理器170基于与该言语相应的语音命令来执行进行预设的相应操作的过程。这里,语音命令意指言语的内容,将详细描述言语的内容。
本示例性实施例示出音频处理器170和图像处理器120是单独的组件。然而,这样的组件是为了方便而在功能上划分的,以便阐明本示例性实施例,图像处理器120和音频处理器170在显示设备100中可以不必分离。也就是说,显示设备100可包括将图像处理器120和音频处理器170集成的信号处理器(未显示)。
存储器180存储根据控制器190的控制的无限制的数据。存储器180被构造为非易失性存储器,诸如闪存和硬盘驱动器,但不限于此。存储器180被控制器190、图像处理器120或音频处理器170访问,并且存储在存储器180中的数据可被读取、记录、修订、删除或更新。
当用户的言语通过音频输入160输入时,控制器190控制音频处理器170对输入的言语进行处理。这里,当言语被输入时,控制器190确定与该言语相应的语音命令是简单句子,还是描述性句子,并基于确定结果控制音频处理器170或服务器10对该语音命令进行处理。详细地讲,当语音命令是简单句子时,控制器190控制音频处理器170对该语音命令进行处理。当语音命令是描述性句子时,控制器190通过通信装置140将该语音命令发送到服务器10,以使得服务器10对该语音命令进行处理。
图2是示出显示设备100与服务器20和30之间的交互的框图。
如图2所示,显示设备100包括通信装置140、音频输入160、音频处理器170和控制器190。以上已参照图1示出了这样的构造。这里,通信装置140与将用户的言语转换为语音命令的言语到文本(STT)服务器20连接,交互服务器30对该语音命令进行分析,并确定与该语音命令相应的操作。
当音频信号被接收到时,STT服务器20对该音频信号的波形进行分析,并将该音频信号的内容产生为文本。当从显示设备10接收到用户的言语的音频时,STT服务器20将该音频信号转换为语音命令。
交互服务器30包括显示设备100的与语音命令相应的各种操作的数据库。交互服务器30对从显示设备100接收的语音命令进行分析,并基于分析结果将用于进行与该语音命令相应的操作的控制信号发送到显示设备100。
当用户的言语被输入到音频输入160时,控制器160将该言语的音频信号发送到STT服务器20,并从STT服务器20接收与该言语相应的语音命令。
控制器190将从STT服务器20接收的语音命令发送到音频处理器170,以使得音频处理器170对该语音命令进行处理。
音频处理器170包括可在显示设备100中执行的与多个语音命令相应的各种操作或功能的列表或数据库,该列表或数据被存储在图1的存储器180中。音频处理器170用所发送的语音命令搜索该列表以确定相应的操作/或功能。当从该列表检索到相应操作时,音频处理器170对将进行的操作进行处理。稍后将详细描述该列表。
该列表的语音命令包括简短的简单句子。如果输入的语音命令不是简单句子,而是描述性句子,则从该列表检索不到该语音命令,因此,音频处理器170可能无法确定相应的操作。
当语音命令是描述性句子时,也就是说,当没有从列表检索到语音命令以使得音频处理器170可能无法对该语音命令进行处理时,控制器190将该语音命令发送到交互服务器30。交互服务器30对从显示设备100接收的语音命令进行分析以确定显示设备100的与该语音命令相应的操作或功能。交互服务器30将指导所确定的操作的控制信号发送到显示设备100,以使得显示设备100根据该控制信号进行操作。
因此,显示设备100的与用户的言语相应的预设操作被执行。
选择基于语音命令是简单句子还是描述性句子对语音命令进行处理的主题的过程可取决于显示设备100的系统负荷和吞吐量。因为描述性句子是自然语言,所以机械地从描述性句子的语音命令提取用户所期望的相应操作相对困难。因此,因为可能难以以显示设备100的有限资源,基于描述性句子对语音命令进行分析,所以描述性句子的语音命令由交互服务器30处理以应对言语的各种内容。
然而,在设计时可各式各样地改变和修改这样的构造,因此,显示设备100可自主地执行STT服务器20或交互服务器30的至少一个处理。例如,显示设备100可代替服务器20和30自主地将用户的言语转换为语音命令或者对描述性句子的语音命令进行分析。
通过这种构造,控制器190控制用于确定与将被音频处理器170或交互服务器30处理的、和用户的言语相应的语音命令相关的操作的处理。以下示例性实施例示出控制器190控制音频处理器170确定显示设备100的与简单句子的语音命令相应的操作。
图3示出存储在显示设备100中的与语音命令相应的操作的列表210。
如图3所示,存储器180存储显示设备100的与和用户的言语相应的语音命令相关的各种功能或操作的列表210。这里,术语“操作”意指显示设备执行并支持的任何类型的过程或功能。
音频处理器170基于特定语音命令搜索列表210以确定与该语音命令相应的操作。
本示例性实施例的列表210根据任何一种示例性原理或方法来构造,因此,不限制本示例性实施例的范围。此外,图3的列表210示出单个命令与单个操作相应,这是为了便于简要地描述本示例性实施例而提供的。在列表210上,多个命令实际上可与单个操作相应。此外,为了便于区分命令和操作,使用列表210的数字。
例如,如果与用户的言语相应的语音命令是“开启”,则音频处理器170使用语音命令“开启”来搜索列表210,从而验证与语音命令“开启”相应的操作是“开启系统”。
这里,音频处理器170可考虑显示设备100的当前状态来选择性地执行操作。如果显示设备100当前被启动,则音频处理器170不执行操作“开启系统”。相反,如果显示设备100当前被关闭,则音频处理器170执行启动系统的操作。
可替换地,如果在显示设备100当前正在显示图像时用户说“安静”,则音频处理器170可确定与语音命令“安静”相应的操作是列表210上的“静音”。然后,音频处理器170将当前显示的图像的音量调低到0,以使得静音操作被执行。
此外,如果在显示设备100当前正在显示图像时用户说“我听不到它”,则音频处理器170确认与语音命令“我听不到它”相应的操作是列表210上的“将音量调高五个级别”。然后,音频处理器170将当前显示的图像的音量调高五个级别。
这样,音频处理器170可控制与用户的言语相应的操作被执行。
这里,列表210中的语音命令可用包括简单字词的简单句子来构造。通过将更多信息添加到列表210,列表210可以既包括简单句子,又包括各种描述性句子。然而,随着列表210的信息量增加,显示设备100的系统负荷也增加,它花费更多的时间搜索列表210。此外,对于个人用户使用的显示设备100而言,将显示设备100的列表210构造为包括基于具有各种语言习惯的不同用户的语音命令不是有效的。
因此,当音频处理器170难以对语音命令进行处理时,控制器190进行控制以使得该语音命令首先由音频处理器170处理或者其次由交互服务器30处理。
如果语音命令是简单句子,则仅由音频处理器170对该语音命令进行处理。然而,如果语音命令是描述性句子或以不同语言发出的命令,则音频处理器170和交互服务器30都对该语音命令进行处理。
例如,如果与用户的言语相应的语音命令是“音量低”,则控制器190将该语音命令发送到音频处理器170,以使得音频处理器170执行与该语音命令相应的操作。然而,如果列表210不包括语音命令“音量低”,则音频处理器170可能无法确定与该语音命令“音量低”相应的操作。在这种情况下,控制器190将语音命令发送到交互服务器30,以使得交互服务器30可对与该语音命令相应的操作进行分析。
当作为分析的结果,交互服务器30确定操作是“音量+5”时,交互服务器30将进行该操作的控制命令发送到显示设备100。控制器190根据从交互服务器30接收的控制命令来执行将图像的音量调高5个级别的操作。
如果与用户的言语相应的语音命令是“我听不到它”,则因为该语音命令包括在列表210中,所以音频处理器170立即确定列表210上的操作“音量+5”,而不将该语音命令发送到交互服务器30。
因此,关于从当用户的言语被输入时的时刻到当相应操作被执行时的时刻的时间,对描述性句子的语音命令进行处理所花费的时间比对简单句子的语音命令进行处理所花费的时间更长,这可能对于当使用显示设备100时希望快速地执行操作的用户造成不便。
因此,本示例性实施例提出了以下方法。
如果与输入到音频输入160的言语相应的第一语音命令是描述性句子,则控制器190执行由交互服务器30确定的与第一语音命令相应的第一操作,并显示推荐与第一操作相应的简单句子的第二语音命令的向导图像。这里,第二语音命令可被确定为与列表210上的第一操作相应的语音命令。也就是说,如果由交互服务器30确定的与描述性句子的语音命令相应的操作是存储在存储器180中的操作,则控制器190显示推荐与该操作相应的简单句子的语音命令的向导图像。
尽管通过第一语音命令或第二语音命令执行第一操作,但是被显示设备100自主地处理的第二语音命令执行第一操作所花费的时间可比必须被交互服务器30处理的第一语音命令更短。向导图像向用户显示执行与第一语音命令相同的操作的第二语音命令,从而诱导用户下次讲出第二语音命令,而不是第一语音命令。
图4是示出根据本示例性实施例的显示设备100的控制方法的流程图。这里,执行显示设备100的预设的第一操作的语音命令包括简单句子的第一语音命令和描述性句子的第二语音命令。
如图4所示,当用户的言语被接收到(操作S100)时,显示设备100确定与所接收的言语相应的语音命令是简单句子的第一语音命令,还是描述性句子的第二语音命令(操作S110)。
当所接收的言语是简单句子的第一语音命令时,显示设备100根据预设的简单句子处理过程来执行与第一语音命令相应的第一操作(操作S120)。
当所接收的言语是描述性句子的第二语音命令时,显示设备100根据预设的描述性句子处理过程来执行与第二语音命令相应的第一操作(操作S130)。此外,显示设备100显示向用户推荐使用简单句子的第一语音命令来代替使用第二语音命令来执行相同的第一操作的向导图像(S140)。
该方法可引导并诱导用户使用简单句子的语音命令,简单句子的语音命令执行操作所涉及的时间比描述性句子的语音命令更短。
这里,可使用各种简单句子处理过程和描述性句子处理过程。例如,简单句子处理过程是涉及仅由音频处理器170对语音命令进行处理的过程,而描述性句子处理过程是涉及由交互服务器30对语音命令进行分析的过程。
图5示出根据本示例性实施例的显示设备100和交互服务器30的控制过程。
如图5所示,显示设备100接收用户的言语(操作310)。显示设备100将与所接收的用户的言语相应的音频信号发送到STT服务器20(操作320)。
STT服务器20将从显示设备100发送的音频信号转换为文本的语音命令,并将所转换的语音命令发送到显示设备100(操作330)。
显示设备100从语音命令和相应操作的列表210检索从STT服务器20接收的语音命令,并确定与该语音命令相应的操作(操作340)。当与语音命令相应的操作被检索到时,显示设备100执行该操作。当与语音命令相应的操作未被检索到时,显示设备100将该语音命令发送到交互服务器30(操作350)。
交互服务器30对语音命令进行分析,并确定与该语音命令相应的操作(操作360)。各种构造和方法可用于对描述性句子的语音命令进行分析,以使得交互服务器30确定相应的操作。交互服务器30将执行所确定的操作的控制命令发送到显示设备(操作370)。
显示设备100根据从交互服务器30接收的控制命令来执行相应的操作(操作380)。显示设备100从列表检索与所执行的操作相应的语音命令(操作390),并显示推荐所检索的语音命令的向导图像(操作400)。
图6示出显示在显示设备100上的向导图像530。
如图6所示,当与语音命令相应的操作被执行时或者在该操作被执行之后,向导图像530可与和该操作相关的图像520一起显示。
例如,考虑与简单句子“音量调高”的语音命令相应的操作被设置为“音量+3”,与描述性句子“请调高声音”的语音命令也相应地执行相同的“音量+3”操作。在这种情况下,简单句子的第一语音命令是“音量调高”,描述性句子的第二语音命令是“请调高声音”,与第一语音命令和第二语音命令相应的操作是“音量+3”。
当在显示设备100正在显示内容图像510时从用户输入了语音命令的言语时,显示设备100确定该语音命令是简单句子还是描述性句子。
如果语音命令是“音量调高”,则显示设备100可自主地检索并确定与该语音命令相应的操作“音量+3”。在这种情况下,显示设备100可执行将内容图像510的音量调高三个级别的操作,并与内容图像510一起显示与该操作相关的图像520。相关图像520可包括例如表示调高音量的视觉标志。
另一方面,如果语音命令是“请调高声音”,则显示设备100难以自主地确定与该语音命令相应的操作,并且在对描述性句子的语音命令的分析中涉及交互服务器30。在这种情况下,显示设备100根据交互服务器30的分析和控制来执行将内容图像510的音量调高三个级别的操作,并与内容图像510一起显示与该操作相关的图像520。此外,显示设备100将向用户通知简单句子“音量调高”的语音命令是执行操作“音量+3”的向导图像530与内容图像510一起显示。
用户通过向导图像530认识到语音命令“音量调高”可与“请调高声音”转换。因此,下次为了执行操作“音量+3”,用户发出“音量调高”,而不是“请调高声音”,从而相对节省执行该操作的时间。
可替换地,与前述示例性实施例不同,当多个语音命令被顺序地输入时,可执行特定操作。
图7示出根据第二示例性实施例的显示在显示设备100上的向导图像550。
如图7所示,与语音命令“睡眠定时器”相应的操作“关闭系统”涉及确定何时关闭系统。当语音命令“睡眠定时器”和“一小时”被顺序地输入时,显示设备100在从当前时间起的一小时后执行关闭操作。
此外,当语音命令“睡眠定时器一小时”一次被输入到显示设备100时,可执行相同的操作。也就是说,当语音命令“睡眠定时器”和“一小时”被顺序地输入时,以及当语音命令“睡眠定时器一小时”被一次输入时,都可执行在从当前时间起的一小时后关闭显示设备100的操作。
如果用户顺序地输入分别与语音命令“睡眠定时器”和“一小时”相应的命令,则显示设备100根据这些语音命令执行在一小时后关闭显示设备100的操作,并显示与该操作相关的图像540。
此外,显示设备100显示推荐预设的语音命令“睡眠定时器一小时”以便简单地执行该操作的向导图像550。
用户看见向导图像550,下次可相应地输入与语音命令“睡眠定时器一小时”相应的命令,而不是顺序地输入分别与语音命令“睡眠定时器”和“一小时”相应的命令。因此,显示设备100可以以简单的方式、更少的时间执行相应的操作。
在前述示例性实施例中,输入到显示设备100的用户的言语被STT服务器30转换为语音命令。此外,简单句子处理过程是语音命令被显示设备100的音频处理器170自主地处理的过程,描述性句子处理过程是语音命令被交互服务器30处理并且处理结果被发送到显示设备100的过程。
然而,这些示例性实施例不限于所示的示例,而是用于将用户的言语转换为语音命令的构造和用于基于语音命令是简单句子还是描述性句子来对语音命令进行处理的代理可具有与前述示例性实施例中的那些结构不同的结构。
图8是示出根据第三示例性实施例的显示设备100a和服务器40的构造的框图。
如图8所示,显示设备100a包括通信装置140a、音频输入160a、音频处理器170a和控制器190a。
这里,音频处理器170a包括STT转换装置171a和简单句子命令处理器172a,其中,STT转换装置171a将从音频输入160a发送的言语转换为语音命令,简单句子命令处理器172a对简单句子的语音命令进行处理。
当从用户输入言语时,音频输入160a将所输入的言语的音频信号发送到STT转换装置171a。STT转换装置171a对从音频输入160a发送的音频信号进行分析,并将该音频信号转换为包括该言语的内容的语音命令。STT转换装置171a根据控制器190a的控制将所转换的语音命令发送到简单句子命令处理器172a。也就是说,STT转换装置171a可执行与第一示例性实施例的STT服务器20的功能相同的功能。
简单句子命令处理器172a像第一示例性实施例的音频处理器170那样确定与语音命令相应的操作。简单句子命令处理器172a根据控制器190a的控制对语音命令进行分析,并根据分析结果执行相应的操作。以与如上所述的方式相同的方式分析并执行语音命令,因此将省略它们的详细描述。
如果语音命令是描述句子,则简单句子命令处理器172a可能无法对该语音命令进行处理。在这种情况下,控制器190a通过通信装置140a将语音命令发送到交互服务器40。交互服务器40可执行与第一示例性实施例的交互服务器30的功能相同的功能。
因此,显示设备100a执行与从交互服务器40接收的控制信号相应的操作。
图9是示出根据第四示例性实施例的显示设备100b的音频处理器171b的信号传输结构的框图。
如图9所示,音频处理器170b包括STT转换装置171b、简单句子命令处理器172b和描述性句子命令处理器173b,其中,STT转换装置171b将从音频输入160b发送的用户的言语转换为语音命令,如果语音命令是简单句子,则简单句子命令处理器172b对由STT转换装置171b转换的语音命令进行处理,如果命令是描述性句子或自然语言命令,则描述性句子命令处理器173b对由STT转换装置171b转换的语音命令进行处理。音频处理器170b不限于前述构造,前述构造仅仅是为了简要地显示与本示例性实施例直接相关联的信息而提供的。
当从用户输入言语时,音频输入160b将输入的言语的音频信号发送到STT转换装置171b。STT转换装置171b将从音频输入160b发送的言语转换为包括该言语的内容的语音命令。STT转换装置171b首先将所转换的语音命令发送到简单句子命令处理器172b。
简单句子命令处理器172b像第一示例性实施例的音频处理器170那样确定与语音命令相应的操作。简单句子命令处理器172b根据控制器190b的控制对语音命令进行分析,并根据分析结果执行相应的操作。
如果语音命令是描述性句子,则简单句子命令处理器172b可能无法对该语音命令进行处理。在这种情况下,控制器190b将语音命令发送到描述性句子命令处理器173b。
简单句子命令处理器172b可执行与图8的简单句子命令处理器172b基本上相同的功能。此外,描述性句子命令处理器173b执行前述示例性实施例中交互服务器30和40所进行的功能。
也就是说,与在前述示例性实施例中不同,根据本示例性实施例的显示设备100b自主地基于用户的言语转换语音命令,并且在不与外部服务器20、30和40执行数据/信号的发送和接收的情况下自主地对与该语音命令相应的操作进行分析。
即时在这种情况下,语音命令也首先被简单句子命令处理器172b处理。此外,如果简单句子命令处理器172b不能对语音命令进行处理,则随后该语音命令被描述性句子命令处理器173b处理。因此,第一示例性实施例的构思也可应用于本示例性实施例。
尽管已显示并描述了几个示例性实施例,但是本领域的技术人员将意识到,可以在不脱离本申请的原理和精神的情况下在这些示例性实施例中进行改变,本申请的范围在所附权利要求及其等同物中限定。
Claims (13)
1.一种图像处理设备,包括:
图像处理器,被构造为对图像信号进行处理并显示所处理的图像;
音频输入,被构造为输入用户的言语;
存储器,被构造为存储至少一个简单句子语音命令和与所述简单句子语音命令相应的操作;
通信装置,被构造为与服务器通信,其中,服务器对描述性句子语音命令进行分析,并确定与所述描述性句子语音命令相应的操作;
音频处理器,被构造为:如果与用户的言语相应的第一语音命令是存储在存储器中的简单句子语音命令,则对第一语音命令进行处理以进行存储在存储器中的与所述简单句子语音命令相应的操作,并且如果第一语音命令不是存储在存储器中的简单句子语音命令,则将第一语音命令发送到通信装置;和
控制器,被构造为:如果服务器所确定的关于第一语音命令的相应操作与存储在存储器中的所述至少一个简单句子语音命令之一相同,则显示推荐存储在存储器中的简单句子语音命令的第一向导图像。
2.根据权利要求1所述的图像处理设备,其中,存储器被构造为存储简单句子语音命令和与所述简单句子语音命令相应的操作的列表,并且音频处理器被构造为:确定第一语音命令是否在所述列表中,如果第一语音命令不在所述列表中,则将第一语音命令发送到通信装置。
3.根据权利要求2所述的图像处理设备,其中,控制器根据从服务器基于第一语音命令发送的控制命令来确定与第一语音命令相应的操作。
4.根据权利要求1所述的图像处理设备,其中,当第一语音命令是简单句子语音命令时,从当言语被输入到音频输入时的时刻到当相应操作被执行时的时刻的时间比当第一语音命令不是简单句子语音命令时的所述时间更短。
5.根据权利要求1所述的图像处理设备,其中,在预设的相应操作被设置为在分别与多个用户言语相应的多个语音命令被顺序地输入的情况下将被执行或者在预设的第二语音命令被输入的情况下将被执行的状态下,当所述多个语音命令被顺序地输入时,控制器显示推荐第二语音命令的第二向导图像。
6.根据权利要求1所述的图像处理设备,其中,当用户的言语被输入到音频输入时,通信装置与用于将用户的言语转换为文本的语音命令的言语到文本(STT)服务器通信,并且控制器将所述言语的音频信号发送到STT服务器,并从STT服务器接收与所述言语相应的语音命令。
7.根据权利要求1所述的图像处理设备,还包括:显示器,将由图像处理器处理的图像信号显示为图像。
8.一种图像处理设备的控制方法,所述方法包括:
输入用户的言语;
当与用户的言语相应的第一语音命令是存储在图像处理设备中的简单句子语音命令时,执行存储在图像处理设备中的与所述简单句子语音命令相应的操作;和
如果与用户的言语相应的第一语音命令不是存储在图像处理设备中的简单句子语音命令,则将第一语音命令发送到服务器,其中,服务器对描述性句子语音命令进行分析,并确定与所述描述句子语音命令相应的操作,
如果服务器所确定的关于第一语音命令的相应操作与存储在图像处理设备中的至少一个简单句子语音命令之一相同,则显示推荐存储在图像处理设备中的简单句子语音命令的第一向导图像。
9.根据权利要求8所述的控制方法,其中,图像处理设备存储简单句子语音命令和与所述简单句子语音命令相应的操作的列表,并且将第一语音命令发送到服务器的步骤包括:如果没有从所述列表检索到第一语音命令,则发送第一语音命令。
10.根据权利要求9所述的控制方法,其中,显示推荐与相应操作相应的简单句子语音命令的向导图像的步骤包括根据从服务器基于第一语音命令发送的控制命令来确定与第一语音命令相应的操作。
11.根据权利要求8所述的控制方法,其中,当第一语音命令是简单句子语音命令时,从当言语被输入到音频输入时的时刻到当相应操作被执行时的时刻的时间比当第一语音命令不是简单句子语音命令时的所述时间更短。
12.根据权利要求8所述的控制方法,其中,显示推荐与相应操作相应的简单句子语音命令的向导图像的步骤包括:在预设的相应操作被设置为在分别与多个言语相应的多个语音命令被顺序地输入的情况下将被执行或者在预设的第二语音命令被输入的情况下将被执行的状态下,当所述多个语音命令被顺序地输入时,显示推荐第二语音命令的向导图像。
13.根据权利要求8所述的控制方法,其中,输入用户的言语的步骤包括:将所述言语的音频信号发送到言语到文本(STT)服务器以将所述言语转换为文本的语音命令,并从STT服务器接收与所述言语相应的语音命令。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810315292.6A CN108446095B (zh) | 2013-01-17 | 2014-01-17 | 图像处理设备、其控制方法、以及图像处理系统 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2013-0005314 | 2013-01-17 | ||
KR1020130005314A KR102019719B1 (ko) | 2013-01-17 | 2013-01-17 | 영상처리장치 및 그 제어방법, 영상처리 시스템 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810315292.6A Division CN108446095B (zh) | 2013-01-17 | 2014-01-17 | 图像处理设备、其控制方法、以及图像处理系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103945250A true CN103945250A (zh) | 2014-07-23 |
CN103945250B CN103945250B (zh) | 2018-11-02 |
Family
ID=50028754
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810315292.6A Active CN108446095B (zh) | 2013-01-17 | 2014-01-17 | 图像处理设备、其控制方法、以及图像处理系统 |
CN201410022968.4A Active CN103945250B (zh) | 2013-01-17 | 2014-01-17 | 图像处理设备、其控制方法、以及图像处理系统 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810315292.6A Active CN108446095B (zh) | 2013-01-17 | 2014-01-17 | 图像处理设备、其控制方法、以及图像处理系统 |
Country Status (8)
Country | Link |
---|---|
US (1) | US9392326B2 (zh) |
EP (1) | EP2757465B1 (zh) |
JP (2) | JP6505966B2 (zh) |
KR (1) | KR102019719B1 (zh) |
CN (2) | CN108446095B (zh) |
BR (1) | BR112015015395B1 (zh) |
MX (1) | MX343941B (zh) |
WO (1) | WO2014112706A1 (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104766607A (zh) * | 2015-03-05 | 2015-07-08 | 广州视源电子科技股份有限公司 | 一种电视节目推荐方法与系统 |
CN105159148A (zh) * | 2015-07-16 | 2015-12-16 | 深圳前海达闼科技有限公司 | 一种机器人指令处理方法及装置 |
CN109218843A (zh) * | 2018-09-27 | 2019-01-15 | 四川长虹电器股份有限公司 | 基于电视设备的个性化智能语音提示方法 |
CN110177185A (zh) * | 2018-02-19 | 2019-08-27 | 柯尼卡美能达株式会社 | 图像处理装置、图像处理装置的控制方法及记录介质 |
CN111383637A (zh) * | 2018-12-28 | 2020-07-07 | 上海寒武纪信息科技有限公司 | 信号处理装置、信号处理方法及相关产品 |
CN111742557A (zh) * | 2018-01-08 | 2020-10-02 | Lg电子株式会社 | 显示装置和包括该显示装置的系统 |
WO2023087955A1 (en) * | 2021-11-18 | 2023-05-25 | International Business Machines Corporation | Dynamic display accommodations for multiple voice commands |
Families Citing this family (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101460179B1 (ko) | 2012-11-28 | 2014-11-10 | 에스케이씨앤씨 주식회사 | 임시 결제카드 설정 방법 및 이를 적용한 모바일 기기 |
KR102112742B1 (ko) * | 2013-01-22 | 2020-05-19 | 삼성전자주식회사 | 전자장치 및 그 음성 처리 방법 |
KR101517738B1 (ko) * | 2014-05-13 | 2015-05-04 | 박남태 | 음성제어 영상표시 장치 및 영상표시 장치의 음성제어 방법 |
EP2958010A1 (en) * | 2014-06-20 | 2015-12-23 | Thomson Licensing | Apparatus and method for controlling the apparatus by a user |
WO2016032021A1 (ko) * | 2014-08-27 | 2016-03-03 | 삼성전자주식회사 | 음성 명령 인식을 위한 장치 및 방법 |
KR102298767B1 (ko) | 2014-11-17 | 2021-09-06 | 삼성전자주식회사 | 음성 인식 시스템, 서버, 디스플레이 장치 및 그 제어 방법 |
KR101581138B1 (ko) * | 2014-12-05 | 2015-12-30 | 박남태 | 음성제어 영상표시 리듬게임 장치 및 방법 |
US9736317B2 (en) * | 2015-02-27 | 2017-08-15 | Cisco Technology, Inc. | Secure mechanism for mute alert |
CN106488310A (zh) * | 2015-08-31 | 2017-03-08 | 晨星半导体股份有限公司 | 电视节目智慧播放方法与其控制装置 |
KR102420518B1 (ko) | 2015-09-09 | 2022-07-13 | 삼성전자주식회사 | 자연어 처리 시스템, 자연어 처리 장치, 자연어 처리 방법 및 컴퓨터 판독가능 기록매체 |
KR101927438B1 (ko) | 2016-07-14 | 2018-12-10 | 삼성전자주식회사 | 홀 영역을 가지는 전자 장치 및 전자 장치의 홀 영역 제어방법 |
US9967382B2 (en) | 2016-08-19 | 2018-05-08 | Amazon Technologies, Inc. | Enabling voice control of telephone device |
US11327538B2 (en) | 2016-10-27 | 2022-05-10 | Samsung Electronics Co., Ltd. | Electronic apparatus having a hole area within screen and control method thereof |
JP6908461B2 (ja) * | 2016-11-02 | 2021-07-28 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 情報処理方法及びプログラム |
US10178219B1 (en) * | 2017-06-21 | 2019-01-08 | Motorola Solutions, Inc. | Methods and systems for delivering a voice message |
US10194023B1 (en) | 2017-08-31 | 2019-01-29 | Amazon Technologies, Inc. | Voice user interface for wired communications system |
US10326886B1 (en) | 2017-08-31 | 2019-06-18 | Amazon Technologies, Inc. | Enabling additional endpoints to connect to audio mixing device |
US10911596B1 (en) | 2017-08-31 | 2021-02-02 | Amazon Technologies, Inc. | Voice user interface for wired communications system |
CN109584862B (zh) * | 2017-09-29 | 2024-01-12 | 上海寒武纪信息科技有限公司 | 图像处理装置和方法 |
CN109584864B (zh) * | 2017-09-29 | 2023-11-24 | 上海寒武纪信息科技有限公司 | 图像处理装置和方法 |
KR102540001B1 (ko) * | 2018-01-29 | 2023-06-05 | 삼성전자주식회사 | 디스플레이 장치 및 디스플레이 장치의 화면 표시방법 |
US11100146B1 (en) * | 2018-03-23 | 2021-08-24 | Amazon Technologies, Inc. | System management using natural language statements |
US20210398520A1 (en) * | 2018-10-31 | 2021-12-23 | Sony Corporation | Information processing device and program |
US20220284900A1 (en) * | 2019-08-29 | 2022-09-08 | Boe Technology Group Co., Ltd. | Voice Interaction Method, System, Terminal Device and Medium |
US20210065719A1 (en) * | 2019-08-29 | 2021-03-04 | Comcast Cable Communications, Llc | Methods and systems for intelligent content controls |
JP2021071797A (ja) * | 2019-10-29 | 2021-05-06 | 富士通クライアントコンピューティング株式会社 | 表示装置および情報処理装置 |
US11960668B1 (en) | 2022-11-10 | 2024-04-16 | Honeywell International Inc. | Cursor management methods and systems for recovery from incomplete interactions |
US11954325B1 (en) | 2023-04-05 | 2024-04-09 | Honeywell International Inc. | Methods and systems for assigning text entry components to cursors |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1319223A (zh) * | 1998-09-21 | 2001-10-24 | 汤姆森多媒体公司 | 包括遥控受控装置和该装置的音频遥控器的系统 |
US20030154077A1 (en) * | 2002-02-13 | 2003-08-14 | International Business Machines Corporation | Voice command processing system and computer therefor, and voice command processing method |
US20120162540A1 (en) * | 2010-12-22 | 2012-06-28 | Kabushiki Kaisha Toshiba | Apparatus and method for speech recognition, and television equipped with apparatus for speech recognition |
CN102668391A (zh) * | 2009-12-18 | 2012-09-12 | 三星电子株式会社 | 用于控制移动装置的外部输出的方法和系统 |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1013006B (zh) * | 1985-04-01 | 1991-06-26 | 株式会社日立制作所 | 自然语言智能指导的方法与装置 |
US5890122A (en) | 1993-02-08 | 1999-03-30 | Microsoft Corporation | Voice-controlled computer simulateously displaying application menu and list of available commands |
JP2002182896A (ja) * | 2000-12-12 | 2002-06-28 | Canon Inc | 音声認識システム及び音声認識装置ならびにそれらの方法 |
JPH11119792A (ja) * | 1997-10-20 | 1999-04-30 | Toyota Motor Corp | 音声認識機能付き機器制御装置および音声認識装置 |
JP2000075887A (ja) * | 1998-08-31 | 2000-03-14 | Sony Corp | パターン認識装置、方法及びシステム |
JP3919210B2 (ja) * | 2001-02-15 | 2007-05-23 | アルパイン株式会社 | 音声入力案内方法及び装置 |
US20020174177A1 (en) * | 2001-04-25 | 2002-11-21 | Sharon Miesen | Voice activated navigation of a computer network |
US7324947B2 (en) | 2001-10-03 | 2008-01-29 | Promptu Systems Corporation | Global speech user interface |
JP2003295893A (ja) * | 2002-04-01 | 2003-10-15 | Omron Corp | 音声認識システム、装置、音声認識方法、音声認識プログラム及び音声認識プログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP3724461B2 (ja) * | 2002-07-25 | 2005-12-07 | 株式会社デンソー | 音声制御装置 |
JP3728304B2 (ja) * | 2003-07-10 | 2005-12-21 | キヤノン株式会社 | 情報処理方法、情報処理装置、プログラム、及び記憶媒体 |
US8244828B2 (en) | 2003-08-28 | 2012-08-14 | International Business Machines Corporation | Digital guide system |
US8635073B2 (en) | 2005-09-14 | 2014-01-21 | At&T Intellectual Property I, L.P. | Wireless multimodal voice browser for wireline-based IPTV services |
CN101331036B (zh) * | 2005-12-16 | 2011-04-06 | 松下电器产业株式会社 | 移动体用输入装置及方法 |
JP2008268517A (ja) * | 2007-04-19 | 2008-11-06 | Matsushita Electric Works Ltd | 音声認識機能付き操作器 |
CN101188108A (zh) * | 2007-12-17 | 2008-05-28 | 凯立德欣技术(深圳)有限公司 | 一种语音控制方法、装置及移动终端 |
US8958848B2 (en) | 2008-04-08 | 2015-02-17 | Lg Electronics Inc. | Mobile terminal and menu control method thereof |
CN101599270A (zh) * | 2008-06-02 | 2009-12-09 | 海尔集团公司 | 语音服务器及语音控制的方法 |
KR20100007625A (ko) | 2008-07-14 | 2010-01-22 | 엘지전자 주식회사 | 이동 단말기 및 그 메뉴 표시 방법 |
US20110067059A1 (en) | 2009-09-15 | 2011-03-17 | At&T Intellectual Property I, L.P. | Media control |
JP5584603B2 (ja) * | 2010-12-06 | 2014-09-03 | 富士通テン株式会社 | 情報提供システムおよび情報提供装置 |
CN102196207B (zh) * | 2011-05-12 | 2014-06-18 | 深圳市车音网科技有限公司 | 语音控制电视机的方法、装置和系统 |
-
2013
- 2013-01-17 KR KR1020130005314A patent/KR102019719B1/ko active IP Right Grant
- 2013-10-03 US US14/045,438 patent/US9392326B2/en active Active
- 2013-10-11 BR BR112015015395-0A patent/BR112015015395B1/pt active IP Right Grant
- 2013-10-11 WO PCT/KR2013/009100 patent/WO2014112706A1/en active Application Filing
- 2013-10-11 MX MX2015009063A patent/MX343941B/es active IP Right Grant
- 2013-11-08 JP JP2013231945A patent/JP6505966B2/ja active Active
-
2014
- 2014-01-09 EP EP14150579.2A patent/EP2757465B1/en active Active
- 2014-01-17 CN CN201810315292.6A patent/CN108446095B/zh active Active
- 2014-01-17 CN CN201410022968.4A patent/CN103945250B/zh active Active
-
2019
- 2019-03-28 JP JP2019063726A patent/JP6824316B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1319223A (zh) * | 1998-09-21 | 2001-10-24 | 汤姆森多媒体公司 | 包括遥控受控装置和该装置的音频遥控器的系统 |
US20030154077A1 (en) * | 2002-02-13 | 2003-08-14 | International Business Machines Corporation | Voice command processing system and computer therefor, and voice command processing method |
CN102668391A (zh) * | 2009-12-18 | 2012-09-12 | 三星电子株式会社 | 用于控制移动装置的外部输出的方法和系统 |
US20120162540A1 (en) * | 2010-12-22 | 2012-06-28 | Kabushiki Kaisha Toshiba | Apparatus and method for speech recognition, and television equipped with apparatus for speech recognition |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104766607A (zh) * | 2015-03-05 | 2015-07-08 | 广州视源电子科技股份有限公司 | 一种电视节目推荐方法与系统 |
CN105159148A (zh) * | 2015-07-16 | 2015-12-16 | 深圳前海达闼科技有限公司 | 一种机器人指令处理方法及装置 |
CN105159148B (zh) * | 2015-07-16 | 2017-11-10 | 深圳前海达闼科技有限公司 | 一种机器人指令处理方法及装置 |
CN111742557B (zh) * | 2018-01-08 | 2024-01-19 | Lg电子株式会社 | 显示装置和包括显示装置的系统 |
CN111742557A (zh) * | 2018-01-08 | 2020-10-02 | Lg电子株式会社 | 显示装置和包括该显示装置的系统 |
US11704089B2 (en) | 2018-01-08 | 2023-07-18 | Lg Electronics Inc. | Display device and system comprising same |
US10911618B2 (en) | 2018-02-19 | 2021-02-02 | Konica Minolta, Inc. | Image processing device for receiving an operation instruction by a voice, method for controlling image processing device, and program |
CN110177185A (zh) * | 2018-02-19 | 2019-08-27 | 柯尼卡美能达株式会社 | 图像处理装置、图像处理装置的控制方法及记录介质 |
CN109218843A (zh) * | 2018-09-27 | 2019-01-15 | 四川长虹电器股份有限公司 | 基于电视设备的个性化智能语音提示方法 |
CN109218843B (zh) * | 2018-09-27 | 2020-10-23 | 四川长虹电器股份有限公司 | 基于电视设备的个性化智能语音提示方法 |
CN111383637A (zh) * | 2018-12-28 | 2020-07-07 | 上海寒武纪信息科技有限公司 | 信号处理装置、信号处理方法及相关产品 |
WO2023087955A1 (en) * | 2021-11-18 | 2023-05-25 | International Business Machines Corporation | Dynamic display accommodations for multiple voice commands |
US12061841B2 (en) | 2021-11-18 | 2024-08-13 | International Business Machines Corporation | Dynamic display accommodations for multiple voice commands |
Also Published As
Publication number | Publication date |
---|---|
US20140200896A1 (en) | 2014-07-17 |
CN108446095A (zh) | 2018-08-24 |
BR112015015395B1 (pt) | 2022-11-16 |
JP2014138421A (ja) | 2014-07-28 |
WO2014112706A1 (en) | 2014-07-24 |
KR20140096202A (ko) | 2014-08-05 |
EP2757465B1 (en) | 2018-03-07 |
JP6505966B2 (ja) | 2019-04-24 |
KR102019719B1 (ko) | 2019-09-09 |
JP2019153314A (ja) | 2019-09-12 |
US9392326B2 (en) | 2016-07-12 |
EP2757465A3 (en) | 2015-06-24 |
MX2015009063A (es) | 2015-10-05 |
CN103945250B (zh) | 2018-11-02 |
EP2757465A2 (en) | 2014-07-23 |
MX343941B (es) | 2016-11-30 |
JP6824316B2 (ja) | 2021-02-03 |
CN108446095B (zh) | 2021-08-31 |
BR112015015395A2 (pt) | 2018-05-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103945250A (zh) | 图像处理设备、其控制方法、以及图像处理系统 | |
CN203151689U (zh) | 图像处理设备以及图像处理系统 | |
CN105659318B (zh) | 声音识别处理装置、声音识别处理方法以及显示装置 | |
US9928030B2 (en) | Speech retrieval device, speech retrieval method, and display device | |
EP3334172B1 (en) | Display apparatus and method for acquiring channel information of a display apparatus | |
CN109190006B (zh) | 一种基于信息搜索界面的交互方法及装置 | |
US8838456B2 (en) | Image processing apparatus and control method thereof and image processing system | |
CN110402583A (zh) | 图像显示设备及其操作方法 | |
CN111866568B (zh) | 一种显示设备、服务器及基于语音的视频集锦获取方法 | |
CN107211174A (zh) | 显示设备及其信息提供方法 | |
CN114155855A (zh) | 语音识别方法、服务器以及电子设备 | |
CN114501158B (zh) | 显示设备、外接音响设备及外接音响设备音频输出的方法 | |
US20130254808A1 (en) | Electronic apparatus and display control method | |
KR102460927B1 (ko) | 음성인식 시스템, 음성인식 서버 및 디스플레이장치의 제어방법 | |
KR101877430B1 (ko) | 영상처리장치 및 그 제어방법, 영상처리 시스템 | |
CN112929717B (zh) | 一种焦点管理的方法及显示设备 | |
CN111914114A (zh) | 一种badcase挖掘方法及电子设备 | |
AU2018202888B2 (en) | Image processing apparatus, control method thereof, and image processing system | |
KR20210027921A (ko) | 영상표시장치 및 이의 개인화 서비스 제공방법 | |
KR20230024712A (ko) | 발화 의도를 고려하여 검색하는 디스플레이 장치 및 방법 | |
CN111611482A (zh) | 一种实现人物百科查询的服务器、显示设备及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |