CN103714816A - 电子装置、服务器及其控制方法 - Google Patents

电子装置、服务器及其控制方法 Download PDF

Info

Publication number
CN103714816A
CN103714816A CN201210585173.5A CN201210585173A CN103714816A CN 103714816 A CN103714816 A CN 103714816A CN 201210585173 A CN201210585173 A CN 201210585173A CN 103714816 A CN103714816 A CN 103714816A
Authority
CN
China
Prior art keywords
voice recognition
voice
recognition commands
command
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201210585173.5A
Other languages
English (en)
Inventor
金度完
权五允
车泰焕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Priority to CN201910281846.XA priority Critical patent/CN109979465B/zh
Publication of CN103714816A publication Critical patent/CN103714816A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42204User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/14Digital output to display device ; Cooperation and interconnection of the display device with other functional units
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/231Content storage operation, e.g. caching movies for short term storage, replicating data over plural servers, prioritizing data for deletion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/233Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/233Processing of audio elementary streams
    • H04N21/2335Processing of audio elementary streams involving reformatting operations of audio signals, e.g. by converting from one coding standard to another
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42203Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/433Content storage operation, e.g. storage operation in response to a pause request, caching operations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/441Acquiring end-user identification, e.g. using personal code sent by the remote control or by inserting a card
    • H04N21/4415Acquiring end-user identification, e.g. using personal code sent by the remote control or by inserting a card using biometric characteristics of the user, e.g. by voice recognition or fingerprint scanning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/65Transmission of management data between client and server
    • H04N21/654Transmission by server directed to the client
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/65Transmission of management data between client and server
    • H04N21/654Transmission by server directed to the client
    • H04N21/6543Transmission by server directed to the client for forcing some client operations, e.g. recording
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/65Transmission of management data between client and server
    • H04N21/654Transmission by server directed to the client
    • H04N21/6547Transmission by server directed to the client comprising parameters, e.g. for client setup
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/65Transmission of management data between client and server
    • H04N21/658Transmission by the client directed to the server
    • H04N21/6582Data stored in the client, e.g. viewing habits, hardware capabilities, credit card number
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Selective Calling Equipment (AREA)
  • User Interface Of Digital Computer (AREA)
  • Telephonic Communication Services (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明提供了一种电子装置、服务器及其控制方法。所述显示设备包括:处理器,对信号进行处理;显示器,基于处理的信号显示图像;命令接收器,接收语音命令;通信器,与第一服务器通信;存储器;控制器,从第一服务器接收包括语音识别命令以及与语音识别命令相应的控制命令信息的语音识别命令列表并存储在存储器中,所述语音识别命令是用户的语音命令中已经被成功识别了预定次数或更多次数的语音命令,确定语音命令是否相应于包括在语音识别命令列表中的语音识别命令,如果是,则控制处理器基于控制命令信息进行操作,如果不是,则将语音命令发送到第一服务器,从第一服务器接收相应的控制命令信息,并控制处理器基于接收的控制命令信息进行操作。

Description

电子装置、服务器及其控制方法
技术领域
与示例性实施例一致的设备和方法涉及一种电子装置、服务器及其控制方法,更具体地,涉及一种通过使用服务器识别用户的命令并在该命令下进行操作的电子装置、服务器及其控制方法。
背景技术
诸如电视(TV)、机顶盒、数字多功能盘(DVD)播放器、空调、冰箱和计算机的电子装置在用户的命令下进行操作。根据使用遥控器的传统输入方法之外的技术的发展和功能的多样化,由各种类型的命令(诸如,通过麦克风的语音识别)来控制电子装置。在诸如TV的电子装置的情况下,如果用户说“将音量变为20”,则电子装置接收语音信号并通过语音识别技术对语音信号进行解释,从而将音量变为20。
电子装置使用命令识别配置以适当地对用户命令进行解释。然而,电子装置可能会不能准确地对命令进行解释。在这种情况下,可使用通过网络的外部服务器。更具体地,为了识别语音,电子装置将用户的语音命令的内容发送到服务器,该服务器通过使用在服务器中设置的语音识别配置来解释并确定用户的关于所述语音命令的意图。服务器将分析结果发送到电子装置,该电子装置可通过使用分析结果来执行相应的功能。
然而,如果现有技术的电子装置自身不可识别用户的命令,则电子装置与服务器进行通信并从服务器接收分析结果。因此,电子装置与服务器之间的通过网络的通信时间不能用于根据分析结果来执行功能。获得关于用户的命令的分析结果的通信时间取决于网络的状态或通信频率,但是基本上延迟了用于识别用户的命令并执行相应的功能的时间。
发明内容
因此,一个或多个示例性实施例提供了一种最小化用于识别用户的命令并执行操作的时间的电子装置、服务器及其控制方法。
根据示例性实施例的一方面,提供了一种显示设备,包括:处理器,对信号进行处理;显示器,基于处理的信号来显示图像;命令接收器,接收用户的语音命令;通信器,与第一服务器进行通信;存储器;控制器,从第一服务器接收包括语音识别命令以及相应的控制命令信息的语音识别命令列表,并将所述列表存储在存储器中,所述语音识别命令是用户的语音命令中已经被成功识别了预定次数或更多次数的用户的语音命令,响应于接收用户的语音命令,识别语音命令是否相应于包括在语音识别命令列表中的语音识别命令,如果是,则控制处理器基于相应的语音识别命令的控制命令信息进行操作,如果不是,则将语音命令发送到第一服务器,从第一服务器接收相应的控制命令信息,并控制处理器基于接收的控制命令信息进行操作。
所述控制器可基于语音命令与语音识别命令列表中的语音识别命令之间的确定的相关性来确定语音命令是否相应于语音识别命令。
如果在语音命令被发送到第一服务器之后过去了预定时间或更长时间,则控制器可控制图像处理器基于语音识别命令列表中的语音识别命令进行操作。
控制器可提前向用户通知语音识别命令列表中的语音识别命令的内容,并根据用户的意图来确定是否基于语音识别命令进行操作。
如果接收的语音命令是对用户新近识别的,则控制器可将识别的语音命令以及相应的控制命令信息发送到第一服务器。
控制器可将用户的语音命令发送到第二服务器,从第二服务器接收语音命令转换的文本,并将接收的文本发送到第一服务器。
控制器可将用于每个用户的语音命令存储在存储器中,并按照用户界面(UI)的形式显示存储的语音命令的列表。
控制器可在用户的指令下注册与语音命令相应的识别符号,并响应于注册的识别符号被用户说出,确定语音符号已被接收。
如果语音命令被排列在列表中的位置被说出,则控制器可确定语音命令已被接收。
根据另一示例性实施例的一方面,提供了一种显示设备的控制方法,所述控制方法包括:从第一服务器接收包括语音识别命令以及相应的控制命令信息的语音识别命令列表,所述语音识别命令是用户的语音命令中已经被成功识别了预定次数或更多次数的用户的语音命令;将接收的语音识别命令列表存储在显示设备中;接收用户的语音命令;识别接收的语音命令是否相应于包括在存储的语音识别命令列表中的语音识别命令;如果接收的语音命令相应于语音识别命令,则根据语音识别命令的控制命令信息进行操作;如果接收的语音命令不相应于语音识别命令,则将接收的语音命令发送到第一服务器,从第一服务器接收相应的控制命令信息,并根据接收的控制命令信息进行操作。
识别接收的语音命令是否相应于包括在语音识别命令列表中的语音识别命令的步骤可包括基于语音命令与语音识别命令列表中的语音识别命令之间的确定的相关性来确定语音命令是否相应于语音识别命令。
所述控制方法还可包括:如果在语音命令被发送到第一服务器之后过去了预定时间或更长时间,则基于语音识别命令列表中的语音识别命令进行操作。
所述控制方法还可包括:提前向用户通知语音识别命令列表中的语音识别命令的内容,并根据用户的意图来确定是否基于语音识别命令进行操作。
所述控制方法还可包括:如果接收的语音命令是对用户新近识别的,则将识别的语音命令以及相应的控制命令信息发送到第一服务器。
所述控制方法还可包括:将用户的语音命令发送到第二服务器;从第二服务器接收语音命令已被转换的文本;将接收的文本发送到第一服务器。
所述控制方法还可包括:将用于每个用户的语音命令存储在处理设备中;并按照用户界面(UI)的形式显示存储的语音命令的列表。
所述控制方法还可包括:在用户的指令下注册与语音命令相应的识别符号,其中,接收语音命令的步骤包括,如果用户说出注册的识别符号,则确定相应的语音符号被接收。
接收语音命令的步骤可包括:如果用户说出一个语音命令被排列在列表中的位置,则确定相应的语音命令被接收。
根据另一示例性实施例的一方面,提供了一种分析到显示设备的用户的语音命令的服务器,所述服务器包括:通信器,与显示设备进行通信;存储器,存储关于用户的语音命令的信息;控制器,响应于从显示设备接收到对用户的语音命令的分析的请求,将与语音命令相应的控制命令信息发送到处理设备,将包括语音识别命令以及相应的控制命令信息的语音识别命令列表存储在存储器中,并将存储的语音识别命令列表发送到显示设备,所述语音识别命令是用户的语音命令中已经被成功识别了预定次数或更多次数的用户的语音命令。
控制器可从显示设备接收已被成功识别的用户的语音命令以及相应的控制命令信息,并基于接收的用户的语音命令以及相应的控制命令信息来准备语音识别命令列表。
根据另一示例性实施例的一方面,提供了一种分析到显示设备的用户的语音命令的服务器的控制方法,所述控制方法包括:从显示设备接收对用户的语音命令的分析的请求;将与语音命令相应的控制命令信息发送到显示设备;存储包括语音识别命令以及相应的控制命令信息的语音识别命令列表,所述语音识别命令是用户的语音命令中已经被成功识别了预定次数或更多次数的用户的语音命令;将存储的语音识别命令列表发送到显示设备。
所述控制方法还可包括:从显示设备接收已被成功识别的用户的语音命令以及相应的控制命令信息,其中,存储的步骤包括基于接收的用户的语音命令以及相应的控制命令信息来准备语音识别命令列表。
根据另一示例性实施例的一方面,提供了一种处理设备的控制方法,所述控制方法包括:从用户接收命令;确定接收的命令是否相应于包括在存储的识别命令列表中的识别命令,所述存储的识别命令列表包括识别命令以及与识别命令相应的控制命令信息;响应于确定接收的命令相应于包括在存储的识别命令列表中的识别命令,根据包括在识别命令列表中并与识别命令相应的控制命令信息进行操作;响应于确定接收的命令不相应于包括在存储的识别命令列表中的识别命令,将接收的命令发送到第一服务器,从第一服务器接收相应的控制命令信息,并根据接收的控制命令信息进行操作。
附图说明
通过下面结合附图对示例性实施例进行的描述,上述和/或其它方面将会变得清楚和更易于理解,其中:
图1是根据示例性实施例的电子装置和分析服务器的框图;
图2是根据示例性实施例的电子装置的框图;
图3是根据示例性实施例的分析服务器的框图;
图4是示出根据示例性实施例的电子装置的操作的流程图;
图5示出根据示例性实施例的语音识别命令列表的示例;
图6是示出根据示例性实施例的由电子装置确定分析的可能性的操作的流程图;
图7是示出根据示例性实施例的电子装置的操作的另一示例的流程图;
图8是示出根据示例性实施例的电子装置的操作的另一示例的流程图;
图9示出根据示例性实施例的电子装置和分析服务器的示例;
图10是示出根据示例性实施例的服务器的操作的流程图;
图11是示出根据示例性实施例的服务器的操作的流程图;
图12是根据示例性实施例的电子装置、分析服务器和语音到文本(STT)服务器的框图;以及
图13和图14示出根据示例性实施例的为每个用户存储的语音命令列表的示例。
具体实施方式
以下,将参照附图来详细描述示例性实施例,以使具有本领域普通知识的人员容易地实现所述示例性实施例。可以以各种形式来实施示例性实施例,而不必限制为这里阐述的示例性实施例。为了清楚而省略了已知部分的描述,并且相同标号始终表示相同部件。
图1是根据示例性实施例的电子装置1和分析服务器2的框图。根据示例性实施例的电子装置1和分析服务器2通过网络3彼此连接。电子装置1在用户的命令下进行操作,并包括例如家用电器或个人手持设备(诸如,电视(TV)、机顶盒、数字多功能盘(DVD)播放器、空调、冰箱、计算机、移动电话、智能电话、智能平板计算机等)、办公机器(诸如,打印机和复印机)以及基于电气/电子电路进行操作的任何其它装置。
根据当前示例性实施例的用户的命令包括电子装置1可基于其确定在用户的动作下执行预定操作的信息。电子装置1和分析服务器2分析用户的命令以识别用户的命令。例如,用户的命令可包括用户的语音、手势和特定外貌的至少一个。以下,为了描述方便,用户的命令将示例为语音命令,并且电子装置1包括诸如TV的显示装置。然而,将理解其它示例性实施例不限于此。
根据当前示例性实施例的网络3包括用于在电子装置1与分析服务器2之间交换关于用户的语音命令的信息的装置或基础设施,并可以是有线和/或无线网络。
分析服务器2连接到网络3,分析关于用户的语音命令的服务,即,用户的用于作为客户机的电子装置1的语音命令,并将分析结果发送到电子装置1。根据当前示例性实施例的分析服务器2将包括语音识别命令的语音识别命令列表发送到电子装置1,其中,所述语音识别命令是用户的语音命令中已经被成功识别了预定次数或更多次并且与控制命令信息相应的的语音命令。控制命令信息用于控制电子装置1在语音识别命令下如用户所期望地进行操作。电子装置1基于由分析服务器2发送的语音识别命令列表来识别用户的语音命令。也就是,如果用户的语音命令被输入,则电子装置1识别用户的语音命令是否相应于包括在语音识别命令列表中的语音识别命令,如果是的话,则根据语音识别命令的控制命令信息进行操作。相反,如果用户的语音命令不相应于包括在语音识别命令列表中的语音识别命令,则电子装置1将用户的语音命令发送到分析服务器2。分析服务器2分析由电子装置1发送的用户的语音命令并将相应的控制命令信息发送到电子装置1。电子装置1根据由分析服务器2发送的控制命令信息来进行操作。
根据当前示例性实施例,电子装置1基于由分析服务器2提前发送的语音识别命令列表来识别用户的语音命令,而不是将所有用户的语音命令发送到分析服务器2,并且如果基于接收的语音识别命令列表,用户的语音命令的识别不可用,则根据由分析服务器2发送的控制命令信息进行操作。因此,可最小化在电子装置1与分析服务器2之间花费的通信时间,并且可最小化用于识别用户的语音命令并执行操作的时间。
图2是根据示例性实施例的电子装置1的框图。电子装置1可包括操作执行器11、命令接收器12、通信单元13(例如,诸如有线和/或无线接口、端口、卡、狗(dongle)等的通信器)以及控制器14。电子装置1可还包括存储单元15(例如,诸如RAM、ROM、闪存、硬盘驱动器等的存储器)。操作执行器11执行电子装置1的操作。例如,如果电子装置1包括诸如TV的显示设备,则操作执行器11可包括信号接收器111、图像处理器112和显示单元113(例如,诸如液晶显示面板、等离子显示面板、有机发光二极管显示器等的显示器)。然而,应理解操作执行器11相应于实现电子装置1的产品的操作,并不限于图2中示出的示例。
信号接收器111可接收包括在由广播信号发送设备(未示出)发送的广播信号中的图像信号,从视频装置(诸如,DVD播放器、蓝光盘(BD)播放器等)接收图像信号,从个人计算机(PC)接收图像信号,从移动装置(诸如,智能电话和智能平板计算机)接收图像信号,通过网络(诸如,互联网)接收图像信号,或接收作为存储在存储介质(诸如,通用串行总线(USB)存储介质)中的图像内容的图像信号。
图像处理器112处理由信号接收器111接收的图像信号以显示图像。图像处理器112可执行解码、图像增强和缩放操作。显示单元113基于由图像处理器112处理的图像信号来显示图像。显示单元113的图像显示方法不受限制。
图像处理器112接收用户的语音命令。例如,命令接收器112可包括用于接收用户的语音命令的第一命令接收器121。第一命令接收器121可包括用于将接收的用户的语音命令转换为语音信号的话筒。命令接收器12还可包括用于接收用户的操作命令的第二命令接收器122。第二命令接收器122可实现为从远程控制器(未示出)接收包括与用户的操作命令相应的键输入信息的远程控制信号的远程控制信号接收器,或者可实现为在电子装置1中设置并产生与用户的操作相应的键输入信息的操作面板。
通信单元13通过网络3与分析服务器2进行通信。通信单元13在控制器14的控制下与分析服务器2交换用户的语音命令和关于分析结果的信息。
控制器14控制操作执行器11以在用户的语音命令下执行操作。响应于通过通信单元13从分析服务器2接收语音识别命令列表151,控制器14将接收的语音识别命令列表151存储在存储单元15中。响应于通过命令接收器12接收用户的语音命令,控制器14识别用户的语音命令是否相应于包括在存储的语音识别命令列表151中的语音识别命令,如果是的话,则控制器14控制操作执行器11根据与包括在存储的语音识别命令列表151中的语音识别命令相应的控制命令信息来执行操作。如果用户的语音命令不相应于包括在存储的语音识别命令列表151中的语音识别命令,则控制器14控制通信单元13将用户的语音命令发送到分析服务器2,并且响应于从分析服务器2接收与发送的语音命令相应的控制命令信息,控制操作执行器11以根据接收的控制命令信息执行操作。
控制器14可包括中央处理单元(CPU),并可执行控制程序以用于操作。控制器14还可包括:诸如闪存的非易失性存储器,用于存储控制程序;以及诸如双数据率(DDR)存储器的易失性存储器,用于载入存储的控制程序的至少一部分以用于CPU的快速访问。控制器14的控制程序被编程为控制操作执行器11的操作。
图3是根据示例性实施例的分析服务器2的框图。分析服务器2包括通信单元21(例如,诸如有线和/或无线接口、端口、卡、狗等的通信器)、控制器22和存储单元23(例如,诸如ROM、闪存、硬盘驱动器等的存储器)。通信单元21通过网络3与电子装置1的通信单元13进行通信。控制器22控制分析服务器2的操作。作为非易失性存储器的存储单元23存储与用户的语音命令相应的语音识别命令列表231。控制器22控制通信单元21以将存储在存储单元23中的语音识别命令列表231发送到电子装置1。响应于从电子装置1接收用户的语音命令和对用户的语音命令的分析请求,控制器22分析接收的用户的语音命令。控制器22控制通信单元21将用户的语音命令的分析结果发送到电子装置1。
图4是示出根据示例性实施例的电子装置1的操作的流程图。在操作S41,电子装置1从分析服务器2接收语音识别命令列表151。接收的语音识别命令列表151可存储在存储单元15中。图5示出根据示例性实施例的语音识别命令列表151的示例。语音识别命令列表151可包括多个语音识别命令(“语音识别命令1”、“语音识别命令2”、“语音识别命令3”等)以及与所述多个语音识别命令相应的多个控制命令信息(“控制命令信息1”、“控制命令信息2”、“控制命令信息3”等)。多个语音识别命令可包括诸如“开启”、“关闭”或“提高音量”的命令。多个控制命令信息可包括关于将由电子装置1执行的与所述多个语音识别命令相应的操作或功能的固有控制信息。
如果电子装置1被开启,则电子装置1可请求分析服务器2发送语音识别命令列表231。响应于从电子装置1接收对发送语音识别命令列表231的请求,分析服务器2可将语音识别命令列表231发送到电子装置1。电子装置1可将由分析服务器2发送的语音识别命令列表231存储在存储单元15中。如果存储单元15已经具有存储在其中的语音识别命令列表151,则电子装置1可将存储的语音识别命令列表151与已由分析服务器2发送的语音识别命令列表231进行比较,并基于接收的语音识别命令列表231来更新存储的语音识别命令列表151。
参照回图4,在操作S42,电子装置1接收用户的语音命令。在操作S43,电子装置1识别接收的用户的语音命令是否相应于包括在接收的语音识别命令列表231中的语音识别命令。图6是示出确定语音命令是否相应于包括在接收的语音识别命令列表231中的语音识别命令的操作的流程图。
在操作S61,电子装置1接收用户的语音命令。在操作S62,电子装置1确定接收的语音命令是否相应于包括在语音识别命令列表151中的语音识别命令。可例如通过接收的语音命令与包括在语音识别命令列表151中的语音识别命令有多相似来确定根据当前示例性实施例的相关性。例如,如果用户说出命令“关闭”,并且语音识别命令列表151包括实质上与用户说出的命令相同或相似的语音识别命令“关闭”,则可确定该语音命令与语音识别命令列表151中的语音识别命令最相关。作为另一示例,如果用户说出命令“提高音量”,并且语音识别命令列表151包括语音命令“音量上升”,则这两个事例可以高度相关。在这种情况下,电子装置1可确定语音命令与语音识别命令列表151中的相应的语音识别命令之间的相关性至少具有预定值或更大。作为另一示例,如果用户说出命令“使屏幕更亮”,并且如果识别出语音识别命令别表151不具有任何相似的语音识别命令,则电子装置1可确定语音命令与语音识别命令列表151中的相应的语音识别命令之间的相关性小于预定值。
返回图6,在操作S63,如果确定语音识别命令列表151包括与语音命令的相关性具有预定值或更大的语音识别命令,则在操作S64,电子装置1确定语音命令相应于包括在语音识别命令列表151中的语音识别命令。相反,如果确定语音识别命令列表151不具有与语音命令的相关性具有预定值或更大的任何语音识别命令,在操作S65,电子装置1确定语音命令不相应于包括在语音识别命令列表151中的语音识别命令。
返回到图4,如果在操作S44确定用户的语音命令相应于接收的语音识别命令列表151中的语音识别命令,则在操作S45,电子装置1根据与语音识别命令列表151中的语音识别命令相应的控制命令信息进行操作。例如,电子装置1通过参照与包括在语音识别命令列表151中的语音识别命令(诸如,“关闭”和“音量上升”)相应的控制命令信息来执行操作,其中,所述语音识别命令(诸如,“关闭”和“音量上升”)相应于用户的语音命令(诸如,“关闭”和“提高音量”)。
如果在操作S44确定用户的语音命令不相应于包括在接收的语音识别命令列表151中的语音识别命令,则在操作S46,电子装置1将用户的语音命令发送到分析服务器2。例如,如果用户的语音命令“使屏幕更亮”基于语音识别命令列表151未被识别,则电子装置1将语音命令“使屏幕更亮”的信息发送到分析服务器2。在操作S47,电子装置从分析服务器2接收与语音命令相应的控制命令信息。例如,电子装置1接收与语音命令相应的控制命令信息作为语音命令“使屏幕更亮”的分析结果。在操作S48,电子装置1根据接收的控制命令信息进行操作。
图12示出根据示例性实施例的语音到文本(STT)服务器4的示例。电子装置1可将关于用户的语音命令的信息(即,用户产生的语音)处理为文本。例如,电子装置1将接收的用户的语音命令发送到STT服务器4。STT服务器4包括STT转换器41,该STT转换器41将电子装置1发送的用户的语音命令转换为相应的文本。STT服务器4将用户的语音命令转换成的文本发送到电子装置1。电子装置1可基于STT服务器4发送的文本来确定用户的语音命令是否相应于包括在存储的语音识别命令列表中的语音识别命令。电子装置1可将STT服务器4提供的文本发送到服务器1并请求服务器1分析用户的语音命令。
图7是示出根据示例性实施例的电子装置1的操作的另一示例的流程图。在当前示例性实施例中,将对用户的语音命令被确定为不相应于接收的语音识别命令列表151中的语音识别命令的情况进行解释。在操作S71,电子装置1将用户的语音命令发送到分析服务器2。在操作S72,电子装置1识别是否已从分析服务器2接收到与用户的语音命令相应的控制命令信息。如果电子装置1已经从分析服务器2接收到与用户的语音命令相应的控制命令信息,则在操作S73,电子装置1根据由分析服务器2发送的控制命令信息进行操作。如果电子装置1还未从分析服务器2接收到与用户的语音命令相应的控制命令信息,则在操作S74,电子装置1识别在用户的语音命令已被发送到分析服务器2之后是否已过去预定时间。如果未过去预定时间,则再次执行操作S72。相反,如果已过去预定时间,则在操作S75,电子装置1在接收的语音识别命令列表151中的语音识别命令下进行操作。
例如,如果用户说出命令“减小屏幕”,则电子装置1可确定语音识别命令列表具有语音命令“使屏幕更小”并且这两个命令之间的相关性小于预定值。因此,在这种情况下,电子装置1向分析服务器2请求分析结果。然而,如果由于通信状况等而从分析服务器2接收分析结果花费较长时间,则对于用户来说等待较长时间直到操作被执行可能是不方便或难以进行的。在这种情况下,如果在电子装置向分析服务器2请求分析结果之后过去了预定时间,则电子装置1可快速地在相关性小于预定值的语音识别命令下进行操作。例如,电子装置1在语音识别命令列表151中的与用户的语音命令“减小屏幕”相应的语音识别命令“使屏幕更小”下进行操作。如果存在与语音命令相关的几个语音识别命令,则电子装置1可首先选择多个语音识别命令中的最相关的语音识别命令以用于其操作。在当前示例性实施例中,可最小化用户等待操作的时间,从而提高用户的便利。
根据另一示例性实施例,使用相关性低的语音识别命令可能不会与用户的意图相一致,从而可避免这样的操作。图8是示出根据示例性实施例的电子装置1的操作的另一示例的流程图。在当前示例性实施例中,将对在电子装置向分析服务器2请求分析之后过去了预定时间并且存在被确定为与语音命令相关到一定程度的语音识别命令的情况进行解释。在操作S81,在电子装置1在被确定为与语音命令相关到一定程度的语音识别命令下进行操作之前,电子装置1向用户通知语音识别命令的内容。更具体地,电子装置1可在显示单元113上显示这样的消息:所述消息询问用户当前用户的语音命令是否落入在被确定为相关到一定程度的语音识别命令下。例如,如果用户说出语音命令“减小屏幕”,则询问用户语音识别命令列表151中的语音识别命令“使屏幕更小”是否与用户的意图相一致的消息被显示。在操作S82,电子装置1通过第二命令接收器122接收关于语音识别命令的用户的意图。如果在操作S83确定用户同意语音识别命令,则在操作S84,电子装置1在语音识别命令下进行操作。相反,如果在操作S83确定用户不同意语音识别命令,则电子装置1不根据语音识别命令进行操作。因此,在当前示例性实施例中,电子装置1与用户的意图更近似地进行操作,从而提高用户的便利。
根据另一示例性实施例,如果在语音识别命令列表151中没有语音识别命令相应于用户的语音命令,则电子装置1可显示包括在语音识别命令列表151中的多个语音识别命令,并使用户能够选择多个语音识别命令中与关于语音命令的用户的意图相一致的一个语音识别命令。如果用户选择了多个语音识别命令中的一个,则电子装置1基于与选择的语音识别命令相应的控制命令信息进行操作。
在存储的语音识别命令列表151不包括与用户的语音命令相应的语音识别命令的情况下,如果基于用户的意图确定用户的语音命令被新近和成功地识别,则电子装置1将用于与识别的语音命令相应的控制命令信息添加到语音识别命令列表151,并存储所述信息。在这种情况下,电子装置1可将识别的语音命令和相应的控制命令信息发送到分析服务器2,所述分析服务器2更新语音识别命令列表231。
图13示出根据示例性实施例的显示存储的语音命令的列表的用户接口(UI)131的示例。电子装置1存储由用户说出的语音命令,并在用户请求时,可将存储的语音命令的列表显示为UI131。如图13所示,显示为UI131的存储的语音命令的列表显示已由用户说出的语音命令132。电子装置1可存储按照每个用户的语音命令,并按照每个用户(标号133)地显示存储的语音命令132。电子装置1可按照语音命令132已被用户说出多少次的顺序来显示存储有语音命令132的存储的语音命令的列表。因此,用户可通过UI131容易地观看用户之前已说出的语音命令,并便利地说出语音命令。
根据示例性实施例,用户可按照每个语音命令注册(例如,存储)识别符号,如果之后用户说出注册的识别符号,则电子装置1可确定相应的语音命令已被接收。显示存储的语音命令的列表的UI131还可显示与每个语音命令相应的识别符号134。例如,如果识别符号1被注册用于诸如“告诉我明天的天气”的语音命令,则在用户说出识别符号“1”时,电子装置1确定语音命令“告诉我明天的天气”已被输入。因此,为了便利,用户可使用简单的识别符号来代替具有长或复杂句子的语音命令。电子装置1可在用户的指令下从UI131的列表删除任何语音命令或将新的语音命令添加到UI131的列表。
根据另一示例性实施例,如果用户说出一个语音命令被排列在语音命令的列表的UI131中的位置,则电子装置1可确定语音命令已被接收。例如,如果用户在列表的UI131被显示时说出“第一个”,则电子装置1可确定在列表的UI131中排名顶端的语音命令“告诉我明天的天气”已被说出。
电子装置1可在用户的指令下编辑存储的语音命令的列表的UI131中的语音命令的顺序。图14示出编辑UI131中的语音命令的顺序的情况。例如,如图14所示,电子装置1可在用户的指令下交换命令“玩%%%”和“记录$$$新闻”的顺序。在这种情况下,可保持相应的识别符号或者可交换所述两个命令的识别符号。
图9示出根据示例性实施例的电子装置1和分析服务器2a的示例。将不重复对与已参照图1到图8解释的分析服务器2的配置相同或相似的分析服务器2a的配置的解释。根据当前示例性实施例的分析服务器2a与多个电子装置1进行通信。在从多个电子装置1接收到对用户的语音命令的分析的请求时,分析服务器2a分析语音命令并将分析结果发送到电子装置1。分析服务器2a收集由多个电子装置1发送的用户的语音命令,基于语音命令准备语音识别命令列表231,并将准备的语音识别命令列表231发送到多个电子装置1。
图10是示出根据示例性实施例的分析服务器2a的操作的流程图。在操作S101,分析服务器2a从电子装置1接收对用户的语音命令的分析的请求。在操作S102,分析服务器2a分析语音命令并将与分析结果相应的控制命令信息发送到电子装置1。在操作S103,分析服务器2a基于从多个电子装置1收集的用户的语音命令以及分析结果来准备语音识别命令列表231,并将准备的语音识别命令列表231存储在存储单元23中。分析服务器2a可基于从多个电子装置1持续收集的用户的语音命令及其分析结果来更新存储在存储单元23中的语音识别命令列表231。在操作S104,分析服务器2a将存储在存储单元23中的语音识别命令列表231发送到多个电子装置1。
根据示例性实施例,如上参照图8所解释的,如果存在已被确定为与语音识别命令列表中的语音识别命令较小地相关的语音命令但是该语音命令已被用户请求(已被新近和成功地识别)以进行操作,则电子装置1可将识别的语音命令和相应的控制命令信息发送到分析服务器2a。在这种情况下,分析服务器2a可在语音识别命令列表231中反映接收的语音命令和相应的控制命令信息。根据示例性实施例,如果分析服务器2a接收了识别的语音命令和相应的控制命令信息预定的次数或者从预定数量的电子装置1接收了识别的语音命令和相应的控制命令信息,则分析服务器2a可将语音识别命令添加到语音识别命令列表23。
图11是示出根据示例性实施例的分析服务器2a的操作的流程图。在操作S111,分析服务器2a确定从多个电子装置1收集的用户的语音命令的成功识别次数。也就是说,分析服务器2a确定从多个电子装置1收集的哪个用户的语音命令被频繁地成功识别。在操作S112,分析服务器2a确定收集的用户的语音命令的成功识别次数是否是预定值或更多。如果语音命令的成功识别次数是预定值或更多,则在操作S113,分析服务器2a可将语音命令和控制命令信息作为新的语音识别命令添加到语音识别命令列表。如果语音命令的成功识别次数小于预定值,则分析服务器2a不将语音命令和控制命令信息添加到语音识别命令列表。根据当前示例性实施例,语音识别命令列表仅添加成功识别次数是预定值或更多的语音命令,从而可最小化用于语音识别命令列表的传输时间和电子装置1的用于处理语音识别命令列表的操作。
如上所述,通过经由服务器识别用户的命令的方法,可最小化用于识别用户的命令和执行操作的时间。
虽然上述示例性实施例参照语音命令,但是应理解一个或多个其它示例性实施例不限于此。例如,另一示例性实施例可应用于任何的一种或多种类型的命令,诸如手势命令。在这种情况下,通过示例的方式,命令列表可包括手势识别命令和相应的控制命令信息。
此外,虽然上述示例性实施例参照第一服务器,但是应理解一个或多个其它示例性实施例不限于此,并可应用于多个第一服务器。
虽然不限于此,但是示例性实施例可被实施为计算机可读记录介质上的计算机可读代码。计算机可读记录介质是可存储其后可由计算机系统读取的数据的任何数据存储装置。计算机可读记录介质的示例包括只读存储器(ROM)、随机访问存储器(RAM)、CD-ROM、磁带、软盘和光数据存储装置。计算机可读记录介质还可分布于联网的计算机系统,从而以分布式方式存储和执行计算机可读代码。另外,示例性实施例可被编写为经由计算机可读传输介质(诸如,载波)发送、接收并在执行程序的通用或专用数字计算机中实施的计算机程序。此外,应理解在示例性实施例中,上述装置一个或多个单元、部件、元件等可包括电路、处理器、微处理器等,并可执行存储在计算机可读介质中的计算机程序。
虽然已经示出和描述了一些示例性实施例,但是本领域的这些技术人员将理解,在不脱离范围由权利要求及其等同物限定的发明构思的原理和精神的情况下,可对这些示例性实施例做出改变。

Claims (15)

1.一种显示设备,包括:
处理器,对信号进行处理;
显示器,基于处理的信号来显示图像;
命令接收器,从用户接收语音命令;
通信器,与第一服务器进行通信;
存储器;以及
控制器,从第一服务器接收包括语音识别命令以及与语音识别命令相应的控制命令信息的语音识别命令列表,并将接收的语音识别命令列表存储在存储器中,所述语音识别命令是用户的语音命令中已经被成功识别了预定次数或更多次数的用户的语音命令,
其中,响应于接收到语音命令,确定接收的语音命令是否相应于包括在存储的语音识别命令列表中的语音识别命令,
其中,响应于确定接收的语音命令相应于包括在存储的语音识别命令列表中的语音识别命令,控制器控制处理器基于与包括在存储的语音识别命令列表中的语音识别命令相应的控制命令信息进行操作,并且
其中,响应于确定接收的语音命令不相应于包括在存储的语音识别命令列表中的语音识别命令,控制器将接收的语音命令发送到第一服务器,从第一服务器接收相应的控制命令信息,并控制处理器基于接收的控制命令信息进行操作。
2.如权利要求1所述的显示设备,其中,控制器基于接收的语音命令与包括在存储的语音识别命令列表中的语音识别命令之间的确定的相关性来确定接收的语音命令是否相应于语音识别命令。
3.如权利要求1所述的显示设备,其中,响应于在接收的语音命令被发送到第一服务器之后过去了预定时间,控制器控制处理器基于包括在存储的语音识别命令列表中的语音识别命令进行操作。
4.如权利要求1所述的显示设备,其中,响应于在接收的语音命令被发送到第一服务器之后过去了预定时间,控制器提前向用户通知包括在存储的语音识别命令列表中的语音识别命令的内容,并根据用户对所述通知的响应来确定是否控制处理器基于语音识别命令进行操作。
5.如权利要求1所述的显示设备,其中,如果接收的语音命令是对用户新近识别的,则控制器将识别的语音命令以及与识别的语音命令相应的控制命令信息发送到第一服务器。
6.如权利要求1所述的显示设备,其中,控制器将接收的语音命令发送到第二服务器,从第二服务器接收发送的语音命令转换的文本,并将接收的文本发送到第一服务器。
7.一种显示设备的控制方法,所述控制方法包括:
从第一服务器接收包括语音识别命令以及与语音识别命令相应的控制命令信息的语音识别命令列表,所述语音识别命令是用户的语音命令中已经被成功识别了预定次数或更多次数的用户的语音命令;
将接收的语音识别命令列表存储在显示设备中;
从用户接收语音命令;
确定接收的语音命令是否相应于包括在存储的语音识别命令列表中的语音识别命令;
响应于确定接收的语音命令相应于包括在存储的语音识别命令列表中的语音识别命令,根据与包括在语音识别命令列表中的语音识别命令相应的控制命令信息进行操作;并且
响应于确定接收的语音命令不相应于包括在存储的语音识别命令列表中的语音识别命令,将接收的语音命令发送到第一服务器,从第一服务器接收相应的控制命令信息,并根据接收的控制命令信息进行操作。
8.如权利要求7所述的控制方法,其中,确定接收的语音命令是否相应于包括在存储的语音识别命令列表中的语音识别命令的步骤包括基于接收的语音命令与包括在存储的语音识别命令列表中的语音识别命令之间的确定的相关性来确定接收的语音命令是否相应于语音识别命令。
9.如权利要求7所述的控制方法,还包括:响应于在接收的语音命令被发送到第一服务器之后过去了预定时间,基于包括在存储的语音识别命令列表中的语音识别命令进行操作。
10.如权利要求7所述的控制方法,其中,响应于过去了预定时间,基于包括在存储的语音识别命令列表中的语音识别命令进行操作的步骤包括提前向用户通知包括在存储的语音识别命令列表中的语音识别命令的内容,并根据用户对所述通知的响应来确定是否基于语音识别命令进行操作。
11.如权利要求7所述的控制方法,还包括:如果接收的语音命令是对用户新近识别的,则将识别的语音命令以及与识别的语音命令相应的控制命令信息发送到第一服务器。
12.如权利要求7所述的控制方法,还包括:
将接收的语音命令发送到第二服务器;
从第二服务器接收发送的语音命令转换的文本;以及
将接收的文本发送到第一服务器。
13.一种分析到显示设备的用户的语音命令的服务器,所述服务器包括:
通信器,与显示设备进行通信;
存储器,存储关于语音命令的信息;以及
控制器,响应于从显示设备接收到对从用户接收的语音命令的分析的请求,将与接收的语音命令相应的控制命令信息发送到显示设备,将包括语音识别命令以及与语音识别命令相应的控制命令信息的语音识别命令列表存储在存储器中,并将存储的语音识别命令列表发送到显示设备,所述语音识别命令是用户的语音命令中已经被成功识别了预定次数或更多次数的用户的语音命令。
14.如权利要求13所述的服务器,其中,控制器从显示设备接收已对用户成功识别的语音命令以及相应的控制命令信息,并基于接收的语音命令以及相应的控制命令信息来准备语音识别命令列表。
15.一种分析到显示设备的用户的语音命令的服务器的控制方法,所述控制方法包括:
从显示设备接收对从用户接收的语音命令的分析的请求;
将与接收的语音命令相应的控制命令信息发送到显示设备;
存储包括语音识别命令以及与语音识别命令相应的控制命令信息的语音识别命令列表,所述语音识别命令是用户的语音命令中已经被成功识别了预定次数或更多次数的用户的语音命令;以及
将存储的语音识别命令列表发送到显示设备。
CN201210585173.5A 2012-09-28 2012-12-28 电子装置、服务器及其控制方法 Pending CN103714816A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910281846.XA CN109979465B (zh) 2012-09-28 2012-12-28 电子装置、服务器及其控制方法

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
KR20120109453 2012-09-28
KR10-2012-0109453 2012-09-28
KR1020120117193A KR101330671B1 (ko) 2012-09-28 2012-10-22 전자장치, 서버 및 그 제어방법
KR10-2012-0117193 2012-10-22

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN201910281846.XA Division CN109979465B (zh) 2012-09-28 2012-12-28 电子装置、服务器及其控制方法

Publications (1)

Publication Number Publication Date
CN103714816A true CN103714816A (zh) 2014-04-09

Family

ID=49857999

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201910281846.XA Active CN109979465B (zh) 2012-09-28 2012-12-28 电子装置、服务器及其控制方法
CN201210585173.5A Pending CN103714816A (zh) 2012-09-28 2012-12-28 电子装置、服务器及其控制方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201910281846.XA Active CN109979465B (zh) 2012-09-28 2012-12-28 电子装置、服务器及其控制方法

Country Status (10)

Country Link
US (4) US9582245B2 (zh)
EP (3) EP2713366B1 (zh)
JP (2) JP2014071449A (zh)
KR (4) KR101330671B1 (zh)
CN (2) CN109979465B (zh)
AU (1) AU2012261531A1 (zh)
BR (1) BR102013002468B1 (zh)
FR (1) FR2996343B3 (zh)
RU (1) RU2627117C2 (zh)
WO (1) WO2014051207A1 (zh)

Cited By (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103985160A (zh) * 2014-05-12 2014-08-13 深圳市威富多媒体有限公司 一种基于计算机及语音控制的车牌管理方法及装置
CN104517606A (zh) * 2013-09-30 2015-04-15 腾讯科技(深圳)有限公司 语音识别测试方法及装置
CN105023575A (zh) * 2014-04-30 2015-11-04 中兴通讯股份有限公司 语音识别方法、装置和系统
CN105448293A (zh) * 2014-08-27 2016-03-30 北京羽扇智信息科技有限公司 语音监听及处理方法和设备
CN105719650A (zh) * 2016-01-30 2016-06-29 深圳市尔木科技有限责任公司 一种语音识别的方法及系统
CN105913839A (zh) * 2016-05-30 2016-08-31 合肥华凌股份有限公司 一种智能冰箱、服务器及语音控制系统和方法
CN106233743A (zh) * 2014-05-01 2016-12-14 索尼公司 通信装置或通信方法以及计算机程序
CN106796496A (zh) * 2014-09-05 2017-05-31 Lg 电子株式会社 显示设备及其操作方法
CN107086037A (zh) * 2017-03-17 2017-08-22 上海庆科信息技术有限公司 一种嵌入式设备的语音交互方法、装置及嵌入式设备
CN107967915A (zh) * 2016-10-20 2018-04-27 三星电子株式会社 显示装置及其控制方法
CN108510990A (zh) * 2018-07-04 2018-09-07 百度在线网络技术(北京)有限公司 语音识别方法、装置、用户设备及存储介质
CN110177185A (zh) * 2018-02-19 2019-08-27 柯尼卡美能达株式会社 图像处理装置、图像处理装置的控制方法及记录介质
CN110910869A (zh) * 2018-09-14 2020-03-24 成都启英泰伦科技有限公司 一种语音识别方法和设备
CN111063345A (zh) * 2018-10-17 2020-04-24 三星电子株式会社 电子装置、其控制方法、以及该电子装置的声音输出控制系统
CN111417924A (zh) * 2017-11-23 2020-07-14 三星电子株式会社 电子设备及其控制方法
CN111754996A (zh) * 2019-03-29 2020-10-09 阿里巴巴集团控股有限公司 基于语音模拟遥控器的控制方法、装置及电子设备
CN111771185A (zh) * 2018-02-26 2020-10-13 三星电子株式会社 用于执行语音命令的方法及系统
CN111856959A (zh) * 2014-05-30 2020-10-30 苹果公司 用于家庭自动化的智能助理
CN112136006A (zh) * 2018-05-18 2020-12-25 三星电子株式会社 空调及其控制方法
CN112147903A (zh) * 2019-06-26 2020-12-29 百度在线网络技术(北京)有限公司 一种设备的控制方法、装置及计算机可读存储介质
CN113411722A (zh) * 2021-06-04 2021-09-17 深圳市右转智能科技有限责任公司 一种智能背景音乐系统
US11321116B2 (en) 2012-05-15 2022-05-03 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US11360577B2 (en) 2018-06-01 2022-06-14 Apple Inc. Attention aware virtual assistant dismissal
US11467802B2 (en) 2017-05-11 2022-10-11 Apple Inc. Maintaining privacy of personal information
US11487364B2 (en) 2018-05-07 2022-11-01 Apple Inc. Raise to speak
US11538469B2 (en) 2017-05-12 2022-12-27 Apple Inc. Low-latency intelligent automated assistant
US11550542B2 (en) 2015-09-08 2023-01-10 Apple Inc. Zero latency digital assistant
US11557310B2 (en) 2013-02-07 2023-01-17 Apple Inc. Voice trigger for a digital assistant
US11580990B2 (en) 2017-05-12 2023-02-14 Apple Inc. User-specific acoustic models
US11657820B2 (en) 2016-06-10 2023-05-23 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US11671920B2 (en) 2007-04-03 2023-06-06 Apple Inc. Method and system for operating a multifunction portable electronic device using voice-activation
US11675491B2 (en) 2019-05-06 2023-06-13 Apple Inc. User configurable task triggers
US11696060B2 (en) 2020-07-21 2023-07-04 Apple Inc. User identification using headphones
US11705130B2 (en) 2019-05-06 2023-07-18 Apple Inc. Spoken notifications
US11749275B2 (en) 2016-06-11 2023-09-05 Apple Inc. Application integration with a digital assistant
US11765209B2 (en) 2020-05-11 2023-09-19 Apple Inc. Digital assistant hardware abstraction
US11783815B2 (en) 2019-03-18 2023-10-10 Apple Inc. Multimodality in digital assistant systems
US11790914B2 (en) 2019-06-01 2023-10-17 Apple Inc. Methods and user interfaces for voice-based control of electronic devices
US11809886B2 (en) 2015-11-06 2023-11-07 Apple Inc. Intelligent automated assistant in a messaging environment
US11810562B2 (en) 2014-05-30 2023-11-07 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US11838734B2 (en) 2020-07-20 2023-12-05 Apple Inc. Multi-device audio adjustment coordination
US11838579B2 (en) 2014-06-30 2023-12-05 Apple Inc. Intelligent automated assistant for TV user interactions
US11842734B2 (en) 2015-03-08 2023-12-12 Apple Inc. Virtual assistant activation
US11888791B2 (en) 2019-05-21 2024-01-30 Apple Inc. Providing message response suggestions
US11893992B2 (en) 2018-09-28 2024-02-06 Apple Inc. Multi-modal inputs for voice commands
US11900936B2 (en) 2008-10-02 2024-02-13 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US11900923B2 (en) 2018-05-07 2024-02-13 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US11914848B2 (en) 2020-05-11 2024-02-27 Apple Inc. Providing relevant data items based on context
US11947873B2 (en) 2015-06-29 2024-04-02 Apple Inc. Virtual assistant for media playback
US12001933B2 (en) 2022-09-21 2024-06-04 Apple Inc. Virtual assistant in a communication session

Families Citing this family (60)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130125067A (ko) * 2012-05-08 2013-11-18 삼성전자주식회사 전자 장치 및 그의 제어 방법
US10157618B2 (en) 2013-05-02 2018-12-18 Xappmedia, Inc. Device, system, method, and computer-readable medium for providing interactive advertising
US9747899B2 (en) 2013-06-27 2017-08-29 Amazon Technologies, Inc. Detecting self-generated wake expressions
KR102246893B1 (ko) * 2013-12-11 2021-04-30 삼성전자주식회사 대화형 시스템, 이의 제어 방법, 대화형 서버 및 이의 제어 방법
US9767803B1 (en) 2013-12-16 2017-09-19 Aftershock Services, Inc. Dynamically selecting speech functionality on client devices
US9674306B2 (en) * 2013-12-20 2017-06-06 The Directv Group, Inc. Method and system for communicating from a client device to a server device in a centralized content distribution system
JP6440513B2 (ja) * 2014-05-13 2018-12-19 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 音声認識機能を用いた情報提供方法および機器の制御方法
KR102225404B1 (ko) * 2014-05-23 2021-03-09 삼성전자주식회사 디바이스 정보를 이용하는 음성인식 방법 및 장치
US9589567B2 (en) * 2014-06-11 2017-03-07 Honeywell International Inc. Plant control system using voice as a control mechanism
KR20160056548A (ko) * 2014-11-12 2016-05-20 삼성전자주식회사 질의 응답을 위한 디스플레이 장치 및 방법
KR101642918B1 (ko) * 2015-08-03 2016-07-27 서치콘주식회사 코드네임 프로토콜을 이용한 네트워크 접속 제어 방법, 이를 수행하는 네트워크 접속 제어 서버 및 이를 저장하는 기록매체
US9978366B2 (en) 2015-10-09 2018-05-22 Xappmedia, Inc. Event-based speech interactive media player
FR3045909B1 (fr) * 2015-12-17 2017-12-29 Delta Dore Procede et dispositif d'analyse et de repartition de commandes vocales
CN105578240A (zh) * 2015-12-23 2016-05-11 广州视源电子科技股份有限公司 电视终端交互方法和系统
US9898250B1 (en) * 2016-02-12 2018-02-20 Amazon Technologies, Inc. Controlling distributed audio outputs to enable voice output
US9858927B2 (en) * 2016-02-12 2018-01-02 Amazon Technologies, Inc Processing spoken commands to control distributed audio outputs
US10271093B1 (en) * 2016-06-27 2019-04-23 Amazon Technologies, Inc. Systems and methods for routing content to an associated output device
JP6908461B2 (ja) * 2016-11-02 2021-07-28 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 情報処理方法及びプログラム
CN108010523B (zh) * 2016-11-02 2023-05-09 松下电器(美国)知识产权公司 信息处理方法以及记录介质
CN108010522A (zh) 2016-11-02 2018-05-08 松下电器(美国)知识产权公司 信息处理方法以及记录介质
WO2018119230A1 (en) * 2016-12-23 2018-06-28 Spectrum Brands, Inc. Electronic faucet with smart features
US10937421B2 (en) * 2016-12-23 2021-03-02 Spectrum Brands, Inc. Electronic faucet with smart features
CN107135443B (zh) * 2017-03-29 2020-06-23 联想(北京)有限公司 一种信号处理方法及电子设备
KR20180118461A (ko) * 2017-04-21 2018-10-31 엘지전자 주식회사 음성 인식 장치 및 음성 인식 방법
US10475454B2 (en) * 2017-09-18 2019-11-12 Motorola Mobility Llc Directional display and audio broadcast
CN109559759B (zh) * 2017-09-27 2021-10-08 华硕电脑股份有限公司 具备增量注册单元的电子设备及其方法
KR102417524B1 (ko) * 2017-10-13 2022-07-07 현대자동차주식회사 음성 인식 기반의 자동차 제어 방법
FR3073067B1 (fr) * 2017-10-27 2020-11-13 Deepor Procede de pilotage d'une salle notamment operatoire d'un plateau medico-technique
KR102480728B1 (ko) * 2017-11-10 2022-12-23 삼성전자주식회사 전자장치 및 그 제어방법
KR102528466B1 (ko) 2017-12-19 2023-05-03 삼성전자주식회사 복수 화자의 음성 신호 처리 방법 및 그에 따른 전자 장치
CN111742557B (zh) * 2018-01-08 2024-01-19 Lg电子株式会社 显示装置和包括显示装置的系统
KR102488001B1 (ko) * 2018-01-22 2023-01-13 삼성전자주식회사 오디오 신호를 이용하여 사용자를 인증하는 전자 장치 및 그 방법
WO2019161229A1 (en) 2018-02-15 2019-08-22 DMAI, Inc. System and method for reconstructing unoccupied 3d space
US11468885B2 (en) * 2018-02-15 2022-10-11 DMAI, Inc. System and method for conversational agent via adaptive caching of dialogue tree
WO2019161216A1 (en) * 2018-02-15 2019-08-22 DMAI, Inc. System and method for prediction based preemptive generation of dialogue content
KR102576388B1 (ko) 2018-02-21 2023-09-08 엘지전자 주식회사 디스플레이 장치 및 그의 동작 방법
KR102533443B1 (ko) * 2018-05-04 2023-05-17 삼성전자 주식회사 콘텐츠 제공 방법 및 이를 사용하는 전자 장치
KR20190134107A (ko) * 2018-05-24 2019-12-04 삼성전자주식회사 사용자의 음성을 처리하는 전자 장치를 포함하는 시스템 및 전자 장치의 음성 인식 제어 방법
JP6918255B1 (ja) * 2018-06-27 2021-08-11 グーグル エルエルシーGoogle LLC 局所的なテキスト応答マップを利用する、ユーザの口頭発話への応答のレンダリング
KR102527107B1 (ko) * 2018-08-08 2023-05-02 삼성전자주식회사 음성에 기반하여 기능을 실행하기 위한 방법 및 이를 지원하는 사용자 전자 장치
KR102563314B1 (ko) * 2018-08-30 2023-08-04 삼성전자주식회사 전자 장치 및 단축 명령어의 바로가기 생성 방법
KR20200042627A (ko) 2018-10-16 2020-04-24 삼성전자주식회사 전자 장치 및 그 제어 방법
CN109448709A (zh) * 2018-10-16 2019-03-08 华为技术有限公司 一种终端投屏的控制方法和终端
KR102651413B1 (ko) * 2018-10-17 2024-03-27 삼성전자주식회사 전자 장치 및 전자 장치의 제어 방법
CN109408024A (zh) * 2018-10-18 2019-03-01 珠海格力电器股份有限公司 信息交互方法及装置、存储介质、处理器
US10885912B2 (en) * 2018-11-13 2021-01-05 Motorola Solutions, Inc. Methods and systems for providing a corrected voice command
CN109493851A (zh) * 2018-11-20 2019-03-19 新视家科技(北京)有限公司 一种语音控制方法、相关装置及存储介质
CN111312253A (zh) * 2018-12-11 2020-06-19 青岛海尔洗衣机有限公司 语音控制方法、云端服务器及终端设备
CN111312234A (zh) * 2018-12-11 2020-06-19 青岛海尔洗衣机有限公司 语音控制方法、云端处理器及终端设备
CN109495360A (zh) * 2018-12-18 2019-03-19 深圳国美云智科技有限公司 一种智能家居物联平台、离线语音控制方法及系统
JP7275795B2 (ja) * 2019-04-15 2023-05-18 コニカミノルタ株式会社 操作受付装置、制御方法、画像形成システム、及び、プログラム
JP2021004980A (ja) * 2019-06-26 2021-01-14 株式会社アール・イー・ハヤシ 生活支援マルチリモコン及び生活支援マルチリモコンシステム
US11508375B2 (en) 2019-07-03 2022-11-22 Samsung Electronics Co., Ltd. Electronic apparatus including control command identification tool generated by using a control command identified by voice recognition identifying a control command corresponding to a user voice and control method thereof
JP7354301B2 (ja) * 2019-10-15 2023-10-02 グーグル エルエルシー 自動アシスタントによって応答アクションをトリガするためのホットコマンドの検出および/または登録
KR20210061091A (ko) 2019-11-19 2021-05-27 삼성전자주식회사 인텔리전트 어시스턴스 서비스를 제공하기 위한 전자 장치 및 그의 동작 방법
CN110992955A (zh) * 2019-12-25 2020-04-10 苏州思必驰信息科技有限公司 一种智能设备的语音操作方法、装置、设备及存储介质
KR102344044B1 (ko) * 2020-01-22 2021-12-27 주식회사 엘지유플러스 셋탑 단말 및 이의 동작 방법
CN112002316A (zh) * 2020-07-30 2020-11-27 珠海格力电器股份有限公司 一种电器控制方法、装置、存储介质及终端
JP7459760B2 (ja) 2020-10-27 2024-04-02 セイコーエプソン株式会社 表示システムの制御方法、表示システム
CN113593555A (zh) * 2021-07-23 2021-11-02 北京百度网讯科技有限公司 通过语音方式控制程序的方法、设备及程序产品

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1448915A (zh) * 2002-04-01 2003-10-15 欧姆龙株式会社 声音识别系统、装置、声音识别方法以及声音识别程序
CN1905007A (zh) * 2005-07-27 2007-01-31 日本电气株式会社 语音识别系统和方法
US20110066634A1 (en) * 2007-03-07 2011-03-17 Phillips Michael S Sending a communications header with voice recording to send metadata for use in speech recognition, formatting, and search in mobile search application

Family Cites Families (75)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL119948A (en) 1996-12-31 2004-09-27 News Datacom Ltd Voice activated communication system and program guide
US6188985B1 (en) 1997-01-06 2001-02-13 Texas Instruments Incorporated Wireless voice-activated device for control of a processor-based host system
JPH10326176A (ja) 1997-05-23 1998-12-08 Oki Hokuriku Syst Kaihatsu:Kk 音声対話制御方法
EP0911808B1 (en) 1997-10-23 2002-05-08 Sony International (Europe) GmbH Speech interface in a home network environment
JP2000075887A (ja) * 1998-08-31 2000-03-14 Sony Corp パターン認識装置、方法及びシステム
JP2000085641A (ja) 1998-09-16 2000-03-28 Kubota Corp クローラ走行装置
FR2783625B1 (fr) * 1998-09-21 2000-10-13 Thomson Multimedia Sa Systeme comprenant un appareil telecommande et un dispositif de telecommande vocale de l'appareil
US7003463B1 (en) 1998-10-02 2006-02-21 International Business Machines Corporation System and method for providing network coordinated conversational services
WO2000058942A2 (en) 1999-03-26 2000-10-05 Koninklijke Philips Electronics N.V. Client-server speech recognition
JP3873513B2 (ja) 1999-03-29 2007-01-24 ソニー株式会社 情報記録装置
US6408272B1 (en) * 1999-04-12 2002-06-18 General Magic, Inc. Distributed voice user interface
US7330815B1 (en) * 1999-10-04 2008-02-12 Globalenglish Corporation Method and system for network-based speech recognition
US7006973B1 (en) 2000-01-31 2006-02-28 Intel Corporation Providing information in response to spoken requests
JP2004503887A (ja) 2000-06-16 2004-02-05 ヘルセテック インコーポレイテッド 携帯情報端末用音声認識装置
US7085716B1 (en) 2000-10-26 2006-08-01 Nuance Communications, Inc. Speech recognition using word-in-phrase command
US20020095294A1 (en) 2001-01-12 2002-07-18 Rick Korfin Voice user interface for controlling a consumer media data storage and playback device
JP3919210B2 (ja) 2001-02-15 2007-05-23 アルパイン株式会社 音声入力案内方法及び装置
US7225130B2 (en) 2001-09-05 2007-05-29 Voice Signal Technologies, Inc. Methods, systems, and programming for performing speech recognition
JP2003114698A (ja) * 2001-10-03 2003-04-18 Denso Corp コマンド受付装置及びプログラム
JP2003131682A (ja) 2001-10-24 2003-05-09 Victor Co Of Japan Ltd 音声コマンドによる機器コントロールシステム
US20030120493A1 (en) 2001-12-21 2003-06-26 Gupta Sunil K. Method and system for updating and customizing recognition vocabulary
US9374451B2 (en) 2002-02-04 2016-06-21 Nokia Technologies Oy System and method for multimodal short-cuts to digital services
US20040006477A1 (en) 2002-07-05 2004-01-08 Craner Michael L. Voice-controllable communication gateway for controlling multiple electronic and information appliances
EP1525577B1 (en) * 2002-08-01 2006-06-21 Telefonaktiebolaget LM Ericsson (publ) Method for automatic speech recognition
EP1604350A4 (en) * 2002-09-06 2007-11-21 Voice Signal Technologies Inc METHODS, SYSTEMS AND PROGRAMMING FOR REALIZING VOICE RECOGNITION
JP2004110613A (ja) 2002-09-20 2004-04-08 Toshiba Corp 制御装置、制御プログラム、対象装置及び制御システム
US6889188B2 (en) 2002-11-22 2005-05-03 Intel Corporation Methods and apparatus for controlling an electronic device
KR20050110021A (ko) 2003-03-17 2005-11-22 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 디바이스의 원격 제어 방법
JP2005148151A (ja) * 2003-11-11 2005-06-09 Mitsubishi Electric Corp 音声操作装置
KR20050060910A (ko) * 2003-12-17 2005-06-22 현대자동차주식회사 차량의 음성 명령 인식 방법 및 장치
JP2005249829A (ja) * 2004-03-01 2005-09-15 Advanced Media Inc 音声認識を行うコンピュータネットワークシステム
US20060041926A1 (en) 2004-04-30 2006-02-23 Vulcan Inc. Voice control of multimedia content
JP4554285B2 (ja) 2004-06-18 2010-09-29 トヨタ自動車株式会社 音声認識システム、音声認識方法、及び音声認識プログラム
TWI334703B (en) 2004-09-02 2010-12-11 Inventec Multimedia & Telecom Voice-activated remote control system
US7283850B2 (en) 2004-10-12 2007-10-16 Microsoft Corporation Method and apparatus for multi-sensory speech enhancement on a mobile device
US8942985B2 (en) 2004-11-16 2015-01-27 Microsoft Corporation Centralized method and system for clarifying voice commands
KR100639931B1 (ko) 2004-11-24 2006-11-01 한국전자통신연구원 대화형 음성인식 시스템의 인식오류 수정장치 및 그 방법
US7529677B1 (en) 2005-01-21 2009-05-05 Itt Manufacturing Enterprises, Inc. Methods and apparatus for remotely processing locally generated commands to control a local device
KR100725719B1 (ko) 2005-02-04 2007-06-08 주식회사 유진로봇 음성과 태스크 오브젝트 기반의 대화시스템
JP4574390B2 (ja) 2005-02-22 2010-11-04 キヤノン株式会社 音声認識方法
US20060235701A1 (en) 2005-04-13 2006-10-19 Cane David A Activity-based control of a set of electronic devices
JP2007052397A (ja) * 2005-07-21 2007-03-01 Denso Corp 操作装置
JP2007226388A (ja) * 2006-02-22 2007-09-06 Konica Minolta Medical & Graphic Inc コマンド入力装置及びプログラム
US20070276651A1 (en) * 2006-05-23 2007-11-29 Motorola, Inc. Grammar adaptation through cooperative client and server based speech recognition
US8150699B2 (en) 2007-05-17 2012-04-03 Redstart Systems, Inc. Systems and methods of a structured grammar for a speech recognition command system
US9794348B2 (en) * 2007-06-04 2017-10-17 Todd R. Smith Using voice commands from a mobile device to remotely access and control a computer
US20090018830A1 (en) 2007-07-11 2009-01-15 Vandinburg Gmbh Speech control of computing devices
US8438024B2 (en) 2007-10-05 2013-05-07 International Business Machines Corporation Indexing method for quick search of voice recognition results
CN102047322B (zh) * 2008-06-06 2013-02-06 株式会社雷特龙 语音识别装置、语音识别方法以及电子设备
WO2010018796A1 (ja) * 2008-08-11 2010-02-18 旭化成株式会社 例外語辞書作成装置、例外語辞書作成方法及びそのプログラム、並びに、音声認識装置及び音声認識方法
US20100131280A1 (en) 2008-11-25 2010-05-27 General Electric Company Voice recognition system for medical devices
KR101513635B1 (ko) * 2008-12-05 2015-04-22 엘지전자 주식회사 단말기 및 그 제어 방법
US8224644B2 (en) * 2008-12-18 2012-07-17 Microsoft Corporation Utterance processing for network-based speech recognition utilizing a client-side cache
JP5437095B2 (ja) 2009-05-19 2014-03-12 東芝機械株式会社 敷ブロックの配置方法、敷ブロック移動用工具、および、その工具を備えた工作機械
US11012732B2 (en) 2009-06-25 2021-05-18 DISH Technologies L.L.C. Voice enabled media presentation systems and methods
US20110099507A1 (en) 2009-10-28 2011-04-28 Google Inc. Displaying a collection of interactive elements that trigger actions directed to an item
US20110184740A1 (en) 2010-01-26 2011-07-28 Google Inc. Integration of Embedded and Network Speech Recognizers
WO2011163538A1 (en) * 2010-06-24 2011-12-29 Honda Motor Co., Ltd. Communication system and method between an on-vehicle voice recognition system and an off-vehicle voice recognition system
KR20120020853A (ko) 2010-08-31 2012-03-08 엘지전자 주식회사 이동 단말기 및 그 제어방법
US20120078635A1 (en) 2010-09-24 2012-03-29 Apple Inc. Voice control system
JP2012088370A (ja) 2010-10-15 2012-05-10 Denso Corp 音声認識システム、音声認識端末、およびセンター
KR101789619B1 (ko) 2010-11-22 2017-10-25 엘지전자 주식회사 멀티미디어 장치에서 음성과 제스쳐를 이용한 제어 방법 및 그에 따른 멀티미디어 장치
JP5771002B2 (ja) * 2010-12-22 2015-08-26 株式会社東芝 音声認識装置、音声認識方法および音声認識装置を搭載したテレビ受像機
US8914287B2 (en) 2010-12-31 2014-12-16 Echostar Technologies L.L.C. Remote control audio link
US20120170572A1 (en) 2011-01-03 2012-07-05 Samsung Electronics Co., Ltd. Method for Enhancing Phone Conversations
KR20120080069A (ko) 2011-01-06 2012-07-16 삼성전자주식회사 디스플레이 장치 및 그 음성 제어 방법
US9953653B2 (en) * 2011-01-07 2018-04-24 Nuance Communications, Inc. Configurable speech recognition system using multiple recognizers
JP5606951B2 (ja) 2011-02-15 2014-10-15 アルパイン株式会社 音声認識システムおよびこれを用いた検索システム
KR101390823B1 (ko) 2011-04-14 2014-05-09 삼성중공업 주식회사 선박용 열교환기
JP5916054B2 (ja) * 2011-06-22 2016-05-11 クラリオン株式会社 音声データ中継装置、端末装置、音声データ中継方法、および音声認識システム
US9009041B2 (en) * 2011-07-26 2015-04-14 Nuance Communications, Inc. Systems and methods for improving the accuracy of a transcription using auxiliary data such as personal data
US8972263B2 (en) * 2011-11-18 2015-03-03 Soundhound, Inc. System and method for performing dual mode speech recognition
EP2783365B1 (en) * 2011-11-21 2018-02-21 Robert Bosch GmbH Method and system for adapting grammars in hybrid speech recognition engines for enhancing local speech recognition performance
US8825020B2 (en) 2012-01-12 2014-09-02 Sensory, Incorporated Information access and device control using mobile phones and audio in the home environment
US9031848B2 (en) 2012-08-16 2015-05-12 Nuance Communications, Inc. User interface for searching a bundled service content data source

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1448915A (zh) * 2002-04-01 2003-10-15 欧姆龙株式会社 声音识别系统、装置、声音识别方法以及声音识别程序
CN1905007A (zh) * 2005-07-27 2007-01-31 日本电气株式会社 语音识别系统和方法
US20110066634A1 (en) * 2007-03-07 2011-03-17 Phillips Michael S Sending a communications header with voice recording to send metadata for use in speech recognition, formatting, and search in mobile search application

Cited By (72)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11671920B2 (en) 2007-04-03 2023-06-06 Apple Inc. Method and system for operating a multifunction portable electronic device using voice-activation
US11979836B2 (en) 2007-04-03 2024-05-07 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US11900936B2 (en) 2008-10-02 2024-02-13 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US11321116B2 (en) 2012-05-15 2022-05-03 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US11862186B2 (en) 2013-02-07 2024-01-02 Apple Inc. Voice trigger for a digital assistant
US11557310B2 (en) 2013-02-07 2023-01-17 Apple Inc. Voice trigger for a digital assistant
CN104517606A (zh) * 2013-09-30 2015-04-15 腾讯科技(深圳)有限公司 语音识别测试方法及装置
WO2015165257A1 (zh) * 2014-04-30 2015-11-05 中兴通讯股份有限公司 语音识别方法、装置、系统及计算机存储介质
CN105023575A (zh) * 2014-04-30 2015-11-04 中兴通讯股份有限公司 语音识别方法、装置和系统
CN105023575B (zh) * 2014-04-30 2019-09-17 中兴通讯股份有限公司 语音识别方法、装置和系统
CN106233743A (zh) * 2014-05-01 2016-12-14 索尼公司 通信装置或通信方法以及计算机程序
CN103985160A (zh) * 2014-05-12 2014-08-13 深圳市威富多媒体有限公司 一种基于计算机及语音控制的车牌管理方法及装置
US11257504B2 (en) 2014-05-30 2022-02-22 Apple Inc. Intelligent assistant for home automation
US11699448B2 (en) 2014-05-30 2023-07-11 Apple Inc. Intelligent assistant for home automation
US11810562B2 (en) 2014-05-30 2023-11-07 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
CN111856959A (zh) * 2014-05-30 2020-10-30 苹果公司 用于家庭自动化的智能助理
US11838579B2 (en) 2014-06-30 2023-12-05 Apple Inc. Intelligent automated assistant for TV user interactions
CN105448293A (zh) * 2014-08-27 2016-03-30 北京羽扇智信息科技有限公司 语音监听及处理方法和设备
CN105448293B (zh) * 2014-08-27 2019-03-12 北京羽扇智信息科技有限公司 语音监听及处理方法和设备
CN106796496A (zh) * 2014-09-05 2017-05-31 Lg 电子株式会社 显示设备及其操作方法
CN106796496B (zh) * 2014-09-05 2020-09-18 Lg 电子株式会社 显示设备及其操作方法
US10586536B2 (en) 2014-09-05 2020-03-10 Lg Electronics Inc. Display device and operating method therefor
US11842734B2 (en) 2015-03-08 2023-12-12 Apple Inc. Virtual assistant activation
US11947873B2 (en) 2015-06-29 2024-04-02 Apple Inc. Virtual assistant for media playback
US11550542B2 (en) 2015-09-08 2023-01-10 Apple Inc. Zero latency digital assistant
US11954405B2 (en) 2015-09-08 2024-04-09 Apple Inc. Zero latency digital assistant
US11809886B2 (en) 2015-11-06 2023-11-07 Apple Inc. Intelligent automated assistant in a messaging environment
CN105719650A (zh) * 2016-01-30 2016-06-29 深圳市尔木科技有限责任公司 一种语音识别的方法及系统
CN105913839A (zh) * 2016-05-30 2016-08-31 合肥华凌股份有限公司 一种智能冰箱、服务器及语音控制系统和方法
US11657820B2 (en) 2016-06-10 2023-05-23 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US11749275B2 (en) 2016-06-11 2023-09-05 Apple Inc. Application integration with a digital assistant
CN107967915A (zh) * 2016-10-20 2018-04-27 三星电子株式会社 显示装置及其控制方法
CN107086037A (zh) * 2017-03-17 2017-08-22 上海庆科信息技术有限公司 一种嵌入式设备的语音交互方法、装置及嵌入式设备
US11467802B2 (en) 2017-05-11 2022-10-11 Apple Inc. Maintaining privacy of personal information
US11837237B2 (en) 2017-05-12 2023-12-05 Apple Inc. User-specific acoustic models
US11580990B2 (en) 2017-05-12 2023-02-14 Apple Inc. User-specific acoustic models
US11862151B2 (en) 2017-05-12 2024-01-02 Apple Inc. Low-latency intelligent automated assistant
US11538469B2 (en) 2017-05-12 2022-12-27 Apple Inc. Low-latency intelligent automated assistant
CN111417924A (zh) * 2017-11-23 2020-07-14 三星电子株式会社 电子设备及其控制方法
CN111417924B (zh) * 2017-11-23 2024-01-09 三星电子株式会社 电子装置及其控制方法
CN110177185A (zh) * 2018-02-19 2019-08-27 柯尼卡美能达株式会社 图像处理装置、图像处理装置的控制方法及记录介质
US10911618B2 (en) 2018-02-19 2021-02-02 Konica Minolta, Inc. Image processing device for receiving an operation instruction by a voice, method for controlling image processing device, and program
CN111771185A (zh) * 2018-02-26 2020-10-13 三星电子株式会社 用于执行语音命令的方法及系统
US11900923B2 (en) 2018-05-07 2024-02-13 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US11907436B2 (en) 2018-05-07 2024-02-20 Apple Inc. Raise to speak
US11487364B2 (en) 2018-05-07 2022-11-01 Apple Inc. Raise to speak
CN112136006A (zh) * 2018-05-18 2020-12-25 三星电子株式会社 空调及其控制方法
US11530836B2 (en) 2018-05-18 2022-12-20 Samsung Electronics Co., Ltd. Air conditioner and control method thereof
CN112136006B (zh) * 2018-05-18 2023-01-17 三星电子株式会社 空调及其控制方法
US11360577B2 (en) 2018-06-01 2022-06-14 Apple Inc. Attention aware virtual assistant dismissal
US11630525B2 (en) 2018-06-01 2023-04-18 Apple Inc. Attention aware virtual assistant dismissal
CN108510990A (zh) * 2018-07-04 2018-09-07 百度在线网络技术(北京)有限公司 语音识别方法、装置、用户设备及存储介质
CN110910869B (zh) * 2018-09-14 2022-02-18 成都启英泰伦科技有限公司 一种语音识别方法和设备
CN110910869A (zh) * 2018-09-14 2020-03-24 成都启英泰伦科技有限公司 一种语音识别方法和设备
US11893992B2 (en) 2018-09-28 2024-02-06 Apple Inc. Multi-modal inputs for voice commands
CN111063345A (zh) * 2018-10-17 2020-04-24 三星电子株式会社 电子装置、其控制方法、以及该电子装置的声音输出控制系统
CN111063345B (zh) * 2018-10-17 2024-01-05 三星电子株式会社 电子装置、其控制方法、以及该电子装置的声音输出控制系统
US11783815B2 (en) 2019-03-18 2023-10-10 Apple Inc. Multimodality in digital assistant systems
CN111754996A (zh) * 2019-03-29 2020-10-09 阿里巴巴集团控股有限公司 基于语音模拟遥控器的控制方法、装置及电子设备
US11675491B2 (en) 2019-05-06 2023-06-13 Apple Inc. User configurable task triggers
US11705130B2 (en) 2019-05-06 2023-07-18 Apple Inc. Spoken notifications
US11888791B2 (en) 2019-05-21 2024-01-30 Apple Inc. Providing message response suggestions
US11790914B2 (en) 2019-06-01 2023-10-17 Apple Inc. Methods and user interfaces for voice-based control of electronic devices
CN112147903A (zh) * 2019-06-26 2020-12-29 百度在线网络技术(北京)有限公司 一种设备的控制方法、装置及计算机可读存储介质
US11765209B2 (en) 2020-05-11 2023-09-19 Apple Inc. Digital assistant hardware abstraction
US11914848B2 (en) 2020-05-11 2024-02-27 Apple Inc. Providing relevant data items based on context
US11924254B2 (en) 2020-05-11 2024-03-05 Apple Inc. Digital assistant hardware abstraction
US11838734B2 (en) 2020-07-20 2023-12-05 Apple Inc. Multi-device audio adjustment coordination
US11750962B2 (en) 2020-07-21 2023-09-05 Apple Inc. User identification using headphones
US11696060B2 (en) 2020-07-21 2023-07-04 Apple Inc. User identification using headphones
CN113411722A (zh) * 2021-06-04 2021-09-17 深圳市右转智能科技有限责任公司 一种智能背景音乐系统
US12001933B2 (en) 2022-09-21 2024-06-04 Apple Inc. Virtual assistant in a communication session

Also Published As

Publication number Publication date
EP2750129A1 (en) 2014-07-02
US20140095176A1 (en) 2014-04-03
KR20140042641A (ko) 2014-04-07
KR101330671B1 (ko) 2013-11-15
US20140095174A1 (en) 2014-04-03
US11086596B2 (en) 2021-08-10
US20140092007A1 (en) 2014-04-03
JP2014071457A (ja) 2014-04-21
EP2713366A1 (en) 2014-04-02
KR102004872B1 (ko) 2019-07-29
BR102013002468B1 (pt) 2020-10-20
BR102013002468A2 (pt) 2014-10-21
EP2713366B1 (en) 2016-08-10
US20190026075A1 (en) 2019-01-24
JP2014071449A (ja) 2014-04-21
US9582245B2 (en) 2017-02-28
US10120645B2 (en) 2018-11-06
KR20190088945A (ko) 2019-07-29
RU2627117C2 (ru) 2017-08-03
CN109979465B (zh) 2024-02-20
RU2015111180A (ru) 2016-10-20
KR20140042642A (ko) 2014-04-07
WO2014051207A1 (en) 2014-04-03
FR2996343B3 (fr) 2015-05-15
KR102169520B1 (ko) 2020-10-23
CN109979465A (zh) 2019-07-05
EP4050599A1 (en) 2022-08-31
AU2012261531A1 (en) 2014-04-17
FR2996343A3 (fr) 2014-04-04

Similar Documents

Publication Publication Date Title
CN103714816A (zh) 电子装置、服务器及其控制方法
WO2016185809A1 (ja) 情報処理装置、情報処理方法およびプログラム
KR101300272B1 (ko) 가전 기기 및 그 동작 방법
CN100530085C (zh) 实现虚拟语音一键通功能的方法和装置
CN102842306A (zh) 语音控制方法及装置、语音响应方法及装置
KR102489914B1 (ko) 전자 장치 및 이의 제어 방법
CN102763159A (zh) 话音输入的处理
CN110457105B (zh) 界面操作方法、装置、设备及存储介质
CN103914234A (zh) 交互服务器及其控制方法和交互系统
CN112419693B (zh) 设备控制方法、装置、显示设备及计算机可读存储介质
CN104272709A (zh) 推断的上下文的日程表匹配和标签传播
CN104184890A (zh) 一种信息处理方法及电子设备
CN103607641A (zh) 智能电视中的用户登录方法及装置
CN105867317B (zh) 一种指令下达、接收方法、装置及智能家居系统
US20200410988A1 (en) Information processing device, information processing system, and information processing method, and program
CN111833585A (zh) 智能设备学习遥控功能的方法、装置、设备及存储介质
CN112634896B (zh) 智能终端上应用程序的运行方法和智能终端
US20210090431A1 (en) Device control signal registration apparatus, device control signal registration system, device control signal registration method, and device control signal registration program storing medium
CN108776450B (zh) 扫地机器人服务系统及计算机可读存储介质
EP2960795A1 (en) A computer implemented non-intrusive remote monitoring and capturing system and a method thereof
CN114067792A (zh) 一种智能设备的控制方法及装置
CN110543556A (zh) 对话配置方法及存储介质和电子设备
US20230188799A1 (en) Display device and operation method for same
CN118034637A (zh) 泛终端感知交互处理方法、控制装置及存储介质
CN114005443A (zh) 设备控制方法、装置、服务器及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20140409

RJ01 Rejection of invention patent application after publication