CN107564517A - 语音唤醒方法、设备及系统、云端服务器与可读介质 - Google Patents
语音唤醒方法、设备及系统、云端服务器与可读介质 Download PDFInfo
- Publication number
- CN107564517A CN107564517A CN201710543572.8A CN201710543572A CN107564517A CN 107564517 A CN107564517 A CN 107564517A CN 201710543572 A CN201710543572 A CN 201710543572A CN 107564517 A CN107564517 A CN 107564517A
- Authority
- CN
- China
- Prior art keywords
- smart machine
- request
- cloud server
- user
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 90
- 238000012545 processing Methods 0.000 claims abstract description 97
- 238000001514 detection method Methods 0.000 claims description 19
- 230000005540 biological transmission Effects 0.000 claims description 14
- 230000000694 effects Effects 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 4
- 230000002618 waking effect Effects 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000005291 magnetic effect Effects 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 230000011664 signaling Effects 0.000 description 4
- 239000003795 chemical substances by application Substances 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000005059 dormancy Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 239000000686 essence Substances 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000000284 resting effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
- G10L17/24—Interactive procedures; Man-machine interfaces the user being prompted to utter a password or a predefined phrase
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/32—Means for saving power
- G06F1/3203—Power management, i.e. event-based initiation of a power-saving mode
- G06F1/3206—Monitoring of events, devices or parameters that trigger a change in power modality
- G06F1/3231—Monitoring the presence, absence or movement of users
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L15/222—Barge in, i.e. overridable guidance for interrupting prompts
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Telephonic Communication Services (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本发明提供一种语音唤醒方法、设备及系统、云端服务器与可读介质。其方法包括:智能设备进入语音识别阶段后,接收用户通过语音方式输入的第一请求;判断语义解析后的所述第一请求与预存储的唤醒词是否一致;若一致,确定接收的所述第一请求用于重新唤醒所述智能设备。本发明的技术方案,在智能设备进入语音识别阶段后,若接收的第一请求为唤醒词,不会对该第一请求进行服务满足处理,而能够识别该第一请求为重新唤醒,不会造成命令识别错误,从而能够满足用户的预期。本发明的语音唤醒方案,能够有效地处理用户的请求,从而能够有效地提高用户的使用体验度。
Description
【技术领域】
本发明涉及计算机应用技术领域,尤其涉及一种语音唤醒方法、智能设备、服务器、设备及可读介质。
【背景技术】
随着科技的发展,为了更加方便用户使用智能设备,现有的很多智能设备支持用户进行语音输入。
由于智能设备若长期在线,会造成智能设备的功耗较大,寿命较短。因此,现有的智能设备在不工作的时候可以处于休眠状态,以节省功耗。在用户需要使用智能设备的时候,可以通过唤醒词将智能设备唤醒。然后智能设备进入语音识别状态。在该状态下,智能设备接收用户输入的语音形式的请求,并配合云端服务器实现对用户的语音进行识别、语义进行分析、并满足用户所请求的服务。现有技术中,用户在唤醒智能设备的时候,若语音输入了至少两次唤醒词,第一遍的唤醒词可以被识别为用于唤醒智能设备,而其后的唤醒词会被识别为语音请求的输入,此时智能设备配合云端服务器根据该唤醒词查询用户所请求的服务。
因此,现有的语音唤醒方案,若唤醒时输入至少两次唤醒词,其后的唤醒词会被误认为是用户的语音请求,造成命令识别错误,且无法满足用户的预期。
【发明内容】
本发明提供了一种语音唤醒方法、智能设备、服务器、设备及可读介质,用于提高命令识别的准确性,满足用户的预期。
本发明提供一种语音唤醒方法,所述方法包括:
智能设备进入语音识别阶段后,接收用户通过语音方式输入的第一请求;
判断语义解析后的所述第一请求与预存储的唤醒词是否一致;
若一致,确定接收的所述第一请求用于重新唤醒所述智能设备。
进一步可选地,如上所述的方法中,智能设备进入语音识别阶段后,接收用户通过语音方式输入的第一请求之前,所述方法还包括:
接收所述用户通过语音方式输入的第二请求;
根据所述第二请求,在本地的服务信息库中查询到所述第二请求对应的服务,并开始实施所述第二请求对应的服务满足处理;
进一步地,确定接收的所述第一请求用于重新唤醒所述智能设备之后,所述方法还包括:
停止所述第二请求对应的服务满足处理。
进一步可选地,如上所述的方法中,智能设备进入语音识别阶段时,接收用户通过语音方式输入的第一请求之前,所述方法还包括:
接收所述用户通过语音方式输入的第二请求;
向云端服务器发送所述智能设备标识和所述第二请求,以供所述云端服务器开始在所述智能设备上实施所述第二请求对应的服务满足处理;
进一步地,确定接收的所述第一请求用于重新唤醒所述智能设备之后,所述方法还包括:
向所述云端服务器发送携带所述智能设备的标识的重新唤醒通知消息,以供所述云端服务器根据所述智能设备的标识,确定对应的所述智能设备重新唤醒;并停止所述第二请求对应的服务满足处理;或者
向所述云端服务器发送所述智能设备的标识和所述第一请求,以供所述云端服务器根据所述智能设备的标识获取预存储的所述智能设备的唤醒词,并判断语义解析后的所述第一请求与预存储的所述唤醒词是否一致;若一致,确定接收的所述第一请求用于重新唤醒所述智能设备,停止所述第二请求对应的服务满足处理。
进一步可选地,如上所述的方法中,接收所述用户通过语音方式输入的第二请求之后,向云端服务器发送携带所述智能设备标识的所述第二请求之前,所述方法还包括:
在所述智能设备本地的服务信息库中未查询到所述第二请求对应的服务。
进一步可选地,如上所述的方法中,向云端服务器发送所述智能设备标识和所述第二请求之后,所述方法还包括:
获取当前时刻与向所述云端服务器发送所述第二请求的时刻的时间差;
向所述用户显示所述时间差,直到接收到所述云端服务器发送的所述第二请求的服务反馈,取消显示;
接收所述用户语音输入的所述唤醒词,以重新唤醒所述智能设备;所述唤醒词为所述用户根据显示的所述时间差,确定所述时间差大于预设时间长度时发出的;
或者,向云端服务器发送所述智能设备标识和所述第二请求之后,所述方法还包括:
检测发送所述第二请求之后的预设时间长度内是否收到所述云端服务器的服务反馈;
若未收到,向所述用户显示重新唤醒的提示消息;
接收所述用户语音输入的所述唤醒词,以重新唤醒所述智能设备。
本发明还提供一种语音唤醒方法,所述方法包括:
若智能设备进入语音识别阶段后,接收所述智能设备发送的所述智能设备的标识和第一请求,所述第一请求为所述智能设备接收用户输入的;
根据所述智能设备的标识获取预存储的所述智能设备的唤醒词;
判断语义解析后的所述第一请求与预存储的所述唤醒词是否一致;
若一致,确定接收的所述第一请求用于重新唤醒所述智能设备。
进一步可选地,如上所述的方法中,接收所述智能设备发送的所述智能设备的标识和第一请求之前,所述方法还包括:
接收所述智能设备发送的所述智能设备的标识和第二请求,所述第二请求为所述智能设备接收用户输入的;
开始在所述智能设备上实施所述第二请求对应的服务满足处理;
确定接收的所述第一请求用于重新唤醒所述智能设备之后,所述方法还包括:
停止所述第二请求对应的服务满足处理。
本发明提供一种智能设备,所述智能设备包括:
接收模块,用于在所述智能设备进入语音识别阶段后,接收用户通过语音方式输入的第一请求;
判断模块,用于判断语义解析后的所述第一请求与预存储的唤醒词是否一致;
确定模块,用于若所述第一请求与预存储的所述唤醒词一致,确定接收的所述第一请求用于重新唤醒所述智能设备。
进一步可选地,如上所述的智能设备,所述智能设备还包括服务满足处理模块:
所述接收模块,还用于接收所述用户通过语音方式输入的第二请求;
服务满足处理模块,用于根据所述第二请求,在本地的服务信息库中查询到所述第二请求对应的服务,并开始实施所述第二请求对应的服务满足处理;
进一步地,所述服务满足处理模块,还用于停止所述第二请求对应的服务满足处理。
进一步可选地,如上所述的智能设备中,还包括发送模块;
所述接收模块,还用于接收所述用户通过语音方式输入的第二请求;
所述发送模块,用于向云端服务器发送所述智能设备标识和所述第二请求,以供所述云端服务器开始在所述智能设备上实施所述第二请求对应的服务满足处理;
进一步地,所述发送模块,还用于向所述云端服务器发送携带所述智能设备的标识的重新唤醒通知消息,以供所述云端服务器根据所述智能设备的标识,确定对应的所述智能设备重新唤醒;并停止所述第二请求对应的服务满足处理;
或者所述发送模块,还用于向所述云端服务器发送所述智能设备的标识和所述第一请求,以供所述云端服务器根据所述智能设备的标识获取预存储的所述智能设备的唤醒词,并判断语义解析后的所述第一请求与预存储的所述唤醒词是否一致;若一致,确定接收的所述第一请求用于重新唤醒所述智能设备,停止所述第二请求对应的服务满足处理。
进一步可选地,如上所述的智能设备中,所述服务满足处理模块,还用于在所述智能设备本地的服务信息库中未查询到所述第二请求对应的服务。
进一步可选地,如上所述的智能设备中,还包括获取模块和显示模块;
所述获取模块,用于获取当前时刻与向所述云端服务器发送所述第二请求的时刻的时间差;
所述显示模块,用于向所述用户显示所述时间差,直到接收到所述云端服务器发送的所述第二请求的服务反馈,取消显示;
所述接收模块,还用于接收所述用户语音输入的所述唤醒词,以重新唤醒所述智能设备;所述唤醒词为所述用户根据显示的所述时间差,确定所述时间差大于预设时间长度时发出的;
或者,所述智能设备还包括检测模块:
所述检测模块,用于检测发送所述第二请求之后的预设时间长度内是否收到所述云端服务器的服务反馈;
所述显示模块,还用于若所述检测模块检测发送所述第二请求之后的预设时间长度内未收到所述云端服务器的服务反馈,向所述用户显示重新唤醒的提示消息;
所述接收模块,还用于接收所述用户语音输入的所述唤醒词,以重新唤醒所述智能设备。
本发明还提供一种云端服务器,所述云端服务器包括:
接收模块,用于若智能设备进入语音识别阶段后,接收所述智能设备发送的所述智能设备的标识和第一请求,所述第一请求为所述智能设备接收用户输入的;
获取模块,用于根据所述智能设备的标识获取预存储的所述智能设备的唤醒词;
判断模块,用于判断语义解析后的所述第一请求与预存储的所述唤醒词是否一致;
确定模块,用于若所述判断模块判断语义解析后的所述第一请求与预存储的所述唤醒词一致,确定接收的所述第一请求用于重新唤醒所述智能设备。
进一步可选地,如上所述的云端服务器中,还包括服务满足处理模块:
所述接收模块,还用于接收所述智能设备发送的所述智能设备的标识和第二请求,所述第二请求为所述智能设备接收用户输入的;
所述服务满足处理模块,用于开始在所述智能设备上实施所述第二请求对应的服务满足处理;
进一步地,所述服务满足处理模块,还用于停止所述第二请求对应的服务满足处理。
本发明还提供一种语音唤醒系统,所述系统包括智能设备和所述云端服务器;所述智能设备与所述云端服务器通信连接;所述智能设备采用如上所述的智能设备,所述云端服务器采用如上所述的云端服务器。
本发明还提供一种智能设备,所述智能设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上所述的语音唤醒方法。
本发明还提供一种云端服务器,所述云端服务器包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上所述的语音唤醒方法。
本发明还提供一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如上所述的语音唤醒方法。
本发明的语音唤醒方法、智能设备、服务器、设备及可读介质,通过采用上述技术方案,在智能设备进入语音识别阶段后,若接收的用户的第一请求为唤醒词,不会对该第一请求进行服务满足处理,而能够识别该第一请求为重新唤醒,不会造成命令识别错误,从而能够满足用户的预期。本发明的语音唤醒方案,能够有效地处理用户的请求,从而能够有效地提高用户的使用体验度。
【附图说明】
图1为本发明的语音唤醒方法实施例一的流程图。
图2为本发明的语音唤醒方法实施例二的流程图。
图3为本发明的语音唤醒方法实施例三的信令图。
图4为本发明的语音唤醒方法实施例四的信令图。
图5为本发明的智能设备实施例一的结构图。
图6为本发明的智能设备实施例二的结构图。
图7为本发明的云端服务器实施例一的结构图。
图8为本发明的云端服务器实施例二的结构图。
图9为本发明的语音唤醒系统实施例的结构图。
图10为本发明的智能设备实施例的结构图。
图11为本发明提供的一种云端服务器的示例图。
【具体实施方式】
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。
图1为本发明的语音唤醒方法实施例一的流程图。如图1所示,本实施例的语音唤醒方法,具体可以包括如下步骤:
100、智能设备进入语音识别阶段后,接收用户通过语音方式输入的第一请求;
本实施例的语音唤醒方法的执行主体为智能设备,例如本实施例的智能设备可以为手机、平板电脑或者其他安装有Android操作系统(Operating System;OS)、IOS的OS或者Linux嵌入式OS的硬件设备。
本实施例的智能设备在使用时,可以支持语音输入,为了减少功耗,本实施例的智能设备在长时间不用的时候可以处于待机状态。然后用户可以对智能设备输入唤醒词,唤醒智能设备。然后智能设备进入语音识别阶段。
例如,可以设置预设时间阈值,若智能设备在预设时间阈值的时间长度内没有接收到任何语音输入,此时智能设备进入待机阶段。具体地,预设时间阈值可以存储在智能设备内,由智能设备自身检测是否在预设时间阈值的时间长度内没有接收到用户的任何语音输入,若是,进入待机阶段。
或者也可以由与智能设备远程无线通信的云端服务器存储该预设时间阈值。智能设备在工作时,仅接收用户的语音请求,然后将用户的语音请求发送给云端服务器,由云端服务器进行处理。假设智能设置没有故障且网络正常的时候,若云端服务器在预设时间阈值的时间长度内没有接收到智能设备发送的任何语音输入,可以确定用户在预设时间阈值的时间长度内没有向智能设备发送任何语音输入。此时云端服务器可以向智能设备发送进入休眠的指示消息,然后智能设备根据接收到的指示消息,降低功耗,进入休眠阶段。
智能设备进入语音识别阶段之后,智能设备接收到用户的语音请求之后,可以独自对用户的语音请求进行处理,也可以配合云端服务器对用户的语音请求进行处理,处理过程可以包括:语音识别、语义解析以及服务满足。也就是说,先对用户输入的语音进行识别,识别为文字信息,然后对识别的文字信息进行语义解析,分析用户的意图即用户的请求;最后,确定用户的请求对应的服务,并满足用户的服务。智能设备可以完全解放,像上述方式一样,接收到用户的语音请求之后,直接发送给云端服务器,由云端服务器进行语音识别、语义解析以及服务满足的处理。或者若智能设备具有一定的处理能力,存储有一定的服务信息库,其中语音识别、语义解析以及服务满足均可以在智能设备中进行。而这样对智能设备的要求较高,也可以仅由智能设备进行语义识别和语义解析,然后由云端服务器进行服务满足处理。本实施例的服务满足处理即为向用户提供满足该请求的服务的处理过程。例如请求为“打开相机”,查询“今天的金价”,“今天的汇率”。
本实施例中,以智能设备能够进行语音识别和语义解析为例。进一步地服务满足可以在智能设备侧进行,也可以在云端服务器侧进行。智能设备在已经接收到唤醒词,进入语音识别阶段之后,接收用户通过语音方式输入的第一请求。然后智能设备进一步地对该第一请求进行语音识别和语义解析,解析之后得到该第一请求对应的文字形式。例如,若用户输入的语音形式的第一请求可以为该智能设备的唤醒词,则对应的语音识别、语义解析后的第一请求为文字形式的唤醒词。
101、判断语义解析后的第一请求与预存储的唤醒词是否一致;若一致,执行步骤102;否则,对第一请求进行服务满足处理;
102、确定接收的唤醒词用于重新唤醒智能设备。
本实施例中,可以将语义解析后的第一请求与预存储的唤醒词进行对比,判断语义解析后的第一请求与预存储的唤醒词是否一致,若一致,确定该第一请求用于重新唤醒智能设备。否则继续对第一请求进行服务满足处理。
可选地,如果在实际应用中对智能设备接收的所有第一请求都分别与预存储的唤醒词进行比较,势必造成处理效率低下。所以,可以先获取语义解析后的第一请求的字数,若其字数与预存储的唤醒词的字数相等,再将语义解析后的第一请求与预存储的唤醒词进行比较,判断两者是否一致,可以提高处理效率。
本实施例的语音唤醒方法,智能设备进入语音识别阶段时,通过接收用户通过语音方式输入的第一请求;判断语义解析后的第一请求与预存储的唤醒词是否一致;若一致,确定接收的唤醒词用于重新唤醒智能设备。本实施例的技术方案,在智能设备进入语音识别阶段后,若接收的第一请求为唤醒词,不会对该第一请求进行服务满足处理,而能够识别该第一请求为重新唤醒,不会造成命令识别错误,从而能够满足用户的预期。本实施例的语音唤醒方案,能够有效地处理用户的请求,从而能够有效地提高用户的使用体验度。
可选地,在上述图1所示实施例的步骤100“智能设备进入语音识别阶段后,接收用户通过语音方式输入的第一请求”之前,还可以包括:接收用户通过语音方式输入的第二请求;并根据第二请求,在本地的服务信息库中查询到第二请求对应的服务,并开始实施第二请求对应的服务满足处理。
智能设备进入语音识别阶段之后,智能设备可以处理用户的语音请求。例如,智能设备可以接收用户通过语音方式输入的第二请求。然后可以对该第二请求进行语音识别、语义解析,确定第二请求的字数不等于唤醒词的字数。然后开始对第二请求进行服务满足处理。具体地,可以在智能设备本地的服务信息库中查询该第二请求对应的服务,并为用户提供该服务。例如用户通过语音输入“帮我给XXX拨打个电话”,此时智能设备对该请求语音识别和语义解析之后,可以从服务信息库中查询该“帮我给XXX拨打个电话”对应的服务的吊起方式,然后吊起为用户吊起该服务,即直接从通信录中查询XXX的电话,并拨打。智能设备侧的服务信息库中可以包括能够在智能设备侧实现的所有服务的信息,包括服务的名称如“打电话”,服务的实现方式等等。
此时对应地,在步骤102“确定接收的第一请求用于重新唤醒智能设备”之后,还可以包括:停止第二请求对应的服务满足处理。
也就是说,用户在发出第二请求之后,又向智能设备发送唤醒词,此时,智能设备确定用户需求重新唤醒该智能设备,之前还未实现的服务满足处理均停止,例如若还在查询该第二请求的服务的实现方式,此时停止查询第二请求对应的服务的实现方式;若正在提供第二请求对应的服务,则立即停止为用户提供第二请求对应的服务。
可选地,若本实施例中,智能设备不对第一请求和第二请求进行语音识别和语义解析,直接向云端服务器发送第一请求和第二请求的时候,考虑到语音活性检测(Voiceactivity detection;VAD),第一请求必须在第二请求发送之后的预订的时间阈值之后,可以确保云端服务器收到该第二请求,此时再发送第一请求。预订的时间阈值可以根据实际经验来选取。
上述实施例中,是以智能设备处理语音识别、语义分析以及服务满足为例,可选地,也可以由云端服务器实现服务满足处理,具体地,在步骤100“智能设备进入语音识别阶段时,接收用户通过语音方式输入的第一请求”之前,还可以包括:接收用户通过语音方式输入的第二请求;向云端服务器发送智能设备标识和第二请求,以供云端服务器开始在智能设备上实施第二请求对应的服务满足处理。
同理,智能设备可以将第二请求直接发送给云端服务器,也可以将第二请求进行语音识别和语义解析之后,发送第二请求的语义解析后的文字信息给云端服务器。也就是说,本实施例中的服务满足在云端服务器一侧实现,而语音识别和语义分析可以在智能设备侧实现;当然,实际应用中,语音识别和语义分析也可以在云端服务器侧实现。
进一步地,在步骤102“确定接收的第一请求用于重新唤醒智能设备”之后,还可以包括:向云端服务器发送携带智能设备的标识的重新唤醒通知消息,以供云端服务器根据智能设备的标识,确定对应的智能设备重新唤醒;并停止第二请求对应的服务满足处理。
该种方式中,智能设备进行语音识别和语义解析,而云端服务器实现服务满足处理。智能设备在接收到第一请求之后并进行初步的判断,确定用户需要重新唤醒智能设备,此时智能设备可以直接向云端服务器发送携带智能设备的标识的重新唤醒通知消息。这样云端服务器根据接收的智能设备的标识,确定对应的智能设备重新唤醒;并停止第二请求对应的服务满足处理,例如可以包括停止查询第二请求对应的服务,或停止通过智能设备为用户提供第二请求对应的服务。
或者,在步骤102“确定接收的第一请求用于重新唤醒智能设备”之后,还可以包括:向云端服务器发送智能设备的标识和第一请求,以供云端服务器根据智能设备的标识获取预存储的智能设备的唤醒词,并判断语义解析后的第一请求与预存储的唤醒词是否一致;若一致,确定接收的第一请求用于重新唤醒智能设备,停止第二请求对应的服务满足处理,如可以包括停止查询第二请求对应的服务,或停止通过智能设备为用户提供第二请求对应的服务。
该种方式与上一方式的区别在于,智能设备也可以不将自身检测的结果发送给云端服务器,而是直接向云端服务器发送智能设备的标识和第一请求,由云端服务器根据智能设备的标识获取预存储的智能设备的唤醒词,并判断语义解析后的第一请求与预存储的唤醒词是否一致;若一致,确定接收的第一请求用于重新唤醒智能设备,停止第二请求对应的服务满足处理。
可选地,实际应用中,智能设备和云端服务器都可以实现服务满足,智能设备可以用于实现一些简单的本地能够实现的、离线的服务的满足,而云端服务器用于实现一些较为复杂的,需要借助于网络才能实现的、在线的服务的满足。此时可选地,在上述实施例中的步骤“接收用户通过语音方式输入的第二请求”之后,步骤“向云端服务器发送智能设备标识和第二请求”之前,还可以包括:在智能设备本地的服务信息库中未查询到第二请求对应的服务。智能设备本地的服务信息库中仅记录本地能够实现的服务名称,例如若用户要查询今天的大盘指数,而智能设备本地是无法实现的,此时关于“今天大盘”的服务名称在本地的服务信息库中是没有存储的。此时,在智能设备本地无法实现该第二请求对应的服务的满足时,向云端服务器发送该第二请求,以供云端服务器实现该第二请求对应的服务的满足。例如,可以在智能设备本地实现一些离线的服务,如,拨打电话、打开某应用等等。而在云端服务器实现一些在线的服务,如今天的股市大盘走向,今天的天气,今天的汇率等等。
进一步可选地,在上述实施例的技术方案的基础上,“向云端服务器发送智能设备标识和第二请求”之后,还可以包括如下步骤:获取当前时刻与向云端服务器发送第二请求的时刻的时间差;向用户显示时间差,直到接收到云端服务器发送的第二请求的服务反馈,取消显示;接收用户语音输入的唤醒词,以重新唤醒智能设备;唤醒词为用户根据显示的时间差,确定时间差大于预设时间长度时发出的。
该种实施方式中,由用户确定重新唤醒智能设备,取消之前的请求。具体地,在智能设备每次向云端服务器发送请求之后,可以开启一个计时器,来对当前时刻与向云端服务器发送第二请求的时刻的时间差进行计时。并同时在智能设备的显示屏上向用户显示该时间差。这样用户便可以知道该请求已经发出多长时间,若智能设备接收到云端服务器反馈该请求对应的服务,此时可以取消智能设备的显示屏上的计时器的显示。而若计时器显示的时间差大于预设时间长度,例如60s,还未收到云端服务器的任何服务反馈,智能设备的显示器还在显示逐渐增加的时间差,此时用户可以取消之前的请求,重新唤醒智能设备。具体地,用户向智能设备语音输入唤醒词,并独立操作或者配合云端服务器实现重新唤醒该智能设备,取消重新唤醒之前的请求的服务满足处理。
或者,在上述实施例的技术方案的基础上,“向云端服务器发送智能设备标识和第二请求”之后,还可以包括如下步骤:检测发送第二请求之后的预设时间长度内是否收到云端服务器的服务反馈;若未收到,向用户显示重新唤醒的提示消息;接收用户语音输入的所述唤醒词,以重新唤醒智能设备。
该种实现方式与上述实现方式的区别在于:上述实现方式由用户触发智能设备重新唤醒。而本实现方式由智能设备进行检测,若在发送第二请求之后的预设时间长度内未收到云端服务器的服务反馈,智能设备提示用户重新唤醒智能设备。然后由用户语音输入唤醒词,以重新唤醒智能设备。
上述实施例的语音唤醒方法,可以在需要的时候,对智能终端输入唤醒词,以重新唤醒;而不会被误认为是语音识别,可以保证命令识别的准确性,满足用户的预期。因此,上述实施例的语音唤醒方案,能够有效地处理用户的请求,从而能够有效地提高用户的使用体验度。
图2为本发明的语音唤醒方法实施例二的流程图。如图2所示,本实施例的语音唤醒方法,具体可以包括如下步骤:
200、若智能设备进入语音识别阶段后,接收智能设备发送的智能设备的标识和第一请求,其中第一请求为智能设备接收用户输入的;
201、根据智能设备的标识获取预存储的智能设备的唤醒词;
202、判断语义解析后的第一请求与预存储的唤醒词是否一致;若一致,执行步骤203;否则,对第一请求进行服务满足处理;
203、确定接收的第一请求用于重新唤醒智能设备。
本实施例的语音唤醒方法的执行主体为云端服务器。本实施例中,云端服务器至少提供语音识别阶段的服务满足的实现。而语音识别和语义解析可以在智能设备侧实现,也可以在云端服务器侧实现。若在智能设备侧实现,则步骤200接收智能设备发送的第一请求,为智能设备已经语音识别和语音解析后的文字形式的第一请求,此时可以将智能设备的标识携带在第一请求中。而若语音识别和语义解析在云端服务器侧实现,则步骤200接收智能设备发送的第一请求可以为语音形式的,此时可以对语音形式的第一请求进行语音识别和语义解析。在智能设备侧,接收用户输入的第一请求都是语音形式的。
本实施例的云端服务器可以支持无数个智能设备,因此智能设备向云端服务器发送的每一个消息都需要携带该智能设备的标识,以供云端服务器确定是由哪个智能设备发送的。在云端服务器中存储有每一个智能设备的唤醒词,接收到某个智能设备的请求消息之后,便可以根据请求消息中的该智能设备的标识,获取预先存储的该智能设备的唤醒词。然后判断语义解析后的第一请求与预存储的唤醒词是否一致;若一致,确定接收的第一请求用于重新唤醒智能设备。否则,继续对第一请求进行服务满足处理;
本实施例的语音唤醒方法,在云端服务器侧实现语音唤醒机制,实现原理与上述图1所示实施例的技术方案类似,详细亦可以参考上述图1所示实施例的记载,在此不再赘述。
本实施例的语音唤醒方法,若智能设备进入语音识别阶段后,云端服务器可以接收智能设备发送的智能设备的标识和第一请求,其中第一请求为智能设备接收用户输入的;根据智能设备的标识获取预存储的智能设备的唤醒词;判断语义解析后的第一请求与预存储的唤醒词是否一致;若一致,确定接收的第一请求用于重新唤醒智能设备。本实施例的技术方案,在智能设备进入语音识别阶段后,若接收的请求为唤醒词,不会对该请求进行服务满足处理,而能够识别该请求为重新唤醒,不会造成命令识别错误,从而能够满足用户的预期,本实施例的语音唤醒方案,能够有效地处理用户的请求,从而能够有效地提高用户的使用体验度。
进一步可选地,步骤200“接收智能设备发送的智能设备的标识和第一请求”之前,还可以包括:接收智能设备发送的智能设备的标识和第二请求,第二请求为智能设备接收用户输入的;开始在智能设备上实施第二请求对应的服务满足处理。
步骤203“确定接收的第一请求用于重新唤醒智能设备”之后,还可以包括:停止第二请求对应的服务满足处理,例如可以包括停止查询第二请求对应的服务,或停止通过智能设备为用户提供第二请求对应的服务。
上述步骤的具体实现方式可以参考上述智能设备侧的技术方案,在此不再赘述。基于以上所述,可以到本发明的语音唤醒方法可以单独在智能设备侧实现,也可以在智能设备和云端服务器两侧配合来实现。下面以两侧配合为例,介绍本发明的技术方案。
图3为本发明的语音唤醒方法实施例三的信令图。如图3所示,本实施例的语音唤醒方法,具体可以包括如下步骤:
300、智能设备处于待机状态时,用户向智能设备语音输入唤醒词;
301、智能设备对语音形式的唤醒词进行语音识别和语义解析,获取文字形式的唤醒词;并获取预存储的唤醒词,判断并确定接收的唤醒词与预存储的唤醒词一致,唤醒智能设备,使得智能设备进入语音识别阶段;
本实施例中,智能设备唤醒的一个标志可以为显示屏亮起。
302、智能设备通过显示屏向用户提示“已进入语音识别阶段”;
303、智能设备进入语音识别阶段后,用户第二次向智能设备语音输入唤醒词;
304、智能设备对第二次接收到唤醒词进行语音识别和语义解析,判断并确定语义解析后的唤醒词与预存储的唤醒词一致,确定用户重新唤醒智能设备;
也就是说,确定用户仍在唤醒智能设备,该第二次的唤醒词不会作为语音识别的指令进行语音识别。
305、智能设备进入语音识别阶段后,用户向智能设备语音输入第一服务请求;
306、智能设备对第一服务请求进行语音识别和语义解析,得到文字形式的第一服务请求;
307、智能设备向云端服务器发送携带智能设备标识的第一服务请求;
308、云端服务器根据第一服务请求获取对应的服务结果;
例如,若用户通过智能设备发出“今天天气怎么样”的第一服务请求,而云端服务器可以联网,
309、云端服务器根据智能设备的标识为智能设备提供服务满足的结果;
310、智能设备向用户显示服务满足的结果。
本实施例中以智能设备侧进行语音识别和语义解析,而由云端服务器实现服务满足为例,可选地,上述实施例中,智能设备也可以不进行任何处理,完全解放出来,仅将接收到的所有语音形式的唤醒词或者请求,都直接发送给云端服务器,由云端服务器进行语音识别、语义解析以及服务满足处理,在此不再赘述。
本实施例的语音唤醒方法,通过采用上述技术方案,在智能设备进入语音识别阶段后,若再次接收到唤醒词,不会对该唤醒词进行服务满足处理,而能够识别该唤醒词用于指示智能设备重新唤醒,不会造成命令识别错误,从而能够满足用户的预期,本实施例的语音唤醒方案,能够有效地处理用户的请求,从而能够有效地提高用户的使用体验度。
图4为本发明的语音唤醒方法实施例四的信令图。如图4所示,本实施例的语音唤醒方法,具体可以包括如下步骤:
400、智能设备处于待机状态时,用户向智能设备语音输入唤醒词;
401、智能设备向云端服务器发送语音形式的唤醒词和智能设备的标识;
402、云端服务器对语音形式的唤醒词进行语音识别和语义解析,获取文字形式的唤醒词;并根据智能设备的标识获取预存储的该智能设备对应的唤醒词,判断并确定接收的唤醒词与预存储的唤醒词一致;
403、云端服务器向智能设备发送唤醒提示,使得智能设备进入语音识别阶段;
404、智能设备通过显示屏向用户提示“已进入语音识别阶段”;
可选地,按照上述步骤400,用户可以再次输入唤醒词,对应的按照步骤401-404的处理,可以确定用户在重新唤醒智能设备,该唤醒词不会被认为是其他语音指令。
405、智能设备进入语音识别阶段后,用户向智能设备语音输入第一服务请求;
406、智能设备向云端服务器发送语音形式的第一服务请求和智能设备的标识;
407、云端服务器开始对第一服务请求进行服务满足处理;
408、用户向智能设备再次语音输入唤醒词;
409、智能设备向云端服务器发送语音形式的唤醒词和智能设备的标识;
410、云端服务器对语音形式的唤醒词进行语音识别和语义解析,获取文字形式的唤醒词;并根据智能设备的标识获取预存储的该智能设备对应的唤醒词,判断并确定接收的唤醒词与预存储的唤醒词一致;
411、云端服务器确定用户请求重新唤醒智能设备,停止对第一服务请求进行服务满足处理;
412、云端服务器向智能设备发送重新唤醒指示消息;
413、智能设备向用户显示“已重新唤醒”。
本实施例中,以智能设备不进行任何处理,完全解放出来,仅将接收到的所有语音形式的唤醒词或者请求,都直接发送给云端服务器,由云端服务器进行语音识别、语义解析以及服务满足处理。而可选地,也可以由智能设备侧进行语音识别和语义解析,而由云端服务器仅实现服务满足处理,在此不再赘述。
本实施例的语音唤醒方法,通过采用上述技术方案,在智能设备进入语音识别阶段后,若开始对第一服务请求进行服务满足处理之后,再次接收到唤醒词,不会对该唤醒词进行服务满足处理,而能够识别该唤醒词用于指示智能设备重新唤醒,停止之前的服务满足处理,不会造成命令识别错误,从而能够满足用户的预期,本实施例的语音唤醒方案,能够有效地处理用户的请求,从而能够有效地提高用户的使用体验度。
图5为本发明的智能设备实施例一的结构图。如图5所示,本实施例的智能设备,具体可以包括:
接收模块10用于在智能设备进入语音识别阶段后,接收用户通过语音方式输入的第一请求;
判断模块11用于判断语义解析后的接收模块10接收的第一请求与预存储的唤醒词是否一致;
确定模块12用于若判断模块11判断第一请求与预存储的唤醒词一致,确定接收的第一请求用于重新唤醒智能设备。
本实施例的智能设备,通过采用上述模块实现语音唤醒处理的实现原理以及技术效果与上述相关方法实施例的实现相同,详细可以参考上述相关方法实施例的记载,在此不再赘述。
图6为本发明的智能设备实施例二的结构图。如图6所示,本实施例的智能设备,在上述图5所示实施例的技术方案的基础上,进一步还可以包括如下技术方案。
如图6所示,本实施例的智能设备,还包括服务满足处理模块13。
其中接收模块10还用于接收用户通过语音方式输入的第二请求;
服务满足处理模块13用于根据接收模块10接收的第二请求,在本地的服务信息库中查询到第二请求对应的服务,并开始实施第二请求对应的服务满足处理;
进一步地,服务满足处理模块13还用于在确定模块12确定接收的第一请求用于重新唤醒智能设备时,停止第二请求对应的服务满足处理。
进一步可选地,如图6所示,本实施例的智能设备中,智能设备还包括发送模块14。
接收模块10还用于接收用户通过语音方式输入的第二请求;
发送模块14用于向云端服务器发送智能设备标识和接收模块10接收的第二请求,以供云端服务器开始在智能设备上实施第二请求对应的服务满足处理;
进一步地,发送模块14还用于向云端服务器发送携带智能设备的标识的重新唤醒通知消息,以供云端服务器根据智能设备的标识,确定对应的智能设备重新唤醒;并停止第二请求对应的服务满足处理;
或者发送模块14还用于向云端服务器发送智能设备的标识和接收模块10接收的第一请求,以供云端服务器根据智能设备的标识获取预存储的智能设备的唤醒词,并判断语义解析后的第一请求与预存储的唤醒词是否一致;若一致,确定接收的第一请求用于重新唤醒智能设备,停止第二请求对应的服务满足处理。
进一步可选地,本实施例的智能设备中,服务满足处理模块13还用于在智能设备本地的服务信息库中未查询到第二请求对应的服务。此时才触发发送模块14执行上述操作。
进一步可选地,如图6所示,本实施例的智能设备中,还包括获取模块15和显示模块16;
获取模块15用于获取当前时刻与发送模块14向云端服务器发送第二请求的时刻的时间差;
显示模块16用于向用户显示获取模块15获取的时间差,直到接收到云端服务器发送的第二请求的服务反馈,取消显示;
接收模块10还用于接收用户语音输入的唤醒词,以重新唤醒智能设备;唤醒词为用户根据显示的时间差,确定时间差大于预设时间长度时发出的;
或者可选地,如图6所示,本实施例的智能设备中,还包括检测模块17:
检测模块17用于检测发送模块14发送第二请求之后的预设时间长度内接收模块10是否收到云端服务器的服务反馈;
显示模块16还用于若检测模块17检测发送第二请求之后的预设时间长度内未收到云端服务器的服务反馈,向用户显示重新唤醒的提示消息;
接收模块10还用于接收用户语音输入的唤醒词,以重新唤醒智能设备。
本实施例的智能设备包括的上述模块以可以结合的方式任意组合,形成本发明的可选实施例,在此不再一一赘述。
本实施例的智能设备,通过采用上述模块实现语音唤醒处理的实现原理以及技术效果与上述相关方法实施例的实现相同,详细可以参考上述相关方法实施例的记载,在此不再赘述。
图7为本发明的云端服务器实施例一的结构图。如图7所示,本实施例的云端服务器,具体可以包括:
接收模块20用于若智能设备进入语音识别阶段后,接收智能设备发送的智能设备的标识和第一请求,第一请求为智能设备接收用户输入的;
获取模块21用于根据接收模块20接收的智能设备的标识获取预存储的智能设备的唤醒词;
判断模块22用于判断语义解析后的接收模块20接收的第一请求与获取模块21获取的预存储的唤醒词是否一致;
确定模块23用于若判断模块22判断语义解析后的第一请求与预存储的唤醒词一致,确定接收的第一请求用于重新唤醒智能设备。
本实施例的云端服务器,通过采用上述模块实现语音唤醒处理的实现原理以及技术效果与上述相关方法实施例的实现相同,详细可以参考上述相关方法实施例的记载,在此不再赘述。
图8为本发明的云端服务器实施例二的结构图。如图8所示,本实施例的云端服务器,在上述图7所示实施例的技术方案的基础上,进一步还可以包括如下技术方案。
如图8所示,本实施例的云端服务器还包括服务满足处理模块24。
接收模块20还用于接收智能设备发送的智能设备的标识和第二请求,第二请求为智能设备接收用户输入的;
服务满足处理模块24用于开始在智能设备上实施接收模块20接收的第二请求对应的服务满足处理;
进一步地,服务满足处理模块24还用于在确定模块23确定接收的第一请求用于重新唤醒智能设备时。停止第二请求对应的服务满足处理。
本实施例的云端服务器,通过采用上述模块实现语音唤醒处理的实现原理以及技术效果与上述相关方法实施例的实现相同,详细可以参考上述相关方法实施例的记载,在此不再赘述。
图9为本发明的语音唤醒系统实施例的结构图。如图9所示,本实施例的语音唤醒系统包括智能设备30和云端服务器40。
本实施例的智能设备30可以采用上述图6所示实施例的、能够与云端服务器40交互的智能设备,本实施例的云端服务器40可以采用上述图7或者图8所示实施例的云端服务器。并具体可以采用上述图2、图3或者图4所示实施例的语音唤醒方法,详细可以参考上述相关实施例的记载,在此不再赘述。
图10为本发明的智能设备实施例的结构图。如图10所示,本实施例的智能设备,包括:一个或多个处理器30,以及存储器40,存储器40用于存储一个或多个程序,当存储器40中存储的一个或多个程序被一个或多个处理器30执行,使得一个或多个处理器30实现如上图1所示实施例的语音唤醒方法。图10所示实施例中以包括多个处理器30为例。
同理,本实施例的云端服务器也可以采用上述图10所示的结构,包括一个或者多个处理器30和存储器10,其中当存储器40中存储的一个或多个程序被一个或多个处理器30执行,使得一个或多个处理器30实现如上图2所示实施例的语音唤醒方法。
例如,图11为本发明提供的一种云端服务器的示例图。图11示出了适于用来实现本发明实施方式的示例性云端服务器12a的框图。图11显示的云端服务器12a仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图11所示,云端服务器12a以通用计算设备的形式表现。云端服务器12a的组件可以包括但不限于:一个或者多个处理器16a,系统存储器28a,连接不同系统组件(包括系统存储器28a和处理器16a)的总线18a。
总线18a表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
云端服务器12a典型地包括多种计算机系统可读介质。这些介质可以是任何能够被云端服务器12a访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器28a可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)30a和/或高速缓存存储器32a。云端服务器12a可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34a可以用于读写不可移动的、非易失性磁介质(图11未显示,通常称为“硬盘驱动器”)。尽管图11中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18a相连。系统存储器28a可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明上述图1-图9各实施例的功能。
具有一组(至少一个)程序模块42a的程序/实用工具40a,可以存储在例如系统存储器28a中,这样的程序模块42a包括——但不限于——操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42a通常执行本发明所描述的上述图1-图9各实施例中的功能和/或方法。
云端服务器12a也可以与一个或多个外部设备14a(例如键盘、指向设备、显示器24a等)通信,还可与一个或者多个使得用户能与该云端服务器12a交互的设备通信,和/或与使得该云端服务器12a能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22a进行。并且,云端服务器12a还可以通过网络适配器20a与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20a通过总线18a与云端服务器12a的其它模块通信。应当明白,尽管图中未示出,可以结合云端服务器12a使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理器16a通过运行存储在系统存储器28a中的程序,从而执行各种功能应用以及数据处理,例如实现上述实施例所示的语音唤醒方法。
本发明还提供一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如上述图1所示实施例所示的语音唤醒方法,或者图2所示实施例所示的语音唤醒方法。
本实施例的计算机可读介质可以包括上述图11所示实施例中的系统存储器28a中的RAM30a、和/或高速缓存存储器32a、和/或存储系统34a。
随着科技的发展,计算机程序的传播途径不再受限于有形介质,还可以直接从网络下载,或者采用其他方式获取。因此,本实施例中的计算机可读介质不仅可以包括有形的介质,还可以包括无形的介质。
本实施例的计算机可读介质可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。
Claims (18)
1.一种语音唤醒方法,其特征在于,所述方法包括:
智能设备进入语音识别阶段后,接收用户通过语音方式输入的第一请求;
判断语义解析后的所述第一请求与预存储的唤醒词是否一致;
若一致,确定接收的所述第一请求用于重新唤醒所述智能设备。
2.根据权利要求1所述的方法,其特征在于,智能设备进入语音识别阶段后,接收用户通过语音方式输入的第一请求之前,所述方法还包括:
接收所述用户通过语音方式输入的第二请求;
根据所述第二请求,在本地的服务信息库中查询到所述第二请求对应的服务,并开始实施所述第二请求对应的服务满足处理;
进一步地,确定接收的所述第一请求用于重新唤醒所述智能设备之后,所述方法还包括:
停止所述第二请求对应的服务满足处理。
3.根据权利要求1所述的方法,其特征在于,智能设备进入语音识别阶段时,接收用户通过语音方式输入的第一请求之前,所述方法还包括:
接收所述用户通过语音方式输入的第二请求;
向云端服务器发送所述智能设备标识和所述第二请求,以供所述云端服务器开始在所述智能设备上实施所述第二请求对应的服务满足处理;
进一步地,确定接收的所述第一请求用于重新唤醒所述智能设备之后,所述方法还包括:
向所述云端服务器发送携带所述智能设备的标识的重新唤醒通知消息,以供所述云端服务器根据所述智能设备的标识,确定对应的所述智能设备重新唤醒;并停止所述第二请求对应的服务满足处理;或者
向所述云端服务器发送所述智能设备的标识和所述第一请求,以供所述云端服务器根据所述智能设备的标识获取预存储的所述智能设备的唤醒词,并判断语义解析后的所述第一请求与预存储的所述唤醒词是否一致;若一致,确定接收的所述第一请求用于重新唤醒所述智能设备,停止所述第二请求对应的服务满足处理。
4.根据权利要求3所述的方法,其特征在于,接收所述用户通过语音方式输入的第二请求之后,向云端服务器发送携带所述智能设备标识的所述第二请求之前,所述方法还包括:
在所述智能设备本地的服务信息库中未查询到所述第二请求对应的服务。
5.根据权利要求3所述的方法,其特征在于,向云端服务器发送所述智能设备标识和所述第二请求之后,所述方法还包括:
获取当前时刻与向所述云端服务器发送所述第二请求的时刻的时间差;
向所述用户显示所述时间差,直到接收到所述云端服务器发送的所述第二请求的服务反馈,取消显示;
接收所述用户语音输入的所述唤醒词,以重新唤醒所述智能设备;所述唤醒词为所述用户根据显示的所述时间差,确定所述时间差大于预设时间长度时发出的;
或者,向云端服务器发送所述智能设备标识和所述第二请求之后,所述方法还包括:
检测发送所述第二请求之后的预设时间长度内是否收到所述云端服务器的服务反馈;
若未收到,向所述用户显示重新唤醒的提示消息;
接收所述用户语音输入的所述唤醒词,以重新唤醒所述智能设备。
6.一种语音唤醒方法,其特征在于,所述方法包括:
若智能设备进入语音识别阶段后,接收所述智能设备发送的所述智能设备的标识和第一请求,所述第一请求为所述智能设备接收用户输入的;
根据所述智能设备的标识获取预存储的所述智能设备的唤醒词;
判断语义解析后的所述第一请求与预存储的所述唤醒词是否一致;
若一致,确定接收的所述第一请求用于重新唤醒所述智能设备。
7.根据权利要求6所述的方法,其特征在于,接收所述智能设备发送的所述智能设备的标识和第一请求之前,所述方法还包括:
接收所述智能设备发送的所述智能设备的标识和第二请求,所述第二请求为所述智能设备接收用户输入的;
开始在所述智能设备上实施所述第二请求对应的服务满足处理;
确定接收的所述第一请求用于重新唤醒所述智能设备之后,所述方法还包括:
停止所述第二请求对应的服务满足处理。
8.一种智能设备,其特征在于,所述智能设备包括:
接收模块,用于在所述智能设备进入语音识别阶段后,接收用户通过语音方式输入的第一请求;
判断模块,用于判断语义解析后的所述第一请求与预存储的唤醒词是否一致;
确定模块,用于若所述第一请求与预存储的所述唤醒词一致,确定接收的所述第一请求用于重新唤醒所述智能设备。
9.根据权利要求8所述的智能设备,其特征在于,所述智能设备还包括服务满足处理模块:
所述接收模块,还用于接收所述用户通过语音方式输入的第二请求;
服务满足处理模块,用于根据所述第二请求,在本地的服务信息库中查询到所述第二请求对应的服务,并开始实施所述第二请求对应的服务满足处理;
进一步地,所述服务满足处理模块,还用于停止所述第二请求对应的服务满足处理。
10.根据权利要求9所述的智能设备,其特征在于,所述智能设备还包括发送模块;
所述接收模块,还用于接收所述用户通过语音方式输入的第二请求;
所述发送模块,用于向云端服务器发送所述智能设备标识和所述第二请求,以供所述云端服务器开始在所述智能设备上实施所述第二请求对应的服务满足处理;
进一步地,所述发送模块,还用于向所述云端服务器发送携带所述智能设备的标识的重新唤醒通知消息,以供所述云端服务器根据所述智能设备的标识,确定对应的所述智能设备重新唤醒;并停止所述第二请求对应的服务满足处理;
或者所述发送模块,还用于向所述云端服务器发送所述智能设备的标识和所述第一请求,以供所述云端服务器根据所述智能设备的标识获取预存储的所述智能设备的唤醒词,并判断语义解析后的所述第一请求与预存储的所述唤醒词是否一致;若一致,确定接收的所述第一请求用于重新唤醒所述智能设备,停止所述第二请求对应的服务满足处理。
11.根据权利要求10所述的智能设备,其特征在于;
所述服务满足处理模块,还用于在所述智能设备本地的服务信息库中未查询到所述第二请求对应的服务。
12.根据权利要求10所述的智能设备,其特征在于,所述智能设备还包括获取模块和显示模块;
所述获取模块,用于获取当前时刻与向所述云端服务器发送所述第二请求的时刻的时间差;
所述显示模块,用于向所述用户显示所述时间差,直到接收到所述云端服务器发送的所述第二请求的服务反馈,取消显示;
所述接收模块,还用于接收所述用户语音输入的所述唤醒词,以重新唤醒所述智能设备;所述唤醒词为所述用户根据显示的所述时间差,确定所述时间差大于预设时间长度时发出的;
或者,所述智能设备还包括检测模块:
所述检测模块,用于检测发送所述第二请求之后的预设时间长度内是否收到所述云端服务器的服务反馈;
所述显示模块,还用于若所述检测模块检测发送所述第二请求之后的预设时间长度内未收到所述云端服务器的服务反馈,向所述用户显示重新唤醒的提示消息;
所述接收模块,还用于接收所述用户语音输入的所述唤醒词,以重新唤醒所述智能设备。
13.一种云端服务器,其特征在于,所述云端服务器包括:
接收模块,用于若智能设备进入语音识别阶段后,接收所述智能设备发送的所述智能设备的标识和第一请求,所述第一请求为所述智能设备接收用户输入的;
获取模块,用于根据所述智能设备的标识获取预存储的所述智能设备的唤醒词;
判断模块,用于判断语义解析后的所述第一请求与预存储的所述唤醒词是否一致;
确定模块,用于若所述判断模块判断语义解析后的所述第一请求与预存储的所述唤醒词一致,确定接收的所述第一请求用于重新唤醒所述智能设备。
14.根据权利要求13所述的云端服务器,其特征在于,所述云端服务器还包括服务满足处理模块:
所述接收模块,还用于接收所述智能设备发送的所述智能设备的标识和第二请求,所述第二请求为所述智能设备接收用户输入的;
所述服务满足处理模块,用于开始在所述智能设备上实施所述第二请求对应的服务满足处理;
进一步地,所述服务满足处理模块,还用于停止所述第二请求对应的服务满足处理。
15.一种语音唤醒系统,其特征在于,所述系统包括智能设备和所述云端服务器;所述智能设备与所述云端服务器通信连接;所述智能设备采用如上权利要求10-12任一所述的智能设备,所述云端服务器采用如上权利要求13或14所述的云端服务器。
16.一种智能设备,其特征在于,所述智能设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-5中任一所述的方法。
17.一种云端服务器,其特征在于,所述云端服务器包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求6或7中任一所述的方法。
18.一种计算机可读介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-5中任一所述的方法;或者该程序被处理器执行时实现如权利要求6-7中任一所述的方法。
Priority Applications (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710543572.8A CN107564517A (zh) | 2017-07-05 | 2017-07-05 | 语音唤醒方法、设备及系统、云端服务器与可读介质 |
US15/857,582 US10964317B2 (en) | 2017-07-05 | 2017-12-28 | Voice wakeup method, apparatus and system, cloud server and readable medium |
KR1020180030250A KR102096156B1 (ko) | 2017-07-05 | 2018-03-15 | 웨이크업 방법, 디바이스 및 가독매체 |
JP2018047997A JP6728540B2 (ja) | 2017-07-05 | 2018-03-15 | ウェイクアップ方法、デバイス及びシステム、クラウドサーバーと可読媒体 |
EP18163308.2A EP3447763A1 (en) | 2017-07-05 | 2018-03-22 | Voice wakeup method, apparatus and system, cloud server and readable medium |
EP18212729.0A EP3486901B1 (en) | 2017-07-05 | 2018-03-22 | Voice wakeup method, cloud server and computer-readable medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710543572.8A CN107564517A (zh) | 2017-07-05 | 2017-07-05 | 语音唤醒方法、设备及系统、云端服务器与可读介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107564517A true CN107564517A (zh) | 2018-01-09 |
Family
ID=60973010
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710543572.8A Pending CN107564517A (zh) | 2017-07-05 | 2017-07-05 | 语音唤醒方法、设备及系统、云端服务器与可读介质 |
Country Status (5)
Country | Link |
---|---|
US (1) | US10964317B2 (zh) |
EP (2) | EP3447763A1 (zh) |
JP (1) | JP6728540B2 (zh) |
KR (1) | KR102096156B1 (zh) |
CN (1) | CN107564517A (zh) |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108665900A (zh) * | 2018-04-23 | 2018-10-16 | 百度在线网络技术(北京)有限公司 | 云端唤醒方法及系统、终端以及计算机可读存储介质 |
CN108735216A (zh) * | 2018-06-12 | 2018-11-02 | 广东小天才科技有限公司 | 一种基于语义识别的语音搜题方法及家教设备 |
CN109377993A (zh) * | 2018-10-12 | 2019-02-22 | 上海庆科信息技术有限公司 | 智能语音系统及其语音唤醒方法及智能语音设备 |
CN109389977A (zh) * | 2018-11-01 | 2019-02-26 | 腾讯大地通途(北京)科技有限公司 | 一种语音交互方法及装置 |
CN109637542A (zh) * | 2018-12-25 | 2019-04-16 | 圆通速递有限公司 | 一种语音外呼系统 |
CN110275691A (zh) * | 2018-03-15 | 2019-09-24 | 阿拉的(深圳)人工智能有限公司 | 智能语音唤醒的自动回复方法、装置、终端及存储介质 |
CN110706696A (zh) * | 2019-09-25 | 2020-01-17 | 珠海格力电器股份有限公司 | 一种语音控制方法及装置 |
CN110827820A (zh) * | 2019-11-27 | 2020-02-21 | 北京梧桐车联科技有限责任公司 | 语音唤醒方法、装置、设备、计算机存储介质及车辆 |
CN110890092A (zh) * | 2019-11-07 | 2020-03-17 | 北京小米移动软件有限公司 | 唤醒控制方法及装置、计算机存储介质 |
CN111243577A (zh) * | 2020-03-27 | 2020-06-05 | 四川虹美智能科技有限公司 | 语音交互方法及装置 |
CN111522592A (zh) * | 2020-04-24 | 2020-08-11 | 腾讯科技(深圳)有限公司 | 一种基于人工智能的智能终端唤醒方法和装置 |
CN111722696A (zh) * | 2020-06-17 | 2020-09-29 | 苏州思必驰信息科技有限公司 | 用于低功耗设备的语音数据处理方法和装置 |
CN111833874A (zh) * | 2020-07-10 | 2020-10-27 | 上海茂声智能科技有限公司 | 一种基于标识符的人机交互方法、系统、设备和存储介质 |
CN111862965A (zh) * | 2019-04-28 | 2020-10-30 | 阿里巴巴集团控股有限公司 | 唤醒处理方法、装置、智能音箱及电子设备 |
US10964317B2 (en) | 2017-07-05 | 2021-03-30 | Baidu Online Network Technology (Beijing) Co., Ltd. | Voice wakeup method, apparatus and system, cloud server and readable medium |
CN113012697A (zh) * | 2021-03-05 | 2021-06-22 | 北京嘀嘀无限科技发展有限公司 | 一种信息交互方法、装置及电子设备 |
EP3627501A4 (en) * | 2018-05-18 | 2021-07-28 | Shenzhen Aukey Smart Information Technology Co., Ltd. | TWS EARPHONES, AI VOICE INTERACTION DEVICE AND SYSTEM WEAR ON THE WRIST |
CN113921016A (zh) * | 2021-10-15 | 2022-01-11 | 阿波罗智联(北京)科技有限公司 | 语音处理方法、装置、电子设备以及存储介质 |
CN111862965B (zh) * | 2019-04-28 | 2024-10-15 | 阿里巴巴集团控股有限公司 | 唤醒处理方法、装置、智能音箱及电子设备 |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019160396A2 (ko) * | 2019-04-11 | 2019-08-22 | 엘지전자 주식회사 | 안내 로봇 및 안내 로봇의 동작 방법 |
KR102228549B1 (ko) * | 2019-06-11 | 2021-03-16 | 엘지전자 주식회사 | 음성 인에이블 디바이스 선택 방법, 음성 인에이블 디바이스 선택 장치 및 이를 제어하는 지능형 컴퓨팅 디바이스 |
CN112152890B (zh) * | 2019-06-28 | 2022-01-21 | 海信视像科技股份有限公司 | 一种基于智能音箱的控制系统及方法 |
CN110827799B (zh) * | 2019-11-21 | 2022-06-10 | 百度在线网络技术(北京)有限公司 | 用于处理语音信号的方法、装置、设备和介质 |
CN111243700B (zh) * | 2020-01-15 | 2023-09-29 | 创业慧康科技股份有限公司 | 一种电子病历输入方法及装置 |
CN111554288A (zh) * | 2020-04-27 | 2020-08-18 | 北京猎户星空科技有限公司 | 智能设备的唤醒方法、装置、电子设备及介质 |
KR20220037846A (ko) * | 2020-09-18 | 2022-03-25 | 삼성전자주식회사 | 음성 인식을 수행하기 위한 전자 장치를 식별하기 위한 전자 장치 및 그 동작 방법 |
CN114373449A (zh) * | 2022-01-18 | 2022-04-19 | 海信电子科技(武汉)有限公司 | 智能设备、服务器及语音交互方法 |
CN114915514B (zh) * | 2022-03-28 | 2024-03-22 | 青岛海尔科技有限公司 | 意图的处理方法和装置、存储介质及电子装置 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080147652A1 (en) * | 2006-12-14 | 2008-06-19 | Bellsouth Intellectual Property Corporation | Physical address verification within electronic documents |
CN103456306A (zh) * | 2012-05-29 | 2013-12-18 | 三星电子株式会社 | 用于在电子装置中执行语音命令的方法和设备 |
US20140372115A1 (en) * | 2010-08-06 | 2014-12-18 | Google, Inc. | Self-Directed Machine-Generated Transcripts |
US20160155443A1 (en) * | 2014-11-28 | 2016-06-02 | Microsoft Technology Licensing, Llc | Device arbitration for listening devices |
US20160180844A1 (en) * | 2014-12-19 | 2016-06-23 | Lenovo (Singapore) Pte, Ltd. | Executing a voice command during voice input |
CN105976813A (zh) * | 2015-03-13 | 2016-09-28 | 三星电子株式会社 | 语音识别系统及其语音识别方法 |
US20170169817A1 (en) * | 2015-12-09 | 2017-06-15 | Lenovo (Singapore) Pte. Ltd. | Extending the period of voice recognition |
Family Cites Families (58)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000089789A (ja) | 1998-09-08 | 2000-03-31 | Fujitsu Ltd | 音声認識装置及び記録媒体 |
US7058575B2 (en) * | 2001-06-27 | 2006-06-06 | Intel Corporation | Integrating keyword spotting with graph decoder to improve the robustness of speech recognition |
JP3632679B2 (ja) | 2002-06-21 | 2005-03-23 | ブラザー工業株式会社 | 通信システム及び通信機器 |
JP2004096520A (ja) | 2002-09-02 | 2004-03-25 | Hosiden Corp | 音声認識リモコン |
US8154227B1 (en) * | 2003-11-26 | 2012-04-10 | Liontech Trains Llc | Model train control system |
KR100621593B1 (ko) * | 2004-09-24 | 2006-09-19 | 삼성전자주식회사 | 다중양식의 입력을 이용하는 통합 원격 제어 장치 및 방법 |
US8041012B2 (en) | 2007-03-06 | 2011-10-18 | Embarq Holdings Company, Llc | System and method for voice-activated dialing over implicit and explicit NFA trunks |
US20110054899A1 (en) | 2007-03-07 | 2011-03-03 | Phillips Michael S | Command and control utilizing content information in a mobile voice-to-speech application |
US8886545B2 (en) | 2007-03-07 | 2014-11-11 | Vlingo Corporation | Dealing with switch latency in speech recognition |
US8090750B2 (en) * | 2008-12-30 | 2012-01-03 | International Business Machines Corporation | Prompting of an end user with commands |
US9421475B2 (en) * | 2009-11-25 | 2016-08-23 | Hallmark Cards Incorporated | Context-based interactive plush toy |
US9921803B2 (en) * | 2010-08-23 | 2018-03-20 | Nokia Technologies Oy | Audio user interface apparatus and method |
US9099087B2 (en) | 2010-09-03 | 2015-08-04 | Canyon IP Holdings, LLC | Methods and systems for obtaining language models for transcribing communications |
CN102682771B (zh) | 2012-04-27 | 2013-11-20 | 厦门思德电子科技有限公司 | 一种适用于云平台的多语音控制方法 |
US20140006825A1 (en) * | 2012-06-30 | 2014-01-02 | David Shenhav | Systems and methods to wake up a device from a power conservation state |
WO2014017144A1 (ja) | 2012-07-27 | 2014-01-30 | Jsr株式会社 | ネガ型レジストパターン形成方法及びフォトレジスト組成物 |
WO2014020588A1 (en) | 2012-07-31 | 2014-02-06 | Novospeech Ltd. | Method and apparatus for speech recognition |
US9576574B2 (en) * | 2012-09-10 | 2017-02-21 | Apple Inc. | Context-sensitive handling of interruptions by intelligent digital assistant |
WO2014055076A1 (en) | 2012-10-04 | 2014-04-10 | Nuance Communications, Inc. | Improved hybrid controller for asr |
US10304465B2 (en) * | 2012-10-30 | 2019-05-28 | Google Technology Holdings LLC | Voice control user interface for low power mode |
CN105009202B (zh) * | 2013-01-04 | 2019-05-07 | 寇平公司 | 分为两部分的语音识别 |
US20140297288A1 (en) * | 2013-03-29 | 2014-10-02 | Orange | Telephone voice personal assistant |
CN103280217B (zh) * | 2013-05-02 | 2016-05-04 | 锤子科技(北京)有限公司 | 一种移动终端的语音识别方法及其装置 |
US9786296B2 (en) | 2013-07-08 | 2017-10-10 | Qualcomm Incorporated | Method and apparatus for assigning keyword model to voice operated function |
US9548047B2 (en) * | 2013-07-31 | 2017-01-17 | Google Technology Holdings LLC | Method and apparatus for evaluating trigger phrase enrollment |
US20150039316A1 (en) * | 2013-07-31 | 2015-02-05 | GM Global Technology Operations LLC | Systems and methods for managing dialog context in speech systems |
US10223445B2 (en) * | 2013-09-19 | 2019-03-05 | Maluuba Inc. | Hybrid natural language processor |
US9443522B2 (en) * | 2013-11-18 | 2016-09-13 | Beijing Lenovo Software Ltd. | Voice recognition method, voice controlling method, information processing method, and electronic apparatus |
US9373321B2 (en) * | 2013-12-02 | 2016-06-21 | Cypress Semiconductor Corporation | Generation of wake-up words |
US8719039B1 (en) * | 2013-12-05 | 2014-05-06 | Google Inc. | Promoting voice actions to hotwords |
CN103714815A (zh) | 2013-12-09 | 2014-04-09 | 何永 | 语音控制方法及其设备 |
US8938394B1 (en) * | 2014-01-09 | 2015-01-20 | Google Inc. | Audio triggers based on context |
CN103956168A (zh) | 2014-03-29 | 2014-07-30 | 深圳创维数字技术股份有限公司 | 一种语音识别方法、装置及终端 |
US9640183B2 (en) | 2014-04-07 | 2017-05-02 | Samsung Electronics Co., Ltd. | Speech recognition using electronic device and server |
US9953632B2 (en) * | 2014-04-17 | 2018-04-24 | Qualcomm Incorporated | Keyword model generation for detecting user-defined keyword |
US9620999B2 (en) * | 2014-04-22 | 2017-04-11 | Baldor Electric Company | High conductivity rotor cage for line start permanent magnet motor |
US20160055847A1 (en) * | 2014-08-19 | 2016-02-25 | Nuance Communications, Inc. | System and method for speech validation |
CN104183237B (zh) | 2014-09-04 | 2017-10-31 | 百度在线网络技术(北京)有限公司 | 用于便携式终端的语音处理方法及装置 |
US10127911B2 (en) * | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
CN204440902U (zh) | 2014-12-22 | 2015-07-01 | 南京声准科技有限公司 | 终端智能语音测试系统 |
EP3279790B1 (en) * | 2015-03-31 | 2020-11-11 | Sony Corporation | Information processing device, control method, and program |
US20190189019A1 (en) * | 2015-06-08 | 2019-06-20 | Novel Effect, Inc. | System and Method for Integrating Special Effects with a Text Source |
CN107710148B (zh) * | 2015-09-30 | 2020-02-14 | 华为技术有限公司 | 一种语音控制的处理方法和装置 |
CN106814639A (zh) * | 2015-11-27 | 2017-06-09 | 富泰华工业(深圳)有限公司 | 语音控制系统及方法 |
CN105895103B (zh) | 2015-12-03 | 2020-01-17 | 乐融致新电子科技(天津)有限公司 | 一种语音识别方法及装置 |
CN105931644B (zh) | 2016-04-15 | 2019-10-25 | Oppo广东移动通信有限公司 | 一种语音识别方法及移动终端 |
CN105869637B (zh) * | 2016-05-26 | 2019-10-15 | 百度在线网络技术(北京)有限公司 | 语音唤醒方法和装置 |
US10217453B2 (en) * | 2016-10-14 | 2019-02-26 | Soundhound, Inc. | Virtual assistant configured by selection of wake-up phrase |
CN106448664A (zh) | 2016-10-28 | 2017-02-22 | 魏朝正 | 一种通过语音控制智能家居设备的系统及方法 |
CN106611597B (zh) | 2016-12-02 | 2019-11-08 | 百度在线网络技术(北京)有限公司 | 基于人工智能的语音唤醒方法和装置 |
US10057125B1 (en) * | 2017-04-17 | 2018-08-21 | Essential Products, Inc. | Voice-enabled home setup |
US20180336275A1 (en) * | 2017-05-16 | 2018-11-22 | Apple Inc. | Intelligent automated assistant for media exploration |
CN107230475B (zh) | 2017-05-27 | 2022-04-05 | 腾讯科技(深圳)有限公司 | 一种语音关键词识别方法、装置、终端及服务器 |
CN107564517A (zh) | 2017-07-05 | 2018-01-09 | 百度在线网络技术(北京)有限公司 | 语音唤醒方法、设备及系统、云端服务器与可读介质 |
CN107358954A (zh) | 2017-08-29 | 2017-11-17 | 成都启英泰伦科技有限公司 | 一种实时更换唤醒词的设备及方法 |
CN107704275B (zh) | 2017-09-04 | 2021-07-23 | 百度在线网络技术(北京)有限公司 | 智能设备唤醒方法、装置、服务器及智能设备 |
CN107610702B (zh) | 2017-09-22 | 2021-01-29 | 百度在线网络技术(北京)有限公司 | 终端设备待机唤醒方法、装置及计算机设备 |
CN107622770B (zh) | 2017-09-30 | 2021-03-16 | 百度在线网络技术(北京)有限公司 | 语音唤醒方法及装置 |
-
2017
- 2017-07-05 CN CN201710543572.8A patent/CN107564517A/zh active Pending
- 2017-12-28 US US15/857,582 patent/US10964317B2/en active Active
-
2018
- 2018-03-15 KR KR1020180030250A patent/KR102096156B1/ko active IP Right Grant
- 2018-03-15 JP JP2018047997A patent/JP6728540B2/ja active Active
- 2018-03-22 EP EP18163308.2A patent/EP3447763A1/en not_active Ceased
- 2018-03-22 EP EP18212729.0A patent/EP3486901B1/en active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080147652A1 (en) * | 2006-12-14 | 2008-06-19 | Bellsouth Intellectual Property Corporation | Physical address verification within electronic documents |
US20140372115A1 (en) * | 2010-08-06 | 2014-12-18 | Google, Inc. | Self-Directed Machine-Generated Transcripts |
CN103456306A (zh) * | 2012-05-29 | 2013-12-18 | 三星电子株式会社 | 用于在电子装置中执行语音命令的方法和设备 |
US20160155443A1 (en) * | 2014-11-28 | 2016-06-02 | Microsoft Technology Licensing, Llc | Device arbitration for listening devices |
US20160180844A1 (en) * | 2014-12-19 | 2016-06-23 | Lenovo (Singapore) Pte, Ltd. | Executing a voice command during voice input |
CN105976813A (zh) * | 2015-03-13 | 2016-09-28 | 三星电子株式会社 | 语音识别系统及其语音识别方法 |
US20170169817A1 (en) * | 2015-12-09 | 2017-06-15 | Lenovo (Singapore) Pte. Ltd. | Extending the period of voice recognition |
Cited By (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10964317B2 (en) | 2017-07-05 | 2021-03-30 | Baidu Online Network Technology (Beijing) Co., Ltd. | Voice wakeup method, apparatus and system, cloud server and readable medium |
CN110275691A (zh) * | 2018-03-15 | 2019-09-24 | 阿拉的(深圳)人工智能有限公司 | 智能语音唤醒的自动回复方法、装置、终端及存储介质 |
US11574632B2 (en) | 2018-04-23 | 2023-02-07 | Baidu Online Network Technology (Beijing) Co., Ltd. | In-cloud wake-up method and system, terminal and computer-readable storage medium |
CN108665900A (zh) * | 2018-04-23 | 2018-10-16 | 百度在线网络技术(北京)有限公司 | 云端唤醒方法及系统、终端以及计算机可读存储介质 |
CN108665900B (zh) * | 2018-04-23 | 2020-03-03 | 百度在线网络技术(北京)有限公司 | 云端唤醒方法及系统、终端以及计算机可读存储介质 |
EP3627501A4 (en) * | 2018-05-18 | 2021-07-28 | Shenzhen Aukey Smart Information Technology Co., Ltd. | TWS EARPHONES, AI VOICE INTERACTION DEVICE AND SYSTEM WEAR ON THE WRIST |
CN108735216A (zh) * | 2018-06-12 | 2018-11-02 | 广东小天才科技有限公司 | 一种基于语义识别的语音搜题方法及家教设备 |
CN108735216B (zh) * | 2018-06-12 | 2020-10-16 | 广东小天才科技有限公司 | 一种基于语义识别的语音搜题方法及家教设备 |
CN109377993A (zh) * | 2018-10-12 | 2019-02-22 | 上海庆科信息技术有限公司 | 智能语音系统及其语音唤醒方法及智能语音设备 |
CN109389977A (zh) * | 2018-11-01 | 2019-02-26 | 腾讯大地通途(北京)科技有限公司 | 一种语音交互方法及装置 |
CN109389977B (zh) * | 2018-11-01 | 2021-07-16 | 腾讯大地通途(北京)科技有限公司 | 一种语音交互方法及装置 |
CN109637542A (zh) * | 2018-12-25 | 2019-04-16 | 圆通速递有限公司 | 一种语音外呼系统 |
CN111862965B (zh) * | 2019-04-28 | 2024-10-15 | 阿里巴巴集团控股有限公司 | 唤醒处理方法、装置、智能音箱及电子设备 |
CN111862965A (zh) * | 2019-04-28 | 2020-10-30 | 阿里巴巴集团控股有限公司 | 唤醒处理方法、装置、智能音箱及电子设备 |
CN110706696A (zh) * | 2019-09-25 | 2020-01-17 | 珠海格力电器股份有限公司 | 一种语音控制方法及装置 |
CN110890092A (zh) * | 2019-11-07 | 2020-03-17 | 北京小米移动软件有限公司 | 唤醒控制方法及装置、计算机存储介质 |
CN110827820A (zh) * | 2019-11-27 | 2020-02-21 | 北京梧桐车联科技有限责任公司 | 语音唤醒方法、装置、设备、计算机存储介质及车辆 |
CN111243577A (zh) * | 2020-03-27 | 2020-06-05 | 四川虹美智能科技有限公司 | 语音交互方法及装置 |
CN111243577B (zh) * | 2020-03-27 | 2022-04-19 | 四川虹美智能科技有限公司 | 语音交互方法及装置 |
CN111522592A (zh) * | 2020-04-24 | 2020-08-11 | 腾讯科技(深圳)有限公司 | 一种基于人工智能的智能终端唤醒方法和装置 |
CN111722696A (zh) * | 2020-06-17 | 2020-09-29 | 苏州思必驰信息科技有限公司 | 用于低功耗设备的语音数据处理方法和装置 |
CN111722696B (zh) * | 2020-06-17 | 2021-11-05 | 思必驰科技股份有限公司 | 用于低功耗设备的语音数据处理方法和装置 |
CN111833874A (zh) * | 2020-07-10 | 2020-10-27 | 上海茂声智能科技有限公司 | 一种基于标识符的人机交互方法、系统、设备和存储介质 |
CN111833874B (zh) * | 2020-07-10 | 2023-12-05 | 上海茂声智能科技有限公司 | 一种基于标识符的人机交互方法、系统、设备和存储介质 |
CN113012697A (zh) * | 2021-03-05 | 2021-06-22 | 北京嘀嘀无限科技发展有限公司 | 一种信息交互方法、装置及电子设备 |
CN113921016A (zh) * | 2021-10-15 | 2022-01-11 | 阿波罗智联(北京)科技有限公司 | 语音处理方法、装置、电子设备以及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
EP3447763A1 (en) | 2019-02-27 |
US10964317B2 (en) | 2021-03-30 |
US20190013021A1 (en) | 2019-01-10 |
EP3486901B1 (en) | 2023-06-14 |
JP2019015952A (ja) | 2019-01-31 |
EP3486901A1 (en) | 2019-05-22 |
KR102096156B1 (ko) | 2020-04-06 |
JP6728540B2 (ja) | 2020-07-22 |
KR20190005104A (ko) | 2019-01-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107564517A (zh) | 语音唤醒方法、设备及系统、云端服务器与可读介质 | |
US9852731B2 (en) | Mechanism and apparatus for seamless voice wake and speaker verification | |
CN107077464B (zh) | 电子设备和用于其口头交互的方法 | |
KR102405793B1 (ko) | 음성 신호 인식 방법 및 이를 제공하는 전자 장치 | |
EP3593347B1 (en) | Method for operating speech recognition service and electronic device supporting the same | |
EP2930716B1 (en) | Speech recognition using electronic device and server | |
US10229256B2 (en) | Techniques for preventing voice replay attacks | |
CN103646646B (zh) | 一种语音控制方法及电子设备 | |
KR20180060328A (ko) | 멀티 모달 입력을 처리하는 전자 장치, 멀티 모달 입력을 처리하는 방법 및 멀티 모달 입력을 처리하는 서버 | |
US11157893B2 (en) | Electronic device including a plurality of payment modules | |
CN107112017A (zh) | 操作语音识别功能的电子设备和方法 | |
CN106502649A (zh) | 一种机器人服务唤醒方法及装置 | |
CN110111789A (zh) | 语音交互方法、装置、计算设备和计算机可读介质 | |
EP3157003B1 (en) | Terminal control method and device, voice control device and terminal | |
CN107886944A (zh) | 一种语音识别方法、装置、设备及存储介质 | |
KR102501083B1 (ko) | 음성 인식 방법 및 이를 사용하는 전자 장치 | |
KR20180109631A (ko) | 전자 장치 및 전자 장치의 기능 실행 방법 | |
CN112597478A (zh) | 身份认证方法、电子设备及存储介质 | |
KR20190106269A (ko) | 사용자 발화를 처리하는 시스템 및 그 시스템의 제어 방법 | |
CN109979474A (zh) | 语音设备及其用户语速修正方法、装置和存储介质 | |
KR102376964B1 (ko) | 잠금 상태에서의 음성 명령을 기반으로 하는 기능 실행 운용 방법 및 이를 지원하는 전자 장치 | |
CN107943724A (zh) | 一种寻找外接设备的方法、装置、终端设备及存储介质 | |
CN108093350A (zh) | 麦克风的控制方法和麦克风 | |
CN113918916A (zh) | 数据迁移方法、终端设备及可读存储介质 | |
KR20190040164A (ko) | 멀티 모달 입력을 처리하는 전자 장치, 멀티 모달 입력을 처리하는 방법 및 멀티 모달 입력을 처리하는 서버 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20210510 Address after: 100085 Baidu Building, 10 Shangdi Tenth Street, Haidian District, Beijing Applicant after: BAIDU ONLINE NETWORK TECHNOLOGY (BEIJING) Co.,Ltd. Applicant after: Shanghai Xiaodu Technology Co.,Ltd. Address before: 100085 Baidu Building, 10 Shangdi Tenth Street, Haidian District, Beijing Applicant before: BAIDU ONLINE NETWORK TECHNOLOGY (BEIJING) Co.,Ltd. |
|
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180109 |