CN110277097A - 数据处理方法及相关设备 - Google Patents
数据处理方法及相关设备 Download PDFInfo
- Publication number
- CN110277097A CN110277097A CN201910552883.XA CN201910552883A CN110277097A CN 110277097 A CN110277097 A CN 110277097A CN 201910552883 A CN201910552883 A CN 201910552883A CN 110277097 A CN110277097 A CN 110277097A
- Authority
- CN
- China
- Prior art keywords
- voice signal
- terminal device
- wake
- voice
- target sound
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 26
- 230000005236 sound signal Effects 0.000 claims abstract description 106
- 238000000034 method Methods 0.000 claims abstract description 26
- 230000002618 waking effect Effects 0.000 claims description 27
- 238000012545 processing Methods 0.000 claims description 26
- 238000012549 training Methods 0.000 claims description 18
- 230000005540 biological transmission Effects 0.000 claims description 15
- 238000013528 artificial neural network Methods 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 15
- 230000006870 function Effects 0.000 description 10
- 230000006854 communication Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 230000006835 compression Effects 0.000 description 4
- 238000007906 compression Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000033001 locomotion Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 2
- 235000013399 edible fruits Nutrition 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012905 input function Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 229910052573 porcelain Inorganic materials 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000005314 correlation function Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000010897 surface acoustic wave method Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephonic Communication Services (AREA)
Abstract
本申请提供了一种数据处理方法及其相关设备,可以提高终端设备的唤醒率,使得终端设备的唤醒更加精准。该方法包括:终端设备获取输入语音;所述终端设备根据所述输入语音确定所述输入语音对应的声音信号的概率值;所述终端设备根据预设概率值对所述声音信号的概率值进行判断,以确定目标声音信号;所述终端设备将所述目标声音信号发送至云端服务器,以使得所述云端服务器对所述目标声音信号进行唤醒识别得到识别结果,并返回所述识别结果;所述终端设备根据所述识别结果执行相应的操作。
Description
技术领域
本申请涉及语音识别领域,尤其涉及一种数据处理方法及其相关设备。
背景技术
智能音箱作为智能家居系统的重要一环,其发展势头十分迅猛。其中,用户体验是决定智能音箱未来发展和市场地位的重要因素之一,而其中不可忽略的一环则是智能音箱的唤醒效果。“唤醒”这个动作形成的结果可以理解为:设备从待机状态切换带工作状态。只有快速、精准完成状态的切换,用户才能近乎无感知地直接使用智能音箱的其他功能。因此,提高唤醒效果至关重要。
通过提高唤醒算法效率、设置合理的唤醒词,能够提升唤醒效果。但如果外界环境过于复杂,存在过多干扰,唤醒率会出现显著下降,而由于设备性能的限制,不便于执行过于复杂的分析和计算,很难对唤醒率进行提升。
发明内容
本申请提供了一种数据处理方法及其相关设备,可以提高终端设备的唤醒率,使得终端设备的唤醒更加精准。
本申请实施例的第一方面提供了一种数据处理方法,包括:
终端设备获取输入语音;
所述终端设备根据所述输入语音确定所述输入语音对应的声音信号的概率值;
所述终端设备根据预设概率值对所述声音信号的概率值进行判断,以确定目标声音信号;
所述终端设备将所述目标声音信号发送至云端服务器,以使得所述云端服务器对所述目标声音信号进行唤醒识别得到识别结果,并返回所述识别结果;
所述终端设备根据所述识别结果执行相应的操作。
可选地,所述终端设备根据预设概率值对所述声音信号的概率值进行判断,以确定目标声音信号包括:
所述终端设备判断所述输入语音对应的声音信号中是否包含概率值大于第一预设值的N个声音信号,其中,N为大于等于1的正整数;
当所述输入语音对应的声音信号中包含概率值大于所述第一预设值的N个声音信号时,所述终端设备确定所述N个声音信号中声音信号的唤醒概率值;
当所述N个声音信号中存在唤醒概率值大于或等于所述第二预设值,且小于或等于第三预设值的声音信号时,将所述N个声音信号中唤醒概率值大于或等于第二预设值,且小于或等于第三预设值的声音信号确定为所述目标声音信号。
可选地,所述方法还包括:
当所述N个声音信号中存在唤醒概率小于所述第二预设值的声音信号时,所述终端设备忽略所述N个声音信号中概率值小于所述第二预设值的声音信号。
可选地,所述方法还包括:
当所述N个声音信号中声音信号的唤醒概率值均小于所述第二预设值时,所述终端设备忽略所述N个声音信号。
可选地,所述方法还包括:
当所述N个声音信号中声音信号的唤醒概率值均大于所述第三预设值时,所述终端设备根据所述N个声音信号执行相应的操作。
可选地,所述根据所述识别结果执行相应的操作包括:
当所述识别结果为唤醒操作时,所述终端设备根据所述目标声音信号执行相应的操作;
当所述识别结果为非唤醒操作时,所述终端设备不执行唤醒操作。
本申请第二方面提供了一种数据处理方法,包括:
云端服务器接收终端设备发送的目标声音信号,所述目标声音信号为所述终端设备根据获取的输入语音对应的声音信号的概率值确定得到;
所述云端服务器对所述目标声音信号进行唤醒识别得到识别结果;
所述云端服务器将所述识别结果发送至所述终端设备,以使得所述终端设备根据所述识别结果执行相应的操作。
可选地,所述云端服务器对所述目标声音信号进行唤醒识别得到识别结果包括:
所述云端服务器根据唤醒识别模型对所述目标声音信号进行唤醒识别,得到所述识别结果,所述唤醒识别模型为通过深度神经网络对训练语料进行训练得到的,所述训练语料为包括目标声音信号在内的多个声音信号,以及所述多个声音信号对应的唤醒方案,所述唤醒方案包括唤醒所述终端设备或不唤醒所述终端设备。
本申请实施例第三方面提供了一种终端设备,包括:
获取单元,用于获取输入语音;
第一确定单元,用于根据所述输入语音确定所述输入语音对应的声音信号的概率值;
第二确定单元,用于根据预设概率值对所述声音信号的概率值进行判断,以确定目标声音信号;
发送单元,用于将所述目标声音信号发送至云端服务器,以使得所述云端服务器对所述目标声音信号进行唤醒识别得到识别结果,并返回所述识别结果;
处理单元,用于根据所述识别结果执行相应的操作。
可选地,所述第二确定单元具体用于:
所述终端设备判断所述输入语音对应的声音信号中是否包含概率值大于第一预设值的N个声音信号,其中,N为大于等于1的正整数;
当所述输入语音对应的声音信号中包含概率值大于所述第一预设值的N个声音信号时,确定所述N个声音信号中声音信号的唤醒概率值;
当所述N个声音信号中存在唤醒概率值大于或等于所述第二预设值,且小于或等于第三预设值的声音信号时,将所述N个声音信号中唤醒概率值大于或等于第二预设值,且小于或等于第三预设值的声音信号确定为所述目标声音信号。
可选地,所述第二确定单元还具体用于:
当所述N个声音信号中存在唤醒概率小于所述第二预设值的声音信号时,忽略所述N个声音信号中概率值小于所述第二预设值的声音信号。
可选地,所述第二确定单元还具体用于:
当所述N个声音信号中声音信号的唤醒概率值均小于所述第二预设值时,忽略所述N个声音信号。
可选地,所述第二确定单元还具体用于:
当所述N个声音信号中声音信号的唤醒概率值均大于所述第三预设值时,根据所述N个声音信号执行相应的操作。
可选地,所述处理单元具体用于:
当所述识别结果为唤醒操作时,根据所述目标声音信号执行相应的操作;
当所述识别结果为非唤醒操作时,不执行唤醒操作。
本申请实施例第四方面提供了一种云端服务器,包括:
接收单元,用于接收终端设备发送的目标声音信号,所述目标声音信号为所述终端设备根据获取的输入语音对应的声音信号的概率值确定得到;
识别单元,用于对所述目标声音信号进行唤醒识别得到识别结果;
发送单元,用于将所述识别结果发送至所述终端设备,以使得所述终端设备根据所述识别结果执行相应的操作。
可选地,所述识别单元具体用于:
所述云端服务器根据唤醒识别模型对所述目标声音信号进行唤醒识别,得到所述识别结果,所述唤醒识别模型为通过深度神经网络对训练语料进行训练得到的,所述训练语料为包括目标声音信号在内的多个声音信号,以及所述多个声音信号对应的唤醒方案,所述唤醒方案包括唤醒所述终端设备或不唤醒所述终端设备。
本申请实施例的第五方面提供了一种计算机可读存储介质,包括指令,当指令在计算机上运行时,使得计算机执行如上述所述数据处理方法的步骤。
本申请实施例的第六方面提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行如上述所述数据处理方法的步骤。
综上所述,可以看出,本申请提供的实施例中,终端设备可以根据输入语音对应的声音信号的概率值确定疑似唤醒的目标声音信号,并将疑似唤醒的目标声音信号发送至云端服务器,由云端服务器来判断该声音信号得到识别结果,并返回识别结果终端设备,终端设备根据该识别结果执行相应的操作,由于终端设备的计算能力有限,通过云端识别并返回识别结果的方式可以提高终端设备的唤醒率,同时使得终端设备的唤醒更加精准。
附图说明
图1为本申请实施例提供的数据处理方法的一个流程示意图;
图2为本申请实施例提供的数据处理方法的另一流程示意图;
图3为本申请实施例提供的数据处理方法的另一流程示意图;
图4为本申请实施例提供的终端设备的一个虚拟结构示意图;
图5为本申请实施例提供的云端服务器的另一虚拟结构示意图;
图6为本申请实施例提供的终端设备的硬件结构示意图;
图7为本申请实施例提供的云端服务器的硬件结构示意图。
具体实施方式
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
下面从终端设备的角度对本申请的数据处理方法,进行说明。
需要说明的是,本申请实施例中所述的终端设备可以是手机、桌上型计算机、笔记本、掌上电脑、智能音箱等智能设备,也可以是智能手表、智能手环等智能可穿戴设备,具体此处对终端设备不做限定。
参阅图1,图1为本申请实施例提供的数据处理方法的一个流程示意图,包括:
101、终端设备获取输入语音。
本实施例中,终端设备可以获取输入语音,此处具体不限定获取方式,例如终端设备可以实时的识别周围环境的语音,将该语音作为输入语音,当然也还可以通过别的方式获取,具体不做限定。
102、终端设备根据输入语音确定输入语音对应的声音信号的概率值。
本实施例中,终端设备可以根据输入语音确定输入语音对应的声音信号的概率值。具体的,可以通过基于深度神经网络的唤醒识别模型对输入语音进行识别,得到输入语音对应的声音信号的概率值。也就是说,该终端设备可以以深度神经网络作为特征提取器,使用depth-wise方式以降低运算量来识别输入语音对应声音信号的概率值。
103、终端设备根据预设概率值对声音信号的概率值进行判断,以确定目标声音信号。
本实施例中,终端设备根据预设概率值对声音信号的概率值进行判断,以确定目标声音信号,具体如下:
终端设备判断输入语音对应的声音信号中是否包含概率值大于第一预设值的N个声音信号,其中,N为大于等于1的正整数;
当输入语音对应的声音信号中包含概率值大于第一预设值的N个声音信号时,终端设备确定所述N个声音信号中声音信号的唤醒概率值;
当N个声音信号中存在唤醒概率值大于或等于第二预设值,且小于或等于第三预设值的声音信号时,将N个声音信号中唤醒概率值大于或等于第二预设值,且小于或等于第三预设值的声音信号确定为目标声音信号。
也就是说,终端设备可以提前设置第一预设值、第二预设值以及第三预设值,之后,判断输入语音对应的声音信号中是否包含概率值大于第一预设值的N个声音信,若该输入语音对应的声音信号包含概率值大于第一预设值的N个声音信号时,确定该N个声音信号中声音信号的唤醒概率值,并通过第二预设值以及第三预设值对N个声音信号中的声音信号的概率值进行判断,以确定出N个声音信号中是否存在唤醒概率值大于或等于第二预设值,且小于或等于第三预设值的声音信号,若存在,则将该大于或等于第二预设值,且小于或等于第三预设值的声音信号确定为目标声音信号。
需要说明的是,当输入语音对应的声音信号中包含概率值小于第一预设值的声音信号时,即可以确定出,该概率值小于第一预设值的声音信号为环境噪声,对该概率值小于第一预设值的声音信号进行忽略处理。该第一预设值为一个判断声音信号为人声信号还是环境噪声的临界值,声音信号的概率值大于该第一预设值,则认为声音信号为人声信号,声音信号的概率值小于或等于该第一预设值,则认为该声音信号为环境噪声。
还需要说明的是,该第二预设值以及第三预设值的设置可以根据实际情况进行设置,唤醒概率值小于第二预设值的声音信号,该声音信号可能是一些谈话声音或者其他的人声,则忽略该声音信号,不执行唤醒操作;当该目标声音信号的唤醒概率值大于第三预设值时,则说明该目标声音信号是一个有效的人声信号,则认为该声音信号为唤醒设备的人声信号,则执行的唤醒操作的声音,
在一个实施例中,当N个声音信号中存在唤醒概率小于第二预设值的声音信号时,终端设备忽略N个声音信号中概率值小于第二预设值的声音信号。
在一个实施例中,当N个声音信号中声音信号的唤醒概率值均小于第二预设值时,终端设备忽略N个声音信号。
在一个实施例中,当N个声音信号中声音信号的唤醒概率值均大于第三预设值时,终端设备根据N个声音信号执行相应的操作。
也就是说,在通过第二预设值以及第三预设值对声音信号的唤醒概率值进行判断时,可能会存在三种情况:1、N个声音信号中的唤醒概率值均大于第三预设值;2、N个声音信号中的唤醒概率值均小于第二预设值;3、N个声音信号中既存在大于第三预设值的声音信号也存在小于第二预设值的声音信号,还存在处于第二预设值以及第三预设值之间的声音信号。根据上述3种不同的判断情况进行不同的处理:对于唤醒概率值小于第二预设值的声音信号,进行忽略处理,对于唤醒概率值大于第三预设值的声音信号,直接该声音信号控制终端设备唤醒并执行相应的操作(例如唤醒概率值大于第三预设值的声音信号为“播放周杰伦的青花瓷”,则直接唤醒终端设备,并播放周杰伦的青花瓷),对于唤醒概率值处于第二预设值以及第三预设值之间的声音信号,则可以将该声音信号确定为目标声音信号。
需要说明的是,终端设备在计算声音信号的唤醒概率值时,可以通过基于深度神经网络的唤醒识别模型得到声音信号的唤醒概率值,也还可以通过其他的方式得到声音信号的唤醒概率值,具体不做限定。
104、终端设备将目标声音信号发送至云端服务器,以使得云端服务器对目标声音信号进行唤醒识别得到识别结果,并返回识别结果。
本实施例中,终端设备在得到目标声音信号之后,此时的终端设备是无法根据该目标声音信号的唤醒概率值来确定是否进行唤醒操作,因此,需要将该目标声音信号发送至云端服务器,由云端服务器对目标声音信号进行唤醒识别得到识别结果,并返回识别结果。
需要说明的是,为了提高声音传输效率以及减少弱网情况下的网络延迟和丢包,终端设备可将目标声音信号压缩成Ogg(全称oggVorbis,是一种音频压缩格式)格式,将Ogg格式的音频信号采用多TCP(Transmission Control Protocol,传输控制协议)的方式传输至云端服务器。
105、终端设备根据识别结果执行相应的操作。
本实施例中,此处的识别结果包括两种,一种是唤醒操作,一种是非唤醒操作,当识别结果为唤醒操作时,终端设备根据目标声音信号执行相应的操作,例如该目标声音信号为“播放xxx歌曲”,则该终端设备根据该目标声音信号播放该歌曲,当识别结果为非唤醒操作时,终端设备不执行唤醒操作,保持终端设备当前的状态不变。
综上所述,可以看出,本申请提供的实施例中,终端设备可以将根据预设概率值对声音信号的概率值进行判断确定的目标声音信号发送至云端服务器,由云端服务器来对该目标声音信号进行识别,并得到识别结果,并返回识别结果终端设备,终端设备根据该识别结果执行相应的操作,由于终端设备的计算能力有限,通过云端识别并返回识别结果的方式可以提高终端设备的唤醒率,同时使得终端设备的唤醒更加精准。
下面以云端服务器的角度对本申请实施例中的数据处理方法进行说明。
请参阅图2,图2为本申请实施例提供的数据处理方法的另一流程示意图,包括:
201、云端服务器接收终端设备发送的目标声音信号。
本实施例中,云端服务器可以接收终端设备发送的目标声音信号,该目标声音信号为终端设备根据获取的输入语音对应的声音信号的概率值确定得到的。也就是说,终端设备对于自身无法确定是否唤醒的目标声音信号,则传输至云端服务器,由云端服务器来该目标声音信号是否是唤醒终端设备的声音信号。
202、云端服务器对目标声音信号进行唤醒识别得到识别结果。
本实施例中,云端服务器根据唤醒识别模型对目标声音信号进行唤醒识别,得到识别结果,该唤醒识别模型为通过深度神经网络对训练语料进行训练得到的,该训练语料为包括目标声音信号在内的多个声音信号以及多个声音信号对应的唤醒方案,该唤醒方案包括唤醒终端设备或不唤醒终端设备。
需要说明的是,此处具体不限定唤醒识别模型的训练方法,只要能训练处精准识别声音信号的唤醒方案即可,具体不做限定。
203、云端服务器将识别结果发送给终端设备。
本实施例中,云端服务器将识别结果发送给终端设备,以使得终端设备根据识别结果执行相应的操作,例如唤醒终端设备执行对应目标声音信号的操作或者不唤醒终端设备。
综上所述,可以看出,本申请提供的实施例中,云端服务器根据接收到终端设备发送的声音信号,并判断该声音信号得到识别结果,且将识别结果终端设备,终端设备根据该识别结果执行相应的操作,由于终端设备的计算能力有限,通过云端识别并返回识别结果的方式可以提高终端设备的唤醒率,同时使得终端设备的唤醒更加精准。
下面从终端设备与云端服务器之间的数据交互的角度对本申请实施例提供的数据处理方法进行说明:
请参阅图3,图3为本申请实施例提供的数据处理方法的另一流程示意图,包括:
301、终端设备获取输入语音。
本实施例中,终端设备可以获取输入语音,此处具体不限定获取方式,例如终端设备可以实时的识别周围环境的语音,将该语音作为输入语音,当然也还可以通过别的方式获取,具体不做限定。
302、终端设备根据输入语音确定输入语音对应的声音信号的概率值。
本实施例中,终端设备可以根据输入语音确定输入语音对应的声音信号的概率值。具体的,可以通过基于深度神经网络的唤醒识别模型对输入语音进行识别,得到输入语音对应的声音信号的概率值,也就是说,该终端设备可以以深度神经网络作为特征提取器,使用depth-wise方式以降低运算量来识别输入语音对应声音信号的概率值。
303、终端设备根据预设概率值对声音信号的概率值进行判断,以确定目标声音信号。
本实施例中,终端设备根据预设概率值对声音信号的概率值进行判断,以确定目标声音信号,具体如下:
终端设备判断输入语音对应的声音信号中是否包含概率值大于第一预设值的N个声音信号,其中,N为大于等于1的正整数;
当输入语音对应的声音信号中包含概率值大于第一预设值的N个声音信号时,终端设备确定所述N个声音信号中声音信号的唤醒概率值;
当N个声音信号中存在唤醒概率值大于或等于第二预设值,且小于或等于第三预设值的声音信号时,将N个声音信号中唤醒概率值大于或等于第二预设值,且小于或等于第三预设值的声音信号确定为目标声音信号。
304、终端设备将目标语音信号发送至云端服务器。
本实施例中,终端设备在得到目标声音信号之后,此时的终端设备是无法根据该目标声音信号的唤醒概率值来确定是否对终端设备进行唤醒操作,因此,需要将该目标声音信号发送至云端服务器,由云端服务器对目标声音信号进行唤醒识别得到识别结果,并返回识别结果。
需要说明的是,为了提高声音传输效率以及减少弱网情况下的网络延迟和丢包,终端设备可将目标声音信号压缩成Ogg(全称oggVorbis,是一种音频压缩格式)格式,将Ogg格式的音频信号采用多TCP(Transmission Control Protocol,传输控制协议)的方式传输至云端服务器。
305、云端服务器接收终端设备发送的目标声音信号。
本实施例中,云端服务器可以接收终端设备发送的目标声音信号。也就是说,终端设备对于自身无法确定的声音信号,则传输至云端服务器,由云端服务器来该目标声音信号是否是唤醒终端设备的声音信号。
306、云端服务器对目标声音信号进行唤醒识别得到识别结果。
本实施例中,云端服务器根据唤醒识别模型对目标声音信号进行唤醒识别,得到识别结果,该唤醒识别模型为通过深度神经网络对训练语料进行训练得到的,该训练语料为包括目标声音信号在内的多个声音信号以及多个声音信号对应的唤醒方案,该唤醒方案包括唤醒终端设备或不唤醒终端设备。
需要说明的是,此处具体不限定唤醒识别模型的训练方法,只要能训练处精准识别声音信号的唤醒方案即可,具体不做限定。
307、云端服务器将识别结果发送给终端设备。
本实施例中,云端服务器将识别结果发送给终端设备,以使得终端设备根据识别结果执行相应的操作,例如唤醒终端设备执行对应目标声音信号的操作或者不唤醒终端设备。
308、终端设备根据识别结果执行相应的操作。
本实施例中,此处的识别结果包括两种,一种是唤醒操作,一种是非唤醒操作,当识别结果为唤醒操作时,终端设备根据目标声音信号执行相应的操作,例如该目标声音信号为“播放xxx歌曲”,则该终端设备则根据该目标声音信号播放该歌曲,当识别结果为非唤醒操作时,终端设备部执行唤醒操作,保持当前的状态不变。
综上所述,可以看出,本申请提供的实施例中,终端设备可以将疑似唤醒的目标声音信号发送至云端服务器,云端服务器根据接收到终端设备发送的声音信号,并判断该声音信号得到识别结果,且将识别结果终端设备,终端设备根据该识别结果执行相应的操作,由于终端设备的计算能力有限,通过云端识别并返回识别结果的方式可以提高终端设备的唤醒率,同时使得终端设备的唤醒更加精准。
上面对本申请实施例提供的数据处理方法进行说明,下面结合图3以及图4对本申请实施例提供的数据处理装置进行说明。
请参阅图4,图4为本申请实施例提供的数据处理装置的一个实施例示意图,该数据处理装置包括:
获取单元401,用于获取输入语音;
第一确定单元402,用于根据所述输入语音确定所述输入语音对应的声音信号的概率值;
第二确定单元403,用于根据预设概率值对所述声音信号的概率值进行判断,以确定目标声音信号;
发送单元404,用于将所述目标声音信号发送至云端服务器,以使得所述云端服务器对所述目标声音信号进行唤醒识别得到识别结果,并返回所述识别结果;
处理单元405,用于根据所述识别结果执行相应的操作。
可选地,所述第二确定单元403具体用于:
所述终端设备判断所述输入语音对应的声音信号中是否包含概率值大于第一预设值的N个声音信号,其中,N为大于等于1的正整数;
当所述输入语音对应的声音信号中包含概率值大于所述第一预设值的N个声音信号时,确定所述N个声音信号中声音信号的唤醒概率值;
当所述N个声音信号中存在唤醒概率值大于或等于所述第二预设值,且小于或等于第三预设值的声音信号时,将所述N个声音信号中唤醒概率值大于或等于第二预设值,且小于或等于第三预设值的声音信号确定为所述目标声音信号。
可选地,所述第二确定单元403还具体用于:
当所述N个声音信号中存在唤醒概率小于所述第二预设值的声音信号时,忽略所述N个声音信号中概率值小于所述第二预设值的声音信号。
可选地,所述第二确定单元403还具体用于:
当所述N个声音信号中声音信号的唤醒概率值均小于所述第二预设值时,忽略所述N个声音信号。
可选地,所述第二确定单元403还具体用于:
当所述N个声音信号中声音信号的唤醒概率值均大于所述第三预设值时,根据所述N个声音信号执行相应的操作。
可选地,所述处理单元405具体用于:
当所述识别结果为唤醒操作时,根据所述目标声音信号执行相应的操作;
当所述识别结果为非唤醒操作时,不执行唤醒操作。
综上所述,可以看出,本申请提供的实施例中,终端设备可以将根据预设概率值对声音信号的概率值进行判断确定的目标声音信号发送至云端服务器,由云端服务器来对该目标声音信号进行识别,并得到识别结果,并返回识别结果终端设备,终端设备根据该识别结果执行相应的操作,由于终端设备的计算能力有限,通过云端识别并返回识别结果的方式可以提高终端设备的唤醒率,同时使得终端设备的唤醒更加精准。
请参阅图5,图5为本申请实施例提供的数据处理装置的另一实施例示意图,该数据处理装置包括:
接收单元501,用于接收终端设备发送的目标声音信号,所述目标声音信号为所述终端设备根据获取的输入语音对应的声音信号的概率值确定得到;
识别单元502,用于对所述目标声音信号进行唤醒识别得到识别结果;
发送单元503,用于将所述识别结果发送至所述终端设备,以使得所述终端设备根据所述识别结果执行相应的操作。
可选地,所述识别单元502具体用于:
所述云端服务器根据唤醒识别模型对所述目标声音信号进行唤醒识别,得到所述识别结果,所述唤醒识别模型为通过深度神经网络对训练语料进行训练得到的,所述训练语料为包括目标声音信号在内的多个声音信号,以及所述多个声音信号对应的唤醒方案,所述唤醒方案包括唤醒所述终端设备或不唤醒所述终端设备。
综上所述,可以看出,本申请提供的实施例中,云端服务器根据接收到终端设备发送的疑似唤醒的目标声音信号,并对该目标声音信号进行识别得到识别结果,且将识别结果返回终端设备,终端设备根据该识别结果执行相应的操作,由于终端设备的计算能力有限,通过云端识别并返回识别结果的方式可以提高终端设备的唤醒率,同时使得终端设备的唤醒更加精准。
本申请实施例还提供了一种终端设备,如图6所示,为了便于说明,仅示出了与本申请实施例相关的部分,具体技术细节未揭示的,请参照本申请实施例方法部分。该终端可以为包括手机、平板电脑、PDA(Personal Digital Assistant,个人数字助理)、POS(Pointof Sales,销售终端)、车载电脑等任意终端设备,以终端为手机为例:
图6示出的是与本申请实施例提供的终端相关的手机的部分结构的框图。参考图6,手机包括:射频(Radio Frequency,RF)电路610、存储器620、输入单元630、显示单元640、传感器650、音频电路660、无线保真(wireless fidelity,WiFi)模块670、处理器680、以及电源690等部件。本领域技术人员可以理解,图6中示出的手机结构并不构成对手机的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
下面结合图6对手机的各个构成部件进行具体的介绍:
RF电路610可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,给处理器680处理;另外,将设计上行的数据发送给基站。通常,RF电路610包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(Low NoiseAmplifier,LNA)、双工器等。此外,RF电路610还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议,包括但不限于全球移动通讯系统(GlobalSystem of Mobile communication,GSM)、通用分组无线服务(General Packet RadioService,GPRS)、码分多址(Code Division Multiple Access,CDMA)、宽带码分多址(Wideband Code Division Multiple Access,WCDMA)、长期演进(Long Term Evolution,LTE)、电子邮件、短消息服务(Short Messaging Service,SMS)等。
存储器620可用于存储软件程序以及模块,处理器680通过运行存储在存储器620的软件程序以及模块,从而执行手机的各种功能应用以及数据处理。存储器620可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器620可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
输入单元630可用于接收输入的数字或字符信息,以及产生与手机的用户设置以及功能控制有关的键信号输入。具体地,输入单元630可包括触控面板631以及其他输入设备632。触控面板631,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板631上或在触控面板631附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触控面板631可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器680,并能接收处理器680发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板631。除了触控面板631,输入单元630还可以包括其他输入设备632。具体地,其他输入设备632可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
显示单元640可用于显示由用户输入的信息或提供给用户的信息以及手机的各种菜单。显示单元640可包括显示面板641,可选的,可以采用液晶显示器(Liquid CrystalDisplay,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板641。进一步的,触控面板631可覆盖显示面板641,当触控面板631检测到在其上或附近的触摸操作后,传送给处理器680以确定触摸事件的类型,随后处理器680根据触摸事件的类型在显示面板641上提供相应的视觉输出。虽然在图6中,触控面板631与显示面板641是作为两个独立的部件来实现手机的输入和输入功能,但是在某些实施例中,可以将触控面板631与显示面板641集成而实现手机的输入和输出功能。
手机还可包括至少一种传感器650,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板641的亮度,接近传感器可在手机移动到耳边时,关闭显示面板641和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于手机还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
音频电路660、扬声器661,传声器662可提供用户与手机之间的音频接口。音频电路660可将接收到的音频数据转换后的电信号,传输到扬声器661,由扬声器661转换为声音信号输出;另一方面,传声器662将收集的声音信号转换为电信号,由音频电路660接收后转换为音频数据,再将音频数据输出处理器680处理后,经RF电路610以发送给比如另一手机,或者将音频数据输出至存储器620以便进一步处理。
WiFi属于短距离无线传输技术,手机通过WiFi模块670可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图6示出了WiFi模块670,但是可以理解的是,其并不属于手机的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
处理器680是手机的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器620内的软件程序和/或模块,以及调用存储在存储器620内的数据,执行手机的各种功能和处理数据,从而对手机进行整体监控。可选的,处理器680可包括一个或多个处理单元;优选的,处理器680可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器680中。
手机还包括给各个部件供电的电源690(比如电池),优选的,电源可以通过电源管理系统与处理器680逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
尽管未示出,手机还可以包括摄像头、蓝牙模块等,在此不再赘述。
在本申请实施例中,该终端所包括的处理器680还用于执行如下操作:
获取输入语音;
根据所述输入语音确定所述输入语音对应的声音信号的概率值;
根据预设概率值对所述声音信号的概率值进行判断,以确定目标声音信号;
将所述目标声音信号发送至云端服务器,以使得所述云端服务器对所述目标声音信号进行唤醒识别得到识别结果,并返回所述识别结果;
根据所述识别结果执行相应的操作。
图7是本申请实施例提供的云端服务器的硬件结构示意图,该云端服务器700可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(centralprocessing units,CPU)722(例如,一个或一个以上处理器)和存储器732,一个或一个以上存储应用程序742或数据744的存储介质730(例如一个或一个以上海量存储设备)。其中,存储器732和存储介质730可以是短暂存储或持久存储。存储在存储介质730的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器722可以设置为与存储介质730通信,在云端服务器700上执行存储介质730中的一系列指令操作。
该中央处理器722用于执行上述由云端服务器执行的操作。
本申请实施例还提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现上述所述数据处理方法的步骤。
本申请实施例一种计算机可读存储介质,包括指令,当其在计算机上运行时,使得计算机执行上述所述数据处理方法。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行计算机程序产品时可以实现上述所述数据处理方法的步骤。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,本地客户端,或者网络设备等)执行本申请图1和图3和图5各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-onlymemory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。
Claims (18)
1.一种数据处理方法,其特征在于,包括:
终端设备获取输入语音;
所述终端设备根据所述输入语音确定所述输入语音对应的声音信号的概率值;
所述终端设备根据预设概率值对所述声音信号的概率值进行判断,以确定目标声音信号;
所述终端设备将所述目标声音信号发送至云端服务器,以使得所述云端服务器对所述目标声音信号进行唤醒识别得到识别结果,并返回所述识别结果;
所述终端设备根据所述识别结果执行相应的操作。
2.根据权利要求1所述的方法,其特征在于,所述终端设备根据预设概率值对所述声音信号的概率值进行判断,以确定目标声音信号包括:
所述终端设备判断所述输入语音对应的声音信号中是否包含概率值大于第一预设值的N个声音信号,其中,N为大于等于1的正整数;
当所述输入语音对应的声音信号中包含概率值大于所述第一预设值的N个声音信号时,所述终端设备确定所述N个声音信号中声音信号的唤醒概率值;
当所述N个声音信号中存在唤醒概率值大于或等于所述第二预设值,且小于或等于第三预设值的声音信号时,将所述N个声音信号中唤醒概率值大于或等于第二预设值,且小于或等于第三预设值的声音信号确定为所述目标声音信号。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
当所述N个声音信号中存在唤醒概率小于所述第二预设值的声音信号时,所述终端设备忽略所述N个声音信号中概率值小于所述第二预设值的声音信号。
4.根据权利要求2所述的方法,其特征在于,所述方法还包括:
当所述N个声音信号中声音信号的唤醒概率值均小于所述第二预设值时,所述终端设备忽略所述N个声音信号。
5.根据权利要求2所述的方法,其特征在于,所述方法还包括:
当所述N个声音信号中声音信号的唤醒概率值均大于所述第三预设值时,所述终端设备根据所述N个声音信号执行相应的操作。
6.根据权利要求1至4中任一项所述的方法,其特征在于,所述根据所述识别结果执行相应的操作包括:
当所述识别结果为唤醒操作时,所述终端设备根据所述目标声音信号执行相应的操作;
当所述识别结果为非唤醒操作时,所述终端设备不执行唤醒操作。
7.一种数据处理方法,其特征在于,包括:
云端服务器接收终端设备发送的目标声音信号,所述目标声音信号为所述终端设备根据获取的输入语音对应的声音信号的概率值确定得到;
所述云端服务器对所述目标声音信号进行唤醒识别得到识别结果;
所述云端服务器将所述识别结果发送至所述终端设备,以使得所述终端设备根据所述识别结果执行相应的操作。
8.根据权利要求7所述的方法,其特征在于,所述云端服务器对所述目标声音信号进行唤醒识别得到识别结果包括:
所述云端服务器根据唤醒识别模型对所述目标声音信号进行唤醒识别,得到所述识别结果,所述唤醒识别模型为通过深度神经网络对训练语料进行训练得到的,所述训练语料为包括目标声音信号在内的多个声音信号,以及所述多个声音信号对应的唤醒方案,所述唤醒方案包括唤醒所述终端设备或不唤醒所述终端设备。
9.一种终端设备,其特征在于,包括:
获取单元,用于获取输入语音;
第一确定单元,用于根据所述输入语音确定所述输入语音对应的声音信号的概率值;
第二确定单元,用于根据预设概率值对所述声音信号的概率值进行判断,以确定目标声音信号;
发送单元,用于将所述目标声音信号发送至云端服务器,以使得所述云端服务器对所述目标声音信号进行唤醒识别得到识别结果,并返回所述识别结果;
处理单元,用于根据所述识别结果执行相应的操作。
10.根据权利要求9所述的终端设备,其特征在于,所述第二确定单元具体用于:
所述终端设备判断所述输入语音对应的声音信号中是否包含概率值大于第一预设值的N个声音信号,其中,N为大于等于1的正整数;
当所述输入语音对应的声音信号中包含概率值大于所述第一预设值的N个声音信号时,确定所述N个声音信号中声音信号的唤醒概率值;
当所述N个声音信号中存在唤醒概率值大于或等于所述第二预设值,且小于或等于第三预设值的声音信号时,将所述N个声音信号中唤醒概率值大于或等于第二预设值,且小于或等于第三预设值的声音信号确定为所述目标声音信号。
11.根据权利要求10所述的终端设备,其特征在于,所述第二确定单元还具体用于:
当所述N个声音信号中存在唤醒概率小于所述第二预设值的声音信号时,忽略所述N个声音信号中概率值小于所述第二预设值的声音信号。
12.根据权利要求10所述的终端设备,其特征在于,所述第二确定单元还具体用于:
当所述N个声音信号中声音信号的唤醒概率值均小于所述第二预设值时,忽略所述N个声音信号。
13.根据权利要求10所述的终端设备,其特征在于,所述第二确定单元还具体用于:
当所述N个声音信号中声音信号的唤醒概率值均大于所述第三预设值时,根据所述N个声音信号执行相应的操作。
14.根据权利要求9至13中任一项所述的终端设备,其特征在于,所述处理单元具体用于:
当所述识别结果为唤醒操作时,根据所述目标声音信号执行相应的操作;
当所述识别结果为非唤醒操作时,不执行唤醒操作。
15.一种云端服务器,其特征在于,包括:
接收单元,用于接收终端设备发送的目标声音信号,所述目标声音信号为所述终端设备根据获取的输入语音对应的声音信号的概率值确定得到;
识别单元,用于对所述目标声音信号进行唤醒识别得到识别结果;
发送单元,用于将所述识别结果发送至所述终端设备,以使得所述终端设备根据所述识别结果执行相应的操作。
16.根据权利要求15所述的云端服务器,其特征在于,所述识别单元具体用于:
所述云端服务器根据唤醒识别模型对所述目标声音信号进行唤醒识别,得到所述识别结果,所述唤醒识别模型为通过深度神经网络对训练语料进行训练得到的,所述训练语料为包括目标声音信号在内的多个声音信号,以及所述多个声音信号对应的唤醒方案,所述唤醒方案包括唤醒所述终端设备或不唤醒所述终端设备。
17.一种计算机可读存储介质,其特征在于,包括指令,当其在计算机上运行时,使得计算机执行权利要求1至6以及权利要求7至8中任一项所述的数据处理方法的步骤。
18.一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述权利要求1至6以及权利要求7至8中任一项所述的数据处理方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910552883.XA CN110277097B (zh) | 2019-06-24 | 2019-06-24 | 数据处理方法及相关设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910552883.XA CN110277097B (zh) | 2019-06-24 | 2019-06-24 | 数据处理方法及相关设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110277097A true CN110277097A (zh) | 2019-09-24 |
CN110277097B CN110277097B (zh) | 2022-04-26 |
Family
ID=67961849
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910552883.XA Active CN110277097B (zh) | 2019-06-24 | 2019-06-24 | 数据处理方法及相关设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110277097B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112634868A (zh) * | 2020-12-21 | 2021-04-09 | 北京声智科技有限公司 | 一种语音信号处理方法、装置、介质和设备 |
CN114202891A (zh) * | 2021-12-28 | 2022-03-18 | 深圳市锐明技术股份有限公司 | 一种发送报警指示的方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160133259A1 (en) * | 2012-07-03 | 2016-05-12 | Google Inc | Determining hotword suitability |
CN106653031A (zh) * | 2016-10-17 | 2017-05-10 | 海信集团有限公司 | 语音唤醒方法及语音交互装置 |
CN108122556A (zh) * | 2017-08-08 | 2018-06-05 | 问众智能信息科技(北京)有限公司 | 减少驾驶人语音唤醒指令词误触发的方法及装置 |
CN108335696A (zh) * | 2018-02-09 | 2018-07-27 | 百度在线网络技术(北京)有限公司 | 语音唤醒方法和装置 |
CN109817200A (zh) * | 2019-01-30 | 2019-05-28 | 北京声智科技有限公司 | 语音唤醒的优化装置及方法 |
-
2019
- 2019-06-24 CN CN201910552883.XA patent/CN110277097B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160133259A1 (en) * | 2012-07-03 | 2016-05-12 | Google Inc | Determining hotword suitability |
CN106653031A (zh) * | 2016-10-17 | 2017-05-10 | 海信集团有限公司 | 语音唤醒方法及语音交互装置 |
CN108122556A (zh) * | 2017-08-08 | 2018-06-05 | 问众智能信息科技(北京)有限公司 | 减少驾驶人语音唤醒指令词误触发的方法及装置 |
CN108335696A (zh) * | 2018-02-09 | 2018-07-27 | 百度在线网络技术(北京)有限公司 | 语音唤醒方法和装置 |
CN109817200A (zh) * | 2019-01-30 | 2019-05-28 | 北京声智科技有限公司 | 语音唤醒的优化装置及方法 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112634868A (zh) * | 2020-12-21 | 2021-04-09 | 北京声智科技有限公司 | 一种语音信号处理方法、装置、介质和设备 |
CN112634868B (zh) * | 2020-12-21 | 2024-04-05 | 北京声智科技有限公司 | 一种语音信号处理方法、装置、介质和设备 |
CN114202891A (zh) * | 2021-12-28 | 2022-03-18 | 深圳市锐明技术股份有限公司 | 一种发送报警指示的方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN110277097B (zh) | 2022-04-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106126174B (zh) | 一种场景音效的控制方法、及电子设备 | |
CN104093123B (zh) | 应用程序的信息推送方法、装置和系统、移动终端 | |
CN107146616A (zh) | 设备控制方法及相关产品 | |
CN110163045A (zh) | 一种手势动作的识别方法、装置以及设备 | |
CN103813127B (zh) | 一种视频通话方法、终端及系统 | |
CN107633051A (zh) | 桌面搜索方法、移动终端及计算机可读存储介质 | |
CN107132974A (zh) | 终端冻屏处理方法、终端及计算机可读存储介质 | |
CN109067981A (zh) | 分屏应用切换方法、装置、存储介质和电子设备 | |
CN108958593A (zh) | 一种确定通讯对象的方法及移动终端 | |
CN107317918A (zh) | 参数设置方法及相关产品 | |
CN110277097A (zh) | 数据处理方法及相关设备 | |
CN110413639A (zh) | 数据核查方法及装置、电子设备和计算机可读存储介质 | |
CN107577795A (zh) | 一种推荐歌曲的方法、装置和系统 | |
CN106294087B (zh) | 一种对业务执行操作的操作频率的统计方法及装置 | |
CN109992472A (zh) | 一种界面监测方法、终端及计算机可读存储介质 | |
CN106791074B (zh) | 歌曲信息显示方法、装置及移动终端 | |
CN107635277A (zh) | 一种物联网终端设备的省电管理方法、及物联网终端设备 | |
CN104834638B (zh) | 一种热词展示方法、装置及电子设备 | |
CN107809474B (zh) | 下载状态的提示方法、装置和终端设备 | |
WO2015067116A1 (zh) | 处理语音文本的方法及装置 | |
CN106484230B (zh) | 一种切换控制方法和设备 | |
CN106777383B (zh) | 文件排序方法及智能终端 | |
CN109189538A (zh) | 一种发送定向红包的方法和装置 | |
CN109710430A (zh) | 一种菜单项的分享方法及终端 | |
CN110908586A (zh) | 一种键盘的显示方法、装置及终端设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |