CN109672775B - 调节唤醒灵敏度的方法、装置及终端 - Google Patents
调节唤醒灵敏度的方法、装置及终端 Download PDFInfo
- Publication number
- CN109672775B CN109672775B CN201710960420.8A CN201710960420A CN109672775B CN 109672775 B CN109672775 B CN 109672775B CN 201710960420 A CN201710960420 A CN 201710960420A CN 109672775 B CN109672775 B CN 109672775B
- Authority
- CN
- China
- Prior art keywords
- awakening
- word
- wake
- sensitivity
- terminal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000035945 sensitivity Effects 0.000 title claims abstract description 200
- 238000000034 method Methods 0.000 title claims abstract description 53
- 230000002159 abnormal effect Effects 0.000 claims abstract description 63
- 238000001514 detection method Methods 0.000 claims description 30
- 210000001260 vocal cord Anatomy 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 5
- 230000008859 change Effects 0.000 abstract description 13
- 238000004422 calculation algorithm Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 14
- 230000002618 waking effect Effects 0.000 description 12
- 238000012545 processing Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 9
- 230000007613 environmental effect Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 6
- 230000007423 decrease Effects 0.000 description 4
- 238000013139 quantization Methods 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000037007 arousal Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 230000005484 gravity Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 230000001755 vocal effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000010079 rubber tapping Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72448—User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions
- H04M1/72454—User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions according to context-related or environment-related conditions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0484—Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
- G06F3/04847—Interaction techniques to control parameter settings, e.g. interaction with sliders or dials
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0487—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
- G06F3/0488—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2250/00—Details of telephonic subscriber devices
- H04M2250/74—Details of telephonic subscriber devices with voice recognition means
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- General Health & Medical Sciences (AREA)
- Computer Networks & Wireless Communication (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Environmental & Geological Engineering (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Electric Clocks (AREA)
Abstract
本发明实施例公开了一种调节唤醒灵敏度的方法、装置和终端。该方法包括:获取至少一个唤醒词的唤醒灵敏度;统计唤醒词对应的异常唤醒的次数,异常唤醒是指终端的实际唤醒情况与期望唤醒情况不同,终端的实际唤醒情况根据语音信号与唤醒词的匹配程度确定,终端的期望唤醒情况根据语音信号中是否包括唤醒词确定;根据唤醒词对应的异常唤醒的次数调节唤醒词的唤醒灵敏度。在本发明实施例中,通过根据唤醒词对应的异常唤醒的次数对该唤醒词的唤醒灵敏度灵活地进行调节,使得唤醒词的唤醒灵敏度更合理,更能适应终端所处的环境变化,从而使终端响应唤醒词的表现较佳。
Description
技术领域
本发明实施例涉及语音唤醒技术领域,特别涉及一种调节唤醒灵敏度的方法、装置及终端。
背景技术
语音唤醒技术是指通过语音唤醒设备的技术,而唤醒词的唤醒灵敏度是语音唤醒技术的重要指标。当用户发出的语音信号与唤醒词的匹配程度较高,也即语音信号的得分大于唤醒词的唤醒灵敏度,此时设备被唤醒。由于不同的环境下设备响应唤醒词的表现不相同,因此需要对唤醒词的唤醒灵敏度进行调节。
相关技术提供的调节唤醒灵敏度的方法如下:终端提供有用于调节唤醒灵敏度的调节滑动条,调节滑动条包括滑块与进度条,滑块在进度条的不同位置对应唤醒词的不同唤醒灵敏度档位,每个档位对应有预先设定的唤醒灵敏度,用户可以在上述多个档位中选择一个档位,终端将用户选择的档位对应的唤醒灵敏度确定为唤醒词的唤醒灵敏度。
相关技术中,用户选择的档位对应的唤醒灵敏度是预先设定的,无法适应终端所处的环境变化,导致终端响应唤醒词的表现较差。
发明内容
本发明实施例提供了一种调节唤醒灵敏度的方法、装置及终端,用以解决相关技术中所存在的唤醒词的唤醒灵敏度无法适应终端所处的环境变化的问题。所述技术方案如下:
第一方面,提供了一种调节唤醒灵敏度的方法,所述方法包括:
获取至少一个唤醒词的唤醒灵敏度;
统计所述唤醒词对应的异常唤醒的次数,所述异常唤醒是指终端的实际唤醒情况与期望唤醒情况不同,所述终端的实际唤醒情况根据语音信号与所述唤醒词的匹配程度确定,所述终端的期望唤醒情况根据所述语音信号中是否包括所述唤醒词确定;
根据所述唤醒词对应的异常唤醒的次数调节所述唤醒词的唤醒灵敏度。
第二方面,提供了一种调节唤醒灵敏度的装置,所述装置包括:
灵敏度获取模块,用于获取至少一个唤醒词的唤醒灵敏度;
次数统计模块,用于统计所述唤醒词对应的异常唤醒的次数,所述异常唤醒是指终端的实际唤醒情况与期望唤醒情况不同,所述终端的实际唤醒情况根据语音信号与所述唤醒词的匹配程度确定,所述终端的期望唤醒情况根据所述语音信号中是否包括所述唤醒词确定;
灵敏度调节模块,用于根据所述唤醒词对应的异常唤醒的次数调节所述唤醒词的唤醒灵敏度。
可选地,所述次数统计模块,包括:
第一获取单元,用于获取采集到的语音信号与所述唤醒词的匹配程度;
第二获取单元,用于获取所述语音信号的识别结果;
次数统计单元,用于根据所述匹配程度与所述语音信号的识别结果统计所述唤醒词对应的异常唤醒次数。
可选地,所述异常唤醒包括误唤醒,所述误唤醒是指所述终端的实际唤醒情况为应该被唤醒,但所述终端的期望唤醒情况为不该被唤醒;
所述次数统计单元,用于当所述匹配程度大于所述唤醒词的唤醒灵敏度,且所述语音信号的识别结果指示所述语音信号中不包括所述唤醒词时,更新所述唤醒词对应的误唤醒的次数。
可选地,所述灵敏度调节模块,用于当所述误唤醒的次数符合第一预设条件时,根据所述误唤醒的次数调高所述唤醒词的唤醒灵敏度。
可选地,所述第二获取单元,用于:
向服务器发送检测请求,所述检测请求用于请求检测所述语音信号中是否包括所述唤醒词;
接收所述服务器根据所述检测请求返回的所述语音信号的识别结果。
可选地,所述次数统计模块,还包括:
信号检测单元,用于检测是否在预设时间内获取到用于触发取消唤醒操作的操作信号;
所述第二获取单元,还用于当在预设时间获取到所述操作信号时,执行所述获取所述语音信号的识别结果的步骤。
可选地,所述异常唤醒包括未唤醒,所述未唤醒是指所述终端的实际唤醒情况为未被唤醒,但所述终端的期望唤醒情况为应该被唤醒;
所述次数统计单元,用于当所述匹配程度小于所述唤醒词的唤醒灵敏度,且所述语音信号的识别结果指示所述语音信号中包括所述唤醒词时,更新所述唤醒词对应的未唤醒的次数。
可选地,所述灵敏度调节模块,用于当所述未唤醒的次数符合第二预设条件时,根据所述未唤醒的次数调低所述唤醒词的唤醒灵敏度。
可选地,所述装置包括:
初始值还原模块,用于将所述唤醒词对应的异常唤醒的次数还原至初始值;
所述次数统计模块,用于在下次调节时从所述初始值重新统计所述异常唤醒的次数。
可选地,所述灵敏度获取模块,包括:
界面显示单元,用于当获取到用于触发显示唤醒灵敏度设置界面的操作信号时,显示所述唤醒灵敏度设置界面,所述唤醒灵敏度设置界面包括所述至少一个唤醒词和所述至少一个唤醒词对应的调节滑动条,所述唤醒词对应的调节滑动条用于调节所述唤醒词的档位,不同的档位对应不同的唤醒灵敏度;
灵敏度获取单元,用于当获取到对应于任意一个调节滑动条的调节信号时,根据调节后的所述调节滑动条确定所述调节滑动条对应的唤醒词的唤醒灵敏度。
可选地,所述灵敏度调节模块,用于根据所述唤醒词对应的异常唤醒的次数调节所述唤醒词的各个档位分别对应的唤醒灵敏度。
第三方面,提供了一种终端,所述终端包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如第一方面所述的调节唤醒灵敏度的方法。
第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如第一方面所述的调节唤醒灵敏度的方法。
第五方面,提供了一种计算机程序产品,当该计算机程序产品被执行时,其用于执行上述第一方面所述的调节唤醒灵敏度的方法。
本发明实施例提供的技术方案可以带来如下有益效果:
通过根据唤醒词对应的异常唤醒的次数对该唤醒词的唤醒灵敏度灵活地进行调节,使得唤醒词的唤醒灵敏度更合理,更能适应终端所处的环境变化,从而使终端响应唤醒词的表现较佳。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一个实施例提供的实施环境的示意图;
图2A是本发明一个实施例提供的调节唤醒灵敏度的方法的流程图;
图2B是本发明一个实施例提供的唤醒灵敏度设置界面的界面示意图;
图2C是本发明另一个实施例提供的唤醒灵敏度设置界面的界面示意图;
图3是本发明另一个实施例提供的调节唤醒灵敏度的方法的流程图;
图4是本发明另一个实施例提供的调节唤醒灵敏度的方法的流程图;
图5是本发明一个实施例提供的调节唤醒灵敏度的装置的框图;
图6是本发明一个实施例提供的终端的结构方框图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
本发明实施例为终端扩充了调节唤醒词的唤醒灵敏度的功能,通过根据唤醒词对应的异常唤醒的次数对该唤醒词的唤醒灵敏度灵活地进行调节,使得唤醒词的唤醒灵敏度更合理,更能适应终端所处的环境变化,从而使终端响应唤醒词的表现较佳。
本发明实施提供的方案,可以由终端自行完成,也可以由终端与服务器交互完成。请参考图1,其示出了本发明一个实施例示出的实施环境的示意图。该实施环境中包括终端10和服务器20。
终端10可以是手机、车载终端、平板电脑、可穿戴设备、膝上型便携计算机等电子设备。可选地,终端10中安装有提供语音唤醒服务的应用程序,例如,该应用程序为是“XX语音助手”。
服务器20具有数据处理的功能以及与终端10进行交互的功能。例如,服务器20具有语音识别的功能。可选地,服务器20是终端10所安装的提供语音唤醒服务的应用程序对应的后台服务器。服务器20可以是一台服务器,也可以是由若干台服务器组成的服务器集群,或者是一个云计算服务中心。
服务器20可以通过网络与终端10建立通信连接。该网络可以是无线网络,也可以是有线网络。
可选的,上述的无线网络或有线网络使用标准通信技术和/或协议。网络通常为因特网、但也可以是任何网络,包括但不限于局域网(Local Area Network,LAN)、城域网(Metropolitan Area Network,MAN)、广域网(Wide Area Network,WAN)、移动、有线或者无线网络、专用网络或者虚拟专用网络的任何组合)。在一些实施例中,使用包括超文本标记语言(Hyper Text Mark-up Language,HTML)、可扩展标记语言(Extensible MarkupLanguage,XML)等的技术和/或格式来代表通过网络交换的数据。此外还可以使用诸如安全套接字层(Secure Socket Layer,SSL)、传输层安全(Trassport Layer Security,TLS)、虚拟专用网络(Virtual Private Network,VPN)、网际协议安全(Internet ProtocolSecurity,IPsec)等常规加密技术来加密所有或者一些链路。在另一些实施例中,还可以使用定制和/或专用数据通信技术取代或者补充上述数据通信技术。
请参考图2A,其示出了本发明一个实施例示出的调节唤醒灵敏度的方法的流程图。该方法以终端实现为例,可以包括如下步骤:
步骤201,获取至少一个唤醒词的唤醒灵敏度。
唤醒词的唤醒灵敏度是指终端被该唤醒词唤醒的触发条件。不同的唤醒词的唤醒灵敏度可以相同,也可以不相同。当语音信号与唤醒词的匹配程度符合上述触发条件时,终端被唤醒;当语音信号与唤醒词的匹配程度不符合上述触发条件时,则终端无法被唤醒。
本发明实施例中,语音信号与唤醒词的匹配程度以及唤醒灵敏度均可以采用数值来衡量,也即,唤醒词的唤醒灵敏度是终端被该唤醒词唤醒的最低门限值。当语音信号与唤醒词的匹配程度大于该唤醒词的唤醒灵敏度时,终端被唤醒;当语音信号与唤醒词的匹配程度小于或等于该唤醒词的唤醒灵敏度时,终端无法被唤醒。另外,对于采用数值来衡量语音信号与唤醒词的匹配程度的具体方式,将在下文实施例进行解释说明。
可选地,步骤201可以包括如下两个子步骤:
步骤201a,当获取到用于触发显示唤醒灵敏度设置界面的操作信号时,显示唤醒灵敏度设置界面。
唤醒灵敏度设置界面用于供用户设置唤醒词的唤醒灵敏度。唤醒灵敏度设置界面包括至少一个唤醒词和至少一个唤醒词对应的调节滑动条,唤醒词对应的调节滑动条用于调节唤醒词的档位。可选地,调节滑动条包括滑块与进度条两个部分,其中,滑块在进度条上的位置对应唤醒词的档位。例如,滑块在进度条的起始位置对应低档,滑块在进度条的中点位置对应中档,滑块在进度条的终点位置对应高档。
不同的档位对应不同的唤醒灵敏度。各个档位对应的唤醒灵敏度可以由相关技术人员在实验室环境下对唤醒词进行唤醒指标测试得到,并被预置到终端中,或者被预置到终端所安装的提供语音唤醒服务的应用程序中。在一个示例中,唤醒词的各个档位与唤醒灵敏度的对应关系可以参考表-1。
表-1
唤醒灵敏度 | 低档 | 高档 | 中档 |
唤醒词A | 50 | 60 | 70 |
唤醒词B | 60 | 70 | 80 |
唤醒词C | 55 | 60 | 65 |
在一种可能的实现方式中,在唤醒灵敏度设置界面对多个唤醒词的唤醒灵敏度的调节是同步完成的。结合参考图2B,多个唤醒词对应有一个调节滑动条。当滑块在进度条上的位置被调节至中点位置时,各个唤醒词的档位均为中档,唤醒词的唤醒灵敏度为该唤醒词的中档所对应的数值。
在另一种可能的实现方式中,在唤醒灵敏度设置界面对多个唤醒词的唤醒灵敏度的调节是非同步完成的。结合参考图2C,每个唤醒词均对应有调节滑动条。当用户选中某个唤醒词时,终端在唤醒灵敏度设置界面显示用户选中的唤醒词对应的调节滑动条。当滑块在进度条上的位置被调节至中点位置时,该唤醒词的档位均为中档,该唤醒词的唤醒灵敏度为该唤醒词的中档所对应的数值。
步骤201b,当获取到对应于任意一个调节滑动条的调节信号时,根据调节后的调节滑动条确定调节滑动条对应的唤醒词的唤醒灵敏度。
调节信号可以是用户对调节滑动条上的滑块所执行的滑动操作,当滑动操作结束时,终端先根据该滑块在调节滑动条上的位置确定唤醒词的档位,之后再确定该唤醒词的唤醒灵敏度。
在一个示例中,终端中存储有唤醒词的档位与唤醒灵敏度之间的预设对应关系,终端获取唤醒词的档位后,直接查找上述预设对应关系,得到唤醒词的唤醒灵敏度。在另一个示例中,服务器中存储有唤醒词的档位与唤醒灵敏度之间的预设对应关系,终端获取唤醒词的档位后,向服务器发送灵敏度获取请求,灵敏度获取请求用于请求获取唤醒灵敏度,灵敏度获取请求中携带有终端的标识,唤醒词,以及唤醒词的档位,服务器根据灵敏度获取请求查询上述预设对应关系,并将查询到的唤醒灵敏度返回至终端。此处的服务器可以是终端所安装的提供语音唤醒服务的应用程序对应的后台服务器。
在其它可能的示例中,唤醒词的唤醒灵敏度也可以由终端预先设定,还可以由服务器预先设定,本发明实施例对此不作限定。
步骤202,统计唤醒词对应的异常唤醒的次数。
异常唤醒是指终端的实际唤醒情况与期望唤醒情况不同。例如,终端的实际唤醒情况为终端应该被唤醒,终端的期望唤醒情况为不该被唤醒。再例如,终端的实际唤醒情况为未被唤醒,终端的期望唤醒情况为终端应该被唤醒。上述两种情况可以分别称之为误唤醒和未唤醒。
终端的实际唤醒情况根据语音信号与唤醒词的匹配程度确定。当语音信号与唤醒词的匹配程度符合预设条件时,终端的实际唤醒情况为应该被唤醒;当语音信号与唤醒词的匹配程度符合预设条件时,终端的实际唤醒情况为不该被唤醒。当语音信号与唤醒词的匹配程度以及唤醒灵敏度均采用数值衡量时,若语音信号与唤醒词的匹配程度大于唤醒词的唤醒灵敏度,则终端的实际唤醒情况为应该被唤醒;若语音信号与唤醒词的匹配程度大于唤醒词的唤醒灵敏度,则终端的实际唤醒情况为未被唤醒。
终端的期望唤醒情况根据语音信号中是否包括唤醒词确定。语音信号中包括唤醒词时,则终端的期望唤醒情况为应该被唤醒;语音信号中不包括唤醒词时,则终端的期望唤醒情况为不该被唤醒。
可选地,步骤202可以包括如下几个子步骤:
步骤202a,获取采集到的语音信号与唤醒词的匹配程度,并获取语音信号的识别结果;
语音信号可以是终端统计异常唤醒次数之前预先采集的,也可以是终端实时采集的。可选地,终端中包括具有语音信号采集功能的组件(例如,麦克风(microphone,MIC)),当终端向用户提供语音唤醒服务时,由上述组件持续地采集终端所处环境中的语音信号。
语音信号与唤醒词的匹配程度可以采用语音信号与唤醒词之间的相似度来表示。语音信号与唤醒词之间的相似度越大,则语音信号与唤醒词之间的匹配程度越高;语音信号与唤醒词之间的相似度越小,则语音信号与唤醒词之间的匹配程度越低。
在一种可能的实现方式中,终端直接对采集到的语音信号与唤醒词的发音进行相似度计算,从而得到语音信号与唤醒词的匹配程度。具体地,终端采用声学模型对采集到的语音信号进行解码,得到语音信号的音索序列,然后将语音信号的音索序列与唤醒词的音索序列进行相似度计算,得到语音信号与唤醒词的匹配程度。在另一种可能的实现方式中,终端先将采集到的语音信号转化成文本,然后将上述文本与唤醒词进行相似度计算,得到语音信号与唤醒词的匹配程度。在本发明实施例中,将语音信号转化成文本所采取的算法可以是基于声道模型和语音知识的算法、动态时间规整(Dynamic Time Warping,DTW)算法、隐马尔可夫模型(Hidden Markov Model,HMM)算法、矢量量化(Vector Quantization)算法等等,相似度计算所采用的算法可以是基于空间向量的余弦算法、基于语义相似度的文本相似度算法、最小编辑距离算法等等,本发明实施例对此不作限定。
语音信号的识别结果是对语音信号进行识别的结果,可用于指示语音信号中是否包括唤醒词。对语音信号进行识别所采取的算法也可以是是基于声道模型和语音知识的算法、动态时间规整算法、隐马尔可夫模型算法、矢量量化算法等等,本发明实施例对此不作限定。
另外,本发明实施例对获取语音信号与唤醒词的匹配程度,以及语音信号的识别结果的先后顺序不作限定。终端可以先获取语音信号与唤醒词的匹配程度,再获取语音信号的识别结果;终端也可以先获取语音信号的识别结果,再获取语音信号与唤醒词的匹配程度。
需要说明的是,语音信号与唤醒词的匹配程度以及语音信号的识别结果均可以由终端直接获取,也可以由终端从服务器中获取。当语音信号与唤醒词的匹配程度由终端直接获取时,终端在未联网的情况下也能向用户提供语音唤醒服务,另外,由于无需与服务器交互,终端响应唤醒词所需的时延较短。当语音信号的识别结果由终端从服务器中获取时,语音识别的结果的精度则更高。
步骤202b,根据匹配程度与语音信号的识别结果统计唤醒词对应的异常唤醒次数。
异常唤醒次数也即是终端的实际唤醒情况与期望唤醒情况不同的次数。若终端根据语音信号与唤醒词的匹配程度确定出的实际唤醒情况,与根据语音信号的识别结果确定的期望唤醒情况不相同时,则终端对唤醒词对应的异常唤醒的次数进行计数。例如,终端每确定出一次误唤醒,将唤醒词的误唤醒的次数加一;再例如,终端每确定出一次未唤醒,将唤醒词的未唤醒的次数加一。
步骤203,根据唤醒词对应的异常唤醒的次数调节唤醒词的唤醒灵敏度。
终端可以根据唤醒词对应的异常唤醒的次数调高或调低唤醒词的唤醒灵敏度。终端每次调节唤醒灵敏度的程度可以由终端或服务器设定,也可以人为设定,本发明实施例对此不作限定。例如,唤醒词的唤醒灵敏度为将唤醒词的唤醒灵敏度调低10%,调高20%等等。
可选地,终端在唤醒词对应的异常唤醒的次数符合预设条件时,调节唤醒词的唤醒灵敏度。在下文实施例中,将对根据误唤醒的次数调节唤醒灵敏度,以及根据未唤醒的次数调节唤醒灵敏度两种情况分别进行说明。
可选地,终端还根据唤醒词对应的异常唤醒的次数调节所述唤醒词的各个档位分别对应的唤醒灵敏度。也即,终端将唤醒词的各个档位对应的唤醒灵敏度同步调高或调低,可以使用户调节唤醒词的档位之后,唤醒词的唤醒灵敏度依然能适应终端所处的环境变化。
可选地,在步骤203之后,还包括如下步骤:将唤醒词对应的异常唤醒的次数还原至初始值,并在下次调节时从初始值重新统计异常唤醒的次数。例如,初始值为0。通过上述方式,可以实现对唤醒灵敏度的循环调节,从而使唤醒词的唤醒灵敏度更好地适应终端所处的环境变化。
综上所述,本发明实施例提供的方法,通过根据唤醒词对应的异常唤醒的次数对该唤醒词的唤醒灵敏度灵活地进行调节,使得唤醒词的唤醒灵敏度更合理,更能适应终端所处的环境变化,从而使终端响应唤醒词的表现较佳。
本发明实施例还通过同步调节唤醒词的各个档位对应的唤醒灵敏度,从而使用户调节唤醒词的档位之后,唤醒词的唤醒灵敏度依然能适应终端所处的环境变化;还通过在调节唤醒灵敏度之后,将唤醒词对应的异常唤醒的次数还原至初始值,并在下次调节时从初始值重新统计异常唤醒的次数,实现对唤醒灵敏度的循环调节,使唤醒词的唤醒灵敏度更好地适应终端所处的环境变化。
请参考图3,其示出了本发明另一个实施例示出的调节唤醒灵敏度的方法的流程图。在该实施例中,异常唤醒包括误唤醒,误唤醒是指终端的实际唤醒情况为应该被唤醒,但终端的期望唤醒情况为不该被唤醒。
该方法可以包括如下步骤:
步骤301,获取至少一个唤醒词的唤醒灵敏度。
步骤302,获取采集到的语音信号与唤醒词的匹配程度。
步骤303,检测是否在预设时间内获取到用于触发取消唤醒操作的操作信号。
预设时间可以根据实际需求设定。例如,预设时间为3秒。可选地,终端通过埋点数据监控终端是否获取到用于触发取消唤醒操作的操作信号。埋点数据分别预置在终端所安装的操作系统中,以及终端所安装的提供语音唤醒技术的应用程序中。
步骤304,若在预设时间获取到操作信号,向服务器发送检测请求。
检测请求用于请求检测语音信号中是否包括唤醒词。检测请求中携带语音信号、终端的标识以及唤醒词。服务器用于根据检测请求对语音信号进行识别,得到语音信号的识别结果,并向终端返回语音信号的识别结果。由服务器对语音信号进行语音识别,识别结果的精度更高。
若在预设时间内未获取到操作信号,则终端根据语音信号与唤醒词的匹配程度决定是否被唤醒,而不执行获取识别结果的步骤。通过上述方式,避免终端每次都获取语音信号的识别结果,可以降低终端的处理开销。
在其它可能的示例中,终端也可以不执行检测是否在预设时间内获取到用于触发取消唤醒操作的操作信号的步骤,而是直接获取语音信号的识别结果。
步骤305,接收服务器根据检测请求返回的语音信号的识别结果。
步骤306,当匹配程度大于唤醒词的唤醒灵敏度,且语音信号的识别结果指示语音信号中不包括唤醒词时,更新唤醒词对应的误唤醒的次数。
匹配程度大于唤醒词的唤醒灵敏度则指示终端的实际唤醒情况为应该被唤醒,语音信号的识别结果指示语音信号中不包括唤醒词指示终端的期望唤醒情况为不该被唤醒,此时终端检测出误唤醒,并更新唤醒词对应的误唤醒的次数。
步骤307,当误唤醒的次数符合第一预设条件时,根据误唤醒的次数调高唤醒词的唤醒灵敏度。
第一预设条件可以由用户设定,也可以由终端设定。在一个示例中,第一预设条件是唤醒词对应的误唤醒的次数在预设时间内大于预设数值。例如,预设数值为2,唤醒词对应的误唤醒的次数小于或等于2时,则该唤醒词的唤醒灵敏度合适,无需调节;唤醒词对应的误唤醒的次数大于2时,则该唤醒词的唤醒灵敏度过于灵敏,需要被调高。
在其它可能的示例中,第一预设条件是误唤醒的次数与总唤醒的次数的比值大于预设阈值。总唤醒的次数为误唤醒的次数、未唤醒的次数与正常唤醒的次数之和。例如,预设阈值为25%。误唤醒的次数与总唤醒的次数的比值小于或等于25%,则该唤醒词的唤醒灵敏度合适,无需调节;误唤醒的次数与总唤醒的次数的比值大于25%时,则该唤醒词的唤醒灵敏度过于灵敏,需要被调高。
综上所述,本发明实施例提供的方法,通过根据唤醒词对应的误唤醒的次数,调高该唤醒词的唤醒灵敏度,使得唤醒词的唤醒灵敏度更合理,更能适应终端所处的环境变化,从而使终端响应唤醒词的表现较佳。
本发明实施例还通过在检测到用于触发取消唤醒操作的操作信号之后获取识别结果,避免终端每次都获取语音信号的识别结果,可以降低终端的处理开销;还通过由服务器对语音信号进行语音识别,提高语音识别的精度。
请参考图4,其示出了本发明另一个实施例示出的调节唤醒灵敏度的方法的流程图。在本实施例中,异常唤醒包括未唤醒,未唤醒是指终端的实际唤醒情况为未被唤醒,但终端的期望唤醒情况为应该被唤醒。
该方法可以包括如下步骤:
步骤401,获取至少一个唤醒词的唤醒灵敏度。
步骤402,获取采集到的语音信号与唤醒词的匹配程度。
步骤403,向服务器发送检测请求。
检测请求用于请求检测语音信号中是否包括唤醒词。可选地,终端先检测语音信号与唤醒词的匹配程度是否符合设定条件。例如,语音信号与唤醒词的匹配程度以及唤醒灵敏度均采用数值来衡量时,设定条件是语音信号与唤醒词的匹配程度小于唤醒词的唤醒灵敏度,并且处于唤醒词的近似门限值区间。结合参考表-2,其示出了唤醒词与唤醒词的近似门限值区间的预设对应关系。
表-2
唤醒词A | 唤醒词A | 唤醒词A | |
档位 | 低档 | 中档 | 高档 |
唤醒灵敏度 | 50 | 60 | 70 |
近似门限值区间 | 45~50 | 54~60 | 63~70 |
当终端先检测语音信号与唤醒词的匹配程度是否符合设定条件时,再执行向服务器发送检测请求的步骤,若未检测到语音信号与唤醒词的匹配程度是否符合设定条件时,则终端根据语音信号与唤醒词的匹配程度决定是否被唤醒,而不执行获取识别结果的步骤。通过上述方式,避免终端每次都获取语音信号的识别结果,可以降低终端的处理开销。
步骤404,接收服务器根据检测请求返回的语音信号的识别结果。
步骤405,当所述匹配程度小于所述唤醒词的唤醒灵敏度,且所述语音信号的识别结果指示所述语音信号中包括所述唤醒词时,更新所述唤醒词对应的未唤醒的次数。
匹配程度小于唤醒词的唤醒灵敏度则指示终端的实际唤醒情况为终端未被唤醒,语音信号的识别结果指示语音信号中包括唤醒词指示终端的期望唤醒情况为应该被唤醒,此时终端检测出未唤醒,并更新唤醒词对应的未唤醒的次数。
步骤406,当未唤醒的次数符合第二预设条件时,根据未唤醒的次数调低唤醒词的唤醒灵敏度。
第二预设条件可以由用户设定,也可以由终端设定。在一个示例中,第二预设条件是唤醒词对应的未唤醒的次数在预设时间内大于预设数值。例如,预设数值为2,唤醒词对应的未唤醒的次数小于或等于2时,则该唤醒词的唤醒灵敏度合适,无需调节;唤醒词对应的未唤醒的次数大于2时,则该唤醒词的唤醒灵敏度不灵敏,需要被调低。
在其它可能的示例中,第二预设条件是未唤醒的次数与总唤醒的次数的比值大于预设阈值。总唤醒的次数为误唤醒的次数、未唤醒的次数与正常唤醒的次数之和。例如,预设阈值为25%。未唤醒的次数与总唤醒的次数的比值小于或等于25%,则该唤醒词的唤醒灵敏度合适,无需调节;未唤醒的次数与总唤醒的次数的比值大于25%时,则该唤醒词的唤醒灵敏度不灵敏,需要被调低。
综上所述,本发明实施例提供的方法,通过根据唤醒词对应的未唤醒的次数,调低该唤醒词的唤醒灵敏度,使得唤醒词的唤醒灵敏度更合理,更能适应终端所处的环境变化,从而使终端响应唤醒词的表现较佳。
本发明实施例还通过在检测到先检测语音信号与唤醒词的匹配程度符合设定条件之后获取识别结果,避免终端每次都获取语音信号的识别结果,可以降低终端的处理开销;还通过由服务器对语音信号进行语音识别,提高语音识别的精度。
下述为本发明装置实施例,可以用于执行本发明方法实施例。对于本发明装置实施例中未披露的细节,请参照本发明方法实施例。
请参考图5,其示出了本发明一个实施例提供的调节唤醒灵敏度的装置的框图。该装置具有实现上述方法示例中的功能,所述功能可以由硬件实现,也可以由硬件执行相应的软件实现。该装置可以包括:灵敏度获取模块501、次数统计模块502和灵敏度调节模块503。
灵敏度获取模块501,用于获取至少一个唤醒词的唤醒灵敏度。
次数统计模块502,用于统计所述唤醒词对应的异常唤醒的次数,所述异常唤醒是指终端的实际唤醒情况与期望唤醒情况不同,所述终端的实际唤醒情况根据语音信号与所述唤醒词的匹配程度确定,所述终端的期望唤醒情况根据所述语音信号中是否包括所述唤醒词确定。
灵敏度调节模块503,用于根据所述唤醒词对应的异常唤醒的次数调节所述唤醒词的唤醒灵敏度。
可选地,所述次数统计模块502,包括:第一获取单元、第二获取单元和次数统计单元(图中未示出)。
第一获取单元,用于获取采集到的语音信号与所述唤醒词的匹配程度。
第二获取单元,用于获取所述语音信号的识别结果。
次数统计单元,用于根据所述匹配程度与所述语音信号的识别结果统计所述唤醒词对应的异常唤醒次数。
可选地,所述异常唤醒包括误唤醒,所述误唤醒是指所述终端的实际唤醒情况为应该被唤醒,但所述终端的期望唤醒情况为不该被唤醒;
所述次数统计单元,用于当所述匹配程度大于所述唤醒词的唤醒灵敏度,且所述语音信号的识别结果指示所述语音信号中不包括所述唤醒词时,更新所述唤醒词对应的误唤醒的次数。
可选地,所述灵敏度调节模块503,用于当所述误唤醒的次数符合第一预设条件时,根据所述误唤醒的次数调高所述唤醒词的唤醒灵敏度。
可选地,所述第二获取单元,用于:
向服务器发送检测请求,所述检测请求用于请求检测所述语音信号中是否包括所述唤醒词;
接收所述服务器根据所述检测请求返回的所述语音信号的识别结果。
可选地,所述次数统计模块502,还包括:信号检测单元(图中未示出)。
信号检测单元,用于检测是否在预设时间内获取到用于触发取消唤醒操作的操作信号。
所述第二获取单元,还用于当在预设时间获取到所述操作信号时,执行所述获取所述语音信号的识别结果的步骤。
可选地,所述异常唤醒包括未唤醒,所述未唤醒是指所述终端的实际唤醒情况为未被唤醒,但所述终端的期望唤醒情况为应该被唤醒;
所述次数统计单元,用于当所述匹配程度小于所述唤醒词的唤醒灵敏度,且所述语音信号的识别结果指示所述语音信号中包括所述唤醒词时,更新所述唤醒词对应的未唤醒的次数。
可选地,所述灵敏度调节模块503,用于当所述未唤醒的次数符合第二预设条件时,根据所述未唤醒的次数调低所述唤醒词的唤醒灵敏度。
可选地,所述装置包括:初始值还原模块(图中未示出)。
初始值还原模块,用于将所述唤醒词对应的异常唤醒的次数还原至初始值。
所述次数统计模块,用于在下次调节时从所述初始值重新统计所述异常唤醒的次数。
可选地,所述灵敏度获取模块501,包括:界面显示单元和灵敏度获取单元。
界面显示单元,用于当获取到用于触发显示唤醒灵敏度设置界面的操作信号时,显示所述唤醒灵敏度设置界面,所述唤醒灵敏度设置界面包括所述至少一个唤醒词和所述至少一个唤醒词对应的调节滑动条,所述唤醒词对应的调节滑动条用于调节所述唤醒词的档位,不同的档位对应不同的唤醒灵敏度。
灵敏度获取单元,用于当获取到对应于任意一个调节滑动条的调节信号时,根据调节后的所述调节滑动条确定所述调节滑动条对应的唤醒词的唤醒灵敏度。
可选地,所述灵敏度调节模块503,用于根据所述唤醒词对应的异常唤醒的次数调节所述唤醒词的各个档位分别对应的唤醒灵敏度。
综上所述,本发明实施例提供的装置,通过根据唤醒词对应的异常唤醒的次数对该唤醒词的唤醒灵敏度灵活地进行调节,使得唤醒词的唤醒灵敏度更合理,更能适应终端所处的环境变化,从而使终端响应唤醒词的表现较佳。
请参考图6,其示出了本发明一个实施例提供的终端的结构示意图。该终端用于实施上述实施例中的调节唤醒灵敏度的方法。具体来讲:
终端600可以包括RF(Radio Frequency,射频)电路610、包括有一个或一个以上计算机可读存储介质的存储器620、输入单元630、显示单元640、传感器650、音频电路660、WiFi(wireless fidelity,无线保真)模块670、包括有一个或者一个以上处理核心的处理器680、以及电源690等部件。本领域技术人员可以理解,图6中示出的终端结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
RF电路610可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,交由一个或者一个以上处理器680处理;另外,将涉及上行的数据发送给基站。通常,RF电路610包括但不限于天线、至少一个放大器、调谐器、一个或多个振荡器、用户身份模块(SIM)卡、收发信机、耦合器、LNA(Low Noise Amplifier,低噪声放大器)、双工器等。此外,RF电路610还可以通过无线通信与网络和其他设备通信。无线通信可以使用任一通信标准或协议,包括但不限于GSM(Global System of Mobile communication,全球移动通讯系统)、GPRS(General Packet Radio Service,通用分组无线服务)、CDMA(CodeDivision Multiple Access,码分多址)、WCDMA(Wideband Code Division MultipleAccess,宽带码分多址)、LTE(Long Term Evolution,长期演进)、电子邮件、SMS(ShortMessaging Service,短消息服务)等。
存储器620可用于存储软件程序以及模块,处理器660通过运行存储在存储器620的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器620可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据终端600的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器620可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器620还可以包括存储器控制器,以提供处理器660和输入单元630对存储器620的访问。
输入单元630可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。具体地,输入单元630可包括触敏表面631以及其他输入设备632。触敏表面631可以是触摸板、触摸屏。除了触敏表面631,输入单元630还可以包括其他输入设备632。具体地,其他输入设备632可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
显示单元640可用于显示由用户输入的信息或提供给用户的信息以及终端600的各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。显示单元640可包括显示面板641,可选的,可以采用LCD(Liquid Crystal Display,液晶显示器)、OLED(Organic Light-Emitting Diode,有机发光二极管)等形式来配置显示面板641。
终端600还可包括至少一种传感器650,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板641的亮度,接近传感器可在终端600移动到耳边时,关闭显示面板641和/或背光。作为运动传感器的一种,重力加速度传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于终端600还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
音频电路660、扬声器661,传声器662可提供用户与终端600之间的音频接口。音频电路660可将接收到的音频数据转换后的电信号,传输到扬声器661,由扬声器661转换为声音信号输出;另一方面,传声器662将收集的声音信号转换为电信号,由音频电路660接收后转换为音频数据,再将音频数据输出处理器660处理后,经RF电路610以发送给比如另一终端,或者将音频数据输出至存储器620以便进一步处理。音频电路660还可能包括耳塞插孔,以提供外设耳机与终端600的通信。
WiFi属于短距离无线传输技术,终端600通过WiFi模块670可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图6示出了WiFi模块670,但是可以理解的是,其并不属于终端600的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
处理器680是终端600的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器620内的软件程序和/或模块,以及调用存储在存储器620内的数据,执行终端600的各种功能和处理数据,从而对手机进行整体监控。可选的,处理器660可包括一个或多个处理核心;优选的,处理器680可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器680中。
终端600还包括给各个部件供电的电源690(比如电池),优选的,电源可以通过电源管理系统与处理器680逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源690还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
尽管未示出,终端600还可以包括蓝牙模块等,在此不再赘述。
具体在本实施例中,终端600还包括有存储器,以及至少一条指令、至少一段程序、代码集或指令集,其中至少一条指令、至少一段程序、代码集或指令集存储于存储器中,且经配置以由一个或者一个以上处理器执行,以实现上述调节唤醒灵敏度的方法。
在示例性实施例中,还提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由终端的处理器加载并执行以实现上述方法实施例中的调节唤醒灵敏度的方法。
可选地,上述计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
应当理解的是,在本文中提及的“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。本文中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
以上仅为本发明的示例性实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (11)
1.一种调节唤醒灵敏度的方法,其特征在于,所述方法包括:
当获取到用于触发显示唤醒灵敏度设置界面的操作信号时,显示所述唤醒灵敏度设置界面,所述唤醒灵敏度设置界面包括至少一个唤醒词和所述至少一个唤醒词对应的调节滑动条,所述唤醒词对应的调节滑动条用于调节所述唤醒词的档位,不同的档位对应不同的唤醒灵敏度;
当获取到对应于任意一个调节滑动条的调节信号时,根据调节后的所述调节滑动条确定所述调节滑动条对应的唤醒词的唤醒灵敏度;
获取所述至少一个唤醒词对应的第一音索序列,其中,终端中存储有所述至少一个唤醒词的档位与所述唤醒灵敏度之间的预设对应关系,获取所述至少一个唤醒词的档位后,根据所述预设对应关系,得到所述至少一个唤醒词的所述唤醒灵敏度;
获取所述至少一个唤醒词的语音信号,并对所述语音信号进行解码,得到所述语音信号的第二音索序列,对所述至少一个唤醒词的所述第一音索序列和所述语音信号的所述第二音索序列进行相似度计算,得到所述至少一个唤醒词和所述语音信号的匹配程度;
响应于检测所述语音信号与所述至少一个唤醒词的匹配程度符合设定条件,向服务器发送检测请求,所述检测请求用于请求检测所述语音信号中是否包括所述唤醒词;
接收所述服务器根据所述检测请求返回的所述语音信号的识别结果;
根据所述匹配程度与所述语音信号的识别结果统计所述唤醒词对应的异常唤醒的次数,所述异常唤醒是指所述终端的实际唤醒情况与期望唤醒情况不同,所述终端的实际唤醒情况根据语音信号与所述唤醒词的匹配程度确定,所述终端的期望唤醒情况根据所述语音信号中是否包括所述唤醒词确定;
根据所述唤醒词对应的异常唤醒的次数调节所述唤醒词的唤醒灵敏度;
将所述唤醒词对应的异常唤醒的次数还原至初始值,并在下次调节时从所述初始值重新统计所述异常唤醒的次数。
2.根据权利要求1所述的方法,其特征在于,所述异常唤醒包括误唤醒,所述误唤醒是指所述终端的实际唤醒情况为应该被唤醒,但所述终端的期望唤醒情况为不该被唤醒;
所述根据所述匹配程度与所述语音信号的识别结果统计所述唤醒词对应的异常唤醒次数,包括:
当所述匹配程度大于所述唤醒词的唤醒灵敏度,且所述语音信号的识别结果指示所述语音信号中不包括所述唤醒词时,更新所述唤醒词对应的误唤醒的次数。
3.根据权利要求2所述的方法,其特征在于,所述根据所述唤醒词对应的异常唤醒的次数调节所述唤醒词的唤醒灵敏度,包括:
当所述误唤醒的次数符合第一预设条件时,根据所述误唤醒的次数调高所述唤醒词的唤醒灵敏度。
4.根据权利要求1所述的方法,其特征在于,所述获取所述语音信号的识别结果,包括:
向服务器发送检测请求,所述检测请求用于请求检测所述语音信号中是否包括所述唤醒词;
接收所述服务器根据所述检测请求返回的所述语音信号的识别结果。
5.根据权利要求1所述的方法,其特征在于,所述获取所述语音信号的识别结果之前,还包括:
检测是否在预设时间内获取到用于触发取消唤醒操作的操作信号;
若在预设时间获取到所述操作信号,则执行所述获取所述语音信号的识别结果的步骤。
6.根据权利要求1所述的方法,其特征在于,所述异常唤醒包括未唤醒,所述未唤醒是指所述终端的实际唤醒情况为未被唤醒,但所述终端的期望唤醒情况为应该被唤醒;
所述根据所述匹配程度与所述语音信号的识别结果统计所述唤醒词对应的异常唤醒次数,包括:
当所述匹配程度小于所述唤醒词的唤醒灵敏度,且所述语音信号的识别结果指示所述语音信号中包括所述唤醒词时,更新所述唤醒词对应的未唤醒的次数。
7.根据权利要求6所述的方法,其特征在于,所述根据所述唤醒词对应的异常唤醒的次数调节所述唤醒词的唤醒灵敏度,包括:
当所述未唤醒的次数符合第二预设条件时,根据所述未唤醒的次数调低所述唤醒词的唤醒灵敏度。
8.根据权利要求7所述的方法,其特征在于,所述根据所述唤醒词对应的异常唤醒的次数调节所述唤醒词的唤醒灵敏度,包括:
根据所述唤醒词对应的异常唤醒的次数调节所述唤醒词的各个档位分别对应的唤醒灵敏度。
9.一种调节唤醒灵敏度的装置,其特征在于,所述装置包括:
界面显示单元,用于当获取到用于触发显示唤醒灵敏度设置界面的操作信号时,显示所述唤醒灵敏度设置界面,所述唤醒灵敏度设置界面包括至少一个唤醒词和所述至少一个唤醒词对应的调节滑动条,所述唤醒词对应的调节滑动条用于调节所述唤醒词的档位,不同的档位对应不同的唤醒灵敏度;
灵敏度获取单元,用于当获取到对应于任意一个调节滑动条的调节信号时,根据调节后的所述调节滑动条确定所述调节滑动条对应的唤醒词的唤醒灵敏度;
灵敏度获取模块,用于获取所述至少一个唤醒词对应的第一音索序列,其中,终端中存储有所述至少一个唤醒词的档位与所述唤醒灵敏度之间的预设对应关系,获取所述至少一个唤醒词的档位后,根据所述预设对应关系,得到所述至少一个唤醒词的唤醒灵敏度;
第一获取单元,用于获取所述至少一个唤醒词的语音信号,并对所述语音信号进行解码,得到所述语音信号的第二音索序列,对所述至少一个唤醒词的所述第一音索序列和所述语音信号的所述第二音索序列进行相似度计算,得到所述至少一个唤醒词和所述语音信号的所述匹配程度,并获取所述语音信号的识别结果;
第二获取单元,用于响应于检测所述语音信号与所述至少一个唤醒词的匹配程度符合设定条件,向服务器发送检测请求,所述检测请求用于请求检测所述语音信号中是否包括所述唤醒词;接收所述服务器根据所述检测请求返回的所述语音信号的识别结果;
次数统计模块,用于根据所述匹配程度与所述语音信号的识别结构统计所述唤醒词对应的异常唤醒的次数,所述异常唤醒是指所述终端的实际唤醒情况与期望唤醒情况不同,所述终端的实际唤醒情况根据语音信号与所述唤醒词的匹配程度确定,所述终端的期望唤醒情况根据所述语音信号中是否包括所述唤醒词确定;
灵敏度调节模块,用于根据所述唤醒词对应的异常唤醒的次数调节所述唤醒词的唤醒灵敏度;
初始值还原模块,用于将所述唤醒词对应的异常唤醒的次数还原至初始值,并在下次调节时从所述初始值重新统计所述异常唤醒的次数。
10.一种终端,其特征在于,所述终端包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如权利要求1至8任一项所述的调节唤醒灵敏度的方法。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如权利要求1至8任一项所述的调节唤醒灵敏度的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710960420.8A CN109672775B (zh) | 2017-10-16 | 2017-10-16 | 调节唤醒灵敏度的方法、装置及终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710960420.8A CN109672775B (zh) | 2017-10-16 | 2017-10-16 | 调节唤醒灵敏度的方法、装置及终端 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109672775A CN109672775A (zh) | 2019-04-23 |
CN109672775B true CN109672775B (zh) | 2021-10-29 |
Family
ID=66139315
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710960420.8A Active CN109672775B (zh) | 2017-10-16 | 2017-10-16 | 调节唤醒灵敏度的方法、装置及终端 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109672775B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110556107A (zh) * | 2019-08-23 | 2019-12-10 | 宁波奥克斯电气股份有限公司 | 可自动调节语音识别灵敏度的控制方法、系统、空调器及可读存储介质 |
CN112685083B (zh) * | 2019-10-17 | 2024-07-16 | 北京沃东天骏信息技术有限公司 | 用于测量唤醒率的方法和系统 |
CN111081217B (zh) * | 2019-12-03 | 2021-06-04 | 珠海格力电器股份有限公司 | 一种语音唤醒方法、装置、电子设备及存储介质 |
CN113160815B (zh) * | 2021-04-15 | 2023-08-29 | 深圳市欧瑞博科技股份有限公司 | 语音唤醒的智能控制方法、装置、设备及存储介质 |
CN117354839B (zh) * | 2023-12-06 | 2024-02-20 | 安徽高灯微行科技有限公司 | 唤醒灵敏度调节方法、装置、计算机设备和存储介质 |
CN117560753B (zh) * | 2024-01-11 | 2024-03-12 | 广州铭创通讯科技有限公司 | Obu误唤醒与门架交易成功率优化方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102999161A (zh) * | 2012-11-13 | 2013-03-27 | 安徽科大讯飞信息科技股份有限公司 | 一种语音唤醒模块的实现方法及应用 |
CN103731908A (zh) * | 2013-03-22 | 2014-04-16 | 深圳市金溢科技有限公司 | 一种obu抗误唤醒方法、系统及obu |
CN103971680A (zh) * | 2013-01-24 | 2014-08-06 | 华为终端有限公司 | 一种语音识别的方法、装置 |
CN105632486A (zh) * | 2015-12-23 | 2016-06-01 | 北京奇虎科技有限公司 | 一种智能硬件的语音唤醒方法和装置 |
CN105702253A (zh) * | 2016-01-07 | 2016-06-22 | 北京云知声信息技术有限公司 | 一种语音唤醒方法及装置 |
CN106338924A (zh) * | 2016-09-23 | 2017-01-18 | 广州视源电子科技股份有限公司 | 一种自动调整设备运行参数阈值的方法与装置 |
WO2017135531A1 (ko) * | 2016-02-05 | 2017-08-10 | 삼성전자(주) | 음성인식 장치 및 방법, 음성인식시스템 |
-
2017
- 2017-10-16 CN CN201710960420.8A patent/CN109672775B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102999161A (zh) * | 2012-11-13 | 2013-03-27 | 安徽科大讯飞信息科技股份有限公司 | 一种语音唤醒模块的实现方法及应用 |
CN103971680A (zh) * | 2013-01-24 | 2014-08-06 | 华为终端有限公司 | 一种语音识别的方法、装置 |
CN103731908A (zh) * | 2013-03-22 | 2014-04-16 | 深圳市金溢科技有限公司 | 一种obu抗误唤醒方法、系统及obu |
CN105632486A (zh) * | 2015-12-23 | 2016-06-01 | 北京奇虎科技有限公司 | 一种智能硬件的语音唤醒方法和装置 |
CN105702253A (zh) * | 2016-01-07 | 2016-06-22 | 北京云知声信息技术有限公司 | 一种语音唤醒方法及装置 |
WO2017135531A1 (ko) * | 2016-02-05 | 2017-08-10 | 삼성전자(주) | 음성인식 장치 및 방법, 음성인식시스템 |
CN106338924A (zh) * | 2016-09-23 | 2017-01-18 | 广州视源电子科技股份有限公司 | 一种自动调整设备运行参数阈值的方法与装置 |
Also Published As
Publication number | Publication date |
---|---|
CN109672775A (zh) | 2019-04-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109672775B (zh) | 调节唤醒灵敏度的方法、装置及终端 | |
CN107360327B (zh) | 语音识别方法、装置和存储介质 | |
CN108111675B (zh) | 通知消息的处理方法、装置及移动终端 | |
CN109509473B (zh) | 语音控制方法及终端设备 | |
WO2017008569A1 (zh) | 消息更新方法、装置及终端 | |
CN108984066B (zh) | 一种应用程序图标显示方法及移动终端 | |
CN107888765B (zh) | 一种切换场景模式的方法、移动终端 | |
CN106940997B (zh) | 一种向语音识别系统发送语音信号的方法和装置 | |
CN107734170B (zh) | 一种通知消息处理方法、移动终端及穿戴设备 | |
JP2018500811A (ja) | ユーザ機器のための電力管理方法および電力管理装置 | |
CN108681413B (zh) | 一种显示模组的控制方法及移动终端 | |
CN110517677B (zh) | 语音处理系统、方法、设备、语音识别系统及存储介质 | |
CN112230877A (zh) | 一种语音操作方法、装置、存储介质及电子设备 | |
CN108492837B (zh) | 音频突发白噪声的检测方法、装置及存储介质 | |
CN108597495B (zh) | 一种处理语音数据的方法及装置 | |
CN107452399B (zh) | 音频特征提取方法及装置 | |
CN110335629B (zh) | 音频文件的音高识别方法、装置以及存储介质 | |
CN111818657B (zh) | 上行发送丢弃方法、上行发送丢弃配置方法及相关设备 | |
CN109389977B (zh) | 一种语音交互方法及装置 | |
CN109688611B (zh) | 一种频段参数的配置方法、装置、终端和存储介质 | |
CN115985323B (zh) | 语音唤醒方法、装置、电子设备及可读存储介质 | |
CN110277097B (zh) | 数据处理方法及相关设备 | |
CN111897916A (zh) | 语音指令识别方法、装置、终端设备及存储介质 | |
CN109144860B (zh) | 一种对控件对象的操作方法及终端设备 | |
CN111491292A (zh) | 上网模式调整方法、装置、存储介质及移动终端 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |