CN108766443A - 匹配阈值的调整方法、装置、存储介质及电子设备 - Google Patents
匹配阈值的调整方法、装置、存储介质及电子设备 Download PDFInfo
- Publication number
- CN108766443A CN108766443A CN201810542931.2A CN201810542931A CN108766443A CN 108766443 A CN108766443 A CN 108766443A CN 201810542931 A CN201810542931 A CN 201810542931A CN 108766443 A CN108766443 A CN 108766443A
- Authority
- CN
- China
- Prior art keywords
- matching threshold
- value
- vocal print
- preset
- feature information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 230000001755 vocal effect Effects 0.000 claims abstract description 128
- 238000004590 computer program Methods 0.000 claims description 11
- 239000000284 extract Substances 0.000 claims description 9
- 238000010586 diagram Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 11
- 238000005516 engineering process Methods 0.000 description 8
- 201000007100 Pharyngitis Diseases 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 230000002452 interceptive effect Effects 0.000 description 3
- 238000011084 recovery Methods 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/06—Decision making techniques; Pattern matching strategies
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/30—Authentication, i.e. establishing the identity or authorisation of security principals
- G06F21/31—User authentication
- G06F21/32—User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Security & Cryptography (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Computer Hardware Design (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Game Theory and Decision Science (AREA)
- General Engineering & Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Collating Specific Patterns (AREA)
- Telephone Function (AREA)
Abstract
本申请公开了一种匹配阈值的调整方法、装置、存储介质及电子设备。该方法包括:获取当前用户的声纹特征信息;将该当前用户的声纹特征信息与预设声纹特征信息进行匹配,得到相应的目标匹配度;若该目标匹配度和预设匹配阈值之间满足预设条件,则对该当前用户进行身份验证;在该身份验证通过后,对该预设匹配阈值的数值进行调整。本申请可以提高声纹识别的灵活性。
Description
技术领域
本申请属于终端技术领域,尤其涉及一种匹配阈值的调整方法、装置、存储介质及电子设备。
背景技术
随着技术的发展,人机之间的交互方式变得越来越丰富。相关技术中,用户可以通过语音对终端进行控制,即终端在接收到用户发出的语音信息后,可以对该语音信息进行解析,得到控制指令。在执行该控制指令之前,终端需要从该语音信息中提取声纹特征,并根据提取到的声纹特征对用户进行声纹识别。只有在声纹识别通过后,终端才会执行语音信息对应的控制指令。然而相关技术中,终端在对用户进行声纹识别时的灵活性较差。
发明内容
本申请实施例提供一种匹配阈值的调整方法、装置、存储介质及电子设备,可以提高声纹识别的灵活性。
本申请实施例提供一种匹配阈值的调整方法,包括:
获取当前用户的声纹特征信息;
将所述当前用户的声纹特征信息与预设声纹特征信息进行匹配,得到相应的目标匹配度;
若所述目标匹配度和预设匹配阈值之间满足预设条件,则对所述当前用户进行身份验证;
在所述身份验证通过后,对所述预设匹配阈值的数值进行调整。
本申请实施例提供一种匹配阈值的调整装置,包括:
获取模块,用于获取当前用户的声纹特征信息;
匹配模块,用于将所述当前用户的声纹特征信息与预设声纹特征信息进行匹配,得到相应的目标匹配度;
验证模块,用于若所述目标匹配度和预设匹配阈值之间满足预设条件,则对所述当前用户进行身份验证;
调整模块,用于在所述身份验证通过后,对所述预设匹配阈值的数值进行调整。
本申请实施例提供一种存储介质,其上存储有计算机程序,当所述计算机程序在计算机上执行时,使得所述计算机执行本申请实施例提供的匹配阈值的调整方法中的步骤。
本申请实施例还提供一种电子设备,包括存储器,处理器,所述处理器通过调用所述存储器中存储的计算机程序,用于执行本申请实施例提供的匹配阈值的调整方法中的步骤。
可以理解的是,本申请实施例中,终端可以在检测到当前用户的声纹特征信息和预设声纹特征信息这二者的匹配度与预设匹配阈值之间满足预设条件时,对当前用户进行身份验证。当身份验证通过后,终端可以对预设匹配阈值的数值进行调整,以使终端后续可以根据数值调整后的预设匹配阈值来进行声纹识别。由于本实施例可以对用于判断声纹识别是否通过的预设匹配阈值进行调整,因此本实施例可以提高终端在进行声纹识别时的灵活性。
附图说明
下面结合附图,通过对本发明的具体实施方式详细描述,将使本发明的技术方案及其有益效果显而易见。
图1是本申请实施例提供的匹配阈值的调整方法的流程示意图。
图2是本申请实施例提供的匹配阈值的调整方法的另一流程示意图。
图3至图5是本申请实施例提供的匹配阈值的调整方法的场景示意图。
图6是本申请实施例提供的匹配阈值的调整装置的结构示意图。
图7是本申请实施例提供的匹配阈值的调整装置的另一结构示意图。
图8是本申请实施例提供的移动终端的结构示意图。
图9是本申请实施例提供的移动终端的另一结构示意图。
具体实施方式
请参照图式,其中相同的组件符号代表相同的组件,本发明的原理是以实施在一适当的运算环境中来举例说明。以下的说明是基于所例示的本发明具体实施例,其不应被视为限制本发明未在此详述的其它具体实施例。
可以理解的是,本申请实施例的执行主体可以是诸如智能手机或平板电脑等的终端设备。
请参阅图1,图1是本申请实施例提供的匹配阈值的调整方法的流程示意图,流程可以包括:
在步骤S101中,获取当前用户的声纹特征信息。
随着技术的发展,人机之间的交互方式变得越来越丰富。相关技术中,用户可以通过语音对终端进行控制,即终端在接收到用户发出的语音信息后,可以对该语音信息进行解析,得到控制指令。在执行该控制指令之前,终端需要从该语音信息中提取声纹特征,并根据提取到的声纹特征对用户进行声纹识别。只有在声纹识别通过后,终端才会执行语音信息对应的控制指令。然而相关技术中,终端在对用户进行声纹识别时的灵活性较差。
在本申请的步骤S101中,比如,在用户使用终端提供的语音助手来操作终端,即需要进行声纹识别时,终端可以获取当前用户的声纹特征信息。例如,终端可以先获取当前用户发出的语音,然后从该语音中提取声纹特征信息。
在步骤S102中,将该当前用户的声纹特征信息与预设声纹特征信息进行匹配,得到相应的目标匹配度。
比如,在获取到当前用户的声纹特征信息后,终端可以将当前用户的声纹特征信息与预设声纹特征信息进行匹配,从而得到相应的目标匹配度。在一种实施方式中,预设声纹特征信息可以是本终端机主的声纹特征信息和/或经过终端机主允许的用户(如机主的家人等)的声纹特征信息。
在得到当前用户的声纹特征信息与预设声纹特征信息的目标匹配度之后,终端可以检测该目标匹配度与预设匹配阈值之间是否满足预设条件。其中,该预设匹配阈值为用于判断声纹识别是否通过的数值(即预设匹配阈值为用于判断当前用户的声纹特征信息与预设声纹特征信息是否匹配成功的数值),即在进行声纹识别时,若用户的声纹特征信息和预设声纹特征信息的匹配度达到预设匹配阈值,则终端可以确定声纹识别通过。
若检测到该目标匹配度与预设匹配阈值之间不满足预设条件,那么终端可以执行其它操作。
若检测到该目标匹配度与预设匹配阈值之间满足预设条件,那么进入步骤S103。
在步骤S103中,若该目标匹配度和预设匹配阈值之间满足预设条件,则对该当前用户进行身份验证。
在步骤S104中,在该身份验证通过后,对该预设匹配阈值的数值进行调整。
比如,步骤S103和S104可以包括:
终端检测到目标匹配度与预设匹配阈值之间满足预设条件。在这种情况下,终端可以对当前用户进行身份验证,以验证当前用户是否为终端机主或其他合法用户。
在当前用户的身份验证通过,即在终端确定出当前用户为终端机主或其他合法用户后,终端可以预设匹配阈值的数值进行调整。之后,终端就可以根据数值调整后的预设匹配阈值来进行声纹识别。
可以理解的是,本申请实施例中,终端可以在检测到当前用户的声纹特征信息和预设声纹特征信息这二者的匹配度与预设匹配阈值之间满足预设条件时,对当前用户进行身份验证。当身份验证通过后,终端可以对预设匹配阈值的数值进行调整,以使终端后续可以根据数值调整后的预设匹配阈值来进行声纹识别。由于本实施例可以对用于判断声纹识别是否通过的预设匹配阈值进行调整,因此本实施例可以提高终端在进行声纹识别时的灵活性。
请参阅图2,图2为本申请实施例提供的匹配阈值的调整方法的另一流程示意图,流程可以包括:
在步骤S201中,终端获取当前用户的声纹特征信息。
比如,在用户使用终端提供的语音助手来操作终端,即需要进行声纹识别时,终端可以获取当前用户的声纹特征信息。
在步骤S202中,终端将该当前用户的声纹特征信息与预设声纹特征信息进行匹配,得到相应的目标匹配度。
比如,在获取到当前用户的声纹特征信息后,终端可以将当前用户的声纹特征信息与预设声纹特征信息进行匹配,从而得到相应的目标匹配度。在一种实施方式中,预设声纹特征信息可以是本终端机主的声纹特征信息和/或经过终端机主允许的用户(如机主的家人等)的声纹特征信息。
在得到当前用户的声纹特征信息与预设声纹特征信息的目标匹配度之后,终端可以将该目标匹配度与预设匹配阈值进行比较。其中,该预设匹配阈值为用于判断声纹识别是否通过的数值,即在进行声纹识别时,若用户的声纹特征信息和预设声纹特征信息的匹配度达到预设匹配阈值,则终端可以确定声纹识别通过。
若检测到目标匹配度达到该预设匹配阈值,例如当前用户的声纹特征信息与预设声纹特征信息的匹配度为95%,而预设匹配阈值为90%,即目标匹配度超过了预设匹配阈值,那么可以认为当前用户为合法用户。在这种情况下,终端可以执行当前用户发出的语音所对应的控制指令。
若检测到目标匹配度小于该预设匹配阈值,那么可以进入步骤S203。
在步骤S203中,若该目标匹配度小于该预设匹配阈值,则终端获取该预设匹配阈值与该目标匹配度的差值。
在步骤S204中,若检测到该差值小于或等于预设差值,则终端确定该目标匹配度和该预设匹配阈值之间满足预设条件,并对该当前用户进行身份验证。
比如,步骤S203和S204可以包括:
终端检测到当前用户的声纹特征信息与预设声纹特征信息的目标匹配度为86%,小于预设匹配阈值90%。在这种情况下,终端可以获取预设匹配阈值与该目标匹配度的差值。例如,终端获取到预设匹配阈值与该目标匹配度的差值为4%(90%-86%)。
之后,终端可以检测该差值是否小于或等于预设差值。
若检测到该差值大于预设差值,那么终端可以执行其它操作。
若检测到该差值小于或等于预设差值,例如预设差值为5%,而当前用户的声纹特征信息与预设声纹特征信息的匹配度86%与预设匹配阈值90%的差值为4%,那么终端可以确定出当前用户的声纹特征信息和预设声纹特征信息的目标匹配度与预设匹配阈值之间满足预设条件。在这种情况下,可以认为当前用户的声纹特征信息与预设声纹特征信息接近于匹配。此时,可以触发终端对当前用户进行身份验证。
在一种实施方式中,终端可以通过诸如指纹识别、人脸识别或者虹膜识别等除声纹识别之外的其他方式对当前用户进行身份验证。
如果当前用户的身份验证未通过,那么可以认为当前用户是非法用户,此时终端可以不执行当前用户发出的语音指令。
如果当前用户的身份验证通过,那么可以进入步骤S205。
在步骤S205中,在该身份验证通过后,终端获取该当前用户的多段语音,并从每段语音中提取目标声纹特征信息。
在步骤S206中,终端将所有该目标声纹特征信息与该预设声纹特征信息进行逐一匹配,并得到多个待用匹配度。
在步骤S207中,终端计算该多个待用匹配度的平均值。
在步骤S208中,终端将该预设匹配阈值的数值由当前的目标值调整为该平均值。
比如,步骤S205、S206、S207和S208可以包括:
在当前用户的身份验证通过后,终端可以获取当前用户的多段语音,并从每段语音中提取声纹特征信息,即目标声纹特征信息。
然后,终端可以将所有目标声纹特征信息与该预设声纹特征信息进行逐一匹配,即终端可以将各个目标声纹特征信息均与预设声纹特征信息进行匹配,从而得到多个匹配度,即多个待用匹配度。
在得到多个待用匹配度之后,终端可以计算这些待用匹配度的平均值。然后,终端可以将预设匹配阈值的数值由当前的目标值调整为该平均值。
例如,终端可以获取当前用户的5段语音,并从每段语音中提取目标声纹特征信息。然后,终端可以将每一目标声纹特征信息与预设声纹特征信息进行匹配,从而得到5个待用匹配度。例如,这5个待用匹配度分别为88%、87%、85%、85%、87%。之后,终端可以计算这5个待用匹配度的平均值,例如平均值为86.4%。在计算得到平均值之后,终端可以将预设匹配阈值的数值由当前的90%调整为86.4%。
在步骤S209中,终端设置一有效期,并当该有效期结束时将该预设匹配阈值的数值由该平均值恢复为该目标值。
比如,在将预设匹配阈值由当前的90%调整为86.4%之后,终端可以设置一有效期。当检测到该有效期结束时,终端可以将预设匹配阈值的数值由86.4%恢复为90%。
例如,在将预设匹配阈值由当前的90%调整为86.4%之后,终端可以为本次数值调整设置有效期为5天,即在5天之后终端需要将预设匹配阈值的数值由86.4%恢复为90%。
在一种实施方式中,在S205中终端获取当前用户的多段语音的步骤之前,还可以包括如下步骤:
终端计算预设匹配阈值与目标匹配度的百分比差值;
终端将该百分比差值转换为以一百为分母的分数;
终端将该分数的分子的数字确定为目标数值;
那么,S205中终端获取当前用户的多段语音的步骤,可以包括:终端获取数量为该目标数值的多段语音。
比如,在身份验证通过后,终端可以先计算预设匹配阈值与目标匹配度的百分比差值。例如,预设匹配阈值为90%,目标匹配度为86%,那么预设匹配阈值与目标匹配度的百分比差值为4%。
之后,终端可以将预设匹配阈值和目标匹配度的百分比差值转换为以一百为分母的分数,并将该分数的分子的数字确定为目标数值。例如,百分比差值4%转换为以一百为分母的分数后,该分数的分子的数字为4。那么,目标数值可以确定为4。
之后,当终端需要获取当前用户的多段语音时,终端就可以获取数量为目标数值的多段语音。例如,目标数值为4,那么终端就可以获取当前用户的4段语音。
可以理解的是,本实施例中,终端可以根据预设匹配阈值与目标匹配度之间的差值,来确定具体获取几段语音。在预设匹配阈值与目标匹配度之间的差值较小,即当前用户的声纹特征变化较小的情况下,终端可以获取较少段的语音。而在预设匹配阈值与目标匹配度之间的差值较大,即当前用户的声纹特征变化较大的情况下,终端可以获取较多段的语音,从而使得终端可以更加准确地根据用户的声纹变化来调整预设匹配阈值的数值,同时也增加了预设匹配阈值调整的灵活性。
在一些实施方式中,当需要获取当前用户的多段语音并根据这多段语音来调整预设匹配阈值的数值时,终端也可以通过如下方式来确定具体需要获取几段语音:
比如,终端可以预先设定一个预设数值,那么当终端需要获取多段语音时,终端就获取数量为该预设数值的多段语音。例如预设数值为5,那么终端就可以获取当前用户的5段语音,并从这5段语音中的每一段语音中提取当前用户的目标声纹特征信息,并将每一目标声纹特征信息与预设声纹特征信息进行匹配,从而得到5个待用匹配度。然后,终端可以计算这5个待用匹配度的平均值,并将预设匹配阈值由当前值调整为该平均值。
在一种实施方式中,终端可以随机生成5段语音,并要求用户念出这5段语音,然后从用户念出的5段语音中的每一段语音中提取当前用户的目标声纹特征信息,并将每一目标声纹特征信息与预设声纹特征信息进行匹配,从而得到5个待用匹配度。然后,终端可以计算这5个待用匹配度的平均值,并将预设匹配阈值由当前值调整为该平均值。在一种实施方式中,终端也可以在与用户进行语音交互时,获取所需的5段用户语音,并执行后续的相关步骤。
或者,终端可以先对当前用户发出的语音进行解析,若该语音对应的控制指令包含两个以上的备选操作,那么终端也可以根据备选操作的数量来确定具体需要获取几段语音。例如,用户发出的语音为“打开音乐应用”,那么如果终端检测到本终端中包含3款音乐应用,例如分别为A应用、B应用和C应用,那么终端可以确定出需要获取3段语音。然后,终端可以依次生成3段用于询问用户是否打开某一应用的语音信息。当接收到当前用户的回答语音时,终端可以从中提取当前用户的声纹特征信息。
请参阅图3至图5,图3至图5为本申请实施例提供的匹配阈值的调整方法的场景示意图。
在日常生活中,用户的声纹特征并不是一成不变的。在一些情况下,用户的声纹特征会发生一些变化。比如,当用户咽喉发炎时用户的声音会变得沙哑,或者当用户边吃食物边说话时用户的声音也会发生轻微变化。
例如,本实施例中当前用户因咽喉发炎引起声音沙哑,导致当前用户的声纹特征发生变化。在这种情况下,比如此时当前用户需要使用终端的语音助手功能。例如,当前用户对着终端发出如下语音“小欧,请打开音乐应用”,如图3所示。
终端在接收到上述语音“小欧,请打开音乐应用”后,可以从该语音中提取当前用户的声纹特征信息,然后将该当前用户的声纹特征信息与预设声纹特征信息进行匹配,并得到相应的目标匹配度。其中,预设声纹特征信息为本终端机主的声纹特征信息。例如,由于当前用户的声音沙哑,导致当前用户的声纹特征信息与预设声纹特征信息的目标匹配度仅有86%,未达到预设匹配阈值90%,即目前当前用户的声纹识别不通过。
之后,终端可以计算目标匹配度与预设匹配阈值之间的差值。例如,目标匹配度与预设匹配阈值之间的差值为4%(90%-86%)。
在得到目标匹配度与预设匹配阈值的差值后,终端可以检测该差值是否小于或等于预设差值。例如,预设差值为5%。因此,本实施例中,终端可以检测到目标匹配度与预设匹配阈值的差值4%小于预设差值5%。在这种情况下,终端可以确定目标匹配度与预设匹配阈值满足预设条件,即可以认为当前用户的声纹特征信息与预设声纹特征信息接近于匹配。然后,终端可以对当前用户进行身份验证。例如,终端可以通过指纹识别、人脸识别以及虹膜识别中的一种或多种方式对当前用户进行身份验证,以验证当前用户是否为终端机主。
例如,本实施例,当前用户的身份验证通过,即终端可以确认当前用户为终端机主。在这种情况下,终端可以获取当前用户的多段语音,并从每段语音中提取目标声纹特征信息。例如,终端在接收到用户发出的语音“小欧,请打开音乐应用”后,对该语音进行了解析,并检测到终端中包含两款音乐应用,分别为A应用和B应用。此时,终端可以向用户发出如下语音“当前终端中包含A音乐应用和B音乐应用,请问您现在需要打开哪个应用”,如图4所示。
例如,当前用户在听到终端发出的语音后,回答如下语音“打开A应用”,如图5所示。在接收到用户的回答并确定当前用户为机主的情况下,终端可以打开A应用。
之后,用户可以根据需要继续使用语音助手来控制终端完成相应的操作。终端在这一过程中,可以继续获取到当前用户的多段语音。然后,终端可以从中选取数量为预设数值的多段语音。例如,预设数值为5,那么终端可以获取当前用户的5段语音,并从每段语音中提取当前用户的目标声纹特征信息。然后,终端可以将各目标声纹特征信息与预设声纹特征信息进行匹配,从而得到相应的匹配度。即,终端可以得到多个匹配度,并将这多个匹配度确定为待用匹配度。之后,终端可以计算这多个待用匹配度的平均值,并将预设匹配阈值的数值由当前的目标值调整为该平均值。
例如,在当前用户使用语音助手控制终端播放音乐的过程中,终端获取到5段语音,并从中提取了5个目标声纹特征信息。这5个目标声纹特征信息与预设声纹特征信息的匹配度依次为88%、87%、85%、85%、87%。之后,终端可以计算这5个匹配度的平均值,例如平均值为86.4%。在计算得到平均值之后,终端可以将预设匹配阈值的数值由当前的90%调整为86.4%。
然后,终端可以设置一个有效期。例如,终端设置得有效期为5天,那么在接下来的5天中,终端可以按照86.4%的匹配阈值来对当前用户进行声纹是被,而在5天之后,终端可以将预设匹配阈值的数值由86.4%恢复为90%。
可以理解的是,一般的,在用户因咽喉发炎引起声音沙哑导致声纹发生变化的情况下,用户的咽喉发炎在经过一段时间后就会痊愈,因此终端可以设置一个有效期,该有效期可以对应于用户咽喉发炎痊愈所需的时间。在该有效期到期时,终端可以将预设匹配阈值的数值恢复。
请参阅图6,图6为本申请实施例提供的匹配阈值的调整装置的结构示意图。匹配阈值的调整装置300可以包括:获取模块301,匹配模块302,验证模块303,以及调整模块304。
获取模块301,用于获取当前用户的声纹特征信息。
匹配模块302,用于将所述当前用户的声纹特征信息与预设声纹特征信息进行匹配,得到相应的目标匹配度。
验证模块303,用于若所述目标匹配度和预设匹配阈值之间满足预设条件,则对所述当前用户进行身份验证。
调整模块304,用于在所述身份验证通过后,对所述预设匹配阈值的数值进行调整。
在一种实施方式中,所述验证模块303,可以用于:
若所述目标匹配度小于所述预设匹配阈值,则获取所述预设匹配阈值与所述目标匹配度的差值;
若检测到所述差值小于或等于预设差值,则确定所述目标匹配度和所述预设匹配阈值之间满足预设条件,并对所述当前用户进行身份验证。
在一种实施方式中,所述调整模块304,可以用于:
获取所述当前用户的多段语音,并从每段语音中提取目标声纹特征信息;
将所有所述目标声纹特征信息与所述预设声纹特征信息进行逐一匹配,并得到多个待用匹配度;
计算所述多个待用匹配度的平均值;
将所述预设匹配阈值的数值由当前的目标值调整为所述平均值。
请一并参阅图7,图7为本申请实施例提供的匹配阈值的调整装置的另一结构示意图。在一实施例中,匹配阈值的调整装置300还可以包括:恢复模块305,和确定模块306。
恢复模块305,用于:设置一有效期,当所述有效期结束时,将所述预设匹配阈值的数值由所述平均值恢复为所述目标值。
确定模块306,用于:计算所述预设匹配阈值与所述目标匹配度的百分比差值;将所述百分比差值转换为以一百为分母的分数;将所述分数的分子的数字确定为目标数值。
那么,所述调整模块304可以用于:获取数量为所述目标数值的多段语音。
本申请实施例提供一种计算机可读的存储介质,其上存储有计算机程序,当所述计算机程序在计算机上执行时,使得所述计算机执行如本实施例提供的匹配阈值的调整方法中的步骤。
本申请实施例还提供一种电子设备,包括存储器,处理器,所述处理器通过调用所述存储器中存储的计算机程序,用于执行本实施例提供的匹配阈值的调整方法中的步骤。
例如,上述电子设备可以是诸如平板电脑或者智能手机等移动终端。请参阅图8,图8为本申请实施例提供的移动终端的结构示意图。
该移动终端400可以包括麦克风401、存储器402、处理器403等部件。本领域技术人员可以理解,图8中示出的移动终端结构并不构成对移动终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
麦克风401可以用于拾取用户发出的语音等。
存储器402可用于存储应用程序和数据。存储器402存储的应用程序中包含有可执行代码。应用程序可以组成各种功能模块。处理器403通过运行存储在存储器402的应用程序,从而执行各种功能应用以及数据处理。
处理器403是移动终端的控制中心,利用各种接口和线路连接整个移动终端的各个部分,通过运行或执行存储在存储器402内的应用程序,以及调用存储在存储器402内的数据,执行移动终端的各种功能和处理数据,从而对移动终端进行整体监控。
在本实施例中,移动终端中的处理器403会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行代码加载到存储器402中,并由处理器403来运行存储在存储器402中的应用程序,从而实现步骤:
获取当前用户的声纹特征信息;
将所述当前用户的声纹特征信息与预设声纹特征信息进行匹配,得到相应的目标匹配度;
若所述目标匹配度和预设匹配阈值之间满足预设条件,则对所述当前用户进行身份验证;
在所述身份验证通过后,对所述预设匹配阈值的数值进行调整。
请参阅图9,移动终端500可以包括麦克风501、存储器502、处理器503、输入单元504、输出单元505、扬声器506等部件。
麦克风501可以用于拾取用户发出的语音等。
存储器502可用于存储应用程序和数据。存储器502存储的应用程序中包含有可执行代码。应用程序可以组成各种功能模块。处理器503通过运行存储在存储器502的应用程序,从而执行各种功能应用以及数据处理。
处理器503是移动终端的控制中心,利用各种接口和线路连接整个移动终端的各个部分,通过运行或执行存储在存储器502内的应用程序,以及调用存储在存储器502内的数据,执行移动终端的各种功能和处理数据,从而对移动终端进行整体监控。
输入单元504可用于接收输入的数字、字符信息或用户特征信息(比如指纹),以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。
输出单元505可用于显示由用户输入的信息或提供给用户的信息以及移动终端的各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。输出单元可包括显示面板。
在本实施例中,移动终端中的处理器503会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行代码加载到存储器502中,并由处理器503来运行存储在存储器502中的应用程序,从而实现步骤:
获取当前用户的声纹特征信息;
将所述当前用户的声纹特征信息与预设声纹特征信息进行匹配,得到相应的目标匹配度;
若所述目标匹配度和预设匹配阈值之间满足预设条件,则对所述当前用户进行身份验证;
在所述身份验证通过后,对所述预设匹配阈值的数值进行调整。
在一种实施方式中,处理器503执行所述若所述目标匹配度和预设匹配阈值之间满足预设条件则对所述当前用户进行身份验证的步骤时,可以执行:若所述目标匹配度小于所述预设匹配阈值,则获取所述预设匹配阈值与所述目标匹配度的差值;若检测到所述差值小于或等于预设差值,则确定所述目标匹配度和所述预设匹配阈值之间满足预设条件,并对所述当前用户进行身份验证。
在一种实施方式中,处理器503执行所述对所述预设匹配阈值的数值进行调整的步骤时,可以执行:获取所述当前用户的多段语音,并从每段语音中提取目标声纹特征信息;将所有所述目标声纹特征信息与所述预设声纹特征信息进行逐一匹配,并得到多个待用匹配度;计算所述多个待用匹配度的平均值;将所述预设匹配阈值的数值由当前的目标值调整为所述平均值。
在一种实施方式中,在将所述预设匹配阈值的数值由当前的目标值调整为所述平均值的步骤之后,处理器503还可以执行:设置一有效期;当所述有效期结束时,将所述预设匹配阈值的数值由所述平均值恢复为所述目标值。处理器503执行
在一种实施方式中,在获取所述当前用户的多段语音的步骤之前,处理器503还可以执行:计算所述预设匹配阈值与所述目标匹配度的百分比差值;将所述百分比差值转换为以一百为分母的分数;将所述分数的分子的数字确定为目标数值;
那么,处理器503执行获取所述当前用户的多段语音的步骤时,可以执行:获取数量为所述目标数值的多段语音。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见上文针对匹配阈值的调整方法的详细描述,此处不再赘述。
本申请实施例提供的所述匹配阈值的调整装置与上文实施例中的匹配阈值的调整方法属于同一构思,在所述匹配阈值的调整装置上可以运行所述匹配阈值的调整方法实施例中提供的任一方法,其具体实现过程详见所述匹配阈值的调整方法实施例,此处不再赘述。
需要说明的是,对本申请实施例所述匹配阈值的调整方法而言,本领域普通技术人员可以理解实现本申请实施例所述匹配阈值的调整方法的全部或部分流程,是可以通过计算机程序来控制相关的硬件来完成,所述计算机程序可存储于一计算机可读取存储介质中,如存储在存储器中,并被至少一个处理器执行,在执行过程中可包括如所述匹配阈值的调整方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储器(ROM,ReadOnly Memory)、随机存取记忆体(RAM,Random Access Memory)等。
对本申请实施例的所述匹配阈值的调整装置而言,其各功能模块可以集成在一个处理芯片中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中,所述存储介质譬如为只读存储器,磁盘或光盘等。
以上对本申请实施例所提供的一种匹配阈值的调整方法、装置、存储介质以及电子设备进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种匹配阈值的调整方法,其特征在于,包括:
获取当前用户的声纹特征信息;
将所述当前用户的声纹特征信息与预设声纹特征信息进行匹配,得到相应的目标匹配度;
若所述目标匹配度和预设匹配阈值之间满足预设条件,则对所述当前用户进行身份验证;
在所述身份验证通过后,对所述预设匹配阈值的数值进行调整。
2.根据权利要求1所述的匹配阈值的调整方法,其特征在于,若所述目标匹配度和预设匹配阈值之间满足预设条件则对所述当前用户进行身份验证,包括:
若所述目标匹配度小于所述预设匹配阈值,则获取所述预设匹配阈值与所述目标匹配度的差值;
若检测到所述差值小于或等于预设差值,则确定所述目标匹配度和所述预设匹配阈值之间满足预设条件,并对所述当前用户进行身份验证。
3.根据权利要求1所述的匹配阈值的调整方法,其特征在于,对所述预设匹配阈值的数值进行调整,包括:
获取所述当前用户的多段语音,并从每段语音中提取目标声纹特征信息;
将所有所述目标声纹特征信息与所述预设声纹特征信息进行逐一匹配,并得到多个待用匹配度;
计算所述多个待用匹配度的平均值;
将所述预设匹配阈值的数值由当前的目标值调整为所述平均值。
4.根据权利要求3所述的匹配阈值的调整方法,其特征在于,在将所述预设匹配阈值的数值由当前的目标值调整为所述平均值之后,还包括:
设置一有效期;
当所述有效期结束时,将所述预设匹配阈值的数值由所述平均值恢复为所述目标值。
5.根据权利要求3所述的匹配阈值的调整方法,其特征在于,在获取所述当前用户的多段语音的步骤之前,还包括:
计算所述预设匹配阈值与所述目标匹配度的百分比差值;
将所述百分比差值转换为以一百为分母的分数;
将所述分数的分子的数字确定为目标数值;
获取所述当前用户的多段语音的步骤,包括:获取数量为所述目标数值的多段语音。
6.一种匹配阈值的调整装置,其特征在于,包括:
获取模块,用于获取当前用户的声纹特征信息;
匹配模块,用于将所述当前用户的声纹特征信息与预设声纹特征信息进行匹配,得到相应的目标匹配度;
验证模块,用于若所述目标匹配度和预设匹配阈值之间满足预设条件,则对所述当前用户进行身份验证;
调整模块,用于在所述身份验证通过后,对所述预设匹配阈值的数值进行调整。
7.根据权利要求6所述的匹配阈值的调整装置,其特征在于,所述验证模块,用于:
若所述目标匹配度小于所述预设匹配阈值,则获取所述预设匹配阈值与所述目标匹配度的差值;
若检测到所述差值小于或等于预设差值,则确定所述目标匹配度和所述预设匹配阈值之间满足预设条件,并对所述当前用户进行身份验证。
8.根据权利要求6所述的匹配阈值的调整装置,其特征在于,所述调整模块,用于:
获取所述当前用户的多段语音,并从每段语音中提取目标声纹特征信息;
将所有所述目标声纹特征信息与所述预设声纹特征信息进行逐一匹配,并得到多个待用匹配度;
计算所述多个待用匹配度的平均值;
将所述预设匹配阈值的数值由当前的目标值调整为所述平均值。
9.一种存储介质,其上存储有计算机程序,其特征在于,当所述计算机程序在计算机上执行时,使得所述计算机执行如权利要求1至5中任一项所述的方法。
10.一种电子设备,包括存储器,处理器,其特征在于,所述处理器通过调用所述存储器中存储的计算机程序,用于执行如权利要求1至5中任一项所述的方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810542931.2A CN108766443A (zh) | 2018-05-30 | 2018-05-30 | 匹配阈值的调整方法、装置、存储介质及电子设备 |
PCT/CN2019/085534 WO2019228135A1 (zh) | 2018-05-30 | 2019-05-05 | 匹配阈值的调整方法、装置、存储介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810542931.2A CN108766443A (zh) | 2018-05-30 | 2018-05-30 | 匹配阈值的调整方法、装置、存储介质及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108766443A true CN108766443A (zh) | 2018-11-06 |
Family
ID=64004565
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810542931.2A Pending CN108766443A (zh) | 2018-05-30 | 2018-05-30 | 匹配阈值的调整方法、装置、存储介质及电子设备 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN108766443A (zh) |
WO (1) | WO2019228135A1 (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019228135A1 (zh) * | 2018-05-30 | 2019-12-05 | Oppo广东移动通信有限公司 | 匹配阈值的调整方法、装置、存储介质及电子设备 |
CN111816178A (zh) * | 2020-07-07 | 2020-10-23 | 云知声智能科技股份有限公司 | 语音设备的控制方法、装置和设备 |
WO2020253265A1 (zh) * | 2019-06-18 | 2020-12-24 | 北京京东尚科信息技术有限公司 | 应用于电子设备的数据处理方法、装置、系统、介质 |
CN112417412A (zh) * | 2020-11-23 | 2021-02-26 | 中国农业银行股份有限公司陕西省分行 | 一种银行账户余额查询方法、装置及系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010039865A (ja) * | 2008-08-06 | 2010-02-18 | Fujitsu Ltd | 個人認証装置、個人認証方法および個人認証プログラム |
CN103000176A (zh) * | 2012-12-28 | 2013-03-27 | 安徽科大讯飞信息科技股份有限公司 | 语音识别方法和系统 |
CN104331651A (zh) * | 2014-10-08 | 2015-02-04 | 无锡指网生物识别科技有限公司 | 基于指纹和语音识别的控制系统及设备 |
CN105550561A (zh) * | 2015-12-14 | 2016-05-04 | 广东欧珀移动通信有限公司 | 一种移动终端的识别方法及装置 |
CN107146613A (zh) * | 2017-04-10 | 2017-09-08 | 北京猎户星空科技有限公司 | 一种语音交互方法及装置 |
CN107864121A (zh) * | 2017-09-30 | 2018-03-30 | 上海壹账通金融科技有限公司 | 用户身份验证方法及应用服务器 |
CN107943536A (zh) * | 2017-11-14 | 2018-04-20 | 广东欧珀移动通信有限公司 | 调整阈值的方法、装置、存储介质及电子设备 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8086461B2 (en) * | 2007-06-13 | 2011-12-27 | At&T Intellectual Property Ii, L.P. | System and method for tracking persons of interest via voiceprint |
CN101887722A (zh) * | 2009-06-18 | 2010-11-17 | 博石金(北京)信息技术有限公司 | 快速声纹认证方法 |
CN102404287A (zh) * | 2010-09-14 | 2012-04-04 | 盛乐信息技术(上海)有限公司 | 用数据复用法确定声纹认证阈值的声纹认证系统及方法 |
CN102142254A (zh) * | 2011-03-25 | 2011-08-03 | 北京得意音通技术有限责任公司 | 基于声纹识别和语音识别的防录音假冒的身份确认方法 |
US9258425B2 (en) * | 2013-05-22 | 2016-02-09 | Nuance Communications, Inc. | Method and system for speaker verification |
CN107491671A (zh) * | 2016-06-13 | 2017-12-19 | 中兴通讯股份有限公司 | 一种安全登录方法和装置 |
CN108040032A (zh) * | 2017-11-02 | 2018-05-15 | 阿里巴巴集团控股有限公司 | 一种声纹认证方法、账号注册方法及装置 |
CN108766443A (zh) * | 2018-05-30 | 2018-11-06 | Oppo广东移动通信有限公司 | 匹配阈值的调整方法、装置、存储介质及电子设备 |
-
2018
- 2018-05-30 CN CN201810542931.2A patent/CN108766443A/zh active Pending
-
2019
- 2019-05-05 WO PCT/CN2019/085534 patent/WO2019228135A1/zh active Application Filing
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010039865A (ja) * | 2008-08-06 | 2010-02-18 | Fujitsu Ltd | 個人認証装置、個人認証方法および個人認証プログラム |
CN103000176A (zh) * | 2012-12-28 | 2013-03-27 | 安徽科大讯飞信息科技股份有限公司 | 语音识别方法和系统 |
CN104331651A (zh) * | 2014-10-08 | 2015-02-04 | 无锡指网生物识别科技有限公司 | 基于指纹和语音识别的控制系统及设备 |
CN105550561A (zh) * | 2015-12-14 | 2016-05-04 | 广东欧珀移动通信有限公司 | 一种移动终端的识别方法及装置 |
CN107146613A (zh) * | 2017-04-10 | 2017-09-08 | 北京猎户星空科技有限公司 | 一种语音交互方法及装置 |
CN107864121A (zh) * | 2017-09-30 | 2018-03-30 | 上海壹账通金融科技有限公司 | 用户身份验证方法及应用服务器 |
CN107943536A (zh) * | 2017-11-14 | 2018-04-20 | 广东欧珀移动通信有限公司 | 调整阈值的方法、装置、存储介质及电子设备 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019228135A1 (zh) * | 2018-05-30 | 2019-12-05 | Oppo广东移动通信有限公司 | 匹配阈值的调整方法、装置、存储介质及电子设备 |
WO2020253265A1 (zh) * | 2019-06-18 | 2020-12-24 | 北京京东尚科信息技术有限公司 | 应用于电子设备的数据处理方法、装置、系统、介质 |
CN111816178A (zh) * | 2020-07-07 | 2020-10-23 | 云知声智能科技股份有限公司 | 语音设备的控制方法、装置和设备 |
CN112417412A (zh) * | 2020-11-23 | 2021-02-26 | 中国农业银行股份有限公司陕西省分行 | 一种银行账户余额查询方法、装置及系统 |
Also Published As
Publication number | Publication date |
---|---|
WO2019228135A1 (zh) | 2019-12-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106658129B (zh) | 基于情绪的终端控制方法、装置及终端 | |
CN108766443A (zh) | 匹配阈值的调整方法、装置、存储介质及电子设备 | |
CN107591155A (zh) | 语音识别方法及装置、终端及计算机可读存储介质 | |
CN107331400A (zh) | 一种声纹识别性能提升方法、装置、终端及存储介质 | |
WO2020253128A1 (zh) | 基于语音识别的通信服务方法、装置、计算机设备及存储介质 | |
CN106297801A (zh) | 语音处理方法及装置 | |
CN105723450A (zh) | 用于话语检测的包络比较 | |
WO2017084185A1 (zh) | 基于语义分析的智能终端控制方法、系统及智能终端 | |
CN113127746B (zh) | 基于用户聊天内容分析的信息推送方法及其相关设备 | |
CN110544473B (zh) | 语音交互方法和装置 | |
CN110544468B (zh) | 应用唤醒方法、装置、存储介质及电子设备 | |
CN113129867B (zh) | 语音识别模型的训练方法、语音识别方法、装置和设备 | |
CN112634897B (zh) | 设备唤醒方法、装置和存储介质及电子装置 | |
JP7063937B2 (ja) | 音声対話するための方法、装置、電子デバイス、コンピュータ読み取り可能な記憶媒体、及びコンピュータプログラム | |
CN112735417B (zh) | 语音翻译方法、电子设备、计算机可读存储介质 | |
CN110580897B (zh) | 音频校验方法、装置、存储介质及电子设备 | |
CN113889091A (zh) | 语音识别方法、装置、计算机可读存储介质及电子设备 | |
WO2022222045A1 (zh) | 语音信息处理方法及设备 | |
CN110853669A (zh) | 音频识别方法、装置及设备 | |
EP4095850A1 (en) | Instruction execution method and apparatus, storage medium, and electronic device | |
CN111862943A (zh) | 语音识别方法和装置、电子设备和存储介质 | |
CN109545226A (zh) | 一种语音识别方法、设备及计算机可读存储介质 | |
CN108231074A (zh) | 一种数据处理方法、语音助手设备及计算机可读存储介质 | |
CN110164431B (zh) | 一种音频数据处理方法及装置、存储介质 | |
CN111062221A (zh) | 数据处理方法、装置、电子设备以及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20181106 |