CN105225664B - 信息验证方法和装置及声音样本的生成方法和装置 - Google Patents

信息验证方法和装置及声音样本的生成方法和装置 Download PDF

Info

Publication number
CN105225664B
CN105225664B CN201510617103.7A CN201510617103A CN105225664B CN 105225664 B CN105225664 B CN 105225664B CN 201510617103 A CN201510617103 A CN 201510617103A CN 105225664 B CN105225664 B CN 105225664B
Authority
CN
China
Prior art keywords
voice
information
user
text content
words
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510617103.7A
Other languages
English (en)
Other versions
CN105225664A (zh
Inventor
李海武
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201510617103.7A priority Critical patent/CN105225664B/zh
Publication of CN105225664A publication Critical patent/CN105225664A/zh
Application granted granted Critical
Publication of CN105225664B publication Critical patent/CN105225664B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明提出一种信息验证方法和装置及声音样本的生成方法和装置,该信息验证方法包括:获取用户的语音输入信息;当所述语音输入信息属于预设的信息类型时,从预先保存的词汇中选择预设个数的词汇,并对选择的词汇进行组合;根据组合后的词汇获取展示信息,并向用户展示所述展示信息;获取用户朗读所述展示信息的语音信息,并与预先保存的用户的声音样本进行比对,得到验证结果。该方法提高仿冒难度,从而提高信息安全性,并且,还可以提高识别率,从而提高验证可靠性。

Description

信息验证方法和装置及声音样本的生成方法和装置
技术领域
本发明涉及互联网技术领域,尤其涉及一种信息验证方法和装置及声音样本的生成方法和装置。
背景技术
随着智能手机和语音技术的发展,人们会选择通过语音与手机上的应用程序(APP)进行交互。在购物或支付等场景下,需要对用户进行认证,以确认是机主本人进行操作,在语音交互场景下,通常采用声纹识别技术进行认证。
现有技术中,声纹识别技术可以分为文本有关的方式和文本无关的方式,文本有关的方式是指事先规定好一段口令,让用户跟读,然后录制下来,认证时要求用户读出相同的口令,文本无关的方式是指事先获取用户的声纹特征,然后认证时让用户随机说一段话,凭借声纹特征识别用户。但是,文本有关的方式容易被仿冒,安全性较差,文本无关的方式容易被误识别,可靠性低。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的一个目的在于提出一种信息验证方法,该方法可以提高仿冒难度,从而提高信息安全性,并且,还可以提高识别率,从而提高验证可靠性。
本发明的另一个目的在于提出一种信息验证装置。
为达到上述目的,本发明第一方面实施例提出的信息验证方法,包括:获取用户的语音输入信息;当所述语音输入信息属于预设的信息类型时,从预先保存的词汇中选择预设个数的词汇,并对选择的词汇进行组合;根据组合后的词汇获取展示信息,并向用户展示所述展示信息;获取用户朗读所述展示信息的语音信息,并与预先保存的用户的声音样本进行比对,得到验证结果。
本发明第一方面实施例提出的信息验证方法,通过在预先保存的词汇中选择词汇并进行组合,相对于文本固定的方式,可以提高仿冒难度,从而提高信息安全性,并且,通过将展示信息展示给用户,用户可以依据展示信息朗读生成语音信息,相对于无依据的方式,可以提高识别率,从而提高验证可靠性。
为达到上述目的,本发明第二方面实施例提出的信息验证装置,包括:获取模块,用于获取用户的语音输入信息;选择模块,用于当所述语音输入信息属于预设的信息类型时,从预先保存的词汇中选择预设个数的词汇,并对选择的词汇进行组合;第一展示模块,用于根据组合后的词汇获取展示信息,并向用户展示所述展示信息;验证模块,用于获取用户朗读所述展示信息的语音信息,并与预先保存的用户的声音样本进行比对,得到验证结果。
本发明第二方面实施例提出的信息验证装置,通过在预先保存的词汇中选择词汇并进行组合,相对于文本固定的方式,可以提高仿冒难度,从而提高信息安全性,并且,通过将展示信息展示给用户,用户可以依据展示信息朗读生成语音信息,相对于无依据的方式,可以提高识别率,从而提高验证可靠性。
为达到上述目的,本发明第三方面实施例提出的声音样本的生成方法,包括:获取文本内容并展示给用户;采集用户朗读所述文本内容的语音信息;在所述文本内容中提取词汇,并确定所述语音信息中与所述词汇对应的语音片段,将所述语音片段作为用户的声音样本与对应的词汇进行关联保存。
本发明第三方面实施例提出的声音样本的生成方法,通过从文本内容中提取词汇,相对于直接采用固定文本的方式,可以提高灵活性,扩展能够保存的词汇及对应的声音样本的数量,从而提高安全性及可靠性。
为达到上述目的,本发明第四方面实施例提出的声音样本的生成装置,包括:展示模块,用于获取文本内容并展示给用户;采集模块,用于采集用户朗读所述文本内容的语音信息;保存模块,用于在所述文本内容中提取词汇,并确定所述语音信息中与所述词汇对应的语音片段,将所述语音片段作为用户的声音样本与对应的词汇进行关联保存。
本发明第四方面实施例提出的声音样本的生成装置,通过从文本内容中提取词汇,相对于直接采用固定文本的方式,可以提高灵活性,扩展能够保存的词汇及对应的声音样本的数量,从而提高安全性及可靠性。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1是本发明一实施例提出的信息验证方法的流程示意图;
图2是本发明另一实施例提出的信息验证方法的流程示意图;
图3是本发明实施例中展示给用户的一段文字的示意图;
图4是本发明另一实施例提出的信息验证装置的结构示意图;
图5是本发明另一实施例提出的信息验证装置的结构示意图;
图6是本发明另一实施例提出的声音样本的生成方法的流程示意图;
图7是本发明另一实施例提出的声音样本的生成方法的流程示意图;
图8是本发明另一实施例提出的声音样本的生成装置的结构示意图;
图9是本发明另一实施例提出的声音样本的生成装置的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的模块或具有相同或类似功能的模块。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。相反,本发明的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。
图1是本发明一实施例提出的信息验证方法的流程示意图,该方法包括:
S11:获取用户的语音输入信息。
在语音交互场景下,用户可以与智能设备上的APP进行语音交互,从而获取到用户的语音输入信息。
智能设备例如为手机等移动终端、智能家居设备、智能工业设备等。
S12:当所述语音输入信息属于预设的信息类型时,从预先保存的词汇中选择预设个数的词汇,并对选择的词汇进行组合。
其中,预设的信息类型是指需要进行信息验证的类型,例如,语音输入信息是购物类请求或者支付类请求等。
从预先保存的词汇中选择词汇时可以采用随机方式选择,例如,预先保存的词汇共有N个词汇,预设个数是M个,则可以在N个词汇中随机M个词汇。
在对词汇进行组合时,也可以采用随机组合顺序,例如,选择的词汇包括:A、B、C,则可以组合成A+B+C,A+C+B,B+A+C等。
S13:根据组合后的词汇获取展示信息,并向用户展示所述展示信息。
其中,展示信息可以是组合后的词汇的语音信息,例如,采用语音合成技术,根据组合后的词汇生成对应的合成语音,之后,可以向用户播放该合成语音。或者,
展示信息可以是组合后的词汇,例如,组合后的词汇是文本形式,则以文本形式向用户展示组合后的词汇。
S14:获取用户朗读所述展示信息的语音信息,并与预先保存的用户的声音样本进行比对,得到验证结果。
例如,当展示信息是组合后的词汇的合成语音时,用户可以跟读该语音,从而获取用户的语音信息。或者,
当展示信息是文本形式的组合后的词汇时,用户可以根据朗读该文本内容,从而获取用户的语音信息。
另外,可以预先对应预先保存的每个词汇,采集用户对该词汇的朗读语音,将该朗读语音或者预设处理后的朗读语音作为该词汇对应的声音样本,并建立词汇与声音样本的关联关系,从而在验证时,可以根据词汇获取对应的声音样本,再与验证时当前采集的用户语音进行比对,如果一致则验证成功,否则,验证失败。
本实施例中,通过在词汇表中选择词汇并进行组合,相对于文本固定的方式,可以提高仿冒难度,从而提高信息安全性,并且,通过将展示信息展示给用户,用户可以依据展示信息朗读生成语音信息,相对于无依据的方式,可以提高识别率,从而提高验证可靠性。
图2是本发明另一实施例提出的信息验证方法的流程示意图,本实施例以用户与手机上的APP交互为例。该方法包括:
本实施例可以分为离线的语音认证设置流程,以及在线的语音认证流程。
其中,语音认证设置流程可以包括:
S201:在用户登录手机上的APP,并触发语音认证设置后,向用户展示预设的文本内容。
例如,用户可以登录需要语音交互的APP,之后,用户可以点击该APP内的语音认证设置功能项,以触发语音认证设置。
在用户触发语音认证设置后,APP的服务器可以获取预设的文本内容并通过客户端展示给用户,其中,APP的服务器内可以预先设置一个文本内容,之后将该文本内容展示给用户,或者,APP的服务器内也可以预先设置多个文本内容,之后服务器在多个文本内容中随机选择一个文本内容展示给用户。
可选的,服务器内预先设置的一个或多个文本内容可以是著名的短文,以方便用户朗读和记忆,例如,如图3所示,展示给用户的文本内容31例如为知名散文的一部分。
S202:用户朗读该展示的文本内容。
在向用户展示文本内容时,还可以展示提示消息,如提示用户朗读该段文字等。
S203:采集用户朗读该文本内容的语音信息。
用户可以根据提示信息朗读该段文本内容,手机可以通过麦克风等采集到用户的语音信息。
一些实施例中,还可以提示用户朗读多次,以采集用户更多的语音信息。另外,也可以增强用户记忆。
S204:在文本内容中提取词汇,并在采集的用户的语音信息中识别出于该词汇对应的语音片段,将该语音片段作为用户的声音样本,关联保存词汇与声音样本。
例如,在上述文本内容中,可以提取出“名曲”,“叶子”,“舞女”,“满月”,“黑影”,“斑驳”,“杨柳”等词汇,并获取相应的语音片断,例如根据语音识别技术以及匹配技术可以区分出每个词汇对应的用户的语音片段,从而可以将语音片段作为声音样本与词汇关联保存。可选的,所述提取的词汇是出现次数大于预设值的词汇,或者,易被语音识别的词汇。
例如,在展示的文本内容中,“荷塘”出现了多次,则可以将“荷塘”确定为要提取的词汇,从而可以采集到该词汇对应的多次的语音片断,以扩展声音样本的数量,提高准确度。或者,也可以将文本内容中易被语音识别的词汇确定为要提取的词汇,而易被语音识别的词汇可以根据实际的语音识别统计情况确定哪些词汇属于易被语音识别的,从而也可以提高准确度。
可选的,所述提取的词汇对应的语音片断是一个或多个。
一些实施例中,采集到用户的语音信息后,还可以包括:
根据所述语音信息获取所述用户的声纹特征信息。
当展示的文本内容是短文时,由于用户朗诵该短文需要一定的时间,那么在提取声音样本之外,还可以在该段时间内根据用户的语音信息提取用户的声纹特征信息。由于用户朗诵该短文包含的词汇较多,那么可以获取到较多的语音信息,从而获取的声纹特征信息也更为准确。在获取到声纹特征信息后,可以将声纹特征信息作为基础数据用于后续流程处理,例如,用于基于声纹特征信息的认证等场景。
以购买机票为例,语音认证流程可以包括:
S205:获取用户的用于购买机票的语音输入信息。
S206:从预先保存的词汇中选择预设个数的词汇,并对选择的词汇进行组合。
预设个数例如为3-5个。
例如,预先保存的有100个词汇,那么取出五个词汇排列组合的可能性是100*99*98*97*96=9034502400,90亿个之多。即便是50个词汇,取出三个词汇随机排列组合的可能性也有50*49*48=117600,11万个之多。这样就很难被破解,从而提高安全性。
S207:采用语音合成技术,生成组合后的词汇对应的合成语音并播放给用户。
另外,该可以提示用户跟读该语音,例如,向用户播放“请跟读如下语音”,之后播放组合后的词汇生成的合成语音。
S208:采集用户跟读的语音信息。
在用户跟读后,可以采集到用户的语音信息。
S209:获取组合后的词汇对应的声音样本,并将语音信息与声音样本进行比对,得到验证结果。
例如,组合后的词汇是A+B+C,则可以从语音认证设置过程中保存的词汇与声音样本的关联关系中,分别获取A、B、C对应的声音样本,之后根据词汇的组合顺序对该声音样本进行组合,再比对组合后的声音样本及当前采集的用户的语音信息,如果两者一致,确定验证成功,否则验证失败。可以理解的是,一致可以是指完全相同或者也可以是指在预设误差范围内的相同。
一些实施例中,在获取到声纹特征信息后,也可以再根据声纹特征信息进行验证,当比对声音样本一致,以及,声纹特征信息一致后,才确定验证成功,否则失败。这样可以提高验证的安全性和准确性。
在获取验证结果后,可以进一步根据验证结果进行操作,如允许用户购物或者拒绝购物等。
本实施例中,通过随机选择文本内容,以及随机选择词汇,可以令攻击者无法猜测,无从攻击,提高安全性。通过预先将词汇与声音样本关联,在验证过程向用户提供展示信息,可以提高识别率,提高验证可靠性。本实施例以语音方式将组合后的词汇提供给用户,可以实现声音验证码,方便用户使用,例如可以应用在用户不方便看屏幕甚至智能设备上没有屏幕的场景。
图4是本发明另一实施例提出的信息验证装置的结构示意图,该装置40包括:获取模块41、选择模块42、第一展示模块43和验证模块44。
获取模块41,用于获取用户的语音输入信息;
在语音交互场景下,用户可以与智能设备上的APP进行语音交互,从而获取到用户的语音输入信息。
智能设备例如为手机等移动终端、智能家居设备、智能工业设备等。
选择模块42,用于当所述语音输入信息属于预设的信息类型时,从预先保存的词汇中选择预设个数的词汇,并对选择的词汇进行组合;
可选的,所述预设的信息类型包括:购物类或支付类。
可选的,所述选择模块42用于从预先保存的词汇中选择预设个数的词汇,包括:
从预先保存的词汇中,随机选择预设个数的词汇。
其中,预设的信息类型是指需要进行信息验证的类型,例如,语音输入信息是购物类请求或者支付类请求等。
从预先保存的词汇中选择词汇时可以采用随机方式选择,例如,预先保存的词汇共有N个词汇,预设个数是M个,则可以在N个词汇中随机M个词汇。
在对词汇进行组合时,也可以采用随机组合顺序,例如,选择的词汇包括:A、B、C,则可以组合成A+B+C,A+C+B,B+A+C等。
第一展示模块43,用于根据组合后的词汇获取展示信息,并向用户展示所述展示信息;
可选的,所述第一展示模块43具体用于:
采用语音合成技术,生成组合后的词汇对应的合成语音,并向用户播放所述合成语音;或者,
将组合后的词汇作为展示信息,以文本形式展示给用户。
其中,展示信息可以是组合后的词汇的语音信息,例如,采用语音合成技术,根据组合后的词汇生成对应的合成语音,之后,可以向用户播放该合成语音。或者,
展示信息可以是组合后的词汇,例如,组合后的词汇是文本形式,则以文本形式向用户展示组合后的词汇。
验证模块44,用于获取用户朗读所述展示信息的语音信息,并与预先保存的用户的声音样本进行比对,得到验证结果。
例如,当展示信息是组合后的词汇的合成语音时,用户可以跟读该语音,从而获取用户的语音信息。或者,
当展示信息是文本形式的组合后的词汇时,用户可以根据朗读该文本内容,从而获取用户的语音信息。
另外,可以预先对应预先保存的每个词汇,采集用户对该词汇的朗读语音,将该朗读语音或者预设处理后的朗读语音作为该词汇对应的声音样本,并建立词汇与声音样本的关联关系,从而在验证时,可以根据词汇获取对应的声音样本,再与验证时当前采集的用户语音进行比对,如果一致则验证成功,否则,验证失败。
本实施例中,通过在词汇表中选择词汇并进行组合,相对于文本固定的方式,可以提高仿冒难度,从而提高信息安全性,并且,通过将展示信息展示给用户,用户可以依据展示信息朗读生成语音信息,相对于无依据的方式,可以提高识别率,从而提高验证可靠性。
一些实施例中,参见图5,该装置40还包括:
第二展示模块45,用于获取文本内容并展示给用户;
可选的,所述获取文本内容包括:
从已有的多个文本内容中,随机选择一个文本内容。
可选的,服务器内预先设置的一个或多个文本内容可以是著名的短文,以方便用户朗读和记忆,例如,如图3所示,展示给用户的文本内容31例如为知名散文的一部分。
采集模块46,用于采集用户朗读所述文本内容的语音信息;
在向用户展示文本内容时,还可以展示提示消息,如提示用户朗读该段文字等。用户可以根据提示信息朗读该段文本内容,手机可以通过麦克风等采集到用户的语音信息。
一些实施例中,还可以提示用户朗读多次,以采集用户更多的语音信息。另外,也可以增强用户记忆。
保存模块47,用于在所述文本内容中提取词汇,并确定所述语音信息中与所述词汇对应的语音片段,将所述语音片段作为用户的声音样本与对应的词汇进行关联保存。
例如,在上述文本内容中,可以提取出“名曲”,“叶子”,“舞女”,“满月”,“黑影”,“斑驳”,“杨柳”等词汇,并获取相应的语音片断,例如根据语音识别技术可以区分出每个词汇对应的用户的语音片段,从而可以将语音片段作为声音样本与词汇关联保存。
可选的,所述提取的词汇是出现次数大于预设值的词汇,或者,易被语音识别的词汇。
可选的,所述提取的词汇对应的语音片断是一个或多个。
一些实施例中,该装置还可以包括:
获取模块,用于根据所述语音信息获取所述用户的声纹特征信息。
当展示的文本内容是短文时,由于用户朗诵该短文需要一定的时间,那么在提取声音样本之外,还可以在该段时间内根据用户的语音信息提取用户的声纹特征信息。由于用户朗诵该短文包含的词汇较多,那么可以获取到较多的语音信息,从而获取的声纹特征信息也更为准确。在获取到声纹特征信息后,可以将声纹特征信息作为基础数据用于后续流程处理,例如,用于基于声纹特征信息的认证等场景。
一些实施例中,验证模块还可以用于:在验证时,还根据所述声纹特征信息进行验证,以及,在根据所述声音样本以及所述声纹特征信息均验证成功时,最终确定为验证成功。这样可以提高验证的安全性和准确性。
本实施例中,通过随机选择文本内容,以及随机选择词汇,可以令攻击者无法猜测,无从攻击,提高安全性。通过预先将词汇与声音样本关联,在验证过程向用户提供展示信息,可以提高识别率,提高验证可靠性。本实施例以语音方式将组合后的词汇提供给用户,可以实现声音验证码,方便用户使用,例如可以应用在用户不方便看屏幕甚至智能设备上没有屏幕的场景。
图6是本发明另一实施例提出的声音样本的生成方法的流程示意图,该方法包括:
S61:获取文本内容并展示给用户;
可选的,所述获取文本内容,包括:
从已有的多个文本内容中,随机选择一个文本内容。
在用户触发语音认证设置后,APP的服务器可以获取预设的文本内容并通过客户端展示给用户,其中,APP的服务器内可以预先设置一个文本内容,之后将该文本内容展示给用户,或者,APP的服务器内也可以预先设置多个文本内容,之后服务器在多个文本内容中随机选择一个文本内容展示给用户。
可选的,所述文本内容是著名的短文。例如,如图3所示,展示给用户的文本内容31例如为知名散文的一部分。
S62:采集用户朗读所述文本内容的语音信息;
在向用户展示文本内容时,还可以展示提示消息,如提示用户朗读该段文字等。
用户可以根据提示信息朗读该段文本内容,手机可以通过麦克风等采集到用户的语音信息。
一些实施例中,还可以提示用户朗读多次,以采集用户更多的语音信息。另外,也可以增强用户记忆。
S63:在所述文本内容中提取词汇,并确定所述语音信息中与所述词汇对应的语音片段,将所述语音片段作为用户的声音样本与对应的词汇进行关联保存。
例如,在上述文本内容中,可以提取出“名曲”,“叶子”,“舞女”,“满月”,“黑影”,“斑驳”,“杨柳”等词汇,并获取相应的语音片断,例如根据语音识别技术以及匹配技术可以区分出每个词汇对应的用户的语音片段,从而可以将语音片段作为声音样本与词汇关联保存。
可选的,所述提取的词汇是出现次数大于预设值的词汇,或者,易被语音识别的词汇。
例如,在展示的文本内容中,“荷塘”出现了多次,则可以将“荷塘”确定为要提取的词汇,从而可以采集到该词汇对应的多次的语音片断,以扩展声音样本的数量,提高准确度。或者,也可以将文本内容中易被语音识别的词汇确定为要提取的词汇,而易被语音识别的词汇可以根据实际的语音识别统计情况确定哪些词汇属于易被语音识别的,从而也可以提高准确度。
可选的,所述提取出的词汇对应的语音片断是一个或多个。
一些实施例中,参见图7,该方法还可以包括:
S64:根据所述语音信息获取所述用户的声纹特征信息。
当展示的文本内容是短文时,由于用户朗诵该短文需要一定的时间,那么在提取声音样本之外,还可以在该段时间内根据用户的语音信息提取用户的声纹特征信息。由于用户朗诵该短文包含的词汇较多,那么可以获取到较多的语音信息,从而获取的声纹特征信息也更为准确。在获取到声纹特征信息后,可以将声纹特征信息作为基础数据用于后续流程处理,例如,用于基于声纹特征信息的认证等场景。
本实施例中,通过从文本内容中提取词汇,相对于直接采用固定文本的方式,可以提高灵活性,扩展能够保存的词汇及对应的声音样本的数量,从而提高安全性及可靠性。
图8是本发明另一实施例提出的声音样本的生成方法的流程示意图,该方法包括:
展示模块81,用于获取文本内容并展示给用户;
可选的,所述展示模块81用于获取文本内容,包括:
从已有的多个文本内容中,随机选择一个文本内容。
在用户触发语音认证设置后,APP的服务器可以获取预设的文本内容并通过客户端展示给用户,其中,APP的服务器内可以预先设置一个文本内容,之后将该文本内容展示给用户,或者,APP的服务器内也可以预先设置多个文本内容,之后服务器在多个文本内容中随机选择一个文本内容展示给用户。
可选的,所述文本内容是著名的短文。例如,如图3所示,展示给用户的文本内容31例如为知名散文的一部分。
采集模块82,用于采集用户朗读所述文本内容的语音信息;
在向用户展示文本内容时,还可以展示提示消息,如提示用户朗读该段文字等。
用户可以根据提示信息朗读该段文本内容,手机可以通过麦克风等采集到用户的语音信息。
一些实施例中,还可以提示用户朗读多次,以采集用户更多的语音信息。另外,也可以增强用户记忆。
保存模块83,用于在所述文本内容中提取词汇,并确定所述语音信息中与所述词汇对应的语音片段,将所述语音片段作为用户的声音样本与对应的词汇进行关联保存。
例如,在上述文本内容中,可以提取出“名曲”,“叶子”,“舞女”,“满月”,“黑影”,“斑驳”,“杨柳”等词汇,并获取相应的语音片断,例如根据语音识别技术以及匹配技术可以区分出每个词汇对应的用户的语音片段,从而可以将语音片段作为声音样本与词汇关联保存。
可选的,所述提取的词汇是出现次数大于预设值的词汇,或者,易被语音识别的词汇。
例如,在展示的文本内容中,“荷塘”出现了多次,则可以将“荷塘”确定为要提取的词汇,从而可以采集到该词汇对应的多次的语音片断,以扩展声音样本的数量,提高准确度。或者,也可以将文本内容中易被语音识别的词汇确定为要提取的词汇,而易被语音识别的词汇可以根据实际的语音识别统计情况确定哪些词汇属于易被语音识别的,从而也可以提高准确度。
可选的,所述提取出的词汇对应的语音片断是一个或多个。
一些实施例中,参见图9,该装置80还包括:
获取模块84,用于根据所述语音信息获取所述用户的声纹特征信息。
当展示的文本内容是短文时,由于用户朗诵该短文需要一定的时间,那么在提取声音样本之外,还可以在该段时间内根据用户的语音信息提取用户的声纹特征信息。由于用户朗诵该短文包含的词汇较多,那么可以获取到较多的语音信息,从而获取的声纹特征信息也更为准确。在获取到声纹特征信息后,可以将声纹特征信息作为基础数据用于后续流程处理,例如,用于基于声纹特征信息的认证等场景。
本实施例中,通过从文本内容中提取词汇,相对于直接采用固定文本的方式,可以提高灵活性,扩展能够保存的词汇及对应的声音样本的数量,从而提高安全性及可靠性。
需要说明的是,在本发明的描述中,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本发明的描述中,除非另有说明,“多个”的含义是指至少两个。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (20)

1.一种信息验证方法,其特征在于,包括:
获取用户的语音输入信息;
当所述语音输入信息属于预设的信息类型时,从预先保存的词汇中选择预设个数的词汇,并对选择的词汇进行组合;
根据组合后的词汇获取展示信息,并向用户展示所述展示信息;
获取用户朗读所述展示信息的语音信息,并从预先保存的词汇与用户的声音样本的关联关系中获取与所述组合后的词汇对应的声音样本,将所述语音信息与所述组合后的词汇对应的声音样本进行比对,得到验证结果;
其中,所述方法还包括:
获取文本内容并展示给用户;
采集用户朗读所述文本内容的语音信息;
在所述文本内容中提取词汇,并确定所述语音信息中与所述词汇对应的语音片段,将所述语音片段作为用户的声音样本与对应的词汇进行关联保存;
根据所述语音信息获取所述用户的声纹特征信息;
在验证时,还根据所述声纹特征信息进行验证,以及,在根据所述声音样本以及所述声纹特征信息均验证成功时,最终确定为验证成功。
2.根据权利要求1所述的方法,其特征在于,所述根据组合后的词汇获取展示信息,并向用户展示所述展示信息,包括:
采用语音合成技术,生成组合后的词汇对应的合成语音,并向用户播放所述合成语音;或者,
将组合后的词汇作为展示信息,以文本形式展示给用户。
3.根据权利要求1所述的方法,其特征在于,所述从预先保存的词汇中选择预设个数的词汇,包括:
从预先保存的词汇中,随机选择预设个数的词汇。
4.根据权利要求1所述的方法,其特征在于,所述获取文本内容包括:
从已有的多个文本内容中,随机选择一个文本内容。
5.根据权利要求1或4所述的方法,其特征在于,所述文本内容是著名的短文。
6.根据权利要求1或4所述的方法,其特征在于,所述提取的词汇是出现次数大于预设值的词汇,或者,易被语音识别的词汇。
7.根据权利要求1或4所述的方法,其特征在于,所述提取的词汇对应的语音片断是一个或多个。
8.根据权利要求1-3任一项所述的方法,其特征在于,所述预设的信息类型包括:购物类或支付类。
9.一种声音样本的生成方法,其特征在于,包括:
获取文本内容并展示给用户;
采集用户朗读所述文本内容的语音信息;
在所述文本内容中提取词汇,并确定所述语音信息中与所述词汇对应的语音片段,将所述语音片段作为用户的声音样本与对应的词汇进行关联保存。
10.根据权利要求9所述的方法,其特征在于,所述获取文本内容,包括:
从已有的多个文本内容中,随机选择一个文本内容。
11.根据权利要求9或10所述的方法,其特征在于,所述文本内容是著名的短文。
12.根据权利要求9或10所述的方法,其特征在于,所述提取的词汇是出现次数大于预设值的词汇,或者,易被语音识别的词汇。
13.根据权利要求9或10所述的方法,其特征在于,所述提取的词汇对应的语音片断是一个或多个。
14.根据权利要求9或10所述的方法,其特征在于,还包括:
根据所述语音信息获取所述用户的声纹特征信息。
15.一种信息验证装置,其特征在于,包括:
获取模块,用于获取用户的语音输入信息;
选择模块,用于当所述语音输入信息属于预设的信息类型时,从预先保存的词汇中选择预设个数的词汇,并对选择的词汇进行组合;
第一展示模块,用于根据组合后的词汇获取展示信息,并向用户展示所述展示信息;
验证模块,用于获取用户朗读所述展示信息的语音信息,并从预先保存的词汇与用户的声音样本的关联关系中获取与所述组合后的词汇对应的声音样本,将所述语音信息与所述组合后的词汇对应的声音样本进行比对,得到验证结果;
其中,所述装置还包括:
第二展示模块,用于获取文本内容并展示给用户;
采集模块,用于采集用户朗读所述文本内容的语音信息;
保存模块,用于在所述文本内容中提取词汇,并确定所述语音信息中与所述词汇对应的语音片段,将所述语音片段作为用户的声音样本与对应的词汇进行关联保存;
所述获取模块,还用于根据所述语音信息获取所述用户的声纹特征信息;
所述验证模块,还用于在验证时,还根据所述声纹特征信息进行验证,以及,在根据所述声音样本以及所述声纹特征信息均验证成功时,最终确定为验证成功。
16.根据权利要求15所述的装置,其特征在于,所述第一展示模块具体用于:
采用语音合成技术,生成组合后的词汇对应的合成语音,并向用户播放所述合成语音;或者,
将组合后的词汇作为展示信息,以文本形式展示给用户。
17.根据权利要求15所述的装置,其特征在于,所述选择模块用于从预先保存的词汇中选择预设个数的词汇,包括:
从预先保存的词汇中,随机选择预设个数的词汇。
18.一种声音样本的生成装置,其特征在于,包括:
展示模块,用于获取文本内容并展示给用户;
采集模块,用于采集用户朗读所述文本内容的语音信息;
保存模块,用于在所述文本内容中提取词汇,并确定所述语音信息中与所述词汇对应的语音片段,将所述语音片段作为用户的声音样本与对应的词汇进行关联保存。
19.根据权利要求18所述的装置,其特征在于,所述展示模块用于获取文本内容,包括:
从已有的多个文本内容中,随机选择一个文本内容。
20.根据权利要求18或19所述的装置,其特征在于,还包括:
获取模块,用于根据所述语音信息获取所述用户的声纹特征信息。
CN201510617103.7A 2015-09-24 2015-09-24 信息验证方法和装置及声音样本的生成方法和装置 Active CN105225664B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510617103.7A CN105225664B (zh) 2015-09-24 2015-09-24 信息验证方法和装置及声音样本的生成方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510617103.7A CN105225664B (zh) 2015-09-24 2015-09-24 信息验证方法和装置及声音样本的生成方法和装置

Publications (2)

Publication Number Publication Date
CN105225664A CN105225664A (zh) 2016-01-06
CN105225664B true CN105225664B (zh) 2019-12-06

Family

ID=54994574

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510617103.7A Active CN105225664B (zh) 2015-09-24 2015-09-24 信息验证方法和装置及声音样本的生成方法和装置

Country Status (1)

Country Link
CN (1) CN105225664B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105786797B (zh) * 2016-02-23 2018-09-14 北京云知声信息技术有限公司 一种基于语音输入的信息处理方法及装置
CN106850539A (zh) * 2016-12-07 2017-06-13 广东小天才科技有限公司 一种验证信息获取方法和装置
CN111292766B (zh) * 2020-02-07 2023-08-08 抖音视界有限公司 用于生成语音样本的方法、装置、电子设备和介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1808567A (zh) * 2006-01-26 2006-07-26 覃文华 验证真人在场状态的声纹认证设备和其认证方法
CN101192925A (zh) * 2006-11-20 2008-06-04 华为技术有限公司 说话人验证方法和系统及媒体资源控制实体和处理实体
CN101335623A (zh) * 2008-04-17 2008-12-31 王皓辰 一种采用口令变换的网络身份认证方法
CN102238189A (zh) * 2011-08-01 2011-11-09 安徽科大讯飞信息科技股份有限公司 声纹密码认证方法及系统
CN103220286A (zh) * 2013-04-10 2013-07-24 郑方 基于动态密码语音的身份确认系统及方法
CN104717219A (zh) * 2015-03-20 2015-06-17 百度在线网络技术(北京)有限公司 基于人工智能的声纹登录方法和装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7240007B2 (en) * 2001-12-13 2007-07-03 Matsushita Electric Industrial Co., Ltd. Speaker authentication by fusion of voiceprint match attempt results with additional information
CN101197131B (zh) * 2006-12-07 2011-03-30 积体数位股份有限公司 随机式声纹密码验证系统、随机式声纹密码锁及其产生方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1808567A (zh) * 2006-01-26 2006-07-26 覃文华 验证真人在场状态的声纹认证设备和其认证方法
CN101192925A (zh) * 2006-11-20 2008-06-04 华为技术有限公司 说话人验证方法和系统及媒体资源控制实体和处理实体
CN101335623A (zh) * 2008-04-17 2008-12-31 王皓辰 一种采用口令变换的网络身份认证方法
CN102238189A (zh) * 2011-08-01 2011-11-09 安徽科大讯飞信息科技股份有限公司 声纹密码认证方法及系统
CN103220286A (zh) * 2013-04-10 2013-07-24 郑方 基于动态密码语音的身份确认系统及方法
CN104717219A (zh) * 2015-03-20 2015-06-17 百度在线网络技术(北京)有限公司 基于人工智能的声纹登录方法和装置

Also Published As

Publication number Publication date
CN105225664A (zh) 2016-01-06

Similar Documents

Publication Publication Date Title
JP6344696B2 (ja) 声紋認証方法および装置
EP3611895B1 (en) Method and device for user registration, and electronic device
KR101757990B1 (ko) 성문 인증 방법 및 장치
JP6394709B2 (ja) 話者識別装置および話者識別用の登録音声の特徴量登録方法
CN106796785B (zh) 用于产生声音检测模型的声音样本验证
CN108053839B (zh) 一种语言练习成果的展示方法及麦克风设备
CN109165336B (zh) 一种信息输出控制方法及家教设备
EP3617973A1 (en) Electronic ticket admission verification anti-counterfeiting system and method thereof
CN104123115A (zh) 一种音频信息处理方法及电子设备
CN103559880B (zh) 语音输入系统和方法
KR101769689B1 (ko) 성문 기반 통신 방법, 장치, 및 시스템
CN109410664A (zh) 一种发音纠正方法及电子设备
CN104462912B (zh) 改进的生物密码安全
CN105225664B (zh) 信息验证方法和装置及声音样本的生成方法和装置
CN102916815A (zh) 用户身份验证的方法和装置
CN109462603A (zh) 基于盲检测的声纹认证方法、设备、存储介质及装置
CN104505103B (zh) 语音质量评价设备、方法和系统
CN110276616A (zh) 语音支付方法、装置、设备和存储介质
CN111081260A (zh) 一种唤醒词声纹的识别方法及系统
CN111639218A (zh) 一种口语训练的交互方法及终端设备
CN109273012B (zh) 一种基于说话人识别和数字语音识别的身份认证方法
US20140163986A1 (en) Voice-based captcha method and apparatus
US11416593B2 (en) Electronic device, control method for electronic device, and control program for electronic device
CN109271480B (zh) 一种语音搜题方法及电子设备
CN108777804B (zh) 媒体播放方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant