CN104967622B - 基于声纹的通讯方法、装置和系统 - Google Patents

基于声纹的通讯方法、装置和系统 Download PDF

Info

Publication number
CN104967622B
CN104967622B CN201510372778.XA CN201510372778A CN104967622B CN 104967622 B CN104967622 B CN 104967622B CN 201510372778 A CN201510372778 A CN 201510372778A CN 104967622 B CN104967622 B CN 104967622B
Authority
CN
China
Prior art keywords
information
vocal print
user account
identification information
voice messaging
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510372778.XA
Other languages
English (en)
Other versions
CN104967622A (zh
Inventor
杜念冬
李超
谢延
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201510372778.XA priority Critical patent/CN104967622B/zh
Publication of CN104967622A publication Critical patent/CN104967622A/zh
Priority to JP2015231335A priority patent/JP2017017669A/ja
Priority to US14/962,711 priority patent/US9865267B2/en
Priority to KR1020150187473A priority patent/KR101769689B1/ko
Application granted granted Critical
Publication of CN104967622B publication Critical patent/CN104967622B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • G10L17/22Interactive procedures; Man-machine interfaces
    • G10L17/24Interactive procedures; Man-machine interfaces the user being prompted to utter a password or a predefined phrase
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • G06F21/32User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints

Abstract

本发明提出一种基于声纹的通讯方法、装置和系统,该基于声纹的通讯方法包括向服务端发送第一信息,并接收所述服务端发送的标识信息,所述标识信息是所述服务端接收到所述第一信息后生成的,所述第一信息是用户账号信息和语音信息中的一种;向所述服务端发送第二信息和所述标识信息,所述第二信息是所述用户账号信息和所述语音信息中的另一种。该方法能够提高基于声纹通讯的安全性。

Description

基于声纹的通讯方法、装置和系统
技术领域
本发明涉及通信技术领域,尤其涉及一种基于声纹的通讯方法、装置和系统。
背景技术
传统的验证方式通常是基于密码的验证,但是,基于密码的验证方式容易被盗用。为了提高安全性,出现了基于声纹的验证方式,基于声纹的验证方式利用了使用者的声纹信息,不易被模仿,可以在一定程度上增加安全性。
现有技术中,在基于声纹的验证流程中,通常是客户端将用户账号信息和声纹信息同步发送给服务端,由服务端进行验证。但是,如果恶意攻击者在客户端与服务端的通信链路上抓包分析,也可能出现用户账号信息和声纹信息被泄露的问题。因此,现有技术的通讯方式存在一定的安全隐患。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的一个目的在于提出一种基于声纹的通讯方法,该方法可以提高基于声纹通讯的安全性。
本发明的另一个目的在于提出一种基于声纹的通讯装置。
本发明的另一个目的在于提出一种基于声纹的通讯系统。
为达到上述目的,本发明第一方面实施例提出的基于声纹的通讯方法,包括:向服务端发送第一信息,并接收所述服务端发送的标识信息,所述标识信息是所述服务端接收到所述第一信息后生成的,所述第一信息是用户账号信息和语音信息中的一种;向所述服务端发送第二信息和所述标识信息,所述第二信息是所述用户账号信息和所述语音信息中的另一种。
本发明第一方面实施例提出的基于声纹的通讯方法,通过将第一信息和第二信息分两次传输给服务端,可以避免第一信息和第二信息同步传输时引起的问题,可以提高基于声纹通讯的安全性。
为达到上述目的,本发明第二方面实施例提出的基于声纹的通讯方法,包括:接收客户端发送的第一信息,生成标识信息,并将所述标识信息发送给所述客户端,所述第一信息是用户账号信息和语音信息中的一种;接收所述客户端发送的第二信息和所述标识信息,所述第二信息是所述用户账号信息和所述语音信息中的另一种。
本发明第二方面实施例提出的基于声纹的通讯方法,通过接收客户端分两次传输的第一信息和第二信息,可以避免第一信息和第二信息同步传输时引起的问题,可以提高基于声纹通讯的安全性。
为达到上述目的,本发明第三方面实施例提出的基于声纹的通讯装置,包括:第一交互模块,用于向服务端发送第一信息,并接收所述服务端发送的标识信息,所述标识信息是所述服务端接收到所述第一信息后生成的,所述第一信息是用户账号信息和语音信息中的一种;第二交互模块,用于向所述服务端发送第二信息和所述标识信息,所述第二信息是所述用户账号信息和所述语音信息中的另一种。
本发明第三方面实施例提出的基于声纹的通讯装置,通过将第一信息和第二信息分两次传输给服务端,可以避免第一信息和第二信息同步传输时引起的问题,可以提高基于声纹通讯的安全性。
为达到上述目的,本发明第四方面实施例提出的基于声纹的通讯装置,包括:第一交互模块,用于接收客户端发送的第一信息,生成标识信息,并将所述标识信息发送给所述客户端,所述第一信息是用户账号信息和语音信息中的一种;第二交互模块,用于接收所述客户端发送的第二信息和所述标识信息,所述第二信息是所述用户账号信息和所述语音信息中的另一种。
本发明第四方面实施例提出的基于声纹的通讯装置,通过接收客户端分两次传输的第一信息和第二信息,可以避免第一信息和第二信息同步传输时引起的问题,可以提高基于声纹通讯的安全性。
为达到上述目的,本发明第五方面实施例提出的基于声纹的通讯系统,包括:第三方面实施例提出的装置,以及,第四方面实施例提出的装置。
本发明第三方面实施例提出的基于声纹的通讯系统,移动端与服务端分两次传输用户账号信息和语音信息,可以将用户账号信息与用于验证的语音信息分开传输,可以避免同步传输导致的不安全问题,从而可以提高验证的安全性。另外,标识信息是随机生成的,可以进一步提高安全性。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1是本发明一实施例提出的基于声纹的通讯方法的流程示意图;
图2是本发明另一实施例提出的基于声纹的通讯方法的流程示意图;
图3是本发明另一实施例提出的基于声纹的通讯方法的流程示意图;
图4是本发明另一实施例提出的基于声纹的通讯方法的流程示意图;
图5是本发明另一实施例提出的基于声纹的通讯装置的结构示意图;
图6是本发明另一实施例提出的基于声纹的通讯装置的结构示意图;
图7是本发明另一实施例提出的基于声纹的通讯装置的结构示意图;
图8是本发明另一实施例提出的基于声纹的通讯装置的结构示意图;
图9是本发明另一实施例提出的基于声纹的通讯系统的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的模块或具有相同或类似功能的模块。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。相反,本发明的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。
图1是本发明一实施例提出的基于声纹的通讯方法的流程示意图,本实施例以客户端执行为例,客户端例如位于移动设备上。该方法包括:
S11:向服务端发送第一信息,并接收所述服务端发送的标识信息,所述标识信息是所述服务端接收到所述第一信息后生成的,所述第一信息是用户账号信息和语音信息中的一种。
本实施例中为了避免用户账号信息和语音信息同步传输时存在的问题,可以将用户账号信息和语音信息分两次进行传输,避免被同时抓包。
用户账号信息例如用户名,手机号,邮箱名等。
本实施例的方法可以应用在注册流程,或者,也可以应用在验证流程中,验证流程可以包括登录验证或者支付验证等。
根据应用场景的不同,语音信息也是不同的。例如,当在注册时,所述语音信息是作为训练样本的语音数据,所述训练样本用于声纹训练以得到声纹特征信息。或者,当在验证时,所述语音信息是待验证的语音数据。
具体的,在注册流程中,客户端可以向用户展示注册界面,用户可以在该注册界面上填写用户账号信息,并可以根据客户端的提示信息,朗诵相应的提示内容,从而使得客户端获取待注册的语音信息。
在验证流程中,客户端可以向用户展示验证界面,用户可以在该验证解密上填写用户账号信息,并根据提示或者自发产生一段语音,从而使得客户端获取待验证的语音信息。
S12:向所述服务端发送第二信息和所述标识信息,所述第二信息是所述用户账号信息和所述语音信息中的另一种。
其中,标识信息可以是服务端随机生成的,具体可以是信息摘要第五版(MessageDigest5,MD5)码。
客户端在接收到标识信息后,可以将标识信息与第二信息同步发送给服务端,服务端根据标识信息可以关联起第一信息和第二信息,进而可以根据关联的第一信息和第二信息进行注册或者验证。
本实施例中,通过将第一信息和第二信息分两次传输给服务端,可以避免第一信息和第二信息同步传输时引起的问题,可以提高基于声纹通讯的安全性。
图2是本发明另一实施例提出的基于声纹的通讯方法的流程示意图,本实施例的执行主体是服务端。本实施例的方法包括:
S21:接收客户端发送的第一信息,生成标识信息,并将所述标识信息发送给所述客户端,所述第一信息是用户账号信息和语音信息中的一种。
其中,标识信息可以是随机生成的,具体可以是MD5码。
根据应用场景的不同,语音信息也可以是不同的。例如,当在注册时,所述语音信息是作为训练样本的语音数据,所述训练样本用于声纹训练以得到声纹特征信息。或者,当在验证时,所述语音信息是待验证的语音数据。
S22:接收所述客户端发送的第二信息和所述标识信息,所述第二信息是所述用户账号信息和所述语音信息中的另一种。
通过标识信息,可以将第一信息和第二信息关联起来,从而可以根据关联的第一信息和第二信息进行注册或者验证。
本实施例中,通过接收客户端分两次传输的第一信息和第二信息,可以避免第一信息和第二信息同步传输时引起的问题,可以提高基于声纹通讯的安全性。
图3是本发明另一实施例提出的基于声纹的通讯方法的流程示意图,该方法以应用在注册流程中为例。本实施例中,以客户端包括移动端,服务端包括声纹训练服务器,缓存和验证服务端为例。参见图3,该方法包括:
S31:移动端向声纹训练服务器发送语音数据。
其中,移动端可以向用户展示提示文本,例如提示文本是多个数字,并提示用户朗诵这些数字,用户朗诵这些数字后,移动端可以获取到用户朗诵的语音数据,之后可以将这些数字对应的语音数据发送给声纹训练服务器。
S32:声纹训练服务器对该语音数据进行训练,得到声纹特征信息,以及,随机生成MD5码。
其中,声纹训练服务器接收到语音数据后,可以先判断接收的语音数据是否与提示文本一致,如果一致,再根据语音数据训练得到声纹特征信息。根据语音数据训练得到声纹特征信息的具体内容可以参见已有技术。
声纹训练服务器在得到声纹特征信息后,可以随机生成MD5码。
S33:声纹服务器将MD5码与声纹特征信息对应存储到缓存(cache)内。
S34:声纹服务器将MD5码发送给移动端。
S33和S34的时序关系不限定。
S35:移动端将MD5码和用户账号信息发送给验证服务器。
其中,在注册时,移动端可以向用户展示注册界面,用户在该注册界面内可以输入用户账号信息,从而移动端可以获取到用户账号信息。
S36:验证服务器验证MD5码的有效性,并在MD5码有效时,根据MD5码在缓存内查找到对应的声纹特征信息。
其中,验证服务器接收到MD5码后,可以先验证该MD5码的有效性,例如,验证服务器在缓存内查找,判断缓存内是否存在接收的MD5码,如果存在,则确定有效,否则确定无效。
当有效后,可以根据MD5码查找到对应的声纹特征信息。
S37:验证服务器将接收的用户账号信息与查找到的声纹特征信息对应存储,得到注册结果。
验证服务器将用户账号信息与声纹特征信息对应存储后,可以得到注册结果。例如,在将用户账号信息与声纹特征信息成功对应存储后,得到注册成功,否则注册失败。
S38:验证服务器向移动端发送注册结果,例如,注册成功或者注册失败。
可以理解的是,本实施例中的声纹训练服务器,缓存,验证服务器可以位于同一个物理设备内,或者位于不同的物理设备内。
本实施例中,当移动端向服务端进行注册时,将用户账号信息与用于注册的语音信息分开传输,可以避免同步传输导致的不安全问题,从而可以提高注册的安全性。另外,标识信息是随机生成的,可以进一步提高安全性。
图4是本发明另一实施例提出的基于声纹的通讯方法的流程示意图,该方法以应用在注册流程中为例。本实施例中,以客户端包括移动端,服务端包括声纹验证服务器,缓存和验证服务端为例。参见图4,该方法包括:
S41:移动端向声纹验证服务器发送语音数据。
其中,移动端可以向用户展示验证界面,用户可以点击该验证界面内的录音按钮后,录入待验证的语音数据,移动端获取到用户朗诵的语音数据后,将该待验证的语音数据发送给声纹验证服务器。其中,用户录入的待验证的语音数据可以是根据提示文本或者在没有提示的情况下朗诵的。
S42:声纹验证服务器接收到待验证的语音数据,随机生成MD5码。
其中,如果该语音数据是根据提示文本获取的,声纹验证服务器接收到语音数据后,可以先判断接收的语音数据是否与提示文本一致,如果一致,再生成MD5码。
S43:声纹服务器将MD5码与待验证的语音数据对应存储到缓存(cache)内。
S44:声纹服务器将MD5码发送给移动端。
S43和S44的时序关系不限定。
S45:移动端将MD5码和用户账号信息发送给验证服务器。
其中,在验证时,移动端可以向用户展示验证界面,用户在该验证界面内可以输入用户账号信息,从而移动端可以获取到用户账号信息。
S46:验证服务器验证MD5码的有效性,并在MD5码有效时,根据MD5码在缓存内查找到对应的待验证的语音数据。
其中,验证服务器接收到MD5码后,可以先验证该MD5码的有效性,例如,验证服务器在缓存内查找,判断缓存内是否存在接收的MD5码,如果存在,则确定有效,否则确定无效。
在MD5码有效后,可以查找到对应的待验证的语音数据。
S47:验证服务器根据接收的用户账号信息与查找到的待验证的语音数据,以及注册时得到的用户账号信息与声纹特征信息,得到验证结果。
当MD5码有效后,可以通过MD5码将用户账号信息与待验证的语音数据关联起来,之后,再根据接收的用户账号信息和注册时得到的用户账号信息与声纹特征信息的对应关系,可以查找到与接收的用户账号信息对应的声纹特征信息,之后再比对与接收的用户账号信息关联的待验证的语音数据和查找到的声纹特征信息,从而得到验证结果。例如,计算待验证的语音数据与声纹特征信息之间的相似度数值,当该相似度数值大于阈值时,确定验证成功,否则在验证失败。当然,可以理解的是,根据待验证的语音数据和声纹特征信息得到验证结果可以采用已有技术实现。
S47:验证服务器向移动端发送验证结果,例如,验证成功或者验证失败。
可以理解的是,本实施例中的声纹验证服务器,缓存,验证服务器可以位于同一个物理设备内,或者位于不同的物理设备内。
本实施例中,当移动端向服务端进行验证时,将用户账号信息与用于验证的语音信息分开传输,可以避免同步传输导致的不安全问题,从而可以提高验证的安全性。另外,标识信息是随机生成的,可以进一步提高安全性。
图5是本发明另一实施例提出的基于声纹的通讯装置的结构示意图,该装置位于客户端,例如,位于移动设备上。该装置50包括:
第一交互模块51,用于向服务端发送第一信息,并接收所述服务端发送的标识信息,所述标识信息是所述服务端接收到所述第一信息后生成的,所述第一信息是用户账号信息和语音信息中的一种;
本实施例中为了避免用户账号信息和语音信息同步传输时存在的问题,可以将用户账号信息和语音信息分两次进行传输,避免被同时抓包。
用户账号信息例如用户名,手机号,邮箱名等。
本实施例的方法可以应用在注册流程,或者,也可以应用在验证流程中,验证流程可以包括登录验证或者支付验证等。
根据应用场景的不同,语音信息也是不同的。例如,当在注册时,所述语音信息是作为训练样本的语音数据,所述训练样本用于声纹训练以得到声纹特征信息。或者,当在验证时,所述语音信息是待验证的语音数据。
具体的,在注册流程中,客户端可以向用户展示注册界面,用户可以在该注册界面上填写用户账号信息,并可以根据客户端的提示信息,朗诵相应的提示内容,从而使得客户端获取待注册的语音信息。
在验证流程中,客户端可以向用户展示验证界面,用户可以在该验证解密上填写用户账号信息,并根据提示或者自发产生一段语音,从而使得客户端获取待验证的语音信息。
第二交互模块52,用于向所述服务端发送第二信息和所述标识信息,所述第二信息是所述用户账号信息和所述语音信息中的另一种。
其中,标识信息可以是服务端随机生成的,具体可以是信息摘要第五版(MessageDigest5,MD5)码。
客户端在接收到标识信息后,可以将标识信息与第二信息同步发送给服务端,服务端根据标识信息可以关联起第一信息和第二信息,进而可以根据关联的第一信息和第二信息进行注册或者验证。
本实施例中,通过将第一信息和第二信息分两次传输给服务端,可以避免第一信息和第二信息同步传输时引起的问题,可以提高基于声纹通讯的安全性。
图6是本发明另一实施例提出的基于声纹的通讯装置的结构示意图,该装置位于服务端。该装置60包括:
第一交互模块61,用于接收客户端发送的第一信息,生成标识信息,并将所述标识信息发送给所述客户端,所述第一信息是用户账号信息和语音信息中的一种;
可选的,所述第一交互模块61用于生成标识信息,包括:
随机生成标识信息。
其中,标识信息可以是随机生成的,具体可以是MD5码。
根据应用场景的不同,语音信息也可以是不同的。例如,当在注册时,所述语音信息是作为训练样本的语音数据,所述训练样本用于声纹训练以得到声纹特征信息。或者,当在验证时,所述语音信息是待验证的语音数据。
第二交互模块62,用于接收所述客户端发送的第二信息和所述标识信息,所述第二信息是所述用户账号信息和所述语音信息中的另一种。
通过标识信息,可以将第一信息和第二信息关联起来,从而可以根据关联的第一信息和第二信息进行注册或者验证。
本实施例中,通过接收客户端分两次传输的第一信息和第二信息,可以避免第一信息和第二信息同步传输时引起的问题,可以提高基于声纹通讯的安全性。
另一实施例中,参见图7,所述第一信息是语音信息,所述第二信息是用户账号信息,当在注册时,所述语音信息是作为训练样本的语音数据,所述训练样本用于声纹训练以得到声纹特征信息,所述装置60还包括:
训练模块71,用于在接收到所述作为训练样本的语音数据后,对所述作为训练样本的语音数据进行训练,得到声纹特征信息;
其中,接收到语音数据后,可以先判断接收的语音数据是否与提示文本一致,如果一致,再根据语音数据训练得到声纹特征信息。根据语音数据训练得到声纹特征信息的具体内容可以参见已有技术。
标识信息可以是随机生成的MD5码。
存储模块72,用于将所述标识信息与所述声纹特征信息进行对应存储;
例如,存储模块具体是缓存。
注册模块73,用于在接收到所述用户账号信息和所述标识信息后,在预先存储的数据中查找到与接收的标识信息对应的声纹特征信息,并将接收的用户账号信息与查找到的声纹特征信息对应存储,得到注册结果。
接收到MD5码后,可以先验证该MD5码的有效性,例如,注册模块在缓存内查找,判断缓存内是否存在接收的MD5码,如果存在,则确定有效,否则确定无效。
当MD5码有效后,可以将用户账号信息与声纹特征信息对应存储,从而得到注册结果。例如,在将用户账号信息与声纹特征信息成功对应存储后,得到注册成功,否则注册失败。
本实施例中,当移动端向服务端进行注册时,将用户账号信息与用于注册的语音信息分开传输,可以避免同步传输导致的不安全问题,从而可以提高注册的安全性。另外,标识信息是随机生成的,可以进一步提高安全性。
另一实施例中,参见图8,所述第一信息是语音信息,所述第二信息是用户账号信息,当在验证时,所述语音信息是待验证的语音数据,所述装置60还包括:
存储模块81,用于在接收到所述待验证的语音数据以及生成所述标识信息后,将所述标识信息与所述待验证的语音数据进行对应存储;
存储模块例如为缓存。
验证模块82,用于在接收到所述用户账号信息和所述标识信息后,在预先存储的数据中查找到与接收的标识信息对应的待验证的语音数据,并根据接收的用户账号信息和查找到的待验证的语音数据,以及注册时得到的用户账号信息与声纹特征信息,得到验证结果。
其中,接收到MD5码后,可以先验证该MD5码的有效性,例如,验证模块在缓存内查找,判断缓存内是否存在接收的MD5码,如果存在,则确定有效,否则确定无效。
当MD5码有效后,可以通过MD5码将用户账号信息与待验证的语音数据关联起来,之后,再根据接收的用户账号信息和注册时得到的用户账号信息与声纹特征信息的对应关系,可以查找到与接收的用户账号信息对应的声纹特征信息,之后再比对与接收的用户账号信息关联的待验证的语音数据和查找到的声纹特征信息,从而得到验证结果。例如,计算待验证的语音数据与声纹特征信息之间的相似度数值,当该相似度数值大于阈值时,确定验证成功,否则在验证失败。当然,可以理解的是,根据待验证的语音数据和声纹特征信息得到验证结果可以采用已有技术实现
本实施例中,当移动端向服务端进行验证时,将用户账号信息与用于验证的语音信息分开传输,可以避免同步传输导致的不安全问题,从而可以提高验证的安全性。另外,标识信息是随机生成的,可以进一步提高安全性。
图9是本发明另一实施例提出的基于声纹的通讯系统的结构示意图,该系统90包括:
客户端设备91和服务端设备92。其中,客户端设备91可以参见图5,服务端设备92可以参见图6-图8。
本实施例中,移动端与服务端分两次传输用户账号信息和语音信息,可以将用户账号信息与用于验证的语音信息分开传输,可以避免同步传输导致的不安全问题,从而可以提高验证的安全性。另外,标识信息是随机生成的,可以进一步提高安全性。
需要说明的是,在本发明的描述中,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本发明的描述中,除非另有说明,“多个”的含义是指至少两个。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (12)

1.一种基于声纹的通讯方法,其特征在于,包括:
向服务端发送第一信息,并接收所述服务端发送的标识信息,所述标识信息是所述服务端接收到所述第一信息后生成的,所述第一信息是用户账号信息和语音信息中的一种;
向所述服务端发送第二信息和所述标识信息,所述第二信息是所述用户账号信息和所述语音信息中的另一种;
所述第一信息是语音信息,所述第二信息是用户账号信息。
2.根据权利要求1所述的方法,其特征在于,所述标识信息是随机生成的。
3.一种基于声纹的通讯方法,其特征在于,包括:
接收客户端发送的第一信息,生成标识信息,并将所述标识信息发送给所述客户端,所述第一信息是用户账号信息和语音信息中的一种;
接收所述客户端发送的第二信息和所述标识信息,所述第二信息是所述用户账号信息和所述语音信息中的另一种;
所述第一信息是语音信息,所述第二信息是用户账号信息。
4.根据权利要求3所述的方法,其特征在于,当在注册时,所述语音信息是作为训练样本的语音数据,所述训练样本用于声纹训练以得到声纹特征信息,所述方法还包括:
在接收到所述作为训练样本的语音数据后,对所述作为训练样本的语音数据进行训练,得到声纹特征信息;
将所述标识信息与所述声纹特征信息进行对应存储;
在接收到所述用户账号信息和所述标识信息后,在预先存储的数据中查找到与接收的标识信息对应的声纹特征信息,并将接收的用户账号信息与查找到的声纹特征信息对应存储,得到注册结果。
5.根据权利要求3所述的方法,其特征在于,当在验证时,所述语音信息是待验证的语音数据,所述方法还包括:
在接收到所述待验证的语音数据以及生成所述标识信息后,将所述标识信息与所述待验证的语音数据进行对应存储;
在接收到所述用户账号信息和所述标识信息后,在预先存储的数据中查找到与接收的标识信息对应的待验证的语音数据,并根据接收的用户账号信息和查找到的待验证的语音数据,以及注册时得到的用户账号信息与声纹特征信息,得到验证结果。
6.根据权利要求3-5任一项所述的方法,其特征在于,所述生成标识信息,包括:
随机生成标识信息。
7.一种基于声纹的通讯装置,其特征在于,包括:
第一交互模块,用于向服务端发送第一信息,并接收所述服务端发送的标识信息,所述标识信息是所述服务端接收到所述第一信息后生成的,所述第一信息是用户账号信息和语音信息中的一种;
第二交互模块,用于向所述服务端发送第二信息和所述标识信息,所述第二信息是所述用户账号信息和所述语音信息中的另一种;
所述第一信息是语音信息,所述第二信息是用户账号信息。
8.一种基于声纹的通讯装置,其特征在于,包括:
第一交互模块,用于接收客户端发送的第一信息,生成标识信息,并将所述标识信息发送给所述客户端,所述第一信息是用户账号信息和语音信息中的一种;
第二交互模块,用于接收所述客户端发送的第二信息和所述标识信息,所述第二信息是所述用户账号信息和所述语音信息中的另一种;
所述第一信息是语音信息,所述第二信息是用户账号信息。
9.根据权利要求8所述的装置,其特征在于,当在注册时,所述语音信息是作为训练样本的语音数据,所述训练样本用于声纹训练以得到声纹特征信息,所述装置还包括:
训练模块,用于在接收到所述作为训练样本的语音数据后,对所述作为训练样本的语音数据进行训练,得到声纹特征信息;
存储模块,用于将所述标识信息与所述声纹特征信息进行对应存储;
注册模块,用于在接收到所述用户账号信息和所述标识信息后,在预先存储的数据中查找到与接收的标识信息对应的声纹特征信息,并将接收的用户账号信息与查找到的声纹特征信息对应存储,得到注册结果。
10.根据权利要求8所述的装置,其特征在于,当在验证时,所述语音信息是待验证的语音数据,所述装置还包括:
存储模块,用于在接收到所述待验证的语音数据以及生成所述标识信息后,将所述标识信息与所述待验证的语音数据进行对应存储;
验证模块,用于在接收到所述用户账号信息和所述标识信息后,在预先存储的数据中查找到与接收的标识信息对应的待验证的语音数据,并根据接收的用户账号信息和查找到的待验证的语音数据,以及注册时得到的用户账号信息与声纹特征信息,得到验证结果。
11.根据权利要求8-10任一项所述的装置,其特征在于,所述第一交互模块用于生成标识信息,包括:
随机生成标识信息。
12.一种基于声纹的通讯系统,其特征在于,包括:
如权利要求7所述的装置;以及,
如权利要求8-11任一项所述的装置。
CN201510372778.XA 2015-06-30 2015-06-30 基于声纹的通讯方法、装置和系统 Active CN104967622B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201510372778.XA CN104967622B (zh) 2015-06-30 2015-06-30 基于声纹的通讯方法、装置和系统
JP2015231335A JP2017017669A (ja) 2015-06-30 2015-11-27 声紋による通信方法、装置及びシステム
US14/962,711 US9865267B2 (en) 2015-06-30 2015-12-08 Communication method, apparatus and system based on voiceprint
KR1020150187473A KR101769689B1 (ko) 2015-06-30 2015-12-28 성문 기반 통신 방법, 장치, 및 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510372778.XA CN104967622B (zh) 2015-06-30 2015-06-30 基于声纹的通讯方法、装置和系统

Publications (2)

Publication Number Publication Date
CN104967622A CN104967622A (zh) 2015-10-07
CN104967622B true CN104967622B (zh) 2017-04-05

Family

ID=54221564

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510372778.XA Active CN104967622B (zh) 2015-06-30 2015-06-30 基于声纹的通讯方法、装置和系统

Country Status (4)

Country Link
US (1) US9865267B2 (zh)
JP (1) JP2017017669A (zh)
KR (1) KR101769689B1 (zh)
CN (1) CN104967622B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10356091B2 (en) * 2015-07-14 2019-07-16 Ujet, Inc. Communication enhancement methods
CN106710593B (zh) * 2015-11-17 2020-07-14 腾讯科技(深圳)有限公司 一种添加账号的方法、终端、服务器
US10701206B2 (en) 2016-07-01 2020-06-30 Genesys Telecommunications Laboratories, Inc. System and method for contact center communications
US10382475B2 (en) * 2016-07-01 2019-08-13 Genesys Telecommunications Laboratories, Inc. System and method for preventing attacks in communications
CN107492379B (zh) 2017-06-30 2021-09-21 百度在线网络技术(北京)有限公司 一种声纹创建与注册方法及装置
WO2019104698A1 (zh) * 2017-11-30 2019-06-06 腾讯科技(深圳)有限公司 信息处理方法及装置、多媒体设备及存储介质
CN107911483A (zh) * 2017-12-12 2018-04-13 阿里巴巴集团控股有限公司 一种信息传输方法和装置
CN109510844B (zh) * 2019-01-16 2022-02-25 中民乡邻投资控股有限公司 一种基于声纹的对话交流式的账号注册方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101685635A (zh) * 2008-09-23 2010-03-31 吕共欣 身份验证系统及方法
CN102869008A (zh) * 2011-07-07 2013-01-09 上海先先信息科技有限公司 一种应用声纹验证作为移动应用安全密码的技术
US8620666B1 (en) * 2009-08-07 2013-12-31 West Corporation System, method, and computer-readable medium that facilitate voice biometrics user authentication
CN103986725A (zh) * 2014-05-29 2014-08-13 中国农业银行股份有限公司 一种客户端、服务器端以及身份认证系统和方法

Family Cites Families (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5953700A (en) * 1997-06-11 1999-09-14 International Business Machines Corporation Portable acoustic interface for remote access to automatic speech/speaker recognition server
US20010039619A1 (en) * 2000-02-03 2001-11-08 Martine Lapere Speaker verification interface for secure transactions
US7054819B1 (en) * 2000-02-11 2006-05-30 Microsoft Corporation Voice print access to computer resources
JP4689788B2 (ja) * 2000-03-02 2011-05-25 株式会社アニモ 電子認証システム、電子認証方法及び記録媒体
JP3603756B2 (ja) * 2000-06-30 2004-12-22 日本電気株式会社 音声署名商取引システム及び方法
KR100374029B1 (ko) * 2000-11-20 2003-02-26 삼성전자주식회사 이동무선 단말기의 음성인식기능을 이용한 사용자 인증 방법
US6973426B1 (en) * 2000-12-29 2005-12-06 Cisco Technology, Inc. Method and apparatus for performing speaker verification based on speaker independent recognition of commands
US20020091937A1 (en) * 2001-01-10 2002-07-11 Ortiz Luis M. Random biometric authentication methods and systems
US20020194003A1 (en) * 2001-06-05 2002-12-19 Mozer Todd F. Client-server security system and method
US7174323B1 (en) * 2001-06-22 2007-02-06 Mci, Llc System and method for multi-modal authentication using speaker verification
US6898568B2 (en) * 2001-07-13 2005-05-24 Innomedia Pte Ltd Speaker verification utilizing compressed audio formants
JP2003044445A (ja) * 2001-08-02 2003-02-14 Matsushita Graphic Communication Systems Inc 認証システム、サービス提供サーバ装置および音声認証装置並びに認証方法
US20030037004A1 (en) * 2001-08-14 2003-02-20 Chuck Buffum Dialog-based voiceprint security for business transactions
JP2004013274A (ja) * 2002-06-04 2004-01-15 Ntt Comware Corp ユーザ認証システム、ユーザ認証方法、ユーザ認証プログラムおよび記録媒体
FR2842643B1 (fr) * 2002-07-22 2004-09-03 France Telecom Normalisation de score de verification dans un dispositif de reconnaissance vocale de locuteur
US8666747B2 (en) * 2002-10-31 2014-03-04 Verizon Business Global Llc Providing information regarding interactive voice response sessions
WO2005091128A1 (ja) * 2004-03-18 2005-09-29 Nec Corporation 音声処理装置とシステム及び音声処理方法
US8725514B2 (en) * 2005-02-22 2014-05-13 Nuance Communications, Inc. Verifying a user using speaker verification and a multimodal web-based interface
WO2006126216A1 (en) * 2005-05-24 2006-11-30 Loquendo S.P.A. Automatic text-independent, language-independent speaker voice-print creation and speaker recognition
US7536304B2 (en) * 2005-05-27 2009-05-19 Porticus, Inc. Method and system for bio-metric voice print authentication
US8396711B2 (en) * 2006-05-01 2013-03-12 Microsoft Corporation Voice authentication system and method
US7992196B2 (en) * 2006-11-06 2011-08-02 Voice Identity, Inc. Apparatus and method for performing hosted and secure identity authentication using biometric voice verification over a digital network medium
JP4867760B2 (ja) * 2007-03-30 2012-02-01 ソニー株式会社 情報処理装置および方法、並びに情報処理システム
JP2009123020A (ja) 2007-11-15 2009-06-04 Canon Inc 情報処理装置、情報処理方法、プログラム及び記憶媒体
US8863262B2 (en) * 2008-08-20 2014-10-14 Yellowpages.Com Llc Systems and methods to provide information and services to authorized users
US8332223B2 (en) * 2008-10-24 2012-12-11 Nuance Communications, Inc. Speaker verification methods and apparatus
US20100306176A1 (en) 2009-01-28 2010-12-02 Digitiliti, Inc. Deduplication of files
KR101566196B1 (ko) 2009-03-02 2015-11-05 삼성전자주식회사 히스토그램 분석을 이용한 영상 분류 방법 및 장치, 이를 이용한 문자 인식 방법 및 장치
JP5697330B2 (ja) * 2009-12-25 2015-04-08 ヤフー株式会社 複数要素認証を実施する認証サーバ及びその方法
US9553727B2 (en) * 2010-01-21 2017-01-24 Omid Ebrahimi Kia Secure and mobile biometric authentication for electronic health record management
FR2964812B1 (fr) * 2010-09-09 2013-04-12 Mobilegov France Procede d'authentification pour l'acces a un site web
JP2012079231A (ja) * 2010-10-05 2012-04-19 Hitachi Ltd 認証情報管理装置および認証情報管理方法
US9318114B2 (en) * 2010-11-24 2016-04-19 At&T Intellectual Property I, L.P. System and method for generating challenge utterances for speaker verification
GB2489527B (en) * 2011-04-01 2014-01-01 Voicevault Ltd Voice verification system
US8897500B2 (en) * 2011-05-05 2014-11-25 At&T Intellectual Property I, L.P. System and method for dynamic facial features for speaker recognition
US20130006626A1 (en) * 2011-06-29 2013-01-03 International Business Machines Corporation Voice-based telecommunication login
US9323912B2 (en) * 2012-02-28 2016-04-26 Verizon Patent And Licensing Inc. Method and system for multi-factor biometric authentication
JP2014016726A (ja) * 2012-07-06 2014-01-30 Keyware Solutions Inc 認証装置、認証方法、扉開閉管理装置及びコンピュータプログラム
CN102760434A (zh) * 2012-07-09 2012-10-31 华为终端有限公司 一种声纹特征模型更新方法及终端
US9172699B1 (en) * 2012-11-30 2015-10-27 Microstrategy Incorporated Associating a device with a user account
US8694315B1 (en) * 2013-02-05 2014-04-08 Visa International Service Association System and method for authentication using speaker verification techniques and fraud model
US20140359736A1 (en) * 2013-05-31 2014-12-04 Deviceauthority, Inc. Dynamic voiceprint authentication
CN103679452A (zh) * 2013-06-20 2014-03-26 腾讯科技(深圳)有限公司 支付验证方法、装置及系统
JP2015099470A (ja) * 2013-11-19 2015-05-28 日本電信電話株式会社 認証システム、方法、サーバ及びプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101685635A (zh) * 2008-09-23 2010-03-31 吕共欣 身份验证系统及方法
US8620666B1 (en) * 2009-08-07 2013-12-31 West Corporation System, method, and computer-readable medium that facilitate voice biometrics user authentication
CN102869008A (zh) * 2011-07-07 2013-01-09 上海先先信息科技有限公司 一种应用声纹验证作为移动应用安全密码的技术
CN103986725A (zh) * 2014-05-29 2014-08-13 中国农业银行股份有限公司 一种客户端、服务器端以及身份认证系统和方法

Also Published As

Publication number Publication date
KR101769689B1 (ko) 2017-08-18
KR20170003366A (ko) 2017-01-09
US20170004832A1 (en) 2017-01-05
JP2017017669A (ja) 2017-01-19
CN104967622A (zh) 2015-10-07
US9865267B2 (en) 2018-01-09

Similar Documents

Publication Publication Date Title
CN104967622B (zh) 基于声纹的通讯方法、装置和系统
CN106658493A (zh) 密钥管理方法、装置和系统
CN106209763B (zh) 一种登录方法及系统
CN107864115B (zh) 一种利用便携式终端进行用户账号登录验证的方法
CN105025041B (zh) 文件上传的方法、装置和系统
CN105306473B (zh) 一种防止注入攻击的方法、客户端、服务器和系统
CN105574398B (zh) 一种验证码验证方法及装置
CN106789851A (zh) 身份验证方法、系统、业务服务器和验证服务器
CN105184567B (zh) 信息的处理方法、处理装置和移动终端
CN106330838B (zh) 一种动态签名方法及应用该方法的客户端和服务器
CN103986720A (zh) 一种登录方法及装置
CN103997681B (zh) 对视频直播进行防盗链处理的方法及其系统
CN105357190A (zh) 访问请求鉴权的方法及系统
CN103763104B (zh) 一种动态验证的方法及系统
CN104079409A (zh) 账号的登录方法及装置
CN107094261A (zh) 视频播放的权限校验方法及装置
US20140068780A1 (en) Apparatus and method for remotely deleting critical information
CN108076056A (zh) 云服务器登录方法及装置
CN108322416A (zh) 一种安全认证实现方法、装置及系统
CN102802150B (zh) 手机号码验证方法、系统以及终端
CN104935548B (zh) 基于智能纹身设备的身份验证方法、装置及系统
CN106549957A (zh) 一种终端应用正版的认证方法及系统
CN107995200B (zh) 一种基于智能卡的证书签发方法、身份认证方法以及系统
CN104901808A (zh) 基于时间型动态口令的声纹认证系统及方法
CN106503527A (zh) 一种电子文档指纹签名的方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant