CN109462603A - 基于盲检测的声纹认证方法、设备、存储介质及装置 - Google Patents
基于盲检测的声纹认证方法、设备、存储介质及装置 Download PDFInfo
- Publication number
- CN109462603A CN109462603A CN201811539992.XA CN201811539992A CN109462603A CN 109462603 A CN109462603 A CN 109462603A CN 201811539992 A CN201811539992 A CN 201811539992A CN 109462603 A CN109462603 A CN 109462603A
- Authority
- CN
- China
- Prior art keywords
- active user
- user
- information
- target
- vocal print
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/08—Network architectures or network communication protocols for network security for authentication of entities
- H04L63/0861—Network architectures or network communication protocols for network security for authentication of entities using biometrical features, e.g. fingerprint, retina-scan
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q20/00—Payment architectures, schemes or protocols
- G06Q20/38—Payment protocols; Details thereof
- G06Q20/40—Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
- G06Q20/401—Transaction verification
- G06Q20/4014—Identity check for transactions
- G06Q20/40145—Biometric identity checks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification
- G10L17/02—Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification
- G10L17/06—Decision making techniques; Pattern matching strategies
Abstract
本发明公开了一种基于盲检测的声纹认证方法、设备、存储介质及装置,该方法包括:获取当前用户输入的目标用户信息及对应的目标声纹特征信息;通过语音提示当前用户进行业务操作,并监测当前用户是否说话;当监测到当前用户说话时,采集当前用户的当前音频,并从当前音频中提取当前声纹特征信息;将当前声纹特征信息与目标声纹特征信息进行相似度对比,根据对比结果验证当前用户的身份。基于声纹识别,在业务操作过程中通过语音对用户进行提示,营造沟通氛围以使用户下意识地说话,从而完成声纹认证,认证过程无感知,避免了人像侵犯造成用户反感,提高了用户体验,仅在用户进行业务操作的过程中即可完成身份认证,无需花费额外时间,认证效率高。
Description
技术领域
本发明涉及声纹识别技术领域,尤其涉及一种基于盲检测的声纹认证方法、设备、存储介质及装置。
背景技术
身份认证是指计算机及网络系统确认用户身份的过程,一般采取人脸识别、线下签字或者声纹识别等方式验证用户是否为本人,广泛用于在线申请贷款、在线签订合同以及钱款支付等场合。
然而,现有的身份认证方式往往操作流程复杂,审核周期长,认证效率低下,并且认证过程中,用户已知当前正在进行身份认证,容易造成用户反感,例如,通过人脸识别进行身份认证时,需要对用户进行拍照,使用户感觉遭受到人像侵犯,因此,需要一种认证效率高、无感知的身份认证方法。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供一种基于盲检测的声纹认证方法、设备、存储介质及装置,旨在解决现有技术中如何提高身份认证的效率和无感知性的技术问题。
为实现上述目的,本发明提供一种基于盲检测的声纹认证方法,所述基于盲检测的声纹认证方法包括以下步骤:
获取当前用户输入的目标用户信息,根据所述目标用户信息获取对应的目标声纹特征信息;
通过语音提示所述当前用户进行业务操作,并在所述当前用户进行业务操作的过程中,监测所述当前用户是否说话;
当监测到所述当前用户说话时,采集所述当前用户的当前音频,并从所述当前音频中提取所述当前用户的当前声纹特征信息;
将所述当前声纹特征信息与所述目标声纹特征信息进行相似度对比,获得相似度评分;
将所述相似度评分与预设分值进行对比,若所述相似度评分大于所述预设分值,则判定所述当前用户认证通过。
优选地,所述通过语音提示所述当前用户进行业务操作,并在所述当前用户进行业务操作的过程中,监测所述当前用户是否说话,包括:
提供若干声音类型供所述当前用户选择,并根据所述当前用户选择的声音类型获取对应类型的仿真语音;
通过所述仿真语音提示所述当前用户进行业务操作;
在所述当前用户进行业务操作的过程中,监测所述当前用户是否说话。
优选地,所述业务操作包括选择业务对象;
所述通过所述仿真语音提示所述当前用户进行业务操作,包括:
展示若干业务对象,通过所述仿真语音提示所述当前用户在所述业务对象中进行选择,并通过预设语句询问所述当前用户的选择结果。
优选地,所述获取当前用户输入的目标用户信息,根据所述目标用户信息获取对应的目标声纹特征信息,包括:
获取当前用户输入的目标用户信息,将所述目标用户信息输入至预设声纹模型中,以获得所述预设声纹模型输出的目标声纹特征信息。
优选地,所述获取当前用户输入的目标用户信息之前,所述基于盲检测的声纹认证方法还包括:
采集样本用户信息和所述样本用户信息对应的样本音频;
从所述样本音频中提取样本声纹特征信息,建立样本用户信息和样本声纹特征信息之间的映射关系;
建立基础声纹模型,根据所述映射关系对所述基础声纹模型进行训练,生成预设声纹模型。
优选地,所述在所述当前用户进行业务操作的过程中,监测所述当前用户是否说话之后,所述基于盲检测的声纹认证方法还包括:
当未监测到所述当前用户说话时,提示所述当前用户阅读预设文本;
采集所述当前用户的阅读音频,并基于所述阅读音频对所述当前用户进行声纹认证。
优选地,所述获取当前用户输入的目标用户信息,根据所述目标用户信息获取对应的目标声纹特征信息,包括:
获取当前业务场景以及当前用户输入的目标用户信息;
根据所述目标用户信息获取对应的目标音频库,从所述目标音频库中选取与所述当前业务场景对应的目标音频;
查找与所述目标音频对应的目标声纹特征信息。
此外,为实现上述目的,本发明还提出一种基于盲检测的声纹认证设备,所述基于盲检测的声纹认证设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于盲检测的声纹认证程序,所述基于盲检测的声纹认证程序配置为实现如上文所述的基于盲检测的声纹认证方法的步骤。
此外,为实现上述目的,本发明还提出一种存储介质,所述存储介质上存储有基于盲检测的声纹认证程序,所述基于盲检测的声纹认证程序被处理器执行时实现如上文所述的基于盲检测的声纹认证方法的步骤。
此外,为实现上述目的,本发明还提出一种基于盲检测的声纹认证装置,所述基于盲检测的声纹认证装置包括:
获取模块,用于获取当前用户输入的目标用户信息,根据所述目标用户信息获取对应的目标声纹特征信息;
提示模块,用于通过语音提示所述当前用户进行业务操作,并在所述当前用户进行业务操作的过程中,监测所述当前用户是否说话;
提取模块,用于当监测到所述当前用户说话时,采集所述当前用户的当前音频,并从所述当前音频中提取所述当前用户的当前声纹特征信息;
对比模块,用于将所述当前声纹特征信息与所述目标声纹特征信息进行相似度对比,获得相似度评分;
识别模块,用于将所述相似度评分与预设分值进行对比,若所述相似度评分大于所述预设分值,则判定所述当前用户认证通过。
本发明中,通过获取当前用户输入的目标用户信息,根据所述目标用户信息获取对应的目标声纹特征信息;通过语音提示所述当前用户进行业务操作,并在所述当前用户进行业务操作的过程中,监测所述当前用户是否说话;当监测到所述当前用户说话时,采集所述当前用户的当前音频,并从所述当前音频中提取所述当前用户的当前声纹特征信息;将所述当前声纹特征信息与所述目标声纹特征信息进行相似度对比,获得相似度评分;将所述相似度评分与预设分值进行对比,若所述相似度评分大于所述预设分值,则判定所述当前用户认证通过。由于通过语音对用户进行提示,使用户感觉与客服人员在进行对话,从而下意识地说话,在用户说话时采集用户的音频进行声纹识别,可确认用户身份,整个身份认证过程在用户不知情的状态下完成,无感知性强,安全性高,避免了人像侵犯造成用户反感,提高了用户体验。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的基于盲检测的声纹认证设备结构示意图;
图2为本发明基于盲检测的声纹认证方法第一实施例的流程示意图;
图3为本发明基于盲检测的声纹认证方法第二实施例的流程示意图;
图4为本发明基于盲检测的声纹认证方法第三实施例的流程示意图;
图5为本发明基于盲检测的声纹认证方法第四实施例的流程示意图;
图6为本发明基于盲检测的声纹认证装置第一实施例的结构框图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
参照图1,图1为本发明实施例方案涉及的硬件运行环境的基于盲检测的声纹认证设备结构示意图。
如图1所示,该基于盲检测的声纹认证设备可以包括:处理器1001,例如中央处理器(Central Processing Unit,CPU),通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display),可选用户接口1003还可以包括标准的有线接口、无线接口,对于用户接口1003的有线接口在本发明中可为USB接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真(WIreless-FIdelity,WI-FI)接口)。存储器1005可以是高速的随机存取存储器(Random Access Memory,RAM)存储器,也可以是稳定的存储器(Non-volatileMemory,NVM),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的结构并不构成对基于盲检测的声纹认证设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及基于盲检测的声纹认证程序。
在图1所示的基于盲检测的声纹认证设备中,网络接口1004主要用于连接后台服务器,与所述后台服务器进行数据通信;用户接口1003主要用于连接外设,与所述外设进行数据通信;所述基于盲检测的声纹认证设备通过处理器1001调用存储器1005中存储的基于盲检测的声纹认证程序,并执行本发明实施例提供的基于盲检测的声纹认证方法。
基于上述硬件结构,提出本发明基于盲检测的声纹认证方法的实施例。
参照图2,图2为本发明基于盲检测的声纹认证方法第一实施例的流程示意图,提出本发明基于盲检测的声纹认证方法第一实施例。
在第一实施例中,所述基于盲检测的声纹认证方法包括以下步骤:
步骤S10:获取当前用户输入的目标用户信息,根据所述目标用户信息获取对应的目标声纹特征信息。
需要说明的是,本实施例的执行主体是基于盲检测的声纹认证设备,所述基于盲检测的声纹认证设备可为个人电脑或服务器等电子基于盲检测的声纹认证设备,本实施例的应用场景是,当前用户在各种业务场景下进行业务操作时,所述业务场景为在线申请贷款、在线签订合同以及钱款支付等需要身份验证的场景,所述基于盲检测的声纹认证设备通过语音试图与当前用户建立沟通,以使当前用户下意识地说话,即可采集到当前用户的当前音频,从而根据该当前音频对当前用户进行声纹认证,确认当前用户的身份。
可以理解的是,每个用户均对应有一个用户信息,用户信息是用户的唯一身份账号信息,一般包括身份证号、身份标识或其它身份信息,当前用户对应有当前用户信息,目标用户对应有目标用户信息,在本实施例中,当前用户输入目标用户信息,若所述当前用户输入的目标用户信息与所述当前用户对应的当前用户信息一致,则认定所述当前用户是真实的目标用户;若所述目标用户信息与所述当前用户信息不一致,则认定所述当前用户是盗用目标用户信息的伪冒用户;从而可通过判断所述目标用户信息与所述当前用户信息是否一致来确认所述当前用户的身份。
在具体实现中,为了判断所述目标用户信息与所述当前用户信息是否一致,将获取所述目标用户信息对应的目标声纹特征信息和所述当前用户信息对应的当前声纹特征信息,通过判断目标声纹特征信息与当前声纹特征信息是否一致来判断所述目标用户信息与所述当前用户信息是否一致。
步骤S20:通过语音提示所述当前用户进行业务操作,并在所述当前用户进行业务操作的过程中,监测所述当前用户是否说话。
需要说明的是,为了提高身份认证过程的无感知性,将通过某种方式使所述当前用户下意识地说话,从而采集所述当前用户的音频进行声纹识别,以确认所述当前用户的身份。本实施例中将通过语音提示所述当前用户进行业务操作,以所述业务场景为在线贷款为例,通过语音对所述当前用户进行提示,以使所述当前用户选择贷款类型、贷款金额等业务数据,在提示过程中,使所述当前用户感觉与客服人员在进行对话,从而下意识地说出选择的贷款类型、贷款金额或者重复语音的内容。
在具体实现中,所述当前用户在使用所述基于盲检测的声纹认证设备办理业务的过程中,所述基于盲检测的声纹认证设备还将展示业务流程,例如,在通过语音提示所述当前用户选择贷款金额时,所述基于盲检测的声纹认证设备的显示屏上将展示若干金额,以供所述当前用户选择,或者提供当前用户输入任意金额的输入框,因此,所述当前用户会在所述显示屏上选择相应的贷款金额,也可能在所述显示屏上选择相应的贷款金额,同时可能会下意识地说出金额,所以,所述当前用户有一定的概率会说话,而为了在所述当前用户说话时采集音频,将实时监测所述当前用户是否说话。
步骤S30:当监测到所述当前用户说话时,采集所述当前用户的当前音频,并从所述当前音频中提取所述当前用户的当前声纹特征信息。
可以理解的是,在整个业务操作过程中,若监测到所述当前用户说话,则及时采集所述当前用户的音频,并从所述当前音频中提取所述当前用户的当前声纹特征信息,所述当前声纹特征信息为所述当前用户本人的声纹特征信息,以供后续根据该当前声纹特征信息识别所述当前用户是否为所述目标用户信息对应的真实当前用户。
步骤S40:将所述当前声纹特征信息与所述目标声纹特征信息进行相似度对比,获得相似度评分。
需要说明的是,为了判断所述当前声纹特征信息与所述目标声纹特征信息是否一致,将对所述当前声纹特征信息与所述目标声纹特征信息进行相似度对比,以获得相似度评分。
步骤S50:将所述相似度评分与预设分值进行对比,若所述相似度评分大于所述预设分值,则判定所述当前用户认证通过。
可以理解的是,将所述相似度评分与预设分值进行对比,并根据对比结果确认当前用户的身份;若所述相似度评分大于所述预设分值,则说明所述当前声纹特征信息与所述目标声纹特征信息相似度很高,可认为所述当前声纹特征信息与所述目标声纹特征信息一致,从而判定所述当前用户认证通过。
在第一实施例中,通过语音对用户进行提示,使用户感觉与客服人员在进行对话,从而下意识地说话,在用户说话时采集用户的音频进行声纹识别,可确认用户身份,整个身份认证过程无需花费额外时间,仅在用户进行业务操作的过程中即可完成身份认证,认证效率高,并且在用户不知情的状态下完成,无感知性强,安全性高,避免了人像侵犯造成用户反感,提高了用户体验。
参照图3,图3为本发明基于盲检测的声纹认证方法第二实施例的流程示意图,基于上述图2所示的第一实施例,提出本发明基于盲检测的声纹认证方法的第二实施例。
在第二实施例中,所述步骤S20,具体包括:
步骤S201:提供若干声音类型供所述当前用户选择,并根据所述当前用户选择的声音类型获取对应类型的仿真语音。
需要说明的是,为了提高所述当前用户下意识说话的概率,本实施例将采用所述当前用户感兴趣的仿真语音对所述当前用户进行业务操作的提示,并通过提供多种声音类型供所述当前用户选择,以确定所述当前用户感兴趣的仿真语音。
在具体实现中,所述声音类型包括但不限于:男声、女声、萝莉声以及搞怪声等,提供并展示该多种声音类型供所述当前用户选择,获取所述当前用户选择的声音类型,并根据所述当前用户选择的声音类型获取对应类型的仿真语音。由于仿真语音与真人的声音极为相似,因而,可最大限度地模拟当前用户与真人对话的场景,以使所述当前用户下意识地说话。
步骤S202:通过所述仿真语音提示所述当前用户进行业务操作。
可以理解的是,为了提高身份认证过程的无感知性,将通过所述仿真语音营造对话沟通氛围,使所述当前用户下意识地说话,从而采集所述当前用户的音频进行声纹识别,以确认所述当前用户的身份。本实施例中将通过仿真语音提示所述当前用户进行业务操作,以所述业务场景为在线贷款为例,通过仿真语音对所述当前用户进行提示,以使所述当前用户选择贷款类型、贷款金额等业务数据,在提示过程中,使所述当前用户感觉与客服人员在进行对话,从而下意识地说出选择的贷款类型、贷款金额或者重复语音的内容。
进一步地,所述业务操作包括选择业务对象;
所述步骤S202,包括:
展示若干业务对象,通过所述仿真语音提示所述当前用户在所述业务对象中进行选择,并通过预设语句询问所述当前用户的选择结果。
需要说明的是,所述业务对象为业务操作过程中所述显示屏上的待选项,当展示有若干业务对象时,将通过所述仿真语音提示所述当前用户在所述业务对象中选择用户的期望对象,并通过预设语句询问所述当前用户的选择结果,基于有问有答的惯性思维,所述当前用户可能会下意识进行回答。例如,在通过仿真语音提示所述当前用户选择贷款金额时,所述基于盲检测的声纹认证设备的显示屏上将展示诸如贷款1万、贷款5万或贷款10万等业务对象,以供所述当前用户选择,所述当前用户在所述显示屏上选择相应的贷款金额的过程中,可能会说出具体的贷款金额,所述当前用户在所述显示屏上选择相应的贷款金额后,通过预设语句询问所述当前用户的选择结果,所述当前用户可能会下意识地回答所选择的贷款金额,从而进一步提高所述当前用户说话的概率。
步骤S203:在所述当前用户进行业务操作的过程中,监测所述当前用户是否说话。
可以理解的是,为了在所述当前用户说话时采集音频,将实时监测所述当前用户是否说话。
在第二实施例中,通过提供若干声音类型供所述当前用户选择,并根据所述当前用户选择的声音类型获取对应类型的仿真语音;通过所述仿真语音提示所述当前用户进行业务操作;在所述当前用户进行业务操作的过程中,监测所述当前用户是否说话。由于通过当前用户感兴趣的声音类型对当前用户进行操作提示,提高所述当前用户下意识说话的概率。
参照图4,图4为本发明基于盲检测的声纹认证方法第三实施例的流程示意图,基于上述图3所示的第二实施例,提出本发明基于盲检测的声纹认证方法的第三实施例。
在第三实施例中,所述步骤S10,具体包括:
步骤S101:获取当前用户输入的目标用户信息,将所述目标用户信息输入至预设声纹模型中,以获得所述预设声纹模型输出的目标声纹特征信息。
需要说明的是,所述预设声纹模型中存储有声纹特征信息与用户信息之间的映射关系,能够查找用户信息对应的声纹特征信息,也能够根据声纹特征信息查找对应的用户信息,因此,将所述目标用户信息输入至所述预设声纹模型中,所述预设声纹模型将输出对应的目标声纹特征信息。
在具体实现中,为了判断所述目标用户信息与所述当前用户信息是否一致,将获取所述目标用户信息对应的目标声纹特征信息和所述当前用户信息对应的当前声纹特征信息,通过判断目标声纹特征信息与当前声纹特征信息是否一致来判断所述目标用户信息与所述当前用户信息是否一致,因此,将通过所述预设声纹模型获取所述目标声纹特征信息。
进一步地,所述步骤S101之前,所述基于盲检测的声纹认证方法还包括:
采集样本用户信息和所述样本用户信息对应的样本音频;
从所述样本音频中提取样本声纹特征信息,建立样本用户信息和样本声纹特征信息之间的映射关系;
建立基础声纹模型,根据所述映射关系对所述基础声纹模型进行训练,生成预设声纹模型。
可以理解的是,在通过所述预设声纹模型进行声纹识别之前,将构造所述预设声纹模型,首先采集大量样本,该样本包含样本用户信息和所述样本用户信息对应的样本音频,例如样本人员的身份证号和该样本人员的一段音频,从所述样本音频中提取样本声纹特征信息,建立样本用户信息和样本声纹特征信息之间的映射关系,根据样本用户信息和样本声纹特征信息之间的映射关系生成预设声纹模型。
进一步地,所述步骤S20之后,所述基于盲检测的声纹认证方法还包括:
当未监测到所述当前用户说话时,提示所述当前用户阅读预设文本;
采集所述当前用户的阅读音频,并基于所述阅读音频对所述当前用户进行声纹认证。
需要说明的是,若在整个业务操作过程中,均未监测到所述当前用户说话,说明所述当前用户未曾下意识说话,将对所述当前用户进行明示,提醒所述当前用户阅读预设文本,当所述当前用户阅读所述预设文本时,采集所述当前用户的阅读音频,并从所述阅读音频中提取当前阅读声纹特征信息,将所述当前阅读声纹特征信息与所述目标声纹特征信息进行相似度比对,根据比对结果确认所述当前用户的身份。
在第三实施例中,通过获取当前用户输入的目标用户信息,将所述目标用户信息输入至预设声纹模型中,以获得所述预设声纹模型输出的目标声纹特征信息。由于采集了大量样本,建立声纹特征信息与用户信息之间的映射关系,使得根据该映射关系训练获得的预设声纹模型具有较高的识别准确率,从而能够获得准确的目标声纹特征信息,提高了声纹认证的准确率。
参照图5,图5为本发明基于盲检测的声纹认证方法第四实施例的流程示意图,基于上述图3所示的第二实施例,提出本发明基于盲检测的声纹认证方法的第四实施例。
在第四实施例中,所述步骤S10,具体包括:
步骤S102:获取当前业务场景以及当前用户输入的目标用户信息。
需要说明的是,为了提高身份认证的准确性,将通过一段特定的目标音频对所述当前用户进行声纹识别,所述目标音频为目标用户在当前业务场景下的标准音频,根据所述当前用户输入的目标用户信息对应的目标音频,以及该当前用户在当前业务场景下实际说出的当前音频进行对比,从而根据对比结果验证所述当前用户的身份,通过该特定的目标音频进行声纹识别,准确率高于通过任意音频进行声纹识别。
在具体实现中,用户信息与音频库之间具有对应关系,音频库中包含业务场景和该业务场景下用户容易说出的音频之间的对应关系,因此,为了获取目标音频,将获取目标用户信息。
步骤S103:根据所述目标用户信息获取对应的目标音频库,从所述目标音频库中选取与所述当前业务场景对应的目标音频。
可以理解的是,预先在各种业务场景下采集用户的标准音频,构建业务场景和该业务场景下用户容易说出的标准音频之间的对应关系,从而可从所述目标音频库中选取与所述当前业务场景对应的目标音频。
步骤S104:查找与所述目标音频对应的目标声纹特征信息。
需要说明的是,在构建音频库时,从各标准音频中提取声纹特征信息,建立标准音频与声纹特征信息之间的对应关系,从而在该对应关系中根据所述目标音频查找对应的目标声纹特征信息,便于后续将当前声纹特征信息与该目标声纹特征信息进行对比,以确认用户身份。
在第四实施例中,通过获取当前业务场景以及当前用户输入的目标用户信息;根据所述目标用户信息获取对应的目标音频库,从所述目标音频库中选取与所述当前业务场景对应的目标音频;查找与所述目标音频对应的目标声纹特征信息。将当前业务场景对应的目标音频与当前用户实际说出的当前音频进行对比,能够提高声纹认证速度,快速确认用户身份。
此外,本发明实施例还提出一种存储介质,所述存储介质上存储有基于盲检测的声纹认证程序,所述基于盲检测的声纹认证程序被处理器执行时实现如上文所述的基于盲检测的声纹认证方法的步骤。
此外,参照图6,本发明实施例还提出一种基于盲检测的声纹认证装置,所述基于盲检测的声纹认证装置包括:
获取模块10,用于获取当前用户输入的目标用户信息,根据所述目标用户信息获取对应的目标声纹特征信息。
需要说明的是,本实施例的应用场景是,当前用户在各种业务场景下进行业务操作时,所述业务场景为在线申请贷款、在线签订合同以及钱款支付等需要身份验证的场景,所述基于盲检测的声纹认证设备通过语音试图与当前用户建立沟通,以使当前用户下意识地说话,即可采集到当前用户的当前音频,从而根据该当前音频对当前用户进行声纹认证,确认当前用户的身份。
可以理解的是,每个用户均对应有一个用户信息,用户信息是用户的唯一身份账号信息,一般包括身份证号、身份标识或其它身份信息,当前用户对应有当前用户信息,目标用户对应有目标用户信息,在本实施例中,当前用户输入目标用户信息,若所述当前用户输入的目标用户信息与所述当前用户对应的当前用户信息一致,则认定所述当前用户是真实的目标用户;若所述目标用户信息与所述当前用户信息不一致,则认定所述当前用户是盗用目标用户信息的伪冒用户;从而可通过判断所述目标用户信息与所述当前用户信息是否一致来确认所述当前用户的身份。
在具体实现中,为了判断所述目标用户信息与所述当前用户信息是否一致,将获取所述目标用户信息对应的目标声纹特征信息和所述当前用户信息对应的当前声纹特征信息,通过判断目标声纹特征信息与当前声纹特征信息是否一致来判断所述目标用户信息与所述当前用户信息是否一致。
提示模块20,用于通过语音提示所述当前用户进行业务操作,并在所述当前用户进行业务操作的过程中,监测所述当前用户是否说话。
需要说明的是,为了提高身份认证过程的无感知性,将通过某种方式使所述当前用户下意识地说话,从而采集所述当前用户的音频进行声纹识别,以确认所述当前用户的身份。本实施例中将通过语音提示所述当前用户进行业务操作,以所述业务场景为在线贷款为例,通过语音对所述当前用户进行提示,以使所述当前用户选择贷款类型、贷款金额等业务数据,在提示过程中,使所述当前用户感觉与客服人员在进行对话,从而下意识地说出选择的贷款类型、贷款金额或者重复语音的内容。
在具体实现中,所述当前用户在使用所述基于盲检测的声纹认证设备办理业务的过程中,所述基于盲检测的声纹认证设备还将展示业务流程,例如,在通过语音提示所述当前用户选择贷款金额时,所述基于盲检测的声纹认证设备的显示屏上将展示若干金额,以供所述当前用户选择,或者提供当前用户输入任意金额的输入框,因此,所述当前用户会在所述显示屏上选择相应的贷款金额,也可能在所述显示屏上选择相应的贷款金额,同时可能会下意识地说出金额,所以,所述当前用户有一定的概率会说话,而为了在所述当前用户说话时采集音频,将实时监测所述当前用户是否说话。
提取模块30,用于当监测到所述当前用户说话时,采集所述当前用户的当前音频,并从所述当前音频中提取所述当前用户的当前声纹特征信息。
可以理解的是,在整个业务操作过程中,若监测到所述当前用户说话,则及时采集所述当前用户的音频,并从所述当前音频中提取所述当前用户的当前声纹特征信息,所述当前声纹特征信息为所述当前用户本人的声纹特征信息,以供后续根据该当前声纹特征信息识别所述当前用户是否为所述目标用户信息对应的真实当前用户。
对比模块40,用于将所述当前声纹特征信息与所述目标声纹特征信息进行相似度对比,获得相似度评分。
需要说明的是,为了判断所述当前声纹特征信息与所述目标声纹特征信息是否一致,将对所述当前声纹特征信息与所述目标声纹特征信息进行相似度对比,以获得相似度评分。
识别模块50,用于将所述相似度评分与预设分值进行对比,若所述相似度评分大于所述预设分值,则判定所述当前用户认证通过。
可以理解的是,将所述相似度评分与预设分值进行对比,并根据对比结果确认当前用户的身份;若所述相似度评分大于所述预设分值,则说明所述当前声纹特征信息与所述目标声纹特征信息相似度很高,可认为所述当前声纹特征信息与所述目标声纹特征信息一致,从而判定所述当前用户认证通过。
在第一实施例中,通过语音对用户进行提示,使用户感觉与客服人员在进行对话,从而下意识地说话,在用户说话时采集用户的音频进行声纹识别,可确认用户身份,整个身份认证过程无需花费额外时间,仅在用户进行业务操作的过程中即可完成身份认证,认证效率高,并且在用户不知情的状态下完成,无感知性强,安全性高,避免了人像侵犯造成用户反感,提高了用户体验。
在一实施例中,所述提示模块20,还用于提供若干声音类型供所述当前用户选择,并根据所述当前用户选择的声音类型获取对应类型的仿真语音;
通过所述仿真语音提示所述当前用户进行业务操作;
在所述当前用户进行业务操作的过程中,监测所述当前用户是否说话。
在一实施例中,所述业务操作包括选择业务对象;
所述提示模块20,还用于展示若干业务对象,通过所述仿真语音提示所述当前用户在所述业务对象中进行选择,并通过预设语句询问所述当前用户的选择结果。
在一实施例中,所述获取模块10,还用于获取当前用户输入的目标用户信息,将所述目标用户信息输入至预设声纹模型中,以获得所述预设声纹模型输出的目标声纹特征信息。
在一实施例中,所述基于盲检测的声纹认证装置,还包括:
建模模块,用于采集样本用户信息和所述样本用户信息对应的样本音频;
从所述样本音频中提取样本声纹特征信息,建立样本用户信息和样本声纹特征信息之间的映射关系;
建立基础声纹模型,根据所述映射关系对所述基础声纹模型进行训练,生成预设声纹模型。
在一实施例中,所述基于盲检测的声纹认证装置,还包括:
认证模块,用于当未监测到所述当前用户说话时,提示所述当前用户阅读预设文本;
采集所述当前用户的阅读音频,并基于所述阅读音频对所述当前用户进行声纹认证。
在一实施例中,所述获取模块10,还用于获取当前业务场景以及当前用户输入的目标用户信息;
根据所述目标用户信息获取对应的目标音频库,从所述目标音频库中选取与所述当前业务场景对应的目标音频;
查找与所述目标音频对应的目标声纹特征信息。
本发明所述基于盲检测的声纹认证装置的其他实施例或具体实现方式可参照上述各方法实施例,此处不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。词语第一、第二、以及第三等的使用不表示任何顺序,可将这些词语解释为名称。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如只读存储器镜像(Read Only Memory image,ROM)/随机存取存储器(Random AccessMemory,RAM)、磁碟、光盘)中,包括若干指令用以使得一台终端基于盲检测的声纹认证设备(可以是手机,计算机,服务器,空调器,或者网络基于盲检测的声纹认证设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种基于盲检测的声纹认证方法,其特征在于,所述基于盲检测的声纹认证方法包括以下步骤:
获取当前用户输入的目标用户信息,根据所述目标用户信息获取对应的目标声纹特征信息;
通过语音提示所述当前用户进行业务操作,并在所述当前用户进行业务操作的过程中,监测所述当前用户是否说话;
当监测到所述当前用户说话时,采集所述当前用户的当前音频,并从所述当前音频中提取所述当前用户的当前声纹特征信息;
将所述当前声纹特征信息与所述目标声纹特征信息进行相似度对比,获得相似度评分;
将所述相似度评分与预设分值进行对比,若所述相似度评分大于所述预设分值,则判定所述当前用户认证通过。
2.如权利要求1所述的基于盲检测的声纹认证方法,其特征在于,所述通过语音提示所述当前用户进行业务操作,并在所述当前用户进行业务操作的过程中,监测所述当前用户是否说话,包括:
提供若干声音类型供所述当前用户选择,并根据所述当前用户选择的声音类型获取对应类型的仿真语音;
通过所述仿真语音提示所述当前用户进行业务操作;
在所述当前用户进行业务操作的过程中,监测所述当前用户是否说话。
3.如权利要求2所述的基于盲检测的声纹认证方法,其特征在于,所述业务操作包括选择业务对象;
所述通过所述仿真语音提示所述当前用户进行业务操作,包括:
展示若干业务对象,通过所述仿真语音提示所述当前用户在所述业务对象中进行选择,并通过预设语句询问所述当前用户的选择结果。
4.如权利要求1-3中任一项所述的基于盲检测的声纹认证方法,其特征在于,所述获取当前用户输入的目标用户信息,根据所述目标用户信息获取对应的目标声纹特征信息,包括:
获取当前用户输入的目标用户信息,将所述目标用户信息输入至预设声纹模型中,以获得所述预设声纹模型输出的目标声纹特征信息。
5.如权利要求4所述的基于盲检测的声纹认证方法,其特征在于,所述获取当前用户输入的目标用户信息之前,所述基于盲检测的声纹认证方法还包括:
采集样本用户信息和所述样本用户信息对应的样本音频;
从所述样本音频中提取样本声纹特征信息,建立样本用户信息和样本声纹特征信息之间的映射关系;
建立基础声纹模型,根据所述映射关系对所述基础声纹模型进行训练,生成预设声纹模型。
6.如权利要求1-3中任一项所述的基于盲检测的声纹认证方法,其特征在于,所述在所述当前用户进行业务操作的过程中,监测所述当前用户是否说话之后,所述基于盲检测的声纹认证方法还包括:
当未监测到所述当前用户说话时,提示所述当前用户阅读预设文本;
采集所述当前用户的阅读音频,并基于所述阅读音频对所述当前用户进行声纹认证。
7.如权利要求1-3中任一项所述的基于盲检测的声纹认证方法,其特征在于,所述获取当前用户输入的目标用户信息,根据所述目标用户信息获取对应的目标声纹特征信息,包括:
获取当前业务场景以及当前用户输入的目标用户信息;
根据所述目标用户信息获取对应的目标音频库,从所述目标音频库中选取与所述当前业务场景对应的目标音频;
查找与所述目标音频对应的目标声纹特征信息。
8.一种基于盲检测的声纹认证设备,其特征在于,所述基于盲检测的声纹认证设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于盲检测的声纹认证程序,所述基于盲检测的声纹认证程序被所述处理器执行时实现如权利要求1至7中任一项所述的基于盲检测的声纹认证方法的步骤。
9.一种存储介质,其特征在于,所述存储介质上存储有基于盲检测的声纹认证程序,所述基于盲检测的声纹认证程序被处理器执行时实现如权利要求1至7中任一项所述的基于盲检测的声纹认证方法的步骤。
10.一种基于盲检测的声纹认证装置,其特征在于,所述基于盲检测的声纹认证装置包括:
获取模块,用于获取当前用户输入的目标用户信息,根据所述目标用户信息获取对应的目标声纹特征信息;
提示模块,用于通过语音提示所述当前用户进行业务操作,并在所述当前用户进行业务操作的过程中,监测所述当前用户是否说话;
提取模块,用于当监测到所述当前用户说话时,采集所述当前用户的当前音频,并从所述当前音频中提取所述当前用户的当前声纹特征信息;
对比模块,用于将所述当前声纹特征信息与所述目标声纹特征信息进行相似度对比,获得相似度评分;
识别模块,用于将所述相似度评分与预设分值进行对比,若所述相似度评分大于所述预设分值,则判定所述当前用户认证通过。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811539992.XA CN109462603A (zh) | 2018-12-14 | 2018-12-14 | 基于盲检测的声纹认证方法、设备、存储介质及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811539992.XA CN109462603A (zh) | 2018-12-14 | 2018-12-14 | 基于盲检测的声纹认证方法、设备、存储介质及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109462603A true CN109462603A (zh) | 2019-03-12 |
Family
ID=65613448
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811539992.XA Pending CN109462603A (zh) | 2018-12-14 | 2018-12-14 | 基于盲检测的声纹认证方法、设备、存储介质及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109462603A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111339517A (zh) * | 2020-05-15 | 2020-06-26 | 支付宝(杭州)信息技术有限公司 | 声纹特征的采样方法、用户识别方法、装置及电子设备 |
CN111340504A (zh) * | 2020-03-10 | 2020-06-26 | 北京意锐新创科技有限公司 | 适用于支付设备的支付方法和装置 |
CN112201254A (zh) * | 2020-09-28 | 2021-01-08 | 中国建设银行股份有限公司 | 无感语音认证方法、装置、设备及存储介质 |
CN113782035A (zh) * | 2021-09-10 | 2021-12-10 | 中国银行股份有限公司 | 业务处理方法、装置、电子设备及存储介质 |
CN114006747A (zh) * | 2021-10-28 | 2022-02-01 | 平安普惠企业管理有限公司 | 交互安全管理方法、装置、计算机设备及可读存储介质 |
CN115086045A (zh) * | 2022-06-17 | 2022-09-20 | 海南大学 | 基于声纹伪造检测的数据安全防护方法及装置 |
CN115471327A (zh) * | 2022-11-02 | 2022-12-13 | 平安银行股份有限公司 | 银行业务办理的远程面签方法、装置、计算机存储介质 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030182119A1 (en) * | 2001-12-13 | 2003-09-25 | Junqua Jean-Claude | Speaker authentication system and method |
CN101321387A (zh) * | 2008-07-10 | 2008-12-10 | 中国移动通信集团广东有限公司 | 基于通信系统的声纹识别方法及系统 |
CN102298929A (zh) * | 2010-06-23 | 2011-12-28 | 上海博路信息技术有限公司 | 一种基于语音识别的呼叫中心用户识别方法 |
US8620666B1 (en) * | 2009-08-07 | 2013-12-31 | West Corporation | System, method, and computer-readable medium that facilitate voice biometrics user authentication |
CN104183238A (zh) * | 2014-09-09 | 2014-12-03 | 深圳市和音达科技有限公司 | 一种基于提问应答的老年人声纹识别方法 |
CN106506524A (zh) * | 2016-11-30 | 2017-03-15 | 百度在线网络技术(北京)有限公司 | 用于验证用户的方法和装置 |
CN106961418A (zh) * | 2017-02-08 | 2017-07-18 | 北京捷通华声科技股份有限公司 | 身份认证方法和身份认证系统 |
WO2017143924A1 (zh) * | 2016-02-22 | 2017-08-31 | 中国银联股份有限公司 | 一种支付方法及装置、设备 |
CN107507612A (zh) * | 2017-06-30 | 2017-12-22 | 百度在线网络技术(北京)有限公司 | 一种声纹识别方法及装置 |
CN107958669A (zh) * | 2017-11-28 | 2018-04-24 | 国网电子商务有限公司 | 一种声纹识别的方法及装置 |
CN108040032A (zh) * | 2017-11-02 | 2018-05-15 | 阿里巴巴集团控股有限公司 | 一种声纹认证方法、账号注册方法及装置 |
CN108766444A (zh) * | 2018-04-09 | 2018-11-06 | 平安科技(深圳)有限公司 | 用户身份验证方法、服务器及存储介质 |
-
2018
- 2018-12-14 CN CN201811539992.XA patent/CN109462603A/zh active Pending
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030182119A1 (en) * | 2001-12-13 | 2003-09-25 | Junqua Jean-Claude | Speaker authentication system and method |
CN101321387A (zh) * | 2008-07-10 | 2008-12-10 | 中国移动通信集团广东有限公司 | 基于通信系统的声纹识别方法及系统 |
US8620666B1 (en) * | 2009-08-07 | 2013-12-31 | West Corporation | System, method, and computer-readable medium that facilitate voice biometrics user authentication |
CN102298929A (zh) * | 2010-06-23 | 2011-12-28 | 上海博路信息技术有限公司 | 一种基于语音识别的呼叫中心用户识别方法 |
CN104183238A (zh) * | 2014-09-09 | 2014-12-03 | 深圳市和音达科技有限公司 | 一种基于提问应答的老年人声纹识别方法 |
WO2017143924A1 (zh) * | 2016-02-22 | 2017-08-31 | 中国银联股份有限公司 | 一种支付方法及装置、设备 |
CN106506524A (zh) * | 2016-11-30 | 2017-03-15 | 百度在线网络技术(北京)有限公司 | 用于验证用户的方法和装置 |
CN106961418A (zh) * | 2017-02-08 | 2017-07-18 | 北京捷通华声科技股份有限公司 | 身份认证方法和身份认证系统 |
CN107507612A (zh) * | 2017-06-30 | 2017-12-22 | 百度在线网络技术(北京)有限公司 | 一种声纹识别方法及装置 |
CN108040032A (zh) * | 2017-11-02 | 2018-05-15 | 阿里巴巴集团控股有限公司 | 一种声纹认证方法、账号注册方法及装置 |
CN107958669A (zh) * | 2017-11-28 | 2018-04-24 | 国网电子商务有限公司 | 一种声纹识别的方法及装置 |
CN108766444A (zh) * | 2018-04-09 | 2018-11-06 | 平安科技(深圳)有限公司 | 用户身份验证方法、服务器及存储介质 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111340504A (zh) * | 2020-03-10 | 2020-06-26 | 北京意锐新创科技有限公司 | 适用于支付设备的支付方法和装置 |
CN111339517A (zh) * | 2020-05-15 | 2020-06-26 | 支付宝(杭州)信息技术有限公司 | 声纹特征的采样方法、用户识别方法、装置及电子设备 |
CN112201254A (zh) * | 2020-09-28 | 2021-01-08 | 中国建设银行股份有限公司 | 无感语音认证方法、装置、设备及存储介质 |
CN113782035A (zh) * | 2021-09-10 | 2021-12-10 | 中国银行股份有限公司 | 业务处理方法、装置、电子设备及存储介质 |
CN114006747A (zh) * | 2021-10-28 | 2022-02-01 | 平安普惠企业管理有限公司 | 交互安全管理方法、装置、计算机设备及可读存储介质 |
CN115086045A (zh) * | 2022-06-17 | 2022-09-20 | 海南大学 | 基于声纹伪造检测的数据安全防护方法及装置 |
CN115471327A (zh) * | 2022-11-02 | 2022-12-13 | 平安银行股份有限公司 | 银行业务办理的远程面签方法、装置、计算机存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109462603A (zh) | 基于盲检测的声纹认证方法、设备、存储介质及装置 | |
EP3465554B1 (en) | Personalized chatbots for inmates | |
CN109360550B (zh) | 语音交互系统的测试方法、装置、设备和存储介质 | |
CN109960723B (zh) | 一种用于心理机器人的交互系统及方法 | |
CN110544469B (zh) | 语音识别模型的训练方法及装置、存储介质、电子装置 | |
CN107393541A (zh) | 信息验证方法和装置 | |
CN112836691A (zh) | 智能面试方法及装置 | |
CN109165336B (zh) | 一种信息输出控制方法及家教设备 | |
CN109726372B (zh) | 基于通话记录的工单的生成方法、装置及计算机可读介质 | |
CN110738998A (zh) | 基于语音的个人信用评估方法、装置、终端及存储介质 | |
CN110895568B (zh) | 处理庭审记录的方法和系统 | |
CN109739354A (zh) | 一种基于声音的多媒体交互方法及装置 | |
CN112507294B (zh) | 一种基于人机交互的英语教学系统及教学方法 | |
CN113327620A (zh) | 声纹识别的方法和装置 | |
CN111081260A (zh) | 一种唤醒词声纹的识别方法及系统 | |
CN107451185B (zh) | 录音方法、朗读系统、计算机可读存储介质和计算机装置 | |
CN110111778B (zh) | 一种语音处理方法、装置、存储介质及电子设备 | |
CN111081256A (zh) | 数字串声纹密码验证方法及系统 | |
CN107992825B (zh) | 一种基于增强现实的人脸识别的方法及系统 | |
CN109389493A (zh) | 基于语音识别的自定义测试题目录入方法、系统及设备 | |
KR102523808B1 (ko) | 외국인을 위한 ai 면접 수행 방법 및 장치 | |
CN111078992B (zh) | 一种听写内容生成方法及电子设备 | |
CN114267324A (zh) | 语音生成方法、装置、设备和存储介质 | |
CN111785280A (zh) | 身份认证方法和装置、存储介质和电子设备 | |
CN115206342A (zh) | 一种数据处理方法、装置、计算机设备及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20190312 |
|
WD01 | Invention patent application deemed withdrawn after publication |