CN109087647B - 声纹识别处理方法、装置、电子设备及存储介质 - Google Patents

声纹识别处理方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN109087647B
CN109087647B CN201810877973.1A CN201810877973A CN109087647B CN 109087647 B CN109087647 B CN 109087647B CN 201810877973 A CN201810877973 A CN 201810877973A CN 109087647 B CN109087647 B CN 109087647B
Authority
CN
China
Prior art keywords
random code
voice
voiceprint recognition
voiceprint
person
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810877973.1A
Other languages
English (en)
Other versions
CN109087647A (zh
Inventor
潘燕飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201810877973.1A priority Critical patent/CN109087647B/zh
Priority to PCT/CN2018/107954 priority patent/WO2020024415A1/zh
Publication of CN109087647A publication Critical patent/CN109087647A/zh
Application granted granted Critical
Publication of CN109087647B publication Critical patent/CN109087647B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/06Decision making techniques; Pattern matching strategies

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Game Theory and Decision Science (AREA)
  • Computational Linguistics (AREA)
  • Telephonic Communication Services (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本申请实施例提供了一种声纹识别处理方法、装置、电子设备及存储介质。方法包括:若获得识别声纹的指令,输出包含第一随机码的提示信息,提示信息是指用于对被识别者提供的语音应包含的内容作出提示的信息;获取被识别者提供的包含第一随机码的语音;通过语音识别,将语音转换为文字,提取文字中包含的第二随机码;使用第一随机码对第二随机码进行校验,若对第二随机码校验成功,进行声纹识别得到声纹识别结果。本申请实施例通过声纹识别设备输出包含第一随机码的提示信息,获取被识别者提供的语音,从语音中获取第二随机码,若对第二随机码校验成功,进行语音的声纹识别得到声纹识别结果,可以保证语音提供者是活体,提高声纹识别的安全性。

Description

声纹识别处理方法、装置、电子设备及存储介质
技术领域
本申请涉及声纹识别技术领域,尤其涉及一种声纹识别处理方法、装置、电子设备及存储介质。
背景技术
声纹识别是根据人的声音的特质来识别说话人身份的系统,采用语音对说话人身份进行验证。这种技术具有较好的便捷性、稳定性、可测量性、准确性和安全性等特点。作为一种非接触式的采集、识别技术,声纹的获取成本较低、获取方便、使用简单,在银行、社保、公安、智能家居、移动支付等领域都有巨大应用前景。
传统的声纹识别中,通常采用的方式是,获取一段语音,根据获取的语音,在数据库中进行声纹的匹配,从而对被识别者身份进行验证。但此种声纹识别方式存在安全性问题。
发明内容
本申请实施例提供了一种声纹识别处理方法、装置、电子设备及存储介质,能够解决声纹识别中由于无法确定声音来源导致的安全性问题。
第一方面,本申请实施例提供了一种声纹识别处理方法,所述方法包括:若获得识别声纹的指令,输出包含第一随机码的提示信息,所述提示信息是指用于对被识别者提供的语音应包含的内容作出提示的信息;获取被识别者提供的包含所述第一随机码的语音;通过语音识别,将所述语音转换为文字,并提取所述文字中包含的第二随机码;以及使用所述第一随机码对所述第二随机码进行校验,若对所述第二随机码校验成功,进行声纹识别得到声纹识别结果。
第二方面,本申请实施例还提供了一种声纹识别处理装置,所述装置包括:
输出单元,用于若获得识别声纹的指令,输出包含第一随机码的提示信息,所述提示信息是指用于对被识别者提供的语音应包含的内容作出提示的信息;获取单元,用于获取被识别者提供的包含所述第一随机码的语音;提取单元,用于通过语音识别,将所述语音转换为文字,并提取所述文字中包含的第二随机码;以及校验单元,用于使用所述第一随机码对所述第二随机码进行校验,若对所述第二随机码校验成功,进行声纹识别得到声纹识别结果。
第三方面,本申请实施例还提供了一种电子设备,其包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现上述声纹识别处理方法。
第四方面,本申请实施例还提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时可实现上述声纹识别处理方法。
本申请实施例提供了一种声纹识别处理方法、装置、电子设备及存储介质。所述方法包括:若获得识别声纹的指令,输出包含第一随机码的提示信息,所述提示信息是指用于对被识别者提供的语音应包含的内容作出提示的信息;获取被识别者提供的包含所述第一随机码的语音;通过语音识别,将所述语音转换为文字,并提取所述文字中包含的第二随机码;以及使用所述第一随机码对所述第二随机码进行校验,若对所述第二随机码校验成功,进行声纹识别得到声纹识别结果。本申请实施例通过声纹识别设备输出包含第一随机码的提示信息,进而获取所述被识别者提供的语音,从所述语音中获取所述第二随机码,将所述第一随机码和所述第二随机码进行匹配,若所述第二随机码校验成功,进而进行所述语音的声纹识别,得到声纹识别结果,可以保证所述语音提供者是活体,从而提高声纹识别的安全性。
附图说明
为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的声纹识别处理方法的应用场景示意图;
图2为本申请实施例提供的声纹识别处理方法的流程示意图;
图3为本申请另一个实施例提供的声纹识别处理方法的流程示意图;
图4为本申请实施例提供的声纹识别处理装置的示意性框图;
图5为本申请实施例提供的电子设备的示意性框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
请参阅图1,图1为本申请实施例提供的声纹识别处理方法的应用场景示意图。所述应用场景包括:
(1)用户,指被识别者,也就是通过声纹识别设备进行声纹识别的人。
(2)声纹识别设备,一种电子设备,可以为一种终端设备,通过获取被识别者提供的语音,进行声纹识别,声纹识别设备可以通过声纹识别设备自身包含的麦克风组件获取被识别者发出的语音。
图1中的各个主体工作过程如下:声纹识别设备若获得识别声纹的指令,输出提示信息,被识别者根据提示信息发出一段语音,声纹识别设备根据获取的语音,通过声纹识别,获得声纹识别结果,进行被识别者身份辨识和身份确认。
需要说明的是,图1中仅仅示意出一个被识别者,在实际操作过程中,被识别者可以有多个,同时,声纹识别设备可以为单独的电子设备终端,也可以是其他电子设备的部件、组件或者包含于其他电子设备的功能单元,比如是智能终端设备的功能单元,以完成声纹识别的全部或者部分功能,上述声纹识别处理方法的应用场景仅仅用于说明本申请技术方案,并不用于限定本申请技术方案。
图2为本申请实施例提供的声纹识别处理方法的示意性流程图。该声纹识别处理方法应用于图1中的声纹识别设备中,所述声纹识别设备可以为单独的电子设备终端,也可以是其他电子设备的部件或者组件,以完成声纹识别的全部或者部分功能。
图2是本申请实施例提供的声纹识别处理方法的流程示意图。如图2所示,该方法包括以下步骤S210-S240:
S210、若获得识别声纹的指令,输出包含第一随机码的提示信息,所述提示信息是指用于对被识别者提供的语音应包含的内容作出提示的信息。
具体地,声纹识别,是根据说话人的声波特性对说话人的身份进行身份辨识,识别或确认发出语音的说话人的身份,声纹识别处理广泛应用于需要对人的身份进行确认的智慧建筑、智能家居、金融安全等领域。
其中,随机码是声纹识别设备随机产生的一串预设位数的字符。随机码可以包含数字、文字、字母及上述形式的组合等形式,比如,随机码可以为“6589”、“科技”、“jym”或者“6589jym”等。通过在被识别者提供的语音中设置随机码,可以实现声纹识别处理时保证是活体提供的语音,避免通过录音的形式进行对人员的识别,提高声纹识别处理时验证的安全性。需要说明的是,第一随机码也是随机码,只是为了区分不同的随机码而对随机码做的区别。
所述提示信息,是指用于对被识别者提供的语音应包含的内容作出提示的信息,用来对用户提供的语音应包含的内容做出明确提示,比如,所示提示信息可以包含随机码,还可以包含进行声纹识别的环境信息,比如被识别者的住址和楼层信息等,或者被识别者的公司地址和公司名称等,用于判断被识别者身份和能够缩小在数据库中进行数据匹配范围。所述提示信息还可以包括一段随机文字,供被识别者根据提示的随机文字提供语音,进一步通过提供的随机文字确保声纹识别的语音提供者是活体,进一步保证声纹识别的安全性。
具体地,声纹识别可以有效应用于建筑公共区域的安全访问权限管控,比如,应用于住宅区或者办公区的访问权限管控。但传统的声纹识别中,通常采用的方式是,获取一段语音,根据获取的语音,在数据库中进行声纹的匹配,从而对被识别者身份进行验证。但此种方式无法确定获取的语音是活体提供的还是通过录音介质获取的录音,因此,声纹识别存在安全性问题。在本申请实施例中,若声纹识别设备获得识别声纹的指令,输出包含第一随机码的提示信息,所述提示信息用于对被识别者提供的语音应包含的内容作出提示。比如当人员在住宅区或者办公区入口处时,若声纹识别设备通过红外检测,检测到人体启动声纹识别,或者通过门禁按键启动声纹识别。若声纹识别设备启动声纹识别,进行人员辨识时,声纹识别设备输出包含所述第一随机码的提示信息,使被识别者提供一段包含所述第一随机码的语音,声纹识别设备通过获取被识别者提供的语音,通过声纹识别处理技术分析出第一随机码的内容,通过对所述第一随机码的验证,实现对声纹识别处理中的活体检测,防止录音仿冒人员进行声纹识别,从而达到活体检测的目的,保证声纹识别处理的安全性,从而进一步根据被识别者的声纹特征对被识别者的身份进行辨识。
同样的,若用户在一些终端上进行账号登录时,也可以通过声纹识别处理对登录账号的人员进行身份验证,当终端进入人员识别界面时,终端也可以输出包含第一随机码的提示信息,对登录账户的人员身份进行声纹识别处理的验证。
进一步地,声纹识别设备输出包含所述第一随机码的提示信息,所述提示信息可以是声纹识别设备以文字形式在声纹识别设备的显示界面上显示的提示信息,或者是声纹识别设备以语音播报形式提示用户应提供的包含于语音的提示信息,还可以是同时以文字形式显示和语音播报的形式同时提示。
S220、获取被识别者提供的包含所述第一随机码的语音。
具体地,声纹识别设备提示声纹识别需要的语音应包含的所述第一随机码的内容后,被识别者根据声纹识别设备输出的提示信息,提供一段包含第一随机码的语音,比如,所述被识别者通过读出包含所述第一随机码“6589”、“科技”、“jym”或者“6589jym”等,以供所述声纹识别设备进行声纹识别时验证所述语音提供者是活体,声纹识别设备通过麦克风等组件获取被识别者提供的语音。
S230、通过语音识别,将所述语音转换为文字,并提取所述文字中包含的第二随机码。
其中,语音识别技术,也被称为自动语音识别,英文为Automatic SpeechRecognition,简写为ASR,其目标是将人类的语音中的词汇内容转换为计算机可读的输入。
具体地,声纹识别设备获取被识别者提供的语音后,通过ASR语音识别技术,将语音转换为文字,将转换后的文字进行分割,根据步骤S220中所述提示信息中限定的所述第一随机码的信息,所述第一随机码的信息包括所述第一随机码的位数、内容及所述第一随机码在所述语音中的位置等,从转换后的文字中提取出第二随机码。比如,若步骤S220中包含的所述第一随机码的信息包括两位随机码在语音的前部,则在转换后的文字中,取前两位为所述第二随机码。
S240、使用所述第一随机码对所述第二随机码进行校验,若对所述第二随机码校验成功,进行声纹识别得到声纹识别结果。
具体地,声纹识别设备通过对所述第一随机码和所述第二随机码的比较,实现对所述第二随机码的校验,进而判断语音提供的被识别者是否是活体。若所述第一随机码和所述第二随机码相同,则表示语音提供的被识别者是活体,否则,表示语音提供的被识别者有可能是录音提供的,是不安全的。
若声纹识别设备通过语音识别技术获取的文字中包含的所述第二随机码与所述声纹识别设备输出的所述第一随机码不相同,所述第二随机码检验失败,跳出现有流程,声纹识别设备提示身份识别失败。进一步地,可以重新输出包含所述第一随机码的提示信息。否则,若通过语音识别技术获取的文字中包含的所述第二随机码与声纹识别设备输出的所述第一随机码相同,所述第二随机码检验成功,则根据所述语音进行声纹识别处理,查询找出这段语音信息所对应的人员/人员库的声音,再进行一比一或者一比多个的声纹对比,通过声纹识别,得到声纹识别结果,进行用户身份验证,从而保证声纹识别处理的安全性。
本申请实施例通过声纹识别设备输出包含第一随机码的提示信息,进而获取所述被识别者提供的语音,从所述语音中获取所述第二随机码,将所述第一随机码和所述第二随机码进行匹配,若所述第二随机码校验成功,进而进行所述语音的声纹识别,获得声纹识别结果,可以保证所述语音提供者是活体,从而提高声纹识别的安全性。
进一步地,若某一场景下有N个人,比如一个小区中居住有N人,或者一栋里住有N人,进行声纹识别时,数据库中有N个声纹模型数据需要进行匹配,若N的数值比较大,则声纹识别需要进行声纹模型的逐一比对,声纹识别处理过程中需要进行处理的声纹匹配数量较大,导致声纹识别处理的识别率较低。请参阅图3,图3为本申请另一个实施例提供的声纹识别处理方法的流程示意图,所述声纹识别处理方法包括以下步骤S310-S340:
S310、若获得识别声纹的指令,输出包含第一随机码和预设内容的提示信息,所述提示信息是指用于对被识别者提供的语音应包含的内容作出提示的信息。
其中,预设内容是用户在声纹识别设备注册时提供的预先设定的语音内容。所述预设内容可以与声纹识别的应用环境有关,所述应用环境包括声纹识别时的位置或者名称等。用户可以根据不同的应用环境,设置不同的预设内容。比如,在住宅区,预设内容可以为“我住在xxx栋xxx房间”,而在办公区域,所述预设内容可以为“我公司的地址是xxx”或者“我公司的名字是xxx”等。
具体地,声纹识别设备若获得识别声纹的指令,输出包含第一随机码和预设内容的提示信息。其中,为了确保用户隐私,声纹识别设备在声纹识别设备的屏幕通过显示界面以文字形式显示提示信息,或者通过以语音播报的方式输出所述提示信息时,所述预设内容采用隐语指代的形式,所述隐语指代是指所述预设内容包含的具体内容未被明确提示,所述预设内容不明确和具体的表述出来。比如,声纹识别设备提示用户输入包含“第一随机码+我的住址”的语音,或者声纹识别设备提示用户输入包含“随机码+我公司的地址”或者“第一随机码+我公司名字”的语音等形式,而不提示“我的住址”、“我公司的地址”或者“我公司的名字”具体是什么。
所述预设内容不但可以限定被识别者在不同使用环境中的身份识别,而且声纹识别设备在进行声纹识别时还可以通过所述预设内容缩小声纹识别时数据匹配的范围。比如,在住宅区,若所述预设内容为“我住在xx栋xx房间”,声纹识别设备输出的提示信息为“随机码+我的住址”,声纹识别设备进行声纹识别时,若检测到获取的语音内容中包含“我住在xx栋xx房间”,在数据库中进行数据匹配时,可以将声纹识别时匹配的数据范围缩小到包含“xx栋”关键词的数据范围内,而不用将整个数据库中的数据逐一进行声纹识别处理时的匹配,从而提高声纹识别处理的效率。若所述声纹识别设备在数据库中检测到与获取的语音信息中包含的声纹匹配的声纹数据,通过被识别者的身份验证,否则,不通过被识别者的身份验证。通过所述第一随机码结合预设内容的提示信息作为声纹识别处理的语音内容,不但可以通过随机码的验证,确保声纹识别处理是活体提供的语音,而且可以通过所述预设内容包含的用户信息,保证声纹识别处理时的安全性,且能够缩小声纹识别处理行时声纹数据容匹配的范围,提高声纹识别处理的效率。
在一个实施例中,所述第一随机码和所述预设内容的顺序在所述语音中被限定。
具体地,声纹识别设备输出包含所述第一随机码和预设内容的提示信息,所述第一随机码和预设内容的顺序在所述语音中被限定。比如,声纹识别设备要求被识别者提供的语音内容的顺序可以是“第一随机码+预设内容”,或者“预设内容+第一随机码”,或者上述两种顺序循环,或者上述两种顺序随机输出。通过所述提示信息中包含的所述第一随机码和预设内容的不同顺序的限定,后续步骤中根据每一次所述第一随机码和预设内容在所述语音中的位置,从语音识别中获取所述语音中包含的所述第一随机码和预设内容,进而利用所述第一随机码和所述预设内容进行声纹识别处理验证,实现语音提供的不可预测性。声纹识别设备在进行声纹识别时,可以进行对语音内容顺序的检测,进一步确保语音是活体提供的实时语音,保证声纹识别的安全性。
进一步地,声纹识别设备输出包含所述第一随机码和预设内容的提示信息,可以是以文字形式在声纹识别设备显示屏的显示界面上显示提示信息,比如“随机码+注册时预设的内容”,或者是声纹识别设备以语音播报的形式提示用户应提供的语音包含的内容。
S320、获取被识别者提供的包含所述第一随机码和所述预设内容的语音。
终端设备获取被识别者根据特定的使用场景,提供的一段包含所述第一随机码和预设内容的语音。
具体地,声纹识别设备提示声纹识别需要的语音应包含的提示信息后,被识别者根据使用场景的不同,提供一段包含所述第一随机码和所述预设内容的语音,比如在住宅区,可以提供包含“随机码和注册时提供的住宅地址”的预设内容,在办公区,可以提供包含“随机码和注册时提供的办公区的地址或者办公区的名字”的预设内容,以供声纹识别设备进行声纹识别处理。声纹识别设备获取被识别者根据当前的使用场景,提供的一段包含所述第一随机码和预设内容的语音。
S330、通过语音识别,将所述语音转换为文字,并提取所述文字中包含的第二随机码和所述预设内容。
具体地,声纹识别设备获取被识别者提供的语音后,通过ASR语音识别技术,将语音转换为文字,将转换后的文字进行分割,根据步骤S330中提示信息中包含的所述第一随机码和所述预设内容在所述语音中的位置、内容及所述第二随机码的位数,从转换后的文字中提取出所述第二随机码和所述预设内容包含的信息,通过从获取的语音中提取的所述第二随机码和声纹识别设备提示的所述第一随机码进行比较,根据从获取的语音中提取的用户信息在数据库中进行相应数据的匹配,以实现通过声纹识别对用户身份的验证。比如,若采取的是两位所述第一随机码在所述预设内容前面的形式,则在转换后的文字中,取前两位为所述第二随机码。若所述预设内容为“我住在xx栋xx房间”,则声纹识别设备在数据库中与涉及xx栋的声纹模型进行匹配,从而缩减声纹识别时的声纹模型匹配范围,提高声纹识别的效率。
S440、使用所述第一随机码对所述第二随机码进行校验,若对所述第二随机码校验成功,根据所述预设内容进行声纹识别,得到声纹识别结果。
具体地,声纹识别设备根据所述提示信息包含的所述第一随机码和预设内容的语音顺序,及通过语音识别,将所述语音转换为文字后分割获取的所述第二随机码与所述第一随机码进行比较。若通过语音识别获取的文字中包含的所述第二随机码与声纹识别设备输出的所述第一随机码不相同,所述第二随机码检验失败,跳出现有流程,声纹识别设备提示身份识别失败,进一步,可以重新输出包含所述第一随机码和所述预设内容的提示信息。否则,若通过语音识别获取的文字中包含的所述第二随机码与声纹识别设备输出的所述第一随机码相同,所述第二随机码检验成功,则根据所述语音提供的预设内容包含的用户信息,在所述用户信息对应的数据范围内进行声纹识别的匹配,查询找出这段语音信息所对应的人员/人员库的声音,再进行一比一或者一比多个的声纹对比,通过声纹识别进行用户身份验证。比如,在住宅区,若所述预设内容为“我住在xx栋xx房间”,声纹识别设备输出的提示信息为“随机码+我的住址”,声纹识别设备进行声纹识别时,若检测到获取的语音内容中包含“我住在xx栋xx房间”,在数据库中进行数据匹配时,可以将声纹识别时匹配的数据范围缩小到包含“xx栋”关键词的数据范围内,或者将声纹识别时匹配的数据范围缩小到“xx栋xx房间”的家庭成员之间,而不用将整个数据库中的数据逐一进行声纹识别处理时的匹配,从而提高声纹识别处理的效率。由于根据用户信息确定的这段语音信息所对应的人员/人员库的声音,相对声纹识别设备的数据库中存储的声纹识别处理的数据已经缩小,从而极大的减小声纹识别处理中的比对量,提高声纹识别处理的效率和准确性。
在一个实施例中,所述若获得识别声纹的指令,输出包含第一随机码的提示信息的步骤还包括:所述提示信息中包含所述第一随机码在语音中的位置。
具体地,所述提示信息中包含所述第一随机码在语音中的位置,是指在提示信息中提示被识别者所述第一随机码在语音中的顺序,在所述语音中预先设定所述第一随机码的位置。在所述语音中预先设定所述第一随机码的位置,是指所述第一随机码在所述语音中的位置被预先限定,比如,被识别者首先说出所述第一随机码,所述第一随机码在所述语音中的位置在所述语音的首部,被识别者最后说出所述第一随机码,所述第一随机码在所述语音中的位置在所述语音的尾部。后续步骤中根据所述第一随机码在所述语音中的位置获取所述语音中包含的所述第一随机码,进而对所述第一随机码进行验证。此种情形下,声纹识别设备只针对所述语音中的所述第一随机码进行检测,所述语音中包括的其他语音内容不加考虑。此时,限定所述第一随机码在所述语音中的位置,比如,所述第一随机码在所述语音的前部,或者所述第一随机码在所述语音的尾部等,则根据所述第一随机码的位数取所述语音转换后的文字中的前几位或者后几位。
进一步地,所述提示信息中包含所述第一随机码在语音中的位置在每一次声纹识别处理时被随机限定。
具体地,所述第一随机码在所述语音中的位置在每一次声纹识别处理时被随机限定,是指每一次声纹识别时,所述第一随机码在语音中的位置不固定,可以提示被识别者所述第一随机码在所述语音的前部,在所述语音的中部,或者在所述语音的尾部,在每一次声纹识别时,声纹识别设备随机限定所述第一随机码在所述语音中的位置,并存储该次所述第一随机码通过所述提示信息提示给所述被识别者在语音中的位置,后续步骤中根据每一次所述第一随机码在所述语音中的位置获取所述语音中包含的所述第二随机码,进而对所述第二随机码进行验证。比如,所述第一随机码在一次所述语音的前部,所述第一随机码在下一次所述语音的前部或者尾部等,通过所述第一随机码在所述语音中的位置被随机限定,可以实现对声纹识别处理更加灵活的安全验证。
在一个实施例中,所述提示信息中还包括语音是预设时间长度内的语音。
具体地,声纹识别设备要求被识别者提供一段预设时间长度内的语音,通过对所述语音的时间长度的限定,可以进一步保证声纹识别处理的安全性。所述预设时间长度,比如,可以是15秒内的语音,也可以是15秒到30秒之间的语音,通过所述语音的时间长度的设置,可以更精确的限定声纹识别处理的条件,提高声纹识别处理的安全性。由于所述语音的预设时间长度是后台预先设定的,其他人不会轻易得知,通过限定被识别者提供的语音长度,可以防止声纹识别处理被不断尝试,进一步保证声纹识别处理的安全性。
在一个实施例中,所述语音的时间长度被随机限定,并提示给被识别者,要求被识别者提供预设时间长度内的语音,比如要求被识别者提供一段15秒以内的语音,或者要求被识别者提供一段20秒之内的语音等,可以通过语音的预设时间长度的随机限定,也可以实现对声纹识别处理中的活体检测,防止录音仿冒人员进行声纹识别。
需要说明的是,上述各个实施例所述的声纹识别处理方法,可以根据需要将不同方法中包含的技术特征重新进行组合,以获取组合后的实施方案,但都在本申请要求的保护范围之内。
请参阅图4,对应于上述声纹识别处理方法,本申请实施例还提供一种声纹识别处理装置。图4是本申请实施例提供的一种声纹识别处理装置的示意性框图。该声纹识别处理装置包括用于执行上述声纹识别处理方法的单元,该装置可以被配置于台式电脑、笔记本、智能手机等电子设备中。具体地,请参阅图4,该声纹识别处理装置包括输出单元401、获取单元402、提取单元403以及校验单元404。
其中,输出单元401,用于若获得识别声纹的指令,输出包含第一随机码的提示信息,所述提示信息是指用于对被识别者提供的语音应包含的内容作出提示的信息;
获取单元402,用于获取被识别者提供的包含所述第一随机码的语音;
提取单元403,用于通过语音识别,将所述语音转换为文字,并提取所述文字中包含的第二随机码;以及
校验单元404,用于使用所述第一随机码对所述第二随机码进行校验,若对所述第二随机码校验成功,进行声纹识别得到声纹识别结果。
在一个实施例中,所述提示信息中还包括预设内容,所述第一随机码和所述预设内容的顺序在所述语音中被限定;
所述校验单元404,用于使用所述第一随机码对所述第二随机码进行校验,若对所述第二随机码校验成功,根据所述预设内容进行声纹识别,得到声纹识别结果。
在一个实施例中,所述输出单元401还用于所述提示信息中包含所述第一随机码在语音中的位置和所述语音是预设时间长度内的语音。
需要说明的是,所属领域的技术人员可以清楚地了解到,上述声纹识别处理装置400和各单元的具体实现过程,可以参考前述方法实施例中的相应描述,为了描述的方便和简洁,在此不再赘述。
同时,上述声纹识别处理装置中各个单元的划分和连接方式仅用于举例说明,在其他实施例中,可将声纹识别处理装置按照需要划分为不同的单元,也可将声纹识别处理装置中各单元采取不同的连接顺序和方式,以完成上述声纹识别处理装置的全部或部分功能。
上述声纹识别处理装置可以实现为一种计算机程序的形式,该计算机程序可以在如图5所示的电子设备上运行。
请参阅图5,图5是本申请实施例提供的一种电子设备的示意性框图。该电子设备500可以是终端,也可以是其他设备中的组件或者部件,其中,终端可以是台式电脑等具有通信功能的电子设备。
参阅图5,该电子设备500包括通过系统总线501连接的处理器502、存储器、网络接口505和音频输入接口506,其中,存储器可以包括非易失性存储介质503和内存储器504。
该非易失性存储介质503可存储操作系统5031和计算机程序5032。该计算机程序5032包括程序指令,该程序指令被执行时,可使得处理器502执行一种上述声纹识别处理方法。
该处理器502用于提供计算和控制能力,以支撑整个电子设备500的运行。
该内存储器504为非易失性存储介质503中的计算机程序5032的运行提供环境,该计算机程序5032被处理器502执行时,可使得处理器502执行一种上述声纹识别处理方法。
该网络接口505用于与其它设备进行网络通信,该音频输入接口506用于获取被识别者提供的语音,所述音频输入接口506可以为话筒(麦克风)等。本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的电子设备500的限定,具体的电子设备500可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
其中,所述处理器502用于运行存储在存储器中的计算机程序5032,以实现如下步骤:若获得识别声纹的指令,输出包含第一随机码的提示信息,所述提示信息是指用于对被识别者提供的语音应包含的内容作出提示的信息;获取被识别者提供的包含所述第一随机码的语音;通过语音识别,将所述语音转换为文字,并提取所述文字中包含的第二随机码;以及使用所述第一随机码对所述第二随机码进行校验,若对所述第二随机码校验成功,进行声纹识别得到声纹识别结果。
在一实施例中,所述处理器502在实现上述步骤时,所述提示信息中还包括预设内容,所述第一随机码和所述预设内容的顺序在所述语音中被限定;
所述使用所述第一随机码对所述第二随机码进行校验,若对所述第二随机码校验成功,进行声纹识别得到声纹识别结果的步骤包括:使用所述第一随机码对所述第二随机码进行校验,若对所述第二随机码校验成功,根据所述预设内容进行声纹识别,得到声纹识别结果。
在一实施例中,所述处理器502在实现上述步骤时,所述若获得识别声纹的指令,输出包含第一随机码的提示信息的步骤还包括:所述提示信息中包含所述第一随机码在语音中的位置。
在一实施例中,所述处理器502在实现上述步骤时,所述提示信息中包含所述第一随机码在语音中的位置在每一次声纹识别时被随机限定。
在一实施例中,所述处理器502在实现上述步骤时,所述提示信息中还包括语音是预设时间长度内的语音。
应当理解,在本申请实施例中,处理器502可以是中央处理单元(CentralProcessing Unit,CPU),该处理器502还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
本领域普通技术人员可以理解的是实现上述实施例的方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成。该计算机程序包括程序指令,计算机程序可存储于一存储介质中,该存储介质为计算机可读存储介质。该程序指令被该计算机系统中的至少一个处理器执行,以实现上述方法的实施例的流程步骤。
因此,本发明还提供一种存储介质。该存储介质可以为计算机可读存储介质。该存储介质存储有计算机程序,其中计算机程序包括程序指令。该程序指令被处理器执行时使处理器执行如下步骤:
一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行以上各实施例中所描述的声纹识别处理方法的步骤。
所述存储介质可以是U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的计算机可读存储介质。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的。例如,各个单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
本申请实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。本申请实施例装置中的单元可以根据实际需要进行合并、划分和删减。另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。
该集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台电子设备(可以是个人计算机,终端,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。
以上所述,仅为本申请的具体实施方式,但本申请明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种声纹识别处理方法,其特征在于,所述方法包括:
若获得识别声纹的指令,输出包含第一随机码的提示信息,所述提示信息是指用于对被识别者提供的语音应包含的内容作出提示的信息;其中,所述提示信息还包含进行声纹识别的环境信息;
获取被识别者提供的包含所述第一随机码的语音;
通过语音识别,将所述语音转换为文字,并提取所述文字中包含的第二随机码;以及
使用所述第一随机码对所述第二随机码进行校验,若对所述第二随机码校验成功,进行声纹识别得到声纹识别结果。
2.根据权利要求1所述声纹识别处理方法,其特征在于,所述提示信息中还包括预设内容,所述第一随机码和所述预设内容的顺序在所述语音中被限定;
所述使用所述第一随机码对所述第二随机码进行校验,若对所述第二随机码校验成功,进行声纹识别得到声纹识别结果的步骤包括:
使用所述第一随机码对所述第二随机码进行校验,若对所述第二随机码校验成功,根据所述预设内容进行声纹识别,得到声纹识别结果。
3.根据权利要求1或者2所述声纹识别处理方法,其特征在于,所述若获得识别声纹的指令,输出包含第一随机码的提示信息的步骤还包括:
所述提示信息中包含所述第一随机码在语音中的位置。
4.根据权利要求3所述声纹识别处理方法,其特征在于,所述提示信息中包含所述第一随机码在语音中的位置在每一次声纹识别时被随机限定。
5.根据权利要求1或者2所述声纹识别处理方法,其特征在于,所述提示信息中还包括语音是预设时间长度内的语音。
6.一种声纹识别处理装置,其特征在于,所述装置包括:
输出单元,用于若获得识别声纹的指令,输出包含第一随机码的提示信息,所述提示信息是指用于对被识别者提供的语音应包含的内容作出提示的信息;其中,所述提示信息还包含进行声纹识别的环境信息;
获取单元,用于获取被识别者提供的包含所述第一随机码的语音;
提取单元,用于通过语音识别,将所述语音转换为文字,并提取所述文字中包含的第二随机码;以及
校验单元,用于使用所述第一随机码对所述第二随机码进行校验,若对所述第二随机码校验成功,进行声纹识别得到声纹识别结果。
7.根据权利要求6所述声纹识别处理装置,其特征在于,所述提示信息中还包括预设内容,所述第一随机码和所述预设内容的顺序在所述语音中被限定;
所述校验单元,用于使用所述第一随机码对所述第二随机码进行校验,若对所述第二随机码校验成功,根据所述预设内容进行声纹识别,得到声纹识别结果。
8.根据权利要求6或者7所述声纹识别处理装置,其特征在于,所述输出单元还用于所述提示信息中包含所述第一随机码在语音中的位置和所述语音是预设时间长度内的语音。
9.一种电子设备,其特征在于,所述电子设备包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现如权利要求1-5中任一项所述声纹识别处理方法。
10.一种存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时可实现如权利要求1-5中任一项所述声纹识别处理方法。
CN201810877973.1A 2018-08-03 2018-08-03 声纹识别处理方法、装置、电子设备及存储介质 Active CN109087647B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201810877973.1A CN109087647B (zh) 2018-08-03 2018-08-03 声纹识别处理方法、装置、电子设备及存储介质
PCT/CN2018/107954 WO2020024415A1 (zh) 2018-08-03 2018-09-27 声纹识别处理方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810877973.1A CN109087647B (zh) 2018-08-03 2018-08-03 声纹识别处理方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN109087647A CN109087647A (zh) 2018-12-25
CN109087647B true CN109087647B (zh) 2023-06-13

Family

ID=64833567

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810877973.1A Active CN109087647B (zh) 2018-08-03 2018-08-03 声纹识别处理方法、装置、电子设备及存储介质

Country Status (2)

Country Link
CN (1) CN109087647B (zh)
WO (1) WO2020024415A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110085228A (zh) * 2019-04-28 2019-08-02 广西盖德科技有限公司 语音码应用方法、应用客户端及系统
CN112309060A (zh) * 2019-08-02 2021-02-02 广东美的制冷设备有限公司 安防设备及其室内监控方法、控制装置和可读存储介质
CN115759649B (zh) * 2022-11-22 2024-03-29 北京丹灵云科技有限责任公司 一种警用物资人物互联安全管控方法

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030037004A1 (en) * 2001-08-14 2003-02-20 Chuck Buffum Dialog-based voiceprint security for business transactions
CN102413101A (zh) * 2010-09-25 2012-04-11 盛乐信息技术(上海)有限公司 声纹密码语音提示的声纹认证系统及其实现方法
CN102142254A (zh) * 2011-03-25 2011-08-03 北京得意音通技术有限责任公司 基于声纹识别和语音识别的防录音假冒的身份确认方法
CN102737634A (zh) * 2012-05-29 2012-10-17 百度在线网络技术(北京)有限公司 一种基于语音的认证方法及装置
CN102708867A (zh) * 2012-05-30 2012-10-03 北京正鹰科技有限责任公司 一种基于声纹和语音的防录音假冒身份识别方法及系统
CN102916815A (zh) * 2012-11-07 2013-02-06 华为终端有限公司 用户身份验证的方法和装置
CN103986725A (zh) * 2014-05-29 2014-08-13 中国农业银行股份有限公司 一种客户端、服务器端以及身份认证系统和方法
US10008208B2 (en) * 2014-09-18 2018-06-26 Nuance Communications, Inc. Method and apparatus for performing speaker recognition
CN105635087B (zh) * 2014-11-20 2019-09-20 阿里巴巴集团控股有限公司 通过声纹验证用户身份的方法及装置
CN105933272A (zh) * 2015-12-30 2016-09-07 中国银联股份有限公司 能够防止录音攻击的声纹认证方法、服务器、终端及系统
CN105913850B (zh) * 2016-04-20 2019-05-28 上海交通大学 文本相关声纹密码验证方法
CN106357411A (zh) * 2016-10-14 2017-01-25 深圳天珑无线科技有限公司 一种身份验证方法和装置
CN106506524B (zh) * 2016-11-30 2019-01-11 百度在线网络技术(北京)有限公司 用于验证用户的方法和装置
CN107068154A (zh) * 2017-03-13 2017-08-18 平安科技(深圳)有限公司 基于声纹识别的身份验证的方法及系统
CN107147499A (zh) * 2017-05-17 2017-09-08 刘光明 使用语音输入进行验证的方法和系统
CN107919961A (zh) * 2017-12-07 2018-04-17 广州势必可赢网络科技有限公司 一种基于动态码和动态声纹更新的身份认证协议及服务器

Also Published As

Publication number Publication date
CN109087647A (zh) 2018-12-25
WO2020024415A1 (zh) 2020-02-06

Similar Documents

Publication Publication Date Title
US10135818B2 (en) User biological feature authentication method and system
US9979721B2 (en) Method, server, client and system for verifying verification codes
CN106961418A (zh) 身份认证方法和身份认证系统
US9728191B2 (en) Speaker verification methods and apparatus
US8396711B2 (en) Voice authentication system and method
CN109087647B (zh) 声纹识别处理方法、装置、电子设备及存储介质
US9589560B1 (en) Estimating false rejection rate in a detection system
WO2019019743A1 (zh) 信息审核方法、装置、电子设备及计算机可读存储介质
US8606574B2 (en) Speech recognition processing system and speech recognition processing method
US20150046162A1 (en) Device, system, and method of liveness detection utilizing voice biometrics
US20030074201A1 (en) Continuous authentication of the identity of a speaker
US20090259468A1 (en) System and method for detecting synthetic speaker verification
KR20170003366A (ko) 성문 기반 통신 방법, 장치, 및 시스템
CN109462603A (zh) 基于盲检测的声纹认证方法、设备、存储介质及装置
CN110111798B (zh) 一种识别说话人的方法、终端及计算机可读存储介质
CN103078828A (zh) 一种云模式的语音鉴权系统
CN106330915A (zh) 语音验证处理方法及装置
KR101181060B1 (ko) 음성 인식 시스템 및 이를 이용한 화자 인증 방법
WO2016124008A1 (zh) 一种语音控制方法、装置及系统
CN111294642B (zh) 一种视频流播放方法及装置
CN108985035B (zh) 用户操作权限的控制方法、装置、存储介质及电子设备
US9894193B2 (en) Electronic device and voice controlling method
US11475113B2 (en) Voice modulation based voice authentication
CN113838469A (zh) 一种身份识别方法、系统及存储介质
CN111785280A (zh) 身份认证方法和装置、存储介质和电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant