CN114550726A - 一种声纹信息处理方法及装置 - Google Patents
一种声纹信息处理方法及装置 Download PDFInfo
- Publication number
- CN114550726A CN114550726A CN202210162532.XA CN202210162532A CN114550726A CN 114550726 A CN114550726 A CN 114550726A CN 202210162532 A CN202210162532 A CN 202210162532A CN 114550726 A CN114550726 A CN 114550726A
- Authority
- CN
- China
- Prior art keywords
- voiceprint
- signal
- sequence
- convolution
- authentication
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 55
- 238000003672 processing method Methods 0.000 title claims abstract description 37
- 108010076504 Protein Sorting Signals Proteins 0.000 claims abstract description 24
- 238000000034 method Methods 0.000 claims abstract description 20
- 239000011159 matrix material Substances 0.000 claims description 22
- 238000004590 computer program Methods 0.000 claims description 20
- 238000006243 chemical reaction Methods 0.000 claims description 7
- 238000010586 diagram Methods 0.000 description 23
- 230000005540 biological transmission Effects 0.000 description 17
- 238000004891 communication Methods 0.000 description 15
- 230000006870 function Effects 0.000 description 14
- 238000004422 calculation algorithm Methods 0.000 description 7
- 230000007613 environmental effect Effects 0.000 description 6
- 239000000872 buffer Substances 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L9/00—Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
- H04L9/32—Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols including means for verifying the identity or authority of a user of the system or for message authentication, e.g. authorization, entity authentication, data integrity or data verification, non-repudiation, key authentication or verification of credentials
- H04L9/3226—Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols including means for verifying the identity or authority of a user of the system or for message authentication, e.g. authorization, entity authentication, data integrity or data verification, non-repudiation, key authentication or verification of credentials using a predetermined code, e.g. password, passphrase or PIN
- H04L9/3231—Biological data, e.g. fingerprint, voice or retina
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Computer Security & Cryptography (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biodiversity & Conservation Biology (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Collating Specific Patterns (AREA)
Abstract
本申请提供一种声纹信息处理方法及装置,涉及声纹支付技术领域,也可用于金融领域,包括:根据待识别的声纹信号生成信号原始序列;对所述信号原始序列进行卷积处理,得到对应的信号卷积序列并发送至声纹认证服务器,以使所述声纹认证服务器根据所述信号卷积序列对所述声纹信号进行声纹认证。本申请能够准确验证用户的声纹信息,以便完成合法的声纹支付。
Description
技术领域
本申请涉及声纹支付技术领域,可以用于金融领域,具体是一种声纹信息处理方法及装置。
背景技术
金融机构的统一支付平台能够为客户提供支付清算服务。在进行支付清算前,统一支付平台一般会对客户所持有的账户进行身份认证。现有的身份认证方式包括声纹认证。
然而,目前的声纹信息在信道中传递时所采用的信道编码技术是线性分组码。线性分组码的编译码相对简单,封闭性好,但差错控制相对不佳,在恶劣环境中,信号可能受到影响而发生变化,最终影响身份认证效果。
发明内容
针对现有技术中的问题,本申请提供一种声纹信息处理方法及装置,能够准确验证用户的声纹信息,以便完成合法的声纹支付。
为解决上述技术问题,本申请提供以下技术方案:
第一方面,本申请提供一种声纹信息处理方法,包括:
根据待识别的声纹信号生成信号原始序列;
对所述信号原始序列进行卷积处理,得到对应的信号卷积序列并发送至声纹认证服务器,以使所述声纹认证服务器根据所述信号卷积序列对所述声纹信号进行声纹认证。
进一步地,所述根据待识别的声纹信号生成信号原始序列,包括:
对所述声纹信号进行模数转换,得到所述信号原始序列。
进一步地,所述对所述信号原始序列进行卷积处理,得到对应的信号卷积序列,包括:
根据所述信号原始序列确定对应的子生成多项式;
根据所述子生成多项式确定对应的子生成元;
根据所述子生成元确定子生成多项式矩阵;
根据所述信号原始序列及所述子生成多项式矩阵确定所述信号卷积序列。
进一步地,所述根据所述信号原始序列确定对应的子生成多项式,包括:
将所述信号原始序列输入加法器,得到对应的加法表达式;
将所述加法表达式输入编码器,得到所述子生成多项式。
进一步地,所述根据所述信号原始序列及所述子生成多项式矩阵确定所述信号卷积序列,包括:
将所述信号原始序列与所述子生成多项式矩阵相乘,得到所述信号卷积序列。
第二方面,本申请提供一种声纹信息处理方法,包括:
从客户端接收待识别的声纹信号对应的信号卷积序列;
根据所述信号卷积序列对所述声纹信号进行声纹认证;
根据声纹认证结果向所述客户端发送认证成功通知或重新认证指令。
进一步地,所述根据所述信号卷积序列对所述声纹信号进行声纹认证,包括:
在声纹信息数据库中搜索所述声纹信号对应的声纹合法信号;
比对所述信号卷积序列与所述声纹合法信号,得到所述声纹认证结果。
进一步地,所述比对所述信号卷积序列与所述声纹合法信号,得到所述声纹认证结果,包括:
比对所述信号卷积序列与所述声纹合法信号,得到差异位数;
根据所述差异位数及预设的阈值确定认证分值;
根据所述分值确定所述声纹认证结果。
第三方面,本申请提供一种声纹信息处理装置,包括:
原始序列生成单元,用于根据待识别的声纹信号生成信号原始序列;
卷积处理单元,用于对所述信号原始序列进行卷积处理,得到对应的信号卷积序列并发送至声纹认证服务器,以使所述声纹认证服务器根据所述信号卷积序列进行声纹认证。
进一步地,所述原始序列生成单元,用于:
对所述声纹信号进行模数转换,得到所述信号原始序列。
进一步地,所述卷积处理单元,包括:
多项式确定模块,用于根据所述信号原始序列确定对应的子生成多项式;
生成元确定模块,用于根据所述子生成多项式确定对应的子生成元;
矩阵确定模块,用于根据所述子生成元确定子生成多项式矩阵;
卷积序列确定模块,用于根据所述信号原始序列及所述子生成多项式矩阵确定所述信号卷积序列。
进一步地,所述多项式确定模块,包括:
表达式生成子模块,用于将所述信号原始序列输入加法器,得到对应的加法表达式;
多项式确定子模块,用于将所述加法表达式输入编码器,得到所述子生成多项式。
进一步地,所述卷积序列确定模块,用于:
将所述信号原始序列与所述子生成多项式矩阵相乘,得到所述信号卷积序列。
第四方面,本申请提供一种声纹信息处理装置,包括:
卷积序列接收单元,用于从客户端接收待识别的声纹信号对应的信号卷积序列;
声纹认证单元,用于根据所述信号卷积序列对所述声纹信号进行声纹认证;
认证结果发送单元,用于根据声纹认证结果向所述客户端发送认证成功通知或重新认证指令。
进一步地,所述声纹认证单元,包括:
合法信号搜索模块,用于在声纹信息数据库中搜索所述声纹信号对应的声纹合法信号;
认证结果生成模块,用于比对所述信号卷积序列与所述声纹合法信号,得到所述声纹认证结果。
进一步地,所述声纹认证单元,包括:
差异位数确定模块,用于比对所述信号卷积序列与所述声纹合法信号,得到差异位数;
认证分值确定模块,用于根据所述差异位数及预设的阈值确定认证分值;
声纹认证模块,用于根据所述分值确定所述声纹认证结果。
第五方面,本申请提供一种电子设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现所述声纹信息处理方法的步骤。
第六方面,本申请提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现所述声纹信息处理方法的步骤。
第七方面,本申请提供一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现所述的声纹信息处理方法的步骤。
针对现有技术中的问题,本申请提供的声纹信息处理方法及装置,能够在获取到待识别的用户声纹信号后,对声纹信号进行卷积处理,提高其在信道传输过程中的传输可靠性,降低误码率,进而优化差错控制。然后,将经过卷积处理的声纹信号与数据库保存的该用户的声纹合法信号对比,评分以判断待识别的用户声纹信号是否合法,进而达到在不同环境噪声下准确验证声纹的目的。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例中声纹信息处理方法的流程图之一;
图2为本申请实施例中得到信号卷积序列的流程图;
图3为本申请实施例中确定子生成多项式的流程图;
图4为本申请实施例中声纹信息处理方法的流程图之二;
图5为本申请实施例中进行声纹认证的流程图之一;
图6为本申请实施例中进行声纹认证的流程图之二;
图7为本申请实施例中声纹信息处理装置的结构图之一;
图8为本申请实施例中卷积处理单元的结构图;
图9为本申请实施例中多项式确定模块的结构图;
图10为本申请实施例中声纹信息处理装置的结构图之二;
图11为本申请实施例中声纹认证单元的结构图之一;
图12为本申请实施例中声纹认证单元的结构图之二;
图13为本申请实施例中的电子设备的结构示意图;
图14为本申请实施例中应用场景示意图;
图15为本申请实施例中卷积编码示意图之一;
图16为本申请实施例中卷积编码示意图之二;
图17为本申请实施例中卷积编码示意图之三。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
需要说明的是,本申请提供的声纹信息处理方法及装置,可用于金融领域,也可用于除金融领域之外的任意领域,本申请提供的声纹信息处理方法及装置的应用领域不做限定。
在线上金融服务越发普及的大背景下,为保障支付过程的资金安全,越来越多的支付场景使用到了密码认证、人脸识别认证、指纹认证及声纹识别认证等身份认证方式。然而,目前的声纹信息在信道中传递时所采用的信道编码技术是线性分组码,其差错控制相对不佳,在恶劣环境中,信号可能受到影响而发生变化,最终影响身份认证效果。
为了解决现有技术所存在的问题,一实施例中,参见图1,为了能够准确验证用户的声纹信息,以便完成合法的声纹支付,本申请提供一种声纹信息处理方法,包括:
S101:根据待识别的声纹信号生成信号原始序列;
S102:对信号原始序列进行卷积处理,得到对应的信号卷积序列并发送至声纹认证服务器,以使声纹认证服务器根据信号卷积序列对声纹信号进行声纹认证。
可以理解的是,本申请实施例的应用场景基于声纹识别技术实现,参见图14所示。客户端100包括但不限于个人计算机(PC)、平板计算机及手机等智能终端,用于使客户完成声纹录入,并对客户录入的声纹信息进行处理;也就是完成步骤S101至步骤S102。服务器200包括但不限于金融机构的后台服务器,用于接收客户端发送的待识别的声纹信息,并对其进行声纹认证,以及向客户端发送认证结果;也就是完成步骤S401至步骤S403。参见图4,一实施例中,一种声纹信息处理方法,包括:
S401:从客户端接收待识别的声纹信号对应的信号卷积序列;
S402:根据信号卷积序列对声纹信号进行声纹认证;
S403:根据声纹认证结果向客户端发送认证成功通知或重新认证指令。
具体实施时,①用户首先利用客户端100发起支付请求,此时客户端100上会出现声纹验证页面,该页面可以展现多位随机数字或其他随机内容,用户需要在预设时间内(如15秒内)完成朗读。下文以随机数字作为示例进行阐述,但本申请不以此为限。
②用户可以通过客户端100上的话筒录入对应的随机数字的语音信息,话筒将声音信息转换成信号电流,这种信号电流的频率及振幅变化的情况与声音的频率及振幅变化情况完全一样,“模仿”着信号的“一举一动”,得到声纹对应的模拟信号,也就是待识别的声纹信号S。一实施例中,根据待识别的声纹信号生成信号原始序列,包括:对声纹信号进行模数转换,得到信号原始序列。
③模拟信号S通过A/D模块(模数转换模块)可以转变为数字信号C序列,C可以是以二进制编码形式存在的一种编码序列。需要说明的是,用户合法的声纹信息,作为用户的合法性信息,需要预先保存在服务器200上,以便后续的声纹认证过程使用。
④上述数字信号C是以不同的二进制符号的形式存在的。本申请实施例中采用卷积编码作为信号在信道中传输时的信道编码方式。卷积算法的输入就是二进制形式的数字信号C,此时C作为卷积编码输入,每个bit依次输入到图15所示的输入端。其中,图15中的b1、b2、b3是寄存器,一实施例中,这些寄存器各自均存储有1bit符号且初始值均为0,下方的三个加法器有各自的输入数据及输出结果c1、c2、c3,将图示对应的寄存器及输入参加到每个加法器对应的计算上,可以得出每个加法器对应的结果,所以每1bit的输入对应c1 c2 c3这样3bit的输出。例如,输入一个1,则输出101,再输入一个0,则输出100,以此类推。如果声纹数字信号C序列为1010,则经过卷积以后的G序列可以是101100101100,位数为12位。
⑤将上述卷积结果G序列与服务器200的数据库中保存的该用户的合法声纹信息序列H比对,根据比对结果可以得出一个评分值grade,保存评分值。与数据库中存储的该用户的合法分临界值Max值进行对比,得出用户是否为合法用户。
⑥如果用户为合法用户,则将评分值及结果序列都保存在数据库中,继续完成后续的支付流程,展示支付结果给用户。
⑦如果用户为非法用户,则保存评分值,将结果及在预设时间内该用户所进行声纹认证的次数保存在数据库中。
⑧如果用户录音未超过预设次数(例如3次),则允许继续进行下一次语音录入,重复上述卷积算法、比对、评分及合法性判断的过程;如果用户超过预设次数(例如3次)则停止语音录入,退出系统。
从上述描述可知,本申请提供的声纹信息处理方法,能够在获取到待识别的用户声纹信号后,对声纹信号进行卷积处理,提高其在信道传输过程中的传输可靠性,降低误码率,进而优化差错控制。然后,将经过卷积处理的声纹信号与数据库保存的该用户的声纹合法信号对比,评分以判断待识别的用户声纹信号是否合法,进而达到在不同环境噪声下准确验证声纹的目的。
需要说明的是,本申请技术方案中对数据的获取、存储、使用、处理等均符合国家法律法规的相关规定。
一实施例中,参见图2,对信号原始序列进行卷积处理,得到对应的信号卷积序列,包括:
S201:根据信号原始序列确定对应的子生成多项式;
S202:根据子生成多项式确定对应的子生成元;
S203:根据子生成元确定子生成多项式矩阵;
S204:根据信号原始序列及子生成多项式矩阵确定信号卷积序列。
可以理解的是,参见图3,根据信号原始序列确定对应的子生成多项式,具体实施方式可为将信号原始序列输入加法器,得到对应的加法表达式(S301);然后将加法表达式输入编码器,得到子生成多项式(S302)。根据所述信号原始序列及所述子生成多项式矩阵确定所述信号卷积序列包括:将信号原始序列与子生成多项式矩阵相乘,得到信号卷积序列。
具体地,图16所示的为卷积码编码器的方框图。一实施例中,编码器包括三种主要元件,包括移存器、n个模2加法器及旋转开关。每个模2加法器的输入端数目可以不同,它连接到移存器的输出端。模2加法器的输出端接到旋转开关上。将时间分成等间隔的时隙,在每一个时隙中有k比特从左端进入移存器,并且移存器各级暂存的信息向右移k位。旋转开关每时隙旋转一周,输出n比特(n>k)。
图14为卷积码(3,1,3)卷积编码器的方框图。一实施例中,左边是信息的输入,右边是编码输出。中间有3级移存器、3个模2加法器及一个旋转开关。每个时隙中,只有1bit输入信息进入移存器,并且移存器各级暂存的内容向右移1位,开关旋转一周输出3比特。其中k=1,n=3,故码率R=1/3。约束长度nN=9。
参见图17,可以按照以下流程确定信号卷积序列:
1、获取了用户的声纹录入电信号,通过模数转换处理将其转换为数字信号C序列。下文以C=10111举例。
2、假设进行卷积处理时所使用的调制器里所使用的卷积码编码器的电路图如图17所示,一个(2,1,2)的卷积码编码器。
(1)声纹的数字信号C序列:C=10111,按照次幂从0开始递增,从左往右顺序,C(x)=1×x+0×x1+1×x2+1×x3+1×x4其多项式表示为C(x)=1+x2+x3+x4。
(2)按照卷积码编码器的连接方位
上方加法器由左、中、右三个输入组成,子生成多项式:g(1,1)(x)=1+x+x2;
下方加法器由左、右两个输入组成,子生成多项式:g(1,2)(x)=1+x2。
(3)根据上述子生成多项式,写成二进制的形式,即得到子生成元g(1,1)=(111)和g(1,2)=(101)。
(4)生成多项式矩阵G(x)=[g(1,1)(x),g(1,2)(x)]
G(x)=[1+x+x2,1+x2]
其中c(1)(x)=C(x)g(1,1)(x)和c(2)(x)=C(x)g(1,2)(x)
c(1)(x)=C(x)g(1,1)(x)=(1+x2+x3+x4)(1+x+x2)=1+x+x4+x6
写成二进制形式为c1=1100101
c(2)(x)=C(x)g(1,2)(x)=(1+x2+x3+x4)(1+x2)=1+x3+x5+x6
写成二进制形式为c2=1001011
两路合并:c=11100001100111
(6)根据上述(5)得出计算的卷积结果c=11100001100111。
3、将卷积结果G送进服务器200,卷积结果G需要与服务器中已经缓存的合格的该用户的声纹序列H=11100001011111进行位数比对。例如,一实施例中,发现有3位不同,可以打分grade=96分,符合打分合格的分值区间。
4、服务器根据打分结果grade判定为声纹合格,给客户端返一个合格的标志,代表该声纹比对通过;否则可以返回重新录入声纹的通知;一实施例中,参见图5,根据信号卷积序列对声纹信号进行声纹认证,包括:S501:在声纹信息数据库中搜索声纹信号对应的声纹合法信号;S502:比对信号卷积序列与声纹合法信号,得到声纹认证结果。
5、客户端100可以展示声纹通过的成功结果页或重新录入声纹的通知。
从上述描述可知,本申请提供的声纹信息处理方法,能够对信号原始序列进行卷积处理,得到对应的信号卷积序列。
一实施例中,参见图6,比对信号卷积序列与声纹合法信号,得到声纹认证结果,包括:
S601:比对信号卷积序列与声纹合法信号,得到差异位数;
S602:根据差异位数及预设的阈值确定认证分值;
S603:根据分值确定声纹认证结果。
可以理解的是,声纹卷积序列(例如100100010101110111)是线性非分组码,也就是卷积码,其具有在信道中传输的高可靠性及低误码率。将该声纹卷积序列与之前记录的合法用户的信息码字H序列(合法声纹序列)进行比对,可以根据对比出来不一样的位数的个数得出评分grade,比如全部匹配是100分,有1位不同是99分,有2位不同是98分……以此类推。
对于每一个用户,其根据用户ID均在服务器200存储有合法的语音分值,也就是合法用户的临界分值Max,评分与该临界分值相比较,如果该评分大于Max,则符合合法用户,认证通过。如果评分低于Max,则判断该语音是非法的,认证失败。
一实施例中,评分表可以如下表1所示:
表1
考虑到误码率不能过高,对比错误位数不应超过6位,所以评分最好是90分为比较好的分数。
经过上述的比对,Max值本身在90分到100分之间,所以如果用户的声纹卷积序列与合法序列(H)的比对得分在90-100分之间,一般都可以认为是合法声纹,低于90分一般认为是非法声纹,此时可以请用户重新录入声纹。
从上述描述可知,本申请提供的声纹信息处理方法,能够在获取到待识别的用户声纹信号后,对声纹信号进行卷积处理,提高其在信道传输过程中的传输可靠性,降低误码率,进而优化差错控制。然后,将经过卷积处理的声纹信号与数据库保存的该用户的声纹合法信号对比,评分以判断待识别的用户声纹信号是否合法,进而达到在不同环境噪声下准确验证声纹的目的。
本发明至少具有如下的有益效果:
1、本发明提出使用信道卷积算法取代声纹信息在信道中传输时采用的线性分组码编码的算法。卷积码是一种线性非分组算法,可以提高信息传输的可靠性,也就是降低传输过程中的误码率。在获取用户声纹信息后,在信道传输中采用卷积算法,用以提高声音信息在信道中传输的可靠性,得到更加低的误码率,进而得到更加优化的差错控制编码。
2、本发明基于卷积算法提出一种判断声纹信息合法性及准确性的方案:将用户的声纹信息做卷积编码后与数据库已经保存的该用户的声纹信息之间做差错对比,根据对比得出对应的评分值,通过评分值高低,判断用户的声纹信息是否合法,进而达到在不同环境噪声下准确验证声纹的目的。
基于同一发明构思,本申请实施例还提供了一种声纹信息处理装置,可以用于实现上述实施例所描述的方法,如下面的实施例所述。由于声纹信息处理装置解决问题的原理与声纹信息处理方法相似,因此声纹信息处理装置的实施可以参见基于软件性能基准确定方法的实施,重复之处不再赘述。以下所使用的,术语“单元”或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的系统较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
一实施例中,参见图7,本申请提供一种声纹信息处理装置,包括:原始序列生成单元701及卷积处理单元702。
原始序列生成单元701,用于根据待识别的声纹信号生成信号原始序列;
卷积处理单元702,用于对所述信号原始序列进行卷积处理,得到对应的信号卷积序列并发送至声纹认证服务器,以使所述声纹认证服务器根据所述信号卷积序列进行声纹认证。
一实施例中,所述原始序列生成单元,用于:
对所述声纹信号进行模数转换,得到所述信号原始序列。
进一步地,参见图8,所述卷积处理单元702,包括:多项式确定模块801、生成元确定模块802、矩阵确定模块803及卷积序列确定模块804。
多项式确定模块801,用于根据所述信号原始序列确定对应的子生成多项式;
生成元确定模块802,用于根据所述子生成多项式确定对应的子生成元;
矩阵确定模块803,用于根据所述子生成元确定子生成多项式矩阵;
卷积序列确定模块804,用于根据所述信号原始序列及所述子生成多项式矩阵确定所述信号卷积序列。
进一步地,参见图9,所述多项式确定模块801,包括:表达式生成子模块901及多项式确定子模块902。
表达式生成子模块901,用于将所述信号原始序列输入加法器,得到对应的加法表达式;
多项式确定子模块902,用于将所述加法表达式输入编码器,得到所述子生成多项式。
进一步地,所述卷积序列确定模块,用于:
将所述信号原始序列与所述子生成多项式矩阵相乘,得到所述信号卷积序列。
一实施例中,参见图10,本申请提供一种声纹信息处理装置,包括:卷积序列接收单元1001、声纹认证单元1002及认证结果发送单元1003。
卷积序列接收单元1001,用于从客户端接收待识别的声纹信号对应的信号卷积序列;
声纹认证单元1002,用于根据所述信号卷积序列对所述声纹信号进行声纹认证;
认证结果发送单元1003,用于根据声纹认证结果向所述客户端发送认证成功通知或重新认证指令。
一实施例中,参见图11,所述声纹认证单元1002,包括:合法信号搜索模块1101及认证结果生成模块1102。
合法信号搜索模块1101,用于在声纹信息数据库中搜索所述声纹信号对应的声纹合法信号;
认证结果生成模块1102,用于比对所述信号卷积序列与所述声纹合法信号,得到所述声纹认证结果。
一实施例中,参见图12,所述声纹认证单元1002,包括:差异位数确定模块1201、认证分值确定模块1202及声纹认证模块1203。
差异位数确定模块1201,用于比对所述信号卷积序列与所述声纹合法信号,得到差异位数;
认证分值确定模块1202,用于根据所述差异位数及预设的阈值确定认证分值;
声纹认证模块1203,用于根据所述分值确定所述声纹认证结果。
从硬件层面来说,为了能够准确验证用户的声纹信息,以便完成合法的声纹支付,本申请提供一种用于实现所述声纹信息处理方法中的全部或部分内容的电子设备的实施例,所述电子设备具体包含有如下内容:
处理器(Processor)、存储器(Memory)、通讯接口(Communications Interface)和总线;其中,所述处理器、存储器、通讯接口通过所述总线完成相互间的通讯;所述通讯接口用于实现所述声纹信息处理装置与核心业务系统、用户终端以及相关数据库等相关设备之间的信息传输;该逻辑控制器可以是台式计算机、平板电脑及移动终端等,本实施例不限于此。在本实施例中,该逻辑控制器可以参照实施例中的声纹信息处理方法的实施例,以及声纹信息处理装置的实施例进行实施,其内容被合并于此,重复之处不再赘述。
可以理解的是,所述用户终端可以包括智能手机、平板电子设备、网络机顶盒、便携式计算机、台式电脑、个人数字助理(PDA)、车载设备、智能穿戴设备等。其中,所述智能穿戴设备可以包括智能眼镜、智能手表、智能手环等。
在实际应用中,声纹信息处理方法的部分可以在如上述内容所述的电子设备侧执行,也可以所有的操作都在所述客户端设备中完成。具体可以根据所述客户端设备的处理能力,以及用户使用场景的限制等进行选择。本申请对此不作限定。若所有的操作都在所述客户端设备中完成,所述客户端设备还可以包括处理器。
上述的客户端设备可以具有通讯模块(即通讯单元),可以与远程的服务器进行通讯连接,实现与所述服务器的数据传输。所述服务器可以包括任务调度中心一侧的服务器,其他的实施场景中也可以包括中间平台的服务器,例如与任务调度中心服务器有通讯链接的第三方服务器平台的服务器。所述的服务器可以包括单台计算机设备,也可以包括多个服务器组成的服务器集群,或者分布式装置的服务器结构。
图13为本申请实施例的电子设备9600的系统构成的示意框图。如图13所示,该电子设备9600可以包括中央处理器9100和存储器9140;存储器9140耦合到中央处理器9100。值得注意的是,该图13是示例性的;还可以使用其他类型的结构,来补充或代替该结构,以实现电信功能或其他功能。
一实施例中,声纹信息处理方法功能可以被集成到中央处理器9100中。其中,中央处理器9100可以被配置为进行如下控制:
S101:根据待识别的声纹信号生成信号原始序列;
S102:对所述信号原始序列进行卷积处理,得到对应的信号卷积序列并发送至声纹认证服务器,以使所述声纹认证服务器根据所述信号卷积序列对所述声纹信号进行声纹认证。
从上述描述可知,本申请提供的声纹信息处理方法,能够在获取到待识别的用户声纹信号后,对声纹信号进行卷积处理,提高其在信道传输过程中的传输可靠性,降低误码率,进而优化差错控制。然后,将经过卷积处理的声纹信号与数据库保存的该用户的声纹合法信号对比,评分以判断待识别的用户声纹信号是否合法,进而达到在不同环境噪声下准确验证声纹的目的。
在另一个实施方式中,声纹信息处理装置可以与中央处理器9100分开配置,例如可以将数据复合传输装置声纹信息处理装置配置为与中央处理器9100连接的芯片,通过中央处理器的控制来实现声纹信息处理方法的功能。
如图13所示,该电子设备9600还可以包括:通讯模块9110、输入单元9120、音频处理器9130、显示器9160、电源9170。值得注意的是,电子设备9600也并不是必须要包括图13中所示的所有部件;此外,电子设备9600还可以包括图13中没有示出的部件,可以参考现有技术。
如图13所示,中央处理器9100有时也称为控制器或操作控件,可以包括微处理器或其他处理器装置和/或逻辑装置,该中央处理器9100接收输入并控制电子设备9600的各个部件的操作。
其中,存储器9140,例如可以是缓存器、闪存、硬驱、可移动介质、易失性存储器、非易失性存储器或其它合适装置中的一种或更多种。可储存上述与失败有关的信息,此外还可存储执行有关信息的程序。并且中央处理器9100可执行该存储器9140存储的该程序,以实现信息存储或处理等。
输入单元9120向中央处理器9100提供输入。该输入单元9120例如为按键或触摸输入装置。电源9170用于向电子设备9600提供电力。显示器9160用于进行图像和文字等显示对象的显示。该显示器例如可为LCD显示器,但并不限于此。
该存储器9140可以是固态存储器,例如,只读存储器(ROM)、随机存取存储器(RAM)、SIM卡等。还可以是这样的存储器,其即使在断电时也保存信息,可被选择性地擦除且设有更多数据,该存储器的示例有时被称为EPROM等。存储器9140还可以是某种其它类型的装置。存储器9140包括缓冲存储器9141(有时被称为缓冲器)。存储器9140可以包括应用/功能存储部9142,该应用/功能存储部9142用于存储应用程序和功能程序或用于通过中央处理器9100执行电子设备9600的操作的流程。
存储器9140还可以包括数据存储部9143,该数据存储部9143用于存储数据,例如联系人、数字数据、图片、声音和/或任何其他由电子设备使用的数据。存储器9140的驱动程序存储部9144可以包括电子设备的用于通讯功能和/或用于执行电子设备的其他功能(如消息传送应用、通讯录应用等)的各种驱动程序。
通讯模块9110即为经由天线9111发送和接收信号的发送机/接收机9110。通讯模块(发送机/接收机)9110耦合到中央处理器9100,以提供输入信号和接收输出信号,这可以和常规移动通讯终端的情况相同。
基于不同的通讯技术,在同一电子设备中,可以设置有多个通讯模块9110,如蜂窝网络模块、蓝牙模块和/或无线局域网模块等。通讯模块(发送机/接收机)9110还经由音频处理器9130耦合到扬声器9131和麦克风9132,以经由扬声器9131提供音频输出,并接收来自麦克风9132的音频输入,从而实现通常的电信功能。音频处理器9130可以包括任何合适的缓冲器、解码器、放大器等。另外,音频处理器9130还耦合到中央处理器9100,从而使得可以通过麦克风9132能够在本机上录音,且使得可以通过扬声器9131来播放本机上存储的声音。
本申请的实施例还提供能够实现上述实施例中的执行主体为服务器或客户端的声纹信息处理方法中全部步骤的一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述实施例中的执行主体为服务器或客户端的声纹信息处理方法的全部步骤,例如,所述处理器执行所述计算机程序时实现下述步骤:
S101:根据待识别的声纹信号生成信号原始序列;
S102:对所述信号原始序列进行卷积处理,得到对应的信号卷积序列并发送至声纹认证服务器,以使所述声纹认证服务器根据所述信号卷积序列对所述声纹信号进行声纹认证。
从上述描述可知,本申请提供的声纹信息处理方法,能够在获取到待识别的用户声纹信号后,对声纹信号进行卷积处理,提高其在信道传输过程中的传输可靠性,降低误码率,进而优化差错控制。然后,将经过卷积处理的声纹信号与数据库保存的该用户的声纹合法信号对比,评分以判断待识别的用户声纹信号是否合法,进而达到在不同环境噪声下准确验证声纹的目的。
本领域内的技术人员应明白,本发明的实施例可提供为方法、装置、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(装置)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本发明中应用了具体实施例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (13)
1.一种声纹信息处理方法,其特征在于,包括:
根据待识别的声纹信号生成信号原始序列;
对所述信号原始序列进行卷积处理,得到对应的信号卷积序列并发送至声纹认证服务器,以使所述声纹认证服务器根据所述信号卷积序列对所述声纹信号进行声纹认证。
2.根据权利要求1所述的声纹信息处理方法,其特征在于,所述根据待识别的声纹信号生成信号原始序列,包括:
对所述声纹信号进行模数转换,得到所述信号原始序列。
3.根据权利要求1所述的声纹信息处理方法,其特征在于,所述对所述信号原始序列进行卷积处理,得到对应的信号卷积序列,包括:
根据所述信号原始序列确定对应的子生成多项式;
根据所述子生成多项式确定对应的子生成元;
根据所述子生成元确定子生成多项式矩阵;
根据所述信号原始序列及所述子生成多项式矩阵确定所述信号卷积序列。
4.根据权利要求3所述的声纹信息处理方法,其特征在于,所述根据所述信号原始序列确定对应的子生成多项式,包括:
将所述信号原始序列输入加法器,得到对应的加法表达式;
将所述加法表达式输入编码器,得到所述子生成多项式。
5.根据权利要求3所述的声纹信息处理方法,其特征在于,所述根据所述信号原始序列及所述子生成多项式矩阵确定所述信号卷积序列,包括:
将所述信号原始序列与所述子生成多项式矩阵相乘,得到所述信号卷积序列。
6.一种声纹信息处理方法,其特征在于,包括:
从客户端接收待识别的声纹信号对应的信号卷积序列;
根据所述信号卷积序列对所述声纹信号进行声纹认证;
根据声纹认证结果向所述客户端发送认证成功通知或重新认证指令。
7.根据权利要求6所述的声纹信息处理方法,其特征在于,所述根据所述信号卷积序列对所述声纹信号进行声纹认证,包括:
在声纹信息数据库中搜索所述声纹信号对应的声纹合法信号;
比对所述信号卷积序列与所述声纹合法信号,得到所述声纹认证结果。
8.根据权利要求7所述的声纹信息处理方法,其特征在于,所述比对所述信号卷积序列与所述声纹合法信号,得到所述声纹认证结果,包括:
比对所述信号卷积序列与所述声纹合法信号,得到差异位数;
根据所述差异位数及预设的阈值确定认证分值;
根据所述分值确定所述声纹认证结果。
9.一种声纹信息处理装置,其特征在于,包括:
原始序列生成单元,用于根据待识别的声纹信号生成信号原始序列;
卷积处理单元,用于对所述信号原始序列进行卷积处理,得到对应的信号卷积序列并发送至声纹认证服务器,以使所述声纹认证服务器根据所述信号卷积序列进行声纹认证。
10.一种声纹信息处理装置,其特征在于,包括:
卷积序列接收单元,用于从客户端接收待识别的声纹信号对应的信号卷积序列;
声纹认证单元,用于根据所述信号卷积序列对所述声纹信号进行声纹认证;
认证结果发送单元,用于根据声纹认证结果向所述客户端发送认证成功通知或重新认证指令。
11.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至8任一项所述的声纹信息处理方法的步骤。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至8任一项所述的声纹信息处理方法的步骤。
13.一种计算机程序产品,包括计算机程序/指令,其特征在于,该计算机程序/指令被处理器执行时实现权利要求1至8任一项所述的声纹信息处理方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210162532.XA CN114550726A (zh) | 2022-02-22 | 2022-02-22 | 一种声纹信息处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210162532.XA CN114550726A (zh) | 2022-02-22 | 2022-02-22 | 一种声纹信息处理方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114550726A true CN114550726A (zh) | 2022-05-27 |
Family
ID=81678507
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210162532.XA Pending CN114550726A (zh) | 2022-02-22 | 2022-02-22 | 一种声纹信息处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114550726A (zh) |
-
2022
- 2022-02-22 CN CN202210162532.XA patent/CN114550726A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5994136B2 (ja) | 認証システム及び認証方法 | |
CN110119643A (zh) | 二维码生成方法及装置、二维码识别方法及装置 | |
CN101998390B (zh) | 保证通信安全的方法及设备 | |
CN111931209B (zh) | 基于零知识证明的合同信息验证方法及装置 | |
CN103679000A (zh) | 用于远程删除关键信息的设备和方法 | |
US7512794B2 (en) | System and method for authentication | |
CN102017512A (zh) | 位置信息验证 | |
CN108540259B (zh) | 一种极化码编译码方法及装置 | |
CN115695051A (zh) | 一种基于异地网络平台架构的数据中心传输管理系统 | |
CN113055184B (zh) | 数据加解密方法及装置 | |
CN106788993A (zh) | 一种加密通信方法、装置及电子设备 | |
CN113191169A (zh) | 终端扫码登录方法、装置及系统 | |
CN114697117B (zh) | 基于定位信息的验证方法、装置、密码器及系统 | |
CN114550726A (zh) | 一种声纹信息处理方法及装置 | |
CN115422584A (zh) | 数据变形方法及装置 | |
CN106940851A (zh) | 一种基于条码的支付方法和系统 | |
KR102395697B1 (ko) | 회의록 생성이 가능한 화상 회의 시스템 서버 및 그 동작 방법 | |
CN115099930A (zh) | 金融业务数据处理方法及装置 | |
CN112948815A (zh) | 基于哈希匹配的离线弱密码核查方法及装置 | |
KR20180005578A (ko) | 정보 유출 탐지를 위한 장치 및 방법 | |
CN113342811A (zh) | HBase表格数据处理方法及装置 | |
CN113037487A (zh) | 文件加密数据处理方法及装置 | |
CN113538129B (zh) | 一种跨机构的隐私查询请求方法及装置 | |
CN114499761B (zh) | 数据识别方法、装置、电子设备和介质 | |
US20240097706A1 (en) | Decoding method and decoding device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |