CN115662444A - 基于人工智能的电子印章语音交互式应用方法及系统 - Google Patents

基于人工智能的电子印章语音交互式应用方法及系统 Download PDF

Info

Publication number
CN115662444A
CN115662444A CN202211597778.6A CN202211597778A CN115662444A CN 115662444 A CN115662444 A CN 115662444A CN 202211597778 A CN202211597778 A CN 202211597778A CN 115662444 A CN115662444 A CN 115662444A
Authority
CN
China
Prior art keywords
voice
user
recognition result
signal
denoising
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211597778.6A
Other languages
English (en)
Other versions
CN115662444B (zh
Inventor
苏琳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Huilang Times Technology Co Ltd
Original Assignee
Beijing Huilang Times Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Huilang Times Technology Co Ltd filed Critical Beijing Huilang Times Technology Co Ltd
Priority to CN202211597778.6A priority Critical patent/CN115662444B/zh
Publication of CN115662444A publication Critical patent/CN115662444A/zh
Application granted granted Critical
Publication of CN115662444B publication Critical patent/CN115662444B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Machine Translation (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于人工智能的电子印章语音交互式应用方法及系统,涉及语音分析技术领域。该方法包括:提取用户语音信号;对用户身份进行识别;利用基于阶梯式尺度分解的小波去噪方法,对用户语音信号进行深度去噪;利用基于多类别特定噪声加权的语音识别方法,对目标去噪语音信号进行识别,并确定高置信度语音识别结果;若高置信度语音识别结果的内容与语音提示信号的内容一致,则利用基于多语音编码的语音识别结果深度检验方法,对高置信度语音识别结果进行深度检验,生成检验结果。本发明利用多种方法相结合,进行多重精准识别,大大提高了用印安全性。

Description

基于人工智能的电子印章语音交互式应用方法及系统
技术领域
本发明涉及语音分析技术领域,具体而言,涉及一种基于人工智能的电子印章语音交互式应用方法及系统。
背景技术
随着科技的进步,电子印章越来越受到认可并被广泛应用,给政府部门、银行、企业、个人提供了巨大的便利。在电子印章的使用过程中,如果印章控制设备能够实现与用户之间的语音交互,会极大地方便用户使用。
尽管现有技术中已经将部分声纹识别技术、语音识别技术应用于电子印章的使用过程,但仍然存在一定的误差,导致用户无法精准地对电子印章的使用过程进行控制。随着人工智能领域技术的不断更新换代,越来越多的创新型声纹识别技术、语音识别技术能为电子印章的智能应用提供直接的支持。因此,提出一种基于人工智能的电子印章语音交互式应用方法及系统有非常重要的价值和意义。
发明内容
为了克服上述问题或者至少部分地解决上述问题,本发明实施例提供一种基于人工智能的电子印章语音交互式应用方法及系统,利用基于回声深度消除的多声纹识别互验方法、基于阶梯式尺度分解的小波去噪方法、基于多类别特定噪声加权的语音识别方法以及基于多语音编码的识别结果深度检验方法,进行多重精准识别,大大提高了用印安全性。
本发明的实施例是这样实现的:
第一方面,本发明实施例提供一种基于人工智能的电子印章语音交互式应用方法,包括以下步骤:
用户在使用电子印章的过程中,印章控制设备发出语音提示信号,采集用户的语音用印指令,提取用户语音信号;
根据用户语音信号利用基于回声深度消除的多声纹识别互验方法,对用户身份进行识别,生成身份识别结果;
根据身份识别结果判断该用户是否有用印权限,若有,则利用基于阶梯式尺度分解的小波去噪方法,对用户语音信号进行深度去噪,以得到目标去噪语音信号;
利用基于多类别特定噪声加权的语音识别方法,对目标去噪语音信号进行识别,以得到并根据多个目标语音识别结果确定高置信度语音识别结果;
若高置信度语音识别结果的内容与语音提示信号的内容一致,则利用基于多语音编码的语音识别结果深度检验方法,对高置信度语音识别结果进行深度检验,生成检验结果;
若检验结果为无误,则控制用印设备对对应的文件进行盖章。
为了解决现有技术中的问题,本发明利用基于回声深度消除的多声纹识别互验方法,更加精准地对用户身份进行了识别;利用基于阶梯式尺度分解的小波去噪方法,更有针对性地对用户语音信号进行了深度去噪;利用基于多类别特定噪声加权的语音识别方法,能够判别最终的语音识别结果是否为高置信度语音识别结果,如果最终的语音识别结果为高置信度语音识别结果,且该高置信度语音识别结果的具体内容也满足要求才可进行下一步,保证了用印过程的安全性。在此基础上,本发明还利用了基于多语音编码的识别结果深度检验方法,对高置信度语音识别结果进行了深度检验,保证了语音识别结果的准确性,也进一步提升了用印过程的安全性。
基于第一方面,在本发明的一些实施例中,上述根据用户语音信号利用基于回声深度消除的多声纹识别互验方法,对用户身份进行识别,生成身份识别结果的方法包括以下步骤:
利用回声消除模型对用户语音信号进行回声消除;
采用多种声纹识别模型对进行回声消除的用户语音信号进行识别,以得到多个声纹识别结果;
根据多个声纹识别结果确定用户身份,生成身份识别结果。
基于第一方面,在本发明的一些实施例中,上述利用基于阶梯式尺度分解的小波去噪方法,对用户语音信号进行深度去噪,以得到目标去噪语音信号的方法包括以下步骤:
S31、利用小波变换对用户语音信号进行多尺度分解,对每个尺度的高频系数进行阈值量化处理,再利用处理后的系数重构语音信号,以得到目标重构语音信号;
S32、对目标重构语音信号进行峰值信噪比检测,生成并根据峰值信噪比结果判断是否达到预置的去噪效果值,若是,则结束;反之,则进入步骤S31。
基于第一方面,在本发明的一些实施例中,上述利用基于多类别特定噪声加权的语音识别方法,对目标去噪语音信号进行识别,以得到并根据多个目标语音识别结果确定高置信度语音识别结果的方法包括以下步骤:
给目标去噪语音信号分别增加多种不同类别的噪声,并利用语音识别模型对加入噪声的目标去噪语音信号进行识别,以得到多个语音识别结果;
根据多个目标语音识别结果确定高置信度语音识别结果。
基于第一方面,在本发明的一些实施例中,上述利用基于多语音编码的语音识别结果深度检验方法,对高置信度语音识别结果进行深度检验,生成检验结果的方法包括以下步骤:
录入模板语音信号;
采用多种不同的编码方式分别对高置信度语音识别结果和模板语音信号进行编码,并计算不同编码方式下的高置信度语音识别结果和模板语音信号之间的相似度,以得到多个相似度结果;
根据多个相似度结果生成检验结果。
第二方面,本发明实施例提供一种基于人工智能的电子印章语音交互式应用系统,包括:语音采集模块、身份识别模块、去噪模块、识别模块、检验模块以及用印控制模块,其中:
语音采集模块,用于用户在使用电子印章的过程中,印章控制设备发出语音提示信号,采集用户的语音用印指令,提取用户语音信号;
身份识别模块,用于根据用户语音信号利用基于回声深度消除的多声纹识别互验方法,对用户身份进行识别,生成身份识别结果;
去噪模块,用于根据身份识别结果判断该用户是否有用印权限,若有,则利用基于阶梯式尺度分解的小波去噪方法,对用户语音信号进行深度去噪,以得到目标去噪语音信号;
识别模块,用于利用基于多类别特定噪声加权的语音识别方法,对目标去噪语音信号进行识别,以得到并根据多个目标语音识别结果确定高置信度语音识别结果;
检验模块,用于若高置信度语音识别结果的内容与语音提示信号的内容一致,则利用基于多语音编码的语音识别结果深度检验方法,对高置信度语音识别结果进行深度检验,生成检验结果;
用印控制模块,用于若检验结果为无误,则控制用印设备对对应的文件进行盖章。
为了解决现有技术中的问题,本系统通过语音采集模块、身份识别模块、去噪模块、识别模块、检验模块以及用印控制模块多个模块的结合,利用基于回声深度消除的多声纹识别互验方法,更加精准地对用户身份进行了识别;利用基于阶梯式尺度分解的小波去噪方法,更有针对性地对用户语音信号进行了深度去噪;利用基于多类别特定噪声加权的语音识别方法,能够判别最终的语音识别结果是否为高置信度语音识别结果,如果最终的语音识别结果为高置信度语音识别结果,且该高置信度语音识别结果的具体内容也满足要求才可进行下一步,保证了用印过程的安全性。在此基础上,还利用基于多语音编码的识别结果深度检验方法,对高置信度语音识别结果进行了深度检验,保证了语音识别结果的准确性,也进一步提升了用印过程的安全性。
第三方面,本申请实施例提供一种电子设备,其包括存储器,用于存储一个或多个程序;处理器。当一个或多个程序被处理器执行时,实现如上述第一方面中任一项的方法。
第四方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述第一方面中任一项的方法。
本发明实施例至少具有如下优点或有益效果:
本发明实施例提供一种基于人工智能的电子印章语音交互式应用方法及系统,利用基于回声深度消除的多声纹识别互验方法,更加精准地对用户身份进行了识别;利用基于阶梯式尺度分解的小波去噪方法,更有针对性地对用户语音信号进行了深度去噪;利用基于多类别特定噪声加权的语音识别方法,能够判别最终的语音识别结果是否为高置信度语音识别结果,如果最终的语音识别结果为高置信度语音识别结果,且该高置信度语音识别结果的具体内容也满足要求才可进行下一步,保证了用印过程的安全性。在此基础上,还利用基于多语音编码的识别结果深度检验方法,对高置信度语音识别结果进行了深度检验,保证了语音识别结果的准确性,也进一步提升了用印过程的安全性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例一种基于人工智能的电子印章语音交互式应用方法的流程图;
图2为本发明实施例一种基于人工智能的电子印章语音交互式应用方法中声纹识别验证的流程图;
图3为本发明实施例一种基于人工智能的电子印章语音交互式应用方法中信号去噪的流程图;
图4为本发明实施例一种基于人工智能的电子印章语音交互式应用系统的原理框图;
图5为本发明实施例提供的一种电子设备的结构框图。
附图标记说明:100、语音采集模块;200、身份识别模块;300、去噪模块;400、识别模块;500、检验模块;600、用印控制模块;101、存储器;102、处理器;103、通信接口。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
在本发明实施例的描述中,“多个”代表至少2个。
实施例:
如图1-图3所示,第一方面,本发明实施例提供一种基于人工智能的电子印章语音交互式应用方法,包括以下步骤:
S1、用户在使用电子印章的过程中,印章控制设备发出语音提示信号,采集用户的语音用印指令,提取用户语音信号;用户在使用电子印章的过程中,印章控制设备发出语音信号“请用户说出‘允许此文件使用电子印章’的语音用印指令”。用户听到后,根据要求说出语音用印指令“允许此文件使用电子印章”,印章控制设备对用户说出的语音信号进行提取。
S2、根据用户语音信号利用基于回声深度消除的多声纹识别互验方法,对用户身份进行识别,生成身份识别结果;
进一步地,如图2所示,包括:
S21、利用回声消除模型对用户语音信号进行回声消除;
S22、采用多种声纹识别模型对进行回声消除的用户语音信号进行识别,以得到多个声纹识别结果;
S23、根据多个声纹识别结果确定用户身份,生成身份识别结果。
在本发明的一些实施例中,利用基于回声深度消除的多声纹识别互验方法,对用户身份进行识别。身份识别之后,如果该用户有用印权限,继续进行下一步。
基于回声深度消除的多声纹识别互验方法具体包括:首先,利用回声消除模型对语音信号进行回声消除,在此基础上利用多种声纹识别技术对用户身份进行识别。当多种声纹识别模型识别结果相同时,对用户身份进行确认。例如,所有声纹识别模型都认定用户为“张三”,最终将用户认定为“张三”。上述回声消除模型和声纹识别模型均为常规算法模型,在此不再赘述。
S3、根据身份识别结果判断该用户是否有用印权限,若有,则利用基于阶梯式尺度分解的小波去噪方法,对用户语音信号进行深度去噪,以得到目标去噪语音信号;
进一步地,如图3所示,包括:
S31、利用小波变换对用户语音信号进行多尺度分解,对每个尺度的高频系数进行阈值量化处理,再利用处理后的系数重构语音信号,以得到目标重构语音信号;
S32、对目标重构语音信号进行峰值信噪比检测,生成并根据峰值信噪比结果判断是否达到预置的去噪效果值,若是,则结束;反之,则进入步骤S31。
在本发明的一些实施例中,利用基于阶梯式尺度分解的小波去噪方法,对语音信号进行深度去噪。具体包括:首先用小波变换对语音信号进行多尺度分解,对每个尺度的高频系数进行阈值量化处理,再利用处理后的系数重构语音信号。利用峰值信噪比等指标检测去噪效果,如果去噪效果达到实际要求,不再进行下一步。如果去噪效果没有达到实际要求,继续用小波变换对语音信号进行多尺度分解(尺度数和上一次不同),对每个尺度的高频系数进行阈值量化处理,再利用处理后的系数重构语音信号。利用峰值信噪比等指标检测去噪效果,如果去噪效果达到实际要求,则不再进行下一步。如果去噪效果没有达到实际要求,则按照上述思路继续进行处理,直到去噪效果达到实际要求。
S4、利用基于多类别特定噪声加权的语音识别方法,对目标去噪语音信号进行识别,以得到并根据多个目标语音识别结果确定高置信度语音识别结果;
进一步地,包括:给目标去噪语音信号分别增加多种不同类别的噪声,并利用语音识别模型对加入噪声的目标去噪语音信号进行识别,以得到多个语音识别结果;根据多个目标语音识别结果确定高置信度语音识别结果。
在本发明的一些实施例中,利用基于多类别特定噪声加权的语音识别方法,对语音信号进行识别。如果最终的语音识别结果被认定为高置信度语音识别结果(即所有的语音识别结果均相同,则认定为高置信度语音识别结果),且该高置信度语音识别结果的具体内容为“允许此文件使用电子印章”,则继续进行下一步。
基于多类别特定噪声加权的语音识别方法具体包括:
(a)给该语音信号增加噪声A,在此基础上利用语音识别模型对语音信号进行识别,得到语音识别结果A。
(b)给该语音信号增加噪声B,在此基础上利用语音识别模型对语音信号进行识别,得到语音识别结果B。
(c)给该语音信号增加噪声C,在此基础上利用语音识别模型对语音信号进行识别,得到语音识别结果C。
噪声A,B,C的噪声种类不同,分别对应周期噪声、脉冲噪声、缓变噪声、平稳噪声等多种噪声中的特定一种。在多个语音识别结果中(结果A,B,C),如果所有的语音识别结果均相同,则将最终的语音识别结果认定为高置信度语音识别结果。
S5、若高置信度语音识别结果的内容与语音提示信号的内容一致,则利用基于多语音编码的语音识别结果深度检验方法,对高置信度语音识别结果进行深度检验,生成检验结果;
进一步地,包括:录入模板语音信号;采用多种不同的编码方式分别对高置信度语音识别结果和模板语音信号进行编码,并计算不同编码方式下的高置信度语音识别结果和模板语音信号之间的相似度,以得到多个相似度结果;根据多个相似度结果生成检验结果。
在本发明的一些实施例中,利用基于多语音编码的语音识别结果深度检验方法,对高置信度语音识别结果进行深度检验,如检验后认定识别结果无误,最终由用印设备对该文件进行盖章。
基于多语音编码的识别结果深度检验方法具体包括:
提前制作好内容为“允许此文件使用电子印章”的语音模板信号,录入系统。
(a)用编码方式A对语音信号和模板语音信号分别进行编码,计算二者相似度,得到相似度A。
(b)用编码方式B对语音信号和模板语音信号分别进行编码,计算二者相似度,得到相似度B。
(c)用编码方式C对语音信号和模板语音信号分别进行编码,计算二者相似度,得到相似度C。
编码方式A,B,C各不相同,分别对应波形编码、参数编码和混合编码等多种编码方式中的特定一种。在多个相似度结果中(相似度A,B,C),如果所有的相似度都较高(高于预设的相似度阈值),则认定识别结果无误。
S6、若检验结果为无误,则控制用印设备对对应的文件进行盖章。
为了解决现有技术中的问题,本发明利用基于回声深度消除的多声纹识别互验方法,更加精准地对用户身份进行了识别;利用基于阶梯式尺度分解的小波去噪方法,更有针对性地对用户语音信号进行了深度去噪;利用基于多类别特定噪声加权的语音识别方法,能够判别最终的语音识别结果是否为高置信度语音识别结果,如果最终的语音识别结果为高置信度语音识别结果,且该高置信度语音识别结果的具体内容也满足要求才可进行下一步,保证了用印过程的安全性。在此基础上,本发明还利用了基于多语音编码的识别结果深度检验方法,对高置信度语音识别结果进行了深度检验,保证了语音识别结果的准确性,也进一步提升了用印过程的安全性。
如图4所示,第二方面,本发明实施例提供一种基于人工智能的电子印章语音交互式应用系统,包括:语音采集模块100、身份识别模块200、去噪模块300、识别模块400、置信度认定模块500、检验模块500以及用印控制模块600,其中:
语音采集模块100,用于用户在使用电子印章的过程中,印章控制设备发出语音提示信号,采集用户的语音用印指令,提取用户语音信号;
身份识别模块200,用于根据用户语音信号利用基于回声深度消除的多声纹识别互验方法,对用户身份进行识别,生成身份识别结果;
去噪模块300,用于根据身份识别结果判断该用户是否有用印权限,若有,则利用基于阶梯式尺度分解的小波去噪方法,对用户语音信号进行深度去噪,以得到目标去噪语音信号;
识别模块400,用于利用基于多类别特定噪声加权的语音识别方法,对目标去噪语音信号进行识别,以得到并根据多个目标语音识别结果确定高置信度语音识别结果;
检验模块500,用于若高置信度语音识别结果的内容与语音提示信号的内容一致,则利用基于多语音编码的语音识别结果深度检验方法,对高置信度语音识别结果进行深度检验,生成检验结果;
用印控制模块600,用于若检验结果为无误,则控制用印设备对对应的文件进行盖章。
为了解决现有技术中的问题,本系统通过语音采集模块100、身份识别模块200、去噪模块300、识别模块400、置信度认定模块500、检验模块500以及用印控制模块600多个模块的结合,利用基于回声深度消除的多声纹识别互验方法,更加精准地对用户身份进行了识别;利用基于阶梯式尺度分解的小波去噪方法,更有针对性地对用户语音信号进行了深度去噪;利用基于多类别特定噪声加权的语音识别方法,能够判别最终的语音识别结果是否为高置信度语音识别结果,如果最终的语音识别结果为高置信度语音识别结果,且该高置信度语音识别结果的具体内容也满足要求才可进行下一步,保证了用印过程的安全性。在此基础上,还利用基于多语音编码的识别结果深度检验方法,对高置信度语音识别结果进行了深度检验,保证了语音识别结果的准确性,也进一步提升了用印过程的安全性。
如图5所示,第三方面,本申请实施例提供一种电子设备,其包括存储器101,用于存储一个或多个程序;处理器102。当一个或多个程序被处理器102执行时,实现如上述第一方面中任一项的方法。
还包括通信接口103,该存储器101、处理器102和通信接口103相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。存储器101可用于存储软件程序及模块,处理器102通过执行存储在存储器101内的软件程序及模块,从而执行各种功能应用以及数据处理。该通信接口103可用于与其他节点设备进行信令或数据的通信。
其中,存储器101可以是但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。
处理器102可以是一种集成电路芯片,具有信号处理能力。该处理器102可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(NetworkProcessor,NP)等;还可以是数字信号处理器(Digital Signal Processing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本申请所提供的实施例中,应该理解到,所揭露的方法及系统和方法,也可以通过其它的方式实现。以上所描述的方法及系统实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的方法及系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
第四方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器102执行时实现如上述第一方面中任一项的方法。所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random AccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
对于本领域技术人员而言,显然本申请不限于上述示范性实施例的细节,而且在不背离本申请的精神或基本特征的情况下,能够以其它的具体形式实现本申请。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本申请的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

Claims (8)

1.一种基于人工智能的电子印章语音交互式应用方法,其特征在于,包括以下步骤:
用户在使用电子印章的过程中,印章控制设备发出语音提示信号,采集用户的语音用印指令,提取用户语音信号;
根据用户语音信号利用基于回声深度消除的多声纹识别互验方法,对用户身份进行识别,生成身份识别结果;
根据身份识别结果判断该用户是否有用印权限,若有,则利用基于阶梯式尺度分解的小波去噪方法,对用户语音信号进行深度去噪,以得到目标去噪语音信号;
利用基于多类别特定噪声加权的语音识别方法,对目标去噪语音信号进行识别,以得到并根据多个目标语音识别结果确定高置信度语音识别结果;
若高置信度语音识别结果的内容与语音提示信号的内容一致,则利用基于多语音编码的语音识别结果深度检验方法,对高置信度语音识别结果进行深度检验,生成检验结果;
若检验结果为无误,则控制用印设备对对应的文件进行盖章。
2.根据权利要求1所述的一种基于人工智能的电子印章语音交互式应用方法,其特征在于,所述根据用户语音信号利用基于回声深度消除的多声纹识别互验方法,对用户身份进行识别,生成身份识别结果的方法包括以下步骤:
利用回声消除模型对用户语音信号进行回声消除;
采用多种声纹识别模型对进行回声消除的用户语音信号进行识别,以得到多个声纹识别结果;
根据多个声纹识别结果确定用户身份,生成身份识别结果。
3.根据权利要求1所述的一种基于人工智能的电子印章语音交互式应用方法,其特征在于,所述利用基于阶梯式尺度分解的小波去噪方法,对用户语音信号进行深度去噪,以得到目标去噪语音信号的方法包括以下步骤:
S31、利用小波变换对用户语音信号进行多尺度分解,对每个尺度的高频系数进行阈值量化处理,再利用处理后的系数重构语音信号,以得到目标重构语音信号;
S32、对目标重构语音信号进行峰值信噪比检测,生成并根据峰值信噪比结果判断是否达到预置的去噪效果值,若是,则结束;反之,则进入步骤S31。
4.根据权利要求1所述的一种基于人工智能的电子印章语音交互式应用方法,其特征在于,所述利用基于多类别特定噪声加权的语音识别方法,对目标去噪语音信号进行识别,以得到并根据多个目标语音识别结果确定高置信度语音识别结果的方法包括以下步骤:
给目标去噪语音信号分别增加多种不同类别的噪声,并利用语音识别模型对加入噪声的目标去噪语音信号进行识别,以得到多个目标语音识别结果;
根据多个目标语音识别结果确定高置信度语音识别结果。
5.根据权利要求1所述的一种基于人工智能的电子印章语音交互式应用方法,其特征在于,所述利用基于多语音编码的语音识别结果深度检验方法,对高置信度语音识别结果进行深度检验,生成检验结果的方法包括以下步骤:
录入模板语音信号;
采用多种不同的编码方式分别对高置信度语音识别结果和模板语音信号进行编码,并计算不同编码方式下的高置信度语音识别结果和模板语音信号之间的相似度,以得到多个相似度结果;
根据多个相似度结果生成检验结果。
6.一种基于人工智能的电子印章语音交互式应用系统,其特征在于,包括:语音采集模块、身份识别模块、去噪模块、识别模块、检验模块以及用印控制模块,其中:
语音采集模块,用于用户在使用电子印章的过程中,印章控制设备发出语音提示信号,采集用户的语音用印指令,提取用户语音信号;
身份识别模块,用于根据用户语音信号利用基于回声深度消除的多声纹识别互验方法,对用户身份进行识别,生成身份识别结果;
去噪模块,用于根据身份识别结果判断该用户是否有用印权限,若有,则利用基于阶梯式尺度分解的小波去噪方法,对用户语音信号进行深度去噪,以得到目标去噪语音信号;
识别模块,用于利用基于多类别特定噪声加权的语音识别方法,对目标去噪语音信号进行识别,以得到并根据多个目标语音识别结果确定高置信度语音识别结果;
检验模块,用于若高置信度语音识别结果的内容与语音提示信号的内容一致,则利用基于多语音编码的语音识别结果深度检验方法,对高置信度语音识别结果进行深度检验,生成检验结果;
用印控制模块,用于若检验结果为无误,则控制用印设备对对应的文件进行盖章。
7.一种电子设备,其特征在于,包括:
存储器,用于存储一个或多个程序;
处理器;
当所述一个或多个程序被所述处理器执行时,实现如权利要求1-5中任一项所述的方法。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1-5中任一项所述的方法。
CN202211597778.6A 2022-12-14 2022-12-14 基于人工智能的电子印章语音交互式应用方法及系统 Active CN115662444B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211597778.6A CN115662444B (zh) 2022-12-14 2022-12-14 基于人工智能的电子印章语音交互式应用方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211597778.6A CN115662444B (zh) 2022-12-14 2022-12-14 基于人工智能的电子印章语音交互式应用方法及系统

Publications (2)

Publication Number Publication Date
CN115662444A true CN115662444A (zh) 2023-01-31
CN115662444B CN115662444B (zh) 2023-04-07

Family

ID=85019979

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211597778.6A Active CN115662444B (zh) 2022-12-14 2022-12-14 基于人工智能的电子印章语音交互式应用方法及系统

Country Status (1)

Country Link
CN (1) CN115662444B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115862641A (zh) * 2023-02-16 2023-03-28 北京惠朗时代科技有限公司 基于区块链的印控仪智能启动和安全应用方法及系统
CN117133271A (zh) * 2023-10-25 2023-11-28 北京吉道尔科技有限公司 基于区块链的电商平台购物和智能语音评价方法及系统

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101271690A (zh) * 2008-05-09 2008-09-24 中国人民解放军重庆通信学院 保护音频数据的音频扩频水印处理方法
US20090125310A1 (en) * 2006-06-21 2009-05-14 Seungjae Lee Apparatus and method for inserting/extracting capturing resistant audio watermark based on discrete wavelet transform, audio rights protection system using the same
CN101827256A (zh) * 2009-03-06 2010-09-08 新奥特硅谷视频技术有限责任公司 一种基于声纹认证和数字水印的远程数字化庭审方法
CN102359815A (zh) * 2011-07-08 2012-02-22 中国人民解放军理工大学工程兵工程学院 一种基于小波分形组合的爆破振动信号特征提取方法
CN110648673A (zh) * 2019-08-21 2020-01-03 珠海思格特智能系统有限公司 一种用于智能印章机的语音识别方法及其系统
CN110931037A (zh) * 2019-04-25 2020-03-27 南京师范大学 改进的Mel频率尺度与耳语音共振峰结合的耳语音增强算法
CN111312259A (zh) * 2020-02-17 2020-06-19 厦门快商通科技股份有限公司 声纹识别方法、系统、移动终端及存储介质
CN112530451A (zh) * 2020-10-20 2021-03-19 国网黑龙江省电力有限公司伊春供电公司 基于去噪自编码器的语音增强方法
CN113436634A (zh) * 2021-07-30 2021-09-24 中国平安人寿保险股份有限公司 基于声纹识别的语音分类方法、装置及相关设备
CN114186577A (zh) * 2020-08-27 2022-03-15 江苏金恒信息科技股份有限公司 一种基于小波变换的振动加速度信号去噪方法及装置
CN115019804A (zh) * 2022-08-03 2022-09-06 北京惠朗时代科技有限公司 一种多员工密集签到的多重校验式声纹识别方法及系统
CN115035903A (zh) * 2022-08-10 2022-09-09 杭州海康威视数字技术股份有限公司 一种物理语音水印的注入方法、语音溯源方法及装置

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090125310A1 (en) * 2006-06-21 2009-05-14 Seungjae Lee Apparatus and method for inserting/extracting capturing resistant audio watermark based on discrete wavelet transform, audio rights protection system using the same
CN101271690A (zh) * 2008-05-09 2008-09-24 中国人民解放军重庆通信学院 保护音频数据的音频扩频水印处理方法
CN101827256A (zh) * 2009-03-06 2010-09-08 新奥特硅谷视频技术有限责任公司 一种基于声纹认证和数字水印的远程数字化庭审方法
CN102359815A (zh) * 2011-07-08 2012-02-22 中国人民解放军理工大学工程兵工程学院 一种基于小波分形组合的爆破振动信号特征提取方法
CN110931037A (zh) * 2019-04-25 2020-03-27 南京师范大学 改进的Mel频率尺度与耳语音共振峰结合的耳语音增强算法
CN110648673A (zh) * 2019-08-21 2020-01-03 珠海思格特智能系统有限公司 一种用于智能印章机的语音识别方法及其系统
CN111312259A (zh) * 2020-02-17 2020-06-19 厦门快商通科技股份有限公司 声纹识别方法、系统、移动终端及存储介质
CN114186577A (zh) * 2020-08-27 2022-03-15 江苏金恒信息科技股份有限公司 一种基于小波变换的振动加速度信号去噪方法及装置
CN112530451A (zh) * 2020-10-20 2021-03-19 国网黑龙江省电力有限公司伊春供电公司 基于去噪自编码器的语音增强方法
CN113436634A (zh) * 2021-07-30 2021-09-24 中国平安人寿保险股份有限公司 基于声纹识别的语音分类方法、装置及相关设备
CN115019804A (zh) * 2022-08-03 2022-09-06 北京惠朗时代科技有限公司 一种多员工密集签到的多重校验式声纹识别方法及系统
CN115035903A (zh) * 2022-08-10 2022-09-09 杭州海康威视数字技术股份有限公司 一种物理语音水印的注入方法、语音溯源方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张振领;贾仰理;: "基于支持向量机和小波分析的说话人识别研究" *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115862641A (zh) * 2023-02-16 2023-03-28 北京惠朗时代科技有限公司 基于区块链的印控仪智能启动和安全应用方法及系统
CN115862641B (zh) * 2023-02-16 2023-04-28 北京惠朗时代科技有限公司 基于区块链的印控仪智能启动和安全应用方法及系统
CN117133271A (zh) * 2023-10-25 2023-11-28 北京吉道尔科技有限公司 基于区块链的电商平台购物和智能语音评价方法及系统

Also Published As

Publication number Publication date
CN115662444B (zh) 2023-04-07

Similar Documents

Publication Publication Date Title
CN106683680B (zh) 说话人识别方法及装置、计算机设备及计算机可读介质
CN111081279A (zh) 语音情绪波动分析方法及装置
KR20170053525A (ko) 뉴럴 네트워크 학습 장치 및 방법과, 음성 인식 장치 및 방법
CN110265037B (zh) 身份验证方法、装置、电子设备及计算机可读存储介质
CN108492830B (zh) 声纹识别方法、装置、计算机设备和存储介质
WO2019019743A1 (zh) 信息审核方法、装置、电子设备及计算机可读存储介质
KR100192854B1 (ko) 음성인식의 잡음강도를 개선하기 위한 스텍트랄 추정 방법
JP2022536189A (ja) オリジナル音声の声紋を認識する方法、装置、設備および記憶媒体
CN115662444B (zh) 基于人工智能的电子印章语音交互式应用方法及系统
CN113886792A (zh) 一种声纹识别和人脸识别相结合的印控仪应用方法和系统
Kotropoulos Source phone identification using sketches of features
KR20210074748A (ko) 도메인 적응에 기반한 네트워크의 트레이닝 방법, 동작 방법 및 동작 장치
JP6553015B2 (ja) 話者属性推定システム、学習装置、推定装置、話者属性推定方法、およびプログラム
CN115860882A (zh) 基于区块链的智慧城市商品大数据智能选购方法及系统
CN111353514A (zh) 模型训练方法、图像识别方法、装置及终端设备
Lee et al. Many-to-many unsupervised speech conversion from nonparallel corpora
CN116884428A (zh) 基于区块链的线上诊疗及音视频数据智能优化方法和系统
CN111028833B (zh) 一种交互、车辆的交互方法、装置
CN116543373B (zh) 基于区块链的直播视频大数据智能分析和优化方法及系统
CN111897851A (zh) 异常数据的确定方法、装置、电子设备及可读存储介质
CN115019804B (zh) 一种多员工密集签到的多重校验式声纹识别方法及系统
CN116723343B (zh) 基于区块链的网络直播大数据智能监测和存储方法及系统
CN114664313A (zh) 语音识别方法、装置、计算机设备、存储介质和程序产品
CN117133271B (zh) 基于区块链的电商平台购物和智能语音评价方法及系统
CN111898531A (zh) 卫星通信信号识别方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant