CN114419740A - 基于人工智能的活体检测方法、装置、设备及存储介质 - Google Patents
基于人工智能的活体检测方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN114419740A CN114419740A CN202210026464.4A CN202210026464A CN114419740A CN 114419740 A CN114419740 A CN 114419740A CN 202210026464 A CN202210026464 A CN 202210026464A CN 114419740 A CN114419740 A CN 114419740A
- Authority
- CN
- China
- Prior art keywords
- character
- text
- living body
- voice data
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 70
- 238000013473 artificial intelligence Methods 0.000 title claims abstract description 27
- 238000000034 method Methods 0.000 claims abstract description 57
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 44
- 238000012545 processing Methods 0.000 claims abstract description 27
- 230000008569 process Effects 0.000 claims abstract description 18
- 230000001960 triggered effect Effects 0.000 claims abstract description 18
- 230000006870 function Effects 0.000 claims description 52
- 238000012549 training Methods 0.000 claims description 30
- 238000004891 communication Methods 0.000 claims description 16
- 238000001727 in vivo Methods 0.000 claims description 15
- 238000002372 labelling Methods 0.000 claims description 15
- 238000010606 normalization Methods 0.000 claims description 13
- 230000004044 response Effects 0.000 claims description 7
- 238000005516 engineering process Methods 0.000 description 9
- 230000008901 benefit Effects 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000011022 operating instruction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
- Collating Specific Patterns (AREA)
Abstract
本发明公开了一种基于人工智能的活体检测方法、装置、设备及存储介质,涉及数据处理技术领域。主要目的在于改善现有由于无法真实识别是否为活体用户,从而导致活体检测不准确的问题。包括:响应于对身份认证触发的活体检测指令,输出参照文字内容,按照所述参照文字内容录入语音数据;其中,所述参照文字内容包括核准文字内容以及随机文字内容;获取录入的语音数据,以及录入所述语音数据过程所产生的图像数据,并根据已完成训练的卷积神经网络模型对所述语音数据以及所述图像数据进行识别处理,得到文字识别结果;若所述文字识别结果匹配的拟合函数与预设文字拟合函数匹配,则输出活体认证结果,以指示执行与所述身份认证匹配的下一业务操作。
Description
技术领域
本发明涉及一种数据处理技术领域,特别是涉及一种基于人工智能的活体检测方法、装置、设备及存储介质。
背景技术
随着面部识别、指纹识别等活体检测技术的快速发展,越来越多的业务方将面部识别、指纹识别应用于身份认证领,从而确保数据安全性。其中,在支付、签到等业务中,为了准确匹配用户是否为活体,通常会进行面部识别或指纹识别来确定支付用户为活体用户,从而完成支付业务。
目前,现有活体检测通常采用指纹图像或人脸图像对比形式完成活体结果的判定,但是,由于指纹或人脸等信息可以暂存于手机终端中,当手机被暂借、遗失后破解等非可信环境下,非授权用户基于存储的指纹或人脸图像等进行技术不当窃取,无法真实识别是否为活体用户,从而导致活体检测的不准确性,因此,亟需一种更为有效的识别方式来实现活体检测。
发明内容
有鉴于此,本发明提供一种基于人工智能的活体检测方法、装置、设备及存储介质,主要目的在于改善现有由于无法真实识别是否为活体用户,从而导致活体检测不准确的技术问题。
依据本发明一个方面,提供了一种基于人工智能的活体检测方法,包括:
响应于对身份认证触发的活体检测指令,输出参照文字内容,按照所述参照文字内容录入语音数据;其中,所述参照文字内容包括核准文字内容以及随机文字内容;
获取录入的语音数据,以及录入所述语音数据过程所产生的图像数据,并根据已完成训练的卷积神经网络模型对所述语音数据以及所述图像数据进行识别处理,得到文字识别结果;
若所述文字识别结果匹配的拟合函数与预设文字拟合函数匹配,则输出活体认证结果,以指示执行与所述身份认证匹配的下一业务操作。
优选的,所述输出参照文字内容之前,所述方法还包括:
从文字语音数据库中确定同音文字以及所述同音文字的数量,并从文字唇形数据库中确定同唇形文字以及所述同唇形文字的数量;
基于所述同音文字的数量确定个数最少的同音文字为第一文字,并基于所述同唇形文字的数量确定个数最少的的同唇形文字为第二文字;
输出所述第一文字、所述第二文字,以指示按照所述第一文字、所述第二文字录入核准语音数据以及核准唇形图像数据;
若基于语音唇形区分关系确定所述核准语音数据以及所述核准唇形图像数据之间的区分参数大于预设阈值,则确定所述第一文字、所述第二文字为核准文字内容。
优选的,所述从文字语音数据库中确定同音文字以及所述同音文字的数量,并从文字唇形数据库中确定同唇形文字以及所述同唇形文字的数量之前,所述方法还包括:
获取身份认证业务需求信息,并解析所述身份认证业务需求信息中的认证业务类型;
按照预设时间,从预设文字数据库中查找与所述认证业务类型匹配的文字内容,并基于所述文字内容采集文字语音数据、以及文字唇形数据,分别更新至所述文字语音数据库、以及所述文字唇形数据库中。
优选的,所述获取录入的语音数据,以及录入所述语音数据过程所产生的图像数据之前,所述方法还包括:
响应于安全认证请求,存储录入的安全语音数据、和/或安全文字数据;
当触发所述活体检测指令后,接收到所述安全语音数据、和/或所述安全文字数据,则锁定所述身份认证所对应的账户信息,并采集触发所述活体检测指令的位置信息;
将所述账户信息、所述位置信息进行上报,并输出等待指示信息,以进行身份认真的安全操作。
优选的,所述根据已完成训练的卷积神经网络模型对所述语音数据以及所述图像数据进行识别处理,得到文字识别结果之前,所述方法还包括:
获取语言图像训练样本数据,并构建双输入的卷积神经网络;
对所述语言图像训练样本数据进行整合归一化处理,并基于整合归一化后的语言图像训练样本数据对所述双输入的卷积神经网络进行训练,得到已完成训练的卷积神经网络模型,其中,所述卷积神经网络模型的权重值为基于所述语言图像训练样本数据中核准文字内容的数量占比确定的。
优选的,所述输出活体认证结果之前,所述方法还包括:
将所述文字识别结果在预设拟合文字数值区域进行数值标注,构建标注曲线,并利用最小二乘法对所述标注曲线进行拟合处理,得到所述文字识别结果的拟合函数。
优选的,其特征在于,所述方法还包括:
若所述文字识别结果匹配的拟合函数与预设文字拟合函数不匹配,则输出活体检测失败所对应的告警信息,以指示重新进行活体检测。
依据本发明另一个方面,提供了一种基于人工智能的活体检测装置,包括:
响应模块,用于响应于对身份认证触发的活体检测指令,输出参照文字内容,按照所述参照文字内容录入语音数据;其中,所述参照文字内容包括核准文字内容以及随机文字内容,;
识别模块,用于获取录入的语音数据,以及录入所述语音数据过程所产生的图像数据,并根据已完成训练的卷积神经网络模型对所述语音数据以及所述图像数据进行识别处理,得到文字识别结果;
第一输出模块,用于若所述文字识别结果匹配的拟合函数与预设文字拟合函数匹配,则输出活体认证结果,以指示执行与所述身份认证匹配的下一业务操作。
优选的,所述响应模块之前,所述装置还包括:
第一确定模块,用于从文字语音数据库中确定同音文字以及所述同音文字的数量,并从文字唇形数据库中确定同唇形文字以及所述同唇形文字的数量;
所述第一确定模块,还用于基于所述同音文字的数量确定个数最少的同音文字为第一文字,并基于所述同唇形文字的数量确定个数最少的的同唇形文字为第二文字;
第二输出模块,用于输出所述第一文字、所述第二文字,以指示按照所述第一文字、所述第二文字录入核准语音数据以及核准唇形图像数据;
第二确定模块,用于若基于语音唇形区分关系确定所述核准语音数据以及所述核准唇形图像数据之间的区分参数大于预设阈值,则确定所述第一文字、所述第二文字为核准文字内容。
优选的,所述第一确定模块之前,所述装置还包括:
获取模块,用于获取身份认证业务需求信息,并解析所述身份认证业务需求信息中的认证业务类型;
查找模块,用于按照预设时间,从预设文字数据库中查找与所述认证业务类型匹配的文字内容,并基于所述文字内容采集文字语音数据、以及文字唇形数据,分别更新至所述文字语音数据库、以及所述文字唇形数据库中。
优选的,所述识别模块之前,所述装置还包括:
存储模块,用于响应于安全认证请求,存储录入的安全语音数据、和/或安全文字数据;
锁定模块,用于当触发所述活体检测指令后,接收到所述安全语音数据、和/或所述安全文字数据,则锁定所述身份认证所对应的账户信息,并采集触发所述活体检测指令的位置信息;
上报模块,用于将所述账户信息、所述位置信息进行上报,并输出等待指示信息,以进行身份认真的安全操作。
优选的,所述识别模块之前,所述装置还包括:
构建模块,用于获取语言图像训练样本数据,并构建双输入的卷积神经网络;
训练模块,用于对所述语言图像训练样本数据进行整合归一化处理,并基于整合归一化后的语言图像训练样本数据对所述双输入的卷积神经网络进行训练,得到已完成训练的卷积神经网络模型,其中,所述卷积神经网络模型的权重值为基于所述语言图像训练样本数据中核准文字内容的数量占比确定的。
优选的,所述第一输出模块之前,所述装置还包括:
拟合模块,用于将所述文字识别结果在预设拟合文字数值区域进行数值标注,构建标注曲线,并利用最小二乘法对所述标注曲线进行拟合处理,得到所述文字识别结果的拟合函数。
优选的,其特征在于,所述装置还包括:
第三输出模块,用于若所述文字识别结果匹配的拟合函数与预设文字拟合函数不匹配,则输出活体检测失败所对应的告警信息,以指示重新进行活体检测。
根据本发明的又一方面,提供了一种存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如上述基于人工智能的活体检测方法对应的操作。
根据本发明的再一方面,提供了一种计算机设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行上述基于人工智能的活体检测方法对应的操作。
借由上述技术方案,本发明实施例提供的技术方案至少具有下列优点:
本发明提供了一种基于人工智能的活体检测方法及装置,首先响应于对身份认证触发的活体检测指令,输出参照文字内容,按照所述参照文字内容录入语音数据;其中,所述参照文字内容包括核准文字内容以及随机文字内容;其次获取录入的语音数据,以及录入所述语音数据过程所产生的图像数据,并根据已完成训练的卷积神经网络模型对所述语音数据以及所述图像数据进行识别处理,得到文字识别结果;最后若所述文字识别结果匹配的拟合函数与预设文字拟合函数匹配,则输出活体认证结果,以指示执行与所述身份认证匹配的下一业务操作。与现有技术相比,本发明实施例通过对用户根据参照文字录入的语音数据进行识别,并将识别结果的拟合函数与预设文字拟合函数相匹配,进一步输出活体认证结果,可以准确的识别出当前为活体用户,进而提高活体检测的准确性。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本发明实施例提供的一种基于人工智能的活体检测方法流程图;
图2示出了本发明实施例提供的一种基于人工智能的活体检测装置组成框图;
图3示出了本发明实施例提供的一种计算机设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
基于此,在一个实施例中,如图1所示,提供了一种基于人工智能的活体检测方法,以该方法应用于服务器等计算机设备为例进行说明,其中,服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。上述方法包括以下步骤:
101、响应于对身份认证触发的活体检测指令,输出参照文字内容按照所述参照文字内容录入语音数据。
本申请实施例中,身份认证可以适用于支付业务、权限分配业务、保险承保业务等,针对不同的业务,在触发身份认证请求后,前端向服务端发送活体检测指令,以进行对用户是否为活体真人的判断,从而实现安全性认证。其中,参照文字内容包括核准文字内容以及随机文字内容,以指示按照所述参照文字内容录入语音数据。核准文字内容为文字内容与唇形区分度较大的文字内容,以便用户基于核准文字内容录入对应于文字的语言内容。随机文字内容为从预设的文字库中随机筛选出一组或者预设个数的文字,可以为词语,可以为单个文字内容,本申请实施例不做具体限定。
102、获取录入的语音数据,以及录入语音数据过程所产生的图像数据,并根据已完成训练的卷积神经网络模型对语音数据以及图像数据进行识别处理,得到文字识别结果。
本申请实施例中,录入的语音数据用于表征用户按照步骤101中的核准文字内容跟读后得到的语音数据,同时,当前系统调取摄像模块对用户的跟读进行拍摄,得到唇形动态变化所对应的图像数据。另外,为了识别出用户录入的具体文字内容,基于已完成训练的卷积神经网络模型进行识别。其中,在基于卷积神经网络模型进行识别时,由于语音数据与图像数据属于2种模态的数据,因此,在构建卷积圣经网络模型时,既可以单独分别构建语音数据、图像数据所对应的卷积神经模型,也可以混合构建语音数据与图像数据所对应的卷积神经网络模型,从而进行模型训练后对语音数据、图像数据进行识别,本申请实施例不做具体限定。
103、若文字识别结果匹配的拟合函数与预设文字拟合函数匹配,则输出活体认证结果,以指示执行与身份认证匹配的下一业务操作。
本申请实施例中,基于步骤102所得到的语音识别结果为基于语音数据以及图像数据识别得到的,因此,为了确定是否为真人录入的,可以对的得到的文字识别结果进行拟合,得到拟合函数,即将文字识别结果以数值方式生成对应的数据曲线,生成拟合函数,与系统中输出的用于指示用户录入的文字内容所生成的阈值文字拟合函数进行匹配,若匹配,则说明用户为真实完成语音录入的真人。
本申请实施例中,为了进一步说明以及限定,在输出参照文字内容之前,实施例方法还包括:从文字语音数据库中确定同音文字以及同音文字的数量,并从文字唇形数据库中确定同唇形文字以及同唇形文字的数量;基于同音文字的数量确定个数最少的同音文字为第一文字,并基于同唇形文字的数量确定个数最少的的同唇形文字为第二文字;输出第一文字、第二文字,以指示按照第一文字、第二文字录入核准语音数据以及核准唇形图像数据;若基于语音唇形区分关系确定核准语音数据以及核准唇形图像数据之间的区分参数大于预设阈值,则确定第一文字、第二文字为核准文字内容。
具体的,由于使用核准文字内容的主要目的在于区分用户发声与当前系统输出的文字进行匹配,因此,作为输出的文字,需要使唇形与声纹具有一定的区分度。本申请实施例中,文字语音数据库中存储有不同文字对应的不同语音信息,文字唇形数据库中存储有不同文字对应的不同唇形图像信息,因此,在确定核准文字时,获取相同发音的个数最少的文字,以及相同唇形文字个数最少的文字,作为用户参照录入的文字内容。当用户基于上述文字录入语音以及唇形图像,可以进行区分度的判断,即按照语音唇形区分关系确定录入的作为核准语音数据、核准唇形图像数据是否大于预设区分阈值,从而将输出的文字确定为核准文字内容。
需要说明的是,语音唇形区分关系中记录有不同语音与不同唇形之间的区分值,以便查询到核准语音数据与核准唇形图像数据之间的区分值,与预设区分阈值进行对比。
为了避免从文字语音数据库、文字唇形数据库中确定的核准语音数据、核准唇形图像数据被窃取,本申请实施例中,在从文字语音数据库中确定同音文字以及同音文字的数量,并从文字唇形数据库中确定同唇形文字以及同唇形文字的数量之前,实施例方法还包括:获取身份认证业务需求信息,并解析身份认证业务需求信息中的认证业务类型;按照预设时间,从预设文字数据库中查找与认证业务类型匹配的文字内容,并基于文字内容采集文字语音数据、以及文字唇形数据,分别更新至文字语音数据库、以及文字唇形数据库中。
其中,身份认证业务需求包括但不限于保险支付、保险承保等认证业务需求,因此,可以在更新文字语音数据库以及文字唇形数据库时,按照保险支付的相关需求文字、以及保险承保的相关需求文字进行更新,从而确保各个数据库中的文字随时间间隔进行变化,以规避被窃取的风险。
为了确保用户在身份认证过程中的安全性,本申请实施例中,在获取录入的语音数据,以及录入语音数据所产生的图像数据之前,实施例方法还包括:响应于安全认证请求,存储录入的安全语音数据、和/或安全文字数据;当触发活体检测指令后,接收到安全语音数据、和/或安全文字数据,则锁定身份认证所对应的账户信息,并采集触发活体检测指令的位置信息;将账户信息、位置信息进行上报,并输出等待指示信息,以进行身份认真的安全操作。
具体的,为了防止用户是在被挟持的情况下进行身份验证或者支付,用户可以进行暗号认证,即通过预先录入安全语音数据或者安全文字数据作为触发锁定账户的触发事件。其中,若用户在非身份认证时,录入安全语音数据或者安全文字数据,并存储在与用户账户对应的数据存储空间中,以便用户登录账户进行身份认证过程中触发活体检测指令后,进行调取匹配。另外,用户在触发身份认证触发的活体检测指令时,当前执行系统首先检测是否存在安全语音数据或安全文字数据,从而确定用户是否被劫持,若存在与存储的安全语音数据或安全文字数据匹配的语音内容或文字内容,则说用户触发了锁定账户的指令,则锁定用户账户,并采集当前位置信息。其中,采集位置信息可以基于用户客户端的GPS系统进行定位,也可以基于前端设备(如ATM机或智能机器人)的身份标识确定用户所在位置,以便对用户账户、所在位置进行上报。
为了进一步说明以及限定,本申请实施例中,在根据已完成训练的卷积神经网络模型对语音数据以及图像数据进行识别处理,得到文字识别结果之前,实施例方法还包括:获取语言图像训练样本数据,并构建双输入的卷积神经网络;对语言图像训练样本数据进行整合归一化处理,并基于整合归一化后的语言图像训练样本数据对双输入的卷积神经网络进行训练,得到已完成训练的卷积神经网络模型。
其中,卷积神经网络模型的权重值为基于语言图像训练样本数据中核准文字内容的数量占比确定的。
具体的,语言图像训练样本数据包括语音样本数据、图像样本数据,为了实现基于一个卷积神经网络模型进行混合式文字识别,在构建卷积神经网络时,按照语音样本数据与图像样本数据两种不同数据构建双输入的卷积神经网络。同时,为了进行统一的模型训练,对语音样本数据和图像样本数据进行统一的归一化处理,从而使全部的样本数据处于0-1之间,由于两种不同的样本,因此,在进行归一化处理时,基于统一的0-1归一化处理方式,分别对两种样本数据进行单独归一化处理,如由于使用梯度下降算法进行学习,卷积神经网络的输入特征需要进行标准化处理。具体地,在将学习数据输入卷积神经网络前,需在通道或时间/频率维对输入数据进行归一化,若输入数据为像素,也可将分布于[0,225]的原始像素值归一化至[0,1]。
需要说明的是,构建的卷积神经网络中,由于卷积神经网络中卷积层的权重更新过程对应卷积核的更新过程,且神经网络的权重修改策略通常基于一条连接权重的更新量为该条连接的前层神经元的兴奋输出乘以后一层神经元的输入错误信号,卷积核的更新也是按照这个规律来进行。本申请实施例中,由于用于用户身份认证的文字可以限定个数、或者限定在一个文字数据库中,因此,权重的修改策略配置为按照文字标签中核准文字的占比确定的,文字标签中的全部文字为包括核准文字以及随机文字的内容,而根据核准文字的个数与全部文字的比例关系,确定权值,作为连接权重,从而优化模型的处理精度。
为了进一步说明以及限定,本申请实施例中,在输出活体认证结果之前,实施例方法还包括:将文字识别结果在预设拟合文字数值区域进行数值标注,构建标注曲线,并利用最小二乘法对标注曲线进行拟合处理,得到文字识别结果的拟合函数。
具体的,为了使文字拟合的效果更加准确,构建一个预设拟合文字数值区域,此区域为按照文字内容所对应的数值区间确定的,即根据文字的发音配置x轴坐标数值,根据文字的音调配置y轴坐标数值,从而使得到的文字识别结果转换在预设拟合文字数值区域中,而在此区域中,预先按照各个文字所对应的发音、音调生成了预设文字拟合函数,从而,只需要将文字识别结果进行数值标注在此数值区域中,既可以进行对标注曲线的拟合函数的生成,从而进行匹配。示例性的,可以基于MATLAB软件中调用最小二乘法对标注曲线进行拟合,得到拟合函数。
进一步的,本申请实施例中,方法还包括:若文字识别结果匹配的拟合函数与预设文字拟合函数不匹配,则输出活体检测失败所对应的告警信息,以指示重新进行活体检测。
具体的,若当前文字识别结果的拟合函数与预设的文字拟合函数不匹配,则说明活体检测失败,同时可以输出对应的警告信息,以指示重新进行活体检测,输出的方式可以以弹窗的方式进行输出,也可以以语音提示的方式进行输出,本申请实施例不做具体限定,
本发明提供了一种基于人工智能的活体检测方法,首先响应于对身份认证触发的活体检测指令,输出参照文字内容,按照所述参照文字内容录入语音数据;其中,所述参照文字内容包括核准文字内容以及随机文字内容;其次获取录入的语音数据,以及录入所述语音数据过程所产生的图像数据,并根据已完成训练的卷积神经网络模型对所述语音数据以及所述图像数据进行识别处理,得到文字识别结果;最后若所述文字识别结果匹配的拟合函数与预设文字拟合函数匹配,则输出活体认证结果,以指示执行与所述身份认证匹配的下一业务操作。与现有技术相比,本发明实施例通过对用户根据参照文字录入的语音数据进行识别,并将识别结果的拟合函数与预设文字拟合函数相匹配,进一步输出活体认证结果,可以准确的识别出当前为活体用户,进而提高活体检测的准确性。
进一步的,作为对上述图1所示方法的实现,本发明实施例提供了一种基于人工智能的活体检测装置,如图2所示,该装置包括:
响应模块21,识别模块22,第一输出模块23。
响应模块21,用于响应于对身份认证触发的活体检测指令,输出参照文字内容,按照所述参照文字内容录入语音数据;其中,所述参照文字内容包括核准文字内容以及随机文字内容;
识别模块22,用于获取录入的语音数据,以及录入所述语音数据过程所产生的图像数据,并根据已完成训练的卷积神经网络模型对所述语音数据以及所述图像数据进行识别处理,得到文字识别结果;
第一输出模块23,用于若所述文字识别结果匹配的拟合函数与预设文字拟合函数匹配,则输出活体认证结果,以指示执行与所述身份认证匹配的下一业务操作。
在具体的应用场景中,所述响应模块21之前,所述装置还包括:
第一确定模块,用于从文字语音数据库中确定同音文字以及所述同音文字的数量,并从文字唇形数据库中确定同唇形文字以及所述同唇形文字的数量;
所述第一确定模块,还用于基于所述同音文字的数量确定个数最少的同音文字为第一文字,并基于所述同唇形文字的数量确定个数最少的的同唇形文字为第二文字;
第二输出模块,用于输出所述第一文字、所述第二文字,以指示按照所述第一文字、所述第二文字录入核准语音数据以及核准唇形图像数据;
第二确定模块,用于若基于语音唇形区分关系确定所述核准语音数据以及所述核准唇形图像数据之间的区分参数大于预设阈值,则确定所述第一文字、所述第二文字为核准文字内容。
在具体的应用场景中,所述第一确定模块之前,所述装置还包括:
获取模块,用于获取身份认证业务需求信息,并解析所述身份认证业务需求信息中的认证业务类型;
查找模块,用于按照预设时间,从预设文字数据库中查找与所述认证业务类型匹配的文字内容,并基于所述文字内容采集文字语音数据、以及文字唇形数据,分别更新至所述文字语音数据库、以及所述文字唇形数据库中。
在具体的应用场景中,所述识别模块22之前,所述装置还包括:
存储模块,用于响应于安全认证请求,存储录入的安全语音数据、和/或安全文字数据;
锁定模块,用于当触发所述活体检测指令后,接收到所述安全语音数据、和/或所述安全文字数据,则锁定所述身份认证所对应的账户信息,并采集触发所述活体检测指令的位置信息;
上报模块,用于将所述账户信息、所述位置信息进行上报,并输出等待指示信息,以进行身份认真的安全操作。
在具体的应用场景中,所述识别模块22之前,所述装置还包括:
构建模块,用于获取语言图像训练样本数据,并构建双输入的卷积神经网络;
训练模块,用于对所述语言图像训练样本数据进行整合归一化处理,并基于整合归一化后的语言图像训练样本数据对所述双输入的卷积神经网络进行训练,得到已完成训练的卷积神经网络模型,其中,所述卷积神经网络模型的权重值为基于所述语言图像训练样本数据中核准文字内容的数量占比确定的。
在具体的应用场景中,所述第一输出模块23之前,所述装置还包括:
拟合模块,用于将所述文字识别结果在预设拟合文字数值区域进行数值标注,构建标注曲线,并利用最小二乘法对所述标注曲线进行拟合处理,得到所述文字识别结果的拟合函数。
在具体的应用场景中,其特征在于,所述装置还包括:
第三输出模块,用于若所述文字识别结果匹配的拟合函数与预设文字拟合函数不匹配,则输出活体检测失败所对应的告警信息,以指示重新进行活体检测。
本发明提供了一种基于人工智能的活体检测装置,首先响应于对身份认证触发的活体检测指令,输出参照文字内容,按照所述参照文字内容录入语音数据;其中,所述参照文字内容包括核准文字内容以及随机文字内容;其次获取录入的语音数据,以及录入所述语音数据过程所产生的图像数据,并根据已完成训练的卷积神经网络模型对所述语音数据以及所述图像数据进行识别处理,得到文字识别结果;最后若所述文字识别结果匹配的拟合函数与预设文字拟合函数匹配,则输出活体认证结果,以指示执行与所述身份认证匹配的下一业务操作。与现有技术相比,本发明实施例通过对用户根据参照文字录入的语音数据进行识别,并将识别结果的拟合函数与预设文字拟合函数相匹配,进一步输出活体认证结果,可以准确的识别出当前为活体用户,进而提高活体检测的准确性。
根据本发明一个实施例提供了一种存储介质,所述存储介质存储有至少一可执行指令,该计算机可执行指令可执行上述任意方法实施例中的基于人工智能的活体检测方法。
图3示出了根据本发明一个实施例提供的一种计算机设备的结构示意图,本发明具体实施例并不对计算机设备的具体实现做限定。
如图3所示,该计算机设备可以包括:处理器(processor)302、通信接口(Communications Interface)304、存储器(memory)306、以及通信总线308。
其中:处理器302、通信接口304、以及存储器306通过通信总线308完成相互间的通信。
通信接口304,用于与其它设备比如客户端或其它服务器等的网元通信。
处理器302,用于执行程序310,具体可以执行上述基于人工智能的活体检测方法实施例中的相关步骤。
具体地,程序310可以包括程序代码,该程序代码包括计算机操作指令。
处理器302可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。计算机设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器306,用于存放程序310。存储器306可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序310具体可以用于使得处理器302执行以下操作:
响应于对身份认证触发的活体检测指令,输出参照文字内容,按照所述参照文字内容录入语音数据;其中,所述参照文字内容包括核准文字内容以及随机文字内容;
获取录入的语音数据,以及录入所述语音数据过程所产生的图像数据,并根据已完成训练的卷积神经网络模型对所述语音数据以及所述图像数据进行识别处理,得到文字识别结果;
若所述文字识别结果匹配的拟合函数与预设文字拟合函数匹配,则输出活体认证结果,以指示执行与所述身份认证匹配的下一业务操作。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。
Claims (10)
1.一种基于人工智能的活体检测方法,其特征在于,包括:
响应于对身份认证触发的活体检测指令,输出参照文字内容,按照所述参照文字内容录入语音数据;其中,所述参照文字内容包括核准文字内容以及随机文字内容;
获取录入的语音数据,以及录入所述语音数据过程所产生的图像数据,并根据已完成训练的卷积神经网络模型对所述语音数据以及所述图像数据进行识别处理,得到文字识别结果;
若所述文字识别结果匹配的拟合函数与预设文字拟合函数匹配,则输出活体认证结果,以指示执行与所述身份认证匹配的下一业务操作。
2.根据权利要求1所述的方法,其特征在于,所述输出参照文字内容之前,所述方法还包括:
从文字语音数据库中确定同音文字以及所述同音文字的数量,并从文字唇形数据库中确定同唇形文字以及所述同唇形文字的数量;
基于所述同音文字的数量确定个数最少的同音文字为第一文字,并基于所述同唇形文字的数量确定个数最少的的同唇形文字为第二文字;
输出所述第一文字、所述第二文字,以指示按照所述第一文字、所述第二文字录入核准语音数据以及核准唇形图像数据;
若基于语音唇形区分关系确定所述核准语音数据以及所述核准唇形图像数据之间的区分参数大于预设阈值,则确定所述第一文字、所述第二文字为核准文字内容。
3.根据权利要求2所述的方法,其特征在于,所述从文字语音数据库中确定同音文字以及所述同音文字的数量,并从文字唇形数据库中确定同唇形文字以及所述同唇形文字的数量之前,所述方法还包括:
获取身份认证业务需求信息,并解析所述身份认证业务需求信息中的认证业务类型;
按照预设时间,从预设文字数据库中查找与所述认证业务类型匹配的文字内容,并基于所述文字内容采集文字语音数据、以及文字唇形数据,分别更新至所述文字语音数据库、以及所述文字唇形数据库中。
4.根据权利要求1所述的方法,其特征在于,所述获取录入的语音数据,以及录入所述语音数据过程所产生的图像数据之前,所述方法还包括:
响应于安全认证请求,存储录入的安全语音数据、和/或安全文字数据;
当触发所述活体检测指令后,接收到所述安全语音数据、和/或所述安全文字数据,则锁定所述身份认证所对应的账户信息,并采集触发所述活体检测指令的位置信息;
将所述账户信息、所述位置信息进行上报,并输出等待指示信息,以进行身份认真的安全操作。
5.根据权利要求1所述的方法,其特征在于,所述根据已完成训练的卷积神经网络模型对所述语音数据以及所述图像数据进行识别处理,得到文字识别结果之前,所述方法还包括:
获取语言图像训练样本数据,并构建双输入的卷积神经网络;
对所述语言图像训练样本数据进行整合归一化处理,并基于整合归一化后的语言图像训练样本数据对所述双输入的卷积神经网络进行训练,得到已完成训练的卷积神经网络模型,其中,所述卷积神经网络模型的权重值为基于所述语言图像训练样本数据中核准文字内容的数量占比确定的。
6.根据权利要求1所述的方法,其特征在于,所述输出活体认证结果之前,所述方法还包括:
将所述文字识别结果在预设拟合文字数值区域进行数值标注,构建标注曲线,并利用最小二乘法对所述标注曲线进行拟合处理,得到所述文字识别结果的拟合函数。
7.根据权利要求1-6任一项所述的方法,其特征在于,所述方法还包括:
若所述文字识别结果匹配的拟合函数与预设文字拟合函数不匹配,则输出活体检测失败所对应的告警信息,以指示重新进行活体检测。
8.一种基于人工智能的活体检测装置,其特征在于,包括:
响应模块,用于响应于对身份认证触发的活体检测指令,输出参照文字内容,按照所述参照文字内容录入语音数据;其中,所述参照文字内容包括核准文字内容以及随机文字内容;
识别模块,用于获取录入的语音数据,以及录入所述语音数据过程所产生的图像数据,并根据已完成训练的卷积神经网络模型对所述语音数据以及所述图像数据进行识别处理,得到文字识别结果;
第一输出模块,用于若所述文字识别结果匹配的拟合函数与预设文字拟合函数匹配,则输出活体认证结果,以指示执行与所述身份认证匹配的下一业务操作。
9.一种存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如权利要求1-7中任一项所述的基于人工智能的活体检测方法对应的操作。
10.一种计算机设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如权利要求1-7中任一项所述的基于人工智能的活体检测方法对应的操作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210026464.4A CN114419740A (zh) | 2022-01-11 | 2022-01-11 | 基于人工智能的活体检测方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210026464.4A CN114419740A (zh) | 2022-01-11 | 2022-01-11 | 基于人工智能的活体检测方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114419740A true CN114419740A (zh) | 2022-04-29 |
Family
ID=81270684
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210026464.4A Pending CN114419740A (zh) | 2022-01-11 | 2022-01-11 | 基于人工智能的活体检测方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114419740A (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020024519A1 (en) * | 2000-08-20 | 2002-02-28 | Adamsoft Corporation | System and method for producing three-dimensional moving picture authoring tool supporting synthesis of motion, facial expression, lip synchronizing and lip synchronized voice of three-dimensional character |
CN101763516A (zh) * | 2010-01-15 | 2010-06-30 | 南京航空航天大学 | 一种基于拟合函数的文字识别方法 |
CN101923858A (zh) * | 2009-06-17 | 2010-12-22 | 劳英杰 | 一种实时同步互译语音终端 |
CN110459204A (zh) * | 2018-05-02 | 2019-11-15 | Oppo广东移动通信有限公司 | 语音识别方法、装置、存储介质及电子设备 |
CN110554783A (zh) * | 2019-08-14 | 2019-12-10 | 柴维林 | 一种拼音化精确输入法 |
CN111881726A (zh) * | 2020-06-15 | 2020-11-03 | 马上消费金融股份有限公司 | 一种活体检测方法、装置及存储介质 |
WO2021007856A1 (zh) * | 2019-07-18 | 2021-01-21 | 深圳海付移通科技有限公司 | 一种身份验证方法、终端设备、存储介质 |
-
2022
- 2022-01-11 CN CN202210026464.4A patent/CN114419740A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020024519A1 (en) * | 2000-08-20 | 2002-02-28 | Adamsoft Corporation | System and method for producing three-dimensional moving picture authoring tool supporting synthesis of motion, facial expression, lip synchronizing and lip synchronized voice of three-dimensional character |
CN101923858A (zh) * | 2009-06-17 | 2010-12-22 | 劳英杰 | 一种实时同步互译语音终端 |
CN101763516A (zh) * | 2010-01-15 | 2010-06-30 | 南京航空航天大学 | 一种基于拟合函数的文字识别方法 |
CN110459204A (zh) * | 2018-05-02 | 2019-11-15 | Oppo广东移动通信有限公司 | 语音识别方法、装置、存储介质及电子设备 |
WO2021007856A1 (zh) * | 2019-07-18 | 2021-01-21 | 深圳海付移通科技有限公司 | 一种身份验证方法、终端设备、存储介质 |
CN110554783A (zh) * | 2019-08-14 | 2019-12-10 | 柴维林 | 一种拼音化精确输入法 |
CN111881726A (zh) * | 2020-06-15 | 2020-11-03 | 马上消费金融股份有限公司 | 一种活体检测方法、装置及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109587360B (zh) | 电子装置、应对话术推荐方法和计算机可读存储介质 | |
CN107239666B (zh) | 一种对医疗影像数据进行脱敏处理的方法及系统 | |
CN109147797B (zh) | 基于声纹识别的客服方法、装置、计算机设备及存储介质 | |
US20200302712A1 (en) | Vehicle detection method, apparatus and vehicle diagnostic device | |
CN109660533B (zh) | 实时识别异常流量的方法、装置、计算机设备和存储介质 | |
CN113688630B (zh) | 文本内容审核方法、装置、计算机设备和存储介质 | |
CN115174231A (zh) | 一种基于AI Knowledge Base的网络欺诈分析方法及服务器 | |
CN116129350A (zh) | 数据中心安全作业的智能监控方法、装置、设备及介质 | |
CN113707157B (zh) | 基于声纹识别的身份验证方法、装置、电子设备及介质 | |
CN111488501A (zh) | 一种基于云平台的电商统计系统 | |
CN113986581A (zh) | 数据聚合处理方法、装置、计算机设备和存储介质 | |
CN110718217A (zh) | 一种控制方法、终端及计算机可读存储介质 | |
CN112288584B (zh) | 保险报案处理方法、装置、计算机可读介质及电子设备 | |
CN114419740A (zh) | 基于人工智能的活体检测方法、装置、设备及存储介质 | |
CN115080827B (zh) | 一种敏感数据处理方法及装置 | |
CN114036117A (zh) | 日志查看方法、装置、计算机设备和存储介质 | |
CN113518058B (zh) | 异常登录行为检测方法、装置、存储介质和计算机设备 | |
US8051026B2 (en) | Rules collector system and method with user interaction | |
CN113449506A (zh) | 一种数据检测方法、装置、设备及可读存储介质 | |
CN116503918A (zh) | 基于ViT网络的掌静脉图像分类方法、装置、设备及介质 | |
CN112825203B (zh) | 用于特定区域的准入控制的方法和装置 | |
CN107105010A (zh) | 基于gps位置信息的汽车用户快速登入方法及装置 | |
US20220261642A1 (en) | Adversarial example detection system, method, and program | |
CN112016316A (zh) | 一种识别方法和系统 | |
CN111007846A (zh) | 一种无人船艇控制方法、装置、终端设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |