CN110266645A - 实时数据的验证方法、装置、服务器及介质 - Google Patents

实时数据的验证方法、装置、服务器及介质 Download PDF

Info

Publication number
CN110266645A
CN110266645A CN201910424123.0A CN201910424123A CN110266645A CN 110266645 A CN110266645 A CN 110266645A CN 201910424123 A CN201910424123 A CN 201910424123A CN 110266645 A CN110266645 A CN 110266645A
Authority
CN
China
Prior art keywords
data
real
time
user
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910424123.0A
Other languages
English (en)
Inventor
王旭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201910424123.0A priority Critical patent/CN110266645A/zh
Priority to PCT/CN2019/103300 priority patent/WO2020232894A1/zh
Publication of CN110266645A publication Critical patent/CN110266645A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/08Network architectures or network communication protocols for network security for authentication of entities
    • H04L63/0815Network architectures or network communication protocols for network security for authentication of entities providing single-sign-on or federations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/08Network architectures or network communication protocols for network security for authentication of entities
    • H04L63/0861Network architectures or network communication protocols for network security for authentication of entities using biometrical features, e.g. fingerprint, retina-scan
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/12Applying verification of the received information

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Collating Specific Patterns (AREA)

Abstract

本发明适用于数据处理技术领域,提供了一种实时数据的验证方法、装置、服务器及介质,通过登录信息获取用户身份数据以及验证关键词,接收用户的实时数据,将实时数据分为实时视频以及实时音频数据,计算实时视频分量中包含的人脸数据与用户身份数据的相似度,以对用户身份进行验证,若相似度不小于预设的相似度阈值,则计算预设时间段内实时音频分量中包含验证关键词的数量,以对实时数据是否合法进行验证,若实时音频分量中包含所述验证关键词的数量大于第一数量阈值,则判定所述实时数据通过验证,以对实时数据进行智能化分析,提高业务远程办理的安全性。

Description

实时数据的验证方法、装置、服务器及介质
技术领域
本发明属于数据处理技术领域,尤其涉及一种实时数据的验证方法、装置、服务器及介质。
背景技术
随着互联网技术的发展,用户可以远程线上办理各种业务。但是线上业务的办理也在一定程度上存在安全隐患。例如,可能有些不法分子会冒用他人身份办理相关业务,以获取不法利益;可能有些老年用户会由于业务人员的疏忽或刻意隐瞒而办理了不必要的业务,引发了不必要的损失。这些安全隐患基本上都是由于对实时录入的用户的视频数据分析不准确不全面造成的。
综上,当前存在严重的对于实时数据分析不准确不全面的技术问题。
发明内容
有鉴于此,本发明实施例提供了一种实时数据的验证方法及服务器,以解决对于实时数据分析不准确不全面的问题。
本发明实施例的第一方面提供了一种实时数据的验证方法,包括:在接收到用户的登录信息后,确定所述登录信息对应的用户身份数据,并解析所述登录信息中包含的关键码,基于所述关键码确定所述用户对应的多个验证关键词;接收用户的实时数据,将所述实时数据分为实时视频分量以及实时音频分量,所述实时视频分量中包含人脸数据;计算所述实时视频分量中包含的人脸数据与所述用户身份数据的相似度,若所述人脸数据与所述用户身份数据的相似度不小于预设的相似度阈值,则计算预设时间段内所述实时音频分量中包含所述验证关键词的数量;若所述实时音频分量中包含所述验证关键词的数量不大于第一数量阈值但大于第二数量阈值,则从多个异步处理服务器中选择一个作为被选服务器,并将所述实时数据发送至所述被选服务器,以通过所述被选服务器对所述实时数据进行非实时验证;若所述实时音频分量中包含所述验证关键词的数量大于第一数量阈值,则判定所述实时数据通过验证。
本发明实施例的第二方面提供了一种实时数据的验证装置,包括:
解析模块,用于在接收到用户的登录信息后,确定所述登录信息对应的用户身份数据,并解析所述登录信息中包含的关键码,基于所述关键码确定所述用户对应的多个验证关键词;分解模块,用于接收用户的实时数据,将所述实时数据分为实时视频分量以及实时音频分量,所述实时视频分量中包含人脸数据;计算模块,用于计算所述实时视频分量中包含的人脸数据与所述用户身份数据的相似度,若所述人脸数据与所述用户身份数据的相似度不小于预设的相似度阈值,则计算预设时间段内所述实时音频分量中包含所述验证关键词的数量;第一执行模块,用于若所述实时音频分量中包含所述验证关键词的数量不大于第一数量阈值但大于第二数量阈值,则从多个异步处理服务器中选择一个作为被选服务器,并将所述实时数据发送至所述被选服务器,以通过所述被选服务器对所述实时数据进行非实时验证;第二执行模块,用于若所述实时音频分量中包含所述验证关键词的数量大于第一数量阈值,则判定所述实时数据通过验证。
本发明实施例的第三方面提供了一种服务器,包括:存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现本发明实施例的第一方面提供的方法的步骤。
本发明实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现本发明实施例的第一方面提供的方法的步骤。
在本发明实施例中,通过登录信息获取用户身份数据以及验证关键词,接收用户的实时数据,将实时数据分为实时视频以及实时音频数据,计算实时视频分量中包含的人脸数据与用户身份数据的相似度,以对用户身份进行验证,若相似度不小于预设的相似度阈值,则计算预设时间段内实时音频分量中包含验证关键词的数量,以对实时数据是否合法进行验证,若实时音频分量中包含所述验证关键词的数量大于第一数量阈值,则判定所述实时数据通过验证,以对实时数据进行智能化分析,提高业务远程办理的安全性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的实时数据的验证方法的实现流程图;
图2是本发明实施例提供的实时数据的验证方法S101的具体实现流程图;
图3是本发明实施例提供的实时数据的验证方法S103的具体实现流程图;
图4是本发明实施例提供的实时数据的验证方法S107的具体实现流程图;
图5是本发明实施例提供的实时数据的验证装置的结构框图;
图6是本发明实施例提供的服务器的示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。
图1示出了本发明实施例提供的实时数据的验证方法的实现流程,该方法流程包括步骤S101至S108。各步骤的具体实现原理如下。
在S101中,在接收到用户的登录信息后,确定所述登录信息对应的用户身份数据,并解析所述登录信息中包含的关键码,基于所述关键码确定所述用户对应的多个验证关键词。
在本发明实施例中,当用户远程办理在线业务时,需要在登录后通过视频与业务人员进行沟通,服务器会在验证用户的登录信息后,对采集到的用户与业务人员的视频(即实时数据)进行人工智能分析,以判断整个业务的办理是否存在安全隐患。总体而言,本发明实施例主要是通过自动验证实时数据中的用户是否与登录信息对应的用户数据相匹配,以及自动验证实时数据是否包含足够的验证关键词这两个维度对实时数据进行验证,从而保证业务办理的安全性的。
可以理解地,服务器在接收到登录信息后,会对登录信息中包含的登录名和密码进行验证,一旦验证通过会根据登录名确定用户身份数据,其中用户身份数据包括用户的面部照片。另一方面,同一个用户在不同的业务的界面进行登录,或者选择不同的业务功能进行登录后,登录信息中包含的关键码并不相同,显然关键码可以用于区分不同的业务;反之,不同类型的用户在同一个业务的界面进行登录,登录信息中包含的关键码也可能并不相同,例如,用户的类型可以分为未成年用户、成年用户以及老年用户,由于他们的判别能力不同,在办理同一个业务登陆后,登录信息中包含的关键码也不同。
如上文所述,本发明实施例对于后续的实时数据的其中一个验证维度就是自动验证实时数据是否包含足够的验证关键词,所以需要在此首先基于关键码确定该实时数据中需要包含哪些验证关键词。可以理解地,在线上业务办理的过程中,例如对于老年用户,需要业务人员告知老年用户业务的风险,以及老年用户必须对这些风险进行确认,这时由于实时数据是对整个交流过程的录制,所以合格的实时数据中必然应该包含一定数量的验证关键词。
显然,一段实时数据中是否包含了一定数量的验证关键词表示了用户是否从业务人员处获知了相应的风险提示,以及是否做出了一些肯定答复。
可选地,可以通过预设的关键码与验证关键词的对应关系,确定登陆信息中包含的关键码对应的多个关键词。
可选地,可以通过预测一个关键码对应的多个词语在未来的出现概率,确定该关键码对应的验证关键词,作为本发明的一个实施例,如图2所示,上述S101包括:
S1011,调取预设周期内接收的所述关键码对应的词语集合,所述词语集合中的各个词语均对应一个接收时刻。
在本发明实施例中,关键码对应的词语集合的生成过程为:业务人员提取一段预设周期内(例如:一个月内)与用户进行业务办理时录制的实时数据,作为标本数据,并确定该标本数据对应的关键码,从该标本数据中人为筛选出可用于保证业务办理安全性的词语,从而确定一个关键码对应的多个词语。此外,由于一个标本数据都有一个接收时间,所以一个标本数据中提取出的词语均对应该接收时间。
显然,业务人员可以通过提取一个关键码对应的多个标本数据,从而获取该关键词对应的更多的词语,从而生成关键词对应的词语集合。值得注意地,本发明实施例不会将词语进行归并,因此词语集合中会包含大量重复的词语,每个词语均对应一个接收时间。
S1012,根据所述词语集合中各个词语与接收时刻的对应关系,建立接收时间段与各个词语的词语出现次数的对应关系,所述接收时间段包括多个接收时刻,所述词语出现次数为在一个所述接收时间段内所述词语在所述词语集合中的出现次数。
可以理解地,由于一个词语集合中包含了很多重复的词语,且每个词语均对应一个接收时间,所以就可以统计出一个接收时间段内某一个词语在词语集合中的出现次数。显然,在对多个接收时间段进行上述统计后,就会生成接收时间段与各个词语的词语出现次数的对应关系。示例性地,在1月1日到1月5日(接收时间段)内“赔钱”这个词语的出现次数为10,“风险”这个词语的出现次数为8,“不建议”这个词语的出现次数为9,“清楚”这个词语的出现次数为20等等。
S1013,拟合表征所述词语出现次数与接收时间段的对应关系的回归方程。
可选地,通过回归模型:拟合表征所述词语出现次数与接收时间段的对应关系的回归方程,生成所述词语集合中各个词语对应的回归方程,其中,num表示所述词语次数、time表示接收时间段序号、pre1和pre2分别是两个非线性回归方程的系数,所述e为自然常数。
可以理解地,以接收时间段为自变量,以某个词语的词语出现次数为因变量,可以通过现有的非线性回归方程的求解方法得到回归模型的系数,所以不在此进行详述。
需要说明的是,此处的接收时间段序号表示的是从前到后第几个接收时间段,例如一共有5个接收时间段,分别为:1月1日到1月5日、1月6日到1月10日、1月11日到1月15日、1月16日到1月20日以及1月21日到1月25日,那么1月1日到1月5日对应的接收时间段序号就为1,1月6日到1月10日对应的接收时间段序号为2,以此类推。
值得注意地,本发明实施例中,每一个词语均对应一个回归方程。
S1014,基于所述词语集合中各个词语对应的回归方程,计算各个词语在当前时刻之后的预设数量的接收时间段内的出现次数,作为各个词语对应的预测出现次数。
示例性地,假设当前时刻所在的接收时间段对应的接收时间段序号为10,预设数量为5,则通过各个词语对应的回归方程,分别计算自变量为11、12、13、14、15对应的因变量的和(即出现次数的和),作为各个词语对应的预测出现次数。
S1015,选择所述预测出现次数不小于预设次数阈值的词语作为所述用户对应的验证关键词。
在S102中,接收用户的实时数据,将所述实时数据分为实时视频分量以及实时音频分量,所述实时视频分量中包含人脸数据。
如上文所述,本发明实施例中的用户的实时数据为用户与业务人员进行沟通时采集的视频,显然该视频可以被分为实时视频分量以及实时音频分量,其中,实时视频分量为只包含图像信息而不包含语音信息的分量,而实时音频分量为只包含语音信息而不包含图像信息的分量。
显然,由于实时数据是在用户与业务人员沟通过程中,采集的用户侧的视频,所以实时视频分量中包含用户的人脸数据,实时音频分量中包含用户和业务人员双方的语音数据。
在S103中,计算所述实时视频分量中包含的人脸数据与所述用户身份数据的相似度。
在本发明实施例中,需要首先通过计算实时视频分量中包含的人脸数据与所述用户身份数据的相似度,判断当前正在远程办理业务的用户是否为登录信息对应的用户,以此来避免由于登录密码泄露或盗号造成的安全性隐患。
作为本发明的一个实施例,如图3所示,上述S103包括:
S1031,从所述实时视频分量中截取一帧图像,作为目标图像。
可以理解地,实时视频分量实际是由多帧图像组成的,本发明实施例选择其中一帧图像作为目标图像进行分析。
S1032,将所述目标图像分割成多个图像区域,并读取所述图像区域中各个像素点的像素点数据,依照预设顺序对所述图像区域进行编号。
示例性地,可以将所述目标图像延横向划分为100个等份,并延纵坐标划分为100个等份,则目标图像可以被分为10000个图像区域,每个图像区域中均包含多个像素点。
可选地,像素点数据可以是一个像素点的RGB值,即通过一个像素点数据可以表示一个像素点的RGB值。
S1033,将预设个数的编号相邻的图像区域的像素点数据同时输入预设的VGG神经网络模型,输出编号居中的图像区域对应的分割系数,所述预设个数为大于1的奇数。
在本发明实施例中,并不是将每一个图像区域的像素点数据单独地输入预设的VGG神经网络模型中,而是由于考虑到人脸在各个图像区域中连续覆盖的原因,为了尽量避免间断式的图像区域计算可能导致的偶然性误差,因此本发明实施例是将预设个数的编号相邻的图像区域的像素点数据同时输入神经网络模型(例如,将3个连续的图像区域的像素点数据同时输入神经网络模型),而在结果输出时,只输出编号居中的图像区域对应的分割系数,所述分割系数用于区分人脸图像所覆盖的图像区域或非人脸图像所覆盖的图像区域。
在本发明实施例中,将预设数量的编号相邻的图像区域作为一个区域组,将每个图像区域中各个像素点的像素点数据整理组合成向量后,就可以生成一个区域组的特征向量。
可以理解地,只需在VGG神经网络模型的训练过程中,将输入参数设定为预设数量的编号相邻的图像区域的像素点数据,将输出参数设定为预设的编号居中的图像区域对应的分割系数,那么自然这样训练出的神经网络模型,可以实现上文所述的输出编号居中的图像区域对应的分割系数。
具体地,VGG神经网络的训练过程包括:获取多个训练区域组的训练特征向量以及训练区域组中居中的图像区域的训练分割系数;反复执行以下步骤直至调整后的VGG神经网络的交叉熵损失函数值小于预设的阈值:将所述训练特征向量作为VGG神经网络的输入,将所述训练分割系数作为所述VGG神经网络的输出,通过随机梯度下降法对所述VGG神经网络的全连接层中的各层参数进行更新,并计算调整后的VGG神经网络的交叉熵损失函数值。最后输出交叉熵损失函数值小于预设的阈值的VGG神经网络作为预设的神经网络模型。
示例性地,假设一共有100个图像区域,如果预设数量为3,则将编号1-3的图像区域的像素点数据输入神经网络模型后,会输出编号2的图像区域的分割系数;将编号2-4的图像区域的像素点数据输入神经网络模型后,会输出编号为3的图像区域的分割系数,以此类推,直至输出编号为99的图像区域的分割系数。
值得注意地,通过上述方法无法获取编号为1以及编号为100的图像区域的分割系数,但是由于获取图像区域的分割系数最终的目的是为了从目标图像中分割出人脸图像,而人脸图像覆盖到目标图像边缘的像素点的概率极小,所以虽然本发明实施例无法计算出编号最大和编号最小的图像区域的分割系数,但是在实际应用中并不会影响对于人脸图像的分割。
S1034,将小于预设的系数阈值的分割系数对应的像素点作为人脸像素点,并根据全部所述人脸像素点的像素点数据,生成人脸数据。
S1035,通过距离公式计算所述人脸数据对应的矩阵与所述用户身份数据对应的矩阵的相似度,作为所述视频分量中包含的人脸数据与所述用户身份数据的相似度。
可选地,所述距离公式为:其中,所述S为所述相似度,所述Xi为所述人脸数据对应的矩阵中的第i个元素,所述Yi为所述用户身份数据对应的矩阵中的第i个元素,所述K为所述人脸数据对应的矩阵以及用户身份数据对应的矩阵所包含元素的个数。
在S104中,若所述人脸数据与所述用户身份数据的相似度小于预设的相似度阈值,则判定所述实时数据未通过验证。
在S105中,若所述人脸数据与所述用户身份数据的相似度不小于预设的相似度阈值,则计算预设时间段内所述实时音频分量中包含所述验证关键词的数量。
可选地,通过语音文本转换算法将所述预设时间段内的所述实时音频分量转换为文本数据;将所述文本数据进行分词处理,生成语音词语集合,所述语音词语集合中包含多个词语;计算所述语音词语集合中包含所述验证关键词的数量,作为所述实时音频分量中包含所述验证关键词的数量。
在S106中,若所述实时音频分量中包含所述验证关键词的数量不大于第二预设数量阈值,则判定所述实时数据未通过验证。
在S107中,若所述实时音频分量中包含所述验证关键词的数量不大于第一预设数量阈值但大于第二预设数量阈值,则从多个异步处理服务器中选择一个作为被选服务器,并将所述实时数据发送至所述被选服务器,以通过所述被选服务器对所述实时数据进行非实时验证。
在本发明实施例中,当实时音频分量中包含的关键词的数量不足够多时,不能直接判定实时数据是否通过验证,需要通过其他的异步处理服务器进行进一步自动分析或人工分析。由于本发明实施例只从主服务器一侧介绍实时数据的验证方法,所以在此只介绍主服务器如何选取一个异步处理服务器作为被选服务器,并将实时数据发送至被选服务器,并不涉及被选服务器如何对实时数据进行非实时验证。
作为本发明的一个实施例,如图4所示,上述S107包括:
S1071,调取多个异步处理服务器各自包含的线程数,并统计在当前时刻之前的单位时间段内接收到各个异步处理服务器反馈的异常任务数。
S1072,通过分段公式计算各个异步处理服务器对应的发送参数。
可选地,所述分段公式包括:所述K(i)表示异步处理服务器i对应的发送参数,所述Z(i)表示异步处理服务器i对应的所述线程数,所述D(i)表示异步处理服务器i对应的异常任务数。
S1073,通过比例计算公式计算各个异步处理服务器对应的发送比例。
可选地,所述比例计算公式包括:所述Pari表示异步处理服务器i对应的发送比例,所述K(i)表示异步处理服务器i对应的发送参数,所述n为异步处理服务器的个数。
S1074,选择其中一个最高的发送比例对应的异步处理服务器作为被选服务器。
在S108中,若所述实时音频分量中包含所述验证关键词的数量大于所述第一预设数量阈值,则判定所述实时数据通过验证。
可以理解地,通过登录信息获取用户身份数据以及验证关键词,接收用户的实时数据,将实时数据分为实时视频以及实时音频数据,计算实时视频分量中包含的人脸数据与用户身份数据的相似度,以对用户身份进行验证,若相似度不小于预设的相似度阈值,则计算预设时间段内实时音频分量中包含验证关键词的数量,以对实时数据是否合法进行验证,若实时音频分量中包含所述验证关键词的数量大于第一数量阈值,则判定所述实时数据通过验证,以对实时数据进行智能化分析,提高业务远程办理的安全性。
对应于上文实施例所述的实时数据的验证方法,图5示出了本发明实施例提供的实时数据的验证装置的结构框图,为了便于说明,仅示出了与本发明实施例相关的部分。
参照图5,该装置包括:
解析模块501,用于在接收到用户的登录信息后,确定所述登录信息对应的用户身份数据,并解析所述登录信息中包含的关键码,基于所述关键码确定所述用户对应的多个验证关键词;
分解模块502,用于接收用户的实时数据,将所述实时数据分为实时视频分量以及实时音频分量,所述实时视频分量中包含人脸数据;
计算模块503,用于计算所述实时视频分量中包含的人脸数据与所述用户身份数据的相似度,若所述人脸数据与所述用户身份数据的相似度不小于预设的相似度阈值,则计算预设时间段内所述实时音频分量中包含所述验证关键词的数量;
第一执行模块504,用于若所述实时音频分量中包含所述验证关键词的数量不大于第一数量阈值但大于第二数量阈值,则从多个异步处理服务器中选择一个作为被选服务器,并将所述实时数据发送至所述被选服务器,以通过所述被选服务器对所述实时数据进行非实时验证;
第二执行模块505,用于若所述实时音频分量中包含所述验证关键词的数量大于第一数量阈值,则判定所述实时数据通过验证。
可选地,所述解析模块,具体用于:
调取预设周期内接收的所述关键码对应的词语集合,所述词语集合中的各个词语均对应一个接收时刻;
根据所述词语集合中各个词语与接收时刻的对应关系,建立接收时间段与各个词语的词语出现次数的对应关系,所述接收时间段包括多个接收时刻,所述词语出现次数为在一个所述接收时间段内所述词语在所述词语集合中的出现次数;
通过回归模型:拟合表征所述词语出现次数与接收时间段的对应关系的回归方程,生成所述词语集合中各个词语对应的回归方程,其中,num表示所述词语次数、time表示接收时间段序号、pre1和pre2分别是两个非线性回归方程的系数,所述e为自然常数;
基于所述词语集合中各个词语对应的回归方程,计算各个词语在当前时刻之后的预设数量的接收时间段内的出现次数,作为各个词语对应的预测出现次数;
选择所述预测出现次数不小于预设次数阈值的词语作为所述用户对应的验证关键词。
可选地,所述计算模块,具体用于:
从所述实时视频分量中截取一帧图像,作为目标图像;
将所述目标图像分割成多个图像区域,并读取所述图像区域中各个像素点的像素点数据,依照预设顺序对所述图像区域进行编号;
将预设个数的编号相邻的图像区域的像素点数据同时输入预设的VGG神经网络模型,输出编号居中的图像区域对应的分割系数,所述预设个数为大于1的奇数
将小于预设的系数阈值的分割系数对应的像素点作为人脸像素点,并根据全部所述人脸像素点的像素点数据,生成人脸数据;
通过公式:计算所述人脸数据对应的矩阵与所述用户身份数据对应的矩阵的相似度,作为所述视频分量中包含的人脸数据与所述用户身份数据的相似度,其中所述S为所述相似度,所述Xi为所述人脸数据对应的矩阵中的第i个元素,所述Yi为所述用户身份数据对应的矩阵中的第i个元素,所述K为所述人脸数据对应的矩阵以及用户身份数据对应的矩阵所包含元素的个数。
可选地,所述计算预设时间段内所述实时音频分量中包含所述验证关键词的数量,包括:通过语音文本转换算法将所述预设时间段内的所述实时音频分量转换为文本数据;将所述文本数据进行分词处理,生成语音词语集合,所述语音词语集合中包含多个词语;计算所述语音词语集合中包含所述验证关键词的数量,作为所述实时音频分量中包含所述验证关键词的数量。
可选地,所述从多个异步处理服务器中选择一个作为被选服务器,包括:
调取多个异步处理服务器各自包含的线程数,并统计在当前时刻之前的单位时间段内接收到各个异步处理服务器反馈的异常任务数;
通过公式:计算各个异步处理服务器对应的发送参数,所述K(i)表示异步处理服务器i对应的发送参数,所述Z(i)表示异步处理服务器i对应的所述线程数,所述D(i)表示异步处理服务器i对应的异常任务数;通过公式:计算各个异步处理服务器对应的发送比例,所述Pari表示异步处理服务器i对应的发送比例,所述K(i)表示异步处理服务器i对应的发送参数,所述n为异步处理服务器的个数;选择其中一个最高的发送比例对应的异步处理服务器作为被选服务器。
可以理解地,通过登录信息获取用户身份数据以及验证关键词,接收用户的实时数据,将实时数据分为实时视频以及实时音频数据,计算实时视频分量中包含的人脸数据与用户身份数据的相似度,以对用户身份进行验证,若相似度不小于预设的相似度阈值,则计算预设时间段内实时音频分量中包含验证关键词的数量,以对实时数据是否合法进行验证,若实时音频分量中包含所述验证关键词的数量大于第一数量阈值,则判定所述实时数据通过验证,以对实时数据进行智能化分析,提高业务远程办理的安全性。
图6是本发明一实施例提供的服务器的示意图。如图6所示,该实施例的服务器6包括:处理器60、存储器61以及存储在所述存储器61中并可在所述处理器60上运行的计算机程序62,例如实时数据的验证程序。所述处理器60执行所述计算机程序62时实现上述各个实时数据的验证方法实施例中的步骤,例如图1所示的步骤101至108。或者,所述处理器60执行所述计算机程序62时实现上述各装置实施例中各模块/单元的功能,例如图5所示单元501至505的功能。
示例性的,所述计算机程序62可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器61中,并由所述处理器60执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序62在所述服务器6中的执行过程。
所述服务器6可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述服务器可包括,但不仅限于,处理器60、存储器61。本领域技术人员可以理解,图6仅仅是服务器6的示例,并不构成对服务器6的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述服务器还可以包括输入输出设备、网络接入设备、总线等。
所称处理器60可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器61可以是所述服务器6的内部存储单元,例如服务器6的硬盘或内存。所述存储器61也可以是所述服务器6的外部存储设备,例如所述服务器6上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器61还可以既包括所述服务器6的内部存储单元也包括外部存储设备。所述存储器61用于存储所述计算机程序以及所述服务器所需的其他程序和数据。所述存储器61还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (10)

1.一种实时数据的验证方法,其特征在于,包括:
在接收到用户的登录信息后,确定所述登录信息对应的用户身份数据,并解析所述登录信息中包含的关键码,基于所述关键码确定所述用户对应的多个验证关键词;
接收用户的实时数据,将所述实时数据分为实时视频分量以及实时音频分量,所述实时视频分量中包含人脸数据;
计算所述实时视频分量中包含的人脸数据与所述用户身份数据的相似度,若所述人脸数据与所述用户身份数据的相似度不小于预设的相似度阈值,则计算预设时间段内所述实时音频分量中包含所述验证关键词的数量;
若所述实时音频分量中包含所述验证关键词的数量不大于第一预设数量阈值但大于第二预设数量阈值,则从多个异步处理服务器中选择一个作为被选服务器,并将所述实时数据发送至所述被选服务器,以通过所述被选服务器对所述实时数据进行非实时验证,所述第二预设数量阈值小于所述第一预设数量阈值;
若所述实时音频分量中包含所述验证关键词的数量大于所述第一预设数量阈值,则判定所述实时数据通过验证。
2.如权利要求1所述的实时数据的验证方法,其特征在于,所述基于所述关键码确定所述用户对应的多个验证关键词,包括:
调取预设周期内接收的所述关键码对应的词语集合,所述词语集合中的各个词语均对应一个接收时刻;
根据所述词语集合中各个词语与接收时刻的对应关系,建立接收时间段与各个词语的词语出现次数的对应关系,所述接收时间段包括多个接收时刻,所述词语出现次数为在一个所述接收时间段内所述词语在所述词语集合中的出现次数;
通过回归模型:拟合表征所述词语出现次数与接收时间段的对应关系的回归方程,生成所述词语集合中各个词语对应的回归方程,其中,num表示所述词语次数、time表示接收时间段序号、pre1和pre2分别是两个非线性回归方程的系数,所述e为自然常数;
基于所述词语集合中各个词语对应的回归方程,计算各个词语在当前时刻之后的预设数量的接收时间段内的出现次数,作为各个词语对应的预测出现次数;
选择所述预测出现次数不小于预设次数阈值的词语作为所述用户对应的验证关键词。
3.如权利要求1所述的实时数据的验证方法,其特征在于,所述计算所述实时视频分量中包含的人脸数据与所述用户身份数据的相似度,包括:
从所述实时视频分量中截取一帧图像,作为目标图像;
将所述目标图像分割成多个图像区域,并读取所述图像区域中各个像素点的像素点数据,依照预设顺序对所述图像区域进行编号;
将预设个数的编号相邻的图像区域的像素点数据同时输入预设的VGG神经网络模型,输出编号居中的图像区域对应的分割系数,所述预设个数为大于1的奇数;
将小于预设的系数阈值的分割系数对应的像素点作为人脸像素点,并根据全部所述人脸像素点的像素点数据,生成人脸数据;
通过公式:计算所述人脸数据对应的矩阵与所述用户身份数据对应的矩阵的相似度,作为所述视频分量中包含的人脸数据与所述用户身份数据的相似度,其中,所述S为所述相似度,所述Xi为所述人脸数据对应的矩阵中的第i个元素,所述Yi为所述用户身份数据对应的矩阵中的第i个元素,所述K为所述人脸数据对应的矩阵以及用户身份数据对应的矩阵所包含元素的个数。
4.如权利要求1所述的实时数据的验证方法,其特征在于,所述计算预设时间段内所述实时音频分量中包含所述验证关键词的数量,包括:
通过语音文本转换算法将所述预设时间段内的所述实时音频分量转换为文本数据;
将所述文本数据进行分词处理,生成语音词语集合,所述语音词语集合中包含多个词语;
计算所述语音词语集合中包含所述验证关键词的数量,作为所述实时音频分量中包含所述验证关键词的数量。
5.如权利要求1所述的实时数据的验证方法,其特征在于,所述从多个异步处理服务器中选择一个作为被选服务器,包括:
调取多个异步处理服务器各自包含的线程数,并统计在当前时刻之前的单位时间段内接收到各个异步处理服务器反馈的异常任务数;
通过公式:计算各个异步处理服务器对应的发送参数,所述K(i)表示异步处理服务器i对应的发送参数,所述Z(i)表示异步处理服务器i对应的所述线程数,所述D(i)表示异步处理服务器i对应的异常任务数;
通过公式:计算各个异步处理服务器对应的发送比例,所述Pari表示异步处理服务器i对应的发送比例,所述K(i)表示异步处理服务器i对应的发送参数,所述n为异步处理服务器的个数;
选择其中一个最高的发送比例对应的异步处理服务器作为被选服务器。
6.一种实时数据的验证装置,其特征在于,所述装置包括:
解析模块,用于在接收到用户的登录信息后,确定所述登录信息对应的用户身份数据,并解析所述登录信息中包含的关键码,基于所述关键码确定所述用户对应的多个验证关键词;
分解模块,用于接收用户的实时数据,将所述实时数据分为实时视频分量以及实时音频分量,所述实时视频分量中包含人脸数据;
计算模块,用于计算所述实时视频分量中包含的人脸数据与所述用户身份数据的相似度,若所述人脸数据与所述用户身份数据的相似度不小于预设的相似度阈值,则计算预设时间段内所述实时音频分量中包含所述验证关键词的数量;
第一执行模块,用于若所述实时音频分量中包含所述验证关键词的数量不大于第一数量阈值但大于第二数量阈值,则从多个异步处理服务器中选择一个作为被选服务器,并将所述实时数据发送至所述被选服务器,以通过所述被选服务器对所述实时数据进行非实时验证;
第二执行模块,用于若所述实时音频分量中包含所述验证关键词的数量大于第一数量阈值,则判定所述实时数据通过验证。
7.如权利要求6所述的实时数据的验证装置,其特征在于,所述解析模块,具体用于:
调取预设周期内接收的所述关键码对应的词语集合,所述词语集合中的各个词语均对应一个接收时刻;
根据所述词语集合中各个词语与接收时刻的对应关系,建立接收时间段与各个词语的词语出现次数的对应关系,所述接收时间段包括多个接收时刻,所述词语出现次数为在一个所述接收时间段内所述词语在所述词语集合中的出现次数;
通过回归模型:拟合表征所述词语出现次数与接收时间段的对应关系的回归方程,生成所述词语集合中各个词语对应的回归方程,其中,num表示所述词语次数、time表示接收时间段序号、pre1和pre2分别是两个非线性回归方程的系数,所述e为自然常数;
基于所述词语集合中各个词语对应的回归方程,计算各个词语在当前时刻之后的预设数量的接收时间段内的出现次数,作为各个词语对应的预测出现次数;
选择所述预测出现次数不小于预设次数阈值的词语作为所述用户对应的验证关键词。
8.如权利要求6所述的实时数据的验证装置,其特征在于,所述计算模块,具体用于:
从所述实时视频分量中截取一帧图像,作为目标图像;
将所述目标图像分割成多个图像区域,并读取所述图像区域中各个像素点的像素点数据,依照预设顺序对所述图像区域进行编号;
将预设个数的编号相邻的图像区域的像素点数据同时输入预设的VGG神经网络模型,输出编号居中的图像区域对应的分割系数,所述预设个数为大于1的奇数
将小于预设的系数阈值的分割系数对应的像素点作为人脸像素点,并根据全部所述人脸像素点的像素点数据,生成人脸数据;
通过公式:计算所述人脸数据对应的矩阵与所述用户身份数据对应的矩阵的相似度,作为所述视频分量中包含的人脸数据与所述用户身份数据的相似度,其中所述S为所述相似度,所述Xi为所述人脸数据对应的矩阵中的第i个元素,所述Yi为所述用户身份数据对应的矩阵中的第i个元素,所述K为所述人脸数据对应的矩阵以及用户身份数据对应的矩阵所包含元素的个数。
9.一种服务器,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述方法的步骤。
CN201910424123.0A 2019-05-21 2019-05-21 实时数据的验证方法、装置、服务器及介质 Pending CN110266645A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201910424123.0A CN110266645A (zh) 2019-05-21 2019-05-21 实时数据的验证方法、装置、服务器及介质
PCT/CN2019/103300 WO2020232894A1 (zh) 2019-05-21 2019-08-29 实时数据的验证方法、装置、服务器及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910424123.0A CN110266645A (zh) 2019-05-21 2019-05-21 实时数据的验证方法、装置、服务器及介质

Publications (1)

Publication Number Publication Date
CN110266645A true CN110266645A (zh) 2019-09-20

Family

ID=67914974

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910424123.0A Pending CN110266645A (zh) 2019-05-21 2019-05-21 实时数据的验证方法、装置、服务器及介质

Country Status (2)

Country Link
CN (1) CN110266645A (zh)
WO (1) WO2020232894A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112036370A (zh) * 2020-09-22 2020-12-04 济南博观智能科技有限公司 一种人脸特征比对方法、系统、设备及计算机存储介质
WO2022206184A1 (en) * 2021-03-29 2022-10-06 International Business Machines Corporation Graphical adjustment recommendations for vocalization
CN117726307A (zh) * 2024-02-18 2024-03-19 成都汇智捷成科技有限公司 一种基于业务中台的数据治理方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106205621A (zh) * 2016-07-28 2016-12-07 北京小米移动软件有限公司 关键词确定方法及装置
US20180242041A1 (en) * 2014-12-01 2018-08-23 Google Llc System and method for associating search queries with remote content display
CN108512869A (zh) * 2017-02-24 2018-09-07 贵州白山云科技有限公司 一种采用异步化方式处理并发数据的方法及系统
CN109190775A (zh) * 2018-09-05 2019-01-11 南方电网科学研究院有限责任公司 一种智能运维管理设备及运维管理方法
CN109377500A (zh) * 2018-09-18 2019-02-22 平安科技(深圳)有限公司 基于神经网络的图像分割方法及终端设备
CN109376344A (zh) * 2018-09-03 2019-02-22 平安普惠企业管理有限公司 表单的生成方法及终端设备
CN109389279A (zh) * 2018-08-17 2019-02-26 深圳壹账通智能科技有限公司 保险销售环节合规判定方法、装置、设备及存储介质
CN109729383A (zh) * 2019-01-04 2019-05-07 深圳壹账通智能科技有限公司 双录视频质量检测方法、装置、计算机设备和存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104580650A (zh) * 2014-12-25 2015-04-29 广东欧珀移动通信有限公司 一种提示诈骗电话的方法及通信终端
GB2550209A (en) * 2016-05-13 2017-11-15 Lucozade Ribena Suntory Ltd Method of controlling a state of a display of a device

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180242041A1 (en) * 2014-12-01 2018-08-23 Google Llc System and method for associating search queries with remote content display
CN106205621A (zh) * 2016-07-28 2016-12-07 北京小米移动软件有限公司 关键词确定方法及装置
CN108512869A (zh) * 2017-02-24 2018-09-07 贵州白山云科技有限公司 一种采用异步化方式处理并发数据的方法及系统
CN109389279A (zh) * 2018-08-17 2019-02-26 深圳壹账通智能科技有限公司 保险销售环节合规判定方法、装置、设备及存储介质
CN109376344A (zh) * 2018-09-03 2019-02-22 平安普惠企业管理有限公司 表单的生成方法及终端设备
CN109190775A (zh) * 2018-09-05 2019-01-11 南方电网科学研究院有限责任公司 一种智能运维管理设备及运维管理方法
CN109377500A (zh) * 2018-09-18 2019-02-22 平安科技(深圳)有限公司 基于神经网络的图像分割方法及终端设备
CN109729383A (zh) * 2019-01-04 2019-05-07 深圳壹账通智能科技有限公司 双录视频质量检测方法、装置、计算机设备和存储介质

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112036370A (zh) * 2020-09-22 2020-12-04 济南博观智能科技有限公司 一种人脸特征比对方法、系统、设备及计算机存储介质
CN112036370B (zh) * 2020-09-22 2023-05-12 济南博观智能科技有限公司 一种人脸特征比对方法、系统、设备及计算机存储介质
WO2022206184A1 (en) * 2021-03-29 2022-10-06 International Business Machines Corporation Graphical adjustment recommendations for vocalization
US11688106B2 (en) 2021-03-29 2023-06-27 International Business Machines Corporation Graphical adjustment recommendations for vocalization
CN117726307A (zh) * 2024-02-18 2024-03-19 成都汇智捷成科技有限公司 一种基于业务中台的数据治理方法
CN117726307B (zh) * 2024-02-18 2024-04-30 成都汇智捷成科技有限公司 一种基于业务中台的数据治理方法

Also Published As

Publication number Publication date
WO2020232894A1 (zh) 2020-11-26

Similar Documents

Publication Publication Date Title
CN110598016B (zh) 一种多媒体信息推荐的方法、装置、设备和介质
Boukabous et al. Crime prediction using a hybrid sentiment analysis approach based on the bidirectional encoder representations from transformers
CN110266645A (zh) 实时数据的验证方法、装置、服务器及介质
CN112800234B (zh) 信息处理方法、装置、电子设备和存储介质
CN112700252B (zh) 一种信息安全性检测方法、装置、电子设备和存储介质
Yin et al. Towards accurate intrusion detection based on improved clonal selection algorithm
CN105956469A (zh) 文件安全性识别方法和装置
CN113726784A (zh) 一种网络数据的安全监控方法、装置、设备及存储介质
CN107526718A (zh) 用于生成文本的方法和装置
CN106803092B (zh) 一种标准问题数据的确定方法及装置
CN113762973A (zh) 数据处理方法、装置、计算机可读介质及电子设备
CN115204886A (zh) 账户识别的方法、装置、电子设备和存储介质
CN115037553A (zh) 信息安全监控模型构建及其应用方法、装置和存储介质
CN109377436A (zh) 一种环境精准监管方法与装置、终端设备及存储介质
CN113761217A (zh) 基于人工智能的题目集数据处理方法、装置和计算机设备
WO2023165145A1 (zh) 时序流量预测方法及装置、存储介质及电子设备
CN116506206A (zh) 基于零信任网络用户的大数据行为分析方法及系统
CN115221954B (zh) 用户画像方法、装置、电子设备以及存储介质
CN117011859A (zh) 一种图片处理的方法以及相关装置
CN114358186A (zh) 一种数据处理方法、装置及计算机可读存储介质
Brosso et al. Adaptive security policy using user behavior analysis and human elements of information security
Tan et al. Detection of malicious web requests using neural networks with multi granularity features
CN113838579A (zh) 一种医疗数据的异常检测方法、装置、设备及存储介质
Lopardo et al. Faithful and Robust Local Interpretability for Textual Predictions
Sánchez et al. Generation of a synthetic dataset for the study of fraud through deep learning techniques

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190920