CN115359385A - 视频数据处理方法、装置和计算机设备 - Google Patents

视频数据处理方法、装置和计算机设备 Download PDF

Info

Publication number
CN115359385A
CN115359385A CN202210875443.XA CN202210875443A CN115359385A CN 115359385 A CN115359385 A CN 115359385A CN 202210875443 A CN202210875443 A CN 202210875443A CN 115359385 A CN115359385 A CN 115359385A
Authority
CN
China
Prior art keywords
data
video
biological object
feature
video frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210875443.XA
Other languages
English (en)
Inventor
郑若冰
程远
王萌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN202210875443.XA priority Critical patent/CN115359385A/zh
Publication of CN115359385A publication Critical patent/CN115359385A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/41Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/762Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Computational Linguistics (AREA)
  • Image Analysis (AREA)

Abstract

本说明书实施例公开了一种视频数据处理方法、装置和计算机设备。所述方法包括:根据生物对象的视频数据,获取多个视频帧;根据视频帧提取第一特征数据,所述第一特征数据用于表示生物对象的身份信息;对多个第一特征数据进行聚合,得到用于核验生物对象身份的第二特征数据。本说明书实施例可以提高身份核验时的准确程度。

Description

视频数据处理方法、装置和计算机设备
技术领域
本说明书实施例涉及计算机技术领域,特别涉及一种视频数据处理方法、装置和计算机设备。
背景技术
在一些应用场景中,为了保护业务安全,需要对生物对象的身份进行核验。
在相关技术中,可以采集生物对象的图像数据,所述图像数据中可以包含生物对象的身份信息。可以根据所述图像数据对生物对象的身份进行核验。
图像数据中身份信息的质量,会影响到对生物对象的身份进行核验时的准确程度。然而,受限于客观因素,采集高质量的图像数据往往是比较困难的。以宠物为例,由于宠物活泼好动的天性,使得,拍摄的图像数据的质量难以保证。例如,拍摄的图像数据会出现模糊、未拍摄到宠物等情况。低质量的图像数据,会降低对宠物的身份进行核验时的准确程度。
发明内容
本说明书实施例提供一种视频数据处理方法、装置和计算机设备,以提高身份核验时的准确程度。本说明书实施例的技术方案如下。
本说明书实施例的第一方面,提供了一种视频数据处理方法,包括:
根据生物对象的视频数据,获取多个视频帧;
根据视频帧,提取第一特征数据,所述第一特征数据用于表示生物对象的身份信息;
对多个第一特征数据进行聚合,得到用于核验生物对象身份的第二特征数据。
本说明书实施例的第二方面,提供了一种视频数据处理装置,包括:
获取单元,用于根据生物对象的视频数据,获取多个视频帧;
提取单元,用于根据视频帧,提取第一特征数据,所述第一特征数据用于表示生物对象的身份信息;
聚合单元,用于对多个第一特征数据进行聚合,得到用于核验生物对象身份的第二特征数据。
本说明书实施例的第三方面,提供了一种计算机设备,包括:
至少一个处理器;
存储有程序指令的存储器,其中,所述程序指令被配置为适于由所述至少一个处理器执行,所述程序指令包括用于执行如第一方面所述方法的指令。
本说明书实施例提供的技术方案,可以根据生物对象的视频数据,获取多个视频帧;可以根据视频帧,提取第一特征数据;可以对多个第一特征数据进行聚合,得到第二特征数据。所述第二特征数据是根据多个视频帧中的身份信息获得的,所述多个视频帧可以对应生物对象的多个拍摄角度和多个姿态。使得,所述第二特征数据能够准确的表示生物对象的身份信息。通过所述第二特征数据,可以提高身份核验时的准确程度。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本说明书实施例中视频数据处理方法的流程示意图;
图2为本说明书实施例中多个视频帧的权重参数的示意图;
图3为本说明书实施例中视频数据处理过程的示意图;
图4为本说明书实施例中视频数据处理装置的结构示意图;
图5为本说明书实施例中计算机设备的结构示意图。
具体实施方式
下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
相较于图像数据,采集高质量的视频数据较为容易,不易受到客观因素的影响。在相关技术中,可以采集生物对象的视频数据;可以从视频数据中抽取单个视频帧;可以根据单个视频帧核验生物对象的身份。然而,单个视频帧仅对应生物对象的一个拍摄角度和一个姿态,单个视频帧中的身份信息有限。因此,上述相关技术在身份核验时的准确程度较低。
本说明书实施例提供一种视频数据处理方法。所述视频数据处理方法,用于利用视频数据进行核身,提高身份核验时的准确程度。所述视频数据处理方法可以应用于计算机设备。所述计算机设备可以包括个人计算机、智能手机、平板电脑、笔记本电脑、服务器、包括多个服务器的服务器集群等。请参阅图1、图2和图3。所述视频数据处理方法包括以下步骤。
步骤S11:根据生物对象的视频数据,获取多个视频帧。
在一些实施例中,所述视频数据的视频格式包括但不限于MPEG格式、AVI格式、MOV格式、3GP格式、H.264格式等。所述视频数据可以包括多帧图像数据。每帧图像数据可以称为一个视频帧。所述视频数据的帧率(Frame Rate)可以为24fps、30fps、或者60fps等。其中,所述视频帧的颜色空间包括但不限于RGB、YUV等等。所述生物对象可以为生物体或者生物体上的身体部位。所述生物体可以包括人、动物等。所述动物可以包括野生动物、豢养动物(例如猫、狗等宠物)等。所述身体部位可以包括脸、虹膜、巩膜、指纹、掌纹、牙齿等。
所述多个视频帧中可以包含同一生物对象的身份信息。所述身份信息用于标识生物对象。不同视频帧中身份信息的质量可以相同或不同。影响质量的因素可以包括以下至少之一:视频帧的清晰度、视频帧的拍摄情况(例如拍摄高度、拍摄方向、拍摄距离)、视频帧中生物对象的姿态(例如倾斜角度、俯仰角度)。例如,视频帧的清晰度越高、视频帧的拍摄距离越近、视频帧中生物对象的姿态越正面,则视频帧中身份信息的质量越高。再比如,视频帧的清晰度越低、视频帧的拍摄距离越远、视频帧中生物对象的姿态越倾斜,则视频帧中身份信息的质量越低。例如,请参阅图2。在图2中,视频帧a中身份信息的质量高于视频帧b。
在一些实施例中,可以获取生物对象的视频数据。具体地,所述计算机设备可以包括拍摄组件,所述拍摄组件可以包括摄像头等。所述拍摄组件用于采集视频数据。所述计算机设备可以利用摄像组件采集生物对象的视频数据。或者,所述计算机设备还可以接收其它设备发来的视频数据。所述其它设备可以包括智能手机、个人计算机、平板电脑、摄像机等。
在一些实施例中,可以从视频数据中抽取多个视频帧。具体地,可以从视频数据中随机抽取多个视频帧。或者,考虑到视频数据中相邻的视频帧比较相似,可以从视频数据中均匀抽取多个视频帧。这样所抽取的多个视频帧的差异较大,有利于全面地利用视频数据中的身份信息进行核身。例如,可以每间隔预设帧数抽取一个或多个视频帧,所述预设帧数可以为30、或者50等。当然,还可以采用其它的方式抽取视频帧。例如,可以获取抽帧规则;可以根据所述抽帧规则从视频数据中抽取多个视频帧。具体地,例如,所述抽帧规则可以包括多个索引位置,每个所述索引位置可以指向视频数据中的一个视频帧。从而可以根据所述多个索引位置从视频数据中抽取相应的多个视频帧。当然,所述抽帧规则还可以为其它的规则。可以接收用户输入的所述抽帧规则。或者,还可以接收其它设备发来的所述抽帧规则。
步骤S13:根据视频帧提取第一特征数据。
在一些实施例中,针对每个视频帧,可以从该视频帧中提取生物对象的第一特征数据。根据所述多个视频帧,可以提取得到多个第一特征数据。所述第一特征数据可以用于表示生物对象的身份信息。所述第一特征数据可以为特征值、特征向量、特征矩阵或者特征图(Feature Map)等。所述第一特征数据的维度可以为N。所述N可以为1、300、512、或600等。其中,所述第一特征数据的维度可以指第一特征数据中数据元素的数量。
在一些实施例中,可以在视频帧中确定生物对象所在的目标区域;可以根据目标区域提取第一特征数据。其中,可以将视频帧输入至区域检测模型,得到生物对象所在的目标区域。所述区域检测模型可以用于检测生物对象所在的目标区域。所述区域检测模型可以包括NanoDet模型、YOLO模型(例如YOLO-V3模型)等。可以采用特征提取算法提取目标区域的特征数据作为第一特征数据。所述特征提取算法可以包括SIFT算法、HOG算法等。
在一些实施例中,可以采用机器学习的方式从视频帧中提取生物对象的第一特征数据。具体地,可以将视频帧输入至特征提取模型,得到第一特征数据。所述特征提取模型可以包括神经网络模型、支持向量机模型等。可以将多个视频帧分别输入至特征提取模型,得到第一特征数据。或者,还可以将多个视频帧同时输入至特征提取模型,得到多个第一特征数据。
步骤S15:对多个第一特征数据进行聚合,得到第二特征数据。
在一些实施例中,可以对所述多个第一特征数据进行聚合处理,得到第二特征数据。所述第二特征数据是根据多个视频帧中的身份信息获得的,所述多个视频帧可以对应生物对象的多个拍摄角度和多个姿态。使得,所述第二特征数据能够准确的表示生物对象的身份信息。
所述第二特征数据可以为特征值、特征向量、特征矩阵或者特征图等。所述第二特征数据的维度可以与第一特征数据相同或不同。例如,所述第一特征数据和所述第二特征数据均可以为维度为N的特征向量。所述N可以为1、300、512、或600等。
在一些实施例中,可以直接对所述多个第一特征数据进行聚合,得到第二特征数据。
例如,可以计算所述多个第一特征数据的平均数据,得到第二特征数据。具体地,例如,所述第一特征数据和所述第二特征数据均可以为维度为N的特征向量。那么,可以根据公式
Figure BDA0003762235570000041
计算第二特征数据。其中,yi表示第二特征数据中的第i个数据元素,i为1和N之间的自然数,m表示第一特征数据的数量,xj,i表示第j个特征数据中的第i个数据元素。
在一些实施例中,还可以确定视频帧的权重参数;可以根据权重参数,对所述多个第一特征数据进行聚合,得到第二特征数据。所述权重参数可以与视频帧中身份信息的质量相关。具体地,所述权重参数可以与身份信息的质量呈正相关。使得,在所述第二特征数据中,从高质量视频帧中所提取的第一特征数据的占比较多,从低质量视频帧中所提取的第一特征数据的占比较少。从而增强了视频数据中的有益身份信息,抑制了视频数据中的干扰信息。
可以确定视频帧的质量指标;可以根据质量指标,确定视频帧的权重参数。
所述质量指标可以用于表示身份信息的质量。所述质量指标的种类可以为一个或多个。所述质量指标可以包括以下至少一种:视频帧的清晰度、生物对象的大小、生物对象的完整度、生物对象的姿态角度。其中,生物对象的大小可以利用目标区域与视频帧的面积比值来表示。所述目标区域可以为视频帧中生物对象所在的区域。
可以根据质量指标,利用权重设置规则,确定视频帧的权重参数。所述权重设置规则可以包括一个或多个子规则。每个子规则可以对应一个种类的质量指标。可以根据所述一个或多个种类的质量指标,利用相应的一个或多个子规则,确定一个或多个子权重参数;可以根据所述一个或多个子权重参数,计算视频帧的权重参数。例如,可以从所述一个或多个子权重参数中选择一个子权重参数作为视频帧的权重参数。再比如,也可以计算所述一个或多个子权重参数的平均值作为视频帧的权重参数。再比如,还可以将所述一个或多个子权重参数相加,得到视频帧的权重参数。在一些场景示例中,所述权重设置规则可以包括子规则R1、子规则R2、子规则R3等3个子规则。所述权重设置规则可以如下表1所示。
表1
Figure BDA0003762235570000051
在本场景示例中,若某个视频帧的质量指标包括:生物对象的大小为0.4、生物对象的完整度为0.8、生物对象的姿态角度为20°。那么,可以根据生物对象的大小,利用子规则R1,确定子权重参数W1为数值0.6;可以根据生物对象的完整度,利用子规则R2,确定子权重参数W2为数值0.7;可以根据生物对象的姿态角度,利用子规则R3,确定子权重参数W3为数值0.6;可以将子权重参数W1、子权重参数W2、子权重参数W3和子权重参数W4相加,得到视频帧的权重参数W为数值1.9。
请参阅图2。在一些场景示例中,所述多个视频帧可以包括视频帧a、视频帧b、视频帧c、视频帧d、视频帧e、视频帧f、视频帧g、视频帧h、视频帧i。其中,视频帧a、视频帧b、视频帧c、视频帧d、视频帧e、视频帧f、视频帧g、视频帧h、视频帧i的权重参数可以分别为0.1051、0.0341、0.0983、0.0858、0.1104、0.1085、0.1249、0.1109、0.1167。
可以根据权重参数,计算所述多个第一特征数据的加权和,得到第二特征数据。例如,可以根据公式
Figure BDA0003762235570000061
计算第二特征数据。其中,y表示第二特征数据,m表示第一特征数据的数量,xi表示第i个第一特征数据,λi表示第i个第一特征数据对应的权重参数。或者,还可以根据权重参数,计算所述多个第一特征数据的加权平均和,得到第二特征数据。例如,可以根据公式
Figure BDA0003762235570000062
计算第二特征数据。其中,y表示第二特征数据,m表示第一特征数据的数量,xi表示第i个第一特征数据,λi表示第i个第一特征数据对应的权重参数。当然,还可以采用其它的方式对所述多个第一特征数据进行聚合,在此不再一一列举。
在一些实施例中,可以采用机器学习的方式对多个第一特征数据进行聚合。具体地,可以将多个第一特征数据输入至特征聚合模型。以使特征聚合模型确定视频帧的权重参数,根据权重参数,聚合多个第一特征数据。所述权重参数可以与视频帧中身份信息的质量正相关。
所述特征聚合模型可以包括基于注意力机制的模型。所述基于注意力机制的模型可以为引入了注意力机制(Attention Mechanism)的模型。所述基于注意力机制的模型可以包括基于注意力机制的神经网络模型。所述特征聚合模型可以通过监督学习的方式训练得到。
在一些实施例中,所述第二特征数据可以用于对生物对象的身份进行核验。具体地,可以计算第二特征数据与预置特征数据之间的相似度;可以根据相似度,确定生物对象的身份核验结果。具体地,可以将相似度与相似度阈值进行比对;可以根据比对结果,确定生物对象的身份核验结果。若相似度大于或等于相似度阈值,可以确定生物对象的身份核验结果为通过。若相似度小于相似度阈值,可以确定生物对象的身份核验结果为未通过。其中,所述预置特征数据可以为特征值、特征向量、特征矩阵或者特征图等。所述预置特征数据的维度可以与第二特征数据相同或不同。所述预置特征数据可以为生物对象的特征数据。具体地,所述预置特征数据可以预先根据生物对象的图像数据获得。或者,所述预置特征数据还可以预先根据生物对象的视频数据获得。所述相似度可以包括余弦相似度(Cosine Similarity)、海明距离(Hamming Distance)、编辑距离(Minimum EditDistance)等。
值得说明的是,所述第二特征数据的维度可以与预置特征数据相同,所述预置特征数据可以预先根据生物对象的图像数据获得。从而,根据视频数据获得的第二特征数据与根据图像数据获得的预置特征数据具有可比性。也就是说,本说明书实施例的利用视频数据进行核身的方法与根据图像数据进行核身的方法相兼容。
本说明书实施例的视频数据处理方法,可以根据生物对象的视频数据,获取多个视频帧;可以根据视频帧提取第一特征数据;可以对多个第一特征数据进行聚合,得到第二特征数据。所述第二特征数据是根据多个视频帧中的身份信息获得的,所述多个视频帧可以对应生物对象的多个拍摄角度和多个姿态。使得,所述第二特征数据能够准确的表示生物对象的身份信息。通过所述第二特征数据,可以提高身份核验时的准确程度。
以下介绍本说明书的一个具体场景示例。
宠物保险是保障宠物主人利益的一个险种。在宠物生病或发生意外时,可以偿付宠物主人的损失。在用户为宠物进行投保时,用户可以通过自身的智能手机拍摄宠物图像数据。所述智能手机可以向保险公司的服务器发送宠物图像数据。所述服务器可以接收宠物图像数据;可以从宠物图像数据中提取特征数据作为预置特征数据。例如,所述服务器可以将宠物图像数据输入至特征提取模型,得到预置特征数据。所述特征提取模型可以包括神经网络模型等。所述预置特征数据可以用于表示宠物的身份信息。在用户为宠物进行理赔时,保险公司需要对待理赔宠物的身份进行核验。然而,从普通用户的体验来说,由于宠物好动的天性,拍摄符合理赔要求的宠物图像数据难度较大,体验较差。考虑到相较于图像数据,拍摄符合理赔要求的视频数据较为容易。为此,用户可以通过自身的智能手机拍摄宠物视频数据。所述智能手机可以向保险公司的服务器发送宠物视频数据。所述服务器可以接收宠物视频数据;可以根据宠物视频数据,获取多个视频帧;可以根据视频帧,提取第一特征数据,所述第一特征数据用于表示待理赔宠物的身份信息;可以对所述多个第一特征数据进行聚合,得到第二特征数据;可以计算第二特征数据与预置特征数据之间的相似度;可以根据相似度,确定待理赔宠物的身份核验结果。所述服务器可以将相似度与相似度阈值进行比对。若相似度大于或等于相似度阈值,所述服务器可以确定待理赔宠物的身份核验结果为通过;可以执行理赔操作;可以向智能手机反馈第一提示信息。所述第一提示信息用于提示理赔申请通过。若相似度小于相似度阈值,所述服务器可以确定待理赔宠物的身份核验结果为未通过;可以拒绝理赔;可以向智能手机反馈第二提示信息。所述第二提示信息用于提示理赔申请未通过。
请参阅图4。本说明书实施例还提供一种视频数据处理装置,可以包括以下单元。
获取单元21,用于根据生物对象的视频数据,获取多个视频帧;
提取单元23,用于根据视频帧,提取第一特征数据,所述第一特征数据用于表示生物对象的身份信息;
聚合单元25,用于对多个第一特征数据进行聚合,得到用于核验生物对象身份的第二特征数据。
下面介绍本说明书计算机设备的一个实施例。图5是该实施例中计算机设备的硬件结构示意图。如图5所示,该计算机设备可以包括一个或多个(图中仅示出一个)处理器、存储器和传输模块。当然,本领域普通技术人员可以理解,图5所示的硬件结构仅为示意,其并不对上述计算机设备的硬件结构造成限定。在实际中该计算机设备还可以包括比图5所示更多或者更少的组件单元;或者,具有与图5所示不同的配置。
所述存储器可以包括高速随机存储器;或者,还可以包括非易失性存储器,例如一个或者多个磁性存储装置、闪存或者其他非易失性固态存储器。当然,所述存储器还可以包括远程设置的网络存储器。所述存储器可以用于存储应用软件的程序指令或模块,例如本说明书图1所对应实施例的程序指令或模块。
所述处理器可以按任何适当的方式实现。例如,所述处理器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific IntegratedCircuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式等等。所述处理器可以读取并执行所述存储器中的程序指令或模块。
所述传输模块可以用于经由网络进行数据传输,例如经由诸如互联网、企业内部网、局域网、移动通信网等网络进行数据传输。
本说明书还提供计算机存储介质的一个实施例。所述计算机存储介质包括但不限于随机存取存储器(Random Access Memory,RAM)、只读存储器(Read-Only Memory,ROM)、缓存(Cache)、硬盘(Hard Disk Drive,HDD)、存储卡(Memory Card)等等。所述计算机存储介质存储有计算机程序指令。在所述计算机程序指令被执行时实现:本说明书图1所对应实施例的程序指令或模块。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同或相似的部分互相参见即可,每个实施例重点说明的都是与其它实施例的不同之处。尤其,对于装置实施例、计算机设备实施例、以及计算机存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。另外,可以理解的是,本领域技术人员在阅读本说明书文件之后,可以无需创造性劳动想到将本说明书列举的部分或全部实施例进行任意组合,这些组合也在本说明书公开和保护的范围内。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本说明书可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本说明书的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本说明书各个实施例或者实施例的某些部分所述的方法。
本说明书可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
虽然通过实施例描绘了本说明书,本领域普通技术人员知道,本说明书有许多变形和变化而不脱离本说明书的精神,希望所附的权利要求包括这些变形和变化而不脱离本说明书的精神。

Claims (10)

1.一种视频数据处理方法,包括:
根据生物对象的视频数据,获取多个视频帧;
根据视频帧,提取第一特征数据,所述第一特征数据用于表示生物对象的身份信息;
对多个第一特征数据进行聚合,得到用于核验生物对象身份的第二特征数据。
2.根据权利要求1所述的方法,所述获取多个视频帧,包括:
从生物对象的视频数据中随机抽取多个视频帧;
或者,从生物对象的视频数据中均匀抽取多个视频帧。
3.根据权利要求1所述的方法,所述提取第一特征数据,包括:
在视频帧中确定生物对象所在的目标区域,根据目标区域提取第一特征数据;
或者,将视频帧输入至特征提取模型,得到第一特征数据。
4.根据权利要求1所述的方法,所述对多个第一特征数据进行聚合,包括:
确定视频帧的权重参数,所述权重参数与身份信息的质量呈正相关;
根据权重参数,对多个第一特征数据进行聚合。
5.根据权利要求4所述的方法,所述确定视频帧的权重参数,包括:
确定视频帧的质量指标,所述质量指标用于表示身份信息的质量;
根据质量指标,确定视频帧的权重参数。
6.根据权利要求4所述的方法,所述对多个第一特征数据进行聚合,包括:
根据权重参数,计算多个第一特征数据的加权和,得到第二特征数据。
7.根据权利要求1所述的方法,所述对多个第一特征数据进行聚合,包括:
将多个第一特征数据输入至特征聚合模型,以使特征聚合模型确定视频帧的权重参数,根据权重参数对多个第一特征数据进行聚合,所述权重参数与身份信息的质量呈正相关。
8.根据权利要求1所述的方法,所述方法还包括:
计算第二特征数据与预置特征数据之间的相似度;
根据相似度,确定生物对象的身份核验结果。
9.一种视频数据处理装置,包括:
获取单元,用于根据生物对象的视频数据,获取多个视频帧;
提取单元,用于根据视频帧,提取第一特征数据,所述第一特征数据用于表示生物对象的身份信息;
聚合单元,用于对多个第一特征数据进行聚合,得到用于核验生物对象身份的第二特征数据。
10.一种计算机设备,包括:
至少一个处理器;
存储有程序指令的存储器,其中,所述程序指令被配置为适于由所述至少一个处理器执行,所述程序指令包括用于执行根据权利要求1-8中任一项所述方法的指令。
CN202210875443.XA 2022-07-25 2022-07-25 视频数据处理方法、装置和计算机设备 Pending CN115359385A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210875443.XA CN115359385A (zh) 2022-07-25 2022-07-25 视频数据处理方法、装置和计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210875443.XA CN115359385A (zh) 2022-07-25 2022-07-25 视频数据处理方法、装置和计算机设备

Publications (1)

Publication Number Publication Date
CN115359385A true CN115359385A (zh) 2022-11-18

Family

ID=84032356

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210875443.XA Pending CN115359385A (zh) 2022-07-25 2022-07-25 视频数据处理方法、装置和计算机设备

Country Status (1)

Country Link
CN (1) CN115359385A (zh)

Similar Documents

Publication Publication Date Title
CN111680551B (zh) 监控牲畜数量的方法、装置、计算机设备及存储介质
US10936911B2 (en) Logo detection
WO2018166114A1 (zh) 图片识别的方法、系统、电子装置及介质
CN109829396B (zh) 人脸识别运动模糊处理方法、装置、设备及存储介质
US11126827B2 (en) Method and system for image identification
US20190294863A9 (en) Method and apparatus for face classification
WO2021051547A1 (zh) 暴力行为检测方法及系统
CN111783146B (zh) 基于隐私保护的图像处理方法、装置和电子设备
CN111738403B (zh) 一种神经网络的优化方法及相关设备
CN111753697B (zh) 智能宠物管理系统及其管理方法
CN110941989A (zh) 图像校验、视频校验方法、装置、设备及存储介质
CN112364846B (zh) 一种人脸活体识别方法、装置、终端设备及存储介质
CN112085701A (zh) 一种人脸模糊度检测方法、装置、终端设备及存储介质
CN112651380A (zh) 人脸识别方法、人脸识别装置、终端设备及存储介质
CN111507403A (zh) 图像分类方法、装置、计算机设备和存储介质
CN111047496A (zh) 阈值确定方法、水印检测方法、装置和电子设备
CN112507897A (zh) 跨模态人脸识别方法、装置、设备及存储介质
CN110956149A (zh) 宠物身份核验方法、装置、设备及计算机可读存储介质
CN113228105A (zh) 一种图像处理方法、装置和电子设备
CN110008922B (zh) 用于终端设备的图像处理方法、设备、装置、介质
US20180137391A1 (en) System and method for training image classifier
CN115359575A (zh) 身份识别方法、装置和计算机设备
CN112084915A (zh) 模型训练方法、活体检测方法、装置和电子设备
CN115359385A (zh) 视频数据处理方法、装置和计算机设备
US20220122341A1 (en) Target detection method and apparatus, electronic device, and computer storage medium

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination