CN115600157B - 一种数据处理的方法、装置、存储介质及电子设备 - Google Patents

一种数据处理的方法、装置、存储介质及电子设备 Download PDF

Info

Publication number
CN115600157B
CN115600157B CN202211508343.XA CN202211508343A CN115600157B CN 115600157 B CN115600157 B CN 115600157B CN 202211508343 A CN202211508343 A CN 202211508343A CN 115600157 B CN115600157 B CN 115600157B
Authority
CN
China
Prior art keywords
data
sub
feature
features
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211508343.XA
Other languages
English (en)
Other versions
CN115600157A (zh
Inventor
赵闻飙
苗书宇
郑霖
金宏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN202211508343.XA priority Critical patent/CN115600157B/zh
Publication of CN115600157A publication Critical patent/CN115600157A/zh
Application granted granted Critical
Publication of CN115600157B publication Critical patent/CN115600157B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Image Analysis (AREA)

Abstract

本说明书公开了一种数据处理的方法、装置、存储介质及电子设备。该数据处理的方法包括:获取待处理数据,其中,所述待处理数据中包含有至少一种类型的数据,针对所述待处理数据中包含的每种类型的数据,确定该类型的数据对应的数据特征,并按照预设的特征尺度,从所述数据特征中提取出各子特征,作为该类型的子特征,针对每个子特征,通过预设的识别模型识别该子特征得到的识别结果,将识别结果之间满足预设关联程度的不同类型的子特征进行融合,得到各融合子特征,根据各融合子特征,对所述待处理数据进行处理。

Description

一种数据处理的方法、装置、存储介质及电子设备
技术领域
本说明书涉及计算机技术领域,尤其涉及一种数据处理的方法、装置、存储介质及电子设备。
背景技术
随着人工智能的发展,目前已经能够将各种数据类型的数据(如图像数据、文本数据、语音数据、视频数据等)作为模型算法的输入,通过对这些数据进行处理从而得到相应的处理结果,以将其应用到各种业务场景中。为了更加有效的利用各种数据类型的数据,通常会将不同数据类型的数据进行融合,从而得到一个统一的特征表示,进而根据该特征表示进行数据处理。而由于不同数据类型的数据特征往往对应有不同的特征维度,因此对这些不同特征维度的数据特征融合效果的好坏直接决定了最终数据处理结果的准确性。
而目前采用的方法中,通常会将属于不同维度的各类型数据对应的数据特征直接进行融合,所得到的融合特征对数据的表达能力较差,这就导致了当根据通过这种方法得到的融合特征对数据进行处理时,得到的处理结果并不准确。
因此,如何将不同数据类型的数据对应的数据特征进行融合,以根据融合后的特征得到准确的数据处理结果,并保证数据的隐私安全,是一个亟待解决的问题。
发明内容
本说明书提供一种数据处理的方法、装置、存储介质及电子设备。以将不同数据类型的数据对应的数据特征进行融合从而得到准确的数据处理结果。
本说明书采用下述技术方案:
本说明书提供了一种数据处理的方法,包括:
获取待处理数据,其中,所述待处理数据中包含有至少一种类型的数据;
针对所述待处理数据中包含的每种类型的数据,确定该类型的数据对应的数据特征,并按照预设的特征尺度,从所述数据特征中提取出各子特征,作为该类型的子特征;
针对每个子特征,通过预设的识别模型识别该子特征得到的识别结果;
将识别结果之间满足预设关联程度的不同类型的子特征进行融合,得到各融合子特征;
根据各融合子特征,对所述待处理数据进行处理。
可选地,针对所述待处理数据中包含的每种类型的数据,确定该类型的数据对应的数据特征,具体包括:
从预设的各特征提取器中,确定出与该类型的数据相匹配的特征提取器,作为目标特征提取器;
将该类型的数据输入所述目标特征提取器中,确定该类型的数据对应的数据特征。
可选地,将识别结果之间满足预设关联程度的不同类型的子特征进行融合,得到各融合子特征,具体包括:
确定不同类型的子特征之间的特征转换关系;
根据所述特征转换关系,将识别结果之间满足预设关联程度的所述不同类型的子特征进行融合。
可选地,确定不同类型的子特征之间的特征转换关系,具体包括:
针对每种类型,将该类型的数据对应的数据特征输入预设的类型编码器中,确定该类型的数据对应的类型编码;
根据每个类型的数据对应的类型编码,确定不同类型的子特征之间的特征转换关系。
可选地,将识别结果之间满足预设关联程度的不同类型的子特征进行融合,得到各融合子特征,具体包括:
针对每种类型,确定该类型的数据在每种预设特征尺度下的子特征;
针对每种预设特征尺度,从其他类型的子特征中确定与该类型在该种预设特征尺度下的子特征相匹配的子特征,并得到子特征对,其中,该子特征对中包含的子特征的识别结果之间满足预设关联程度,且该子特征对中包含的子特征所对应的特征尺度相匹配;
将所述子特征对中包含的子特征进行融合,得到该预设特征尺度下的融合子特征;
根据各融合子特征,对所述待处理数据进行处理,具体包括:
将不同预设特征尺度下的融合子特征进行融合,得到融合后特征;
根据所述融合后特征,对所述待处理数据进行处理。
可选地,将不同预设特征尺度下的融合子特征进行融合,得到融合后特征,具体包括:
针对每个预设特征尺度,将大于该预设特征尺度的特征尺度,作为目标尺度;
在所述目标尺度下的融合子特征中,确定与该预设特征尺度相匹配的特征,作为待融合特征;
将该预设特征尺度下的融合子特征,与所述待融合特征进行融合,以得到所述融合后特征。
可选地,所述类型包括:图像类型、文本类型、视频类型以及音频类型中的至少一种。
本说明书提供了一种数据处理的装置,包括:
获取模块,获取待处理数据,其中,所述待处理数据中包含有至少一种类型的数据;
提取模块,针对所述待处理数据中包含的每种类型的数据,确定该类型的数据对应的数据特征,并按照预设的特征尺度,从所述数据特征中提取出各子特征,作为该类型的子特征;
确定模块,针对每个子特征,通过预设的识别模型识别该子特征得到的识别结果;
融合模块,将识别结果之间满足预设关联程度的不同类型的子特征进行融合,得到各融合子特征;
处理模块,根据各融合子特征,对所述待处理数据进行处理。
本说明书提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述数据处理的方法。
本说明书提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述数据处理的方法。
本说明书采用的上述至少一个技术方案能够达到以下有益效果:
在本说明书提供的数据处理的方法中,会获取包含有至少一种类型的数据的待处理数据,针对待处理数据中包含的每种类型的数据,确定该类型的数据对应的数据特征,并从该数据特征中提取出各子特征,作为该类型的子特征,针对每个子特征,确定识别该子特征得到的识别结果,并将识别结果之间满足预设关联程度的不同类型的子特征进行融合,得到各融合子特征,进而根据各融合子特征,对待处理数据进行处理。
从上述方法可以看出,本方案在对数据进行处理时,能够将识别结果之间满足预设关联程度的不同类型的子特征进行融合,从而得到融合子特征以对待处理数据进行处理,在特征融合的过程中考虑到了各子特征对应识别结果之间的关联程度,从而使对应识别结果相同或者存在一定关联性的子特征被融合到一起,这样一来,在根据该融合子特征进行数据处理时得到的处理结果能够更为准确,相比于目前将各个维度的特征直接进行融合的方法,通过本方案融合后的特征进行数据处理时,得到的数据处理结果能够更为准确,并且充分的保护了数据的隐私安全。
附图说明
此处所说明的附图用来提供对本说明书的进一步理解,构成本说明书的一部分,本说明书的示意性实施例及其说明用于解释本说明书,并不构成对本说明书的不当限定。在附图中:
图1为本说明书中提供的一种数据处理的方法的流程示意图;
图2为本说明书中提供的一种数据处理的过程示意图;
图3为本说明书中提供的一种数据处理的装置的示意图;
图4为本说明书中提供的一种对应于图1的电子设备示意图。
具体实施方式
为使本说明书的目的、技术方案和优点更加清楚,下面将结合本说明书具体实施例及相应的附图对本说明书技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本说明书保护的范围。
以下结合附图,详细说明本说明书各实施例提供的技术方案。
图1为本说明书中提供的一种数据处理的方法的流程示意图,包括以下步骤:
S100:获取待处理数据,其中,所述待处理数据中包含有至少一种类型的数据。
在诸如目标识别、目标分类、以及目标检测等领域中,通常需要根据获取到的数据来进行相应的数据处理,以获得相应的处理结果。而这些数据可以是多种数据类型下的数据,如图片、文字、视频、音频等,由于不同类型的数据对应的数据特征处于不同的数据维度中,所以就需要将这些不同类型对应数据维度下的数据特征进行融合,以根据融合后的数据特征对数据进行处理。
例如,在目标识别的过程中,会对文本数据、图像数据以及视频数据对应的数据特征进行特征融合,通常情况下,文本数据对应的数据特征为一维特征、图像数据对应的数据特征为二维特征(即图像的长和宽),而视频数据对应的数据特征为三维特征(如视频画面的长、宽以及时间),因此,就需要将上述三个维度的数据特征融合为一个统一维度的特征表示,进而根据该特征表示对目标进行识别。
再例如,在无人驾驶领域的目标检测过程中,无人驾驶设备上通常会设置有多个传感器,而不同传感器采集到的数据对应的数据类型也有所不同,如摄像机会采集到相应的图像数据、雷达会采集到相应的点云数据、而飞行时间(Time of Flight,TOF)传感器采集会采集到相应的深度图像数据,因此就需要将上述图像数据对应的数据特征、点云数据对应的数据特征以及深度图像数据对应的数据特征进行融合,从而根据融合后的特征进行数据处理,以准确地检测出相应的目标。
由于不同类型数据对应的数据特征往往对应有不同的特征维度,因此对这些不同特征维度的数据特征融合效果的好坏直接决定了最终数据处理结果的准确性。
基于此,本说明书提供了一种数据处理的方法,其中,需要获取待处理数据,该待处理数据中可以包含有不同类型的数据,该不同类型包括:图像类型、文本类型、视频类型、语音类型等,当然,也可以包含有其他业务场景下对应的数据类型,如点云、深度图像等,本说明书对此不做具体限定。
在本说明书中,用于实现数据处理的方法的执行主体,可以指服务器等设置于业务平台的指定设备,为了便于描述,本说明书仅以服务器是执行主体为例,对本说明书提供的一种代码测试的方法进行说明。
S102:针对所述待处理数据中包含的每种类型的数据,确定该类型的数据对应的数据特征,并按照预设的特征尺度,从所述数据特征中提取出各子特征,作为该类型的子特征。
在实际应用中,不同类型的数据往往会对应有不同的特征提取方法,而不同的特征提取方法又对应于不同的特征提取器,因此,服务器可以在预设的各特征提取器中,按照预设的特征尺度确定出与该类型的数据相匹配的特征提取器,作为目标特征提取器,而后将该类型的数据输入到目标特征提取器中,确定该类型的数据对应的数据特征。
例如,可以通过图像Encoder特征编码器,对图像数据进行特征提取,从而得到该图像数据对应的图像数据特征。通过文本Embedding特征提取器,对文本数据进行特征提取,从而得到该文本数据对应的文本数据特征。通过诸如3D卷积(3D Convolution,3D-Conv),对视频数据进行特征提取,从而得到该视频数据对应的视频数据特征。通过诸如梅尔倒谱系数(Mel-Frequency Cepstral Coefficients,MFCC),对音频数据进行特征提取,从而得到该音频数据对应的音频数据特征。
当然,在本说明书中,也可以采用诸如残差神经网络(Residual Network,ResNet)、视觉变换器(Vision Transformer,ViT)、Swin 转换器(Swin Transformer)等对图像数据进行特征提取,通过诸如Bert-base-Chinese中已经训练好的语言表征模型(Bidirectional Encoder Representation from Transformer,Bert)、文本卷积网络(TextConvolutional Neural Networks,Text CNN)等对文本数据进行特征提取。
需要说明的是,本说明书可以采用任意已经训练好并且公开的与不同类型的数据相匹配的特征提取器,来对不同类型的数据进行特征提取,本说明书对此不做具体限定。
此外,在对各类型数据的数据特征进行提取的过程中,服务器还可以通过相应的特征提取器,来从上述各类型数据的数据特征中提取出相应的子特征,作为各类型对应的子特征。
例如,在对文本数据进行特征提取的过程中,当以两个字节长度为预设特征尺度时,则该文本数据中每两个字节所对应的特征即为相应的子特征,再例如,在对图像数据进行特征提取的过程中,提取出的每个固定大小的图像区域所对应的特征即为相应的子特征。需要说明的是,各类型数据的数据特征对应的特征尺度要大于该数据特征中包含的每一个子特征对应的预设特征尺度。
在本说明书中,对于每个类型的数据,还可以通过多个不同卷积尺寸的特征提取器,来提取多个预设特征尺度下该类型数据的特征以及相应的子特征,例如,在文本数据的特征提取过程中,可以分别以一个字节、两个字节、三个字节为预设特征尺度进行特征提取,从而获得文本数据对应的,由每个字节对应子特征组合而成的文本数据特征,由每两个字节对应子特征组合而成的文本数据特征以及由每三个字节对应子特征组合而成的文本数据特征。
而对于图像数据而言,则可以分别提取不同范围大小的图像区域对应的子特征组合而成的各预设特征尺度的图像数据特征,对于音频数据、视频数据以及其他类型的数据也可以采用上述相同的方式,不同类型数据对应数据特征以及各类型的子特征对应的预设特征尺度可以不同。
S104:针对每个子特征,通过预设的识别模型识别该子特征得到的识别结果。
服务器得到各类型数据对应的数据特征以及各类型的子特征后,针对每个类型的子特征,可以通过预设的识别模型先确定该子特征对应识别结果。
以目标识别场景下的图像数据特征提取为例,针对该图像数据对应的每个子特征,该子特征都会对应有一个识别结果,例如,如果该图像数据中,该子特征对应的实际图像区域为“猫”的图像时,则该子特征对应的识别结果很有可能指向“猫”或者与猫相似的其他动物或物体,而这里的“猫”或者与猫相似的其他动物或者物体就可以为该子特征对应的识别结果。
当然,在实际应用中,该识别结果也可以不为某一具体的事物,还以上述目标识别场景下的图像数据特征提取为例,当该子特征对应的实际图像数据区域为“猫”的图像时,该子特征对应的识别结果可能会有70%指向“猫”,另外有30%指向与猫相似的其他动物或物体(如老虎),则70%为“猫”,30%为老虎即可以为该子特征对应的识别结果。
在实际应用中,可以是将上述各类型数据输入到预设的识别模型后,即可以通过该识别模型提取出各类型数据的数据特征以及各类型的子特征,并确定每个子特征对应的识别结果。
S106:将识别结果之间满足预设关联程度的不同类型的子特征进行融合,得到各融合子特征。
服务器确定各类型数据对应的数据特征以及各类型的子特征后,服务器可以将上述各类型数据对应的数据特征输入到预设的类型编码器中,通过预设的类型编码器,确定不同类型的数据对应的类型编码,从而区分出不同数据特征所对应的数据类型。其中,服务器可以通过参数自定义的方式,将不同类型的数据设置为不同的类型编码,例如,当待处理数据中包含有文本数据、图像数据以及音频数据时,则可以分别将文本数据的类型编码设置为0,将图像数据的类型编码设置为1,将音频编码的数据设置为2。当然,服务器也可以采用参数自学习的方式,即通过不断的学习训练,以使不同的数据类型自动生成各自对应的数据类型编码。
由于不同类型的子特征对应的特征维度不同,所以在将各类型的子特征进行融合时,需要将各类型的子特征全部转换到同一个维度下,从而进行融合。
因此,服务器可以根据不同类型的数据对应的类型编码,确定不同类型的子特征之间的特征转换关系,并根据该特征转换关系,将识别结果之间满足预设关联程度的不同类型的子特征进行融合。
例如,当根据类型编码确定出上述子特征分别为文本数据对应的一维子特征和图像数据对应的二维子特征时,则可以将上述文本数据的一维子特征通过相应的特征转换关系转换为二维子特征,从而将文本数据转换后的二维子特征和图像数据的二维子特征进行融合。或者将上述图像数据的二维子特征通过相应的特征转换关系转换为一维子特征,从而将文本数据的一维子特征和图像数据转换后的一维子特征进行融合。当然,服务器也可以同时将文本数据的一维子特征和图像数据的二维子特征同时转换为一个其他维度,从而将该其他维度下的图像数据的子特征和文本数据的子特征进行融合。
此外,服务器还可以通过预设的位置编码器,确定不同类型的数据对应的位置编码,其中,该位置编码信息用于表征该类型的数据对应数据特征中各子特征对应的位置,以文本的数据为例,该位置编码信息即可以表征提取到的各子特征所对应文字在实际文本数据中的位置,而以图像数据类型的数据为例,该位置编码信息即可以表征提取到的每个子特征对应图像区域在实际图像数据中的位置。
其中,服务器可以通过参数自定义的方式,将同一数据中,各位置的子特征设置为不同的位置编码,当然,也可以采用参数自学习的方式,即通过不断的学习训练,以使不同位置的子特征自动生成各自对应的位置编码。
在本说明书中,服务器可以先将上述各类型数据的数据特征先输入到相应的类型编码器,确定各类型的子特征对应的类型编码后再将上述各类型数据的数据特征输入到相应的位置编码器,也可以先将上述各类型数据的数据特征输入到相应的位置编码器,确定各类型的子特征对应的位置编码后再将上述各类型的数据对应额数据特征输入到相应的类型编码器,当然,也可以将上述各类型数据的数据特征在同一时刻分别输入到类型编码器和位置编码器中,从而得到不同类型子特征的类型编码和位置编码。
获得各类型的数据对应的数据特征、各类型的子特征对应的位置编码,以及各类型的子特征对应的类型编码后,服务器可以先将不同类型的子特征、各子特征的位置编码以及各子特征的类型编码进行组合,并将组合后的各类型的子特征、位置编码以及类型编码输入到相应的第一特征融合网络(如Transformer Encoder),以根据上述特征转换关系,将识别结果之间满足预设关联程度的不同类型的子特征进行融合,得到各融合子特征,从而使关联性较强的各类型的子特征融合在一起,其中,该预设关联程度可以用来表征各子特征对应识别结果之间的相似性或者相关性,该预设关联程度可以根据实际情况进行设定,并且在各类型子特征融合的过程中,服务器可以将识别结果满足预设关联程度的不同类型的子特征进行融合,以及将识别结果满足预设关联程度的相同类型的子特征进行融合,从而得到融合子特征。
例如,在对文本数据和图像数据进行识别的过程中,若文本数据的内容为“使用电脑工作”,而图像数据中包含有鼠标、主机、键盘、显示器等设备的图像,针对文本数据中的一个子特征,若该子特征对应的识别结果为“电脑”,而图像数据中,识别结果分别为鼠标、主机、键盘、显示器的各个子特征都属于“电脑”的一部分,所以可以将鼠标、主机、键盘、显示器等识别结果对应的子特征与文本数据中“电脑”对应的子特征进行融合,从而得到融合子特征。而对于图像数据中包含的鼠标、主机、键盘、显示器等区域对应的子特征,由于这些子特征之间的关联程度较强(即都与“电脑”相关),所以在子特征融合的过程中,也会将这些图像数据中的子特征进行融合。
还以文本数据中的一个子特征对应的识别结果为“电脑”为例,如果图像数据中的一个子特征对应的识别结果为“显示器”或者“主机”,则可以认为该图像数据的子特征对应识别结果与图像数据子特征对应的识别结果相同或者相似,因此可以将上述文本数据的子特征和图像数据的子特征进行融合。
在实际应用中,不同特征尺度的特征往往具有不同的表征能力,通常情况下,较大特征尺度的特征具有较高的语意表征能力,能够更好的反应出数据整体的语意信息,但是对于局部特征的表示效果较低,以图像数据为例,较大特征尺度的特征图对应的分辨率较低,这就很难表现出图像局部的空间几何特征。而较小特征尺度的特征图恰恰相反,较小特征尺度的特征图的分辨率较高,对于局部的空间几何特征的表现能力较强,但是对于图像整体语意的表现能力确较差。
因此,为了使最终得到的融合子特征在具有较高的整体语意表现能力的同时,也拥有较高的局部空间几何特征的表现能力,针对每种类型,服务器可以确定该类型的数据在每种预设特征尺度下的子特征,针对每种预设特征尺度,服务器可以从其他类型的子特征中确定与该类型在该种预设特征尺度下的子特征相匹配的子特征,并得到子特征对,其中,该子特征对中包含的子特征的识别结果之间满足预设关联程度,且该子特征中包含的子特征所对应的预设特征尺度相匹配,进而服务器可以将上述子特征对中包含的子特征进行融合,从而得到该预设特征尺度下的融合子特征。
得到各预设特征尺度下的融合子特征后,针对每种预设特征尺度,服务器可以通过预设的第二特征融合网络,将大于该预设特征尺度的特征尺度,作为目标尺度,并在该目标尺度下的融合子特征中,确定与该预设特征尺度相匹配的特征,作为待融合特征,而后将该预设特征尺度下的融合子特征,与待融合特征进行融合(如将上述融合子特征与待融合特征相加或相并),以得到融合后特征。
也就是说,在本说明书中,可以将较小的预设特征尺度下的融合子特征融合到较大的预设特征尺度下的融合子特征中,并且融合后特征的特征长度与目标尺度下的待融合特征(较大预设特征尺度下的融合子特征)的特征长度相同。其中,与该预设特征尺度相匹配的特征可以为,目标尺度下与该预设特征尺度的融合子特征对应识别结果相同或者满足预设关联程度的融合子特征。
这样一来,服务器可以得到该待处理数据对应的融合后特征,并且该融合后特征中即包含有各个类型数据对应的局部特征,又包含有各个类型数据对应的全局特征。
S108:根据各融合子特征,对所述待处理数据进行处理。
而后服务器可以将上述融合后特征输入到相应的数据处理网络中,从而使该数据处理网络根据上述融合后特征对待处理数据进行处理,其中,不同的业务场景可以对应有不同的数据处理网络,例如,在目标分类业务中,该数据处理网络主要用来根据融合后特征确定待处理数据对应的分类,目标检测业务中,该数据处理网络主要用来根据融合后特征对待处理数据中的目标进行识别以及检测,当然,还可以包含有诸如分割业务等其他业务场景,本说明书对此不做具体限定。
当然,服务器也可以只根据任意的一个预设特征尺度下的各融合子特征对待处理数据进行处理,即只通过一种预设特征尺度下的各融合子特征对待处理数据进行处理,不再对不同尺度的融合子特征进一步进行融合。
在本说明书中,上述各数据类型对应的特征提取器、位置编码器、类型编码器、第一特征融合网络、第二特征融合网络,以及数据处理网络可以部署在相应的数据处理模型中,将待处理数据输入到该数据处理模型后,即可通过该模型中的各个模块来逐步对该待处理数据进行处理。
需要说明的是,该数据处理模型中已经包含有预设的与不同类型数据相匹配的特征提取器,当在该模型中输入待处理数据后,会直接匹配出该待处理数据中不同类型的数据对应的特征提取器,从而分别对不同类型的数据进行特征提取。
为了便于理解,本说明书提供了一种数据处理过程示意图,如图2所示。
图2为本说明书中提供的一种数据处理过程示意图。
其中,服务器分别将待处理数据中的文本数据输入相应的文本Embedding特征提取器中,将图像数据输入到相应的图像Encoder特征提取器中,将其他数据(如音频数据)输入相应的Projection处理器中,从而得的图像数据对应图像数据特征、文本数据对应的文本数据特征以及其他数据对应的其他数据特征。而后服务器可以将上述各数据特征输入到相应的数据类型编码器中,得到各类型数据对应的类型编码,以及将上述数据特征输入到相应的位置编码器中,得到各类型的数据特征对应的位置编码。
而后服务器可以通过第一融合网络,根据上述各类型的子特征、各类型数据对应的类型编码以及各数据特征对应的位置编码,将各类型的子特征进行融合,从而得到融合子特征,而后通过第二融合网络,对各个特征尺度的融合子特征进行进一步融合,得到融合后特征,进而根据该融合后特征对待处理数据进行处理。
从上述方法可以看出,本方案在对数据进行处理时,能够将识别结果之间满足预设关联程度的不同类型的子特征进行融合,从而得到融合子特征以对待处理数据进行处理,在特征融合的过程中考虑到了各子特征对应识别结果之间的关联程度,从而使对应识别结果相同或者存在一定关联性的子特征被融合到一起,这样一来,在根据该融合子特征进行数据处理时得到的处理结果能够更为准确,相比于目前将各个维度的特征直接进行融合的方法,通过本方案融合后的特征进行数据处理时,得到的数据处理结果能够更为准确,并且充分的保护了数据的隐私安全。
另外,在本申请中,能直接从预设的各特征提取器中确定出与各类型的数据相匹配的特征提取器,也就是说,针对不同的业务场景中不同类型的数据,本方案都能直接找到与其相匹配的特征提取器并单独针对每个类型的数据进行特征提取,并不需要再对特征提取器进行预训练以使其具备能够提取不同类型数据对应数据特征的能力。
还需要说明的是,本方案的特征融合方式能够将不同类型的子特征依据识别结果之间的关联程度进行融合,从而难以根据融合子特征或者最终的处理结果推测出原始数据的内容,保证了数据隐私的安全。
以上为本说明书的一个或多个实施数据处理的方法,基于同样的思路,本说明书还提供了相应的数据处理的装置,如图3所示。
图3为本说明书提供的一种数据处理的装置的示意图,包括:
获取模块300,用于获取待处理数据,其中,所述待处理数据中包含有至少一种类型的数据;
提取模块302,针用于对所述待处理数据中包含的每种类型的数据,确定该类型的数据对应的数据特征,并按照预设的特征尺度,从所述数据特征中提取出各子特征,作为该类型的子特征;
确定模块304,用于针对每个子特征,通过预设的识别模型识别该子特征得到的识别结果;
融合模块306,用于将识别结果之间满足预设关联程度的不同类型的子特征进行融合,得到各融合子特征;
处理模块308,用于根据各融合子特征,对所述待处理数据进行处理。
可选地,所述提取模块302具体用于,从预设的各特征提取器中,确定出与该类型的数据相匹配的特征提取器,作为目标特征提取器;将该类型的数据输入所述目标特征提取器中,确定该类型的数据对应的数据特征。
可选地,所述融合模块306具体用于,确定不同类型的子特征之间的特征转换关系;根据所述特征转换关系,将识别结果之间满足预设关联程度的所述不同类型的子特征进行融合。
可选地,所述融合模块306具体用于,针对每种类型,将该类型的数据对应的数据特征输入预设的类型编码器中,确定该类型的数据对应的类型编码;根据每个类型的数据对应的类型编码,确定不同类型的子特征之间的特征转换关系。
可选地,所述融合模块306具体用于,针对每种类型,确定该类型的数据在每种预设特征尺度下的子特征;针对每种预设特征尺度,从其他类型的子特征中确定与该类型在该种预设特征尺度下的子特征相匹配的子特征,并得到子特征对,其中,该子特征对中包含的子特征的识别结果之间满足预设关联程度,且该子特征对中包含的子特征所对应的特征尺度相匹配;将所述子特征对中包含的子特征进行融合,得到该预设特征尺度下的融合子特征;
所述处理模块308具体用于,将不同预设特征尺度下的融合子特征进行融合,得到融合后特征;根据所述融合后特征,对所述待处理数据进行处理。
可选地,所述融合模块306具体用于,针对每个预设特征尺度,将大于该预设特征尺度的特征尺度,作为目标尺度;在所述目标尺度下的融合子特征中,确定与该预设特征尺度相匹配的特征,作为待融合特征;将该预设特征尺度下的融合子特征,与所述待融合特征进行融合,以得到所述融合后特征。
可选地,所述类型包括:图像类型、文本类型、视频类型以及音频类型中的至少一种。
本说明书还提供了一种计算机可读存储介质,该存储介质存储有计算机程序,计算机程序可用于执行上述图1提供的一种数据处理的方法。
本说明书还提供了图4所示的一种对应于图1的电子设备的示意结构图。如图4所述,在硬件层面,该电子设备包括处理器、内部总线、网络接口、内存以及非易失性存储器,当然还可能包括其他业务所需要的硬件。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,以实现上述图1所述的数据处理的方法。当然,除了软件实现方式之外,本说明书并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device, PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20 以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本说明书的实施例可提供为方法、系统、或计算机程序产品。因此,本说明书可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他数据类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本说明书的实施例可提供为方法、系统或计算机程序产品。因此,本说明书可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本说明书的实施例而已,并不用于限制本说明书。对于本领域技术人员来说,本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书的权利要求范围之内。

Claims (8)

1.一种数据处理的方法,包括:
获取待处理数据,其中,所述待处理数据中包含有至少一种类型的数据;
针对所述待处理数据中包含的每种类型的数据,确定该类型的数据对应的数据特征,并按照预设的特征尺度,从所述数据特征中提取出各子特征,作为该类型的子特征;
针对每个子特征,通过预设的识别模型识别该子特征得到的识别结果;
针对每种类型,将该类型的数据对应的数据特征输入预设的类型编码器中,确定该类型的数据对应的类型编码;根据每个类型的数据对应的类型编码,确定不同类型的子特征之间的特征转换关系;根据所述特征转换关系,将识别结果之间满足预设关联程度的所述不同类型的子特征进行融合,其中,所述预设关联程度用于表征各子特征对应识别结果相同或者存在一定关联性;
根据各融合子特征,对所述待处理数据进行处理。
2.如权利要求1所述的方法,针对所述待处理数据中包含的每种类型的数据,确定该类型的数据对应的数据特征,具体包括:
从预设的各特征提取器中,确定出与该类型的数据相匹配的特征提取器,作为目标特征提取器;
将该类型的数据输入所述目标特征提取器中,确定该类型的数据对应的数据特征。
3.如权利要求1所述的方法,将识别结果之间满足预设关联程度的不同类型的子特征进行融合,得到各融合子特征,具体包括:
针对每种类型,确定该类型的数据在每种预设特征尺度下的子特征;
针对每种预设特征尺度,从其他类型的子特征中确定与该类型在该种预设特征尺度下的子特征相匹配的子特征,并得到子特征对,其中,该子特征对中包含的子特征的识别结果之间满足预设关联程度,且该子特征对中包含的子特征所对应的特征尺度相匹配;
将所述子特征对中包含的子特征进行融合,得到该预设特征尺度下的融合子特征;
根据各融合子特征,对所述待处理数据进行处理,具体包括:
将不同预设特征尺度下的融合子特征进行融合,得到融合后特征;
根据所述融合后特征,对所述待处理数据进行处理。
4.如权利要求3所述的方法,将不同预设特征尺度下的融合子特征进行融合,得到融合后特征,具体包括:
针对每个预设特征尺度,将大于该预设特征尺度的特征尺度,作为目标尺度;
在所述目标尺度下的融合子特征中,确定与该预设特征尺度相匹配的特征,作为待融合特征;
将该预设特征尺度下的融合子特征,与所述待融合特征进行融合,以得到所述融合后特征。
5.如权利要求1~4任一项所述的方法,所述类型包括:图像类型、文本类型、视频类型以及音频类型中的至少一种。
6.一种数据处理的装置,包括:
获取模块,获取待处理数据,其中,所述待处理数据中包含有至少一种类型的数据;
提取模块,针对所述待处理数据中包含的每种类型的数据,确定该类型的数据对应的数据特征,并按照预设的特征尺度,从所述数据特征中提取出各子特征,作为该类型的子特征;
确定模块,针对每个子特征,通过预设的识别模型识别该子特征得到的识别结果;
融合模块,针对每种类型,将该类型的数据对应的数据特征输入预设的类型编码器中,确定该类型的数据对应的类型编码;根据每个类型的数据对应的类型编码,确定不同类型的子特征之间的特征转换关系;根据所述特征转换关系,将识别结果之间满足预设关联程度的所述不同类型的子特征进行融合,其中,所述预设关联程度用于表征各子特征对应识别结果相同或者存在一定关联性;
处理模块,根据各融合子特征,对所述待处理数据进行处理。
7.一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述权利要求1~5任一项所述的方法。
8.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述权利要求1~5任一项所述的方法。
CN202211508343.XA 2022-11-29 2022-11-29 一种数据处理的方法、装置、存储介质及电子设备 Active CN115600157B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211508343.XA CN115600157B (zh) 2022-11-29 2022-11-29 一种数据处理的方法、装置、存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211508343.XA CN115600157B (zh) 2022-11-29 2022-11-29 一种数据处理的方法、装置、存储介质及电子设备

Publications (2)

Publication Number Publication Date
CN115600157A CN115600157A (zh) 2023-01-13
CN115600157B true CN115600157B (zh) 2023-05-16

Family

ID=84853016

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211508343.XA Active CN115600157B (zh) 2022-11-29 2022-11-29 一种数据处理的方法、装置、存储介质及电子设备

Country Status (1)

Country Link
CN (1) CN115600157B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115981870B (zh) * 2023-03-10 2023-06-13 之江实验室 一种数据处理的方法、装置、存储介质及电子设备
CN116451175A (zh) * 2023-04-25 2023-07-18 北京远舢智能科技有限公司 一种多模态数据处理方法、装置、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114154579A (zh) * 2021-11-29 2022-03-08 北京三快在线科技有限公司 一种图像分类方法、装置、存储介质及电子设备
CN114387465A (zh) * 2021-12-02 2022-04-22 北京旷视科技有限公司 图像识别方法、装置、电子设备和计算机可读介质
CN114926437A (zh) * 2022-05-19 2022-08-19 北京三快在线科技有限公司 一种图像质量评价方法及装置
CN115115872A (zh) * 2022-06-07 2022-09-27 腾讯科技(深圳)有限公司 图像识别方法、装置、设备及存储介质
WO2022199504A1 (zh) * 2021-03-26 2022-09-29 腾讯科技(深圳)有限公司 内容识别方法、装置、计算机设备和存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2523149B1 (en) * 2011-05-11 2023-01-11 Tata Consultancy Services Ltd. A method and system for association and decision fusion of multimodal inputs
CN114580416A (zh) * 2022-03-01 2022-06-03 海南大学 基于多视图语义特征融合的中文命名实体识别方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022199504A1 (zh) * 2021-03-26 2022-09-29 腾讯科技(深圳)有限公司 内容识别方法、装置、计算机设备和存储介质
CN114154579A (zh) * 2021-11-29 2022-03-08 北京三快在线科技有限公司 一种图像分类方法、装置、存储介质及电子设备
CN114387465A (zh) * 2021-12-02 2022-04-22 北京旷视科技有限公司 图像识别方法、装置、电子设备和计算机可读介质
CN114926437A (zh) * 2022-05-19 2022-08-19 北京三快在线科技有限公司 一种图像质量评价方法及装置
CN115115872A (zh) * 2022-06-07 2022-09-27 腾讯科技(深圳)有限公司 图像识别方法、装置、设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于特征融合进行活动识别的DCNN方法;王金甲;杨中玉;;高技术通讯(第04期);全文 *

Also Published As

Publication number Publication date
CN115600157A (zh) 2023-01-13

Similar Documents

Publication Publication Date Title
CN115600157B (zh) 一种数据处理的方法、装置、存储介质及电子设备
CN111508258B (zh) 一种定位方法及装置
KR102316230B1 (ko) 이미지 처리 방법 및 장치
CN115828162B (zh) 一种分类模型训练的方法、装置、存储介质及电子设备
CN111797711A (zh) 一种模型训练的方法及装置
CN117197781B (zh) 一种交通标志识别的方法、装置、存储介质及电子设备
CN117036868B (zh) 一种人体感知模型的训练方法、装置、介质及电子设备
CN116186330B (zh) 一种基于多模态学习的视频去重方法及装置
CN117409466A (zh) 一种基于多标签控制的三维动态表情生成方法及装置
CN112818968A (zh) 一种目标物分类方法及装置
CN116863484A (zh) 一种字符识别的方法、装置、存储介质及电子设备
CN112734851B (zh) 一种位姿确定的方法以及装置
CN113642616B (zh) 一种基于环境数据的训练样本的生成方法及装置
CN111967365B (zh) 影像连接点的提取方法和装置
CN116310406B (zh) 一种图像检测的方法、装置、存储介质及电子设备
CN116188919B (zh) 一种测试方法、装置、可读存储介质及电子设备
CN117874706B (zh) 一种多模态知识蒸馏学习方法及装置
CN117726907B (zh) 一种建模模型的训练方法、三维人体建模的方法以及装置
CN116704178A (zh) 一种图像的实例分割方法、装置、存储介质及电子设备
CN116563387A (zh) 一种标定模型的训练方法、装置、存储介质以及电子设备
CN117934858A (zh) 一种点云的处理方法、装置、存储介质及电子设备
CN117576748A (zh) 一种伪造检测模型训练方法、装置、存储介质及电子设备
CN117743824A (zh) 一种模型训练、业务执行方法、装置、存储介质及设备
CN116401541A (zh) 一种模型训练的方法、装置、存储介质及电子设备
CN117325171A (zh) 带电作业机器人的目标辨识与定位方法、装置和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant