CN114565772A - 集合特征提取方法、装置、电子设备及存储介质 - Google Patents

集合特征提取方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN114565772A
CN114565772A CN202210151104.7A CN202210151104A CN114565772A CN 114565772 A CN114565772 A CN 114565772A CN 202210151104 A CN202210151104 A CN 202210151104A CN 114565772 A CN114565772 A CN 114565772A
Authority
CN
China
Prior art keywords
feature
extracted
matrix
transformed
irregular data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210151104.7A
Other languages
English (en)
Other versions
CN114565772B (zh
Inventor
邓志东
费家骏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN202210151104.7A priority Critical patent/CN114565772B/zh
Publication of CN114565772A publication Critical patent/CN114565772A/zh
Application granted granted Critical
Publication of CN114565772B publication Critical patent/CN114565772B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种集合特征提取方法、装置、电子设备及存储介质,其中,所述方法包括:获取待提取集合,其中,待提取集合包括第一数量的非规则数据;基于多个多层感知机,对非规则数据进行特征变换,得到多个变换后特征矩阵,其中,变换后特征矩阵的数量与多层感知机的数量相对应,变换后特征矩阵以第一数量作为行向量,以各个非规则数据的变换后特征的特征维度作为列向量,在多个变换后特征矩阵中的列向量的最小值小于或等于第一数量;基于多个变换后特征矩阵,得到关于待提取集合的集合特征。本发明提供的集合特征提取方法,可以在确保集合特征提取的高准确度前提下,减少特征提取过程的计算量。

Description

集合特征提取方法、装置、电子设备及存储介质
技术领域
本发明涉及特征提取技术领域,尤其涉及一种集合特征提取方法、装置、电子设备及存储介质。
背景技术
在对集合(集合由无序或无结构的集合类数据构成)进行特征提取时,往往可以采用全局聚合方法或局部聚合方法。
然而,采用全局聚合方法进行集合特征提取时,其计算量相对较小,但特征提取的准确度不高。采用局部聚合方法进行集合特征提取时,其特征提取的准确度虽然相对较高,但计算量较大。采用当前的全局聚合方法或局部聚合方法进行集合特征提取均不能达到良好的提取效果。
发明内容
本发明提供一种集合特征提取方法、装置、电子设备及存储介质,用以解决现有技术中采用全局聚合方法或局部聚合方法进行集合特征提取不能平衡计算量和提取准确度的缺陷,实现了在确保集合特征提取的高准确度前提下,减少了特征提取过程的计算量。
本发明提供一种集合特征提取方法,所述方法包括:获取待提取集合,其中,所述待提取集合包括第一数量的非规则数据;基于多个多层感知机,对所述非规则数据进行特征变换,得到多个变换后特征矩阵,其中,所述变换后特征矩阵的数量与所述多层感知机的数量相对应,所述变换后特征矩阵以所述第一数量作为行向量,以各个所述非规则数据的变换后特征的特征维度作为列向量,在多个变换后特征矩阵中的所述列向量的最小值小于或等于所述第一数量;基于多个所述变换后特征矩阵,得到关于所述待提取集合的集合特征。
根据本发明提供的一种集合特征提取方法,在所述基于多个多层感知机,对所述非规则数据进行特征变换之前,所述方法还包括:基于所述待提取集合,确定关于所述待提取集合的集合矩阵,其中,所述集合矩阵以所述第一数量作为行向量,以各个所述非规则数据的原始特征的特征维度作为列向量;所述基于多个多层感知机,对所述非规则数据进行特征变换,包括:基于多个多层感知机和所述集合矩阵,对所述非规则数据进行特征变换。
根据本发明提供的一种集合特征提取方法,在所述基于多个多层感知机,对所述非规则数据进行特征变换之前,所述方法还包括:基于多层感知机和所述集合矩阵,对所述非规则数据进行特征增强变换,得到元素特征增强矩阵,其中,所述元素特征增强矩阵以所述第一数量作为行向量,以各个所述非规则数据的增强变换后特征的特征维度作为列向量;所述变换后特征矩阵还包括所述元素特征增强矩阵,所述基于多个所述变换后特征矩阵,得到关于所述待提取集合的集合特征,包括:对所述元素特征增强矩阵和所述待提取集合的集合特征进行合并处理,得到增强集合特征矩阵,其中,所述增强集合特征矩阵中包括增强元素特征;将所述增强元素特征作为最终关于所述待提取集合的集合特征。
根据本发明提供的一种集合特征提取方法,在所述对所述元素特征增强矩阵和所述待提取集合的集合特征进行合并处理之前,所述方法还包括:基于多层感知机对所述待提取集合的集合特征进行增强处理,得到增强处理后集合特征;所述对所述元素特征增强矩阵和所述待提取集合的集合特征进行合并处理,包括:对所述元素特征增强矩阵和所述增强处理后集合特征进行合并处理。
根据本发明提供的一种集合特征提取方法,所述多层感知机的数量为两个,所述基于多个多层感知机,对所述非规则数据进行特征变换,得到多个变换后特征矩阵,包括:基于两个多层感知机,对所述非规则数据进行特征变换,得到两个变换后特征矩阵;所述基于多个所述变换后特征矩阵,得到关于所述待提取集合的集合特征,包括:将两个变换后特征矩阵中的任意矩阵进行转置处理,并将转置处理后的变换后特征矩阵与另一变换后特征矩阵进行矩阵相乘,得到关于待提取集合的集合特征矩阵;对所述集合特征矩阵进行压平处理,得到关于所述待提取集合的集合特征。
本发明还提供一种集合特征提取装置,所述装置包括:获取模块,用于获取待提取集合,其中,所述待提取集合包括第一数量的非规则数据;变换模块,用于基于多个多层感知机,对所述非规则数据进行特征变换,得到多个变换后特征矩阵,其中,所述变换后特征矩阵的数量与所述多层感知机的数量相对应,所述变换后特征矩阵以所述第一数量作为行向量,以各个所述非规则数据的变换后特征的特征维度作为列向量,在多个变换后特征矩阵中的所述列向量的最小值小于或等于所述第一数量;生成模块,用于基于多个所述变换后特征矩阵,得到关于所述待提取集合的集合特征。
根据本发明提供的一种集合特征提取装置,所述获取模块还用于:基于所述待提取集合,确定关于所述待提取集合的集合矩阵,其中,所述集合矩阵以所述第一数量作为行向量,以各个所述非规则数据的原始特征的特征维度作为列向量;所述变换模块采用以下方式基于多个多层感知机,对所述非规则数据进行特征变换:基于多个多层感知机和所述集合矩阵,对所述非规则数据进行特征变换。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述集合特征提取方法。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述集合特征提取方法。
本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述集合特征提取方法。
本发明提供的集合特征提取方法、装置、电子设备及存储介质,通过多个多层感知机,对待提取集合中非规则数据进行特征变换以得到多个变换后特征矩阵,并基于多个变换后特征矩阵,得到关于待提取集合的集合特征。在本发明中通过并行采用多层感知机对非规则数据的原始特征进行处理,确保在相同特征向量维度的情况下减少计算量和参数量,进而实现在保证集合特征提取的高准确度前提下,减少了特征提取过程的计算量。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的集合特征提取方法的流程示意图之一;
图2是本发明提供的集合特征提取方法的流程示意图之二;
图3是本发明提供的集合特征提取方法的流程示意图之三;
图4是本发明提供的集合特征提取方法的流程示意图之四;
图5是本发明提供的集合特征提取方法的流程示意图之五;
图6是本发明提供的集合特征提取方法的流程示意图之六;
图7是关于本发明的集合特征提取方法在t-SNE方法下的可视化结果;
图8是本发明的集合特征提取方法的关于ModelNet40测试集的可视化结果;
图9是本发明提供的集合特征提取装置的结构示意图;
图10是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
对于输入数据的顺序不敏感的神经网络,被称为置换不变神经网络。置换不变神经网络在提取无序或无结构的集合类数据(又称非规则数据)的特征方面具有十分重要的作用。置换不变神经网络广泛用于集合数据特征提取,包括点云数据处理及集合异常检测等。当前的置换不变神经网络(或集合特征提取方法),根据聚合域的范围大小可分为全局聚合方法和局部聚合方法。然而全局聚合方法或局部聚合方法进行集合特征提取不能平衡计算量和提取准确度。
本发明创造性地提出一种新型全局聚合型的基于对偶多层感知机的置换不变神经网络,又可以理解为是一种集合特征提取方法。以往的全局聚合方法往往采用单一神经网络来对待提取集合中的非规则数据的原始特征进行处理,其参数量大且效率较低。本方法创造性地并行采用对偶多层感知机对原始特征进行处理,在相同特征向量维度M的情况下将计算量和参数量由O(M+C)降低至O(M^0.5+C)。
图1是本发明提供的集合特征提取方法的流程示意图之一。
在本发明一示例性实施例中,如图1所示,集合特征提取方法可以包括步骤110至步骤130,下面将分别介绍各步骤。
在步骤110中,获取待提取集合,其中,待提取集合包括第一数量的非规则数据。
在一种实施例中,可以获取待提取集合。其中,待提取集合中包括有N个元素(又称非规则数据)。其中,非规则数据是指无顺序性或无结构的集合类数据。在一示例中,待提取集合可以用输入(N,C)表示,其中,N表示待提取集合中包括有N个元素,C表示每个元素的原始特征维度。在应用过程中,待提取集合可以大小为N*C的矩阵进行存储。需要说明的是,第一数量可以根据实际情况进行确定,在本实施例中不作具体限定。
在步骤120中,基于多个多层感知机,对非规则数据进行特征变换,得到多个变换后特征矩阵,其中,变换后特征矩阵的数量与多层感知机的数量相对应,变换后特征矩阵以第一数量作为行向量,以各个非规则数据的变换后特征的特征维度作为列向量,在多个变换后特征矩阵中的列向量的最小值小于或等于第一数量。
在步骤130中,基于多个变换后特征矩阵,得到关于待提取集合的集合特征。
在一种实施例中,可以基于多个多层感知机并行对待提取集合中所有的非规则数据进行特征变换,得到多个变换后特征矩阵。在一示例中,若基于n个多层感知机对非规则数据进行特征变换,可以得到n个变换后特征矩阵。其中,多个多层感知机的数量可以根据实际情况进行调整,在本实施例中不对具体限定。
可以理解的是,对所有非规则数据进行特征变换,可以得到关于各个非规则数据的变换后特征。各个非规则数据的变换后特征具有特征维度,在应用过程中,可以基于各个非规则数据的变换后特征的特征维度作为变换后特征矩阵的列向量。
继续以待提取集合为矩阵N*C为例进行说明,可以利用多个(例如两个)多层感知机对待提取集合中的非规则数据逐元素进行特征变换,得到两个大小分别为N*C1和N*C2的变换后特征矩阵。其中,变换后特征矩阵以第一数量N作为行向量,以各个非规则数据的变换后特征的特征维度C1和C2作为列向量。可以理解的是,特征维度可以根据实际情况进行调整,只需满足特征维度C1和特征维度C2中的最小值小于或等于第一数量N即可。进一步的,可以根据多个(例如两个)变换后特征矩阵,得到关于待提取集合的集合特征。
可以理解的是,对于具有置换不变性的函数f:RN*p→RC1*C2,总存在两个具有置换协变性的函数g(1):RN*p→RN*C1、g(2):RN*p→RN*C2,使得对任意X∈RN*p总有f(X)=[g(1)(X)]Tg(2)(X)的充要条件是N≥min{C1,C2}。
需要说明的是,上述的置换协变性的函数意为当输入数据经过了顺序的置换后,其输出也会经过相同地顺序置换。事实上只要是逐元素作用的函数都满足置换协变性。上述描述说明,只要待处理集合的元素数目(又称第一数量)N不小于C1和C2的最小值,作用于待处理集合上的任意置换不变性函数总可以分解为对偶的置换协变性函数之积。由此可知,本发明提供的集合特征提取方法的表达能力并没有损失,即本发明提供的集合特征提取方法具有良好的特征提取能力。
在本实施例中,通过并行采用对偶多层感知机对原始特征进行处理,可以削减待搜索空间,在相同特征向量维度M的情况下将计算量和参数量由O(M+C)降低至O(M^0.5+C),进而可以在保证集合特征提取的高准确度前提下,减少特征提取过程的计算量。
为了进一步介绍本发明提供的集合特征提取方法,下面将结合图2进行说明。
图2是本发明提供的集合特征提取方法的流程示意图之二。
在本发明一示例性实施例中,如图2所示,对于输入的集合类数据(又称待提取集合),假定其中有N个元素,每个元素的原始特征维度为C。在应用过程中,待提取集合可采用大小为N*C的矩阵进行存储。其中,对于集合特征提取方法,输入为(N,C)。进一步的,分别将待提取集合逐元素地作用于两个多层感知机,以得到两个大小分别为N*C1和N*C2的元素特征矩阵(又称变换后特征矩阵)。在一示例中,可以将第一个矩阵转置后与第二个矩阵相乘,以得到大小为C1*C2的集合特征矩阵,再将集合特征矩阵C1*C2压平即得到关于待提取集合的集合特征(长度为C1*C2的集合特征向量)。在应用过程中,可以输出(C1C2),即得到了关于待提取集合的集合特征。
本发明提供的集合特征提取方法,通过多个多层感知机,对待提取集合中非规则数据进行特征变换以得到多个变换后特征矩阵,并基于多个变换后特征矩阵,得到关于待提取集合的集合特征。在本发明中通过并行采用多层感知机对非规则数据的原始特征进行处理,确保在相同特征向量维度的情况下减少计算量和参数量,进而实现在保证集合特征提取的高准确度前提下,减少了特征提取过程的计算量。
本发明将结合图3对另一种集合特征提取方法的过程进行说明。
图3是本发明提供的集合特征提取方法的流程示意图之三。
在本发明一示例性实施例中,如图3所示,集合特征提取方法可以包括步骤310至步骤340,其中,步骤310和步骤110相同或相似,步骤340和步骤130相同或相似,其具体实施方式和有益效果请参照前文描述,在本实施例中不再赘述,下面将介绍步骤320和步骤330。
在步骤320中,基于待提取集合,确定关于待提取集合的集合矩阵。
在一种实施例中,集合矩阵可以采用第一数量作为行向量,以及采用各个非规则数据的原始特征的特征维度作为列向量。在一示例中,待提取集合可以用输入(N,C)表示,其中,N表示待提取集合中包括有N个元素,C表示每个元素的原始特征维度。在应用过程中,待提取集合可以大小为N*C的矩阵进行存储,并将大小为N*C的矩阵作为关于待提取集合的集合矩阵。
在步骤330中,基于多个多层感知机和集合矩阵,对非规则数据进行特征变换。
在一种实施例中,关于待提取集合的集合矩阵可以表示为矩阵N*C。在应过程中,可以利用多个(例如两个)多层感知机,对集合矩阵N*C进行特征变换处理,以实现对待提取集合中各非规则数据进行特征变换。在应用过程中,可以对待提取集合中的非规则数据逐元素进行特征变换,得到两个大小分别为N*C1和N*C2的变换后特征矩阵。其中,变换后特征矩阵以第一数量N作为行向量,以非规则数据的变换后特征的特征维度C1和C2作为列向量。可以理解的是,特征维度可以根据实际情况进行调整,只需满足特征维度C1和特征维度C2中的最小值小于或等于第一数量N即可。
为了进一步介绍本发明提供的集合特征提取方法,下面将结合图4进行说明。
图4是本发明提供的集合特征提取方法的流程示意图之四。
在本发明一示例性实施例中,如图4所示,集合特征提取方法可以包括步骤410至步骤470,其中,步骤410至步骤420和步骤310至步骤320相同或相似,步骤440至步骤450与步骤330至步骤340相同或相似,下面将分别介绍步骤430、步骤460和步骤470。
在步骤430中,基于多层感知机和集合矩阵,对非规则数据进行特征增强变换,得到元素特征增强矩阵。
在一种实施例中,对于集合矩阵N*C,可以采用一个多层感知机对集合矩阵中对应的非规则数据进行特征增强变换,以得到元素特征增强矩阵(N,C3)。其中,元素特征增强矩阵(N,C3)可以采用第一数量N作为行向量,采用各个非规则数据的增强变换后特征的特征维度C3作为列向量。
在步骤460中,对元素特征增强矩阵和待提取集合的集合特征进行合并处理,得到增强集合特征矩阵,其中,增强集合特征矩阵中包括增强元素特征。
在步骤470中,将增强元素特征作为最终关于待提取集合的集合特征。
继续以待提取集合为矩阵N*C为例进行说明,可以将元素特征增强矩阵(N,C3)和待提取集合的集合特征(C1C2)进行合并处理,得到增强集合特征矩阵(N,C6)。进一步的,将增强集合特征矩阵(N,C6)中的增强元素特征作为最终关于待提取集合的集合特征。在本实施例中,通过迭代应用待提取集合的集合特征,并与元素特征增强矩阵进行合并,可以提高集合特征提取的准确度。可以理解的是,为了进一步提高集合特征提取的准确度,还可以再次迭代应用最终关于待提取集合的集合特征,并与元素特征增强矩阵进行合并来实现。
为了进一步提高集合特征提取方法的特征提取准确性,下面将结合图5进行说明。
图5是本发明提供的集合特征提取方法的流程示意图之五。
在本发明一示例性实施例中,如图5所示,集合特征提取方法可以包括步骤510至步骤580,其中,步骤510至步骤550与步骤410至步骤450相同或相似,步骤580和步骤470相同或相似,其具体实施方式和有益效果请参照前文描述,下面将分别介绍步骤560和步骤570。
在步骤560中,基于多层感知机对待提取集合的集合特征进行增强处理,得到增强处理后集合特征。
在步骤570中,对元素特征增强矩阵和增强处理后集合特征进行合并处理,得到增强集合特征矩阵,其中,增强集合特征矩阵中包括增强元素特征。
在一种实施例中,继续以待提取集合为矩阵N*C为例进行说明,可以采用一个多层感知机对待提取集合的集合特征(C1C2)进行增强处理,以得到增强处理后集合特征(C5)。进一步的,对元素特征增强矩阵(N,C3)和增强处理后集合特征(C5)进行合并处理,得到增强集合特征矩阵(N,C6)。进一步的,将增强集合特征矩阵(N,C6)中的增强元素特征作为最终关于待提取集合的集合特征。在本实施例中,通过对待提取集合的集合特征(C1C2)进行增强处理,再基于增强处理后集合特征(C5)得到最终关于待提取集合的集合特征,可以提高集合特征提取的准确度。
为了进一步介绍本发明提供的集合特征提取方法,下面将结合图6进行说明。
图6是本发明提供的集合特征提取方法的流程示意图之六。
在本发明一示例性实施例中,如图6所示,对于输入的集合类数据(又称待提取集合),假定其中有N个元素,每个元素的原始特征维度为C。在应用过程中,待提取集合可采用大小为N*C的矩阵进行存储。其中,对于集合特征提取方法,输入为(N,C)。进一步的,可以基于前文所述方法提取出关于待提取集合的集合特征向量C1*C2(又可以表示为图6中的C4)。在将经过多层感知机增强处理的集合特征向量(又称增强处理后集合特征(C5))与经过多层感知机增强处理的元素特征矩阵(又称元素特征增强矩阵(N,C3))进行合并,得到增强集合特征矩阵(N,C6)。进一步的,将增强集合特征矩阵(N,C6)中的增强元素特征作为最终关于待提取集合的集合特征。在应用过程中,可以输出(N,C6),即得到关于待提取集合的集合特征。
在本发明一示例性实施例中,多层感知机的数量可以为两个,基于多个多层感知机,对非规则数据进行特征变换,得到多个变换后特征矩阵可以采用以下方式实现:基于两个多层感知机,对非规则数据进行特征变换,得到两个变换后特征矩阵。基于多个变换后特征矩阵,得到关于待提取集合的集合特征可以采用以下方式实现:将两个变换后特征矩阵中的任意矩阵进行转置处理,并将转置处理后的变换后特征矩阵与另一变换后特征矩阵进行矩阵相乘,得到关于待提取集合的集合特征矩阵;对集合特征矩阵进行压平处理,得到关于待提取集合的集合特征。
在应用过程中,将多层感知机的数量设置为两个可以在保证集合特征提取准确度高的基础下,有效减少了计算量。
在一种实施例中,对于集合特征提取方法,输入为(N,C)。进一步的,分别将待提取集合逐元素地作用于两个多层感知机,以得到两个大小分别为N*C1和N*C2的元素特征矩阵(又称变换后特征矩阵)。在一示例中,可以将第一个矩阵转置后与第二个矩阵相乘,以得到大小为C1*C2的集合特征矩阵,再将集合特征矩阵C1*C2压平即得到关于待提取集合的集合特征(长度为C1*C2的集合特征向量)。在应用过程中,可以输出(C1C2),即得到关于待提取集合的集合特征。
根据前文描述可知,本发明提供的集合特征提取方法结构简单,推理速度较快。与当下主流的局部聚合方法相比,没有繁多冗杂的采样及分组模块,这些保证了本方法的推理速度。另外,本发明提供的集合特征提取方法参数量少、计算量小,以往的全局聚合方法往往需要大量的参数才能达到或接近同量级的局部聚合方法。然而,通过本方法对集合特征进行对偶分解,在保证集合特征提取准确度的前提下,不仅使其参数量比以往的全局聚合方法要少,也使其参数量比目前主流性能最佳的局部聚合方法要少。
为说明以上优点,本技术方案在三个任务上进行了实验,分别是像素集合分类、属性集合异常检测和点云集合分类。
采用本发明提供的集合特征提取方法对像素集合进行分类:
在应用过程中,可以采用MNIST数据集。该数据集是一个手写数字分类数据集,训练集中有60000张图像,测试集中有10000张图像。为了在图片上测试集合特征提取方法,可以通过将相对坐标附加到强度并随机调整顺序来将图像转换为像素集合。本发明提供的集合特征提取方法分别与PointNet和PointNet++进行比较,并使用错误率作为评估指标。其中,表1表示MNIST像素集合的分类结果。
表1 MNIST像素集合的分类结果
方法 参数量(M) 错误率(%)
PointNet 3.47 0.78
PointNet++ 1.47 0.51
本方法(小) 0.28 0.80±0.053
本方法(大) 1.13 0.48±0.034
对于本发明提供的集合特征提取方法,评估了两种不同大小的模型:只有一个特征聚合模块的小模型(可以是对应图2所示的方案)和具有一个特征聚合模块和两个特征广播模块的大模型(可以是对应图6所示的方案)。根据表1可知,在本数据集中,小模型的性能比PointNet稍差,而大模型的性能略好于PointNet++。但是与作为局部聚合方法的PointNet++不同,无论是小模型还是大模型,均无需访问像素集合的局部结构即可实现当前效果,进而减少了计算量,从而使结果更具竞争力。
图7是关于本发明的集合特征提取方法在t-SNE方法下的可视化结果。
结合图7可知,图7示出了前文所述的关于小模型的集合特征提取方法产生的特征向量在t-SNE方法下的可视化结果。在图7中,不同的形状表示不同的类别,由图7可知,不同的类别被有效的提取并聚类,说明本发明提供的集合特征提取方法可以有效的区分出不同集合的特征。
采用本发明提供的集合特征提取方法进行属性集合异常检测:
CelebA是一个大规模的人脸属性数据集,包括202599张人脸图像,每张图像有40个属性注释。可以随机抽样9张具有相同2个属性的图像和1张没有这些属性的图像。CelebA中的每个图像在采样数据集中最多出现一次。由于异常是少数,在应用过程中,提取集合特征,使得大多数正常成员不会偏离集合特征。在提取过程中,除了集合特征提取器之外,所有方法都相同。在没有访问属性的情况下评估端到端设置下的所有方法。在应用过程中,使用全局准确率作为评估指标。通过网格搜索从一系列候选中选择所有方法的结构。如表2所示,本发明提供的集合特征提取方法和Set Transformer方法明显优于其他方法,但本方法使用的参数更少,因此总体性能更好。
表2 CelebA属性集合异常检测结果
方法 参数量(K) 准确率(%)
最大池化 65.8 60.4±0.44
平均池化 65.8 65.0±0.16
PointNet 131.6 62.3±0.22
Deep Sets 132.6 65.0±0.35
Set Transformer 263.4 66.4±0.45
本方法 83.3 66.8±0.43
采用本发明提供的集合特征提取方法进行点云集合分类:
ModelNet40是一个40类3D形状数据集,训练集中有9843个CAD模型,测试集中有2468个CAD模型。可以利用PointNet++中采样点云的1024个点和法线向量以进行公平比较,并以整体准确率作为评估指标。结果如表3所示。
表3 ModelNet40点云集合分类结果
Figure BDA0003504002520000141
Figure BDA0003504002520000151
与像素集合分类相同,同样评估了两个不同大小的模型,但它们具有相似的性能,这意味着模型在添加更多参数时倾向于过拟合。因此,在应用过程中只关注本方法中较小的那个模型。本方法的性能优于其他全局聚合方法(Deep Sets和Set Transformer)和早期点云领域的全局聚合方法和局部聚合方法(PointNet和PointNet++),但准确率与当下最佳的方法差1%到2%左右。作为一种全局聚合方法,本方法无法捕捉更多的局部信息。但这一结果仍是有竞争力的,因为相较于其他局部聚合方法,本方法的结构更简单,与其他所有方法相比,本方法所需参数的数量显着减少了85%以上。由此可知,本方法提供的集合特征提取方法实现了在保证集合特征提取的高准确度前提下,减少了特征提取过程的计算量。
可以采用与PointNet中介绍的相同方法对分类结果进行可视化,结果如8所示。
图8是本发明的集合特征提取方法的关于ModelNet40测试集的可视化结果。
在图8中,左侧代表待索引的点云,右侧是在特征空间中与左侧点云最近的5个点云,其中,被虚线框住的点云代表点云类别与左侧类别不同的点云。由图8可知,本发明提供的集合特征提取方法可以有效提取出结合特征且准确度较高。
以上三个实验都说明基于本发明提供的集合特征提取方法在多个集合特征提取任务中结构简单,参数量较少且特征提取准确度高。
根据上述描述可知,本发明提供的集合特征提取方法,通过多个多层感知机,对待提取集合中非规则数据进行特征变换以得到多个变换后特征矩阵,并基于多个变换后特征矩阵,得到关于待提取集合的集合特征。在本发明中通过并行采用多层感知机对非规则数据的原始特征进行处理,确保在相同特征向量维度的情况下减少计算量和参数量,进而实现在保证集合特征提取的高准确度前提下,减少了特征提取过程的计算量。
基于相同的构思,本发明还提供一种集合特征提取装置。
下面对本发明提供的集合特征提取装置进行描述,下文描述的集合特征提取装置与上文描述的集合特征提取方法可相互对应参照。
图9是本发明提供的集合特征提取装置的结构示意图。
在本发明一示例性实施例中,如图9所示,集合特征提取装置可以包括获取模块910、变换模块920和生成模块930,下面将分别介绍各模块。
获取模块910可以被配置为用于获取待提取集合,其中,待提取集合包括第一数量的非规则数据。
变换模块920可以被配置为用于基于多个多层感知机,对非规则数据进行特征变换,得到多个变换后特征矩阵,其中,变换后特征矩阵的数量与多层感知机的数量相对应,变换后特征矩阵以第一数量作为行向量,以各个非规则数据的变换后特征的特征维度作为列向量,在多个变换后特征矩阵中的列向量的最小值小于或等于第一数量。
生成模块930可以被配置为用于基于多个变换后特征矩阵,得到关于待提取集合的集合特征。
在本发明一示例性实施例中,获取模块910还可以被配置为用于:基于待提取集合,确定关于待提取集合的集合矩阵,其中,集合矩阵以第一数量作为行向量,以各个非规则数据的原始特征的特征维度作为列向量。变换模块920可以采用以下方式基于多个多层感知机,对非规则数据进行特征变换:基于多个多层感知机和集合矩阵,对非规则数据进行特征变换。
在本发明一示例性实施例中,变换模块920还可以被配置为用于基于多层感知机和集合矩阵,对非规则数据进行特征增强变换,得到元素特征增强矩阵,其中,元素特征增强矩阵以第一数量作为行向量,以各个非规则数据的增强变换后特征的特征维度作为列向量。变换后特征矩阵还可以包括元素特征增强矩阵,生成模块930可以采用以下方式基于多个变换后特征矩阵,得到关于待提取集合的集合特征:对元素特征增强矩阵和待提取集合的集合特征进行合并处理,得到增强集合特征矩阵,其中,增强集合特征矩阵中包括增强元素特征;将增强元素特征作为最终关于待提取集合的集合特征。
在本发明一示例性实施例中,变换模块920还可以被配置为用于基于多层感知机对待提取集合的集合特征进行增强处理,得到增强处理后集合特征;生成模块930可以采用以下方式对元素特征增强矩阵和待提取集合的集合特征进行合并处理:对元素特征增强矩阵和增强处理后集合特征进行合并处理。
在本发明一示例性实施例中,多层感知机的数量可以为两个,变换模块920可以采用以下方式基于多个多层感知机,对非规则数据进行特征变换,得到多个变换后特征矩阵:基于两个多层感知机,对非规则数据进行特征变换,得到两个变换后特征矩阵。生成模块930可以采用以下方式基于多个变换后特征矩阵,得到关于待提取集合的集合特征:将两个变换后特征矩阵中的任意矩阵进行转置处理,并将转置处理后的变换后特征矩阵与另一变换后特征矩阵进行矩阵相乘,得到关于待提取集合的集合特征矩阵;对集合特征矩阵进行压平处理,得到关于待提取集合的集合特征。
图10示例了一种电子设备的实体结构示意图,如图10所示,该电子设备可以包括:处理器(processor)1010、通信接口(Communications Interface)1020、存储器(memory)1030和通信总线1040,其中,处理器1010,通信接口1020,存储器1030通过通信总线1040完成相互间的通信。处理器1010可以调用存储器1030中的逻辑指令,以执行集合特征提取方法,该方法包括:获取待提取集合,其中,所述待提取集合包括第一数量的非规则数据;基于多个多层感知机,对所述非规则数据进行特征变换,得到多个变换后特征矩阵,其中,所述变换后特征矩阵的数量与所述多层感知机的数量相对应,所述变换后特征矩阵以所述第一数量作为行向量,以各个所述非规则数据的变换后特征的特征维度作为列向量,在多个变换后特征矩阵中的所述列向量的最小值小于或等于所述第一数量;基于多个所述变换后特征矩阵,得到关于所述待提取集合的集合特征。
此外,上述的存储器1030中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的集合特征提取方法,该方法包括:获取待提取集合,其中,所述待提取集合包括第一数量的非规则数据;基于多个多层感知机,对所述非规则数据进行特征变换,得到多个变换后特征矩阵,其中,所述变换后特征矩阵的数量与所述多层感知机的数量相对应,所述变换后特征矩阵以所述第一数量作为行向量,以各个所述非规则数据的变换后特征的特征维度作为列向量,在多个变换后特征矩阵中的所述列向量的最小值小于或等于所述第一数量;基于多个所述变换后特征矩阵,得到关于所述待提取集合的集合特征。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的集合特征提取方法,该方法包括:获取待提取集合,其中,所述待提取集合包括第一数量的非规则数据;基于多个多层感知机,对所述非规则数据进行特征变换,得到多个变换后特征矩阵,其中,所述变换后特征矩阵的数量与所述多层感知机的数量相对应,所述变换后特征矩阵以所述第一数量作为行向量,以各个所述非规则数据的变换后特征的特征维度作为列向量,在多个变换后特征矩阵中的所述列向量的最小值小于或等于所述第一数量;基于多个所述变换后特征矩阵,得到关于所述待提取集合的集合特征。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
进一步可以理解的是,本公开实施例中尽管在附图中以特定的顺序描述操作,但是不应将其理解为要求按照所示的特定顺序或是串行顺序来执行这些操作,或是要求执行全部所示的操作以得到期望的结果。在特定环境中,多任务和并行处理可能是有利的。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种集合特征提取方法,其特征在于,所述方法包括:
获取待提取集合,其中,所述待提取集合包括第一数量的非规则数据;
基于多个多层感知机,对所述非规则数据进行特征变换,得到多个变换后特征矩阵,其中,所述变换后特征矩阵的数量与所述多层感知机的数量相对应,所述变换后特征矩阵以所述第一数量作为行向量,以各个所述非规则数据的变换后特征的特征维度作为列向量,在多个变换后特征矩阵中的所述列向量的最小值小于或等于所述第一数量;
基于多个所述变换后特征矩阵,得到关于所述待提取集合的集合特征。
2.根据权利要求1所述的集合特征提取方法,其特征在于,在所述基于多个多层感知机,对所述非规则数据进行特征变换之前,所述方法还包括:
基于所述待提取集合,确定关于所述待提取集合的集合矩阵,其中,所述集合矩阵以所述第一数量作为行向量,以各个所述非规则数据的原始特征的特征维度作为列向量;
所述基于多个多层感知机,对所述非规则数据进行特征变换,包括:
基于多个多层感知机和所述集合矩阵,对所述非规则数据进行特征变换。
3.根据权利要求2所述的集合特征提取方法,其特征在于,在所述基于多个多层感知机,对所述非规则数据进行特征变换之前,所述方法还包括:
基于多层感知机和所述集合矩阵,对所述非规则数据进行特征增强变换,得到元素特征增强矩阵,其中,所述元素特征增强矩阵以所述第一数量作为行向量,以各个所述非规则数据的增强变换后特征的特征维度作为列向量;
所述变换后特征矩阵还包括所述元素特征增强矩阵,所述基于多个所述变换后特征矩阵,得到关于所述待提取集合的集合特征,包括:
对所述元素特征增强矩阵和所述待提取集合的集合特征进行合并处理,得到增强集合特征矩阵,其中,所述增强集合特征矩阵中包括增强元素特征;
将所述增强元素特征作为最终关于所述待提取集合的集合特征。
4.根据权利要求3所述的集合特征提取方法,其特征在于,在所述对所述元素特征增强矩阵和所述待提取集合的集合特征进行合并处理之前,所述方法还包括:
基于多层感知机对所述待提取集合的集合特征进行增强处理,得到增强处理后集合特征;
所述对所述元素特征增强矩阵和所述待提取集合的集合特征进行合并处理,包括:
对所述元素特征增强矩阵和所述增强处理后集合特征进行合并处理。
5.根据权利要求1所述的集合特征提取方法,其特征在于,所述多层感知机的数量为两个,所述基于多个多层感知机,对所述非规则数据进行特征变换,得到多个变换后特征矩阵,包括:
基于两个多层感知机,对所述非规则数据进行特征变换,得到两个变换后特征矩阵;
所述基于多个所述变换后特征矩阵,得到关于所述待提取集合的集合特征,包括:
将两个变换后特征矩阵中的任意矩阵进行转置处理,并将转置处理后的变换后特征矩阵与另一变换后特征矩阵进行矩阵相乘,得到关于待提取集合的集合特征矩阵;
对所述集合特征矩阵进行压平处理,得到关于所述待提取集合的集合特征。
6.一种集合特征提取装置,其特征在于,所述装置包括:
获取模块,用于获取待提取集合,其中,所述待提取集合包括第一数量的非规则数据;
变换模块,用于基于多个多层感知机,对所述非规则数据进行特征变换,得到多个变换后特征矩阵,其中,所述变换后特征矩阵的数量与所述多层感知机的数量相对应,所述变换后特征矩阵以所述第一数量作为行向量,以各个所述非规则数据的变换后特征的特征维度作为列向量,在多个变换后特征矩阵中的所述列向量的最小值小于或等于所述第一数量;
生成模块,用于基于多个所述变换后特征矩阵,得到关于所述待提取集合的集合特征。
7.根据权利要求6所述的集合特征提取装置,其特征在于,所述获取模块还用于:
基于所述待提取集合,确定关于所述待提取集合的集合矩阵,其中,所述集合矩阵以所述第一数量作为行向量,以各个所述非规则数据的原始特征的特征维度作为列向量;
所述变换模块采用以下方式基于多个多层感知机,对所述非规则数据进行特征变换:
基于多个多层感知机和所述集合矩阵,对所述非规则数据进行特征变换。
8.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至5任一项所述集合特征提取方法。
9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述集合特征提取方法。
10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述集合特征提取方法。
CN202210151104.7A 2022-02-14 2022-02-14 集合特征提取方法、装置、电子设备及存储介质 Active CN114565772B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210151104.7A CN114565772B (zh) 2022-02-14 2022-02-14 集合特征提取方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210151104.7A CN114565772B (zh) 2022-02-14 2022-02-14 集合特征提取方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN114565772A true CN114565772A (zh) 2022-05-31
CN114565772B CN114565772B (zh) 2024-06-11

Family

ID=81713239

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210151104.7A Active CN114565772B (zh) 2022-02-14 2022-02-14 集合特征提取方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN114565772B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116107636A (zh) * 2023-04-06 2023-05-12 之江实验室 一种硬件加速方法、装置、存储介质及电子设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111028279A (zh) * 2019-12-12 2020-04-17 商汤集团有限公司 点云数据处理方法及装置、电子设备和存储介质
US20210089878A1 (en) * 2019-09-20 2021-03-25 International Business Machines Corporation Bayesian nonparametric learning of neural networks
CN113177555A (zh) * 2021-05-21 2021-07-27 西南大学 基于跨层级跨尺度跨注意力机制的目标处理方法及装置
CN113256640A (zh) * 2021-05-31 2021-08-13 北京理工大学 基于PointNet网络点云分割及虚拟环境生成方法和装置
CN113628322A (zh) * 2021-07-26 2021-11-09 阿里巴巴(中国)有限公司 图像处理、ar显示与直播方法、设备及存储介质
CN113989291A (zh) * 2021-10-20 2022-01-28 上海电力大学 一种基于PointNet与RANSAC算法的建筑物屋顶平面分割方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210089878A1 (en) * 2019-09-20 2021-03-25 International Business Machines Corporation Bayesian nonparametric learning of neural networks
CN111028279A (zh) * 2019-12-12 2020-04-17 商汤集团有限公司 点云数据处理方法及装置、电子设备和存储介质
CN113177555A (zh) * 2021-05-21 2021-07-27 西南大学 基于跨层级跨尺度跨注意力机制的目标处理方法及装置
CN113256640A (zh) * 2021-05-31 2021-08-13 北京理工大学 基于PointNet网络点云分割及虚拟环境生成方法和装置
CN113628322A (zh) * 2021-07-26 2021-11-09 阿里巴巴(中国)有限公司 图像处理、ar显示与直播方法、设备及存储介质
CN113989291A (zh) * 2021-10-20 2022-01-28 上海电力大学 一种基于PointNet与RANSAC算法的建筑物屋顶平面分割方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
J. PARK等: "The efficient incorporation of MLP features into automatic speech recognition systems", COMPUTER SPEECH & LANGUAGE, 11 July 2011 (2011-07-11) *
JIAJUN FEI等: "DuMLP-Pin: A Dual-MLP-dot-product Permutation-invariant Network for Set Feature Extraction", ARXIV:2203.04007V1, 8 March 2022 (2022-03-08), pages 3 - 4 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116107636A (zh) * 2023-04-06 2023-05-12 之江实验室 一种硬件加速方法、装置、存储介质及电子设备

Also Published As

Publication number Publication date
CN114565772B (zh) 2024-06-11

Similar Documents

Publication Publication Date Title
Sun et al. Hybrid pixel-unshuffled network for lightweight image super-resolution
CN107563433B (zh) 一种基于卷积神经网络的红外小目标检测方法
CN108108751B (zh) 一种基于卷积多特征和深度随机森林的场景识别方法
Agarwal et al. Content based image retrieval using color edge detection and discrete wavelet transform
CN107944459A (zh) 一种rgb‑d物体识别方法
CN111415323B (zh) 图像的检测方法及装置,神经网络的训练方法及装置
Li et al. Ensemble EMD-based spectral-spatial feature extraction for hyperspectral image classification
CN113361546A (zh) 融合非对称卷积和注意力机制的遥感图像特征提取方法
Wang et al. Low rank representation on SPD matrices with log-Euclidean metric
Zhang et al. An image denoising method based on BM4D and GAN in 3D shearlet domain
CN116012393A (zh) 一种纸箱点云分割方法、装置以及处理设备
CN114565772B (zh) 集合特征提取方法、装置、电子设备及存储介质
CN114494021A (zh) 图像重建方法、装置、电子设备及存储介质
Qu et al. Umle: Unsupervised multi-discriminator network for low light enhancement
Dey Python image processing cookbook: over 60 recipes to help you perform complex image processing and computer vision tasks with ease
CN113657196A (zh) Sar图像目标检测方法、装置、电子设备和存储介质
Hu et al. Bi-volution: A static and dynamic coupled filter
CN111985487A (zh) 一种遥感影像目标提取方法、电子设备及存储介质
CN109902720B (zh) 基于子空间分解进行深度特征估计的图像分类识别方法
CN116071625A (zh) 深度学习模型的训练方法、目标检测方法及装置
Feng et al. Study on the optimization of CNN based on image identification
CN113657493B (zh) 基于风格特征通道注意力的x光安检图像违禁品检测方法
CN113128614B (zh) 基于图像梯度的卷积方法、基于方向卷积的神经网络及分类方法
Zhang et al. A generative adversarial network with dual discriminators for infrared and visible image fusion based on saliency detection
Yang et al. Manipulation Mask Generator: High-Quality Image Manipulation Mask Generation Method Based on Modified Total Variation Noise Reduction

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant