CN115797715A - 一种量子视觉mlp处理系统及存储介质 - Google Patents

一种量子视觉mlp处理系统及存储介质 Download PDF

Info

Publication number
CN115797715A
CN115797715A CN202211583636.4A CN202211583636A CN115797715A CN 115797715 A CN115797715 A CN 115797715A CN 202211583636 A CN202211583636 A CN 202211583636A CN 115797715 A CN115797715 A CN 115797715A
Authority
CN
China
Prior art keywords
image block
mlp
quantum
visual
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211583636.4A
Other languages
English (en)
Other versions
CN115797715B (zh
Inventor
罗引
蒋永余
王俊艳
王璋盛
曹家
王磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zhongke Wenge Technology Co ltd
Original Assignee
Beijing Zhongke Wenge Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Zhongke Wenge Technology Co ltd filed Critical Beijing Zhongke Wenge Technology Co ltd
Priority to CN202211583636.4A priority Critical patent/CN115797715B/zh
Publication of CN115797715A publication Critical patent/CN115797715A/zh
Application granted granted Critical
Publication of CN115797715B publication Critical patent/CN115797715B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Image Analysis (AREA)

Abstract

本发明提供了一种量子视觉MLP处理系统及存储介质,所述系统包括n个量子视觉MLP处理模块、处理器和存储有一段计算机程序的存储器,所述量子视觉处理模块包括n个依次连接的量子视觉MLP处理单元,当所述处理器执行一段计算机程序时,实现如下步骤:获取目标图像对应的图像块初始特征向量,将图像块初始化特征向量输入量子视觉MLP处理模块,以获得该目标图像的最终图像聚合特征和最终图像块特征;本发明提出的量子视觉MLP处理系统,一方面使得图像块的特征充分考虑了其语义内容,更利于图像块的聚合,另一方面,其包含了较少的归纳偏差,具有较高的适应性。

Description

一种量子视觉MLP处理系统及存储介质
技术领域
本发明涉及视觉任务处理领域,特别是涉及一种量子视觉MLP处理系统及存储介质。
背景技术
在计算机视觉中,卷积神经网络(CNNs)长期以来一直是主流的体系结构。最近的工作对Transformer模型提出了挑战,标准Transformer模型也可以很好地处理各种计算机视觉任务,如图像分类、目标检测和语义分割。考虑到视觉Transformer中自注意模块的高度复杂性,只堆叠多层感知器(MLPs)这种更简单的结构引起了人们的关注。
但是,视觉MLP体系结构的性能仍然不如SOTATransformer和CNN体系结构,其瓶颈之一在于其聚合不同tokens的方式,即使用全连接层的固定权重混合不同标记。现有的视觉MLP模型用固定的权重聚合不同的tokens,对来自不同输入图像的tokens使用相同的权重,忽略了不同tokens的语义信息差异,可能无法很好地对所有输入图像的tokens进行聚合,导致现有的视觉MLP体系结构对图像分类、目标检测和语义分割等各种视觉下游任务上表现不好。如何更好地表示tokens,以使得根据tokens新的表示进而提高如图片分类、图片情感分析、图片检索等下游任务的识别效果,是本领域技术人员需要解决的技术问题。
发明内容
针对上述技术问题,本发明采用的技术方案为:一种量子视觉MLP处理系统及存储介质,所述系统包括量子视觉处理模块、处理器和存储有一段计算机程序的存储器,其中,所述量子视觉处理模块包括n个依次连接的量子视觉MLP处理单元B1,B2,…,Bj,…,Bn,第j个量子视觉MLP处理单元Bj包括图像块特征提取MLP子单元Cj、图像块特征融合MLP子单元Tj和酉变换子单元UMj,j的取值范围是1到n,当所述处理器执行一段计算机程序时,实现如下步骤:
S100,获取目标图像对应的图像块初始特征向量A={A1,A2,…,Ar,…,As},Ar是目标图像中第r个图像块对应的图像块初始特征向量,r的取值范围是1到s,s是目标图像中图像块的数。
S200,将所述图像块初始特征向量A输入所述量子视觉处理模块,以获得该目标图像的最终图像聚合特征TF和最终图像块特征TO,其中,所述最终图像聚合特征TF为量子视觉MLP处理单元Bn输出的目标图像聚合特征Fρn,最终图像块特征TO为量子视觉MLP处理单元Bn输出的目标图像块特征向量On
其中,S200中,量子视觉MLP处理单元Bj执行如下步骤:
S210,获取与量子视觉MLP处理单元Bj连接的前一量子视觉MLP处理单元Bj-1输出的目标图像块特征向量Oj-1={Oj-1,1,Oj-1,2,…,Oj-1,r,…,Oj-1,s}和目标酉矩阵Uj-1,且,当j=1时,量子视觉MLP处理单元B1获取的目标图像块特征O0为图像块初始特征向量A,目标酉矩阵U0是随机初始化的一个酉矩阵;当j≠1时,Oj-1,r为Ar在量子视觉MLP处理单元Bj-1中相应输出的目标图像块特征向量。
S220,图像块特征提取MLP子单元Cj基于所述目标图像块特征向量Oj-1,获取第一图像块复数特征向量Zj={Zj1,Zj2,…,Zjr,…,Zjs},其中,Zjr为对应于Oj-1,r的第一图像块复数特征向量。
S230,图像块特征融合MLP子单元Tj基于第一图像块复数特征向量Zj,输出与所述量子视觉MLP处理单元Bj对应的目标图像块特征向量Oj={Oj1,Oj2,…,Ojr,…,Ojs}和中间图像聚合特征ρj,其中,Ojr是经所述图像块特征融合MLP子单元Tj处理得到的对应于Ar的目标图像块特征向量。
S240,酉矩阵子单元UMj基于中间图像聚合特征ρj和量子视觉MLP处理单元Bj-1输出的目标酉矩阵Uj-1,输出与所述量子视觉MLP处理单元Bj对应的目标酉矩阵Uj和目标图像聚合特征Fρj
本发明至少具有以下有益效果:本发明构建了量子视觉MLP处理系统,所述量子视觉MLP处理系统包括n个依次连接的量子视觉MLP处理单元,每个量子视觉MLP处理单元包括图像块特征提取MLP子单元、图像块特征融合MLP子单元和酉变换子单元,使用量子视觉MLP处理系统对目标图像进行处理,获取目标图像的最终图像聚合特征和最终图像块特征,每个视觉MLP处理单元接收上一个视觉MLP处理单元输出的目标图像块特征向量和目标酉矩阵,目标图像块特征向量通过图像块特征提取MLP子单元和图像块特征融合MLP子单元,输出该量子视觉MLP处理单元对应的目标图像块特征和中间图像聚合特征,中间图像聚合特征和目标酉矩阵输入到酉变换子单元,输出该量子视觉MLP处理单元对应的目标酉矩阵和目标图像聚合特征;本发明提出的量子视觉MLP处理系统,使用了channel-mixing的MLP和token-mixing的MLP两种类型的MLP块进行交替堆叠,使得量子视觉MLP处理系统包含较少的归纳偏差,本发明改进了图像块表示方式,并根据图像块的语义动态聚合,解决了现有技术中使用固定权重聚合不同图像块的问题,更加注重了不同图像块的语义信息差异,更好地聚合了图像块,具有应用于更多样化任务的潜力。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一实施例提供的一种量子视觉MLP处理系统及存储介质执行所述计算机程序时实现的方法流程图;
图2为本发明另一实施例提供的一种量子视觉MLP处理系统及存储介质执行所述计算机程序时实现的方法流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供了一种量子视觉MLP处理系统及存储介质,所述系统包括量子视觉处理模块、处理器和存储有一段计算机程序的存储器,其中,所述量子视觉处理模块包括n个依次连接的量子视觉MLP处理单元B1,B2,…,Bj,…,Bn,第j个量子视觉MLP处理单元Bj包括图像块特征提取MLP子单元Cj、图像块特征融合MLP子单元Tj和酉变换子单元UMj,j的取值范围是1到n,当所述处理器执行一段计算机程序时,如图1所示,实现如下步骤:
S100,获取目标图像对应的图像块初始特征向量A={A1,A2,…,Ar,…,As},Ar是目标图像中第r个图像块对应的图像块初始特征向量,r的取值范围是1到s,s是目标图像中图像块的数量。
具体地,S100中获取目标图像对应的图像块初始特征向量A包括:
S101,将目标图像划分为s个图像块。
S102,获取s个图像块对应的图像块初始特征向量A={A1,A2,…,Ar,…,As}。
具体地,图像块初始特征向量Ar可以通过Resent图像编码模型获取。
进一步地,本领域技术人员知晓,通过Resnet图像块初始特征向量Ar为非复数形式。
进一步地,本领域技术人员知晓,现有技术中任何一种获取图像块初始特征向量的方法均属于本发明保护范围。
S200,将所述图像块初始特征向量A输入所述量子视觉处理模块,以获得该目标图像的最终图像聚合特征TF和最终图像块特征TO,其中,所述最终图像聚合特征TF为量子视觉MLP处理单元Bn输出的目标图像聚合特征Fρn,最终图像块特征TO为量子视觉MLP处理单元Bn输出的目标图像块特征向量On
具体的,图2为本申请另一实施例公开的量子视觉MLP处理系统在执行计算机程序时实现的方法,如图2所示,S200中,量子视觉MLP处理单元Bj执行如下步骤:
S210,获取与量子视觉MLP处理单元Bj连接的前一量子视觉MLP处理单元Bj-1输出的目标图像块特征向量Oj-1={Oj-1,1,Oj-1,2,…,Oj-1,r,…,Oj-1,s}和目标酉矩阵Uj-1,且,当j=1时,量子视觉MLP处理单元B1获取的目标图像块特征O0为图像块初始特征向量A,目标酉矩阵U0是随机初始化的一个酉矩阵;当j≠1时,Oj-1,r为Ar在量子视觉MLP处理单元Bj-1中相应输出的目标图像块特征向量。
S220,图像块特征提取MLP子单元Cj基于所述目标图像块特征向量Oj-1,获取第一图像块复数特征向量Zj={Zj1,Zj2,…,Zjr,…,Zjs},其中,Zjr为对应于Oj-1,r的第一图像块复数特征向量。
具体地,S220包括如下步骤:
S221,获取第一图像块复数特征向量Zjr的振幅部分Z0jr=Channel-FC(Oj-1,r,Wc),其中,Channel-FC为channel-mixing的第一MLP,Wc为可训练参数。
具体地,第一图像块复数特征向量Zjr通过channel-mmixing的第一MLP获取,其中,channel-mixing的第一MLP由全连接层和激活函数组成,用于转换每个图像块的特征。
S222,获取第一图像块复数特征向量Zjr的相位部分θjr=Θ(Oj-1,r,Wθ),其中,估计模块Θ为channel-mixing的第二MLP,Wθ为可训练参数。
具体地,所述估计模块Θ用于获取每个图像块的特定属性。
S223,获取第一图像块复数特征向量Zjr=|Z0jr|cosθjr+i|Z0jr|sinθjr,其中,i为虚数单位。
具体地,振幅部分|Z0jr|表示目标图像第r个图像块的语义内容。
基于此,本申请将目标图像的图像块表示为了一个具有振幅和相位的波,使用了复数特征表示图像块,将目标图像表示为了复数特征表示的图像块的集合,并使用channel-mixing的第一MLP和第二MLP获取第一图像块复数特征向量的振幅部分和相位部分,因此本发明引入了复数特征表示目标图像的图像块。
S230,图像块特征融合MLP子单元Tj基于第一图像块复数特征向量Zj,输出与所述量子视觉MLP处理单元Bj对应的目标图像块特征向量Oj={Oj1,Oj2,…,Ojr,…,Ojs}和中间图像聚合特征ρj,其中,Ojr是经所述图像块特征融合MLP子单元Tj处理得到的对应于Ar的目标图像块特征向量。
具体地,S230包括如下步骤:
S231,构建量子概率系统Ψjr
Figure BDA0003991586920000051
其中,Wt j、Wi j为可训练参数。
具体地,
Figure BDA0003991586920000052
可以理解为,为了融合图像块间的相互作用包括振幅和相位特征,在本发明中将第一图像块复数特征向量看作是定义在向量空间的量子系统,本发明使用了一个token-mixing的MLP构建量子概率系统,token-mixing的MLP由全连接层和激活函数组成,用于聚合不同图像块的特征,在本发明中定义为Token-FC(Zjr,Wt j,Wi j),相位θjr根据图像块的语义内容确定。
S232,获取目标图像对应的中间图像聚合特征
Figure BDA0003991586920000053
具体地,所述中间图像聚合特征ρj表示为目标图像的聚合特征。
S233,基于中间图像聚合特征ρj,获取第一图像块复数特征向量Zjr对应于目标图像块特征向量Ojr,从而获取目标图像块特征向量Oj={Oj1,Oj2,…,Ojr,…,Ojs},其中,
Figure BDA0003991586920000054
量子测量算子
Figure BDA0003991586920000055
是对中间图像聚合特征ρj的归一化计算,Tr(·)为求迹运算。
基于此,本发明基于第一图像块复数特征向量组成量子概率系统,通过量子测量观测经特征融合后的目标图像块特征向量,图像块特征提取MLP子单元和图像块特征融合MLP子单元引入了不同图像块的语义内容,能很好地对所有目标图像的图像块进行动态聚合。
S240,酉矩阵子单元UMj基于中间图像聚合特征ρj和量子视觉MLP处理单元Bj-1输出的目标酉矩阵Uj-1,输出与所述量子视觉MLP处理单元Bj对应的目标酉矩阵Uj和目标图像聚合特征Fρj
具体地,S240包括以下步骤:
S241,获取与所述量子视觉MLP处理单元Bj对应的目标图像聚合特征
Figure BDA0003991586920000056
S242,获取与所述量子视觉MLP处理单元Bj对应的目标酉矩阵
Figure BDA0003991586920000061
具体地,目标酉矩阵Uj满足
Figure BDA0003991586920000062
其中,UH j是Uj的共轭转置矩阵,I是单位矩阵。
基于上述内容,酉变换子单元可以将低层的量子概率系统信息传到高层,同时了保留初始可观测量的信息分布,保留了低层的图像块聚合特征。
综上,本发明构建了量子视觉MLP处理系统,所述量子视觉MLP处理系统包括n个依次连接的量子视觉MLP处理单元,每个量子视觉MLP处理单元包括图像块特征提取MLP子单元、图像块特征融合MLP子单元和酉变换子单元,使用量子视觉MLP处理系统对目标图像进行处理,获取目标图像的最终图像聚合特征和最终图像块特征,每个视觉MLP处理单元接收上一个视觉MLP处理单元输出的目标图像块特征向量和目标酉矩阵,目标图像块特征向量通过图像块特征提取MLP子单元和图像块特征融合MLP子单元,输出该量子视觉MLP处理单元对应的目标图像块特征和中间图像聚合特征,中间图像聚合特征和目标酉矩阵输入到酉变换子单元,输出该量子视觉MLP处理单元对应的目标酉矩阵和目标图像聚合特征;本发明提出的量子视觉MLP处理系统,使用了channel-mixing的MLP和token-mixing的MLP两种类型的MLP块进行交替堆叠,使得量子视觉MLP处理系统包含较少的归纳偏差,本发明改进了图像块表示方式,并根据图像块的语义动态聚合,解决了现有技术中使用固定权重聚合不同图像块的问题,更加注重了不同图像块的语义信息差异,更好地聚合了图像块,具有应用于更多样化任务的潜力。
虽然已经通过示例对本发明的一些特定实施例进行了详细说明,但是本领域的技术人员应该理解,以上示例仅是为了进行说明,而不是为了限制本发明的范围。本领域的技术人员还应理解,可以对实施例进行多种修改而不脱离本发明的范围和精神。本发明开的范围由所附权利要求来限定。

Claims (8)

1.一种量子视觉MLP处理系统及存储介质,其特征在于,所述系统包括量子视觉处理模块、处理器和存储有一段计算机程序的存储器,其中,所述量子视觉处理模块包括n个依次连接的量子视觉MLP处理单元B1,B2,…,Bj,…,Bn,第j个量子视觉MLP处理单元Bj包括图像块特征提取MLP子单元Cj、图像块特征融合MLP子单元Tj和酉变换子单元UMj,j的取值范围是1到n,当所述处理器执行一段计算机程序时,实现如下步骤:
S100,获取目标图像对应的图像块初始特征向量A={A1,A2,…,Ar,…,As},Ar是目标图像中第r个图像块对应的图像块初始特征向量,r的取值范围是1到s,s是目标图像中图像块的数量;
S200,将所述图像块初始特征向量A输入所述量子视觉处理模块,以获得该目标图像的最终图像聚合特征TF和最终图像块特征TO,其中,所述最终图像聚合特征TF为量子视觉MLP处理单元Bn输出的目标图像聚合特征Fρn,所述最终图像块特征TO为量子视觉MLP处理单元Bn输出的目标图像块特征向量On
其中,S200中,量子视觉MLP处理单元Bj执行如下步骤:
S210,获取与量子视觉MLP处理单元Bj连接的前一量子视觉MLP处理单元Bj-1输出的目标图像块特征向量Oj-1={Oj-1,1,Oj-1,2,…,Oj-1,r,…,Oj-1,s}和目标酉矩阵Uj-1,且,当j=1时,量子视觉MLP处理单元B1获取的目标图像块特征O0为图像块初始特征向量A,目标酉矩阵U0是随机初始化的一个酉矩阵;当j≠1时,Oj-1,r为Ar在量子视觉MLP处理单元Bj-1中相应输出的目标图像块特征向量;
S220,图像块特征提取MLP子单元Cj基于所述目标图像块特征向量Oj-1,获取第一图像块复数特征向量Zj={Zj1,Zj2,…,Zjr,…,Zjs},其中,Zjr为对应于Oj-1,r的第一图像块复数特征向量;
S230,图像块特征融合MLP子单元Tj基于第一图像块复数特征向量Zj,输出与所述量子视觉MLP处理单元Bj对应的目标图像块特征向量Oj={Oj1,Oj2,…,Ojr,…,Ojs}和中间图像聚合特征ρj,其中,Ojr是经所述图像块特征融合MLP子单元Tj处理得到的对应于Ar的目标图像块特征向量;
S240,酉矩阵子单元UMj基于中间图像聚合特征ρj和量子视觉MLP处理单元Bj-1输出的目标酉矩阵Uj-1,输出与所述量子视觉MLP处理单元Bj对应的目标酉矩阵Uj和目标图像聚合特征Fρj
2.根据权利要求1所述的系统,其特征在于,S220包括如下步骤:
S221,获取第一图像块复数特征向量Zjr的振幅部分Z0jr=Channel-FC(Oj-1,r,Wc),其中,Channel-FC为channel-mixing的第一MLP,Wc为可训练参数;
S222,获取第一图像块复数特征向量Zjr的相位部分θjr=Θ(Oj-1,r,Wθ),其中,估计模块Θ为channel-mixing的第二MLP,Wθ为可训练参数;
S223,获取第一图像块复数特征向量Zjr=|Z0jr|cosθjr+i|Z0jr|sinθjr,其中,i为虚数单位。
3.根据权利要求1所述的系统,其特征在于,S230包括如下步骤:
S231,构建量子概率系统Ψjr
Figure FDA0003991586910000021
其中,Wt j、Wi j为可训练参数;
S232,获取目标图像对应的中间图像聚合特征
Figure FDA0003991586910000022
S233,基于中间图像聚合特征ρj,获取第一图像块复数特征向量Zjr对应于目标图像块特征向量Ojr,从而获取目标图像块特征向量Oj={Oj1,Oj2,…,Ojr,…,Ojs},其中,
Figure FDA0003991586910000023
Figure FDA0003991586910000024
是对中间图像聚合特征ρj的归一化计算,Tr(·)为求迹运算。
4.根据权利要求1所述的系统,其特征在于,S240具体包括:
S241,获取与所述量子视觉MLP处理单元Bj对应的目标图像聚合特征
Figure FDA0003991586910000025
S242,获取与所述量子视觉MLP处理单元Bj对应的目标酉矩阵
Figure FDA0003991586910000026
5.根据权利要求1所述的系统,其特征在于,S100中获取目标图像对应的图像块初始特征向量A包括:
S101,将目标图像划分为s个图像块;
S102,获取s个图像块对应的图像块初始特征向量A={A1,A2,…,Ar,…,As}。
6.根据权利要求1所述的系统,其特征在于,目标酉矩阵Uj满足:
Figure FDA0003991586910000027
其中,UH j是Uj的共轭转置矩阵,I是单位矩阵。
7.根据权利要求5所述的系统,其特征在于,图像块初始特征向量Ar通过Resent图像编码模型获取。
8.一种非瞬时性计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由处理器加载并执行以实现如权利要求1~7中任意一项。
CN202211583636.4A 2022-12-09 2022-12-09 一种量子视觉mlp处理系统及存储介质 Active CN115797715B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211583636.4A CN115797715B (zh) 2022-12-09 2022-12-09 一种量子视觉mlp处理系统及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211583636.4A CN115797715B (zh) 2022-12-09 2022-12-09 一种量子视觉mlp处理系统及存储介质

Publications (2)

Publication Number Publication Date
CN115797715A true CN115797715A (zh) 2023-03-14
CN115797715B CN115797715B (zh) 2023-06-23

Family

ID=85418428

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211583636.4A Active CN115797715B (zh) 2022-12-09 2022-12-09 一种量子视觉mlp处理系统及存储介质

Country Status (1)

Country Link
CN (1) CN115797715B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110704668A (zh) * 2019-09-23 2020-01-17 北京影谱科技股份有限公司 基于网格的协同注意力vqa方法和装置
US20210295133A1 (en) * 2016-09-07 2021-09-23 Robert Bosch Gmbh Model calculating unit and control unit for calculating a neural layer of a multilayer perceptron model
CN115293254A (zh) * 2022-07-29 2022-11-04 合肥本源量子计算科技有限责任公司 基于量子多层感知器的分类方法及相关设备
US20220375211A1 (en) * 2021-05-06 2022-11-24 Google Llc Multi-layer perceptron-based computer vision neural networks

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210295133A1 (en) * 2016-09-07 2021-09-23 Robert Bosch Gmbh Model calculating unit and control unit for calculating a neural layer of a multilayer perceptron model
CN110704668A (zh) * 2019-09-23 2020-01-17 北京影谱科技股份有限公司 基于网格的协同注意力vqa方法和装置
US20220375211A1 (en) * 2021-05-06 2022-11-24 Google Llc Multi-layer perceptron-based computer vision neural networks
CN115293254A (zh) * 2022-07-29 2022-11-04 合肥本源量子计算科技有限责任公司 基于量子多层感知器的分类方法及相关设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
YEHUI TANG等: "An Image Patch is aWave: Quantum Inspired Vision MLP", 《ARXIV:2111.12294V3 [CS.CV]》, pages 1 - 11 *
罗会兰等: "一种基于多级空间视觉词典集体的图像分类方法", 《电子学报》, vol. 43, no. 4, pages 684 - 693 *

Also Published As

Publication number Publication date
CN115797715B (zh) 2023-06-23

Similar Documents

Publication Publication Date Title
US20220180199A1 (en) Neural network model compression method and apparatus, storage medium, and chip
Sankaranarayanan et al. Generate to adapt: Aligning domains using generative adversarial networks
Zeng et al. Traffic sign recognition using kernel extreme learning machines with deep perceptual features
Passalis et al. Training lightweight deep convolutional neural networks using bag-of-features pooling
US9633282B2 (en) Cross-trained convolutional neural networks using multimodal images
Donahue et al. Decaf: A deep convolutional activation feature for generic visual recognition
Tommasi et al. Frustratingly easy nbnn domain adaptation
CN109063719B (zh) 一种联合结构相似性和类信息的图像分类方法
Huang et al. Multiple features learning for ship classification in optical imagery
US20170091530A1 (en) Media content enrichment using an adapted object detector
Zuo et al. Challenging tough samples in unsupervised domain adaptation
Kumagai et al. Unsupervised domain adaptation by matching distributions based on the maximum mean discrepancy via unilateral transformations
Ye et al. Heterogeneous few-shot model rectification with semantic mapping
US20230245351A1 (en) Image style conversion method and apparatus, electronic device, and storage medium
Abdulnabi et al. Multimodal recurrent neural networks with information transfer layers for indoor scene labeling
Bai et al. Generic object recognition with local receptive fields based extreme learning machine
Cheng Riemannian similarity learning
CN115937655A (zh) 多阶特征交互的目标检测模型及其构建方法、装置及应用
Zhang et al. Cousin network guided sketch recognition via latent attribute warehouse
Wu et al. Improving domain-specific classification by collaborative learning with adaptation networks
CN115482141A (zh) 图像处理方法、装置、电子设备和存储介质
He et al. CORL: compositional representation learning for few-shot classification
US20240112318A1 (en) Artificial intelligence architectures for determining image authenticity
Papa et al. A survey on efficient vision transformers: algorithms, techniques, and performance benchmarking
Henry et al. Pix2Pix GAN for image-to-image Translation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant