CN111368941A - 一种图像处理方法、装置以及计算机存储介质 - Google Patents

一种图像处理方法、装置以及计算机存储介质 Download PDF

Info

Publication number
CN111368941A
CN111368941A CN202010281134.0A CN202010281134A CN111368941A CN 111368941 A CN111368941 A CN 111368941A CN 202010281134 A CN202010281134 A CN 202010281134A CN 111368941 A CN111368941 A CN 111368941A
Authority
CN
China
Prior art keywords
convolution model
model
convolution
time
space
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010281134.0A
Other languages
English (en)
Other versions
CN111368941B (zh
Inventor
赵雷
殷俊
潘华东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Dahua Technology Co Ltd
Original Assignee
Zhejiang Dahua Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Dahua Technology Co Ltd filed Critical Zhejiang Dahua Technology Co Ltd
Priority to CN202010281134.0A priority Critical patent/CN111368941B/zh
Publication of CN111368941A publication Critical patent/CN111368941A/zh
Application granted granted Critical
Publication of CN111368941B publication Critical patent/CN111368941B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/15Correlation function computation including computation of convolution operations
    • G06F17/153Multidimensional correlation or convolution
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Algebra (AREA)
  • Evolutionary Biology (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本申请公开了一种图像处理方法、装置及存储介质。该方法包括:获取待模拟的3D卷积模型及训练数据;将3D卷积模型分解为3D空间卷积模型和3D时间卷积模型的级联,获得伪3D级联卷积模型;用训练数据训练伪3D级联卷积模型,获取3D空间卷积模型和3D时间卷积模型的参数;将3D空间卷积模型和3D时间卷积模型转化为2D空间卷积模型和2D时间卷积模型;为2D空间卷积模型和2D时间卷积模型设置特征重排规则;将3D空间卷积模型和3D时间卷积模型的模型参数映射成2D空间卷积模型和2D时间卷积模型的参数,获得2D级联卷积模型;利用2D空间卷积模型和2D时间卷积模型对图像进行卷积运算。通过上述方式,本申请能够通过2D卷积模型实现利用3D卷积运算进行的图像处理。

Description

一种图像处理方法、装置以及计算机存储介质
技术领域
本申请涉及视频分析技术领域,特别是涉及一种图像处理方法、装置以及计算机存储介质。
背景技术
卷积神经网络(Convolutional Neural Networks,CNN)是一类包含卷积计算且具有深度结构的前馈神经网络(Feedforward Neural Networks),是深度学习(deeplearning)的代表算法之一。卷积神经网络具有表征学习(representation learning)能力,能够按其阶层结构对输入信息进行平移不变分类(shift-invariantclassification),因此也被称为“平移不变人工神经网络(Shift-Invariant ArtificialNeural Networks,SIANN)”。
对卷积神经网络的研究始于二十世纪80至90年代,时间延迟网络和LeNet-5是最早出现的卷积神经网络;在二十一世纪后,随着深度学习理论的提出和数值计算设备的改进,卷积神经网络得到了快速发展,并被应用于计算机视觉、自然语言处理等领域。
其中,一维卷积主要用于对只有一个维度的序列提取特征,比如信号、股价、天气、文本以及自然语言处理领域。2D卷积可以提取单张静态图像的静态空间特征,然后同神经网络结合完成图像的分类、检测等计算机视觉方面的任务。3D卷积能提取视频及多帧图像在时间和空间上的信息。
发明内容
本申请主要解决的技术问题是提供一种图像处理方法,能够解决现有技术中利用3D卷积模型实现的图像处理技术无法通过2D卷积模型实现的问题。
为解决上述技术问题,本申请采用的一个技术方案是:提供一种图像处理方法,具体步骤包括:获取待模拟的3D卷积模型以及训练数据;将所述3D卷积模型分解为3D空间卷积模型和3D时间卷积模型的级联,以获得伪3D级联卷积模型;利用所述训练数据训练所述伪3D级联卷积模型,以获取所述3D空间卷积模型和3D时间卷积模型的模型参数;将所述3D空间卷积模型和3D时间卷积模型转化2D空间卷积模型和2D时间卷积模型;为所述2D空间卷积模型和2D时间卷积模型设置相应的特征重排规则;将所述3D空间卷积模型和3D时间卷积模型的模型参数映射成所述2D空间卷积模型和2D时间卷积模型的模型参数,以获得2D级联卷积模型;利用所述2D空间卷积模型和2D时间卷积模型对图像进行卷积运算。
本申请的有益效果是:区别于现有技术的情况,本申请将3D卷积模型分解为伪3D卷积模型的级联,再将伪3D卷积模型的级联转化为2D卷积模型,其中,2D卷积模型的参数为3D卷积模型参数映射得到,再利用特征重排,可以将利用3D卷积实现的图像处理的方法通过2D卷积模拟实现。
附图说明
图1是本申请3D卷积模型一般实现方法一实施例的示意框图;
图2是本申请2D卷积模型一般实现方法一实施例的示意图;
图3是本申请图像处理方法一实施例的流程示意图;
图4是本申请图像处理方法应用分组卷积一实施例的示意图;
图5是本申请图像处理装置一实施例的示意框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请中的术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。此外,术语“包括”和“具有”以及他们任何形变,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解是,本文所描述的实施例可以与其他实施例结合。
参阅图1和图2,图1为3D卷积模型一般实现方法一实施例的示意图,图2为2D卷积模型一般实现方法一实施例的示意图。图1所示的3D卷积模型的卷积核为k1×k2×k3,输入特征为F∈RB×C×T×H×W,经3D卷积模型进行卷积运算后,输出特征为F′∈RB×C′×T′×H′×W′。其中,B表示样本数特征,C表示通道特征、T表示时间特征,H、W分别表示图像或视频帧的高、宽。图2所示的2D卷积模型的卷积核为k4×k5,输入特征为F∈RB×C×H×W,经3D卷积模型进行卷积运算后,输出特征为F′∈RB×C′×H′×W′
本实施例提供一种图像处理方法,具体请参阅图3,图3为本申请图像处理方法一实施例的流程示意图。具体步骤包括:
S100,获取待模拟的3D卷积模型以及训练数据。
本实施例中,以图1所示的3D卷积模型为例,待模拟的3D卷积模型的卷积核的大小为k1×k2×k3,其中,k1为时间深度,k2为高度尺寸,k3为宽度尺寸。在此步骤中,为了获得较好的训练结果,除了获取训练数据外,还要获取负样本数据。
S200,将3D卷积模型分解为3D空间卷积模型和3D时间卷积模型的级联,以获得伪3D级联卷积模型。
分解得到的3D空间卷积模型的卷积核为1×k2×k3,3D时间卷积模型的卷积核为k1×1×1。在由3D空间卷积模型和3D时间卷积模型组成的伪3D级联卷积模型中,3D空间卷积模型的输出特征作为3D时间卷积模型的输入特征。
S300,利用训练数据训练伪3D级联卷积模型,以获取3D空间卷积模型和3D时间卷积模型的模型参数。
S400,将3D空间卷积模型和3D时间卷积模型转化2D空间卷积模型和2D时间卷积模型。
为了实现彻底将3D卷积模型转化为2D卷积模型,需要将3D空间卷积模型转化为2D空间卷积模型,首先需将3D时间卷积模型转化为2D时间卷积模型,其中,2D空间卷积模型的卷积核的大小为k2×k3,2D时间卷积模型的卷积核的大小为k1×1。
S500,将3D空间卷积模型和3D时间卷积模型的模型参数映射成2D空间卷积模型和2D时间卷积模型的模型参数,以获得2D级联卷积模型。
此步骤中,将步骤S300中训练所得的3D空间卷积模型和3D时间卷积模型的模型参数映射到2D空间卷积模型和2D时间卷积模型中,以作为2D空间卷积模型的模型参数和2D时间卷积模型的参数。
具体地,2D空间卷积模型可以是GROUP=T的分组卷积模型,其卷积核为k2×k3,其中需要将3D空间卷积模型的模型参数在输入通道维度上复制T份,并取消时间维度,例如,3D空间卷积模型的模型参数是维度为C×C′×1×k2×k3的张量,将3D空间卷积模型的模型参数在输入通道维度C上复制T份,再取消第三维度,得到2D空间卷积模型的模型参数,2D空间卷积模型的模型参数是维度为TC×C′×k2×k3的张量。其中,T为3D卷积模型所对应的输入特征的时间深度。
参阅图4,图4为本申请图像处理方法应用分组卷积一实施例的示意图,图中(a)表示输入的视频或图像信息,(c)表示将输入的时间深度为T的视频或图像信息分为T组分别进行卷积运算。如此一来,可将输入的时间深度为T的视频或图像进行T组的分组卷积运算。
可选地,将3D时间卷积模型的模型参数直接复用为2D时间卷积模型的模型参数。
S600,为2D空间卷积模型和2D时间卷积模型设置相应的特征重排规则。
3D卷积模型所需的输入特征为五维输入特征,例如,图1所示的五维输入特征为F∈RB×C×T×H×W,经过3D卷积运算后,得到输出特征为F′∈RB×C′×T′×H′×W′。而2D卷积模型所需的输入特征为四维输入特征,若直接将五维输入特征输入2D卷积模型,则会超出2D卷积模型的计算能力,造成无法处理的情况,因此,需要为2D空间卷积模型和2D时间卷积模型设置相应的特征重排规则,将五维输入特征进行特征重排。
具体地,设置第一特征重排规则,以将3D卷积模型所对应的输入特征的通道维度和时间维度进行交换,并将交换后的输入特征的时间维度和通道维度进行合并,以作为2D空间卷积模型的输入特征。
输入特征F∈RB×C×T×H×W依照上述第一特征重排规则进行维度重排的维度变化如下:
B×C×T×H×W→B×T×C×H×W→B×TC×H×W,
重排后得到2D空间卷积模型的输入特征的维度为B×TC×H×W,经过2D空间卷积模型的卷积计算后,得到2D空间卷积模型的输出特征的维度为B×TC′×H′×W′,经2D空间卷积模型的卷积计算得到的输出特征可表示为RB×TC′×H′×W′
上述2D空间卷积模型忽略了时间特征,时间特征的提取需要通过2D时间卷积模型来实现,而2D时间卷积模型的卷积计算需要在时间维度上滑动进行,因此,需对2D空间卷积模型的输出特征RB×TC′×H′×W′进行特征重排。
具体地,设置第二特征重排规则,以将2D空间卷积模型的输出特征的合并的时间维度和通道维度进行拆分,将2D空间卷积模型的输出特征的高度维度和宽度维度进行合并,并2D空间卷积模型的输出特征拆分后的时间维度和通道维度进行交换,以作为2D时间卷积模型的输入特征。经第二特征重排规则对输出特征RB×TC×H×W的维度重排。
经2D空间卷积模型的卷积计算得到的输出特征RB×TC′×H′×W,依照上述第二特征重排规则进行特征重排的维度变化如下:
B×TC′×H′×W′→B×T×C′×H′×W′→B×T×C′×H′W′→B×C′×T×H′W′。
重排后得到2D时间卷积模型的输入特征的维度为B×C′×T×H′W′,经过2D时间卷积模型的卷积计算后,得到2D时间卷积模型的输出特征的维度为B×C′×T′×H′W′,经2D时间卷积模型的卷积计算得到的输出特征可表示为RB×C′×T′×H′W′
卷积计算结束之前,经2D时间卷积模型的卷积计算得到的输出特征RB×C′×T′×H′W′还不是最终的输出结果,输出特征RB×C′×T′×H′W′需返回2D空间卷积模型继续进行卷积计算,因此经2D时间卷积模型的卷积计算得到的输出特征RB×C′×T′×H′W′需进行特征重排。
具体地,设置第三特征重排规则,以将2D时间卷积模型的输出特征的通道维度和时间维度进行交换,将2D空间卷积模型的输出特征的合并的高度维度和宽度维度进行拆分,并2D空间卷积模型的输出特征交换后的时间维度和通道维度进行合并,以作为2D级联卷积模型的输出特征。
经2D空间卷积模型的卷积计算得到的输出特征RB×C′×T′×H′W′,依照上述第三特征重排规则进行特征重排的维度变化如下:
B×C′×T′×H′W′→B×T′×C′×H′W′→B×T′×C′×H′×W′→B×T′C′×H′×W′。
经2D空间卷积模型的卷积计算得到的输出特征RB×C′×T′×H′W′经第三重排规则的特征重排后,得到的特征的维度为B×T′C′×H′×W′,得到的特征RB×T′C′×H′×W′就可以输入2D空间卷积模型进行卷积计算。
S700,利用所述2D空间卷积模型和2D时间卷积模型对图像进行卷积运算;
经过上述步骤S100-S600,可以实现将3D卷积运算通过2D卷积来模拟实现,可以实现对多帧图像或视频的卷积运算,以实现图像分类、动作识别等。
请参阅图5,图5是本申请图像处理装置一实施例的电路结构示意框图。如图5所示,图像处理装置包括相互耦接的处理器11和存储器12。存储器12中存储有计算机程序,处理器11用于执行计算机程序以实现如上述本申请图像处理方法实施例的步骤。
关于处理执行的各步骤的描述请参照上述本申请图像处理方法实施例的各步骤的描述,在此不再赘述。
在本申请的各实施例中,所揭露的图像处理方法和图像处理装置,可以通过其它的方式实现。例如,以上所描述的图像处理装置的各实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施方式方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本申请各个实施方式所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本申请的实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

Claims (9)

1.一种图像处理方法,其特征在于,所述方法包括:
获取待模拟的3D卷积模型以及训练数据;
将所述3D卷积模型分解为3D空间卷积模型和3D时间卷积模型的级联,以获得伪3D级联卷积模型;
利用所述训练数据训练所述伪3D级联卷积模型,以获取所述3D空间卷积模型和3D时间卷积模型的模型参数;
将所述3D空间卷积模型和3D时间卷积模型转化为2D空间卷积模型和2D时间卷积模型;
将所述3D空间卷积模型和3D时间卷积模型的模型参数映射成所述2D空间卷积模型和2D时间卷积模型的模型参数,以获得2D级联卷积模型;
为所述2D空间卷积模型和2D时间卷积模型设置相应的特征重排规则;
利用所述2D空间卷积模型和2D时间卷积模型对图像进行卷积运算。
2.根据权利要求1所述的方法,其特征在于,所述3D卷积模型的卷积核的大小为k1×k2×k3
所述将所述3D卷积模型分解为3D空间卷积模型和3D时间卷积模型的级联的步骤包括:
将所述3D空间卷积模型和3D时间卷积模型的卷积核的大小分别设置为1×k2×k3和k1×1×1;
所述将所述3D空间卷积模型和3D时间卷积模型转化2D空间卷积模型和2D时间卷积模型的步骤包括:
所述2D空间卷积模型和2D时间卷积模型的卷积核的大小分别设置为k2×k3和k1×1;
其中,k1为时间深度,k2和k3为高度尺寸和宽度尺寸。
3.根据权利要求1所述的方法,其特征在于,所述为所述2D空间卷积模型和2D时间卷积模型设置相应的特征重排规则的步骤包括:
设置第一特征重排规则,以将所述3D卷积模型所对应的输入特征的通道维度和时间维度进行交换,并将交换后的所述输入特征的时间维度和通道维度进行合并,以作为所述2D空间卷积模型的输入特征。
4.根据权利要求3所述的方法,其特征在于,所述为所述2D空间卷积模型和2D时间卷积模型设置相应的特征重排规则的步骤进一步包括:
设置第二特征重排规则,以将所述2D空间卷积模型的输出特征的合并的时间维度和通道维度进行拆分,将所述2D空间卷积模型的输出特征的高度维度和宽度维度进行合并,并所述2D空间卷积模型的输出特征拆分后的时间维度和通道维度进行交换,以作为所述2D时间卷积模型的输入特征。
5.根据权利要求4所述的方法,其特征在于,所述为所述2D空间卷积模型和2D时间卷积模型设置相应的特征重排规则的步骤进一步包括:
设置第三特征重排规则,以将所述2D时间卷积模型的输出特征的通道维度和时间维度进行交换,将所述2D空间卷积模型的输出特征的合并的高度维度和宽度维度进行拆分,并所述2D空间卷积模型的输出特征交换后的时间维度和通道维度进行合并,以作为所述2D级联卷积模型的输出特征。
6.根据权利要求1所述的方法,其特征在于,所述将所述3D空间卷积模型和3D时间卷积模型的模型参数映射成所述2D空间卷积模型和2D时间卷积模型的模型参数的步骤包括:
将所述3D空间卷积模型的模型参数在输入通道维度上复制T份,并取消时间维度,以作为所述2D空间卷积模型的模型参数,T为所述3D卷积模型所对应的输入特征的时间深度。
7.根据权利要求6所述的方法,其特征在于,所述将所述3D空间卷积模型和3D时间卷积模型的模型参数映射成所述2D空间卷积模型和2D时间卷积模型的模型参数的步骤包括:
将所述3D时间卷积模型的模型参数直接复用为所述2D时间卷积模型的模型参数。
8.一种图像处理装置,其特征在于,所述装置包括处理器和存储器;所述存储器中存储有计算机程序,所述处理器用于执行所述计算机程序以实现如权利要求1-7中任一项所述方法的步骤。
9.一种计算机存储介质,其特征在于,所述计算机存储介质存储有计算机程序,所述计算机程序被执行时实现如权利要求1-7中任一项所述方法的步骤。
CN202010281134.0A 2020-04-10 2020-04-10 一种图像处理方法、装置以及计算机存储介质 Active CN111368941B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010281134.0A CN111368941B (zh) 2020-04-10 2020-04-10 一种图像处理方法、装置以及计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010281134.0A CN111368941B (zh) 2020-04-10 2020-04-10 一种图像处理方法、装置以及计算机存储介质

Publications (2)

Publication Number Publication Date
CN111368941A true CN111368941A (zh) 2020-07-03
CN111368941B CN111368941B (zh) 2023-09-01

Family

ID=71212058

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010281134.0A Active CN111368941B (zh) 2020-04-10 2020-04-10 一种图像处理方法、装置以及计算机存储介质

Country Status (1)

Country Link
CN (1) CN111368941B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113468980A (zh) * 2021-06-11 2021-10-01 浙江大华技术股份有限公司 一种人体行为识别方法及相关装置
GB2599098A (en) * 2020-09-22 2022-03-30 Imagination Tech Ltd Hardware implementation of windowed operations in three or more dimensions

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106504190A (zh) * 2016-12-29 2017-03-15 浙江工商大学 一种基于3d卷积神经网络的立体视频生成方法
WO2018210796A1 (en) * 2017-05-15 2018-11-22 Deepmind Technologies Limited Neural network systems for action recognition in videos
CN109063666A (zh) * 2018-08-14 2018-12-21 电子科技大学 基于深度可分离卷积的轻量化人脸识别方法及系统
CN109583576A (zh) * 2018-12-17 2019-04-05 上海联影智能医疗科技有限公司 一种医学图像处理装置及方法
US20190114511A1 (en) * 2017-10-16 2019-04-18 Illumina, Inc. Deep Learning-Based Techniques for Training Deep Convolutional Neural Networks
CN109766949A (zh) * 2019-01-17 2019-05-17 北京海印博识智能科技有限公司 卷积神经网络轻量化方法、装置及电子设备
WO2019128475A1 (zh) * 2017-12-29 2019-07-04 中兴通讯股份有限公司 数据训练方法及装置、存储介质、电子装置
WO2019184657A1 (zh) * 2018-03-30 2019-10-03 腾讯科技(深圳)有限公司 图像识别方法、装置、电子设备及存储介质
CN110399789A (zh) * 2019-06-14 2019-11-01 佳都新太科技股份有限公司 行人重识别方法、模型构建方法、装置、设备和存储介质
WO2019214381A1 (zh) * 2018-05-09 2019-11-14 腾讯科技(深圳)有限公司 一种视频去模糊方法、装置、存储介质和电子装置
WO2020024585A1 (zh) * 2018-08-03 2020-02-06 华为技术有限公司 一种训练物体检测模型的方法、装置以及设备
CN110796162A (zh) * 2019-09-18 2020-02-14 平安科技(深圳)有限公司 图像识别、训练识别模型的方法、相关设备及存储介质

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106504190A (zh) * 2016-12-29 2017-03-15 浙江工商大学 一种基于3d卷积神经网络的立体视频生成方法
WO2018210796A1 (en) * 2017-05-15 2018-11-22 Deepmind Technologies Limited Neural network systems for action recognition in videos
US20190114511A1 (en) * 2017-10-16 2019-04-18 Illumina, Inc. Deep Learning-Based Techniques for Training Deep Convolutional Neural Networks
WO2019128475A1 (zh) * 2017-12-29 2019-07-04 中兴通讯股份有限公司 数据训练方法及装置、存储介质、电子装置
WO2019184657A1 (zh) * 2018-03-30 2019-10-03 腾讯科技(深圳)有限公司 图像识别方法、装置、电子设备及存储介质
WO2019214381A1 (zh) * 2018-05-09 2019-11-14 腾讯科技(深圳)有限公司 一种视频去模糊方法、装置、存储介质和电子装置
WO2020024585A1 (zh) * 2018-08-03 2020-02-06 华为技术有限公司 一种训练物体检测模型的方法、装置以及设备
CN109063666A (zh) * 2018-08-14 2018-12-21 电子科技大学 基于深度可分离卷积的轻量化人脸识别方法及系统
CN109583576A (zh) * 2018-12-17 2019-04-05 上海联影智能医疗科技有限公司 一种医学图像处理装置及方法
CN109766949A (zh) * 2019-01-17 2019-05-17 北京海印博识智能科技有限公司 卷积神经网络轻量化方法、装置及电子设备
CN110399789A (zh) * 2019-06-14 2019-11-01 佳都新太科技股份有限公司 行人重识别方法、模型构建方法、装置、设备和存储介质
CN110796162A (zh) * 2019-09-18 2020-02-14 平安科技(深圳)有限公司 图像识别、训练识别模型的方法、相关设备及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
周衍挺;: "基于改进的多通道卷积神经网络模型的图像分类方法", 佳木斯大学学报(自然科学版), no. 06 *
薛继光: "基于时空域深度神经网络的视频烟雾检测研究" *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2599098A (en) * 2020-09-22 2022-03-30 Imagination Tech Ltd Hardware implementation of windowed operations in three or more dimensions
GB2599098B (en) * 2020-09-22 2024-04-10 Imagination Tech Ltd Hardware implementation of windowed operations in three or more dimensions
CN113468980A (zh) * 2021-06-11 2021-10-01 浙江大华技术股份有限公司 一种人体行为识别方法及相关装置
CN113468980B (zh) * 2021-06-11 2024-05-31 浙江大华技术股份有限公司 一种人体行为识别方法及相关装置

Also Published As

Publication number Publication date
CN111368941B (zh) 2023-09-01

Similar Documents

Publication Publication Date Title
DE102019130702A1 (de) Stilbasierte architektur für generative neuronale netzwerke
CN110020639B (zh) 视频特征提取方法及相关设备
CN109508717A (zh) 一种车牌识别方法、识别装置、识别设备及可读存储介质
Jahid et al. Image analysis by Meixner moments and a digital filter
CN111382867A (zh) 神经网络压缩的方法、数据处理的方法及相关装置
CN111340077B (zh) 基于注意力机制的视差图获取方法和装置
EP4290448A1 (en) Image generation model training method, generation method, apparatus, and device
WO2020143513A1 (zh) 一种超分辨率图像的重构方法、装置及设备
CN108334810B (zh) 视线追踪设备中确定参数的方法和装置
CN111539290A (zh) 视频动作识别方法、装置、电子设备及存储介质
CN112487207A (zh) 图像的多标签分类方法、装置、计算机设备及存储介质
CN111368941A (zh) 一种图像处理方法、装置以及计算机存储介质
US20200327709A1 (en) System and method for rendering an image
JP7418578B2 (ja) マイクロ構造マスクを用いたマルチスケールファクタ画像の超解像
CN114897136A (zh) 多尺度注意力机制方法及模块和图像处理方法及装置
CN115393231B (zh) 一种缺陷图像的生成方法、装置、电子设备和存储介质
CN113096001A (zh) 图像处理方法、电子设备及可读存储介质
CN104008383B (zh) 基于流形学习线性化的高光谱图像特征提取方法
Bende et al. VISMA: A Machine Learning Approach to Image Manipulation
JP7479507B2 (ja) 画像処理方法及び装置、コンピューター機器、並びにコンピュータープログラム
CN110956599A (zh) 图片处理方法和装置、存储介质及电子装置
CN114494021A (zh) 图像重建方法、装置、电子设备及存储介质
CN112785498B (zh) 一种基于深度学习的病理图像超分建模方法
CN114611667A (zh) 一种基于小规模参数矩阵计算特征图边界的重构方法
CN113962221A (zh) 一种文本摘要的提取方法、装置、终端设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant