CN109685058A - 一种图像目标识别方法、装置及计算机设备 - Google Patents

一种图像目标识别方法、装置及计算机设备 Download PDF

Info

Publication number
CN109685058A
CN109685058A CN201710969721.7A CN201710969721A CN109685058A CN 109685058 A CN109685058 A CN 109685058A CN 201710969721 A CN201710969721 A CN 201710969721A CN 109685058 A CN109685058 A CN 109685058A
Authority
CN
China
Prior art keywords
sequence
image
convolution
obtains
longitudinal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710969721.7A
Other languages
English (en)
Other versions
CN109685058B (zh
Inventor
程战战
钮毅
罗兵华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Hikvision Digital Technology Co Ltd
Original Assignee
Hangzhou Hikvision Digital Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Hikvision Digital Technology Co Ltd filed Critical Hangzhou Hikvision Digital Technology Co Ltd
Priority to CN201710969721.7A priority Critical patent/CN109685058B/zh
Priority to EP18867472.5A priority patent/EP3699818A4/en
Priority to PCT/CN2018/108301 priority patent/WO2019076188A1/zh
Priority to US16/756,427 priority patent/US11347977B2/en
Publication of CN109685058A publication Critical patent/CN109685058A/zh
Application granted granted Critical
Publication of CN109685058B publication Critical patent/CN109685058B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/72Data preparation, e.g. statistical preprocessing of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/80Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
    • G06V10/806Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/63Scene text, e.g. street names
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/1801Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections
    • G06V30/18019Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections by matching or filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Multimedia (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明实施例提供了一种图像目标识别方法、装置及计算机设备,其中,图像目标识别方法包括:分别沿图像的水平视角方向和垂直视角方向进行特征提取,相应得到图像的横向特征序列和纵向特征序列;将横向特征序列及纵向特征序列进行融合,得到融合特征;利用预设激活函数,对融合特征进行激活,得到图像特征;通过对图像特征进行解码,识别图像中的目标。通过本方案可以提高目标识别的效率。

Description

一种图像目标识别方法、装置及计算机设备
技术领域
本发明涉及机器视觉技术领域,特别是涉及一种图像目标识别方法、装置及计算机设备。
背景技术
图像目标识别主要是指在给定的图像上定位识别出预先指定的目标。在图像处理领域,主要通过如下三种方法进行目标识别:模板匹配法、特征点匹配法和深度学习的方法。但是,在实际目标识别场景中,存在很多倾斜、旋转、弯曲的目标,上述三种方法均是基于预先指定的目标的特征信息进行目标识别,该指定的目标的特征信息往往限定为具有固定姿态的目标的特征信息,如果图像中的目标发生倾斜或者变形,利用上述三种方法则无法识别出准确的目标。
针对上述问题,相应的提出了能识别多角度目标的图像检测方法,在进行目标识别之前,利用角度辨识器判断图像的角度,然后基于该角度,利用目标分类器生成装置生成针对该角度的目标分类器,最后,应用目标分类器从图像中识别指定的目标。
但是,如果一个图像中有多个目标的角度发生倾斜,则需要分别针对每个倾斜角度生成目标分类器,并且,需要对每个目标的角度预先进行判断,如果串行运行会导致运行速率较慢,如果并行运行则需要处理器具有高效的处理能力,因此,上述方法的目标识别的效率较低。
发明内容
本发明实施例的目的在于提供一种图像目标识别方法、装置及计算机设备,以提高目标识别的效率。具体技术方案如下:
第一方面,本发明实施例提供了一种图像目标识别方法,所述方法包括:
分别沿图像的水平视角方向和垂直视角方向进行特征提取,相应得到所述图像的横向特征序列和纵向特征序列;
将所述横向特征序列及所述纵向特征序列进行融合,得到融合特征;
利用预设激活函数,对所述融合特征进行激活,得到图像特征;
通过对所述图像特征进行解码,识别所述图像中的目标。
可选的,所述分别沿图像的水平视角方向和垂直视角方向进行特征提取,相应得到所述图像的横向特征序列和纵向特征序列,包括:
沿图像的水平视角方向,对所述图像的每个行向量分别进行卷积操作,得到第一卷积结果;将所述第一卷积结果确定为横向特征序列;
沿所述图像的垂直视角方向,对所述图像的每个列向量分别进行卷积操作,得到第二卷积结果;将所述第二卷积结果确定为纵向特征序列。
可选的,在所述将所述横向特征序列及所述纵向特征序列进行融合,得到融合特征之前,所述方法还包括:
基于所述横向特征序列及所述纵向特征序列,对所述图像进行卷积操作,提取用于表示所述横向特征序列及所述纵向特征序列分别在图像形变中所占权值的形变参数;
所述将所述横向特征序列及所述纵向特征序列进行融合,得到融合特征,包括:
根据所述形变参数,以加权和的方式,将所述横向特征序列及所述纵向特征序列进行融合,得到融合特征。
可选的,所述分别沿图像的水平视角方向和垂直视角方向进行特征提取,相应得到所述图像的横向特征序列和纵向特征序列,包括:
沿图像的水平视角方向,对所述图像的每个行向量分别进行卷积操作,得到第一卷积结果;
将所述第一卷积结果中的行向量进行反向排列,得到第一反向序列;
将所述第一卷积结果及所述第一反向序列确定为横向特征序列;
沿图像的垂直视角方向,对所述图像的每个列向量分别进行卷积操作,得到第二卷积结果;
将所述第二卷积结果中的列向量进行反向排列,得到第二反向序列;
将所述第二卷积结果及所述第二反向序列确定为纵向特征序列。
可选的,在所述将所述横向特征序列及所述纵向特征序列进行融合,得到融合特征之前,所述方法还包括:
基于所述横向特征序列中的第一卷积结果、第一反向序列,以及所述纵向特征序列中的第二卷积结果、第二反向序列,对所述图像进行卷积操作,提取用于表示所述第一卷积结果、所述第一反向序列、所述第二卷积结果及所述第二反向序列分别在图像形变中所占权值的形变参数;
所述将所述横向特征序列及所述纵向特征序列进行融合,得到融合特征,包括:
根据所述形变参数,以加权和的方式,将所述第一卷积结果、所述第一反向序列、所述第二卷积结果及所述第二反向序列进行融合,得到融合特征。
可选的,所述将所述横向特征序列及所述纵向特征序列进行融合,得到融合特征,包括:
以拼接融合的方式,将所述横向特征序列及所述纵向特征序列进行融合,得到融合特征。
第二方面,本发明实施例提供了一种图像目标识别装置,所述装置包括:
特征提取模块,用于分别沿图像的水平视角方向和垂直视角方向进行特征提取,相应得到所述图像的横向特征序列和纵向特征序列;
融合模块,用于将所述横向特征序列及所述纵向特征序列进行融合,得到融合特征;
激活模块,用于利用预设激活函数,对所述融合特征进行激活,得到图像特征;
解码模块,用于通过对所述图像特征进行解码,识别所述图像中的目标。
可选的,所述特征提取模块,具体用于:
沿图像的水平视角方向,对所述图像的每个行向量分别进行卷积操作,得到第一卷积结果;将所述第一卷积结果确定为横向特征序列;
沿所述图像的垂直视角方向,对所述图像的每个列向量分别进行卷积操作,得到第二卷积结果;将所述第二卷积结果确定为纵向特征序列。
可选的,所述装置还包括:
第一形变参数提取模块,用于基于所述横向特征序列及所述纵向特征序列,对所述图像进行卷积操作,提取用于表示所述横向特征序列及所述纵向特征序列分别在图像形变中所占权值的形变参数;
所述融合模块,具体用于:
根据所述形变参数,以加权和的方式,将所述横向特征序列及所述纵向特征序列进行融合,得到融合特征。
可选的,所述特征提取模块,具体用于:
沿图像的水平视角方向,对所述图像的每个行向量分别进行卷积操作,得到第一卷积结果;
将所述第一卷积结果中的行向量进行反向排列,得到第一反向序列;
将所述第一卷积结果及所述第一反向序列确定为横向特征序列;
沿图像的垂直视角方向,对所述图像的每个列向量分别进行卷积操作,得到第二卷积结果;
将所述第二卷积结果中的列向量进行反向排列,得到第二反向序列;
将所述第二卷积结果及所述第二反向序列确定为纵向特征序列。
可选的,所述装置还包括:
第二形变参数提取模块,用于基于所述横向特征序列中的第一卷积结果、第一反向序列,以及所述纵向特征序列中的第二卷积结果、第二反向序列,对所述图像进行卷积操作,提取用于表示所述第一卷积结果、所述第一反向序列、所述第二卷积结果及所述第二反向序列分别在图像形变中所占权值的形变参数;
所述融合模块,具体用于:
根据所述形变参数,以加权和的方式,将所述第一卷积结果、所述第一反向序列、所述第二卷积结果及所述第二反向序列进行融合,得到融合特征。
可选的,所述融合模块,具体用于:
以拼接融合的方式,将所述横向特征序列及所述纵向特征序列进行融合,得到融合特征。
第三方面,本发明实施例提供了一种计算机设备,包括处理器、通信接口、存储器和通信总线,其中,所述处理器,所述通信接口,所述存储器通过所述通信总线完成相互间的通信;
所述存储器,用于存放计算机程序;
所述处理器,用于执行所述存储器上所存放的程序时,实现如第一方面所述的方法步骤。
本发明实施例提供的一种图像目标识别方法、装置及计算机设备,基于沿图像的水平视角方向和垂直视角方向分别进行特征提取,能够得到图像的横向特征序列和纵向特征序列,然后将横向特征序列和纵向特征序列进行融合,得到融合特征,最后,通过对融合特征进行激活后得到的图像特征进行解码,识别图像中的目标。针对发生倾斜的目标,目标在不同视角方向上的分量不同,因此,通过沿不同视角进行特征提取,然后经过特征融合的方式,得到目标在各视角下的完整的特征信息,再利用预设激活函数,将融合特征进行激活,得到能够与模板匹配的图像特征,最后通过解码即可识别目标,此方法无需提前对发生倾斜的目标进行角度判断,也就不需要针对不同角度的目标生成各种目标分类器,简化了目标识别的实现步骤,在保证目标识别的准确率的基础上,提高了目标识别的效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为现实的目标识别场景中目标发生倾斜的示意图;
图2为本发明实施例的图像目标识别方法的一种流程示意图;
图3a为本发明实施例的图像横向卷积示意图;
图3b为本发明实施例的图像纵向卷积示意图;
图4为本发明实施例的图像目标识别方法的另一种流程示意图;
图5为本发明实施例的目标识别示例图;
图6为本发明实施例的图像目标识别装置的一种结构示意图;
图7为本发明实施例的图像目标识别装置的另一种结构示意图;
图8为本发明实施例的图像目标识别装置的再一种结构示意图;
图9为本发明实施例的计算机设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在现实的目标识别场景中,存在很多倾斜、旋转、透视及弯曲的目标,例如倒置的文字等,如图1所示。传统的目标识别方法受限于模板的固定,无法准确识别出发生倾斜、旋转、透视或者弯曲的目标。因此,为了能够准确识别出上述目标,并且提高目标识别的效率,本发明实施例提供了一种图像目标识别方法、装置及计算机设备。下面,首先对本发明实施例所提供的图像目标识别方法进行介绍。
本发明实施例所提供的一种图像目标识别方法的执行主体可以为具有图像识别功能的计算机设备,也可以为具有图像识别功能的摄像机,执行主体中至少包括具有数据处理能力的核心处理芯片,其中,核心处理芯片可以为DSP(Digital Signal Processor,数字信号处理器)、ARM(Advanced Reduced Instruction Set Computer Machines,精简指令集计算机微处理器)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)等核心处理芯片中的任一种。实现本发明实施例所提供的一种图像目标识别方法的方式可以为设置于执行主体中的软件、硬件电路和逻辑电路的至少一种方式。
如图2所示,为本发明实施例所提供的一种图像目标识别方法,该图像目标识别方法可以包括如下步骤:
S201,分别沿图像的水平视角方向和垂直视角方向进行特征提取,相应得到图像的横向特征序列和纵向特征序列。
对于一图像,可以沿两个视角方向分别进行特征提取,即分别沿图像的水平视角方向和垂直视角方向进行特征提取。沿图像的水平视角方向进行特征提取的方式,可以为对图像的每个行向量分别进行卷积操作,可以称之为横向卷积,如图3a所示;沿图像的垂直视角方向进行特征提取的方式,可以为对图像的每个列向量分别进行卷积操作,可以称之为纵向卷积,如图3b所示。当然,特征提取的方式还可以为其他特征提取的方式,保证沿图像的水平视角方向,对图像的每个行向量进行特征提取,沿图像的垂直视角方向,对图像的每个列向量进行特征提取即可。为了能够进一步提高处理效率,沿两个视角方向分别进行特征提取可以是并行执行的。通过特征提取,相应地可以得到图像的横向特征序列和纵向特征序列。其中,横向特征序列为列数等效为1的特征序列,纵向特征序列为行数等效为1的特征序列,在这里,列数或者行数等效为1,并不表示列数或者行数一定等于1,仅表示可以作为一个整体的数据进行处理。
S202,将横向特征序列及纵向特征序列进行融合,得到融合特征。
由于横向特征序列及纵向特征序列是图像在不同视角下的特征集合,对图像中的目标进行识别,需要图像完整的特征信息,因此,需要对横向特征序列及纵向特征序列进行融合,得到的融合特征具有图像完整的特征信息。特征融合可以是通过拼接融合Concat的方式,将横向特征序列和纵向特征序列直接拼接到一起,得到融合特征;也可以是通过特征点叠加Eltwise Add的方式,将对应的特征值相加,得到融合特征;还可以是基于用于表示横向特征序列和纵向特征序列的形变程度的权值,通过加权和的方式,得到融合特征。当然这三种特征融合的方式只是举例说明,特征融合的方式不仅限于此,其他特征融合的方式均属于本发明实施例的保护范围,这里不再一一赘述。
S203,利用预设激活函数,对融合特征进行激活,得到图像特征。
通过融合得到的融合特征可以体现图像完整的特征信息,但是,同一个目标的特征往往较为分散,需要将融合特征通过预设激活函数把各目标的特征保留并映射出来,得到图像特征,所得到的图像特征可以与模板匹配。其中,预设激活函数可以为非线性激活函数中的双曲线tanh函数、S型生长曲线Sigmoid函数、修正线性单元ReLU函数等,也可以为其他类别的激活函数,这里不再一一列举。
S204,通过对图像特征进行解码,识别图像中的目标。
在通过激活得到图像特征后,可以通过后接解码器,对图像特征进行解码,针对不同的目标可以采用不同的解码器,例如,需要识别的指定目标为文字,则可以选择Attention解码器。当然,也可以选择常规的目标分类器,通过置信度对目标的类别进行识别。
应用本实施例,基于沿图像的水平视角方向和垂直视角方向分别进行特征提取,能够得到图像的横向特征序列和纵向特征序列,然后将横向特征序列和纵向特征序列进行融合,得到融合特征,最后,通过对融合特征进行激活后得到的图像特征进行解码,识别图像中的目标。针对发生倾斜的目标,目标在不同视角方向上的分量不同,因此,通过沿不同视角进行特征提取,然后经过特征融合的方式,得到目标在各视角下的完整的特征信息,再利用预设激活函数,将融合特征进行激活,得到能够与模板匹配的图像特征,最后通过解码即可识别目标,此方法无需提前对发生倾斜的目标进行角度判断,也就不需要针对不同角度的目标生成各种目标分类器,简化了目标识别的实现步骤,在保证目标识别的准确率的基础上,提高了目标识别的效率。
基于图2所示实施例,本发明实施例还提供了另一种图像目标识别方法,如图4所示,该图像目标识别方法包括如下步骤:
S401,分别沿图像的水平视角方向和垂直视角方向进行特征提取,相应得到图像的横向特征序列和纵向特征序列。
本实施例中,为了提高特征提取的效率,采用卷积运算,沿图像的水平视角方向,对图像的每个行向量分别进行卷积操作,得到第一卷积结果,并将第一卷积结果确定为横向特征序列;沿图像的垂直视角方向,对图像的每个列向量分别进行卷积操作,得到第二卷积结果,并将第二卷积结果确定为纵向特征序列。也就是说,横向特征序列中仅包含对图像的每个行向量分别进行卷积操作得到的卷积结果,纵向特征序列中仅包括对图像的每个列向量分别进行卷积操作得到的卷积结果。
S402,基于横向特征序列及纵向特征序列,对图像进行卷积操作,提取用于表示横向特征序列及纵向特征序列分别在图像形变中所占权值的形变参数。
针对得到的横向特征序列和纵向特征序列,特征序列的长度、参数等属性,说明了该视角方向的特征所占比重,即该视角方向的特征序列在图像形变中所占权值,通过对图像进行横纵卷积操作,可以提取到各视角方向对应的权值。
S403,根据形变参数,以加权和的方式,将横向特征序列及纵向特征序列进行融合,得到融合特征。
在得到形变参数之后,形变参数表示了各视角方向的特征序列在图像形变中所占比重,则可以通过加权和的方式,将不同视角方向对应的特征序列进行融合,融合后得到的融合特征可以反映各视角方向的形变程度。例如,通过特征提取,得到的横向特征序列为v、纵向特征序列为h,通过卷积操作得到的形变参数为(0.6,0.4),则融合特征中每个特征值为0.6×vij+0.4×hij
S404,利用预设激活函数,对融合特征进行激活,得到图像特征。
S405,通过对图像特征进行解码,识别图像中的目标。
本实施例中S404、S405与图2所示实施例中的S203、S204相同,这里不再赘述。
应用本实施例,基于沿图像的水平视角方向和垂直视角方向分别进行特征提取,能够得到图像的横向特征序列和纵向特征序列,然后将横向特征序列和纵向特征序列进行融合,得到融合特征,最后,通过对融合特征进行激活后得到的图像特征进行解码,识别图像中的目标。针对发生倾斜的目标,目标在不同视角方向上的分量不同,因此,通过沿不同视角进行特征提取,然后经过特征融合的方式,得到目标在各视角下的完整的特征信息,再利用预设激活函数,将融合特征进行激活,得到能够与模板匹配的图像特征,最后通过解码即可识别目标,此方法无需提前对发生倾斜的目标进行角度判断,也就不需要针对不同角度的目标生成各种目标分类器,简化了目标识别的实现步骤,在保证目标识别的准确率的基础上,提高了目标识别的效率。并且,通过对横向特征序列和纵向特征序列进行卷积操作,得到用于表示横向特征序列及纵向特征序列分别在图像形变中所占权值的形变参数,通过加权和的方式进行特征融合,使得融合特征可以更真实的反映目标在不同视角方向的形变程度,可以进一步提高目标识别的准确性。
为了保证目标识别的高准确性,本发明实施例还可以在沿图像水平视角方向对图像的每个行向量分别进行卷积操作得到第一卷积结果之后,再将第一卷积结果中的行向量进行反向排列得到第一反向序列,在沿图像垂直视角方向对图像的每个列向量分别进行卷积操作得到第二卷积结果之后,再将第二卷积结果中的列向量进行反向排列得到第二反向序列。然后,将第一卷积结果和第一反向序列确定为横向特征序列、将第二卷积结果和第二反向序列确定为纵向特征序列。横向特征序列和纵向特征序列中,通过卷积结果的正向排列和反向排列,可以更为直观的表示目标的倾斜情况。下面,结合具体实例,对该实施例进行介绍。
如图5所示,为本发明实施例的目标识别示例图。
第一步,沿图像的水平视角方向,对图像的每个行向量分别进行横向卷积,得到第一卷积结果,如图5中所示,第一卷积结果为将第一卷积结果中的行向量进行反向排列,得到第一反向序列将第一卷积结果及第一反向序列确定为横向特征序列。
第二步,沿图像的垂直视角方向,对图像的每个列向量分别进行卷积操作,得到第二卷积结果,如图5中所示,第二卷积结果为将第二卷积结果中的列向量进行反向排列,得到第二反向序列将第二卷积结果及第二反向序列确定为纵向特征序列。
第三步,基于横向特征序列中的第一卷积结果、第一反向序列,以及纵向特征序列中的第二卷积结果、第二反向序列,对图像进行卷积操作,提取用于表示第一卷积结果、第一反向序列、第二卷积结果及第二反向序列分别在图像形变中所占权值的形变参数α:(α1122)T
第四步,根据形变参数,以加权和的方式,通过公式(1),将第一卷积结果、第一反向序列、第二卷积结果及第二反向序列进行融合,得到n×1的融合特征
第五步,利用预设的双曲线激活函数,通过公式(2),对融合特征进行激活,得到图像特征h。
第六步,通过对图像特征进行解码,识别图像中的目标。
通过本方案,针对发生倾斜的目标,目标在不同视角方向上的分量不同,因此,通过沿不同视角进行特征提取,然后经过特征融合的方式,得到目标在各视角下的完整的特征信息,再利用预设激活函数,将融合特征进行激活,得到能够与模板匹配的图像特征,最后通过解码即可识别目标,此方法无需提前对发生倾斜的目标进行角度判断,也就不需要针对不同角度的目标生成各种目标分类器,简化了目标识别的实现步骤,在保证目标识别的准确率的基础上,提高了目标识别的效率。并且,横向特征序列和纵向特征序列中,通过卷积结果的正向排列和反向排列,可以更为直观的表示目标的倾斜情况,通过对横向特征序列和纵向特征序列进行卷积操作,得到用于表示横向特征序列及纵向特征序列分别在图像形变中所占权值的形变参数,通过加权和的方式进行特征融合,使得融合特征可以更真实的反映目标在不同视角方向的形变程度,可以进一步提高目标识别的准确性。
相应于上述方法实施例,本发明实施例提供了一种图像目标识别装置,如图6所示,该图像目标识别装置可以包括:
特征提取模块610,用于分别沿图像的水平视角方向和垂直视角方向进行特征提取,相应得到所述图像的横向特征序列和纵向特征序列;
融合模块620,用于将所述横向特征序列及所述纵向特征序列进行融合,得到融合特征;
激活模块630,用于利用预设激活函数,对所述融合特征进行激活,得到图像特征;
解码模块640,用于通过对所述图像特征进行解码,识别所述图像中的目标。
应用本实施例,基于沿图像的水平视角方向和垂直视角方向分别进行特征提取,能够得到图像的横向特征序列和纵向特征序列,然后将横向特征序列和纵向特征序列进行融合,得到融合特征,最后,通过对融合特征进行激活后得到的图像特征进行解码,识别图像中的目标。针对发生倾斜的目标,目标在不同视角方向上的分量不同,因此,通过沿不同视角进行特征提取,然后经过特征融合的方式,得到目标在各视角下的完整的特征信息,再利用预设激活函数,将融合特征进行激活,得到能够与模板匹配的图像特征,最后通过解码即可识别目标,此方法无需提前对发生倾斜的目标进行角度判断,也就不需要针对不同角度的目标生成各种目标分类器,简化了目标识别的实现步骤,在保证目标识别的准确率的基础上,提高了目标识别的效率。
可选的,所述融合模块620,具体可以用于:
以拼接融合的方式,将所述横向特征序列及所述纵向特征序列进行融合,得到融合特征。
本发明实施例的图像目标识别装置为应用如图2所示实施例的图像目标识别方法的装置,则图2所示实施例的图像目标识别方法的所有实施例均适用于该图像目标识别装置,且均能达到相同或相似的有益效果。
基于图6所示实施例,本发明实施例提供了另一种图像目标识别装置,如图7所示,该图像目标识别装置包括:
特征提取模块710,用于沿图像的水平视角方向,对所述图像的每个行向量分别进行卷积操作,得到第一卷积结果;将所述第一卷积结果确定为横向特征序列;沿所述图像的垂直视角方向,对所述图像的每个列向量分别进行卷积操作,得到第二卷积结果;将所述第二卷积结果确定为纵向特征序列;
第一形变参数提取模块720,用于基于所述横向特征序列及所述纵向特征序列,对所述图像进行卷积操作,提取用于表示所述横向特征序列及所述纵向特征序列分别在图像形变中所占权值的形变参数;
融合模块730,用于根据所述形变参数,以加权和的方式,将所述横向特征序列及所述纵向特征序列进行融合,得到融合特征;
激活模块740,用于利用预设激活函数,对所述融合特征进行激活,得到图像特征;
解码模块750,用于通过对所述图像特征进行解码,识别所述图像中的目标。
应用本实施例,基于沿图像的水平视角方向和垂直视角方向分别进行特征提取,能够得到图像的横向特征序列和纵向特征序列,然后将横向特征序列和纵向特征序列进行融合,得到融合特征,最后,通过对融合特征进行激活后得到的图像特征进行解码,识别图像中的目标。针对发生倾斜的目标,目标在不同视角方向上的分量不同,因此,通过沿不同视角进行特征提取,然后经过特征融合的方式,得到目标在各视角下的完整的特征信息,再利用预设激活函数,将融合特征进行激活,得到能够与模板匹配的图像特征,最后通过解码即可识别目标,此方法无需提前对发生倾斜的目标进行角度判断,也就不需要针对不同角度的目标生成各种目标分类器,简化了目标识别的实现步骤,在保证目标识别的准确率的基础上,提高了目标识别的效率。并且,通过对横向特征序列和纵向特征序列进行卷积操作,得到用于表示横向特征序列及纵向特征序列分别在图像形变中所占权值的形变参数,通过加权和的方式进行特征融合,使得融合特征可以更真实的反映目标在不同视角方向的形变程度,可以进一步提高目标识别的准确性。
基于图6所示实施例,本发明实施例提供了另一种图像目标识别装置,如图8所示,该图像目标识别装置包括:
特征提取模块810,用于沿图像的水平视角方向,对所述图像的每个行向量分别进行卷积操作,得到第一卷积结果;将所述第一卷积结果中的行向量进行反向排列,得到第一反向序列;将所述第一卷积结果及所述第一反向序列确定为横向特征序列;沿图像的垂直视角方向,对所述图像的每个列向量分别进行卷积操作,得到第二卷积结果;将所述第二卷积结果中的列向量进行反向排列,得到第二反向序列;将所述第二卷积结果及所述第二反向序列确定为纵向特征序列;
第二形变参数提取模块820,用于基于所述横向特征序列中的第一卷积结果、第一反向序列,以及所述纵向特征序列中的第二卷积结果、第二反向序列,对所述图像进行卷积操作,提取用于表示所述第一卷积结果、所述第一反向序列、所述第二卷积结果及所述第二反向序列分别在图像形变中所占权值的形变参数;
融合模块830,用于根据所述形变参数,以加权和的方式,将所述第一卷积结果、所述第一反向序列、所述第二卷积结果及所述第二反向序列进行融合,得到融合特征;
激活模块840,用于利用预设激活函数,对所述融合特征进行激活,得到图像特征;
解码模块850,用于通过对所述图像特征进行解码,识别所述图像中的目标。
应用本实施例,针对发生倾斜的目标,目标在不同视角方向上的分量不同,因此,通过沿不同视角进行特征提取,然后经过特征融合的方式,得到目标在各视角下的完整的特征信息,再利用预设激活函数,将融合特征进行激活,得到能够与模板匹配的图像特征,最后通过解码即可识别目标,此方法无需提前对发生倾斜的目标进行角度判断,也就不需要针对不同角度的目标生成各种目标分类器,简化了目标识别的实现步骤,在保证目标识别的准确率的基础上,提高了目标识别的效率。并且,横向特征序列和纵向特征序列中,通过卷积结果的正向排列和反向排列,可以更为直观的表示目标的倾斜情况,通过对横向特征序列和纵向特征序列进行卷积操作,得到用于表示横向特征序列及纵向特征序列分别在图像形变中所占权值的形变参数,通过加权和的方式进行特征融合,使得融合特征可以更真实的反映目标在不同视角方向的形变程度,可以进一步提高目标识别的准确性。
本发明实施例还提供了一种计算机设备,如图9所示,包括处理器901、通信接口902、存储器903和通信总线904,其中,处理器901,通信接口902,存储器903通过通信总线904完成相互间的通信,
存储器903,用于存放计算机程序;
处理器901,用于执行存储器903上所存放的程序时,实现如下步骤:
分别沿图像的水平视角方向和垂直视角方向进行特征提取,相应得到所述图像的横向特征序列和纵向特征序列;
将所述横向特征序列及所述纵向特征序列进行融合,得到融合特征;
利用预设激活函数,对所述融合特征进行激活,得到图像特征;
通过对所述图像特征进行解码,识别所述图像中的目标。
处理器901在实现所述分别沿图像的水平视角方向和垂直视角方向进行特征提取,相应得到所述图像的横向特征序列和纵向特征序列的步骤中,具体可以实现:
沿图像的水平视角方向,对所述图像的每个行向量分别进行卷积操作,得到第一卷积结果;将所述第一卷积结果确定为横向特征序列;
沿所述图像的垂直视角方向,对所述图像的每个列向量分别进行卷积操作,得到第二卷积结果;将所述第二卷积结果确定为纵向特征序列。
处理器901还可以实现:
基于所述横向特征序列及所述纵向特征序列,对所述图像进行卷积操作,提取用于表示所述横向特征序列及所述纵向特征序列分别在图像形变中所占权值的形变参数;
处理器901在实现所述将所述横向特征序列及所述纵向特征序列进行融合,得到融合特征的步骤中,具体可以实现:
根据所述形变参数,以加权和的方式,将所述横向特征序列及所述纵向特征序列进行融合,得到融合特征。
处理器901在实现所述分别沿图像的水平视角方向和垂直视角方向进行特征提取,相应得到所述图像的横向特征序列和纵向特征序列的步骤中,具体可以实现:
沿图像的水平视角方向,对所述图像的每个行向量分别进行卷积操作,得到第一卷积结果;
将所述第一卷积结果中的行向量进行反向排列,得到第一反向序列;
将所述第一卷积结果及所述第一反向序列确定为横向特征序列;
沿图像的垂直视角方向,对所述图像的每个列向量分别进行卷积操作,得到第二卷积结果;
将所述第二卷积结果中的列向量进行反向排列,得到第二反向序列;
将所述第二卷积结果及所述第二反向序列确定为纵向特征序列。
处理器901还可以实现:
基于所述横向特征序列中的第一卷积结果、第一反向序列,以及所述纵向特征序列中的第二卷积结果、第二反向序列,对所述图像进行卷积操作,提取用于表示所述第一卷积结果、所述第一反向序列、所述第二卷积结果及所述第二反向序列分别在图像形变中所占权值的形变参数;
处理器901在实现所述将所述横向特征序列及所述纵向特征序列进行融合,得到融合特征的步骤中,具体可以实现:
根据所述形变参数,以加权和的方式,将所述第一卷积结果、所述第一反向序列、所述第二卷积结果及所述第二反向序列进行融合,得到融合特征。
处理器901在实现所述将所述横向特征序列及所述纵向特征序列进行融合,得到融合特征的步骤中,具体还可以实现:
以拼接融合的方式,将所述横向特征序列及所述纵向特征序列进行融合,得到融合特征。
上述计算机设备提到的通信总线可以是PCI(Peripheral ComponentInterconnect,外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture,扩展工业标准结构)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括RAM(Random Access Memory,随机存取存储器),也可以包括NVM(Non-Volatile Memory,非易失性存储器),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括CPU(Central Processing Unit,中央处理器)、NP(Network Processor,网络处理器)等;还可以是DSP(Digital Signal Processing,数字信号处理器)、ASIC(Application Specific Integrated Circuit,专用集成电路)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
本实施例中,该计算机设备的处理器通过读取存储器中存储的计算机程序,并通过运行该计算机程序,能够实现:针对发生倾斜的目标,目标在不同视角方向上的分量不同,因此,通过沿不同视角进行特征提取,然后经过特征融合的方式,得到目标在各视角下的完整的特征信息,再利用预设激活函数,将融合特征进行激活,得到能够与模板匹配的图像特征,最后通过解码即可识别目标,此方法无需提前对发生倾斜的目标进行角度判断,也就不需要针对不同角度的目标生成各种目标分类器,简化了目标识别的实现步骤,在保证目标识别的准确率的基础上,提高了目标识别的效率。
另外,相应于上述实施例所提供的图像目标识别方法,本发明实施例提供了一种计算机可读存储介质,用于存储计算机程序,所述计算机程序被处理器执行时,实现如上述图像目标识别方法实施例的步骤。
本实施例中,计算机可读存储介质存储有在运行时执行本申请实施例所提供的图像目标识别方法的应用程序,因此能够实现:针对发生倾斜的目标,目标在不同视角方向上的分量不同,因此,通过沿不同视角进行特征提取,然后经过特征融合的方式,得到目标在各视角下的完整的特征信息,再利用预设激活函数,将融合特征进行激活,得到能够与模板匹配的图像特征,最后通过解码即可识别目标,此方法无需提前对发生倾斜的目标进行角度判断,也就不需要针对不同角度的目标生成各种目标分类器,简化了目标识别的实现步骤,在保证目标识别的准确率的基础上,提高了目标识别的效率。
对于计算机设备以及计算机可读存储介质实施例而言,由于其所涉及的方法内容基本相似于前述的方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (13)

1.一种图像目标识别方法,其特征在于,所述方法包括:
分别沿图像的水平视角方向和垂直视角方向进行特征提取,相应得到所述图像的横向特征序列和纵向特征序列;
将所述横向特征序列及所述纵向特征序列进行融合,得到融合特征;
利用预设激活函数,对所述融合特征进行激活,得到图像特征;
通过对所述图像特征进行解码,识别所述图像中的目标。
2.根据权利要求1所述的方法,其特征在于,所述分别沿图像的水平视角方向和垂直视角方向进行特征提取,相应得到所述图像的横向特征序列和纵向特征序列,包括:
沿图像的水平视角方向,对所述图像的每个行向量分别进行卷积操作,得到第一卷积结果;将所述第一卷积结果确定为横向特征序列;
沿所述图像的垂直视角方向,对所述图像的每个列向量分别进行卷积操作,得到第二卷积结果;将所述第二卷积结果确定为纵向特征序列。
3.根据权利要求2所述的方法,其特征在于,在所述将所述横向特征序列及所述纵向特征序列进行融合,得到融合特征之前,所述方法还包括:
基于所述横向特征序列及所述纵向特征序列,对所述图像进行卷积操作,提取用于表示所述横向特征序列及所述纵向特征序列分别在图像形变中所占权值的形变参数;
所述将所述横向特征序列及所述纵向特征序列进行融合,得到融合特征,包括:
根据所述形变参数,以加权和的方式,将所述横向特征序列及所述纵向特征序列进行融合,得到融合特征。
4.根据权利要求1所述的方法,其特征在于,所述分别沿图像的水平视角方向和垂直视角方向进行特征提取,相应得到所述图像的横向特征序列和纵向特征序列,包括:
沿图像的水平视角方向,对所述图像的每个行向量分别进行卷积操作,得到第一卷积结果;
将所述第一卷积结果中的行向量进行反向排列,得到第一反向序列;
将所述第一卷积结果及所述第一反向序列确定为横向特征序列;
沿图像的垂直视角方向,对所述图像的每个列向量分别进行卷积操作,得到第二卷积结果;
将所述第二卷积结果中的列向量进行反向排列,得到第二反向序列;
将所述第二卷积结果及所述第二反向序列确定为纵向特征序列。
5.根据权利要求4所述的方法,其特征在于,在所述将所述横向特征序列及所述纵向特征序列进行融合,得到融合特征之前,所述方法还包括:
基于所述横向特征序列中的第一卷积结果、第一反向序列,以及所述纵向特征序列中的第二卷积结果、第二反向序列,对所述图像进行卷积操作,提取用于表示所述第一卷积结果、所述第一反向序列、所述第二卷积结果及所述第二反向序列分别在图像形变中所占权值的形变参数;
所述将所述横向特征序列及所述纵向特征序列进行融合,得到融合特征,包括:
根据所述形变参数,以加权和的方式,将所述第一卷积结果、所述第一反向序列、所述第二卷积结果及所述第二反向序列进行融合,得到融合特征。
6.根据权利要求1所述的方法,其特征在于,所述将所述横向特征序列及所述纵向特征序列进行融合,得到融合特征,包括:
以拼接融合的方式,将所述横向特征序列及所述纵向特征序列进行融合,得到融合特征。
7.一种图像目标识别装置,其特征在于,所述装置包括:
特征提取模块,用于分别沿图像的水平视角方向和垂直视角方向进行特征提取,相应得到所述图像的横向特征序列和纵向特征序列;
融合模块,用于将所述横向特征序列及所述纵向特征序列进行融合,得到融合特征;
激活模块,用于利用预设激活函数,对所述融合特征进行激活,得到图像特征;
解码模块,用于通过对所述图像特征进行解码,识别所述图像中的目标。
8.根据权利要求7所述的装置,其特征在于,所述特征提取模块,具体用于:
沿图像的水平视角方向,对所述图像的每个行向量分别进行卷积操作,得到第一卷积结果;将所述第一卷积结果确定为横向特征序列;
沿所述图像的垂直视角方向,对所述图像的每个列向量分别进行卷积操作,得到第二卷积结果;将所述第二卷积结果确定为纵向特征序列。
9.根据权利要求8所述的装置,其特征在于,所述装置还包括:
第一形变参数提取模块,用于基于所述横向特征序列及所述纵向特征序列,对所述图像进行卷积操作,提取用于表示所述横向特征序列及所述纵向特征序列分别在图像形变中所占权值的形变参数;
所述融合模块,具体用于:
根据所述形变参数,以加权和的方式,将所述横向特征序列及所述纵向特征序列进行融合,得到融合特征。
10.根据权利要求7所述的装置,其特征在于,所述特征提取模块,具体用于:
沿图像的水平视角方向,对所述图像的每个行向量分别进行卷积操作,得到第一卷积结果;
将所述第一卷积结果中的行向量进行反向排列,得到第一反向序列;
将所述第一卷积结果及所述第一反向序列确定为横向特征序列;
沿图像的垂直视角方向,对所述图像的每个列向量分别进行卷积操作,得到第二卷积结果;
将所述第二卷积结果中的列向量进行反向排列,得到第二反向序列;
将所述第二卷积结果及所述第二反向序列确定为纵向特征序列。
11.根据权利要求10所述的装置,其特征在于,所述装置还包括:
第二形变参数提取模块,用于基于所述横向特征序列中的第一卷积结果、第一反向序列,以及所述纵向特征序列中的第二卷积结果、第二反向序列,对所述图像进行卷积操作,提取用于表示所述第一卷积结果、所述第一反向序列、所述第二卷积结果及所述第二反向序列分别在图像形变中所占权值的形变参数;
所述融合模块,具体用于:
根据所述形变参数,以加权和的方式,将所述第一卷积结果、所述第一反向序列、所述第二卷积结果及所述第二反向序列进行融合,得到融合特征。
12.根据权利要求7所述的装置,其特征在于,所述融合模块,具体用于:
以拼接融合的方式,将所述横向特征序列及所述纵向特征序列进行融合,得到融合特征。
13.一种计算机设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,所述处理器,所述通信接口,所述存储器通过所述通信总线完成相互间的通信;
所述存储器,用于存放计算机程序;
所述处理器,用于执行所述存储器上所存放的程序时,实现权利要求1-6任一所述的方法步骤。
CN201710969721.7A 2017-10-18 2017-10-18 一种图像目标识别方法、装置及计算机设备 Active CN109685058B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201710969721.7A CN109685058B (zh) 2017-10-18 2017-10-18 一种图像目标识别方法、装置及计算机设备
EP18867472.5A EP3699818A4 (en) 2017-10-18 2018-09-28 PROCESS FOR RECOGNIZING IMAGE OBJECT, APPARATUS, AND COMPUTER DEVICE
PCT/CN2018/108301 WO2019076188A1 (zh) 2017-10-18 2018-09-28 一种图像目标识别方法、装置及计算机设备
US16/756,427 US11347977B2 (en) 2017-10-18 2018-09-28 Lateral and longitudinal feature based image object recognition method, computer device, and non-transitory computer readable storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710969721.7A CN109685058B (zh) 2017-10-18 2017-10-18 一种图像目标识别方法、装置及计算机设备

Publications (2)

Publication Number Publication Date
CN109685058A true CN109685058A (zh) 2019-04-26
CN109685058B CN109685058B (zh) 2021-07-09

Family

ID=66173116

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710969721.7A Active CN109685058B (zh) 2017-10-18 2017-10-18 一种图像目标识别方法、装置及计算机设备

Country Status (4)

Country Link
US (1) US11347977B2 (zh)
EP (1) EP3699818A4 (zh)
CN (1) CN109685058B (zh)
WO (1) WO2019076188A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110197206A (zh) * 2019-05-10 2019-09-03 杭州深睿博联科技有限公司 图像处理的方法及装置

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111291627B (zh) * 2020-01-16 2024-04-19 广州酷狗计算机科技有限公司 人脸识别方法、装置及计算机设备
CN113221709B (zh) * 2021-04-30 2022-11-25 芜湖美的厨卫电器制造有限公司 用于识别用户运动的方法、装置及热水器
TWI815782B (zh) * 2022-11-27 2023-09-11 互動細胞股份有限公司 擴增實境影像識別的組合方法

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103903238A (zh) * 2014-03-21 2014-07-02 西安理工大学 图像特征的显著结构和相关结构融合方法
CN104091348A (zh) * 2014-05-19 2014-10-08 南京工程学院 融合显著特征和分块模板的多目标跟踪方法
WO2014183259A1 (zh) * 2013-05-14 2014-11-20 中国科学院自动化研究所 一种全色−多光谱遥感图像融合方法
CN104268833A (zh) * 2014-09-15 2015-01-07 江南大学 基于平移不变剪切波变换的图像融合新方法
CN104978561A (zh) * 2015-03-25 2015-10-14 浙江理工大学 融合梯度和光流特征的视频动作行为识别方法
CN105740876A (zh) * 2014-12-10 2016-07-06 阿里巴巴集团控股有限公司 一种图像预处理方法及装置
CN105893947A (zh) * 2016-03-29 2016-08-24 江南大学 基于多局部相关特征学习的两视角人脸识别方法
CN106156768A (zh) * 2016-07-01 2016-11-23 屈桢深 基于视觉的机动车行驶证检测方法
CN106407927A (zh) * 2016-09-12 2017-02-15 河海大学常州校区 基于偏振成像的适用于水下目标检测的显著性视觉方法
CN106529446A (zh) * 2016-10-27 2017-03-22 桂林电子科技大学 基于多分块深层卷积神经网络的车型识别方法和系统
CN106991472A (zh) * 2017-03-30 2017-07-28 中国人民解放军国防科学技术大学 一种融合ReLU激活函数与最大值池化的向量化实现方法
CN107122712A (zh) * 2017-03-27 2017-09-01 大连大学 基于卷积神经网络和双向局部特征聚合描述向量的掌纹图像识别方法

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070189607A1 (en) * 2005-10-17 2007-08-16 Siemens Corporate Research Inc System and method for efficient feature dimensionality and orientation estimation
GB0616293D0 (en) * 2006-08-16 2006-09-27 Imp Innovations Ltd Method of image processing
US8630489B2 (en) * 2009-05-05 2014-01-14 Microsoft Corporation Efficient image matching
CN101944174B (zh) 2009-07-08 2012-06-27 西安电子科技大学 车牌字符的识别方法
US8494259B2 (en) * 2009-12-28 2013-07-23 Teledyne Scientific & Imaging, Llc Biologically-inspired metadata extraction (BIME) of visual data using a multi-level universal scene descriptor (USD)
CN101833653A (zh) * 2010-04-02 2010-09-15 上海交通大学 低分辨率视频中的人物识别方法
KR101397712B1 (ko) * 2010-07-27 2014-06-27 주식회사 팬택 증강 현실 객체 인식 가이드 제공 장치 및 방법
US9760789B2 (en) * 2012-04-17 2017-09-12 Conduent Business Services, Llc Robust cropping of license plate images
WO2016083002A1 (en) 2014-11-28 2016-06-02 Fotonation Limited A method for producing a histogram of oriented gradients
JP6324338B2 (ja) * 2015-03-25 2018-05-16 株式会社日立ハイテクノロジーズ 細胞診断支援装置、細胞診断支援方法、遠隔診断支援システム、及びサービス提供システム
US10839573B2 (en) 2016-03-22 2020-11-17 Adobe Inc. Apparatus, systems, and methods for integrating digital media content into other digital media content
CN106803090A (zh) 2016-12-05 2017-06-06 中国银联股份有限公司 一种图像识别方法和装置
JP6833496B2 (ja) * 2016-12-19 2021-02-24 株式会社東芝 学習装置、紙葉類判別装置および紙葉類判別方法
CN108345827B (zh) * 2017-01-24 2021-11-30 富士通株式会社 识别文档方向的方法、系统和神经网络
CN106960206B (zh) 2017-02-08 2021-01-01 北京捷通华声科技股份有限公司 字符识别方法和字符识别系统
CN107103331B (zh) * 2017-04-01 2020-06-16 中北大学 一种基于深度学习的图像融合方法

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014183259A1 (zh) * 2013-05-14 2014-11-20 中国科学院自动化研究所 一种全色−多光谱遥感图像融合方法
CN103903238A (zh) * 2014-03-21 2014-07-02 西安理工大学 图像特征的显著结构和相关结构融合方法
CN104091348A (zh) * 2014-05-19 2014-10-08 南京工程学院 融合显著特征和分块模板的多目标跟踪方法
CN104268833A (zh) * 2014-09-15 2015-01-07 江南大学 基于平移不变剪切波变换的图像融合新方法
CN105740876A (zh) * 2014-12-10 2016-07-06 阿里巴巴集团控股有限公司 一种图像预处理方法及装置
CN104978561A (zh) * 2015-03-25 2015-10-14 浙江理工大学 融合梯度和光流特征的视频动作行为识别方法
CN105893947A (zh) * 2016-03-29 2016-08-24 江南大学 基于多局部相关特征学习的两视角人脸识别方法
CN106156768A (zh) * 2016-07-01 2016-11-23 屈桢深 基于视觉的机动车行驶证检测方法
CN106407927A (zh) * 2016-09-12 2017-02-15 河海大学常州校区 基于偏振成像的适用于水下目标检测的显著性视觉方法
CN106529446A (zh) * 2016-10-27 2017-03-22 桂林电子科技大学 基于多分块深层卷积神经网络的车型识别方法和系统
CN107122712A (zh) * 2017-03-27 2017-09-01 大连大学 基于卷积神经网络和双向局部特征聚合描述向量的掌纹图像识别方法
CN106991472A (zh) * 2017-03-30 2017-07-28 中国人民解放军国防科学技术大学 一种融合ReLU激活函数与最大值池化的向量化实现方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110197206A (zh) * 2019-05-10 2019-09-03 杭州深睿博联科技有限公司 图像处理的方法及装置
CN110197206B (zh) * 2019-05-10 2021-07-13 杭州深睿博联科技有限公司 图像处理的方法及装置

Also Published As

Publication number Publication date
WO2019076188A1 (zh) 2019-04-25
EP3699818A1 (en) 2020-08-26
EP3699818A4 (en) 2020-12-23
CN109685058B (zh) 2021-07-09
US11347977B2 (en) 2022-05-31
US20200334504A1 (en) 2020-10-22

Similar Documents

Publication Publication Date Title
US10824916B2 (en) Weakly supervised learning for classifying images
CN109711243B (zh) 一种基于深度学习的静态三维人脸活体检测方法
CN108875523B (zh) 人体关节点检测方法、装置、系统和存储介质
CN105809164B (zh) 文字识别方法和装置
CN109685058A (zh) 一种图像目标识别方法、装置及计算机设备
CN106650662B (zh) 目标对象遮挡检测方法及装置
CN108875537B (zh) 对象检测方法、装置和系统及存储介质
WO2021238548A1 (zh) 区域识别方法、装置、设备及可读存储介质
CN108875539B (zh) 表情匹配方法、装置和系统及存储介质
CN108549850A (zh) 一种图像识别方法及电子设备
CN111680546A (zh) 注意力检测方法、装置、电子设备及存储介质
CN111163265A (zh) 图像处理方法、装置、移动终端及计算机存储介质
CN112348885A (zh) 视觉特征库的构建方法、视觉定位方法、装置和存储介质
CN112417970A (zh) 目标对象识别方法、装置和电子系统
CN109063776A (zh) 图像再识别网络训练方法、装置和图像再识别方法及装置
Katahira et al. Development and evaluation of a system for AR enabling realistic display of gripping motions using Leap Motion controller
CN108319916A (zh) 人脸识别方法、装置、机器人及存储介质
CN109640068A (zh) 视频帧的信息预测方法、装置、设备以及存储介质
CN116311279A (zh) 样本图像的生成、模型训练、字符识别方法、设备及介质
CN114972947B (zh) 一种基于模糊语义建模的深度场景文本检测方法和装置
WO2021036185A1 (zh) 证件识别方法及装置
CN115546831A (zh) 一种多粒度注意力机制跨模态行人搜索方法和系统
CN112230765A (zh) Ar显示方法、ar显示设备和计算机可读存储介质
CN108229281B (zh) 神经网络的生成方法和人脸检测方法、装置及电子设备
CN114202457A (zh) 低分辨率图像的处理方法、电子设备及计算机程序产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant