CN102713974A - 学习装置、识别装置、学习识别系统和学习识别装置 - Google Patents

学习装置、识别装置、学习识别系统和学习识别装置 Download PDF

Info

Publication number
CN102713974A
CN102713974A CN2010800609414A CN201080060941A CN102713974A CN 102713974 A CN102713974 A CN 102713974A CN 2010800609414 A CN2010800609414 A CN 2010800609414A CN 201080060941 A CN201080060941 A CN 201080060941A CN 102713974 A CN102713974 A CN 102713974A
Authority
CN
China
Prior art keywords
gradient
characteristic quantity
scope
predetermined
learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2010800609414A
Other languages
English (en)
Other versions
CN102713974B (zh
Inventor
细井利宪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of CN102713974A publication Critical patent/CN102713974A/zh
Application granted granted Critical
Publication of CN102713974B publication Critical patent/CN102713974B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • G06V40/165Detection; Localisation; Normalisation using facial parts and geometric relationships
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/443Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
    • G06V10/446Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering using Haar-like filters, e.g. using integral image techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Geometry (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Image Analysis (AREA)

Abstract

所公开的学习装置提高了图案识别中的识别精确度,也提高了学习过程和识别过程的流畅性。学习装置包括:梯度特征提取单元,其基于输入的学习对象图案在每个坐标上的亮度与其周边的亮度之间的变化量提取包括每个坐标上的梯度方向及其梯度强度值的梯度特征量;和差特征提取单元,基于提取的梯度特征量,通过对符合包含在指示预定梯度方向的范围的预定梯度范围内的梯度方向的梯度强度值求和,并且从计算出的和值中减去符合包含在临近预定梯度范围的其他梯度范围内的梯度方向的梯度强度值,计算预定的和差特征量;以及学习单元,使用梯度特征量以及和差特征量,基于预定学习算法,获取每个坐标上的学习参数。

Description

学习装置、识别装置、学习识别系统和学习识别装置
技术领域
本发明涉及一种预先学习学习对象图案以进行目标识别的学习装置,一种学习方法,一种存储学习程序的记录介质,一种输入识别对象图案并进行识别的识别装置,一种识别方法,一种存储识别程序的记录介质,以及一种学习学习对象图案并识别识别对象图案的学习识别系统,一种学习识别装置,一种学习识别方法以及一种存储学习识别程序的记录介质。
背景技术
统计图案识别方法是大家熟知的用于从图像中识别目标的方法。
统计图案识别方法是基于一些输入输出对估计输入和输出之间的关系的方法。更具体地,统计图案识别方法是这样一种方法,其中,从大量的输入数据和输出数据中学习所需的输入输出关系,并且该关系被用于识别。
因此,统计图案识别方法主要由学习过程和识别过程来实现。
学习过程是通过使用用于学习的采样数据以及其教师数据来获取用于识别过程的学习参数。教师数据是指示对于采样数据(输入)的正确的识别结果(输出)。
具体地,教师数据是算术式或者用于由输入值推导输出值的学习参数(例如,输入值和对应于输入值的输出值),或两者都有。
换句话说,如上所述,学习过程是一种计算过程,其目的是获取学习参数,该学习参数用于对在识别过程阶段输入的任意输入计算输出的数据。
例如,在学习过程使用是一种神经网络的多层感知器的情况下,获取各节点之间的“连接权值”作为学习参数。
另一方面,识别过程是通过对输入的任意数据(识别对象)使用学习参数计算输出(识别结果)的过程。
通常,为了提高识别过程的精确度,对大量学习对象图案的每一个执行复杂的特征提取过程。例如,当执行特征识别时,提取对应于学习对象图案的特定特征的轮廓的斜率、宽度、曲率、圈数等作为特征量。因此,换句话说,特征提取过程是从初始图案建立另一个图案的过程。
在下文将参考图14描述通常的特征提取过程。
图14是示出了基于统计图案识别方法执行识别过程的通常结构的框图。
首先,如图14所示,输入任意识别对象图案之后,预处理装置A1执行初步的处理(噪声消除和归一化),使得更容易执行随后的处理。
其次,特征提取装置A2从已执行了初步处理的识别对象图案提取特征量(数值和符号),该特征量给出了图案的特殊性。
例如,当提取了特征量d,特征量可由以下述公式表示的特征矢量来表示。
X=(x1,x2,…,xd)
识别计算装置A3输入由特征提取装置A2提取的特征量并确定识别对象的“分类/类别/类”。
具体地,识别计算装置A3基于由预先存储在字典存储单元A4中的学习参数所指定的计算方法执行计算以确定所提取的特征量是否是特定对象。
例如,当计算结果为“1”时,识别计算装置A3确定所提取的特征量是特定对象,当计算结果为“0”时确定为不是特定对象。而且,识别计算装置A3能基于计算结果是否低于预定阈值来确定所提取的特征量是否是特定对象。
在以下的相关技术中,为了维持高识别精确度,特征矢量xd的维数需要等于或大于预设值。而且,不仅这样的方法已被使用,其他各种方法也已被使用。
例如,在非专利文献1提出的方法中,矩形特征被从对象图案中提取。
在专利文献1提出的方法中,建立了指示在特征图案上定向分量分布的定向图案。基于定向图案的垂直方向分量、水平方向分量和对角方向分量被提取作为定向特征图案,以进行特征识别。换句话说,在这种方法里,通过组合这些定向分量来再现读出的特征。
在专利文献2提出的技术中,关于图像上的多个测量点,在经过每个测量点的搜索线段的两侧提供用于测量的具有狭窄固定形状的临近区域。通过该技术,在该区域的多个临近点测量图像的亮度梯度矢量的方向。在该技术中,从矢量的方向和搜索线段的方向之间的差别可计算在每个临近点的集中度,从所有的集中度计算对于测量点的线段集中度,并且当其为最大值时,确定沿搜索线段的方向存线段信息。在该技术中,基于集中度预先计算能被用在每个测量点的基本附加值。在该技术中,当测量矢量的方向时,基本附加值中的一个被选择并为搜索线段的每个方向添加,由此,每个测量点的线段集中度被计算,并且,当该值为最大时,线段信息被期待。
在专利文献3提出的技术中,关于特定对象的特征量,通过将对应于背景区域的特征量分量替换为另一个值,从一个对象图像生成背景不同的多个特征量数据,并学习到识别参数。
现有技术文献
非专利文献
非专利文献1:Paul Viola,Michael Jones,“Rapid Object Detectionusing a Boosted Cascade of Simple Feature”Proceeding of Computer Visionand Pattern Recognition 2001,2001
专利文献
专利文献1:日本专利公开No.2605807
专利文献2:日本专利申请公开No.2005-284697
专利文献3:日本专利申请公开No.2008-059110
发明内容
本发明要解决的问题
可是,当使用这样的方法时,会出现以下问题。
首先,在非专利文献1提出的技术中,用于学习过程的特征是简单的矩形。因此,对于识别没用的很多参数被包括在提取的特征量中。从而,当使用该技术时,产生了这样的问题,为了维持识别精确度需要大量的特征量(换句话说,在学习过程中,更高阶次的计算是必须的),并且计算成本变得很高。
结果,由于学习过程花费了大量的时间,在该技术中出现了这样的问题,到可以执行识别过程所需的期间被延长了。
在专利文献1所公开的技术中,由于用于识别的特征很复杂,在识别过程中需要更高阶次的计算,从而,识别过程不能被流畅的执行。
在专利文献2和3所公开的技术中,用于计算过程的滤波器的处理内容与本发明的不同。因此,上述问题也不能得到解决。
本发明的一个目的就是要提供一种学习装置,其避免了高维度特征量的使用以及在执行图案识别时为维持和提高识别精确度所必需的复杂特征提取,从而降低了学习过程和识别过程中计算成本的负担,并且能够执行流畅的图案识别,还提供一种学习方法,一种存储学习程序的记录介质,一种识别装置,一种识别方法,一种存储识别程序的记录介质,以及一种学习识别系统,一种学习识别装置,一种学习识别方法和一种存储学习识别程序的记录介质。
解决问题的手段
根据本发明一个实施例的学习装置,包括:梯度特征提取单元,基于输入的学习对象图案在每个坐标上的亮度与其周边的亮度之间的变化量提取包括每个坐标上的梯度方向及其梯度强度值的梯度特征量;和差特征提取单元,基于提取的梯度特征量,通过对符合包含在指示预定梯度方向的范围的预定梯度范围内的梯度方向的梯度强度值求和,并且从计算出的和值中减去符合包含在临近预定梯度范围的其他梯度范围内的梯度方向的梯度强度值,计算预定的和差特征量;学习单元,使用梯度特征量以及和差特征量,基于预定学习算法,获取每个坐标上的学习参数。
进一步,根据本发明一个实施例的学习方法,包括:基于输入的学习对象图案在每个坐标上的亮度与其周边的亮度之间的变化量提取包括每个坐标上的梯度方向及其梯度强度值的梯度特征量;基于提取的梯度特征量,通过对符合包含在指示预定梯度方向的范围的预定梯度范围内的梯度方向的梯度强度值求和,并且从计算出的和值中减去符合包含在临近预定梯度范围的其他梯度范围内的梯度方向的梯度强度值,计算预定的和差特征量;使用梯度特征量以及和差特征量,基于预定学习算法,获取每个坐标上的学习参数。
更进一步,根据本发明一个实施例的存储学习程序的记录介质,其使计算机按如下单元工作:梯度特征提取单元,基于输入的学习对象图案在每个坐标上的亮度与其周边的亮度之间的变化量提取包括每个坐标上的梯度方向及其梯度强度值的梯度特征量;和差特征提取单元,基于提取的梯度特征量,通过对符合包含在指示预定梯度方向的范围的预定梯度范围内的梯度方向的梯度强度值求和,并且从计算出的和值中减去符合包含在临近预定梯度范围的其他梯度范围内的梯度方向的梯度强度值,计算预定的和差特征量;学习单元,使用梯度特征量以及和差特征量,基于预定学习算法,获取每个坐标上的学习参数。
进一步,根据本发明一个实施例的识别装置包括:梯度特征提取单元,基于输入的识别对象图案在每个坐标上的亮度与其周边的亮度之间的变化量提取包括每个坐标上的梯度方向及其梯度强度值的梯度特征量;和差特征提取单元,基于提取的梯度特征量,通过对符合包含在指示预定梯度方向的范围的预定梯度范围内的梯度方向的梯度强度值求和,并且从计算出的和值中减去符合包含在临近预定梯度范围的其他梯度范围内的梯度方向的梯度强度值,计算预定的和差特征量;识别单元,基于梯度特征量、和差特征量以及通过预定学习算法获取的部分或者全部学习参数,从一个或多个类型中识别识别对象图案所属的类型。
更进一步,根据本发明一个实施例的识别方法,包括:基于输入的识别对象图案在每个坐标上的亮度与其周边的亮度之间的变化量提取包括每个坐标上的梯度方向及其梯度强度值的梯度特征量;基于提取的梯度特征量,通过对符合包含在指示预定梯度方向的范围的预定梯度范围内的梯度方向的梯度强度值求和,并且从计算出的和值中减去符合包含在临近预定梯度范围的其他梯度范围内的梯度方向的梯度强度值,计算预定的和差特征量;基于梯度特征量、和差特征量以及通过预定学习算法获取的部分或者全部学习参数,从一个或多个类型中识别识别对象图案所属的类型。
更进一步,根据本发明一个实施例的存储识别程序的记录介质,其使计算机按如下单元工作:梯度特征提取单元,基于输入的识别对象图案在每个坐标上的亮度与其周边的亮度之间的变化量提取包括每个坐标上的梯度方向及其梯度强度值的梯度特征量;和差特征提取单元,基于提取的梯度特征量,通过对符合包含在指示预定梯度方向的范围的预定梯度范围内的梯度方向的梯度强度值求和,并且从计算出的和值中减去符合包含在临近预定梯度范围的其他梯度范围内的梯度方向的梯度强度值,计算预定的和差特征量;识别单元,基于梯度特征量、和差特征量以及通过预定学习算法获取的部分或者全部学习参数,从一个或多个类型中识别识别对象图案所属的类型。
进一步,根据本发明一个实施例的学习识别系统包括:学习装置,其包括梯度特征提取单元,其基于输入的学习对象图案在每个坐标上的亮度与其周边的亮度之间的变化量提取包括每个坐标上的梯度方向及其梯度强度值的梯度特征量;和差特征提取单元,基于提取的梯度特征量,通过对符合包含在指示预定梯度方向的范围的预定梯度范围内的梯度方向的梯度强度值求和,并且从计算出的和值中减去符合包含在临近预定梯度范围的其他梯度范围内的梯度方向的梯度强度值,计算预定的和差特征量;学习单元,使用梯度特征量以及和差特征量,基于预定学习算法,获取每个坐标上的学习参数。识别装置,其包括梯度特征提取单元,基于输入的识别对象图案在每个坐标上的亮度与其周边的亮度之间的变化量提取包括每个坐标上的梯度方向及其梯度强度值的梯度特征量;和差特征提取单元,基于提取的梯度特征量,通过对符合包含在指示预定梯度方向的范围的预定梯度范围内的梯度方向的梯度强度值求和,并且从计算出的和值中减去符合包含在临近预定梯度范围的其他梯度范围内的梯度方向的梯度强度值,计算预定的和差特征量;识别单元,基于梯度特征量、和差特征量以及由所述学习单元获取的部分或者全部学习参数,从一个或多个类型中识别识别对象图案所属的类型。
更进一步,一种学习识别装置,包括用于从一个或多个类型中识别识别对象图案所属的类型的识别单元,包括:梯度特征提取单元,基于输入的学习对象图案在每个坐标上的亮度与其周边的亮度之间的变化量提取包括每个坐标上的梯度方向及其梯度强度值的梯度特征量;和差特征提取单元,基于提取的梯度特征量,通过对符合包含在指示预定梯度方向的范围的预定梯度范围内的梯度方向的梯度强度值求和,并且从计算出的和值中减去符合包含在临近预定梯度范围的其他梯度范围内的梯度方向的梯度强度值,计算预定的和差特征量;学习单元,使用梯度特征量以及和差特征量,基于预定学习算法,获取每个坐标上的学习参数;所述梯度特征提取单元,基于输入的识别对象图案在每个坐标上的亮度与其周边的亮度之间的变化量提取包括每个坐标上的梯度方向及其梯度强度值的梯度特征量;所述和差特征提取单元,基于提取的梯度特征量,通过对符合包含在指示预定梯度方向的范围的预定梯度范围内的梯度方向,梯度强度值求和,并且从计算出的和值中减去符合包含在临近预定梯度范围的其他梯度范围内的梯度方向的梯度强度值,计算预定的和差特征量;识别单元,基于由识别对象图案计算出的梯度特征量和和差特征量,以及由所述学习单元获取的部分或者全部学习参数,从一个或多个类型中识别识别对象图案所属的类型。
进一步,根据本发明一个实施例的学习识别方法包括如下步骤:基于输入的学习对象图案在每个坐标上的亮度与其周边的亮度之间的变化量提取包括每个坐标上的梯度方向及其梯度强度值的梯度特征量;基于提取的梯度特征量,通过对符合包含在指示预定梯度方向的范围的预定梯度范围内的梯度方向的梯度强度值求和,并且从计算出的和值中减去符合包含在临近预定梯度范围的其他梯度范围内的梯度方向的梯度强度值,计算预定的和差特征量;使用梯度特征量以及和差特征量,基于预定学习算法,获取每个坐标上的学习参数;基于输入的识别对象图案在每个坐标上的亮度与其周边的亮度之间的变化量提取包括每个坐标上的梯度方向及其梯度强度值的梯度特征量;基于提取的梯度特征量,通过对符合包含在指示预定梯度方向的范围的预定梯度范围内的梯度方向的梯度强度值求和,并且从计算出的和值中减去符合包含在临近预定梯度范围的其他梯度范围内的梯度方向的梯度强度值,计算预定的和差特征量;基于从识别对象图案计算出的梯度特征量和和差特征量,以及由所述学习单元获取的部分或者全部学习参数,从一个或多个类型中识别识别对象图案所属的类型。
更进一步,根据本发明一个实施例的存储学习识别程序的记录介质,其使计算机按如下单元工作:梯度特征提取单元,其基于输入的学习对象图案在每个坐标上的亮度与其周边的亮度之间的变化量提取包括每个坐标上的梯度方向及其梯度强度值的梯度特征量;和差特征提取单元,基于提取的梯度特征量,通过对符合包含在指示预定梯度方向的范围的预定梯度范围内的梯度方向的梯度强度值求和,并且从计算出的和值中减去符合包含在临近预定梯度范围的其他梯度范围内的梯度方向的梯度强度值,计算预定的和差特征量;学习单元,使用梯度特征量以及和差特征量,基于预定学习算法,获取每个坐标上的学习参数;所述梯度特征提取单元,基于输入的识别对象图案在每个坐标上的亮度与其周边的亮度之间的变化量提取包括每个坐标上的梯度方向及其梯度强度值的梯度特征量;所述和差特征提取单元,基于提取的梯度特征量,通过对符合包含在指示预定梯度方向的范围的预定梯度范围内的梯度方向的梯度强度值求和,并且从计算出的和值中减去符合包含在临近预定梯度范围的其他梯度范围内的梯度方向的梯度强度值,计算预定的和差特征量;识别单元,基于由识别对象图案计算出的梯度特征量和和差特征量,以及由所述学习单元获取的部分或者全部学习参数,从一个或多个类型中识别识别对象图案所属的类型。
本发明的效果
所述的学习装置、学习方法、存储学习程序的记录介质、识别装置、识别方法、存储识别程序的记录介质,以及所述的学习识别系统、学习识别装置、学习识别方法和存储学习识别程序的记录介质,能够降低计算成本的负担,提高识别精确度,并且实现了流畅的学习过程和识别过程。
附图说明
图1是示出了根据本发明第一实施例的学习装置的结构的第一框图;
图2是示出了根据本发明的第一实施例的用于学习过程的梯度特征量的说明图;
图3A是示出了根据本发明的第一实施例的用于学习过程的和差特征量的说明图;
图3B是示出了根据本发明的第一实施例的用于学习过程的和差特征量的说明图;
图3C是示出了根据本发明的第一实施例的用于学习过程的和差特征量的说明图;
图4是示出了根据本发明第一实施例的学习装置的结构的第二框图;
图5是示出了根据本发明第一实施例的识别装置的结构的第一框图;
图6是示出了根据本发明第一实施例的识别装置的结构的第二框图;
图7是示出了根据本发明第一实施例的学习过程的步骤的流程图;
图8是示出了根据本发明第一实施例的识别过程的步骤的流程图;
图9A是示出了根据本发明第二实施例的简单地分配梯度特征量数据的存储方法的示意图;
图9B是示出了根据本发明第二实施例的最优地分配梯度特征量数据的存储方法的示意图;
图9C是示出了根据本发明第二实施例的存储梯度特征量的方法的示例的示意图;
图10是示出了根据本发明第三实施例的学习识别系统的结构的第一框图;
图11是示出了根据本发明第三实施例的学习识别系统的结构的第二框图;
图12是示出了根据本发明第四实施例的学习识别装置的结构的第一框图;
图13是示出了根据本发明第四实施例的学习识别装置的结构的第二框图;
图14是示出了现有技术的识别装置的结构的框图;
具体实施方式
以下将描述本发明的实施例。
这里,随后提到的示例性实施例中的学习装置、学习方法、识别装置、识别方法、学习识别系统、学习识别装置和学习识别方法由方法、装置或由计算机根据程序指令(例如,学习程序、识别程序以及学习识别程序)执行的功能来实现。所述程序向计算机的每个组件发送命令使其执行预定方法并如以下所示出的那样工作。也就是,随后描述的实施例中的学习装置、学习方法、识别装置、识别方法、学习识别系统、学习识别装置和学习识别方法由特定的装置实现,其中所述程序和计算机彼此配合工作。
进一步,程序的全部或者部分由例如磁盘、光盘、半导体存储器或任意计算机可读的记录介质来提供,从记录介质中读出的程序被安装在计算机中并被执行。而且,可以通过通信线路而不用使用记录介质将程序直接加载到计算机中。
[第一实施例]
(学习装置10)
图1是示出了根据本发明第一实施例的学习装置的结构的第一框图。
如图1所示,根据本发明实施例的学习装置10包括梯度特征提取单元11、和差特征提取单元12和学习单元13,并且,学习装置10被连接至存储装置20。
梯度特征提取单元11从输入的学习对象图案提取每个坐标上的梯度特征量。
梯度特征提取单元11提取学习对象图案在每个坐标上的亮度与其周边的亮度之间的变化量。梯度特征量是基于所述变化量通过量化在每个坐标上的亮度的方向和强度(梯度强度值)所提取的数据。
图2是直观的示出了由梯度特征提取单元11所提取的梯度特征量的说明图。
如图2所示,例如,当输入人脸的照相图像作为提取特征前的学习对象图案时,梯度特征提取单元11能够通过使用例如SOBEL滤波器等的梯度滤波器将该图像分为八个梯度(0度,45度,90度,135度,180度,225度,270度和315度)并提取梯度特征量。
换句话说,梯度特征提取单元11为这八个梯度的每一个提取梯度强度值,这八个梯度是对于每个像素分别提取的。图2的右侧图示意性的示出了提取对象图像(图2的左侧图)的所有像素的梯度强度值的结果。
梯度特征提取单元11在存储装置20的特征量暂存单元22暂时存储提取的梯度特征量。
如图1所示,和差特征提取单元12从特征量暂存单元22获得梯度特征量并计算和差特征量。和差特征提取单元12能从梯度特征提取单元11接收梯度特征量。
具体地,和差特征提取单元12将符合包括在“预定梯度范围”内的梯度方向的梯度强度值增加至学习对象图案的特定坐标。和差特征提取单元12通过减去符合包括在与所述梯度范围相邻的“其他梯度范围”内的梯度方向的梯度强度值,来计算和差特征量。
这里,“预定梯度范围”是这样的范围,其中,当包括了所有有效梯度的整个范围,就是说360度,被量化为四个或者更多的梯度方向时,该范围包括符合其中两个或者更多梯度方向的梯度特征量(梯度强度值)。
“其他梯度范围”是与“预定梯度范围”相邻的范围,包括了符合其数量与包括在“预定梯度范围”内的梯度方向的数量相同的梯度方向的梯度特征量。
图3A是示意性示出直观指示每个梯度方向的梯度强度值的示例的图。
图3B是说明图,示出了说明作为图3C中计算对象的特征范围的方法。白色矩形表示的范围指示作为加法对象的特征值的范围。黑色矩形表示的范围指示作为减法对象的特征值的范围。
图3C是说明图,其说明了当被量化的梯度方向数量为8时的和差特征量。
在图3C中,在行的开头指示作为加法对象或者减法对象的梯度方向的范围(宽度),在列的开头指示作为加法对象或者减法对象的梯度方向的范围的排列。
例如,当宽度为“2”,θ=45度时,有8种关于梯度强度值的加法(+)和减法(-)的排列:(1)“(+):4θ和3θ”,“(-):2θ和θ”;(2)“(+):5θ和4θ”,“(-):3θ和2θ”;(3)“(+):6θ和5θ”,“(-):4θ和3θ”;(4)“(+):7θ和6θ”,“(-):5θ和4θ”;(5)“(+):0和7θ”,“(-):6θ和5θ”;(6)“(+):θ和0”,“(-):7θ和6θ”;(7)“(+):2θ和θ”,“(-):0和7θ”;以及(8)“(+):3θ和2θ”和“(-):θ和0”。
和差特征提取单元12根据这些组合的每一种通过对梯度强度值执行加法和减法来计算和差特征量。
例如,当用E(θn)表示符合任意梯度方向(θn)的梯度强度值时,排列(1)的和差特征量可以通过以下方法计算。即,和差特征提取单元12能通过执行计算过程E(4θ)+E(3θ)-(E(2θ)+E(θ))来获取关于该像素的这些和差特征量的一个。和差特征提取单元12能通过对排列(1)至(8)执行所述计算过程来计算关于像素的所需的和差特征量。换句话说,在这种情况下,和差特征提取单元12计算关于一个像素的8个和差特征量。
另外,和差特征提取单元12对于学习对象图案的所有像素执行该方法。
进一步,上述的“梯度范围”可以根据用户的输入操作来设置或者改变。
具体地,学习装置10能通过设置包括在该梯度范围内的梯度方向的数量来任意设置“预定梯度范围”或“其他梯度范围”(本发明的梯度特征数量设置装置的功能)。
例如,当宽度被设为“3”,和差特征提取单元12计算16个和差特征量:通过执行宽度为“3”时梯度强度值的加法和/或减法而获取的8个和差特征量,通过执行宽度为“2”时梯度强度值的加法/减法而计算的8个和差特征量。
类似地,当宽度被设为“4”,和差特征提取单元12获取24个和差特征量:通过执行宽度为“4”时梯度强度值的加法和/或减法而获取的8个和差特征量,通过执行宽度为“3”时梯度强度值的加法和/或减法而计算的8个和差特征量,以及通过执行宽度为“2”时梯度强度值的加法/减法而计算的8个和差特征量。
从而,和差特征提取单元12能通过改变用于计算和差特征量的加法和/或减法的范围(宽度)来调整用于学习过程的和差特征量的数量。
进一步,和差特征提取单元12针对所有像素计算和差特征量,并在存储装置20的特征量暂存单元22中暂时存储计算出的和差特征量。
如图1所示,学习单元13从特征量暂存单元22获取梯度特征量以及和差特征量,并基于预定学习算法获得识别过程的学习参数。学习单元13通过梯度特征提取单元11以及和差特征提取单元12接收这些梯度特征量以及和差特征量。
进一步,如图1所示,学习单元13能够通过使用梯度特征量和和差特征量以及预定的教师数据来获取学习参数。
教师数据是指示对于采样数据(输入)的正确识别结果(输出)的数据。具体地,教师数据是算术式或者用于由输入值推导输出值的学习参数,或两者都有。
这里,学习单元13不仅能够通过使用特定学习算法获取学习参数,也能通过使用各种学习算法来获取。
例如,在使用一种神经网络的多层感知器的情况下,学习单元13获取各节点之间的“连接权值”作为学习参数。
当使用一般化的学习矢量量化(GLVQ)作为学习算法时,学习单元13可以获取“参考矢量(原型)”作为学习参数。
当使用支持矢量机(SVM)作为学习算法时,学习单元13能够获取选择的“支持矢量”作为学习参数。
学习单元13在字典存储单元21中存储所获取的学习参数。
存储在字典存储单元21中的学习参数被用于随后描述的识别过程。
进一步,如图4所示,学习装置10可以具有这样的结构,其中没有包括存储装置20。
在这种情况中,梯度特征提取单元11能直接输出所提取的梯度特征量至和差特征提取单元12和学习单元13。和差特征提取单元12能直接输出所计算的和差特征量至学习单元13,并将从梯度特征提取单元11接收的梯度特征量发送至学习单元13。
学习单元13输出基于梯度特征量以及和差特征量(当使用教师数据时,包括教师数据)所获取的学习参数至识别装置。
(识别装置30)
如图5所示,识别装置30包括梯度特征提取单元31、和差特征量提取单元32和识别单元33。
梯度特征提取单元31从输入的识别对象图案中提取每个坐标上的梯度特征量。
梯度特征提取单元31提取识别对象图案在每个坐标上的亮度与其周边的亮度之间的变化量。梯度特征量是基于所述变化量通过量化在每个坐标上的亮度的方向和强度(梯度强度值)所提取的数据。
即,梯度特征提取单元31执行与学习装置10的梯度特征提取单元11相同的操作。
进一步,梯度特征提取单元31能够只是提取被判定为对识别过程有用的特定梯度特征量。例如,梯度特征提取单元31通过统计学方法等排除了被判定为对识别过程无用的梯度特征量,并将对识别过程无用的识别码附在识别对象图案的预定坐标或像素中。这样,就可以不提取对于识别无用的梯度特征量。
梯度特征提取单元31将所提取的梯度特征量暂时存储在存储装置40的特征量暂存单元42中。
如图5所示,和差特征提取单元32从特征量暂存单元42获取梯度特征量,并计算预定的和差特征量。和差特征提取单元32能够直接从梯度特征提取单元31接收梯度特征量。
即,和差特征提取单元32执行与学习装置10的和差特征提取单元12相同的操作。
例如,当学习装置10的和差特征提取单元12中的“预定梯度范围”和“其他梯度范围”被设为“3”时,通常,识别装置30的和差特征提取单元32通过使用包括在具有同样宽度的梯度范围内的梯度特征量来计算和差特征量。具体地,在这种情况下,和差特征提取单元32对符合3个梯度方向的梯度强度值求和,并从所计算出的和值中减去符合3个其他梯度方向的梯度强度值,以获取和差特征量。和差特征提取单元32对符合两个梯度方向的梯度强度求和,并从所计算出的和值中减去符合两个其他梯度方向的梯度强度值,以获取和差特征量。
然而,作为学习装置10的学习过程的结果,当梯度范围的宽度为“3”,梯度特征量被判定为对识别无用时,和差特征提取单元32能够仅仅基于宽度为“2”的梯度范围来获取和差特征量。换句话说,在这种情况下,和差特征提取单元32对符合两个梯度方向的梯度强度值求和,并从所计算出的和值中减去符合两个其他梯度方向的梯度强度值,以获取和差特征量。
进一步,通过使用与前述的梯度特征提取单元31所执行的方法相同的方法,和差特征提取单元32能够仅仅获取被判定为对识别有用的特定和差特征量。
结果,根据示例性实施例的学习装置10能够降低识别的计算成本,并实现快速的识别过程。
进一步,和差特征提取单元32将所计算出的和差特征量暂存在存储装置40的特征量暂存单元42中。
如图5所示,识别单元33从特征量暂存单元42获得梯度特征量以及和差特征量。识别单元33从字典存储单元41获得学习参数,并且基于这些学习参数,输出指示在一个或多个类型(预定的分类/类别/类等)中的识别对象图案所属的类型的信息,作为识别结果。
例如,识别单元33获取由从识别对象图案提取的梯度特征量和和差特征量组成的特征矢量和多个学习参数的参考矢量之间的欧几里得距离,识别识别对象图案所属的分类/类别/类,欧几里得距离为最短距离的参考矢量所被分配到该分类/类别/类。
这里,识别单元33能够从存储在字典存储单元41中的学习参数中仅仅提取被判定为对识别有用的学习参数,并将其用于识别过程。例如,识别单元33能够基于通过实际识别过程提取的识别结果,通过预先将识别码附在被判定为对识别有用的学习参数上来实现该方法。
进一步,如图6所示,识别装置30具有这样的结构,其中可以不包括存储装置40。
在这种情况中,梯度特征提取单元31能直接输出所提取的梯度特征量至和差特征提取单元32或识别单元33。和差特征提取单元32能直接输出所计算的和差特征量至识别单元33。和差特征提取单元32能将从梯度特征提取单元31接收的梯度特征量发送至学习单元33。
学习单元13基于梯度特征量、和差特征量以及从学习装置(未示出)接收到的学习参数等,输出识别结果。
(存储装置20(40))
图1中示出的存储装置20以及图5中示出的存储装置40是由硬盘、半导体存储器等组成的存储装置。
如这些图中所示,存储装置20(30)包括字典存储单元21(41)和特征量暂存单元22(42)。
字典存储单元21(41)存储通过学习过程所获取的学习参数。存储在字典存储单元21(41)中的学习参数被用于识别过程。
特征量暂存单元22存储由梯度特征提取单元11所提取的梯度特征量以及学习装置10中的和差特征提取单元12所计算出来的和差特征量。
特征量暂存单元42存储由梯度特征提取单元31所提取的梯度特征量以及识别装置30中的和差特征提取单元32所计算出来的和差特征量。
接下来,参考图7和图8描述具有上述结构的学习装置的学习方法以及具有上述结构的识别装置的识别方法。
图7是示出了根据实施例的学习方法的流程图。
图8是示出了根据实施例的识别方法的流程图。
(学习方法)
如图7所示,在根据示例性实施例的学习方法中,首先,学习装置10通过输入单元(未示出)输入学习对象图案(S101)。
接下来,梯度特征提取单元11从输入的学习对象图案中提取梯度特征量(S102)。
具体地,梯度特征提取单元11提取梯度特征量,其由每个坐标上的梯度方向以及基于输入的学习对象图案在每个坐标上的亮度与其周边的亮度之间的变化量的其梯度强度值组成。
梯度特征提取单元11在存储装置20的特征量暂存单元22中存储所提取的梯度特征量。
接下来,和差特征提取单元12从特征量暂存单元22获得梯度特征量,并计算和差特征量(S103)。
具体地,基于从学习对象图案中提取的梯度特征量,和差特征提取单元12对符合包括在预定梯度范围内的梯度方向的梯度强度值求和。和差特征提取单元12通过减去符合包括在与所述梯度范围相邻的其他梯度范围内的梯度方向的梯度强度值来计算和差特征量。
和差特征提取单元12对学习对象图案里的所有像素执行上述方法。
进一步,和差特征提取单元12在特征量暂存单元22中存储所获取的和差特征量。
接下来,学习装置10确定是否还有其他要学习的学习对象图案存在(S104)。
当有其他要学习的学习对象图案存在时(S104:是),学习装置10对其他学习对象图案执行类似的方法(S101至S103)。即,学习装置10重复S101至S103的方法,其重复次数与学习对象图案的数量相同。
当不存在其他要学习的学习对象图案时(S104:否),学习单元13执行学习过程(S105)。
具体地,学习单元13使用取自特征量暂存单元22的梯度特征量以及和差特征量,基于预定学习算法,来获取学习参数。
进一步,那时,学习单元13能通过增加预定教师数据来执行学习过程。
在该示例性实施例中,学习单元13在与识别装置30连接的存储装置40的字典存储单元41中存储所获取的学习参数。
这里,上述学习过程的步骤能任意改变。
例如,当执行这样的学习过程时,其中学习对象图案如同一般化的学习矢量量化(GLVQ)那样被顺序输入,步骤S104和S105的处理顺序能被互换。即,可根据学习图案的数量重复执行下列一系列的步骤:输入学习对象图案->提取梯度特征量->提取和差特征量->执行学习过程。
(识别方法)
如图8所示,在根据示例性实施例的识别方法中,首先,识别装置30通过输入单元(未示出)输入识别对象图案(S201)。
接下来,梯度特征提取单元31从输入的识别对象图案中提取梯度特征量(S202)。
具体地,梯度特征提取单元31提取梯度特征量,其由每个坐标上的梯度方向以及基于输入的识别对象图案在每个坐标上的亮度与其周边的亮度之间的变化量的其梯度强度值组成。
梯度特征提取单元31在存储装置40的特征量暂存单元42中存储所提取的梯度特征量。
接下来,和差特征提取单元32从特征量暂存单元42获得梯度特征量,并计算和差特征量(S203)。
具体地,基于从识别对象图案中提取的梯度特征量,和差特征提取单元32对符合包括在预定梯度范围内的梯度方向的梯度强度值求和。和差特征提取单元32通过减去符合包括在与所述梯度范围相邻的其他梯度范围内的梯度方向的梯度强度值来计算和差特征量。
和差特征提取单元32对识别对象图案里的所有像素执行上述方法。
进一步,和差特征提取单元32在特征量暂存单元42中存储所计算出来的和差特征量。
接下来,识别单元33从特征量暂存单元42获取梯度特征量以及和差特征量,从字典存储单元41获取在学习过程的步骤中存储的学习参数。基于这些数据,识别单元33从一个或多个类型中识别识别对象图案所属的类型(S204)。
识别结果可通过显示、打印等方法被输出。
如前所述,示例性实施例的学习装置10,基于输入的学习对象图案提取每个坐标上的梯度特征量,基于该梯度特征量提取和差特征量,并基于预定的学习算法获取学习参数。
基于这个原因,示例性实施例的学习装置10能通过执行诸如加法和减法的简单计算过程,基于特定特征量提取学习参数。
因此,该示例性实施例的学习装置10能降低学习过程的计算成本,并实现流畅的学习过程。
进一步,该示例性实施例的识别装置30,基于输入的识别对象图案获取每个坐标上的梯度特征量,基于该梯度特征量获取和差特征量,将这些特征量与预先提取(由前述的学习装置等)的学习参数相比较,从而执行识别对象图案的识别。
因此,该示例性实施例的识别装置30能降低识别过程的计算成本,并流畅的获得识别结果。
从而,通过使用根据示例性实施例的学习装置10或者识别装置30,尽管学习参数是特定特征量,但通过执行例如加法或者减法的简单计算过程,能有效的获得对识别有用的学习参数并流畅的计算出识别结果。
即,根据该示例性实施例的学习装置10或识别装置30在学习过程中不需要提取大量的特征量和学习参数来保证识别的精确度。在根据示例性实施例的学习装置10或识别装置30中,由于执行识别过程不需要复杂的计算过程,从而降低了总体计算成本。
另外,在根据示例性实施例的学习装置10或识别装置30中,能调整学习过程和识别过程所需的梯度特征的量。
例如,当根据示例性实施例的学习装置10或识别装置30中设置为宽梯度范围时,执行学习过程时能获取很多学习参数,从而能进一步提高识别过程中的识别精确度。
另一方面,当根据实施例的学习装置10或识别装置30中设置为窄梯度范围时,执行学习过程和识别过程的计算成本能被降低。
从而,由于用户能够自由的改变梯度范围,用户能调整识别精确度和计算成本之间的平衡。
进而,该示例性实施例的识别装置30能执行识别过程,其中在学习过程中获取的学习参数中仅仅使用识别过程所需的学习参数。
具体地,在该示例性实施例的识别装置30中,梯度特征提取单元31提取用于识别的梯度特征量,和差特征提取单元32仅仅计算用于识别的和差特征量,识别单元33将这些特征量与学习参数相比较,由此执行识别过程。
进一步,实施例的识别装置30能从存储在字典存储单元的学习参数中只取出用于识别的学习参数,并将其用于与梯度特征量及和差特征量的比较。
结果,实施例的识别装置30能降低识别过程的计算成本,并实现流畅的识别过程。
[第二实施例]
接下来将描述根据本发明第二实施例的学习装置。
根据该示例性实施例的学习装置10的特征在于当梯度特征量被存储在暂存单元22中时所使用的存储方法。第二实施例的其它结构、操作/效果等与第一实施例的相同。因此,细节描述将被省略。
此后将参照图9A至9C描述根据该示例性实施例的存储梯度特征量的方法。
图9A至9C是示出根据该示例性实施例的存储梯度特征量的方法的说明图。
当根据本示例性实施例的学习装置中的特征量暂存单元22执行学习过程时,它在相同的存储区域或临近区域中分别存储在由在每个坐标上的亮度的梯度方向组成的梯度特征量中用于计算一个和差特征量的加法或减法对象的梯度特征量,以及由梯度特征提取单元11提取的其梯度强度值。
即,特征量暂存单元22不以分级方式或无序方式存储针对学习对象图案的特定像素而提取的梯度特征量(参照图9A),而是如此存储这些梯度特征量,以使得这些和差特征量的计算对象被安排在相同或相邻地址(区域)(参照图9B)。
例如,在9C的示例中,特征量暂存单元22在#001地址的存储区域中存储像素001的各梯度方向(方向D1至Dn)的梯度强度值。
进一步地,特征量暂存单元22在#002地址的存储区域中存储像素002的各梯度方向的梯度强度值(同样的操作执行至像素N(N是对象图案相应像素的数量))。
即,特征量暂存单元22存储和差特征量,从而在存储器的存储区域中地址彼此邻近(或相同)的存储区域中存储和差特征量的计算对象。
因此,与无序存储梯度特征量的情形相比,该示例性实施例的学习装置10在执行和差特征提取过程时,能够高速执行梯度强度值的加法和减法,从而可缩短执行学习过程所需的周期(时间)。
进一步,在该示例性实施例中已经给出了关于学习装置10的说明。但是,由于识别装置30与学习装置10二者的结构彼此相似,所以识别装置30的操作/效果与学习装置10的相似。
[第三实施例]
下面将参照图10和图11来描述根据本发明第三实施例的学习识别系统。
图10和图11是示出根据该示例性实施例的学习识别系统的结构的框图。
如这些图中所示,根据该示例性实施例的学习识别系统90包括学习装置10和识别装置30。
因此,根据该示例性实施例的学习识别系统90的操作/效果与第一实施例中示出的学习装置10和识别装置30的操作/效果相似。另外,由于学习识别系统90是由学习装置10和识别装置30组成,因此其可以被整体提供,从而具有良好的适用性。
具体地,当实时执行学习过程和识别过程时,可使用图10所示的学习识别系统90a。例如,在学习装置10连续输入学习图案和教师数据并执行学习过程并且同时识别装置30执行识别对象图案的识别过程的实施例中,可应用学习识别系统90a。
在图11所示的学习识别系统90b中,学习装置10和识别装置30共享存储装置20。因此,由于学习装置10和识别装置30可被配置为其中不包含存储装置,与学习装置10和识别装置30分别包含存储装置的情形相比,可以降低学习识别系统90b的成本。
[第四实施例]
下面将参照图12和图13来描述根据本发明第四实施例的学习识别装置。
图12和图13是示出根据该示例性实施例的学习识别装置的结构的框图。
根据该示例性实施例的学习识别装置100集成了学习装置10和识别装置20。
具体地,图12所示的学习识别装置100a对应于图10所示的学习识别系统90a。
图13所示的学习识别装置100b对应于图11所示的学习识别系统90b。
因此,第四实施例的其它结构、操作/效果等与第三实施例的相同。
但是,在根据该示例性实施例的学习识别装置100中,学习过程和识别过程共享梯度特征提取单元及和差特征提取单元。这不同于前述实施例。
因此,与根据第三实施例所示的学习识别系统相比,根据该示例性实施例的学习识别装置100能进一步降低成本。
通过示出的实施例,给出了关于本发明的学习装置、学习方法、存储学习程序的记录介质、识别装置、识别方法和存储识别程序的记录介质,以及学习识别系统、学习识别装置、学习识别方法和存储学习识别程序的记录介质的说明。然而,根据本发明的装置、系统、方法和存储程序的记录介质并不限于前述的实施例,并且不必说,在本发明范围内能作出各种改变。
例如,不仅图像本身,而且,例如,执行了预定的预处理(参照图14的A1)后的数据或者被预定缩减处理压缩后的数据等,能被用作在每个实施例中输入的学习对象图案和识别对象图案。
对对象图像执行了例如柱状量化的图像处理后的数据可被用作学习对象图案和识别对象图案。在此情况下,本发明的学习装置、学习方法、存储学习程序的记录介质、识别装置、识别方法和存储识别程序的记录介质,以及学习识别系统、学习识别装置、学习识别方法和存储学习识别程序的记录介质能抑制照像时产生的亮度影响。因此,能进一步提高识别性能。
本发明在减轻计算成本负担的同时,还具有提高识别精确度以及流畅执行学习过程和识别过程的效果。这是本发明的效果中的一个示例。
本申请请求2010年1月6日提出的日本专利申请No.2010-001265的优先权,在此通过整体参照结合该优先权的内容。
工业实用性
本发明可适用于对象识别,例如图像中的特征识别、面部识别、使用人脸或者身体的个人认证、监测摄像机的图像中的人物检测、工厂生产线的缺陷检测等。
符号说明
10学习装置
11梯度特征提取单元
12和差特征提取单元
13学习单元
20,40存储装置
21,41字典存储单元
22,42特征量暂存单元
30识别装置
31梯度特征提取单元
32和差特征提取单元
33识别单元
90学习识别系统
100学习识别装置

Claims (33)

1.一种学习装置,其特征在于包括:
梯度特征提取单元,其基于输入的学习对象图案在每个坐标上的亮度与其周边的亮度之间的变化量提取包括每个坐标上的梯度方向及其梯度强度值的梯度特征量;
和差特征提取单元,基于所提取的梯度特征量,通过对符合包含在指示预定梯度方向的范围的预定梯度范围内的梯度方向的梯度强度值求和,并且从所计算出的和值中减去符合包含在临近所述预定梯度范围的其他梯度范围内的梯度方向的所述梯度强度值,计算预定的和差特征量;
学习单元,其使用所述梯度特征量和所述和差特征量,基于预定学习算法,获取每个坐标上的学习参数。
2.如权利要求1所述的学习装置,其特征在于:
所述预定梯度范围是这样的范围,其中在包括了所有可用梯度方向的整个范围被量化为的四个或者更多的梯度方向中,其包括符合两个或者更多量化的梯度方向的梯度特征量;
所述其他梯度范围是与所述梯度范围相邻的范围,其包括了符合其数量与包括在所述梯度范围内的所述量化的梯度方向的数量相同的所述量化的梯度方向的所述梯度特征量。
3.如权利要求2所述的学习装置,其特征在于:
所述和差特征量提取单元,在符合包括在预定梯度范围中的梯度方向的梯度强度中,对单元数量小于包括在所述梯度范围中的量化的梯度方向的数量的梯度强度值求和,从计算出的和值中减去包含在所述其他梯度范围中的所述单元数量的所述梯度强度值。
4.如权利要求2或3所述的学习装置,其特征在于:
包括梯度特征数量设置装置,用于根据输入操作设置包括在所述预设梯度范围中和/或所述其它梯度范围中的所述量化的梯度方向的数量。
5.如权利要求1至4任一项所述的学习装置,其特征在于:
所述学习单元基于所述梯度特征量、所述和差特征量及所述预定学习算法,使用对应于这些特征量的预定教师数据,来获取所述学习参数。
6.如权利要求1至5任一项所述的学习装置,其特征在于:
所述学习装置包括特征量暂存单元,其用于存储包括所述学习对象图案中在每个坐标上的梯度方向及其梯度强度值的梯度特征量,并且
所述和差特征提取单元,基于取自所述特征量暂存单元的所述梯度特征量,通过对符合包含在预定梯度范围内的梯度方向的梯度强度值求和,并且减去符合包含在临近所述预定梯度范围的所述其他梯度范围内的所述梯度方向的所述梯度强度值,计算出和差特征量。
7.如权利要求6所述的学习装置,其特征在于:
所述特征量暂存单元,在相同或相邻区域存储包括在学习对象图案的每个坐标上的梯度方向及其梯度强度值的各梯度特征量中的符合一个坐标的梯度特征量。
8.一种学习方法,其特征在于包括下列步骤:
基于输入的学习对象图案在每个坐标上的亮度与其周边的亮度之间的变化量,提取包括每个坐标上的梯度方向及其梯度强度值的梯度特征量;
基于提取的梯度特征量,通过对符合包含在指示所述预定梯度方向的范围的预定梯度范围内的梯度方向的所述梯度强度值求和,并且从所计算出的和值中减去符合包含在临近所述预定梯度范围的其他梯度范围内的梯度方向的所述梯度强度值,计算预定的和差特征量;
使用所述梯度特征量和所述和差特征量,基于预定学习算法,获取每个坐标上的学习参数。
9.如权利要求8所述的学习方法,其特征在于:
所述预定梯度范围是这样的范围,其中在包括了所有可用梯度方向的整个范围被量化为的四个或者更多的梯度方向中,包括了符合两个或更多量化的梯度方向的梯度特征量;
所述其他梯度范围是与所述梯度范围相邻的范围,其包括了符合其数量与包括在所述梯度范围内的所述量化的梯度方向的数量相同的所述量化的梯度方向的所述梯度特征量。
10.一种存储学习程序的记录介质,其特征在于使计算机作为如下单元工作:
梯度特征提取单元,其基于输入的学习对象图案在每个坐标上的亮度与其周边的亮度之间的变化量提取包括每个坐标上的梯度方向及其梯度强度值的梯度特征量;
和差特征提取单元,基于所述提取的梯度特征量,通过对符合包含在指示所述预定梯度方向的范围的预定梯度范围内的所述梯度方向的所述梯度强度值求和,并且从所述计算出的和值中减去符合包含在临近所述预定梯度范围的所述其他梯度范围内的所述梯度方向的所述梯度强度值,计算预定的和差特征量;以及
学习单元,使用所述梯度特征量和所述和差特征量,基于预定学习算法,获取每个坐标上的学习参数。
11.如权利要求10所述的存储学习程序的记录介质,其特征在于:
所述预定梯度范围是这样的范围,其中在包括了所有可用梯度方向的整个范围被量化为的四个或者更多的梯度方向中,包括了符合两个或更多量化的梯度方向的梯度特征量;
所述其他梯度范围是与所述梯度范围相邻的范围,其包括了符合其数量与包括在所述梯度范围内的所述梯度方向的数量相同的所述量化的梯度方向的梯度特征量。
12.一种识别装置,其特征在于包括:
梯度特征提取单元,其基于输入的识别对象图案在每个坐标上的亮度与其周边的亮度之间的变化量提取包括每个坐标上的梯度方向及其梯度强度值的梯度特征量;
和差特征提取单元,基于所提取的梯度特征量,通过对符合包含在指示所述预定梯度方向的范围的预定梯度范围内的所述梯度方向的所述梯度强度值求和,并且从所计算出的和值中减去符合包含在临近所述预定梯度范围的其他梯度范围内的梯度方向的所述梯度强度值,计算预定的和差特征量;以及
识别单元,基于所述梯度特征量、所述和差特征量以及通过预定学习算法获取的部分或者全部学习参数,从一个或多个类型中识别识别对象图案所属的类型。
13.如权利要求12所述的识别装置,其特征在于:
所述预定梯度范围是这样的范围,其中在包括了所有可用梯度方向的整个范围被量化为的四个或者更多的梯度方向中,包括了符合两个或更多量化的梯度方向的所述梯度特征量;
所述其他梯度范围是与所述梯度范围相邻的范围,其包括了符合其数量与包括在所述梯度范围内的所述梯度方向的数量相同的所述量化的梯度方向的所述梯度特征量。
14.如权利要求13所述的识别装置,其特征在于:
所述和差特征量提取单元,在符合包括在预定梯度范围中的梯度方向的梯度强度中,对单元数量小于包括在所述梯度范围中的量化的梯度方向的数量的梯度强度值求和,从计算出的和值中减去包含在所述其他梯度范围中的所述单元数量的梯度强度值。
15.如权利要求13或14所述的识别装置,其特征在于:
包括梯度特征数量设置装置,用于根据输入操作设置包括在所述预设梯度范围中和/或所述其它梯度范围中的所述量化的梯度方向的数量。
16.如权利要求12至15任一项所述的识别装置,其特征在于:
所述识别装置包括特征量暂存单元,用于存储包括在识别对象图案的每个坐标上的所述梯度方向及其梯度强度值的所述梯度特征量,并且
所述和差特征提取单元,基于取自所述特征量暂存单元的所述梯度特征量,通过对符合包含在预定梯度范围内的所述梯度方向的所述梯度强度值求和,并且减去符合包含在临近所述预定梯度范围的所述其他梯度范围内的所述梯度方向的所述梯度强度值,计算出和差特征量。
17.如权利要求16所述的识别装置,其特征在于:
所述特征量暂存单元,在相同或相邻区域存储包括在所述识别对象图案的每个坐标上的所述梯度方向及其梯度强度值的各梯度特征量中的符合一个坐标的梯度特征量。
18.如权利要求12至17任一项所述的识别装置,其特征在于:
所述识别装置包括字典存储单元,其针对预定学习对象参数存储使用所述梯度特征量及所述和差特征量基于预定学习算法获取的学习参数;
所述识别单元基于所述梯度特征量、所述和差特征量以及存储在所述字典存储单元中的部分或者全部学习参数,从一个或多个类型中识别识别对象图案所属的类型。
19.如权利要求18所述的识别装置,其特征在于:
所述识别单元,基于所述梯度特征量、所述和差特征量以及从存储在所述字典存储单元中的所述学习参数中被判定为对识别过程有用的学习参数,从一个或多个类型中识别所述识别对象图案所属的类型。
20.如权利要求12至19任一项所述的识别装置,其特征在于:
所述梯度特征提取单元提取被所述识别单元判定为对所述识别过程有用的特定梯度特征量。
21.如权利要求12至20任一项所述的识别装置,其特征在于:
所述和差特征提取单元计算被所述识别单元判定为对所述识别过程有用的特定和差特征量。
22.一种识别方法,其特征在于包括如下步骤:
基于输入的识别对象图案在每个坐标上的亮度与其周边的亮度之间的变化量提取包括每个坐标上的梯度方向及其梯度强度值的梯度特征量;
基于所述提取的梯度特征量,通过对符合包含在指示所述预定梯度方向的范围的预定梯度范围内的所述梯度方向的梯度强度值求和,并且从所计算出的和值中减去符合包含在临近所述预定梯度范围的其他梯度范围内的梯度方向的所述梯度强度值,计算预定的和差特征量;以及
基于所述梯度特征量、所述和差特征量以及通过预定学习算法获取的部分或者全部学习参数,从一个或多个类型中识别所述识别对象图案所属的类型。
23.如权利要求22所述的识别方法,其特征在于:
所述预定梯度范围是这样的范围,其中在包括了所有可用梯度方向的整个范围被量化为的四个或者更多的梯度方向中,包括了符合两个或更多量化的梯度方向的所述梯度特征量;
所述其他梯度范围是与所述梯度范围相邻的范围,其包括了符合其数量与包括在所述梯度范围内的所述梯度方向的数量相同的所述量化的梯度方向的梯度特征量。
24.一种存储识别程序的记录介质,其特征在于使计算机按如下单元工作:
梯度特征提取单元,其基于输入的识别对象图案在每个坐标上的亮度与其周边的亮度之间的变化量提取包括每个坐标上的梯度方向及其梯度强度值的梯度特征量;
和差特征提取单元,基于所提取的梯度特征量,通过对符合包含在指示所述预定梯度方向的范围的预定梯度范围内的所述梯度方向的所述梯度强度值求和,并且从所计算出的和值中减去符合包含在临近所述预定梯度范围的其他梯度范围内的梯度方向的所述梯度强度值,计算预定的和差特征量;
识别单元,其基于所述梯度特征量、所述和差特征量以及通过所述预定学习算法获取的部分或者全部学习参数,从一个或多个类型中识别所述识别对象图案所属的类型。
25.如权利要求24所述的存储识别程序的记录介质,其特征在于:
所述预定梯度范围是这样的范围,在包括了所有可用梯度方向的整个范围被量化为的四个或者更多的梯度方向中,包括了符合两个或更多量化的梯度方向的所述梯度特征量;
所述其他梯度范围是与所述梯度范围相邻的范围,其包括了符合其数量与包括在所述梯度范围内的所述梯度方向的数量相同的所述量化的梯度方向的所述梯度特征量。
26.一种学习识别系统,其特征在于包括:
学习装置,其包括:
梯度特征提取单元,其基于输入的学习对象图案在每个坐标上的亮度与其周边的亮度之间的变化量提取包括每个坐标上的梯度方向及其梯度强度值的梯度特征量;
和差特征提取单元,基于所述提取的梯度特征量,通过对符合包含在指示所述预定梯度方向的范围的预定梯度范围内的所述梯度方向的所述梯度强度值求和,并且从所计算出的和值中减去符合包含在临近所述预定梯度范围的其他梯度范围内的梯度方向的所述梯度强度值,计算预定的和差特征量;和
学习单元,其使用所述梯度特征量以及所述和差特征量,基于预定学习算法,获取每个坐标上的学习参数;以及
识别装置,其包括:
梯度特征提取单元,其基于输入的识别对象图案在每个坐标上的亮度与其周边的亮度之间的变化量提取包括每个坐标上的梯度方向及其梯度强度值的梯度特征量;
和差特征提取单元,基于所提取的梯度特征量,通过对符合包含在预定梯度范围内的所述梯度方向的梯度强度值求和,并且从所计算出的和值中减去符合包含在临近所述预定梯度范围的所述其他梯度范围内的所述梯度方向的所述梯度强度值,计算预定的和差特征量;和
识别单元,其基于所述梯度特征量、所述和差特征量以及由所述学习单元获取的部分或者全部学习参数,从一个或多个类型中识别所述识别对象图案所属的类型。
27.如权利要求26所述的学习识别系统,其特征在于:
所述预定梯度范围是这样的范围,其中在包括了所有可用梯度方向的整个范围被量化为的四个或者更多的梯度方向中,包括了符合两个或更多量化的梯度方向的所述梯度特征量;
所述其他梯度范围是与所述梯度范围相邻的范围,其包括了符合其数量与包括在所述梯度范围内的所述梯度方向的数量相同的所述量化的梯度方向的所述梯度特征量。
28.一种学习识别装置,包括用于从一个或多个类型中识别识别对象图案所属的类型的识别单元,其特征在于:
所述学习识别装置包括:
梯度特征提取单元,其基于输入的学习对象图案在每个坐标上的亮度与其周边的亮度之间的变化量提取包括每个坐标上的梯度方向及其梯度强度值的梯度特征量;
和差特征提取单元,基于所述提取的梯度特征量,通过对符合包含在指示所述预定梯度方向的范围的预定梯度范围内的所述梯度方向的梯度强度值求和,并且从所计算出的和值中减去符合包含在临近所述预定梯度范围的其他梯度范围内的梯度方向的所述梯度强度值,从而计算预定的和差特征量;
学习单元,使用所述梯度特征量以及所述和差特征量,基于预定学习算法,获取每个坐标上的学习参数;
所述梯度特征提取单元,其基于输入的识别对象图案在每个坐标上的亮度与其周边的亮度之间的变化量提取包括每个坐标上的梯度方向及其梯度强度值的梯度特征量;
所述和差特征提取单元,基于所提取的梯度特征量,通过对符合包含在预定梯度范围内的所述梯度方向的梯度强度值求和,并且从所述计算出的和值中减去符合包含在临近所述预定梯度范围的所述其他梯度范围内的所述梯度方向的所述梯度强度值,计算预定的和差特征量;
识别单元,基于从所述识别对象图案计算出的所述梯度特征量和所述和差特征量以及由所述学习单元获取的部分或者全部学习参数,从一个或多个类型中识别所述识别对象图案所属的类型。
29.如权利要求28所述的学习识别装置,其特征在于:
所述预定梯度范围是这样的范围,其中在包括了所有可用梯度方向的整个范围被量化为的四个或者更多的梯度方向中,包括了符合两个或更多量化的梯度方向的梯度特征量;
所述其他梯度范围是与所述梯度范围相邻的范围,其包括了符合其数量与包括在所述梯度范围内的所述梯度方向的数量相同的所述量化的梯度方向的所述梯度特征量。
30.一种学习识别方法,其特征在于包括以下步骤:
基于输入的学习对象图案在每个坐标上的亮度与其周边的亮度之间的变化量提取包括每个坐标上的梯度方向及其梯度强度值的梯度特征量;
基于所述提取的梯度特征量,通过对符合包含在指示所述预定梯度方向的范围的预定梯度范围内的所述梯度方向的所述梯度强度值求和,并且从所计算出的和值中减去符合包含在临近所述预定梯度范围的其他梯度范围内的所述梯度方向的所述梯度强度值,计算预定的和差特征量;
使用所述梯度特征量以及所述和差特征量,基于预定学习算法,获取每个坐标上的学习参数;
基于输入的识别对象图案在每个坐标上的亮度与其周边的亮度之间的变化量提取包括每个坐标上的梯度方向及其梯度强度值的梯度特征量;
基于所述提取的梯度特征量,通过对符合包含在预定梯度范围内的所述梯度方向的梯度强度值求和,并且从所述计算出的和值中减去符合包含在临近所述预定梯度范围的所述其他梯度范围内的所述梯度方向的所述梯度强度值,计算预定的和差特征量;
基于从所述识别对象图案计算出的所述梯度特征量和所述和差特征量以及由所述学习单元获取的部分或者全部学习参数,从一个或多个类型中识别所述识别对象图案所属的类型。
31.如权利要求30所述的学习识别方法,其特征在于:
所述预定梯度范围是这样的范围,其中在包括了所有可用梯度方向的整个范围被量化为的四个或者更多的梯度方向中,包括了符合两个或更多量化的梯度方向的所述梯度特征量;
所述其他梯度范围是与所述梯度范围相邻的范围,其包括了符合其数量与包括在所述梯度范围内的所述梯度方向的数量相同的所述量化的梯度方向的梯度特征量。
32.一种存储学习识别程序的记录介质,其特征在于使得:
计算机按如下单元工作:
梯度特征提取单元,其基于输入的学习对象图案在每个坐标上的亮度与其周边的亮度之间的变化量提取包括每个坐标上的梯度方向及其梯度强度值的梯度特征量;
和差特征提取单元,基于所述提取的梯度特征量,通过对符合包含在指示所述预定梯度方向的范围的预定梯度范围内的所述梯度方向的所述梯度强度值求和,并且从所计算出的和值中减去符合包含在临近所述预定梯度范围的其他梯度范围内的梯度方向的所述梯度强度值,计算预定的和差特征量;
学习单元,使用所述梯度特征量以及所述和差特征量,基于预定学习算法,获取每个坐标上的学习参数;
所述梯度特征提取单元,基于输入的识别对象图案在每个坐标上的亮度与其周边的亮度之间的变化量提取包括每个坐标上的梯度方向及其梯度强度值的梯度特征量;
所述和差特征提取单元,基于提取的梯度特征量,通过对符合包含在预定梯度范围内的梯度方向的所述梯度强度值求和,并且从所述计算出的和值中减去符合包含在临近所述预定梯度范围的所述其他梯度范围内的所述梯度方向的所述梯度强度值,计算预定的和差特征量;
所述识别单元,基于从所述识别对象图案计算出的梯度特征量和所述和差特征量以及由所述学习单元获取的部分或者全部学习参数,从一个或多个类型中识别所述识别对象图案所属的类型。
33.如权利要求32所述的存储学习识别程序的记录介质,其特征在于:
所述预定梯度范围是这样的范围,其中在包括了所有可用梯度方向的整个范围被量化为的四个或者更多的梯度方向中,包括了符合两个或更多量化的梯度方向的梯度特征量;
所述其他梯度范围是与所述梯度范围相邻的范围,其包括了符合其数量与包括在所述梯度范围内的所述梯度方向的数量相同的所述量化的梯度方向的所述梯度特征量。
CN201080060941.4A 2010-01-06 2010-12-24 学习装置、识别装置、学习识别系统和学习识别装置 Active CN102713974B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2010001265 2010-01-06
JP2010-001265 2010-01-06
PCT/JP2010/073873 WO2011083749A1 (ja) 2010-01-06 2010-12-24 学習装置、識別装置、学習識別システム及び学習識別装置

Publications (2)

Publication Number Publication Date
CN102713974A true CN102713974A (zh) 2012-10-03
CN102713974B CN102713974B (zh) 2015-09-30

Family

ID=44305485

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201080060941.4A Active CN102713974B (zh) 2010-01-06 2010-12-24 学习装置、识别装置、学习识别系统和学习识别装置

Country Status (5)

Country Link
US (1) US9036903B2 (zh)
EP (1) EP2523162B1 (zh)
JP (1) JP5768719B2 (zh)
CN (1) CN102713974B (zh)
WO (1) WO2011083749A1 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011083749A1 (ja) * 2010-01-06 2011-07-14 日本電気株式会社 学習装置、識別装置、学習識別システム及び学習識別装置
US8842909B2 (en) * 2011-06-30 2014-09-23 Qualcomm Incorporated Efficient blending methods for AR applications
JP5833880B2 (ja) * 2011-10-07 2015-12-16 キヤノンイメージングシステムズ株式会社 情報処理装置、デバイス制御装置、デバイス制御システム、およびその制御方法
US11521460B2 (en) 2018-07-25 2022-12-06 Konami Gaming, Inc. Casino management system with a patron facial recognition system and methods of operating same
AU2019208182B2 (en) 2018-07-25 2021-04-08 Konami Gaming, Inc. Casino management system with a patron facial recognition system and methods of operating same
US11803960B2 (en) * 2020-08-12 2023-10-31 Kla Corporation Optical image contrast metric for optical target search

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1901607A (zh) * 2005-07-21 2007-01-24 华晶科技股份有限公司 二维影像色彩信息重建方法
CN101511031A (zh) * 2008-12-15 2009-08-19 四川虹微技术有限公司 一种用于Bayer Data插值的方法
CN101515325A (zh) * 2009-04-08 2009-08-26 北京邮电大学 基于字符切分和颜色聚类的数字视频中的字符提取方法
CN101551863A (zh) * 2009-05-22 2009-10-07 西安电子科技大学 基于非下采样轮廓波变换的遥感图像道路提取方法

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2605807B2 (ja) 1988-06-23 1997-04-30 日本電気株式会社 特徴抽出方式
JPH09171553A (ja) * 1995-12-20 1997-06-30 Hitachi Ltd 画像認識方法
US6519372B1 (en) * 1999-08-31 2003-02-11 Lockheed Martin Corporation Normalized crosscorrelation of complex gradients for image autoregistration
GB2395777B (en) * 2002-11-27 2005-12-28 Taylor Hobson Ltd A surface profiling apparatus
JP4382472B2 (ja) * 2003-12-26 2009-12-16 株式会社リコー 網点領域識別装置、および網点領域識別方法
JP4544891B2 (ja) 2004-03-30 2010-09-15 幸靖 吉永 線抽出のための画像処理方法及びそのプログラム、線集中度画像フィルタ
JP2006048322A (ja) 2004-08-04 2006-02-16 Seiko Epson Corp オブジェクト画像検出装置、顔画像検出プログラムおよび顔画像検出方法
JP4103898B2 (ja) * 2005-04-12 2008-06-18 株式会社日立製作所 地図情報更新方法及び地図更新装置
JP4661319B2 (ja) * 2005-04-18 2011-03-30 パナソニック電工株式会社 画像処理装置及び画像処理方法
JP4788525B2 (ja) 2006-08-30 2011-10-05 日本電気株式会社 物体識別パラメータ学習システム、物体識別パラメータ学習方法および物体識別パラメータ学習用プログラム
JP4636064B2 (ja) * 2007-09-18 2011-02-23 ソニー株式会社 画像処理装置および画像処理方法、並びにプログラム
JP5489425B2 (ja) 2008-06-23 2014-05-14 株式会社ナンバースリー 酸性染毛料組成物の製造方法
CN101894262B (zh) * 2009-05-20 2014-07-09 索尼株式会社 对图像进行分类的方法和设备
WO2011083749A1 (ja) * 2010-01-06 2011-07-14 日本電気株式会社 学習装置、識別装置、学習識別システム及び学習識別装置
US8705881B2 (en) * 2011-09-02 2014-04-22 Adobe Systems Incorporated Motion deblurring for text images

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1901607A (zh) * 2005-07-21 2007-01-24 华晶科技股份有限公司 二维影像色彩信息重建方法
CN101511031A (zh) * 2008-12-15 2009-08-19 四川虹微技术有限公司 一种用于Bayer Data插值的方法
CN101515325A (zh) * 2009-04-08 2009-08-26 北京邮电大学 基于字符切分和颜色聚类的数字视频中的字符提取方法
CN101551863A (zh) * 2009-05-22 2009-10-07 西安电子科技大学 基于非下采样轮廓波变换的遥感图像道路提取方法

Also Published As

Publication number Publication date
WO2011083749A1 (ja) 2011-07-14
JPWO2011083749A1 (ja) 2013-05-13
CN102713974B (zh) 2015-09-30
US9036903B2 (en) 2015-05-19
JP5768719B2 (ja) 2015-08-26
EP2523162A1 (en) 2012-11-14
EP2523162B1 (en) 2019-05-08
EP2523162A4 (en) 2018-01-10
US20120281909A1 (en) 2012-11-08

Similar Documents

Publication Publication Date Title
CN112446270B (zh) 行人再识别网络的训练方法、行人再识别方法和装置
CN110909651B (zh) 视频主体人物的识别方法、装置、设备及可读存储介质
Jiang et al. Robust feature matching for remote sensing image registration via linear adaptive filtering
FI123982B (fi) Kasvojen tunnistaminen digitaalisissa kuvissa
US20230021661A1 (en) Forgery detection of face image
CN108399386A (zh) 饼图中的信息提取方法及装置
CN110059728B (zh) 基于注意力模型的rgb-d图像视觉显著性检测方法
CN102713974A (zh) 学习装置、识别装置、学习识别系统和学习识别装置
EP2235680A1 (en) Invariant visual scene and object recognition
Bhattacharya et al. Interleaved deep artifacts-aware attention mechanism for concrete structural defect classification
CN114444565B (zh) 一种图像篡改检测方法、终端设备及存储介质
JP7225731B2 (ja) 多変数データシーケンスの画像化
CN111222558B (zh) 图像处理方法及存储介质
Thakur et al. Hybrid deep learning and machine learning approach for passive image forensic
CN115578590A (zh) 基于卷积神经网络模型的图像识别方法、装置及终端设备
CN111126250A (zh) 一种基于ptgan的行人重识别方法及装置
Rodríguez et al. HD-MR: A new algorithm for number recognition in electrical meters
CN113139540A (zh) 背板检测方法及设备
CN117197086A (zh) 图像检测方法、装置、计算机设备和存储介质
CN114820755B (zh) 一种深度图估计方法及系统
CN116152542A (zh) 图像分类模型的训练方法、装置、设备及存储介质
CN111353577A (zh) 基于多任务的级联组合模型的优化方法、装置及终端设备
Kotyza et al. Detection of directions in an image as a method for circle detection
Dai et al. OAMatcher: An overlapping areas-based network with label credibility for robust and accurate feature matching
CN109740646B (zh) 一种图像差异比对方法及其系统、电子装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1177040

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant