CN103577840A - 物品识别方法 - Google Patents

物品识别方法 Download PDF

Info

Publication number
CN103577840A
CN103577840A CN201310526390.1A CN201310526390A CN103577840A CN 103577840 A CN103577840 A CN 103577840A CN 201310526390 A CN201310526390 A CN 201310526390A CN 103577840 A CN103577840 A CN 103577840A
Authority
CN
China
Prior art keywords
picture
pixel
photo
feature
center
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310526390.1A
Other languages
English (en)
Other versions
CN103577840B (zh
Inventor
庄礼鸿
吴明霓
翁至中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shantou University
Original Assignee
Shantou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shantou University filed Critical Shantou University
Priority to CN201310526390.1A priority Critical patent/CN103577840B/zh
Publication of CN103577840A publication Critical patent/CN103577840A/zh
Application granted granted Critical
Publication of CN103577840B publication Critical patent/CN103577840B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开了一种物品识别方法,包括获取图片特征再将获取的图片特征向量与数据库中的图片特征向量进行比对,利用欧氏距离确定所拍摄的照片的物品信息。本发明采用人类视觉较敏感的HSV色彩空间,将纹理特征和颜色特征结合之后使用直方图来统计,可以大大提高辨识率和辨识范围,并且通过获取物体的重心来使物体在旋转不同角度时都能准确地对其进行特征的获取,还增加了对照片特征水平翻转、垂直翻转机像素移位的特征比对,进一步提高辨识的准确率。

Description

物品识别方法
技术领域
本发明涉及一种识别方法,尤其涉及一种对物品照片的特征获取进行识别的方法
背景技术
电脑技术的进步及储存装置成本的降低使数位影像在许多方面被广泛应用,如罪犯辨识、影像图库、人造卫星影像搜寻等。
过去,信息大多仅限于以文字的方式呈现,由于信息的多样化,现今的信息很多是各种多媒体资料。而如何从数量庞大的多媒体信息中选取复合条件的数据,包括以前的文字关键字查询,以及利用图像特征去以图找图的方式,已成了多媒体研究的主流方向之一。由于影像中包含许多纹理、形状或颜色等不易以关键字描述的特征,因此需要一种能通过图像的特征如颜色、轮廓或形状进行辨别的方法进行数据的比对。
发明内容
本发明所要解决的技术问题在于,提供一种物品的识别方法,可以通过拍摄物体的照片并与数据库的数据进行比对从而快速查询出相同或相似的物件。本方法包括获取图片特征并将获取的图片特征向量与数据库中的图片特征向量进行比对,利用欧氏距离确定所拍摄的照片的物品信息。
获取图片特征的步骤包括:
(S1)将拍摄的照片由RGB色彩空间模式转为HSV色彩空间模式,转换的公式为
S = MAX - MIN MAX
V = MAX 255
其中的MAX=max(R,G,B)與MIN=min(R,G,B)分別為取得RGB色彩空間中的最大值與最小值,采用HSV可结合颜色信息及纹理特征,能大大地提高辨识率及可辨识范围。
(S2)将HSV色彩空间模式中的H、S、V分别量化为8、3、3个区域,从而将HSV色彩空间量化为72色,将图像的每个像素点(H,S,V)量化的结果为(H`,S`,V`),对HSV色彩空间量化为72色之后可减少色差对图像比对的影响并降低图像处理时间。
(S3)将量化后的照片色彩按照以下公式转换为平面坐标,转换结果是(H``,S``,V``),其方法为
Figure BDA0000404934000000023
Figure BDA0000404934000000024
Figure BDA0000404934000000025
(S4)将转换为平面坐标的照片的像素点的数值使用边缘检测计算出X轴及Y轴的变化趋势,检测的公式为:
G x = - 1 0 1 - 2 0 2 - 1 0 1
G y = 1 2 1 0 0 0 - 1 - 2 1 |G|=|Gx|+|Gy|
进一步地,由步骤(S4)得到两个向量并计算出这两个向量的夹角θ,可用于判断在某个边缘的属性上是否相似,夹角θ的计算公式为:
| a | = ( H x ′ ′ ) 2 + ( S x ′ ′ ) 2 + ( V x ′ ′ ) 2
| b | = ( H y ′ ′ ) 2 + ( S y ′ ′ ) 2 + ( V y ′ ′ ) 2
αβ = H x ′ ′ H y ′ ′ + S x ′ ′ S y ′ ′ + V x ′ ′ V y ′ ′
Figure BDA00004049340000000211
Figure BDA0000404934000000031
(S5)获取照片上的微结构特征,获取的步骤为
(S51)将图片切割为若干个不重叠的正方形微结构区域;
(S52)对每一个微结构区域内的周围像素点与中心像素点做比较;
(S53)将与中心像素点相同的周围像素点保留,否则删除;
(S54)将微结构区域的中心比对位置由正中央依次往右、下、右下移动一个像素,对图像重新进行分割,再进行(S53)的判断步骤;
(S55)将上述四种区块切割运算后的保留像素进行合并,得到所需的微结构特征。
(S51)对每一个微结构单元区域内周围像素点与中心像素点做比较;
(S52)将与中心像素点相同的像素点保留,否则删除。
(S6)将步骤(S5)获得的特征位置与步骤(S2)获得的色彩数据相结合,公式为:
{ if M ( i , j ) and C ( i , j ) not Null , R ( i , j ) = M ( i , j ) + C ( i , j ) otherwise , ignored
其中,M(i,j)为结构特征,C(i,j)为HSV色彩空间的特征。
(S7)将步骤(S6)得到的特征向量使用直方图统计,统计的步骤包括
(S71)由步骤S6取得的特征计算出图像大小并计算出最小外接圆的半径及圆心;
(S72)将极坐标的圆心与上述步骤的外接圆圆心重叠,并将外接圆分为若干个同心圆组成的区域;
(S73)将每个区域所对应的特征部分记录起来并用直方图统计。
最后,将获取的图片特征向量与数据库中的图片特征向量进行比对,利用欧氏距离确定所拍摄的照片的物品信息。
其判断公式为:
E = ( P i - Q i ) 2 + ( P j - Q j ) 2
其中P与Q分别为数据库中的图片和拍摄的图片,而i和j则代表直方图中每个区间的统计个数。
进一步地,步骤S4对平面坐标进行边缘检测之后计算出物体的长与宽,并将特征区域的中心点并移至照片量化后的中心点。
在一个三维空间中,若将其中的一轴固定(如z轴),经过任意旋转,其参数可能会改变,但是函数值保持不变,计算出物体的长与宽后可以得出物体的中心,以此可以在物体旋转不同角度时都能准确对其进行特征的获取。
进一步地,为了进一步提高识别的准确率及识别范围,除了获取原照片的特征数据进行对比之外,还包括将照片特征水平翻转、垂直翻转及像素移位获取特征数据再进行对比。
实施本发明,具有如下有益效果:
本发明采用人类视觉较敏感的HSV色彩空间,将纹理特征和颜色特征结合之后使用直方图来统计,可以大大提高辨识率和辨识范围,并且通过获取物体的重心来使物体在旋转不同角度时都能准确地对其进行特征的获取,还增加了对照片特征水平翻转、垂直翻转机像素移位的特征比对,进一步提高辨识的准确率。
附图说明
图1是本发明流程示意图;
图2是本发明流程S52及S53示意图;
图3是本发明流程S54示意图;
图4是本发明流程S55示意图;
图5是将特征数据的中心点移动到图片中心点示意图;
图6是本发明直方图统计方法示意图;
图7是将照片特征数据水平翻转示意图;
图8是将照片特征数据垂直翻转示意图;
图9是将照片特征数据向左平移一个像素点示意图;
图10是用于训练的资料库图片。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述。
如图1所示,本发明的识别方法的步骤包括
获取图片特征
(S1)将拍摄的图片像素由RGB色彩空间模式转为HSV色彩空间模式;
(S2)将HSV色彩空间模式中的H、S、V分别量化为8、3、3个区域,从而将照片像素点的值量化为72色;
(S3)将量化后的图片像素点转换为平面坐标;
(S4)将转换为平面坐标的照片像素值使用边缘检测计算出X轴及Y轴的变化趋势,本发明方案优选采用Sobel边缘检测;
(S5)获取照片上的微结构特征;
(S6)将步骤S5获得的特征位置与步骤S2获得的色彩数据相结合;
(S7)将步骤S6得到的特征使用直方图统计图片的特征向量;
图片特征比对
将获取的图片特征向量与数据库中的图片特征向量进行比对,利用欧氏距离确定所拍摄的照片的物品信息。
其中S5包括
(S51)将图片切割为若干个不重叠的正方形微结构区域;
(S52)对每一个微结构区域内的周围像素点与中心像素点做比较;
(S53)将与中心像素点相同的周围像素点保留,否则删除;
(S54)将微结构区域的中心比对位置由正中央依次往右、下、右下移动一个像素,对图像重新进行分割,再进行S53的判断步骤;
(S55)将上述四种区块切割运算后的保留像素进行合并,得到所需的微结构特征。
步骤S7包括
(S71)由步骤S6取得的特征计算出图像大小并计算出最小外接圆的半径及圆心;
(S72)将极坐标的圆心与上述步骤的外接圆圆心重叠,并将外接圆分为若干个同心圆组成的区域;
(S73)将每个区域所对应的特征部分记录起来并用直方图统计。
获取照片上微结构特征的步骤参照图2~图4所示,采用获取照片上微结构特征在本实施例中如图3、图4所示,图片的大小为6×6像素。如图3所示,将该图片分割为不重叠的四个3×3区块将每个中心点的像素与周围的像素做比较,相同的像素点保留,不相同的删除如图2所示。
此外,该方式不止通过图2中区域的中心的为基准做比较,还以其他像素点作为基准点做同样运算,如图3所示,让图2中的区域的对比位置依次往右、下及右下的位置各移动一个像素并做同样的运算。
图4是以图3所示方式取得不同基准点说保留的不同像素之后再进行合并,得到最终的特征像素的位置。
图6是本发明直方图统计方法示意图,在如图的实施例中,将获取的特征量化为12个区间,由内到外同心圆的个数为3个,因此共有36个特征区如图6a所示。
由步骤S6取得的特征计算出图像大小并计算出最小外接圆的半径及圆心,再将极坐标的圆心与上述步骤的外接圆圆心重叠(如图5所示),最后将取得的特征点对应至极坐标上,图6a中的点对应到极坐标中的区间,将每个区间的特征记录统计起来并用直方图来统计(如图6a、图6b所示)。
参照图7~图9所示,本发明除了获取原照片的特征数据进行对比之外,还包括将照片特征水平翻转、垂直翻转及像素移位获取特征数据再进行对比。
如图9所示,图片特征向左平移一个像素时,一开始先将第一栏的像素移到最后一栏,第二栏移到第一栏,其余的依次类推。
采用本发明方法,如图10所示,使用16张自行拍摄的图片作为训练资料库,其大小为342×256像素组成。测试资料库是由训练资料库中的原始图片经过了缩小、偏移及旋转组成的,共192张图片,缩小的图片有16张,偏移的图片有偏左和偏右各16张共32张,原图片16张,旋转的图片共8×16=128张。其中旋转图片和原图片共由8个角度组成,除了缩小图片为原图片小一半,其大小为171×128像素,其他则和原图片大小相同。
采用本发明方法进行物品识别的准确率如表1至表5所示,从表中可以得知,在比对准确率上均达到了100%。
而表中的相似数量是检测是否可以根据本发明方法从类似的物品中准确找出对应的物品。
本实施例将编号b与p分为一组,e、i、o为一组,其余的则为宝特瓶、钢杯及马克杯各自为一组。前两组的纹理几乎相同,区别仅在于颜色,在此情况下,e、i和o的分组识别率为100%;b与p的分组准确率稍微降低。
表1原始影像查询之正确率
Figure BDA0000404934000000071
表2偏左影像查询之正确率
Figure BDA0000404934000000072
Figure BDA0000404934000000081
表3偏右影像查询之正确率
Figure BDA0000404934000000082
表4缩小影像查询之正确率
Figure BDA0000404934000000083
表5旋转影像查询之正确率
Figure BDA0000404934000000084
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。

Claims (5)

1.一种物品识别方法,其特征在于,包括以下步骤:
获取图片特征
(S1)将拍摄的图片像素由RGB色彩空间模式转为HSV色彩空间模式;
(S2)将HSV色彩空间模式中的H、S、V分别量化为8、3、3个区域,从而将照片像素点的值量化为72色;
(S3)将量化后的图片像素点转换为平面坐标;
(S4)将转换为平面坐标的照片像素值使用边缘检测计算出X轴及Y轴的变化趋势;
(S5)获取照片上的微结构特征;
(S6)将步骤S5获得的特征位置与步骤S2获得的色彩数据相结合;
(S7)将步骤S6得到的特征使用直方图统计图片的特征向量;
图片特征比对
将获取的图片特征向量与数据库中的图片特征向量进行比对,利用欧氏距离确定所拍摄的照片的物品信息。
2.根据权利要求1所述的识别方法,其特征在于,步骤(S5)中微结构特征获取的方法包括以下步骤,
(S51)将图片切割为若干个不重叠的正方形微结构区域;
(S52)对每一个微结构区域内的周围像素点与中心像素点做比较;
(S53)将与中心像素点相同的周围像素点保留,否则删除;
(S54)将微结构区域的中心比对位置由正中央依次往右、下、右下移动一个像素,对图像重新进行分割,再进行S53的判断步骤;
(S55)将上述四种区块切割运算后的保留像素进行合并,得到所需的微结构特征。
3.根据权利要求1所述的识别方法,其特征在于,步骤S4对平面坐标进行边缘检测之后计算出物体的长与宽,并将特征区域的中心并移至照片量化后的中心点。
4.根据权利要求1所述的识别方法,其特征在于,使用直方图统计的方法包括以下步骤,
(S71)由步骤S6取得的特征计算出图像大小并计算出最小外接圆的半径及圆心;
(S72)将极坐标的圆心与上述步骤的外接圆圆心重叠,并将外接圆分为若干个同心圆组成的区域;
(S73)将每个区域所对应的特征部分记录起来并用直方图统计。
5.根据权利要求1所述的识别方法,其特征在于,在图片特征对比时,除了获取原照片的特征数据进行对比之外,还包括将照片特征水平翻转、垂直翻转机像素移位获取特征数据再进行对比。
CN201310526390.1A 2013-10-30 2013-10-30 物品识别方法 Expired - Fee Related CN103577840B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310526390.1A CN103577840B (zh) 2013-10-30 2013-10-30 物品识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310526390.1A CN103577840B (zh) 2013-10-30 2013-10-30 物品识别方法

Publications (2)

Publication Number Publication Date
CN103577840A true CN103577840A (zh) 2014-02-12
CN103577840B CN103577840B (zh) 2017-05-31

Family

ID=50049588

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310526390.1A Expired - Fee Related CN103577840B (zh) 2013-10-30 2013-10-30 物品识别方法

Country Status (1)

Country Link
CN (1) CN103577840B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105224913A (zh) * 2015-09-01 2016-01-06 上海斐讯数据通信技术有限公司 一种物品数量检测方法及装置
CN105824928A (zh) * 2016-03-17 2016-08-03 广东欧珀移动通信有限公司 移动终端、服务器、基于内容的图像识别搜索方法及系统
CN106203264A (zh) * 2016-06-28 2016-12-07 深圳市元征科技股份有限公司 危险物品检测方法和装置
CN107133573A (zh) * 2017-04-12 2017-09-05 宇龙计算机通信科技(深圳)有限公司 一种寻找物品的方法和装置
CN109389094A (zh) * 2018-10-23 2019-02-26 北京无线电计量测试研究所 一种稳定的虹膜特征提取与匹配方法
CN109389582A (zh) * 2018-09-11 2019-02-26 广东智媒云图科技股份有限公司 一种图像主体亮度的识别方法及装置
CN109622400A (zh) * 2018-12-26 2019-04-16 深圳市越疆科技有限公司 视觉智能识别及适配金饰的方法
CN109657083A (zh) * 2018-12-27 2019-04-19 广州华迅网络科技有限公司 纺织品图片特征库的建立方法和装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102663401A (zh) * 2012-04-18 2012-09-12 哈尔滨工程大学 一种图像特征提取和描述方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102663401A (zh) * 2012-04-18 2012-09-12 哈尔滨工程大学 一种图像特征提取和描述方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
GUANGHAI LIU等: "Image retrieval based on micro-structure descriptor", 《PATTERN RECOGNITION》 *
张水利: "基于量化颜色空间的彩色图像检索算法", 《计算机仿真》 *
张玲等: "一种基于极坐标下分块的商标图像检索新方法", 《小型微型计算机系统》 *
曹莉华: "基于多种主色调的图像检索算法研究与实现", 《计算机研究与发展》 *
王华等: "一种基于基元的彩色图像检索方法", 《计算机系统应用》 *
陈秀新等: "三位量化颜色直方图在彩色图像检索中的应用", 《计算机应用与软件》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105224913A (zh) * 2015-09-01 2016-01-06 上海斐讯数据通信技术有限公司 一种物品数量检测方法及装置
CN105824928A (zh) * 2016-03-17 2016-08-03 广东欧珀移动通信有限公司 移动终端、服务器、基于内容的图像识别搜索方法及系统
CN106203264A (zh) * 2016-06-28 2016-12-07 深圳市元征科技股份有限公司 危险物品检测方法和装置
CN107133573A (zh) * 2017-04-12 2017-09-05 宇龙计算机通信科技(深圳)有限公司 一种寻找物品的方法和装置
CN109389582A (zh) * 2018-09-11 2019-02-26 广东智媒云图科技股份有限公司 一种图像主体亮度的识别方法及装置
CN109389582B (zh) * 2018-09-11 2020-06-26 广东智媒云图科技股份有限公司 一种图像主体亮度的识别方法及装置
CN109389094A (zh) * 2018-10-23 2019-02-26 北京无线电计量测试研究所 一种稳定的虹膜特征提取与匹配方法
CN109389094B (zh) * 2018-10-23 2021-04-16 北京无线电计量测试研究所 一种稳定的虹膜特征提取与匹配方法
CN109622400A (zh) * 2018-12-26 2019-04-16 深圳市越疆科技有限公司 视觉智能识别及适配金饰的方法
CN109657083A (zh) * 2018-12-27 2019-04-19 广州华迅网络科技有限公司 纺织品图片特征库的建立方法和装置
CN109657083B (zh) * 2018-12-27 2020-07-14 广州华迅网络科技有限公司 纺织品图片特征库的建立方法和装置

Also Published As

Publication number Publication date
CN103577840B (zh) 2017-05-31

Similar Documents

Publication Publication Date Title
CN103577840A (zh) 物品识别方法
Ju et al. Depth-aware salient object detection using anisotropic center-surround difference
CN106447676B (zh) 一种基于快速密度聚类算法的图像分割方法
CN103530881B (zh) 适用于移动终端的户外增强现实无标志点跟踪注册方法
CN105809651B (zh) 基于边缘非相似性对比的图像显著性检测方法
CN104978567B (zh) 基于场景分类的车辆检测方法
CN104156965B (zh) 一种矿井监控图像自动快速拼接方法
CN103473551A (zh) 基于sift算子的台标识别方法及系统
CN104881671B (zh) 一种基于2D‑Gabor的高分遥感影像局部特征提取方法
CN104850850A (zh) 一种结合形状和颜色的双目立体视觉图像特征提取方法
CN104182973A (zh) 基于圆形描述算子csift的图像复制粘贴检测方法
CN103207898A (zh) 一种基于局部敏感哈希的相似人脸快速检索方法
CN104077605A (zh) 一种基于颜色拓扑结构的行人搜索识别方法
CN110321769A (zh) 一种多尺寸货架商品检测方法
US20170161587A1 (en) Image description and image recognizable method
CN102117337B (zh) 一种融合空间信息的Bag of Words图像检索方法
CN103383700A (zh) 基于边缘方向差直方图的图像检索方法
CN108960115A (zh) 基于角点的多方向文本检测方法
CN103218604A (zh) 交通场景中基于路面提取的行人检测方法
CN105427333A (zh) 视频序列图像的实时配准方法、系统及拍摄终端
CN102446356A (zh) 一种获取均匀分布匹配点的遥感影像并行自适应匹配方法
CN103399863B (zh) 基于边缘方向差特征袋的图像检索方法
CN107578424A (zh) 一种基于时空分类的动态背景差分检测方法、系统及装置
CN103744903B (zh) 一种基于草图的场景图像检索方法
Tao et al. F-PVNet: Frustum-level 3-D object detection on point–voxel feature representation for autonomous driving

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170531

Termination date: 20191030

CF01 Termination of patent right due to non-payment of annual fee