CN103577840B - 物品识别方法 - Google Patents
物品识别方法 Download PDFInfo
- Publication number
- CN103577840B CN103577840B CN201310526390.1A CN201310526390A CN103577840B CN 103577840 B CN103577840 B CN 103577840B CN 201310526390 A CN201310526390 A CN 201310526390A CN 103577840 B CN103577840 B CN 103577840B
- Authority
- CN
- China
- Prior art keywords
- picture
- feature
- photo
- pixel
- center
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Image Analysis (AREA)
Abstract
本发明公开了一种物品识别方法,包括获取图片特征再将获取的图片特征向量与数据库中的图片特征向量进行比对,利用欧氏距离确定所拍摄的照片的物品信息。本发明采用人类视觉较敏感的HSV色彩空间,将纹理特征和颜色特征结合之后使用直方图来统计,可以大大提高辨识率和辨识范围,并且通过获取物体的重心来使物体在旋转不同角度时都能准确地对其进行特征的获取,还增加了对照片特征水平翻转、垂直翻转机像素移位的特征比对,进一步提高辨识的准确率。
Description
技术领域
本发明涉及一种识别方法,尤其涉及一种对物品照片的特征获取进行识别的方法
背景技术
电脑技术的进步及储存装置成本的降低使数位影像在许多方面被广泛应用,如罪犯辨识、影像图库、人造卫星影像搜寻等。
过去,信息大多仅限于以文字的方式呈现,由于信息的多样化,现今的信息很多是各种多媒体资料。而如何从数量庞大的多媒体信息中选取复合条件的数据,包括以前的文字关键字查询,以及利用图像特征去以图找图的方式,已成了多媒体研究的主流方向之一。由于影像中包含许多纹理、形状或颜色等不易以关键字描述的特征,因此需要一种能通过图像的特征如颜色、轮廓或形状进行辨别的方法进行数据的比对。
发明内容
本发明所要解决的技术问题在于,提供一种物品的识别方法,可以通过拍摄物体的照片并与数据库的数据进行比对从而快速查询出相同或相似的物件。本方法包括获取图片特征并将获取的图片特征向量与数据库中的图片特征向量进行比对,利用欧氏距离确定所拍摄的照片的物品信息。
获取图片特征的步骤包括:
(S1)将拍摄的照片由RGB色彩空间模式转为HSV色彩空间模式,转换的公式为
其中的MAX=max(R,G,B)與MIN=min(R,G,B)分別為取得RGB色彩空間中的最大值與最小值,采用HSV可结合颜色信息及纹理特征,能大大地提高辨识率及可辨识范围。
(S2)将HSV色彩空间模式中的H、S、V分别量化为8、3、3个区域,从而将HSV色彩空间量化为72色,将图像的每个像素点(H,S,V)量化的结果为(H`,S`,V`),对HSV色彩空间量化为72色之后可减少色差对图像比对的影响并降低图像处理时间。
(S3)将量化后的照片色彩按照以下公式转换为平面坐标,转换结果是(H``,S``,V``),其方法为
H″=S·cos H″
S″=S·sin H″
V″=V″
(S4)将转换为平面坐标的照片的像素点的数值使用边缘检测计算出X轴及Y轴的变化趋势,检测的公式为:
|G|=|Gx|+|Gy|
进一步地,由步骤(S4)得到两个向量并计算出这两个向量的夹角θ,可用于判断在某个边缘的属性上是否相似,夹角θ的计算公式为:
αβ=H″xH″y+S″xS″y+V″xV″y
(S5)获取照片上的微结构特征,获取的步骤为
(S51)将图片切割为若干个不重叠的正方形微结构区域;
(S52)对每一个微结构区域内的周围像素点与中心像素点做比较;
(S53)将与中心像素点相同的周围像素点保留,否则删除;
(S54)将微结构区域的中心比对位置由正中央依次往右、下、右下移动一个像素,对图像重新进行分割,再进行(S53)的判断步骤;
(S55)将S54中原结构区块及依次移动后重新分割的四种区块切割运算后的保留像素进行合并,得到所需的微结构特征。
(S51)对每一个微结构单元区域内周围像素点与中心像素点做比较;
(S52)将与中心像素点相同的像素点保留,否则删除。
(S6)将步骤(S5)获得的微结构特征位置与步骤(S2)获得的色彩数据相结合,公式为:
其中,M(i,j)为结构特征,C(i,j)为HSV色彩空间的特征。
(S7)将步骤(S6)得到的特征向量使用直方图统计,统计的步骤包括
(S71)由步骤S6取得的特征计算出图像大小并计算出最小外接圆的半径及圆心;
(S72)将极坐标的圆心与上述步骤的外接圆圆心重叠,并将外接圆分为若干个同心圆组成的区域;
(S73)将每个区域所对应的特征部分记录起来并用直方图统计。
最后,将获取的图片特征向量与数据库中的图片特征向量进行比对,利用欧氏距离确定所拍摄的照片的物品信息。
其判断公式为:
其中P与Q分别为数据库中的图片和拍摄的图片,而i和j则代表直方图中每个区间的统计个数。
进一步地,步骤S4对平面坐标进行边缘检测之后计算出物体的长与宽,并将特征区域的中心点移至照片量化后的中心点。
在一个三维空间中,若将其中的一轴固定(如z轴),经过任意旋转,其参数可能会改变,但是函数值保持不变,计算出物体的长与宽后可以得出物体的中心,以此可以在物体旋转不同角度时都能准确对其进行特征的获取。
进一步地,为了进一步提高识别的准确率及识别范围,除了获取原照片的特征数据进行对比之外,还包括将照片特征水平翻转、垂直翻转及像素移位获取特征数据再进行对比。
实施本发明,具有如下有益效果:
本发明采用人类视觉较敏感的HSV色彩空间,将纹理特征和颜色特征结合之后使用直方图来统计,可以大大提高辨识率和辨识范围,并且通过获取物体的重心来使物体在旋转不同角度时都能准确地对其进行特征的获取,还增加了对照片特征水平翻转、垂直翻转机像素移位的特征比对,进一步提高辨识的准确率。
附图说明
图1是本发明流程示意图;
图2是本发明流程S52及S53示意图;
图3是本发明流程S54示意图;
图4是本发明流程S55示意图;
图5是将特征数据的中心点移动到图片中心点示意图;
图6是本发明直方图统计方法示意图;
图7是将照片特征数据水平翻转示意图;
图8是将照片特征数据垂直翻转示意图;
图9是将照片特征数据向左平移一个像素点示意图;
图10是用于训练的资料库图片。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述。
如图1所示,本发明的识别方法的步骤包括
获取图片特征
(S1)将拍摄的图片像素由RGB色彩空间模式转为HSV色彩空间模式;
(S2)将HSV色彩空间模式中的H、S、V分别量化为8、3、3个区域,从而将照片像素点的值量化为72色;
(S3)将量化后的照片像素点转换为平面坐标;
(S4)将转换为平面坐标的照片像素值使用边缘检测计算出X轴及Y轴的变化趋势,本发明方案优选采用Sobel边缘检测;
(S5)获取照片上的微结构特征;
(S6)将步骤S5获得的特征位置与步骤S2获得的色彩数据相结合;
(S7)将步骤S6得到的特征使用直方图统计图片的特征向量;
图片特征比对
将获取的图片特征向量与数据库中的图片特征向量进行比对,利用欧氏距离确定所拍摄的照片的物品信息。
其中S5包括
(S51)将图片切割为若干个不重叠的正方形微结构区域;
(S52)对每一个微结构区域内的周围像素点与中心像素点做比较;
(S53)将与中心像素点相同的周围像素点保留,否则删除;
(S54)将微结构区域的中心比对位置由正中央依次往右、下、右下移动一个像素,对图像重新进行分割,再进行S53的判断步骤;
(S55)将S54中原结构区块及依次移动后重新分割的四种区块切割运算后的保留像素进行合并,得到所需的微结构特征。
步骤S7包括
(S71)由步骤S6取得的特征计算出图像大小并计算出最小外接圆的半径及圆心;
(S72)将极坐标的圆心与上述步骤的外接圆圆心重叠,并将外接圆分为若干个同心圆组成的区域;
(S73)将每个区域所对应的特征部分记录起来并用直方图统计。
获取照片上微结构特征的步骤参照图2~图4所示,采用获取照片上微结构特征在本实施例中如图3、图4所示,图片的大小为6×6像素。如图3所示,将该图片分割为不重叠的四个3×3区块将每个中心点的像素与周围的像素做比较,相同的像素点保留,不相同的删除如图2所示。
此外,该方式不止通过图2中区域的中心的为基准做比较,还以其他像素点作为基准点做同样运算,如图3所示,让图2中的区域的对比位置依次往右、下及右下的位置各移动一个像素并做同样的运算。
图4是以图3所示方式取得不同基准点说保留的不同像素之后再进行合并,得到最终的特征像素的位置。
图6是本发明直方图统计方法示意图,在如图的实施例中,将获取的特征量化为12个区间,由内到外同心圆的个数为3个,因此共有36个特征区如图6a所示。
由步骤S6取得的特征计算出图像大小并计算出最小外接圆的半径及圆心,再将极坐标的圆心与上述步骤的外接圆圆心重叠(如图5所示),最后将取得的特征点对应至极坐标上,图6a中的点对应到极坐标中的区间,将每个区间的特征记录统计起来并用直方图来统计(如图6a、图6b所示)。
参照图7~图9所示,本发明除了获取原照片的特征数据进行对比之外,还包括将照片特征水平翻转、垂直翻转及像素移位获取特征数据再进行对比。
如图9所示,图片特征向左平移一个像素时,一开始先将第一栏的像素移到最后一栏,第二栏移到第一栏,其余的依次类推。
采用本发明方法,如图10所示,使用16张自行拍摄的图片作为训练资料库,其大小为342×256像素组成。测试资料库是由训练资料库中的原始图片经过了缩小、偏移及旋转组成的,共192张图片,缩小的图片有16张,偏移的图片有偏左和偏右各16张共32张,原图片16张,旋转的图片共8×16=128张。其中旋转图片和原图片共由8个角度组成,除了缩小图片为原图片小一半,其大小为171×128像素,其他则和原图片大小相同。
采用本发明方法进行物品识别的准确率如表1至表5所示,从表中可以得知,在比对准确率上均达到了100%。
而表中的相似数量是检测是否可以根据本发明方法从类似的物品中准确找出对应的物品。
本实施例将编号b与p分为一组,e、i、o为一组,其余的则为宝特瓶、钢杯及马克杯各自为一组。前两组的纹理几乎相同,区别仅在于颜色,在此情况下,e、i和o的分组识别率为100%;b与p的分组准确率稍微降低。
表1原始影像查询之正确率
表2偏左影像查询之正确率
表3偏右影像查询之正确率
表4缩小影像查询之正确率
表5旋转影像查询之正确率
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。
Claims (4)
1.一种物品识别方法,其特征在于,包括以下步骤:
获取图片特征:
(S1)将拍摄的图片像素由RGB色彩空间模式转为HSV色彩空间模式,转换的公式为
其中的MAX=max(R,G,B)与MIN=min(R,G,B)分別为取得RGB色彩空间中的最大值与最小值;
(S2)将HSV色彩空间模式中的H、S、V分别量化为8、3、3个区域,从而将照片像素点的值量化为72色;
(S3)将量化后的照片像素点转换为平面坐标,转换结果是(H``,S``,V``),其方法为
(S4)将转换为平面坐标的照片像素值使用边缘检测计算出X轴及Y轴的变化趋势,检测的公式为:
|G|=|Gx|+|Gy|;
(S5)获取照片上的微结构特征,获取的步骤为
(S51)将图片切割为若干个不重叠的正方形微结构区域;
(S52)对每一个微结构区域内的周围像素点与中心像素点做比较;
(S53)将与中心像素点相同的周围像素点保留,否则删除;
(S54)将微结构区域的中心比对位置由正中央依次往右、下、右下移动一个像素,对图像重新进行分割,再进行(S53)的判断步骤;
(S55)将S54中原结构区块及依次移动后重新分割的四种区块切割运算后的保留像素进行合并,得到所需的微结构特征;
(S6)将步骤S5获得的微结构特征与步骤S2获得的色彩数据相结合,公式为:
其中,M(i,j)为结构特征,C(i,j)为HSV色彩空间的特征;
(S7)将步骤S6得到的特征使用直方图统计图片的特征向量;
图片特征比对:
将获取的图片特征向量与数据库中的图片特征向量进行比对,利用欧氏距离确定所拍摄的照片的物品信息。
2.根据权利要求1所述的识别方法,其特征在于,步骤S4对平面坐标进行边缘检测之后计算出物体的长与宽,并将特征区域的中心移至照片量化后的中心点。
3.根据权利要求1所述的识别方法,其特征在于,使用直方图统计的方法包括以下步骤,
(S71)由步骤S6取得的特征计算出图像大小并计算出最小外接圆的半径及圆心;
(S72)将极坐标的圆心与上述步骤的外接圆圆心重叠,并将外接圆分为若干个同心圆组成的区域;
(S73)将每个区域所对应的特征部分记录起来并用直方图统计。
4.根据权利要求1所述的识别方法,其特征在于,在图片特征对比时,除了获取原照片的特征数据进行对比之外,还包括将照片特征水平翻转、垂直翻转及像素移位获取特征数据再进行对比。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310526390.1A CN103577840B (zh) | 2013-10-30 | 2013-10-30 | 物品识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310526390.1A CN103577840B (zh) | 2013-10-30 | 2013-10-30 | 物品识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103577840A CN103577840A (zh) | 2014-02-12 |
CN103577840B true CN103577840B (zh) | 2017-05-31 |
Family
ID=50049588
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310526390.1A Expired - Fee Related CN103577840B (zh) | 2013-10-30 | 2013-10-30 | 物品识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103577840B (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105224913A (zh) * | 2015-09-01 | 2016-01-06 | 上海斐讯数据通信技术有限公司 | 一种物品数量检测方法及装置 |
CN105824928A (zh) * | 2016-03-17 | 2016-08-03 | 广东欧珀移动通信有限公司 | 移动终端、服务器、基于内容的图像识别搜索方法及系统 |
CN106203264A (zh) * | 2016-06-28 | 2016-12-07 | 深圳市元征科技股份有限公司 | 危险物品检测方法和装置 |
CN107133573A (zh) * | 2017-04-12 | 2017-09-05 | 宇龙计算机通信科技(深圳)有限公司 | 一种寻找物品的方法和装置 |
CN109389582B (zh) * | 2018-09-11 | 2020-06-26 | 广东智媒云图科技股份有限公司 | 一种图像主体亮度的识别方法及装置 |
CN109389094B (zh) * | 2018-10-23 | 2021-04-16 | 北京无线电计量测试研究所 | 一种稳定的虹膜特征提取与匹配方法 |
CN109622400A (zh) * | 2018-12-26 | 2019-04-16 | 深圳市越疆科技有限公司 | 视觉智能识别及适配金饰的方法 |
CN109657083B (zh) * | 2018-12-27 | 2020-07-14 | 广州华迅网络科技有限公司 | 纺织品图片特征库的建立方法和装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102663401A (zh) * | 2012-04-18 | 2012-09-12 | 哈尔滨工程大学 | 一种图像特征提取和描述方法 |
-
2013
- 2013-10-30 CN CN201310526390.1A patent/CN103577840B/zh not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102663401A (zh) * | 2012-04-18 | 2012-09-12 | 哈尔滨工程大学 | 一种图像特征提取和描述方法 |
Non-Patent Citations (4)
Title |
---|
一种基于基元的彩色图像检索方法;王华等;《计算机系统应用》;20110131;第20卷(第1期);全文 * |
三位量化颜色直方图在彩色图像检索中的应用;陈秀新等;《计算机应用与软件》;20120930;第29卷(第9期);全文 * |
基于多种主色调的图像检索算法研究与实现;曹莉华;《计算机研究与发展》;19990131;第36卷(第1期);全文 * |
基于量化颜色空间的彩色图像检索算法;张水利;《计算机仿真》;20101031;第27卷(第10期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN103577840A (zh) | 2014-02-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103577840B (zh) | 物品识别方法 | |
CN109614922B (zh) | 一种动静态手势识别方法和系统 | |
CN115082419B (zh) | 一种吹塑箱包生产缺陷检测方法 | |
CN106447676B (zh) | 一种基于快速密度聚类算法的图像分割方法 | |
CN106910186B (zh) | 一种基于cnn深度学习的桥梁裂缝检测定位方法 | |
CN104766343B (zh) | 一种基于稀疏表示的视觉目标跟踪方法 | |
CN103207898B (zh) | 一种基于局部敏感哈希的相似人脸快速检索方法 | |
WO2018077165A1 (zh) | 一种基于双目视觉目标检测的家居环境下门定位方法 | |
CN107092871B (zh) | 基于多尺度多特征融合的遥感影像建筑物检测方法 | |
CN105205488B (zh) | 基于Harris角点和笔画宽度的文字区域检测方法 | |
CN103473551A (zh) | 基于sift算子的台标识别方法及系统 | |
CN106529573A (zh) | 一种结合三维点云分割和局部特征匹配的实时物体检测方法 | |
CN110321769A (zh) | 一种多尺寸货架商品检测方法 | |
CN106874942B (zh) | 一种基于正则表达式语义的目标模型快速构建方法 | |
CN105718882A (zh) | 一种分辨率自适应特征提取与融合的行人重识别方法 | |
CN106778779A (zh) | 一种电动注塑机模具检测方法 | |
CN109472267A (zh) | 图片相似度比对算法 | |
CN108985337A (zh) | 一种基于图像深度学习的产品表面划痕检测方法 | |
CN111310662A (zh) | 一种基于集成深度网络的火焰检测识别方法及系统 | |
CN114708208B (zh) | 一种基于机器视觉的名优茶嫩芽识别与采摘点定位方法 | |
CN109034065B (zh) | 一种基于点云的室内场景物体提取方法 | |
CN112381870B (zh) | 一种基于双目视觉的船舶识别与航速测量系统及方法 | |
CN103218604A (zh) | 交通场景中基于路面提取的行人检测方法 | |
CN105957107A (zh) | 行人检测与跟踪方法及装置 | |
CN104463134A (zh) | 一种车牌检测方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20170531 Termination date: 20191030 |
|
CF01 | Termination of patent right due to non-payment of annual fee |