CN110390364B - 图像分类方法及装置 - Google Patents
图像分类方法及装置 Download PDFInfo
- Publication number
- CN110390364B CN110390364B CN201910703345.6A CN201910703345A CN110390364B CN 110390364 B CN110390364 B CN 110390364B CN 201910703345 A CN201910703345 A CN 201910703345A CN 110390364 B CN110390364 B CN 110390364B
- Authority
- CN
- China
- Prior art keywords
- image
- classification
- classified
- line
- parameter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了图像分类方法,包括:采集用户对待分类图像的操作轨迹;若操作轨迹为点,则以该点为中心,选取设定范围内的像素点,分别提取各像素点的RGB值,并计算获得设定范围的第一平均RGB值,作为第一分类参数;若操作轨迹为线,则以该线为基线,以设定规则在待分类图像内拓展,获得连续的拓展区域,提取所述拓展区域的边缘轮廓线,作为第二分类参数;若操作轨迹为闭合线,则将待分类图像上位于该闭合线范围内的区域作为识别区域,并识别位于识别区域内的对象,作为第三分类参数。本发明还提供了图像分类装置。本发明能够辅助用户进行更为精细的图像分类操作,提高用户体验。
Description
技术领域
本发明涉及图像识别、分类技术领域。更具体地说,本发明涉及一种图像分类方法及装置。
背景技术
使用移动终端拍照、存储图像已经成为许多中国人的习惯。随着移动终端的使用时间的增长,移动终端内的图像越来越多,图像的查找、整理也越来越麻烦。为此,移动终端厂商提供了一些自动对图像分类的方法,比如按照拍摄时间、拍摄地点、相似度分类,部分移动终端还能根据人脸分类。显然,这些分类方法虽然为用户提供了方便,但仍然较为粗糙,无法完全满足用户需求。因此,亟需设计一种能够一定程度克服上述缺陷的图像分类方法及装置。
发明内容
本发明的一个目的是提供一种图像分类方法及装置,其能够辅助用户进行更为精细的图像分类操作,提高用户体验。
为了实现根据本发明的这些目的和其它优点,提供了图像分类方法,包括:
采集用户对待分类图像的操作轨迹;
若操作轨迹为点,则以该点为中心,选取设定范围内的像素点,分别提取各像素点的RGB值,并计算获得所述设定范围的第一平均RGB值,以所述第一平均RGB值作为待分类图像的第一分类参数;
若操作轨迹为线,则以该线为基线,以设定规则在待分类图像内拓展,获得连续的拓展区域,提取所述拓展区域的边缘轮廓线,并以所述边缘轮廓线作为待分类图像的第二分类参数;
若操作轨迹为闭合线,则将待分类图像上位于该闭合线范围内的区域作为识别区域,并识别位于所述识别区域内的对象,并以所述识别区域内的对象作为待分类图像的第三分类参数;
将第一分类参数、第二分类参数、第三分类参数及组合作为分类标准,对待分类图像进行分类;
其中,在采集用户对待分类图像的操作轨迹之前,获取与待分类图像拍摄信息相似的已分类图像,并获取已分类图像的分类标准,根据获取的分类标准,识别待分类图像,并在待分类图像上形成与分类标准匹配的待选区域。
优选的是,所述的图像分类方法,将所述第一平均RGB值与第一设定系数范围相乘,得到第一RGB值范围,并将第一RGB值范围作为待分类图像的第一分类参数。
优选的是,所述的图像分类方法,
获取位于线上的各像素点的RGB值,将各RGB值乘以第二设定系数范围,得到多个第二RGB值范围,拓展区域为基线周围颜色处于第二RGB值范围的连续区域。
优选的是,所述的图像分类方法,所述识别区域内的对象包括文字、人物、植物、动物、自然物或人造物。
优选的是,所述的图像分类方法,分类标准包括第一分类参数、第二分类参数、第三分类参数以及三者的组合、三者的两两组合。
优选的是,所述的图像分类方法,所述拍摄信息包括拍摄地点、拍摄时间。
本发明还提供了图像分类装置,包括:
处理器;
存储器,其存储有可执行指令;
其中,所述处理器被配置为执行所述可执行指令,以执行所述的图像分类方法。
本发明至少包括以下有益效果:
本发明通过采集用户对待分类图像执行的点、线、面操作轨迹,对待分类图像执行不同的识别处理,分别获得第一分类参数、第二分类参数和第三分类参数,进而获得分类标准。本发明克服了现有技术图像分类简单粗糙的缺陷,能够根据用户需求,对图像进行较为精确的分类,提高了用户体验。
本发明的其它优点、目标和特征将部分通过下面的说明体现,部分还将通过对本发明的研究和实践而为本领域的技术人员所理解。
附图说明
图1为本发明的流程图。
具体实施方式
下面结合附图对本发明做进一步的详细说明,以令本领域技术人员参照说明书文字能够据以实施。
应当理解,本文所使用的诸如“具有”、“包含”以及“包括”术语并不排除一个或多个其它元件或其组合的存在或添加。
在一种技术方案中,如图1所示,图像分类方法,包括:
采集用户对待分类图像的操作轨迹;
若操作轨迹为点,则以该点为中心,选取设定范围内的像素点,分别提取各像素点的RGB值,并计算获得所述设定范围的第一平均RGB值,以所述第一平均RGB值作为待分类图像的第一分类参数;
若操作轨迹为线,则以该线为基线,以设定规则在待分类图像内拓展,获得连续的拓展区域,提取所述拓展区域的边缘轮廓线,并以所述边缘轮廓线作为待分类图像的第二分类参数;
若操作轨迹为闭合线,则将待分类图像上位于该闭合线范围内的区域作为识别区域,并识别位于所述识别区域内的对象,并以所述识别区域内的对象作为待分类图像的第三分类参数;
将第一分类参数、第二分类参数、第三分类参数及组合作为分类标准,对待分类图像进行分类;
其中,在采集用户对待分类图像的操作轨迹之前,获取与待分类图像拍摄信息相似的已分类图像,并获取已分类图像的分类标准,根据获取的分类标准,识别待分类图像,并在待分类图像上形成与分类标准匹配的待选区域。
在上述技术方案中,图像分类方法的应用场景可以是移动终端内图库、文件库。移动终端将待分类图像展示给用户,用户通过屏幕用手指、电容笔等对待分类图像进行带轨迹的操作。用户的操作包括点、线和闭合线三类操作轨迹。当操作轨迹为点时,即用户点击某一点,则以该点为中心选取设定周围内的像素点,设定范围比如可以是向周围各方向各延伸8个像素点,然后设定范围内各像素点RGB值的平均值(R值、B值和G值分别计算平均值),得到第一平均RGB值,将第一平均RGB值作为第一分类参数。当操作轨迹为线时,即用户在待分类图像上滑动形成线条轨迹,则以该线条轨迹为起始向外拓展,拓展区域比如可以拓展至颜色相近的连续区域,然后提取拓展区域的边缘轮廓线,将边缘轮廓线作为第二分类参数。当操作轨迹为闭合线时,则识别闭合线包含的对象,将对象名作为第三分类参数。对对象的识别可以参考现有技术,比如,对于文字对象的识别采用OCR技术,对于其它对象的识别,可以包括预先训练识别模型、提取对象特征、根据识别模型和对象特征对对象进行识别。
第一分类参数可以用于颜色单一的图像,如蓝天、大海、沙漠、星空,用户执行点操作,即可将颜色类似的图像归为一类,比如将所有涉及蓝天的图像归为一类。第二分类参数可以用于轮廓鲜明的图像,如山峦、房屋、人物、茶杯等,用户执行线操作,标记出有轮廓特征的部分并识别,即可将这类图像归类,比如将具有特定动作轮廓人物的图像归为一类,将具有塔楼的图像归为一类。第三分类参数可以用于特定对象的图像,如包含文字的图像、包含特定人脸的图像、包含特定动物、植物的图像,用于执行闭合线操作,将特定对象包括在内并识别,即可将这类图像归类,比如将包含特定品牌商标的衣服归为一类。在实际分类中,可以用第一分类参数、第二分类参数、第三分类参数单独作为分类标准(图像类别),也可以组合起来作为分类标准,若两张图像的分类标准中的各分类参数分别相同或相似,即可将两张图像归为一类。比如想将既包括蓝天又包括山峦的图像归为一类时,即可将第一分类参数和第二分类参数组合作为分类标准,这时用户针对待分类图像同时进行点操作和线操作即可。
为了进一步提高分类的便利性,在待分类图像接受用户操作轨迹之前,根据拍摄信息的相似性,预先根据已经归类的图像的分类标准,在待分类图像上预先提供可选区域,比如预先在待分类图像中将各特定对象选定,用户选择其中一个后,即按选中特定对象进行分类。
可以看出,本技术方案通过采集用户对待分类图像执行的点、线、面操作轨迹,对待分类图像执行不同的识别处理,分别获得第一分类参数、第二分类参数和第三分类参数,进而获得分类标准。本技术方案克服了现有技术图像分类简单粗糙的缺陷,能够根据用户需求,对图像进行较为精确、自定义的分类,提高了用户体验。
在另一种技术方案中,所述的图像分类方法,将所述第一平均RGB值与第一设定系数范围相乘,得到第一RGB值范围,并将第一RGB值范围作为待分类图像的第一分类参数。这里,提供了获得第一分类参数的优选方法,将第一平均RGB值乘以第一设定系数范围,使得能够将一定的颜色区间作为第一分类参数,提高第一分类参数的实用性。第一设定系数范围可以根据实际需求或统计确定。
在另一种技术方案中,所述的图像分类方法,
获取位于线上的各像素点的RGB值,将各RGB值乘以第二设定系数范围,得到多个第二RGB值范围,拓展区域为基线周围颜色处于第二RGB值范围的连续区域。这里,提供了获得拓展区域的优选方法,用户的线操作可能包含多个不同RGB值的像素点,将颜色位于这些RGB值附近的且相邻的像素点均纳入拓展区域。第二设定系数范围可以根据实际需求或统计确定。
在另一种技术方案中,所述的图像分类方法,所述识别区域内的对象包括文字、人物、植物、动物、自然物或人造物。这里,这些对象的特征均预存于移动终端内,方便识别。
在另一种技术方案中,所述的图像分类方法,分类标准包括第一分类参数、第二分类参数、第三分类参数以及三者的组合、三者的两两组合。这里,提供了分类标准的组合方式,方便更精准的满足用户需求。
在另一种技术方案中,所述的图像分类方法,所述拍摄信息包括拍摄地点、拍摄时间。这里,拍摄图像时获取拍摄地点和拍摄时间为现有技术,相近拍摄地点和拍摄时间的图像可能具有较大的参考价值,方便较精准地为用户形成待选区域。这里相近的拍摄地点和拍摄时间不仅指拍摄地点距离短和拍摄时间间隔短,还指类似的拍摄地点和时间,比如在类似的时间在类似的风景区拍摄的图像。
本发明基于与图像分类方法相同的发明构思,还提供了图像分类装置,包括:
处理器;
存储器,其存储有可执行指令;
其中,所述处理器被配置为执行所述可执行指令,以执行所述的图像分类方法。图像分类装置可以是具有处理器和存储器的智能手机、笔记本电脑等,其对图像的分类流程参见图像分类方法。
这里说明的设备数量和处理规模是用来简化本发明的说明的。对本发明图像分类方法的应用、修改和变化对本领域的技术人员来说是显而易见的。
尽管本发明的实施方案已公开如上,但其并不仅仅限于说明书和实施方式中所列运用,它完全可以被适用于各种适合本发明的领域,对于熟悉本领域的人员而言,可容易地实现另外的修改,因此在不背离权利要求及等同范围所限定的一般概念下,本发明并不限于特定的细节和这里示出与描述的图例。
Claims (7)
1.图像分类方法,其特征在于,包括:
采集用户对待分类图像的操作轨迹;
若操作轨迹为点,则以该点为中心,选取设定范围内的像素点,分别提取各像素点的RGB值,并计算获得所述设定范围的第一平均RGB值,以所述第一平均RGB值作为待分类图像的第一分类参数;
若操作轨迹为线,则以该线为基线,以设定规则在待分类图像内拓展,获得连续的拓展区域,提取所述拓展区域的边缘轮廓线,并以所述边缘轮廓线作为待分类图像的第二分类参数;
若操作轨迹为闭合线,则将待分类图像上位于该闭合线范围内的区域作为识别区域,并识别位于所述识别区域内的对象,并以所述识别区域内的对象作为待分类图像的第三分类参数;
将第一分类参数、第二分类参数、第三分类参数及组合作为分类标准,对待分类图像进行分类;
其中,在采集用户对待分类图像的操作轨迹之前,获取与待分类图像拍摄信息相似的已分类图像,并获取已分类图像的分类标准,根据获取的分类标准,识别待分类图像,并在待分类图像上形成与分类标准匹配的待选区域。
2.如权利要求1所述的图像分类方法,其特征在于,将所述第一平均RGB值与第一设定系数范围相乘,得到第一RGB值范围,并将第一RGB值范围作为待分类图像的第一分类参数。
3.如权利要求1所述的图像分类方法,其特征在于,获取位于线上的各像素点的RGB值,将各RGB值乘以第二设定系数范围,得到多个第二RGB值范围,拓展区域为基线周围颜色处于第二RGB值范围的连续区域。
4.如权利要求1所述的图像分类方法,其特征在于,所述识别区域内的对象包括文字、人物、植物、动物、自然物或人造物。
5.如权利要求1所述的图像分类方法,其特征在于,分类标准包括第一分类参数、第二分类参数、第三分类参数以及三者的组合、三者的两两组合。
6.如权利要求1所述的图像分类方法,其特征在于,所述拍摄信息包括拍摄地点、拍摄时间。
7.图像分类装置,其特征在于,包括:
处理器;
存储器,其存储有可执行指令;
其中,所述处理器被配置为执行所述可执行指令,以执行权利要求1~6任一所述的图像分类方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910703345.6A CN110390364B (zh) | 2019-07-31 | 2019-07-31 | 图像分类方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910703345.6A CN110390364B (zh) | 2019-07-31 | 2019-07-31 | 图像分类方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110390364A CN110390364A (zh) | 2019-10-29 |
CN110390364B true CN110390364B (zh) | 2022-10-14 |
Family
ID=68288305
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910703345.6A Active CN110390364B (zh) | 2019-07-31 | 2019-07-31 | 图像分类方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110390364B (zh) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100772506B1 (ko) * | 2005-12-08 | 2007-11-01 | 한국전자통신연구원 | 영상처리를 이용한 지질재료 분류 방법 및 그 장치 |
CN103377376A (zh) * | 2012-04-13 | 2013-10-30 | 阿里巴巴集团控股有限公司 | 图像分类的方法和系统、图像检索的方法和系统 |
CN108960246B (zh) * | 2018-06-14 | 2020-06-16 | 国网江苏省电力有限公司电力科学研究院 | 一种用于图像识别的二值化处理装置及方法 |
-
2019
- 2019-07-31 CN CN201910703345.6A patent/CN110390364B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN110390364A (zh) | 2019-10-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Shahrian et al. | Improving image matting using comprehensive sampling sets | |
CN105335725B (zh) | 一种基于特征融合的步态识别身份认证方法 | |
CN104616021B (zh) | 交通标志图像处理方法及装置 | |
CN110287771B (zh) | 图像手掌区域提取方法及装置 | |
CN107274373B (zh) | 直播中打码方法及装置 | |
CN108388905B (zh) | 一种基于卷积神经网络和邻域上下文的光源估计方法 | |
CN109409377B (zh) | 图像中文字的检测方法及装置 | |
CN105825228B (zh) | 图像识别方法及装置 | |
CN110413816A (zh) | 彩色草图图像搜索 | |
CN107977948B (zh) | 一种面向社群图像的显著图融合方法 | |
US20180107877A1 (en) | Image processing apparatus, image processing method, and image processing system | |
CN107368838A (zh) | 图像处理装置、图像处理方法、搜索装置以及搜索方法 | |
CN108984576A (zh) | 一种基于卷积神经网络的专利文献获取方法及系统 | |
CN109377494A (zh) | 一种用于图像的语义分割方法和装置 | |
CN104951440B (zh) | 一种图像处理方法及电子设备 | |
CN108961250A (zh) | 一种目标物统计方法、装置、终端以及存储介质 | |
CN108647696B (zh) | 图片颜值确定方法及装置、电子设备、存储介质 | |
CN108647264A (zh) | 一种基于支持向量机的图像自动标注方法及装置 | |
CN110264320B (zh) | 基于现实增强设备的信息显示方法、装置以及存储介质 | |
CN106446889B (zh) | 一种台标的本地识别方法和装置 | |
CN107077594A (zh) | 标记移动设备上的视觉媒体 | |
CN113128373B (zh) | 基于图像处理的色斑评分方法、色斑评分装置及终端设备 | |
CN110390364B (zh) | 图像分类方法及装置 | |
CN106354838B (zh) | 一种基于语义共鸣色彩的数据可视化方法 | |
CN103984927A (zh) | 一种信息处理方法及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |