CN110390364A - 图像分类方法及装置 - Google Patents

图像分类方法及装置 Download PDF

Info

Publication number
CN110390364A
CN110390364A CN201910703345.6A CN201910703345A CN110390364A CN 110390364 A CN110390364 A CN 110390364A CN 201910703345 A CN201910703345 A CN 201910703345A CN 110390364 A CN110390364 A CN 110390364A
Authority
CN
China
Prior art keywords
image
classified
rgb value
sorting parameter
classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910703345.6A
Other languages
English (en)
Other versions
CN110390364B (zh
Inventor
骆绍烨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Putian University
Original Assignee
Putian University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Putian University filed Critical Putian University
Priority to CN201910703345.6A priority Critical patent/CN110390364B/zh
Publication of CN110390364A publication Critical patent/CN110390364A/zh
Application granted granted Critical
Publication of CN110390364B publication Critical patent/CN110390364B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了图像分类方法,包括:采集用户对待分类图像的操作轨迹;若操作轨迹为点,则以该点为中心,选取设定范围内的像素点,分别提取各像素点的RGB值,并计算获得设定范围的第一平均RGB值,作为第一分类参数;若操作轨迹为线,则以该线为基线,以设定规则在待分类图像内拓展,获得连续的拓展区域,提取所述拓展区域的边缘轮廓线,作为第二分类参数;若操作轨迹为闭合线,则将待分类图像上位于该闭合线范围内的区域作为识别区域,并识别位于识别区域内的对象,作为第三分类参数。本发明还提供了图像分类装置。本发明能够辅助用户进行更为精细的图像分类操作,提高用户体验。

Description

图像分类方法及装置
技术领域
本发明涉及图像识别、分类技术领域。更具体地说,本发明涉及一种图像分类方法及装置。
背景技术
使用移动终端拍照、存储图像已经成为许多中国人的习惯。随着移动终端的使用时间的增长,移动终端内的图像越来越多,图像的查找、整理也越来越麻烦。为此,移动终端厂商提供了一些自动对图像分类的方法,比如按照拍摄时间、拍摄地点、相似度分类,部分移动终端还能根据人脸分类。显然,这些分类方法虽然为用户提供了方便,但仍然较为粗糙,无法完全满足用户需求。因此,亟需设计一种能够一定程度克服上述缺陷的图像分类方法及装置。
发明内容
本发明的一个目的是提供一种图像分类方法及装置,其能够辅助用户进行更为精细的图像分类操作,提高用户体验。
为了实现根据本发明的这些目的和其它优点,提供了图像分类方法,包括:
采集用户对待分类图像的操作轨迹;
若操作轨迹为点,则以该点为中心,选取设定范围内的像素点,分别提取各像素点的RGB值,并计算获得所述设定范围的第一平均RGB值,以所述第一平均RGB值作为待分类图像的第一分类参数;
若操作轨迹为线,则以该线为基线,以设定规则在待分类图像内拓展,获得连续的拓展区域,提取所述拓展区域的边缘轮廓线,并以所述边缘轮廓线作为待分类图像的第二分类参数;
若操作轨迹为闭合线,则将待分类图像上位于该闭合线范围内的区域作为识别区域,并识别位于所述识别区域内的对象,并以所述识别区域内的对象作为待分类图像的第三分类参数;
将第一分类参数、第二分类参数、第三分类参数及组合作为分类标准,对待分类图像进行分类;
其中,在采集用户对待分类图像的操作轨迹之前,获取与待分类图像拍摄信息相似的已分类图像,并获取已分类图像的分类标准,根据获取的分类标准,识别待分类图像,并在待分类图像上形成与分类标准匹配的待选区域。
优选的是,所述的图像分类方法,将所述第一平均RGB值与第一设定系数范围相乘,得到第一RGB值范围,并将第一RGB值范围作为待分类图像的第一分类参数。
优选的是,所述的图像分类方法,
获取位于线上的各像素点的RGB值,将各RGB值乘以第二设定系数范围,得到多个第二RGB值范围,拓展区域为基线周围颜色处于第二RGB值范围的连续区域。
优选的是,所述的图像分类方法,所述识别区域内的对象包括文字、人物、植物、动物、自然物或人造物。
优选的是,所述的图像分类方法,分类标准包括第一分类参数、第二分类参数、第三分类参数以及三者的组合、三者的两两组合。
优选的是,所述的图像分类方法,所述拍摄信息包括拍摄地点、拍摄时间。
本发明还提供了图像分类装置,包括:
处理器;
存储器,其存储有可执行指令;
其中,所述处理器被配置为执行所述可执行指令,以执行所述的图像分类方法。
本发明至少包括以下有益效果:
本发明通过采集用户对待分类图像执行的点、线、面操作轨迹,对待分类图像执行不同的识别处理,分别获得第一分类参数、第二分类参数和第三分类参数,进而获得分类标准。本发明克服了现有技术图像分类简单粗糙的缺陷,能够根据用户需求,对图像进行较为精确的分类,提高了用户体验。
本发明的其它优点、目标和特征将部分通过下面的说明体现,部分还将通过对本发明的研究和实践而为本领域的技术人员所理解。
附图说明
图1为本发明的流程图。
具体实施方式
下面结合附图对本发明做进一步的详细说明,以令本领域技术人员参照说明书文字能够据以实施。
应当理解,本文所使用的诸如“具有”、“包含”以及“包括”术语并不排除一个或多个其它元件或其组合的存在或添加。
在一种技术方案中,如图1所示,图像分类方法,包括:
采集用户对待分类图像的操作轨迹;
若操作轨迹为点,则以该点为中心,选取设定范围内的像素点,分别提取各像素点的RGB值,并计算获得所述设定范围的第一平均RGB值,以所述第一平均RGB值作为待分类图像的第一分类参数;
若操作轨迹为线,则以该线为基线,以设定规则在待分类图像内拓展,获得连续的拓展区域,提取所述拓展区域的边缘轮廓线,并以所述边缘轮廓线作为待分类图像的第二分类参数;
若操作轨迹为闭合线,则将待分类图像上位于该闭合线范围内的区域作为识别区域,并识别位于所述识别区域内的对象,并以所述识别区域内的对象作为待分类图像的第三分类参数;
将第一分类参数、第二分类参数、第三分类参数及组合作为分类标准,对待分类图像进行分类;
其中,在采集用户对待分类图像的操作轨迹之前,获取与待分类图像拍摄信息相似的已分类图像,并获取已分类图像的分类标准,根据获取的分类标准,识别待分类图像,并在待分类图像上形成与分类标准匹配的待选区域。
在上述技术方案中,图像分类方法的应用场景可以是移动终端内图库、文件库。移动终端将待分类图像展示给用户,用户通过屏幕用手指、电容笔等对待分类图像进行带轨迹的操作。用户的操作包括点、线和闭合线三类操作轨迹。当操作轨迹为点时,即用户点击某一点,则以该点为中心选取设定周围内的像素点,设定范围比如可以是向周围各方向各延伸8个像素点,然后设定范围内各像素点RGB值的平均值(R值、B值和G值分别计算平均值),得到第一平均RGB值,将第一平均RGB值作为第一分类参数。当操作轨迹为线时,即用户在待分类图像上滑动形成线条轨迹,则以该线条轨迹为起始向外拓展,拓展区域比如可以拓展至颜色相近的连续区域,然后提取拓展区域的边缘轮廓线,将边缘轮廓线作为第二分类参数。当操作轨迹为闭合线时,则识别闭合线包含的对象,将对象名作为第三分类参数。对对象的识别可以参考现有技术,比如,对于文字对象的识别采用OCR技术,对于其它对象的识别,可以包括预先训练识别模型、提取对象特征、根据识别模型和对象特征对对象进行识别。
第一分类参数可以用于颜色单一的图像,如蓝天、大海、沙漠、星空,用户执行点操作,即可将颜色类似的图像归为一类,比如将所有涉及蓝天的图像归为一类。第二分类参数可以用于轮廓鲜明的图像,如山峦、房屋、人物、茶杯等,用户执行线操作,标记出有轮廓特征的部分并识别,即可将这类图像归类,比如将具有特定动作轮廓人物的图像归为一类,将具有塔楼的图像归为一类。第三分类参数可以用于特定对象的图像,如包含文字的图像、包含特定人脸的图像、包含特定动物、植物的图像,用于执行闭合线操作,将特定对象包括在内并识别,即可将这类图像归类,比如将包含特定品牌商标的衣服归为一类。在实际分类中,可以用第一分类参数、第二分类参数、第三分类参数单独作为分类标准(图像类别),也可以组合起来作为分类标准,若两张图像的分类标准中的各分类参数分别相同或相似,即可将两张图像归为一类。比如想将既包括蓝天又包括山峦的图像归为一类时,即可将第一分类参数和第二分类参数组合作为分类标准,这时用户针对待分类图像同时进行点操作和线操作即可。
为了进一步提高分类的便利性,在待分类图像接受用户操作轨迹之前,根据拍摄信息的相似性,预先根据已经归类的图像的分类标准,在待分类图像上预先提供可选区域,比如预先在待分类图像中将各特定对象选定,用户选择其中一个后,即按选中特定对象进行分类。
可以看出,本技术方案通过采集用户对待分类图像执行的点、线、面操作轨迹,对待分类图像执行不同的识别处理,分别获得第一分类参数、第二分类参数和第三分类参数,进而获得分类标准。本技术方案克服了现有技术图像分类简单粗糙的缺陷,能够根据用户需求,对图像进行较为精确、自定义的分类,提高了用户体验。
在另一种技术方案中,所述的图像分类方法,将所述第一平均RGB值与第一设定系数范围相乘,得到第一RGB值范围,并将第一RGB值范围作为待分类图像的第一分类参数。这里,提供了获得第一分类参数的优选方法,将第一平均RGB值乘以第一设定系数范围,使得能够将一定的颜色区间作为第一分类参数,提高第一分类参数的实用性。第一设定系数范围可以根据实际需求或统计确定。
在另一种技术方案中,所述的图像分类方法,
获取位于线上的各像素点的RGB值,将各RGB值乘以第二设定系数范围,得到多个第二RGB值范围,拓展区域为基线周围颜色处于第二RGB值范围的连续区域。这里,提供了获得拓展区域的优选方法,用户的线操作可能包含多个不同RGB值的像素点,将颜色位于这些RGB值附近的且相邻的像素点均纳入拓展区域。第二设定系数范围可以根据实际需求或统计确定。
在另一种技术方案中,所述的图像分类方法,所述识别区域内的对象包括文字、人物、植物、动物、自然物或人造物。这里,这些对象的特征均预存于移动终端内,方便识别。
在另一种技术方案中,所述的图像分类方法,分类标准包括第一分类参数、第二分类参数、第三分类参数以及三者的组合、三者的两两组合。这里,提供了分类标准的组合方式,方便更精准的满足用户需求。
在另一种技术方案中,所述的图像分类方法,所述拍摄信息包括拍摄地点、拍摄时间。这里,拍摄图像时获取拍摄地点和拍摄时间为现有技术,相近拍摄地点和拍摄时间的图像可能具有较大的参考价值,方便较精准地为用户形成待选区域。这里相近的拍摄地点和拍摄时间不仅指拍摄地点距离短和拍摄时间间隔短,还指类似的拍摄地点和时间,比如在类似的时间在类似的风景区拍摄的图像。
本发明基于与图像分类方法相同的发明构思,还提供了图像分类装置,包括:
处理器;
存储器,其存储有可执行指令;
其中,所述处理器被配置为执行所述可执行指令,以执行所述的图像分类方法。图像分类装置可以是具有处理器和存储器的智能手机、笔记本电脑等,其对图像的分类流程参见图像分类方法。
这里说明的设备数量和处理规模是用来简化本发明的说明的。对本发明图像分类方法的应用、修改和变化对本领域的技术人员来说是显而易见的。
尽管本发明的实施方案已公开如上,但其并不仅仅限于说明书和实施方式中所列运用,它完全可以被适用于各种适合本发明的领域,对于熟悉本领域的人员而言,可容易地实现另外的修改,因此在不背离权利要求及等同范围所限定的一般概念下,本发明并不限于特定的细节和这里示出与描述的图例。

Claims (7)

1.图像分类方法,其特征在于,包括:
采集用户对待分类图像的操作轨迹;
若操作轨迹为点,则以该点为中心,选取设定范围内的像素点,分别提取各像素点的RGB值,并计算获得所述设定范围的第一平均RGB值,以所述第一平均RGB值作为待分类图像的第一分类参数;
若操作轨迹为线,则以该线为基线,以设定规则在待分类图像内拓展,获得连续的拓展区域,提取所述拓展区域的边缘轮廓线,并以所述边缘轮廓线作为待分类图像的第二分类参数;
若操作轨迹为闭合线,则将待分类图像上位于该闭合线范围内的区域作为识别区域,并识别位于所述识别区域内的对象,并以所述识别区域内的对象作为待分类图像的第三分类参数;
将第一分类参数、第二分类参数、第三分类参数及组合作为分类标准,对待分类图像进行分类;
其中,在采集用户对待分类图像的操作轨迹之前,获取与待分类图像拍摄信息相似的已分类图像,并获取已分类图像的分类标准,根据获取的分类标准,识别待分类图像,并在待分类图像上形成与分类标准匹配的待选区域。
2.如权利要求1所述的图像分类方法,其特征在于,将所述第一平均RGB值与第一设定系数范围相乘,得到第一RGB值范围,并将第一RGB值范围作为待分类图像的第一分类参数。
3.如权利要求1所述的图像分类方法,其特征在于,获取位于线上的各像素点的RGB值,将各RGB值乘以第二设定系数范围,得到多个第二RGB值范围,拓展区域为基线周围颜色处于第二RGB值范围的连续区域。
4.如权利要求1所述的图像分类方法,其特征在于,所述识别区域内的对象包括文字、人物、植物、动物、自然物或人造物。
5.如权利要求1所述的图像分类方法,其特征在于,分类标准包括第一分类参数、第二分类参数、第三分类参数以及三者的组合、三者的两两组合。
6.如权利要求1所述的图像分类方法,其特征在于,所述拍摄信息包括拍摄地点、拍摄时间。
7.图像分类装置,其特征在于,包括:
处理器;
存储器,其存储有可执行指令;
其中,所述处理器被配置为执行所述可执行指令,以执行权利要求1~6任一所述的图像分类方法。
CN201910703345.6A 2019-07-31 2019-07-31 图像分类方法及装置 Active CN110390364B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910703345.6A CN110390364B (zh) 2019-07-31 2019-07-31 图像分类方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910703345.6A CN110390364B (zh) 2019-07-31 2019-07-31 图像分类方法及装置

Publications (2)

Publication Number Publication Date
CN110390364A true CN110390364A (zh) 2019-10-29
CN110390364B CN110390364B (zh) 2022-10-14

Family

ID=68288305

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910703345.6A Active CN110390364B (zh) 2019-07-31 2019-07-31 图像分类方法及装置

Country Status (1)

Country Link
CN (1) CN110390364B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070133866A1 (en) * 2005-12-08 2007-06-14 Electronics And Telecommunications Research Institute Method and apparatus for classifying geological materials using image processing techniques
CN103377376A (zh) * 2012-04-13 2013-10-30 阿里巴巴集团控股有限公司 图像分类的方法和系统、图像检索的方法和系统
CN108960246A (zh) * 2018-06-14 2018-12-07 国网江苏省电力有限公司电力科学研究院 一种用于图像识别的二值化处理装置及方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070133866A1 (en) * 2005-12-08 2007-06-14 Electronics And Telecommunications Research Institute Method and apparatus for classifying geological materials using image processing techniques
CN103377376A (zh) * 2012-04-13 2013-10-30 阿里巴巴集团控股有限公司 图像分类的方法和系统、图像检索的方法和系统
CN108960246A (zh) * 2018-06-14 2018-12-07 国网江苏省电力有限公司电力科学研究院 一种用于图像识别的二值化处理装置及方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
陆伟艳等: "基于MATLAB/GUI的图像语义自动标注系统", 《软件》 *

Also Published As

Publication number Publication date
CN110390364B (zh) 2022-10-14

Similar Documents

Publication Publication Date Title
KR102102161B1 (ko) 이미지 내 객체의 대표 특성을 추출하는 방법, 장치 및 컴퓨터 프로그램
US10049308B1 (en) Synthesizing training data
Margolin et al. Saliency for image manipulation
CN108121957B (zh) 美颜素材的推送方法及装置
CN105493078B (zh) 彩色草图图像搜索
US9195904B1 (en) Method for detecting objects in stereo images
Tiay et al. Flower recognition system based on image processing
US20120288198A1 (en) Information processing apparatus, information processing method, and non-transitory computer-readable storage medium
CN108647625A (zh) 一种表情识别方法及装置
CN110427859A (zh) 一种人脸检测方法、装置、电子设备及存储介质
Berezhnoy et al. Computer analysis of van Gogh’s complementary colours
CN108109161B (zh) 基于自适应阈值分割的视频数据实时处理方法及装置
CN108111911B (zh) 基于自适应跟踪框分割的视频数据实时处理方法及装置
CN103810490A (zh) 一种确定人脸图像的属性的方法和设备
CN106203286A (zh) 一种增强现实的内容获取方法、装置及移动终端
Thi et al. Human action recognition and localization in video using structured learning of local space-time features
CN102779270A (zh) 一种针对购物图像搜索的目标衣物图像提取方法
Lee et al. Automatic recognition of flower species in the natural environment
CN109377494A (zh) 一种用于图像的语义分割方法和装置
CN110069983A (zh) 基于显示媒质的活体识别方法、装置、终端及可读介质
CN107644105A (zh) 一种搜题方法及装置
CN109725721A (zh) 用于裸眼3d显示系统的人眼定位方法及系统
Pfister et al. Automatic and Efficient Long Term Arm and Hand Tracking for Continuous Sign Language TV Broadcasts.
CN109919128A (zh) 控制指令的获取方法、装置及电子设备
JP6754717B2 (ja) 物体候補領域推定装置、物体候補領域推定方法、及び物体候補領域推定プログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant