CN113505863B - 基于级联均值向量综合评分的图片多级分类方法及系统 - Google Patents
基于级联均值向量综合评分的图片多级分类方法及系统 Download PDFInfo
- Publication number
- CN113505863B CN113505863B CN202111048704.2A CN202111048704A CN113505863B CN 113505863 B CN113505863 B CN 113505863B CN 202111048704 A CN202111048704 A CN 202111048704A CN 113505863 B CN113505863 B CN 113505863B
- Authority
- CN
- China
- Prior art keywords
- picture
- classification
- feature
- classified
- mean
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及图像分类领域,提供一种基于级联均值向量综合评分的图片多级分类方法及系统,包括:通过样本图片集合构建样本图片特征向量集合,样本图片特征向量集合包括多个特征类别;计算样本图片特征向量集合中各特征类别的均值向量,获得均值向量集合;提取待分类图片的待分类图片特征向量;迭代计算待分类图片特征向量与均值向量集合中各特征类别的均值向量之间的欧式距离,获得欧式距离集合;通过欧式距离集合计算获得待分类图片的分类结果。本发明能提高多级分类准确度,有效解决包括未考虑类间亲疏性所造成的分类准确度低问题,样本分布不平衡造成分类准确度低的问题;有效解决样本仓库更新困难问题,极大地降低样本仓库更新成本。
Description
技术领域
本发明涉及图像分类领域,尤其涉及一种基于级联均值向量综合评分的图片多级分类方法及系统。
背景技术
在基层社会治理工作开展过程中,网格员在进行巡查走访、基础数据采集、信息上报、矛盾纠纷排查调解等问题上报时,需要填写事件类型,事件类型常常表现为多级级联分类,且以三级分类最为常见。基层社会治理的事件类别多、分类细,以深圳南山区为例,事件可分为二十几个一级分类、五十几个二级分类和三百多个三级分类,这使得网格员难以快速地、准确地选定事件类型,而准确的事件分类是后续事件分拨、下派工作展开的重要保障。在网格员事件上报过程中,结合网格员拍摄的事件发生地的代表性照片,进行事件智能多级分类,是一种提高网格员事件上报效率、降低人工误差的新技术方案。除此以外,图片多级分类在新闻图片多级分类、植物花卉多级分类等多个领域均具备直接或间接的应用价值。
目前较为主流的图片多级分类方法主要分为“机器学习分类模型法”、“图片特征向量搜索法”两种。
对于“图片特征向量搜索法”,这种方法直接搜索与待分类图片的特征向量距离最近的特征向量,以此特征向量的多级分类标签作为待分类图片的多级分类结果,这种“直接分类方法”未考虑类间的亲疏性,分类结果易混淆。
对于“机器学习分类模型法”,无论采取何种分类模型,在构建训练样本集时,都要求样本分布均衡,分布不均衡的样本将影响分类模型准确度,分类结果将更偏向于训练样本数目更多的类别。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于,解决现有技术中,未考虑类间的亲疏性导致分类结果易混淆,以及分布不均衡的样本将影响分类模型准确度的技术问题。
为实现上述目的,本发明提供一种基于级联均值向量综合评分的图片多级分类方法,包括:
优选地,步骤S1具体为:
S11:采集多张社区事件图片,将所述社区事件图片作为样本图片,获得所述样本图片集合;
优选地,步骤S2具体为:
优选地,步骤S4具体为:
所述均值向量集合共包括个所述均值向量,依次计算所述待分类图
片特征向量与各所述特征类别的均值向量之间的欧式距离,共获得个欧
式距离,将所有的欧式距离的集合作为所述欧式距离集合,其中特征类
别与的标号依次对应。
优选地,步骤S5具体为:
其中计算值最大的级联分类综合评分对应的分类结果,为所述待分类图片概率最大的分类结果。
优选地,步骤S52具体为:
一种基于级联均值向量综合评分的图片多级分类系统,包括:
本发明具有以下有益效果:
1、提高多级分类准确度,有效解决包括未考虑类间亲疏性所造成的分类准确度低问题,样本分布不平衡造成分类准确度低的问题;
2、有效解决样本仓库更新困难问题,极大地降低样本仓库更新成本。
附图说明
图1为本发明实施例方法流程图;
图2为本发明实施例系统结构图;
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
参照图1,本发明提供一种基于级联均值向量综合评分的图片多级分类方法,包括:
本实施例中,步骤S1具体为:
S11:采集多张社区事件图片,将所述社区事件图片作为样本图片,获得所述样本图片集合;共选取157398张社区事件图片;
具体实现中,例如将n设置为3,i=1时,0<ji≤19,表示样本图片在1级共有19类;i=
2时,0<ji≤63,表示样本图片在1级共有63类;i=3时,0<ji≤493,表示样本图片在3级共有
493类;样本图片特征向量集合包括575个特征类别,即=575;
样本图片特征向量集合的各级各类与分类名称及其级联关系示例如表1所示:
表1 社区事件三级各分类示例
本实施例中,步骤S2具体为:
本实施例中,步骤S4具体为:
所述均值向量集合共包括个所述均值向量,依次计算所述待分类图
片特征向量与各所述特征类别的均值向量之间的欧式距离,共获得个欧
式距离,将所有的欧式距离的集合作为所述欧式距离集合,其中特征
类别与的标号依次对应;
表2 欧式距离集合
本实施例中,步骤S5具体为:
其中计算值最大的级联分类综合评分对应的分类结果,为所述待分类图片概率最大的分类结果。
本实施例中,步骤S52具体为:
表5 待分类图片的分类结果
参考图2,本发明提供一种基于级联均值向量综合评分的图片多级分类系统,包括:
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。词语第一、第二、以及第三等的使用不表示任何顺序,可将这些词语解释为标识。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (6)
1.一种基于级联均值向量综合评分的图片多级分类方法,其特征在于,包括:
S1:获取样本图片集合,通过所述样本图片集合构建样本图片特征向量集合,所述样本图片特征向量集合包括个特征类别;其中,i表示样本图片的级,0<i≤n,n表示级的总个数;ji表示样本图片在i级对应的类,0<ji≤mi,mi表示在i级对应的类的总个数;
步骤S5具体为:
其中计算值最大的级联分类综合评分对应的分类结果,为所述待分类图片概率最大的分类结果。
6.一种基于级联均值向量综合评分的图片多级分类系统,其特征在于,包括:
具体为:
其中计算值最大的级联分类综合评分对应的分类结果,为所述待分类图片概率最大的分类结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111048704.2A CN113505863B (zh) | 2021-09-08 | 2021-09-08 | 基于级联均值向量综合评分的图片多级分类方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111048704.2A CN113505863B (zh) | 2021-09-08 | 2021-09-08 | 基于级联均值向量综合评分的图片多级分类方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113505863A CN113505863A (zh) | 2021-10-15 |
CN113505863B true CN113505863B (zh) | 2021-12-03 |
Family
ID=78016435
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111048704.2A Active CN113505863B (zh) | 2021-09-08 | 2021-09-08 | 基于级联均值向量综合评分的图片多级分类方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113505863B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113920373A (zh) * | 2021-10-29 | 2022-01-11 | 平安银行股份有限公司 | 一种对象分类方法、装置、终端设备及存储介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106056086B (zh) * | 2016-06-02 | 2019-05-17 | 江苏华通晟云科技有限公司 | 基于快速学习框架的车辆品牌型号识别方法 |
CN110136840B (zh) * | 2019-05-17 | 2022-12-20 | 山东管理学院 | 一种基于自加权分级生物特征的医学图像分类方法、装置和计算机可读存储介质 |
CN111126482B (zh) * | 2019-12-23 | 2020-11-13 | 自然资源部国土卫星遥感应用中心 | 一种基于多分类器级联模型的遥感影像自动分类方法 |
CN112949740B (zh) * | 2021-03-17 | 2022-11-25 | 重庆邮电大学 | 一种基于多级度量的小样本图像分类方法 |
-
2021
- 2021-09-08 CN CN202111048704.2A patent/CN113505863B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN113505863A (zh) | 2021-10-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106845717B (zh) | 一种基于多模型融合策略的能源效率评价方法 | |
CN102411563B (zh) | 一种识别目标词的方法、装置及系统 | |
CN114021799A (zh) | 风电场日前风电功率预测方法及系统 | |
CN106095928A (zh) | 一种事件类型识别方法及装置 | |
Liang et al. | Decision tree for dynamic and uncertain data streams | |
CN104820724B (zh) | 文本类教育资源知识点预测模型获得方法及模型应用方法 | |
CN107291895B (zh) | 一种快速的层次化文档查询方法 | |
CN107562938A (zh) | 一种法院智能审判方法 | |
CN113254643B (zh) | 文本分类方法、装置、电子设备和 | |
CN102902826A (zh) | 一种基于基准图像索引的图像快速检索方法 | |
CN114817575B (zh) | 基于扩展模型的大规模电力事理图谱处理方法 | |
CN113505863B (zh) | 基于级联均值向量综合评分的图片多级分类方法及系统 | |
CN106203508A (zh) | 一种基于Hadoop平台的图像分类方法 | |
CN109543038B (zh) | 一种应用于文本数据的情感分析方法 | |
CN109344233B (zh) | 一种中文人名识别方法 | |
CN114491081A (zh) | 基于数据血缘关系图谱的电力数据溯源方法及系统 | |
CN105337842A (zh) | 一种与内容无关的垃圾邮件过滤方法 | |
CN112687402A (zh) | 基于人工智能的智慧医疗互联网大数据处理方法及智能云服务平台 | |
CN115496948A (zh) | 一种基于深度学习的网络监督细粒度图像识别方法和系统 | |
CN108763289A (zh) | 一种海量异构传感器格式数据的解析方法 | |
CN109299456B (zh) | 一种地名识别方法 | |
CN103761433A (zh) | 一种网络服务资源分类方法 | |
CN113553419A (zh) | 民航知识图谱问答系统 | |
CN113836395A (zh) | 一种基于异构信息网络的服务开发者按需推荐方法及系统 | |
WO2020024448A1 (zh) | 人群绩效等级识别方法、装置、存储介质及计算机设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CP01 | Change in the name or title of a patent holder | ||
CP01 | Change in the name or title of a patent holder |
Address after: 430000 Wuda science and Technology Park, Jiangxia Avenue, Miaoshan District, Donghu Development Zone, Wuhan City, Hubei Province Patentee after: Geospace Information Technology Co., Ltd. Address before: 430000 Wuda science and Technology Park, Jiangxia Avenue, Miaoshan District, Donghu Development Zone, Wuhan City, Hubei Province Patentee before: WUDA GEOINFORMATICS Co.,Ltd. |