CN114663701A - 一种智能分组方法及分组系统 - Google Patents

一种智能分组方法及分组系统 Download PDF

Info

Publication number
CN114663701A
CN114663701A CN202210249756.4A CN202210249756A CN114663701A CN 114663701 A CN114663701 A CN 114663701A CN 202210249756 A CN202210249756 A CN 202210249756A CN 114663701 A CN114663701 A CN 114663701A
Authority
CN
China
Prior art keywords
distance
data node
target
clustering center
center
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210249756.4A
Other languages
English (en)
Inventor
吴振涛
刘辉
赵鲜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Xuanshi Intelligent Technology Co ltd
Original Assignee
Guangzhou Xuanshi Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Xuanshi Intelligent Technology Co ltd filed Critical Guangzhou Xuanshi Intelligent Technology Co ltd
Priority to CN202210249756.4A priority Critical patent/CN114663701A/zh
Publication of CN114663701A publication Critical patent/CN114663701A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

本发明实施例涉及人工智能技术领域,公开了一种智能分组方法及分组系统,该方法包括:计算出数据节点集中每一数据节点的特征向量到每一组类的聚类中心的距离;选择出与同一聚类中心之间的距离小于指定阈值的第一目标数据节点;将所述第一目标数据节点分配至与所述同一聚类中心对应的组类中。实施本发明实施例,能够有效减少量化误差的同时增加特征匹配精度,以获得更加精细化的数据分组结果。

Description

一种智能分组方法及分组系统
技术领域
本发明涉及人工智能技术领域,尤其涉及一种智能分组方法及分组系统。
背景技术
随着光电技术和互联网的高速发展,人们可以很容易地获取大规模场景的图像数据,因此从大规模图像集合去恢复三维场景结构的需求和应用也就应运而生。但是由于获取图像的传感器参数不同,拍摄视场和角度不同,图像集合中不但包含多个不同场景内容的图像,还包含噪声污染、模糊抖动甚至错误图像。因此,对杂乱无序的图像集合进行预处理,将内容关联的图像进行分组,不但有助于用户快速组织和掌握图像内容,也是场景三维重建的前提条件和关键步骤。
但是在无序宽基线条件下,如何进行高效的图像分组是一项极具挑战的任务,许多学者根据不同的应用提出了各种各样的图像分组方法。但在实践中发现,现已有的这些分组方法都是通过两两图像间的最近邻特征匹配,或者是利用全局特征聚类对图像进行分组,当图像规模很大时,这些算法的时间复杂度都非常高,不利于实际应用。
发明内容
本发明实施例公开一种智能分组方法及分组系统,能够有效减少量化误差的同时增加特征匹配精度,以获得更加精细化的数据分组结果。
本发明实施例第一方面公开一种智能分组方法,所述方法包括:
计算出数据节点集中每一数据节点的特征向量到每一组类的聚类中心的距离;
选择出与同一聚类中心之间的距离小于指定阈值的第一目标数据节点;
将所述第一目标数据节点分配至与所述同一聚类中心对应的组类中。
作为另一种可选的实施方式,在本发明实施例第一方面中,所述将所述第一目标数据节点分配至与所述同一聚类中心对应的组类中之后,所述方法还包括:
检测所述数据节点集中是否还存在有未被分配的剩余数据节点;若是,计算出所述剩余数据节点到每一所述第一目标数据节点的距离;
确定出与所述剩余数据节点之间的距离最小的第二目标数据节点;
将所述剩余数据节点分配至所述第二目标数据节点所处的组类中。
作为另一种可选的实施方式,在本发明实施例第一方面中,所述将所述剩余数据节点分配至所述第二目标数据节点所处的组类中之后,所述方法还包括:
计算出每一相邻两所述聚类中心之间的距离;
检测所述聚类中心所处组类中是否存在与所述聚类中心之间的距离大于相邻两所述聚类中心之间的距离的超距离数据节点;若是,将所述超距离数据节点从所述聚类中心所处组类中剔除出去。
作为另一种可选的实施方式,在本发明实施例第一方面中,所述将所述超距离数据节点从所述聚类中心所处组类中剔除出去之后,所述方法还包括:
计算出所述超距离数据节点的特征向量到每一所述聚类中心的距离;
确定出与所述超距离数据节点之间的距离最小的目标聚类中心;
检测所述超距离数据节点与所述目标聚类中心之间的距离是否大于所述目标聚类中心与相邻所述聚类中心之间的距离;若否,将所述超距离数据节点分配至与所述目标聚类中心所处的组类中。
作为另一种可选的实施方式,在本发明实施例第一方面中,所述方法还包括:
若检测出所述超距离数据节点与所述目标聚类中心之间的距离大于所述目标聚类中心与相邻所述聚类中心之间的距离时,将所述超距离数据节点分配至被排除组类中。
本发明实施例第二方面公开一种分组系统,所述分组系统包括:
第一计算单元,用于计算出数据节点集中每一数据节点的特征向量到每一组类的聚类中心的距离;
选择单元,用于选择出与同一聚类中心之间的距离小于指定阈值的第一目标数据节点;
分配单元,用于将所述第一目标数据节点分配至与所述同一聚类中心对应的组类中。
作为一种可选的实施方式,在本发明实施例第二方面中,所述分组系统还包括:
第一检测单元,用于在所述分配单元将所述第一目标数据节点分配至与所述同一聚类中心对应的组类中之后,检测所述数据节点集中是否还存在有未被分配的剩余数据节点;
第二计算单元,用于在所述第一检测单元检测出所述数据节点集中还存在有未被分配的剩余数据节点时,计算出所述剩余数据节点到每一所述第一目标数据节点的距离;
第一确定单元,用于确定出与所述剩余数据节点之间的距离最小的第二目标数据节点;
所述分配单元,还用于将所述剩余数据节点分配至所述第二目标数据节点所处的组类中。
作为一种可选的实施方式,在本发明实施例第二方面中,所述分组系统还包括:
第三计算单元,用于在所述分配单元将所述剩余数据节点分配至所述第二目标数据节点所处的组类中之后,计算出每一相邻两所述聚类中心之间的距离;
第二检测单元,用于检测所述聚类中心所处组类中是否存在与所述聚类中心之间的距离大于相邻两所述聚类中心之间的距离的超距离数据节点;
剔除单元,用于在所述第二检测单元检测出所述聚类中心所处组类中存在与所述聚类中心之间的距离大于相邻两所述聚类中心之间的距离的超距离数据节点时,将所述超距离数据节点从所述聚类中心所处组类中剔除出去。
作为一种可选的实施方式,在本发明实施例第二方面中,所述分组系统还包括:
所述第一计算单元,用于在所述剔除单元将所述超距离数据节点从所述聚类中心所处组类中剔除出去之后,计算出所述超距离数据节点的特征向量到每一所述聚类中心的距离;
第二确定单元,用于确定出与所述超距离数据节点之间的距离最小的目标聚类中心;
第三检测单元,用于检测所述超距离数据节点与所述目标聚类中心之间的距离是否大于所述目标聚类中心与相邻所述聚类中心之间的距离;
所述分配单元,用于在所述第三检测单元检测出所述超距离数据节点与所述目标聚类中心之间的距离未大于所述目标聚类中心与相邻所述聚类中心之间的距离时,将所述超距离数据节点分配至与所述目标聚类中心所处的组类中。
本发明实施例第三方面公开一种分组系统,所述分组系统包括:
存储有可执行程序代码的存储器;
与所述存储器耦合的处理器;
所述处理器调用所述存储器中存储的所述可执行程序代码,执行本发明实施例第一方面公开的一种智能分组方法。
本发明实施例第四方面公开一种计算机可读存储介质,其存储计算机程序,其中,所述计算机程序使得计算机执行本发明实施例第一方面公开的一种智能分组方法。
本发明实施例第五方面公开一种计算机程序产品,当所述计算机程序产品在计算机上运行时,使得所述计算机执行第一方面的任意一种智能分组方法的部分或全部步骤。
本发明实施例第六方面公开一种应用发布平台,所述应用发布平台用于发布计算机程序产品,其中,当所述计算机程序产品在计算机上运行时,使得所述计算机执行第一方面的任意一种智能分组方法的部分或全部步骤。
与现有技术相比,本发明实施例具有以下有益效果:
本发明实施例中,计算出数据节点集中每一数据节点的特征向量到每一组类的聚类中心的距离;选择出与同一聚类中心之间的距离小于指定阈值的第一目标数据节点;将所述第一目标数据节点分配至与所述同一聚类中心对应的组类中。可见,本发明实施例,能够有效减少量化误差的同时增加特征匹配精度,以获得更加精细化的数据分组结果。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例公开的一种智能分组方法的流程示意图;
图2是本发明实施例公开的另一种智能分组方法的流程示意图;
图3是本发明实施例公开的一种分组系统的结构示意图;
图4是本发明实施例公开的另一种分组系统的结构示意图;
图5是本发明实施例公开的另一种分组系统的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书中的术语“第一”、“第二”、“第三”“第四”等是用于区别不同的对象,而不是用于描述特定顺序。本发明实施例的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明实施例公开了一种智能分组方法及分组系统,能够有效减少量化误差的同时增加特征匹配精度,以获得更加精细化的数据分组结果。
以下结合附图进行详细描述。
实施例一
请参阅图1,图1是本发明实施例公开的一种智能分组方法的流程示意图。如图1所示,该智能分组方法可以包括以下步骤。
101、分组系统计算出数据节点集中每一数据节点的特征向量到每一组类的聚类中心的距离。
作为一种可选的实施方式,在本发明实施例中,聚类中心为每一组类中的中心点位置,本申请可预先将数据节点和聚类中心进行向量化,以大幅度提高数据分组的效率,举例来说,假设点A到D表示聚类中心,点1,2,3表示数据节点的特征向量,本申请可计算出点1到点A到D的距离、点2到点A到D的距离、点3到点A到D的距离,继而得到所需的各数据节点的距离数据。
102、分组系统选择出与同一聚类中心之间的距离小于指定阈值的第一目标数据节点。
作为一种可选的实施方式,在本发明实施例中,在本申请计算出数据节点集中每一数据节点的特征向量到每一组类的聚类中心的距离之后,本申请可从中选取出距离数据节点最小的聚类中心,并将该数据节点分配至该聚类中心所处的组类中。
作为一种可选的实施方式,在本发明实施例中,本申请中的指定阈值可为相邻两聚类中心之间的距离的中间值,举例来说,假设点A到点B表示聚类中心,而指定阈值可代表着点A到点B之间的距离的中间值,而后本申请可计算出表示数据节点的特征向量点1到点A和点B的距离,随后得到两个数值出来,而后本申请可将这两个数值和指定阈值进行对比,以从中选择出小于该指定阈值的数值,进而确定出点1属于点A还是点B所处的组类中。
103、分组系统将第一目标数据节点分配至与同一聚类中心对应的组类中。
作为一种可选的实施方式,在本发明实施例中,在将数据节点进行特征量化后,每幅图像便映射成视词空间的一个高维向量,再用倒排文件组织视词和图像之间的映射关系,这样可以快速地计算视词向量之间的距离,得到图像间的相似度,两两图像之间的相似度可以表示为相似度矩阵Mn×n的形式,获得矩阵Mn×n是非常高效的,最后,采用视图-生成树算法对矩阵所表示的加权图进行分割,先将两幅相似度最高的节点(图像)加入树,直到再没有余下的节点和树中节点相似度超过给定阈值,这样就生成了一棵树,将这棵树的节点从整个图像节点中移除,在剩下的节点集合中重复这个过程,直到数据节点集合为空,或者再也找不出两幅图像节点之间相似度大于给定阈值为止,这样生成的这些树就是对整个图像集合的划分,一棵树就是一个分组结果,而将那些独立的节点视为污染图像,系统将自动去除它们。
在图1所示的智能分组方法中,以分组系统作为执行主体为例进行描述。需要说明的是,图1所示的智能分组方法的执行主体还可以是与分组系统相关联的独立设备,本发明实施例不作限定。
可见,实施图1所描述的一种智能分组方法,能够有效减少量化误差的同时增加特征匹配精度,以获得更加精细化的数据分组结果。
此外,实施图1所描述的一种智能分组方法,能够增加分组准确性的同时提高分组速度。
实施例二
请参阅图2,图2是本发明实施例公开的另一种智能分组方法的流程示意图。如图2所示,该智能分组方法可以包括以下步骤:
201、分组系统计算出数据节点集中每一数据节点的特征向量到每一组类的聚类中心的距离。
202、分组系统选择出与同一聚类中心之间的距离小于指定阈值的第一目标数据节点。
203、分组系统将第一目标数据节点分配至与同一聚类中心对应的组类中。
204、分组系统检测数据节点集中是否还存在有未被分配的剩余数据节点,若是,执行步骤205~步骤209,若否,结束本次流程。
作为一种可选的实施方式,在本发明实施例中,本申请可采用视图-生成树算法对矩阵所表示的加权图进行分割,即先将两幅相似度最高的节点(图像)加入树,直到再没有余下的节点和树中节点相似度超过给定阈值,之后,若数据节点集中还有剩余数据节点,本申请可将剩余数据节点重新投入步骤201~步骤204的分组流程,若在剩余数据节点重新投入步骤201~步骤204的分组流程之后,还是依旧有剩余数据节点的存在,本申请可执行步骤205~步骤209。
作为一种可选的实施方式,在本发明实施例中,若分组系统未检测数据节点集中还存在有未被分配的剩余数据节点时,本申请可直接跳过步骤205~步骤207,直接执行步骤208~步骤209即可。
205、分组系统计算出剩余数据节点到每一第一目标数据节点的距离。
206、分组系统确定出与剩余数据节点之间的距离最小的第二目标数据节点。
207、分组系统将剩余数据节点分配至第二目标数据节点所处的组类中。
作为一种可选的实施方式,在本发明实施例中,若点1和点2表示分配至聚类中心A中的数据节点,点3和点4表示分配至聚类中心B中的数据节点,点5代表表示剩余数据节点,而后分组系统可计算出点5到点1和点2、点5到点3和点4之间的距离,随后可得到四个距离数据,本申请可将这四个距离数据进行对比,进而选取出一个最小的距离数据,进而确定出点3属于分配至点A还是点B所处的组类中。
208、分组系统计算出每一相邻两聚类中心之间的距离。
作为一种可选的实施方式,在本发明实施例中,本申请即便将数据节点集中的每一个数据节点进行了分组,但是可能会发生分组误差的现象的发生,更甚数据节点集中或许存在干扰数据,故本申请执行步骤208~步骤210是为了进一步提高其分组的准确性问题。
209、分组系统检测聚类中心所处组类中是否存在与聚类中心之间的距离大于相邻两聚类中心之间的距离的超距离数据节点,若是,执行步骤210~步骤213,若否,结束本次流程。
作为一种可选的实施方式,在本发明实施例中,若点A和点B为聚类中心,点1表示分配至聚类中心A中的数据节点,本申请从步骤208中可以得出点A和点B之间的位置距离,随后可得到一个数值,随后可将点1与聚类中心A之间的距离数据与该数值进行对比,若点1与聚类中心A之间的距离数据落入在该数值的范围区间内,则可认为点1不属于超距离数据节点,结束流程并完成分组,若点1与聚类中心A之间的距离数据不落入在该数值的范围区间内,则可认为点1不属于超距离数据节点,本申请执行步骤210~步骤213。
210、分组系统将超距离数据节点从聚类中心所处组类中剔除出去。
211、分组系统计算出超距离数据节点的特征向量到每一聚类中心的距离。
212、分组系统确定出与超距离数据节点之间的距离最小的目标聚类中心。
作为一种可选的实施方式,在本发明实施例中,在分组系统将超距离数据节点从其原属聚类中心的组类中剔除出去之后,超距离数据节点可重复执行步骤201~步骤204,直到数据节点集合为空。
213、分组系统检测超距离数据节点与目标聚类中心之间的距离是否大于目标聚类中心与相邻聚类中心之间的距离,若否,执行步骤214,若是,执行步骤215。
作为一种可选的实施方式,在本发明实施例中,本申请为了提高分组的精确性,为防止在分组过程中因错误分组或错误剔除而造成数据分组错误的事项,本申请可在将数据节点集合中的数据完成粗分组之后再开始一个个的进行验证,而在分组系统将超距离数据节点从其原所属聚类中心所处组类中剔除出去之后,为防止误伤的操作,故本申请还需要对该被剔除出去的超距离数据节点再重新执行一次验证,即步骤213的验证,待步骤213进一步验证出超距离数据节点属于被误伤的数据节点之后,可执行步骤214,在步骤213验证出超距离数据节点实属是属于污染数据时,可执行步骤215。
214、分组系统将超距离数据节点分配至与目标聚类中心所处的组类中,结束本次流程。
215、分组系统将超距离数据节点分配至被排除组类中,结束本次流程。
作为一种可选的实施方式,在本发明实施例中,在本申请确定出超距离数据节点无法分配至任一组类中时,分组系统可将那些独立的节点视为污染图像,将可自动去除它们。
作为一种可选的实施方式,在本发明实施例中,在在精细分组阶段,对每个组内的图像采用增强的相似度准则重新分组,其结果可能是一些弱相关的图像被系统排除,或者是组内生成树的连接关系被重新确定,甚至会划分出更加精细的分组。
作为一种可选的实施方式,在本发明实施例中,本申请可快速去除图像集合中大量的与内容无关的污染图像,并按照数据集合中不同图像场景内容对图像集合进行准确划分,同时还完成了图像组内的特征级匹配,这不但能够帮助用户迅速掌握图像集合内容,还可以为后续大规模场景的三维重建工作提供有效的基础数据。
可见,实施图2所描述的另一种智能分组方法,能够有效减少量化误差的同时增加特征匹配精度,以获得更加精细化的数据分组结果。
此外,实施图2所描述的另一种智能分组方法,能够增加分组准确性的同时提高分组速度。
实施例三
请参阅图3,图3是本发明实施例公开的一种分组系统的结构示意图。如图3所示,该分组系统300可以包括第一计算单元301、选择单元302与分配单元303,其中:
第一计算单元301,用于计算出数据节点集中每一数据节点的特征向量到每一组类的聚类中心的距离。
选择单元302,用于选择出与同一聚类中心之间的距离小于指定阈值的第一目标数据节点。
分配单元303,用于将第一目标数据节点分配至与同一聚类中心对应的组类中。
作为一种可选的实施方式,在本发明实施例中,聚类中心为每一组类中的中心点位置,本申请可预先将数据节点和聚类中心进行向量化,以大幅度提高数据分组的效率,举例来说,假设点A到D表示聚类中心,点1,2,3表示数据节点的特征向量,第一计算单元301可计算出点1到点A到D的距离、点2到点A到D的距离、点3到点A到D的距离,继而得到所需的各数据节点的距离数据。
作为一种可选的实施方式,在本发明实施例中,在第一计算单元301计算出数据节点集中每一数据节点的特征向量到每一组类的聚类中心的距离之后,选择单元302可从中选取出距离数据节点最小的聚类中心,分配单元303并将该数据节点分配至该聚类中心所处的组类中。
作为一种可选的实施方式,在本发明实施例中,本申请中的指定阈值可为相邻两聚类中心之间的距离的中间值,举例来说,假设点A到点B表示聚类中心,而指定阈值可代表着点A到点B之间的距离的中间值,而后第一计算单元301可计算出表示数据节点的特征向量点1到点A和点B的距离,随后得到两个数值出来,而后本申请可将这两个数值和指定阈值进行对比,选择单元302以从中选择出小于该指定阈值的数值,进而确定出点1属于点A还是点B所处的组类中。
作为一种可选的实施方式,在本发明实施例中,在将数据节点进行特征量化后,每幅图像便映射成视词空间的一个高维向量,再用倒排文件组织视词和图像之间的映射关系,这样第一计算单元301可以快速地计算视词向量之间的距离,得到图像间的相似度,两两图像之间的相似度可以表示为相似度矩阵Mn×n的形式,获得矩阵Mn×n是非常高效的,最后,采用视图-生成树算法对矩阵所表示的加权图进行分割,先将两幅相似度最高的节点(图像)加入树,直到再没有余下的节点和树中节点相似度超过给定阈值,这样就生成了一棵树,将这棵树的节点从整个图像节点中移除,在剩下的节点集合中重复这个过程,直到数据节点集合为空,或者再也找不出两幅图像节点之间相似度大于给定阈值为止,这样生成的这些树就是对整个图像集合的划分,一棵树就是一个分组结果,而将那些独立的节点视为污染图像,系统将自动去除它们。
可见,实施图3所描述的分组系统,能够有效减少量化误差的同时增加特征匹配精度,以获得更加精细化的数据分组结果。
此外,实施图3所描述的分组系统,能够增加分组准确性的同时提高分组速度。
实施例四
请参阅图4,图4是本发明实施例公开的另一种分组系统的结构示意图。其中,图4所示的分组系统是由图3所示的分组系统进行优化得到的。与图3所示的分组系统相比较,图4所示的分组系统还可以包括:
第一检测单元304,用于在分配单元303将第一目标数据节点分配至与同一聚类中心对应的组类中之后,检测数据节点集中是否还存在有未被分配的剩余数据节点。
作为一种可选的实施方式,在本发明实施例中,本申请可采用视图-生成树算法对矩阵所表示的加权图进行分割,即先将两幅相似度最高的节点(图像)加入树,直到再没有余下的节点和树中节点相似度超过给定阈值,之后,若数据节点集中还有剩余数据节点,第一计算单元301可计算出剩余数据节点的特征向量到每一组类的聚类中心的距离以对该剩余数据节点进行重新计算并分组,若在剩余数据节点可重新投入第一计算单元301进行重新计算并分组之后,还是依旧有剩余数据节点的存在,第二计算单元305可执行动作。
第二计算单元305,用于在第一检测单元304检测出数据节点集中还存在有未被分配的剩余数据节点时,计算出剩余数据节点到每一第一目标数据节点的距离。
第一确定单元306,用于确定出与剩余数据节点之间的距离最小的第二目标数据节点。
作为一种可选的实施方式,在本发明实施例中,分配单元303还用于将剩余数据节点分配至第二目标数据节点所处的组类中。
作为一种可选的实施方式,在本发明实施例中,若点1和点2表示分配至聚类中心A中的数据节点,点3和点4表示分配至聚类中心B中的数据节点,点5代表表示剩余数据节点,而后第二计算单元305可计算出点5到点1和点2、点5到点3和点4之间的距离,随后可得到四个距离数据,第一确定单元306可将这四个距离数据进行对比,进而选取出一个最小的距离数据,进而确定出点3属于分配至点A还是点B所处的组类中。
与图3所示的分组系统相比较,图4所示的分组系统还可以包括:
第三计算单元307,用于在分配单元303将剩余数据节点分配至第二目标数据节点所处的组类中之后,计算出每一相邻两聚类中心之间的距离。
作为一种可选的实施方式,在本发明实施例中,分配单元303即便将数据节点集中的每一个数据节点进行了分组,但是可能会发生分组误差的现象的发生,更甚数据节点集中或许存在干扰数据,故第三计算单元307~剔除单元309的设计是为了进一步提高其分组的准确性问题。
第二检测单元308,用于检测聚类中心所处组类中是否存在与聚类中心之间的距离大于相邻两聚类中心之间的距离的超距离数据节点。
作为一种可选的实施方式,在本发明实施例中,若点A和点B为聚类中心,点1表示分配至聚类中心A中的数据节点,第二检测单元308可以得出点A和点B之间的位置距离,随后可得到一个数值,随后可将点1与聚类中心A之间的距离数据与该数值进行对比,若点1与聚类中心A之间的距离数据落入在该数值的范围区间内,则可认为点1不属于超距离数据节点,结束流程并完成分组,若点1与聚类中心A之间的距离数据不落入在该数值的范围区间内。
剔除单元309,用于在第二检测单元308检测出聚类中心所处组类中存在与聚类中心之间的距离大于相邻两聚类中心之间的距离的超距离数据节点时,将超距离数据节点从聚类中心所处组类中剔除出去。
作为一种可选的实施方式,在本发明实施例中,第一计算单元301还用于在剔除单元309将超距离数据节点从聚类中心所处组类中剔除出去之后,计算出超距离数据节点的特征向量到每一聚类中心的距离。
第二确定单元310,用于确定出与超距离数据节点之间的距离最小的目标聚类中心。
作为一种可选的实施方式,在本发明实施例中,在剔除单元309将超距离数据节点从其原属聚类中心的组类中剔除出去之后,第一计算单元301可对超距离数据节点执行动作以对该超距离数据节点进行重新计算并分组,直到数据节点集合为空。
第三检测单元311,用于检测超距离数据节点与目标聚类中心之间的距离是否大于目标聚类中心与相邻聚类中心之间的距离。
作为一种可选的实施方式,在本发明实施例中,本申请为了提高分组的精确性,为防止在分组过程中因错误分组或错误剔除而造成数据分组错误的事项,本申请可在将数据节点集合中的数据完成粗分组之后再开始一个个的进行验证,而在剔除单元309将超距离数据节点从其原所属聚类中心所处组类中剔除出去之后,为防止误伤的操作,故本申请还需要对该被剔除出去的超距离数据节点再重新执行一次验证,即第三检测单元311的验证,待第三检测单元311进一步验证出超距离数据节点属于被误伤的数据节点之后,分配单元303可将超距离数据节点分配至与目标聚类中心所处的组类中,在第三检测单元311验证出超距离数据节点实属是属于污染数据时,分配单元303可将超距离数据节点分配至被排除组类中。
作为一种可选的实施方式,在本发明实施例中,分配单元303还用于在第三检测单元311检测出超距离数据节点与目标聚类中心之间的距离未大于目标聚类中心与相邻聚类中心之间的距离时,将超距离数据节点分配至与目标聚类中心所处的组类中。
作为一种可选的实施方式,在本发明实施例中,分配单元303还用于在第三检测单元311检测出超距离数据节点与目标聚类中心之间的距离大于目标聚类中心与相邻聚类中心之间的距离时,将超距离数据节点分配至被排除组类中。
作为一种可选的实施方式,在本发明实施例中,在第三检测单元311确定出超距离数据节点无法分配至任一组类中时,分组系统可将那些独立的节点视为污染图像,将可自动去除它们。
作为一种可选的实施方式,在本发明实施例中,在在精细分组阶段,对每个组内的图像采用增强的相似度准则重新分组,其结果可能是一些弱相关的图像被系统排除,或者是组内生成树的连接关系被重新确定,甚至会划分出更加精细的分组。
作为一种可选的实施方式,在本发明实施例中,本申请可快速去除图像集合中大量的与内容无关的污染图像,并按照数据集合中不同图像场景内容对图像集合进行准确划分,同时还完成了图像组内的特征级匹配,这不但能够帮助用户迅速掌握图像集合内容,还可以为后续大规模场景的三维重建工作提供有效的基础数据。
可见,实施图4所描述的另一种分组系统,能够有效减少量化误差的同时增加特征匹配精度,以获得更加精细化的数据分组结果。
此外,实施图4所描述的另一种分组系统,能够增加分组准确性的同时提高分组速度。
实施例五
请参阅图5,图5是本发明实施例公开的另一种分组系统的结构示意图。如图5所示,该分组系统可以包括:
存储有可执行程序代码的存储器501;
与存储器501耦合的处理器502;
其中,处理器502调用存储器501中存储的可执行程序代码,执行图1~图2任意一种智能分组方法。
本发明实施例公开一种计算机可读存储介质,其存储计算机程序,其中,该计算机程序使得计算机执行图1~图2任意一种智能分组方法。
本发明实施例还公开一种计算机程序产品,其中,当计算机程序产品在计算机上运行时,使得计算机执行如以上各方法实施例中的方法的部分或全部步骤。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一种计算机可读存储介质中,存储介质包括只读存储器(Read-Only Memory,ROM)、随机存储器(Random Access Memory,RAM)、可编程只读存储器(Programmable Read-only Memory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、一次可编程只读存储器(One-time Programmable Read-Only Memory,OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
以上对本发明实施例公开的一种智能分组方法及分组系统进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种智能分组方法,其特征在于,包括:
计算出数据节点集中每一数据节点的特征向量到每一组类的聚类中心的距离;
选择出与同一聚类中心之间的距离小于指定阈值的第一目标数据节点;
将所述第一目标数据节点分配至与所述同一聚类中心对应的组类中。
2.根据权利要求1所述的方法,其特征在于,所述将所述第一目标数据节点分配至与所述同一聚类中心对应的组类中之后,所述方法还包括:
检测所述数据节点集中是否还存在有未被分配的剩余数据节点;若是,计算出所述剩余数据节点到每一所述第一目标数据节点的距离;
确定出与所述剩余数据节点之间的距离最小的第二目标数据节点;
将所述剩余数据节点分配至所述第二目标数据节点所处的组类中。
3.根据权利要求2所述的方法,其特征在于,所述将所述剩余数据节点分配至所述第二目标数据节点所处的组类中之后,所述方法还包括:
计算出每一相邻两所述聚类中心之间的距离;
检测所述聚类中心所处组类中是否存在与所述聚类中心之间的距离大于相邻两所述聚类中心之间的距离的超距离数据节点;若是,将所述超距离数据节点从所述聚类中心所处组类中剔除出去。
4.根据权利要求3所述的方法,其特征在于,所述将所述超距离数据节点从所述聚类中心所处组类中剔除出去之后,所述方法还包括:
计算出所述超距离数据节点的特征向量到每一所述聚类中心的距离;
确定出与所述超距离数据节点之间的距离最小的目标聚类中心;
检测所述超距离数据节点与所述目标聚类中心之间的距离是否大于所述目标聚类中心与相邻所述聚类中心之间的距离;若否,将所述超距离数据节点分配至与所述目标聚类中心所处的组类中。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
若检测出所述超距离数据节点与所述目标聚类中心之间的距离大于所述目标聚类中心与相邻所述聚类中心之间的距离时,将所述超距离数据节点分配至被排除组类中。
6.一种分组系统,其特征在于,所述分组系统包括:
第一计算单元,用于计算出数据节点集中每一数据节点的特征向量到每一组类的聚类中心的距离;
选择单元,用于选择出与同一聚类中心之间的距离小于指定阈值的第一目标数据节点;
分配单元,用于将所述第一目标数据节点分配至与所述同一聚类中心对应的组类中。
7.根据权利要求6所述的分组系统,其特征在于,所述分组系统还包括:
第一检测单元,用于在所述分配单元将所述第一目标数据节点分配至与所述同一聚类中心对应的组类中之后,检测所述数据节点集中是否还存在有未被分配的剩余数据节点;
第二计算单元,用于在所述第一检测单元检测出所述数据节点集中还存在有未被分配的剩余数据节点时,计算出所述剩余数据节点到每一所述第一目标数据节点的距离;
第一确定单元,用于确定出与所述剩余数据节点之间的距离最小的第二目标数据节点;
所述分配单元,还用于将所述剩余数据节点分配至所述第二目标数据节点所处的组类中。
8.根据权利要求7所述的分组系统,其特征在于,所述分组系统还包括:
第三计算单元,用于在所述分配单元将所述剩余数据节点分配至所述第二目标数据节点所处的组类中之后,计算出每一相邻两所述聚类中心之间的距离;
第二检测单元,用于检测所述聚类中心所处组类中是否存在与所述聚类中心之间的距离大于相邻两所述聚类中心之间的距离的超距离数据节点;
剔除单元,用于在所述第二检测单元检测出所述聚类中心所处组类中存在与所述聚类中心之间的距离大于相邻两所述聚类中心之间的距离的超距离数据节点时,将所述超距离数据节点从所述聚类中心所处组类中剔除出去。
9.根据权利要求8所述的分组系统,其特征在于,所述分组系统还包括:
所述第一计算单元,还用于在所述剔除单元将所述超距离数据节点从所述聚类中心所处组类中剔除出去之后,计算出所述超距离数据节点的特征向量到每一所述聚类中心的距离;
第二确定单元,用于确定出与所述超距离数据节点之间的距离最小的目标聚类中心;
第三检测单元,用于检测所述超距离数据节点与所述目标聚类中心之间的距离是否大于所述目标聚类中心与相邻所述聚类中心之间的距离;
所述分配单元,还用于在所述第三检测单元检测出所述超距离数据节点与所述目标聚类中心之间的距离未大于所述目标聚类中心与相邻所述聚类中心之间的距离时,将所述超距离数据节点分配至与所述目标聚类中心所处的组类中。
10.一种分组系统,其特征在于,所述分组系统包括:
存储有可执行程序代码的存储器;
与所述存储器耦合的处理器;
所述处理器调用所述存储器中存储的所述可执行程序代码,执行权利要求1-5任一项所述的智能分组方法。
CN202210249756.4A 2022-03-14 2022-03-14 一种智能分组方法及分组系统 Pending CN114663701A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210249756.4A CN114663701A (zh) 2022-03-14 2022-03-14 一种智能分组方法及分组系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210249756.4A CN114663701A (zh) 2022-03-14 2022-03-14 一种智能分组方法及分组系统

Publications (1)

Publication Number Publication Date
CN114663701A true CN114663701A (zh) 2022-06-24

Family

ID=82029103

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210249756.4A Pending CN114663701A (zh) 2022-03-14 2022-03-14 一种智能分组方法及分组系统

Country Status (1)

Country Link
CN (1) CN114663701A (zh)

Similar Documents

Publication Publication Date Title
CN104679818A (zh) 一种视频关键帧提取方法及系统
US9842279B2 (en) Data processing method for learning discriminator, and data processing apparatus therefor
CN111143685B (zh) 一种商品推荐方法及装置
US4887304A (en) Library image optimization
CN112200059B (zh) 水上移动目标的流量统计方法、装置和计算机设备
JP2021135993A (ja) テキスト認識方法及びテキスト認識装置、電子設備、記憶媒体
JP2016095640A (ja) 密度計測装置、密度計測方法、およびプログラム
CN114663701A (zh) 一种智能分组方法及分组系统
US11500767B2 (en) Method and device for determining a global memory size of a global memory size for a neural network
CN116366603A (zh) 一种活跃IPv6地址的确定方法及装置
KR101623113B1 (ko) 의사 결정 트리의 학습과 분류를 위한 장치 및 그 방법
US20210241021A1 (en) Information processing method and information processing system
CN113688810B (zh) 一种边缘设备的目标捕获方法、系统及相关设备
CN111915016B (zh) 一种基于tvm编译器的异构平台的部署方法及装置
CN111179304A (zh) 目标关联方法、装置和计算机可读存储介质
CN114972956A (zh) 一种目标检测模型训练方法、装置、设备及存储介质
CN114611501A (zh) 生僻字检测方法、装置、设备及存储介质
US9875252B2 (en) Data processing apparatus using calculation of histogram intersection
CN112434648A (zh) 一种墙体形状变化检测方法及系统
CN111626364B (zh) 手势图像分类方法、装置、计算机设备及存储介质
Vu et al. Automatic improvement of graph based image segmentation
CN117291973B (zh) 一种基于激光点云的快速鲁棒的初定位方法
CN117372722B (zh) 一种目标识别方法及识别系统
CN111813971B (zh) 哈希表构建及图像匹配方法和装置,存储介质和电子设备
CN114265556B (zh) 一种数据存储方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination