CN112036344A - 应用于图像处理的聚类效果检测方法、装置、设备及介质 - Google Patents

应用于图像处理的聚类效果检测方法、装置、设备及介质 Download PDF

Info

Publication number
CN112036344A
CN112036344A CN202010922529.4A CN202010922529A CN112036344A CN 112036344 A CN112036344 A CN 112036344A CN 202010922529 A CN202010922529 A CN 202010922529A CN 112036344 A CN112036344 A CN 112036344A
Authority
CN
China
Prior art keywords
class
members
prediction
predicted
query
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202010922529.4A
Other languages
English (en)
Inventor
周曦
姚志强
王诗诗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Yunconghuilin Artificial Intelligence Technology Co ltd
Original Assignee
Shanghai Yunconghuilin Artificial Intelligence Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Yunconghuilin Artificial Intelligence Technology Co ltd filed Critical Shanghai Yunconghuilin Artificial Intelligence Technology Co ltd
Priority to CN202010922529.4A priority Critical patent/CN112036344A/zh
Publication of CN112036344A publication Critical patent/CN112036344A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/217Validation; Performance evaluation; Active pattern learning techniques
    • G06F18/2193Validation; Performance evaluation; Active pattern learning techniques based on specific statistical tests
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23211Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with adaptive number of clusters

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种应用于图像处理聚类效果检测方法、装置、设备及介质,该方法包括:通过标记成员来获取聚类结果中所对应的一种或者多种的实际类以及实际类中的预测类内成员;根据预测类内成员的成员数量分别进行多维查询处理,获取所述预测类内成员对应的类号,并通过所述预测类内成员的类号分别获取对应的实际类内成员;通过成员参数来确定聚类效果参数,并通过所述聚类效果参数来判定所述聚类效果。通过聚类效果参数来获取一种或者多种评价标准并对聚类效果进行评价,从而便于检测相关指标、衡量算法、阈值是否达到要求,从不同角度、不同类型的参数提供准确率、召回率、F值参考,提供评价方式或者检测结果,能够更好地优化算法、调整阈值。

Description

应用于图像处理的聚类效果检测方法、装置、设备及介质
技术领域
本发明涉及程序算法技术,特别是涉及一种应用于图像处理的聚类效果检测方法、装置、设备及介质。
背景技术
在机器学习中,通常使用聚类算法进行非监督学习,能够较好地适用于海量数据的处理。例如,安防部门有时需要对特定行人进行跟踪,所以要对抓拍到的人脸进行聚类。在完成聚类任务后,通常为得到更好的聚类效果需要优化算法、调整阈值等处理,以检测相关指标、衡量算法、阈值是否达到要求,现有的检测方法不能较好地反应和检测聚类效果。
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供一种应用于图像处理的聚类效果检测方法、装置、设备及介质,用于解决现有技术中聚类效果不便于检测的问题。
为实现上述目的及其他相关目的,本发明提供一种应用于图像处理的聚类效果检测方法,包括:
通过标记成员来获取聚类结果中所对应的一种或者多种的实际类以及所述实际类中的预测类内成员,其中,所述聚类结果是聚类算法的输出结果;
根据所述预测类内成员的成员数量分别进行多维查询处理,获取所述预测类内成员对应的类号,并通过所述预测类内成员的类号分别获取对应的实际类内成员;
通过成员参数来确定聚类效果参数,并通过所述聚类效果参数来判定所述聚类效果,其中,所述成员参数至少包括以下之一:所述标记成员、所述预测类内成员、所述实际类内成员。
可选的,所述多维查询处理的步骤包括:当所述预测类内成员的成员数量小于或者等于n时,查询各个预测类内成员所对应的类号,其中,n≥2且n为正整数;
所述多维查询处理的步骤包括:当所述预测类内成员的数量大于n时,查询其中m个预测类内成员所对应的类号,其中,其中,n>m≥1,n和m为正整数。
可选的,获取所述预测类内成员对应的类号,并通过所述预测类内成员的类号分别获取对应的实际类内成员的步骤包括:
通过各个预测类内成员所对应的类号确定不同的类号,并通过不同的类号分别获取对应的实际类内成员。
可选的,获取所述预测类内成员对应的类号,并通过所述预测类内成员的类号分别获取对应的实际类内成员的步骤包括:
通过m个预测类内成员所对应的类号确定不同的类号,并通过不同的类号分别获取对应的实际类内成员;
当m个预测类内成员对应的实际类内成员存在于所述标记成员的类中时,将m个预测类内成员从所述预测类内成员中删除。
可选的,当m个预测类内成员对应的实际类内成员不存在于所述标记成员的类中时,判断所述预测类内成员是否完成查询,当完成查询时,通过成员参数来确定聚类效果参数,当未完成查询时,查询所述预测类内成员的类号;
判断所述预测类内成员是否都完成查询,当完成查询时,通过成员参数来确定聚类效果参数,当未完成查询时,查询预测类内成员的类号。
可选的,所述聚类效果参数包括所述召回率和所述准确率,通过所述标记成员与所述预测类内成员之间的数量关系来确定所述召回率或者所述准确率。
可选的,所述聚类效果参数包括所述召回率和所述准确率,通过所述标记成员的元素与所述预测类内成员的元素之间的数量关系来确定所述召回率或者所述准确率,其中,所述标记成员的元素为所述标记成员所对应的类的二维列表的元素,所述预测类内成员的元素为所述预测类内成员所对应的类的二维列表的元素。
可选的,所述聚类效果参数包括所述召回率和所述准确率,通过所述标记成员所对应的类号与所述预测类内成员所对应的类号之间的数量关系来确定所述召回率或者所述准确率。
可选的,所述聚类效果参数包括所述F值,通过所述召回率与所述准确率之积、所述召回率与所述准确率之和的数量关系获取F值。
一种应用于图像处理的聚类效果检测装置,包括:
查询模块,用于通过标记成员获取所对应的一种或者多种的实际类以及所述实际类中的预测类内成员,根据所述预测类内成员的成员数量分别进行多维查询处理,获取所述预测类内成员对应的类号,并通过所述预测类内成员的类号分别获取对应的实际类内成员;
检测模块,用于通过成员参数来确定聚类效果参数,并通过所述聚类效果参数来判定聚类效果,其中,所述成员参数至少包括以下之一:所述标记成员、所述预测类内成员、所述实际类内成员;
所述查询模块与所述检测模块信号连接。
可选的,所述查询模块进行所述多维查询处理的步骤包括:当所述预测类内成员的成员数量小于或者等于n时,查询各个预测类内成员所对应的类号,其中,n≥2且n为正整数;
所述多维查询处理的步骤包括:当所述预测类内成员的数量大于n时,查询其中m个预测类内成员所对应的类号,其中,其中,n>m≥1,n和m为正整数。
可选的,所述查询模块获取所述预测类内成员对应的类号,通过所述预测类内成员的类号分别获取对应的实际类内成员的步骤包括:
通过各个预测类内成员所对应的类号确定不同的类号,并通过不同的类号分别获取对应的实际类内成员。
可选的,所述查询模块获取所述预测类内成员对应的类号,通过所述预测类内成员的类号分别获取对应的实际类内成员的步骤包括:
通过m个预测类内成员所对应的类号确定不同的类号,并通过不同的类号分别获取对应的实际类内成员;
当m个预测类内成员对应的实际类内成员存在于所述标记成员的类中时,将m个预测类内成员从所述预测类内成员中删除。
可选的,当m个预测类内成员对应的实际类内成员不存在于所述标记成员的类中时,判断所述预测类内成员是否完成查询,当完成查询时,通过成员参数来确定聚类效果参数,当未完成查询时,查询所述预测类内成员的类号;
判断所述预测类内成员是否都完成查询,当完成查询时,通过成员参数来确定聚类效果参数,当未完成查询时,查询预测类内成员的类号。
一种计算机设备,包括:
一个或多个处理器;和其上存储有指令的一个或多个机器可读介质,当所述一个或多个处理器执行时,使得所述设备执行一个或多个所述的方法。
一个或多个机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得设备执行一个或多个所述的方法。
如上所述,本发明提供的一种应用于图像处理的聚类效果检测方法、装置、设备及介质,具有以下有益效果:
通过聚类效果参数来获取一种或者多种评价标准,并通过该评价标准对聚类效果进行评价,从而便于检测相关指标、衡量算法、阈值是否达到要求,从不同角度、不同类型的参数提供准确率、召回率、F值参考,提供评价方式或者检测结果,能够更好地优化算法、调整阈值。
附图说明
图1为本发明实施例提供的应用于图像处理的聚类效果检测方法的流程示意图。
图2为本发明实施例提供的一多维查询处理的流程示意图。
图3为本发明实施例提供的另一多维查询处理的流程示意图。
图4为本发明实施例提供的应用于图像处理的聚类效果检测装置的结构示意图。。
图5为一实施例提供的终端设备的硬件结构示意图。
图6为另一实施例提供的终端设备的硬件结构示意图。
元件标号说明
1100 输入设备
1101 第一处理器
1102 输出设备
1103 第一存储器
1104 通信总线
1200 处理组件
1201 第二处理器
1202 第二存储器
1203 通信组件
1204 电源组件
1205 多媒体组件
1206 语音组件
1207 输入/输出接口
1208 传感器组件
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,遂图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
在图像处理的过程中,需要通过聚类算法来获取类以及类内的成员,发明人发现在测试过程中还需要通过一定的评价指标来评价聚类算法的性能,以便于进行阈值调节等对聚类算法的优化处理,请参阅图1,本发明提供一种应用于图像处理的聚类效果检测方法,包括:
S1:通过标记成员来获取聚类结果中所对应的一种或者多种的实际类以及所述实际类中的预测类内成员,即通过对聚类结果中的成员进行标记,获取标记成员,通过标记成员获取该标记成员所对应的实际类,并通过对实际类进行查询和预测,获取预测类内成员,其中,所述聚类结果是聚类算法的输出结果;
S2:根据所述预测类内成员的成员数量分别进行多维查询处理,获取所述预测类内成员对应的类号,并通过所述预测类内成员的类号分别获取对应的实际类内成员,还可根据所述预测类内成员的成员数量选择不同的多维查询处理方式,提高查询的速度和效率,也便于应用于海量数据聚类后的结果处理;
S3:通过成员参数来确定聚类效果参数,并通过所述聚类效果参数来判定所述聚类效果,其中,所述成员参数至少包括以下之一:所述标记成员、所述预测类内成员、所述实际类内成员。例如,可以通过各实际类包含的标记成员从数据库读取标记成员所在的类号,由于并非所有标记成员被聚到一个实际类中,所以可能会得到多个预测类,再通过这些预测类内读到该预测类的预测类内成员,最后得到二维成员列表。如有两个实际类内成员ID:[u1,u2,u3]、[u5,u6],通过数据库查询得到u1,u2属于类c1,u3属于类c2,u5,u6属于类c3,通过查询c1、c2得到其成员分别是[u1,u2],[u3,u4],查询c3得到其成员是[u5,u6],则最终返回的预测类内成员ID为以下二维列表[[u1,u2],[u3,u4]],[[u5,u6]],进而可以获取成员参数和聚类效果参数,通过聚类效果参数来获取一种或者多种评价标准,并通过该评价标准对聚类效果进行评价,从而便于检测相关指标、衡量算法、阈值是否达到要求,提供评价方式或者检测结果,能够更好地优化算法、调整阈值。
请参阅图2,在一些实施过程中,所述多维查询处理的步骤包括:
S101:当所述预测类内成员的成员数量小于或者等于n时;
S102:查询各个预测类内成员所对应的类号,其中,n≥2且n为正整数。
可选的,获取所述预测类内成员对应的类号,通过所述预测类内成员的类号分别获取对应的实际类内成员的步骤包括:
S103:通过各个预测类内成员所对应的类号确定不同的类号,并通过不同的类号分别获取对应的实际类内成员。由于类中类内成员的数量多少不同,出现大小类的情况,为减少网络传输耗时,可以选择对大小类分开处理,数量较小的类,例如,含有少于或者等于n个类内成员的类,可以一次对该类中所有类内成员查询所属的类号,返回不重复的类结果,单次查询只查询一个类内成员的所属类号消耗时间较多,所以采用一次查询多个类内成员的策略。
在一些实施过程中,对于较大的类,从第一次查询开始,每次选若干个预测类内成员进行查询,得到的不重复的类号以及对应的类号所含的实际类内成员,如果实际类内成员在标记成员的类号中,则将所述若干个预测类内成员删除,这样可以较大地减少需要查询的成员个数,也可以大大减少需要查询的次数。请参阅图3,所述多维查询处理的步骤包括:
S111:当所述预测类内成员的数量大于n时;
S112:查询其中m个预测类内成员所对应的类号,其中,其中,n>m≥1,n和m为正整数。
获取所述预测类内成员对应的类号,通过所述预测类内成员的类号分别获取对应的实际类内成员的步骤包括:
S113:通过m个预测类内成员所对应的类号确定不同的类号,并通过不同的类号分别获取对应的实际类内成员;
S114:当m个预测类内成员对应的实际类内成员存在于所述标记成员的类中时;
S115:将m个预测类内成员从所述预测类内成员中删除。
S114:当m个预测类内成员对应的实际类内成员不存在于所述标记成员的类中时,判断所述预测类内成员是否完成查询S116,当完成查询时,通过成员参数来确定聚类效果参数S2,当未完成查询时,查询所述预测类内成员的类号,跳转至S112。
在将m个预测类内成员从所述预测类内成员中删除的步骤S115之后,判断所述预测类内成员是否都完成查询S116,当完成查询时,通过成员参数来确定聚类效果参数S2,当未完成查询时,查询预测类内成员的类号,跳转至S112。通过选取m个预测类内成员进行查询,然后删除存在于标记成员的类中的m个预测类内成员,避免重复查询,降低了需要查询的次数,提高了查询效率和速度。
在一些实施过程中,所述聚类效果参数包括所述召回率和所述准确率,通过所述标记成员与所述预测类内成员之间的数量关系来确定所述召回率或者所述准确率。例如,R表示标记成员的集合,P表示预测类内成员的集合,所述召回率或者所述准确率的一种数学表达为:
Figure BDA0002667223250000061
Figure BDA0002667223250000071
其中,Recall1表示一种召回率,Accurancy1表示一种准确率,∩表示集合的交集,|T|表示集合T的元素数量。
在一些实施过程中,所述聚类效果参数包括所述召回率和所述准确率,通过所述标记成员的元素与所述预测类内成员的元素之间的数量关系来确定所述召回率或者所述准确率,其中,所述标记成员的元素为所述标记成员所对应的类的二维列表的元素,所述预测类内成员的元素为所述预测类内成员所对应的类的二维列表的元素。例如,所述召回率或者所述准确率的另一数学表达为:
Figure BDA0002667223250000072
Figure BDA0002667223250000075
其中,R表示标记成员的集合,P表示预测类内成员的集合,Recall2表示另一种召回率,Accurancy2表示另一种准确率,∩表示集合的交集,pairedT表示集合T中元素的二维列表,|T|表示集合T的元素数量。更加符合实际,而且为了便于提升计算性能,将熵的运算改为成员个数的运算。
在一些实施过程中,所述聚类效果参数包括所述召回率和所述准确率,通过所述标记成员所对应的类号与所述预测类内成员所对应的类号之间的数量关系来确定所述召回率或者所述准确率,例如,所述召回率或者所述准确率的又一数学表达为:
Figure BDA0002667223250000073
Figure BDA0002667223250000074
其中,R’表示标记成员的对应类的集合,P’表示预测类内成员的对应类的集合,Recall3表示又一种召回率,Accurancy3表示又一种准确率,∩表示集合的交集。由于信息量较少,计算方式较为严格,该计算方式以类或者集群为单位,用来检查集群是否完全正确。
可选的,所述聚类效果参数包括所述F值(即F-measure),通过所述召回率与所述准确率之积、所述召回率与所述准确率之和的数量关系获取F值。例如,F值的一种数学表达为:
Figure BDA0002667223250000081
其中,Recall表示召回率,Accurancy表示准确率。
在一些实施过程中,可将本方法提供的聚类效果检测方法应用到现有网络中,并进行运行环境的配置,通过命令行命令访问所述流程进行准召自动识别,还可以通过命令行窗口,可以查看准确率、召回率、F值等参数随阈值调整发生的变化,从不同角度、不同类型的参数提供准确率、召回率、F值参考,便于检测聚类效果。
请参阅图4,本发明还提供一种应用于图像处理的聚类效果检测装置,包括:
查询模块1,用于通过标记成员获取所对应的一种或者多种的类以及预测类内成员,根据所述预测类内成员的成员数量分别进行多维查询处理,获取所述预测类内成员对应的类号,通过所述预测类内成员的类号分别获取对应的实际类内成员;
检测模块2,用于通过成员参数来确定聚类效果参数,并通过所述聚类效果参数来判定聚类效果,其中,所述成员参数至少包括以下之一:所述标记成员、所述预测类内成员、所述实际类内成员,所述聚类效果参数至少包括以下之一:准确率、召回率、F值。如有两个实际类内成员ID:[u1,u2,u3]、[u5,u6],通过数据库查询得到u1,u2属于类c1,u3属于类c2,u5,u6属于类c3,通过查询c1、c2得到其成员分别是[u1,u2],[u3,u4],查询c3得到其成员是[u5,u6],则最终返回的预测类内成员ID为以下二维列表[[u1,u2],[u3,u4]],[[u5,u6]],进而可以获取成员参数和聚类效果参数,通过聚类效果参数来获取一种或者多种评价标准,并通过该评价标准对聚类效果进行评价,从而便于检测相关指标、衡量算法、阈值是否达到要求,提供评价方式或者检测结果,能够更好地优化算法、调整阈值。
可选的,所述多维查询处理的步骤包括:当所述预测类内成员的成员数量小于或者等于n时,查询各个预测类内成员所对应的类号,其中,n≥2且n为正整数。
可选的,获取所述预测类内成员对应的类号,通过所述预测类内成员的类号分别获取对应的实际类内成员的步骤包括:
通过各个预测类内成员所对应的类号确定不同的类号,并通过不同的类号分别获取对应的实际类内成员。
可选的,所述多维查询处理的步骤包括:当所述预测类内成员的数量大于n时,查询其中m个预测类内成员所对应的类号,其中,其中,n>m≥1,n和m为正整数。
可选的,获取所述预测类内成员对应的类号,通过所述预测类内成员的类号分别获取对应的实际类内成员的步骤包括:
通过m个预测类内成员所对应的类号确定不同的类号,并通过不同的类号分别获取对应的实际类内成员;
当m个预测类内成员存在于所述标记成员的类中时,将m个预测类内成员从所述预测类内成员中删除。
可选的,当m个预测类内成员不存在于所述标记成员的类中时,判断所述预测类内成员是否完成查询,当完成查询时,通过成员参数来确定聚类效果参数,当未完成查询时,查询所述预测类内成员的类号。
可选的,将m个预测类内成员从所述预测类内成员中删除的步骤之后,判断所述预测类内成员是否都完成查询,当完成查询时,通过成员参数来确定聚类效果参数,当未完成查询时,查询预测类内成员的类号。
可选的,所述聚类效果参数包括所述召回率和所述准确率,通过所述标记成员与所述预测类内成员之间的数量关系来确定所述召回率或者所述准确率。
可选的,所述聚类效果参数包括所述召回率和所述准确率,通过所述标记成员的元素与所述预测类内成员的元素之间的数量关系来确定所述召回率或者所述准确率,其中,所述标记成员的元素为所述标记成员所对应的类的二维列表的元素,所述预测类内成员的元素为所述预测类内成员所对应的类的二维列表的元素。
可选的,所述聚类效果参数包括所述召回率和所述准确率,通过所述标记成员所对应的类号与所述预测类内成员所对应的类号之间的数量关系来确定所述召回率或者所述准确率。
可选的,所述聚类效果参数包括所述F值,通过所述召回率与所述准确率之积、所述召回率与所述准确率之和的数量关系获取F值。
一种设备,包括:一个或多个处理器;和其上存储有指令的一个或多个机器可读介质,当所述一个或多个处理器执行时,使得所述设备执行一个或多个所述的方法。
一个或多个机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得设备执行一个或多个所述的方法。
本申请实施例还提供了一种设备,该设备可以包括:一个或多个处理器;和其上存储有指令的一个或多个机器可读介质,当由所述一个或多个处理器执行时,使得所述设备执行图1所述的方法。在实际应用中,该设备可以作为终端设备,也可以作为服务器,终端设备的例子可以包括:智能手机、平板电脑、电子书阅读器、MP3(动态影像专家压缩标准语音层面3,Moving Picture Experts Group Audio Layer III)播放器、MP4(动态影像专家压缩标准语音层面4,Moving Picture Experts Group Audio Layer IV)播放器、膝上型便携计算机、车载电脑、台式计算机、机顶盒、智能电视机、可穿戴设备等等,本申请实施例对于具体的设备不加以限制。
本申请实施例还提供了一种非易失性可读存储介质,该存储介质中存储有一个或多个模块(programs),该一个或多个模块被应用在设备时,可以使得该设备执行本申请实施例的图4中数据处理方法所包含步骤的指令(instructions)。
图5为本申请一实施例提供的终端设备的硬件结构示意图。如图所示,该终端设备可以包括:输入设备1100、第一处理器1101、输出设备1102、第一存储器1103和至少一个通信总线1104。通信总线1104用于实现元件之间的通信连接。第一存储器1103可能包含高速RAM存储器,也可能还包括非易失性存储NVM,例如至少一个磁盘存储器,第一存储器1103中可以存储各种程序,用于完成各种处理功能以及实现本实施例的方法步骤。
可选的,上述第一处理器1101例如可以为中央处理器(Central ProcessingUnit,简称CPU)、应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,该第一处理器1101通过有线或无线连接耦合到上述输入设备1100和输出设备1102。
可选的,上述输入设备1100可以包括多种输入设备,例如可以包括面向用户的用户接口、面向设备的设备接口、软件的可编程接口、摄像头、传感器中至少一种。可选的,该面向设备的设备接口可以是用于设备与设备之间进行数据传输的有线接口、还可以是用于设备与设备之间进行数据传输的硬件插入接口(例如USB接口、串口等);可选的,该面向用户的用户接口例如可以是面向用户的控制按键、用于接收语音输入的语音输入设备以及用户接收用户触摸输入的触摸感知设备(例如具有触摸感应功能的触摸屏、触控板等);可选的,上述软件的可编程接口例如可以是供用户编辑或者修改程序的入口,例如芯片的输入引脚接口或者输入接口等;输出设备1102可以包括显示器、音响等输出设备。
在本实施例中,该终端设备的处理器包括用于执行各设备中语音识别装置各模块的功能,具体功能和技术效果参照上述实施例即可,此处不再赘述。
图6为本申请的一个实施例提供的终端设备的硬件结构示意图。图6是对图5在实现过程中的一个具体的实施例。如图所示,本实施例的终端设备可以包括第二处理器1201以及第二存储器1202。
第二处理器1201执行第二存储器1202所存放的计算机程序代码,实现上述实施例中图4所述方法。
第二存储器1202被配置为存储各种类型的数据以支持在终端设备的操作。这些数据的示例包括用于在终端设备上操作的任何应用程序或方法的指令,例如消息,图片,视频等。第二存储器1202可能包含随机存取存储器(random access memory,简称RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
可选地,第二处理器1201设置在处理组件1200中。该终端设备还可以包括:通信组件1203,电源组件1204,多媒体组件1205,语音组件1206,输入/输出接口1207和/或传感器组件1208。终端设备具体所包含的组件等依据实际需求设定,本实施例对此不作限定。
处理组件1200通常控制终端设备的整体操作。处理组件1200可以包括一个或多个第二处理器1201来执行指令,以完成上述数据处理方法中的全部或部分步骤。此外,处理组件1200可以包括一个或多个模块,便于处理组件1200和其他组件之间的交互。例如,处理组件1200可以包括多媒体模块,以方便多媒体组件1205和处理组件1200之间的交互。
电源组件1204为终端设备的各种组件提供电力。电源组件1204可以包括电源管理系统,一个或多个电源,及其他与为终端设备生成、管理和分配电力相关联的组件。
多媒体组件1205包括在终端设备和用户之间的提供一个输出接口的显示屏。在一些实施例中,显示屏可以包括液晶显示器(LCD)和触摸面板(TP)。如果显示屏包括触摸面板,显示屏可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。
语音组件1206被配置为输出和/或输入语音信号。例如,语音组件1206包括一个麦克风(MIC),当终端设备处于操作模式,如语音识别模式时,麦克风被配置为接收外部语音信号。所接收的语音信号可以被进一步存储在第二存储器1202或经由通信组件1203发送。在一些实施例中,语音组件1206还包括一个扬声器,用于输出语音信号。
输入/输出接口1207为处理组件1200和外围接口模块之间提供接口,上述外围接口模块可以是点击轮,按钮等。这些按钮可包括但不限于:音量按钮、启动按钮和锁定按钮。
传感器组件1208包括一个或多个传感器,用于为终端设备提供各个方面的状态评估。例如,传感器组件1208可以检测到终端设备的打开/关闭状态,组件的相对定位,用户与终端设备接触的存在或不存在。传感器组件1208可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在,包括检测用户与终端设备间的距离。在一些实施例中,该传感器组件1208还可以包括摄像头等。
通信组件1203被配置为便于终端设备和其他设备之间有线或无线方式的通信。终端设备可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个实施例中,该终端设备中可以包括SIM卡插槽,该SIM卡插槽用于插入SIM卡,使得终端设备可以登录GPRS网络,通过互联网与服务器建立通信。
由上可知,在图6实施例中所涉及的通信组件1203、语音组件1206以及输入/输出接口1207、传感器组件1208均可以作为图5实施例中的输入设备的实现方式。
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。

Claims (16)

1.一种应用于图像处理的聚类效果检测方法,其特征在于,包括:
通过标记成员来获取聚类结果中所对应的一种或者多种的实际类以及所述实际类中的预测类内成员,其中,所述聚类结果是聚类算法的输出结果;
根据所述预测类内成员的成员数量分别进行多维查询处理,获取所述预测类内成员对应的类号,并通过所述预测类内成员的类号分别获取对应的实际类内成员;
通过成员参数来确定聚类效果参数,并通过所述聚类效果参数来判定所述聚类效果,其中,所述成员参数至少包括以下之一:所述标记成员、所述预测类内成员、所述实际类内成员。
2.根据权利要求1所述的应用于图像处理的聚类效果检测方法,其特征在于,所述多维查询处理的步骤包括:当所述预测类内成员的成员数量小于或者等于n时,查询各个预测类内成员所对应的类号,其中,n≥2且n为正整数;
所述多维查询处理的步骤包括:当所述预测类内成员的数量大于n时,查询其中m个预测类内成员所对应的类号,其中,其中,n>m≥1,n和m为正整数。
3.根据权利要求2所述的应用于图像处理的聚类效果检测方法,其特征在于,获取所述预测类内成员对应的类号,并通过所述预测类内成员的类号分别获取对应的实际类内成员的步骤包括:
通过各个预测类内成员所对应的类号确定不同的类号,并通过不同的类号分别获取对应的实际类内成员。
4.根据权利要求2所述的应用于图像处理的聚类效果检测方法,其特征在于,获取所述预测类内成员对应的类号,并通过所述预测类内成员的类号分别获取对应的实际类内成员的步骤包括:
通过m个预测类内成员所对应的类号确定不同的类号,并通过不同的类号分别获取对应的实际类内成员;
当m个预测类内成员对应的实际类内成员存在于所述标记成员的类中时,将m个预测类内成员从所述预测类内成员中删除。
5.根据权利要求4所述的应用于图像处理的聚类效果检测方法,其特征在于,当m个预测类内成员对应的实际类内成员不存在于所述标记成员的类中时,判断所述预测类内成员是否完成查询,当完成查询时,通过成员参数来确定聚类效果参数,当未完成查询时,查询所述预测类内成员的类号;
判断所述预测类内成员是否都完成查询,当完成查询时,通过成员参数来确定聚类效果参数,当未完成查询时,查询预测类内成员的类号。
6.根据权利要求1所述的应用于图像处理的聚类效果检测方法,其特征在于,所述聚类效果参数包括所述召回率和所述准确率,通过所述标记成员与所述预测类内成员之间的数量关系来确定所述召回率或者所述准确率。
7.根据权利要求1所述的应用于图像处理的聚类效果检测方法,其特征在于,所述聚类效果参数包括所述召回率和所述准确率,通过所述标记成员的元素与所述预测类内成员的元素之间的数量关系来确定所述召回率或者所述准确率,其中,所述标记成员的元素为所述标记成员所对应的类的二维列表的元素,所述预测类内成员的元素为所述预测类内成员所对应的类的二维列表的元素。
8.根据权利要求1所述的应用于图像处理的聚类效果检测方法,其特征在于,所述聚类效果参数包括所述召回率和所述准确率,通过所述标记成员所对应的类号与所述预测类内成员所对应的类号之间的数量关系来确定所述召回率或者所述准确率。
9.根据权利要求6或者7或者8所述的应用于图像处理的聚类效果检测方法,其特征在于,所述聚类效果参数包括所述F值,通过所述召回率与所述准确率之积、所述召回率与所述准确率之和的数量关系获取F值。
10.一种应用于图像处理的聚类效果检测装置,其特征在于,包括:
查询模块,用于通过标记成员获取所对应的一种或者多种的实际类以及所述实际类中的预测类内成员,根据所述预测类内成员的成员数量分别进行多维查询处理,获取所述预测类内成员对应的类号,并通过所述预测类内成员的类号分别获取对应的实际类内成员;
检测模块,用于通过成员参数来确定聚类效果参数,并通过所述聚类效果参数来判定聚类效果,其中,所述成员参数至少包括以下之一:所述标记成员、所述预测类内成员、所述实际类内成员;
所述查询模块与所述检测模块信号连接。
11.根据权利要求10所述的应用于图像处理的聚类效果检测装置,其特征在于,所述查询模块进行所述多维查询处理的步骤包括:当所述预测类内成员的成员数量小于或者等于n时,查询各个预测类内成员所对应的类号,其中,n≥2且n为正整数;
所述多维查询处理的步骤包括:当所述预测类内成员的数量大于n时,查询其中m个预测类内成员所对应的类号,其中,其中,n>m≥1,n和m为正整数。
12.根据权利要求11所述的应用于图像处理的聚类效果检测装置,其特征在于,所述查询模块获取所述预测类内成员对应的类号,通过所述预测类内成员的类号分别获取对应的实际类内成员的步骤包括:
通过各个预测类内成员所对应的类号确定不同的类号,并通过不同的类号分别获取对应的实际类内成员。
13.根据权利要求11所述的应用于图像处理的聚类效果检测装置,其特征在于,所述查询模块获取所述预测类内成员对应的类号,通过所述预测类内成员的类号分别获取对应的实际类内成员的步骤包括:
通过m个预测类内成员所对应的类号确定不同的类号,并通过不同的类号分别获取对应的实际类内成员;
当m个预测类内成员对应的实际类内成员存在于所述标记成员的类中时,将m个预测类内成员从所述预测类内成员中删除。
14.根据权利要求13所述的应用于图像处理的聚类效果检测装置,其特征在于,当m个预测类内成员对应的实际类内成员不存在于所述标记成员的类中时,判断所述预测类内成员是否完成查询,当完成查询时,通过成员参数来确定聚类效果参数,当未完成查询时,查询所述预测类内成员的类号;
判断所述预测类内成员是否都完成查询,当完成查询时,通过成员参数来确定聚类效果参数,当未完成查询时,查询预测类内成员的类号。
15.一种计算机设备,其特征在于,包括:
一个或多个处理器;和
其上存储有指令的一个或多个机器可读介质,当所述一个或多个处理器执行时,使得所述设备执行如权利要求1-9中一个或多个所述的应用于图像处理的聚类效果检测方法。
16.一个或多个机器可读介质,其特征在于,其上存储有指令,当由一个或多个处理器执行时,使得设备执行如权利要求1-9中一个或多个所述的应用于图像处理的聚类效果检测方法。
CN202010922529.4A 2020-09-04 2020-09-04 应用于图像处理的聚类效果检测方法、装置、设备及介质 Withdrawn CN112036344A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010922529.4A CN112036344A (zh) 2020-09-04 2020-09-04 应用于图像处理的聚类效果检测方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010922529.4A CN112036344A (zh) 2020-09-04 2020-09-04 应用于图像处理的聚类效果检测方法、装置、设备及介质

Publications (1)

Publication Number Publication Date
CN112036344A true CN112036344A (zh) 2020-12-04

Family

ID=73590616

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010922529.4A Withdrawn CN112036344A (zh) 2020-09-04 2020-09-04 应用于图像处理的聚类效果检测方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN112036344A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010042195A1 (en) * 2008-10-10 2010-04-15 Exxonmobil Research And Engineering Company Method for clustering of large, high-dimensional datasets
US20190311194A1 (en) * 2018-04-09 2019-10-10 Abbyy Production Llc Character recognition using hierarchical classification
CN110942086A (zh) * 2019-10-30 2020-03-31 平安科技(深圳)有限公司 数据预测优化方法、装置、设备及可读存储介质
CN111091152A (zh) * 2019-12-17 2020-05-01 上海云从汇临人工智能科技有限公司 图像聚类方法、系统、设备及机器可读介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010042195A1 (en) * 2008-10-10 2010-04-15 Exxonmobil Research And Engineering Company Method for clustering of large, high-dimensional datasets
US20190311194A1 (en) * 2018-04-09 2019-10-10 Abbyy Production Llc Character recognition using hierarchical classification
CN110942086A (zh) * 2019-10-30 2020-03-31 平安科技(深圳)有限公司 数据预测优化方法、装置、设备及可读存储介质
CN111091152A (zh) * 2019-12-17 2020-05-01 上海云从汇临人工智能科技有限公司 图像聚类方法、系统、设备及机器可读介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ANGELO DALLI: "Adaptation of the F-measure to Cluster Based Lexicon Quality", 《PROCEEDINGS OF THE EACL 2003 WORKSHOP ON EVALUATION INITIATIVES IN NATURAL LANGUAGE PROCESSING: ARE EVALUATION METHODS, METRICS AND RESOURCES REUSABLE?》 *
百度文库: "F-measure方法说明及MATLAB程序", 《HTTPS://WENKU.BAIDU.COM/VIEW/D9B45DE7AFF8941EA76E58FAFAB069DC50224781.HTML》 *

Similar Documents

Publication Publication Date Title
CN111898495B (zh) 一种动态阈值管理方法、系统、设备及介质
CN111598012B (zh) 一种图片聚类管理方法、系统、设备及介质
CN111310725A (zh) 一种对象识别方法、系统、机器可读介质及设备
CN112200318A (zh) 一种目标检测方法、装置、机器可读介质及设备
CN110825611A (zh) 异常程序的分析方法及装置和计算机可读存储介质
CN112241789A (zh) 用于轻量化神经网络的结构化剪枝方法、装置、介质及设备
CN107679222B (zh) 图片处理方法、移动终端及计算机可读存储介质
CN111178455B (zh) 图像聚类方法、系统、设备及介质
CN112989210A (zh) 基于健康画像的保险推荐方法、系统、设备和介质
CN112860731A (zh) 一种物品信息交互管理方法、系统、设备和介质
CN111091152A (zh) 图像聚类方法、系统、设备及机器可读介质
CN112417197B (zh) 一种排序方法、装置、机器可读介质及设备
CN111275683A (zh) 图像质量评分处理方法、系统、设备及介质
CN112036344A (zh) 应用于图像处理的聚类效果检测方法、装置、设备及介质
CN111813988B (zh) 用于图像特征库的hnsw节点删除方法、系统、设备和介质
CN112084780B (zh) 自然语言处理中共指消解方法、装置、设备及介质
CN112257812A (zh) 一种标注样本确定方法、装置、机器可读介质及设备
CN112051270B (zh) 一种输电线缺陷检测方法、系统、设备及介质
CN108021648B (zh) 一种搜题的方法、装置及智能终端
CN116468883B (zh) 一种高精度图像数据体积雾识别方法及装置
CN112801130B (zh) 图像聚类簇质量评估方法、系统、介质及装置
CN111224936B (zh) 用户异常请求检测方法、系统、设备以及机器可读介质
CN114155536A (zh) 一种文字识别方法、装置、机器可读介质及设备
CN110875876B (zh) 电子红包识别方法、电子红包识别装置及移动终端
CN112069184A (zh) 一种向量检索方法、系统、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20201204