CN108288076B - 汽车配件聚类方法、装置、电子设备及存储介质 - Google Patents

汽车配件聚类方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN108288076B
CN108288076B CN201810144714.8A CN201810144714A CN108288076B CN 108288076 B CN108288076 B CN 108288076B CN 201810144714 A CN201810144714 A CN 201810144714A CN 108288076 B CN108288076 B CN 108288076B
Authority
CN
China
Prior art keywords
accessory
samples
similarity
clustering
accessory samples
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810144714.8A
Other languages
English (en)
Other versions
CN108288076A (zh
Inventor
江兴凌
袁海昌
叶铭根
武群夺
雷四红
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Casstime Technology Co ltd
Original Assignee
Shenzhen Casstime Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Casstime Technology Co ltd filed Critical Shenzhen Casstime Technology Co ltd
Priority to CN201810144714.8A priority Critical patent/CN108288076B/zh
Publication of CN108288076A publication Critical patent/CN108288076A/zh
Application granted granted Critical
Publication of CN108288076B publication Critical patent/CN108288076B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Traffic Control Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种汽车配件聚类方法,所述方法包括:构建由多个配件样本组成的配件图;确定所述配件图的拉普拉斯矩阵;对所述拉普拉斯矩阵进行分解,获得特征向量;对所述特征向量进行聚类,以使得多个所述配件样本中同类别的配件样本聚集,不同类别的配件样本分离。本发明能够对多个配件进行聚类,以选择出替换件,节约维修费用,同时,节省仓储,缩短维修工期。

Description

汽车配件聚类方法、装置、电子设备及存储介质
技术领域
本发明涉及汽车配件技术领域,尤其涉及一种汽车配件聚类方法、装置、电子设备及存储介质。
背景技术
近年来,不论合资品牌还是自主品牌,汽车产品均不断推陈出新。汽车厂家根据国家新法规新技术,产品升级质量提升等因素,在原有汽车基础上实施工程更改,从不同层面提升整车的性能,以满足不同客户对油耗和驾驶舒适度的多样化需求。因此,不少车型由于不同生产日期,或者同一型号汽车在不同生产时期,其部分零件不具有替换性。另外一方面,同一品牌的汽车新开发的车型,一般以老车型为基础,进行性能、装备方面的改进和扩展,为了降低开发、生产的成本,以及维修的方便性,新车型采用了原车型的许多部件,仍有很多零件是可以通用的。
在汽车维修层面,维修厂不可能贮备所有的配件,而车主如果选择原装的配件进行维修,将会花费较高的维修费用。因此,在汽车配件数据管理的基础上,如何选择替换件是一个亟待解决的技术课题。
发明内容
鉴于以上内容,有必要提供一种汽车配件聚类方法、装置、电子设备及存储介质,能够对多个配件进行聚类,以选择出替换件,节约维修费用,同时,节省仓储,缩短维修工期。
一种汽车配件聚类方法,所述方法包括:
构建由多个配件样本组成的配件图;
确定所述配件图的拉普拉斯矩阵;
对所述拉普拉斯矩阵进行分解,获得特征向量;
对所述特征向量进行聚类,以使得多个所述配件样本中同类别的配件样本聚集,不同类别的配件样本分离。
在一种可能的实现方式中,所述构建由多个配件样本组成的配件图包括:
构建以配件样本为对象的集合;
计算各个所述配件样本之间的相似度;
根据所述集合以及所述各个所述配件样本之间的相似度,构建由多个配件样本组成的配件图。
在一种可能的实现方式中,所述计算各个所述配件样本之间的相似度包括:
计算各个所述配件样本的图像属性之间的第一相似度;
计算各个所述配件样本的文本属性之间的第二相似度;
根据所述第一相似度以及所述第二相似度,确定各个所述配件样本之间的相似度。
在一种可能的实现方式中,针对聚集后的同类别的配件样本,任意两个所述配件样本之间具有可替换性。
一种汽车配件聚类装置,所述汽车配件聚类装置包括:
构建单元,用于构建由多个配件样本组成的配件图;
确定单元,用于确定所述配件图的拉普拉斯矩阵;
分解单元,用于对所述拉普拉斯矩阵进行分解,获得特征向量;
聚类单元,用于对所述特征向量进行聚类,以使得多个所述配件样本中同类别的配件样本聚集,不同类别的配件样本分离。
在一种可能的实现方式中,所述构建单元构建由多个配件样本组成的配件图包括:
构建以配件样本为对象的集合;
计算各个所述配件样本之间的相似度;
根据所述集合以及所述各个所述配件样本之间的相似度,构建由多个配件样本组成的配件图。
在一种可能的实现方式中,所述计算各个所述配件样本之间的相似度包括:
计算各个所述配件样本的图像属性之间的第一相似度;
计算各个所述配件样本的文本属性之间的第二相似度;
根据所述第一相似度以及所述第二相似度,确定各个所述配件样本之间的相似度。
在一种可能的实现方式中,针对聚集后的同类别的配件样本,任意两个所述配件样本之间具有可替换性。
一种电子设备,所述电子设备包括处理器和存储器,所述处理器用于执行存储器中存储的计算机程序以实现所述的汽车配件聚类方法。
一种计算机可读存储介质,所述计算机可读存储介质存储有至少一个指令,所述至少一个指令被处理器执行时实现所述的汽车配件聚类方法。
由以上技术方案,本发明中,电子设备可以构建由多个配件样本组成的配件图;确定所述配件图的拉普拉斯矩阵;对所述拉普拉斯矩阵进行分解,获得特征向量;对所述特征向量进行聚类,以使得多个所述配件样本中同类别的配件样本聚集,不同类别的配件样本分离。可见,通过本发明的实施例,电子设备可以通过相关的算法对多个配件样本进行聚类,从而使得多个所述配件样本中同类别的配件样本聚集,不同类别的配件样本分离,聚集后的同类别的多个配件样本之间,任意两个配件样本具有可替换性,从而可以从多个配件中选择出替换件,节约维修费用,同时,节省仓储,缩短维修工期。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1是本发明公开的一种汽车配件聚类方法的较佳实施例的流程图。
图2是本发明公开的一种配件图的示意图。
图3是本发明公开的另一种汽车配件聚类方法的较佳实施例的流程图。
图4是本发明公开的一种汽车配件聚类装置的较佳实施例的功能模块图。
图5是本发明实现汽车配件聚类方法的较佳实施例的电子设备的结构示意图。
主要元件符号说明
电子设备 1
汽车配件聚类装置 11
存储器 12
处理器 13
构建单元 101
确定单元 102
分解单元 103
聚类单元 104
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
其中,所述电子设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(ApplicationSpecific Integrated Circuit,ASIC)、可编程门阵列(Field-Programmable GateArray,FPGA)、数字处理器(Digital Signal Processor,DSP)、嵌入式设备等。
所述电子设备包括但不限于任何一种可与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互的电子产品,例如,个人计算机、平板电脑、个人数字助理(Personal Digital Assistant,PDA)、交互式网络电视(Internet Protocol Television,IPTV)等。
请参见图1,图1是本发明公开的一种汽车配件聚类方法的较佳实施例的流程图。其中,根据不同的需求,该流程图中步骤的顺序可以改变,某些步骤可以省略。
S11、电子设备构建由多个配件样本组成的配件图。
本发明实施例中,汽车由各种各样的配件组成,当汽车需要进行性能、装备方面的改进和扩展,或者产品质量升级,或者维修时,往往需要对配件进行替换。
其中,配件可以包括但不限于滤清器、刹车片、刹车盘、皮带、润滑油、球头、球笼、减震器、点火线圈、火花塞、雨刮片、燃油泵以及汽机油等。汽车可以包括但不限于各种品牌各种机型的汽车,比如宝马318i E46N42CHN,奥迪A6L 2017等。
本发明实施例中,在对汽车进行维修时,由于汽车的配件多种多样,而维修厂不可能储备所有的配件,因而需要构建由多个配件样本组成的配件图,以研究配件之间的可替换性。
可选的,所述构建由多个配件样本组成的配件图包括:
构建以配件样本为对象的集合;
计算各个所述配件样本之间的相似度;
根据所述集合以及所述各个所述配件样本之间的相似度,构建由多个配件样本组成的配件图。
其中,所述计算各个所述配件样本之间的相似度包括:
计算各个所述配件样本的图像属性之间的第一相似度;
计算各个所述配件样本的文本属性之间的第二相似度;
根据所述第一相似度以及所述第二相似度,确定各个所述配件样本之间的相似度。
在该实施例中,可以以汽车的多个配件样本为对象,构成一个集合,进一步地,可以计算各个所述配件样本之间的相似度。其中,各个所述配件样本之间的相似度可以从两个维度进行衡量:图像属性的相似度和文字属性的相似度,图像属性为配件所在图片以及图上的位置,文字属性为配件所在的目录描述,配件名称,配件说明信息,使用数量等。具体的,可以先采用杰卡德相似系数来计算各个所述配件样本的图像属性之间的第一相似度,以及采用余弦相似度来计算各个所述配件样本的文本属性之间的第二相似度,然后,综合所述第一相似度以及所述第二相似度,确定各个所述配件样本之间的相似度。最后根据所述集合以及所述各个所述配件样本之间的相似度,构建由多个配件样本组成的配件图。
其中,两个集合A和B的交集元素在A,B的并集中所占的比例,称为两个集合的杰卡德相似系数,用符号J(A,B)表示。如:
Figure BDA0001578516820000061
其中,杰卡德相似系数用于比较有限样本集之间的相似性与差异性。杰卡德相似系数值越大,样本相似度越高。
其中,余弦相似度,又称为余弦相似性,是通过计算两个向量的夹角余弦值来评估他们的相似度。余弦相似度将向量根据坐标值,绘制到向量空间中,如最常见的二维空间。求得他们的夹角,并得出夹角对应的余弦值,此余弦值就可以用来表征,这两个向量的相似性。夹角越小,余弦值越接近于1,它们的方向更加吻合,则越相似。如:
Figure BDA0001578516820000071
其中,a,b为两个向量,θ为a,b的夹角。
通常,余弦值的范围在[-1,1]之间,值越趋近于1,代表两个向量的方向越接近;越趋近于-1,他们的方向越相反;接近于0,表示两个向量近乎于正交。
请一并参见图2,图2是本发明公开的一种配件图的示意图。如图2所示,图中的6个顶点(1、2、3、4、5、6)分别代表的是6个配件,各顶点之间的连线代表的是两个配件之间的关系,而关系的强弱则用边的权重来表示,通常,两个配件之间的相似度越高,代表两个配件的边的权重就越大,反之,两个配件之间的相似度越低,代表两个配件的边的权重就越小。
需要说明的是,图2仅仅是本发明实施例所示出的一个简单的图例而已,并不代表所有的。
S12、电子设备确定所述配件图的拉普拉斯矩阵。
其中,拉普拉斯矩阵也称为基尔霍夫矩阵,是表示图的一种矩阵。
本发明实施例中,假设给定一个有n个顶点的图G=(V,E),顶点集合V表示配件样本,带权的边表示各个配件样本之间的相似度,其拉普拉斯矩阵被定义为:
L=D-W
其中,D为图的度矩阵,W为图的邻接矩阵。
把该图G转换为邻接矩阵W为:
Figure BDA0001578516820000081
把W的每一列元素相加得到的n个数,把它们放到对角线上组成一个n×n的对角矩阵,记为度矩阵D:
Figure BDA0001578516820000082
根据拉普拉斯矩阵定义L=D-W,得到拉普拉斯矩阵L:
Figure BDA0001578516820000083
S13、电子设备对所述拉普拉斯矩阵进行分解,获得特征向量。
本发明实施例中,对上述拉普拉斯矩阵L进行计算,求出L的前k个特征值(前k个指按照特征值的大小从小到大排序得到)
Figure BDA0001578516820000084
以及对应的特征向量
Figure BDA0001578516820000085
S14、电子设备对所述特征向量进行聚类,以使得多个所述配件样本中同类别的配件样本聚集,不同类别的配件样本分离。
本发明实施例中,把上述特征向量
Figure BDA0001578516820000086
排列在一起组成一个N x k的矩阵,将其中每一行看作k维空间中的一个向量,并使用K-means算法进行聚类。聚类的结果中每一行所属的类别就是原来配件图中的节点亦即最初的N个数据点分别所属的类别。
电子设备对所述特征向量进行聚类之后,就可以使得多个所述配件样本中同类别的配件样本聚集,不同类别的配件样本分离。
其中,针对聚集后的同类别的配件样本,任意两个所述配件样本之间具有可替换性。也就是说,聚集在一起的同类别的任意两个所述配件样本可以互相替换。
其中,K-means算法是输入聚类个数k,以及包含n个数据对象的数据库,输出满足方差最小标准k个聚类的一种算法。K-means算法接受输入量k;然后将n个数据对象划分为k个聚类以便使得所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小。
在图1所描述的方法流程中,电子设备可以构建由多个配件样本组成的配件图;确定所述配件图的拉普拉斯矩阵;对所述拉普拉斯矩阵进行分解,获得特征向量;对所述特征向量进行聚类,以使得多个所述配件样本中同类别的配件样本聚集,不同类别的配件样本分离。可见,通过本发明的实施例,电子设备可以通过相关的算法对多个配件样本进行聚类,从而使得多个所述配件样本中同类别的配件样本聚集,不同类别的配件样本分离,聚集后的同类别的多个配件样本之间,任意两个配件样本具有可替换性,从而可以从多个配件中选择出替换件,节约维修费用,同时,节省仓储,缩短维修工期。
请参见图3,图3是本发明公开的另一种汽车配件聚类方法的较佳实施例的流程图。其中,根据不同的需求,该流程图中步骤的顺序可以改变,某些步骤可以省略。
S31、电子设备构建以配件样本为对象的集合。
本发明实施例中,汽车由各种各样的配件组成,当汽车需要进行性能、装备方面的改进和扩展,或者产品质量升级,或者维修时,往往需要对配件进行替换。
其中,配件可以包括但不限于滤清器、刹车片、刹车盘、皮带、润滑油、球头、球笼、减震器、点火线圈、火花塞、雨刮片、燃油泵以及汽机油等。汽车可以包括但不限于各种品牌各种机型的汽车,比如宝马318i E46N42CHN,奥迪A6L 2017等。
本发明实施例中,在对汽车进行维修时,由于汽车的配件多种多样,而维修厂不可能储备所有的配件,因而需要构建由多个配件样本组成的配件图,以研究配件之间的可替换性。
本发明实施例中,可以以汽车的多个配件样本为对象,构成一个集合。
S32、电子设备计算各个所述配件样本之间的相似度。
其中,所述计算各个所述配件样本之间的相似度包括:
计算各个所述配件样本的图像属性之间的第一相似度;
计算各个所述配件样本的文本属性之间的第二相似度;
根据所述第一相似度以及所述第二相似度,确定各个所述配件样本之间的相似度。
其中,各个所述配件样本之间的相似度可以从两个维度进行衡量:图像属性的相似度和文字属性的相似度,图像属性为配件所在图片以及图上的位置,文字属性为配件所在的目录描述,配件名称,配件说明信息,使用数量等。具体的,可以先采用杰卡德相似系数来计算各个所述配件样本的图像属性之间的第一相似度,以及采用余弦相似度来计算各个所述配件样本的文本属性之间的第二相似度,然后,综合所述第一相似度以及所述第二相似度,确定各个所述配件样本之间的相似度。
其中,两个集合A和B的交集元素在A,B的并集中所占的比例,称为两个集合的杰卡德相似系数,用符号J(A,B)表示。如:
Figure BDA0001578516820000101
其中,杰卡德相似系数用于比较有限样本集之间的相似性与差异性。杰卡德相似系数值越大,样本相似度越高。
其中,余弦相似度,又称为余弦相似性,是通过计算两个向量的夹角余弦值来评估他们的相似度。余弦相似度将向量根据坐标值,绘制到向量空间中,如最常见的二维空间。求得他们的夹角,并得出夹角对应的余弦值,此余弦值就可以用来表征,这两个向量的相似性。夹角越小,余弦值越接近于1,它们的方向更加吻合,则越相似。如:
Figure BDA0001578516820000111
其中,a,b为两个向量,θ为a,b的夹角。
通常,余弦值的范围在[-1,1]之间,值越趋近于1,代表两个向量的方向越接近;越趋近于-1,他们的方向越相反;接近于0,表示两个向量近乎于正交。
S33、电子设备根据所述集合以及所述各个所述配件样本之间的相似度,构建由多个配件样本组成的配件图。
本发明实施例中,假设以n个配件样本为对象的集合用V表示,所述各个所述配件样本之间的相似度用带权的边E表示,则由多个配件样本组成的配件图可以为图G=(V,E)。
S34、电子设备确定所述配件图的拉普拉斯矩阵。
本发明实施例中,配件图G=(V,E)的拉普拉斯矩阵被定义为:
L=D-W
其中,D为图的度矩阵,W为图的邻接矩阵。
把该图G转换为邻接矩阵W为:
Figure BDA0001578516820000112
把W的每一列元素相加得到的n个数,把它们放到对角线上组成一个n×n的对角矩阵,记为度矩阵D:
Figure BDA0001578516820000121
根据拉普拉斯矩阵定义L=D-W,得到拉普拉斯矩阵L:
Figure BDA0001578516820000122
S35、电子设备对所述拉普拉斯矩阵进行分解,获得特征向量。
本发明实施例中,对上述拉普拉斯矩阵L进行计算,求出L的前k个特征值(前k个指按照特征值的大小从小到大排序得到)
Figure BDA0001578516820000123
以及对应的特征向量
Figure BDA0001578516820000124
S36、电子设备对所述特征向量进行聚类,以使得多个所述配件样本中同类别的配件样本聚集,不同类别的配件样本分离。
本发明实施例中,把上述特征向量
Figure BDA0001578516820000125
排列在一起组成一个N x k的矩阵,将其中每一行看作k维空间中的一个向量,并使用K-means算法进行聚类。聚类的结果中每一行所属的类别就是原来配件图中的节点亦即最初的N个数据点分别所属的类别。
电子设备对所述特征向量进行聚类之后,就可以使得多个所述配件样本中同类别的配件样本聚集,不同类别的配件样本分离。
其中,针对聚集后的同类别的配件样本,任意两个所述配件样本之间具有可替换性。也就是说,聚集在一起的同类别的任意两个所述配件样本可以互相替换。
其中,K-means算法是输入聚类个数k,以及包含n个数据对象的数据库,输出满足方差最小标准k个聚类的一种算法。K-means算法接受输入量k;然后将n个数据对象划分为k个聚类以便使得所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小。
在图3所描述的方法流程中,电子设备可以构建构建以配件样本为对象的集合,计算各个所述配件样本之间的相似度;根据所述集合以及所述各个所述配件样本之间的相似度,构建由多个配件样本组成的配件图;确定所述配件图的拉普拉斯矩阵;对所述拉普拉斯矩阵进行分解,获得特征向量;对所述特征向量进行聚类,以使得多个所述配件样本中同类别的配件样本聚集,不同类别的配件样本分离。可见,通过本发明的实施例,电子设备可以通过相关的算法对多个配件样本进行聚类,从而使得多个所述配件样本中同类别的配件样本聚集,不同类别的配件样本分离,聚集后的同类别的多个配件样本之间,任意两个配件样本具有可替换性,从而可以从多个配件中选择出替换件,节约维修费用,同时,节省仓储,缩短维修工期。
请参见图4,图4是本发明公开的一种汽车配件聚类装置的较佳实施例的功能模块图。其中,图4描述的汽车配件聚类装置用于执行图1或图3所描述的汽车配件聚类方法中的部分或全部步骤。本发明所称的单元是指一种能够被处理器所执行并且能够完成固定功能的一系列计算机程序段,其存储在存储器中。在本实施例中,关于各单元的功能将在后续的实施例中详述。
图4所描述的汽车配件聚类装置11包括:
构建单元101,用于构建由多个配件样本组成的配件图;
本发明实施例中,汽车由各种各样的配件组成,当汽车需要进行性能、装备方面的改进和扩展,或者产品质量升级,或者维修时,往往需要对配件进行替换。
其中,配件可以包括但不限于滤清器、刹车片、刹车盘、皮带、润滑油、球头、球笼、减震器、点火线圈、火花塞、雨刮片、燃油泵以及汽机油等。汽车可以包括但不限于各种品牌各种机型的汽车,比如宝马318i E46N42CHN,奥迪A6L 2017等。
本发明实施例中,在对汽车进行维修时,由于汽车的配件多种多样,而维修厂不可能储备所有的配件,因而需要构建由多个配件样本组成的配件图,以研究配件之间的可替换性。
确定单元102,用于确定所述配件图的拉普拉斯矩阵;
其中,拉普拉斯矩阵也称为基尔霍夫矩阵,是表示图的一种矩阵。
本发明实施例中,假设给定一个有n个顶点的图G=(V,E),顶点集合V表示配件样本,带权的边表示各个配件样本之间的相似度,其拉普拉斯矩阵被定义为:
L=D-W
其中,D为图的度矩阵,W为图的邻接矩阵。
把该图G转换为邻接矩阵W为:
Figure BDA0001578516820000141
把W的每一列元素相加得到的n个数,把它们放到对角线上组成一个n×n的对角矩阵,记为度矩阵D:
Figure BDA0001578516820000142
根据拉普拉斯矩阵定义L=D-W,得到拉普拉斯矩阵L:
Figure BDA0001578516820000143
分解单元103,用于对所述拉普拉斯矩阵进行分解,获得特征向量;
本发明实施例中,对上述拉普拉斯矩阵L进行计算,求出L的前k个特征值(前k个指按照特征值的大小从小到大排序得到)
Figure BDA0001578516820000151
以及对应的特征向量
Figure BDA0001578516820000152
聚类单元104,用于对所述特征向量进行聚类,以使得多个所述配件样本中同类别的配件样本聚集,不同类别的配件样本分离。
本发明实施例中,把上述特征向量
Figure BDA0001578516820000153
排列在一起组成一个N x k的矩阵,将其中每一行看作k维空间中的一个向量,并使用K-means算法进行聚类。聚类的结果中每一行所属的类别就是原来配件图中的节点亦即最初的N个数据点分别所属的类别。
电子设备对所述特征向量进行聚类之后,就可以使得多个所述配件样本中同类别的配件样本聚集,不同类别的配件样本分离。
其中,针对聚集后的同类别的配件样本,任意两个所述配件样本之间具有可替换性。也就是说,聚集在一起的同类别的任意两个所述配件样本可以互相替换。
其中,K-means算法是输入聚类个数k,以及包含n个数据对象的数据库,输出满足方差最小标准k个聚类的一种算法。K-means算法接受输入量k;然后将n个数据对象划分为k个聚类以便使得所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小。
可选的,构建单元101构建由多个配件样本组成的配件图包括:
构建以配件样本为对象的集合;
计算各个所述配件样本之间的相似度;
根据所述集合以及所述各个所述配件样本之间的相似度,构建由多个配件样本组成的配件图。
其中,所述计算各个所述配件样本之间的相似度包括:
计算各个所述配件样本的图像属性之间的第一相似度;
计算各个所述配件样本的文本属性之间的第二相似度;
根据所述第一相似度以及所述第二相似度,确定各个所述配件样本之间的相似度。
在该实施例中,可以以汽车的多个配件样本为对象,构成一个集合,进一步地,可以计算各个所述配件样本之间的相似度。其中,各个所述配件样本之间的相似度可以从两个维度进行衡量:图像属性的相似度和文字属性的相似度,图像属性为配件所在图片以及图上的位置,文字属性为配件所在的目录描述,配件名称,配件说明信息,使用数量等。具体的,可以先采用杰卡德相似系数来计算各个所述配件样本的图像属性之间的第一相似度,以及采用余弦相似度来计算各个所述配件样本的文本属性之间的第二相似度,然后,综合所述第一相似度以及所述第二相似度,确定各个所述配件样本之间的相似度。最后根据所述集合以及所述各个所述配件样本之间的相似度,构建由多个配件样本组成的配件图。
其中,两个集合A和B的交集元素在A,B的并集中所占的比例,称为两个集合的杰卡德相似系数,用符号J(A,B)表示。如:
Figure BDA0001578516820000161
其中,杰卡德相似系数用于比较有限样本集之间的相似性与差异性。杰卡德相似系数值越大,样本相似度越高。
其中,余弦相似度,又称为余弦相似性,是通过计算两个向量的夹角余弦值来评估他们的相似度。余弦相似度将向量根据坐标值,绘制到向量空间中,如最常见的二维空间。求得他们的夹角,并得出夹角对应的余弦值,此余弦值就可以用来表征,这两个向量的相似性。夹角越小,余弦值越接近于1,它们的方向更加吻合,则越相似。如:
Figure BDA0001578516820000162
其中,a,b为两个向量,θ为a,b的夹角。
通常,余弦值的范围在[-1,1]之间,值越趋近于1,代表两个向量的方向越接近;越趋近于-1,他们的方向越相反;接近于0,表示两个向量近乎于正交。
其中,针对聚集后的同类别的配件样本,任意两个所述配件样本之间具有可替换性。
在图4所描述的汽车配件聚类装置中,可以构建由多个配件样本组成的配件图;确定所述配件图的拉普拉斯矩阵;对所述拉普拉斯矩阵进行分解,获得特征向量;对所述特征向量进行聚类,以使得多个所述配件样本中同类别的配件样本聚集,不同类别的配件样本分离。可见,通过本发明的实施例,电子设备可以通过相关的算法对多个配件样本进行聚类,从而使得多个所述配件样本中同类别的配件样本聚集,不同类别的配件样本分离,聚集后的同类别的多个配件样本之间,任意两个配件样本具有可替换性,从而可以从多个配件中选择出替换件,节约维修费用,同时,节省仓储,缩短维修工期。
上述以软件功能模块的形式实现的集成的单元,可以存储在一个计算机可读存储介质中。其中,该计算机可读存储介质可以存储计算机程序,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读存储介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读存储介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
如图5所示,图5是本发明实现汽车配件聚类方法的较佳实施例的电子设备的结构示意图。所述电子设备1包括存储器12以及处理器13。本领域技术人员可以理解,所述图5所示的示意图仅仅是电子设备1的示例,并不构成对电子设备1的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述电子设备1还可以包括输入输出设备、网络接入设备、总线等。
所述电子设备1还包括但不限于任何一种可与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互的电子产品,例如,个人计算机、平板电脑、个人数字助理(Personal Digital Assistant,PDA)、游戏机、交互式网络电视(Internet ProtocolTelevision,IPTV)等。所述电子设备1所处的网络包括但不限于互联网、广域网、城域网、局域网、虚拟专用网络(Virtual Private Network,VPN)等。
所述存储器12可选地包括一个或多个计算机可读存储介质,用于存储一种汽车配件聚类方法的程序和各种数据,并在运行过程中实现高速、自动地完成程序或数据的存取。所述存储器12可选地包括高速随机存取存储器,并且还可选地包括非易失性存储器,诸如一个或多个磁盘存储设备、闪存存储器设备、或其它非易失性固态存储器设备。
所述处理器13又称中央处理器(CPU,Central Processing Unit),是一块超大规模的集成电路,是电子设备1的运算核心(Core)和控制核心(Control Unit)。所述处理器13可执行所述电子设备1的操作系统以及安装的各类应用程序、程序代码等,例如汽车配件聚类装置11。
结合图1或图3,所述电子设备1中的所述存储器12存储多个指令以实现一种汽车配件聚类方法,所述处理器13可执行所述多个指令从而实现:
构建由多个配件样本组成的配件图;
确定所述配件图的拉普拉斯矩阵;
对所述拉普拉斯矩阵进行分解,获得特征向量;
对所述特征向量进行聚类,以使得多个所述配件样本中同类别的配件样本聚集,不同类别的配件样本分离。
本发明实施例中,汽车由各种各样的配件组成,当汽车需要进行性能、装备方面的改进和扩展,或者产品质量升级,或者维修时,往往需要对配件进行替换。
其中,配件可以包括但不限于滤清器、刹车片、刹车盘、皮带、润滑油、球头、球笼、减震器、点火线圈、火花塞、雨刮片、燃油泵以及汽机油等。汽车可以包括但不限于各种品牌各种机型的汽车,比如宝马318i E46N42CHN,奥迪A6L 2017等。
本发明实施例中,在对汽车进行维修时,由于汽车的配件多种多样,而维修厂不可能储备所有的配件,因而需要构建由多个配件样本组成的配件图,以研究配件之间的可替换性。
其中,拉普拉斯矩阵也称为基尔霍夫矩阵,是表示图的一种矩阵。
本发明实施例中,假设给定一个有n个顶点的图G=(V,E),顶点集合V表示配件样本,带权的边表示各个配件样本之间的相似度,其拉普拉斯矩阵被定义为:
L=D-W
其中,D为图的度矩阵,W为图的邻接矩阵。
把该图G转换为邻接矩阵W为:
Figure BDA0001578516820000191
把W的每一列元素相加得到的n个数,把它们放到对角线上组成一个n×n的对角矩阵,记为度矩阵D:
Figure BDA0001578516820000201
根据拉普拉斯矩阵定义L=D-W,得到拉普拉斯矩阵L:
Figure BDA0001578516820000202
本发明实施例中,对上述拉普拉斯矩阵L进行计算,求出L的前k个特征值(前k个指按照特征值的大小从小到大排序得到)
Figure BDA0001578516820000203
以及对应的特征向量
Figure BDA0001578516820000204
本发明实施例中,把上述特征向量
Figure BDA0001578516820000205
排列在一起组成一个N x k的矩阵,将其中每一行看作k维空间中的一个向量,并使用K-means算法进行聚类。聚类的结果中每一行所属的类别就是原来配件图中的节点亦即最初的N个数据点分别所属的类别。
电子设备对所述特征向量进行聚类之后,就可以使得多个所述配件样本中同类别的配件样本聚集,不同类别的配件样本分离。
其中,针对聚集后的同类别的配件样本,任意两个所述配件样本之间具有可替换性。也就是说,聚集在一起的同类别的任意两个所述配件样本可以互相替换。
其中,K-means算法是输入聚类个数k,以及包含n个数据对象的数据库,输出满足方差最小标准k个聚类的一种算法。K-means算法接受输入量k;然后将n个数据对象划分为k个聚类以便使得所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小。
在一种可选的实施方式中,所述构建由多个配件样本组成的配件图包括:
构建以配件样本为对象的集合;
计算各个所述配件样本之间的相似度;
根据所述集合以及所述各个所述配件样本之间的相似度,构建由多个配件样本组成的配件图。
在一种可选的实施方式中,所述计算各个所述配件样本之间的相似度包括:
计算各个所述配件样本的图像属性之间的第一相似度;
计算各个所述配件样本的文本属性之间的第二相似度;
根据所述第一相似度以及所述第二相似度,确定各个所述配件样本之间的相似度。
在该实施例中,可以以汽车的多个配件样本为对象,构成一个集合,进一步地,可以计算各个所述配件样本之间的相似度。其中,各个所述配件样本之间的相似度可以从两个维度进行衡量:图像属性的相似度和文字属性的相似度,图像属性为配件所在图片以及图上的位置,文字属性为配件所在的目录描述,配件名称,配件说明信息,使用数量等。具体的,可以先采用杰卡德相似系数来计算各个所述配件样本的图像属性之间的第一相似度,以及采用余弦相似度来计算各个所述配件样本的文本属性之间的第二相似度,然后,综合所述第一相似度以及所述第二相似度,确定各个所述配件样本之间的相似度。最后根据所述集合以及所述各个所述配件样本之间的相似度,构建由多个配件样本组成的配件图。
其中,两个集合A和B的交集元素在A,B的并集中所占的比例,称为两个集合的杰卡德相似系数,用符号J(A,B)表示。如:
Figure BDA0001578516820000211
其中,杰卡德相似系数用于比较有限样本集之间的相似性与差异性。杰卡德相似系数值越大,样本相似度越高。
其中,余弦相似度,又称为余弦相似性,是通过计算两个向量的夹角余弦值来评估他们的相似度。余弦相似度将向量根据坐标值,绘制到向量空间中,如最常见的二维空间。求得他们的夹角,并得出夹角对应的余弦值,此余弦值就可以用来表征,这两个向量的相似性。夹角越小,余弦值越接近于1,它们的方向更加吻合,则越相似。如:
Figure BDA0001578516820000221
其中,a,b为两个向量,θ为a,b的夹角。
通常,余弦值的范围在[-1,1]之间,值越趋近于1,代表两个向量的方向越接近;越趋近于-1,他们的方向越相反;接近于0,表示两个向量近乎于正交。
在一种可选的实施方式中,针对聚集后的同类别的配件样本,任意两个所述配件样本之间具有可替换性。
具体地,所述处理器13对上述指令的具体实现方法可参考图1对应实施例中相关步骤的描述,在此不赘述。
在图5所描述的电子设备1中,电子设备可以构建由多个配件样本组成的配件图;确定所述配件图的拉普拉斯矩阵;对所述拉普拉斯矩阵进行分解,获得特征向量;对所述特征向量进行聚类,以使得多个所述配件样本中同类别的配件样本聚集,不同类别的配件样本分离。可见,通过本发明的实施例,电子设备可以通过相关的算法对多个配件样本进行聚类,从而使得多个所述配件样本中同类别的配件样本聚集,不同类别的配件样本分离,聚集后的同类别的多个配件样本之间,任意两个配件样本具有可替换性,从而可以从多个配件中选择出替换件,节约维修费用,同时,节省仓储,缩短维修工期。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。

Claims (6)

1.一种汽车配件聚类方法,其特征在于,所述方法包括:
构建以汽车的配件样本为对象的集合;
采用杰卡德相似系数计算各个所述配件样本的图像属性之间的第一相似度,所述图像属性为配件所在图片以及图上的位置;
采用余弦相似度计算各个所述配件样本的文本属性之间的第二相似度,所述文本属性为配件所在的目录属性;
根据所述第一相似度以及所述第二相似度,确定各个所述配件样本之间的相似度;
根据所述集合以及所述各个所述配件样本之间的相似度,构建由多个配件样本组成的配件图;
确定所述配件图的拉普拉斯矩阵;
对所述拉普拉斯矩阵进行分解,获得特征向量;
对所述特征向量进行聚类,以使得多个所述配件样本中同类别的配件样本聚集,不同类别的配件样本分离。
2.根据权利要求1所述的方法,其特征在于,针对聚集后的同类别的配件样本,任意两个所述配件样本之间具有可替换性。
3.一种汽车配件聚类装置,其特征在于,所述汽车配件聚类装置包括:
构建单元,用于构建以汽车的配件样本为对象的集合;采用杰卡德相似系数计算各个所述配件样本的图像属性之间的第一相似度;采用余弦相似度计算各个所述配件样本的文本属性之间的第二相似度;根据所述第一相似度以及所述第二相似度,确定各个所述配件样本之间的相似度;根据所述集合以及所述各个所述配件样本之间的相似度,构建由多个配件样本组成的配件图,所述图像属性为配件所在图片以及图上的位置,所述文本属性为配件所在的目录属性;
确定单元,用于确定所述配件图的拉普拉斯矩阵;
分解单元,用于对所述拉普拉斯矩阵进行分解,获得特征向量;
聚类单元,用于对所述特征向量进行聚类,以使得多个所述配件样本中同类别的配件样本聚集,不同类别的配件样本分离。
4.根据权利要求3所述的汽车配件聚类装置,其特征在于,针对聚集后的同类别的配件样本,任意两个所述配件样本之间具有可替换性。
5.一种电子设备,其特征在于,所述电子设备包括处理器和存储器,所述处理器用于执行存储器中存储的计算机程序以实现如权利要求1至2中任意一项所述的汽车配件聚类方法。
6.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有至少一个指令,所述至少一个指令被处理器执行时实现如权利要求1至2任意一项所述的汽车配件聚类方法。
CN201810144714.8A 2018-02-12 2018-02-12 汽车配件聚类方法、装置、电子设备及存储介质 Active CN108288076B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810144714.8A CN108288076B (zh) 2018-02-12 2018-02-12 汽车配件聚类方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810144714.8A CN108288076B (zh) 2018-02-12 2018-02-12 汽车配件聚类方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN108288076A CN108288076A (zh) 2018-07-17
CN108288076B true CN108288076B (zh) 2022-04-08

Family

ID=62832658

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810144714.8A Active CN108288076B (zh) 2018-02-12 2018-02-12 汽车配件聚类方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN108288076B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112070142B (zh) * 2020-09-02 2024-05-10 平安科技(深圳)有限公司 车辆配件的分组方法、装置、电子设备及存储介质

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008154029A1 (en) * 2007-06-11 2008-12-18 The Trustees Of Columbia University In The City Of New York Data classification and hierarchical clustering
CN102110173A (zh) * 2011-04-08 2011-06-29 华北电力大学(保定) 一种改进亲和矩阵的多路谱聚类方法
CN102622753B (zh) * 2012-02-28 2014-05-14 西安电子科技大学 基于密度可达测度的半监督谱聚类sar图像分割方法
CN103514183B (zh) * 2012-06-19 2017-04-12 北京大学 基于交互式文档聚类的信息检索方法及系统
CN103399852A (zh) * 2013-06-27 2013-11-20 江南大学 基于局部密度估计和近邻关系传播的多路谱聚类方法
CN105139031A (zh) * 2015-08-21 2015-12-09 天津中科智能识别产业技术研究院有限公司 一种基于子空间聚类的数据处理方法
CN105095516B (zh) * 2015-09-16 2019-02-15 中国传媒大学 基于谱聚类集成的广播电视用户分群系统及方法
CN106202184B (zh) * 2016-06-27 2019-05-31 华中科技大学 一种面向高校图书馆的图书个性化推荐方法和系统

Also Published As

Publication number Publication date
CN108288076A (zh) 2018-07-17

Similar Documents

Publication Publication Date Title
CN110866181B (zh) 资源推荐的方法、装置及存储介质
CN111833099B (zh) 一种生成创意广告的方法和系统
JP2019091445A5 (zh)
CN110222710B (zh) 数据处理方法、装置及存储介质
CN109993753B (zh) 遥感影像中城市功能区的分割方法及装置
CN110287415A (zh) 一种内容推荐方法、装置和计算设备
CN115293332A (zh) 一种图神经网络的训练方法、装置、设备及存储介质
US9959268B2 (en) Semantic modeling of geographic information in business intelligence
JP5898584B2 (ja) 六面体メッシュ生成装置
CN108288076B (zh) 汽车配件聚类方法、装置、电子设备及存储介质
CN113936114B (zh) 一种bim模型构件类别级轻量化方法及系统
CN114022188A (zh) 目标人群圈选方法、装置、设备以及存储介质
CN111444368B (zh) 构建用户画像的方法、装置、计算机设备及存储介质
CN110287351B (zh) 一种三维模型轻量化展示优化方法
CN110609927B (zh) 一种可视化家谱布局方法、终端设备及存储介质
CN109461198B (zh) 网格模型的处理方法及装置
CN110782232A (zh) 业务流程可视化配置方法、装置、电子设备及存储介质
CN115269600A (zh) 一种飞机数据的管理方法、装置、电子设备及存储介质
CN111984637B (zh) 数据建模中的缺失值处理方法和装置、设备及存储介质
CN114564773A (zh) 一种基于bim模型的构件筛选检查方法和系统
CN113204714A (zh) 一种基于用户画像的任务推荐方法、装置、存储介质及终端
Alkadhi et al. Parametric grid model of the drawing
CN112001044B (zh) 零件cad模型相似度估算方法与系统
KR20200073441A (ko) 데이터베이스 기반 경량 모델 가시화 시스템 및 방법
CN116882408B (zh) 变压器图模型的构建方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant