CN102136007B - 基于小世界特性的工程信息组织方法 - Google Patents

基于小世界特性的工程信息组织方法 Download PDF

Info

Publication number
CN102136007B
CN102136007B CN 201110080080 CN201110080080A CN102136007B CN 102136007 B CN102136007 B CN 102136007B CN 201110080080 CN201110080080 CN 201110080080 CN 201110080080 A CN201110080080 A CN 201110080080A CN 102136007 B CN102136007 B CN 102136007B
Authority
CN
China
Prior art keywords
node
engineering information
similarity
component
newly
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN 201110080080
Other languages
English (en)
Other versions
CN102136007A (zh
Inventor
赵正旭
綦朝晖
封筠
刘展威
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shijiazhuang Tiedao University
Original Assignee
Shijiazhuang Tiedao University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shijiazhuang Tiedao University filed Critical Shijiazhuang Tiedao University
Priority to CN 201110080080 priority Critical patent/CN102136007B/zh
Publication of CN102136007A publication Critical patent/CN102136007A/zh
Application granted granted Critical
Publication of CN102136007B publication Critical patent/CN102136007B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于小世界特性的工程信息组织方法,首先对工程信息文件进行特征数据描述,形成特征向量;然后建立具有小世界特性的网络拓扑结构;然后在此基础上对新增工程信息文件进行保存、检索及维护。本发明为实现信息长期保存、信息扩展以及后期维护提供有效支持,为计算不同工程信息节点之间的相似度提供细粒度比较,提高信息查询的精度和准确度。

Description

基于小世界特性的工程信息组织方法
技术领域
本发明涉及计算机网络智能信息检索技术领域,尤其是一种基于小世界特性的工程信息组织方法。
背景技术
随着计算机和网络技术的飞速发展,信息量的增长远远超出了人们对信息获取能力的增长。原始和无序的信息不但不产生价值,还会加剧信息增长和利用之间的矛盾,造成信息超载而知识缺乏的社会困境。因此,海量信息资源的有序存储和利用越来越受到世界各国的关注。对于工程信息的存储和利用,特别是对生产制造领域的工程信息的保存和利用,仍然是一个颇具挑战性的问题。
小世界现象存在于社会关系网络中,即世界上任何人之间都可以通过很短的社会关系联系起来。社会关系链的长度一般不超过六,被称之为“六度分隔理论”。六度分隔理论的提出,极大地激发了人们对于小世界现象的全面研究,人们发现类似的小世界现象广泛存在于电力网、计算机互联网、食物链网、演员关系网、科学家合作网等实际网络中。最近几年,小世界现象在销售业、人力资源管理、传播学、传染疾病预防、网络安全等领域得到了广泛的应用。
人们对工程信息的保存和利用主要是针对国防工程、军事科技、航空、汽车、造船等领域中的设计与制造,研究如何长期保存产品的原始设计数据和生产过程中的工程信息,以满足产品的维修、故障排除、改型等需求。目前,工程信息的保存和利用主要基于以下方法:(1)基于传统图纸形式的电子文档、微缩胶片、穿孔卡片等,这种方法所保留的信息资源容易老化或损坏,不便于在网络上调用和传输,无法记录和保留后续对产品的改进等信息;(2)基于STEP ISO 10303 标准的融入设计和制造信息的三维CAD 模型,由于生成这些信息的CAD系统寿命比多数产品的寿命要短得多,在今后利用时将会产生数据和系统之间的兼容问题。另外,研究工程信息的生成方法以及对数字化工程信息实行长期保存并保证数据的可靠性,以满足今后不同时期和不同用户的多方面需求,然而要确保其长期的安全保存和数据可靠性,就必须对这些信息资源进行定期检查、移存和转化,这些定期的处理过程不但有前面提及的兼容问题,还将遇到信息处理的时间和效率问题。
发明内容
本发明要解决的技术问题是提供一种基于小世界特性的工程信息组织方法,该方法能够以灵活的方式组织工程信息,提供快速的工程信息检索、有效地信息扩展及便利的信息维护。
为解决上述技术问题,本发明所采取的技术方案是:一种基于小世界特性的工程信息组织方法,其方法步骤如下:
(1)工程信息文件的特征数据描述,其步骤包括:
(1.1)确定需要长期保存和利用的工程信息文件,并将其数字化;
(1.2)选择统一的元数据标准对所述工程信息文件进行特征描述,形成特征向量,该特征向量的维数就是所述工程信息文件的信息特征数;
(2)建立具有小世界特性的网络拓扑结构,其步骤包括:
(2.1)采用一维聚类方法对每个工程信息文件所对应特征向量的同一分量进行聚类分析,获取聚类模型;
(2.2)记录上述分量的数值化分类信息,该分类信息标志该分量归属于不同类别的相似程度;
(2.3)所述每个工程信息文件作为一个节点,所述每个节点在上述步骤的基础上获得其自身特征描述的数值化分类信息,同时设定一个隶属于该节点的用于描述其特征向量各个分量重要程度的权值向量;
(2.4)以所述权值向量为依据,两两比较计算出每个节点与其他所有节点之间的相似度;
(2.5)计算每个节点与其他所有节点之间的相似度期望值,并将该节点与相似度不小于所述期望值的所有其他节点进行链接,对于相似度小于期望值的所有其他节点,将该节点以一定概率与其相链接;
(3)在建立具有小世界特性的网络拓扑结构的基础上,对新增工程信息文件进行保存,其步骤包括:
(3.1)获取新增工程信息文件的特征向量;
(3.2)比较新增工程信息文件特征向量中各个分量与已有工程信息文件特征向量各个分量之间的关系,当新增工程信息文件特征向量中存在新的特征维时,全局性特征向量的维数也做出相应增加,当新增工程信息文件特征向量在新增维数上与已有工程信息文件特征向量不存在隶属关系时,对这些新增维数不进行任何信息记录;
(3.3)比较新增工程信息文件特征向量中各个分量与该分量现有分类之间的关系,当新增工程信息文件特征向量中某个分量与现有分类之间的相似度为0或较低时,将该分量独立出来成为新增分量类型,同时该分量的分类个数做出相应增加;
(3.4)设定用于描述新增工程信息文件特征向量中各个分量重要程度的权值向量;
(3.5)每个新增工程信息文件作为一个节点,计算所述新增节点与其他所有节点之间的相似度期望值,并将该新增节点与相似度不小于所述期望值的所有其他节点进行链接,对于相似度小于期望值的所有其他节点,将该节点以一定概率与其相链接;
(4)在建立具有小世界特征的网络拓扑结构基础上,进行工程信息文件检索,其步骤包括:
(4.1)依据现有工程信息文件特征向量中的各个分量特性,确定检索目标节点特征向量的分量,并给出这些分量隶属于其现有分量类型的相似度及权值;
(4.2)随机选择未被访问过的节点,发出查询请求,当不存在未被访问过的节点时,执行步骤(4.5);
(4.3)计算检索目标节点与被访问节点之间的相似度,当相似度超过给定阈值时,进一步计算出检索目标节点与被访问节点的每个短链接节点之间的相似度,返回被访问节点及其短链接节点中相似度最大的节点,执行步骤(4.5);否则,将被访问节点标记为已访问,执行步骤(4.4);
(4.4)将查询请求发送给被访问节点的未被访问过的长链接节点,执行步骤(4.3),当被访问节点的每一长链接节点都被访问过时,执行步骤(4.2);
(4.5)结束查询;                                               
(5)在建立具有小世界特性的网络拓扑结构基础上,进行工程信息文件的维护,其步骤包括:
(5.1)依据步骤(4)查询得到需要维护的工程信息文件;
(5.2)保持原有节点及其网络拓扑关系不变,构建一个新的原有节点的复制节点,并对该复制节点进行维护工作;
(5.3)抽取所述复制节点在进行维护工作之后的特征向量的分量,计算出这些分量隶属于其现有分量类型的相似度及权值;
(5.4)计算出进行维护工作之后的复制节点与其他所有节点之间的相似度期望值,并将该复制节点与相似度不小于所述期望值的所有其他节点进行链接,对于相似度小于所述期望值的所有其他节点,将该复制节点以一定概率与其相链接。
针对工程信息文件的组织方法以及数字化工程信息实行长期保存、保证数据可靠性、检索效率及后期维护,本发明结合元数据描述、一维聚类以及小世界网络拓扑结构特性,提供了一种适用于工程信息文件的存储、检索以及后期维护的方法。该方法将数字化的工程信息文件进行统一描述,并利用小世界网络的拓扑特性,在减少信息传递的前提下,提高信息查全率和查询效率,实现数字化工程信息文件的长久保存和后期维护过程中的兼容性;该方法能够快速路由到目标,而不是传统的盲目路由,从而提高信息查询效率;该方法充分利用小世界网络中的长链接,使得查询过程能够被很快地传递到网络中其他部分,根据小世界网络具有较短的网络平均距离可知这一查询过程能够在较少的长链转移之后找到目标所在网络范围,从而提高信息查询的查全率及后期维护效率。
本发明的有益效果如下:
(1)采用统一的元数据标准对数字化的工程信息文件进行特征描述,为实现信息长期保存、信息扩展及后期维护提供有效支持;
(2)利用一维聚类方法进行工程信息文件的聚类分析,为计算不同工程信息文件之间的相似度提供细粒度比较,提高了信息查询的精度和准确度;
(3)将相似度高于期望值的工程信息文件之间进行互连,其余采用长链接方式形成小世界拓扑结构,使得查询信息能够很快到达相关节点,提高查询速度,根据需要将相似度高于给定阈值的节点输出,进一步提高信息查询和维护的准确性及灵活性。
附图说明
下面结合附图和具体实施方式对本发明作进一步详细的说明。
图1是工程信息文件特征数据描述流程图;
图2是建立具有小世界特性的网络拓扑结构流程图;
图3是对新增工程信息文件进行保存的流程图;
图4是对工程信息文件进行检索的流程图;
图5是对工程信息文件进行维护的流程图。
具体实施方式
由图1-图5所示的实施例可知,本发明包括五个主要步骤,即工程信息文件特征数据描述;建立具有小世界特性的网络拓扑结构;在建立具有小世界特性的网络拓扑结构基础上,对新增工程信息进行保存;在建立具有小世界特性的网络拓扑结构基础上,进行工程信息文件检索;在建立具有小世界特性的网络拓扑结构基础上,进行工程信息文件维护。具体方法如下:
(1)工程信息文件的特征数据描述,如图1所示,其包括如下步骤:
(1.1)确定需要长期保存和利用的工程信息文件,并将其数字化,其中工程信息文件由具体应用决定,如机械制造行业某产品的生产过程,其工程信息文件包括生产线上的所有信息记录、制造机械、生产日期、检验员等生产过程相关的重要信息;再如软件工程领域某软件项目开发过程,其工程信息文件包括开发过程中的开发环境版本、硬件条件、日期、开发团队、测试、兼容性等相关信息;
(1.2)为确保工程信息文件特征描述的统一性和兼容性,选择统一的元数据标准对其进行特征描述,形成特征向量,对于给定的工程信息文件i,其特征向量Ti为                                                ,其中m为向量Ti的维数,每一工程信息文件特征向量中各个分量的确定由具体情况决定,不同工程信息文件特征向量既有共同分量,也有不同分量,不同的分量分别对应不同的向量维数,当工程信息文件特征向量不存在某一分量时,为节省数据存储空间,对这些特征向量上不存在隶属关系的分量将不进行任何信息记录,在后续的相似度计算中处理为0值。
(2)建立具有小世界特性的网络拓扑结构,如图2所示,其步骤包括:
(2.1)以步骤(1)中所确定的工程信息文件i的特征向量Ti的第j个分量tij为进一步分析的基础,采用一维聚类方法对每个工程信息文件所对应特征向量的第j个分量进行聚类分析,获取第j个分量的聚类模型。具体过程如下:
将工程信息文件特征向量中同一分量存在明显差异的划分为不同的类型,并依据专业的经验知识确定每一类型中的代表性工程信息文件作为初始聚类中心,而对于所有剩下的其它工程信息文件,则根据它们与这些聚类中心的相似度大小,分别将它们分配给与其最相似的聚类;然后再计算每个所获新聚类的聚类中心;不断重复这一过程直到均方差值开始收敛为止。最终的聚类结果特征显著,即各聚类本身尽可能地紧凑,而各聚类之间则尽可能地分开。
(2.2)对所有工程信息文件特征向量的同一分量获得以上聚类模型后,记录该分量的数值化分类信息,该分类信息标志该分量归属于不同类别的相似程度,其中分类信息的定义如下:
设定所有工程信息文件特征向量的第j个分量被分为sj种不同的类型,用分类向量Vij表示工程信息文件i的特征向量Ti的第j个分量tij隶属于不同类别的相似程度,其中
Figure 171311DEST_PATH_IMAGE002
,0表示分量tij与第r种类型没有相关性,1表示完全相同,而介于0和1之间的值越大表示分量tij隶属于第r种类型的相似度越高。
(2.3)所述每个工程信息文件作为一个节点,所述每个节点在上述步骤的基础上获得其自身特征描述的数值化分类信息,同时设定一个隶属于该节点的权值向量Pi,用于描述工程信息文件i的特征向量Ti各个分量的重要程度,其中
Figure 609246DEST_PATH_IMAGE003
。当计算节点i与其他节点间的相似度时,所有节点特征向量的分量的重要性程度都以节点i的权值向量pi为依据;
(2.4)以所述权值向量为依据,两两比较计算出每个节点与其他所有节点之间的相似度,不失一般性,设定两两比较的两个节点分别为a和b,用S(a,b)表示它们之间的相似度,S(a,b)的定义过程如下:
依据步骤(2.2)中关于分类信息的定义,节点a上包含分类信息的特征向量所对应的相似度描述为
Figure 627067DEST_PATH_IMAGE005
,节点b上包含分类信息的特征向量Tb所对应的相似度描述为
Figure 740516DEST_PATH_IMAGE006
,其中s1,s2,sm分别表示特征向量各分量在一维聚类模型下的分类数,节点a、b之间相似度S(a,b)的计算表达式为:
Figure 665747DEST_PATH_IMAGE007
(2.5)计算每个节点与其他所有节点之间的相似度期望值,并将该节点与相似度不小于所述期望值的所有其他节点进行链接,对于相似度大于零小于期望值的所有其他节点,将该节点以概率p与其相链接,其中
Figure 772124DEST_PATH_IMAGE009
完成上述步骤后,所有节点都具有直接相连的与其相似度不低于该节点相似度期望值的短链接节点,同时具有极少的与其不一定相似的长链接节点,从而形成具有小世界特性的网络拓扑结构。
(3)在建立具有小世界特性的网络拓扑结构的基础上,对新增工程信息文件进行保存,如图3所示,其步骤包括:
(3.1)获取新增工程信息文件的特征向量。
(3.2)比较新增工程信息文件特征向量中各个分量与已有工程信息文件特征向量各个分量之间的关系,当新增工程信息文件特征向量中存在新的特征维时,全局性特征向量的维数也做出相应增加,当新增工程信息文件特征向量在新增维数上与已有工程信息文件特征向量不存在隶属关系时,对这些新增维数不进行任何信息记录。设定新增特征维数为M,对于给定的工程信息文件i,其特征向量Ti则为
Figure 56474DEST_PATH_IMAGE010
,当工程信息文件i的特征向量不具备某新增分量时,所对应的特征维
Figure 203422DEST_PATH_IMAGE011
就不存在,在后续的相似度计算公式中处理为0值。
(3.3)比较新增工程信息文件特征向量中各个分量与该分量现有分类之间的关系,当新增工程信息文件特征向量中某个分量与现有分类之间的相似度为0或较低时,将该分量独立出来成为新增分量类型,同时该分量的分类个数做出相应增加,原有工程信息文件特征向量的分量在新增分量类型上的相似度为0或较低。设定工程信息文件i特征向量的第j个分量类型增加数量为Nj,则第j个分量共有sj+Nj种不同的类型,用分类向量Vij表示工程信息文件i的特征向量Ti的第j个分量tij隶属于不同类别的相似程度,则有
Figure 231421DEST_PATH_IMAGE012
Figure 475320DEST_PATH_IMAGE013
,0表示分量tij与第r种类型没有相关性,1表示完全相同,而介于0和1之间的值越大表示分量tij隶属于第r种类型的相似度越高; 
(3.4)设定用于描述新增工程信息文件特征向量中各个分量重要程度的权值向量,设定在包括新增节点在内的网络拓扑结构中,一个隶属于节点i的权值向量Pi,用于描述工程信息文件i的特征向量Ti中各个分量的重要程度,
Figure 930572DEST_PATH_IMAGE014
;然后计算新增节点与所有其他节点之间的相似度值,不失一般性,设定新增节点为w,其他与之比较的几点为b,设定
Figure 830395DEST_PATH_IMAGE015
分别表示新增节点之后的各特征向量分量在一维聚类模型下的分类数,则节点w与节点b之间的相似度s(w,b)的计算公式为:
Figure 458823DEST_PATH_IMAGE016
(3.5)每个新增工程信息文件作为一个节点,计算所述新增节点与其他所有节点之间的相似度期望值,并将该新增节点与相似度不小于所述期望值的所有其他节点进行链接,对于相似度小于期望值的所有其他节点,将该节点以一定概率与其相链接。
在完成上述步骤后,新增工程信息文件节点完全整合到原有信息网络中,这些新增节点具有直接相连的与其相似度不低于该节点相似度期望值的短链接节点,同时还具有极少的与其不一定相似的长链接节点,从而形成具有小世界特性的网络拓扑结构。
(4)在建立具有小世界特征的网络拓扑结构基础上,进行工程信息文件检索,如图4所示,其步骤包括:
(4.1)依据现有工程信息文件特征向量中各分量以及检索者已有的经验知识,确定好检索目标特征分量的兴趣点,并给出这些兴趣点分量隶属于该分量现有类型的相似度值,以及相应的分量权重;现设定检索目标上已确定的兴趣点特征分量有k个,不失一般性,将这k个分量按照从1到k的顺序重新编排,它们隶属于各分量现有类型的相似度分别为
Figure 494912DEST_PATH_IMAGE017
,其中
Figure 121065DEST_PATH_IMAGE018
表示检索目标,s1,s2,…,sk分别表示特征向量各分量在一维聚类模型下的分类数,并设定这些分类数所对应的权重比值为
Figure 242605DEST_PATH_IMAGE019
,其中
Figure 674723DEST_PATH_IMAGE020
(4.2)随机选择未被访问过的节点,发出查询请求,当不存在未被访问过的节点时,执行步骤(4.5)。每个查询语句包括已确定的特征分量和对应的各分量权重,其中查询语句为Query={T,P},T表示已确定的特征分量,P表示这些分量的权重比值。
(4.3)依据步骤(4.1)得到检索目标
Figure 830898DEST_PATH_IMAGE021
的k个分量隶属于相应分量现有类型的相似度值,并设定各分量权重比值。现设定用于计算相似度S的另一选定节点d上所对应的k个分量隶属于相应分量现有类型的相似度描述为
Figure 627953DEST_PATH_IMAGE022
。在相似度S的计算公式中,只需要考虑这
Figure 236789DEST_PATH_IMAGE023
个特征分量,其计算表达式为基于相似度S的计算公式,计算出检索目标与选定节点d之间的相似度S,如果S超过给定阈值,则进一步计算出检索目标与该节点的每个短链接节点之间的相似度S,返回选定节点及其短链接节点中相似度S取值最大的节点,跳入步骤(4.5);否则,将该节点标记为已访问,跳入步骤(4.4)。
(4.4)如果S小于给定阈值,将该查询请求Query发送给该节点中未被访问过的长链接节点,跳入步骤(4.3);如果没有未访问过的长链接节点,则跳入(4.2);
(4.5)结束查询;
根据以上方法,可以将查询请求Query发送到最有可能返回有效查询结果的节点,而不是传统的盲目随机选择,从而提高查询效率;同时,充分利用小世界网络拓扑结构中的长链接,使得查询请求Query能够快速地传递到网络中的其他部分,从而提高信息检索速度和查全率。
(5)在建立具有小世界特性的网络拓扑结构基础上,进行工程信息文件的维护,如图5所示,其步骤包括:
(5.1)依据步骤(4)查询得到需要维护的工程信息文件;
(5.2)保持原有节点及其网络拓扑关系不变,构建一个新的原有节点的复制节点,并对复制节点进行修改、删除、添加等维护工作;为了保持信息网络系统原有节点的完整性和兼容性,在进行工程信息维护时,需要将维护前的原始信息保留,对原有工程信息需要进行的所有操作如修改、删除、添加等维护性工作都必须在原有文件的复制版本上进行;
(5.3)抽取所述复制节点在进行维护工作之后的特征向量的分量,计算出这些分量隶属于其现有分量类型的相似度及权值;
(5.4)计算出进行维护工作之后的复制节点与其他所有节点之间的相似度期望值,并将该复制节点与相似度不小于所述期望值的所有其他节点进行链接,对于相似度小于所述期望值的所有其他节点,将该复制节点以一定概率与其相链接。
在完成上述步骤后,经过维护后的工程信息文件节点被完全整合到原有信息网络中,这些新增的维护节点具有直接相连的与其相似度不低于该节点相似度期望值的短链接节点,同时还具有极少的与其不一定相似的长链接,从而形成具有小世界特性的网络拓扑。

Claims (1)

1.一种基于小世界特性的工程信息组织方法,其特征在于其方法步骤如下:
(1)工程信息文件的特征数据描述,其步骤包括:
(1.1)确定需要长期保存和利用的工程信息文件,并将其数字化;
(1.2)选择统一的元数据标准对所述工程信息文件进行特征描述,形成特征向量,该特征向量的维数就是所述工程信息文件的信息特征数;
(2)建立具有小世界特性的网络拓扑结构,其步骤包括:
(2.1)采用一维聚类方法对每个工程信息文件所对应特征向量的同一分量进行聚类分析,获取聚类模型;
(2.2)记录上述分量的数值化分类信息,该分类信息标志该分量归属于不同类别的相似程度;
(2.3)所述每个工程信息文件作为一个节点,每个节点在上述步骤的基础上获得其自身特征描述的数值化分类信息,同时设定一个隶属于该节点的用于描述其特征向量各个分量重要程度的权值向量;
(2.4)以所述权值向量为依据,两两比较计算出每个节点与其他所有节点之间的相似度;
(2.5)计算每个节点与其他所有节点之间的相似度期望值,并将该节点与相似度不小于所述期望值的所有其他节点进行链接,对于相似度小于期望值的所有其他节点,将该节点以一定概率与其相链接;
(3)在建立具有小世界特性的网络拓扑结构的基础上,对新增工程信息文件进行保存,其步骤包括:
(3.1)获取新增工程信息文件的特征向量;
(3.2)比较新增工程信息文件特征向量中各个分量与已有工程信息文件特征向量各个分量之间的关系,当新增工程信息文件特征向量中存在新的特征维时,全局性特征向量的维数也做出相应增加,当新增工程信息文件特征向量在新增维数上与已有工程信息文件特征向量不存在隶属关系时,对这些新增维数不进行任何信息记录;
(3.3)比较新增工程信息文件特征向量中各个分量与该分量现有分类之间的关系,当新增工程信息文件特征向量中某个分量与现有分类之间的相似度为0或较低时,将该分量独立出来成为新增分量类型,同时该分量的分类个数做出相应增加;
(3.4)设定用于描述新增工程信息文件特征向量中各个分量重要程度的权值向量;
(3.5)每个新增工程信息文件作为一个节点,计算所述新增节点与其他所有节点之间的相似度期望值,并将该新增节点与相似度不小于所述期望值的所有其他节点进行链接,对于相似度小于期望值的所有其他节点,将该节点以一定概率与其相链接;
(4)在建立具有小世界特征的网络拓扑结构基础上,进行工程信息文件检索,其步骤包括:
(4.1)依据现有工程信息文件特征向量中的各个分量特性,确定检索目标节点特征向量的分量,并给出这些分量隶属于其现有分量类型的相似度及权值;
(4.2)随机选择未被访问过的节点,发出查询请求,当不存在未被访问过的节点时,执行步骤(4.5);
(4.3)计算检索目标节点与被访问节点之间的相似度,当相似度超过给定阈值时,进一步计算出检索目标节点与被访问节点的每个短链接节点之间的相似度,返回被访问节点及其短链接节点中相似度最大的节点,执行步骤(4.5);否则,将被访问节点标记为已访问,执行步骤(4.4);
(4.4)将查询请求发送给被访问节点的未被访问过的长链接节点,执行步骤(4.3),当被访问节点的每一长链接节点都被访问过时,执行步骤(4.2);
(4.5)结束查询; 
(5)在建立具有小世界特性的网络拓扑结构基础上,进行工程信息文件的维护,其步骤包括:
(5.1)依据步骤(4)查询得到需要维护的工程信息文件;
(5.2)保持原有节点及其网络拓扑关系不变,构建一个新的原有节点的复制节点,并对该复制节点进行维护工作;
(5.3)抽取所述复制节点在进行维护工作之后的特征向量的分量,计算出这些分量隶属于其现有分量类型的相似度及权值;
(5.4)计算出进行维护工作之后的复制节点与其他所有节点之间的相似度期望值,并将该复制节点与相似度不小于所述期望值的所有其他节点进行链接,对于相似度小于所述期望值的所有其他节点,将该复制节点以一定概率与其相链接。
CN 201110080080 2011-03-31 2011-03-31 基于小世界特性的工程信息组织方法 Expired - Fee Related CN102136007B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201110080080 CN102136007B (zh) 2011-03-31 2011-03-31 基于小世界特性的工程信息组织方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201110080080 CN102136007B (zh) 2011-03-31 2011-03-31 基于小世界特性的工程信息组织方法

Publications (2)

Publication Number Publication Date
CN102136007A CN102136007A (zh) 2011-07-27
CN102136007B true CN102136007B (zh) 2013-07-10

Family

ID=44295793

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201110080080 Expired - Fee Related CN102136007B (zh) 2011-03-31 2011-03-31 基于小世界特性的工程信息组织方法

Country Status (1)

Country Link
CN (1) CN102136007B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102523300A (zh) * 2011-12-23 2012-06-27 国网电力科学研究院 面向智能电网的数据密集型云存储模型
WO2016147260A1 (ja) * 2015-03-13 2016-09-22 株式会社日立製作所 画像検索装置、及び画像を検索する方法
CN107958074B (zh) * 2017-12-11 2020-06-26 四川隧唐科技股份有限公司 工程信息展示方法及装置
CN108960256A (zh) * 2018-06-28 2018-12-07 东软集团股份有限公司 一种部件损伤程度的确定方法、装置及设备
CN109523035A (zh) * 2018-10-25 2019-03-26 中国航天标准化研究所 基于元数据实现产品寿命周期质量数据规范与组织的方法
CN112434437B (zh) * 2020-12-02 2023-08-25 大连大学 考虑节点重组的装备保障超网络动态演化模型构建方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101017504A (zh) * 2007-03-02 2007-08-15 华中科技大学 基于语义小世界模型的文献检索方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101017504A (zh) * 2007-03-02 2007-08-15 华中科技大学 基于语义小世界模型的文献检索方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Manfredi, S.et al..Small world effects in networks: an engineering interpretation.《Circuits and Systems, 2004. ISCAS "04. Proceedings of the 2004 International Symposium on》.2004,820~823.
Small world effects in networks: an engineering interpretation;Manfredi, S.et al.;《Circuits and Systems, 2004. ISCAS "04. Proceedings of the 2004 International Symposium on》;20040526;1-6 *
工程软件的小世界效应探究;赵正旭等;《石家庄铁道大学学报(自然科学版)》;20100930;第23卷(第3期);820~823 *
赵正旭等.工程软件的小世界效应探究.《石家庄铁道大学学报(自然科学版)》.2010,第23卷(第3期),1~6.

Also Published As

Publication number Publication date
CN102136007A (zh) 2011-07-27

Similar Documents

Publication Publication Date Title
Zhu et al. High-order proximity preserved embedding for dynamic networks
Zhang et al. An incremental CFS algorithm for clustering large data in industrial internet of things
CN102136007B (zh) 基于小世界特性的工程信息组织方法
CN109033234B (zh) 一种基于状态更新传播的流式图计算方法及系统
CN106547882A (zh) 一种智能电网中营销大数据的实时处理方法及系统
CN106202548A (zh) 数据存储方法、查找方法及装置
CN106897374B (zh) 一种基于轨迹大数据最近邻查询的个性化推荐方法
CN107145526B (zh) 一种路网下地理社交关键字反最近邻查询处理方法
CN106874425B (zh) 基于Storm的实时关键词近似搜索算法
CN113157943A (zh) 面向大规模金融知识图谱的分布式存储及可视化查询处理方法
CN103761286B (zh) 一种基于用户兴趣的服务资源检索方法
Roy et al. Fast best-effort search on graphs with multiple attributes
Vishwakarma et al. A comparative study of K-means and K-medoid clustering for social media text mining
Muminov et al. IDEF models and innovative system for search data in stochastic information environment
CN108509545A (zh) 一种文章的评论处理方法及系统
CN113806446A (zh) 一种大数据海量数据快速检索方法
CN109657060B (zh) 安全生产事故案例推送方法及系统
Adhikari et al. Study of select items in different data sources by grouping
CN107018027B (zh) 一种基于贝叶斯估计和共同邻居节点度的链路预测方法
Zheng et al. User preference-based data partitioning top-k skyline query processing algorithm
Zhao et al. Research on Engineering Software Data Formats Conversion Network.
CN108280176A (zh) 基于MapReduce的数据挖掘优化方法
CN108256086A (zh) 数据特征统计分析方法
JP2007073063A (ja) 空間インデックス方法
Patil et al. A review on up-growth algorithm using association rule mining

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20130710

Termination date: 20140331