CN101256594A - 一种图结构相似度测量方法及其系统 - Google Patents
一种图结构相似度测量方法及其系统 Download PDFInfo
- Publication number
- CN101256594A CN101256594A CNA2008101027114A CN200810102711A CN101256594A CN 101256594 A CN101256594 A CN 101256594A CN A2008101027114 A CNA2008101027114 A CN A2008101027114A CN 200810102711 A CN200810102711 A CN 200810102711A CN 101256594 A CN101256594 A CN 101256594A
- Authority
- CN
- China
- Prior art keywords
- similarity
- distance
- space
- graph structure
- number percent
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种图结构相似度测量方法及其系统,其中该方法包括:步骤一,输入第一个图、第二个图,并获取所述第一个图、所述第二个图的SG空间;步骤二,根据所述SG空间计算所述第一个图、所述第二个图之间的结构相似度。该方法可用于数据挖掘或信息检索领域中。任何一个图与其他图的相似度数值可以进而作为一个量化的衡量标准用于相似图或以图作为表示形式特征的相似信息的搜索查询中,也可用于图聚类算法的距离测量中,该方法远好于文本相似度算法,搜索查询准确度更高。
Description
技术领域
本发明涉及结构相似度测量技术,特别是涉及一种可用于数据挖掘或信息检索领域中图结构相似度测量方法及其系统。
背景技术
随着互联网的飞速发展,信息技术的发展也突飞猛进,各类信息资源的数量以惊人的速度增长,如何在浩瀚的信息海洋中快速而又准确地检索出自己所需要的信息成为信息检索技术亟待解决的一大难题。
相似度测量算法可用于数据挖掘或信息检索领域中。如文本相似性度量,很多文本应用包括文档聚类、文档检索、文档过滤等,都依赖于文档相似性的精确度量。然而现有的信息检索技术所采用的文本相似度度量并不能较好地进行信息检索,信息检索的性能不强,准确度不高。
发明内容
本发明所要解决的技术问题在于提供一种图结构相似度测量方法及其系统,用于在数据挖掘或信息检索中通过将信息转化为图并通过图结构计算相似度,以提高信息检索能力和准确度。
为了实现上述目的,本发明提供了一种图结构相似度测量方法,其特征在于,包括:
步骤一,输入第一个图、第二个图,并获取所述第一个图的SG空间、所述第二个图的SG空间;
步骤二,根据所述SG空间计算所述第一个图、所述第二个图之间的结构相似度。
所述的图结构相似度测量方法,其中,所述步骤一中,所述SG空间由所述第一个图或所述第二个图所包含的SG组成,所述SG为从所述第一个图或所述第二个图中抽取的一个关系,表示为<X,v1,v2>,v1和v2分别是所述第一个图或所述第二个图中2个不同的顶点,X表示v1,v2的关系,X为前驱模式或后继模式或前向边模式,前驱模式表示在所述第一个图或所述第二个图中存在分别从v1,v2指向一相同节点的边;后继模式表示在所述第一个图或所述第二个图中存在从一相同节点分别指向v1,v2节点的边;前向边模式表示在所述第一个图或所述第二个图中存在v1指向v2的边。
所述的图结构相似度测量方法,其中,所述步骤二中,所述结构相似度为以所述第一个图、所述第二个图之间的SG距离与重合百分比表示的函数。
所述的图结构相似度测量方法,其中,所述SG距离的计算公式如下:
G1:所述第一个图;
G2:所述第二个图;
SGDist(G1,G2):G1和G2的SG距离;
C11:G1中SG的数目;
SGi:SG空间中第i个SG;
r1、r2:SGi分别在G1和G2中的数目。
所述的图结构相似度测量方法,其中,所述重合百分比的计算公式如下:
G1:所述第一个图;
G2:所述第二个图;
Per(G1,G2):重合百分比;
C12:G2中包含的G1中出现的所有SG的数目;
C22:G2中SG的数目。
所述的图结构相似度测量方法,其中,所述函数为所述SG距离与所述重合百分比之间的加权算术平均值或加权几何平均值或自定义函数。
为了实现上述目的,本发明还提供了一种图结构相似度测量系统,其特征在于,包括:
SG空间获取模块,用于获取所输入的第一个图、第二个图的SG空间;
相似度计算模块,连接所述SG空间获取模块,用于根据所述SG空间计算所述第一个图、所述第二个图之间的结构相似度。
所述的图结构相似度测量系统,其中,所述SG空间获取模块将所述第一个图或所述第二个图所包含的SG组成所述SG空间,所述SG为从所述第一个图或所述第二个图中抽取的一个关系,表示为<X,v1,v2>,v1和v2分别是所述第一个图或所述第二个图中2个不同的顶点,X表示v1,v2的关系,X为前驱模式或后继模式或前向边模式;前驱模式表示在所述第一个图或所述第二个图中存在分别从v1,v2指向一相同节点的边;后继模式表示在所述第一个图或所述第二个图中存在从一相同节点分别指向v1,v2节点的边;前向边模式表示在所述第一个图或所述第二个图中存在v1指向v2的边。
所述的图结构相似度测量系统,其中,所述相似度计算模块又包括:
SG距离计算模块,用于根据所述SG空间计算所述第一个图、所述第二个图之间的SG距离;
G1:所述第一个图;
G2:所述第二个图;
SGDist(G1,G2):G1和G2的SG距离;
C11:G1中SG的数目;
SGi:SG空间中第i个SG;
r1、r2:SGi在G1和G2中的数目;
重合百分比计算模块,用于根据所述SG计算所述第一个图、所述第二个图之间的重合百分比;
Per(G1,G2):重合百分比;
C12:G2中包含的G1中出现的所有SG的数目;
C22:G2中SG的数目;
相似度获取模块,连接所述SG距离计算模块、所述重合百分比计算模块,用于根据所述SG距离与所述重合百分比获取所述结构相似度。
所述的图结构相似度测量系统,其中,所述相似度获取模块以所述SG距离与所述重合百分比表示的函数获取所述结构相似度,所述函数为所述SG距离与所述重合百分比之间的加权算术平均值或加权几何平均值或自定义函数。
本发明的有益技术效果在于:
本发明提出的图相似度测量算法用于计算两个图之间的相似度,可用于数据挖掘或信息检索领域中。任何一个图与其他图的相似度数值可以进而作为一个量化的衡量标准用于相似图或以图作为表示形式特征的相似信息的搜索查询中,也可用于图聚类算法的距离测量中。
以下结合附图和具体实施例对本发明进行详细描述,但不作为对本发明的限定。
附图说明
图1为本发明的图结构相似度测量系统结构图;
图2为本发明的图结构相似度测量方法流程图;
图3为采用智能菜谱机的菜谱示意图。
具体实施方式
下面结合附图和具体实施方式对本发明的技术方案作进一步更详细的描述。
如图1所示,为本发明的图结构相似度测量系统结构图。在该系统100中包括:SG空间获取模块10、相似度计算模块20。
SG空间获取模块10,用于获取所输入的G1和G2的SG空间,每个图G的SG空间由该图G所包含的所有SG组成,一个SG是可以从一个图G中抽取的一个关系,具体见后面定义。
相似度计算模块20,连接SG空间获取模块10,用于根据SG空间计算图G1和图G2之间的结构相似度。具体地,通过由SG空间计算得到的图G1和图G2的SG距离与图G1和图G2的重合百分比之间的函数来计算两个图G1和G2之间的相似度。该函数可以为SG距离与重合百分比所表示的加权算术平均值或加权几何平均值或其他自定义函数。
进一步地,相似度计算模块20又包括:SG距离计算模块21、重合百分比计算模块22、相似度获取模块23。
SG距离计算模块21,用于根据SG计算图G1和图G2之间的SG距离。
重合百分比计算模块22,用于根据SG计算图G1和图G2之间的重合百分比。
相似度获取模块23,连接SG距离计算模块21、重合百分比计算模块22,用于根据SG距离、重合百分比获取图G1和图G2之间的结构相似度。
有关SG更详细的信息将在下文介绍。
SG距离计算模块21以如下公式计算SG距离:
式中符号含义如下:
SGDist(G1,G2):图G1和图G2的SG距离;
C11:图G1中SG的数目;
SGi:SG空间中第i个SG;
r1、r2:SGi在图G1和图G2中的数目。
重合百分比计算模块22以如下公式计算重合百分比:
式中符号含义如下:
Per(G1,G2):重合百分比;
C12:图G2中包含的图G1中出现的所有SG的数目;
C22:图G2中SG的数目。
当SGDist(G1,G2)为一设定值时,Per(G1,G2)的值越小,则表明图G1和图G2两个图重合的部分越少,所以图G1和图G2很不相似;反之,当SGDist(G1,G2)为一设定值时,Per(G1,G2)的值越大,则表明G1和G2两个图重合的部分越多,所以图G1和图G2很相似。因此用SGDist(G1,G2)和Per(G1,G2)来表示G1和G2两个图的相似度。
本发明提出的图相似度测量算法可用于数据挖掘或信息检索领域中。该算法可用于计算两两图之间的相似度。任何一个图与其他图的相似度数值可以进而作为一个量化的衡量标准用于相似图或以图作为表示形式特征的相似信息的搜索查询中,也可用于图聚类算法的距离测量中。
如图2所示,为本发明的图结构相似度测量方法流程图。该流程描述了图结构相似度测量方法,该方法是基于一种具有有序特性的图的相似度测量算法。有序特性,比如说时间特性或者是流程顺序都属于具有有序特性,图模型中带有这种有序特性的图就是一种具有有序特性的图,比如说流程图。该算法通过提取SG作为特征及特性,通过由SG空间计算得到的两个图的SG距离与该两个图的SG重合百分比之间的函数来计算相似度。
有q个字母的一个字符串可以叫做q-gram。对于任何两个字符串S1和S2,Esko[Esko]等人证明了这两个字符串之间的差别是一个有限集,参见“U.Esko,Approximate string-matching with q-grams and maximal matches.TheoreticalComputer Science,vol.92,pp.191-211,1992”。Rui[Rui]进一步将q-gram的思想用在树结构上,参见“Y.Rui,K.Panos,and K.H.T.Anthony,Similarityevaluation on tree-structured data.In proceedings of ACM-SIGMOD InternationalConference on Management of Data,pp,754-765,2005.”。因为树的边数等于顶点数减一,因此可以通过类似字符串q-gram的分析方法来解决树结构的相似度问题。然而,对于图结构的相似度分析却还没有使用这种方法,原因是,图的属性不满足边数等于顶点数减一。对于一个完全图,其有n个顶点却有n*(n-1)/2条边,从而可以看出,随着顶点数的增加,顶点之间的关系(也就是边数)增长得很快。因此只能考虑用以下所述的方法来计算图相似度。
为了更好地描述上述相似度测量方法,现给出以下几个定义:
1)SG:一个SG是可以从一个图G中抽取的一个关系,表示为<X,v1,v2>。v1和v2分别是图G中2个不同的顶点(其中的一个可以为空null)。这里X表示v1,v2的关系,是下面三种关系中的一种:P(Predecessor),为前驱模式,表示在图G中存在分别从v1,v2指向某一相同节点的边,S(Successor)为后继模式,表示在图G中存在从某一相同节点分别指向v1,v2节点的边,F(ForwardEdge),为前向边模式,表示在图G中存在v1指向v2的边。
2)SG空间:一个图G的SG空间可以用R(G)来表示,它是由图G包含的所有SG组成的。C11表示图G1中SG的数目,G22表示图G2中SG的数目,C12表示图G2中包含的图G1中出现的所有SG的数目。
3)SG距离:根据SG计算的两图间的距离称为SG距离。令SGi表示SG空间中第i个SG,r1和r2分别代表SGi在图G1和图G2中的数目,那么SG距离可以用下式表示:
4)重合百分比:对于任意两个图G1和G2,重合百分比Per(G1,G2)定义为图G2中包含的图G1中出现的所有SG的数目比上图G2中SG的数目:
从重合百分比的定义可以看出,对于给定的SG距离,Per(G1,G2)这个数值越小表明两个图重合的部分越少,因此是很不相似的。因此可以用SGDist(G1,G2)和Per(G1,G2)的函数来表示图G1和图G2两个图的相似度:
Sim(G1,G2)=f(SGDist(G1,G2),Per(G1,G2))。
SGDist(G1,G2)和Per(G1,G2)的函数也可是SGDist(G1,G2)和Per(G1,G2)的加权算术平均值或加权几何平均值或其它自定义函数。
结合图1,该流程的具体实现步骤如下:
步骤S201,输入图G1和图G2两个图;
步骤S202,由SG空间获取模块10获取图G1和图G2的SG空间;
步骤S203,由SG距离计算模块21计算图G1和图G2之间的SG距离即SGDist(G1,G2),由重合百分比计算模块22计算图G1和图G2之间的重合百分比即Per(G1,G2)。
进一步地,步骤S203中,当SGDist(G1,G2)为一设定值时,Per(G1,G2)的值越小,则表明图G1和图G2两个图重合的部分越少,所以图G1和图G2很不相似;反之,当SGDist(G1,G2)为一设定值时,Per(G1,G2)的值越大,则表明图G1和图G2两个图重合的部分越多,所以图G1和图G2很相似。因此可用SGDist(G1,G2)和Per(G1,G2)的函数来表示图G1和图G2两个图的相似度。
表一举出了两个SG及SG空间的例子,该表一列出了图G1和图G2及其SG空间。在图G1和图G2中,小下标的数字代表时间的先后顺序。根据SG的定义,可以看到G1中,对于顶点“heat6”,顶点“oil5.01”比顶点“crush5”离这个顶点更近一点。因此仅选择这一对顶点,用SG{F,‘oil5.01’,‘heat6’}来表示,有oil5.01指向heat6的边。SG{P,‘marinate’,‘heat’}表示顶点‘marinate’和顶点‘heat’有指向顶点‘stir-fry’的边。对于例子中的图G1、图G2,可以计算SGDist(G1,G2)=4,Per(G1,G2)=4/11=36.4%。计算Sim(G1,G2)的函数可以根据具体情况选用恰当的函数,比如算术平均、几何平均等等。这里使用下面这个函数(即几何平均)来计算Sim(G1,G2):
Sim(G1,G2)=[1/SGDist(G1,G2)*Per(G1,G2)]1/2
=[1/4*0.364]1/2
=0.302
表一
在该方法的步骤中,首先输入两个图G1,G2,并得到图G1的空间R(G1),具体的程序流程是:
{.....
S1=C11;
S2=C22;
对于每一个在空间R(G1)中的SGi;
occ1=SGi在G1中的数目;
occ2=SGi在G2中的数目;
如果图G2不在结果集中那么
把图G2写入结果集;
SGDist(G1,G2)=S1-occ1+|occ1-occ2|;
Per(G1,G2)=occ2/S2;
否则
从结果集中取得SGDist(G1, G2)和Per(G1,G2);
更新SGDist(G1,G2)-=occ1-|occ1-occ2|;
更新Per(G1,G2)+=occ2/S2;
返回结果集;
.......
}。
上述图相似度算法可以用于各种搜索相似图的应用中,如图3中举例的菜谱。这里给出了一种使用这种算法的应用实例-智能菜谱机,该智能菜谱机集成了搜索、显示、推荐的功能,为用户提供各式各样的菜谱。一个菜谱的信息可以包括制作流程(Steps)35,视频(Video Clip)3 1,图片(Final Look)32,还包括菜谱成分(Ingredients,所需食材或原料)34,菜谱的步骤图解(StepIllustration)33,菜谱所属类别(Category)36等,如图3所示。特别是,一个菜谱的制作流程(Steps)可以用一种具有有序特性的图来表示,如表一中的图G1或图G2。智能菜谱机可以实现如下功能:
a1)当用户输入一些食材(原料)后,智能菜谱机可以与菜谱成分匹配输出利用这些食材的菜谱。
a2)当用户输入一个菜谱名字后,智能菜谱机可以输出这个菜谱的图片,做法流程。不仅如此,还可以根据本发明的方法找出及推荐一些类似做法的菜谱。
智能菜谱机的工作流程如下:
b1)用户输入食材或菜谱名,如Bang Bang Chicken(棒棒鸡)30;
b2)智能菜谱系统用传统的搜索方法搜索出相似的菜谱,提供该菜谱的信息,包括制作流程(Steps)35,视频(Video Clip)31,图片(Final Look)32,+还包括菜谱成分(Ingredients,即所需食材或原料)34,菜谱的步骤图解(StepIllustration)33,菜谱所属类别(Category)36等,如图3所示;
b3)智能菜谱系统使用图相似度算法计算两个菜谱流程图的相似度。
b4)排序所有菜谱与用户查询菜谱的相似度。
b5)按顺序显示推荐的类似做法的菜谱,提供该菜谱的流程。
本发明提出的图相似度测量算法用于计算两个图之间的相似度,可用于数据挖掘或信息检索领域中。任何一个图与其他图的相似度数值可以进而作为一个量化的衡量标准用于相似图或以图作为表示形式特征的相似信息的搜索查询中,也可用于图聚类算法的距离测量中。本发明所提出的图相似度算法远好于文本相似度算法,搜索查询准确度更高。
当然,本发明还可有其他多种实施例,在不背离本发明精神及其实质的情况下,熟悉本领域的技术人员当可根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。
Claims (10)
1、一种图结构相似度测量方法,其特征在于,包括:
步骤一,输入第一个图、第二个图,并获取所述第一个图的SG空间、所述第二个图的SG空间;
步骤二,根据所述SG空间计算所述第一个图、所述第二个图之间的结构相似度。
2、根据权利要求1所述的图结构相似度测量方法,其特征在于,所述步骤一中,所述SG空间由所述第一个图或所述第二个图所包含的SG组成,所述SG为从所述第一个图或所述第二个图中抽取的一个关系,表示为<X,v1,v2>,v1和v2分别是所述第一个图或所述第二个图中2个不同的顶点,X表示v1,v2的关系,X为前驱模式或后继模式或前向边模式,前驱模式表示在所述第一个图或所述第二个图中存在分别从v1,v2指向一相同节点的边;后继模式表示在所述第一个图或所述第二个图中存在从一相同节点分别指向v1,v2节点的边;前向边模式表示在所述第一个图或所述第二个图中存在v1指向v2的边。
3、根据权利要求2所述的图结构相似度测量方法,其特征在于,所述步骤二中,所述结构相似度为以所述第一个图、所述第二个图之间的SG距离与重合百分比表示的函数。
4、根据权利要求3所述的图结构相似度测量方法,其特征在于,所述SG距离的计算公式如下:
G1:所述第一个图;
G2:所述第二个图;
SGDist(G1,G2):G1和G2的SG距离;
C11:G1中SG的数目;
SGi:SG空间中第i个SG;
r1、r2:SGi分别在G1和G2中的数目。
5、根据权利要求4所述的图结构相似度测量方法,其特征在于,所述重合百分比的计算公式如下:
G1:所述第一个图;
G2:所述第二个图;
Per(G1,G2):重合百分比;
C12:G2中包含的G1中出现的所有SG的数目;
G22:G2中SG的数目。
6、根据权利要求3、4或5所述的图结构相似度测量方法,其特征在于,所述函数为所述SG距离与所述重合百分比之间的加权算术平均值或加权几何平均值或自定义函数。
7、一种图结构相似度测量系统,其特征在于,包括:
SG空间获取模块,用于获取所输入的第一个图、第二个图的SG空间;
相似度计算模块,连接所述SG空间获取模块,用于根据所述SG空间计算所述第一个图、所述第二个图之间的结构相似度。
8、根据权利要求7所述的图结构相似度测量系统,其特征在于,所述SG空间获取模块将所述第一个图或所述第二个图所包含的SG组成所述SG空间,所述SG为从所述第一个图或所述第二个图中抽取的一个关系,表示为<X,v1,v2>,v1和v2分别是所述第一个图或所述第二个图中2个不同的顶点,X表示v1,v2的关系,X为前驱模式或后继模式或前向边模式;前驱模式表示在所述第一个图或所述第二个图中存在分别从v1,v2指向一相同节点的边;后继模式表示在所述第一个图或所述第二个图中存在从一相同节点分别指向v1,v2节点的边;前向边模式表示在所述第一个图或所述第二个图中存在v1指向v2的边。
9、根据权利要求8所述的图结构相似度测量系统,其特征在于,所述相似度计算模块又包括:
SG距离计算模块,用于根据所述SG空间计算所述第一个图、所述第二个图之间的SG距离;
G1:所述第一个图;
G2:所述第二个图;
SGDist(G1,G2):G1和G2的SG距离;
C11:G1中SG的数目;
SGi:SG空间中第i个SG;
r1、r2:SGi在G1和G2中的数目;
重合百分比计算模块,用于根据所述SG计算所述第一个图、所述第二个图之间的重合百分比;
Per(G1,G2):重合百分比;
C12:G2中包含的G1中出现的所有SG的数目;
C22:G2中SG的数目;
相似度获取模块,连接所述SG距离计算模块、所述重合百分比计算模块,用于根据所述SG距离与所述重合百分比获取所述结构相似度。
10、根据权利要求9所述的图结构相似度测量系统,其特征在于,所述相似度获取模块以所述SG距离与所述重合百分比表示的函数获取所述结构相似度,所述函数为所述SG距离与所述重合百分比之间的加权算术平均值或加权几何平均值或自定义函数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNA2008101027114A CN101256594A (zh) | 2008-03-25 | 2008-03-25 | 一种图结构相似度测量方法及其系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNA2008101027114A CN101256594A (zh) | 2008-03-25 | 2008-03-25 | 一种图结构相似度测量方法及其系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101256594A true CN101256594A (zh) | 2008-09-03 |
Family
ID=39891413
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2008101027114A Pending CN101256594A (zh) | 2008-03-25 | 2008-03-25 | 一种图结构相似度测量方法及其系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101256594A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102368266A (zh) * | 2011-10-21 | 2012-03-07 | 浙江大学 | 一种用于网络搜索的无标注图片的排序方法 |
CN103502919A (zh) * | 2012-02-21 | 2014-01-08 | 松下电器产业株式会社 | 菜谱提示装置以及菜谱提示方法 |
CN104156391A (zh) * | 2014-07-09 | 2014-11-19 | 北京奇虎科技有限公司 | 一种在移动搜索结果中展现菜谱的装置和方法 |
CN106484813A (zh) * | 2016-09-23 | 2017-03-08 | 广东港鑫科技有限公司 | 一种大数据分析系统及方法 |
CN108664582A (zh) * | 2018-05-04 | 2018-10-16 | 苏州朗动网络科技有限公司 | 企业关系的查询方法、装置、计算机设备及存储介质 |
CN109766940A (zh) * | 2018-12-29 | 2019-05-17 | 北京天诚同创电气有限公司 | 评估多个污水处理系统间的相似度的方法和装置 |
CN112927752A (zh) * | 2021-02-23 | 2021-06-08 | 淮南师范学院 | 一种用于量化生物进化树间相似度的算法 |
-
2008
- 2008-03-25 CN CNA2008101027114A patent/CN101256594A/zh active Pending
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102368266A (zh) * | 2011-10-21 | 2012-03-07 | 浙江大学 | 一种用于网络搜索的无标注图片的排序方法 |
CN102368266B (zh) * | 2011-10-21 | 2013-03-20 | 浙江大学 | 一种用于网络搜索的无标注图片的排序方法 |
CN103502919A (zh) * | 2012-02-21 | 2014-01-08 | 松下电器产业株式会社 | 菜谱提示装置以及菜谱提示方法 |
US9519694B2 (en) | 2012-02-21 | 2016-12-13 | Panasonic Intellectual Property Management Co., Ltd. | Device for presenting recipe and method for presenting recipe |
CN104156391A (zh) * | 2014-07-09 | 2014-11-19 | 北京奇虎科技有限公司 | 一种在移动搜索结果中展现菜谱的装置和方法 |
CN106484813A (zh) * | 2016-09-23 | 2017-03-08 | 广东港鑫科技有限公司 | 一种大数据分析系统及方法 |
CN108664582A (zh) * | 2018-05-04 | 2018-10-16 | 苏州朗动网络科技有限公司 | 企业关系的查询方法、装置、计算机设备及存储介质 |
CN109766940A (zh) * | 2018-12-29 | 2019-05-17 | 北京天诚同创电气有限公司 | 评估多个污水处理系统间的相似度的方法和装置 |
CN109766940B (zh) * | 2018-12-29 | 2024-02-02 | 北京天诚同创电气有限公司 | 评估多个污水处理系统间的相似度的方法和装置 |
CN112927752A (zh) * | 2021-02-23 | 2021-06-08 | 淮南师范学院 | 一种用于量化生物进化树间相似度的算法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106599278B (zh) | 应用搜索意图的识别方法及装置 | |
CN108280114B (zh) | 一种基于深度学习的用户文献阅读兴趣分析方法 | |
US8489589B2 (en) | Visual search reranking | |
US20060004753A1 (en) | System and method for document analysis, processing and information extraction | |
CN108647276B (zh) | 一种搜索方法 | |
CN101256594A (zh) | 一种图结构相似度测量方法及其系统 | |
CN106951498A (zh) | 文本聚类方法 | |
Hu et al. | Relaxed lightweight assembly retrieval using vector space model | |
CN107291895B (zh) | 一种快速的层次化文档查询方法 | |
CN105653706A (zh) | 一种基于文献内容知识图谱的多层引文推荐方法 | |
US20090063461A1 (en) | User query mining for advertising matching | |
CN106503223B (zh) | 一种结合位置和关键词信息的在线房源搜索方法及装置 | |
CN102456016B (zh) | 一种对搜索结果进行排序的方法及装置 | |
CN102495892A (zh) | 一种网页信息抽取方法 | |
CN103646070A (zh) | 搜索引擎的数据处理方法及装置 | |
CN101206674A (zh) | 以商品为媒介的增强型相关搜索系统及其方法 | |
CN111429980A (zh) | 一种材料晶体结构特征的自动化获取方法 | |
CN105868366B (zh) | 基于概念关联的概念空间导航方法 | |
Gu et al. | Module overlapping structure detection in PPI using an improved link similarity-based Markov clustering algorithm | |
CN103744887A (zh) | 一种用于人物搜索的方法、装置和计算机设备 | |
CN105243064A (zh) | 一种子图匹配的方法及装置 | |
CN102314464B (zh) | 歌词搜索方法及搜索引擎 | |
Kalyani et al. | Paper on searching and indexing using elasticsearch | |
Kore et al. | Survey of image retrieval techniques and algorithms for image-rich information networks | |
Goyal et al. | Concept based query recommendation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Open date: 20080903 |