CN103778182A - 一种快速图形相似度判别方法 - Google Patents

一种快速图形相似度判别方法 Download PDF

Info

Publication number
CN103778182A
CN103778182A CN201310677109.4A CN201310677109A CN103778182A CN 103778182 A CN103778182 A CN 103778182A CN 201310677109 A CN201310677109 A CN 201310677109A CN 103778182 A CN103778182 A CN 103778182A
Authority
CN
China
Prior art keywords
sigma
mean distance
similarity
coordinate
drawing object
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310677109.4A
Other languages
English (en)
Other versions
CN103778182B (zh
Inventor
张贵军
秦传庆
周晓根
郝小虎
张贝金
明洁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Technology ZJUT
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN201310677109.4A priority Critical patent/CN103778182B/zh
Publication of CN103778182A publication Critical patent/CN103778182A/zh
Application granted granted Critical
Publication of CN103778182B publication Critical patent/CN103778182B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5838Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour

Landscapes

  • Engineering & Computer Science (AREA)
  • Library & Information Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种快速图形相似度判别方法,包括以下步骤:读入待比较图形对象,从图形对象里面提取出采样点的坐标;求得图形对象的质心坐标、离对象质心坐标最近和最远的采样点坐标,求得采样点和质心坐标、离对象质心坐标最近和最远的采样点坐标的平均距离、平均距离的方差、以及平均距离的偏度,获得代表对象特征的一个九维向量,从数据库中取得的欲和本图形对象比较相似性的另一个图形对象,按照上述方法取得新图形对象的九维向量;通过比较两个九维向量获得相似性度量指标,进行归一化处理,越接近于1代表相似性越高,对查询到的结果按照相似性排列出最相似的查找到的图形对象。本发明提出了一种有效降低搜索代价、效率较高的快速图形相似度判别方法。

Description

一种快速图形相似度判别方法
技术领域
本发明涉及二维图形、三维图形数据处理、数据库搜索、计算机领域,尤其涉及的是一种图形相似度判别方法。 
背景技术
随着科技的不断发展,我们所处的时代是一个大数据时代,大数据时代带来的问题是——有很多的数据亟需处理。大数据的具体表现表现出来就是各种类型的数据库越来越多,并且随着3D打印技术的产生,3D图形数据也会越来越多。我们面临的问题就是如何能从庞大的数据库里面找出我们想要找到的对象。尤其是在我们有一定比对数据的情况下,能够找到和我们手中数据相似度较高的有用数据。 
这个问题映射到生物学的关键领域——蛋白质上就显得更加的迫切。现在关于蛋白质的数据库有很多。多数是一些已经在实验室条件下测定结构的蛋白质。关于用计算机算法预测未知蛋白质的方法是一个对实验室测定蛋白质花费代价很高的一个补充。蛋白质的结构是蛋白质生物功能的一个极其重要的因素,可以说确定蛋白质的结构也就基本上确定了蛋白质的功能。反过来说,如果工程制药需要设定特殊结构的蛋白质,就必须确定这个蛋白质的结构,现在比较流行的方法是参照蛋白质数据库中已有蛋白质结构来实现预测。随着已经测定的蛋白质结构越来越多,意味着蛋白质数据库中的已知蛋白质数量及其庞大,那么我们怎么找到和某一个蛋白质相似的蛋白质呢。 
当然,这个方法不是限定于蛋白质结构相似性的比对,这个方法可以使用在二维三维图形,只要能够采集到所需的数据笛卡尔坐标数据即可,比如这个方法可以使用在GIS(地理信息系统)上相似图形区域的搜索。 
发明内容
为了克服当前图形相似性搜索代价高、效率低的不足,本发明提出了一种有效降低搜索代价、效率较高的快速图形相似度判别方法。 
本发明解决其技术问题所采用的技术方案是: 
一种快速图形相似度判别方法,包括以下步骤: 
A1、首先读入一个待比较图形对象; 
A2、从上述的待处理图像对象里面提取出来各个采样点的坐标,所述坐标是三维的笛卡尔坐标或者二维坐标,假定采样点的坐标共有n个; 
A3、由公式(1)求得上述待比较图形对象的质心坐标,即几何中心坐标centroid(x,y,z); 
x = 1 n Σ i = 1 n x i y = 1 n Σ i = 1 n y i z = 1 n Σ i = 1 n z i - - - ( 1 )
A4、由公式(2)迭代求得离上述待比较图形对象的质心坐标centroid(x,y,z)最近的采样点坐标nearest(x,y,z); 
Dis tan ce = ( ( x i - x ) 2 + ( y i - y ) 2 + ( z i - z ) 2 ) - - - ( 2 )
A5、由公式(2)迭代求得离上述待处理图形对象的质心坐标centroid(x,y,z)最远的采样点坐标farest(x,y,z); 
A6、分别由公式(3)、(4)、(5)迭代求得各个采样点与centroid(x,y,z)的平均距离CentroidAverage、平均距离的方差CentroidVariance、以及平均距离的偏度CentroidSkewness; 
CentroidAverage = Σ i = 1 4 n ( ( x i - x ) 2 + ( y i - y ) 2 + ( z i - z ) 2 ) / ( 4 n ) - - - ( 3 )
CentroidVariance = Σ i = 1 4 n ( ( ( x i - x ) 2 + ( y i - y ) 2 + ( z i - z ) 2 ) - CentroidAverage ) 2 / ( 4 n ) - - - ( 4 )
CentroidSkewness = ( 1 4 n Σ i = 1 4 n ( ( ( x i - x ) 2 + ( y i - y ) 2 + ( z i - z ) 2 ) - CentroidAverage ) ) 3 CentroidVariance 3 / 2 - - - ( 5 )
A7、分别由公式(6)、(7)、(8)迭代求得各个采样点与nearest(x,y,z)的平均距离NearestAverage、平均距离的方差NearestVariance、以及平均距离的偏度NearestSkewness; 
NearestAverage = Σ i = 1 4 n ( ( x i - x ) 2 + ( y i - y ) 2 + ( z i - z ) 2 ) / ( 4 n ) - - - ( 6 )
NearestVariance = Σ i = 1 4 n ( ( ( x i - x ) 2 + ( y i - y ) 2 + ( z i - z ) 2 ) - NearestAverage ) 2 / ( 4 n ) - - - ( 7 )
NearestSkewness = ( 1 4 n Σ i = 1 4 n ( ( ( x i - x ) 2 + ( y i - y ) 2 + ( z i - z ) 2 ) - NearestAverage ) ) 3 NearestVariance 3 / 2 - - - ( 8 )
A8、分别由公式(9)、(10)、(11)迭代求得各个采样点与farest(x,y,z)的平均距离FarestAverage、平均距离的方差FarestVariance、以及平均距离的偏度FarestSkewness; 
FarestAverage = Σ i = 1 4 n ( ( x i - x ) 2 + ( y i - y ) 2 + ( z i - z ) 2 ) / ( 4 n ) - - - ( 9 )
FarestVariance = Σ i = 1 4 n ( ( ( x i - x ) 2 + ( y i - y ) 2 + ( z i - z ) 2 ) - FarestAverage ) 2 / ( 4 n ) - - - ( 10 )
FarestSkewness = ( 1 4 n Σ i = 1 4 n ( ( ( x i - x ) 2 + ( y i - y ) 2 + ( z i - z ) 2 ) - FarestAverage ) ) 3 FarestVariance 3 / 2 - - - ( 11 )
A9、将上述A6,A7,A8步骤之中获得的每个分量组成一个九维向量(12),这个九维向量就代表了当前这个待比较图形对象的特征向量; 
FeatureVectorq=(CentroidAverage,CentroidVariance,CentroidSkewness, 
NearestAverage,NearestVariance,NearestSkewness,                  (12) 
FarestAverage,FarestVariance,FarestSkewness) 
A10、从数据库中取一个图形对象,按照步骤A2-A9求得其九维特征向量,FeatureVectori; 
A11、通过比较步骤A9和A10的九维的向量获得确定性的相似性指标,并进行归一化处理,其取值范围在[0,1]之间,越接近于1代表相似性越高,否则相似性 越低; 
S = 1 / ( 1 + Σ i = 1 12 | FeatureVector q - FeatureVector i | / 12 ) - - - ( 13 )
公式其中的|FeatureVectorq-FeatureVectori|是两个向量之间的曼哈顿距离(Manhattan distance),S是最后求得的两个图形对象比较的相似性得分; 
对查询到的结果按照相似性排列出最相似的查找到的图形对象。 
进一步,所述步骤A1中,所述图形对象是二维、三维实体图形或GIS图形,该图形对象能够获得相应数据采集点的坐标。 
本发明的技术构思为:将实体图形按照其具体的特有相关特征,取得所有采样点进行相应的数学运算最后映射为数学上的九维向量来进行数学描述,通过九维向量来比较对象之间的相似性。 
本发明的有益效果为:有效降低搜索代价、效率较高。 
具体实施方式
下面结合蛋白质分子一般结构,对本发明作进一步描述。 
一种快速图形相似度判别方法,包括以下步骤: 
A1、首先读入一个待比较图形对象; 
A2、从上述的待处理图像对象里面提取出来各个采样点的坐标,所述坐标是三维的笛卡尔坐标或者二维坐标,假定采样点的坐标共有n个; 
A3、由公式(1)求得上述待比较图形对象的质心坐标,即几何中心坐标centroid(x,y,z); 
x = 1 n Σ i = 1 n x i y = 1 n Σ i = 1 n y i z = 1 n Σ i = 1 n z i - - - ( 1 )
A4、由公式(2)迭代求得离上述待比较图形对象的质心坐标centroid(x,y,z)最近的采 样点坐标nearest(x,y,z); 
Dis tan ce = ( ( x i - x ) 2 + ( y i - y ) 2 + ( z i - z ) 2 ) - - - ( 2 )
A5、由公式(2)迭代求得离上述待比较图形对象的质心坐标centroid(x,y,z)最远的采样点坐标farest(x,y,z); 
A6、分别由公式(3)、(4)、(5)迭代求得各个采样点与centroid(x,y,z)的平均距离CentroidAverage、平均距离的方差CentroidVariance、以及平均距离的偏度CentroidSkewness; 
CentroidAverage = Σ i = 1 4 n ( ( x i - x ) 2 + ( y i - y ) 2 + ( z i - z ) 2 ) / ( 4 n ) - - - ( 3 )
CentroidVariance = Σ i = 1 4 n ( ( ( x i - x ) 2 + ( y i - y ) 2 + ( z i - z ) 2 ) - CentroidAverage ) 2 / ( 4 n ) - - - ( 4 )
CentroidSkewness = ( 1 4 n Σ i = 1 4 n ( ( ( x i - x ) 2 + ( y i - y ) 2 + ( z i - z ) 2 ) - CentroidAverage ) ) 3 CentroidVariance 3 / 2 - - - ( 5 )
A7、分别由公式(6)、(7)、(8)迭代求得各个采样点与nearest(x,y,z)的平均距离NearestAverage、平均距离的方差NearestVariance、以及平均距离的偏度NearestSkewness; 
NearestAverage = Σ i = 1 4 n ( ( x i - x ) 2 + ( y i - y ) 2 + ( z i - z ) 2 ) / ( 4 n ) - - - ( 6 )
NearestVariance = Σ i = 1 4 n ( ( ( x i - x ) 2 + ( y i - y ) 2 + ( z i - z ) 2 ) - NearestAverage ) 2 / ( 4 n ) - - - ( 7 )
NearestSkewness = ( 1 4 n Σ i = 1 4 n ( ( ( x i - x ) 2 + ( y i - y ) 2 + ( z i - z ) 2 ) - NearestAverage ) ) 3 NearestVariance 3 / 2 - - - ( 8 )
A8、分别由公式(9)、(10)、(11)迭代求得各个采样点与farest(x,y,z)的平均距离FarestAverage、平均距离的方差FarestVariance、以及平均距离的偏度FarestSkewness; 
FarestAverage = Σ i = 1 4 n ( ( x i - x ) 2 + ( y i - y ) 2 + ( z i - z ) 2 ) / ( 4 n ) - - - ( 9 )
FarestVariance = Σ i = 1 4 n ( ( ( x i - x ) 2 + ( y i - y ) 2 + ( z i - z ) 2 ) - FarestAverage ) 2 / ( 4 n ) - - - ( 10 )
FarestSkewness = ( 1 4 n Σ i = 1 4 n ( ( ( x i - x ) 2 + ( y i - y ) 2 + ( z i - z ) 2 ) - FarestAverage ) ) 3 FarestVariance 3 / 2 - - - ( 11 )
A9、将上述A6,A7,A8步骤之中获得的每个分量组成一个九维向量(12),这个九维向量就代表了当前这个待比较图形对象的特征向量; 
FeatureVectorq=(CentroidAverage,CentroidVariance,CentroidSkewness, 
NearestAverage,NearestVariance,NearestSkewness,                     (12) 
FarestAverage,FarestVariance,FarestSkewness) 
A10、从数据库中取一个图形对象,按照步骤A2-A9求得其九维特征向量,FeatureVectori; 
A11、通过比较步骤A9和A10的九维的向量获得确定性的相似性指标,并进行归一化处理,其取值范围在[0,1]之间,越接近于1代表相似性越高,否则相似性越低; 
S = 1 / ( 1 + Σ i = 1 12 | FeatureVector q - FeatureVector i | / 12 ) - - - ( 13 )
公式其中的|FeatureVectorq-FeatureVectori|是两个向量之间的曼哈顿距离(Manhattan distance),S是最后求得的两个图形对象比较的相似性得分; 
对查询到的结果按照相似性排列出最相似的查找到的图形对象。 
进一步,所述步骤A1中,所述图形对象是二维、三维实体图形或GIS图形,该图形对象能够获得相应数据采集点的坐标。 
本实例以蛋白质相似性的搜索为例,一种蛋白质图形识别比对搜索方法,包括以下步骤: 
A1、首先读入一个需要比对相似性的蛋白质分子的详细描述文件(该文件是一个pdb格式的文件,该文件包含了蛋白质分子各个原子的笛卡尔三维坐标); 
A2、从上述的文件中取出待处理原子(相当于采样点)的三维坐标(作为示例只是对蛋白质分子的骨链氨基酸中的原子坐标进行了提取,也就是蛋白质分子的每个氨基酸的N原子、Cα原子、C原子、O原子四个原子进行坐标数据的处理,由 于每个氨基酸均有这四种原子。因此,其数目是相同的均等于蛋白质之中氨基酸的数目); 
所谓的蛋白质骨链氨基酸原子是组成蛋白质分子各个氨基酸残基的共有结构。蛋白质的骨链的一般构象可见蛋白质分子的结构图; 
A3、根据上述的坐标求解出蛋白质分子的质心坐标centroid(x,y,z)(也就是蛋白质分子的几何中心); 
计算公式如下: 
假设预测定的蛋白质长度为n个氨基酸,根据A2已经获得的各个原子的坐标分别为: 
N1(Nx1,Ny1,Nz1)……Nn(Nxn,,Nyn.,Nzn),共n个N原子 
Cα1(Cαx1,Cαy1,Cαz1)……Cαn(Cαxn,Cαyn,Cαzn),共n个Cα原子 
C1(Cx1,Cy1,Cz1)……Cn(Cxn,Cyn,Czn),共n个C原子 
O1(Ox1,Oy1,Oz1)……On(Oxn,,Oyn.,Ozn),共n个O原子 
centroid(x,y,z)质心的坐标计算方式如下: 
centroid(x,y,z)中的x分量计算如下: 
x = 1 n Σ i = 1 n N xi + 1 n Σ i = 1 n C αxi + 1 n Σ i = 1 n C xi + 1 n Σ i = 1 n O xi
centroid(x,y,z)中的y分量计算如下: 
y = 1 n Σ i = 1 n N yi + 1 n Σ i = 1 n C αyi + 1 n Σ i = 1 n C yi + 1 n Σ i = 1 n O yi
centroid(x,y,z)中的z分量计算如下: 
z = 1 n Σ i = 1 n N zi + 1 n Σ i = 1 n C αzi + 1 n Σ i = 1 n C zi + 1 n Σ i = 1 n O zi
A4、根据上述求得的质心坐标求解离质心最近的原子坐标nearest(x,y,z),这需要迭代所有的蛋白质分子中的骨链原子(N,Cα,C,O)坐标和质心坐标centroid(x,y,z)的距离,从中选择离质心最近的原子; 
求解任意四种类型中的原子坐标ATOM(xi,yi,zi)和质心坐标centroid(x,y,z)的距离公式如下: 
Dis tan ce = ( ( x i - x ) 2 + ( y i - y ) 2 + ( z i - z ) 2 )
根据这个公式迭代求解得到离质心坐标centroid(x,y,z)最近的原子坐标nearest(x,y,z)。 
A5、根据上述求得的质心坐标求解离质心最远的原子坐标farest(x,y,z),这需要迭代所有的蛋白质分子中的骨链原子(N,Cα,C,O)坐标和质心坐标centroid(x,y,z)的距离,从中选择离质心最远的原子; 
求解任意四种类型中的原子坐标ATOM(xi,yi,zi)和质心坐标centroid(x,y,z)的距离公式如下: 
Dis tan ce = ( ( x i - x ) 2 + ( y i - y ) 2 + ( z i - z ) 2 )
根据这个公式迭代求解得到离质心坐标centroid(x,y,z)最远的原子坐标farest(x,y,z)。 
A6、求得各个原子坐标和质心坐标centroid(x,y,z)的平均距离CentroidAverage、平均距离的方差CentroidVariance、平均距离的偏度CentroidSkewness; 
计算公式如下: 
假设这个蛋白质分子有n个氨基酸,根据上边的描述每个氨基酸骨链原子之中均有4个类型的原子(N,Cα,C,O),可以将这四个原子统称为ATOM(xi,yi,zi),共有4n个原子。 
计算各个原子和质心坐标的平均距离: 
CentroidAverage = Σ i = 1 4 n ( ( x i - x ) 2 + ( y i - y ) 2 + ( z i - z ) 2 ) / ( 4 n )
计算各个原子ATOM(xi,yi,zi)和质心坐标centroid(x,y,z)的平均距离的方差: 
CentroidVariance = Σ i = 1 4 n ( ( ( x i - x ) 2 + ( y i - y ) 2 + ( z i - z ) 2 ) - CentroidAverage ) 2 / ( 4 n )
计算各个原子ATOM(xi,yi,zi)和质心坐标centroid(x,y,z)的平均距离的偏度: 
CentroidSkewness = ( 1 4 n Σ i = 1 4 n ( ( ( x i - x ) 2 + ( y i - y ) 2 + ( z i - z ) 2 ) - CentroidAverage ) ) 3 CentroidVariance 3 / 2
A7、求得各个原子坐标和上述求得坐标nearest(x,y,z)的平均距离NearestAverage、平均距离的方差NearestVariance、平均距离的偏度NearestSkewness; 
计算公式如下: 
假设这个蛋白质分子有n个氨基酸,根据上边的描述每个氨基酸骨链原子之中均有4个类型的原子(N,Cα,C,O),可以将这四个原子统称为ATOM(xi,yi,zi),共有4n个原子。 
计算各个原子和nearest(x,y,z)的平均距离: 
NearestAverage = Σ i = 1 4 n ( ( x i - x ) 2 + ( y i - y ) 2 + ( z i - z ) 2 ) / ( 4 n )
计算各个原子ATOM(xi,yi,zi)和nearest(x,y,z)的平均距离的方差: 
NearestVariance = Σ i = 1 4 n ( ( ( x i - x ) 2 + ( y i - y ) 2 + ( z i - z ) 2 ) - NearestAverage ) 2 / ( 4 n )
计算各个原子ATOM(xi,yi,zi)和nearest(x,y,z)的平均距离的偏度: 
NearestSkewness = ( 1 4 n Σ i = 1 4 n ( ( ( x i - x ) 2 + ( y i - y ) 2 + ( z i - z ) 2 ) - NearestAverage ) ) 3 NearestVariance 3 / 2
A8、求得各个原子坐标和上述求得坐标farest(x,y,z)的平均距离FarestAverage、平均距离的方差FarestVariance、平均距离的偏度FarestSkewness; 
计算公式如下: 
假设这个蛋白质分子有n个氨基酸,根据上边的描述每个氨基酸骨链原子之中均有4个类型的原子(N,Cα,C,O),可以将这四个原子统称为ATOM(xi,yi,zi),共有4n个原子。 
计算各个原子和farest(x,y,z)的平均距离: 
FarestAverage = Σ i = 1 4 n ( ( x i - x ) 2 + ( y i - y ) 2 + ( z i - z ) 2 ) / ( 4 n )
计算各个原子ATOM(xi,yi,zi)和farest(x,y,z)的平均距离的方差: 
FarestVariance = Σ i = 1 4 n ( ( ( x i - x ) 2 + ( y i - y ) 2 + ( z i - z ) 2 ) - FarestAverage ) 2 / ( 4 n )
计算各个原子ATOM(xi,yi,zi)和farest(x,y,z)的平均距离的偏度: 
FarestSkewness = ( 1 4 n Σ i = 1 4 n ( ( ( x i - x ) 2 + ( y i - y ) 2 + ( z i - z ) 2 ) - FarestAverage ) ) 3 FarestVariance 3 / 2
A9、将上述所求得9个分量组成一个九维的蛋白质特征向量; 
FeatureVectorq=(CentroidAverage,CentroidVariance,CentroidSkewness, 
NearestAverage,NearestVariance,NearestSkewness, 
FarestAverage,FarestVariance,FarestSkewness) 
A10、从数据库中取得的待和本对象比较相似性的另外若干对象,按照同样的方法取得这个从数据库中的获得对象的九维特征向量FeatureVectori; 
A11、通过比较这两个九维的向量可以获得某种确定性的相似性指标,并进行归一化处理,其取值范围在[0,1]之间,越接近于1代表相似性越高,否则相似性越低。 
S = 1 / ( 1 + Σ i = 1 12 | FeatureVector q - FeatureVector i | / 12 )
公式其中的|FeatureVectorq-FeatureVectori|是两个向量之间的Manhattan distance,可以对查询到的结果按照相似性排列出最相似的查找到的图形对象。 
以上阐述的是本发明给出的一个实例表现出来的优良优化效果,显然本发明不仅适合上述实施例,在不偏离本发明基本精神及不超出本发明实质内容所涉及内容的前提下可对其做种种变化加以实施。 

Claims (2)

1.一种快速图形相似度判别方法,其特征在于:所述判别方法包括以下步骤:
A1、首先读入一个待比较图形对象;
A2、从上述的待处理图形对象里面提取出来各个采样点的坐标,所述坐标是三维的笛卡尔坐标或者二维坐标,假定采样点的坐标共有n个;
A3、由公式(1)求得上述待比较图形对象的质心坐标,即几何中心坐标centroid(x,y,z);
x = 1 n Σ i = 1 n x i y = 1 n Σ i = 1 n y i z = 1 n Σ i = 1 n z i - - - ( 1 )
A4、由公式(2)迭代求得离上述待比较图形对象的质心坐标centroid(x,y,z)最近的采样点坐标nearest(x,y,z);
Dis tan ce = ( ( x i - x ) 2 + ( y i - y ) 2 + ( z i - z ) 2 ) - - - ( 2 )
A5、由公式(2)迭代求得离上述待比较图形对象的质心坐标centroid(x,y,z)最远的采样点坐标farest(x,y,z);
A6、分别由公式(3)、(4)、(5)迭代求得各个采样点与centroid(x,y,z)的平均距离CentroidAverage、平均距离的方差CentroidVariance、以及平均距离的偏度CentroidSkewness;
CentroidAverage = Σ i = 1 4 n ( ( x i - x ) 2 + ( y i - y ) 2 + ( z i - z ) 2 ) / ( 4 n ) - - - ( 3 )
CentroidVariance = Σ i = 1 4 n ( ( ( x i - x ) 2 + ( y i - y ) 2 + ( z i - z ) 2 ) - CentroidAverage ) 2 / ( 4 n ) - - - ( 4 )
CentroidSkewness = ( 1 4 n Σ i = 1 4 n ( ( ( x i - x ) 2 + ( y i - y ) 2 + ( z i - z ) 2 ) - CentroidAverage ) ) 3 CentroidVariance 3 / 2 - - - ( 5 )
A7、分别由公式(6)、(7)、(8)迭代求得各个采样点与nearest(x,y,z)的平均距离NearestAverage、平均距离的方差NearestVariance、以及平均距离的偏度NearestSkewness;
NearestAverage = Σ i = 1 4 n ( ( x i - x ) 2 + ( y i - y ) 2 + ( z i - z ) 2 ) / ( 4 n ) - - - ( 6 )
NearestVariance = Σ i = 1 4 n ( ( ( x i - x ) 2 + ( y i - y ) 2 + ( z i - z ) 2 ) - NearestAverage ) 2 / ( 4 n ) - - - ( 7 )
NearestSkewness = ( 1 4 n Σ i = 1 4 n ( ( ( x i - x ) 2 + ( y i - y ) 2 + ( z i - z ) 2 ) - NearestAverage ) ) 3 NearestVariance 3 / 2 - - - ( 8 )
A8、分别由公式(9)、(10)、(11)迭代求得各个采样点与farest(x,y,z)的平均距离FarestAverage、平均距离的方差FarestVariance、以及平均距离的偏度FarestSkewness;
FarestAverage = Σ i = 1 4 n ( ( x i - x ) 2 + ( y i - y ) 2 + ( z i - z ) 2 ) / ( 4 n ) - - - ( 9 )
FarestVariance = Σ i = 1 4 n ( ( ( x i - x ) 2 + ( y i - y ) 2 + ( z i - z ) 2 ) - FarestAverage ) 2 / ( 4 n ) - - - ( 10 )
FarestSkewness = ( 1 4 n Σ i = 1 4 n ( ( ( x i - x ) 2 + ( y i - y ) 2 + ( z i - z ) 2 ) - FarestAverage ) ) 3 FarestVariance 3 / 2 - - - ( 11 )
A9、将上述A6,A7,A8步骤之中获得的每个分量组成一个九维向量(12),这个九维向量就代表了当前这个待比较图形对象的特征向量;
FeatureVectorq=(CentroidAverage,CentroidVariance,CentroidSkewness,
NearestAverage,NearestVariance,NearestSkewness,                   (12)
FarestAverage,FarestVariance,FarestSkewness)
A10、从数据库中取一个图形对象,按照步骤A2-A9求得其九维特征向量,FeatureVectori
A11、通过比较步骤A9和A10的九维的向量获得确定性的相似性指标,并进行归一化处理,其取值范围在[0,1]之间,越接近于1代表相似性越高,否则相似性越低;
S = 1 / ( 1 + Σ i = 1 12 | FeatureVector q - FeatureVector i | 12 ) - - - ( 13 )
公式其中的|FeatureVectorq-FeatureVectori|是两个向量之间的曼哈顿距离,S是最后求得的两个图形对象比较的相似性得分;
对查询到的结果按照相似性排列出最相似的查找到的图形对象。
2.如权利要求1所述的一种快速图形相似度判别方法,其特征在于:所述步骤A1中,所述图形对象是二维、三维实体图形或GIS图形,该图形对象能够获得相应数据采集点的坐标。
CN201310677109.4A 2013-12-12 2013-12-12 一种快速图形相似度判别方法 Active CN103778182B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310677109.4A CN103778182B (zh) 2013-12-12 2013-12-12 一种快速图形相似度判别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310677109.4A CN103778182B (zh) 2013-12-12 2013-12-12 一种快速图形相似度判别方法

Publications (2)

Publication Number Publication Date
CN103778182A true CN103778182A (zh) 2014-05-07
CN103778182B CN103778182B (zh) 2017-01-04

Family

ID=50570417

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310677109.4A Active CN103778182B (zh) 2013-12-12 2013-12-12 一种快速图形相似度判别方法

Country Status (1)

Country Link
CN (1) CN103778182B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106096326A (zh) * 2016-06-02 2016-11-09 浙江工业大学 一种基于质心变异策略的差分进化蛋白质结构预测方法
CN110909766A (zh) * 2019-10-29 2020-03-24 北京明略软件系统有限公司 相似度的确定方法及装置、存储介质、电子装置
CN112697987A (zh) * 2020-12-12 2021-04-23 海南海神同洲制药有限公司 仿制药生物等效性预估方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102117412B (zh) * 2009-12-31 2013-03-27 北大方正集团有限公司 图像识别方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
RUIXUAN WANG等: "Visualizing Image Collections Using High-Entropy Layout Distributions", 《IEEE TRANSACTIONS ON MULTIMEDIA》 *
蔡圣燕: "基于判别分析的图形图像分类方法", 《中国印刷与包装研究》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106096326A (zh) * 2016-06-02 2016-11-09 浙江工业大学 一种基于质心变异策略的差分进化蛋白质结构预测方法
CN106096326B (zh) * 2016-06-02 2018-09-07 浙江工业大学 一种基于质心变异策略的差分进化蛋白质结构预测方法
CN110909766A (zh) * 2019-10-29 2020-03-24 北京明略软件系统有限公司 相似度的确定方法及装置、存储介质、电子装置
CN112697987A (zh) * 2020-12-12 2021-04-23 海南海神同洲制药有限公司 仿制药生物等效性预估方法

Also Published As

Publication number Publication date
CN103778182B (zh) 2017-01-04

Similar Documents

Publication Publication Date Title
Jiang et al. Drug–target affinity prediction using graph neural network and contact maps
Yang et al. A novel method for 2D nonrigid partial shape matching
EP2504776B1 (en) Density based clustering for multidimensional data
Liu et al. ProtDet-CCH: protein remote homology detection by combining long short-term memory and ranking methods
CN103577418B (zh) 海量文档分布式检索排重系统和方法
Guo et al. DeepUMQA: ultrafast shape recognition-based protein model quality assessment using deep learning
Huang et al. Improved protein-protein interactions prediction via weighted sparse representation model combining continuous wavelet descriptor and PseAA composition
Zhong et al. Fast object retrieval using direct spatial matching
Zhang et al. Inertial sensors supported visual descriptors encoding and geometric verification for mobile visual location recognition applications
CN105843925A (zh) 一种基于改进bow算法的相似图片搜索方法
CN103778182A (zh) 一种快速图形相似度判别方法
CN116662839A (zh) 基于多维智能采集的关联大数据聚类分析方法及装置
CN109346125B (zh) 一种快速精确的蛋白质绑定口袋结构对齐方法
Sun et al. An energy-efficient stream-based fpga implementation of feature extraction algorithm for lidar point clouds with effective local-search
Chaouch et al. 3D model retrieval based on depth line descriptor
CN107526939B (zh) 一种快速小分子结构对齐方法
Zhu et al. Global and local geometric constrained feature matching for high resolution remote sensing images
Yang et al. Ghost shuffle lightweight pose network with effective feature representation and learning for human pose estimation
CN116308625A (zh) 一种商品匹配方法、装置、电子设备及存储介质
Guo et al. Utilizing the scale-invariant feature transform algorithm to align distance matrices facilitates systematic protein structure comparison
Guyon et al. Assessing 3D scores for protein structure fragment mining
Wang et al. Reconstruction of Protein Backbone with the alpha-Carbon Coordinates.
Hu et al. Interpretable prediction of protein-ligand interaction by convolutional neural network
Daberdaku Identification of protein pockets and cavities by Euclidean Distance Transform
Lu Molecular structure recognition by blob detection

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20140507

Assignee: ZHEJIANG XINJING AIR CONDITIONING EQUIPMENT CO.,LTD.

Assignor: JIANG University OF TECHNOLOGY

Contract record no.: X2023980037342

Denomination of invention: A Fast Method for Distinguishing Graph Similarity

Granted publication date: 20170104

License type: Common License

Record date: 20230703

EE01 Entry into force of recordation of patent licensing contract
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20140507

Assignee: Songyang County Wonderful Advertising Co.,Ltd.

Assignor: JIANG University OF TECHNOLOGY

Contract record no.: X2023980037616

Denomination of invention: A Fast Method for Distinguishing Graph Similarity

Granted publication date: 20170104

License type: Common License

Record date: 20230706

EE01 Entry into force of recordation of patent licensing contract
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20140507

Assignee: Taizhou Printing Co.,Ltd.

Assignor: JIANG University OF TECHNOLOGY

Contract record no.: X2023980038345

Denomination of invention: A Fast Method for Distinguishing Graph Similarity

Granted publication date: 20170104

License type: Common License

Record date: 20230720

Application publication date: 20140507

Assignee: Taizhou Luqiao Hongshi Plastic Factory

Assignor: JIANG University OF TECHNOLOGY

Contract record no.: X2023980038340

Denomination of invention: A Fast Method for Distinguishing Graph Similarity

Granted publication date: 20170104

License type: Common License

Record date: 20230720

EE01 Entry into force of recordation of patent licensing contract
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20140507

Assignee: Huzhou Bodian Network Technology Co.,Ltd.

Assignor: JIANG University OF TECHNOLOGY

Contract record no.: X2023980041703

Denomination of invention: A Fast Method for Distinguishing Graph Similarity

Granted publication date: 20170104

License type: Common License

Record date: 20230914

EE01 Entry into force of recordation of patent licensing contract
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20140507

Assignee: FOSHAN DOUQI TECHNOLOGY Co.,Ltd.

Assignor: JIANG University OF TECHNOLOGY

Contract record no.: X2024980000081

Denomination of invention: A Fast Graph Similarity Discrimination Method

Granted publication date: 20170104

License type: Common License

Record date: 20240104

EE01 Entry into force of recordation of patent licensing contract