CN114723922A - 基于数据降维的三维结构数据对比呈现方法和装置 - Google Patents

基于数据降维的三维结构数据对比呈现方法和装置 Download PDF

Info

Publication number
CN114723922A
CN114723922A CN202210177665.4A CN202210177665A CN114723922A CN 114723922 A CN114723922 A CN 114723922A CN 202210177665 A CN202210177665 A CN 202210177665A CN 114723922 A CN114723922 A CN 114723922A
Authority
CN
China
Prior art keywords
dimensional structure
structure data
original
matrix
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210177665.4A
Other languages
English (en)
Other versions
CN114723922B (zh
Inventor
张林峰
孙伟杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Shenshi Technology Co ltd
Original Assignee
Beijing Shenshi Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Shenshi Technology Co ltd filed Critical Beijing Shenshi Technology Co ltd
Priority to CN202210177665.4A priority Critical patent/CN114723922B/zh
Publication of CN114723922A publication Critical patent/CN114723922A/zh
Application granted granted Critical
Publication of CN114723922B publication Critical patent/CN114723922B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T19/00Manipulating 3D models or images for computer graphics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Computer Graphics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Hardware Design (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Geometry (AREA)
  • Complex Calculations (AREA)

Abstract

本发明公开了一种基于数据降维的三维结构数据对比呈现方法以及装置。该方法包括:根据两个.mol格式的原始三维结构数据,得到两个中心化后的坐标矩阵;根据两个中心化后的坐标矩阵求协方差矩阵,然后对协方差矩阵进行特征值分解以得到多个特征值,然后根据对多个特征值求特征向量以得到特征向量矩阵;选取特征向量矩阵中的最小特征值对应的特征向量,作为最佳偏移方向向量;将两个原始三维结构数据分别按照最佳偏移方向向量偏移,得到偏移后的两组三维结构数据,将该偏移后的两组三维结构数据重写为.mol格式并进行对比呈现。本发明能够解决用户对比查看两个三维结构时,由于空间位置相对重合某些视角结构重叠严重导致信息获取不直观的问题。

Description

基于数据降维的三维结构数据对比呈现方法和装置
技术领域
本发明涉及多维数据分析技术领域,特别地涉及一种的基于数据降维的三维结构数据对比呈现方法、装置、计算机设备和计算机存储介质。
背景技术
有时候两组三维结构数据的相似程度比较高,若按常规方式投射在三维空间中则两组三维点重合程度比较高,不利于用户观察分析和比较。亟需提出一种更好的对比呈现方法和装置。
发明内容
有鉴于此,本发明提出基于数据降维的三维结构数据对比呈现方法、装置、计算机设备和计算机存储介质。
本发明第一方面提出一种基于数据降维的三维结构数据对比呈现方法,包括:根据两个.mol格式的原始三维结构数据,得到两个中心化后的坐标矩阵;根据所述两个中心化后的坐标矩阵求协方差矩阵,然后对所述协方差矩阵进行特征值分解以得到多个特征值,然后根据对多个特征值求特征向量以得到特征向量矩阵;选取所述特征向量矩阵中的最小特征值对应的特征向量,作为最佳偏移方向向量;将所述两个原始三维结构数据之一按照最佳偏移方向向量偏移,得到一组偏移后的三维结构数据和一组未偏移的三维结构数据,将一组偏移后的三维结构数据和一组未偏移的三维结构数据重写为.mol格式并进行对比呈现。
可选地,所述根据两个.mol格式的原始三维结构数据结构文件,得到两个中心化后的坐标矩阵的步骤包括:解析两个.mol格式的原始三维结构数据结构文件得到两组原始三维结构数据,将所述两组原始三维结构数据转换为坐标矩阵后上下合并再进行转置操作,然后进行中心化,以得到所述中心化后的坐标矩阵。
可选地,所述中心化包括零均值化。
可选地,所述对所述协方差矩阵进行特征值分解以得到多个特征值的步骤包括:采用盛金公式对所述协方差矩阵进行特征值分解以得到多个特征值。
本发明第二方面提出一种基于数据降维的三维结构数据对比呈现装置,包括:原始数据处理模块,用于根据两个.mol格式的原始三维结构数据,得到两个中心化后的坐标矩阵;向量矩阵计算模块,用于根据所述两个中心化后的坐标矩阵求协方差矩阵,然后对所述协方差矩阵进行特征值分解以得到多个特征值,然后根据对多个特征值求特征向量以得到特征向量矩阵;偏移方向选取模块,用于选取所述特征向量矩阵中的最小特征值对应的特征向量,作为最佳偏移方向向量;对比呈现模块,用于将所述两个原始三维结构数据分别按照最佳偏移方向向量偏移,得到偏移后的两组三维结构数据,将该偏移后的两组三维结构数据重写为.mol格式并进行对比呈现。
可选地,所述原始数据处理模块还用于:解析两个.mol格式的原始三维结构数据结构文件得到两组原始三维结构数据,将所述两组原始三维结构数据转换为坐标矩阵后上下合并再进行转置操作,然后进行中心化,以得到所述中心化后的坐标矩阵。
可选地,所述中心化包括零均值化。
可选地,所述特征向量矩阵计算模块还用于:采用盛金公式对所述协方差矩阵进行特征值分解以得到多个特征值。
本发明第三方面提出一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现本发明提出的基于数据降维的三维结构数据对比呈现方法。
本发明第四方面提出一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现本发明提出的基于数据降维的三维结构数据对比呈现方法。
本发明的技术方案能够优化三维结构数据对比呈现,不破坏原结构数据,使得原本交叉重叠的两个三维结构尽量平行显示、并且使得有效信息最大化保留,具有简单易行,计算开销小等优点。
附图说明
为了说明而非限制的目的,现在将根据本发明的优选实施例、特别是参考附图来描述本发明,其中:
图1是本发明实施方式的基于数据降维的三维结构数据对比呈现方法的流程示意图;
图2是两个原始三维结构数据的对比呈现的效果示意图;
图3是两个原始三维数据采用本发明实施方式的基于数据降维的三维结构数据对比呈现效果示意图;
图4是本发明实施方式的基于数据降维的三维结构数据对比呈现装置的结构框图。
具体实施方式
本发明旨在提出基于数据降维的三维结构数据对比呈现方法、装置、计算机设备和计算机存储介质。技术方案中基于主成分分析PCA(Principal components analysis)的降维思想。PCA在数据压缩消除冗余和数据噪音消除等领域都有广泛的应用,诸如人脸识别中特征提取、数据挖掘和机器学习、数据可视化等等。PCA的一般流程为:将原始数据按列组成n行m列矩阵;将矩阵进行零均值化;求协方差矩阵;求协方差矩阵的特征值及特征向量;按特征值大小从上到下组成特征向量矩阵;通过特征向量矩阵求出降维数据。
如图1所示,本发明实施方式的基于数据降维的三维结构数据对比呈现方法,主要包括如下步骤A至步骤D。三维结构数据可以是配体的空间建构数据,也可以是其他三维空间结构数据。
步骤A:根据两个.mol格式的原始三维结构数据,得到合并且中心化后的坐标矩阵。
具体过程为:解析两个.mol格式的原始三维结构数据结构文件得到两组原始三维结构数据,将两组原始三维结构数据转换为坐标矩阵后上下合并再进行转置操作,然后进行中心化,以得到中心化后的坐标矩阵。其中,中心化包括零均值化。
步骤B:根据合并且中心化后的坐标矩阵求协方差矩阵,然后对协方差矩阵进行特征值分解以得到多个特征值,然后根据对多个特征值求特征向量以得到特征向量矩阵。
具体过程为:为了将数据从三维降到二维,需要先求出矩阵的协方差矩阵,公式为
Figure BDA0003519540660000041
协方差矩阵的特征方程的解即为该协方差矩阵的特征值。协方差是对两个随机变量联合分布线性相关程度的一种度量。两个随机变量越线性相关,协方差越大,两个变量完全线性无关,协方差为零。计算各维度两两之间的协方差,各协方差组成了一个n*n的矩阵,称为协方差矩阵。公式中的符号定义为:m为数据维度,三维结构数据有x、y、z三类数据,因此数据维度m=3。X为合并且中心化后的坐标矩阵,XT为合并且中心化后的坐标矩阵的转置。
由于步骤B中求得的协方差矩阵必定为3*3的矩阵,所以协方差矩阵的特征方程必定为一元三次方程,可以通过盛金公式求解该一元三次方程,求出的解即为协方差矩阵的特征值。盛金公式主要是在三次方程应用广泛,具有方便记忆,解题直观、准确、高效等优点。最后通过特征值分别求出特征向量,按特征值大小从上到下组成特征向量矩阵。
步骤C:特征向量矩阵中的最小特征值对应的特征向量,为一个原三维结构向该方向偏移后,三维结构相关信息损失最低的方向,即可作为最佳偏移方向向量。
步骤D:将一组原始三维结构数据按照最佳偏移方向向量偏移,得到偏移后的两组三维结构数据,将该偏移后的三维结构数据和另一组未偏移的三维结构数据重写为.mol格式并进行对比呈现。
为使得本领域技术人员更好地理解,下面结合具体实施例进行说明。
例1:
给出较简单的原始的两个三维结构数据分别为:
A:[-14.9816,-16.8848,-26.7516],[-15.4574,-17.737,-25.9019],[-16.1716,-17.2489,-24.8288],
B:[-14.6816,-16.9848,-26.6516],[-15.9574,-17.337,-25.3019],[-16.8716,-17.1489,-24.1288],[-14.4541,-21.5636,-27.4485],
首先将上面两个坐标矩阵拼接成一个7*3的矩阵,并求取x、y、z各坐标均值。
则拼接后的矩阵为:
Figure BDA0003519540660000051
Figure BDA0003519540660000061
x、y、z坐标均值为:[-15.5107,-17.8435,-25.8590]
然后,将矩阵转置,并进行零均值化。转置后并进行零均值化的矩阵为:
[
[0.5291,0.05335,-0.6608,0.8291,-0.4466,-1.3608,1.0566],
[0.9587,0.1065,0.5946,0.8587,0.5065,0.6946,-3.7200],
[-0.8925,-0.0428,1.0302,-0.7925,0.5571,1.7302,-1.5894],
]
接着,求出矩阵的协方差矩阵为:
Figure BDA0003519540660000062
求上述协方差矩阵的特征值,得到特征值为:[0.05613,6.7537,22.6831]
求特征向量。得到特征向量组为:
Figure BDA0003519540660000071
选择最小特征值对应的特征向量作为最佳偏移方向向量
最佳偏移方向向量为:[0.7911,-0.0346,0.6107]。
将A三维结构的坐标组与最佳偏移方向向量的8倍相加,得到偏移结果:
Figure BDA0003519540660000072
例2:
图2是两个原始三维结构数据的对比呈现的效果示意图,两个原始三维结构数据相对重合,无法清晰地比对两个结构;图3是两个原始三维数据采用本发明实施方式的基于数据降维的三维结构数据对比呈现效果示意图,经过本方案处理后,两个三维结构能够清晰地进行比对,并且两结构原子间的对应关系(两结构原子间的细线)也能清晰地体现出来。具体计算过程如下。
原始的两个三维结构数据分别为:
A:
[[24.6259,-7.866,8.7334],[23.1293,-7.4735,8.7996],[22.6954,-7.2418,10.2636],[22.7909,-6.2622,7.8925],[22.8738,-6.6704,6.4078],[22.1358,-5.7635,5.5223],[22.7097,-4.8401,4.7345],[23.9222,-4.6235,4.717],[21.8301,-4.2146,3.9327],[22.213,-3.3267,2.8277],[22.4104,-4.0052,1.4447],[22.5917,-5.5478,1.4779],[22.7233,-6.1364,0.0689],[21.6118,-5.6375,-0.883],[20.2203,-6.2938,-0.6338],[20.267,-7.8196,-0.7218],[20.7636,-8.4333,-1.876],[20.8376,-9.8189,-1.96],[20.4162,-10.596,-0.885],[19.9093,-9.9947,0.2638],[19.8291,-8.6064,0.3467],[19.2197,-5.7414,-1.5474],[19.2948,-4.4043,-1.9782],[18.2818,-3.9371,-2.8121],[18.3185,-2.634,-3.298],[19.3597,-1.7771,-2.9394],[19.4012,-0.358,-3.498],[20.0378,-0.3778,-4.669],[18.1673,0.1037,-3.6958],[20.0405,0.4785,-2.6804],[20.3629,-2.2454,-2.0835],[20.3668,-3.5683,-1.6185],[21.5193,-4.096,-0.7781],[21.3132,-3.6892,0.5792],[25.2164,-7.0222,9.0957],[24.8791,-8.102,7.6993],[24.7724,-8.7444,9.3636],[23.3131,-6.4465,10.6852],[22.8412,-8.1821,10.7957],[21.6388,-6.9691,10.2682],[21.7777,-5.9492,8.1504],[23.4896,-5.4696,8.1738],[23.9213,-6.7484,6.103],[22.4471,-7.664,6.2753],[21.1345,-5.8821,5.4785],[20.8406,-4.3717,4.0498],[21.4512,-2.5521,2.7558],[23.1305,-2.7903,3.0829],[23.3076,-3.5453,1.0209],[23.4743,-5.8116,2.06],[21.7427,-6.0106,1.9842],[23.6925,-5.8493,-0.3403],[22.7443,-7.2239,0.1318],[21.9303,-5.8583,-1.9036],[19.8931,-6.0389,0.3764],[21.0809,-7.8351,-2.716],[21.215,-10.2869,-2.856],[20.4639,-11.6734,-0.953],[19.5757,-10.6055,1.0909],[19.43,-8.1471,1.2402],[18.3103,-6.1752,-1.4489],[17.4654,-4.583,-3.0992],[17.5368,-2.2953,-3.9615],[21.1823,-1.5942,-1.8134],[22.442,-3.6559,-1.1615],[22.5842,-8.2611,8.4647]]
B:
[[15.2899,-4.644,7.5351],[14.2408,-3.9683,6.669],[14.7206,-3.0566,5.5418],[14.8984,-3.7855,4.1902],[15.0728,-5.3257,4.2388],[15.2134,-5.9104,2.8261],[14.0958,-5.4095,1.8827],[12.7022,-6.0636,2.1368],[12.707,-7.5842,2.0907],[12.2595,-8.4762,3.0628],[12.4745,-9.8243,2.7647],[13.0252,-10.0075,1.5129],[13.333,-8.4922,0.7364],[11.6991,-5.5164,1.2216],[11.7868,-4.1856,0.7799],[10.7738,-3.7177,-0.0535],[10.8219,-2.4249,-0.5507],[11.8669,-1.5627,-0.1974],[11.9198,-0.1294,-0.7526],[10.4882,0.3797,-0.9919],[12.6705,-0.093,-2.0912],[12.6599,0.8143,0.2183],[12.858,-2.0372,0.6716],[12.8622,-3.3514,1.1382],[14.0094,-3.8677,1.9934],[13.796,-3.4623,3.3445],[14.6664,-5.2237,8.2169],[15.8523,-3.8448,8.0176],[15.8748,-5.2649,6.8653],[13.711,-4.7018,6.2296],[13.9057,-2.3303,5.5154],[15.6371,-2.5924,5.9],[15.7935,-3.3529,3.7429],[15.9485,-5.5941,4.8268],[14.2142,-5.7907,4.7217],[16.1837,-5.6238,2.4135],[15.2279,-6.9978,2.8763],[14.4053,-5.6215,0.8588],[12.3641,-5.775,3.1321],[11.8117,-8.1486,3.9889],[12.2118,-10.6326,3.4332],[13.265,-10.9429,1.0257],[10.772,-5.8918,1.3809],[9.9477,-4.3525,-0.3357],[10.0337,-2.1012,-1.2145],[10.4127,1.4448,-1.0125],[9.8181,0.07,-0.2204],[10.0518,0.0158,-1.8864],[12.1527,-0.6813,-2.8327],[13.6843,-0.472,-2.0012],[12.756,0.9141,-2.4864],[12.5165,1.8671,-0.0212],[13.7282,0.6208,0.2096],[12.3734,0.6364,1.246],[13.6663,-1.3913,0.9779],[14.9478,-3.414,1.6615],[13.6614,-3.4199,7.2878]]
首先将上面两个坐标矩阵拼接成一个7*3的矩阵,并求取x、y、z各坐标均值。
则拼接后的矩阵为:
[[-14.9816,-16.8848,-26.7516],[-15.4574,-17.737,-25.9019],[-16.1716,-17.2489,-24.8288],[-14.6816,-16.9848,-26.6516],[-15.9574,-17.337,-25.3019],[-16.8716,-17.1489,-24.1288],[-14.4541,-21.5636,-27.4485],]
x、y、z坐标均值为:[13.5741,-4.7251,3.5139]
然后,将矩阵转置,并进行零均值化。转置后并进行零均值化的矩阵为:
[[3.5467,2.0501,1.6162,1.7117,1.7946,1.0566,1.6305,2.843,0.7509,1.1338,1.3312,1.5125,1.6441,0.5326,-0.8589,-0.8122,-0.3156,-0.2416,-0.663,-1.1699,-1.2501,-1.8595,-1.7844,-2.7974,-2.7607,-1.7195,-1.678,-1.0414,-2.9119,-1.0387,-0.7163,-0.7124,0.4401,0.234,4.1372,3.7999,3.6932,2.2339,1.762,0.5596,0.6985,2.4104,2.8421,1.3679,0.0553,-0.2386,0.372,2.0513,2.2284,2.3951,0.6635,2.6133,1.6651,0.8511,-1.1861,0.0017,0.1358,-0.6153,-1.5035,-1.6492,-2.7689,-3.6138,-3.5424,0.1031,1.3628,1.505,1.7158,0.6667,1.1465,1.3243,1.4987,1.6393,0.5217,-0.8719,-0.8671,-1.3146,-1.0996,-0.5489,-0.2411,-1.875,-1.7873,-2.8003,-2.7522,-1.7072,-1.6543,-3.0859,-0.9036,-0.9142,-0.7161,-0.7119,0.4353,0.2219,1.0923,2.2782,2.3007,0.1369,0.3316,2.063,2.2194,2.3744,0.6401,2.6096,1.6538,0.8312,-1.21,-1.7624,-1.3623,-0.3091,-2.8021,-3.6264,-3.5404,-3.1614,-3.756,-3.5223,-1.4214,0.1102,-0.8181,-1.0576,0.1541,-1.2007,0.0922,1.3737,0.0873],[-2.9156,-2.5231,-2.2914,-1.3118,-1.72,-0.8131,0.1103,0.3269,0.7358,1.6237,0.9452,-0.5974,-1.186,-0.6871,-1.3434,-2.8692,-3.4829,-4.8685,-5.6456,-5.0443,-3.656,-0.791,0.5461,1.0133,2.3164,3.1733,4.5924,4.5726,5.0541,5.4289,2.705,1.3821,0.8544,1.2612,-2.0718,-3.1516,-3.794,-1.4961,-3.2317,-2.0187,-0.9988,-0.5192,-1.798,-2.7136,-0.9317,0.5787,2.3983,2.1601,1.4051,-0.8612,-1.0602,-0.8989,-2.2735,-0.9079,-1.0885,-2.8847,-5.3365,-6.723,-5.6551,-3.1967,-1.2248,0.3674,2.6551,3.3562,1.2945,-3.3107,0.0811,0.7568,1.6685,0.9396,-0.6006,-1.1853,-0.6844,-1.3385,-2.8591,-3.7511,-5.0992,-5.2824,-3.7671,-0.7913,0.5395,1.0074,2.3002,3.1624,4.5957,5.1048,4.6321,5.5394,2.6879,1.3737,0.8574,1.2628,-0.4986,0.8803,-0.5398,0.0233,2.3948,2.1327,1.3722,-0.869,-1.0656,-0.8987,-2.2727,-0.8964,-1.0499,-3.4235,-5.9075,-6.2178,-1.1667,0.3726,2.6239,6.1699,4.7951,4.7409,4.0438,4.2531,5.6392,6.5922,5.3459,5.3615,3.3338,1.3111,1.3052],[7.9805,8.0467,9.5107,7.1396,5.6549,4.7694,3.9816,3.9641,3.1798,2.0748,0.6918,0.725,-0.684,-1.6359,-1.3867,-1.4747,-2.6289,-2.7129,-1.6379,-0.4891,-0.4062,-2.3003,-2.7311,-3.565,-4.0509,-3.6923,-4.2509,-5.4219,-4.4487,-3.4333,-2.8364,-2.3714,-1.531,-0.1737,8.3428,6.9464,8.6107,9.9323,10.0428,9.5153,7.3975,7.4209,5.3501,5.5224,4.7256,3.2969,2.0029,2.33,0.268,1.3071,1.2313,-1.0932,-0.6211,-2.6565,-0.3765,-3.4689,-3.6089,-1.7059,0.338,0.4873,-2.2018,-3.8521,-4.7144,-2.5663,-1.9144,7.7118,4.0212,3.1551,2.0279,0.6763,0.7249,-0.6878,-1.6312,-1.3771,-1.4232,-0.4511,-0.7492,-2.001,-2.7775,-2.2923,-2.734,-3.5674,-4.0646,-3.7113,-4.2665,-4.5058,-5.6051,-3.2956,-2.8423,-2.3757,-1.5205,-0.1694,4.703,4.5037,3.3514,2.7157,2.0015,2.3861,0.229,1.3129,1.2078,-1.1004,-0.6376,-2.6551,-0.3818,0.475,-0.0807,-2.4882,-2.133,-3.8496,-4.7284,-4.5264,-3.7343,-5.4003,-6.3466,-5.5151,-6.0003,-3.5351,-3.3043,-2.2679,-2.536,-1.8524,3.7739]]
接着,求出矩阵的协方差矩阵为:
[
[408.6227,-197.7978,631.7830],
[-197.7978,1120.4695,-614.2327],
[631.7830,-614.2327,1949.6222]
]
求上述协方差矩阵的特征值,得到特征值为:
[182.1399,815.3148,2481.2595]
求特征向量。得到特征向量组为:
[
[0.9381,-0.0282,-0.3451],
[0.1718,0.9032,0.3934],
[0.3006,-0.4283,0.8521]
]
选择最小特征值对应的特征向量作为最佳偏移方向向量
最佳偏移方向向量为:[0.9381,-0.0282,-0.3451]。
将A三维结构的坐标组与最佳偏移方向向量的8倍相加,得到偏移结果:
A’:
[[24.6259,-7.866,8.7334],[23.1293,-7.4735,8.7996],[22.6954,-7.2418,10.2636],[22.7909,-6.2622,7.8925],[22.8738,-6.6704,6.4078],[22.1358,-5.7635,5.5223],[22.7097,-4.8401,4.7345],[23.9222,-4.6235,4.717],[21.8301,-4.2146,3.9327],[22.213,-3.3267,2.8277],[22.4104,-4.0052,1.4447],[22.5917,-5.5478,1.4779],[22.7233,-6.1364,0.0689],[21.6118,-5.6375,-0.883],[20.2203,-6.2938,-0.6338],[20.267,-7.8196,-0.7218],[20.7636,-8.4333,-1.876],[20.8376,-9.8189,-1.96],[20.4162,-10.596,-0.885],[19.9093,-9.9947,0.2638],[19.8291,-8.6064,0.3467],[19.2197,-5.7414,-1.5474],[19.2948,-4.4043,-1.9782],[18.2818,-3.9371,-2.8121],[18.3185,-2.634,-3.298],[19.3597,-1.7771,-2.9394],[19.4012,-0.358,-3.498],[20.0378,-0.3778,-4.669],[18.1673,0.1037,-3.6958],[20.0405,0.4785,-2.6804],[20.3629,-2.2454,-2.0835],[20.3668,-3.5683,-1.6185],[21.5193,-4.096,-0.7781],[21.3132,-3.6892,0.5792],[25.2164,-7.0222,9.0957],[24.8791,-8.102,7.6993],[24.7724,-8.7444,9.3636],[23.3131,-6.4465,10.6852],[22.8412,-8.1821,10.7957],[21.6388,-6.9691,10.2682],[21.7777,-5.9492,8.1504],[23.4896,-5.4696,8.1738],[23.9213,-6.7484,6.103],[22.4471,-7.664,6.2753],[21.1345,-5.8821,5.4785],[20.8406,-4.3717,4.0498],[21.4512,-2.5521,2.7558],[23.1305,-2.7903,3.0829],[23.3076,-3.5453,1.0209],[23.4743,-5.8116,2.06],[21.7427,-6.0106,1.9842],[23.6925,-5.8493,-0.3403],[22.7443,-7.2239,0.1318],[21.9303,-5.8583,-1.9036],[19.8931,-6.0389,0.3764],[21.0809,-7.8351,-2.716],[21.215,-10.2869,-2.856],[20.4639,-11.6734,-0.953],[19.5757,-10.6055,1.0909],[19.43,-8.1471,1.2402],[18.3103,-6.1752,-1.4489],[17.4654,-4.583,-3.0992],[17.5368,-2.2953,-3.9615],[21.1823,-1.5942,-1.8134],[22.442,-3.6559,-1.1615],[22.5842,-8.2611,8.4647]]。
然后将A’和B进行对比展示。
本发明实施方式的基于数据降维的三维结构数据对比呈现装置,如图4所示主要包括:原始数据处理模块100、向量矩阵计算模块200、偏移方向选取模块300以及对比呈现模块400。
原始数据处理模块100用于根据两个.mol格式的原始三维结构数据,得到两个中心化后的坐标矩阵。向量矩阵计算模块200用于根据两个中心化后的坐标矩阵求协方差矩阵,然后对协方差矩阵进行特征值分解以得到多个特征值,然后根据对多个特征值求特征向量以得到特征向量矩阵。偏移方向选取模块300用于选取特征向量矩阵中的最小特征值对应的特征向量,作为最佳偏移方向向量。对比呈现模块400用于将两个原始三维结构数据分别按照最佳偏移方向向量偏移,得到偏移后的两组三维结构数据,将该偏移后的两组三维结构数据重写为.mol格式并进行对比呈现。
原始数据处理模块100还用于:解析两个.mol格式的原始三维结构数据结构文件得到两组原始三维结构数据,将两组原始三维结构数据转换为坐标矩阵后上下合并再进行转置操作,然后进行中心化,以得到中心化后的坐标矩阵。其中,中心化包括零均值化。
特征向量矩阵计算模块200中可以采用盛金公式对协方差矩阵进行特征值分解以得到多个特征值。
综上所述,本发明的技术方案能够优化三维结构数据对比呈现,不破坏原结构数据,使得原本交叉重叠的两个三维结构尽量平行显示、并且使得有效信息最大化保留,具有简单易行,计算开销小等优点。
在本申请所提供的实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取非易失性存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个非易失性存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的非易失性存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种基于数据降维的三维结构数据对比呈现方法,其特征在于,包括:
根据两个.mol格式的原始三维结构数据,得到两个中心化后的坐标矩阵;
根据所述两个中心化后的坐标矩阵求协方差矩阵,然后对所述协方差矩阵进行特征值分解以得到多个特征值,然后根据对多个特征值求特征向量以得到特征向量矩阵;
选取所述特征向量矩阵中的最小特征值对应的特征向量,作为最佳偏移方向向量;
将所述两个原始三维结构数据之一按照最佳偏移方向向量偏移,得到一组偏移后的三维结构数据和一组未偏移的三维结构数据,将一组偏移后的三维结构数据和一组未偏移的三维结构数据重写为.mol格式并进行对比呈现。
2.根据权利要求1所述的方法,其特征在于,所述根据两个.mol格式的原始三维结构数据结构文件,得到两个中心化后的坐标矩阵的步骤包括:
解析两个.mol格式的原始三维结构数据结构文件得到两组原始三维结构数据,将所述两组原始三维结构数据转换为坐标矩阵后上下合并再进行转置操作,然后进行中心化,以得到所述中心化后的坐标矩阵。
3.根据权利要求1所述的方法,其特征在于,所述中心化包括零均值化。
4.根据权利要求1所述的方法,其特征在于,所述对所述协方差矩阵进行特征值分解以得到多个特征值的步骤包括:
采用盛金公式对所述协方差矩阵进行特征值分解以得到多个特征值。
5.一种基于数据降维的三维结构数据对比呈现装置,其特征在于,包括:
原始数据处理模块,用于根据两个.mol格式的原始三维结构数据,得到两个中心化后的坐标矩阵;
向量矩阵计算模块,用于根据所述两个中心化后的坐标矩阵求协方差矩阵,然后对所述协方差矩阵进行特征值分解以得到多个特征值,然后根据对多个特征值求特征向量以得到特征向量矩阵;
偏移方向选取模块,用于选取所述特征向量矩阵中的最小特征值对应的特征向量,作为最佳偏移方向向量;
对比呈现模块,用于将所述两个原始三维结构数据分别按照最佳偏移方向向量偏移,得到偏移后的两组三维结构数据,将该偏移后的两组三维结构数据重写为.mol格式并进行对比呈现。
6.根据权利要求5所述的装置,其特征在于,所述原始数据处理模块还用于:解析两个.mol格式的原始三维结构数据结构文件得到两组原始三维结构数据,将所述两组原始三维结构数据转换为坐标矩阵后上下合并再进行转置操作,然后进行中心化,以得到所述中心化后的坐标矩阵。
7.根据权利要求5所述的装置,其特征在于,所述中心化包括零均值化。
8.根据权利要求5所述的装置,其特征在于,所述特征向量矩阵计算模块还用于:采用盛金公式对所述协方差矩阵进行特征值分解以得到多个特征值。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至4中任一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至4中任一项所述的方法。
CN202210177665.4A 2022-02-24 2022-02-24 基于数据降维的三维结构数据对比呈现方法和装置 Active CN114723922B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210177665.4A CN114723922B (zh) 2022-02-24 2022-02-24 基于数据降维的三维结构数据对比呈现方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210177665.4A CN114723922B (zh) 2022-02-24 2022-02-24 基于数据降维的三维结构数据对比呈现方法和装置

Publications (2)

Publication Number Publication Date
CN114723922A true CN114723922A (zh) 2022-07-08
CN114723922B CN114723922B (zh) 2023-04-18

Family

ID=82236484

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210177665.4A Active CN114723922B (zh) 2022-02-24 2022-02-24 基于数据降维的三维结构数据对比呈现方法和装置

Country Status (1)

Country Link
CN (1) CN114723922B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116342903A (zh) * 2023-05-15 2023-06-27 济南安迅科技有限公司 一种基于大数据的用户数据分析方法及分析系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103363961A (zh) * 2013-07-09 2013-10-23 中国人民解放军第三军医大学第三附属医院 基于航拍图像的交通事故场景三维信息测定方法
CN104050483A (zh) * 2014-06-25 2014-09-17 北京大学 一种基于局部正交对齐的特征降维方法
CN107633513A (zh) * 2017-09-18 2018-01-26 天津大学 基于深度学习的3d图像质量的度量方法
CN109212596A (zh) * 2018-07-26 2019-01-15 西安交通大学 一种基于矩阵降维的特征结构相干体快速实现方法
CN109241231A (zh) * 2018-09-07 2019-01-18 武汉中海庭数据技术有限公司 高精度地图数据的预处理装置及方法
CN111242169A (zh) * 2019-12-31 2020-06-05 浙江工业大学 一种基于图片相似度计算的脑纤维视角自动选择方法
WO2020232666A1 (zh) * 2019-05-22 2020-11-26 深圳市大疆创新科技有限公司 一种图像处理方法、终端、系统以及计算机可读存储介质
US11120072B1 (en) * 2020-07-25 2021-09-14 Sas Institute Inc. High dimensional to low dimensional data transformation and visualization system

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103363961A (zh) * 2013-07-09 2013-10-23 中国人民解放军第三军医大学第三附属医院 基于航拍图像的交通事故场景三维信息测定方法
CN104050483A (zh) * 2014-06-25 2014-09-17 北京大学 一种基于局部正交对齐的特征降维方法
CN107633513A (zh) * 2017-09-18 2018-01-26 天津大学 基于深度学习的3d图像质量的度量方法
CN109212596A (zh) * 2018-07-26 2019-01-15 西安交通大学 一种基于矩阵降维的特征结构相干体快速实现方法
CN109241231A (zh) * 2018-09-07 2019-01-18 武汉中海庭数据技术有限公司 高精度地图数据的预处理装置及方法
WO2020232666A1 (zh) * 2019-05-22 2020-11-26 深圳市大疆创新科技有限公司 一种图像处理方法、终端、系统以及计算机可读存储介质
CN111242169A (zh) * 2019-12-31 2020-06-05 浙江工业大学 一种基于图片相似度计算的脑纤维视角自动选择方法
US11120072B1 (en) * 2020-07-25 2021-09-14 Sas Institute Inc. High dimensional to low dimensional data transformation and visualization system

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116342903A (zh) * 2023-05-15 2023-06-27 济南安迅科技有限公司 一种基于大数据的用户数据分析方法及分析系统
CN116342903B (zh) * 2023-05-15 2023-08-18 济南安迅科技有限公司 一种基于大数据的用户数据分析方法及分析系统

Also Published As

Publication number Publication date
CN114723922B (zh) 2023-04-18

Similar Documents

Publication Publication Date Title
Rathi et al. Statistical shape analysis using kernel PCA
Guo et al. Patch-based image inpainting via two-stage low rank approximation
Hartley Lines and points in three views—a unified approach
JP4125786B2 (ja) 疎配列画像の相関付け
RU2429540C2 (ru) Устройство для обработки изображений, способ обработки изображений и считываемый компьютером носитель информации
US6611609B1 (en) Method of tracking changes in a multi-dimensional data structure
Goodall et al. Projective shape analysis
JP2010500677A (ja) 画像処理の方法
Bentolila et al. Conic epipolar constraints from affine correspondences
CN114723922B (zh) 基于数据降维的三维结构数据对比呈现方法和装置
AU2012268846A1 (en) Optimal patch ranking for coordinate transform estimation of microscope images from sparse patch shift estimates
US20070070365A1 (en) Content-based image retrieval based on color difference and gradient information
Yang et al. Image analysis by log-polar Exponent-Fourier moments
US8571255B2 (en) Scalable media fingerprint extraction
US20180144490A1 (en) Method, Apparatus, Storage Medium and Device for Controlled Synthesis of Inhomogeneous Textures
CN109685029B (zh) 复杂空间结构的柔性物体识别方法、装置、设备和介质
US8712159B2 (en) Image descriptor quantization
US7406563B1 (en) Method and apparatus for accessing a striped configuration of disks
JP2005234994A (ja) 類似度判定プログラム、マルチメディアデータ検索プログラム、類似度判定方法、および類似度判定装置
CN112651408B (zh) 一种基于点对变换特征的三维局部表面描述方法和系统
Mosleh et al. Texture image retrieval using contourlet transform
Hsing et al. Dependence estimation and visualization in multivariate extremes with applications to financial data
CN114757822A (zh) 一种基于双目的人体三维关键点检测方法及系统
KR101373397B1 (ko) 증강현실의 호모그래피 정확도 향상을 위한 csp 기반의 ransac 샘플링 방법
CN116503933B (zh) 一种眼周特征提取方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant