CN111241054B - 基于虚拟数据库的电力通信网络异地异构数据源整合方法 - Google Patents
基于虚拟数据库的电力通信网络异地异构数据源整合方法 Download PDFInfo
- Publication number
- CN111241054B CN111241054B CN201911288538.6A CN201911288538A CN111241054B CN 111241054 B CN111241054 B CN 111241054B CN 201911288538 A CN201911288538 A CN 201911288538A CN 111241054 B CN111241054 B CN 111241054B
- Authority
- CN
- China
- Prior art keywords
- heterogeneous data
- virtual database
- data
- heterogeneous
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 53
- 238000004891 communication Methods 0.000 title claims abstract description 14
- 230000010354 integration Effects 0.000 title abstract description 33
- 230000005540 biological transmission Effects 0.000 claims abstract description 26
- 238000013500 data storage Methods 0.000 claims abstract description 22
- 238000009826 distribution Methods 0.000 claims description 18
- 230000006798 recombination Effects 0.000 claims description 17
- 238000005215 recombination Methods 0.000 claims description 17
- 238000000605 extraction Methods 0.000 claims description 11
- 238000007499 fusion processing Methods 0.000 claims description 9
- 230000004927 fusion Effects 0.000 claims description 8
- 239000013598 vector Substances 0.000 claims description 6
- 238000001514 detection method Methods 0.000 claims description 5
- 230000008569 process Effects 0.000 claims description 3
- 238000000611 regression analysis Methods 0.000 claims description 3
- 239000000284 extract Substances 0.000 claims 1
- 238000005065 mining Methods 0.000 abstract description 8
- 230000006870 function Effects 0.000 description 8
- 230000008521 reorganization Effects 0.000 description 6
- 238000010276 construction Methods 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 238000000513 principal component analysis Methods 0.000 description 4
- 238000012300 Sequence Analysis Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000007500 overflow downdraw method Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000000638 solvent extraction Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/211—Schema design and management
- G06F16/212—Schema design and management with details for data modelling support
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及电力通信技术领域,且公开了基于虚拟数据库的电力通信网络异地异构数据源整合方法,包括步骤一、进行传输负载模型及数据存储结构的构建与重组,步骤二、进行异地异构数据源整合优化。该发明构建虚拟数据库异地异构数据的传输负载模型及数据存储结构,用以提取数据存储结构的稀疏性特征;基于挖掘虚拟数据库异地异构数据的属性关联规则特征量,利用特征量融合异地异构数据的模糊信息,建立数据整合模型,实现虚拟数据库异地异构数据源整合。解决了现有的方法中存在时间开销较大、查准率低等问题。
Description
技术领域
本发明涉及电力通信技术领域,具体为基于虚拟数据库的电力通信网络异地异构数据源整合方法。
背景技术
在电力通信网络中,存在大量的异地异构数据,用户通过远程调度和访问方法进行异地异构数据方位和查询。异地异构数据的数据结构复杂,导致数据调用容易出错,开发成本高,其数据源整合也因此成为该领域研究的重点内容。
特征提取方法是一种采用特征提取技术抽取虚拟数据库异地异构数据的平均互信息特征量,结合关联规则挖掘方法进行虚拟数据整合。通过对异地异构数据源的采集,搭建Hive数据仓库,并对异地异构数据源进行分析与整理,最后采用Java开发语言搭建异地异构数据源整合系统,实现异地异构数据源的整合。但上述方法存在时间开销较大、查准率低等问题。
发明内容
本发明主要是提供基于虚拟数据库的电力通信网络异地异构数据源整合方法,解决现有技术中方法存在时间开销较大、查准率低等问题。
为了解决上述技术问题,本发明采用如下技术方案:
基于虚拟数据库的电力通信网络异地异构数据源整合方法,该方法包括以下步骤:
步骤一,进行传输负载模型及数据存储结构的构建与重组;
为实现对虚拟数据库异地异构数据源整合算法的优化设计,需利用虚拟数据库异地异构数据存储节点的分布式结构重组方法,构建异地异构数据的传输负载模型;利用相空间重构方法进行虚拟数据库异地异构数据的特征重构,根据重构特征建立虚拟数据库异地异构存储结构模型。
步骤二,进行异地异构数据源整合优化;
在传输负载模型与数据存储结构的基础上,进行异地异构数据源整合及优化。本节将采用虚拟数据库技术实现数据源整合的过程,该技术的主要内容包括对异地异构数据的稀疏性特征提取,以及数据源整合模型的构建。
使用时,首先需提取异地异构数据源中的数据特征,在对异地异构数据的特征提取基础上,通过挖掘虚拟数据库异地异构数据的有效特征值,构建虚拟数据库异地异构数据的整合模型,实现虚拟数据库异地异构数据源整合。
进一步,其中所述步骤一包括以下子步骤:
A,构建异地异构数据的传输负载模型;
为了在模糊网格区域聚类环境下,得到源组合模式下异地异构数据的边缘特征分布集;
B,存储结构重组;
采用相空间重构方法进行虚拟数据库异地异构数据的特征重构,实现储存结构的重组。
进一步,其中所述步骤二包括以下子步骤:
a,异地异构数据的稀疏性特征提取;
在采用相空间重构方法进行虚拟数据库异地异构数据的数据存储结构重构的基础上,进行异地异构数据源整合方法的优化设计。
b,虚拟数据库异地异构数据源整合。
进一步,所述A步骤包括:
A01,用二元有向图G=(V,E)表示虚拟数据库异地异构数据的图模型结构,其中,V是虚拟数据库的分布节点的顶点集;E是虚拟数据库异地异构数据的有向边集合;
A02,设M1,M2...MN为虚拟数据库异地的Sink存储节点,采用多元回归分析方法提取异地异构数据的相关性统计特征量,得到虚拟数据库的分布式拓扑结构模型;
A03,结合A02中的所述虚拟数据库的分布式拓扑结构模型,获取虚拟数据库异地异构数据检测的测度信息;
A04,在存储网络结构模型中,数据组合模型的有向图向量的加权系数为Ws={w1,w2,…,wk},在虚拟数据库异地异构数据的信息覆盖区域,假设M个传输链路层,统计数据的离散分布形式为x(k-1),....,x(k-M),则虚拟数据库异地异构数据的模糊节点差分xs的估计值:
式(1)中,Ws代表差分系数,基于模糊节点差分的估计值,构建虚拟数据库异地异构数据的传输负载模型:
式(2)中
式(3)中,ω(t)为虚拟节点的数据维数;ph(t)为虚拟数据库异地异构数据Source与Sink储存节点之间的距离;bi为异地异构数据的传输负载损失量。
进一步,所述B步骤包括:
B01,对异地异构数据进行离散融合处理:
式(4)中,TV代表顶点集的融合系数;βV代表数据离散估计参量;adj(a,c)表示重构向量a与c的个数,经式(4)得到异地异构数据的离散融合函数Tr;
B02,利用B01中的所述Tr函数求得异地异构数据分布特征集T0的统计特征量:
T0={T1,T2,...,T0} (5)
其中,对所述特征集T0求解特征量:
根据求得的所述特征量进行特征重组:
βd=(MPDist-d+1)/MPDist,d∈[2,MPDist] (7)
采用特征提取技术在所述特征重组的数据特征中抽取平均互信息特征量,得到虚拟数据库异地异构数据的存储结构重构过程为:
I(Q,S)=H(Q)-H(Q|S) (8)
其中
B03,结合所述平均互信息特征量,采用模糊相关性特征匹配方法进行虚拟数据库异地异构数据的主成分分析,实现数据存储结构重组。
通过对异地异构数据进行离散融合处理,计算密集场景中虚拟数据库异地异构数据分布特征集T0的统计特征量,完成储存结构的重组。
通过虚拟数据库异地异构数据的传输负载模型及数据存储结构的构建与重组,完成虚拟数据库异地异构数据的采集及结构化。在传输负载模型及及数据存储结构的基础上进行数据源的优化整合。
进一步,所述a步骤包括:
a01,根据虚拟数据库异地异构数据的属性挖掘结果进行源组合,得到数据源整合的判决准则满足:
准则(1):
准则(2):
根据所述判决准则,进行所述虚拟数据库异地异构数据的主成分分析,在数据的特征分布属性集中,设{u1,...,uN}代表包含的若干虚拟节点集合的所述数据库异地异构数据的类空间分布集合,{v1,...,vM}代表语义本体节点集合,R=[Ru,v]N×M表示所述虚拟数据库异地异构数据的属性规则集;
a02,结合所述虚拟数据库异地异构数据的特征编码方法进行信息采样,采用分组检测方法,进行所述虚拟数据库异地异构数据的分集调度,推公式如下:
用CIntrai(n)表示所述虚拟数据库异地异构数据访问节点i的最优间隔,CInteri(n)表示竞争节点i的总时隙,得到所述虚拟数据库异地异构数据的分布式重组结构式为:
X(n)={x(n),x(n+τ),···,x(n+(m-1)τ)} n=1,2,···,N (13)
其中,τ表示所述虚拟数据库异地异构数据在高维相空间中的嵌入延迟;
a03,结合所述虚拟数据库异地异构数据的离散融合处理,对数据库中的异地异构数据进行整合处理。
进一步,所述b步骤包括:
b01,设置虚拟数据库异地异构数据特征构成的数据集合X,建立状态转移模型,所述虚拟数据库异地异构数据的特征评价概念集表达式为:
b02,采用云稀疏散乱点结构重组方法,得到第i个所述虚拟数据库异地异构数据的散乱点集为Pi=(pi1,pi2,…piD),其中:
j∈Ni(k),Ni(k)={||xj(k)-xi(k)||<rd(k)} (15)
调整所述虚拟数据库异地异构数据的关联规则项,构建所述虚拟数据库异地异构数据的模糊信息融合模型:
在强干扰下的所述虚拟数据库异地异构数据源整合的边值收敛条件满足如下边界函数为:
b03,采用点云结构网格分区方法进行异地异构数据的稀疏性特征提取和融合处理,建立所述异地异构数据的主成分分析模型,采用非线性统计序列分析方法进行所述虚拟数据库异地异构数据结构重组,得到虚拟数据库异地异构数据源整合模型为:
其中,K=N-(m-1)τ表示的虚拟数据库异地异构数据源整合的嵌入维数,m为虚拟节点和虚拟链路层数,si=(xi,xi+τ,···,xi+(m-1)τ)T是空间分布特征量。
据此,采用相似度融合方法实现对虚拟数据库异地异构数据源整合。
有益效果:该发明构建虚拟数据库异地异构数据的传输负载模型及数据存储结构,用以提取数据存储结构的稀疏性特征;基于挖掘虚拟数据库异地异构数据的属性关联规则特征量,利用特征量融合异地异构数据的模糊信息,建立数据整合模型,实现虚拟数据库异地异构数据源整合。解决了现有的方法中存在时间开销较大、查准率低等问题。
附图说明
图1为本实施例的实施流程示意图;
图2为本实施例的虚拟数据库的分布式拓扑结构模型图;
具体实施方式
以下将结合实施例对本发明涉及的基于虚拟数据库的电力通信网络异地异构数据源整合方法技术方案进一步详细说明。
如图1、图2所示,本实施例的基于虚拟数据库的电力通信网络异地异构数据源整合方法,该方法包括以下步骤:
步骤一,进行传输负载模型及数据存储结构的构建与重组;
为实现对虚拟数据库异地异构数据源整合算法的优化设计,需利用虚拟数据库异地异构数据存储节点的分布式结构重组方法,构建异地异构数据的传输负载模型;利用相空间重构方法进行虚拟数据库异地异构数据的特征重构,根据重构特征建立虚拟数据库异地异构存储结构模型。
步骤二,进行异地异构数据源整合优化;
在传输负载模型与数据存储结构的基础上,进行异地异构数据源整合及优化。本节将采用虚拟数据库技术实现数据源整合的过程,该技术的主要内容包括对异地异构数据的稀疏性特征提取,以及数据源整合模型的构建。
使用时,首先需提取异地异构数据源中的数据特征,在对异地异构数据的特征提取基础上,通过挖掘虚拟数据库异地异构数据的有效特征值,构建虚拟数据库异地异构数据的整合模型,实现虚拟数据库异地异构数据源整合。
进一步,其中所述步骤一包括以下子步骤:
A,构建异地异构数据的传输负载模型;
为了在模糊网格区域聚类环境下,得到源组合模式下异地异构数据的边缘特征分布集;
B,存储结构重组;
采用相空间重构方法进行虚拟数据库异地异构数据的特征重构,实现储存结构的重组。
进一步,其中所述步骤二包括以下子步骤:
a,异地异构数据的稀疏性特征提取;
在采用相空间重构方法进行虚拟数据库异地异构数据的数据存储结构重构的基础上,进行异地异构数据源整合方法的优化设计。
b,虚拟数据库异地异构数据源整合。
进一步,所述A步骤包括:
A01,用二元有向图G=(V,E)表示虚拟数据库异地异构数据的图模型结构,其中,V是虚拟数据库的分布节点的顶点集;E是虚拟数据库异地异构数据的有向边集合;
A02,设M1,M2…MN为虚拟数据库异地的Sink存储节点,采用多元回归分析方法提取异地异构数据的相关性统计特征量,得到虚拟数据库的分布式拓扑结构模型;
A03,结合A02中的所述虚拟数据库的分布式拓扑结构模型,获取虚拟数据库异地异构数据检测的测度信息;
A04,在存储网络结构模型中,数据组合模型的有向图向量的加权系数为Ws={w1,w2,…,wk},在虚拟数据库异地异构数据的信息覆盖区域,假设M个传输链路层,统计数据的离散分布形式为x(k-1),…,x(k-M),则虚拟数据库异地异构数据的模糊节点差分xs的估计值:
式(1)中,Ws代表差分系数,基于模糊节点差分的估计值,构建虚拟数据库异地异构数据的传输负载模型:
式(2)中
式(3)中,ω(t)为虚拟节点的数据维数;ph(t)为虚拟数据库异地异构数据Source与Sink储存节点之间的距离;bi为异地异构数据的传输负载损失量。
进一步,所述B步骤包括:
B01,对异地异构数据进行离散融合处理:
式(4)中,TV代表顶点集的融合系数;βV代表数据离散估计参量;adj(a,c)表示重构向量a与c的个数,经式(4)得到异地异构数据的离散融合函数Tr;
B02,利用B01中的所述Tr函数求得异地异构数据分布特征集T0的统计特征量:
T0={T1,T2,...,T0} (5)
其中,对所述特征集T0求解特征量:
根据求得的所述特征量进行特征重组:
βd=(MPDist-d+1)/MPDist,d∈[2,MPDist] (7)
采用特征提取技术在所述特征重组的数据特征中抽取平均互信息特征量,得到虚拟数据库异地异构数据的存储结构重构过程为:
I(Q,S)=H(Q)-H(Q|S) (8)
其中
B03,结合所述平均互信息特征量,采用模糊相关性特征匹配方法进行虚拟数据库异地异构数据的主成分分析,实现数据存储结构重组。
通过对异地异构数据进行离散融合处理,计算密集场景中虚拟数据库异地异构数据分布特征集T0的统计特征量,完成储存结构的重组。
通过虚拟数据库异地异构数据的传输负载模型及数据存储结构的构建与重组,完成虚拟数据库异地异构数据的采集及结构化。在传输负载模型及及数据存储结构的基础上进行数据源的优化整合。
进一步,所述a步骤包括:
a01,根据虚拟数据库异地异构数据的属性挖掘结果进行源组合,得到数据源整合的判决准则满足:
准则(1):
准则(2):
根据所述判决准则,进行所述虚拟数据库异地异构数据的主成分分析,在数据的特征分布属性集中,设{u1,...,uN}代表包含的若干虚拟节点集合的所述数据库异地异构数据的类空间分布集合,{v1,...,vM}代表语义本体节点集合,R=[Ru,v]N×M表示所述虚拟数据库异地异构数据的属性规则集;
a02,结合所述虚拟数据库异地异构数据的特征编码方法进行信息采样,采用分组检测方法,进行所述虚拟数据库异地异构数据的分集调度,推公式如下:
用CIntrai(n)表示所述虚拟数据库异地异构数据访问节点i的最优间隔,CInteri(n)表示竞争节点i的总时隙,得到所述虚拟数据库异地异构数据的分布式重组结构式为:
X(n)={x(n),x(n+τ),···,x(n+(m-1)τ)} n=1,2,···,N (13)
其中,τ表示所述虚拟数据库异地异构数据在高维相空间中的嵌入延迟;
a03,结合所述虚拟数据库异地异构数据的离散融合处理,对数据库中的异地异构数据进行整合处理。
进一步,所述b步骤包括:
b01,设置虚拟数据库异地异构数据特征构成的数据集合X,建立状态转移模型,所述虚拟数据库异地异构数据的特征评价概念集表达式为:
b02,采用云稀疏散乱点结构重组方法,得到第i个所述虚拟数据库异地异构数据的散乱点集为Pi=(pi1,pi2,…piD),其中:
j∈Ni(k),Ni(k)={||xj(k)-xi(k)||<rd(k)} (15)
调整所述虚拟数据库异地异构数据的关联规则项,构建所述虚拟数据库异地异构数据的模糊信息融合模型:
在强干扰下的所述虚拟数据库异地异构数据源整合的边值收敛条件满足如下边界函数为:
b03,采用点云结构网格分区方法进行异地异构数据的稀疏性特征提取和融合处理,建立所述异地异构数据的主成分分析模型,采用非线性统计序列分析方法进行所述虚拟数据库异地异构数据结构重组,得到虚拟数据库异地异构数据源整合模型为:
其中,K=N-(m-1)τ表示的虚拟数据库异地异构数据源整合的嵌入维数,m为虚拟节点和虚拟链路层数,si=(xi,xi+τ,···,xi+(m-1)τ)T是空间分布特征量。
据此,采用相似度融合方法实现对虚拟数据库异地异构数据源整合。
该发明构建虚拟数据库异地异构数据的传输负载模型及数据存储结构,用以提取数据存储结构的稀疏性特征;基于挖掘虚拟数据库异地异构数据的属性关联规则特征量,利用特征量融合异地异构数据的模糊信息,建立数据整合模型,实现虚拟数据库异地异构数据源整合。解决了现有的方法中存在时间开销较大、查准率低等问题。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
Claims (3)
1.基于虚拟数据库的电力通信网络异地异构数据源整合方法,其特征在于,该方法包括以下步骤:步骤一,进行传输负载模型及数据存储结构的构建与重组;步骤二,进行异地异构数据源整合优化;
所述步骤一包括以下子步骤:
A,构建异地异构数据的传输负载模型;
B,存储结构重组;
所述A步骤包括:
A01,用二元有向图G=(V,E)表示虚拟数据库异地异构数据的图模型结构,其中,V是虚拟数据库的分布节点的顶点集;E是虚拟数据库异地异构数据的有向边集合;
A02,设M1,M2,...,MN为虚拟数据库异地的Sink存储节点,采用多元回归分析方法提取异地异构数据的相关性统计特征量,得到虚拟数据库的分布式拓扑结构模型;
A03,结合A02中的所述虚拟数据库的分布式拓扑结构模型,获取虚拟数据库异地异构数据检测的测度信息;
A04,在存储网络结构模型中,数据组合模型的有向图向量的加权系数为Ws={w1,w2,…,wk},在虚拟数据库异地异构数据的信息覆盖区域,假设M个传输链路层,统计数据的离散分布形式为x(k-1),....,x(k-M),则虚拟数据库异地异构数据的模糊节点差分xs的估计值:
基于模糊节点差分的估计值,构建虚拟数据库异地异构数据的传输负载模型:
其中,
ω(t)为虚拟节点的数据维数;ph(t)为虚拟数据库异地异构数据Source与Sink储存节点之间的距离;bi为异地异构数据的传输负载损失量。
2.根据权利要求1所述的基于虚拟数据库的电力通信网络异地异构数据源整合方法,其特征在于,其中所述步骤二包括以下子步骤:
a,异地异构数据的稀疏性特征提取;
b,虚拟数据库异地异构数据源整合。
3.根据权利要求1所述的基于虚拟数据库的电力通信网络异地异构数据源整合方法,其特征在于,所述B步骤包括:
B01,对异地异构数据进行离散融合处理:
式(4)中,TV代表顶点集的融合系数;βV代表数据离散估计参量;adj(a,c)表示重构向量a与c的个数,经式(4)得到异地异构数据的离散融合函数Tr;
B02,利用B01中的所述Tr函数求得异地异构数据分布特征集T0的统计特征量:T0={T1,T2,…,Tn} (5)
其中,对所述特征集T0求解特征量:
根据求得的所述特征量进行特征重组:
βd=(MPDist-d+1)/MPDist,d∈[2,MPDist] (7)
采用特征提取技术在所述特征重组的数据特征中抽取平均互信息特征量,得到虚拟数据库异地异构数据的存储结构重构过程为:
I(Q,S)=H(Q)-H(Q|S) (8)
其中
B03,结合所述平均互信息特征量,采用模糊相关性特征匹配方法进行虚拟数据库异地异构数据的主成分分析,实现数据存储结构重组;
其中,V是虚拟数据库的分布节点的顶点集,Si是空间分布特征量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911288538.6A CN111241054B (zh) | 2019-12-12 | 2019-12-12 | 基于虚拟数据库的电力通信网络异地异构数据源整合方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911288538.6A CN111241054B (zh) | 2019-12-12 | 2019-12-12 | 基于虚拟数据库的电力通信网络异地异构数据源整合方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111241054A CN111241054A (zh) | 2020-06-05 |
CN111241054B true CN111241054B (zh) | 2023-05-23 |
Family
ID=70877568
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911288538.6A Active CN111241054B (zh) | 2019-12-12 | 2019-12-12 | 基于虚拟数据库的电力通信网络异地异构数据源整合方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111241054B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113110351A (zh) * | 2021-04-28 | 2021-07-13 | 广东省科学院智能制造研究所 | 一种工业生产现场异构状态数据采集系统及方法 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7660805B2 (en) * | 2003-12-23 | 2010-02-09 | Canon Kabushiki Kaisha | Method of generating data servers for heterogeneous data sources |
US8131966B2 (en) * | 2007-04-30 | 2012-03-06 | International Business Machines Corporation | System and method for storage structure reorganization |
CN101546325B (zh) * | 2008-12-23 | 2012-04-18 | 重庆邮电大学 | 基于soa的网格异构数据集成方法 |
CN105224613A (zh) * | 2015-09-17 | 2016-01-06 | 西安未来国际信息股份有限公司 | 基于数据联邦技术的异构数据源整合系统及其整合方法 |
CN106899638B (zh) * | 2015-12-21 | 2021-01-19 | 中国科学院信息工程研究所 | 一种解决数据异构的融合物联网关系统和方法 |
CN107491510A (zh) * | 2017-08-03 | 2017-12-19 | 国网江苏省电力公司信息通信分公司 | 一种混合异构数据源统一查询系统及分布式查询方法 |
CN109766378A (zh) * | 2018-12-26 | 2019-05-17 | 吕杨 | 一种多源异构水利水文数据共享系统 |
CN110272913B (zh) * | 2019-06-12 | 2020-11-03 | 北京大学 | 一种基于索烃化的蛋白质偶联方法 |
-
2019
- 2019-12-12 CN CN201911288538.6A patent/CN111241054B/zh active Active
Non-Patent Citations (1)
Title |
---|
基于虚拟数据库技术的异地异构数据源整合;刘晴 等;《信息技术》;20200117;第44卷(第1期);130-133+139 * |
Also Published As
Publication number | Publication date |
---|---|
CN111241054A (zh) | 2020-06-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105069703B (zh) | 一种电网海量数据管理方法 | |
CN103106279B (zh) | 一种同时基于节点属性以及结构关系相似度的聚类方法 | |
Zhu et al. | Network latency estimation for personal devices: A matrix completion approach | |
CN110348526B (zh) | 一种基于半监督聚类算法的设备类型识别方法和装置 | |
US20060100969A1 (en) | Learning-based method for estimating cost and statistics of complex operators in continuous queries | |
CN102222092A (zh) | 一种MapReduce平台上的海量高维数据聚类方法 | |
CN104462318A (zh) | 一种多网络中相同人名的身份识别方法及装置 | |
CN113900810A (zh) | 分布式图处理方法、系统及存储介质 | |
CN103593435B (zh) | 不确定数据PT‑TopK查询近似处理系统和方法 | |
CN111241054B (zh) | 基于虚拟数据库的电力通信网络异地异构数据源整合方法 | |
CN109492055B (zh) | 一种基于cim模型建立电网大数据仓库的方法 | |
CN102799616A (zh) | 大规模社会网络中的离群点检测方法 | |
CN109903205B (zh) | 一种公开课智能推荐方法以及管理系统 | |
CN107590225A (zh) | 一种基于分布式数据挖掘算法的可视化管理系统 | |
CN104376116A (zh) | 一种人物信息的搜索方法及装置 | |
Chen et al. | Graph neural network-based wind farm cluster speed prediction | |
CN110287237B (zh) | 一种基于社会网络结构分析社团数据挖掘方法 | |
CN112463910A (zh) | 物联网多维度数据融合系统及方法 | |
Chen et al. | An improved incomplete AP clustering algorithm based on K nearest neighbours | |
CN113191656A (zh) | 一种基于数据关联分析的低压配电网设备负荷与拓扑联动方法 | |
CN105868435A (zh) | 一种基于线性相关性分析实现光网络建设的高效控制方法 | |
Ling et al. | Optimization of the distributed K-means clustering algorithm based on set pair analysis | |
CN104331481A (zh) | 基于大规模数据碰撞获取业务模型数据和物理模型数据关系的方法 | |
Ding | Research on generalized optimal regression sampling estimation method in wireless communication technology | |
Zeng et al. | Research on Intrusion Data Mining Algorithm Based on Multiple Minimum Support |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |