CN111241054B - 基于虚拟数据库的电力通信网络异地异构数据源整合方法 - Google Patents

基于虚拟数据库的电力通信网络异地异构数据源整合方法 Download PDF

Info

Publication number
CN111241054B
CN111241054B CN201911288538.6A CN201911288538A CN111241054B CN 111241054 B CN111241054 B CN 111241054B CN 201911288538 A CN201911288538 A CN 201911288538A CN 111241054 B CN111241054 B CN 111241054B
Authority
CN
China
Prior art keywords
heterogeneous data
virtual database
data
heterogeneous
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911288538.6A
Other languages
English (en)
Other versions
CN111241054A (zh
Inventor
刘晴
汤玮
刘旭
金海�
姜海
董武
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guizhou Power Grid Co Ltd
Original Assignee
Guizhou Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guizhou Power Grid Co Ltd filed Critical Guizhou Power Grid Co Ltd
Priority to CN201911288538.6A priority Critical patent/CN111241054B/zh
Publication of CN111241054A publication Critical patent/CN111241054A/zh
Application granted granted Critical
Publication of CN111241054B publication Critical patent/CN111241054B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/211Schema design and management
    • G06F16/212Schema design and management with details for data modelling support
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及电力通信技术领域,且公开了基于虚拟数据库的电力通信网络异地异构数据源整合方法,包括步骤一、进行传输负载模型及数据存储结构的构建与重组,步骤二、进行异地异构数据源整合优化。该发明构建虚拟数据库异地异构数据的传输负载模型及数据存储结构,用以提取数据存储结构的稀疏性特征;基于挖掘虚拟数据库异地异构数据的属性关联规则特征量,利用特征量融合异地异构数据的模糊信息,建立数据整合模型,实现虚拟数据库异地异构数据源整合。解决了现有的方法中存在时间开销较大、查准率低等问题。

Description

基于虚拟数据库的电力通信网络异地异构数据源整合方法
技术领域
本发明涉及电力通信技术领域,具体为基于虚拟数据库的电力通信网络异地异构数据源整合方法。
背景技术
在电力通信网络中,存在大量的异地异构数据,用户通过远程调度和访问方法进行异地异构数据方位和查询。异地异构数据的数据结构复杂,导致数据调用容易出错,开发成本高,其数据源整合也因此成为该领域研究的重点内容。
特征提取方法是一种采用特征提取技术抽取虚拟数据库异地异构数据的平均互信息特征量,结合关联规则挖掘方法进行虚拟数据整合。通过对异地异构数据源的采集,搭建Hive数据仓库,并对异地异构数据源进行分析与整理,最后采用Java开发语言搭建异地异构数据源整合系统,实现异地异构数据源的整合。但上述方法存在时间开销较大、查准率低等问题。
发明内容
本发明主要是提供基于虚拟数据库的电力通信网络异地异构数据源整合方法,解决现有技术中方法存在时间开销较大、查准率低等问题。
为了解决上述技术问题,本发明采用如下技术方案:
基于虚拟数据库的电力通信网络异地异构数据源整合方法,该方法包括以下步骤:
步骤一,进行传输负载模型及数据存储结构的构建与重组;
为实现对虚拟数据库异地异构数据源整合算法的优化设计,需利用虚拟数据库异地异构数据存储节点的分布式结构重组方法,构建异地异构数据的传输负载模型;利用相空间重构方法进行虚拟数据库异地异构数据的特征重构,根据重构特征建立虚拟数据库异地异构存储结构模型。
步骤二,进行异地异构数据源整合优化;
在传输负载模型与数据存储结构的基础上,进行异地异构数据源整合及优化。本节将采用虚拟数据库技术实现数据源整合的过程,该技术的主要内容包括对异地异构数据的稀疏性特征提取,以及数据源整合模型的构建。
使用时,首先需提取异地异构数据源中的数据特征,在对异地异构数据的特征提取基础上,通过挖掘虚拟数据库异地异构数据的有效特征值,构建虚拟数据库异地异构数据的整合模型,实现虚拟数据库异地异构数据源整合。
进一步,其中所述步骤一包括以下子步骤:
A,构建异地异构数据的传输负载模型;
为了在模糊网格区域聚类环境下,得到源组合模式下异地异构数据的边缘特征分布集;
B,存储结构重组;
采用相空间重构方法进行虚拟数据库异地异构数据的特征重构,实现储存结构的重组。
进一步,其中所述步骤二包括以下子步骤:
a,异地异构数据的稀疏性特征提取;
在采用相空间重构方法进行虚拟数据库异地异构数据的数据存储结构重构的基础上,进行异地异构数据源整合方法的优化设计。
b,虚拟数据库异地异构数据源整合。
进一步,所述A步骤包括:
A01,用二元有向图G=(V,E)表示虚拟数据库异地异构数据的图模型结构,其中,V是虚拟数据库的分布节点的顶点集;E是虚拟数据库异地异构数据的有向边集合;
A02,设M1,M2...MN为虚拟数据库异地的Sink存储节点,采用多元回归分析方法提取异地异构数据的相关性统计特征量,得到虚拟数据库的分布式拓扑结构模型;
A03,结合A02中的所述虚拟数据库的分布式拓扑结构模型,获取虚拟数据库异地异构数据检测的测度信息;
A04,在存储网络结构模型中,数据组合模型的有向图向量的加权系数为Ws={w1,w2,…,wk},在虚拟数据库异地异构数据的信息覆盖区域,假设M个传输链路层,统计数据的离散分布形式为x(k-1),....,x(k-M),则虚拟数据库异地异构数据的模糊节点差分xs的估计值:
Figure GDA0002448198090000031
式(1)中,Ws代表差分系数,基于模糊节点差分的估计值,构建虚拟数据库异地异构数据的传输负载模型:
Figure GDA0002448198090000032
式(2)中
Figure GDA0002448198090000033
式(3)中,ω(t)为虚拟节点的数据维数;ph(t)为虚拟数据库异地异构数据Source与Sink储存节点之间的距离;bi为异地异构数据的传输负载损失量。
进一步,所述B步骤包括:
B01,对异地异构数据进行离散融合处理:
Figure GDA0002448198090000041
式(4)中,TV代表顶点集的融合系数;βV代表数据离散估计参量;adj(a,c)表示重构向量a与c的个数,经式(4)得到异地异构数据的离散融合函数Tr
B02,利用B01中的所述Tr函数求得异地异构数据分布特征集T0的统计特征量:
T0={T1,T2,...,T0} (5)
其中,对所述特征集T0求解特征量:
Figure GDA0002448198090000042
根据求得的所述特征量进行特征重组:
βd=(MPDist-d+1)/MPDist,d∈[2,MPDist] (7)
采用特征提取技术在所述特征重组的数据特征中抽取平均互信息特征量,得到虚拟数据库异地异构数据的存储结构重构过程为:
I(Q,S)=H(Q)-H(Q|S) (8)
其中
Figure GDA0002448198090000043
B03,结合所述平均互信息特征量,采用模糊相关性特征匹配方法进行虚拟数据库异地异构数据的主成分分析,实现数据存储结构重组。
通过对异地异构数据进行离散融合处理,计算密集场景中虚拟数据库异地异构数据分布特征集T0的统计特征量,完成储存结构的重组。
通过虚拟数据库异地异构数据的传输负载模型及数据存储结构的构建与重组,完成虚拟数据库异地异构数据的采集及结构化。在传输负载模型及及数据存储结构的基础上进行数据源的优化整合。
进一步,所述a步骤包括:
a01,根据虚拟数据库异地异构数据的属性挖掘结果进行源组合,得到数据源整合的判决准则满足:
准则(1):
Figure GDA0002448198090000051
准则(2):
Figure GDA0002448198090000052
根据所述判决准则,进行所述虚拟数据库异地异构数据的主成分分析,在数据的特征分布属性集中,设{u1,...,uN}代表包含的若干虚拟节点集合的所述数据库异地异构数据的类空间分布集合,{v1,...,vM}代表语义本体节点集合,R=[Ru,v]N×M表示所述虚拟数据库异地异构数据的属性规则集;
a02,结合所述虚拟数据库异地异构数据的特征编码方法进行信息采样,采用分组检测方法,进行所述虚拟数据库异地异构数据的分集调度,推公式如下:
Figure GDA0002448198090000053
用CIntrai(n)表示所述虚拟数据库异地异构数据访问节点i的最优间隔,CInteri(n)表示竞争节点i的总时隙,得到所述虚拟数据库异地异构数据的分布式重组结构式为:
X(n)={x(n),x(n+τ),···,x(n+(m-1)τ)} n=1,2,···,N (13)
其中,τ表示所述虚拟数据库异地异构数据在高维相空间中的嵌入延迟;
a03,结合所述虚拟数据库异地异构数据的离散融合处理,对数据库中的异地异构数据进行整合处理。
进一步,所述b步骤包括:
b01,设置虚拟数据库异地异构数据特征构成的数据集合X,建立状态转移模型,所述虚拟数据库异地异构数据的特征评价概念集表达式为:
Figure GDA0002448198090000061
挖掘所述虚拟数据库异地异构数据的属性关联规则为:
Figure GDA0002448198090000062
特征量表示为:
Figure GDA0002448198090000063
b02,采用云稀疏散乱点结构重组方法,得到第i个所述虚拟数据库异地异构数据的散乱点集为Pi=(pi1,pi2,…piD),其中:
j∈Ni(k),Ni(k)={||xj(k)-xi(k)||<rd(k)} (15)
调整所述虚拟数据库异地异构数据的关联规则项,构建所述虚拟数据库异地异构数据的模糊信息融合模型:
Figure GDA0002448198090000064
在强干扰下的所述虚拟数据库异地异构数据源整合的边值收敛条件满足如下边界函数为:
Figure GDA0002448198090000065
Figure GDA0002448198090000066
b03,采用点云结构网格分区方法进行异地异构数据的稀疏性特征提取和融合处理,建立所述异地异构数据的主成分分析模型,采用非线性统计序列分析方法进行所述虚拟数据库异地异构数据结构重组,得到虚拟数据库异地异构数据源整合模型为:
Figure GDA0002448198090000071
其中,K=N-(m-1)τ表示的虚拟数据库异地异构数据源整合的嵌入维数,m为虚拟节点和虚拟链路层数,si=(xi,xi+τ,···,xi+(m-1)τ)T是空间分布特征量。
据此,采用相似度融合方法实现对虚拟数据库异地异构数据源整合。
有益效果:该发明构建虚拟数据库异地异构数据的传输负载模型及数据存储结构,用以提取数据存储结构的稀疏性特征;基于挖掘虚拟数据库异地异构数据的属性关联规则特征量,利用特征量融合异地异构数据的模糊信息,建立数据整合模型,实现虚拟数据库异地异构数据源整合。解决了现有的方法中存在时间开销较大、查准率低等问题。
附图说明
图1为本实施例的实施流程示意图;
图2为本实施例的虚拟数据库的分布式拓扑结构模型图;
具体实施方式
以下将结合实施例对本发明涉及的基于虚拟数据库的电力通信网络异地异构数据源整合方法技术方案进一步详细说明。
如图1、图2所示,本实施例的基于虚拟数据库的电力通信网络异地异构数据源整合方法,该方法包括以下步骤:
步骤一,进行传输负载模型及数据存储结构的构建与重组;
为实现对虚拟数据库异地异构数据源整合算法的优化设计,需利用虚拟数据库异地异构数据存储节点的分布式结构重组方法,构建异地异构数据的传输负载模型;利用相空间重构方法进行虚拟数据库异地异构数据的特征重构,根据重构特征建立虚拟数据库异地异构存储结构模型。
步骤二,进行异地异构数据源整合优化;
在传输负载模型与数据存储结构的基础上,进行异地异构数据源整合及优化。本节将采用虚拟数据库技术实现数据源整合的过程,该技术的主要内容包括对异地异构数据的稀疏性特征提取,以及数据源整合模型的构建。
使用时,首先需提取异地异构数据源中的数据特征,在对异地异构数据的特征提取基础上,通过挖掘虚拟数据库异地异构数据的有效特征值,构建虚拟数据库异地异构数据的整合模型,实现虚拟数据库异地异构数据源整合。
进一步,其中所述步骤一包括以下子步骤:
A,构建异地异构数据的传输负载模型;
为了在模糊网格区域聚类环境下,得到源组合模式下异地异构数据的边缘特征分布集;
B,存储结构重组;
采用相空间重构方法进行虚拟数据库异地异构数据的特征重构,实现储存结构的重组。
进一步,其中所述步骤二包括以下子步骤:
a,异地异构数据的稀疏性特征提取;
在采用相空间重构方法进行虚拟数据库异地异构数据的数据存储结构重构的基础上,进行异地异构数据源整合方法的优化设计。
b,虚拟数据库异地异构数据源整合。
进一步,所述A步骤包括:
A01,用二元有向图G=(V,E)表示虚拟数据库异地异构数据的图模型结构,其中,V是虚拟数据库的分布节点的顶点集;E是虚拟数据库异地异构数据的有向边集合;
A02,设M1,M2…MN为虚拟数据库异地的Sink存储节点,采用多元回归分析方法提取异地异构数据的相关性统计特征量,得到虚拟数据库的分布式拓扑结构模型;
A03,结合A02中的所述虚拟数据库的分布式拓扑结构模型,获取虚拟数据库异地异构数据检测的测度信息;
A04,在存储网络结构模型中,数据组合模型的有向图向量的加权系数为Ws={w1,w2,…,wk},在虚拟数据库异地异构数据的信息覆盖区域,假设M个传输链路层,统计数据的离散分布形式为x(k-1),…,x(k-M),则虚拟数据库异地异构数据的模糊节点差分xs的估计值:
Figure GDA0002448198090000091
式(1)中,Ws代表差分系数,基于模糊节点差分的估计值,构建虚拟数据库异地异构数据的传输负载模型:
Figure GDA0002448198090000092
式(2)中
Figure GDA0002448198090000093
式(3)中,ω(t)为虚拟节点的数据维数;ph(t)为虚拟数据库异地异构数据Source与Sink储存节点之间的距离;bi为异地异构数据的传输负载损失量。
进一步,所述B步骤包括:
B01,对异地异构数据进行离散融合处理:
Figure GDA0002448198090000101
式(4)中,TV代表顶点集的融合系数;βV代表数据离散估计参量;adj(a,c)表示重构向量a与c的个数,经式(4)得到异地异构数据的离散融合函数Tr
B02,利用B01中的所述Tr函数求得异地异构数据分布特征集T0的统计特征量:
T0={T1,T2,...,T0} (5)
其中,对所述特征集T0求解特征量:
Figure GDA0002448198090000102
根据求得的所述特征量进行特征重组:
βd=(MPDist-d+1)/MPDist,d∈[2,MPDist] (7)
采用特征提取技术在所述特征重组的数据特征中抽取平均互信息特征量,得到虚拟数据库异地异构数据的存储结构重构过程为:
I(Q,S)=H(Q)-H(Q|S) (8)
其中
Figure GDA0002448198090000103
B03,结合所述平均互信息特征量,采用模糊相关性特征匹配方法进行虚拟数据库异地异构数据的主成分分析,实现数据存储结构重组。
通过对异地异构数据进行离散融合处理,计算密集场景中虚拟数据库异地异构数据分布特征集T0的统计特征量,完成储存结构的重组。
通过虚拟数据库异地异构数据的传输负载模型及数据存储结构的构建与重组,完成虚拟数据库异地异构数据的采集及结构化。在传输负载模型及及数据存储结构的基础上进行数据源的优化整合。
进一步,所述a步骤包括:
a01,根据虚拟数据库异地异构数据的属性挖掘结果进行源组合,得到数据源整合的判决准则满足:
准则(1):
Figure GDA0002448198090000111
准则(2):
Figure GDA0002448198090000112
根据所述判决准则,进行所述虚拟数据库异地异构数据的主成分分析,在数据的特征分布属性集中,设{u1,...,uN}代表包含的若干虚拟节点集合的所述数据库异地异构数据的类空间分布集合,{v1,...,vM}代表语义本体节点集合,R=[Ru,v]N×M表示所述虚拟数据库异地异构数据的属性规则集;
a02,结合所述虚拟数据库异地异构数据的特征编码方法进行信息采样,采用分组检测方法,进行所述虚拟数据库异地异构数据的分集调度,推公式如下:
Figure GDA0002448198090000113
用CIntrai(n)表示所述虚拟数据库异地异构数据访问节点i的最优间隔,CInteri(n)表示竞争节点i的总时隙,得到所述虚拟数据库异地异构数据的分布式重组结构式为:
X(n)={x(n),x(n+τ),···,x(n+(m-1)τ)} n=1,2,···,N (13)
其中,τ表示所述虚拟数据库异地异构数据在高维相空间中的嵌入延迟;
a03,结合所述虚拟数据库异地异构数据的离散融合处理,对数据库中的异地异构数据进行整合处理。
进一步,所述b步骤包括:
b01,设置虚拟数据库异地异构数据特征构成的数据集合X,建立状态转移模型,所述虚拟数据库异地异构数据的特征评价概念集表达式为:
Figure GDA0002448198090000121
挖掘所述虚拟数据库异地异构数据的属性关联规则为:
Figure GDA0002448198090000122
特征量表示为:
Figure GDA0002448198090000123
b02,采用云稀疏散乱点结构重组方法,得到第i个所述虚拟数据库异地异构数据的散乱点集为Pi=(pi1,pi2,…piD),其中:
j∈Ni(k),Ni(k)={||xj(k)-xi(k)||<rd(k)} (15)
调整所述虚拟数据库异地异构数据的关联规则项,构建所述虚拟数据库异地异构数据的模糊信息融合模型:
Figure GDA0002448198090000124
在强干扰下的所述虚拟数据库异地异构数据源整合的边值收敛条件满足如下边界函数为:
Figure GDA0002448198090000125
Figure GDA0002448198090000126
b03,采用点云结构网格分区方法进行异地异构数据的稀疏性特征提取和融合处理,建立所述异地异构数据的主成分分析模型,采用非线性统计序列分析方法进行所述虚拟数据库异地异构数据结构重组,得到虚拟数据库异地异构数据源整合模型为:
Figure GDA0002448198090000131
其中,K=N-(m-1)τ表示的虚拟数据库异地异构数据源整合的嵌入维数,m为虚拟节点和虚拟链路层数,si=(xi,xi+τ,···,xi+(m-1)τ)T是空间分布特征量。
据此,采用相似度融合方法实现对虚拟数据库异地异构数据源整合。
该发明构建虚拟数据库异地异构数据的传输负载模型及数据存储结构,用以提取数据存储结构的稀疏性特征;基于挖掘虚拟数据库异地异构数据的属性关联规则特征量,利用特征量融合异地异构数据的模糊信息,建立数据整合模型,实现虚拟数据库异地异构数据源整合。解决了现有的方法中存在时间开销较大、查准率低等问题。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (3)

1.基于虚拟数据库的电力通信网络异地异构数据源整合方法,其特征在于,该方法包括以下步骤:步骤一,进行传输负载模型及数据存储结构的构建与重组;步骤二,进行异地异构数据源整合优化;
所述步骤一包括以下子步骤:
A,构建异地异构数据的传输负载模型;
B,存储结构重组;
所述A步骤包括:
A01,用二元有向图G=(V,E)表示虚拟数据库异地异构数据的图模型结构,其中,V是虚拟数据库的分布节点的顶点集;E是虚拟数据库异地异构数据的有向边集合;
A02,设M1,M2,...,MN为虚拟数据库异地的Sink存储节点,采用多元回归分析方法提取异地异构数据的相关性统计特征量,得到虚拟数据库的分布式拓扑结构模型;
A03,结合A02中的所述虚拟数据库的分布式拓扑结构模型,获取虚拟数据库异地异构数据检测的测度信息;
A04,在存储网络结构模型中,数据组合模型的有向图向量的加权系数为Ws={w1,w2,…,wk},在虚拟数据库异地异构数据的信息覆盖区域,假设M个传输链路层,统计数据的离散分布形式为x(k-1),....,x(k-M),则虚拟数据库异地异构数据的模糊节点差分xs的估计值:
Figure QLYQS_1
基于模糊节点差分的估计值,构建虚拟数据库异地异构数据的传输负载模型:
Figure QLYQS_2
其中,
Figure QLYQS_3
ω(t)为虚拟节点的数据维数;ph(t)为虚拟数据库异地异构数据Source与Sink储存节点之间的距离;bi为异地异构数据的传输负载损失量。
2.根据权利要求1所述的基于虚拟数据库的电力通信网络异地异构数据源整合方法,其特征在于,其中所述步骤二包括以下子步骤:
a,异地异构数据的稀疏性特征提取;
b,虚拟数据库异地异构数据源整合。
3.根据权利要求1所述的基于虚拟数据库的电力通信网络异地异构数据源整合方法,其特征在于,所述B步骤包括:
B01,对异地异构数据进行离散融合处理:
Figure QLYQS_4
式(4)中,TV代表顶点集的融合系数;βV代表数据离散估计参量;adj(a,c)表示重构向量a与c的个数,经式(4)得到异地异构数据的离散融合函数Tr
B02,利用B01中的所述Tr函数求得异地异构数据分布特征集T0的统计特征量:T0={T1,T2,…,Tn} (5)
其中,对所述特征集T0求解特征量:
Figure QLYQS_5
根据求得的所述特征量进行特征重组:
βd=(MPDist-d+1)/MPDist,d∈[2,MPDist] (7)
采用特征提取技术在所述特征重组的数据特征中抽取平均互信息特征量,得到虚拟数据库异地异构数据的存储结构重构过程为:
I(Q,S)=H(Q)-H(Q|S) (8)
其中
Figure QLYQS_6
B03,结合所述平均互信息特征量,采用模糊相关性特征匹配方法进行虚拟数据库异地异构数据的主成分分析,实现数据存储结构重组;
其中,V是虚拟数据库的分布节点的顶点集,Si是空间分布特征量。
CN201911288538.6A 2019-12-12 2019-12-12 基于虚拟数据库的电力通信网络异地异构数据源整合方法 Active CN111241054B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911288538.6A CN111241054B (zh) 2019-12-12 2019-12-12 基于虚拟数据库的电力通信网络异地异构数据源整合方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911288538.6A CN111241054B (zh) 2019-12-12 2019-12-12 基于虚拟数据库的电力通信网络异地异构数据源整合方法

Publications (2)

Publication Number Publication Date
CN111241054A CN111241054A (zh) 2020-06-05
CN111241054B true CN111241054B (zh) 2023-05-23

Family

ID=70877568

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911288538.6A Active CN111241054B (zh) 2019-12-12 2019-12-12 基于虚拟数据库的电力通信网络异地异构数据源整合方法

Country Status (1)

Country Link
CN (1) CN111241054B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113110351A (zh) * 2021-04-28 2021-07-13 广东省科学院智能制造研究所 一种工业生产现场异构状态数据采集系统及方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7660805B2 (en) * 2003-12-23 2010-02-09 Canon Kabushiki Kaisha Method of generating data servers for heterogeneous data sources
US8131966B2 (en) * 2007-04-30 2012-03-06 International Business Machines Corporation System and method for storage structure reorganization
CN101546325B (zh) * 2008-12-23 2012-04-18 重庆邮电大学 基于soa的网格异构数据集成方法
CN105224613A (zh) * 2015-09-17 2016-01-06 西安未来国际信息股份有限公司 基于数据联邦技术的异构数据源整合系统及其整合方法
CN106899638B (zh) * 2015-12-21 2021-01-19 中国科学院信息工程研究所 一种解决数据异构的融合物联网关系统和方法
CN107491510A (zh) * 2017-08-03 2017-12-19 国网江苏省电力公司信息通信分公司 一种混合异构数据源统一查询系统及分布式查询方法
CN109766378A (zh) * 2018-12-26 2019-05-17 吕杨 一种多源异构水利水文数据共享系统
CN110272913B (zh) * 2019-06-12 2020-11-03 北京大学 一种基于索烃化的蛋白质偶联方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于虚拟数据库技术的异地异构数据源整合;刘晴 等;《信息技术》;20200117;第44卷(第1期);130-133+139 *

Also Published As

Publication number Publication date
CN111241054A (zh) 2020-06-05

Similar Documents

Publication Publication Date Title
CN105069703B (zh) 一种电网海量数据管理方法
CN103106279B (zh) 一种同时基于节点属性以及结构关系相似度的聚类方法
Zhu et al. Network latency estimation for personal devices: A matrix completion approach
CN110348526B (zh) 一种基于半监督聚类算法的设备类型识别方法和装置
US20060100969A1 (en) Learning-based method for estimating cost and statistics of complex operators in continuous queries
CN102222092A (zh) 一种MapReduce平台上的海量高维数据聚类方法
CN104462318A (zh) 一种多网络中相同人名的身份识别方法及装置
CN113900810A (zh) 分布式图处理方法、系统及存储介质
CN103593435B (zh) 不确定数据PT‑TopK查询近似处理系统和方法
CN111241054B (zh) 基于虚拟数据库的电力通信网络异地异构数据源整合方法
CN109492055B (zh) 一种基于cim模型建立电网大数据仓库的方法
CN102799616A (zh) 大规模社会网络中的离群点检测方法
CN109903205B (zh) 一种公开课智能推荐方法以及管理系统
CN107590225A (zh) 一种基于分布式数据挖掘算法的可视化管理系统
CN104376116A (zh) 一种人物信息的搜索方法及装置
Chen et al. Graph neural network-based wind farm cluster speed prediction
CN110287237B (zh) 一种基于社会网络结构分析社团数据挖掘方法
CN112463910A (zh) 物联网多维度数据融合系统及方法
Chen et al. An improved incomplete AP clustering algorithm based on K nearest neighbours
CN113191656A (zh) 一种基于数据关联分析的低压配电网设备负荷与拓扑联动方法
CN105868435A (zh) 一种基于线性相关性分析实现光网络建设的高效控制方法
Ling et al. Optimization of the distributed K-means clustering algorithm based on set pair analysis
CN104331481A (zh) 基于大规模数据碰撞获取业务模型数据和物理模型数据关系的方法
Ding Research on generalized optimal regression sampling estimation method in wireless communication technology
Zeng et al. Research on Intrusion Data Mining Algorithm Based on Multiple Minimum Support

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant