CN110289986B - 一种网络仿真数据的准确性量化方法 - Google Patents
一种网络仿真数据的准确性量化方法 Download PDFInfo
- Publication number
- CN110289986B CN110289986B CN201910444133.0A CN201910444133A CN110289986B CN 110289986 B CN110289986 B CN 110289986B CN 201910444133 A CN201910444133 A CN 201910444133A CN 110289986 B CN110289986 B CN 110289986B
- Authority
- CN
- China
- Prior art keywords
- data
- network simulation
- value
- mrlt
- complex
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/10—Geometric CAD
- G06F30/18—Network design, e.g. design based on topological or interconnect aspects of utility systems, piping, heating ventilation air conditioning [HVAC] or cabling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/145—Network analysis or design involving simulating, designing, planning or modelling of a network
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Geometry (AREA)
- General Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Computer Hardware Design (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computational Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Signal Processing (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种网络仿真数据的准确性量化方法,本发明详细介绍了数据的拓扑性质的近似估计方法,并在拓扑性质估计的基础上提出了不同数据的拓扑性质相似度的计算方法,通过计算仿真模型数据和参考数据的拓扑空间性质的相似程度来度量数据之间的相似性,同时提供了定量的度量指标可以直接比较不同的模型数据和参考数据之间的相似程度的大小,可用于网络仿真可信度的评估。
Description
技术领域
本发明属于网络仿真技术领域,尤其涉及一种网络仿真可信度评估中对仿真数据的准确性进行量化的方法。
背景技术
网络仿真是目前研究网络系统设计规划运行的有效手段,通过建立网络通信设备组件、传播环境、链路以及协议的模型,并且通过提供的相关的流量模型仿真模拟业务流量在网络中的传输,从而获取网络研究设计或网络模型优化所需的网络性能相关的指标数据。
网络仿真是基于相似性原理,所以仿真系统模型是否可信,最直接的方法是通过考察仿真模型的输出响应变量和系统状态变量的观测值与实际参考系统的输出响应变量和系统状态变量的观测值之间的偏差是否大到掩盖了仿真模型的有用性,即需要度量仿真数据与参考数据之间是否有足够的相似程度。所以仿真数据与参考数据的相似性的度量是进行仿真输出数据的准确性分析的重要内容。
目前针对相似度的度量方法研究,常用的有基于距离的度量方法,如编辑距离、欧式距离、动态时间弯曲距离以及灰色关联分析的空间距离等。但当数据扩展到多输出的高维数据之间的相似度度量时纯粹的基于距离的度量则区分程度不敏感。对于网络仿真研究中通过仿真模型生成的数据,假设其生成数据的分布为pmodel(X),则同样地参考数据的分布为pdata(X)。根据流形假设的理论:实际的支撑数据生成的分布pdata(X)是一个在欧式空间的低维流形Mdata,且该流形是一个非线性的复杂的难以显示描述的空间结构。则同样的通过仿真生成模型生成的数据也有一个固有的流形为Mmodel。因此基于此假设,如果仿真模型足够好的话,其生成数据的流形空间和参考数据的流形空间应该是很接近的,即流形空间的拓扑性质是相似的,拓扑空间是指数据点在一定的度量空间下点与点之间构成的抽象的空间结构,是对数据内部的关系进行的全局客观的度量,所以提出了基于拓扑数据分析的相似性度量方法。
发明内容
目前针对相似度的度量方法研究,常用的有基于距离的度量方法,如编辑距离、欧式距离、动态时间弯曲距离以及灰色关联分析的空间距离等。但当数据扩展到多输出的高维数据之间的相似度度量时纯粹的基于距离的度量则区分程度不敏感。为了解决现有技术中存在的问题,本发明提供了一种网络仿真数据的准确性量化方法。
本发明所采用的技术方案是:一种网络仿真数据的准确性量化方法,其特征在于,包括以下步骤:
步骤1:假定网络仿真数据集为X,从中随机选择L个标定点,然后计算所选标定点与网络仿真数据集X的成对距离,并通过矩阵形式保存;
步骤2:通过默认设定的γ值与所选标定点之间成对距离的最大值相乘计算出持续性参数α的最大值αmax;
步骤3:利用步骤1中所选标定点与网络仿真数据集X的成对距离和2计算得到的参数αmax,以及witness复形进行拓扑近似,复形的最大维度设为k,然后利用得到的复形族计算在维度为k时的持续性区间;
步骤4:通过式(1)计算相对生成时间RTL(i,k,X,L);
其中,βk(α)表示k维“环”的贝蒂系数,i表示环的个数,k表示环的维度,μ表示在α的整个变化区间内,βk(α)=i的区间的长度;
对于一个固定值的α,k维“环”的贝蒂系数为包含α的持续性区间的数量,相应的值函数为式(2);
βk(α)=|{[bi,di]∈Ik:α∈[bi,di]}| (2)
其中,bi和di表示有i个环时α区间的端点,Ik表示k维“环”的α总区间。
步骤5:进行若干次的随机选择标定点之后计算出若干个相对生成时间,根据式(3)计算平均相对生成时间:
MRLT(i,k,X)=EL[RLT(i,k,X,L)] (3)
同时有:
∑iMRLT(i,k,X)=1 (4)
步骤6:计算两个数据集的MRLT的JS散度来表示两个数据集之间拓扑性质的相似程度:
TopSimScore(Xdata,Xmodel)=JS(MRLTdata||MRLTmodel) (5)
其中,Xdata表示参考数据集,Xmodel表示网络仿真数据集,MRLTdata表示参考数据集的平均相对生成时间,MRLTmodel表示网络仿真数据集的平均相对生成时间,P(x)和Q(x)分别表示两个数据集,KL散度(Kullback–Leibler divergence),称为相对熵是用于描述两个概率分布P(x)和Q(x)的差异。
JS散度的值域为[0,1],值越低表示越接近,即相同为0,反之越不同值越接近1,同时具有对称性。由JS散度值即可判断网络仿真数据和参考数据的相似性。
对于网络仿真研究通过仿真模型生成的数据假设其生成数据的分布为pmodel(X),则同样地参考数据的分布为pdata(X)。根据流形假设的理论“实际的支撑数据生成的分布pdata(X)是一个在欧式空间的低维流形Mdata,且该流形是一个非线性的复杂的难以显示描述的空间结构”。则同样的通过仿真生成模型生成的数据也有一个固有的流形为Mmodel。因此基于此假设,如果仿真模型足够好的话,其生成数据的流形空间和参考数据的流形空间应该是很接近的,即流形空间的拓扑性质是相似的,拓扑空间是指数据点在一定的度量空间下点与点之间构成的抽象的空间结构,是对数据内部的关系进行了全局客观的度量。所以提出了基于拓扑数据分析的相似性度量方法,通过计算仿真模型数据和参考数据的拓扑空间性质的相似程度来度量数据之间的相似性,同时提供了定量的度量指标可以直接比较不同的模型数据和参考数据之间的相似程度的大小。
附图说明
图1是本发明实施例的流程图;
图2是本发明实施例的拓扑性质计算结果示意图;
图3是本发明实施例的不同噪声系数下生成的数据集示意图;
图4是本发明实施例的不同的噪声系数下生成的数据和参考数据的拓扑性质计算结果示意图;
图5是本发明实施例的不同噪声系数下生成数据的拓扑相似性评分示意图。
具体实施方式
为了便于本领域普通技术人员理解和实施本发明,下面结合附图及实施例对本发明作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本发明,并不用于限定本发明。
本发明针对网络仿真数据的准确性量化问题,提出了基于拓扑性质的相似性的度量方法,并通过实例证明了其正确性和有效性。
请见图1,本发明提供的一种网络仿真数据的准确性量化方法,包括以下步骤:
步骤1:假定网络仿真数据集为X,从中随机选择L个标定点,然后计算所选标定点与网络仿真数据集X的成对距离,并通过矩阵形式保存;
请见图2,为本发明实施例的拓扑性质计算结果示意图,右边为相应的数据集利用本发明的拓扑近似的方法计算得到的拓扑性质即“环”的个数的分布。
本实施例中,假定数据集X描点后分别为图2中左边所示的形状(实际中很难直接在高维空间中画出数据点的分布形状),分别构造了“环”的个数从1到5的测试数据,从中随机选择64个标定点,然后计算所选标定点与数据集X的成对距离的矩阵。
步骤2:通过默认设定的γ值与所选标定点之间成对距离的最大值相乘计算出持续性参数α的最大值αmax;
αmax=γ*max(dist(L,L));
步骤3:利用步骤1中所选标定点与网络仿真数据集X的成对距离和步骤2计算得到的参数αmax,以及witness复形进行拓扑近似,复形的最大维度设为k,然后利用得到的复形族计算在维度为k时的持续性区间;
本实施例中,复形的最大维度设为2,即k=2,然后利用得到的复形族计算在维度为2时的持续性区间。
Witness复形:
(2)选择的标定点将作为单纯复形的节点,并且witness复形将决定什么样的单形被添加到单纯复形里面;
步骤4:通过式(1)计算相对生成时间RTL(i,k,X,L);
其中,βk(α)表示k维“环”的贝蒂系数,i表示环的个数,k表示环的维度,μ表示在α的整个变化区间内,βk(α)=i的区间的长度。
对于一个固定值的α,k维“环”的贝蒂系数为包含α的持续性区间的数量,相应的值函数为式(2);
βk(α)=|{[bi,di]∈Ik:α∈[bi,di]}| (2)
其中,bi和di表示有i个环时α区间的端点,Ik表示k维“环”的α总区间。
步骤5:进行若干次的随机选择标定点之后计算出若干个相对生成时间,根据式(3)计算平均相对生成时间:
MRLT(i,k,X)=EL[RLT(i,k,x,L)] (3)
同时有:
∑iMRLT(i,k,X)=1 (4)
根据规则MRLT加起来等于1,利用贝叶斯的观点,可以把它们解释为一个概率分布,反映了对平均有多少个“环”的度量。于是可以由步骤1中的数据集得到对应的概率分布图,如图2右边所示。从图2可以看出,本发明提出的数据的拓扑性质的方法,均能正确地计算出数据的拓扑中环的个数,从图中的体现是“环”在该数目下的对应的概率更高。如图所示在数据集的“环”的个数为1、2、3、5时,对应的计算出来的“环”的个数分别都是在等于1、2、3、5时的概率达到0.8以上;对于“环”的个数为4时,计算出来的“环”的个数等于4时的概率达到0.6以上,同时,因为在“环”的个数为4时,从数据集的分布的形状可以看出,其中间形成的“环”较小,所以,相对于其他的环,该“环”的生存时间则比较短,所以最终会有存在3个“环”的情况,同时这也在右边的计算的拓扑性质中体现出来,即在“环”的个数等于3时,对应的概率达到0.2以上,所以对拓扑性质的近似的概率也达到了0.8以上,因此从图示的结果可以验证的拓扑性质近似的方法的正确性和有效性。
假设参考的数据为6个“环”的数据集,同时,在参考数据上添加不同的噪声系数表示不同的仿真模型生成的数据,如图3所示。
步骤6:计算两个数据集的MRLT的JS散度来表示两个数据集之间拓扑性质的相似程度:
TopSimScore(Xdata,Xmodel)=JS(MRLTdata||MRLTmodel) (5)
其中,Xdata表示参考数据集,Xmodel表示网络仿真数据集,MRLTdata表示参考数据集的平均相对生成时间,MRLTmodel表示网络仿真数据集的平均相对生成时间,P(x)和Q(x)分别表示两个数据集,KL散度(Kullback–Leibler divergence),称为相对熵是用于描述两个概率分布P(x)和Q(x)的差异。
JS散度的值域为[0,1],值越低表示越接近,即相同为0,反之越不同值越接近1,同时具有对称性。由JS散度值即可判断网络仿真数据和参考数据的相似性。
得到结果如图4和5所示。
如图4拓扑性质分布图的结果可知,随着仿真模型的噪声系数的增加,生成的数据的拓扑性质的分布越来越远离参考数据的拓扑性质的分布图,提供了一个定性地观察数据拓扑性质变化。同时利用拓扑性质的相似度的评分,结果如图5所示,可以定量地比较和观察生成的数据和参考数据的拓扑性质的相似度,由图可知,随着噪声系数的增加,与参考数据之间的拓扑的相似性越来越低,同时,在噪声系数为2以上时,与参考数据的拓扑的相似性的评分并没有继续升高,而是几乎保持一个收敛的水平,此时的数据和参考数据已经没有了相似性,所以这也说明当计算出来的相似度的评分在0.6以下时,和参考数据之间才有一定的相似度可言。
本发明详细介绍了数据的拓扑性质的近似估计方法,并在拓扑性质估计的基础上提出了不同数据的拓扑性质相似度的计算方法,通过计算仿真模型数据和参考数据的拓扑空间性质的相似程度来度量数据之间的相似性,同时提供了定量的度量指标(就是JS散度值)可以直接比较不同的模型数据和参考数据之间的相似程度的大小,可用于网络仿真可信度的评估。
应当理解的是,本说明书未详细阐述的部分均属于现有技术。
应当理解的是,上述针对较佳实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。
Claims (3)
1.一种网络仿真数据的准确性量化方法,其特征在于,包括以下步骤:
步骤1:假定网络仿真数据集为X,从中随机选择L个标定点,然后计算所选标定点与网络仿真数据集X的成对距离,并通过矩阵形式保存;
步骤2:通过默认设定的γ值与所选标定点之间成对距离的最大值相乘计算出持续性参数α的最大值αmax;
步骤3:利用步骤1中所选标定点与网络仿真数据集X的成对距离和步骤2计算得到的参数αmax,以及witness复形进行拓扑近似,复形的最大维度设为k,然后利用得到的复形族计算在维度为k时的持续性区间;
步骤4:通过式(1)计算相对生成时间RTL(i,k,X,L);
其中,βk(α)表示k维“环”的贝蒂系数,其中i表示环的个数,k表示环的维度,μ表示在α的整个变化区间内,βk(α)=i的区间的长度;
对于一个固定值的α,k维“环”的贝蒂系数为包含α的持续性区间的数量,相应的值函数为式(2);
βk(α)=|{[bi,di]∈Ik:α∈[bi,di]}| (2)
其中,bi和di表示有i个环时α区间的端点,Ik表示k维“环”的α总区间;
步骤5:进行若干次的随机选择标定点之后计算出若干个相对生成时间,根据式(3)计算平均相对生成时间:
MRLT(i,k,X)=EL[RLT(i,k,x,L)] (3)
同时有:
∑iMRLT(i,k,X)=1 (4)
步骤6:计算两个数据集的MRLT的JS散度来表示两个数据集之间拓扑性质的相似程度:
TopSimScore(Xdata,Xmodel)=JS(MRLTdata||MRLTmodel) (5)
其中,Xdata表示参考数据集,Xmodel表示网络仿真数据集,MRLTdata表示参考数据集的平均相对生成时间,MRLTmodel表示网络仿真数据集的平均相对生成时间,P(x)和Q(x)分别表示两个数据集,KL散度,称为相对熵是用于描述两个概率分布P(x)和Q(x)的差异;
JS散度的值域为[0,1],值越低表示越接近,即相同为0,反之越不同值越接近1,同时具有对称性;由JS散度值即可判断网络仿真数据和参考数据的相似性。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910444133.0A CN110289986B (zh) | 2019-05-27 | 2019-05-27 | 一种网络仿真数据的准确性量化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910444133.0A CN110289986B (zh) | 2019-05-27 | 2019-05-27 | 一种网络仿真数据的准确性量化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110289986A CN110289986A (zh) | 2019-09-27 |
CN110289986B true CN110289986B (zh) | 2021-05-18 |
Family
ID=68002251
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910444133.0A Active CN110289986B (zh) | 2019-05-27 | 2019-05-27 | 一种网络仿真数据的准确性量化方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110289986B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112257332B (zh) * | 2020-09-23 | 2022-12-13 | 北京航空航天大学 | 一种仿真模型的评估方法及装置 |
CN114726601B (zh) * | 2022-03-28 | 2023-06-02 | 北京计算机技术及应用研究所 | 一种基于图结构的信息安全仿真建模与验证评估方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102012856A (zh) * | 2010-11-30 | 2011-04-13 | 中国人民解放军信息工程大学 | 自动生成硬件构件仿真工程的方法和装置 |
CN104915434A (zh) * | 2015-06-24 | 2015-09-16 | 哈尔滨工业大学 | 一种基于马氏距离dtw的多维时间序列分类方法 |
CN108054755A (zh) * | 2017-12-26 | 2018-05-18 | 广州市捷信通科技发展有限公司 | 一种基于k最近邻分类算法的配电网拓扑结构校验方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7787683B2 (en) * | 2004-12-20 | 2010-08-31 | Siemens Medical Solutions Usa, Inc. | Tree structure based 2D to 3D registration |
-
2019
- 2019-05-27 CN CN201910444133.0A patent/CN110289986B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102012856A (zh) * | 2010-11-30 | 2011-04-13 | 中国人民解放军信息工程大学 | 自动生成硬件构件仿真工程的方法和装置 |
CN104915434A (zh) * | 2015-06-24 | 2015-09-16 | 哈尔滨工业大学 | 一种基于马氏距离dtw的多维时间序列分类方法 |
CN108054755A (zh) * | 2017-12-26 | 2018-05-18 | 广州市捷信通科技发展有限公司 | 一种基于k最近邻分类算法的配电网拓扑结构校验方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110289986A (zh) | 2019-09-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7353238B2 (ja) | 高次元センサデータにおける異常事象の自動化された根本原因分析を実行する方法及びシステム | |
US7196662B2 (en) | Probabilistic model for a positioning technique | |
KR100938047B1 (ko) | 시스템 교정 방법, 위치 탐색 시스템 및 컴퓨터 | |
CN110427654B (zh) | 一种基于敏感状态的滑坡预测模型构建方法及系统 | |
CN112508044A (zh) | 人工智能ai模型的评估方法、系统及设备 | |
CN110289986B (zh) | 一种网络仿真数据的准确性量化方法 | |
CN110213003B (zh) | 一种无线信道大尺度衰落建模方法及装置 | |
CN108627798B (zh) | 基于线性判别分析和梯度提升树的wlan室内定位算法 | |
US11216534B2 (en) | Apparatus, system, and method of covariance estimation based on data missing rate for information processing | |
CN111325376A (zh) | 风速预测方法及装置 | |
CN109754135B (zh) | 信用行为数据处理方法、装置、存储介质和计算机设备 | |
CN116578660A (zh) | 一种基于稀疏数据的电磁目标态势地图构建方法 | |
CN116557787A (zh) | 管网状态智能评估系统及其方法 | |
CN113159142B (zh) | 一种用于细粒度图像分类的损失函数可变超参数确定方法 | |
CN107104747B (zh) | 无线时变信道中的多径分量的分簇方法 | |
CN107613466B (zh) | 超密集无线网络下基于指纹相似度的室内定位方法 | |
CN104244502A (zh) | 确定照度传感器的布置的方法、装置和照明控制系统 | |
KR20120132101A (ko) | 비선형 감쇠 시스템에서의 비조화적이고 주기적인 가진력 추정방법 | |
CN115099385A (zh) | 基于传感器布局优化和自适应Kriging模型的频谱地图构建方法 | |
CN114578087B (zh) | 基于非支配排序和随机模拟算法的风速不确定性度量方法 | |
US20060025972A1 (en) | Incorporation of uncertainty information in modeling a characteristic of a device | |
CN114492540A (zh) | 目标检测模型的训练方法、装置、计算机设备及存储介质 | |
CN111147311B (zh) | 一种基于图嵌入的网络结构性差异量化方法 | |
US7895021B1 (en) | Method of sensor disposition | |
Chen et al. | Research on indoor positioning method based on LoRa-improved fingerprint localization algorithm |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |