CN110855517B - 一种从频谱数据中挖掘电台通信网络拓扑结构的方法 - Google Patents
一种从频谱数据中挖掘电台通信网络拓扑结构的方法 Download PDFInfo
- Publication number
- CN110855517B CN110855517B CN201911047121.0A CN201911047121A CN110855517B CN 110855517 B CN110855517 B CN 110855517B CN 201911047121 A CN201911047121 A CN 201911047121A CN 110855517 B CN110855517 B CN 110855517B
- Authority
- CN
- China
- Prior art keywords
- coordinate system
- spectrum
- neighborhood
- communication
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/04—Processing captured monitoring data, e.g. for logfile generation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/12—Discovery or management of network topologies
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/145—Network analysis or design involving simulating, designing, planning or modelling of a network
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Data Mining & Analysis (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
本发明公开了一种从频谱监测数据中挖掘电台通信网络拓扑结构的方法,方法包括:从频谱监测数据中提取特征(信号功率、信号监测时间以及信号方向);基于上述提取的特征标识每一个频谱信号,在柱坐标系中表示频谱监测信号的分布;由于信源产生的频谱信号在功率、监测时间和方向上呈现的聚类性,以及通信过程中通信双方产生的频谱信号的关联性,基于改进的OPTICS算法挖掘频谱监测数据中电台之间的通联关系;通过对电台与通联关系的匹配,推测、构建通信网络结构。本发明方法实现了从频谱监测数据中挖掘电台的通联关系、通信网络结构,并通过对通信网络结构的分析获取电台的通信行为。
Description
技术领域
本发明属于数据挖掘技术领域,具体是一种从频谱监测数据中挖掘电台之间的通联关系和通信网络结构,分析电台的通信行为的方法。
背景技术
随着无线通信的飞速发展,频谱的稀缺性越来越突出,加强对频谱信号的监测、分析以及对电磁频谱的管理越来越迫切。频谱信号作为信息传输的媒介,对其进行深入的研究具有重要意义。目前,对海量频谱监测信号的挖掘分析主要集中于频谱态势展示,信号特征提取,信号分类等方面。海量频谱信号除了携带着通信信息外,信号本身的物理特征以及这些特征的统计规律也潜在地反映了电台的通信行为以及与通信行为相关的情报信息。但是仅仅依据频谱信号的物理特征以及这些特征的统计规律,而不依赖破解信号内容,从频谱信号中挖掘电台之间的通联关系、通信网络结构以及通信行为的研究几乎是空白。
在反恐、军事通信、通信侦查、通信安全等领域,截获并破解信号内容通常需要付出巨大的代价,并且更多时候,其加密内容是无法破解的,因此在某些具体场景中基于信号内容去获取通信个体的通信行为是难以实现的。然而频谱信号本身的物理特征是难以加密的,并且这些特征易于获取,通过研究从频谱信号中提取的物理特征和这些特征的统计规律,也可以挖掘出电台之间的通联关系、乃至通信网络等隐藏信息,进而分析并获取电台的通信行为。
发明内容
本发明的目的在于提供一种从海量频谱监测数据中挖掘电台之间通联关系、通信网络拓扑结构的方法,从而分析电台的通信行为。
为了实现上述目的,采用以下技术方案:本发明所述方法包括以下步骤:
S1:从频谱监测数据中提取特征(信号功率P、信号监测时间t以及信号方向θ)得到频谱数据集Y={y1,y2,…,yi,…,yn}T,其中yi={θi,Pi,ti},θi表示信号方向,Pi表示信号功率,ti表示信号监测时间。数据的格式,如表1所示。
S2:基于上述提取的特征标识每一个频谱信号,引入柱坐标系和极坐标系用于研究频谱数据集Y的分布特点和统计规律;柱坐标系的三个维度分别为信号功率P、信号方向θ以及信号监测时间t;极坐标系是该柱坐标系在时间t方向上的投影。数据集表示为Z={y1,y2,…,yi,…,yn}T,其中zi={θi,Pi}。数据集Y在柱坐标系的分布如图2所示,数据集Z在极坐标的分布如图3所示。
S3:基于改进的OPTICS算法对分布在柱坐标系中的频谱监测数据进行聚类,聚类集分别对应不同电台在不同通信过程中产生的频谱信号集;OPTICS算法的改进在于:
1)ε-邻域定义为:Nε(yj)={yi∈Y|dist(yi-yj)≤ε}
其中ε为邻域半径,2h为柱状领域的高度。
2)估计MinPts的值:
选取MinPts的值要取决于数据中对象的数量。除此之外,数据的分布特点以及关于数据集群的附加信息也可以用来定义MinPts。MinPts的初始值可设置为5。
3)估计ε的值
设某一个接收电台产生的频谱信号集为R={θi,Pi,ti},其中i=1,2,…,m。为了更直观的表示,将数据集R通过公式转换到三维直角坐标系中,得到R′={ai,bi,ti}。
数据集R′在空间中所占据的范围用体积表示为VR;设R″是与数据集R′维数和数据范围相同,但是服从均匀分布的数据集,R″中每个对象所占据的平均范围可表示为则有:
其中MinPts表示yj是核心对象时,yj的(ε,h)-邻域至少包含的样本数量,2hπε2表示柱形(ε,h)-邻域所占据范围的体积,表示每个对象邻域内有MinPts个点对应的平均范围的体积。基于给定的MinPts,上述公式确定了h和ε的关系以及柱状(ε,h)-邻域的范围。
S4:对聚类集依据其数据的时间分布范围进行匹配,发现数据集之间的通信关系;为了保证数据的可靠传输,在数据链路层通常采用停止等待ARQ的方式。收发双方在通信过程中,接收方会发送反馈信息给发送方来进行确认,所以一对通信电台各自产生的频谱信号所占据的时间范围是相近的,可以用于确定电台之间的通联关系。
S5:将柱坐标系中的数据投影到极坐标系得到数据集Z,用DBSCAN算法对数据进行聚类(DBSCAN算法参数的选取要根据具体的监测环境设定)。以聚类集代替电台,聚类集的质心邻域作为电台在极坐标系中的相对位置,并作为通信网络的节点。质心邻域定义为:
设某一聚类集(其中/>)的质心位置/>表示为:
设定了的邻域范围:
其中r为邻域半径。
S6:将S5发现的聚类集的质心领域作为网络节点,依据S4中发现的电台之间的通联关系连接网络节点,作为网络的边,从而构建通信网络拓扑结构。
本发明与现有技术相比,其显著优点为:本发明依据频谱信号的物理特征以及这些特征的统计规律,挖掘海量频谱信号中的电台之间的通联关系以及通信网络拓扑结构,避免了通过破解信号内容来获取情报、电台通信行为的困难和代价,并为深入挖掘海量频谱信号的隐藏信息提供了新的思路和角度。
附图说明
图1为从频谱监测数据中挖掘通信网络结构的方法的流程图。
图2为频谱信号在由信号功率、信号方向、信号监测时间构成的柱坐标系中的分布示意图。
图3为频谱信号在由信号功率、信号方向构成的极坐标系中的分布示意图。
图4实验设置的通信网络图。
图5质心邻域的分布图。
图6截取的8s时长的数据聚类结果图。
图7截取的8s时长数据进行通联关系结匹配图。
图8通信网络拓扑结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步描述。
实验设置了14台超短波电台模拟通信网络通信的过程,如图4所示。通过频谱监测设备对电台通信产生的频谱信号进行监测,获取频谱监测数据。如图1所示。
S1:从频谱监测数据中提取特征(信号功率P、信号监测时间t以及信号方向θ)得到频谱数据集Y={y1,y2,…,yi,…,yn}T,其中yi={θi,Pi,ti},θi表示信号方向,Pi表示信号功率,ti表示信号监测时间。数据的格式,如表1所示。
表1:数据格式
Y | 功率P | 时间t | 方向θ |
y1 | 29.56dbm | 10”000 | 137.2° |
y2 | 28.74dbm | 10”016 | 136.9° |
… | … | … | … |
yi | 20.47dbm | 99”000 | 209.7° |
… | … | … | … |
S2:基于上述提取的特征标识每一个频谱信号,引入柱坐标系和极坐标系用于研究海量频谱监测信号的分布特点和统计规律;柱坐标系的三个维度分别为信号功率P、信号方向θ以及信号监测时间t。极坐标系是该柱坐标系在时间t方向上的投影,投影得到的数据集表示为Z={z1,z2,…,zi,…,zn}T,其中zi={θi,Pi}。
S3:基于改进的OPTICS算法对分布在柱坐标系中的频谱监测数据进行聚类,聚类集分别对应不同电台在不同通信过程中产生的频谱信号集;对于改进的OPTICS算法,改进之处在于:
1)(ε,h)-邻域定义为:Nε(yj)={yi∈Y|dist(yi-yj)≤ε}
其中ε为邻域半径,2h为柱状领域的高度。
2)估计MinPts的值:
依据数据的分布特点以及实验验证,设置MinPts=5.
3)估计ε以及h的值
设某一个接收电台产生的频谱信号集为R={θi,Pi,ti},其中i=1,2,…,m。为了更直观的表示,将数据集R通过公式转换到三维直角坐标系中,得到R′={ai,bi,ti}。
数据集R′在空间中所占据的范围用体积表示为VR;设R″是与数据集R′维数和实验范围相同,但是服从均匀分布的数据集,R″中每个对象所占据的平均范围可表示为则有:
其中2hπε2表示柱形ε-邻域所占据的范围,表示每个对象邻域内有MinPts个点对应的平均范围。基于给定的MinPts,公式确定了h和ε的关系以及柱状(ε,h)-邻域的范围。
S4:对聚类集依据其数据的时间分布范围进行匹配,发现数据集之间的通信关系;聚类集在柱坐标系的分布如图6所示,具有通联关系的聚类集标注为相同形状的符号,如图7所示。
S5:将柱坐标系中的数据投影到极坐标系,用DBSCAN算法对数据进行聚类,用聚类集代替电台,聚类集的质心邻域作为电台在极坐标系中的相对位置,并作为通信网络的节点。质心邻域定义为:
设某一聚类集(其中/>)的质心位置/>表示为:
设定了的邻域范围:
图5展示了极坐标系中的聚类集的质心邻域。
S6:将S5发现的聚类集的质心领域作为网络节点,依据S4中发现的电台之间的通联关系连接网络节点,作为网络的边,从而构建通信网络拓扑结构。发现的无线通信网络拓扑结构如图8所示。
Claims (6)
1.一种从频谱数据中挖掘电台通信网络拓扑结构的方法,其特征在于,包括以下步骤:
S1:从频谱监测数据中提取特征得到频谱数据集Y,特征包括信号功率P、信号监测时间t以及信号方向θ;
S2:基于上述提取的特征标识每一个频谱信号,引入柱坐标系和极坐标系用于表示频谱数据集Y中数据的分布情况;
S3:基于改进的OPTICS算法对分布在柱坐标系中的频谱监测数据Y进行聚类,聚类集分别对应不同电台在不同通信过程中产生的频谱信号集;
所述改进的OPTICS算法的改进之处在于:
1)根据频谱数据的特点重新定义数据之间的距离dist(yi,yj):
其中ε为邻域半径,2h为柱状领域的高度;
2)算法中球形ε-邻域改为柱状(ε,h)-邻域:
yj的(ε,h)-邻域表示为:
Nε(yj)={yi∈Y|dist(yi,yj)≤ε}
3)估计ε的范围:
设某一个接收电台产生的频谱信号集为R={θi,Pi,ti},其中i=1,2,…,m;将数据集R通过公式转换到三维直角坐标系中,得到R′={ai,bi,ti};
数据集R′在空间中所占据的范围用体积表示为VR;设R″是与数据集R′维数和数据范围相同,但是服从均匀分布的数据集,R″中每个对象所占据的平均范围可表示为则有:
其中,MinPts表示yj是核心对象时,yj的(ε,h)-邻域至少包含的样本数量,2hπε2表示柱状(ε,h)-邻域所占据范围的体积,表示每个对象邻域内有MinPts个点对应的平均范围的体积;基于给定的MinPts,式(1)、式(2)确定h和ε的关系以及柱状(ε,h)-邻域的范围;
S4:依据聚类集内数据的时间分布,将具有相近时间范围的聚类集匹配在一起,聚类集的匹配关系对应着电台之间的通联关系;
S5:将柱坐标系中的数据集Y投影到极坐标系得到数据集Z,用DBSCAN算法对极坐标系内的数据进行聚类,用聚类集代替电台,聚类集的质心邻域作为电台在极坐标系中的相对位置即网络节点;
S6:将S5发现的聚类集的质心领域作为网络节点,依据S4中发现的电台之间的通联关系连接网络节点,作为网络的边,从而构建通信网络拓扑结构。
2.如权利要求1所述的方法,其特征在于:S1中所述频谱数据集表示为Y={y1,y2,…,yi,…,yn}T,其中yi={θi,Pi,ti},θi表示信号方向,Pi表示信号功率,ti表示信号监测时间。
3.如权利要求1所述的方法,其特征在于:S2中所述柱坐标系的三个维度分别为信号功率P、信号方向θ以及信号监测时间t。
4.如权利要求1所述的方法,其特征在于:S2中所述极坐标系是该柱坐标系在时间t方向上的投影;数据集表示为Z={z1,z2,…,zi,…,zn}T,其中zi={θi,Pi}。
5.如权利要求1所述的方法,其特征在于:S5中所述聚类集的质心邻域表征聚类集在极坐标系中的相对位置,用于代替信源在极坐标的相对位置,极坐标原点表示监测设备的位置。
6.如权利要求1所述的方法,其特征在于,S6中所述通信网络拓扑结构的构建过程是将S4中在柱坐标系中发现的具有通联关系的聚类集投影到极坐标表示网络拓扑结构;以投影后聚类集的质心邻域作为网络节点,以通联关系作为网络的边。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911047121.0A CN110855517B (zh) | 2019-10-30 | 2019-10-30 | 一种从频谱数据中挖掘电台通信网络拓扑结构的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911047121.0A CN110855517B (zh) | 2019-10-30 | 2019-10-30 | 一种从频谱数据中挖掘电台通信网络拓扑结构的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110855517A CN110855517A (zh) | 2020-02-28 |
CN110855517B true CN110855517B (zh) | 2023-08-04 |
Family
ID=69599253
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911047121.0A Active CN110855517B (zh) | 2019-10-30 | 2019-10-30 | 一种从频谱数据中挖掘电台通信网络拓扑结构的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110855517B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115866615B (zh) * | 2023-02-24 | 2023-05-05 | 南京邮电大学 | 一种基于电磁频谱特征的无线网络通联关系发现方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102142992A (zh) * | 2011-01-11 | 2011-08-03 | 浪潮通信信息系统有限公司 | 通信告警频繁项集挖掘引擎及冗余处理方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9622019B2 (en) * | 2014-11-28 | 2017-04-11 | Huawei Technologies Co., Ltd. | Systems and methods for generating a virtual network topology for M2M communications |
-
2019
- 2019-10-30 CN CN201911047121.0A patent/CN110855517B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102142992A (zh) * | 2011-01-11 | 2011-08-03 | 浪潮通信信息系统有限公司 | 通信告警频繁项集挖掘引擎及冗余处理方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110855517A (zh) | 2020-02-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Reus-Muns et al. | Trust in 5G open RANs through machine learning: RF fingerprinting on the POWDER PAWR platform | |
CN109495920B (zh) | 一种无线通信网络特征画像方法、设备和计算机程序产品 | |
CN114021168B (zh) | 基于联邦学习的地铁基坑开挖风险识别方法及装置 | |
CN104601596A (zh) | 一种分类数据挖掘系统中数据隐私保护方法 | |
CN110855517B (zh) | 一种从频谱数据中挖掘电台通信网络拓扑结构的方法 | |
CN114218984B (zh) | 一种基于样本多视图学习的射频指纹识别方法 | |
Liu et al. | Research on communication network structure mining based on spectrum monitoring data | |
CN110705387A (zh) | 一种基于云模型的通信信号特征提取方法及信号识别方法 | |
CN101848482A (zh) | 一种获取干扰矩阵的方法和装置 | |
CN110765329B (zh) | 一种数据的聚类方法和电子设备 | |
Zhang et al. | Data modeling with large random matrices in a cognitive radio network testbed: Initial experimental demonstrations with 70 nodes | |
Kim et al. | Reducing model cost based on the weights of each layer for federated learning clustering | |
CN109413068B (zh) | 一种基于对偶gan的无线信号加密方法 | |
CN109067778B (zh) | 一种基于蜜网数据的工控扫描器指纹识别方法 | |
Zhang et al. | Adaptive RF fingerprints fusion via dual attention convolutions | |
CN109547443B (zh) | 一种网络存储型隐信道的检测方法 | |
Mohammadabadi et al. | Towards distributed learning of pmu data: A federated learning based event classification approach | |
CN114756880A (zh) | 一种基于fpga的信息隐藏方法及系统 | |
CN113343868A (zh) | 一种辐射源个体识别方法及装置、终端、存储介质 | |
CN112118572B (zh) | 工业网络场景下基于5g通信的数据安全传输系统及方法 | |
CN115866615B (zh) | 一种基于电磁频谱特征的无线网络通联关系发现方法 | |
CN110621025B (zh) | 一种设备选型方法和装置 | |
CN110851414A (zh) | 一种以聚类法进行边界数据分析的方法及其系统 | |
CN111949699A (zh) | 一种基于多重验证的轨迹碰撞方法及系统 | |
CN109150902B (zh) | 一种基于家庭网关系统的加密装置及其加密方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |