CN113325469B - 一种地震电离层tec关联分析方法 - Google Patents
一种地震电离层tec关联分析方法 Download PDFInfo
- Publication number
- CN113325469B CN113325469B CN202010128083.8A CN202010128083A CN113325469B CN 113325469 B CN113325469 B CN 113325469B CN 202010128083 A CN202010128083 A CN 202010128083A CN 113325469 B CN113325469 B CN 113325469B
- Authority
- CN
- China
- Prior art keywords
- tec
- seismic
- variable
- frequent
- item
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 238000010219 correlation analysis Methods 0.000 title claims abstract description 9
- 239000005433 ionosphere Substances 0.000 claims abstract description 32
- 238000009826 distribution Methods 0.000 claims abstract description 19
- 238000012545 processing Methods 0.000 claims abstract description 12
- 230000011218 segmentation Effects 0.000 claims abstract description 3
- 238000012216 screening Methods 0.000 claims description 17
- 238000013138 pruning Methods 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000011160 research Methods 0.000 description 10
- 230000000694 effects Effects 0.000 description 7
- 230000006872 improvement Effects 0.000 description 7
- 238000007418 data mining Methods 0.000 description 3
- 101100182247 Caenorhabditis elegans lat-1 gene Proteins 0.000 description 2
- 101100511466 Caenorhabditis elegans lon-1 gene Proteins 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000012098 association analyses Methods 0.000 description 2
- 238000012097 association analysis method Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 101100182248 Caenorhabditis elegans lat-2 gene Proteins 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000035935 pregnancy Effects 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01V—GEOPHYSICS; GRAVITATIONAL MEASUREMENTS; DETECTING MASSES OR OBJECTS; TAGS
- G01V1/00—Seismology; Seismic or acoustic prospecting or detecting
- G01V1/01—Measuring or predicting earthquakes
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01V—GEOPHYSICS; GRAVITATIONAL MEASUREMENTS; DETECTING MASSES OR OBJECTS; TAGS
- G01V1/00—Seismology; Seismic or acoustic prospecting or detecting
- G01V1/28—Processing seismic data, e.g. for interpretation or for event detection
- G01V1/30—Analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01V—GEOPHYSICS; GRAVITATIONAL MEASUREMENTS; DETECTING MASSES OR OBJECTS; TAGS
- G01V2210/00—Details of seismic processing or analysis
- G01V2210/60—Analysis
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Business, Economics & Management (AREA)
- Remote Sensing (AREA)
- Theoretical Computer Science (AREA)
- Geology (AREA)
- General Life Sciences & Earth Sciences (AREA)
- Geophysics (AREA)
- Databases & Information Systems (AREA)
- Tourism & Hospitality (AREA)
- Environmental & Geological Engineering (AREA)
- Acoustics & Sound (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Probability & Statistics with Applications (AREA)
- Mathematical Physics (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Fuzzy Systems (AREA)
- Computational Linguistics (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Geophysics And Detection Of Objects (AREA)
Abstract
本发明公开了一种地震电离层TEC关联分析方法,包括:收集地震编目数据和电离层TEC数据;从地震编目数据和电离层TEC数据中抽取数据,处理后按时空关系拼接组合,构造地震‑TEC数据集;针对地震‑TEC数据集,分别计算地震纬度、经度、震源深度、震级和TEC的最大值和最小值,并按照各个变量的值域区间等间隔划分变量,得到变量的离散子区间值域范围;统计各个子区间内事务集的频数分布结果,依据事务项聚集在不同子区间分布的稀疏程度,进行区间自适应分段,基于划分后的变量子区间的区间编号来构建标注的事务集;采用Apriori算法对标注的事务集进行处理,输出地震因子与电离层TEC之间的关联规则,所述地震因子为地震纬度、经度、震源深度和震级中一个或多个组合。
Description
技术领域
本发明涉及数据挖掘和地球物理技术领域,具体涉及一种地震电离层TEC关联分析方法。
背景技术
相关地震研究是地震预报的常用方法之一,主要是研究不同地震活动的时空分布相关性,进而推断出一定区域内特定震级以上的地震是否会发生相伴地震。地震关联分析研究则主要关注地震与其他地球物理现象(电磁扰动、重力场变化等)之间的联系,而震前电离层扰动是当前地震预报的研究热点。
基于历史上发生的地震活动统计资料分析,人类发现地震活动分布在空间上具有聚集性,在时间上呈现周期性。全球地震活动在空间分布上呈现一定的带状,主要分布板块交界处,包含环太平洋地震带、地中海—印度尼西亚地震带和海岭地震带三个大型的地震带。同时地震震源深度和地震区域也有一定相关性,环太平洋地震带几乎集中了全世界80%以上的浅源地震(0~70千米),90%的中源(70~300千米)和所有的深源地震,而地中海—印度尼西亚地震带和海岭地震带主要为浅源地震和中源地震。再从时间分布上看,地震学家认为地震的活跃期和平静期交替出现,呈现周期性。通常地球上某一个区域或地震带,在一定时间段内表现为多震活跃期,而在另一段时间内表现为少震平静期。这种活跃期和平静期常常交替出现。
地震活动除了具有时空分布的内在相关性外,还与其他地球物理现象有相关关系。电离层电子浓度总含量(TEC)又称电离层电子浓度柱含量、积分含量等。人们常常观测到5级以上的地震前几天到几小时内再地震孕震区上空出现了明显的电离层TEC异常扰动,且扰动有正负,国内外学者将震前电离层扰动作为地震预报的研究热点。虽然对于地震-电离层扰动的物理解释还没有令人完全信服的一套理论,但开展地震-电离层扰动相关性研究有助于进一步认识地震与电离层的关系。
由于相关地震研究是针对大量地震案例的统计研究,没有考虑电离层参量的扰动,而地震-电离层扰动研究常常是对单个地震事件进行分析,无法提供统计参考价值,如何将两种方法优点结合起来,开展地震因子(震级、震源深度、位置、时间)与电离层参量之间细化的关联分析,评估大量地震案例之间的统计相关性以及大量地震案例与电离层扰动的相关性,是值得深入研究的。考虑到地震因子与电离层参量之间的关系不是简单的线性或非线性回归问题,如何挖掘这些变量之间的相关关系也是比较困难的。
发明内容
本发明的目的在于克服上述技术缺陷,为了细化研究地震因子与电离层扰动的关联关系,结合相关地震研究和地震-电离层扰动关联分析研究两种思路,引入数据挖掘技术,建立地震电离层TEC关联分析系统,探索地震因子与电离层TEC之间的关联规则。
为实现上述目的,本发明提出了一种地震电离层TEC关联分析方法,所述方法包括:
收集地震编目数据和电离层TEC数据;
从地震编目数据和电离层TEC数据中抽取数据,处理后按时空关系拼接组合,构造地震-TEC数据集;
针对地震-TEC数据集,分别计算地震纬度、经度、震源深度、震级和TEC的最大值和最小值,并按照各个变量的值域区间等间隔划分变量,得到变量的离散子区间值域范围;
统计各个子区间内事务集的频数分布结果,依据事务项聚集在不同子区间分布的稀疏程度,进行区间自适应分段,基于划分后的变量子区间的区间编号来构建标注的事务集;
采用Apriori算法对标注的事务集进行处理,输出地震因子与电离层TEC之间的关联规则,所述地震因子为地震纬度、经度、震源深度和震级中一个或多个组合。
作为上述方法的一种改进,所述从地震编目数据和电离层TEC数据中抽取数据,处理后按时空关系拼接组合,构造地震-TEC数据集;具体包括:
将地震编目数据中的地震信息抽取出来,每一行按照时间、纬度、经度、震源深度和震级的顺序重新存储,存储为地震因子数据集;
将电离层TEC原始数据从源文件ionex格式中解析成网格数据,每一行按照时间、纬度、经度、TEC值顺序存储,每一列按时间序列存储,存储为TEC数据集;对TEC数据集中的TEC值进行统一数据分辨率处理;
基于地震事件的时间、纬度、经度,从TEC数据集中寻找匹配的TEC值,并将TEC值与添加到地震因子文件最后一列,使得每一行按时间、纬度、经度、震源深度、震级、TEC顺序排列,存储为地震-TEC数据集。
作为上述方法的一种改进,所述对TEC数据集中的TEC值进行统一数据分辨率处理,具体为:
使用线性插值法在时间维度上对TEC数据集的TEC值进行插值,针对同一经纬度上的点,取该时刻附近前后1小时TEC的平均值作为当前时刻TEC值,从而将2014年10月18日之前的数据时间分辨率提升为1小时,而2014年10月19日以后的数据时间分辨率保持不变。
作为上述方法的一种改进,所述针对地震-TEC数据集,分别计算地震纬度、经度、震源深度、震级和TEC的最大值和最小值,并按照各个变量的值域区间等间隔划分变量,得到变量的离散子区间值域范围;由此构建标注的事务集,具体包括:
在地震-TEC数据集中,将纬度属性变量的最大值和最小值分别记为Max_lat和Min_lat,将该属性变量等间隔划分为N_lat份,得到该属性变量的区间跨度为(Max_lat-Min_lat)/N_lat,则将所有属于Min_lat+n1*(Max_lat-Min_lat)/N_lat到Min_lat+(n1+1)*(Max_lat-Min_lat)/N_lat之间的地震案例纬度属性变量均标记为Lat_n1;其中0≤n1≤N_lat-1;
将经度属性变量的最大值和最小值分别记为Max_lon和Min_lon,将该属性变量等间隔划分为N_lon份,得到该属性变量的区间跨度为(Max_lon-Min_lon)/N_lon,则将所有属于Min_lon+n2*(Max_lon-Min_lon)/N_lon到Min_lon+(n2+1)*(Max_lon-Min_lon)/N_lon之间的地震案例经度属性变量均标记为Lon_n2;其中0≤n2≤N_lon-1;
将震源深度属性变量的最大值和最小值分别记为Max_dep和Min_dep,将该属性变量等间隔划分为N_dep份,得到该属性变量的区间跨度为(Max_dep-Min_dep)/N_dep,则将所有属于Min_dep+n3*(Max_dep-Min_dep)/N_dep到Min_dep+(n3+1)*(Max_dep-Min_dep)/N_dep之间的地震案例的震源深度属性变量均标记为Dep_n3;其中0≤n3≤N_dep-1;
将震级属性变量的最大值和最小值分别记为Max_mag和Min_mag,将该属性变量等间隔划分为N_mag份,得到该属性变量的区间跨度为(Max_mag-Min_mag)/N_mag,则将所有属于Min_mag+n4*(Max_mag-Min_mag)/N_mag到Min_mag+(n4+1)*(Max_mag-Min_mag)/N_mag之间的地震案例的震级属性变量均标记为Mag_n4;其中0≤n4≤N_mag-1;
将TEC属性变量的最大值和最小值分别记为Max_tec和Min_tec,将该属性变量等间隔划分为N_tec份,得到该属性变量的区间跨度为(Max_tec-Min_tec)/N_tec,则将所有属于Min_tec+n5*(Max_tec-Min_tec)/N_tec到Min_tec+(n5+1)*(Max_tec-Min_tec)/N_tec之间的地震案例的TEC属性变量均标记为Tec_n5;其中0≤n5≤N_Tec-1;
将数据集标记为与属性变量子区间值域范围对应的标记变量后,得到关于地震纬度、经度、震源深度、震级和TEC的标记事务集。
作为上述方法的一种改进,所述采用Apriori算法对标注的事务集进行处理,输出地震因子与电离层TEC之间的关联规则,具体包括:
步骤S1)根据标记事务集的区间划分选择合适的支持度阈值,并设置置信度阈值和提升度阀值;
步骤S2)分别计算五个1项集的支持度,筛选出大于支持度阀值的五个频繁1项集,其中,五个1项集包括纬度、经度、震源深度、震级和TEC变量对应的1项集;
步骤S3)以任意一个纬度变量、经度变量、深度变量、震级变量对应的频繁1项集与TEC变量对应的频繁1项集进行连接,生成候选2项集;计算出候选2项集的支持度,筛选出大于最小支持度的频繁2项集;计算置信度和提升度,并根据置信度阈值和提升度阈值,产生一个地震因子与TEC的强关联规则;
步骤S4)将频繁2项集通过连接和剪枝计算出候选3项集,计算出候选3项集的支持度,筛选出大于支持度阀值的频繁3项集;计算其中的频繁2项集与TEC变量的频繁1项集的置信度和提升度,根据置信度阈值和提升度阈值,产生两个地震因子和TEC变量的强关联规则;
步骤S5)将频繁3项集通过连接和剪枝计算出候选4项集,计算出候选4项集的支持度,筛选出大于支持度阀值的频繁4项集;计算其中的频繁3项集与TEC变量的频繁1项集的置信度和提升度,根据置信度阈值和提升度阈值,产生三个地震因子和TEC变量的强关联规则;
步骤S6)将频繁4项集通过连接和剪枝计算出候选5项集,计算出候选5项集的支持度,筛选出大于支持度阀值的频繁5项集;计算其中的频繁4项集与TEC变量的频繁1项集的置信度和提升度,根据置信度阈值和提升度阈值,产生四个地震因子和TEC变量的强关联规则。
作为上述方法的一种改进,所述根据标记事务集的区间划分选择合适的支持度阈值,具体包括:
对于标记事务集中的5个属性变量:地震纬度、经度、震源深度、震级和TEC,分别进行区间划分,NX表示变量X的数值区域被划分为NX份,NX为整数;数值区间的长度记作lX,区间划分的原则是:变量X的数值分布越集中于少数稠密区域,划分时lX越小,NX取值越大;变量X的数值分布越均衡,lX越大,NX取值越小;
根据单个变量X的支持度阀值分别计算5个属性变量的支持度阀值;取地震纬度、经度、震源深度、震级和TEC中支持度阀值的最小值为Support_Xthreshold;
则支持度阀值nvariable表示变量个数,nvariable=5。
作为上述方法的一种改进,所述步骤S2)中,分别计算五个1项集的支持度,筛选出大于支持度阀值的五个频繁1项集;具体包括:
计算1项集的支持度,其中,1项集为:纬度变量、经度变量、深度变量、震级变量和TEC变量;其支持度计算公式为:
Support(A)=P(A)
其中,A代表任意一个1项集,P(A)为A的概率;
筛选出支持度大于支持度阀值的频繁1项集;输出纬度变量中的频繁1项Lat_n1、经度变量频繁1项Lon_n2、深度变量的频繁1项Dep_n3、震级变量的频繁项Mag_n4和TEC变量的频繁1项Tec_n5。
作为上述方法的一种改进,所述步骤S3)中,计算置信度和提升度,并根据置信度阈值和提升度阈值,产生一个地震因子与TEC的强关联规则,具体包括:
在频繁2项集中,以任意一个纬度变量、经度变量、深度变量、震级变量对应的频繁1项集为A,以TEC变量对应的频繁1项集为B,计算A→B的置信度:
Confidence(A→B)=P(B|A)=P(A∩B)/P(A)
计算A→B的提升度:
然后根据置信度阈值和提升度阈值,产生A与B的强关联规则,即一个地震因子与TEC的强关联规则。
本发明的优势在于:
1、本发明的方法通过组合不同变量子区间值以构建事务集,细化探究了地震因子(经度、纬度、震级、震源深度)和电离层TEC 5个变量及变量组合之间的相关关系,包括正相关关系和负相关关系。用户可以基于自身兴趣灵活设置变量区间离散化标准,重点细化关注的变量区间,以探究区间变量引起相关变量的变化特征;
2、本发明的方法引入了数据挖掘领域广泛应用的关联分析方法Apriori算法,依次寻找频繁项集,计算相应的置信度和提升度,保证了寻找的变量之间关联规则的可靠性和易解释性。
附图说明
图1是本发明的地震电离层TEC关联分析方法的流程图。
具体实施方式
下面结合附图对本发明的技术方案进行详细的说明。
如图1所示,基于Apriori算法,本发明提出了一种地震电离层TEC关联分析方法,该方法包括:
步骤1)数据收集:
从国际地震中心网站(http://www.isc.ac.uk/isc-ehb/search/catalogue/)下载地震编目数据,时间范围是2000.1.1-2019.12.31。从欧洲定轨中心CODE的ftp上下载电离层TEC数据,时间是2000.1.1-2019.12.31。TEC数据纬度范围是-87.5°—87.5°,经度范围是-180.0°—180.0°空间分辨率是纬度2.5°、经度5°,2000.1.1-2014.10.18的时间分辨率是2小时,2014.10.19-2019.12.31的时间分辨率是1小时。
步骤2)数据预处理;具体包括:
步骤2-1)数据抽取时,将获取的地震编目数据部分地震信息抽取出来,每一行按照时间、纬度、经度、震源深度、震级的顺序重新存储,存储为地震因子数据集;将电离层TEC原始数据从源文件ionex格式中解析成网格数据,每一行按照时间、纬度、经度、TEC值顺序存储,每一列按时间序列存储,存储为TEC数据集;
步骤2-2)统一数据分辨率时,使用线性插值法在时间维度上进行插值,针对同一经纬度上的点,取该时刻附近前后1小时TEC的平均值作为当前时刻TEC值,从而将2000.1.1-2014.10.18期间的数据时间分辨率提升为1小时,2014.10.19-2019.12.31期间的数据时间分辨率保持不变。
步骤2-3)数据拼接时,基于地震事件的时间、纬度、经度,从TEC数据集中寻找匹配的TEC值,并将TEC值与添加到地震因子数据集最后一列,使得每一行按时间、纬度、经度、震源深度、震级、TEC顺序排列,形成地震-TEC数据集。
步骤3)事务集构建;具体包括:
步骤3-1)对于地震-TEC数据集,分别计算地震纬度、经度、震源深度、震级和TEC的最大值Max和最小值Min,并按照各个变量的值域区间等间隔划分变量,得到变量的离散子区间值域范围;
纬度、经度、震源深度、震级、TEC属性变量的最大值和最小值分别记为Max_lat、Min_lat、Max_lon、Min_lon、Max_dep、Min_dep、Max_mag、Min_mag、Max_tec、Min_tec,分别将属性变量等间隔划分为N_lat、N_lon、N_dep、N_mag、N_tec份,得到各个属性变量的区间跨度(Max_lat-Min_lat)/N_lat、(Max_lon-Min_lon)/N_lon、(Max_dep-Min_dep)/N_dep、(Max_mag-Min_mag)/N_mag、(Max_tec-Min_tec)/N_tec.如经度子区间1记为Lon_1,则所有经度属于Min_lon到Min_lon+(Max_lon-Min_lon)/N_lon之间的地震案例的经度属性变量均标记为Lon_1,所有经度属于Min_lon+(Max_lon-Min_lon)/N_lon到Min_lon+2*(Max_lon-Min_lon)/N_lon之间的地震案例经度属性变量均标记为Lon_2。其他属性变量按同样规则进行标记。
步骤3-2)将数据集标记为与属性变量子区间值域范围对应的标记变量后,得到关于地震纬度、经度、震源深度、震级和TEC的标记事务集。
步骤4)对步骤3)中各个属性变量子区间的优化设置;
选取不同的区间划分方式,包括区间等间隔划分和区间自适应划分,分别针对地震纬度、经度、震源深度、震级和TEC统计各自子区间内事务集的频数分布;基于划分后的变量子区间,选择合适的支持度、置信度和提升度阀值,记为Support_min,Confidence_min,Lift_min。
设单个变量X的支持度阀值NX表示变量X的数值区域被划分为NX份(NX为整数),数值区间的长度记作lX,。区间划分原则是:变量X的数值分布越集中于少数稠密区域,划分时lX越小,NX取值越大;变量X的数值分布越均衡,lX越大,NX取值越小。最终的支持度阀值Supportthreshold取地震纬度、经度、震源深度、震级和TEC中支持度阀值最小值/>nvariable表示变量个数,等于5。
置信度阀值Confidencethreshold和提升度阀值Liftthreshold依据用户感兴趣设置,通常Confidencethreshold设置为大于0.5的数值,Liftthreshold设置为大于1的数值,本申请设置Confidencethreshold=0.6,Liftthreshold=1.25。
步骤5)关联规则挖掘
步骤5-1)计算1项集的支持度,筛选出大于支持度阀值的频繁1项集L1;
其中,1项集为:纬度变量、经度变量、深度变量、震级变量和TEC变量;其支持度计算公式为:
Support(A)=P(A)
其中,A代表任意一个1项集;
输出纬度变量中的频繁1项Lat_n1、经度变量频繁1项Lon_n2、深度变量的频繁1项Dep_n3、震级变量的频繁项Mag_n4和TEC变量的频繁1项Tec_n5;
步骤5-2)排列组合出2项集,计算出2项集的支持度,筛选出大于支持度阀值的频繁2项集L2=L1∞L1;
其中,2项集为纬度变量、经度变量、深度变量、震级变量对应的1项集的排列组合:{Lat_n1,Lon_n2}、{Lat_n1,Dep_n3}、{Lat_n1,Tec_n5}……
本申请关注的是地震因子与TEC的关联规则,因此将任意一个纬度变量、经度变量、深度变量、震级变量对应的频繁1项集与TEC变量对应的频繁1项集进行连接,生成候选2项集,计算出候选2项集的支持度,筛选出大于最小支持度的频繁2项集;
在频繁2项集中,以任意一个纬度变量、经度变量、深度变量、震级变量对应的频繁1项集为A,以TEC变量对应的频繁1项集为B,计算置信度:
Confidence(A→B)=P(B|A)=P(A∩B)/P(A)
计算提升度:
根据置信度阈值和提升度阈值,产生A与B的强关联规则。
当关注纬度、经度、深度、震级、TEC任意两个变量之间的关联关系时,也可以将任意一个纬度变量、经度变量、深度变量、震级变量、TEC变量对应的频繁1项集进行两两连接,计算出频繁2项集,在频繁2项集中以任意一个变量对应的频繁1项集为A,另一个变量对应的频繁1项集为B,产生A与B的强关联规则。
步骤5-3)通过连接和剪枝计算出3项集,计算出3项集的支持度,筛选出大于支持度阀值的频繁3项集;
执行连接步骤时,候选频繁项集C3=L2∞L2,C3是L3的超集:
{Lat_n1,Lon_n2}∞{Lat_n1,Dep_n3}={Lat_n1,Lon_n2,Dep_n3},
{Lat_n1,Lon_n2}∞{Lat_n1,Dep_n4}={Lat_n1,Lon_n2,Mag_n4},
{Lon_n2,Dep_n3}∞{Lon_n2,Dep_n4}={Lon_n2,Dep_n3,Mag_n4}
……
执行剪枝步骤时,根据Apriori先验性质,任一频繁项集的所有非空子集也必须是频繁的,即如果某个候选的非空子集不是频繁的,那么该候选肯定不是频繁的,从而将其从将连接步骤所得C3中删除,最终得到L3。
计算其中的频繁2项集与TEC变量的频繁1项集的置信度和提升度,根据置信度阈值和提升度阈值,产生两个地震因子和TEC变量的强关联规则;
步骤5-4)将频繁3项集通过连接和剪枝计算出候选4项集,计算出候选4项集的支持度,筛选出大于支持度阀值的频繁4项集;计算其中的频繁3项集与TEC变量的频繁1项集的置信度和提升度,根据置信度阈值和提升度阈值,产生三个地震因子和TEC变量的强关联规则;
步骤5-5)将频繁4项集通过连接和剪枝计算出候选5项集,计算出候选5项集的支持度,筛选出大于支持度阀值的频繁5项集;计算其中的频繁4项集与TEC变量的频繁1项集的置信度和提升度,根据置信度阈值和提升度阈值,产生四个地震因子和TEC变量的强关联规则。
注意,本申请探寻的是不同变量之间的关联规则,因此以上Lk的连接过程中,同一变量内部不能连接,只能是不同变量之间进行连接。如Lat_1不能连接Lat_2,Lon_1不能连接Lon_2,只能是Lat_1∞Lon_1。
示例:
表1为2014年11月至2019年12月全球5级以上地震因子与电离层TEC变量的置信度和提升度:
表1
最后所应说明的是,以上实施例仅用以说明本发明的技术方案而非限制。尽管参照实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,对本发明的技术方案进行修改或者等同替换,都不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。
Claims (5)
1.一种地震电离层TEC关联分析方法,所述方法包括:
收集地震编目数据和电离层TEC数据;
从地震编目数据和电离层TEC数据中抽取数据,处理后按时空关系拼接组合,构造地震-TEC数据集;
针对地震-TEC数据集,分别计算地震纬度、经度、震源深度、震级和TEC的最大值和最小值,并按照各个变量的值域区间等间隔划分变量,得到变量的离散子区间值域范围;
统计各个子区间内事务集的频数分布结果,依据事务项聚集在不同子区间分布的稀疏程度,进行区间自适应分段,基于划分后的变量子区间的区间编号来构建标注的事务集;
采用Apriori算法对标注的事务集进行处理,输出地震因子与电离层TEC之间的关联规则,所述地震因子为地震纬度、经度、震源深度和震级中一个或多个组合;
所述从地震编目数据和电离层TEC数据中抽取数据,处理后按时空关系拼接组合,构造地震-TEC数据集,具体包括:
将地震编目数据中的地震信息抽取出来,每一行按照时间、纬度、经度、震源深度和震级的顺序重新存储,存储为地震因子数据集;
将电离层TEC原始数据从源文件ionex格式中解析成网格数据,每一行按照时间、纬度、经度、TEC值顺序存储,每一列按时间序列存储,存储为TEC数据集;对TEC数据集中的TEC值进行统一数据分辨率处理;
基于地震事件的时间、纬度和经度,从TEC数据集中寻找匹配的TEC值,并将TEC值与添加到地震因子文件最后一列,使得每一行按时间、纬度、经度、震源深度、震级、TEC顺序排列,存储为地震-TEC数据集;
所述针对地震-TEC数据集,分别计算地震纬度、经度、震源深度、震级和TEC的最大值和最小值,并按照各个变量的值域区间等间隔划分变量,得到变量的离散子区间值域范围;由此构建标注的事务集,具体包括:
在地震-TEC数据集中,将纬度属性变量的最大值和最小值分别记为Max_lat和Min_lat,将该属性变量等间隔划分为N_lat份,得到该属性变量的区间跨度为(Max_lat-Min_lat)/N_lat,则将所有属于Min_lat+n1*(Max_lat-Min_lat)/N_lat到Min_lat+(n1+1)*(Max_lat-Min_lat)/N_lat之间的地震案例纬度属性变量均标记为Lat_n1;其中0≤n1≤N_lat-1;
将经度属性变量的最大值和最小值分别记为Max_lon和Min_lon,将该属性变量等间隔划分为N_lon份,得到该属性变量的区间跨度为(Max_lon-Min_lon)/N_lon,则将所有属于Min_lon+n2*(Max_lon-Min_lon)/N_lon到Min_lon+(n2+1)*(Max_lon-Min_lon)/N_lon之间的地震案例经度属性变量均标记为Lon_n2;其中0≤n2≤N_lon-1;
将震源深度属性变量的最大值和最小值分别记为Max_dep和Min_dep,将该属性变量等间隔划分为N_dep份,得到该属性变量的区间跨度为(Max_dep-Min_dep)/N_dep,则将所有属于Min_dep+n3*(Max_dep-Min_dep)/N_dep到Min_dep+(n3+1)*(Max_dep-Min_dep)/N_dep之间的地震案例的震源深度属性变量均标记为Dep_n3;其中0≤n3≤N_dep-1;
将震级属性变量的最大值和最小值分别记为Max_mag和Min_mag,将该属性变量等间隔划分为N_mag份,得到该属性变量的区间跨度为(Max_mag-Min_mag)/N_mag,则将所有属于Min_mag+n4*(Max_mag-Min_mag)/N_mag到Min_mag+(n4+1)*(Max_mag-Min_mag)/N_mag之间的地震案例的震级属性变量均标记为Mag_n4;其中0≤n4≤N_mag-1;
将TEC属性变量的最大值和最小值分别记为Max_tec和Min_tec,将该属性变量等间隔划分为N_tec份,得到该属性变量的区间跨度为(Max_tec-Min_tec)/N_tec,则将所有属于Min_tec+n5*(Max_tec-Min_tec)/N_tec到Min_tec+(n5+1)*(Max_tec-Min_tec)/N_tec之间的地震案例的TEC属性变量均标记为Tec_n5;其中0≤n5≤N_Tec-1;
将数据集标记为与属性变量子区间值域范围对应的标记变量后,得到关于地震纬度、经度、震源深度、震级和TEC的标记事务集;
所述采用Apriori算法对标注的事务集进行处理,输出地震因子与电离层TEC之间的关联规则,具体包括:
步骤S1)根据标记事务集的区间划分选择合适的支持度阈值,并设置置信度阈值和提升度阈值;
步骤S2)分别计算五个1项集的支持度,筛选出大于支持度阈值的五个频繁1项集,其中,五个1项集包括纬度、经度、震源深度、震级和TEC变量对应的1项集;
步骤S3)以任意一个纬度变量、经度变量、深度变量、震级变量对应的频繁1项集与TEC变量对应的频繁1项集进行连接,生成候选2项集;计算出候选2项集的支持度,筛选出大于最小支持度的频繁2项集;计算置信度和提升度,并根据置信度阈值和提升度阈值,产生一个地震因子与TEC的强关联规则;
步骤S4)将频繁2项集通过连接和剪枝计算出候选3项集,计算出候选3项集的支持度,筛选出大于支持度阈值的频繁3项集;计算其中的频繁2项集与TEC变量的频繁1项集的置信度和提升度,根据置信度阈值和提升度阈值,产生两个地震因子和TEC变量的强关联规则;
步骤S5)将频繁3项集通过连接和剪枝计算出候选4项集,计算出候选4项集的支持度,筛选出大于支持度阈值的频繁4项集;计算其中的频繁3项集与TEC变量的频繁1项集的置信度和提升度,根据置信度阈值和提升度阈值,产生三个地震因子和TEC变量的强关联规则;
步骤S6)将频繁4项集通过连接和剪枝计算出候选5项集,计算出候选5项集的支持度,筛选出大于支持度阈值的频繁5项集;计算其中的频繁4项集与TEC变量的频繁1项集的置信度和提升度,根据置信度阈值和提升度阈值,产生四个地震因子和TEC变量的强关联规则。
2.根据权利要求1所述的地震电离层TEC关联分析方法,其特征在于,所述对TEC数据集中的TEC值进行统一数据分辨率处理,具体为:
使用线性插值法在时间维度上对TEC数据集的TEC值进行插值,针对同一经纬度上的点,取该时刻附近前后1小时TEC的平均值作为当前时刻TEC值,从而将2014年10月18日之前的数据时间分辨率提升为1小时,而2014年10月19日以后的数据时间分辨率保持不变。
3.根据权利要求1所述的地震电离层TEC关联分析方法,其特征在于,所述根据标记事务集的区间划分选择合适的支持度阈值,具体包括:
对于标记事务集中的5个属性变量:地震纬度、经度、震源深度、震级和TEC,分别进行区间划分,NX表示变量X的数值区域被划分为NX份,NX为整数;数值区间的长度记作lX,区间划分的原则是:变量X的数值分布越集中于少数稠密区域,划分时lX越小,NX取值越大;变量X的数值分布越均衡,lX越大,NX取值越小;
根据单个变量X的支持度阈值分别计算5个属性变量的支持度阈值;取地震纬度、经度、震源深度、震级和TEC中支持度阈值的最小值为Support_Xthreshold;
则支持度阈值nvariable表示变量个数,nvariable=5。
4.根据权利要求3所述的地震电离层TEC关联分析方法,其特征在于,所述步骤S2)中,分别计算五个1项集的支持度,筛选出大于支持度阈值的五个频繁1项集;具体包括:
计算1项集的支持度,其中,1项集为:纬度变量、经度变量、深度变量、震级变量和TEC变量;其支持度计算公式为:
Support(A)=P(A)
其中,A代表任意一个1项集,P(A)为A的概率;
筛选出支持度大于支持度阈值的频繁1项集;输出纬度变量中的频繁1项Lat_n1、经度变量频繁1项Lon_n2、深度变量的频繁1项Dep_n3、震级变量的频繁项Mag_n4和TEC变量的频繁1项Tec_n5。
5.根据权利要求4所述的地震电离层TEC关联分析方法,其特征在于,所述步骤S3)中,计算置信度和提升度,并根据置信度阈值和提升度阈值,产生一个地震因子与TEC的强关联规则,具体包括:
在频繁2项集中,以任意一个纬度变量、经度变量、深度变量、震级变量对应的频繁1项集为A,以TEC变量对应的频繁1项集为B,计算A→B的置信度:
Confidence(A→B)=P(B|A)=P(A∩B)/P(A)
计算A→B的提升度:
然后根据置信度阈值和提升度阈值,产生A与B的强关联规则,即一个地震因子与TEC的强关联规则。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010128083.8A CN113325469B (zh) | 2020-02-28 | 2020-02-28 | 一种地震电离层tec关联分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010128083.8A CN113325469B (zh) | 2020-02-28 | 2020-02-28 | 一种地震电离层tec关联分析方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113325469A CN113325469A (zh) | 2021-08-31 |
CN113325469B true CN113325469B (zh) | 2023-10-13 |
Family
ID=77412599
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010128083.8A Active CN113325469B (zh) | 2020-02-28 | 2020-02-28 | 一种地震电离层tec关联分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113325469B (zh) |
Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2217779C2 (ru) * | 2001-04-16 | 2003-11-27 | Московский государственный университет леса | Способ обнаружения очагов землетрясений |
US7277797B1 (en) * | 2005-03-29 | 2007-10-02 | Kunitsyn Viatcheslav E | Prediction system and method |
RU2009143759A (ru) * | 2009-11-26 | 2011-06-10 | Открытое акционерное общество "Российская корпорация ракетно-космического приборостроения и информационных систем" (ОАО "Российские к | Способ прогнозирования времени сильных коровых землетрясений суши |
WO2013152200A1 (en) * | 2012-04-04 | 2013-10-10 | Cornell University | System and methods for risk prediction and assessment |
UA103986C2 (ru) * | 2013-07-16 | 2013-12-10 | Институт Технической Механики Национальной Академии Наук Украины И Государственного Космического Агентства Украины | Способ идентификации и прогнозирования локализации эпицентров землетрясений |
WO2015025340A1 (ja) * | 2013-08-20 | 2015-02-26 | 株式会社環太平洋地殻変動解析 | 地震発生予測情報提供方法、地震発生予測情報提供システム、地震発生予測情報提供プログラム及び地震発生予測情報提供プログラムを記録したコンピュータ読み取り可能な媒体 |
CN106021710A (zh) * | 2016-05-13 | 2016-10-12 | 南京航空航天大学 | 基于大气电离层参数的震前卫星轨道异常识别方法 |
JP2016218069A (ja) * | 2015-05-25 | 2016-12-22 | 国立大学法人北海道大学 | 地震発生予測装置、地震発生予測方法およびコンピュータプログラム |
CN107356979A (zh) * | 2017-05-27 | 2017-11-17 | 淮海工学院 | 一种电离层tec异常探测的方法 |
JP2018081065A (ja) * | 2016-11-20 | 2018-05-24 | みらい地震予測株式会社 | 地震予報システム及び予報方法 |
TW201833587A (zh) * | 2017-03-13 | 2018-09-16 | 顏伯聰 | 地震預測方法與系統 |
WO2018208271A2 (en) * | 2016-12-28 | 2018-11-15 | Mustafa Ulukavak | Continuous ionospheric tec earthquake monitoring system |
RU2676235C1 (ru) * | 2017-11-03 | 2018-12-26 | Акционерное общество "Российская корпорация ракетно-космического приборостроения и информационных систем" (АО "Российские космические системы") | Способ краткосрочного прогноза землетрясений по данным вертикального зондирования ионосферы с ионозонда |
CN109507724A (zh) * | 2018-11-01 | 2019-03-22 | 中国石油大学(华东) | 一种基于非震动态背景场的地震tec异常信息提取方法 |
CN109683196A (zh) * | 2018-11-15 | 2019-04-26 | 天津大学青岛海洋技术研究院 | 一种电离层与地震前兆相关量时空特性分析方法 |
CN110045413A (zh) * | 2019-04-22 | 2019-07-23 | 中国地质大学(北京) | 一种地震短期预测方法和装置 |
-
2020
- 2020-02-28 CN CN202010128083.8A patent/CN113325469B/zh active Active
Patent Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2217779C2 (ru) * | 2001-04-16 | 2003-11-27 | Московский государственный университет леса | Способ обнаружения очагов землетрясений |
US7277797B1 (en) * | 2005-03-29 | 2007-10-02 | Kunitsyn Viatcheslav E | Prediction system and method |
RU2009143759A (ru) * | 2009-11-26 | 2011-06-10 | Открытое акционерное общество "Российская корпорация ракетно-космического приборостроения и информационных систем" (ОАО "Российские к | Способ прогнозирования времени сильных коровых землетрясений суши |
WO2013152200A1 (en) * | 2012-04-04 | 2013-10-10 | Cornell University | System and methods for risk prediction and assessment |
UA103986C2 (ru) * | 2013-07-16 | 2013-12-10 | Институт Технической Механики Национальной Академии Наук Украины И Государственного Космического Агентства Украины | Способ идентификации и прогнозирования локализации эпицентров землетрясений |
WO2015025340A1 (ja) * | 2013-08-20 | 2015-02-26 | 株式会社環太平洋地殻変動解析 | 地震発生予測情報提供方法、地震発生予測情報提供システム、地震発生予測情報提供プログラム及び地震発生予測情報提供プログラムを記録したコンピュータ読み取り可能な媒体 |
JP2016218069A (ja) * | 2015-05-25 | 2016-12-22 | 国立大学法人北海道大学 | 地震発生予測装置、地震発生予測方法およびコンピュータプログラム |
CN106021710A (zh) * | 2016-05-13 | 2016-10-12 | 南京航空航天大学 | 基于大气电离层参数的震前卫星轨道异常识别方法 |
JP2018081065A (ja) * | 2016-11-20 | 2018-05-24 | みらい地震予測株式会社 | 地震予報システム及び予報方法 |
WO2018208271A2 (en) * | 2016-12-28 | 2018-11-15 | Mustafa Ulukavak | Continuous ionospheric tec earthquake monitoring system |
TW201833587A (zh) * | 2017-03-13 | 2018-09-16 | 顏伯聰 | 地震預測方法與系統 |
CN107356979A (zh) * | 2017-05-27 | 2017-11-17 | 淮海工学院 | 一种电离层tec异常探测的方法 |
RU2676235C1 (ru) * | 2017-11-03 | 2018-12-26 | Акционерное общество "Российская корпорация ракетно-космического приборостроения и информационных систем" (АО "Российские космические системы") | Способ краткосрочного прогноза землетрясений по данным вертикального зондирования ионосферы с ионозонда |
CN109507724A (zh) * | 2018-11-01 | 2019-03-22 | 中国石油大学(华东) | 一种基于非震动态背景场的地震tec异常信息提取方法 |
CN109683196A (zh) * | 2018-11-15 | 2019-04-26 | 天津大学青岛海洋技术研究院 | 一种电离层与地震前兆相关量时空特性分析方法 |
CN110045413A (zh) * | 2019-04-22 | 2019-07-23 | 中国地质大学(北京) | 一种地震短期预测方法和装置 |
Non-Patent Citations (8)
Title |
---|
2012年北大北京本校站电离层TEC和闪烁指数集;李灵樨;张东和;邹自明;钟佳;胡晓彦;纪珍;郝永强;;《中国科学数据》(第03期);21-29 * |
Pre-earthquake ionospheric anomalies before three major earthquakes by GPS-TEC and GIM-TEC data during 2015–2017;Tariq, M. A., Shah, M., Hernández-Pajares, M., & Iqbal, T;《Advances in Space Research》;第63卷(第7期);2088-2099 * |
Pre-earthquake ionospheric anomalies registered by continuous GPS TEC measurements. In Annales geophysicae;Liu, J. Y., Chuo, Y. J., Shan, S. J., Tsai, Y. B., Chen, Y. I., Pulinets, S. A., & Yu, S. B.;《Göttingen, Germany: Copernicus Publications》;第22卷(第5期);1585-1593 * |
The algorithm of density visualization of magnetic flux lines based on geo-magnetic dipole field;ZHONG, J., & ZOU, Z. M.;《Progress in Geophysics》;第29卷(第6期);2614-2619 * |
地磁偶极子场磁力线疏密可视化算法;钟佳;邹自明;;《地球物理学进展》(第06期);138-143 * |
地震期间电离层扰动现象研究;蔡军涛;赵国泽;詹艳;汤吉;陈小斌;;《地球物理学进展》(第03期);41-47 * |
美国加利福尼亚州M6.0地震前电离层TEC异常分析;黄智;《科技导报》(第04期);24-29 * |
震前电离层TEC异常扰动的研究;林剑;吴云;祝芙英;;《武汉大学学报(信息科学版)》(第08期);97-100 * |
Also Published As
Publication number | Publication date |
---|---|
CN113325469A (zh) | 2021-08-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Bloomfield et al. | A comparison of network and clustering methods to detect biogeographical regions | |
Beyene et al. | The characteristics and chronology of the earliest Acheulean at Konso, Ethiopia | |
Lambshead et al. | Marine nematode deep‐sea biodiversity–hyperdiverse or hype? | |
US20110276565A1 (en) | Collaborative Location and Activity Recommendations | |
CN110045413B (zh) | 一种地震短期预测方法和装置 | |
CN106202430A (zh) | 基于关联规则的直播平台用户兴趣度挖掘系统及挖掘方法 | |
Reece et al. | Historical perspectives on population genetics and conservation of three marine turtle species | |
CN111291243A (zh) | 一种人物事件的时空信息不确定性的可视化推理方法 | |
Palacio-Castro et al. | Increased dominance of heat-tolerant symbionts creates resilient coral reefs in near-term ocean warming | |
Yuan et al. | Multi-granularity periodic activity discovery for moving objects | |
Vallianatos et al. | The evolution of preseismic patterns related to the central crete (Mw6. 0) strong earthquake on 27 September 2021 revealed by multiresolution wavelets and natural time analysis | |
Mazzoni et al. | Relational database used for ground-motion model development in the NGA-Sub project | |
Varotsos et al. | Order parameter and entropy of seismicity in natural time before major earthquakes: recent results | |
Wiertz et al. | The rise of the nones across the United States, 1973 to 2018: State-level trends of religious affiliation and participation in the general social survey | |
CN113325469B (zh) | 一种地震电离层tec关联分析方法 | |
Costa et al. | Near-real-time strong motion acquisition at national scale and automatic analysis | |
Mantas et al. | Mediterranean Sea shelters for the gold coral Savalia savaglia (Bertoloni, 1819): An assessment of potential distribution of a rare parasitic species | |
Slejko et al. | Seismic hazard estimates for the Vittorio Veneto broader area (NE Italy) | |
Assis et al. | Kelp forest diversity under projected end‐of‐century climate change | |
Chen et al. | A paradigm for developing earthquake probability forecasts based on geoelectric data | |
Nurtas et al. | Predicting the Likelihood of an Earthquake by Leveraging Volumetric Statistical Data through Machine Learning Techniques | |
Brancato et al. | Pattern recognition for flank eruption forecasting: an application at Mount Etna volcano (Sicily, Italy) | |
Bragato et al. | Decreasing rate of M≥ 7 earthquakes in the northern hemisphere since 1900 | |
Adomat et al. | Mass occurrence of the large solitary rugose coral Phaulactis angusta at the boundary Lower/Upper Visby Formation in the Silurian of Gotland, Sweden: palaeoecology and depositional implications | |
CN106910132A (zh) | Top‑k可决策的负序列模式在客户投保行为分析中的应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |