CN106599264B - 一种基于大数据的突发事件演化推理方法及系统 - Google Patents
一种基于大数据的突发事件演化推理方法及系统 Download PDFInfo
- Publication number
- CN106599264B CN106599264B CN201611198487.4A CN201611198487A CN106599264B CN 106599264 B CN106599264 B CN 106599264B CN 201611198487 A CN201611198487 A CN 201611198487A CN 106599264 B CN106599264 B CN 106599264B
- Authority
- CN
- China
- Prior art keywords
- item
- subevent
- support
- case
- regularization term
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
- G06F16/24564—Applying rules; Deductive queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2216/00—Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
- G06F2216/03—Data mining
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于大数据的突发事件演化推理方法及系统,将数据库中的案例进行整合得到子事件链集合,将子事件链集合作为算法的输入,通过算法得到强、弱规则项集,从大于支持度的集合中,获得强规则项集,从小于或等于支持度的集合中,获得弱规则项集,其中,强规则项集作为常规突发事件演变可能路径,而弱规则项集作为非常规突发事件演变可能路径,并将强、弱规则项集作为推理的依据,从案例库中挖掘到最可能发生的后续子事件集合以及发生概率极小的后续子事件集合,可以改善Apriori算法只针对强规则项集的推论,将计算过程中强弱规则项集区分,均保留为目标数据。
Description
技术领域
本发明属于数据挖掘技术领域,更具体地,涉及一种基于大数据的突发事件演化推理方法及系统。
背景技术
数据挖掘也称为在数据库中进行知识发现,数据挖掘的目的是从大型数据库中抽象出感兴趣的知识。从抽象模式来分析,决策过程可以很容易被完成。关联规则主要是基于发现频繁项集,零售店经常使用关联规则来协助营销,广告,库存控制,预测电信网络中的故障,其中主要使用的是关联规则算法Apriori算法,Apriori算法是一种挖掘关联规则的频繁项集算法,其核心思想是通过候选集生成和情节的向下封闭检测两个阶段来挖掘频繁项集。
随着非常规突发事件的发生越来越频繁,然而当前的突发事件预警预测方法大多从突发事件案例的宏观信息(如事件类型、资源类型等)出发,利用CBR、基于规则的推理(Rule-Based Reasoning,RBR)、基于模型的推理(Model-based Reasoning,MBR)等方法,然而采用上述方法并不能将案例最原本的信息关系挖掘出来,同时在一定程度上忽略了常规突发事件与非常规突发事件的区别,具有一定的局限性。
发明内容
针对现有技术的以上缺陷或改进需求,本发明提供了一种基于大数据的突发事件演化推理方法及系统,在Apriori算法的基础上得到改进的推理算法,利用结构化的突发事件案例库的相关信息从突发事件的子事件链出发,可以从案例库中挖掘到最可能发生的后续子事件集合以及发生概率极小的后续子事件集合。由此解决现有技术中对案例推理忽略案例基本信息间关系的缺陷,以及忽略了常规突发事件与非常规突发事件的区别的技术问题。
为实现上述目的,按照本发明的一个方面,提供了一种基于大数据的突发事件演化推理方法,包括:
(1)获取预设案例库中所有的案例,遍历每个案例的子事件,根据各案例中子事件发生时间的先后顺序形成每个案例的子事件链;
(2)针对每个案例的子事件链,获取各案例对应的子事件链的二项集至n项集,其中,n为正整数;
(3)将k项集中的各项进行两两比较,若比较的两项中存在相同的子事件,则进行合并得到合并项,比较合并项与k+1项集中的各项,若k+1 项集中不包含合并项,则使合并项成为k+1项集的元素,其中,k=2 ,…,n-1;
(4)以步骤(1)得到的所有子事件链以及步骤(3)得到的所有项集作为输入,依据Apriori算法得到1项集,将1项集中居中的概率作为支持度,比较1项集中各元素的概率与支持度的关系,将大于支持度的元素按照Apriori算法求解并不断选择大于支持度的项,剔除在求解过程中产生的小于或等于支持度的项,直至得到强规则项,将1项集中小于或等于支持度的元素按照Apriori算法求解并不断选择小于或等于支持度的项,剔除在求解过程中产生的大于支持度的项,直至得到弱规则项;
(5)根据用户输入的事件信息,以强规则项和弱规则项为依据,得到后续将会发生的子事件集合。
按照本发明的另一方面,提供了一种基于大数据的突发事件演化推理系统,包括:
子事件链生成模块,用于获取预设案例库中所有的案例,遍历每个案例的子事件,根据各案例中子事件发生时间的先后顺序形成每个案例的子事件链;
项集生成模块,用于针对每个案例的子事件链,获取各案例对应的子事件链的二项集至n项集,其中,n为正整数;
合成模块,用于将k项集中的各项进行两两比较,若比较的两项中存在相同的子事件,则进行合并得到合并项,比较合并项与k+1项集中的各项,若k+1项集中不包含合并项,则使合并项成为k+1项集的元素,其中, k=2 ,…,n-1;
强弱规则项生成模块,用于以子事件链生成模块得到的所有子事件链以及合成模块得到的所有项集作为输入,依据Apriori算法得到1项集,将 1项集中居中的概率作为支持度,比较1项集中各元素的概率与支持度的关系,将大于支持度的元素按照Apriori算法求解并不断选择大于支持度的项,剔除在求解过程中产生的小于或等于支持度的项,直至得到强规则项,将1 项集中小于或等于支持度的元素按照Apriori算法求解并不断选择小于或等于支持度的项,剔除在求解过程中产生的大于支持度的项,直至得到弱规则项;
事件推理模块,用于根据用户输入的事件信息,以强规则项和弱规则项为依据,得到后续将会发生的子事件集合。
总体而言,通过本发明所构思的以上技术方案与现有技术相比,主要有以下的技术优点:数据集合不固定,将数据源进行关联组合与Apriori算法的固定数据集合不同;改善Apriori算法只针对强规则项集的推论,将计算过程中强弱规则项集区分,均保留为目标数据。
附图说明
图1为本发明实施例公开的一种基于大数据的突发事件演化推理方法的流程示意图;
图2为本发明实施例公开的一种基于大数据的突发事件演化推理系统的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
图1为本发明实施例公开的一种基于大数据的突发事件演化推理方法的流程示意图,在图1所示的方法中具体包括以下步骤:
(1)获取预设案例库中所有的案例,遍历每个案例的子事件,根据各案例中子事件发生时间的先后顺序形成每个案例的子事件链;
(2)针对每个案例的子事件链,获取各案例对应的子事件链的二项集至n项集,其中,n为正整数;
(3)将k项集中的各项进行两两比较,若比较的两项中存在相同的子事件,则进行合并得到合并项,比较合并项与k+1项集中的各项,若k+1 项集中不包含合并项,则使合并项成为k+1项集的元素,其中,k=2 ,…,n-1;
(4)以步骤(1)得到的所有子事件链以及步骤(3)得到的所有项集作为输入,依据Apriori算法得到1项集,将1项集中居中的概率作为支持度,比较1项集中各元素的概率与支持度的关系,将大于支持度的元素按照Apriori算法求解并不断选择大于支持度的项,剔除在求解过程中产生的小于或等于支持度的项,直至得到强规则项,将1项集中小于或等于支持度的元素按照Apriori算法求解并不断选择小于或等于支持度的项,剔除在求解过程中产生的大于支持度的项,直至得到弱规则项;
(5)根据用户输入的事件信息,以强规则项和弱规则项为依据,得到后续将会发生的子事件集合。
通过图1所示的方法得到的数据集合不固定,并可以将数据源进行关联组合,并且可以区分强弱规则项,依据强弱规则项得到常规突发事件演变的可能路径或非常规突发事件演变的可能路径。
为了便于对本发明提出的基于大数据的突发事件演化推理方法的理解,下面以一个具体的例子来描述该方法中数据集的实现过程。假设有如下三条事件链:
案例1:A1→B1→C1→D1→E1
案例2:A2→C1→B2→D3
案例3:A1→B2→C1→D3
针对每个案例的子事件链,获取子事件链的二项集\三项集\…\n项集:
进行元素合并得到合并之后的项集:
I)Al Bl Cl B2 D3
2)A1 B2 C1 D3
3)……
针对每一条子事件链以及合并之后的项集,利用Apriori算法分别求出强规则项以及出现概率极低的项(即弱规则项)。最终推理出与用户输入的事件对应的后续可能发生的事件集合。
图2所示为本法实施例公开的一种基于大数据的突发事件演化推理系统,在图2所示的系统中包括:
子事件链生成模块,用于获取预设案例库中所有的案例,遍历每个案例的子事件,根据各案例中子事件发生时间的先后顺序形成每个案例的子事件链;
项集生成模块,用于针对每个案例的子事件链,获取各案例对应的子事件链的二项集至n项集,其中,n为正整数;
合成模块,用于将k项集中的各项进行两两比较,若比较的两项中存在相同的子事件,则进行合并得到合并项,比较合并项与k+1项集中的各项,若k+1项集中不包含合并项,则使合并项成为k+1项集的元素,其中, k=2 ,…,n-1;
强弱规则项生成模块,用于以子事件链生成模块得到的所有子事件链以及合成模块得到的所有项集作为输入,依据Apriori算法得到1项集,将 1项集中居中的概率作为支持度,比较1项集中各元素的概率与支持度的关系,将大于支持度的元素按照Apriori算法求解并不断选择大于支持度的项,剔除在求解过程中产生的小于或等于支持度的项,直至得到强规则项,将1 项集中小于或等于支持度的元素按照Apriori算法求解并不断选择小于或等于支持度的项,剔除在求解过程中产生的大于支持度的项,直至得到弱规则项;
事件推理模块,用于根据用户输入的事件信息,以强规则项和弱规则项为依据,得到后续将会发生的子事件集合。
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (2)
1.一种基于大数据的突发事件演化推理方法,其特征在于,包括:
(1)获取预设案例库中所有的案例,遍历每个案例的子事件,根据各案例中子事件发生时间的先后顺序形成每个案例的子事件链;
(2)针对每个案例的子事件链,获取各案例对应的子事件链的二项集至n项集,其中,n为正整数;
(3)将k项集中的各项进行两两比较,若比较的两项中存在相同的子事件,则进行合并得到合并项,比较合并项与k+1项集中的各项,若k+1项集中不包含合并项,则使合并项成为k+1项集的元素,其中,k=2,…,n-1;
(4)以步骤(1)得到的所有子事件链以及步骤(3)得到的所有项集作为输入,依据Apriori算法得到1项集,将1项集中居中的概率作为支持度,比较1项集中各元素的概率与支持度的关系,将大于支持度的元素按照Apriori算法求解并不断选择大于支持度的项,剔除在求解过程中产生的小于或等于支持度的项,直至得到强规则项,将1项集中小于或等于支持度的元素按照Apriori算法求解并不断选择小于或等于支持度的项,剔除在求解过程中产生的大于支持度的项,直至得到弱规则项;
(5)根据用户输入的事件信息,以强规则项和弱规则项为依据,得到后续将会发生的子事件集合。
2.一种基于大数据的突发事件演化推理系统,其特征在于,包括:
子事件链生成模块,用于获取预设案例库中所有的案例,遍历每个案例的子事件,根据各案例中子事件发生时间的先后顺序形成每个案例的子事件链;
项集生成模块,用于针对每个案例的子事件链,获取各案例对应的子事件链的二项集至n项集,其中,n为正整数;
合成模块,用于将k项集中的各项进行两两比较,若比较的两项中存在相同的子事件,则进行合并得到合并项,比较合并项与k+1项集中的各项,若k+1项集中不包含合并项,则使合并项成为k+1项集的元素,其中,k=2,…,n-1;
强弱规则项生成模块,用于以子事件链生成模块得到的所有子事件链以及合成模块得到的所有项集作为输入,依据Apriori算法得到1项集,将1项集中居中的概率作为支持度,比较1项集中各元素的概率与支持度的关系,将大于支持度的元素按照Apriori算法求解并不断选择大于支持度的项,剔除在求解过程中产生的小于或等于支持度的项,直至得到强规则项,将1项集中小于或等于支持度的元素按照Apriori算法求解并不断选择小于或等于支持度的项,剔除在求解过程中产生的大于支持度的项,直至得到弱规则项;
事件推理模块,用于根据用户输入的事件信息,以强规则项和弱规则项为依据,得到后续将会发生的子事件集合。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611198487.4A CN106599264B (zh) | 2016-12-22 | 2016-12-22 | 一种基于大数据的突发事件演化推理方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611198487.4A CN106599264B (zh) | 2016-12-22 | 2016-12-22 | 一种基于大数据的突发事件演化推理方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106599264A CN106599264A (zh) | 2017-04-26 |
CN106599264B true CN106599264B (zh) | 2019-07-19 |
Family
ID=58602811
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611198487.4A Active CN106599264B (zh) | 2016-12-22 | 2016-12-22 | 一种基于大数据的突发事件演化推理方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106599264B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108734402B (zh) * | 2018-05-23 | 2021-06-11 | 华中科技大学 | 基于虚拟案例的非常规突发事件应急管理决策方法及系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101888309A (zh) * | 2010-06-30 | 2010-11-17 | 中国科学院计算技术研究所 | 在线日志分析方法 |
CN102685180A (zh) * | 2011-10-18 | 2012-09-19 | 国网电力科学研究院 | 一种面向云计算的网络安全预警方法 |
CN104598569A (zh) * | 2015-01-12 | 2015-05-06 | 北京航空航天大学 | 一种基于关联规则的mbd数据集完整性检查方法 |
CN105787610A (zh) * | 2014-12-18 | 2016-07-20 | 中国科学院沈阳自动化研究所 | 一种支持时间序列匹配的案例推理方法 |
CN105956598A (zh) * | 2015-09-26 | 2016-09-21 | 朱怡安 | 一种离散事件系统事件不完备模型的诊断方法 |
CN106228244A (zh) * | 2016-07-12 | 2016-12-14 | 深圳大学 | 一种基于自适应关联规则挖掘的能源解聚合方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103295147B (zh) * | 2012-03-02 | 2017-02-15 | 华为技术有限公司 | 投放广告的方法、装置和系统 |
-
2016
- 2016-12-22 CN CN201611198487.4A patent/CN106599264B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101888309A (zh) * | 2010-06-30 | 2010-11-17 | 中国科学院计算技术研究所 | 在线日志分析方法 |
CN102685180A (zh) * | 2011-10-18 | 2012-09-19 | 国网电力科学研究院 | 一种面向云计算的网络安全预警方法 |
CN105787610A (zh) * | 2014-12-18 | 2016-07-20 | 中国科学院沈阳自动化研究所 | 一种支持时间序列匹配的案例推理方法 |
CN104598569A (zh) * | 2015-01-12 | 2015-05-06 | 北京航空航天大学 | 一种基于关联规则的mbd数据集完整性检查方法 |
CN105956598A (zh) * | 2015-09-26 | 2016-09-21 | 朱怡安 | 一种离散事件系统事件不完备模型的诊断方法 |
CN106228244A (zh) * | 2016-07-12 | 2016-12-14 | 深圳大学 | 一种基于自适应关联规则挖掘的能源解聚合方法 |
Non-Patent Citations (3)
Title |
---|
基于应急实例本体模型的应急案例推理方法;蔡玫等;《情报杂志》;20160618(第06期);第183-188页 |
基于贝叶斯网络的突发事件预测模型;裘江南等;《系统管理学报》;20110115(第01期);第98-103页 |
案例推理和规则推理结合的紧急预案信息系统;张建华等;《同济大学学报(自然科学版)》;20020730(第07期);第890-894页 |
Also Published As
Publication number | Publication date |
---|---|
CN106599264A (zh) | 2017-04-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102274389B1 (ko) | 센서 데이터를 이용한 이상패턴 탐지 모델 구축 방법 및 이를 이용한 이상 탐지 장치 및 방법 | |
Witlox et al. | The application of rough sets analysis in activity-based modelling. Opportunities and constraints | |
CN106649550B (zh) | 一种基于代价敏感学习的联合知识嵌入方法 | |
CN109255505A (zh) | 一种多模型融合神经网络的短期负荷预测方法 | |
Xia et al. | Deciphering spatio-temporal graph forecasting: A causal lens and treatment | |
CN102592093B (zh) | 一种基于生物免疫机制的主机入侵检测方法 | |
CN110826702A (zh) | 一种多任务深度网络的异常事件检测方法 | |
Zhang et al. | Trusted multi-source information fusion for fault diagnosis of electromechanical system with modified graph convolution network | |
Fan et al. | A two-layer Wang-Mendel fuzzy approach for predicting the residuary resistance of sailing yachts | |
CN106599264B (zh) | 一种基于大数据的突发事件演化推理方法及系统 | |
Li et al. | DiffTAD: Denoising diffusion probabilistic models for vehicle trajectory anomaly detection | |
Liu et al. | Simple primitives with feasibility-and contextuality-dependence for open-world compositional zero-shot learning | |
Jin et al. | A visual analytics system for improving attention-based traffic forecasting models | |
CN118013135A (zh) | 基于关系图卷积神经网络的图对比学习推荐方法 | |
CN117671952A (zh) | 基于时空同步动态图注意力网络的交通流预测方法及系统 | |
Li et al. | Learning to detect traffic incidents from data based on tree augmented naive bayesian classifiers | |
Singh et al. | A Directed Graph and GRUs Based Trajectory Forecasting of Intelligent and Automated Transportation System for Consumer Electronics | |
Ramirez-Alcocer et al. | Predicting incidents of crime through LSTM neural networks in smart city domain | |
Zhang et al. | Machine Learning‐Based Multitarget Tracking of Motion in Sports Video | |
Jiang et al. | Fault Diagnosis of Gearbox in Multiple Conditions Based on Fine‐Grained Classification CNN Algorithm | |
Atef et al. | On Some Types of Covering‐Based ℐ, T‐Fuzzy Rough Sets and Their Applications | |
CN113835973B (zh) | 一种模型训练方法及相关装置 | |
Ngoc Phien et al. | A comparison between deep belief network and LSTM in chaotic time series forecasting | |
CN109635008A (zh) | 一种基于机器学习的设备故障检测方法 | |
Hruschka Jr et al. | Variable ordering for bayesian networks learning from data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |