CN110866624A - 化工事故预测方法和系统 - Google Patents
化工事故预测方法和系统 Download PDFInfo
- Publication number
- CN110866624A CN110866624A CN201810981022.9A CN201810981022A CN110866624A CN 110866624 A CN110866624 A CN 110866624A CN 201810981022 A CN201810981022 A CN 201810981022A CN 110866624 A CN110866624 A CN 110866624A
- Authority
- CN
- China
- Prior art keywords
- accident
- chemical
- news
- chemical accident
- keyword
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000000126 substance Substances 0.000 title claims abstract description 229
- 238000000034 method Methods 0.000 title claims abstract description 34
- 230000004044 response Effects 0.000 claims abstract description 8
- 238000004422 calculation algorithm Methods 0.000 claims description 39
- 238000000605 extraction Methods 0.000 claims description 11
- 238000007477 logistic regression Methods 0.000 claims description 8
- 238000010801 machine learning Methods 0.000 claims description 8
- 238000009795 derivation Methods 0.000 claims description 6
- 238000013528 artificial neural network Methods 0.000 claims description 5
- 238000007637 random forest analysis Methods 0.000 claims description 5
- 238000012216 screening Methods 0.000 claims description 4
- 238000011160 research Methods 0.000 abstract description 7
- 238000007726 management method Methods 0.000 abstract description 2
- 238000012544 monitoring process Methods 0.000 abstract description 2
- 238000013024 troubleshooting Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 238000003889 chemical engineering Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 231100000572 poisoning Toxicity 0.000 description 1
- 230000000607 poisoning effect Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/04—Manufacturing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Manufacturing & Machinery (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明实施例提供一种化工事故预测方法和系统,属于化工事故研究与预测领域。所述化工事故预测方法包括:发送搜索请求至搜索引擎服务器,其中所述搜索请求包括事故关键词;从所述搜索引擎服务器接收响应于所述搜索请求的新闻数据;基于预配置的化工事故新闻文本特征分类所述新闻数据,以筛选出化工事故新闻;基于所述化工事故新闻,预测未来可能发生的化工事故。由此,一方面实现了针对化学品事故实时自动监测,另一方面,基于预测结果,能够科学地、有针对性地指导石化安全管理人员开展石化安全隐患排查工作。
Description
技术领域
本发明涉及化工事故研究与预测领域,具体地涉及一种化工事故预测方法和系统。
背景技术
化学工业是国民经济重要支柱产业,2014年、2015年化工行业主营收入分别为8.8万亿和8.84万亿,占GDP分别为14%和13%。2015年,化工行业增加值同比增长9.3%。化工对我国经济虽然如此重要,但由于化工设计的危险化学品具有易燃、易爆、有毒、有害等危险因素,化工事故严重制约着社会和谐发展。研究化工事故,找出事故发生规律,预测事故,因此在事故发生前采取有针对性的安全措施,对于预防化工事故意义重大。
当前,化工事故多发频发,新闻媒体对化工突发事件铺天盖地的报道,新闻报道数量呈现几何性增长的趋势,且目前各大新闻网站,并没有单独化工事故新闻版块,即使在搜索引擎(例如百度、谷歌等)上基于关键词搜索也会出现大量的无关信息。
目前化工事故预测多是以发生过的事故,历史数据进行未来的预测,但受限于样本的稀缺,预测模型难以具有实际意义,但当事故样本丰富时,又面临海量数据,人工无法开展事故预测工作。因此,如何从海量数据中,特别是海量的中文文本信息进行快速、高效、准确地分析并挖掘出有价值的信息是目前化工事故研究领域亟待解决技术难题。
发明内容
本发明实施例的目的是提供一种化工事故预测方法及系统,用以至少解决现有技术中无法从海量的互联网数据中快速、高效、准确地分析并挖掘出有价值的信息的难题。
为了实现上述目的,本发明实施例提供一种化工事故预测方法,包括:发送搜索请求至搜索引擎服务器,其中所述搜索请求包括事故关键词;从所述搜索引擎服务器接收响应于所述搜索请求的新闻数据;基于预配置的化工事故新闻文本特征分类所述新闻数据,以筛选出化工事故新闻;基于所述化工事故新闻,预测未来可能发生的化工事故。
另一方面,本发明提供一种化工事故预测系统,包括:搜索请求单元,用于发送搜索请求至搜索引擎服务器,其中所述搜索请求包括事故关键词;事故新闻接收单元,用于从所述搜索引擎服务器接收响应于所述搜索请求的新闻数据;化工事故新闻筛选单元,用于基于预配置的化工事故新闻文本特征分类所述新闻数据,以筛选出化工事故新闻;化工事故预测单元,用于基于所述化工事故新闻,预测未来可能发生的化工事故。
通过上述技术方案,一方面,应用化工事故新闻文本特征来分类从搜索引擎服务器所反馈的新闻数据,实现了对化学品事故实时自动监测,改变人工手动查询收集的落后手段;另一方面,基于化工事故新闻来预测未来可能发生的化工事故,提供了新的针对化工事故的预控方案,能够科学地、有针对性地指导石化安全管理人员开展石化安全隐患排查工作。
本发明实施例的其它特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
附图是用来提供对本发明实施例的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本发明实施例,但并不构成对本发明实施例的限制。在附图中:
图1是本发明一实施例的化工事故预测方法的流程图;
图2是本发明一实施例的基于化工事故新闻预测化工事故的方法的流程图;
图3A示出的是所统计的各类化工事故在时间上的统计柱状图;
图3B示出的是所统计的化工事故类型的分布图;
图3C示出的是化工事故在地域上的统计柱状图;
图3D示出的是所预测的未来发生的化工事故在地域上的热力分布图和气泡图;
图3E示出的是所预测的未来发生的化工事故在星期数上的趋势线条图;
图4是本发明一实施例的化工事故预测系统的结构框图。
具体实施方式
以下结合附图对本发明实施例的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明实施例,并不用于限制本发明实施例。
如图1所示,本发明一实施例的化工事故预测方法,包括:
S11、发送搜索请求至搜索引擎服务器,其中该搜索请求包括事故关键词。
本发明实施例的方法可以应用在各种终端设备上,其可以是通用的终端设备,例如手机或电脑;其也还可以是专用的终端设备,例如专用于实现化工事故采集功能的专业设备,且以上都属于本发明的保护范围内。以及,通过该终端设备可适用于企业及政府开展事故研究,有效应用事故预测模型,便于企业有针对性地提出安全措施,以预防事故发生。
关于该搜索引擎服务器的类型在此应不加以限定,其可以是各种类型或服务商(例如百度、谷歌等)所运营的服务器,其能够响应于所输入的关键词反馈响应的搜索结果。
S12、从搜索引擎服务器接收响应于搜索请求的新闻数据。
其中,由于搜索引擎服务器的网络爬虫系统的不精确性,使得搜索引擎所反馈的该事故新闻链接集合中会出现大量的无关信息。
S13、基于预配置的化工事故新闻文本特征分类新闻数据,以筛选出化工事故新闻。
由此,解决了获知化学品事故不及时,改变了传统的获取事故通报的单一事故采集渠道,可以实现对化学品事故实时监测,及时应用提取事故影响因素等相关数据,全面分析事故历史信息大数据,改变人工手动查询收集的落后手段,形成准确高效的事故信息采集系统,从而提升事故调查与事故研究的科学性,具有极强的现实意义。
其中,通过预配置的化工事故新闻文本特征将新闻数据中与化工事故新闻无关的信息分离出去。作为示例,可以是利用化工事故新闻分类器,通过机器学习的逻辑回归(Logistic regression)算法结合预配置的化工事故新闻特征来分类所述新闻数据,从而筛选出化工事故新闻。据此,通过研究了大量的自然语言处理和机器学习的方法和算法,并基于化工事故新闻的特点进行大量的训练和实验,结合化工事故新闻文本特征,设计化工事故新闻分类器,快速准确的对信息进行分类处理,判断事故新闻是否是化工事故新闻,并判断事故新闻的类型,使得平均绝对误差逐步减小,分类准确率大幅提高。
S14、基于化工事故新闻,预测未来可能发生的化工事故。
在本发明实施例中,以化工事故新闻为数据基础分析化工事故发生的趋势,能够较精准地预测出未来发生的化工事故,为企业及政府提供有价值的分析结论,并为其开展事故预防措施提供了指导性建议。
具体的,可以是通过如图2所示的流程来完成化工事故的预测的:S141、基于关键字生成算法(例如TextRank算法)提取化工事故新闻中的关键字,其中该化工事故新闻中的关键字包括以下中的一者或多者:化工事故发生时间、化工事故发生地点、化工事故类型、化学品、死伤人数和事故发生星期数。S142、基于化工事故相关语义网络结合该所提取的关键字,推导未来可能发生的化工事故,其中化工事故相关语义网络是采用词袋模型和/或神经网络语言算法模型并以历史化工事故数据为基础来进行训练的;具体的,该化工事故相关语义网络可以是以机器学习算法贝叶斯信念网络、逻辑回归算法和/或随机森林算法为基础的,例如其可以就是贝叶斯信念网络、逻辑回归算法和随机森林算法其中的任意一者,也可以是基于贝叶斯信念网络、逻辑回归算法、随机森林算法和其他机器学习算法进行组合设计的新型算法,且都属于本发明的保护范围内。
为了提高关键字提取效率,可以不直接对化工事故新闻进行关键字提取,优选的,还可以是先从化工事故新闻中提取出初始模式规则,筛除无用信息之后再提取,具体可以通过以下方式来实现:根据化工事故新闻生成新闻句子,基于最大熵依存算法计算出新闻句子中各个词汇成分之间的关系并确定新闻句子中的谓语和宾语,以及根据新闻句子中的谓语和宾语生成初始模式规则,基于关键字生成算法提取初始模式规则中的关键字。由此,本发明实施例中采用基于自动语言理解的文本规则匹配的提取方法,和面向文本关键词近似匹配方法,能够在一定的辅助支持下自动提取时间、地点、化学品、死伤人数等基础信息。
另外,随着时间的推移,事故新闻数据也会随之在变化,使得数据库中的新闻数据需要一直在更新,而预测分析是一种归纳的学习过程,它依赖于对历史数据,或“训练数据”的分析来创建模型。所以,如果数据没有被标注日期或时间戳,使得部分理应失效的或参考价值低的(例如具有久远的数据时间)数据会严重影响预测过程,导致容易产生错误结果导向的未来数据。
有鉴于此,在本发明实施例的一优选实施方式中,可以为所提取的化工事故新闻中的关键字附加时间戳,并基于附加有时间戳的所述关键字生成关键字数列,之后基于化工事故相关语义网络结合所述关键字数列推导可能发生的化工事故。由此,可以在丰富了数据的完整性的同时,及时将低价值的垃圾数据清理掉,提高了预测结果的可靠性。
优选的,本发明实施例还可以包括:S15、基于化工事故新闻,统计在至少一个属性维度上所预测的未来可能发生的化工事故,其中该属性维度包括以下中的一者或多者:化工事故规模、化工事故类型、事故发生时间、事故发生地点和事故发生星期数。
具体的,可以是在化工事故预测过程中提取化工事故新闻在特定维度的的关键字,例如提取在化工事故发生时间、化工事故发生地点和化工事故类型、事故发生星期数等维度下的关键字,并通过使用化工事故相关语义网络找出在这些属性维度下事故发生的规律,从而实现在相应的属性维度下推导未来发生的化工事故,进而统计所推导出的化工事故结果。
优选的,本发明实施例还可以包括:S16、展示在所统计的属性维度上的所预测的未来可能发生的化工事故。
其中,可以是展示在化工事故规模、化工事故类型、事故发生时间、事故发生地点和事故发生星期数其中的一个或多个维度下的所推导的化工事故结果。
具体的,可以在化工事故预测设备的用户界面上展示化工事故的预测结果,并且展示方式可以是多样化的,例如可以是柱状图、趋势线条图、气泡图、地域热力图等等。另外,设备的用户界面除了展示化工事故的预测结果外,还可以展示其他数据,例如历史化工事故的统计结果等等。
由此,通过在化工事故预测截面录入海量化工事故数据,系统自动实现关键语义的分类与关键信息提取,并进行相关统计,通过高效的机器学习算法,揭示化工事故发生发展规律,并拟合历史数据以进行算法计算,从而完成事故预测。
如图3A-3E所示,应用有本发明实施例的化工事故预测方法的设备的用户界面的截图的示例,图3A示出的是所统计的各类化工事故(例如爆炸、火灾、泄漏、中毒等)在时间(不同月份)上的统计柱状图,图3B示出的是所统计的化工事故类型的分布图,图3C是化工事故在地域(例如北京、湖南、湖北等)上的统计柱状图。如图3D示出的是所预测的未来发生的化工事故在地域上的热力分布图和气泡图,如图3E示出的是所预测的未来发生的化工事故在星期数上的趋势线条图,由此不难得出在星期五各类化工事故发生的概率最高,石化安全管理人员应当注意在星期五更应当提升警惕,尤其是针对可能发生的泄漏事故应当采取相应的检测防范措施,由此能够起到实际性的指导安全检查工作的作用。
在本发明实施例中,研究了大量的自然语言处理和机器学习的方法和算法,并基于化工事故新闻的特点,做了大量的训练和实验,结合化工事故新闻文本特征,设计化工事故新闻分类器,快速准确的对信息进行分类处理,判断事故新闻是否是化工事故新闻,并判断事故新闻的类型,使得平均绝对误差逐步减小,分类准确率大幅提高。同时,主要设计实现了基于最大熵依存算法计算出句子中各个组成成分之间的关系,选取需要被抽取的句子的谓语、宾语来构造出模式规则,可以精确的提取出文本的主要信息。针对信息的特征研究,采用词袋模型和神经网络语言模型训练化工事故相关语义网络,设计基于贝叶斯信念网络,逻辑回归,随机森林等高效的机器学习算法,并以历史数据为基础,采用时间序列预测分析法,进行算法设计。通过对化工事故新闻的特征研究,以及事故属性间的关联分析,通过基于数据挖掘的预测模型,从而完成了化工事故的预测。
如图4所示,本发明一实施例的化工事故预测系统40,包括搜索请求单元401、事故新闻接收单元402、化工事故新闻筛选单元403和化工事故预测单元404,其中搜索请求单元401,用于发送搜索请求至搜索引擎服务器,其中所述搜索请求包括事故关键词;事故新闻接收单元402,用于从所述搜索引擎服务器接收响应于所述搜索请求的新闻数据;化工事故新闻筛选单元403,用于基于预配置的化工事故新闻文本特征分类所述新闻数据,以筛选出化工事故新闻;化工事故预测单元404,用于基于所述化工事故新闻,预测未来可能发生的化工事故。
在一些实施方式中,该系统还包括:化工事故统计单元,用于基于所述化工事故新闻,统计在至少一个属性维度上经预测的未来可能发生的化工事故,其中所述属性维度包括以下中的一者或多者:化工事故规模、化工事故类型、事故发生时间、事故发生地点和事故发生星期数。
在一些实施方式中,该系统还包括:化工事故展示单元,用于展示在所统计的属性维度上的经预测的未来可能发生的化工事故。
在一些实施方式中,所述化工事故预测单元404包括:关键字提取模块,用于基于关键字生成算法提取所述化工事故新闻中的关键字,其中所述化工事故新闻中的关键字包括以下中的一者或多者:化工事故发生时间、化工事故发生地点、化工事故类型、化学品、死伤人数和事故发生星期数;语义推导模块,用于基于化工事故相关语义网络结合所述关键字,推导未来可能发生的化工事故,其中所述化工事故相关语义网络是采用词袋模型和/或神经网络语言算法模型并以历史化工事故数据为基础来进行训练的。
在一些实施方式中,所述语义推导模块包括:时间戳附加组件,用于为所提取的所述化工事故新闻中的关键字附加时间戳;关键字数列生成组件,用于基于附加有所述时间戳的所述关键字生成关键字数列;化工事故推导组件,用于基于化工事故相关语义网络结合所述关键字数列,推导可能发生的化工事故。
在一些实施方式中,所述关键字提取模块包括:新闻句子生成组件,用于根据所述化工事故新闻生成新闻句子;词汇成分确定组件,用于基于最大熵依存算法计算出所述新闻句子中各个词汇成分之间的关系,并确定所述新闻句子中的谓语和宾语;初始模式规则生成组件,用于根据所述新闻句子中的谓语和宾语生成初始模式规则;提取组件,用于基于关键字生成算法提取所述初始模式规则中的关键字。
关于本发明实施例的化工事故预测系统的更多的细节和效果可以参照上文关于化工事故预测方法的描述,在此便不赘述。
以上结合附图详细描述了本发明实施例的可选实施方式,但是,本发明实施例并不限于上述实施方式中的具体细节,在本发明实施例的技术构思范围内,可以对本发明实施例的技术方案进行多种简单变型,这些简单变型均属于本发明实施例的保护范围。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合。为了避免不必要的重复,本发明实施例对各种可能的组合方式不再另行说明。
本领域技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序存储在一个存储介质中,包括若干指令用以使得单片机、芯片或处理器(processor)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
此外,本发明实施例的各种不同的实施方式之间也可以进行任意组合,只要其不违背本发明实施例的思想,其同样应当视为本发明实施例所公开的内容。
Claims (14)
1.一种化工事故预测方法,包括:
发送搜索请求至搜索引擎服务器,其中所述搜索请求包括事故关键词;
从所述搜索引擎服务器接收响应于所述搜索请求的新闻数据;
基于预配置的化工事故新闻文本特征分类所述新闻数据,以筛选出化工事故新闻;
基于所述化工事故新闻,预测未来可能发生的化工事故。
2.根据权利要求1所述的方法,其特征在于,在所述基于所述化工事故新闻预测未来可能发生的化工事故之后,该方法还包括:
基于所述化工事故新闻,统计在至少一个属性维度上所预测的未来可能发生的化工事故,其中所述属性维度包括以下中的一者或多者:化工事故规模、化工事故类型、事故发生时间、事故发生地点和事故发生星期数。
3.根据权利要求2所述的方法,其特征在于,在所述统计在至少一个属性维度上所预测的来可能发生的化工事故之后,该方法还包括:
展示在所统计的属性维度上的所预测的未来可能发生的化工事故。
4.根据权利要求1所述的方法,其特征在于,所述基于所述化工事故新闻预测未来可能发生的化工事故包括:
基于关键字生成算法提取所述化工事故新闻中的关键字,其中所述化工事故新闻中的关键字包括以下中的一者或多者:化工事故发生时间、化工事故发生地点、化工事故类型、化学品、死伤人数和事故发生星期数;
基于化工事故相关语义网络结合所述关键字,推导未来可能发生的化工事故,其中所述化工事故相关语义网络是采用词袋模型和/或神经网络语言算法模型并以历史化工事故数据为基础来进行训练的。
5.根据权利要求4所述的方法,其特征在于,所述基于化工事故相关语义网络结合所述关键字推导未来可能发生的化工事故包括:
为所提取的所述化工事故新闻中的关键字附加时间戳;
基于附加有所述时间戳的所述关键字生成关键字数列;
基于化工事故相关语义网络结合所述关键字数列,推导可能发生的化工事故。
6.根据权利要求4所述的方法,其特征在于,所述化工事故相关语义网络是以以下中的至少一者的机器学习算法为基础的:贝叶斯信念网络、逻辑回归算法和随机森林算法。
7.根据权利要求4所述的方法,其特征在于,所述基于关键字生成算法提取所述化工事故新闻中的关键字包括:
根据所述化工事故新闻生成新闻句子;
基于最大熵依存算法计算出所述新闻句子中各个词汇成分之间的关系,并确定所述新闻句子中的谓语和宾语;以及
根据所述新闻句子中的谓语和宾语生成初始模式规则;
基于关键字生成算法提取所述初始模式规则中的关键字。
8.根据权利要求1所述的方法,其特征在于,所述基于预配置的化工事故新闻文本特征分类所述新闻数据以筛选出化工事故新闻包括:
通过机器学习的逻辑回归算法结合预配置的化工事故新闻特征来分类所述新闻数据,以筛选出化工事故新闻。
9.一种化工事故预测系统,包括:
搜索请求单元,用于发送搜索请求至搜索引擎服务器,其中所述搜索请求包括事故关键词;
事故新闻接收单元,用于从所述搜索引擎服务器接收响应于所述搜索请求的新闻数据;
化工事故新闻筛选单元,用于基于预配置的化工事故新闻文本特征分类所述新闻数据,以筛选出化工事故新闻;
化工事故预测单元,用于基于所述化工事故新闻,预测未来可能发生的化工事故。
10.根据权利要求9所述的系统,其特征在于,该系统还包括:
化工事故统计单元,用于基于所述化工事故新闻,统计在至少一个属性维度上经预测的未来可能发生的化工事故,其中所述属性维度包括以下中的一者或多者:化工事故规模、化工事故类型、事故发生时间、事故发生地点和事故发生星期数。
11.根据权利要求10所述的系统,其特征在于,该系统还包括:
化工事故展示单元,用于展示在所统计的属性维度上的经预测的未来可能发生的化工事故。
12.根据权利要求9所述的系统,其特征在于,所述化工事故预测单元包括:
关键字提取模块,用于基于关键字生成算法提取所述化工事故新闻中的关键字,其中所述化工事故新闻中的关键字包括以下中的一者或多者:化工事故发生时间、化工事故发生地点、化工事故类型、化学品、死伤人数和事故发生星期数;
语义推导模块,用于基于化工事故相关语义网络结合所述关键字,推导未来可能发生的化工事故,其中所述化工事故相关语义网络是采用词袋模型和/或神经网络语言算法模型并以历史化工事故数据为基础来进行训练的。
13.根据权利要求12所述的系统,其特征在于,所述语义推导模块包括:
时间戳附加组件,用于为所提取的所述化工事故新闻中的关键字附加时间戳;
关键字数列生成组件,用于基于附加有所述时间戳的所述关键字生成关键字数列;
化工事故推导组件,用于基于化工事故相关语义网络结合所述关键字数列,推导可能发生的化工事故。
14.根据权利要求12所述的系统,其特征在于,所述关键字提取模块包括:
新闻句子生成组件,用于根据所述化工事故新闻生成新闻句子;
词汇成分确定组件,用于基于最大熵依存算法计算出所述新闻句子中各个词汇成分之间的关系,并确定所述新闻句子中的谓语和宾语;
初始模式规则生成组件,用于根据所述新闻句子中的谓语和宾语生成初始模式规则;
提取组件,用于基于关键字生成算法提取所述初始模式规则中的关键字。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810981022.9A CN110866624A (zh) | 2018-08-27 | 2018-08-27 | 化工事故预测方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810981022.9A CN110866624A (zh) | 2018-08-27 | 2018-08-27 | 化工事故预测方法和系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110866624A true CN110866624A (zh) | 2020-03-06 |
Family
ID=69651212
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810981022.9A Pending CN110866624A (zh) | 2018-08-27 | 2018-08-27 | 化工事故预测方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110866624A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113341894A (zh) * | 2021-05-27 | 2021-09-03 | 河钢股份有限公司承德分公司 | 事故规律数据的生成方法、装置和终端设备 |
CN113553754A (zh) * | 2020-04-23 | 2021-10-26 | 中国石油化工股份有限公司 | 存储器、火灾风险预测模型构建方法、系统和装置 |
-
2018
- 2018-08-27 CN CN201810981022.9A patent/CN110866624A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113553754A (zh) * | 2020-04-23 | 2021-10-26 | 中国石油化工股份有限公司 | 存储器、火灾风险预测模型构建方法、系统和装置 |
CN113341894A (zh) * | 2021-05-27 | 2021-09-03 | 河钢股份有限公司承德分公司 | 事故规律数据的生成方法、装置和终端设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106815207B (zh) | 用于法律裁判文书的信息处理方法及装置 | |
CN107147639A (zh) | 一种基于复杂事件处理的实时安全预警方法 | |
CN111045847B (zh) | 事件审计方法、装置、终端设备以及存储介质 | |
Kim et al. | Analysis of fire-accident factors using big-data analysis method for construction areas | |
Nguyen et al. | TrafficWatch: Real-time traffic incident detection and monitoring using social media | |
CN107391353A (zh) | 基于日志的复杂软件系统异常行为检测方法 | |
CN104572958A (zh) | 一种基于事件抽取的敏感信息监控方法 | |
US20070005650A1 (en) | Methods and systems for analyzing incident reports | |
CN112491611A (zh) | 故障定位系统、方法、装置、电子设备和计算机可读介质 | |
US20180336250A1 (en) | Apparatus and method for generation of a financial event database | |
CN112163072A (zh) | 基于多数据源的数据处理方法以及装置 | |
CN107729337B (zh) | 事件的监测方法和装置 | |
CN110866624A (zh) | 化工事故预测方法和系统 | |
KR102124935B1 (ko) | 크라우드 소싱을 활용한 재난 모니터링 시스템, 재난 모니터링 방법 및 이를 수행하기 위한 컴퓨터 프로그램 | |
KR20150059208A (ko) | 소셜 웹 미디어의 이벤트 시공간 연관성 분석 장치 및 그 방법 | |
CN108984514A (zh) | 词语的获取方法及装置、存储介质、处理器 | |
CN109857869A (zh) | 一种基于Ap增量聚类和网络基元的热点话题预测方法 | |
CN115544519A (zh) | 对计量自动化系统威胁情报进行安全性关联分析的方法 | |
KR101444250B1 (ko) | 개인정보 접근감시 시스템 및 그 방법 | |
Simandl et al. | Making use of big data to evaluate the effectiveness of selective law enforcement in reducing crashes | |
CN112652168A (zh) | 一种重大交通事故预警方法、系统及存储介质 | |
CN110888977B (zh) | 文本分类方法、装置、计算机设备和存储介质 | |
Nourbakhsh et al. | " Breaking" Disasters: Predicting and Characterizing the Global News Value of Natural and Man-made Disasters | |
CN115913710A (zh) | 异常检测方法、装置、设备及存储介质 | |
CN110866177B (zh) | 化工事故新闻采集方法及机器可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200306 |
|
RJ01 | Rejection of invention patent application after publication |