CN116361463B - 一种地震灾情信息提取方法、装置、设备及介质 - Google Patents
一种地震灾情信息提取方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN116361463B CN116361463B CN202310308766.5A CN202310308766A CN116361463B CN 116361463 B CN116361463 B CN 116361463B CN 202310308766 A CN202310308766 A CN 202310308766A CN 116361463 B CN116361463 B CN 116361463B
- Authority
- CN
- China
- Prior art keywords
- information
- seismic
- text information
- candidate
- label
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000605 extraction Methods 0.000 title claims abstract description 20
- 238000013145 classification model Methods 0.000 claims abstract description 76
- 238000000034 method Methods 0.000 claims abstract description 41
- 238000004590 computer program Methods 0.000 claims description 16
- 238000012549 training Methods 0.000 claims description 13
- 238000005259 measurement Methods 0.000 claims description 11
- 238000002372 labelling Methods 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 9
- 238000010276 construction Methods 0.000 claims description 2
- 230000010354 integration Effects 0.000 abstract description 4
- 230000000875 corresponding effect Effects 0.000 description 13
- 238000012545 processing Methods 0.000 description 11
- 238000004891 communication Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000011835 investigation Methods 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000013468 resource allocation Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 208000037974 severe injury Diseases 0.000 description 1
- 230000009528 severe injury Effects 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/353—Clustering; Classification into predefined classes
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A10/00—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE at coastal zones; at river basins
- Y02A10/40—Controlling or monitoring, e.g. of flood or hurricane; Forecasting, e.g. risk assessment or mapping
Abstract
本申请公开了一种地震灾情信息提取方法、装置、设备及介质。其中,该方法通过根据获取到的地震要素数据,从目标网络平台中采集候选文本信息;基于地震信息分类模型,对候选文本信息进行多标签分类,得到与候选文本信息对应的至少一个标签信息;其中,标签信息至少包括无用信息、致灾信息、损失信息、救援救助信息和舆情信息;根据标签信息,对候选文本信息进行分类,并提取目标文本信息。本技术方案,通过对地震信息进行多标签分类,以实现快速对地震信息进行分类提取整合,提高地震信息的分类准确度,为地震灾害应急工作提供信息支撑。
Description
技术领域
本申请涉及信息处理技术领域,尤其涉及一种地震灾情信息提取方法、装置、设备及介质。
背景技术
地震事件属于突发事件,在地震发生后进行信息收集是应急响应决策的首要任务,精准、实时、全面的地震信息有利于对地震做出有效的应急响应。
然而,地震发生后的黄金72小时恰好是传统信息获取手段的盲点时段。一方面,基于现场的受灾范围评估、地方灾情上报、专业部门的现场调查等工作,往往需要在灾后24小时以后才能到达现场并逐步开展;另一方面,卫星遥感和航空遥感数据通常需要进行协调、资源调配和影像解译等处理,这些传统手段在短时间内通常难以发挥作用。
因此,如何提供一种能快速对地震信息进行提取整合的技术方案,是本领域技术人员亟待解决的技术问题。
发明内容
本申请提供了一种地震灾情信息提取方法、装置、设备及介质,
根据本申请的一方面,提供了一种地震灾情信息提取方法,该方法包括:
根据获取到的地震要素数据,从目标网络平台中采集候选文本信息;
基于地震信息分类模型,对所述候选文本信息进行多标签分类,得到与所述候选文本信息对应的至少一个标签信息;其中,所述标签信息至少包括无用信息、致灾信息、损失信息、救援救助信息和舆情信息;
根据所述标签信息,对所述候选文本信息进行分类,并提取目标文本信息。
根据本申请的另一方面,提供了一种地震灾情信息提取装置,该装置包括:
候选文本信息采集模块,用于根据获取到的地震要素数据,从目标网络平台中采集候选文本信息;
标签信息分类模块,用于基于地震信息分类模型,对所述候选文本信息进行多标签分类,得到与所述候选文本信息对应的至少一个标签信息;其中,所述标签信息至少包括无用信息、致灾信息、损失信息、救援救助信息和舆情信息;
目标文本信息确定模块,用于根据所述标签信息,对所述候选文本信息进行分类,并提取目标文本信息。
根据本申请的另一方面,提供了一种电子设备,该设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本申请任一实施例所述的地震灾情信息提取方法。
根据本申请的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本申请任一实施例所述的地震灾情信息提取方法。
本申请提供的技术方案,通过根据获取到的地震要素数据,从目标网络平台中采集候选文本信息;基于地震信息分类模型,对候选文本信息进行多标签分类,得到与候选文本信息对应的至少一个标签信息;其中,标签信息至少包括无用信息、致灾信息、损失信息、救援救助信息和舆情信息;根据标签信息,对候选文本信息进行分类,并提取目标文本信息。本技术方案,通过对地震信息进行多标签分类,以实现快速对地震信息进行分类提取整合,提高地震信息的分类准确度,为地震灾害应急工作提供信息支撑。
应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例一提供的一种地震灾情信息提取方法的流程图;
图2为本申请实施例二提供的一种地震信息分类模型的构建流程图;
图3为本申请实施例三提供的一种地震灾情信息提取装置的结构示意图;
图4是实现本申请实施例的一种地震灾情信息提取方法的设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“候选”、“目标”、“预设”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例一
图1为本申请实施例一提供的一种地震灾情信息提取方法的流程图,本实施例可适用于对与当前台风对应的相似路径台风进行确定的情况,该方法可以由地震灾情信息提取装置来执行,该地震灾情信息提取装置可以采用硬件和/或软件的形式实现,该地震灾情信息提取装置可配置于具有数据处理能力的设备中。如图1所示,该方法包括:
S110、根据获取到的地震要素数据,从目标网络平台中采集候选文本信息。
其中,地震要素数据可为与地震相关的属性信息,如地震发生的时间、地点、强度、震源、震中、震源深度、震级、烈度等,可通过地震台网公布的信息获取。目标网络平台可为能够获取网络舆情信息的平台,如社交媒体等。候选文本信息可为于地震相关的中文短文本信息,可包括发布者昵称、短文本内容、发布时间、发布地址等字段属性。
具体的,可以根据所获取的地震要素数据确定与地震关联的属性信息,从目标网络平台中遍历筛选包含与地震关联的属性信息的候选文本信息。
作为一种可选的但非限定的实现方式,所述地震要素数据至少包括发震时刻和震中位置;相应地,根据获取到的地震要素数据,从目标网络平台中采集候选文本信息,包括:根据获取到的地震要素数据,在发震时刻后的预设时间段内,从目标网络平台中采集与震中位置相关联的候选文本信息。
其中,发震时刻可为地震发生的时刻,例如可以用北京时间进行表示。震中位置可为地震开始发生的地区,例如可以用经纬度进行表示,又例如也可以用省市区县进行表示。
需要说明的是,地震发生后的黄金72小时恰好是传统信息获取手段的盲点时段,基于现场的受灾范围评估、地方灾情上报、专业部门的现场调查等,往往在灾后24小时以后才能到达现场并逐步开展工作,而卫星遥感和航空遥感数据通常需要协调、资源调配和影像解译等过程,这些传统手段通常在短时间内难以发挥作用。
因此,在本发明实施例中通过在发震时刻后的预设时间段内,从目标网络平台中采集与震中位置相关联的候选文本信息,以实现对传统灾害信息获取手段的有效补充,弥补灾害管理部门监测手段、感知体系的不足。
S120、基于地震信息分类模型,对所述候选文本信息进行多标签分类,得到与所述候选文本信息对应的至少一个标签信息。其中,所述标签信息至少包括无用信息、致灾信息、损失信息、救援救助信息和舆情信息。
其中,地震信息分类模型可为基于深度学习算法或者机器学习算法所构建的分类模型。标签信息可为地震信息主题,以为地震救援提供明确便捷的数据支撑。
具体的,可通过各标签信息的判别标准和关键词对候选文本信息进行多标签分类,得到与候选文本信息对应的至少一个标签信息。其中,无用信息的判别标准可为短文本内容与地震无关、纯属蹭流量等;无具体关键词。致灾信息的判别标准可为短文本包含震级信息、位置及震感信息、次生灾害信息等;关键词可包括地震、级(震级)、余震、市(县、乡、村)、堰塞湖、地质灾害、水库、裂缝、断裂等。损失信息的判别标准可为短文本包含人员伤亡信息、房屋倒损信息、交通电力通信受损信息等;关键词可为死亡、重伤、房屋、道路、电力、通信、中断等。救援救助信息的判别标准可为短文本包含求救信息、相关救援行动等;关键词可为被困、求救、食品、帐篷、物资、消防、部队、救援、捐款、通道等。舆情信息的判别标准可为短文本包含情绪表达信息、疑似谣言信息等;关键词可为祈福、希望、害怕、哀悼、难过、愤怒、造假、谣传等。
可选的,在基于地震信息分类模型对候选文本信息进行多标签分类之前,可对候选文本信息进行预处理,以使候选文本信息为模型可识别分类的形式。
示例性的,可对候选文本信息中的表情等信息进行删除处理,对候选文本信息中的符号信息进行全角半角转换处理,对候选文本信息中的图片视频等信息进行删除处理,对候选文本信息中的英文缩写词进行中文翻译处理,对候选文本信息中的地址信息进行经纬度转换处理等等。
S130、根据所述标签信息,对所述候选文本信息进行分类,并提取目标文本信息。
其中,目标文本信息可为能够提供有助于地震救援的候选文本信息,可为致灾信息、损失信息、救援救助信息或舆情信息。
具体的,在基于地震信息分类模型对候选文本信息进行标签标注之后,各候选文本信息都被标注至少一个标签信息,可将标签信息为无用信息的候选文本信息进行筛除,将标签信息为致灾信息、损失信息、救援救助信息或舆情信息的候选文本信息按照标签信息进行分类,得到目标文本信息,以便在对地震救援行动提供可靠的信息支撑。
作为一种可选的但非限定的实现方式,提取目标文本信息,包括但不限于如下过程:将分类后的候选文本信息定时按照所述标签信息进行分类提取,确定与各标签信息对应的目标文本信息。
具体的,将分类后的候选文本信息定时按照标签信息进行分类提取,确定与各标签信息对应的目标文本信息,形成各主题汇总,可以实时有效地对地震救援行动提供可靠的信息支撑。
本发明实施例提供了一种地震灾情信息提取方法,该方法通过根据获取到的地震要素数据,从目标网络平台中采集候选文本信息;基于地震信息分类模型,对候选文本信息进行多标签分类,得到与候选文本信息对应的至少一个标签信息;其中,标签信息至少包括无用信息、致灾信息、损失信息、救援救助信息和舆情信息;根据标签信息,对候选文本信息进行分类,并提取目标文本信息。本技术方案,通过对地震信息进行多标签分类,以实现快速对地震信息进行分类提取整合,提高地震信息的分类准确度,为地震灾害应急工作提供信息支撑。
实施例二
图2为本申请实施例二提供的一种地震信息分类模型的构建流程图,本实施例以上述实施例为基础进行优化。如图2所示,本实施例的方法具体包括如下步骤:
S210、获取样本地震文本信息集合,并根据所述样本地震文本信息中是否包括各预设标签信息的判断结果,对各样本地震文本信息进行标注。
其中,样本地震文本信息集合可为历史多次地震灾害发生后所收集的文本信息。预设标签信息可至少包括无用信息、致灾信息、损失信息、救援救助信息和舆情信息。预设标签信息的判断结果可为是否包含预设标签信息。
具体的,可以通过“1”或“0”对各样本地震文本信息的预设标签信息的判断结果进行标注,例如,用“1”表示包含预设标签信息,用“0”表示不包含预设标签信息。通过对各样本地震文本信息的各预设标签信息的判断结果进行分别标注,各样本地震文本信息会形成一个标签向量。
作为一种可选的但非限定性的实现方式,根据所述样本地震文本信息中是否包括各预设标签信息的判断结果,对各样本地震文本信息进行标注,包括但不限于如下步骤A1-A2的过程:
步骤A1、根据各预设标签信息的判断标准,对所述样本地震文本信息中是否包括各预设标签信息进行判断,得到判断结果。
其中,各预设标签信息的判断标准可根据实际需求进行设定,例如可以设置关键词以对样本地震文本信息进行语义识别,又例如还可以设置判定条件以对满足判定条件的样本地震文本信息进行筛选。
步骤A2、用预设数值对判断结果进行表示,对所述样本地震信息集合进行标注。
其中,预设数值可以用“1”或“0”表示样本地震文本信息中是否包括各预设标签信息;也可以用“0-10”之间的数值表示样本地震文本信息中包括各预设标签信息的相关性,数值越大越相关。
上述技术方案的有益效果在于,可以实现对样本地震信息集合进行准确标注。
S220、根据标注有标签信息的样本地震信息集合进行模型训练,建立地震信息分类模型。
具体的,可以基于自然语言处理算法(如,机器学习算法或深度学习算法)构建面向短文本的多标签分类模型,并通过标注有标签信息的样本地震信息集合训练模型,确定模型参数,从而建立地震信息分类模型。
作为一种可选的但非限定性的实现方式,根据标注有标签信息的样本地震信息集合进行模型训练,建立地震信息分类模型,包括但不限于如下步骤B1-B2的过程:
步骤B1、根据标注有标签信息的样本地震信息集合进行模型训练,得到至少一个候选地震信息分类模型。
其中,候选地震信息分类模型可为经标注有标签信息的样本地震信息集合进行初步训练所得到的模型。
步骤B2、确定所述候选地震信息模型的分类准确度和/或F度量值,并根据所述准确率和/或所述F度量值,从所述候选地震信息分类模型中确定地震信息分类模型。
其中,分类准确度和F度量值都可用于评估候选地震信息模型的精度。在本发明实施例中,可以只通过分类准确度评估候选地震信息模型的精度,也可以只通过F度量值评估候选地震信息模型的精度,还可以通过分类准确度和F度量值综合评估候选地震信息模型的精度。
其中,分类准确度可以通过如下公式进行确定:
Accuracy=(TP+TN)/(TP+TN+FP+FN);
其中,Accuracy表示分类准确度;TP表示真阳性,即本身是正样本,预测也是正样本;TN表示真阴性,即本身是负样本,预测也是负样本;FP表示假阳性,即本身是正样本,预测是负样本;FN表示假阴性,即本身是负样本,预测是正样本。
其中,F度量值可以通过如下公式进行确定:
F=(2×P×R)/(P+R);
其中,F表示F度量值,P=TP/(TP+FP);R=TP/(TP+FN)。
具体的,可以根据准确率和/或F度量值与预设准确率和/或F度量值进行对比,将满足预设准确率和/或F度量值的候选地震信息分类模型确定为地震信息分类模型。
可选的,根据所述准确率和/或所述F度量值,从所述候选地震信息分类模型中确定地震信息分类模型,包括:若存在所述候选地震信息分类模型的准确率大于预设准确率,和/或F度量值大于预设阈值,则确定该候选地震信息分类模型为地震信息分类模型;若不存在,则增加样本地震文本信息的数量,对所述候选地震信息分类模型进行优化,以使存在候选地震信息分类模型的准确率大于预设准确率,和/或F度量值大于预设阈值。
示例性的,若存在分类准确率于预设准确率,和/或F度量值大于预设阈值,则确定该候选地震信息分类模型可用于实际工作,将该候选地震信息分类模型为地震信息分类模型。
又示例性的,若不存在分类准确率于预设准确率,和/或F度量值大于预设阈值,则确定该候选地震信息分类模型的评估指标精度无法达到与其,将通过增加样本地震文本信息的数量、提高模型训练技巧或优化模型参数等方法,以使存在候选地震信息分类模型的准确率大于预设准确率,和/或F度量值大于预设阈值。
上述技术方案的有益效果在于,可以确保地震信息分类模型的精度,提高对候选文本信息分类筛选的准确性,从而能够更准确地支持地震救援作业。
本发明实施例提供了一种地震信息分类模型的构建方法,该方法通过获取样本地震文本信息集合,并根据样本地震文本信息中是否包括各预设标签信息的判断结果,对各样本地震文本信息进行标注;根据标注有标签信息的样本地震信息集合进行模型训练,建立地震信息分类模型。本技术方案,以实现对地震信息分类模型进行建立,确保地震信息分类模型对候选文本信息的分类准确性和快速性。
实施例三
图3为本申请实施例四提供的一种地震灾情信息提取装置的结构示意图。如图3所示,该装置包括:
候选文本信息采集模块310,用于根据获取到的地震要素数据,从目标网络平台中采集候选文本信息;
标签信息分类模块320,用于基于地震信息分类模型,对所述候选文本信息进行多标签分类,得到与所述候选文本信息对应的至少一个标签信息;其中,所述标签信息至少包括无用信息、致灾信息、损失信息、救援救助信息和舆情信息;
目标文本信息确定模块330,用于根据所述标签信息,对所述候选文本信息进行分类,并提取目标文本信息。
本发明实施例提供了一种地震灾情信息提取装置,该装置通过根据获取到的地震要素数据,从目标网络平台中采集候选文本信息;基于地震信息分类模型,对候选文本信息进行多标签分类,得到与候选文本信息对应的至少一个标签信息;其中,标签信息至少包括无用信息、致灾信息、损失信息、救援救助信息和舆情信息;根据标签信息,对候选文本信息进行分类,并提取目标文本信息。本技术方案,通过对地震信息进行多标签分类,以实现快速对地震信息进行分类提取整合,提高地震信息的分类准确度,为地震灾害应急工作提供信息支撑。
进一步的,所述地震信息分类模型的构建过程如下:
获取样本地震文本信息集合,并根据所述样本地震文本信息中是否包括各预设标签信息的判断结果,对各样本地震文本信息进行标注;
根据标注有标签信息的样本地震信息集合进行模型训练,建立地震信息分类模型。
进一步的,根据所述样本地震文本信息中是否包括各预设标签信息的判断结果,对各样本地震文本信息进行标注,包括:
根据各预设标签信息的判断标准,对所述样本地震文本信息中是否包括各预设标签信息进行判断,得到判断结果;
用预设数值对判断结果进行表示,对所述样本地震信息集合进行标注。
进一步的,根据标注有标签信息的样本地震信息集合进行模型训练,建立地震信息分类模型,包括:
根据标注有标签信息的样本地震信息集合进行模型训练,得到至少一个候选地震信息分类模型;
确定所述候选地震信息模型的分类准确度和/或F度量值,并根据所述准确率和/或所述F度量值,从所述候选地震信息分类模型中确定地震信息分类模型。
进一步的,根据所述准确率和/或所述F度量值,从所述候选地震信息分类模型中确定地震信息分类模型,包括:
若存在所述候选地震信息分类模型的准确率大于预设准确率,和/或F度量值大于预设阈值,则确定该候选地震信息分类模型为地震信息分类模型;
若不存在,则增加样本地震文本信息的数量,对所述候选地震信息分类模型进行优化,以使存在候选地震信息分类模型的准确率大于预设准确率,和/或F度量值大于预设阈值。
进一步的,所述地震要素数据至少包括发震时刻和震中位置;
相应地,候选文本信息采集模块310,具体用于:
根据获取到的地震要素数据,在发震时刻后的预设时间段内,从目标网络平台中采集与震中位置相关联的候选文本信息。
进一步的,目标文本信息确定模块330,具体用于:
将分类后的候选文本信息定时按照所述标签信息进行分类提取,确定与各标签信息对应的目标文本信息。
本申请实施例所提供的一种地震灾情信息提取装置可执行本申请任意实施例所提供的一种地震灾情信息提取方法,具备执行方法相应的功能模块和有益效果。
实施例四
图4示出了可以用来实施本申请的实施例的设备10的结构示意图。设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图4所示,设备10包括至少一个处理器11,以及与至少一个处理器11通信连接的存储器,如只读存储器(ROM)12、随机访问存储器(RAM)13等,其中,存储器存储有可被至少一个处理器执行的计算机程序,处理器11可以根据存储在只读存储器(ROM)12中的计算机程序或者从存储单元18加载到随机访问存储器(RAM)13中的计算机程序,来执行各种适当的动作和处理。在RAM 13中,还可存储设备10操作所需的各种程序和数据。处理器11、ROM12以及RAM 13通过总线14彼此相连。输入/输出(I/O)接口15也连接至总线14。
设备10中的多个部件连接至I/O接口15,包括:输入单元16,例如键盘、鼠标等;输出单元17,例如各种类型的显示器、扬声器等;存储单元18,例如磁盘、光盘等;以及通信单元19,例如网卡、调制解调器、无线通信收发机等。通信单元19允许设备10通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
处理器11可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器11的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。处理器11执行上文所描述的各个方法和处理,例如地震灾情信息提取方法。
在一些实施例中,地震灾情信息提取方法可被实现为计算机程序,其被有形地包含于计算机可读存储介质,例如存储单元18。在一些实施例中,计算机程序的部分或者全部可以经由ROM 12和/或通信单元19而被载入和/或安装到设备10上。当计算机程序加载到RAM 13并由处理器11执行时,可以执行上文描述的地震灾情信息提取方法的一个或多个步骤。备选地,在其他实施例中,处理器11可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行地震灾情信息提取方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本申请的方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本申请的上下文中,计算机可读存储介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。备选地,计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在设备上实施此处描述的系统和技术,该设备具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给设备。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、区块链网络和互联网。
计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务中,存在的管理难度大,业务扩展性弱的缺陷。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。
Claims (7)
1.一种地震灾情信息提取方法,其特征在于,所述方法包括:
根据获取到的地震要素数据,从目标网络平台中采集候选文本信息;
基于地震信息分类模型,对所述候选文本信息进行多标签分类,得到与所述候选文本信息对应的至少一个标签信息;其中,所述标签信息至少包括无用信息、致灾信息、损失信息、救援救助信息和舆情信息;
根据所述标签信息,对所述候选文本信息进行分类,并提取目标文本信息;
其中,基于地震信息分类模型,对所述候选文本信息进行多标签分类,得到与所述候选文本信息对应的至少一个标签信息,包括:
基于地震信息分类模型,通过各标签信息的判别标准和关键词对所述候选文本信息进行多标签分类,得到与所述候选文本信息对应的至少一个标签信息;
其中,所述地震信息分类模型的构建过程如下:
获取样本地震文本信息集合,并根据所述样本地震文本信息中是否包括各预设标签信息的判断结果,对各样本地震文本信息进行标注;
根据标注有标签信息的样本地震信息集合进行模型训练,建立地震信息分类模型;
其中,根据所述样本地震文本信息中是否包括各预设标签信息的判断结果,对各样本地震文本信息进行标注,包括:
根据各预设标签信息的判断标准,对所述样本地震文本信息中是否包括各预设标签信息进行判断,得到判断结果;
用预设数值对判断结果进行表示,对所述样本地震信息集合进行标注;
其中,根据标注有标签信息的样本地震信息集合进行模型训练,建立地震信息分类模型,包括:
根据标注有标签信息的样本地震信息集合进行模型训练,得到至少一个候选地震信息分类模型;
确定所述候选地震信息模型的分类准确度和/或F度量值,并根据所述准确率和/或所述F度量值,从所述候选地震信息分类模型中确定地震信息分类模型。
2.根据权利要求1所述的方法,其特征在于,根据所述准确率和/或所述F度量值,从所述候选地震信息分类模型中确定地震信息分类模型,包括:
若存在所述候选地震信息分类模型的准确率大于预设准确率,和/或F度量值大于预设阈值,则确定该候选地震信息分类模型为地震信息分类模型;
若不存在,则增加样本地震文本信息的数量,对所述候选地震信息分类模型进行优化,以使存在候选地震信息分类模型的准确率大于预设准确率,和/或F度量值大于预设阈值。
3.根据权利要求1所述的方法,其特征在于,所述地震要素数据至少包括发震时刻和震中位置;
相应地,根据获取到的地震要素数据,从目标网络平台中采集候选文本信息,包括:
根据获取到的地震要素数据,在发震时刻后的预设时间段内,从目标网络平台中采集与震中位置相关联的候选文本信息。
4.根据权利要求1所述的方法,其特征在于,提取目标文本信息,包括:
将分类后的候选文本信息定时按照所述标签信息进行分类提取,确定与各标签信息对应的目标文本信息。
5.一种基于权利要求1所述方法的地震灾情信息提取装置,其特征在于,所述装置包括:
候选文本信息采集模块,用于根据获取到的地震要素数据,从目标网络平台中采集候选文本信息;
标签信息分类模块,用于基于地震信息分类模型,对所述候选文本信息进行多标签分类,得到与所述候选文本信息对应的至少一个标签信息;其中,所述标签信息至少包括无用信息、致灾信息、损失信息、救援救助信息和舆情信息;
目标文本信息确定模块,用于根据所述标签信息,对所述候选文本信息进行分类,并提取目标文本信息;
其中,基于地震信息分类模型,对所述候选文本信息进行多标签分类,得到与所述候选文本信息对应的至少一个标签信息,包括:
基于地震信息分类模型,通过各标签信息的判别标准和关键词对所述候选文本信息进行多标签分类,得到与所述候选文本信息对应的至少一个标签信息。
6.一种电子设备,其特征在于,所述设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-4中任一项所述的地震灾情信息提取方法。
7.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-4中任一项所述的地震灾情信息提取方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310308766.5A CN116361463B (zh) | 2023-03-27 | 2023-03-27 | 一种地震灾情信息提取方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310308766.5A CN116361463B (zh) | 2023-03-27 | 2023-03-27 | 一种地震灾情信息提取方法、装置、设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116361463A CN116361463A (zh) | 2023-06-30 |
CN116361463B true CN116361463B (zh) | 2023-12-08 |
Family
ID=86935849
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310308766.5A Active CN116361463B (zh) | 2023-03-27 | 2023-03-27 | 一种地震灾情信息提取方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116361463B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107562814A (zh) * | 2017-08-14 | 2018-01-09 | 中国农业大学 | 一种地震应急和灾情信息获取分类方法及系统 |
WO2019200806A1 (zh) * | 2018-04-20 | 2019-10-24 | 平安科技(深圳)有限公司 | 文本分类模型的生成装置、方法及计算机可读存储介质 |
CN112148881A (zh) * | 2020-10-22 | 2020-12-29 | 北京百度网讯科技有限公司 | 用于输出信息的方法和装置 |
CN112948587A (zh) * | 2021-03-30 | 2021-06-11 | 杭州叙简科技股份有限公司 | 一种基于地震行业的微博舆情分析方法、装置及电子设备 |
CN113468320A (zh) * | 2021-07-22 | 2021-10-01 | 中国地震台网中心 | 地震应急信息快速可视化方法及系统 |
WO2021243828A1 (zh) * | 2020-06-05 | 2021-12-09 | 平安国际智慧城市科技股份有限公司 | 基于机器学习的文本处理方法、装置、计算机设备及介质 |
CN115310443A (zh) * | 2022-09-06 | 2022-11-08 | 上海浦东发展银行股份有限公司 | 模型训练方法、信息分类方法、装置、设备及存储介质 |
CN115690816A (zh) * | 2022-11-16 | 2023-02-03 | 上海浦东发展银行股份有限公司 | 一种文本要素提取方法、装置、设备和介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113657465B (zh) * | 2021-07-29 | 2024-04-09 | 北京百度网讯科技有限公司 | 预训练模型的生成方法、装置、电子设备和存储介质 |
-
2023
- 2023-03-27 CN CN202310308766.5A patent/CN116361463B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107562814A (zh) * | 2017-08-14 | 2018-01-09 | 中国农业大学 | 一种地震应急和灾情信息获取分类方法及系统 |
WO2019200806A1 (zh) * | 2018-04-20 | 2019-10-24 | 平安科技(深圳)有限公司 | 文本分类模型的生成装置、方法及计算机可读存储介质 |
WO2021243828A1 (zh) * | 2020-06-05 | 2021-12-09 | 平安国际智慧城市科技股份有限公司 | 基于机器学习的文本处理方法、装置、计算机设备及介质 |
CN112148881A (zh) * | 2020-10-22 | 2020-12-29 | 北京百度网讯科技有限公司 | 用于输出信息的方法和装置 |
CN112948587A (zh) * | 2021-03-30 | 2021-06-11 | 杭州叙简科技股份有限公司 | 一种基于地震行业的微博舆情分析方法、装置及电子设备 |
CN113468320A (zh) * | 2021-07-22 | 2021-10-01 | 中国地震台网中心 | 地震应急信息快速可视化方法及系统 |
CN115310443A (zh) * | 2022-09-06 | 2022-11-08 | 上海浦东发展银行股份有限公司 | 模型训练方法、信息分类方法、装置、设备及存储介质 |
CN115690816A (zh) * | 2022-11-16 | 2023-02-03 | 上海浦东发展银行股份有限公司 | 一种文本要素提取方法、装置、设备和介质 |
Non-Patent Citations (2)
Title |
---|
地震应急灾情信息分类探讨;董曼;杨天青;;震灾防御技术(第04期);全文 * |
网络地震灾情信息智能处理模型与地震烈度判定方法研究;胡素平;帅向华;;震灾防御技术(第04期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN116361463A (zh) | 2023-06-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20210091076A (ko) | 비디오를 처리하기 위한 방법, 장치, 전자기기, 매체 및 컴퓨터 프로그램 | |
EP4134900A2 (en) | Method and apparatus for recommending content, method and apparatus for training ranking model, device, and storage medium | |
US20220301547A1 (en) | Method for processing audio signal, method for training model, device and medium | |
CN114494776A (zh) | 一种模型训练方法、装置、设备以及存储介质 | |
CN114581732A (zh) | 一种图像处理及模型训练方法、装置、设备和存储介质 | |
KR20220117341A (ko) | 차선 검출 모델의 트레이닝 방법, 장치, 전자 기기 및 저장 매체 | |
TW201415263A (zh) | 取證系統、取證方法及取證程式 | |
CN116361463B (zh) | 一种地震灾情信息提取方法、装置、设备及介质 | |
CN114692778B (zh) | 用于智能巡检的多模态样本集生成方法、训练方法及装置 | |
CN115909357A (zh) | 基于人工智能的目标识别方法、模型训练方法和装置 | |
EP4092564A1 (en) | Method and apparatus for constructing event library, electronic device and computer readable medium | |
CN115641360A (zh) | 基于人工智能的电池检测方法、装置和电子设备 | |
CN115600607A (zh) | 一种日志检测方法、装置、电子设备及介质 | |
CN115098729A (zh) | 视频处理方法、样本生成方法、模型训练方法及装置 | |
CN114417029A (zh) | 模型训练方法、装置、电子设备及存储介质 | |
CN113963186A (zh) | 目标检测模型的训练方法、目标检测方法及相关装置 | |
CN113344064A (zh) | 事件处理方法和装置 | |
CN112818972A (zh) | 兴趣点图像的检测方法、装置、电子设备及存储介质 | |
CN113342978A (zh) | 一种城市事件处理方法及装置 | |
CN115294536B (zh) | 基于人工智能的违章检测方法、装置、设备及存储介质 | |
CN114201607B (zh) | 一种信息处理的方法和装置 | |
US20230145853A1 (en) | Method of generating pre-training model, electronic device, and storage medium | |
CN114531287A (zh) | 虚拟资源获取行为的检测方法、装置、设备及介质 | |
CN114065008A (zh) | 基于搜索的对象识别的方法、装置、设备以及存储介质 | |
CN117271289A (zh) | 一种网页监测方法、装置、设备以及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |