CN115730071A - 电力舆情事件的抽取方法、装置、电子设备及存储介质 - Google Patents

电力舆情事件的抽取方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN115730071A
CN115730071A CN202211495906.6A CN202211495906A CN115730071A CN 115730071 A CN115730071 A CN 115730071A CN 202211495906 A CN202211495906 A CN 202211495906A CN 115730071 A CN115730071 A CN 115730071A
Authority
CN
China
Prior art keywords
event
public opinion
power public
event type
argument
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211495906.6A
Other languages
English (en)
Inventor
张强
毛光辉
付慧
金焱
马径坦
宋博川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Smart Grid Research Institute Co ltd
State Grid Corp of China SGCC
State Grid Jiangsu Electric Power Co Ltd
Original Assignee
State Grid Smart Grid Research Institute Co ltd
State Grid Corp of China SGCC
State Grid Jiangsu Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Smart Grid Research Institute Co ltd, State Grid Corp of China SGCC, State Grid Jiangsu Electric Power Co Ltd filed Critical State Grid Smart Grid Research Institute Co ltd
Priority to CN202211495906.6A priority Critical patent/CN115730071A/zh
Publication of CN115730071A publication Critical patent/CN115730071A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

本发明实施例涉及一种电力舆情事件的抽取方法、装置、电子设备及存储介质,包括:获取电力舆情数据;对所述电力舆情数据进行事件检测,标注含有事件类型标签的目标语句;抽取所述目标语句中的论元角色;将所述目标语句对应的事件类型与抽取到的论元角色按照预设格式组合,得到电力舆情事件。由此,可以从大量的电力舆情文本中自动、快捷的将其包含的多个事件信息同时抽取出来,提高了电力舆情事件的识别准确率和抽取效率。

Description

电力舆情事件的抽取方法、装置、电子设备及存储介质
技术领域
本发明实施例涉及数据处理领域,尤其涉及一种电力舆情事件的抽取方法、装置、电子设备及存储介质。
背景技术
随着网络技术的快速发展,互联网上每天都会有大量电力舆情相关的新闻报道等文本数据产生,这些文本数据可以帮助广大民众了解电力舆情有关的热点信息和相关新闻事件。然而,网络上的这些新闻报道相关的文本数据量很大,每篇新闻报道的文本内容也是有多有少,每一篇新闻报道中叙述的事情很难直接快速的了解。针对该问题,对电力舆情相关的新闻报道进行语义分析的研究,从而可以及时获取热点事件的关键信息,了解舆论动态,同时也可以帮助相关的监管者及时的了解电力相关的舆论,协助其进行快速有效的决策。
现有的事件信息抽取方法包括:基于机器学习的事件抽取方法和基于规则的事件抽取方法,但是这两种方法存在抽取信息精准度低或操作繁琐等问题,不能精准、快速的获取热点事件的关键信息。
发明内容
鉴于此,为解决上述技术问题或部分技术问题,本发明实施例提供一种电力舆情事件的抽取方法、装置、电子设备及存储介质。
第一方面,本发明实施例提供一种电力舆情事件的抽取方法,包括:
获取电力舆情数据;
对所述电力舆情数据进行事件检测,标注含有事件类型标签的目标语句;
抽取所述目标语句中的论元角色;
将所述目标语句对应的事件类型与抽取到的论元角色按照预设格式组合,得到电力舆情事件。
在一个可能的实施方式中,所述方法还包括:
对所述电力舆情数据进行预处理,得到预处理后的电力舆情数据;
将预处理后的电力舆情数据输入预先训练的事件检测模型中,对每个语句标注对应的事件类型标签,得到含有事件类型标签的目标语句。
在一个可能的实施方式中,所述方法还包括:
将所述含有事件类型标签的目标语句输入预先训练的论元角色抽取模型中,对每个论元角色进行识别并标注对应的论元角色标签,得到带有论元角色标签的多个论元角色。
在一个可能的实施方式中,所述方法还包括:
构建电力舆情事件Schema;
将所述目标语句、所述目标语句对应的事件类型、抽取到的论元角色添加到所述电力舆情事件Schema中。
在一个可能的实施方式中,所述方法还包括:
识别每个语句是否包含事件类型,将包含事件类型的语句进行标记;
对标记过的包含事件类型的语句进行事件类型识别,对包含事件类型的语句标记对应的事件类型标签,得到含有事件类型标签的目标语句。
在一个可能的实施方式中,所述方法还包括:
对含有事件类型标签的目标语句进行事件编码,将所述事件编码输入至预先训练的论元角色抽取模型中,识别论元角色特征、语义角色特征和事件类型特征;
基于所述论元角色特征、语义角色特征和事件类型特征,得到事件类型对应的带有论元角色标签的多个论元角色。
第二方面,本发明实施例提供一种电力舆情事件的抽取装置,包括:
获取模块,用于获取电力舆情数据;
检测模块,用于对所述电力舆情数据进行事件检测,标注含有事件类型标签的目标语句;
抽取模块,用于抽取所述目标语句中的论元角色;
所述抽取模块,还用于将所述目标语句对应的事件类型与抽取到的论元角色按照预设格式组合,得到电力舆情事件。
在一个可能的实施方式中,所述检测模块,还用于对所述电力舆情数据进行预处理,得到预处理后的电力舆情数据;将预处理后的电力舆情数据输入预先训练的事件检测模型中,对每个语句标注对应的事件类型标签,得到含有事件类型标签的目标语句。
在一个可能的实施方式中,所述检测模块,还用于识别每个语句是否包含事件类型,将包含事件类型的语句进行标记;对标记过的包含事件类型的语句进行事件类型识别,对包含事件类型的语句标记对应的事件类型标签,得到含有事件类型标签的目标语句。
在一个可能的实施方式中,所述抽取模块,还用于将所述含有事件类型标签的目标语句输入预先训练的论元角色抽取模型中,对每个论元角色进行识别并标注对应的论元角色标签,得到带有论元角色标签的多个论元角色。
在一个可能的实施方式中,所述抽取模块,还用于对含有事件类型标签的目标语句进行事件编码,将所述事件编码输入至预先训练的论元角色抽取模型中,识别论元角色特征、语义角色特征和事件类型特征;基于所述论元角色特征、语义角色特征和事件类型特征,得到事件类型对应的带有论元角色标签的多个论元角色。
在一个可能的实施方式中,所述抽取模块,还用于构建电力舆情事件Schema;将所述目标语句、所述目标语句对应的事件类型、抽取到的论元角色添加到所述电力舆情事件Schema中。
第三方面,本发明实施例提供一种电子设备,包括:处理器和存储器,所述处理器用于执行所述存储器中存储的电力舆情事件的抽取程序,以实现上述第一方面中所述的电力舆情事件的抽取方法。
第四方面,本发明实施例提供一种存储介质,包括:所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现上述第一方面中所述的电力舆情事件的抽取方法。
本发明实施例提供的电力舆情事件的抽取方案,通过获取电力舆情数据;对所述电力舆情数据进行事件检测,标注含有事件类型标签的目标语句;抽取所述目标语句中的论元角色;将所述目标语句对应的事件类型与抽取到的论元角色按照预设格式组合,得到电力舆情事件。相比于现有的基于机器学习的事件抽取方法和基于规则的事件抽取方法,存在抽取信息精准度低或操作繁琐,不能精准、快速的获取热点事件的关键信息的问题,由本方案,可以从大量的电力舆情文本中自动、快捷的将其包含的多个事件信息同时抽取出来,提高了电力舆情事件的识别准确率和抽取效率。
附图说明
图1为本发明实施例提供的一种电力舆情事件的抽取方法的流程示意图;
图2为本发明实施例提供的另一种电力舆情事件的抽取方法的流程示意图;
图3为本发明实施例提供的一种事件检测模型的工作流程示意图;
图4为本发明实施例提供的一种论元角色抽取模型的工作流程示意图;
图5为本发明实施例提供的一种电力舆情事件的抽取模型的工作流程示意图;
图6为本发明实施例提供的一种电力舆情事件的抽取装置的结构示意图;
图7为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为便于对本发明实施例的理解,下面将结合附图以具体实施例做进一步的解释说明,实施例并不构成对本发明实施例的限定。
图1为本发明实施例提供的一种电力舆情事件的抽取方法的流程示意图,如图1所示,该方法具体包括:
S11、获取电力舆情数据。
本发明实施例中,首先获取原始电力舆情数据,可以是文本形式,还可以对电力舆情数据进行预处理,包括但不限于删除特殊字符以及多余的空白行,对数据格式进行统一化处理,去除重复的文本等一系列操作,得到处理后的电力舆情数据。
S12、对所述电力舆情数据进行事件检测,标注含有事件类型标签的目标语句。
对电力舆情数据进行事件检测,首先,可以预先根据实际应用场景设置多个事件类型,例如,电力舆情事件中一般包括会议信息和项目施工信息,可以设置事件类型为会议信息和项目施工信息。
进一步的,可以利用事件检测模型检测每一个语句中是否包含事件类型,如果语句中包含事件类型则标注为“1”,如果不包含事件类型则标注为“0”。
进一步的,识别标注为“1”的语句的事件类型(会议信息或项目施工信息),对语句对应的事件类型打标签,得到标注含有事件类型标签的目标语句。
S13、抽取所述目标语句中的论元角色。
本发明实施例中,对论元角色的抽取任务即为识别事件类型所对应的论元角色值是什么,可以通过使用BERT-BLSTM-CRF模型,使用序列标注来进行数据标注的任务,并使用BIO标签对事件论元角色进行标注。通过事件检测模型,已经获得了电力舆情文本中所包含的所有的事件,如图4所示,将其进行编码作为论元角色抽取模型输入的一部分,最后将论元角色特征、语义角色特征和事件类型特征进行拼接,共同作为BLSTM层的输入,从而增强整体的语义特征,最后再接入CRF层,从而准确的识别出事件类型对应的论元角色。
S14、将所述目标语句对应的事件类型与抽取到的论元角色按照预设格式组合,得到电力舆情事件。
本发明实施例中,可以预先设置事件检测结果的输出格式,该输出格式可以是表格的形式,如表1所示:
Figure BDA0003959406900000061
Figure BDA0003959406900000071
表1
如表1所示,将目标语句、目标语句对应的事件类型与抽取到的论元角色对应填入表中,得到电力舆情事件表。
需要说明的是,输出格式还可以根据实际应用设置其他形式,本发明不做具体限制。
本发明实施例提供的电力舆情事件的抽取方法,通过获取电力舆情数据;对所述电力舆情数据进行事件检测,标注含有事件类型标签的目标语句;抽取所述目标语句中的论元角色;将所述目标语句对应的事件类型与抽取到的论元角色按照预设格式组合,得到电力舆情事件。相比于现有的基于机器学习的事件抽取方法和基于规则的事件抽取方法,存在抽取信息精准度低或操作繁琐,不能精准、快速的获取热点事件的关键信息的问题,由本方法,可以从大量的电力舆情文本中自动、快捷的将其包含的多个事件信息同时抽取出来,提高了电力舆情事件的识别准确率和抽取效率。
图2为本发明实施例提供的另一种电力舆情事件的抽取方法的流程示意图,如图2所示,该方法具体包括:
S21、识别每个语句是否包含事件类型,将包含事件类型的语句进行标记。
S22、对标记过的包含事件类型的语句进行事件类型识别,对包含事件类型的语句标记对应的事件类型标签,得到含有事件类型标签的目标语句。
本发明实施例中,识别每个语句是否包含事件类型,并且对包含的事件类型进行识别,可以通过事件检测模型进行识别。预先训练事件检测模型:
首先,构建电力舆情相关的事件Schema,如表2所示:
Figure BDA0003959406900000081
表2
步骤一:电力舆情数据通过使用语言技术平台(LTP)中的语义角色标注模型进行语义角色标注,根据对电力舆情事件抽取的分析,需要获取触发词对应的施事(Arg0)、受事(Arg1)、地点(LOC)和时间(TMP)等四个语义角色。
步骤二:对于一个完整的事件Schema包括事件类型、各类事件的触发词和各类事件的重要角色,事件的触发词主要为事件的核心词与标志词,其词性一般为动词或者名词。论元角色为其中每个事件类型对应的值。通过对语料的总结,最终确定论元角色的全部类型值。
其次,对电力舆情数据进行预处理以及标注:
对事件检测模型的数据进行标注,得到电力舆情文本以及其包含的事件类别,标注样例如表3所示;对论元角色抽取模型的数据进行标注,得到电力舆情文本中所包含的论元角色,标注实例如表4所示,具体步骤如下:
Figure BDA0003959406900000082
Figure BDA0003959406900000091
表3
Figure BDA0003959406900000092
表4
步骤一:电力舆情文本预处理。对收集到的原始电力舆情数据进行预处理,删除特殊字符以及多余的空白行,对数据格式进行统一化处理,去除重复的文本等一系列操作。
步骤二:对事件检测模型的数据进行标注。通过对电力舆情事件抽取任务的分析,总结出会议信息和项目施工信息两个事件类型。电力舆情相关的事件检测任务,其目的就是要检测电力舆情文本中所包含的事件类型,因在同一个数据文本中存在含有多个事件类型的情况,因此在进行事件检测模型数据标注时可以将其视为一个多标签的分类任务,即在标注时,某文本中包含事件类型就在其对应下标位置标注为“1”,不包含该事件类型就在其对应下标位置标注为“0”。
步骤三:对论元角色抽取模型的数据进行标注。对论元角色的识别任务即为识别事件类型所对应的论元角色值是什么。通过使用序列标注来进行数据标注的任务,并使用BIO标签对事件论元角色进行标注。
进一步的,搭建电力舆情相关的事件检测模型:通过对电力舆情文本进行事件检测,从文本中检测出其所包含的多个事件类型,电力舆情相关的事件检测模型的工作流程如图3所示。具体步骤如下:
步骤一:由于BERT模型的输入是单字模式的,将电力舆情文本数据中的每一句都拆分成单个字形式,通过使用BERT预训练模型来对电力舆情文本进行特征提取,得到期对应的BERT特征向量。
步骤二:将电力舆情文本中所包含的触发词对应的位置标记为“1”,其他位置都标记为“0”,并将其与BERT模型得到的特征向量进行拼接,将得到的结果作为BLSTM模型的输入。
步骤三:通过sigmoid激活函数得到每个事件类别的概率,这里可以取0.5作为事件类别概率可以通过的阈值,即事件类别的概率如果大于0.5,就将该事件类别作为电力舆情文本中所包含的事件类别。
S23、对含有事件类型标签的目标语句进行事件编码,将所述事件编码输入至预先训练的论元角色抽取模型中,识别论元角色特征、语义角色特征和事件类型特征。
S24、基于所述论元角色特征、语义角色特征和事件类型特征,得到事件类型对应的带有论元角色标签的多个论元角色。
搭建电力舆情相关的论元角色抽取模型,通过论元角色抽取模型对电力舆情文本不同的事件类型抽取出其对应的论元角色,电力舆情相关的论元角色抽取模型的工作流程如图4所示。具体步骤如下:
步骤一:论元角色抽取模型的任务为系列的标注任务,通过搭建BERT-BLSTM-CRF模型进行训练对论元角色的识别。
步骤二:事件检测任务的输出为事件类别,将其进行编码和语义角色特征以及BERT模型的输出进行拼接,将其作为BLSTM模型的输入,在其后加入CRF层来大大减少不规则标签出现的概率,从而来提高论元角色的识别率。
进一步的,搭建电力舆情的事件抽取模型,得到事件抽取的结果。电力舆情事件抽取模型为事件检测模型与论元角色抽取模型的融合,,电力舆情事件抽取模型如图5所示,通过以上各步骤已经可以获得事件抽取的各项内容,通过对输入的电力舆情文本进行处理,对输出的事件类型与论元角色进行对应处理,从而获得最终结构化输出的结果。
S25、构建电力舆情事件Schema。
S26、将所述目标语句、所述目标语句对应的事件类型、抽取到的论元角色添加到所述电力舆情事件Schema中。
本发明实施例中,可以预先设置事件检测结果的输出格式,该输出格式可以是表格的形式,将目标语句、目标语句对应的事件类型与抽取到的论元角色对应填入表中,得到电力舆情事件表。
需要说明的是,输出格式还可以根据实际应用设置其他形式,本发明不做具体限制。
本发明实施例提供的电力舆情事件的抽取方法,通过获取电力舆情数据;对所述电力舆情数据进行预处理,得到处理后的电力舆情数据;对所述处理后的电力舆情数据进行事件检测,标注含有事件类型标签的目标语句;抽取所述目标语句中的论元角色;将所述目标语句对应的事件类型与抽取到的论元角色按照预设格式组合,得到电力舆情事件。由本方法,通过电力舆情事件检测模型,从电力舆情数据中识别出所包含的全部事件类型,通过电力舆情论元角色抽取模型,识别出具体的论元角色内容,从而将非结构化的文本数据,转化为以结构化数据呈现的方式,本发明中通过事件检测模型以多标签分类的模式进行事件类型的标注,可以更多的获取电力舆情文本中所含有的全部事件类型,在进行论元角色标注的时候通过使用多种特征向量融合拼接的方式进行论元角色的抽取提高了事件抽取最终的准确率,可以从大量的电力舆情文本中自动、快捷的将其包含的多个事件信息同时抽取出来,提高了电力舆情事件的识别准确率和抽取效率,减少了人力对事件信息的抽取工作,减少了工作量,降低成本。
图6示出了本发明实施例的一种电力舆情事件的抽取装置的结构示意图。如图7所示,该装置包括:
获取模块601,用于获取电力舆情数据。详细说明参见上述方法实施例对应的相关描述,此处不再赘述。
检测模块602,用于对所述电力舆情数据进行事件检测,标注含有事件类型标签的目标语句。详细说明参见上述方法实施例对应的相关描述,此处不再赘述。
抽取模块603,用于抽取所述目标语句中的论元角色;将所述目标语句对应的事件类型与抽取到的论元角色按照预设格式组合,得到电力舆情事件。详细说明参见上述方法实施例对应的相关描述,此处不再赘述。
本发明实施例提供的电力舆情事件的抽取装置,用于执行上述实施例提供的电力舆情事件的抽取方法,其实现方式与原理相同,详细内容参见上述方法实施例的相关描述,不再赘述。
图7示出了本发明实施例的一种电子设备,如图7所示,该电子设备可以包括处理器901和存储器902,其中处理器901和存储器902可以通过总线或者其他方式连接,图7中以通过总线连接为例。
处理器901可以为中央处理器(Central Processing Unit,CPU)。处理器901还可以为其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。
存储器902作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块,如本发明实施例中所提供方法所对应的程序指令/模块。处理器901通过运行存储在存储器902中的非暂态软件程序、指令以及模块,从而执行处理器的各种功能应用以及数据处理,即实现上述方法实施例中的方法。
存储器902可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储处理器901所创建的数据等。此外,存储器902可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器902可选包括相对于处理器901远程设置的存储器,这些远程存储器可以通过网络连接至处理器901。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
一个或者多个模块存储在存储器902中,当被处理器901执行时,执行上述方法实施例中的方法。
上述电子设备具体细节可以对应参阅上述方法实施例中对应的相关描述和效果进行理解,此处不再赘述。
本领域技术人员可以理解,实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)、随机存储记忆体(Random Access Memory,RAM)、快闪存储器(Flash Memory)、硬盘(Hard Disk Drive,缩写:HDD)或固态硬盘(Solid-StateDrive,SSD)等;存储介质还可以包括上述种类的存储器的组合。
虽然结合附图描述了本发明的实施例,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下作出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。

Claims (10)

1.一种电力舆情事件的抽取方法,其特征在于,包括:
获取电力舆情数据;
对所述电力舆情数据进行事件检测,标注含有事件类型标签的目标语句;
抽取所述目标语句中的论元角色;
将所述目标语句对应的事件类型与抽取到的论元角色按照预设格式组合,得到电力舆情事件。
2.根据权利要求1所述的方法,其特征在于,对所述电力舆情数据进行事件检测,标注含有事件类型标签的目标语句,包括:
对所述电力舆情数据进行预处理,得到预处理后的电力舆情数据;
将预处理后的电力舆情数据输入预先训练的事件检测模型中,对每个语句标注对应的事件类型标签,得到含有事件类型标签的目标语句。
3.根据权利要求2所述的方法,其特征在于,所述抽取所述目标语句中的论元角色,包括:
将所述含有事件类型标签的目标语句输入预先训练的论元角色抽取模型中,对每个论元角色进行识别并标注对应的论元角色标签,得到带有论元角色标签的多个论元角色。
4.根据权利要求3所述的方法,其特征在于,所述将所述目标语句对应的事件类型与抽取到的论元角色按照预设格式组合,得到电力舆情事件,包括:
构建电力舆情事件Schema;
将所述目标语句、所述目标语句对应的事件类型、抽取到的论元角色添加到所述电力舆情事件Schema中。
5.根据权利要求2所述的方法,其特征在于,所述将所述处理后的电力舆情数据输入预先训练的事件检测模型中,对每个语句标注对应的事件类型标签,得到含有事件类型标签的目标语句,包括:
识别每个语句是否包含事件类型,将包含事件类型的语句进行标记;
对标记过的包含事件类型的语句进行事件类型识别,对包含事件类型的语句标记对应的事件类型标签,得到含有事件类型标签的目标语句。
6.根据权利要求2所述的方法,其特征在于,所述将所述含有事件类型标签的目标语句输入预先训练的论元角色抽取模型中,对每个论元角色进行识别并标注对应的论元角色标签,得到带有论元角色标签的多个论元角色,包括:
对含有事件类型标签的目标语句进行事件编码,将所述事件编码输入至预先训练的论元角色抽取模型中,识别论元角色特征、语义角色特征和事件类型特征;
基于所述论元角色特征、语义角色特征和事件类型特征,得到事件类型对应的带有论元角色标签的多个论元角色。
7.一种电力舆情事件的抽取装置,其特征在于,包括:
获取模块,用于获取电力舆情数据;
检测模块,用于对所述电力舆情数据进行事件检测,标注含有事件类型标签的目标语句;
抽取模块,用于抽取所述目标语句中的论元角色;
所述抽取模块,还用于将所述目标语句对应的事件类型与抽取到的论元角色按照预设格式组合,得到电力舆情事件。
8.根据权利要求7所述的装置,其特征在于,所述检测模块,具体用于对所述电力舆情数据进行预处理,得到预处理后的电力舆情数据;将预处理后的电力舆情数据输入预先训练的事件检测模型中,对每个语句标注对应的事件类型标签,得到含有事件类型标签的目标语句。
9.一种电子设备,其特征在于,包括:处理器和存储器,所述处理器用于执行所述存储器中存储的电力舆情事件的抽取程序,以实现权利要求1~6中任一项所述的电力舆情事件的抽取方法。
10.一种存储介质,其特征在于,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现权利要求1~6中任一项所述的电力舆情事件的抽取方法。
CN202211495906.6A 2022-11-23 2022-11-23 电力舆情事件的抽取方法、装置、电子设备及存储介质 Pending CN115730071A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211495906.6A CN115730071A (zh) 2022-11-23 2022-11-23 电力舆情事件的抽取方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211495906.6A CN115730071A (zh) 2022-11-23 2022-11-23 电力舆情事件的抽取方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN115730071A true CN115730071A (zh) 2023-03-03

Family

ID=85298525

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211495906.6A Pending CN115730071A (zh) 2022-11-23 2022-11-23 电力舆情事件的抽取方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN115730071A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117648397A (zh) * 2023-11-07 2024-03-05 中译语通科技股份有限公司 篇章事件抽取方法、系统、设备及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117648397A (zh) * 2023-11-07 2024-03-05 中译语通科技股份有限公司 篇章事件抽取方法、系统、设备及存储介质

Similar Documents

Publication Publication Date Title
CN111177532A (zh) 一种垂直搜索方法、装置、计算机系统及可读存储介质
CN111309910A (zh) 文本信息挖掘方法及装置
CN111783471B (zh) 自然语言的语义识别方法、装置、设备及存储介质
CN113486178B (zh) 文本识别模型训练方法、文本识别方法、装置以及介质
CN114861677B (zh) 信息抽取方法、装置、电子设备以及存储介质
CN112257444B (zh) 金融信息负面实体发现方法、装置、电子设备及存储介质
CN113282955A (zh) 隐私政策中隐私信息提取方法、系统、终端及介质
CN115080750B (zh) 基于融合提示序列的弱监督文本分类方法、系统和装置
CN111738018A (zh) 一种意图理解方法、装置、设备及存储介质
CN113159969A (zh) 一种金融长文本复核系统
CN112651234A (zh) 一种半开放信息抽取的方法及装置
CN111178080B (zh) 一种基于结构化信息的命名实体识别方法及系统
CN112784580A (zh) 基于事件抽取的金融数据分析方法及装置
CN114218940B (zh) 文本信息处理、模型训练方法、装置、设备及存储介质
CN117668180A (zh) 文档问答方法、文档问答设备以及可读存储介质
WO2022267460A1 (zh) 基于事件的情感分析方法、装置、计算机设备及存储介质
CN113568969B (zh) 信息抽取方法、装置、设备以及计算机可读存储介质
CN113705192B (zh) 文本处理方法、装置与存储介质
CN115730071A (zh) 电力舆情事件的抽取方法、装置、电子设备及存储介质
CN118093689A (zh) 基于rpa多模态文档解析与结构化处理系统
CN117278675A (zh) 一种基于意图分类的外呼方法、装置、设备及介质
US20120197894A1 (en) Apparatus and method for processing documents to extract expressions and descriptions
CN113657092B (zh) 识别标签的方法、装置、设备以及介质
CN115563278A (zh) 一种句子文本的问题分类处理方法及装置
CN114722821A (zh) 一种文本匹配方法、装置、存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination