CN106445999A - 一种基于事件要素的事件抽取方法及系统 - Google Patents

一种基于事件要素的事件抽取方法及系统 Download PDF

Info

Publication number
CN106445999A
CN106445999A CN201610599014.9A CN201610599014A CN106445999A CN 106445999 A CN106445999 A CN 106445999A CN 201610599014 A CN201610599014 A CN 201610599014A CN 106445999 A CN106445999 A CN 106445999A
Authority
CN
China
Prior art keywords
event
place
time
data
key element
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610599014.9A
Other languages
English (en)
Inventor
史墨轩
杨伟锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin Mass Information Technology Ltd By Share Ltd
Original Assignee
Tianjin Mass Information Technology Ltd By Share Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin Mass Information Technology Ltd By Share Ltd filed Critical Tianjin Mass Information Technology Ltd By Share Ltd
Priority to CN201610599014.9A priority Critical patent/CN106445999A/zh
Publication of CN106445999A publication Critical patent/CN106445999A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates

Abstract

本发明涉及一种基于事件要素的事件抽取方法及系统。该方法包括:根据预设事件识别模型对显示在预设长度文本窗口内的数据中所包含的事件构成要素识别:根据该预设事件识别模型对所述数据中所包含的事件特征词进行识别;对所述事件特征词以及事件构成要素组合成描述相应事件的新的数据对象。本发明可实现快速对互联网上传播的数据的抽取,且事件抽取方法可控可干预,从而可极大地满足互联网信息中数据抽取的需要,最终获得效果理想的事件识别结果。

Description

一种基于事件要素的事件抽取方法及系统
技术领域
本发明属于数据挖掘技术领域,具体涉及一种基于事件要素的事件抽取方法及系统。
背景技术
由于现在互联网的发展,以微博为代表的自媒体大行其道,相比起官方的通告,互联网自媒体的声音要更迅速,更贴近。对于应对各类突发事件(如火灾、地震等),互联网上的信息变得尤为重要,但面对互联网庞大的数据增量,这类数据又显得极为稀疏,因此从互联网庞大的声音中找到各类突发事件的声音,以便即使的做出响应和对策,是现在无论政府还是企业都迫切需要的一种数据挖掘能力。
发明内容
本发明的目的在于解决上述的技术问题而提供一种基于事件要素的事件抽取方法及系统。
为实现上述目的,本发明采用如下技术方案:
一种基于事件要素的事件抽取方法,包括以下步骤:
根据预设事件识别模型,对显示在预设长度文本窗口内的数据中所包含的事件构成要素识别:
根据该预设事件识别模型,对所述数据中所包含的事件特征词进行识别;
对所述事件特征词以及事件构成要素组合成描述相应事件的新的数据对象。
本发明的目的还在于提供一种基于事件要素的事件抽取系统,包括:
要素识别模块,用于根据预设事件识别模型,对显示在预设长度文本窗口内的数据中所包含的事件构成要素识别:
特征词识别模块,用于根据该预设事件识别模型,根据预设事件识别模型对所述数据中所包含的事件特征词进行识别;
数据组合模块,用于对所述事件特征词以及事件构成要素组合成描述相应事件的新的数据对象。
本发明通过数据中所包含的事件的构成要素进行识别后,利用预置的要素同现模型识别出该数据中包含的事件特征词,原来将事件特征词与事件的构成要素进行组合,形成新的描述事件的数据对象,从而实现快速对互联网上传播的数据的抽取,且本发明事件抽取方法可控可干预,从而可极大地满足互联网信息中数据抽取的需要,最终获得效果理想的事件识别结果。
附图说明
图1为本发明实施例提供的基于事件要素的事件抽取方法的流程图;
图2为本发明实施例提供的基于事件要素的事件抽取系统的原理图。
具体实施方式
下面,结合实例对本发明的实质性特点和优势作进一步的说明,但本发明并不局限于所列的实施例。
本发明是通过要素识别、复合以及同现手段以实现对事件自动化的提取的。
见图1所示,一种基于事件要素的事件抽取方法,包括
根据预设事件识别模型,对显示在预设长度文本窗口内的数据中所包含的事件构成要素识别:
根据该预设事件识别模型对所述数据中所包含的事件特征词进行识别;
对所述事件特征词以及事件构成要素组合成描述相应事件的新的数据对象。
所述预设长度文本窗口可以根据需要来设定,如可以根据数据的事件表达的经验值来设定相应的文本窗口的长度,以使一个文本窗口内数据可以表述一个完整的事件为原则。
所述事件构成要素主要是指能构成一个事件的关键要素,该要素组合起来能完整、简要地描述一个事件的发生时间、地点等。
所述事件特征词,是能够确定事件内容的一类特征词,通常是事件具体描述词,是指能表述事件或描述事件的主要特征的词,即描述这是一个什么事件,如火灾事件或爆炸事件。
由于不同类型的事件在互联网文本传播时,在一定文本窗口内所出现的要素类型及要素内容是不同的,也就是说同一个要素内容对于不同的事件贡献不同,根据事件识别模型及数据文本的要素的同现情况,就能确定这段文本数据的具体事件描述。
所述预设事件识别模型根据不同事件抽取的需要而设置,因而对应不同的事件抽取需要,可以是多个事件识别模型,如火灾事件识别模型、爆炸事件识别模型等,不同的事件识别模型要求同现的要素不同,如火灾事件识别模型要求同现的要素可以是事件构成要素如时间、地点与对应的火灾特征词,而爆炸事件识别模型要求同现的要素可以是事件构成要素如时间、地点与对应的爆炸特征词。
如原始文本为:“2016年1月15日凌晨2:50左右,东关镇东华社区一民房因电线老化漏电发生火灾”
利用火灾同现模型,形成的新的数据对象如下:
文本内容:2016年1月15日凌晨2:50左右,东关镇东华社区一民房因电线老化漏电发生火灾
事件特征词:火灾
发生时间:2016年1月15日凌晨2:50
发生地点:东关镇。
本发明通过数据中所包含的事件的构成要素进行识别后,利用预置的要素同现模型识别出该数据中包含的事件特征词,原来将事件特征词与事件的构成要素进行组合,形成新的描述事件的数据对象,从而实现快速对互联网上传播的数据的抽取,且本发明事件抽取方法可控可干预,从而可极大地满足互联网信息中数据抽取的需要,最终获得效果理想的事件识别结果。
具体实现上,本发明中,所述事件构成要素可以是包括时间、地点、数量以及人物;所述数量包括数字及对应的数量单位。
所述时间如数据中的包含的“14年5月20日12点24分”,地点如数据中包含的的“济南市”,数量如数据中包含的“1,111平方米”,人物如数据中包含的“张某某说”。
进一步的,本发明中,在对事件构成要素识别还包括以下格式化的步骤:
对识别出的时间要素,按预置方法进行格式归一化处理转换统一的时间格式;
对识别出的数量要素,将数量要素中的数字与对应的数量单位拆分,将数字转换为预设的数字格式;
对识别出的地点要素,根据地点分类标准将地点分为多级,并给每个地点赋予上级行政区划的属性;
对识别的出人物要素进行格式化处理,提取出相应的人名。
具体的,对上述关于对时间要素、数量要素及地点要素的处理可以是采用如下方法:
时间----从文本中识别出时间,并对时间进行格式归一化,时间分为绝对时间和相对时间:
绝对时间转化为标准时间格式,如14年5月20日12点24分,转化为:2014-05-2012:24:00;
相对时间通过基准时间进行调整,并转化为标准时间格式;
如昨天(基准时间2014-05-20 12:24:00,)转化为2014-05-19 12:24:00。
地点---从文本中识别出地点,根据地点分类标准,将地点可以分为5级(如国家,省,市,区县,乡镇),并给每个地点赋予高级行政区划的属性。
如济南市,级别为3级,高级行政区划:中国-山东省。
数量---从文本中识别出数字,对数字进行分类,将数字中的数和单位拆分,数转化为标准的数字格式。
如:1,111平方米,格式化数字:1111,单位:平方米。
人物---从文本中识别出人名。
如:张某某说,格式化人名:张某某。
通过以上的方法,对数据中包含的时间、地点、数量要素进行统一处的处理,形成了统一的格式,便于事件抽取时数据处理统一。
进一步的,本发明中,在对事件构成要素中的时间、地点、数量要素识别出后还包括以下步骤:
根据预选设置的时间、地点、数量的筛选条件,对识别出的事件构成要素中的时间、地点、数量进行筛选。
通过对识别出的地名,时间,数字可以再进行针对性地筛选,可以取得更为细分的结果,从而满足相应的事件识别要求,输出符合要求的事件识别结构,使得事件识别处理更为准确。
具体的,在时间筛选上,可以通过日期比较筛选实现:筛选某一天前后的日期或某个区间的日期;时间筛选:筛选某个时间点前后的时间或某个区间的时间;自定义时间段筛选:可以自定义筛选某个时间特征,如:2016-05-27前的日期,09:10:00后的时间,4月份的时间
地点,根据行政区划进行筛选,如属于中国河南的地点,属于中国浙江省慈溪市的地点
数字,根据数字大小筛选,单位筛选;如大于20的数,单位是“小时”的数量。
需要说明的是,本发明中,所述对显示在预设长度文本窗口内的数据中所包含的事件构成要素识别时以在句内的数据为限进行识别。
事件模型的一重要维度,通常分为整句(句号等结尾),半句(逗号等结尾)两种划分,因此事件识别模型通过以在句内的数据为限进行识别,能够降低自然语言在跨句时的歧义问题。
如文本窗口内显示的原始文本内容为“2016年1月15日凌晨2:50左右,东关镇东华社区一民房因电线老化漏电发生火灾”
该火灾事件识别模型要求必须包括的要素有:时间+地点+火灾特征词(一句话内)
事件特征词:火灾
事件时间:2016年1月15日凌晨2:50
时间地点:东关镇。
本发明的目的还在于提供一种基于事件要素的事件抽取系统,包括:
要素识别模块,用于根据预设事件识别模型,对显示在预设长度文本窗口内的数据中所包含的事件构成要素识别:
特征词识别模块,用于根据该预设事件识别模型,根据预设事件识别模型对所述数据中所包含的事件特征词进行识别;
数据组合模块,用于对所述事件特征词以及事件构成要素组合成描述相应事件的新的数据对象。
所述的预设长度文本窗口可以根据需要来设定,如可以根据数据的事件表达的经验值来设定相应的文本窗口的长度,以使一个文本窗口内数据可以表述一个完整的事件为原则。
所述事件构成要素主要是指能构成一个事件的关键要素,该要素组合起来能完整、简要地描述一个事件的发生时间、地点等。
所述事件特征词,是能够确定事件内容的一类特征词,通常是事件具体描述词,是指能表述事件或描述事件的主要特征的词,即描述这是一个什么事件,如火灾事件或爆炸事件。
由于不同类型的事件在互联网文本传播时,在一定文本窗口内所出现的要素类型及要素内容是不同的,也就是说同一个要素内容对于不同的事件贡献不同,根据事件识别模型及数据文本的要素同现情况,就能确定这段文本数据的具体事件描述。
所述预设事件识别模型根据不同事件抽取的需要而设置,因而对应不同的事件抽取需要,可以是多个事件识别模型,如火灾事件识别模型、爆炸事件识别模型等,不同的事件识别模型要求同现的要素不同,如火灾事件识别模型要求同现的要素可以是事件构成要素如时间、地点与对应的火灾特征词,而爆炸事件识别模型要求同现的要素可以是事件构成要素如时间、地点与对应的爆炸特征词。
如原始文本为:“2016年1月15日凌晨2:50左右,东关镇东华社区一民房因电线老化漏电发生火灾”
利用火灾同现模型,形成的新的数据对象如下:
文本内容:2016年1月15日凌晨2:50左右,东关镇东华社区一民房因电线老化漏电发生火灾
事件特征词:火灾
发生时间:2016年1月15日凌晨2:50
发生地点:东关镇。
本发明通过数据中所包含的事件的构成要素进行识别后,利用预置的要素同现模型识别出该数据中包含的事件特征词,原来将事件特征词与事件的构成要素进行组合,形成新的描述事件的数据对象,从而实现快速对互联网上传播的数据的抽取,且本发明事件抽取方法可控可干预,从而可极大地满足互联网信息中数据抽取的需要,最终获得效果理想的事件识别结果。
具体实现上,本发明中,所述事件构成要素包括时间、地点、数量以及人物;所述数量包括数字及对应的数量单位。
所述时间如数据中的包含的“14年5月20日12点24分”,地点如数据中包含的的“济南市”,数量如数据中包含的“1,111平方米”,人物如数据中包含的“张某某说”。
进一步的,本发明中,所述要素识别模块包括:
时间要素处理单元,用于对识别出的时间要素,按预置方法进行格式归一化处理转换统一的时间格式;
数量要素处理单元,用于对识别出的数量要素,将数量要素中的数字与对应的数量单位拆分,将数字转换为预设的数字格式;
地点要素处理单元,用于对识别出的地点要素,根据地点分类标准将地点分为多级,并给每个地点赋予上级行政区划的属性。
人名要素处理单元,用于对识别的出人物要素进行格式化处理,提取出相应的人名。
具体的,对上述关于对时间要素、数量要素及地点要素的处理可以是采用如下方法:
时间----从文本中识别出时间,并对时间进行格式归一化,时间分为绝对时间和相对时间:
绝对时间转化为标准时间格式,如14年5月20日12点24分,转化为:2014-05-2012:24:00;
相对时间通过基准时间进行调整,并转化为标准时间格式;
如昨天(基准时间2014-05-20 12:24:00,)转化为2014-05-19 12:24:00。
地点---从文本中识别出地点,根据地点分类标准,将地点可以分为5级(如国家,省,市,区县,乡镇),并给每个地点赋予高级行政区划的属性。
如济南市,级别为3级,高级行政区划:中国-山东省。
数量---从文本中识别出数字,对数字进行分类,将数字中的数和单位拆分,数转化为标准的数字格式。
如:1,111平方米,格式化数字:1111,单位:平方米。
人物---从文本中识别出人名。
如:张某某说,格式化人名:张某某。
通过以上的方法,对数据中包含的时间、地点、数量要素进行统一处的处理,形成了统一的格式,便于事件抽取时数据处理统一。
进一步的,本发明中,所述要素识别模块包括筛选单元,用于在对事件构成要素中的时间、地点、数量要素识别出后,根据预选设置的时间、地点、数量的筛选条件,对识别出的事件构成要素中的时间、地点、数量进行筛选。
通过对识别出的地名,时间,数字可以再进行针对性地筛选,可以取得更为细分的结果,从而满足相应的事件识别要求,输出符合要求的事件识别结构,使得事件识别处理更为准确。
具体的,在时间筛选上,可以通过日期比较筛选实现:筛选某一天前后的日期或某个区间的日期;时间筛选:筛选某个时间点前后的时间或某个区间的时间;自定义时间段筛选:可以自定义筛选某个时间特征,如:2016-05-27前的日期,09:10:00后的时间,4月份的时间
地点,根据行政区划进行筛选,如属于中国河南的地点,属于中国浙江省慈溪市的地点
数字,根据数字大小筛选,单位筛选;如大于20的数,单位是“小时”的数量。
需要说明的是,本发明中,所述对显示在预设长度文本窗口内的数据中所包含的事件构成要素识别时以在句内的数据为限进行识别。
事件模型的一重要维度,通常分为整句(句号等结尾),半句(逗号等结尾)两种划分,因此事件识别模型通过以在句内的数据为限进行识别,能够降低自然语言在跨句时的歧义问题。
如文本窗口内显示的原始文本内容为“2016年1月15日凌晨2:50左右,东关镇东华社区一民房因电线老化漏电发生火灾”
该火灾事件识别模型要求必须包括的要素有:时间+地点+火灾特征词(一句话内)
事件特征词:火灾
事件时间:2016年1月15日凌晨2:50
时间地点:东关镇。
可以看出,本发明通过使用要素识别以及事件识别模型,能灵活的针对开放文本进行事件抽取,要素识别为后续处理提供了标准的格式化的事件要素,另外通过要素筛选,要素同现的事件特征词、句内设置及能够简单的对事件抽取效果进行干预,使事件抽取可运营,可干预,效果可控,通过模型的改进,最终获得效果理想的事件识别结果。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种基于事件要素的事件抽取方法,其特征在于,包括以下步骤:
根据预设事件识别模型,对显示在预设长度文本窗口内的数据中所包含的事件构成要素识别:
根据该预设事件识别模型,对所述数据中所包含的事件特征词进行识别;
对所述事件特征词以及事件构成要素组合成描述相应事件的新的数据对象。
2.根据权利要求1所述基于事件要素的事件抽取方法,其特征在于,所述事件构成要素包括时间、地点、数量以及人物;所述数量包括数字及对应的数量单位。
3.根据权利要求2所述基于事件要素的事件抽取方法,其特征在于,在对事件构成要素识别还包括以下步骤:
对识别出的时间要素,按预置方法进行格式归一化处理转换统一的时间格式;
对识别出的数量要素,将数量要素中的数字与对应的数量单位拆分,将数字转换为预设的数字格式;
对识别出的地点要素,根据地点分类标准将地点分为多级,并给每个地点赋予上级行政区划的属性。
4.根据权利要求3所述基于事件要素的事件抽取方法,其特征在于,在对事件构成要素中的时间、地点、数量要素识别出后还包括以下步骤:
根据预选设置的时间、地点、数量的筛选条件,对识别出的事件构成要素中的时间、地点、数量进行筛选。
5.根据权利要求1-4任一项所述基于事件要素的事件抽取方法,其特征在于,所述对显示在预设长度文本窗口内的数据中所包含的事件构成要素识别时以在句内的数据为限进行识别。
6.一种基于事件要素的事件抽取系统,其特征在于,包括:
要素识别模块,用于根据预设事件识别模型,对显示在预设长度文本窗口内的数据中所包含的事件构成要素识别:
特征词识别模块,用于根据该预设事件识别模型,根据预设事件识别模型对所述数据中所包含的事件特征词进行识别;
数据组合模块,用于对所述事件特征词以及事件构成要素组合成描述相应事件的新的数据对象。
7.根据权利要求6所述基于事件要素的事件抽取系统,其特征在于,所述事件构成要素包括时间、地点、数量以及人物;所述数量包括数字及对应的数量单位。
8.根据权利要求7所述基于事件要素的事件抽取方法,其特征在于,所述要素识别模块包括:
时间要素处理单元,用于对识别出的时间要素,按预置方法进行格式归一化处理转换统一的时间格式;
数量要素处理单元,用于对识别出的数量要素,将数量要素中的数字与对应的数量单位拆分,将数字转换为预设的数字格式;
地点要素处理单元,用于对识别出的地点要素,根据地点分类标准将地点分为多级,并给每个地点赋予上级行政区划的属性。
9.根据权利要求8所述基于事件要素的事件抽取方法,其特征在于,所述要素识别模块包括筛选单元,用于在对事件构成要素中的时间、地点、数量要素识别出后,根据预选设置的时间、地点、数量的筛选条件,对识别出的事件构成要素中的时间、地点、数量进行筛选。
10.根据权利要求6-9任一项所述基于事件要素的事件抽取方法,其特征在于,所述对显示在预设长度文本窗口内的数据中所包含的事件构成要素识别时以在句内的数据为限进行识别。
CN201610599014.9A 2016-07-27 2016-07-27 一种基于事件要素的事件抽取方法及系统 Pending CN106445999A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610599014.9A CN106445999A (zh) 2016-07-27 2016-07-27 一种基于事件要素的事件抽取方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610599014.9A CN106445999A (zh) 2016-07-27 2016-07-27 一种基于事件要素的事件抽取方法及系统

Publications (1)

Publication Number Publication Date
CN106445999A true CN106445999A (zh) 2017-02-22

Family

ID=58184273

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610599014.9A Pending CN106445999A (zh) 2016-07-27 2016-07-27 一种基于事件要素的事件抽取方法及系统

Country Status (1)

Country Link
CN (1) CN106445999A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110245907A (zh) * 2018-03-09 2019-09-17 北京国双科技有限公司 庭审笔录内容的生成方法及装置
WO2020007138A1 (zh) * 2018-07-03 2020-01-09 腾讯科技(深圳)有限公司 一种事件识别的方法、模型训练的方法、设备及存储介质
CN110909122A (zh) * 2019-10-10 2020-03-24 重庆金融资产交易所有限责任公司 一种信息处理方法及相关设备
CN111967268A (zh) * 2020-06-30 2020-11-20 北京百度网讯科技有限公司 文本中的事件抽取方法、装置、电子设备和存储介质
CN112989031A (zh) * 2021-04-28 2021-06-18 成都索贝视频云计算有限公司 基于深度学习的广播电视新闻事件要素抽取方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080098399A1 (en) * 2006-10-18 2008-04-24 Kabushiki Kaisha Toshiba Thread ranking system and thread ranking method
CN102298635A (zh) * 2011-09-13 2011-12-28 苏州大学 事件信息融合方法和系统
CN104408093A (zh) * 2014-11-14 2015-03-11 中国科学院计算技术研究所 一种新闻事件要素抽取方法与装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080098399A1 (en) * 2006-10-18 2008-04-24 Kabushiki Kaisha Toshiba Thread ranking system and thread ranking method
CN102298635A (zh) * 2011-09-13 2011-12-28 苏州大学 事件信息融合方法和系统
CN104408093A (zh) * 2014-11-14 2015-03-11 中国科学院计算技术研究所 一种新闻事件要素抽取方法与装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110245907A (zh) * 2018-03-09 2019-09-17 北京国双科技有限公司 庭审笔录内容的生成方法及装置
WO2020007138A1 (zh) * 2018-07-03 2020-01-09 腾讯科技(深圳)有限公司 一种事件识别的方法、模型训练的方法、设备及存储介质
US11972213B2 (en) 2018-07-03 2024-04-30 Tencent Technology (Shenzhen) Company Limited Event recognition method and apparatus, model training method and apparatus, and storage medium
CN110909122A (zh) * 2019-10-10 2020-03-24 重庆金融资产交易所有限责任公司 一种信息处理方法及相关设备
CN110909122B (zh) * 2019-10-10 2023-10-03 湖北华中电力科技开发有限责任公司 一种信息处理方法及相关设备
CN111967268A (zh) * 2020-06-30 2020-11-20 北京百度网讯科技有限公司 文本中的事件抽取方法、装置、电子设备和存储介质
CN111967268B (zh) * 2020-06-30 2024-03-19 北京百度网讯科技有限公司 文本中的事件抽取方法、装置、电子设备和存储介质
CN112989031A (zh) * 2021-04-28 2021-06-18 成都索贝视频云计算有限公司 基于深度学习的广播电视新闻事件要素抽取方法

Similar Documents

Publication Publication Date Title
CN106445999A (zh) 一种基于事件要素的事件抽取方法及系统
CN103455563B (zh) 一种适用于智能变电站一体化监控系统的数据挖掘方法
CN104573231A (zh) 基于bim的智慧楼宇系统和方法
CN103838870B (zh) 基于信息单元融合的新闻原子事件抽取方法
CN107766371A (zh) 一种文本信息分类方法及其装置
CN103647676A (zh) 域名系统数据处理方法
CN103605651A (zh) 一种基于olap多维分析的数据处理展现方法
CN103686244A (zh) 视频数据的管理方法及其系统
CN112560468B (zh) 气象预警文本处理方法、相关装置及计算机程序产品
CN111447507B (zh) 视频制作方法和装置、电子设备和存储介质
CN105404757A (zh) 一种智能变电站scd文件标准化程度的校验方法
CN105956740A (zh) 一种基于文本逻辑特征的语义风险计算方法
CN115460459A (zh) 基于ai的视频生成方法、装置和电子设备
CN103020251A (zh) 大规模数据下的新闻事件自动挖掘系统及其方法
CN105488471B (zh) 一种字形识别方法及装置
CN102801548A (zh) 一种智能预警的方法、装置及信息系统
CN110633318A (zh) 一种数据提取的处理方法、装置、设备和存储介质
CN112307318A (zh) 一种内容发布方法、系统及装置
CN103729197A (zh) 一种基于lda模型的多粒度层次软件聚类方法
CN103838739A (zh) 一种搜索引擎中纠错词的检测方法及系统
CN107918675A (zh) 一种搜索方法及搜索系统
CN104636324B (zh) 话题溯源方法和系统
CN106933783A (zh) 一种从文本中智能提取日期的方法及装置
KR102285080B1 (ko) 이슈 발생 예측 시스템
CN107748819A (zh) 一种基于自然语言处理的电气二次设备建模方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170222