CN106445999A - 一种基于事件要素的事件抽取方法及系统 - Google Patents
一种基于事件要素的事件抽取方法及系统 Download PDFInfo
- Publication number
- CN106445999A CN106445999A CN201610599014.9A CN201610599014A CN106445999A CN 106445999 A CN106445999 A CN 106445999A CN 201610599014 A CN201610599014 A CN 201610599014A CN 106445999 A CN106445999 A CN 106445999A
- Authority
- CN
- China
- Prior art keywords
- event
- place
- time
- data
- key element
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
本发明涉及一种基于事件要素的事件抽取方法及系统。该方法包括:根据预设事件识别模型对显示在预设长度文本窗口内的数据中所包含的事件构成要素识别:根据该预设事件识别模型对所述数据中所包含的事件特征词进行识别;对所述事件特征词以及事件构成要素组合成描述相应事件的新的数据对象。本发明可实现快速对互联网上传播的数据的抽取,且事件抽取方法可控可干预,从而可极大地满足互联网信息中数据抽取的需要,最终获得效果理想的事件识别结果。
Description
技术领域
本发明属于数据挖掘技术领域,具体涉及一种基于事件要素的事件抽取方法及系统。
背景技术
由于现在互联网的发展,以微博为代表的自媒体大行其道,相比起官方的通告,互联网自媒体的声音要更迅速,更贴近。对于应对各类突发事件(如火灾、地震等),互联网上的信息变得尤为重要,但面对互联网庞大的数据增量,这类数据又显得极为稀疏,因此从互联网庞大的声音中找到各类突发事件的声音,以便即使的做出响应和对策,是现在无论政府还是企业都迫切需要的一种数据挖掘能力。
发明内容
本发明的目的在于解决上述的技术问题而提供一种基于事件要素的事件抽取方法及系统。
为实现上述目的,本发明采用如下技术方案:
一种基于事件要素的事件抽取方法,包括以下步骤:
根据预设事件识别模型,对显示在预设长度文本窗口内的数据中所包含的事件构成要素识别:
根据该预设事件识别模型,对所述数据中所包含的事件特征词进行识别;
对所述事件特征词以及事件构成要素组合成描述相应事件的新的数据对象。
本发明的目的还在于提供一种基于事件要素的事件抽取系统,包括:
要素识别模块,用于根据预设事件识别模型,对显示在预设长度文本窗口内的数据中所包含的事件构成要素识别:
特征词识别模块,用于根据该预设事件识别模型,根据预设事件识别模型对所述数据中所包含的事件特征词进行识别;
数据组合模块,用于对所述事件特征词以及事件构成要素组合成描述相应事件的新的数据对象。
本发明通过数据中所包含的事件的构成要素进行识别后,利用预置的要素同现模型识别出该数据中包含的事件特征词,原来将事件特征词与事件的构成要素进行组合,形成新的描述事件的数据对象,从而实现快速对互联网上传播的数据的抽取,且本发明事件抽取方法可控可干预,从而可极大地满足互联网信息中数据抽取的需要,最终获得效果理想的事件识别结果。
附图说明
图1为本发明实施例提供的基于事件要素的事件抽取方法的流程图;
图2为本发明实施例提供的基于事件要素的事件抽取系统的原理图。
具体实施方式
下面,结合实例对本发明的实质性特点和优势作进一步的说明,但本发明并不局限于所列的实施例。
本发明是通过要素识别、复合以及同现手段以实现对事件自动化的提取的。
见图1所示,一种基于事件要素的事件抽取方法,包括
根据预设事件识别模型,对显示在预设长度文本窗口内的数据中所包含的事件构成要素识别:
根据该预设事件识别模型对所述数据中所包含的事件特征词进行识别;
对所述事件特征词以及事件构成要素组合成描述相应事件的新的数据对象。
所述预设长度文本窗口可以根据需要来设定,如可以根据数据的事件表达的经验值来设定相应的文本窗口的长度,以使一个文本窗口内数据可以表述一个完整的事件为原则。
所述事件构成要素主要是指能构成一个事件的关键要素,该要素组合起来能完整、简要地描述一个事件的发生时间、地点等。
所述事件特征词,是能够确定事件内容的一类特征词,通常是事件具体描述词,是指能表述事件或描述事件的主要特征的词,即描述这是一个什么事件,如火灾事件或爆炸事件。
由于不同类型的事件在互联网文本传播时,在一定文本窗口内所出现的要素类型及要素内容是不同的,也就是说同一个要素内容对于不同的事件贡献不同,根据事件识别模型及数据文本的要素的同现情况,就能确定这段文本数据的具体事件描述。
所述预设事件识别模型根据不同事件抽取的需要而设置,因而对应不同的事件抽取需要,可以是多个事件识别模型,如火灾事件识别模型、爆炸事件识别模型等,不同的事件识别模型要求同现的要素不同,如火灾事件识别模型要求同现的要素可以是事件构成要素如时间、地点与对应的火灾特征词,而爆炸事件识别模型要求同现的要素可以是事件构成要素如时间、地点与对应的爆炸特征词。
如原始文本为:“2016年1月15日凌晨2:50左右,东关镇东华社区一民房因电线老化漏电发生火灾”
利用火灾同现模型,形成的新的数据对象如下:
文本内容:2016年1月15日凌晨2:50左右,东关镇东华社区一民房因电线老化漏电发生火灾
事件特征词:火灾
发生时间:2016年1月15日凌晨2:50
发生地点:东关镇。
本发明通过数据中所包含的事件的构成要素进行识别后,利用预置的要素同现模型识别出该数据中包含的事件特征词,原来将事件特征词与事件的构成要素进行组合,形成新的描述事件的数据对象,从而实现快速对互联网上传播的数据的抽取,且本发明事件抽取方法可控可干预,从而可极大地满足互联网信息中数据抽取的需要,最终获得效果理想的事件识别结果。
具体实现上,本发明中,所述事件构成要素可以是包括时间、地点、数量以及人物;所述数量包括数字及对应的数量单位。
所述时间如数据中的包含的“14年5月20日12点24分”,地点如数据中包含的的“济南市”,数量如数据中包含的“1,111平方米”,人物如数据中包含的“张某某说”。
进一步的,本发明中,在对事件构成要素识别还包括以下格式化的步骤:
对识别出的时间要素,按预置方法进行格式归一化处理转换统一的时间格式;
对识别出的数量要素,将数量要素中的数字与对应的数量单位拆分,将数字转换为预设的数字格式;
对识别出的地点要素,根据地点分类标准将地点分为多级,并给每个地点赋予上级行政区划的属性;
对识别的出人物要素进行格式化处理,提取出相应的人名。
具体的,对上述关于对时间要素、数量要素及地点要素的处理可以是采用如下方法:
时间----从文本中识别出时间,并对时间进行格式归一化,时间分为绝对时间和相对时间:
绝对时间转化为标准时间格式,如14年5月20日12点24分,转化为:2014-05-2012:24:00;
相对时间通过基准时间进行调整,并转化为标准时间格式;
如昨天(基准时间2014-05-20 12:24:00,)转化为2014-05-19 12:24:00。
地点---从文本中识别出地点,根据地点分类标准,将地点可以分为5级(如国家,省,市,区县,乡镇),并给每个地点赋予高级行政区划的属性。
如济南市,级别为3级,高级行政区划:中国-山东省。
数量---从文本中识别出数字,对数字进行分类,将数字中的数和单位拆分,数转化为标准的数字格式。
如:1,111平方米,格式化数字:1111,单位:平方米。
人物---从文本中识别出人名。
如:张某某说,格式化人名:张某某。
通过以上的方法,对数据中包含的时间、地点、数量要素进行统一处的处理,形成了统一的格式,便于事件抽取时数据处理统一。
进一步的,本发明中,在对事件构成要素中的时间、地点、数量要素识别出后还包括以下步骤:
根据预选设置的时间、地点、数量的筛选条件,对识别出的事件构成要素中的时间、地点、数量进行筛选。
通过对识别出的地名,时间,数字可以再进行针对性地筛选,可以取得更为细分的结果,从而满足相应的事件识别要求,输出符合要求的事件识别结构,使得事件识别处理更为准确。
具体的,在时间筛选上,可以通过日期比较筛选实现:筛选某一天前后的日期或某个区间的日期;时间筛选:筛选某个时间点前后的时间或某个区间的时间;自定义时间段筛选:可以自定义筛选某个时间特征,如:2016-05-27前的日期,09:10:00后的时间,4月份的时间
地点,根据行政区划进行筛选,如属于中国河南的地点,属于中国浙江省慈溪市的地点
数字,根据数字大小筛选,单位筛选;如大于20的数,单位是“小时”的数量。
需要说明的是,本发明中,所述对显示在预设长度文本窗口内的数据中所包含的事件构成要素识别时以在句内的数据为限进行识别。
事件模型的一重要维度,通常分为整句(句号等结尾),半句(逗号等结尾)两种划分,因此事件识别模型通过以在句内的数据为限进行识别,能够降低自然语言在跨句时的歧义问题。
如文本窗口内显示的原始文本内容为“2016年1月15日凌晨2:50左右,东关镇东华社区一民房因电线老化漏电发生火灾”
该火灾事件识别模型要求必须包括的要素有:时间+地点+火灾特征词(一句话内)
事件特征词:火灾
事件时间:2016年1月15日凌晨2:50
时间地点:东关镇。
本发明的目的还在于提供一种基于事件要素的事件抽取系统,包括:
要素识别模块,用于根据预设事件识别模型,对显示在预设长度文本窗口内的数据中所包含的事件构成要素识别:
特征词识别模块,用于根据该预设事件识别模型,根据预设事件识别模型对所述数据中所包含的事件特征词进行识别;
数据组合模块,用于对所述事件特征词以及事件构成要素组合成描述相应事件的新的数据对象。
所述的预设长度文本窗口可以根据需要来设定,如可以根据数据的事件表达的经验值来设定相应的文本窗口的长度,以使一个文本窗口内数据可以表述一个完整的事件为原则。
所述事件构成要素主要是指能构成一个事件的关键要素,该要素组合起来能完整、简要地描述一个事件的发生时间、地点等。
所述事件特征词,是能够确定事件内容的一类特征词,通常是事件具体描述词,是指能表述事件或描述事件的主要特征的词,即描述这是一个什么事件,如火灾事件或爆炸事件。
由于不同类型的事件在互联网文本传播时,在一定文本窗口内所出现的要素类型及要素内容是不同的,也就是说同一个要素内容对于不同的事件贡献不同,根据事件识别模型及数据文本的要素同现情况,就能确定这段文本数据的具体事件描述。
所述预设事件识别模型根据不同事件抽取的需要而设置,因而对应不同的事件抽取需要,可以是多个事件识别模型,如火灾事件识别模型、爆炸事件识别模型等,不同的事件识别模型要求同现的要素不同,如火灾事件识别模型要求同现的要素可以是事件构成要素如时间、地点与对应的火灾特征词,而爆炸事件识别模型要求同现的要素可以是事件构成要素如时间、地点与对应的爆炸特征词。
如原始文本为:“2016年1月15日凌晨2:50左右,东关镇东华社区一民房因电线老化漏电发生火灾”
利用火灾同现模型,形成的新的数据对象如下:
文本内容:2016年1月15日凌晨2:50左右,东关镇东华社区一民房因电线老化漏电发生火灾
事件特征词:火灾
发生时间:2016年1月15日凌晨2:50
发生地点:东关镇。
本发明通过数据中所包含的事件的构成要素进行识别后,利用预置的要素同现模型识别出该数据中包含的事件特征词,原来将事件特征词与事件的构成要素进行组合,形成新的描述事件的数据对象,从而实现快速对互联网上传播的数据的抽取,且本发明事件抽取方法可控可干预,从而可极大地满足互联网信息中数据抽取的需要,最终获得效果理想的事件识别结果。
具体实现上,本发明中,所述事件构成要素包括时间、地点、数量以及人物;所述数量包括数字及对应的数量单位。
所述时间如数据中的包含的“14年5月20日12点24分”,地点如数据中包含的的“济南市”,数量如数据中包含的“1,111平方米”,人物如数据中包含的“张某某说”。
进一步的,本发明中,所述要素识别模块包括:
时间要素处理单元,用于对识别出的时间要素,按预置方法进行格式归一化处理转换统一的时间格式;
数量要素处理单元,用于对识别出的数量要素,将数量要素中的数字与对应的数量单位拆分,将数字转换为预设的数字格式;
地点要素处理单元,用于对识别出的地点要素,根据地点分类标准将地点分为多级,并给每个地点赋予上级行政区划的属性。
人名要素处理单元,用于对识别的出人物要素进行格式化处理,提取出相应的人名。
具体的,对上述关于对时间要素、数量要素及地点要素的处理可以是采用如下方法:
时间----从文本中识别出时间,并对时间进行格式归一化,时间分为绝对时间和相对时间:
绝对时间转化为标准时间格式,如14年5月20日12点24分,转化为:2014-05-2012:24:00;
相对时间通过基准时间进行调整,并转化为标准时间格式;
如昨天(基准时间2014-05-20 12:24:00,)转化为2014-05-19 12:24:00。
地点---从文本中识别出地点,根据地点分类标准,将地点可以分为5级(如国家,省,市,区县,乡镇),并给每个地点赋予高级行政区划的属性。
如济南市,级别为3级,高级行政区划:中国-山东省。
数量---从文本中识别出数字,对数字进行分类,将数字中的数和单位拆分,数转化为标准的数字格式。
如:1,111平方米,格式化数字:1111,单位:平方米。
人物---从文本中识别出人名。
如:张某某说,格式化人名:张某某。
通过以上的方法,对数据中包含的时间、地点、数量要素进行统一处的处理,形成了统一的格式,便于事件抽取时数据处理统一。
进一步的,本发明中,所述要素识别模块包括筛选单元,用于在对事件构成要素中的时间、地点、数量要素识别出后,根据预选设置的时间、地点、数量的筛选条件,对识别出的事件构成要素中的时间、地点、数量进行筛选。
通过对识别出的地名,时间,数字可以再进行针对性地筛选,可以取得更为细分的结果,从而满足相应的事件识别要求,输出符合要求的事件识别结构,使得事件识别处理更为准确。
具体的,在时间筛选上,可以通过日期比较筛选实现:筛选某一天前后的日期或某个区间的日期;时间筛选:筛选某个时间点前后的时间或某个区间的时间;自定义时间段筛选:可以自定义筛选某个时间特征,如:2016-05-27前的日期,09:10:00后的时间,4月份的时间
地点,根据行政区划进行筛选,如属于中国河南的地点,属于中国浙江省慈溪市的地点
数字,根据数字大小筛选,单位筛选;如大于20的数,单位是“小时”的数量。
需要说明的是,本发明中,所述对显示在预设长度文本窗口内的数据中所包含的事件构成要素识别时以在句内的数据为限进行识别。
事件模型的一重要维度,通常分为整句(句号等结尾),半句(逗号等结尾)两种划分,因此事件识别模型通过以在句内的数据为限进行识别,能够降低自然语言在跨句时的歧义问题。
如文本窗口内显示的原始文本内容为“2016年1月15日凌晨2:50左右,东关镇东华社区一民房因电线老化漏电发生火灾”
该火灾事件识别模型要求必须包括的要素有:时间+地点+火灾特征词(一句话内)
事件特征词:火灾
事件时间:2016年1月15日凌晨2:50
时间地点:东关镇。
可以看出,本发明通过使用要素识别以及事件识别模型,能灵活的针对开放文本进行事件抽取,要素识别为后续处理提供了标准的格式化的事件要素,另外通过要素筛选,要素同现的事件特征词、句内设置及能够简单的对事件抽取效果进行干预,使事件抽取可运营,可干预,效果可控,通过模型的改进,最终获得效果理想的事件识别结果。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (10)
1.一种基于事件要素的事件抽取方法,其特征在于,包括以下步骤:
根据预设事件识别模型,对显示在预设长度文本窗口内的数据中所包含的事件构成要素识别:
根据该预设事件识别模型,对所述数据中所包含的事件特征词进行识别;
对所述事件特征词以及事件构成要素组合成描述相应事件的新的数据对象。
2.根据权利要求1所述基于事件要素的事件抽取方法,其特征在于,所述事件构成要素包括时间、地点、数量以及人物;所述数量包括数字及对应的数量单位。
3.根据权利要求2所述基于事件要素的事件抽取方法,其特征在于,在对事件构成要素识别还包括以下步骤:
对识别出的时间要素,按预置方法进行格式归一化处理转换统一的时间格式;
对识别出的数量要素,将数量要素中的数字与对应的数量单位拆分,将数字转换为预设的数字格式;
对识别出的地点要素,根据地点分类标准将地点分为多级,并给每个地点赋予上级行政区划的属性。
4.根据权利要求3所述基于事件要素的事件抽取方法,其特征在于,在对事件构成要素中的时间、地点、数量要素识别出后还包括以下步骤:
根据预选设置的时间、地点、数量的筛选条件,对识别出的事件构成要素中的时间、地点、数量进行筛选。
5.根据权利要求1-4任一项所述基于事件要素的事件抽取方法,其特征在于,所述对显示在预设长度文本窗口内的数据中所包含的事件构成要素识别时以在句内的数据为限进行识别。
6.一种基于事件要素的事件抽取系统,其特征在于,包括:
要素识别模块,用于根据预设事件识别模型,对显示在预设长度文本窗口内的数据中所包含的事件构成要素识别:
特征词识别模块,用于根据该预设事件识别模型,根据预设事件识别模型对所述数据中所包含的事件特征词进行识别;
数据组合模块,用于对所述事件特征词以及事件构成要素组合成描述相应事件的新的数据对象。
7.根据权利要求6所述基于事件要素的事件抽取系统,其特征在于,所述事件构成要素包括时间、地点、数量以及人物;所述数量包括数字及对应的数量单位。
8.根据权利要求7所述基于事件要素的事件抽取方法,其特征在于,所述要素识别模块包括:
时间要素处理单元,用于对识别出的时间要素,按预置方法进行格式归一化处理转换统一的时间格式;
数量要素处理单元,用于对识别出的数量要素,将数量要素中的数字与对应的数量单位拆分,将数字转换为预设的数字格式;
地点要素处理单元,用于对识别出的地点要素,根据地点分类标准将地点分为多级,并给每个地点赋予上级行政区划的属性。
9.根据权利要求8所述基于事件要素的事件抽取方法,其特征在于,所述要素识别模块包括筛选单元,用于在对事件构成要素中的时间、地点、数量要素识别出后,根据预选设置的时间、地点、数量的筛选条件,对识别出的事件构成要素中的时间、地点、数量进行筛选。
10.根据权利要求6-9任一项所述基于事件要素的事件抽取方法,其特征在于,所述对显示在预设长度文本窗口内的数据中所包含的事件构成要素识别时以在句内的数据为限进行识别。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610599014.9A CN106445999A (zh) | 2016-07-27 | 2016-07-27 | 一种基于事件要素的事件抽取方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610599014.9A CN106445999A (zh) | 2016-07-27 | 2016-07-27 | 一种基于事件要素的事件抽取方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106445999A true CN106445999A (zh) | 2017-02-22 |
Family
ID=58184273
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610599014.9A Pending CN106445999A (zh) | 2016-07-27 | 2016-07-27 | 一种基于事件要素的事件抽取方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106445999A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110245907A (zh) * | 2018-03-09 | 2019-09-17 | 北京国双科技有限公司 | 庭审笔录内容的生成方法及装置 |
WO2020007138A1 (zh) * | 2018-07-03 | 2020-01-09 | 腾讯科技(深圳)有限公司 | 一种事件识别的方法、模型训练的方法、设备及存储介质 |
CN110909122A (zh) * | 2019-10-10 | 2020-03-24 | 重庆金融资产交易所有限责任公司 | 一种信息处理方法及相关设备 |
CN111967268A (zh) * | 2020-06-30 | 2020-11-20 | 北京百度网讯科技有限公司 | 文本中的事件抽取方法、装置、电子设备和存储介质 |
CN112989031A (zh) * | 2021-04-28 | 2021-06-18 | 成都索贝视频云计算有限公司 | 基于深度学习的广播电视新闻事件要素抽取方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080098399A1 (en) * | 2006-10-18 | 2008-04-24 | Kabushiki Kaisha Toshiba | Thread ranking system and thread ranking method |
CN102298635A (zh) * | 2011-09-13 | 2011-12-28 | 苏州大学 | 事件信息融合方法和系统 |
CN104408093A (zh) * | 2014-11-14 | 2015-03-11 | 中国科学院计算技术研究所 | 一种新闻事件要素抽取方法与装置 |
-
2016
- 2016-07-27 CN CN201610599014.9A patent/CN106445999A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080098399A1 (en) * | 2006-10-18 | 2008-04-24 | Kabushiki Kaisha Toshiba | Thread ranking system and thread ranking method |
CN102298635A (zh) * | 2011-09-13 | 2011-12-28 | 苏州大学 | 事件信息融合方法和系统 |
CN104408093A (zh) * | 2014-11-14 | 2015-03-11 | 中国科学院计算技术研究所 | 一种新闻事件要素抽取方法与装置 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110245907A (zh) * | 2018-03-09 | 2019-09-17 | 北京国双科技有限公司 | 庭审笔录内容的生成方法及装置 |
WO2020007138A1 (zh) * | 2018-07-03 | 2020-01-09 | 腾讯科技(深圳)有限公司 | 一种事件识别的方法、模型训练的方法、设备及存储介质 |
US11972213B2 (en) | 2018-07-03 | 2024-04-30 | Tencent Technology (Shenzhen) Company Limited | Event recognition method and apparatus, model training method and apparatus, and storage medium |
CN110909122A (zh) * | 2019-10-10 | 2020-03-24 | 重庆金融资产交易所有限责任公司 | 一种信息处理方法及相关设备 |
CN110909122B (zh) * | 2019-10-10 | 2023-10-03 | 湖北华中电力科技开发有限责任公司 | 一种信息处理方法及相关设备 |
CN111967268A (zh) * | 2020-06-30 | 2020-11-20 | 北京百度网讯科技有限公司 | 文本中的事件抽取方法、装置、电子设备和存储介质 |
CN111967268B (zh) * | 2020-06-30 | 2024-03-19 | 北京百度网讯科技有限公司 | 文本中的事件抽取方法、装置、电子设备和存储介质 |
CN112989031A (zh) * | 2021-04-28 | 2021-06-18 | 成都索贝视频云计算有限公司 | 基于深度学习的广播电视新闻事件要素抽取方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106445999A (zh) | 一种基于事件要素的事件抽取方法及系统 | |
CN107766371B (zh) | 一种文本信息分类方法及其装置 | |
CN102779174B (zh) | 一种舆情信息展示系统及方法 | |
CN106484767A (zh) | 一种跨媒体的事件抽取方法 | |
CN104573231A (zh) | 基于bim的智慧楼宇系统和方法 | |
CN103838870B (zh) | 基于信息单元融合的新闻原子事件抽取方法 | |
CN104268428A (zh) | 一种用于指标计算的可视化配置方法 | |
CN103647676A (zh) | 域名系统数据处理方法 | |
CN103605651A (zh) | 一种基于olap多维分析的数据处理展现方法 | |
CN112560468B (zh) | 气象预警文本处理方法、相关装置及计算机程序产品 | |
CN103686244A (zh) | 视频数据的管理方法及其系统 | |
CN111447507B (zh) | 视频制作方法和装置、电子设备和存储介质 | |
CN103778200A (zh) | 一种报文信息源抽取方法及其系统 | |
CN105404757A (zh) | 一种智能变电站scd文件标准化程度的校验方法 | |
CN105956740A (zh) | 一种基于文本逻辑特征的语义风险计算方法 | |
CN103020251A (zh) | 大规模数据下的新闻事件自动挖掘系统及其方法 | |
CN102801548A (zh) | 一种智能预警的方法、装置及信息系统 | |
CN110633318A (zh) | 一种数据提取的处理方法、装置、设备和存储介质 | |
CN112307318A (zh) | 一种内容发布方法、系统及装置 | |
CN108182178B (zh) | 基于事件文本数据挖掘的地下水水位分析方法与系统 | |
CN103729197A (zh) | 一种基于lda模型的多粒度层次软件聚类方法 | |
CN109918623A (zh) | 一种政策更新自动对比管理系统 | |
CN103838739A (zh) | 一种搜索引擎中纠错词的检测方法及系统 | |
CN107918675A (zh) | 一种搜索方法及搜索系统 | |
CN104636324B (zh) | 话题溯源方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170222 |