CN110297904A - 事件名的生成方法、装置、电子设备及存储介质 - Google Patents

事件名的生成方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN110297904A
CN110297904A CN201910521868.9A CN201910521868A CN110297904A CN 110297904 A CN110297904 A CN 110297904A CN 201910521868 A CN201910521868 A CN 201910521868A CN 110297904 A CN110297904 A CN 110297904A
Authority
CN
China
Prior art keywords
event
text
type
processed
name
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910521868.9A
Other languages
English (en)
Other versions
CN110297904B (zh
Inventor
韩翠云
陈玉光
刘远圳
潘禄
施茜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201910521868.9A priority Critical patent/CN110297904B/zh
Publication of CN110297904A publication Critical patent/CN110297904A/zh
Application granted granted Critical
Publication of CN110297904B publication Critical patent/CN110297904B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/316Indexing structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/38Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/383Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content

Abstract

本公开提供的事件名的生成方法、装置、电子设备及存储介质,通过对待处理文本进行事件分类,获得所述待处理文本的事件类型及至少一个事件属性;基于事件图谱技术从所述待处理文本中抽取每一个事件属性的事件属性值;将各所述事件属性值填充至所述事件类型对应的事件名模板,获得所述待处理文本的事件名,以实现对于事件名的自动生成,由于针对不同事件类型的待处理文本,采用不同的事件属性和事件名模板,使得生成的待处理文本的事件名的语言流畅性和语义完整度更高,满足实际使用需求。

Description

事件名的生成方法、装置、电子设备及存储介质
技术领域
本公开涉及计算机技术,尤其涉及一种事件名的生成方法、装置、电子设备及存储介质。
背景技术
随着互联网技术的发展,通过网络阅读或获取新闻咨询信息成为人们生活必不可缺的部分。一般来说,可对与新闻咨询信息进行摘要提取,并将获得的简明扼要的事件名作为该新闻咨询信息的预览信息或标题。
在现有技术中,往往会通过摘要生成的方式获取新闻资讯信息的事件名。具体来说,摘要生成的方式包括抽取式和生成式;其中,抽取式是指直接从新闻资讯信息中抽取重要的句子作为事件名,生成式是指利用包括神经网络模型在内的端到端模型,并结合注意力机制等生成策略,生成事件名。
但是,通过摘要生成的方式所获得的事件名,在语言流畅性和语义完整性上均无法满足事件名的实际使用需求,因此,在将以摘要生成方式获得的事件名投入使用之间,还需要采用人工编辑的方式对其进行处理,其生成效率和人工成本较高,不利于实际使用。
发明内容
针对上述问题,本公开提供了一种事件名的生成方法、装置、电子设备及存储介质。
第一方面,本公开提供了一种事件名的生成方法,包括:
对待处理文本进行事件分类,获得所述待处理文本的事件类型及至少一个事件属性;
基于事件图谱技术从所述待处理文本中抽取每一个事件属性的事件属性值;
将各所述事件属性值填充至所述事件类型对应的事件名模板,获得所述待处理文本的事件名。
在其他可选的示例中,所述对待处理文本进行事件分类之前,还包括:
获取预设历史时间段内的多个热点事件名;
对各个热点事件名进行事件类型提取,获得至少一个热点事件类型;
相应的,所述对待处理文本进行事件分类,包括:
从所述至少一个热点事件类型中选出与所述待处理文本匹配的热点事件类型作为该待处理文本的事件类型。
在其他可选的示例中,所述对各个热点事件名进行事件类型提取,获得至少一个热点事件类型之后,还包括:
分析获得每一热点事件类型所对应的至少一个热点事件名,获得每一热点事件类型对应的至少一个热点事件属性;
根据各热点事件类型和其对应的热点事件属性,获得所述事件名模板。
在其他可选的示例中,所述将各所述事件属性值填充至所述事件类型对应的事件名模板,获得所述待处理文本的事件名,包括:
将所述事件属性值中的全部或部分填充至所述事件名模板,形成事件名。
在其他可选的示例中,所述对待处理文本进行事件分类,包括:
对所述待处理文本进行触发词匹配处理,以在预设的各事件类型中确定与所述待处理文本对应的事件类型。
在其他可选的示例中,所述对待处理文本进行事件分类,还包括:
根据所述待处理文本的事件类型在预设的事件本体库中,确定该事件类型相应的至少一个事件属性;
其中,所述预设的事件本体库中包括每一事件类型相应的至少一个事件属性。
第二方面,本公开一种事件名的生成装置,包括:
第一处理模块,用于对待处理文本进行事件分类,获得所述待处理文本的事件类型及至少一个事件属性;
第二处理模块,用于基于事件图谱技术从所述待处理文本中抽取每一个事件属性的事件属性值;
第三处理模块,用于将各所述事件属性值填充至所述事件类型对应的事件名模板,获得所述待处理文本的事件名。
在其他可选的示例中,该事件名的生成装置还包括:第四处理模块;
所述第四处理模块用于在对待处理文本进行事件分类之前,获取预设历史时间段内的多个热点事件名;对各个热点事件名进行事件类型提取,获得至少一个热点事件类型;
相应的,所述第一处理模块,具体用于从所述至少一个热点事件类型中选出与所述待处理文本匹配的热点事件类型作为该待处理文本的事件类型。
在其他可选的示例中,所述第四处理模块,还用于在对各个热点事件名进行事件类型提取,获得至少一个热点事件类型之后,分析获得每一热点事件类型所对应的至少一个热点事件名,获得每一热点事件类型对应的至少一个热点事件属性;根据各热点事件类型和其对应的热点事件属性,获得所述事件名模板。
在其他可选的示例中,所述第三处理模块,具体用于将所述事件属性值中的全部或部分填充至所述事件名模板,形成事件名。
在其他可选的示例中,第一处理模块,具体用于对所述待处理文本进行触发词匹配处理,以在预设的各事件类型中确定与所述待处理文本对应的事件类型。
在其他可选的示例中,所述第一处理模块,还用于根据所述待处理文本的事件类型在预设的事件本体库中,确定该事件类型相应的至少一个事件属性;其中,所述预设的事件本体库中包括每一事件类型相应的至少一个事件属性。
第三方面,本公开提供了一种电子设备,所述电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如前任一所述的方法。
第四方面,本公开提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如前任一所述的方法。
本公开提供的事件名的生成方法、装置、电子设备及存储介质,通过对待处理文本进行事件分类,获得所述待处理文本的事件类型及至少一个事件属性;基于事件图谱技术从所述待处理文本中抽取每一个事件属性的事件属性值;将各所述事件属性值填充至所述事件类型对应的事件名模板,获得所述待处理文本的事件名,以实现对于事件名的自动生成,由于针对不同事件类型的待处理文本,采用不同的事件属性和事件名模板,使得生成的待处理文本的事件名的语言流畅性和语义完整度更高,满足实际使用需求。
附图说明
图1为本公开所基于的一种网络架构的示意图;
图2为本公开提供的一种事件名的生成方法的流程示意图;
图3为本公开提供的另一种事件名的生成方法的流程示意图;
图4为本公开提供的一种事件名的生成装置的结构示意图;
图5为本公开提供的一种电子设备的硬件结构示意图。
具体实施方式
为使本公开示例的目的、技术方案和优点更加清楚,下面将结合本公开示例中的附图,对本公开示例中的技术方案进行清楚、完整地描述。
随着互联网技术的发展,通过网络阅读或获取新闻咨询信息成为人们生活必不可缺的部分。一般来说,可对与新闻咨询信息进行摘要提取,并将获得的简明扼要的事件名作为该新闻咨询信息的预览信息或标题。
在现有技术中,往往会通过摘要生成的方式获取新闻资讯信息的事件名。具体来说,摘要生成的方式包括抽取式和生成式;其中,抽取式是指直接从新闻资讯信息中抽取重要的句子作为事件名,生成式是指利用包括神经网络模型在内的端到端模型,并结合注意力机制等生成策略,生成事件名。但是,通过摘要生成的方式所获得的事件名,在语言流畅性和语义完整性上均无法满足事件名的实际使用需求。
因此,在实际使用中,对于包括应用于信息流文章分发、资讯聚合等多种应用场景的事件名来讲,其更多采用的是将搜索引擎提供的热点词汇结合人工编辑的事件名获得方法,即,获取搜索引擎提供的新闻咨询信息的搜索关键词,并基于人工编辑的方式将搜索关键词进行整合,以获得新闻咨询信息的事件名。而显然的,这样的生成方式其人工成本极大,且生成效率很低。
因此,亟需一种自动生成事件名的方法,以使得生成的事件名在保持语言流畅性和语义完整性的同时,生成效率较高,生成成本较低,有效满足事件名的实际使用需求。
针对上述问题,本公开提供了一种事件名的生成方法、装置、电子设备及存储介质,以实现对于事件名的自动生成,此外,由于针对不同事件类型的待处理文本,采用不同的事件属性和事件名模板,使得生成的待处理文本的事件名的语言流畅性和语义完整度更高,满足实际使用需求。
图1为本公开所基于的一种网络架构的示意图,如图1所示,本公开基于的网络架构可包括事件名的生成装置1、网络以及服务器2,其中的事件名的生成装置1可用于执行下述各实施方式中所述的控制方法,以实现对于事件名的自动生成。
其中,网络用以在事件名的生成装置1和服务器2之前提供通信链路的介质,网络可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
需要说明的是,上述的事件名的生成装置1可为具备逻辑处理功能的硬件设备或电子设备,如计算机,又如移动平板电脑等,也可为软件。相应的,服务器2具体可为设置在云端的服务器组或服务器集群,其可提供有数据的存储、搜索、计算、处理等功能。
特别的,当事件名的生成装置1为软件时,其可以安装在上述所列举的相应的电子设备中,即事件名的生成装置1为的软件形式可以是安装在计算机、移动平台电脑等电子设备中的软件。此外,事件名的生成装置1还可以实现成多个软件或软件模块(例如用来提供分布式服务),也可以实现成单个软件或软件模块,在此不做具体限定。
一方面,本公开示例提供了一种事件名的生成方法,图2为本公开提供的一种事件名的生成方法的流程示意图。
如图2所示,该事件名的生成方法包括:
步骤101、对待处理文本进行事件分类,获得所述待处理文本的事件类型及至少一个事件属性。
具体来说,待处理文本具体可为新闻咨询信息,也可为学术短文、报道等基于文本的信息,其来源可为前述图1所示的服务器所存储的数据,也可为基于该服务器对于用户上传信息进行处理获得文本,本公开对此不进行限制。
其中,对于待处理文本进行事件分类的方式可采用多种,例如,预设的触发词匹配、关键词匹配等方式。具体来说,可对所述待处理文本进行触发词匹配处理,以在预设的各事件类型中确定与所述待处理文本对应的事件类型。其中的事件类型用于表示常见的咨询信息话题,一般可例如,收购事件类型、地震事件类型、娱乐事件类型等。
对于事件类型的确定可采用触发词匹配的方式,具体来说,针对每一事件类型可设置若干触发词。例如,针对于收购事件类型来讲,其触发词可为“公司”“收购”“协议”“资金”等等;针对于娱乐事件类型来讲,其触发词可为“某明星”“狗仔”“经纪人”等等。在进行触发词匹配时,可基于该待处理文本所触发的触发词的数量或覆盖某一事件类型触发词的覆盖百分比,确定该待处理文本的事件类型。需要说明的是,对于触发词的设置内容、设置方式以及触发词的语法属性,本公开均不作限制。同时,还可采用其他方式确定待处理文本的事件类型,如,语义分析等方式确定待处理文本的事件类型。
此外,在对待处理文本进行事件分类时,还可在预设的事件本体库中确定与待处理的文本的事件类型相应的事件属性。具体来说,在预设的事件本体库中包括每一事件类型相应的至少一个事件属性,相应的,根据所述待处理文本的事件类型在预设的事件本体库中,确定该事件类型相应的至少一个事件属性。举例来说,针对于举行婚礼这一事件类型,事件本体库中将存储有该事件类型下的全部事件属性,即[男(女)主角,举行地点,举行时间];针对于收购这一事件类型,事件本体库中将存储有该事件类型下的全部事件属性,即[收购(被收购)方,收购金额,收购内容]。
步骤102、基于事件图谱技术从所述待处理文本中抽取每一个事件属性的事件属性值。
具体来说,事件图谱技术是一种以“事件”为核心的动态知识图谱的构建技术,其基于事件实体,通过对于事件抽象概念本体层和实例层等多层结构的抽取,从而实现以事件为基础信息结构化表示。通过利用该事件图谱技术中的机械算法以及阅读理解等技术,以从待处理文本中抽取各事件属性的事件属性值。其中,事件属性值具体表示了事件属性的取值,例如前述的收购内容这一事件属性的事件属性值可为“手机业务”等。
步骤103、将各所述事件属性值填充至所述事件类型对应的事件名模板,获得所述待处理文本的事件名。
具体来说,针对于不同的事件类型,可预先设置不同的事件名模板,以使可将前述获得的包括“手机业务”在内的事件属性值填充至该模板,获得待处理文本的事件名。其中,事件名模板包括有前述的事件属性取值之间的相对位置关系,以及该事件类型下的固定文本。例如,对于前述举行婚礼事件类型来说,其事件名模板可为[{男主角}+{女主角}于{地点/时间}举行婚礼]。
当然,需要说明的是,考虑到事件名对于用户的吸引力,针对于同一事件类型可包括有多种事件名模板,而各事件名模板之间的不同则在于对于出现在事件名中的事件属性的选取以及事件属性值之间位置的相对关系。也就是说,基于不同的需求将事件属性值中的全部或部分填充至所述事件名模板,形成事件名。
本公开提供的事件名的生成方法,通过对待处理文本进行事件分类,获得所述待处理文本的事件类型及至少一个事件属性;基于事件图谱技术从所述待处理文本中抽取每一个事件属性的事件属性值;将各所述事件属性值填充至所述事件类型对应的事件名模板,获得所述待处理文本的事件名,以实现对于事件名的自动生成,由于针对不同事件类型的待处理文本,采用不同的事件属性和事件名模板,使得生成的待处理文本的事件名的语言流畅性和语义完整度更高,满足实际使用需求。
结合前述的各实现方式,图3为本公开提供的另一种事件名的生成方法的流程示意图,如图3所示,该事件名的生成方法包括:
步骤201、获取预设历史时间段内的多个热点事件名。
步骤202、对各个热点事件名进行事件类型提取,获得至少一个热点事件类型。
步骤203、从所述至少一个热点事件类型中选出与所述待处理文本匹配的热点事件类型作为该待处理文本的事件类型,并确定相应的至少一个事件属性。
步骤204、基于事件图谱技术从所述待处理文本中抽取每一个事件属性的事件属性值;
步骤205、将各所述事件属性值填充至所述事件类型对应的事件名模板,获得所述待处理文本的事件名。
本实施方式中的步骤203、步骤204、步骤205分别与前述实施方式中的步骤101、步骤102、步骤103的实现方式类似,在此不进行赘述。
考虑到本公开提供的事件名的生成方法可有效适用在信息流文章分发、资讯聚合等多种应用场景中,一般来说,这类应用场景对于信息的实时性和事件名的时效性要求很高。
与前述实施方式不同的是,在本实施方式中,为了保证生成的事件名对于用户具备一定的吸引力,以及具备一定的热点时效性,在对待处理文本进行事件分类之前,还可获取预设历史时间段内的多个热点事件名。
其中,该预设历史时间段具体可为最近1周,或近1个月等,其可为技术人员根据实际情况自行设置的。而热点事件名具体可为搜索排行榜或搜索引擎的搜索列表中,具备高搜索量、高点击率的事件名。例如,该热点事件名具体可为某热搜排行榜中最近一周以来排名靠前的100个事件名等。这些热点事件名可在一定程度上反映,用户所喜欢并乐于点击浏览的事件的事件名,即,对用户具备一定吸引力的事件名。因此,通过对这类事件名进行分析,可有效对事件名的生成装置中的事件类型、事件属性甚至事件名模板进行更新和迭代,以便生成的事件名更为符合用户需求。
在本实施方式中,首先,可获取预设历史时间段内的多个热点事件名,随后,利用前述的触发词匹配的方式,或语义分析等方式对各个热点事件名进行事件类型提取,获得至少一个热点事件类型。相应的,在确定待处理文本的事件类型时,将从这些热点事件类型中选取与待处理文本匹配的以成为待处理文本的事件类型。
此外,在本实施方式中,还可针对与每一热点事件类型所对应的全部热点事件名,依次采用如前述的事件图谱技术进行分析,以获得至少一个热点事件属性。而每个热点事件属性将组成该热点事件类型的事件名模板,以供后续使用。
在前述实施方式的基础上,通过对待处理文本进行事件分类之前,还可获取预设历史时间段内的多个热点事件名,以对该热点事件名进行分析获取热点事件类型和相应的热点事件属性,以及事件名模板,保证生成的事件名对于用户具备一定的吸引力,以及具备一定的热点时效性。
第二方面,本公开示例提供了一种事件名的生成装置,图4为本公开提供的一种事件名的生成装置的结构示意图,如图4所示,该事件名的生成装置包括:
第一处理模块10,用于对待处理文本进行事件分类,获得所述待处理文本的事件类型及至少一个事件属性;
第二处理模块20,用于基于事件图谱技术从所述待处理文本中抽取每一个事件属性的事件属性值;
第三处理模块30,用于将各所述事件属性值填充至所述事件类型对应的事件名模板,获得所述待处理文本的事件名。
在其他可选的示例中,该事件名的生成装置还包括:第四处理模块;
所述第四处理模块用于在对待处理文本进行事件分类之前,获取预设历史时间段内的多个热点事件名;对各个热点事件名进行事件类型提取,获得至少一个热点事件类型;
相应的,所述第一处理模块10,具体用于从所述至少一个热点事件类型中选出与所述待处理文本匹配的热点事件类型作为该待处理文本的事件类型。
在其他可选的示例中,所述第四处理模块,还用于在对各个热点事件名进行事件类型提取,获得至少一个热点事件类型之后,分析获得每一热点事件类型所对应的至少一个热点事件名,获得每一热点事件类型对应的至少一个热点事件属性;根据各热点事件类型和其对应的热点事件属性,获得所述事件名模板。
在其他可选的示例中,所述第三处理模块30,具体用于将所述事件属性值中的全部或部分填充至所述事件名模板,形成事件名。
在其他可选的示例中,第一处理模块10,具体用于对所述待处理文本进行触发词匹配处理,以在预设的各事件类型中确定与所述待处理文本对应的事件类型。
在其他可选的示例中,所述第一处理模块10,还用于根据所述待处理文本的事件类型在预设的事件本体库中,确定该事件类型相应的至少一个事件属性;其中,所述预设的事件本体库中包括每一事件类型相应的至少一个事件属性。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的控制设备的具体工作过程以及相应的有益效果,可以参考前述方法示例中的对应过程,在此不再赘述。
本公开提供的事件名的生成装置,通过对待处理文本进行事件分类,获得所述待处理文本的事件类型及至少一个事件属性;基于事件图谱技术从所述待处理文本中抽取每一个事件属性的事件属性值;将各所述事件属性值填充至所述事件类型对应的事件名模板,获得所述待处理文本的事件名,以实现对于事件名的自动生成,由于针对不同事件类型的待处理文本,采用不同的事件属性和事件名模板,使得生成的待处理文本的事件名的语言流畅性和语义完整度更高,满足实际使用需求。
第三方面,本公开示例提供了一种控制设备,图5为本公开提供的一种电子设备的硬件结构示意图,如图5所示,本公开提供了一种电子设备,包括:
一个或多个处理器42;
存储装置41,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处器执行,使得所述一个或多个处理器实现如前任一所述的方法。
所述功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。
在一个可能的设计中,控制设备的结构中包括处理器和存储器,所述存储器用于存储支持控制设备执行上述第一方面中设备的控制方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。所述控制设备还可以包括通信接口,用于控制设备与其他设备或通信网络通信。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的控制设备的具体工作过程以及相应的有益效果,可以参考前述方法示例中的对应过程,在此不再赘述。
第四方面,本公开示例提供了一种存储介质,用于储存控制设备所用的计算机软件指令,其包含用于执行上述第一方面中设备的控制方法为控制设备所涉及的程序。
本领域普通技术人员可以理解:实现上述各方法示例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法示例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各示例仅用以说明本公开的技术方案,而非对其限制;尽管参照前述各示例对本公开进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各示例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本公开各示例技术方案的范围。

Claims (14)

1.一种事件名的生成方法,其特征在于,包括:
对待处理文本进行事件分类,获得所述待处理文本的事件类型及至少一个事件属性;
基于事件图谱技术从所述待处理文本中抽取每一个事件属性的事件属性值;
将各所述事件属性值填充至所述事件类型对应的事件名模板,获得所述待处理文本的事件名。
2.根据权利要求1所述的事件名的生成方法,其特征在于,所述对待处理文本进行事件分类之前,还包括:
获取预设历史时间段内的多个热点事件名;
对各个热点事件名进行事件类型提取,获得至少一个热点事件类型;
相应的,所述对待处理文本进行事件分类,包括:
从所述至少一个热点事件类型中选出与所述待处理文本匹配的热点事件类型作为该待处理文本的事件类型。
3.根据权利要求2所述的事件名的生成方法,其特征在于,所述对各个热点事件名进行事件类型提取,获得至少一个热点事件类型之后,还包括:
分析获得每一热点事件类型所对应的至少一个热点事件名,获得每一热点事件类型对应的至少一个热点事件属性;
根据各热点事件类型和其对应的热点事件属性,获得所述事件名模板。
4.根据权利要求1所述的事件名的生成方法,其特征在于,所述将各所述事件属性值填充至所述事件类型对应的事件名模板,获得所述待处理文本的事件名,包括:
将所述事件属性值中的全部或部分填充至所述事件名模板,形成事件名。
5.根据权利要求1-4任一项所述的事件名的生成方法,其特征在于,所述对待处理文本进行事件分类,包括:
对所述待处理文本进行触发词匹配处理,以在预设的各事件类型中确定与所述待处理文本对应的事件类型。
6.根据权利要求5所述的事件名的生成方法,其特征在于,所述对待处理文本进行事件分类,还包括:
根据所述待处理文本的事件类型在预设的事件本体库中,确定该事件类型相应的至少一个事件属性;
其中,所述预设的事件本体库中包括每一事件类型相应的至少一个事件属性。
7.一种事件名的生成装置,其特征在于,包括:
第一处理模块,用于对待处理文本进行事件分类,获得所述待处理文本的事件类型及至少一个事件属性;
第二处理模块,用于基于事件图谱技术从所述待处理文本中抽取每一个事件属性的事件属性值;
第三处理模块,用于将各所述事件属性值填充至所述事件类型对应的事件名模板,获得所述待处理文本的事件名。
8.根据权利要求7所述的事件名的生成装置,其特征在于,还包括:第四处理模块;
所述第四处理模块用于在对待处理文本进行事件分类之前,获取预设历史时间段内的多个热点事件名;对各个热点事件名进行事件类型提取,获得至少一个热点事件类型;
相应的,所述第一处理模块,具体用于从所述至少一个热点事件类型中选出与所述待处理文本匹配的热点事件类型作为该待处理文本的事件类型。
9.根据权利要求8所述的事件名的生成装置,其特征在于,所述第四处理模块,还用于在对各个热点事件名进行事件类型提取,获得至少一个热点事件类型之后,分析获得每一热点事件类型所对应的至少一个热点事件名,获得每一热点事件类型对应的至少一个热点事件属性;根据各热点事件类型和其对应的热点事件属性,获得所述事件名模板。
10.根据权利要求7所述的事件名的生成装置,其特征在于,所述第三处理模块,具体用于将所述事件属性值中的全部或部分填充至所述事件名模板,形成事件名。
11.根据权利要求7-10任一项所述的事件名的生成装置,其特征在于,第一处理模块,具体用于对所述待处理文本进行触发词匹配处理,以在预设的各事件类型中确定与所述待处理文本对应的事件类型。
12.根据权利要求11所述的事件名的生成装置,其特征在于,所述第一处理模块,还用于根据所述待处理文本的事件类型在预设的事件本体库中,确定该事件类型相应的至少一个事件属性;其中,所述预设的事件本体库中包括每一事件类型相应的至少一个事件属性。
13.一种电子设备,其特征在于,所述电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-6中任一所述的方法。
14.一种包含计算机可执行指令的存储介质,其特征在于,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-6中任一所述的方法。
CN201910521868.9A 2019-06-17 2019-06-17 事件名的生成方法、装置、电子设备及存储介质 Active CN110297904B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910521868.9A CN110297904B (zh) 2019-06-17 2019-06-17 事件名的生成方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910521868.9A CN110297904B (zh) 2019-06-17 2019-06-17 事件名的生成方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN110297904A true CN110297904A (zh) 2019-10-01
CN110297904B CN110297904B (zh) 2022-10-04

Family

ID=68028095

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910521868.9A Active CN110297904B (zh) 2019-06-17 2019-06-17 事件名的生成方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN110297904B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111353070A (zh) * 2020-02-18 2020-06-30 北京百度网讯科技有限公司 视频标题的处理方法、装置、电子设备及可读存储介质
CN111428049A (zh) * 2020-03-20 2020-07-17 北京百度网讯科技有限公司 一种事件专题的生成方法、装置、设备和存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130091145A1 (en) * 2011-10-07 2013-04-11 Electronics And Telecommunications Research Institute Method and apparatus for analyzing web trends based on issue template extraction
CN103699663A (zh) * 2013-12-27 2014-04-02 中国科学院自动化研究所 一种基于大规模知识库的热点事件挖掘方法
CN104573131A (zh) * 2015-02-15 2015-04-29 北京京东尚科信息技术有限公司 生成商品详情页面数据的方法和终端装置
CN107562772A (zh) * 2017-07-03 2018-01-09 南京柯基数据科技有限公司 事件抽取方法、装置、系统和存储介质
CN108182295A (zh) * 2018-02-09 2018-06-19 重庆誉存大数据科技有限公司 一种企业知识图谱属性抽取方法及系统
CN109255034A (zh) * 2018-08-08 2019-01-22 数据地平线(广州)科技有限公司 一种基于产业链的行业知识图谱构建方法
CN109726293A (zh) * 2018-11-14 2019-05-07 数据地平线(广州)科技有限公司 一种因果事件图谱构建方法、系统、装置及存储介质
CN109785144A (zh) * 2019-01-18 2019-05-21 国家电网有限公司 一种资产分类方法、装置、设备及介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130091145A1 (en) * 2011-10-07 2013-04-11 Electronics And Telecommunications Research Institute Method and apparatus for analyzing web trends based on issue template extraction
CN103699663A (zh) * 2013-12-27 2014-04-02 中国科学院自动化研究所 一种基于大规模知识库的热点事件挖掘方法
CN104573131A (zh) * 2015-02-15 2015-04-29 北京京东尚科信息技术有限公司 生成商品详情页面数据的方法和终端装置
CN107562772A (zh) * 2017-07-03 2018-01-09 南京柯基数据科技有限公司 事件抽取方法、装置、系统和存储介质
CN108182295A (zh) * 2018-02-09 2018-06-19 重庆誉存大数据科技有限公司 一种企业知识图谱属性抽取方法及系统
CN109255034A (zh) * 2018-08-08 2019-01-22 数据地平线(广州)科技有限公司 一种基于产业链的行业知识图谱构建方法
CN109726293A (zh) * 2018-11-14 2019-05-07 数据地平线(广州)科技有限公司 一种因果事件图谱构建方法、系统、装置及存储介质
CN109785144A (zh) * 2019-01-18 2019-05-21 国家电网有限公司 一种资产分类方法、装置、设备及介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111353070A (zh) * 2020-02-18 2020-06-30 北京百度网讯科技有限公司 视频标题的处理方法、装置、电子设备及可读存储介质
CN111353070B (zh) * 2020-02-18 2023-08-18 北京百度网讯科技有限公司 视频标题的处理方法、装置、电子设备及可读存储介质
CN111428049A (zh) * 2020-03-20 2020-07-17 北京百度网讯科技有限公司 一种事件专题的生成方法、装置、设备和存储介质

Also Published As

Publication number Publication date
CN110297904B (zh) 2022-10-04

Similar Documents

Publication Publication Date Title
JP7449919B2 (ja) 自律型エージェントおよびシソーラスを用いるデータベースのための自然言語インターフェイス
US10949744B2 (en) Recurrent neural network architectures which provide text describing images
US20220004702A1 (en) Robust expandable dialogue system
Moon et al. Situated and interactive multimodal conversations
US20240004934A1 (en) Multi-modal virtual experiences of distributed content
Li et al. Api-bank: A benchmark for tool-augmented llms
CN104412265B (zh) 更新用于促进应用搜索的搜索索引
US10387536B2 (en) Computerized data-aware agent systems for retrieving data to serve a dialog between human user and computerized system
US8903711B2 (en) System and methods for semiautomatic generation and tuning of natural language interaction applications
US11720749B2 (en) Constructing conclusive answers for autonomous agents
Alag Collective intelligence in action
JP2021534493A (ja) 限られた知識ドメイン内でナレッジグラフを構築するための技術
Feinleib Big data bootcamp: What managers need to know to profit from the big data revolution
JP2019502981A (ja) 自動的な音声対話スクリプトの発見
CN103534697B (zh) 用于提供统计对话管理器训练的方法和系统
Jurney Agile data science: building data analytics applications with Hadoop
US11663218B2 (en) Systems and methods for associating dual-path resource locators with streaming content
US8850308B1 (en) Automated determination of website structure
CN110297904A (zh) 事件名的生成方法、装置、电子设备及存储介质
Zhang et al. An approach of service discovery based on service goal clustering
Liermann Overview machine learning and deep learning frameworks
Kimball The evolving role of the enterprise data warehouse in the era of big data analytics
JP2022514156A (ja) 確率的アイテムマッチングおよび検索
CN110428342A (zh) 数据修复方法、服务器、客服端及存储介质
Alonso Perspectives on infrastructure for crowdsourcing

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant