CN111414487B - 事件主题的关联扩展方法、装置、设备及介质 - Google Patents

事件主题的关联扩展方法、装置、设备及介质 Download PDF

Info

Publication number
CN111414487B
CN111414487B CN202010202353.5A CN202010202353A CN111414487B CN 111414487 B CN111414487 B CN 111414487B CN 202010202353 A CN202010202353 A CN 202010202353A CN 111414487 B CN111414487 B CN 111414487B
Authority
CN
China
Prior art keywords
event
keyword
target
theme
keywords
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010202353.5A
Other languages
English (en)
Other versions
CN111414487A (zh
Inventor
陈奇石
郑烨翰
彭卫华
罗雨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202010202353.5A priority Critical patent/CN111414487B/zh
Publication of CN111414487A publication Critical patent/CN111414487A/zh
Application granted granted Critical
Publication of CN111414487B publication Critical patent/CN111414487B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles

Abstract

本申请公开一种事件主题的关联扩展方法、装置、设备及介质,涉及人工智能技术领域,具体实现方案:获取待扩展的原始事件主题,并提取所述原始事件主题中包括的时间主题词,以及至少一个时间描述词;在至少一个关键词图谱中,获取与各所述事件描述词匹配的目标替换关键词;使用所述目标替换关键词,生成与原始事件主题匹配的扩展事件主题;其中,关键词图谱包括多个具有替换关系的关键词,关键词图谱由与设定延续类事件匹配的发布文档集合确定得到,延续类事件包括初始子事件,和与初始子事件为起点的至少一个发展子事件。能够根据原始事件主题,向用户推荐相关联的扩展事件主题,以进一步提高用户寻找素材的效率。

Description

事件主题的关联扩展方法、装置、设备及介质
技术领域
本申请实施例涉及计算机技术领域,尤其涉及人工智能技术领域,具体涉及一种事件主题的关联扩展方法、装置、设备及介质。
背景技术
目前,随着媒体行业的不断发展,涌现出大量的媒体作者,这些媒体作者每天会产出大量紧跟时事热点的资讯文章。
当一个媒体作者大量写作时,可能会出现写作资源枯竭的问题,现有技术无法对媒体作家进行撰写思路的有效推荐。
发明内容
本申请实施例公开了一种事件主题的关联扩展方法、装置、设备及介质,以针对用户输入的事件话题同类的历史话题,向用户推荐关联的扩展话题,以进一步地提高用户寻找素材的效率。
第一方面,本申请实施例公开了一种事件主题的关联扩展方法,所述方法包括:
获取待扩展的原始事件主题,并提取所述原始事件主题中包括的时间主题词,以及至少一个时间描述词;
在至少一个关键词图谱中,获取与各所述事件描述词匹配的目标替换关键词;
使用所述目标替换关键词,生成与原始事件主题匹配的扩展事件主题;
其中,关键词图谱包括多个具有替换关系的关键词,关键词图谱由与设定延续类事件匹配的发布文档集合确定得到,延续类事件包括初始子事件,和与初始子事件为起点的至少一个发展子事件。
上述申请中的一个实施例具有如下优点或有益效果:能够根据原始事件主题,向用户推荐相关联的扩展事件主题,以进一步提高用户寻找素材的效率。
另外,根据本申请上述实施例的事件主题的关联扩展方法,还可以具有如下附加的技术特征:
可选的,在所述获取待扩展的原始事件主题之前,还包括:
获取与至少一个延续类事件匹配发布的文档集合;
提取与所述发布的文档集合中的每个文档分别对应的至少一个事件描述关键词;
根据所述事件描述关键词,建立与所述延续类事件对应的关键词图谱。
上述申请中的一个实施例具有如下优点或有益效果:通过延续类事件中的事件描述关键词能够建立关键词图谱,能够使得待扩展的原始事件主题在扩展事件主题时采用。
可选的,所述提取与所述发布的文档集合中的每个文档分别对应的至少一个事件描述关键词,包括:
采用设定关键词提取技术,在当前处理的目标文档中提取至少一个关键词;
在提取的各所述关键词中滤除事件主体词,得到与所述目标文档对应的至少一个事件描述关键词。
上述申请中的一个实施例具有如下优点或有益效果:将不同的目标文档中的事件主题词滤除,而将其他的事件描述关键词建立连接,能够在事件更换了主题后,利用事件描述关键词的连接扩展新的事件的内容。
可选的,获取当前处理的目标延续类事件匹配的至少两个目标事件描述关键词;
以各所述目标事件描述关键词为顶点,建立全连接图;
根据所述全连接图,生成与所述目标延续类事件对应的关键词图谱。
上述申请中的一个实施例具有如下优点或有益效果:通过目标事件描述关键词建立的全连接图,生成关键词图谱,则能够使待扩展的原始事件主题在扩展事件主题时采用,以向用户推荐关联的扩展话题。
可选的,所述关键词图谱中还包括:
关键词与事件主体词之间的位置关系,和/或关键词在事件主题中的词性信息;
在至少一个关键词图谱中,获取与所述事件描述词匹配的目标替换关键词,包括:
在所述至少一个关键词图谱中,获取包含当前处理的目标事件描述词的目标关键词图谱;
在所述原始事件主题中,获取目标事件描述词与所述事件主体词之间的目标位置关系,和/或,目标事件描述词在事件主题中的目标词性信息;
在所述目标关键词图谱中,获取与所述目标位置关系,和/或目标词性信息匹配的关键词,作为所述目标替换关键词。
上述申请中的一个实施例具有如下优点或有益效果:能够准确地替换目标替换关键词,并能够保证替换后的目标事件的语序不会出错。
第二方面,本申请实施例公开了一种事件主题的关联扩展装置,包括:
待扩展的原始事件主题获取模块,用于获取待扩展的原始事件主题,并提取所述原始事件主题中包括的事件主体词,以及至少一个事件描述词;
目标替换关键词获取模块,用于在至少一个关键词图谱中,获取与各所述事件描述词匹配的目标替换关键词;
扩展事件主题生成模块,用于使用所述目标替换关键词,生成与原始事件主题匹配的扩展事件主题;
其中,关键词图谱包括多个具有替换关系的关键词,关键词图谱由与设定延续类事件匹配的发布文档集合确定得到,延续类事件包括初始子事件,和与初始子事件为起点的至少一个发展子事件。
第三方面,本申请实施例公开了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本申请实施例中任一项所述的事件主题的关联扩展方法。
第四方面,本申请实施例公开了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行本申请实施例中任一项所述的事件主题的关联扩展方法。
上述申请中的一个实施例具有如下优点或有益效果:以针对用户输入的同类事件话题,向用户推荐关联的扩展话题,以进一步地提高用户寻找素材的效率
上述可选方式所具有的其他效果将在下文中结合具体实施例加以说明。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1是根据本申请第一实施例提供的一种事件主题的关联扩展方法的流程示意图;
图2是根据本申请第二实施例提供的一种事件主题的关联扩展方法的流程示意图;
图3a是根据本申请第二实施例提供的一种全连接图的示意图;
图3b是根据本申请第二实施例提供的一种关键词图谱的示意图;
图4是根据本申请第三实施例提供的一种事件主题的关联扩展装置的结构示意图;
图5是用来实现本申请实施例的事件主题的关联扩展方法的电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
第一实施例
图1是根据本申请第一实施例提供的一种事件主题的关联扩展方法的流程示意图,本实施例适用于根据原始事件主题进行事件主题的扩展的情况,具体的,可以用于给予媒体工作者撰写文章时启发。该方法可以由一种事件主题的关联扩展装置来执行。该装置可以采用软件和/或硬件的方式实现,并一般可集成于电子设备中。如图1所示,本实施例提供的一种事件主题的关联扩展方法可以包括:
S110、获取待扩展的原始事件主题,并提取所述原始事件主题中包括的事件主体词,以及至少一个事件描述词。
本实施例中,原始事件主题是指对一个事件内容的描述,具体的,可以是一个新闻内容的标题或者是一篇文章的核心提要,示例性的,一件新产品的研发或者一台仪器的生产。待扩展是指能够在原始事件主题的基础上对原始事件主题进行相关内容的延伸。
事件主题词是指事件内容中的主语或者事件内容中的执行主体,以一件新产品的研发为例,则该原始事件主题中的事件主题词为新产品。
本实施例中,事件描述词是事件内容中事件主题词所做的事件的描述,具体的,事件描述词可以是动词,也可以是修饰事件主题词的限定词。示例性的,原始事件主题为一件新产品的研发,则该原始事件主题中的事件描述词为研发。
S120、在至少一个关键词图谱中,获取与各所述事件描述词匹配的目标替换关键词。
本实施例中,关键词图谱包括多个具有替换关系的关键词,每个关键词图谱由与设定的一个延续类事件匹配的发布文档集合确定得到,延续类事件包括初始子事件,和与初始子事件为起点的至少一个发展子事件。
延续类事件是在时间的延伸方向上,具备从开始、发展或结束的过程这些特性的事件。
初始子事件是用于描述一个事件的起始状态,该事件会持续以不同的形态进行发展。示例性的,初始子事件可以是产品A的研发。
发展子事件是用于描述一个事件的发展状态,示例性的,若初始子事件是产品A的研发,则发展子事件可以是产品A的面世,还可以是产品A的面世后的用户反馈等。
进一步地,关键词图谱是从延续类事件中获取的多个具有替换关系的关键词,示例性的,延续类事件为产品A的研发、产品A的面世和产品A面世后的用户反馈,则从该延续类事件中获取的具有替换关系的关键词为研发、面世和用户反馈。其中,一个关键词图谱可以是由一个延续类事件确定得到,可以针对不同类型的延续类事件预先生成多个关键词图谱。
若原始事件主题中的事件描述词为研发,则与事件描述词匹配的目标替换关键词可以从关键词图谱中获取,进一步地,该目标替换关键词为面世和用户反馈。
本实施例中,可选的,所述关键词图谱中还包括:
关键词与事件主体词之间的位置关系,和/或关键词在事件主题中的词性信息;
本实施例中,位置关系可以是前后关系,或者间隔几个词的关系。词性信息是指关键词是动词、形容词还是名词等。
在至少一个关键词图谱中,获取与所述事件描述词匹配的目标替换关键词,包括:
在所述至少一个关键词图谱中,获取包含当前处理的目标事件描述词的目标关键词图谱;
在所述原始事件主题中,获取目标事件描述词与所述事件主体词之间的目标位置关系,和/或,目标事件描述词在事件主题中的目标词性信息;
在所述目标关键词图谱中,获取与所述目标位置关系,和/或目标词性信息匹配的关键词,作为所述目标替换关键词。
本实施例中,目标事件描述词可以是面世,该描述词与事件主体词一件新产品的之间的目标位置关系是事件主体词在前,目标事件描述词在后,且目标词性信息为动词。
根据目标事件描述词确定目标关键词图谱,在目标关键词图谱中确定目标替换关键词。示例性的,目标关键词图谱中包括研发、面世和用户反馈,且上述目标关键词均在事件主题词之后,且均是用于形容事件主题词的名词。
S130、使用所述目标替换关键词,生成与原始事件主题匹配的扩展事件主题。
本实施例中,扩展事件主题是对原始事件主题进行相关内容的延伸。示例性的,若原始事件主题为一件新产品的研发,则将事件描述词研发替换为面世后,与该原始事件主题匹配的扩展事件主题为一件新产品的面世。
上述申请中的一个实施例具有如下优点或有益效果:能够根据原始事件主题,向用户推荐相关联的扩展事件主题,以进一步提高用户寻找素材的效率。
第二实施例
图2是根据本申请第二实施例提供的一种事件主题的关联扩展方法的流程示意图,本实施例用于根据原始事件主题进行扩展的情况,具体的,可以用于给予媒体工作者撰写文章时启发。该方法可以由一种事件主题的关联扩展装置来执行。该装置可以采用软件和/或硬件的方式实现,并可集成于电子设备中。如图2所示,本实施例提供的一种事件主题的关联扩展方法可以包括:
S210、获取与至少一个延续类事件匹配发布的文档集合。
本实施例中,延续类事件匹配发布的文档集合可以从互联网中各个媒体发布平台上发布的媒体文章中进行获取,也可以从延续类事件所属的领域在各类论坛或者博客中进行搜索获取。其中,文档集合不限于新闻文章、热点话题和公众号文章。
S220、提取与所述发布的文档集合中的每个文档分别对应的至少一个事件描述关键词。
本实施例中,由于文档集合的数量不止一个,在每个文档中均存在至少一个事件描述关键词,因此,需要将这些事件描述关键词进行提取。
可选的,所述提取与所述发布的文档集合中的每个文档分别对应的至少一个事件描述关键词,包括:
采用设定关键词提取技术,在当前处理的目标文档中提取至少一个关键词;
在提取的各所述关键词中滤除事件主体词,得到与所述目标文档对应的至少一个事件描述关键词。
本实施例中,关键词提取技术可以是基于词频的关键词提取技术,或者基于词图模型的关键词提取技术,具体的,基于词频的关键词提取技术可以是TF-IDF(termfrequency–inverse document frequency)技术,其中TF-IDF是一种用于信息检索与数据挖掘的常用加权技术。TF意思是词频(Term Frequency),IDF意思是逆文本频率指数(Inverse Document Frequency)。TF-IDF是一种统计方法,用以评估一个字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。
基于词图模型的关键词提取技术可以是wordRank,wordRank使用词向量的内积的关系建模,内积和他们之间的关系是直接成比例的,如果该词和上下文越相关,内积就会越大。
在当前处理的目标文档中提取至少一个关键词后,在这些关键词中将事件主体词过滤,示例性的,获取的关键词中有产品A、研发和面世。则将产品A进行过滤,得到事件描述关键词研发和面世。
S230、根据所述事件描述关键词,建立与所述延续类事件对应的关键词图谱。
本实施例中,若上述事件描述关键词为研发、面世和用户反馈,则建立这三者之间的延续关系,并记录这三者的词性,生成关键词图谱。
可选的,所述根据所述事件描述关键词,建立与所述延续类事件对应的关键词图谱,包括:
获取当前处理的目标延续类事件匹配的至少两个目标事件描述关键词;
以各所述目标事件描述关键词为顶点,建立全连接图;
根据所述全连接图,生成与所述目标延续类事件对应的关键词图谱。
本实施例中,目标事件描述关键词为研发、面世和用户反馈,则将上述三者为顶点,形成一个互相连接的全连接图,其中,全连接图可以是闭环的图形,示例性的,可以是环形。具体的,可参见图3a示出的一种全连接图的示意图。
获取全连接图后,再根据目标事件描述关键词的词性以及位置关系,生成关键词图谱。具体的,可参见图3b示出的一种关键词图谱的示意图。
S240、获取待扩展的原始事件主题,并提取所述原始事件主题中包括的事件主体词,以及至少一个事件描述词。
S250、在至少一个关键词图谱中,获取与各所述事件描述词匹配的目标替换关键词。
S260、使用所述目标替换关键词,生成与原始事件主题匹配的扩展事件主题。
其中,关键词图谱包括多个具有替换关系的关键词,关键词图谱由与设定延续类事件匹配的发布文档集合确定得到,延续类事件包括初始子事件,和与初始子事件为起点的至少一个发展子事件。
上述申请中的一个实施例具有如下优点或有益效果:通过建立关键词图谱,能够对原始事件主题智能化地扩展,能够快速给用户推荐相关内容。
第三实施例
图4是根据本申请第三实施例提供的一种事件主题的关联扩展装置的结构示意图,该装置可执行本申请实施例所提供的事件主题的关联扩展方法,具备执行方法相应的功能模块和有益效果。如图4所示,该装置400可以包括:
待扩展的原始事件主题获取模块401,用于获取待扩展的原始事件主题,并提取所述原始事件主题中包括的事件主体词,以及至少一个事件描述词;
目标替换关键词获取模块402,用于在至少一个关键词图谱中,获取与各所述事件描述词匹配的目标替换关键词;
扩展事件主题生成模块403,用于使用所述目标替换关键词,生成与原始事件主题匹配的扩展事件主题;
其中,关键词图谱包括多个具有替换关系的关键词,关键词图谱由与设定延续类事件匹配的发布文档集合确定得到,延续类事件包括初始子事件,和与初始子事件为起点的至少一个发展子事件。
可选的,所述装置还包括:
文档集合获取模块404,用于获取与至少一个延续类事件匹配发布的文档集合;
事件描述关键词提取模块405,用于提取与所述发布的文档集合中的每个文档分别对应的至少一个事件描述关键词;
关键词图谱建立模块406,用于根据所述事件描述关键词,建立与所述延续类事件对应的关键词图谱。
所述事件描述关键词提取模块405,包括:
关键词提取单元4051,用于采用设定关键词提取技术,在当前处理的目标文档中提取至少一个关键词;
事件描述关键词获取单元4052,用于在提取的各所述关键词中滤除事件主体词,得到与所述目标文档对应的至少一个事件描述关键词。
关键词图谱建立模块406,包括:
目标事件描述关键词获取单元4061,用于获取当前处理的目标延续类事件匹配的至少两个目标事件描述关键词;
全连接图建立单元4062,用于以各所述目标事件描述关键词为顶点,建立全连接图;
关键词图谱生成单元4063,用于根据所述全连接图,生成与所述目标延续类事件对应的关键词图谱。
所述关键词图谱中还包括:
关键词与事件主体词之间的位置关系,和/或关键词在事件主题中的词性信息;
所述目标替换关键词获取模块402,还包括:
目标关键词图谱获取单元4021,用于在所述至少一个关键词图谱中,获取包含当前处理的目标事件描述词的目标关键词图谱;
关系和词性信息获取单元4022,用于在所述原始事件主题中,获取目标事件描述词与所述事件主体词之间的目标位置关系,和/或,目标事件描述词在事件主题中的目标词性信息;
关键词匹配单元4023,用于在所述目标关键词图谱中,获取与所述目标位置关系,和/或目标词性信息匹配的关键词,作为所述目标替换关键词。
上述申请中的一个实施例具有如下优点或有益效果:能够根据原始事件主题,向用户推荐相关联的扩展事件主题,以进一步提高用户寻找素材的效率。
根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。
如图5所示,是根据本申请实施例的事件主题的关联扩展方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图5所示,该电子设备包括:一个或多个处理器501、存储器502,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图5中以一个处理器501为例。
存储器502即为本申请所提供的非瞬时计算机可读存储介质。其中,所述存储器存储有可由至少一个处理器执行的指令,以使所述至少一个处理器执行本申请所提供的事件主题的关联扩展方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的事件主题的关联扩展方法。
存储器502作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的车辆信息确定方法对应的程序指令/模块(例如,附图4所示的模块)。处理器501通过运行存储在存储器502中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的事件主题的关联扩展方法。
存储器502可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据事件主题的关联扩展电子设备的使用所创建的数据等。此外,存储器502可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器502可选包括相对于处理器501远程设置的存储器,这些远程存储器可以通过网络连接至事件主题的关联扩展电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
事件主题的关联扩展的电子设备还可以包括:输入装置503和输出装置504。处理器501、存储器502、输入装置503和输出装置504可以通过总线或者其他方式连接,图5中以通过总线连接为例。
输入装置503可接收输入的数字或字符信息,以及产生与事件主题的关联扩展方法的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置504可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括视觉输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、互联网和区块链网络。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
根据本申请实施例的技术方案,能够增加终端的智能性,并使得终端界面图像的变换具有实时性、用户行为关联性。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。

Claims (10)

1.一种事件主题的关联扩展方法,其特征在于,包括:
获取待扩展的原始事件主题,并提取所述原始事件主题中包括的事件主体词,以及至少一个事件描述词;
在至少一个关键词图谱中,获取与各所述事件描述词匹配的目标替换关键词;
使用所述目标替换关键词,生成与原始事件主题匹配的扩展事件主题;
其中,关键词图谱包括多个具有替换关系的关键词,关键词图谱由与设定延续类事件匹配的发布文档集合确定得到,延续类事件包括初始子事件,和与初始子事件为起点的至少一个发展子事件;所述关键词图谱中还包括:关键词与事件主体词之间的位置关系,和/或关键词在事件主题中的词性信息;
在至少一个关键词图谱中,获取与所述事件描述词匹配的目标替换关键词,包括:在所述至少一个关键词图谱中,获取包含当前处理的目标事件描述词的目标关键词图谱;在所述原始事件主题中,获取目标事件描述词与所述事件主体词之间的目标位置关系,和/或,目标事件描述词在事件主题中的目标词性信息;在所述目标关键词图谱中,获取与所述目标位置关系,和/或目标词性信息匹配的关键词,作为所述目标替换关键词。
2.根据权利要求1所述的方法,其特征在于,在所述获取待扩展的原始事件主题之前,还包括:
获取与至少一个延续类事件匹配发布的文档集合;
提取与所述发布的文档集合中的每个文档分别对应的至少一个事件描述关键词;
根据所述事件描述关键词,建立与所述延续类事件对应的关键词图谱。
3.根据权利要求2所述的方法,其特征在于,所述提取与所述发布的文档集合中的每个文档分别对应的至少一个事件描述关键词,包括:
采用设定关键词提取技术,在当前处理的目标文档中提取至少一个关键词;
在提取的各所述关键词中滤除事件主体词,得到与所述目标文档对应的至少一个事件描述关键词。
4.根据权利要求2所述的方法,其特征在于,所述根据所述事件描述关键词,建立与所述延续类事件对应的关键词图谱,包括:
获取当前处理的目标延续类事件匹配的至少两个目标事件描述关键词;
以各所述目标事件描述关键词为顶点,建立全连接图;
根据所述全连接图,生成与所述目标延续类事件对应的关键词图谱。
5.一种事件主题的关联扩展装置,其特征在于,包括:
待扩展的原始事件主题获取模块,用于获取待扩展的原始事件主题,并提取所述原始事件主题中包括的事件主体词,以及至少一个事件描述词;
目标替换关键词获取模块,用于在至少一个关键词图谱中,获取与各所述事件描述词匹配的目标替换关键词;
扩展事件主题生成模块,用于使用所述目标替换关键词,生成与原始事件主题匹配的扩展事件主题;
其中,关键词图谱包括多个具有替换关系的关键词,关键词图谱由与设定延续类事件匹配的发布文档集合确定得到,延续类事件包括初始子事件,和与初始子事件为起点的至少一个发展子事件;所述关键词图谱中还包括:关键词与事件主体词之间的位置关系,和/或关键词在事件主题中的词性信息;
所述目标替换关键词获取模块,还包括:目标关键词图谱获取单元,用于在所述至少一个关键词图谱中,获取包含当前处理的目标事件描述词的目标关键词图谱;关系和词性信息获取单元,用于在所述原始事件主题中,获取目标事件描述词与所述事件主体词之间的目标位置关系,和/或,目标事件描述词在事件主题中的目标词性信息;关键词匹配单元,用于在所述目标关键词图谱中,获取与所述目标位置关系,和/或目标词性信息匹配的关键词,作为所述目标替换关键词。
6.根据权利要求5所述的装置,其特征在于,所述装置还包括:
文档集合获取模块,用于获取与至少一个延续类事件匹配发布的文档集合;
事件描述关键词提取模块,用于提取与所述发布的文档集合中的每个文档分别对应的至少一个事件描述关键词;
关键词图谱建立模块,用于根据所述事件描述关键词,建立与所述延续类事件对应的关键词图谱。
7.根据权利要求6所述的装置,其特征在于,所述事件描述关键词提取模块,包括:
关键词提取单元,用于采用设定关键词提取技术,在当前处理的目标文档中提取至少一个关键词;
事件描述关键词获取单元,用于在提取的各所述关键词中滤除事件主体词,得到与所述目标文档对应的至少一个事件描述关键词。
8.根据权利要求6所述的装置,其特征在于,所述关键词图谱建立模块,具体包括:
目标事件描述关键词获取单元,用于获取当前处理的目标延续类事件匹配的至少两个目标事件描述关键词;
全连接图建立单元,用于以各所述目标事件描述关键词为顶点,建立全连接图;
关键词图谱生成单元,用于根据所述全连接图,生成与所述目标延续类事件对应的关键词图谱。
9.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-4中任一项所述的事件主题的关联扩展方法。
10.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行权利要求1-4中任一项所述的事件主题的关联扩展方法。
CN202010202353.5A 2020-03-20 2020-03-20 事件主题的关联扩展方法、装置、设备及介质 Active CN111414487B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010202353.5A CN111414487B (zh) 2020-03-20 2020-03-20 事件主题的关联扩展方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010202353.5A CN111414487B (zh) 2020-03-20 2020-03-20 事件主题的关联扩展方法、装置、设备及介质

Publications (2)

Publication Number Publication Date
CN111414487A CN111414487A (zh) 2020-07-14
CN111414487B true CN111414487B (zh) 2023-06-23

Family

ID=71491367

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010202353.5A Active CN111414487B (zh) 2020-03-20 2020-03-20 事件主题的关联扩展方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN111414487B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112148979B (zh) * 2020-09-27 2023-08-01 北京百度网讯科技有限公司 事件关联用户的识别方法、装置、电子设备和存储介质
CN114492393A (zh) * 2022-01-17 2022-05-13 北京百度网讯科技有限公司 文本主题的确定方法、装置及电子设备

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7111010B2 (en) * 2000-09-25 2006-09-19 Hon Hai Precision Industry, Ltd. Method and system for managing event attributes
CN101799849A (zh) * 2010-03-17 2010-08-11 哈尔滨工业大学 采用计算机实现的非障碍性自动心理咨询方法
US20140258001A1 (en) * 2013-03-08 2014-09-11 DataPop, Inc. Systems and Methods for Determining Net-New Keywords in Expanding Live Advertising Campaigns in Targeted Advertising Systems
CN103984681B (zh) * 2014-03-31 2017-01-25 同济大学 基于时序分布信息和主题模型的新闻事件演化分析方法
CN106610955A (zh) * 2016-12-13 2017-05-03 成都数联铭品科技有限公司 基于词典的多维度情感分析方法
CN110781317B (zh) * 2019-10-29 2022-03-01 北京明略软件系统有限公司 事件图谱的构建方法、装置及电子设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于事件图谱的新闻事件演化分析;季东;万方学位论文库;全文 *
基于计量学工词视角的突发事件应对研究知识图谱与热点主题分析;温志强等;数学的事件与认识;全文 *

Also Published As

Publication number Publication date
CN111414487A (zh) 2020-07-14

Similar Documents

Publication Publication Date Title
CN111241282B (zh) 文本主题生成方法、装置及电子设备
CN111563385B (zh) 语义处理方法、装置、电子设备和介质
US8700594B2 (en) Enabling multidimensional search on non-PC devices
CN111488740B (zh) 一种因果关系的判别方法、装置、电子设备及存储介质
JP7300475B2 (ja) エンティティ関係マイニング方法、装置、電子デバイス、コンピュータ可読記憶媒体及びコンピュータプログラム
CN111460289B (zh) 新闻资讯的推送方法和装置
CN111414487B (zh) 事件主题的关联扩展方法、装置、设备及介质
CN111625552B (zh) 数据收集方法、装置、设备和可读存储介质
CN111984774B (zh) 搜索方法、装置、设备以及存储介质
CN111090991B (zh) 场景纠错方法、装置、电子设备和存储介质
CN111460296B (zh) 用于更新事件集合的方法和装置
EP3839799A1 (en) Method, apparatus, electronic device and readable storage medium for translation
CN111428489B (zh) 一种评论生成方法、装置、电子设备及存储介质
CN111666417B (zh) 生成同义词的方法、装置、电子设备以及可读存储介质
CN111353070B (zh) 视频标题的处理方法、装置、电子设备及可读存储介质
CN110674262B (zh) 词语识别方法、装置、电子设备和介质
CN111832313B (zh) 文本中情感搭配集合的生成方法、装置、设备和介质
CN111125362B (zh) 一种异常文本确定方法、装置、电子设备和介质
CN112148988B (zh) 用于生成信息的方法、装置、设备以及存储介质
CN111198971B (zh) 搜索方法、搜索装置和电子设备
CN111414531B (zh) 事件的搜索方法、装置和电子设备
JP7212714B2 (ja) 関係ネットワーク生成方法、装置、電子設備、記憶媒体、及びプログラム
CN112800319A (zh) 信息搜索方法、装置、设备和介质
CN111460133B (zh) 主题短语生成方法、装置以及电子设备
CN112948718B (zh) 信息投放方法、装置、设备和介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant