CN111428049A - 一种事件专题的生成方法、装置、设备和存储介质 - Google Patents
一种事件专题的生成方法、装置、设备和存储介质 Download PDFInfo
- Publication number
- CN111428049A CN111428049A CN202010203397.XA CN202010203397A CN111428049A CN 111428049 A CN111428049 A CN 111428049A CN 202010203397 A CN202010203397 A CN 202010203397A CN 111428049 A CN111428049 A CN 111428049A
- Authority
- CN
- China
- Prior art keywords
- event
- information
- event information
- topic
- entity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 59
- 238000012216 screening Methods 0.000 claims abstract description 14
- 230000015654 memory Effects 0.000 claims description 20
- 238000012163 sequencing technique Methods 0.000 claims description 7
- 238000001914 filtration Methods 0.000 claims description 4
- 238000012986 modification Methods 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000004590 computer program Methods 0.000 description 3
- 238000000855 fermentation Methods 0.000 description 3
- 230000004151 fermentation Effects 0.000 description 3
- 238000003062 neural network model Methods 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 238000010276 construction Methods 0.000 description 2
- 238000013075 data extraction Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000001151 other effect Effects 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/211—Selection of the most significant subset of features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
- G06F18/2148—Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/29—Graphical models, e.g. Bayesian networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Computational Linguistics (AREA)
- Animal Behavior & Ethology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开了一种事件专题的生成方法、装置、设备和存储介质,涉及知识图谱技术领域。具体实现方案为:获取具有关联关系的多个事件信息,并从每个事件信息中提取实体信息和事件类型;从所述多个事件信息中,筛选具有代表属性的目标事件信息;从专题模板库中,选取与所述目标事件信息的事件类型相匹配的专题模板;将所述目标事件信息的实体信息和事件类型填充到所述专题模板中,生成所述多个事件的专题。本实施例,采用模板套用的方法生成专题,提高专题的生成效率和自动化程度。
Description
技术领域
本申请涉及计算机技术,尤其涉及知识图谱技术领域。
背景技术
随着互联网和计算机技术的发展,大量的新闻资讯能够及时推送给用户,为了便于组织新闻资讯,提供给用户良好的阅读体验,一般会将描述同一事件的新闻资讯聚合起来,再将同一专题的不同事件聚合起来,便于用户挑选感兴趣的专题或事件,进而层层展开阅读新闻资讯。
现有技术中,事件的专题大多是人工整理的,即人工阅读各个事件以及各个事件下的新闻资讯,在脑海中构建一个标题,作为各个事件的主题。显然,人工生成事件专题的方式,需要耗费较多人力,时效性也不高。
发明内容
本申请实施例提供了一种事件专题的生成方法、装置、设备和存储介质,以自动生成多个事件的专题。
第一方面,本申请实施例提供了一种事件专题的生成方法,包括:
获取具有关联关系的多个事件信息,以及每个事件信息的实体信息和事件类型;
从所述多个事件信息中,筛选具有代表属性的目标事件信息;
从专题模板库中,选取与所述目标事件信息的事件类型相匹配的专题模板;
将所述目标事件信息的实体信息和事件类型填充到所述专题模板中,生成所述多个事件信息的专题。
本申请实施例中,通过获取具有关联关系的多个事件信息的实体信息和事件类型,从而获取到生成专题所需的数据;通过从事件信息中筛选具有代表属性的目标事件信息,并将依据目标事件信息生成专题,提高了专题对多个事件信息的概括性;本实施例中的专题模板与事件类型匹配,通过对不同事件类型采用不同的专题模板,使得专题更符合人们的语言逻辑;通过从专题模板库中选取与事件类型相匹配的专题模板,并填充实体信息和事件类型,采用模板套用的方法生成专题,提高专题的生成效率和自动化程度。
可选的,所述获取具有关联关系的多个事件信息,以及每个事件信息的实体信息和事件类型,包括:
从事件知识图谱中提取子图,所述子图包括多个具有关联关系的事件节点,每个所述事件节点存储事件信息的标识,每个事件节点的属性包括所述事件信息的实体信息和事件类型。
上述申请中的一种可选实施方式,每个事件信息的实体信息和事件类型均预先存储在事件知识图谱中;通过直接从知识图谱中提取结构化的数据,提高数据提取速率,进而提高专题生成的时效性。
可选的,所述从事件知识图谱中提取子图,包括:
从事件知识图谱中提取候选子图,所述候选子图包括多个具有所述关联关系的事件节点;
如果所述候选子图包括具有两个以上出度或两个以上入度的事件节点,从所述候选子图中抽取单链条状的结构,得到所述子图。
上述申请中的一种可选实施方式,考虑到候选子图中可能存在两个以上出度或两个以上入度的事件节点,这些事件节点不属于一个主题则不应生成一个专题,因此从候选子图中抽取单链条状的结构,保证对同一主题的多个事件生成专题,提高专题的智能性和用户的阅读体验。
可选的,从事件知识图谱中提取子图,包括:
从所述事件图谱中确定待提取的所述子图;
如果所述子图的节点数量达到设定数量,和/或所述子图包括的事件节点的总热度达到设定热度值,提取所述子图。
上述申请中的一种可选实施方式,当节点数量较多和/或热度较高时才提取子图,从而将足够数量和热度的事件生成专题。
可选的,在所述从事件知识图谱中提取子图之前,还包括:
获取多个具有所述关联关系的事件信息,所述事件信息包括事件标题和报道内容;
对所述多个事件信息中每个事件信息中的事件标题进行命名实体识别,得到每个事件信息的实体信息;
对所述多个事件信息中每个事件信息中的报道内容进行事件类型分类,得到每个事件信息的事件类型;
采用每个事件信息,以及每个事件信息的实体信息和事件类型,构建事件节点;并采用所述事件信息之间的关联关系构建所述事件节点之间的边,以形成所述事件知识图谱。
上述申请中的一种可选实施方式提供了事件知识图谱的生成过程,为生成专题预先提供实体信息、事件类型和关联关系。
可选的,所述将所述目标事件信息的实体信息和事件类型填充到所述专题模板中,生成所述多个事件的专题,包括:
将所述目标事件信息的实体信息填充到所述专题模板的主语位,将所述目标事件信息的事件类型填充到所述专题模板的谓语位,生成所述多个事件的专题。
上述申请中的一种可选实施方式提供了专题模板的套用方法,通过直接将实体信息和事件类型填充到专题模板的设定位置,直接生成专题。
可选的,所述从所述多个事件信息中,筛选具有代表属性的目标事件信息,包括:
按照事件发生时间的先后顺序,对所述多个事件信息进行排序;
从排序后的多个事件信息中选择排在首位或末位的目标事件信息。
上述申请中的一种可选实施方式,首先发生的事件是多个事件的起因,最后发生的事件是多个事件的最终发酵结果,均具有多个事件的代表性,则将排在首位或末位的事件信息更加能够代表多个事件信息。
可选的,在所述按照事件发生时间的先后顺序,对所述多个事件信息进行排序之前,还包括:
从多个事件信息中,计算任意两个事件信息的相似度;
从相似度超过设定相似度阈值的两个事件信息中,剔除任一事件信息。
上述申请中的一种可选实施方式,通过剔除相似的事件信息避免事件冗余;而且,通过剔除冗余事件再进行事件排序,提高目标事件信息的准确性,
可选的,在所述将所述目标事件信息的实体信息和事件类型填充到所述专题模板中,生成所述多个事件信息的专题之前,还包括:
对所述多个事件信息中的不同实体信息和不同事件类型,分别进行数量统计;
如果所述不同实体信息的数量超过设定数量阈值,确定与所述不同实体信息对应的专题修饰词汇;
如果所述不同事件类型的数量超过设定数量阈值,确定与所述不同事件类型对应的专题修饰词汇;
所述将所述目标事件信息的实体信息和事件类型填充到所述专题模板中,生成所述多个事件的专题,包括:
将所述目标事件信息的实体信息、事件类型和所述专题修饰词汇,填充到所述专题模板中,生成所述多个事件信息的专题。
上述申请中的一种可选实施方式,如果不同实体信息的数量或者不同事件类型的数量较多,则目标事件信息不足够代表所有的事件信息。因此,在填充实体信息和事件类型后再填充专题修饰词汇,丰富了专题内容,也提高了专题对多个事件的概括性。
第二方面,本申请实施例还提供了一种事件专题的生成装置,包括:
获取模块,用于获取具有关联关系的多个事件信息,以及每个事件信息的实体信息和事件类型;
筛选模块,用于从所述多个事件信息中,筛选具有代表属性的目标事件信息;
选取模块,用于从专题模板库中,选取与所述目标事件信息的事件类型相匹配的专题模板;
填充模块,用于将所述目标事件信息的实体信息和事件类型填充到所述专题模板中,生成所述多个事件信息的专题。
第三方面,本申请实施例还提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如第一方面实施例所提供的一种事件专题的生成方法。
第四方面,本申请实施例还提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行如第一方面实施例所提供的一种事件专题的生成方法。
上述可选方式所具有的其他效果将在下文中结合具体实施例加以说明。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1是本申请实施例一中的一种事件专题的生成方法的流程图;
图2是本申请实施例二中的一种事件专题的生成方法的流程图;
图3是本申请实施例三中的一种事件专题的生成方法的流程图;
图4是本申请实施例四中的一种事件专题的生成方法的流程图;
图5是本申请实施例五中的一种事件专题的生成装置的结构图;
图6是用来实现本申请实施例的事件专题的生成方法的电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
实施例一
图1是本申请实施例一中的一种事件专题的生成方法的流程图,本申请实施例适用于对多个事件自动生成专题的情况,该方法通过事件专题的生成装置执行,该装置采用软件和/或硬件实现,并具体配置于具备一定数据运算能力的电子设备中。
如图1所示的一种事件专题的生成方法,包括:
S110、获取具有关联关系的多个事件信息,以及每个事件信息的实体信息和事件类型。
事件之间的关系包括顺承关系,因果关系等。本实施例中的关联关系可以是顺承关系,即多个事件的发生时间具有先后关系,后发生的一事件是前一事件的延续或发酵。
事件信息包括事件标题和报道内容。具体的,对每个事件信息的事件标题进行命名实体识别,如姓名,得到每个事件信息的实体信息。对每个事件信息的报道内容进行事件类型分类,如离婚类型、会议类型和贸易类型等,得到每个事件信息的事件类型。其中,对报道内容进行事件分类时,可以对报道内容中的关键字、句子、段落,利用深度学习,识别事件触发词,并进一步实现事件分类。事件触发词是直接引发事件发生的词,例如:"高中同学前一个月娶媳妇了"的触发词为"娶媳妇",所触发的事件类别为结婚类型。
当然,事件信息还包括事件发生信息,例如事件发生时间和事件发生地点等。
S120、从多个事件信息中,筛选具有代表属性的目标事件信息。
代表属性指能够代表多个事件信息的属性。可选的,将官方发布的事件信息筛选为具有代表属性的目标事件信息。
S130、从专题模板库中,选取与目标事件信息的事件类型相匹配的专题模板。
S140、将目标事件信息的实体信息和事件类型填充到专题模板中,生成多个事件信息的专题。
专题模板库包括与事件类型对应的专题模板,专题模板包括用于填充实体信息的主语位和用于填充时间类型的谓语位,当然,专题模板还可以包括用于填充事件发生信息的表语位。例如,会议类型的模板为(主语位)在(表语位)(谓语位)的主要会议内容。又例如,离婚类型的模板为(主语位)的(谓语位)风波。
然后,将目标事件信息的实体信息填充到专题模板的主语位,将目标事件信息的事件类型填充到专题模板的谓语位,生成多个事件的专题。进一步的,将目标事件信息的事件发生信息填充到专题模板的表语位。例如,实体信息为张某和吴某,事件类型为离婚,则填充后的专题模板为张某和吴某的离婚风波。
本申请实施例中,通过获取具有关联关系的多个事件信息的实体信息和事件类型,从而获取到生成专题所需的数据;通过从事件信息中筛选具有代表属性的目标事件信息,并将依据目标事件信息生成专题,提高了专题对多个事件信息的概括性;本实施例中的专题模板与事件类型匹配,通过对不同事件类型采用不同的专题模板,使得专题更符合人们的语言逻辑;通过从专题模板库中选取与事件类型相匹配的专题模板,并填充实体信息和事件类型,采用模板套用的方法生成专题,提高专题的生成效率和自动化程度。
进一步的,通过直接将实体信息和事件类型填充到专题模板的设定位置,直接生成专题。
实施例二
图2是本申请实施例二中的一种事件专题的生成方法的流程图,本申请实施例在上述各实施例的技术方案的基础上进行优化。
可选的,将操作“获取具有关联关系的多个事件信息,并从每个事件信息中提取实体信息和事件类型”细化为“从事件知识图谱中提取子图,子图包括多个具有关联关系的事件节点,每个事件节点包括实体信息和事件类型”,以提高专题生成效率。
如图2所示的一种事件专题的生成方法,包括:
S210、从事件知识图谱中提取子图,子图包括多个具有关联关系的事件节点,每个事件节点存储事件信息的标识,每个事件节点的属性包括事件信息的实体信息和事件类型。
事件知识图谱包括多个事件节点,事件节点之间由有向边连接,代表事件之间的关联关系。事件节点存储事件信息的标识,即用于标识事件标题和报道内容。实体信息和事件类型作为事件节点的属性。
事件知识图谱包括的事件节点之间不一定都具有关联关系,不具有关联关系的事件节点不应生成一个专题。因此,从事件知识图谱中提取具有关联关系的多个事件节点,以生成一个共同的专题。
可选的,在S210之前还包括知识图谱的生成操作,为生成专题预先提供实体信息、事件类型和关联关系。具体的,获取多个具有关联关系的事件信息;对多个事件信息中每个事件信息中的事件标题进行命名实体识别,得到每个事件信息的实体信息;对多个事件信息中每个事件信息中的报道内容进行事件类型分类,得到每个事件信息的事件类型;采用每个事件信息,以及每个事件信息的实体信息和事件类型,构建事件节点;并采用事件信息之间的关联关系构建事件节点之间的边,以形成事件知识图谱。实体信息的识别和事件类型的分类详见上述实施例的描述,此处不再赘述。
事件节点存储事件标识,实体信息和事件类型会作为事件节点的属性进行存储。进一步的,采用正则表达式,从每个事件信息的事件标题中提取事件发生信息。事件发生信息也会作为事件节点的属性进行存储。
可选的,从事件知识图谱中提取候选子图,候选子图包括多个具有关联关系的事件节点;如果候选子图包括具有两个以上出度或两个以上入度的事件节点,从候选子图中抽取单链条状的结构,得到子图。
本实施例首先从事件知识图谱中提取子图,再从这个子图中再抽取子图。为了便于描述和区分,将第一次提取的子图称为候选子图。
考虑到候选子图中可能存在两个以上出度或两个以上入度的事件节点,这些事件节点不属于一个主题则不应生成一个专题,因此从候选子图中抽取单链条状的结构,该单链条结构中事件节点仅有一个出度或入度,不存在分支,以保证对同一主题的多个事件生成专题,提高专题的智能性和用户的阅读体验。
S220、从多个事件信息中,筛选具有代表属性的目标事件信息。
S230、从专题模板库中,选取与目标事件信息的事件类型相匹配的专题模板。
S240、将目标事件信息的实体信息和事件类型填充到专题模板中,生成多个事件信息的专题。
本实施例中,每个事件信息的实体信息和事件类型均预先存储在事件知识图谱中;通过直接从知识图谱中提取结构化的数据,提高数据提取速率,进而提高专题生成的时效性。
实施例三
图3是本申请实施例三中的一种事件专题的生成方法的流程图,本申请实施例在上述各实施例的技术方案的基础上进行优化。
可选的,将操作“从事件知识图谱中提取子图”细化为“从事件图谱中确定待提取的子图;如果子图的节点数量达到设定数量,和/或子图包括的事件节点的总热度达到设定热度值,提取子图”,限定了子图的提取条件。
可选的,将操作“从多个事件信息中,筛选具有代表属性的目标事件信息”细化为“按照事件发生时间的先后顺序,对多个事件信息进行排序;从排序后的多个事件信息中选择排在首位或末位的目标事件信息”,以获取具有代表性的目标事件信息。
如图3所示的一种事件专题的生成方法,包括:
S310、从事件图谱中确定待提取的子图。
本实施例在提取子图之前,先划定待提取的子图的范围,当子图满足S320所示的条件后,再行提取。
S320、如果子图的节点数量达到设定数量,和/或子图包括的事件节点的总热度达到设定热度值,提取子图。
其中,设定数量和设定热度值可以自主设定。设定数量可以是10,设定热度值可以是200。
子图包括的事件节点的总热度为子图包括的每个事件节点的热度之和。每个事件节点的热度可以通过在设定时间段内用户对事件节点标识的事件信息的触发次数确定。设定时间段可以是1天或6个小时。
随着时间的进行,事件节点会越来越多,子图包括的事件节点的总热度也会越来越大。待子图的节点数量达到设定数量,和/或子图包括的事件节点的总热度达到设定热度值,进行子图提取,从而对足够数量和热度的事件信息生成专题。
S330、从多个事件信息中,筛选具有代表属性的目标事件信息。
按照事件发生时间的先后顺序,对多个事件信息进行排序;从排序后的多个事件信息中选择排在首位或末位的目标事件信息。
例如,按照事件发生时间的先后顺序,得到排序后的事件信息1、事件信息2、事件信息3和事件信息4。排在首位的事件信息是首先发生的事件,即事件信息1,排在末位的事件信息是最后发生的事件,即事件信息4。
可选的,在按照事件发生时间的先后顺序,对多个事件信息进行排序之前还包括:从多个事件信息中,计算任意两个事件信息的相似度;从相似度超过设定相似度阈值的两个事件信息中,剔除任一事件信息。
具体的,构建包括正样本和负样本的训练集,正样本为相似的两个事件信息,负样本为不相似的两个事件信息。采用训练集训练神经网络模型。值得说明的是,此处的事件信息可以是事件标题,或者报道内容中的第一句话。
将任意两个事件信息均输入至神经网络模型,得到输入的两个事件信息的相似度。判断相似度是否超过设定相似度阈值,如50%。如果输入的两个事件信息的相似度超过相似度阈值,判定输入的两个事件信息相似,则剔除任一事件信息。对多个事件信息中任意两个事件信息均输入至神经网络模型进行相似度判断,剔除相似的事件信息之后,剩下的事件信息互不相似。然后,将剩下的互不相似的事件信息进行排序。
S340、从专题模板库中,选取与目标事件信息的事件类型相匹配的专题模板。
S350、将目标事件信息的实体信息和事件类型填充到专题模板中,生成多个事件信息的专题。
本实施例中,首先发生的事件是多个事件的起因,最后发生的事件是多个事件的最终发酵结果,均具有多个事件的代表性,则将排在首位或末位的事件信息更加能够代表多个事件信息。
进一步的,通过剔除相似的事件信息避免事件冗余;而且,通过剔除冗余事件再进行事件排序,提高目标事件信息的准确性。
实施例四
图4是本发明实施例四中的一种事件专题的生成方法的流程图,本申请实施例在上述各实施例的技术方案的基础上进行优化。
可选的,将操作“将目标事件信息的实体信息和事件类型填充到专题模板中,生成多个事件信息的专题”之前,追加“对多个事件信息中的不同实体信息和不同事件类型,分别进行数量统计;如果不同实体信息的数量超过设定数量阈值,确定与不同实体信息对应的专题修饰词汇;如果不同事件类型的数量超过设定数量阈值,确定与不同事件类型对应的专题修饰词汇”,将操作“将目标事件信息的实体信息和事件类型填充到专题模板中,生成多个事件的专题”细化为“将目标事件信息的实体信息、事件类型和专题修饰词汇,填充到专题模板中,生成多个事件信息的专题”。
如图4所示的一种事件专题的生成方法,包括:
S410、获取具有关联关系的多个事件信息,以及每个事件信息的实体信息和事件类型。
S420、从多个事件信息中,筛选具有代表属性的目标事件信息。
S430、从专题模板库中,选取与目标事件信息的事件类型相匹配的专题模板。
S440、对多个事件信息中的不同实体信息和不同事件类型,分别进行数量统计。
由于事件信息之间具有关联关系,则有的事件信息的实体信息是相同的,但是有的事件信息的实体信息是不同的;类似的,有的事件信息的事件类型是相同的,但是有的事件信息的事件类型是不同的,则统计不同的实体信息和不同的事件类型。
以实体信息为例,多个事件信息包括事件信息1、事件信息2、事件信息3和事件信息4。事件信息1和事件信息2的实体信息是李某,事件信息3的实体信息是赵某,事件信息4的实体信息是王某。经统计,不同的实体信息的数量是3个。
S450、如果不同实体信息的数量超过设定数量阈值,确定与不同实体信息对应的专题修饰词汇。
S460、如果不同事件类型的数量超过设定数量阈值,确定与不同事件类型对应的专题修饰词汇。
设定数量阈值可以是2或3。如果不同实体信息的数量超过设定数量阈值,说明有多人参与到多个事件中。确定不同实体信息对应的专题修饰词汇包括:多方响应等。
如果不同事件类型的数量超过设定数量阈值,说明事件类型较多。确定不同事件类型对应的专题修饰词汇包括:影响、风波等。
S470、将目标事件信息的实体信息、事件类型和专题修饰词汇填充到专题模板中,生成多个事件信息的专题。
具体的,将目标事件信息的实体信息填充到专题模板的主语位,将目标事件信息的事件类型填充到专题模板的谓语位,将专题修饰词汇填充到专题模板的最后,生成多个事件的专题。
例如,填充主语位和谓语位后,得到郑某和王某离婚,专题修饰词汇为风波,则得到多个事件的专题为郑某和王某离婚风波。
值得说明的是,S440-S460在S470之前、S410之后执行即可。
本实施例中,如果不同实体信息的数量或者不同事件类型的数量较多,则目标事件信息不足够代表所有的事件信息。因此,在填充实体信息和事件类型后再填充专题修饰词汇,丰富了专题内容,也提高了专题对多个事件的概括性。
实施例五
图5是本申请实施例五中的一种事件专题的生成装置的结构图,本申请实施例适用于寻找词条对的同义判别证据,以便依据同义判别证据进行同义判断的情况,该装置采用软件和/或硬件实现,并具体配置于具备一定数据运算能力的电子设备中。
如图5所示的一种事件专题的生成装置500,包括:获取模块501、筛选模块502、选取模块503和填充模块504;其中,
获取模块501,用于获取具有关联关系的多个事件信息,以及每个事件信息的实体信息和事件类型;
筛选模块502,用于从多个事件信息中,筛选具有代表属性的目标事件信息;
选取模块503,用于从专题模板库中,选取与目标事件信息的事件类型相匹配的专题模板;
填充模块504,用于将目标事件信息的实体信息和事件类型填充到专题模板中,生成多个事件信息的专题。
本申请实施例中,通过获取具有关联关系的多个事件信息的实体信息和事件类型,从而获取到生成专题所需的数据;通过从事件信息中筛选具有代表属性的目标事件信息,并将依据目标事件信息生成专题,提高了专题对多个事件信息的概括性;本实施例中的专题模板与事件类型匹配,通过对不同事件类型采用不同的专题模板,使得专题更符合人们的语言逻辑;通过从专题模板库中选取与事件类型相匹配的专题模板,并填充实体信息和事件类型,采用模板套用的方法生成专题,提高专题的生成效率和自动化程度。
进一步的,获取模块501具体用于:从事件知识图谱中提取子图,子图包括多个具有关联关系的事件节点,每个事件节点存储事件信息的标识,每个事件节点的属性包括事件信息的实体信息和事件类型。
进一步的,获取模块501在从事件知识图谱中提取子图时,具体用于:从事件知识图谱中提取候选子图,候选子图包括多个具有关联关系的事件节点;如果候选子图包括具有两个以上出度或两个以上入度的事件节点,从候选子图中抽取单链条状的结构,得到子图。
进一步的,获取模块501在从事件知识图谱中提取子图时,具体用于:从事件图谱中确定待提取的子图;如果子图的节点数量达到设定数量,和/或子图包括的事件节点的总热度达到设定热度值,提取子图。
进一步的,该装置还包括图谱构建模块,用于:获取多个具有关联关系的事件信息,事件信息包括事件标题和报道内容;对多个事件信息中每个事件信息中的事件标题进行命名实体识别,得到每个事件信息中的实体信息;对多个事件信息中每个事件信息的报道内容进行事件类型分类,得到每个事件信息的事件类型;采用每个事件信息,以及每个事件信息的实体信息和事件类型,构建事件节点;并采用事件信息之间的关联关系构建事件节点之间的边,以形成事件知识图谱。
进一步的,填充模块504具体用于:将目标事件信息的实体信息填充到专题模板的主语位,将目标事件信息的事件类型填充到专题模板的谓语位,生成多个事件的专题
进一步的,筛选模块502具体用于:按照事件发生时间的先后顺序,对多个事件信息进行排序;从排序后的多个事件信息中选择排在首位或末位的目标事件信息。
进一步的,该装置还包括剔除模块,用于:从多个事件信息中,计算任意两个事件信息的相似度;从相似度超过设定相似度阈值的两个事件信息中,剔除任一事件信息。
进一步的,该装置还包括专题修饰词汇确定模块,用于:对多个事件信息中的不同实体信息和不同事件类型,分别进行数量统计;如果不同实体信息的数量超过设定数量阈值,确定与不同实体信息对应的专题修饰词汇;如果不同事件类型的数量超过设定数量阈值,确定与不同事件类型对应的专题修饰词汇;相应的,填充模块504具体用于:将目标事件信息的实体信息、事件类型和专题修饰词汇,填充到专题模板中,生成多个事件信息的专题。
上述事件专题的生成装置可执行本申请任意实施例所提供的事件专题的生成方法,具备执行事件专题的生成方法相应的功能模块和有益效果。
实施例六
根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。
如图6所示,是实现本申请实施例的事件专题的生成方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图6所示,该电子设备包括:一个或多个处理器601、存储器602,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图6中以一个处理器601为例。
存储器602即为本申请所提供的非瞬时计算机可读存储介质。其中,存储器存储有可由至少一个处理器执行的指令,以使至少一个处理器执行本申请所提供的事件专题的生成方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的事件专题的生成方法。
存储器602作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的事件专题的生成的方法对应的程序指令/模块(例如,附图5所示的包括获取模块501、筛选模块502、选取模块503和填充模块504)。处理器601通过运行存储在存储器602中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的事件专题的生成的方法。
存储器602可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储实现事件专题的生成方法的电子设备的使用所创建的数据等。此外,存储器602可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器602可选包括相对于处理器601远程设置的存储器,这些远程存储器可以通过网络连接至执行事件专题的生成方法的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
执行事件专题的生成方法的电子设备还可以包括:输入装置603和输出装置604。处理器601、存储器602、输入装置603和输出装置604可以通过总线或者其他方式连接,图6中以通过总线连接为例。
输入装置603可接收输入的数字或字符信息,以及产生与执行事件专题的生成方法的电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置604可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、互联网和区块链网络。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。
Claims (12)
1.一种事件专题的生成方法,其特征在于,包括:
获取具有关联关系的多个事件信息,以及每个事件信息的实体信息和事件类型;
从所述多个事件信息中,筛选具有代表属性的目标事件信息;
从专题模板库中,选取与所述目标事件信息的事件类型相匹配的专题模板;
将所述目标事件信息的实体信息和事件类型填充到所述专题模板中,生成所述多个事件信息的专题。
2.根据权利要求1所述的方法,其特征在于,所述获取具有关联关系的多个事件信息,以及每个事件信息的实体信息和事件类型,包括:
从事件知识图谱中提取子图,所述子图包括多个具有关联关系的事件节点,每个所述事件节点存储事件信息的标识,每个事件节点的属性包括所述事件信息的实体信息和事件类型。
3.根据权利要求2所述的方法,其特征在于,所述从事件知识图谱中提取子图,包括:
从事件知识图谱中提取候选子图,所述候选子图包括多个具有所述关联关系的事件节点;
如果所述候选子图包括具有两个以上出度或两个以上入度的事件节点,从所述候选子图中抽取单链条状的结构,得到所述子图。
4.根据权利要求2所述的方法,其特征在于,所述从事件知识图谱中提取子图,包括:
从所述事件图谱中确定待提取的所述子图;
如果所述子图的节点数量达到设定数量,和/或所述子图包括的事件节点的总热度达到设定热度值,提取所述子图。
5.根据权利要求2所述的方法,其特征在于,在所述从事件知识图谱中提取子图之前,还包括:
获取多个具有所述关联关系的事件信息,所述事件信息包括事件标题和报道内容;
对所述多个事件信息中每个事件信息中的所述事件标题进行命名实体识别,得到每个事件信息的实体信息;
对所述多个事件信息中每个事件信息中的所述报道内容进行事件类型分类,得到每个事件信息的事件类型;
采用每个事件信息,以及每个事件信息的实体信息和事件类型,构建事件节点;并采用所述事件信息之间的关联关系构建所述事件节点之间的边,以形成所述事件知识图谱。
6.根据权利要求1所述的方法,其特征在于,所述将所述目标事件信息的实体信息和事件类型填充到所述专题模板中,生成所述多个事件的专题,包括:
将所述目标事件信息的实体信息填充到所述专题模板的主语位,将所述目标事件信息的事件类型填充到所述专题模板的谓语位,生成所述多个事件的专题。
7.根据权利要求1所述的方法,其特征在于,所述从所述多个事件信息中,筛选具有代表属性的目标事件信息,包括:
按照事件发生时间的先后顺序,对所述多个事件信息进行排序;
从排序后的多个事件信息中选择排在首位或末位的目标事件信息。
8.根据权利要求7所述的方法,其特征在于,在所述按照事件发生时间的先后顺序,对所述多个事件信息进行排序之前,还包括:
从多个事件信息中,计算任意两个事件信息的相似度;
从相似度超过设定相似度阈值的两个事件信息中,剔除任一事件信息。
9.根据权利要求1-8任一项所述的方法,其特征在于,在所述将所述目标事件信息的实体信息和事件类型填充到所述专题模板中,生成所述多个事件信息的专题之前,还包括:
对所述多个事件信息中的不同实体信息和不同事件类型,分别进行数量统计;
如果所述不同实体信息的数量超过设定数量阈值,确定与所述不同实体信息对应的专题修饰词汇;
如果所述不同事件类型的数量超过设定数量阈值,确定与所述不同事件类型对应的专题修饰词汇;
所述将所述目标事件信息的实体信息和事件类型填充到所述专题模板中,生成所述多个事件的专题,包括:
将所述目标事件信息的实体信息、事件类型和所述专题修饰词汇填充到所述专题模板中,生成所述多个事件信息的专题。
10.一种事件专题的生成装置,其特征在于,包括:
获取模块,用于获取具有关联关系的多个事件信息,以及每个事件信息的实体信息和事件类型;
筛选模块,用于从所述多个事件信息中,筛选具有代表属性的目标事件信息;
选取模块,用于从专题模板库中,选取与所述目标事件信息的事件类型相匹配的专题模板;
填充模块,用于将所述目标事件信息的实体信息和事件类型填充到所述专题模板中,生成所述多个事件信息的专题。
11.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-9中任一项所述的一种事件专题的生成方法。
12.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行权利要求1-9中任一项所述的一种事件专题的生成方法。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010203397.XA CN111428049B (zh) | 2020-03-20 | 2020-03-20 | 一种事件专题的生成方法、装置、设备和存储介质 |
KR1020210035123A KR20210038467A (ko) | 2020-03-20 | 2021-03-18 | 이벤트 테마 생성 방법, 장치, 기기 및 저장 매체 |
JP2021045400A JP2021101361A (ja) | 2020-03-20 | 2021-03-19 | イベントトピックの生成方法、装置、機器及び記憶媒体 |
EP21163766.5A EP3832488A3 (en) | 2020-03-20 | 2021-03-19 | Method and apparatus for generating event theme, device and storage medium |
US17/206,917 US20210209416A1 (en) | 2020-03-20 | 2021-03-19 | Method and apparatus for generating event theme |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010203397.XA CN111428049B (zh) | 2020-03-20 | 2020-03-20 | 一种事件专题的生成方法、装置、设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111428049A true CN111428049A (zh) | 2020-07-17 |
CN111428049B CN111428049B (zh) | 2023-07-21 |
Family
ID=71553574
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010203397.XA Active CN111428049B (zh) | 2020-03-20 | 2020-03-20 | 一种事件专题的生成方法、装置、设备和存储介质 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20210209416A1 (zh) |
EP (1) | EP3832488A3 (zh) |
JP (1) | JP2021101361A (zh) |
KR (1) | KR20210038467A (zh) |
CN (1) | CN111428049B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112101013A (zh) * | 2020-09-27 | 2020-12-18 | 北京百度网讯科技有限公司 | 地点抽取方法、装置、设备以及存储介质 |
CN112733516A (zh) * | 2020-12-31 | 2021-04-30 | 京东数字科技控股股份有限公司 | 快讯处理方法、装置、设备及存储介质 |
CN113204690A (zh) * | 2021-05-28 | 2021-08-03 | 北京字节跳动网络技术有限公司 | 一种信息展示的方法、装置以及计算机存储介质 |
CN114357197A (zh) * | 2022-03-08 | 2022-04-15 | 支付宝(杭州)信息技术有限公司 | 事件推理方法和装置 |
CN117035087A (zh) * | 2023-10-09 | 2023-11-10 | 北京壹永科技有限公司 | 用于医疗推理的事理图谱生成方法、装置、设备及介质 |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111967268B (zh) * | 2020-06-30 | 2024-03-19 | 北京百度网讯科技有限公司 | 文本中的事件抽取方法、装置、电子设备和存储介质 |
CN113343687B (zh) * | 2021-05-25 | 2023-09-05 | 北京奇艺世纪科技有限公司 | 事件名称的确定方法、装置、设备及存储介质 |
CN114707004B (zh) * | 2022-05-24 | 2022-08-16 | 国网浙江省电力有限公司信息通信分公司 | 基于图像模型和语言模型的事理关系抽取处理方法及系统 |
CN114817575B (zh) * | 2022-06-24 | 2022-09-02 | 国网浙江省电力有限公司信息通信分公司 | 基于扩展模型的大规模电力事理图谱处理方法 |
CN117236330B (zh) * | 2023-11-16 | 2024-01-26 | 南京邮电大学 | 一种基于互信息和对抗神经网络的增强主题多样性方法 |
Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040143472A1 (en) * | 2003-01-22 | 2004-07-22 | International Business Machines Corporation | System and method for integrating projects events with personal calendar and scheduling clients |
JP2008203964A (ja) * | 2007-02-16 | 2008-09-04 | Nec Corp | 因果関係分析装置、因果関係分析方法及びプログラム |
JP2011204107A (ja) * | 2010-03-26 | 2011-10-13 | Nomura Research Institute Ltd | リスク情報提供システム及びプログラム |
US20120137367A1 (en) * | 2009-11-06 | 2012-05-31 | Cataphora, Inc. | Continuous anomaly detection based on behavior modeling and heterogeneous information analysis |
US20130083364A1 (en) * | 2009-09-22 | 2013-04-04 | Xerox Corporation | Knowlege-based method for using social networking site content in variable data applications |
CN108846028A (zh) * | 2018-05-24 | 2018-11-20 | 网易传媒科技(北京)有限公司 | 文章投放方法、介质、装置和计算设备 |
CN110162632A (zh) * | 2019-05-17 | 2019-08-23 | 北京百分点信息科技有限公司 | 一种新闻专题事件发现的方法 |
CN110162796A (zh) * | 2019-05-31 | 2019-08-23 | 阿里巴巴集团控股有限公司 | 新闻专题创建方法和装置 |
CN110297904A (zh) * | 2019-06-17 | 2019-10-01 | 北京百度网讯科技有限公司 | 事件名的生成方法、装置、电子设备及存储介质 |
CN110413784A (zh) * | 2019-07-23 | 2019-11-05 | 国家计算机网络与信息安全管理中心 | 基于知识图谱的舆情关联分析方法及系统 |
CN110489520A (zh) * | 2019-07-08 | 2019-11-22 | 平安科技(深圳)有限公司 | 基于知识图谱的事件处理方法、装置、设备和存储介质 |
CN110543574A (zh) * | 2019-08-30 | 2019-12-06 | 北京百度网讯科技有限公司 | 一种知识图谱的构建方法、装置、设备及介质 |
CN110633406A (zh) * | 2018-06-06 | 2019-12-31 | 北京百度网讯科技有限公司 | 事件专题的生成方法、装置、存储介质和终端设备 |
CN110633330A (zh) * | 2018-06-01 | 2019-12-31 | 北京百度网讯科技有限公司 | 事件发现方法、装置、设备及存储介质 |
CN110765265A (zh) * | 2019-09-06 | 2020-02-07 | 平安科技(深圳)有限公司 | 信息分类抽取方法、装置、计算机设备和存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11893543B2 (en) * | 2018-05-15 | 2024-02-06 | International Business Machines Corporation | Optimized automatic consensus determination for events |
-
2020
- 2020-03-20 CN CN202010203397.XA patent/CN111428049B/zh active Active
-
2021
- 2021-03-18 KR KR1020210035123A patent/KR20210038467A/ko not_active Application Discontinuation
- 2021-03-19 JP JP2021045400A patent/JP2021101361A/ja active Pending
- 2021-03-19 EP EP21163766.5A patent/EP3832488A3/en not_active Withdrawn
- 2021-03-19 US US17/206,917 patent/US20210209416A1/en active Pending
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040143472A1 (en) * | 2003-01-22 | 2004-07-22 | International Business Machines Corporation | System and method for integrating projects events with personal calendar and scheduling clients |
JP2008203964A (ja) * | 2007-02-16 | 2008-09-04 | Nec Corp | 因果関係分析装置、因果関係分析方法及びプログラム |
US20130083364A1 (en) * | 2009-09-22 | 2013-04-04 | Xerox Corporation | Knowlege-based method for using social networking site content in variable data applications |
US20120137367A1 (en) * | 2009-11-06 | 2012-05-31 | Cataphora, Inc. | Continuous anomaly detection based on behavior modeling and heterogeneous information analysis |
JP2011204107A (ja) * | 2010-03-26 | 2011-10-13 | Nomura Research Institute Ltd | リスク情報提供システム及びプログラム |
CN108846028A (zh) * | 2018-05-24 | 2018-11-20 | 网易传媒科技(北京)有限公司 | 文章投放方法、介质、装置和计算设备 |
CN110633330A (zh) * | 2018-06-01 | 2019-12-31 | 北京百度网讯科技有限公司 | 事件发现方法、装置、设备及存储介质 |
CN110633406A (zh) * | 2018-06-06 | 2019-12-31 | 北京百度网讯科技有限公司 | 事件专题的生成方法、装置、存储介质和终端设备 |
CN110162632A (zh) * | 2019-05-17 | 2019-08-23 | 北京百分点信息科技有限公司 | 一种新闻专题事件发现的方法 |
CN110162796A (zh) * | 2019-05-31 | 2019-08-23 | 阿里巴巴集团控股有限公司 | 新闻专题创建方法和装置 |
CN110297904A (zh) * | 2019-06-17 | 2019-10-01 | 北京百度网讯科技有限公司 | 事件名的生成方法、装置、电子设备及存储介质 |
CN110489520A (zh) * | 2019-07-08 | 2019-11-22 | 平安科技(深圳)有限公司 | 基于知识图谱的事件处理方法、装置、设备和存储介质 |
CN110413784A (zh) * | 2019-07-23 | 2019-11-05 | 国家计算机网络与信息安全管理中心 | 基于知识图谱的舆情关联分析方法及系统 |
CN110543574A (zh) * | 2019-08-30 | 2019-12-06 | 北京百度网讯科技有限公司 | 一种知识图谱的构建方法、装置、设备及介质 |
CN110765265A (zh) * | 2019-09-06 | 2020-02-07 | 平安科技(深圳)有限公司 | 信息分类抽取方法、装置、计算机设备和存储介质 |
Non-Patent Citations (2)
Title |
---|
LEI SHA, SUJIAN LI, BAOBAO CHANG, ZHIFANG SUI: "Joint Learning Templates and Slots for Event Schema Induction", 《ARXIV》 * |
刘海涛,老松杨,白亮,刘振亚: "基于故事的新闻视频事件专题分析方法", 《国防科技大学学报》 * |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112101013A (zh) * | 2020-09-27 | 2020-12-18 | 北京百度网讯科技有限公司 | 地点抽取方法、装置、设备以及存储介质 |
CN112733516A (zh) * | 2020-12-31 | 2021-04-30 | 京东数字科技控股股份有限公司 | 快讯处理方法、装置、设备及存储介质 |
CN112733516B (zh) * | 2020-12-31 | 2024-04-09 | 京东科技控股股份有限公司 | 快讯处理方法、装置、设备及存储介质 |
CN113204690A (zh) * | 2021-05-28 | 2021-08-03 | 北京字节跳动网络技术有限公司 | 一种信息展示的方法、装置以及计算机存储介质 |
WO2022247524A1 (zh) * | 2021-05-28 | 2022-12-01 | 北京字节跳动网络技术有限公司 | 一种信息展示的方法、装置以及计算机存储介质 |
CN113204690B (zh) * | 2021-05-28 | 2023-09-26 | 抖音视界有限公司 | 一种信息展示的方法、装置以及计算机存储介质 |
CN114357197A (zh) * | 2022-03-08 | 2022-04-15 | 支付宝(杭州)信息技术有限公司 | 事件推理方法和装置 |
CN114357197B (zh) * | 2022-03-08 | 2022-07-26 | 支付宝(杭州)信息技术有限公司 | 事件推理方法和装置 |
CN117035087A (zh) * | 2023-10-09 | 2023-11-10 | 北京壹永科技有限公司 | 用于医疗推理的事理图谱生成方法、装置、设备及介质 |
CN117035087B (zh) * | 2023-10-09 | 2023-12-26 | 北京壹永科技有限公司 | 用于医疗推理的事理图谱生成方法、装置、设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
EP3832488A2 (en) | 2021-06-09 |
JP2021101361A (ja) | 2021-07-08 |
US20210209416A1 (en) | 2021-07-08 |
EP3832488A3 (en) | 2021-08-18 |
CN111428049B (zh) | 2023-07-21 |
KR20210038467A (ko) | 2021-04-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111428049B (zh) | 一种事件专题的生成方法、装置、设备和存储介质 | |
JP7127106B2 (ja) | 質問応答処理、言語モデルの訓練方法、装置、機器および記憶媒体 | |
CN109189942B (zh) | 一种专利数据知识图谱的构建方法及装置 | |
CN111966890B (zh) | 基于文本的事件推送方法、装置、电子设备和存储介质 | |
US10248715B2 (en) | Media content recommendation method and apparatus | |
CN111797226A (zh) | 会议纪要的生成方法、装置、电子设备以及可读存储介质 | |
CN112148881B (zh) | 用于输出信息的方法和装置 | |
WO2018085401A1 (en) | Systems and methods for event detection and clustering | |
CN111125435A (zh) | 视频标签的确定方法、装置和计算机设备 | |
CN111522967A (zh) | 知识图谱构建方法、装置、设备以及存储介质 | |
CN111488740A (zh) | 一种因果关系的判别方法、装置、电子设备及存储介质 | |
CN111783468A (zh) | 文本处理方法、装置、设备和介质 | |
CN111091006A (zh) | 一种实体意图体系的建立方法、装置、设备和介质 | |
CN112084150B (zh) | 模型训练、数据检索方法,装置,设备以及存储介质 | |
Vysotska et al. | Intelligent analysis of Ukrainian-language tweets for public opinion research based on NLP methods and machine learning technology | |
CN112650919A (zh) | 实体资讯分析方法、装置、设备及存储介质 | |
CN111523019B (zh) | 用于输出信息的方法、装置、设备以及存储介质 | |
CN112052397A (zh) | 用户特征生成方法、装置、电子设备及存储介质 | |
CN111984774A (zh) | 搜索方法、装置、设备以及存储介质 | |
CN111385188A (zh) | 对话元素的推荐方法、装置、电子设备和介质 | |
CN111460257A (zh) | 专题生成方法、装置、电子设备和存储介质 | |
CN114860872A (zh) | 数据处理方法、装置、设备以及存储介质 | |
CN112015989A (zh) | 用于推送信息的方法和装置 | |
CN111523036A (zh) | 一种搜索行为挖掘方法、装置和电子设备 | |
CN115809334B (zh) | 事件关联性分类模型的训练方法、文本处理方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |