CN110633406B - 事件专题的生成方法、装置、存储介质和终端设备 - Google Patents

事件专题的生成方法、装置、存储介质和终端设备 Download PDF

Info

Publication number
CN110633406B
CN110633406B CN201810573445.7A CN201810573445A CN110633406B CN 110633406 B CN110633406 B CN 110633406B CN 201810573445 A CN201810573445 A CN 201810573445A CN 110633406 B CN110633406 B CN 110633406B
Authority
CN
China
Prior art keywords
event
topic
events
main body
cluster
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810573445.7A
Other languages
English (en)
Other versions
CN110633406A (zh
Inventor
周辉
陈文浩
陈玉光
郑宇宏
陈伟娜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201810573445.7A priority Critical patent/CN110633406B/zh
Publication of CN110633406A publication Critical patent/CN110633406A/zh
Application granted granted Critical
Publication of CN110633406B publication Critical patent/CN110633406B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提出一种事件专题的生成方法、装置、存储介质和终端设备,其中,所述方法包括:接收事件专题的页面生成请求,所述页面生成请求包括参与事件的主体;从事件数据库中检索包括所述主体的事件,所述事件数据库中包括预先收集的各种事件,所述事件数据库中按照各事件的基本属性建立索引,所述基本属性包括参与事件的主体;按照预设的专题样式,对检索到的事件进行组合,生成以所述主体为中心的事件专题。采用本发明,能自动生成事件专题,无需人工编辑,成本低,新闻专题生成速度快,便于应对突发性的事件的专题生成。

Description

事件专题的生成方法、装置、存储介质和终端设备
技术领域
本发明涉及计算机技术领域,尤其涉及一种事件专题的生成方法、装置、存储介质和终端设备。
背景技术
随着移动互联网发展,各大新闻资讯类APP(application,应用程序)也随之发展迅速。以个性化推荐、内容聚合、碎片化等形式来展示新闻资讯已经成为了资讯类应用程序的发展方向。其中,内容聚合的一种重要形式就是新闻专题。通过新闻专题可以充分展现事件发生的时序脉络和事件缘由,是一种较好的资讯展现和体验的形式。
传统的新闻专题的生成需要人工的介入,例如需要资深编辑参与编写新闻专题。但是,人工编辑的成本较高,耗时过长,无法及时应对突发性的事件,时效性低。而且,在跨领域展示新闻专题时,需要不同领域的资深编辑同时参与,则在编辑能力有限的情况下,新闻专题的可扩展性较差。
发明内容
本发明实施例提供一种事件专题的生成方法、装置、存储介质和终端设备,以解决或缓解现有技术中的以上一个或多个技术问题。
第一方面,本发明实施例提供了一种事件专题的生成方法,包括:
接收事件专题的页面生成请求,所述页面生成请求包括参与事件的主体;
从事件数据库中检索包括所述主体的事件,所述事件数据库中包括预先收集的各种事件,所述事件数据库中按照各事件的基本属性建立索引,所述基本属性包括参与事件的主体;
按照预设的专题样式,对检索到的事件进行组合,生成以所述主体为中心的事件专题。
结合第一方面,在第一方面的第一种实施方式中,所述方法还包括:
从互联网中实时地收集资讯数据;
对收集到的资讯数据进行预处理,所述预处理包括数据清洗和/或数据对齐。
结合第一方面的第一种实施方式,在第一方面的第二种实施方式中,所述方法还包括:
对预处理后资讯数据的题目进行切分,获得所述资讯数据的有效词句;
根据所述有效词句和所述资讯数据描述的事件的发生时间,按照聚类算法将描述同一事件的资讯数据聚合在同一资讯簇中。
结合第一方面的第二种实施方式,在第一方面的第三种实施方式中,所述方法还包括:
根据各所述资讯簇中的资讯数据的内容,构建各所述资讯簇对应的事件的基本属性;其中,所述基本属性包括事件名、事件所属领域、事件摘要、事件图片、事件热度、事件的发生时间以及参与者中的至少一项;
建立所述事件的参与者与人物信息网站之间的关联关系。
结合第一方面的第三种实施方式,在第一方面的第四种实施方式中,所述专题样式包括基本简介版块,所述按照预设的专题样式,对检索到的事件进行组合,生成以所述主体为中心的事件专题,包括:
从检索到的事件的各参与者中,确定出与所述事件的主体相关的相关参与者;
根据所述事件的主体与人物信息网站之间的关联关系,获得所述主体的基本简介;
根据所述相关参与者与人物信息网站之间的关联关系,获得所述相关参与者的基本简介;
在事件专题的基本简介版块显示所述事件的主体和相关参与者的基本简介。
结合第一方面的第三种实施方式,在第一方面的第五种实施方式中,所述专题样式包括最新消息版块以及历史消息回顾版块,所述按照预设的专题样式,对检索到的事件进行组合,生成以所述主体为中心的事件专题,包括:
根据检索到的事件的发生时间,将第一时间段内发生的事件的事件名以及事件摘要显示在所述最新消息版块,将第二时间段内发生的事件的事件名以及事件摘要显示在所述历史消息回顾版块;
其中,所述第一时间段在所述第二时间段之前。
结合第一方面的第四种实施方式,在第一方面的第六种实施方式中,所述专题样式还包括相关消息推荐版块,以及所述按照预设的专题样式,对检索到的事件进行组合,生成以所述主体为中心的事件专题,包括:
从所述事件数据库中检索包括所述相关参与者的事件;
根据包括所述相关参与者的事件的基本属性,对检索到的事件进行组合,显示在所述相关消息推荐版块。
结合第一方面的第三种实施方式,在第一方面的第四种实施方式中,所述专题样式包括话题簇,以及所述按照预设的专题样式,对检索到的事件进行组合,生成以所述主体为中心的事件专题,包括:
对检索到的事件的事件名进行切词,从中选取关键语句;
从所述检索到的事件中提取与所述关键语句相关的事件,并根据提取到的事件的基本属性构建成以所述关键语句为中心的话题簇;
在事件专题中,按照不同的话题簇,显示各话题簇包括的事件的事件名以及事件摘要。
第二方面,本发明实施例还提供一种事件专题的生成装置,包括:
请求接收模块,用于接收事件专题的页面生成请求,所述页面生成请求包括参与事件的主体;
事件检索模块,用于从事件数据库中检索包括所述主体的事件,所述事件数据库中包括预先收集的各种事件,所述事件数据库中按照各事件的基本属性建立索引,所述基本属性包括参与事件的主体;
事件专题生成模块,用于按照预设的专题样式,对检索到的事件进行组合,生成以所述主体为中心的事件专题。
结合第二方面,在第二方面的第一种实施方式中,所述装置还包括:
数据收集模块,用于从互联网中实时地收集资讯数据;
数据预处理模块,用于对收集到的资讯数据进行预处理,所述预处理包括数据清洗和/或数据对齐。
结合第二方面第一种实施方式,在第二方面的第二种实施方式中,所述装置还包括:
题目切分模块,用于对预处理后资讯数据的题目进行切分,获得所述资讯数据的有效词句;
资讯聚合模块,用于根据所述有效词句和所述资讯数据描述的事件的发生时间,按照聚类算法将描述同一事件的资讯数据聚合在同一资讯簇中。
结合第二方面第二种实施方式,在第二方面的第三种实施方式中,所述装置还包括:
事件属性构建模块,用于根据各所述资讯簇中的资讯数据的内容,构建各所述资讯簇对应的事件的基本属性;其中,所述基本属性包括事件名、事件所属领域、事件摘要、事件图片、事件热度、事件的发生时间以及参与者中的至少一项;
参与者关联模块,用于建立所述事件的参与者与人物信息网站之间的关联关系。
结合第二方面第三种实施方式,在第二方面的第四种实施方式中,所述专题样式包括基本简介版块,所述事件专题生成模块包括:
相关参与者确定单元,用于从检索到的事件的各参与者中,确定出与所述事件的主体相关的相关参与者;
主体简介获取单元,用于根据所述事件的主体与人物信息网站之间的关联关系,获得所述主体的基本简介;
相关参与者简介获取单元,用于根据所述相关参与者与人物信息网站之间的关联关系,获得所述相关参与者的基本简介;
简介显示单元,用于在事件专题的基本简介版块显示所述事件的主体和相关参与者的基本简介。
结合第二方面第三种实施方式,在第二方面的第五种实施方式中,所述专题样式包括最新消息版块以及历史消息回顾版块,所述事件专题生成模块包括:
按时间显示单元,用于根据检索到的事件的发生时间,将第一时间段内发生的事件的事件名以及事件摘要显示在所述最新消息版块,将第二时间段内发生的事件的事件名以及事件摘要显示在所述历史消息回顾版块;
其中,所述第一时间段在所述第二时间段之前。
结合第二方面第四种实施方式,在第二方面的第六种实施方式中,所述专题样式还包括相关消息推荐版块,以及所述事件专题生成模块包括:
相关事件检索单元,用于从所述事件数据库中检索包括所述相关参与者的事件;
相关消息显示单元根据包括所述相关参与者的事件的基本属性,对检索到的事件进行组合,显示在所述相关消息推荐版块。
结合第二方面第三种实施方式,在第二方面的第七种实施方式中,所述专题样式包括话题簇,以及所述事件专题生成模块包括:
事件名切词单元,用于对检索到的事件的事件名进行切词,从中选取关键语句;
构建话题簇单元,用于从所述检索到的事件中提取与所述关键语句相关的事件,并根据提取到的事件的基本属性构建成以所述关键语句为中心的话题簇;
话题簇显示单元,用于在事件专题中,按照不同的话题簇,显示各话题簇包括的事件的事件名以及事件摘要。
在一个可能的设计中,事件专题的生成结构中包括处理器和存储器,所述存储器用于事件专题的生成装置执行上述第一方面中事件专题的生成程序,所述处理器被配置为用于执行所述存储器中存储的程序。所述事件专题的生成装置还可以包括通信接口,用于事件专题的生成装置与其他设备或通信网络通信。
第三方面,本发明实施例还提供一种计算机可读存储介质,用于存储事件专题的生成装置所用的计算机软件指令,其中包括用于执行上述第一方面的事件专题的生成方法所涉及的程序。
上述技术方案中的任意一个技术方案具有如下优点或有益效果:
本发明实施例预先收集各种事件于事件数据库中,且该事件数据库中按照各事件的基本属性建立索引,其中一种基本属性为参与事件的主体。进而可以在接收事件专题的页面生成请求时,从事件数据库中检索包括该页面生成请求中涉及到的主体的事件。然后按照预设的专题样式,对检索到的事件进行组合,自动生成以该主体为中心的事件专题,无需人工编辑,成本低,新闻专题生成速度快,便于应对突发性的事件的专题生成。
上述概述仅仅是为了说明书的目的,并不意图以任何方式进行限制。除上述描述的示意性的方面、实施方式和特征之外,通过参考附图和以下的详细描述,本发明进一步的方面、实施方式和特征将会是容易明白的。
附图说明
在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解,这些附图仅描绘了根据本发明公开的一些实施方式,而不应将其视为是对本发明范围的限制。
图1是本发明提供的事件专题的生成方法的一个实施例的流程示意图;
图2是本发明提供的基于动态样式的事件专题的生成方法的一个实施例的流程示意图;
图3是本发明提供的事件专题的生成装置的一个实施例的流程示意图;
图4是本发明提供的事件专题的生成装置的另一个实施例的结构示意图;
图5是本发明提供的事件专题的生成方法的一个应用示例的示意图;
图6是本发明提供的终端设备的一个实施例的结构示意图。
具体实施方式
在下文中,仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样,在不脱离本发明的精神或范围的情况下,可通过各种不同方式修改所描述的实施例。因此,附图和描述被认为本质上是示例性的而非限制性的。
学术上,事件(event)是由特定人、物、事在特定时间、特定地点相互作用的客观事实,事件的发生具有客观性、真实性等特点。事件专题又称事件图谱,其定义为知识图谱的一部分,并以事件作为事件图谱中的节点。事件专题旨在发现客观世界存在的形形色色事件,挖掘事件间的联系,构建一张刻画真实世界中人物活动的网络。
请参阅图1,本发明实施例提供了一种事件专题的生成方法,可以应用于服务器。该方法包括步骤S110至步骤S130,具体如下:
S110,接收事件专题的页面生成请求,页面生成请求包括参与事件的主体;
S120,从事件数据库中检索包括页面生成请求中的主体的事件,事件数据库中包括预先收集的各种事件,事件数据库中按照各事件的基本属性建立索引,基本属性包括参与事件的主体;
S130,按照预设的专题样式,对检索到的事件进行组合,生成以页面生成请求中的主体为中心的事件专题。
在本发明实施例中,预先收集各种事件,并将这些事件按照基本属性建立索引并存储到事件数据库中。其中一种基本属性为参与事件的主体。在接收到事件专题的页面生成请求时,可以从事件数据库中根据基本属性检索包括该页面生成请求中涉及到的主体的事件。然后按照预设的专题样式,对检索到的事件进行组合,自动生成以该主体为中心的事件专题,无需人工编辑,成本低,新闻专题生成速度快,便于应对突发性的事件专题的生成。
在一种可能的实现方式中,本发明实施例在构建事件数据库的过程中或添加事件于事件数据库之前,实时收集资讯数据以构建事件。资讯数据可以包括网络新闻、博客、微博、微信公众号等资讯。其收集过程可以包括:首先,从互联网中实时地收集资讯数据;然后,对收集到的资讯数据进行预处理,预处理包括数据清洗和/或数据对齐。其中,实时收集数据的时间级别可以是秒或分钟等。数据清洗可以包括筛选掉非资讯类的数据,例如,小说、广告等。数据的来源可以包括不同的网站,例如百度、腾讯、新浪等网站的新闻资讯。各网站发布资讯的格式可能相同的,也可能是不同的,因而在收集到数据可以对数据进行对齐,统一格式。需要说明的是,收集到的资讯数据可以存储于资讯数据库或者事件数据库中的一个特定区域。
在一种可能的实现方式中,在对收集到的资讯数据进行预处理后,服务器还会对预处理后的资讯数据进行分类聚合,以将描述同一事件的资讯数据聚合在同一个资讯簇中,具体地:首先,每一个资讯数据一般都会有一个题目,可以对预处理后的资讯数据的题目进行切分,获得资讯数据的有效词句。有效词句可以是题目中的名词(主语或宾语)、动作词或事件触发词、短语或短句。例如:名词可以包括XXX人物名、XXX机构名、XXX国家或地区名等。再如,从题目中提取短句“XXX为XX捐赠XXX”。以此短句为例,事件触发词可以是“捐赠”。然后,根据有效词句和资讯数据描述的事件的发生时间,按照聚类算法将描述同一事件的资讯数据聚合在同一资讯簇中。例如,两个资讯数据的题目的有效词句相同或非常相似,并且两个资讯数据各自描述的事件的发生时间或两个资讯数据的发文时间落在同一时间区间内,可以认为这两个资讯数据在描述同一事件,将这两个资讯数据聚合在同一资讯簇中。一般来说,对收集到的海量新闻资讯采用聚类算法进行分类聚合,有利于提高事件聚合的效率。其中,常见的聚类算法包括但不限于:K均值聚类、均值漂移聚类、基于密度的聚类方法、基于高斯混合模型的最大期户聚类等。
在一种可能的实现方式中,在聚合描述同一事件的各资讯数据于相应的资讯簇中后,服务器可以构建事件的基本属性以描述事件,即建立事件于事件数据库中。其中,构建事件的基本属性的实施方式可以如下:首先,根据各资讯簇中的资讯数据的内容,构建各资讯簇对应的事件的基本属性;其中,基本属性可以包括事件名、事件所属领域、事件摘要、事件图片、事件热度、事件的发生时间以及参与者等中的至少一项。然后,建立事件的参与者与人物信息网站之间的关联关系。该关联关系可以是链接例如URL(Uniform ResourceLocator,统一资源定位符)地址,可以通过URL地址从人物信息网站中获取描述参与者的基本简介。人物信息网站可以包括介绍人物基本信息的百度百科、维基百科等。
其中,对于一个事件来说,事件名的生成过程可以包括:对资讯簇中的各资讯数据的题目进行切词,并统计每个词的出现频率,从描述同一个含义的词中选取出频率最高的词,最后根据选取出的词组合成事件名。事件所属领域可以根据资讯簇中的资讯数据所属的领域来决定,事件所属领域可以包括财经、体育、娱乐、科技等。事件摘要的生成过程可以包括:根据资讯簇中各资讯数据的热度来排序,从中选取热度最高或热度满足要求的资讯数据的摘要。或者,还可以结合各资讯数据所来自的网站的热度,从中选择热度满足要求的资讯数据的摘要。事件图片的生成可以包括:从资讯簇中的各资讯数据包含的图片中选取,并对有水印或模糊的图片进行排除,以及对选取到图片进行格式统一。事件的发生时间的确定可以包括:根据资讯簇中的各资讯数据描述事件的发生时间来统计。事件的参与者可以包括一个或多个,可以根据资讯簇中的各资讯数据的主体或参与者来确定。事件热度的生成可以包括:根据资讯簇中的各资讯数据的点击情况以及搜索日志,进行统计获得事件热度。也可以包括:先根据资讯簇中的各资讯数据的点击情况以及搜索日志,计算出各资讯数据的热度情况;然后根据各资讯数据的热度情况进行计算相应事件的事件热度。一般来说,资讯数据的点击频次越高以及被搜索到的次数越多,则该资讯数据的热度越高。
当建立事件的基本属性后,对事件的基本属性与事件之间建立索引关系。进而可以通过事件的基本属性,从事件数据库中检索到相应的事件。例如,检索语句为:NBA和12月,则可以从事件数据库中检索到NBA这一机构在12月份发生的所有事件。
在本发明实施例中,事件专题的专题样式可以包括静态样式和动态样式。其中,静态样式可以分为多个版块,并结合时序脉络进行显示。例如,静态样式包括:基本简介版块、最新消息版块、历史消息回顾版块、相关消息版会推荐版块等。动态样式可以以主体为中心并分成多个话题簇以聚类显示事件。话题的个数可以通过话题个数阈值以及话题资源数来控制。
在一种可能的实现方式中,静态样式中设置有基本简介版块,对于这一基本简介版块的生成可以仅显示主体的基本简介,也可以包括主体以及与主体相关的相关参与者的基本简介。以后者为例,具体地:首先,从检索到的事件的各参与者中,确定出与事件的主体相关的相关参与者。例如,主体为“XXX明星”,对于“XXX明星参与某电影的拍摄”的事件,则可以根据这一电影的参演者或幕后参与制作的人这些参与者来确定与“XXX明星”相关的相关参与者,假设“XXX明星”为男主角,则相关参与者可以包括女主角、导演等。然后,再基于主体以及相关参与者与人物信息网站之间的关联关系,分别获取主体以及相关参与者的基本简介。例如,可以通过事件数据库存储的“XXX明星”与人物信息网站之间的链接,获得“XXX明星”的人物基本简介,包括人物生平、历年参演的电影的信息以及家人的相关信息。最后,在事件专题的基本简介版块显示事件的主体和相关参与者的基本简介。
在一种可能的实现方式中,静态样式中可以设置有消息版块,可以根据时间距离当前时间的长远,由近到远按时间顺序显示事件的事件名以及事件摘要。也可以将消息版块分成最新消息版块和历史消息回顾版块。则以后者为例,具体地:根据检索到的事件的发生时间,将第一时间段内发生的事件的事件名以及事件摘要显示在最新消息版块,将第二时间段内发生的事件的事件名以及事件摘要显示在以及历史消息回顾版块;其中,第一时间段在第二时间段之前。例如,假设第一时间段是最近一星期内,那么第二时间段可以是在最近一个或两个月内但非最近的一星期。
在一种可能的实现方式中,静态样式中可以设置有相关消息推荐版块,可以如下进行排版显示:与主体相关的相关参与者可以根据检索到的事件的参与者来确定,则在确定相关参与者之后,可以从事件数据库中检索包括相关参与者的事件。然后,根据包括相关参与者的事件的基本属性,对检索到的事件进行组合,显示在相关消息推荐版块。例如,主体为XXX明星,相关参与者可以包括XXX明星的伴侣,可以从事件数据库中检索XXX明星的伴侣参与的事件,再根据XXX明星的伴侣参与的事件的基本属性,对XXX明星的伴侣参与的事件进行组合显示,例如,当事件热度满足热度阈值时可以选取其显示在相关消息推荐版块中。
在一种可能的实现方式中,专题样式包括话题簇,如图2所示,前述步骤S130的实现方式可以如下:
S131,对检索到的事件的事件名进行切词,从中选取关键语句。关键语句可以包括事件短语、短句、触发词等。例如,XXX明星参演XXX电影并于XXX时间上映,则关键语句可以包括:XXX明星、XXX电影、XXX时间上映的电影。
S132,从检索到的事件中提取与关键语句相关的事件,并根据提取到的事件的基本属性构建成以关键语句为中心的话题簇。以关键语句是XXX明星为例,从已检索到的事件中提取与XXX明星相关的事件,并限制事件发生时间以及事件热度,然后基于XXX明星为中心将提取到的事件构建成话题簇。以XXX电影为例,从已检索到的事件中提取与XXX电影相关的事件,并限制事件发生时间以及事件热度。然后基于XXX电影为中心将提取到的事件构建成话题簇。以关键语句是XXX时间上映的电影,从已检索到的事件中提取与XXX时间上映的电影相关的事件。当提取的事件数量过少时,还可以返回事件数据库继续检索,以构成话题簇。
S133,在事件专题中,按照不同的话题簇,显示各话题簇包括的事件的事件名以及事件摘要。需要说明的是,当话题簇包括的事件较少时,可以同时以显式的方式同时显示每个事件的事件名以及事件摘要。当话题簇包括的事件较多时,可以以显式的方式显示每个事件的事件名并以隐式的方式显示每个事件的事件摘要。例如,当用户点击事件专题某一话题簇的事件名时,显示该事件名对应的事件摘要,与此同时可以将该话题簇的事件名隐藏起来或以阴影的方式隐藏起来。
请参阅图3,本发明实施例提供一种事件专题的生成装置,包括:
请求接收模块110,用于接收事件专题的页面生成请求,所述页面生成请求包括参与事件的主体;
事件检索模块120,用于从事件数据库中检索包括所述主体的事件,所述事件数据库中包括预先收集的各种事件,所述事件数据库中按照各事件的基本属性建立索引,所述基本属性包括参与事件的主体;
事件专题生成模块130,用于按照预设的专题样式,对检索到的事件进行组合,生成以所述主体为中心的事件专题。
在一种可能的实现方式中,如图4所示,所述装置还包括:
数据收集模块410,用于从互联网中实时地收集资讯数据;
数据预处理模块420,用于对收集到的资讯数据进行预处理,所述预处理包括数据清洗和/或数据对齐。
在一种可能的实现方式中,所述装置还包括:
题目切分模块430,用于对预处理后资讯数据的题目进行切分,获得所述资讯数据的有效词句;
资讯聚合模块440,用于根据所述有效词句和所述资讯数据描述的事件的发生时间,按照聚类算法将描述同一事件的资讯数据聚合在同一资讯簇中。
在一种可能的实现方式中,所述装置还包括:
事件属性构建模块450,用于根据各所述资讯簇中的资讯数据的内容,构建各所述资讯簇对应的事件的基本属性;其中,所述基本属性包括事件名、事件所属领域、事件摘要、事件图片、事件热度、事件的发生时间以及参与者中的至少一项;
参与者关联模块460,用于建立所述事件的参与者与人物信息网站之间的关联关系。
在一种可能的实现方式中,所述专题样式包括基本简介版块,所述事件专题生成模块130包括:
相关参与者确定单元,用于从检索到的事件的各参与者中,确定出与所述事件的主体相关的相关参与者;
主体简介获取单元,用于根据所述事件的主体与人物信息网站之间的关联关系,获得所述主体的基本简介;
相关参与者简介获取单元,用于根据所述相关参与者与人物信息网站之间的关联关系,获得所述相关参与者的基本简介;
简介显示单元,用于在事件专题的基本简介版块显示所述事件的主体和相关参与者的基本简介。
在一种可能的实现方式中,所述专题样式包括最新消息版块以及历史消息回顾版块,所述事件专题生成模块130包括:
按时间显示单元,用于根据检索到的事件的发生时间,将第一时间段内发生的事件的事件名以及事件摘要显示在所述最新消息版块,将第二时间段内发生的事件的事件名以及事件摘要显示在所述历史消息回顾版块;
其中,所述第一时间段在所述第二时间段之前。
在一种可能的实现方式中,所述专题样式还包括相关消息推荐版块,以及所述事件专题生成模块130包括:
相关事件检索单元,用于从所述事件数据库中检索包括所述相关参与者的事件;
相关消息显示单元根据包括所述相关参与者的事件的基本属性,对检索到的事件进行组合,显示在所述相关消息推荐版块。
在一种可能的实现方式中,所述专题样式包括话题簇,以及所述事件专题生成模块130包括:
事件名切词单元,用于对检索到的事件的事件名进行切词,从中选取关键语句;
构建话题簇单元,用于从所述检索到的事件中提取与所述关键语句相关的事件,并根据提取到的事件的基本属性构建成以所述关键语句为中心的话题簇;
话题簇显示单元,用于在事件专题中,按照不同的话题簇,显示各话题簇包括的事件的事件名以及事件摘要。
在一个可能的设计中,事件专题的生成结构中包括处理器和存储器,所述存储器用于事件专题的生成装置执行上述第一方面中事件专题的生成程序,所述处理器被配置为用于执行所述存储器中存储的程序。所述事件专题的生成装置还可以包括通信接口,用于事件专题的生成装置与其他设备或通信网络通信。
在事件专题的产品应用上,本发明实施例基于现有的事件数据库(也称事件图谱)和其他知识库数据。其中,事件专题聚类各领域的新闻事件或资讯事件,并包含事件的各维度属性(事件发生时间、事件发生地点、参与者、主体或参与者简介、事件摘要等)。同时,事件数据库中能够关联或链接到百科或者人物等其他知识库,这些知识库可提供主体的基本简介描述和其相关的参与者或参与事件的简介描述。在产品应用样式上包括:(1)、通过事件数据的挖掘和组织,可产生静态样式(比如基于时序的专题)的事件专题;(2)、通过现有的事件的关键短语和触发词(即事件的触发动词)进行聚类,聚类出来的专题簇可作为事件专题中的一个话题簇。如此可以实现动态话题展示。两种形式的专题均可应用与资讯流的文章生成或者专题中间页的生成。
请参阅图5,本发明实施例提供一种事件专题的生成方法的应用示例。在本实施例中,事件专题的生成方法的实现主要分为五个部分:
1、资讯数据收集模块210
在本实施例中,资讯数据收集模块主要用于收集资讯数据,包括实时抓取或者接收第三方数据,然后第三方数据进行数据清洗、数据对齐(基于数据库中的schema(图表)进行数据对齐,schema为数据库对象的集合,一个用户可以对应一个schema)等。本实施例中的资讯数据来自百度新闻库、网页库、时效阿拉丁等。资讯数据的收集过程是实时的,收集过程的时效性为分钟级别。
2、事件发现模块220
在本实施例中,事件的发现过程主要包括:对描述同一事件的新闻资讯进行聚合,判断某一新闻资讯是否为一事件的潜在资讯,过滤非该事件的资讯数据。资讯聚类过程主要包括:对新闻题目处理,挖掘题目中的实体、动作词(也称事件触发词)、事件短语(主要来自新闻题目的子句),并结合时间约束,使用聚类算法将描述同一事件的新闻资讯聚合在同一个资讯簇中。同时,在聚类过程中会结合新闻资讯URL的点击和query log(查询日志)进行计算,可以获取该事件的PV(page view,页面浏览量)热度信息。
事件短语示例如下:
"ralatedmention":
[
{"@value":"王某立遗嘱捐赠全部财产成立XXX基金会"},
{"@value":"王某捐赠N亿身家成立XXX基金会"},
{"@value":"王某捐赠成立XXX基金会"}.
]
事件触发词示例如下:
"trigger":
[
{"@value":"捐赠"},
{"@value":"成立"}.
]
3、事件构建模块230
在本实施例中,前述的事件发现流程是通过对流式的查询日志进行事件的发现与追踪,将描述同一事件的新闻或资讯聚类在一起。事件发现的主要功能在于将资讯数据以事件为簇中心整合起来。但应用资讯数据还需要对单个事件的属性进行优化和挖掘,称为事件构建过程。事件的基本属性的构建过程可以包括:事件名的生成,事件所属领域的分类,事件摘要的生成,事件图片的优化与选取,事件发生时间的归一、事件热度的生成以及参与者的确定等。
此外,还可以建立事件的周边关系,通过事件的参与者,建立事件专题和百科知识的关联。至此,搭建完成基于新闻资讯数据集的事件数据库。
4、事件检索服务模块240
在本实施例中,事件检索服务是对事件数据库中事件的基本属性建立索引,这些属性主要包括参与者、时间、热度、相关触发词等。其中示例的检索语句如下:
"g.has('involving.attendee',MATCH,'NBA').has('startTime',GE,'1517356800').maxBy('startTime').with('name','startTime','involving','burstPv','clickBurstPv','@fromUrl','relatedMention','eventType','imageList')"
通过匹配(match)参与者“NBA”,再结加上时间约束和事件PV热度的排序,可以获得NBA在某个时间段发生的事件。
5、事件专题生成模块250
在本实施例中,事件专题页可以分为两种样式:(1)静态样式,专题样式分为主体简介版块、最新消息版块、历史消息回顾版块、相关消息推荐版块等。(2)动态样式:专题中的多个话题是通过该主体的主要事件短语和触发词聚类而成。具体的话题个数需要阈值和话题资源数来控制。
通过检索服务可以检索出某个主体在某段时间内参与的主要事件集合。对于时序脉络新闻则可以根据检索出来的主要事件集合快速地组织生成相应的事件专题。与此同时,通过与主体相关的相关参与者,进行检索并组合在事件专题中,从而可以推荐周边的参与者的事件,丰富专题页的内容。
其中,静态样式主要是以时间脉络为基准。基于事件数据库的检索服务,组装检索语句,可以获取满足各种条件的事件的数据。例如,以明星王某为例,构建王某最近的大事件专题。可以根据参与者为“王某”,事件发生时间为“最近的一个月内”,事件热度PV为“大于预设热度PV阈值”,可以拉取最近一个月内王某的热度事件。以及,基于主体或其他参与者和其他知识库的关联,比如百科知识库、维基知识库等人物知识库,可以获取到王某的人物简介、王某参与的主要电影的相关信息,王某的家人或朋友的相关信息。基于获取的信息,本实施例可以构成以王某为中心的事件专题,包括以下几个板块:王某的个人简介,王某最新事件集锦,王某的历史事件回顾,与王某相关的家人或朋友的消息等。
其中,对于动态样式的事件专题,可以基于某个主体,例如明星王某、某公益机构,检索以该主体作为参与者的事件列表。然后通过对事件列表中的事件短语和/或触发词聚类,聚类出的话题簇。例如:出演某某电影事件、参加某某活动事件、王某离婚事件等。同样地,也可以通过主体或参与者关联的知识库信息,挖掘出主体或参与者的基本简介、周边相关的主体的信息作为话题的补充。这样形式的话题具有多样性和动态性的特点。
本发明实施例还提供一种终端设备,如图6所示,该设备包括:存储器21和处理器22,存储器21内存储有可在处理器22上的计算机程序。处理器22执行计算机程序时实现上述实施例中的事件专题的生成方法。存储器21和处理器22的数量可以为一个或多个。
该设备还包括:
通信接口23,用于处理器22与外部设备之间的通信。
存储器21可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatilememory),例如至少一个磁盘存储器。
如果存储器21、处理器22和通信接口23独立实现,则存储器21、处理器22和通信接口23可以通过总线相互连接并完成相互间的通信。总线可以是工业标准体系结构(ISA,Industry Standard Architecture)总线、外部设备互连(PCI,Peripheral Component)总线或扩展工业标准体系结构(EISA,Extended Industry Standard Component)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,图6中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
可选的,在具体实现上,如果存储器21、处理器22及通信接口23集成在一块芯片上,则存储器21、处理器22及通信接口23可以通过内部接口完成相互间的通信。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。
本发明实施例的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质的更具体的示例至少(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式只读存储器(CDROM)。另外,计算机可读存储介质甚至可以是可在其上打印程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得程序,然后将其存储在计算机存储器中。
在本发明实施例中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于指令执行系统、输入法或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、射频(Radio Frequency,RF)等等,或者上述的任意合适的组合。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读存储介质中。存储介质可以是只读存储器,磁盘或光盘等。
以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到其各种变化或替换,这些都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (16)

1.一种事件专题的生成方法,其特征在于,包括:
接收事件专题的页面生成请求,所述页面生成请求包括参与事件的主体;
从事件数据库中检索包括所述主体的事件,所述事件数据库中包括预先收集的各种事件,所述事件数据库中按照各事件的基本属性建立索引,所述基本属性包括参与事件的主体;
按照预设的专题样式,对检索到的事件进行组合,生成以所述主体为中心的事件专题,包括:对检索到的事件的事件名进行切词,从中选取多个关键语句;对于所述多个关键语句中的每个关键语句,从所述检索到的事件中提取与该关键语句相关的事件,并根据提取到的事件的基本属性构建成以该关键语句为中心的话题簇;在所述事件专题中,按照不同的话题簇,显示各话题簇包括的事件的事件名以及事件摘要;所述专题样式包括动态样式,所述动态样式以所述主体为中心并分成多个话题簇以聚类显示所述检索到的事件;
在所述事件专题中,在所述话题簇包括的事件的数量小于设定阈值时,同时显示所述话题簇中的每个事件的事件名和事件摘要;
在所述话题簇包括的事件的数量大于所述设定阈值时,显示所述话题簇中的每个事件的事件名,并以阴影的方式隐藏所述每个事件的事件摘要;以及,在用户点击所述话题簇中的目标事件名的情况下,显示所述目标事件名的事件摘要,并以阴影的方式隐藏所述目标事件名。
2.如权利要求1所述的事件专题的生成方法,其特征在于,所述方法还包括:
从互联网中实时地收集资讯数据;
对收集到的资讯数据进行预处理,所述预处理包括数据清洗和/或数据对齐。
3.如权利要求2所述的事件专题的生成方法,其特征在于,所述方法还包括:
对预处理后资讯数据的题目进行切分,获得所述资讯数据的有效词句;
根据所述有效词句和所述资讯数据描述的事件的发生时间,按照聚类算法将描述同一事件的资讯数据聚合在同一资讯簇中。
4.如权利要求3所述的事件专题的生成方法,其特征在于,所述方法还包括:
根据各所述资讯簇中的资讯数据的内容,构建各所述资讯簇对应的事件的基本属性;其中,所述基本属性包括事件名、事件所属领域、事件摘要、事件图片、事件热度、事件的发生时间以及参与者中的至少一项;
建立所述事件的参与者与人物信息网站之间的关联关系。
5.如权利要求4所述的事件专题的生成方法,其特征在于,所述专题样式包括基本简介版块,所述按照预设的专题样式,对检索到的事件进行组合,生成以所述主体为中心的事件专题,包括:
从检索到的事件的各参与者中,确定出与所述事件的主体相关的相关参与者;
根据所述事件的主体与人物信息网站之间的关联关系,获得所述主体的基本简介;
根据所述相关参与者与人物信息网站之间的关联关系,获得所述相关参与者的基本简介;
在事件专题的基本简介版块显示所述事件的主体和相关参与者的基本简介。
6.如权利要求4所述的事件专题的生成方法,其特征在于,所述专题样式包括最新消息版块以及历史消息回顾版块,所述按照预设的专题样式,对检索到的事件进行组合,生成以所述主体为中心的事件专题,包括:
根据检索到的事件的发生时间,将第一时间段内发生的事件的事件名以及事件摘要显示在所述最新消息版块,将第二时间段内发生的事件的事件名以及事件摘要显示在所述历史消息回顾版块;
其中,所述第一时间段在所述第二时间段之前。
7.如权利要求5所述的事件专题的生成方法,其特征在于,所述专题样式还包括相关消息推荐版块,以及所述按照预设的专题样式,对检索到的事件进行组合,生成以所述主体为中心的事件专题,包括:
从所述事件数据库中检索包括所述相关参与者的事件;
根据包括所述相关参与者的事件的基本属性,对检索到的事件进行组合,显示在所述相关消息推荐版块。
8.一种事件专题的生成装置,其特征在于,包括:
请求接收模块,用于接收事件专题的页面生成请求,所述页面生成请求包括参与事件的主体;
事件检索模块,用于从事件数据库中检索包括所述主体的事件,所述事件数据库中包括预先收集的各种事件,所述事件数据库中按照各事件的基本属性建立索引,所述基本属性包括参与事件的主体;
事件专题生成模块,用于按照预设的专题样式,对检索到的事件进行组合,生成以所述主体为中心的事件专题;所述专题样式包括动态样式,所述动态样式以所述主体为中心并分成多个话题簇以聚类显示所述检索到的事件;
用于在所述事件专题中,在所述话题簇包括的事件的数量小于设定阈值时,同时显示所述话题簇中的每个事件的事件名和事件摘要;
用于在所述话题簇包括的事件的数量大于所述设定阈值时,显示所述话题簇中的每个事件的事件名,并以阴影的方式隐藏所述每个事件的事件摘要的模块;
用于在用户点击所述话题簇中的目标事件名的情况下,显示所述目标事件名的事件摘要,并以阴影的方式隐藏所述目标事件名的模块;
所述事件专题生成模块包括:
事件名切词单元,用于对检索到的事件的事件名进行切词,从中选取多个关键语句;构建话题簇单元,用于对于所述多个关键语句中的每个关键语句,从所述检索到的事件中提取与该关键语句相关的事件,并根据提取到的事件的基本属性构建成以该关键语句为中心的话题簇;话题簇显示单元,用于在所述事件专题中,按照不同的话题簇,显示各话题簇包括的事件的事件名以及事件摘要。
9.如权利要求8所述的事件专题的生成装置,其特征在于,所述装置还包括:
数据收集模块,用于从互联网中实时地收集资讯数据;
数据预处理模块,用于对收集到的资讯数据进行预处理,所述预处理包括数据清洗和/或数据对齐。
10.如权利要求9所述的事件专题的生成装置,其特征在于,所述装置还包括:
题目切分模块,用于对预处理后资讯数据的题目进行切分,获得所述资讯数据的有效词句;
资讯聚合模块,用于根据所述有效词句和所述资讯数据描述的事件的发生时间,按照聚类算法将描述同一事件的资讯数据聚合在同一资讯簇中。
11.如权利要求10所述的事件专题的生成装置,其特征在于,所述装置还包括:
事件属性构建模块,用于根据各所述资讯簇中的资讯数据的内容,构建各所述资讯簇对应的事件的基本属性;其中,所述基本属性包括事件名、事件所属领域、事件摘要、事件图片、事件热度、事件的发生时间以及参与者中的至少一项;
参与者关联模块,用于建立所述事件的参与者与人物信息网站之间的关联关系。
12.如权利要求11所述的事件专题的生成装置,其特征在于,所述专题样式包括基本简介版块,所述事件专题生成模块包括:
相关参与者确定单元,用于从检索到的事件的各参与者中,确定出与所述事件的主体相关的相关参与者;
主体简介获取单元,用于根据所述事件的主体与人物信息网站之间的关联关系,获得所述主体的基本简介;
相关参与者简介获取单元,用于根据所述相关参与者与人物信息网站之间的关联关系,获得所述相关参与者的基本简介;
简介显示单元,用于在事件专题的基本简介版块显示所述事件的主体和相关参与者的基本简介。
13.如权利要求11所述的事件专题的生成装置,其特征在于,所述专题样式包括最新消息版块以及历史消息回顾版块,所述事件专题生成模块包括:
按时间显示单元,用于根据检索到的事件的发生时间,将第一时间段内发生的事件的事件名以及事件摘要显示在所述最新消息版块,将第二时间段内发生的事件的事件名以及事件摘要显示在所述历史消息回顾版块;
其中,所述第一时间段在所述第二时间段之前。
14.如权利要求12所述的事件专题的生成装置,其特征在于,所述专题样式还包括相关消息推荐版块,以及所述事件专题生成模块包括:
相关事件检索单元,用于从所述事件数据库中检索包括所述相关参与者的事件;
相关消息显示单元根据包括所述相关参与者的事件的基本属性,对检索到的事件进行组合,显示在所述相关消息推荐版块。
15.一种实现事件专题的生成的终端设备,其特征在于,所述终端设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1-7中任一所述的事件专题的生成方法。
16.一种计算机可读存储介质,其存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的事件专题的生成方法。
CN201810573445.7A 2018-06-06 2018-06-06 事件专题的生成方法、装置、存储介质和终端设备 Active CN110633406B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810573445.7A CN110633406B (zh) 2018-06-06 2018-06-06 事件专题的生成方法、装置、存储介质和终端设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810573445.7A CN110633406B (zh) 2018-06-06 2018-06-06 事件专题的生成方法、装置、存储介质和终端设备

Publications (2)

Publication Number Publication Date
CN110633406A CN110633406A (zh) 2019-12-31
CN110633406B true CN110633406B (zh) 2023-08-01

Family

ID=68966155

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810573445.7A Active CN110633406B (zh) 2018-06-06 2018-06-06 事件专题的生成方法、装置、存储介质和终端设备

Country Status (1)

Country Link
CN (1) CN110633406B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110931136B (zh) * 2020-01-21 2020-06-19 医渡云(北京)技术有限公司 事件的搜索方法及装置、计算机介质和电子设备
CN111428049B (zh) * 2020-03-20 2023-07-21 北京百度网讯科技有限公司 一种事件专题的生成方法、装置、设备和存储介质
CN112069405A (zh) * 2020-08-31 2020-12-11 北京搜狗科技发展有限公司 周期性事件的处理方法和装置
CN112000763B (zh) 2020-09-25 2023-08-29 北京百度网讯科技有限公司 兴趣点竞争关系确定方法、装置、设备和介质
CN113268598A (zh) * 2021-05-26 2021-08-17 平安科技(深圳)有限公司 事件脉络生成方法、装置、终端设备及存储介质
CN113204690B (zh) * 2021-05-28 2023-09-26 抖音视界有限公司 一种信息展示的方法、装置以及计算机存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102411638A (zh) * 2011-12-30 2012-04-11 中国科学院自动化研究所 一种新闻检索结果的多媒体摘要生成方法
CN107015976A (zh) * 2016-01-27 2017-08-04 阿里巴巴集团控股有限公司 业务处理方法、数据处理方法及装置
CN107241260A (zh) * 2017-06-02 2017-10-10 北京百度网讯科技有限公司 基于人工智能的新闻推送的方法和装置

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7249135B2 (en) * 2004-05-14 2007-07-24 Microsoft Corporation Method and system for schema matching of web databases
CN102937960B (zh) * 2012-09-06 2015-06-17 北京邮电大学 突发事件热点话题的识别与评估装置
CN102890715A (zh) * 2012-09-24 2013-01-23 人民搜索网络股份公司 一种特定领域信息自动化组织的装置及其方法
CN103345489A (zh) * 2013-06-25 2013-10-09 百度在线网络技术(北京)有限公司 一种事件查询请求处理方法及装置
US20150286726A1 (en) * 2014-04-02 2015-10-08 NewsOther, Inc. Methods, Apparatuses, And Systems For Facilitating Access To, And Organization Of, News And Other Information Relating To One Or More Entities Or Subjects
CN104077391A (zh) * 2014-06-30 2014-10-01 北京奇虎科技有限公司 提供专题新闻搜索的方法、服务器、客户端和系统
US20160125426A1 (en) * 2014-11-03 2016-05-05 Vivastream Llc Determining Engagement Levels Based On Topical Interest
US20160328474A1 (en) * 2015-05-08 2016-11-10 Jun Shi Data recording and data recording apparatus
CN105005590B (zh) * 2015-06-29 2019-02-22 北京信息科技大学 一种信息媒介的专题阶段性摘要的生成方法
US10621231B2 (en) * 2015-08-24 2020-04-14 Google Llc Generation of a topic index with natural language processing
US10565225B2 (en) * 2016-03-04 2020-02-18 International Business Machines Corporation Exploration and navigation of a content collection
CN106021418B (zh) * 2016-05-13 2019-09-06 北京奇虎科技有限公司 新闻事件的聚类方法及装置
CN106649738A (zh) * 2016-12-23 2017-05-10 北京奇虎科技有限公司 在搜索结果页中聚合人物类资讯信息的方法及装置
CN107633044B (zh) * 2017-09-14 2021-08-06 国家计算机网络与信息安全管理中心 一种基于热点事件的舆情知识图谱构建方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102411638A (zh) * 2011-12-30 2012-04-11 中国科学院自动化研究所 一种新闻检索结果的多媒体摘要生成方法
CN107015976A (zh) * 2016-01-27 2017-08-04 阿里巴巴集团控股有限公司 业务处理方法、数据处理方法及装置
CN107241260A (zh) * 2017-06-02 2017-10-10 北京百度网讯科技有限公司 基于人工智能的新闻推送的方法和装置

Also Published As

Publication number Publication date
CN110633406A (zh) 2019-12-31

Similar Documents

Publication Publication Date Title
CN110633406B (zh) 事件专题的生成方法、装置、存储介质和终端设备
US20220391460A1 (en) Methods and systems for identifying markers of coordinated activity in social media movements
US10235421B2 (en) Systems and methods for facilitating the gathering of open source intelligence
EP2915127B1 (en) Adjusting content delivery based on user submissions
US9165085B2 (en) System and method for publishing aggregated content on mobile devices
Tinati et al. Identifying communicator roles in twitter
US8326880B2 (en) Summarizing streams of information
US20160048556A1 (en) System and method for a search engine content filter
US20130304818A1 (en) Systems and methods for discovery of related terms for social media content collection over social networks
US20130297581A1 (en) Systems and methods for customized filtering and analysis of social media content collected over social networks
US9961162B2 (en) Disambiguating online identities
Liu et al. Using social media to identify events
CN106383887A (zh) 一种环保新闻数据采集和推荐展示的方法及系统
US20140181109A1 (en) System and method for analysing text stream message thereof
US10482142B2 (en) Information processing device, information processing method, and program
US9407589B2 (en) System and method for following topics in an electronic textual conversation
US9158851B2 (en) Location aware commenting widget for creation and consumption of relevant comments
Kim et al. Finding core topics: Topic extraction with clustering on tweet
Kim et al. TwitterTrends: a spatio-temporal trend detection and related keywords recommendation scheme
Wang et al. Seeft: Planned social event discovery and attribute extraction by fusing twitter and web content
US11494450B2 (en) Providing recommended contents
Yang et al. Comparison and modelling of country-level micro-blog user behaviour and activity in cyber-physical-social systems using weibo and twitter data
Guo Spatial-temporal analysis of international connections based on textual social media data
Lamprianidis Advanced techniques and algorithms to collect, analyze and visualize spatiotemporal data from social media feeds
CN114595359A (zh) 视频评论观点处理方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant