CN111046281B - 热点话题的构建方法及装置 - Google Patents

热点话题的构建方法及装置 Download PDF

Info

Publication number
CN111046281B
CN111046281B CN201911233103.1A CN201911233103A CN111046281B CN 111046281 B CN111046281 B CN 111046281B CN 201911233103 A CN201911233103 A CN 201911233103A CN 111046281 B CN111046281 B CN 111046281B
Authority
CN
China
Prior art keywords
information
price
topic
hot
financial market
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911233103.1A
Other languages
English (en)
Other versions
CN111046281A (zh
Inventor
金业
李志强
朱克斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bank of China Ltd
Original Assignee
Bank of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bank of China Ltd filed Critical Bank of China Ltd
Priority to CN201911233103.1A priority Critical patent/CN111046281B/zh
Publication of CN111046281A publication Critical patent/CN111046281A/zh
Application granted granted Critical
Publication of CN111046281B publication Critical patent/CN111046281B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/06Asset management; Financial planning or analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Finance (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Human Resources & Organizations (AREA)
  • Operations Research (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种热点话题的构建方法及装置,该方法包括:采集多个资讯平台的资讯信息;将资讯信息归类为一个或多个资讯话题;实时采集每个资讯话题的热度信息,并根据每个资讯话题的热度信息,计算每个资讯话题的热度指标;监测每个资讯话题的热度指标是否在第一预设时间段内持续高于第一预设阈值;将热度指标在第一预设时间段内持续高于第一预设阈值的资讯话题,确定为热点话题,创建热点话题的记录文档,记录热点话题的资讯信息,直到热点话题的热度指标在第二预设时间段内持续低于第二预设阈值,停止记录热点话题的资讯信息。本发明能够从大量资讯信息中提取热点话题,并记录热点话题的资讯信息,提高资讯信息的阅读效率。

Description

热点话题的构建方法及装置
技术领域
本发明涉及大数据技术领域,尤其涉及一种热点话题的构建方法及装置。
背景技术
本部分旨在为权利要求书中陈述的本发明实施例提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
随着移动互联网的快速发展,提供各种新闻资讯的平台越来越多,海量的资讯内容,使得用户很难在有限的时间内找到有价值的资讯内容,且很难发现某个资讯话题的影响力趋势。尤其是金融市场产品的投资用户,其了解资讯的很大一部分原因是为了能够了解其已投资或意向投资的金融市场产品受政策、市场的影响情况。由于金融市场产品的价格受政策、市场变化影响较大,因而,从海量的资讯信息中挖掘出用户关注的资讯话题,并能够直观展示资讯话题的发展趋势,不仅能够帮助用户节省大量的资讯阅读时间,还能够帮助用户做出正确的投资决策。
目前,现有资讯平台都是按照时间顺序展示资讯内容,通过关键词搜索来实现对某个资讯话题的追踪,这种方式,一方面搜索出的资讯内容可能不全面,另一方面,海量的资讯信息,使得用户很难快速了解到资讯话题的影响力趋势。
针对上述问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供一种热点话题的构建方法,用以解决现有资讯平台按照时间顺序展示资讯内容,通过关键词搜索来实现对某个资讯话题的追踪,导致需要阅读的资讯信息量很大,且无法实现对某个资讯话题影响力趋势追踪的技术问题,该方法包括:采集多个资讯平台的资讯信息;将资讯信息归类为一个或多个资讯话题;实时采集每个资讯话题的热度信息,并根据每个资讯话题的热度信息,计算每个资讯话题的热度指标,其中,每个资讯话题的热度信息包含每个资讯话题内所有资讯的点击数、点赞数或评论数;监测每个资讯话题的热度指标是否在第一预设时间段内持续高于第一预设阈值;将热度指标在第一预设时间段内持续高于第一预设阈值的资讯话题,确定为热点话题,创建热点话题的记录文档,记录热点话题的资讯信息,直到热点话题的热度指标在第二预设时间段内持续低于第二预设阈值,停止记录热点话题的资讯信息。
本发明实施例还提供一种热点话题的构建装置,用以解决现有资讯平台按照时间顺序展示资讯内容,通过关键词搜索来实现对某个资讯话题的追踪,导致需要阅读的资讯信息量很大,且无法实现对某个资讯话题影响力趋势追踪的技术问题,该装置包括:资讯采集模块,用于采集多个资讯平台的资讯信息;资讯话题归类模块,用于将资讯信息归类为一个或多个资讯话题;热度指标计算模块,用于实时采集每个资讯话题的热度信息,并根据每个资讯话题的热度信息,计算每个资讯话题的热度指标,其中,每个资讯话题的热度信息包含每个资讯话题内所有资讯的点击数、点赞数或评论数;热度指标监测模块,用于监测每个资讯话题的热度指标是否在第一预设时间段内持续高于第一预设阈值;热点话题构建模块,用于将热度指标在第一预设时间段内持续高于第一预设阈值的资讯话题,确定为热点话题,创建热点话题的记录文档,记录热点话题的资讯信息,直到热点话题的热度指标在第二预设时间段内持续低于第二预设阈值,停止记录热点话题的资讯信息。
本发明实施例还提供一种计算机设备,用以解决现有资讯平台按照时间顺序展示资讯内容,通过关键词搜索来实现对某个资讯话题的追踪,导致需要阅读的资讯信息量很大,且无法实现对某个资讯话题影响力趋势追踪的技术问题,该计算机设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述热点话题的构建方法。
本发明实施例还提供一种计算机可读存储介质,用以解决现有资讯平台按照时间顺序展示资讯内容,通过关键词搜索来实现对某个资讯话题的追踪,导致需要阅读的资讯信息量很大,且无法实现对某个资讯话题影响力趋势追踪的技术问题,该计算机可读存储介质存储有执行上述热点话题的构建方法的计算机程序。
本发明实施例中,通过与不同资讯平台对接,采集来自多个资讯平台的资讯信息,将采集到的资讯信息归类为一个或多个资讯话题,进而实时采集各个资讯话题的热度信息,并根据各个资讯话题的热度信息(包括但不限于每个资讯话题内所有资讯的点击数、点赞数或评论数),计算各个资讯话题的热度指标,监测各个资讯话题的热度指标是否在第一预设时间段内持续高于第一预设阈值,将热度指标在第一预设时间段内持续高于第一预设阈值的资讯话题,确定为热点话题,创建热点话题的记录文档,记录热点话题的资讯信息,直到热点话题的热度指标在第二预设时间段内持续低于第二预设阈值,停止记录热点话题的资讯信息。
通过本发明实施例,对不同资讯平台的资讯信息进行归类,从海量资讯信息中提取热点话题,并记录热点话题的资讯信息,能够提高用户阅读资讯内容的效率,让用户快速了解到其关注的资讯话题的影响力趋势,对于金融市场茶品的投资用户,能够快速从海量的财经新闻资讯中了解其已投资或意向投资的金融市场产品受政策、市场的影响情况。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1为本发明实施例中提供的一种热点话题的构建方法流程图;
图2为本发明实施例中提供的一种展示热点话题热度曲线的界面示意图;
图3为本发明实施例中提供的一种展示热点话题热度曲线和金融市场产品价格曲线的界面示意图;
图4为本发明实施例中提供的一种热点话题对应的第一时间戳和第二时间戳均落入产品价格时间段内的示意图;
图5为本发明实施例中提供的一种热点话题对应的第一时间戳和第二时间戳均未落入产品价格时间段内的示意图;
图6为本发明实施例中提供的一种热点话题对应的第一时间戳落入产品价格时间段内而第二时间戳未落入产品价格时间段内的示意图;
图7为本发明实施例中提供的一种热点话题对应的第一时间戳未落入产品价格时间段内而第二时间戳落入产品价格时间段内的示意图;
图8为本发明实施例中提供的一种优选的热点话题展示界面示意图;
图9为本发明实施例中提供的一种热点话题资讯展示方式示意图;
图10为本发明实施例中提供的一种热点话题拓扑结构信息示意图;
图11为本发明实施例中提供一种热点话题的构建装置示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本发明实施例做进一步详细说明。在此,本发明的示意性实施例及其说明用于解释本发明,但并不作为对本发明的限定。
在本说明书的描述中,所使用的“包含”、“包括”、“具有”、“含有”等,均为开放性的用语,即意指包含但不限于。参考术语“一个实施例”、“一个具体实施例”、“一些实施例”、“例如”等的描述意指结合该实施例或示例描述的具体特征、结构或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。各实施例中涉及的步骤顺序用于示意性说明本申请的实施,其中的步骤顺序不作限定,可根据需要作适当调整。
本发明实施例中提供了一种热点话题的构建方法,图1为本发明实施例中提供的一种热点话题的构建方法流程图,如图1所示,该方法包括如下步骤:
S101,采集多个资讯平台的资讯信息。
需要说明的是,上述资讯平台可以是任意一种发布资讯的平台,包括但不限于微博、微信朋友圈、网易新闻等;作为一种优选的实施例,本发明实施例以发布金融市场产品相关资讯为例来进行说明,例如,彭博社、Wind、华尔街见闻等资讯平台每天会推送大量财经新闻资讯,用户通常阅读这些财经新闻资讯,以对其已经投资的金融市场产进行趋势预判。
作为一种可选的实施方式,上述S101可以通过统一的资讯接口,与各个资讯平台进行对接,以采集各个资讯平台上发布的资讯信息。现有技术中,用户通过不同的资讯平台来查看新闻资讯,不仅耗时耗力,而且对于同一话题,可能不同的资讯平台上均会发布资讯,导致用户重复查看资讯会浪费很多时间。本发明实施例通过统一的资讯接口,与多个资讯平台对接,不仅可以提供更全面的资讯内容,而且还可以起到去冗余的作用。
S102,将资讯信息归类为一个或多个资讯话题。
具体地,上述S102可以采用各种聚类算法将来自各个资讯平台的资讯信息归类为不同的资讯话题,现有的聚类方法有很多,本发明实施例对此不再赘述。例如,通过对财经新闻资讯进行自然语言分析,聚类算法进行归类后,可以得到多个资讯话题。
S103,实时采集每个资讯话题的热度信息,并根据每个资讯话题的热度信息,计算每个资讯话题的热度指标,其中,每个资讯话题的热度信息包含每个资讯话题内所有资讯的点击数、点赞数或评论数。
需要说明的是,每个资讯话题都包含多条资讯,每条资讯都有相应的点击数、点赞数或评论数等影响热度变化的影响力指标,因而,通过采集每个资讯话题内所有资讯的点击数、点赞数或评论数等影响力指标,并针对不同的影响力指标设定不同的权重,进行加权平均,即可计算得到每个资讯话题的热度指标。需要注意的是,每条资讯的影响力指标是实时变化的,因而,每个资讯话题的热度指标也是实时变化的。
S104,监测每个资讯话题的热度指标是否在第一预设时间段内持续高于第一预设阈值。
需要说明的是,本发明实施例将热度指标在一段时间内持续高于某个阈值的资讯话题确定为热点话题。通过实时监测每个资讯话题内各条资讯的热度信息,能够实时计算每个资讯话题的热度指标,因而,可以通过实时监测各个资讯话题的热度指标是否在一预设时间段内均持续高于某个阈值(即第一预设阈值)。通常,如果一个资讯话题的热度指标仅在某个时刻高于预设阈值,其他时刻均低于预设阈值,则表明该资讯话题的影响力不大,因而不能将其能确定为热点话题。
可选地,本发明实施例中确定一个热点话题开始的第一预设时间段和热度指标的第一预设阈值,均可以针对不同的应用场景具体设定,本发明实施例对此不作限定。例如,一种实施方式中,同一热点话题,对于不同的资讯来源(即不同的资讯平台),可以设定不同的热度指标阈值和权重,将各个资讯平台的热度指标阈值加权平均,得到热点话题的热度指标阈值;另一种实施方式中,可以对历史多个热点话题的多个热度指标阈值求平均,将均值确定为当前热点话题的热度指标阈值。
S105,将热度指标在第一预设时间段内持续高于第一预设阈值的资讯话题,确定为热点话题,创建热点话题的记录文档,记录热点话题的资讯信息,直到热点话题的热度指标在第二预设时间段内持续低于第二预设阈值,停止记录热点话题的资讯信息。
需要说明的是,由于不同的热点话题,热度变化的持续时间存在较大差异,有的热点话题可能持续一天或几天,有的热点话题可能持续几个月,甚至一年或几年,因而,在构建各个热点话题的时候,确定各个热点话题是否结束的热度指标阈值(即第二预设阈值)也需要设定不同的值,作为一种可选的实施方式,本发明实施例提供的热点构建方法通过如下步骤来确定各个热点话题结束的热度指标阈值:监测每个热点话题的持续时间段;根据每个热点话题的持续时间段,确定每个热点话题对应的第二预设阈值。
由上可知,本发明实施例提供的热点话题的构建方法,通过与不同资讯平台对接,采集来自多个资讯平台的资讯信息,将采集到的资讯信息归类为一个或多个资讯话题,进而实时采集各个资讯话题的热度信息,并根据各个资讯话题的热度信息(包括但不限于每个资讯话题内所有资讯的点击数、点赞数或评论数),计算各个资讯话题的热度指标,监测各个资讯话题的热度指标是否在第一预设时间段内持续高于第一预设阈值,将热度指标在第一预设时间段内持续高于第一预设阈值的资讯话题,确定为热点话题,创建热点话题的记录文档,记录热点话题的资讯信息,直到热点话题的热度指标在第二预设时间段内持续低于第二预设阈值,停止记录热点话题的资讯信息。
通过本发明实施例提供的热点话题的构建方法,对不同资讯平台的资讯信息进行归类,从海量资讯信息中提取热点话题,并记录热点话题的资讯信息,能够提高用户阅读资讯内容的效率,让用户快速了解到其关注的资讯话题的影响力趋势,对于金融市场茶品的投资用户,能够快速从海量的财经新闻资讯中了解其已投资或意向投资的金融市场产品受政策、市场的影响情况。
在构建各个热点话题后,作为一种优选的实施方式,本发明实施例提供的热点话题构建方法还可以包括如下步骤:获取每个热点话题在持续时间段内的热度指标;根据每个热点话题在持续时间段内的热度指标,绘制每个热点话题在持续时间段内的热度曲线。
可选地,在根据每个热点话题在持续时间段内的热度指标,绘制每个热点话题在持续时间段内的热度曲线之后,本发明实施例提供的热点话题构建方法还可以包括如下步骤:在热点话题展示界面上,显示各个热点话题在持续时间段内的热度曲线;接收第一选择指令,其中,第一选择指令用于选择在热点话题展示界面上显示的一个或多个热点话题;在热点话题展示界面上,显示第一选择指令选择的一个或多个热点话题的热度曲线。
由于各个热点话题的热度指标都是随着时间不断变化的,为了让用户直观了解各个热点话题的热度变化趋势,可以根据各个热点话题在持续时间段内的热度指标,绘制各个热点话题在持续时间段内的热度曲线,并输出到热点话题的展示界面上。
可选地,在根据各个金融市场产品的价格数据,绘制各个金融市场产品在每个热点话题的持续时间段内的价格曲线之后,本发明实施例提供的热点话题构建方法还可以包括如下步骤:在热点话题展示界面上,显示各个金融市场产品在热点话题的持续时间段内的价格曲线;接收第二选择指令,其中,第二选择指令用于选择在热点话题展示界面上显示的一个或多个金融市场产品;在热点话题展示界面上,显示第二选择指令选择的一个或多个金融市场产品的价格曲线。
例如,图2为本发明实施例中提供的一种展示热点话题热度曲线的界面示意图,当用户选择“朝韩会面”这个热点话题后,可以在热点话题展示界面上展示该热点话题的热度曲线,点击热度曲线上的任意一点,可以显示该点对应资讯信息。
进一步地,为了便于金融市场产品的投资用户了解其已投资或意向投资的金融市场产品受热点话题资讯影响的价格变化,因而,本发明实施例根据各个金融市场产品的价格数据绘制相应的价格曲线,也输出到热点话题的展示界面上,可以将其与热点话题的热度曲线进行比对,让金融市场产品的投资用户清晰地了解热点话题对金融市场产品价格变化的影响。
因而,在一种可选的实施例中,本发明实施例提供的热点话题构建方法还可以包括如下步骤:采集各个金融市场产品的价格数据;根据各个金融市场产品的价格数据,绘制各个金融市场产品在每个热点话题的持续时间段内的价格曲线。
可选地,在绘制各个金融市场产品在每个热点话题的持续时间段内的价格曲线之后,本发明实施例提供的热点话题构建方法还可以包括如下步骤:在热点话题展示界面上,显示各个金融市场产品在热点话题的持续时间段内的价格曲线;接收第二选择指令,其中,第二选择指令用于选择在热点话题展示界面上显示的一个或多个金融市场产品;在热点话题展示界面上,显示第二选择指令选择的一个或多个金融市场产品的价格曲线。
图3为本发明实施例中提供的一种展示热点话题热度曲线和金融市场产品价格曲线的界面示意图,如图3所示,可以将与某个热点话题(“XX会面”)相关的一个或多个金融市场产品(“黄金”、“原油”、“XX对XX汇率”)的价格曲线显示在该热点话题的展示界面上,让金融市场产品的投资用户快速了解到热点话题影响力趋势,以及热点话题对金融市场产品价格变化的影响情况。当用户选择其关注的一个或多个金融市场产品后,将用户选择的金融市场产品的价格曲线与该热点话题的热度曲线进行对比显示。
可见,本发明实施例通过在界面上显示热点话题(例如,“XX会面”)的热度曲线以及该热点话题所影响的金融市场产品(例如,“黄金”、“原油”、“XX对XX汇率”)的价格曲线,可以让金融市场产品的投资用户快速了解到热点话题影响力趋势,以及热点话题对金融市场产品价格变化的影响情况。可选地,用户可以任意选择界面上展示的热点话题的热度曲线以及金融市场产品的价格曲线。
需要注意的是,本发明实施例提供的热点构建方法,旨在保护一种从海量资讯信息中提取热点话题,并创建热点话题记录文档以记录热点话题相关资讯信息的方法,至于在构建各个热点话题后,对热点话题的展示方式,本发明不作限定,本领域技术技术人员可以根据具体应用场景,采用不同的展示方式(例如,列表展示或图文展示)。
优选地,为了量化热点话题对金融市场产品价格变化的影响,让用户更加直观了解热点话题对其关注的金融市场产品价格波的影响,本发明实施例提供的热点话题构建方法还可以包括如下步骤:根据各个金融市场产品的价格数据,确定每个热点话题对各个金融市场产品价格变化影响的价格波动率;输出每个热点话题对各个金融市场产品价格变化影响的价格波动率。可选地,在热点话题的展示界面上展示热点话题对各个金融市场产品价格变化影响的价格波动率。
具体地,可以通过如下步骤来确定每个热点话题对各个金融市场产品价格变化影响的价格波动率:根据每个热点话题的持续时间段,确定每个热点话题对应的第一时间戳和第二时间戳,其中,第一时间戳为每个热点话题持续时间段的开始时刻或开始时刻之前的一个时刻,第二时间戳为每个热点话题持续时间段的结束时刻或结束时刻之后的一个时刻;根据每个热点话题对应的第一时间戳和金融市场产品产生价格数据的价格时间段,确定金融市场产品在每个热点话题发生之前的第一价格;根据每个热点话题对应的第二时间戳和金融市场产品产生价格数据的价格时间段,确定金融市场产品在每个热点话题发生之后的第二价格;根据第一价格和第二价格,确定每个热点话题对金融市场产品价格变化影响的价格波动率。
其中,在根据每个热点话题对应的第一时间戳和金融市场产品产生价格数据的价格时间段,确定金融市场产品在每个热点话题发生之前的第一价格的时候,可以具体包括如下步骤:判断第一时间戳是否落入金融市场产品产生价格数据的价格时间段内;如果第一时间戳落入金融市场产品产生价格数据的价格时间段内,则将金融市场产品产生价格数据的价格时间段内第一时间戳到每个热点话题持续时间段的开始时刻之间金融市场产品的平均价格或第一时间戳对应金融市场产品的价格,确定为金融市场产品在每个热点话题发生之前的第一价格;如果第一时间戳未落入金融市场产品产生价格数据对应的时间段内,则将第一时间戳之前且与第一时间戳相邻的一个价格时间段结束时刻对应金融市场产品的价格确定为金融市场产品在每个热点话题发生之前的第一价格。
在根据每个热点话题对应的第二时间戳和金融市场产品产生价格数据的价格时间段,确定金融市场产品在每个热点话题发生之后的第二价格的时候,可以具体包括如下步骤:判断第二时间戳是否落入金融市场产品产生价格数据的价格时间段内;如果第二时间戳落入金融市场产品产生价格数据的价格时间段内,则将金融市场产品产生价格数据的价格时间段内每个热点话题持续时间段的结束时刻到第二时间戳之间金融市场产品的平均价格或第二时间戳对应金融市场产品的价格,确定为金融市场产品在每个热点话题发生之后的第二价格;如果第二时间戳未落入金融市场产品产生价格数据对应的时间段内,则将在第二时间戳之后且与第二时间戳相邻的一个价格时间段开始时刻对应金融市场产品的价格确定为金融市场产品在每个热点话题发生之后的第二价格。
本发明实施例中,假设某个热点话题对应的第一时间戳和第二时间戳分别为Δt1和Δt1,下面结合图4~图7来对第一价格和第二价格的确定具体说明:
如图4或图6所示,第一时间戳Δt1落入了金融市场产品产生价格数据的价格时间段(即第一价格时间段t1~t2)内,则将金融市场产品产生价格数据的价格时间段内第一时间戳到每个热点话题持续时间段的开始时刻之间金融市场产品的平均价格或第一时间戳对应金融市场产品的价格,确定为金融市场产品在每个热点话题发生之前的第一价格;如图5或图7所示,第一时间戳Δt1未落入金融市场产品产生价格数据对应的时间段内,则将第一时间戳之前且与第一时间戳相邻的一个价格时间段结束时刻对应金融市场产品的价格确定为金融市场产品在每个热点话题发生之前的第一价格。
如图4或图7所示,第二时间戳Δt2落入金融市场产品产生价格数据的价格时间段(图4中第二时间戳Δt2落入第一价格时间段t1~t2,图7中第二时间戳Δt2落入第二价格时间段t3~t4)内,则将金融市场产品产生价格数据的价格时间段内每个热点话题持续时间段的结束时刻到第二时间戳之间金融市场产品的平均价格或第二时间戳对应金融市场产品的价格,确定为金融市场产品在每个热点话题发生之后的第二价格;如图5或图6所示,第二时间戳Δt2未落入金融市场产品产生价格数据对应的时间段内,则将在第二时间戳之后且与第二时间戳相邻的一个价格时间段开始时刻对应金融市场产品的价格确定为金融市场产品在每个热点话题发生之后的第二价格。
需要注意的是,图5中第一时间戳Δt1和第二时间戳Δt2均未落入金融市场产品产生价格数据的价格时间段内,因而,将第一时间戳之前且与第一时间戳相邻的一个价格时间段结束时刻对应金融市场产品的价格确定为金融市场产品在每个热点话题发生之前的第一价格;且将在第二时间戳之后且与第二时间戳相邻的一个价格时间段开始时刻对应金融市场产品的价格确定为金融市场产品在每个热点话题发生之后的第二价格。
例如,某个热点话题A发生前后,产品a的第一价格和第二价格分别为P1和P2,则该热点话题A对该产品a影响的价格波动率表示为:
其中,ΔP表示热点话题A对该产品a影响的价格波动率。
由于有些热点话题的持续时间段会很长,且热点话题持续时间段内,会发布多条关键资讯(即热点话题的热度指标处于极值点对应的资讯),因而,作为一种优选的实施方式,本发明实施例可以针对热点话题内的各条关键资讯,计算每条关键资讯发生前后对金融市场产品影响的价格波动率,与上述介绍的热点话题对金融市场产品影响的价格波动率的计算方法相同,在计算得到某个热点话题对应的多条关键资讯对应某个金融市场产品的价格波动率后,将这些关键资讯对应该金融市场产品的多个价格波动率的均值,确定为该热点话题对该金融市场产品价格变化影响的价格波动率,并输出到热点话题的展示界面上。
在构建各个热点话题之后,一种可选的实施例中,本发明实施例提供的热点话题的构建方法还可以包括如下步骤:获取每个热点话题内各条资讯的资讯信息;根据每条资讯的资讯信息,生成每条资讯的资讯标题、关键词或关键句;按时间顺序显示每个热点话题内各条资讯的资讯标题、关键词或关键句。
图8为本发明实施例中提供的一种优选的热点话题展示界面示意图,如图8所示,在热点话题展示界面中还可以按照时间轴顺序显示某个热点话题内各条资讯的资讯信息,由于显示空间有限,可以只显示各条资讯的标题和概要内容。需要注意的是,热点话题展示界面上方的热点曲线与界面下方展示的资讯信息是保持一致的,滚动界面下方的时间轴,界面上方的热点曲线随之改变;移动界面上方展示的热度曲线,界面下方的资讯信息也随之改变。
可选地,当用户选择其关注的金融市场产品“XX对XX汇率”后,可以在界面上显示热点话题“XX会面”中资讯事件“XX决定停止X试验与XX试射”和“XXX与XXX首次会晤”对金融市场产品“XX对XX汇率”的价格变化影响的价格波动率分别为1%和2.5%。
可选地,在按时间顺序显示每个热点话题内各条资讯的资讯标题和资讯概要内容之后,本发明实施例提供的热点话题的构建方法还可以包括如下步骤:在检测到选中任意一条资讯的情况下,以弹框的形式显示资讯的概要内容,其中,每条资讯的概要内容是基于自然语言从每条资讯的详情内容中提取的内容。
具体地,在提取每条资讯的概要内容的时候,可以对每条资讯的详情内容进行分词,基于语料库,删除资讯详情内容中的动词、代词、定语、状语等修饰词,仅保留名词,得到第一文本内容,如果第一文本内容的字数超过预设字数(例如,160字数),则仅保留第一文本内容中第一段和最后一段的内容,得到第二文本内容,将第二文本内容作为每条资讯的概要内容。
图9为本发明实施例中提供的一种热点话题资讯展示方式示意图,当用户选中热点话题内某条资讯后,可以弹出一个显示该资讯概要内容的弹框。优选地,选中某条资讯的资讯标题、关键词、关键句或概要内容,可以右键打开查看该资讯的详情内容。
本发明实施例在将构建的热点话题与各个金融市场产品关联后,可以根据用户关注的热点话题,向用户推送一些相关金融市场产品的产品信息,或者根据用户已经投资的金融市场产品,向用户推送一些相关的热点话题资讯。可选地,在推送的产品信息或资讯信息可以加入产品购买链接,以便在用户想要购买某个金融市场产品的同时,能够快速进入相应的购买界面。
在一种可选的实施例中,本发明实施例提供的热点话题的构建方法,在创建各个热点话题的记录文档后,可以将各个热点话题进行归类,生成热点话题的拓扑结构信息,以便用户通过热点话题的拓扑结构信息,查看相应热点话题的资讯信息。例如,图10所示的包含一级热点话题(XX、经济等)、二级热点话题(XX、XX等)、三级热点话题(XX会面等),关于朝韩会面这个热点话题,包含多个热点事件,每个热点事件关联多条资讯。点击每一级的热点话题,会出现其包含的子热点话题,逐级显示,直到显示到热点话题的资讯事件标题。
基于同一发明构思,本发明实施例中还提供了一种热点话题的构建装置,如下面的实施例所述。由于该装置或系统实施例解决问题的原理与热点话题的构建方法相似,因此该装置实施例的实施可以参见方法的实施,重复之处不再赘述。
图11为本发明实施例中提供一种热点话题的构建装置示意图,如图7所示,该装置包括:资讯采集模块111、资讯话题归类模块112、热度指标计算模块113、热度指标监测模块114和热点话题构建模块115。
其中,资讯采集模块111,用于采集多个资讯平台的资讯信息;资讯话题归类模块112,用于将资讯信息归类为一个或多个资讯话题;热度指标计算模块113,用于实时采集每个资讯话题的热度信息,并根据每个资讯话题的热度信息,计算每个资讯话题的热度指标,其中,每个资讯话题的热度信息包含每个资讯话题内所有资讯的点击数、点赞数或评论数;热度指标监测模块114,用于监测每个资讯话题的热度指标是否在第一预设时间段内持续高于第一预设阈值;热点话题构建模块115,用于将热度指标在第一预设时间段内持续高于第一预设阈值的资讯话题,确定为热点话题,创建热点话题的记录文档,记录热点话题的资讯信息,直到热点话题的热度指标在第二预设时间段内持续低于第二预设阈值,停止记录热点话题的资讯信息。
由上可知,本发明实施例提供的热点话题的构建装置,通过与不同资讯平台对接,采集来自多个资讯平台的资讯信息,将采集到的资讯信息归类为一个或多个资讯话题,进而实时采集各个资讯话题的热度信息,并根据各个资讯话题的热度信息(包括但不限于每个资讯话题内所有资讯的点击数、点赞数或评论数),计算各个资讯话题的热度指标,监测各个资讯话题的热度指标是否在第一预设时间段内持续高于第一预设阈值,将热度指标在第一预设时间段内持续高于第一预设阈值的资讯话题,确定为热点话题,创建热点话题的记录文档,记录热点话题的资讯信息,直到热点话题的热度指标在第二预设时间段内持续低于第二预设阈值,停止记录热点话题的资讯信息。
通过本发明实施例提供的热点话题的构建装置,对不同资讯平台的资讯信息进行归类,从海量资讯信息中提取热点话题,并记录热点话题的资讯信息,能够提高用户阅读资讯内容的效率,让用户快速了解到其关注的资讯话题的影响力趋势,对于金融市场茶品的投资用户,能够快速从海量的财经新闻资讯中了解其已投资或意向投资的金融市场产品受政策、市场的影响情况。
在一种可选的实施例中,本发明实施例提供的热点话题的构建装置还可以包括:热点话题监测模块116,用于监测每个热点话题的持续时间段;指标阈值确定模块117,用于根据每个热点话题的持续时间段,确定每个热点话题对应的第二预设阈值。
在一种可选的实施例中,本发明实施例提供的热点话题的构建装置还可以包括:热度指标获取模块118,用于获取每个热点话题在持续时间段内的热度指标;热度曲线绘制模块119,用于根据每个热点话题在持续时间段内的热度指标,绘制每个热点话题在持续时间段内的热度曲线。
可选地,本发明实施例提供的热点话题的构建装置还可以包括:热度曲线显示模块120,用于在热点话题展示界面上,显示各个热点话题在持续时间段内的热度曲线;接收第一选择指令,其中,第一选择指令用于选择在热点话题展示界面上显示的一个或多个热点话题;在热点话题展示界面上,显示第一选择指令选择的一个或多个热点话题的热度曲线。
在一种可选的实施例中,本发明实施例提供的热点话题的构建装置还可以包括:产品价格数据采集模块121,用于采集各个金融市场产品的价格数据;产品价格曲线绘制模块122,用于根据各个金融市场产品的价格数据,绘制各个金融市场产品在每个热点话题的持续时间段内的价格曲线。
可选地,本发明实施例提供的热点话题的构建装置还可以包括:产品价格曲线显示模块123,用于在热点话题展示界面上,显示各个金融市场产品在热点话题的持续时间段内的价格曲线;接收第二选择指令,其中,第二选择指令用于选择在热点话题展示界面上显示的一个或多个金融市场产品;在热点话题展示界面上,显示第二选择指令选择的一个或多个金融市场产品的价格曲线。
在一种可选的实施例中,本发明实施例提供的热点话题的构建装置还可以包括:产品价格波动率监测模块124,用于根据各个金融市场产品的价格数据,确定每个热点话题对各个金融市场产品价格变化影响的价格波动率;以及输出每个热点话题对各个金融市场产品价格变化影响的价格波动率。
可选地,上述产品价格波动率监测模块还用于根据每个热点话题的持续时间段,确定每个热点话题对应的第一时间戳和第二时间戳,根据每个热点话题对应的第一时间戳和金融市场产品产生价格数据的价格时间段,确定金融市场产品在每个热点话题发生之前的第一价格,并根据每个热点话题对应的第二时间戳和金融市场产品产生价格数据的价格时间段,确定金融市场产品在每个热点话题发生之后的第二价格,以及根据第一价格和第二价格,确定每个热点话题对金融市场产品价格变化影响的价格波动率,其中,第一时间戳为每个热点话题持续时间段的开始时刻或开始时刻之前的一个时刻,第二时间戳为每个热点话题持续时间段的结束时刻或结束时刻之后的一个时刻。
进一步地,上述产品价格波动率监测模块还用于判断第一时间戳是否落入金融市场产品产生价格数据的价格时间段内;如果第一时间戳落入金融市场产品产生价格数据的价格时间段内,则将金融市场产品产生价格数据的价格时间段内第一时间戳到每个热点话题持续时间段的开始时刻之间金融市场产品的平均价格或第一时间戳对应金融市场产品的价格,确定为金融市场产品在每个热点话题发生之前的第一价格;如果第一时间戳未落入金融市场产品产生价格数据对应的时间段内,则将第一时间戳之前且与第一时间戳相邻的一个价格时间段结束时刻对应金融市场产品的价格确定为金融市场产品在每个热点话题发生之前的第一价格。
进一步地,上述产品价格波动率监测模块还用于判断第二时间戳是否落入金融市场产品产生价格数据的价格时间段内;如果第二时间戳落入金融市场产品产生价格数据的价格时间段内,则将金融市场产品产生价格数据的价格时间段内每个热点话题持续时间段的结束时刻到第二时间戳之间金融市场产品的平均价格或第二时间戳对应金融市场产品的价格,确定为金融市场产品在每个热点话题发生之后的第二价格;如果第二时间戳未落入金融市场产品产生价格数据对应的时间段内,则将在第二时间戳之后且与第二时间戳相邻的一个价格时间段开始时刻对应金融市场产品的价格确定为金融市场产品在每个热点话题发生之后的第二价格。
在一种可选的实施例中,本发明实施例提供的热点话题的构建装置还可以包括:热点话题资讯显示模块125,用于获取每个热点话题内各条资讯的资讯信息;根据每条资讯的资讯信息,生成每条资讯的资讯标题、关键词或关键句;按时间顺序显示每个热点话题内各条资讯的资讯标题、关键词或关键句。
可选地,热点话题资讯显示模块125还用于在检测到选中任意一条资讯的情况下,以弹框的形式显示资讯的概要内容,其中,每条资讯的概要内容是基于自然语言从每条资讯的详情内容中提取的内容。
本发明实施例还提供了一种计算机设备,用以解决现有资讯平台按照时间顺序展示资讯内容,通过关键词搜索来实现对某个资讯话题的追踪,导致需要阅读的资讯信息量很大,且无法实现对某个资讯话题影响力趋势追踪的技术问题,该计算机设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述热点话题的构建方法。
本发明实施例还提供了一种计算机可读存储介质,用以解决现有资讯平台按照时间顺序展示资讯内容,通过关键词搜索来实现对某个资讯话题的追踪,导致需要阅读的资讯信息量很大,且无法实现对某个资讯话题影响力趋势追踪的技术问题,该计算机可读存储介质存储有执行上述热点话题的构建方法的计算机程序。
综上所述,本发明实施例提供了一种热点话题的构建方法、装置、计算机设备及计算机可读存储介质,通过与多个资讯平台对接,获取来自不同资讯平台的资讯信息,对资讯信息分类,确定一个或多个资讯话题,进而根据每个资讯话题的点击量、点赞量、评论量等计算每个资讯话题的热度指标,如果某个资讯话题的热度指标在一段时间内持续高于某个阈值,则将该资讯话题确定为热点话题,创建热点话题的记录文档,记录该话题所有资讯信息,如果该热点话题的热度指标在某个时间段内持续低于某个阈值,则结束该热点话题,也即不再记录该热点话题的资讯信息了。
需要注意的是,本发明实施例在确定是否结束一个话题的时候,结束时间段时间的选择可以根据该话题持续时间确定,例如,有的话题在很长一段时间才会结束,则结束时间的选择也需要增长;如果有的话题在较短一段时间才结束,则结束时间的选择也会变短。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (13)

1.一种热点话题的构建方法,其特征在于,包括:
采集多个资讯平台的资讯信息;
将所述资讯信息归类为一个或多个资讯话题;
实时采集每个资讯话题的热度信息,并根据每个资讯话题的热度信息,计算每个资讯话题的热度指标,其中,每个资讯话题的热度信息包含每个资讯话题内所有资讯的点击数、点赞数或评论数;
监测每个资讯话题的热度指标是否在第一预设时间段内持续高于第一预设阈值;
将热度指标在第一预设时间段内持续高于第一预设阈值的资讯话题,确定为热点话题,创建热点话题的记录文档,记录热点话题的资讯信息,直到热点话题的热度指标在第二预设时间段内持续低于第二预设阈值,停止记录热点话题的资讯信息;
采集多个资讯平台的资讯信息,包括:通过统一的资讯接口,与各个资讯平台进行对接,以采集各个资讯平台上发布的资讯信息;
所述方法还包括:
采集各个金融市场产品的价格数据;
根据各个金融市场产品的价格数据,绘制各个金融市场产品在每个热点话题的持续时间段内的价格曲线;
所述方法还包括:
在检测到选中任意一条资讯的情况下,以弹框的形式显示资讯的概要内容,其中,每条资讯的概要内容是基于自然语言从每条资讯的详情内容中提取的内容;
其中,在提取每条资讯的概要内容的时候,对每条资讯的详情内容进行分词,基于语料库,删除资讯详情内容中的修饰词,仅保留名词,得到第一文本内容,如果第一文本内容的字数超过预设字数,则仅保留第一文本内容中第一段和最后一段的内容,得到第二文本内容,将第二文本内容作为每条资讯的概要内容;
第一预设阈值为采用下述过程确定:同一热点话题,对于不同的资讯来源,设定不同的热度指标阈值和权重,将各个资讯平台的热度指标阈值加权平均,得到热点话题的热度指标阈值;或者,对历史多个热点话题的多个热度指标阈值求平均,将均值确定为当前热点话题的热度指标阈值。
2.如权利要求1所述的方法,其特征在于,所述方法还包括:
监测每个热点话题的持续时间段;
根据每个热点话题的持续时间段,确定每个热点话题对应的第二预设阈值。
3.如权利要求2所述的方法,其特征在于,所述方法还包括:
获取每个热点话题在所述持续时间段内的热度指标;
根据每个热点话题在所述持续时间段内的热度指标,绘制每个热点话题在所述持续时间段内的热度曲线。
4.如权利要求3所述的方法,其特征在于,在根据每个热点话题在所述持续时间段内的热度指标,绘制每个热点话题在所述持续时间段内的热度曲线之后,所述方法还包括:
在热点话题展示界面上,显示各个热点话题在所述持续时间段内的热度曲线;
接收第一选择指令,其中,所述第一选择指令用于选择在热点话题展示界面上显示的一个或多个热点话题;
在所述热点话题展示界面上,显示所述第一选择指令选择的一个或多个热点话题的热度曲线。
5.如权利要求1所述的方法,其特征在于,在根据各个金融市场产品的价格数据,绘制各个金融市场产品在每个热点话题的持续时间段内的价格曲线之后,所述方法还包括:
在热点话题展示界面上,显示各个金融市场产品在所述热点话题的持续时间段内的价格曲线;
接收第二选择指令,其中,所述第二选择指令用于选择在所述热点话题展示界面上显示的一个或多个金融市场产品;
在所述热点话题展示界面上,显示所述第二选择指令选择的一个或多个金融市场产品的价格曲线。
6.如权利要求1所述的方法,其特征在于,所述方法还包括:
根据各个金融市场产品的价格数据,确定每个热点话题对各个金融市场产品价格变化影响的价格波动率;
输出每个热点话题对各个金融市场产品价格变化影响的价格波动率。
7.如权利要求6所述的方法,其特征在于,根据各个金融市场产品的价格数据,确定每个热点话题对各个金融市场产品价格变化影响的价格波动率,包括:
根据每个热点话题的持续时间段,确定每个热点话题对应的第一时间戳和第二时间戳,其中,所述第一时间戳为每个热点话题持续时间段的开始时刻或开始时刻之前的一个时刻,所述第二时间戳为每个热点话题持续时间段的结束时刻或结束时刻之后的一个时刻;
根据每个热点话题对应的第一时间戳和所述金融市场产品产生价格数据的价格时间段,确定所述金融市场产品在每个热点话题发生之前的第一价格;
根据每个热点话题对应的第二时间戳和所述金融市场产品产生价格数据的价格时间段,确定所述金融市场产品在每个热点话题发生之后的第二价格;
根据所述第一价格和所述第二价格,确定每个热点话题对所述金融市场产品价格变化影响的价格波动率。
8.如权利要求7所述的方法,其特征在于,根据每个热点话题对应的第一时间戳和所述金融市场产品产生价格数据的价格时间段,确定所述金融市场产品在每个热点话题发生之前的第一价格,包括:
判断第一时间戳是否落入所述金融市场产品产生价格数据的价格时间段内;
如果所述第一时间戳落入所述金融市场产品产生价格数据的价格时间段内,则将所述金融市场产品产生价格数据的价格时间段内所述第一时间戳到每个热点话题持续时间段的开始时刻之间金融市场产品的平均价格或所述第一时间戳对应金融市场产品的价格,确定为所述金融市场产品在每个热点话题发生之前的第一价格;
如果所述第一时间戳未落入所述金融市场产品产生价格数据对应的时间段内,则将所述第一时间戳之前且与所述第一时间戳相邻的一个价格时间段结束时刻对应金融市场产品的价格确定为所述金融市场产品在每个热点话题发生之前的第一价格。
9.如权利要求7所述的方法,其特征在于,根据每个热点话题对应的第二时间戳和所述金融市场产品产生价格数据的价格时间段,确定所述金融市场产品在每个热点话题发生之后的第二价格,包括:
判断第二时间戳是否落入所述金融市场产品产生价格数据的价格时间段内;
如果所述第二时间戳落入所述金融市场产品产生价格数据的价格时间段内,则将所述金融市场产品产生价格数据的价格时间段内每个热点话题持续时间段的结束时刻到所述第二时间戳之间金融市场产品的平均价格或所述第二时间戳对应金融市场产品的价格,确定为所述金融市场产品在每个热点话题发生之后的第二价格;
如果所述第二时间戳未落入所述金融市场产品产生价格数据对应的时间段内,则将在所述第二时间戳之后且与所述第二时间戳相邻的一个价格时间段开始时刻对应金融市场产品的价格确定为所述金融市场产品在每个热点话题发生之后的第二价格。
10.如权利要求1所述的方法,其特征在于,所述方法还包括:
获取每个热点话题内各条资讯的资讯信息;
根据每条资讯的资讯信息,生成每条资讯的资讯标题、关键词或关键句;
按时间顺序显示每个热点话题内各条资讯的资讯标题、关键词或关键句。
11.一种热点话题的构建装置,其特征在于,包括:
资讯采集模块,用于采集多个资讯平台的资讯信息;
资讯话题归类模块,用于将所述资讯信息归类为一个或多个资讯话题;
热度指标计算模块,用于实时采集每个资讯话题的热度信息,并根据每个资讯话题的热度信息,计算每个资讯话题的热度指标,其中,每个资讯话题的热度信息包含每个资讯话题内所有资讯的点击数、点赞数或评论数;
热度指标监测模块,用于监测每个资讯话题的热度指标是否在第一预设时间段内持续高于第一预设阈值;
热点话题构建模块,用于将热度指标在第一预设时间段内持续高于第一预设阈值的资讯话题,确定为热点话题,创建热点话题的记录文档,记录热点话题的资讯信息,直到热点话题的热度指标在第二预设时间段内持续低于第二预设阈值,停止记录热点话题的资讯信息;
采集多个资讯平台的资讯信息,包括:通过统一的资讯接口,与各个资讯平台进行对接,以采集各个资讯平台上发布的资讯信息;
还包括:产品价格数据采集模块,用于采集各个金融市场产品的价格数据;产品价格曲线绘制模块,用于根据各个金融市场产品的价格数据,绘制各个金融市场产品在每个热点话题的持续时间段内的价格曲线;
还包括:热点话题资讯显示模块,用于在检测到选中任意一条资讯的情况下,以弹框的形式显示资讯的概要内容,其中,每条资讯的概要内容是基于自然语言从每条资讯的详情内容中提取的内容;
其中,在提取每条资讯的概要内容的时候,对每条资讯的详情内容进行分词,基于语料库,删除资讯详情内容中的修饰词,仅保留名词,得到第一文本内容,如果第一文本内容的字数超过预设字数,则仅保留第一文本内容中第一段和最后一段的内容,得到第二文本内容,将第二文本内容作为每条资讯的概要内容;
第一预设阈值为采用下述过程确定:同一热点话题,对于不同的资讯来源,设定不同的热度指标阈值和权重,将各个资讯平台的热度指标阈值加权平均,得到热点话题的热度指标阈值;或者,对历史多个热点话题的多个热度指标阈值求平均,将均值确定为当前热点话题的热度指标阈值。
12.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至10任一项所述热点话题的构建方法。
13.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有执行权利要求1至10任一项所述热点话题的构建方法的计算机程序。
CN201911233103.1A 2019-12-05 2019-12-05 热点话题的构建方法及装置 Active CN111046281B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911233103.1A CN111046281B (zh) 2019-12-05 2019-12-05 热点话题的构建方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911233103.1A CN111046281B (zh) 2019-12-05 2019-12-05 热点话题的构建方法及装置

Publications (2)

Publication Number Publication Date
CN111046281A CN111046281A (zh) 2020-04-21
CN111046281B true CN111046281B (zh) 2024-04-19

Family

ID=70234911

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911233103.1A Active CN111046281B (zh) 2019-12-05 2019-12-05 热点话题的构建方法及装置

Country Status (1)

Country Link
CN (1) CN111046281B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111580921B (zh) * 2020-05-15 2021-10-22 北京字节跳动网络技术有限公司 内容创作方法及设备
CN113656695A (zh) * 2021-08-18 2021-11-16 北京奇艺世纪科技有限公司 热点数据生成方法、装置及数据处理方法、电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106970985A (zh) * 2017-03-29 2017-07-21 百度在线网络技术(北京)有限公司 基于需求引导的信息流频道分类交互方法、装置和服务器
CN110245298A (zh) * 2019-06-18 2019-09-17 北京百度网讯科技有限公司 用于推送信息的方法和装置
CN110517149A (zh) * 2019-08-29 2019-11-29 中国银行股份有限公司 向用户推送金融市场加工信息的方法及装置
CN110517150A (zh) * 2019-08-29 2019-11-29 中国银行股份有限公司 金融市场产品交易报告的生成方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8239397B2 (en) * 2009-01-27 2012-08-07 Palo Alto Research Center Incorporated System and method for managing user attention by detecting hot and cold topics in social indexes

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106970985A (zh) * 2017-03-29 2017-07-21 百度在线网络技术(北京)有限公司 基于需求引导的信息流频道分类交互方法、装置和服务器
CN110245298A (zh) * 2019-06-18 2019-09-17 北京百度网讯科技有限公司 用于推送信息的方法和装置
CN110517149A (zh) * 2019-08-29 2019-11-29 中国银行股份有限公司 向用户推送金融市场加工信息的方法及装置
CN110517150A (zh) * 2019-08-29 2019-11-29 中国银行股份有限公司 金融市场产品交易报告的生成方法及装置

Also Published As

Publication number Publication date
CN111046281A (zh) 2020-04-21

Similar Documents

Publication Publication Date Title
CN111026965B (zh) 基于知识图谱的热点话题追溯方法及装置
Tu et al. Indices of novelty for emerging topic detection
US8630972B2 (en) Providing context for web articles
JP5885875B1 (ja) データ分析システム、データ分析方法、プログラム、および、記録媒体
Gao et al. Paid: Prioritizing app issues for developers by tracking user reviews over versions
US10002371B1 (en) System, method, and computer program product for searching summaries of online reviews of products
WO2009096523A1 (ja) 情報分析装置、検索システム、情報分析方法及び情報分析用プログラム
CN110705288A (zh) 一种基于大数据的舆情分析系统
CN101645066B (zh) 一种互联网新颖词监测方法
CN111046281B (zh) 热点话题的构建方法及装置
JP2011198364A (ja) 媒体文書へのラベル添加方法及び該方法を用いるシステム
JP2011022705A (ja) 証跡管理方法、システム、及びプログラム
JP5895052B2 (ja) 情報分析システム及び情報分析方法
TWI571756B (zh) 用以分析瀏覽記錄及其文件之方法及其系統
CN111159566A (zh) 金融市场产品的资讯推送方法及装置
KR20090000284A (ko) 관심주제에 대한 동향 및 성향 분석시스템
CN111611464A (zh) 一种基于大数据的舆情监测平台
KR20140047226A (ko) 이슈 일지를 제공하는 단말기, 이슈 일지를 생성하는 서버 및 이슈 일지 제공 및 생성 방법
CN110929198B (zh) 热点事件展示方法及装置
Guo et al. An opinion feature extraction approach based on a multidimensional sentence analysis model
Ceroni et al. Justevents: A crowdsourced corpus for event validation with strict temporal constraints
JP2008204355A (ja) 辞書作成方法
Yanti et al. Application of named entity recognition via Twitter on SpaCy in Indonesian (case study: Power failure in the Special Region of Yogyakarta)
CN105809488B (zh) 一种信息处理方法及电子设备
Hogenboom et al. Mining economic sentiment using argumentation structures

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant