CN112487808A - 基于大数据的新闻消息推送方法、装置、设备及存储介质 - Google Patents
基于大数据的新闻消息推送方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN112487808A CN112487808A CN202011473050.3A CN202011473050A CN112487808A CN 112487808 A CN112487808 A CN 112487808A CN 202011473050 A CN202011473050 A CN 202011473050A CN 112487808 A CN112487808 A CN 112487808A
- Authority
- CN
- China
- Prior art keywords
- news
- stock
- pushed
- impact
- event type
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 230000011218 segmentation Effects 0.000 claims description 28
- 238000004364 calculation method Methods 0.000 claims description 11
- 238000007405 data analysis Methods 0.000 abstract description 2
- 238000004458 analytical method Methods 0.000 description 10
- 230000008859 change Effects 0.000 description 9
- 230000008569 process Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明公开了一种基于大数据的新闻消息推送方法、装置、设备及存储介质,涉及数据分析技术领域,该方法包括:获取待推送新闻消息,并确定待推送新闻消息对应的事件类型;根据事件类型从预设股票样本数据库中查找对应的股票冲击样本;根据股票冲击样本的收益参数确定事件类型对应的冲击结果;根据冲击结果和待推送新闻消息生成待推送消息,并将待推送消息发送至目标客户端。本发明在为用户推送实时的新闻消息时,还提供了相同事件类型的新闻消息在历史时间上对股价的冲击结果,使用户获得更明确的投资交易信号以及预警信号,辅助用户指定投资交易策略,提高了用户的体验。
Description
技术领域
本发明涉及数据分析技术领域,尤其涉及一种基于大数据的新闻消息推送方法、装置、设备及存储介质。
背景技术
在股票市场中,股价对市场信息极为敏感。通常,在上市公司发生一些事件(高层人员变动、合作状态等)时,其股价也会产生变化。为了使用户能够及时了解市场的变化情况,多数的数据供应商会为用户推送相关事件的新闻舆情信息。然而,对于用户而言,很难从新闻舆情信息预期到市场股价的变化情况。因此,如何为用户提供更为全面的信息,使用户更准确的掌握市场股价变化,是亟待解决的技术问题。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供一种基于大数据的新闻消息推送方法、装置、设备及存储介质,旨在解决现有技术中向用户提供的信息不全面的技术问题。
为实现上述目的,本发明提供一种基于大数据的新闻消息推送方法,基于大数据的新闻消息推送方法包括以下步骤:
获取待推送新闻消息,并确定待推送新闻消息对应的事件类型;
根据事件类型从预设股票样本数据库中查找对应的股票冲击样本;
根据股票冲击样本的收益参数确定事件类型对应的冲击结果;
根据冲击结果和待推送新闻消息生成待推送消息,并将待推送消息发送至目标客户端。
可选的,根据事件类型从预设股票样本数据库中查找对应的股票冲击样本,之前,还包括:
获取预设时间段内的新闻消息,并根据预设事件类型对新闻消息进行分类,获得分类结果;
获取新闻消息对应的股票冲击样本;
根据股票冲击样本和分类结果建立预设股票样本数据库。
可选的,根据股票冲击样本和分类结果建立预设股票样本数据库,包括:
根据分类结果确定新闻消息与预设事件类型之间的匹配度;
根据匹配度确定股票冲击样本对应的分类等级;
根据分类等级建立股票冲击样本与预设事件类型之间的关联关系,以建立预设股票样本数据库。
可选的,根据股票冲击样本的收益参数确定事件类型对应的冲击结果,包括:
根据分类等级确定股票冲击样本对应的权重值;
获取股票冲击样本在预设时间段内的收益参数;
根据收益参数及权重值确定事件类型对应的冲击参数;
根据第一预设条件确定冲击参数对应的冲击结果。
可选的,获取待推送新闻消息,并确定待推送新闻消息对应的事件类型,包括:
获取待推送新闻消息,并对待推送新闻消息进行分词处理,获得分词词段;
将分词词段与预设事件类型标签进行匹配,获得匹配结果;
根据匹配结果确定待推送新闻消息对应的事件类型。
可选的,将分词词段与预设事件类型标签进行匹配,获得匹配结果,包括:
获取分词词语与预设事件类型标签之间的词义相似度;
将词义相似度与预设相似度阈值进行比对,获得比对结果;
根据比对结果确定分词词段与预设事件类型标签之间的匹配结果。
可选的,获取待推送新闻消息,并确定待推送新闻消息对应的事件类型之前,还包括:
获取用户持有股票的股票信息,并根据股票信息生成搜索关键词;
根据搜索关键词从预设新闻消息库中查找对应的待选新闻消息;
获取待选新闻信息的时间信息;
根据第二预设条件和时间信息从待选新闻消息中确定目标新闻信息,并将目标新闻消息作为待推送新闻消息。
此外,为实现上述目的,本发明还提出一种基于大数据的新闻消息推送装置,装置包括:
分类模块,用于获取待推送新闻消息,并确定待推送新闻消息对应的事件类型;
查找模块,用于根据事件类型从预设股票样本数据库中查找对应的股票冲击样本;
冲击计算模块,用于根据股票冲击样本的收益参数确定事件类型对应的冲击结果;
推送模块,用于根据冲击结果和待推送新闻消息生成待推送消息,并将待推送消息发送至目标客户端。
此外,为实现上述目的,本发明还提出一种基于大数据的新闻消息推送设备,基于大数据的新闻消息推送设备包括:存储器、处理器及存储在存储器上并可在处理器上运行的基于大数据的新闻消息推送程序,基于大数据的新闻消息推送程序被处理器执行时实现如上文的基于大数据的新闻消息推送方法的步骤。
此外,为实现上述目的,本发明还提出一种存储介质,存储介质上存储有基于大数据的新闻消息推送程序,基于大数据的新闻消息推送程序被处理器执行时实现如上文的基于大数据的新闻消息推送方法的步骤。
在本发明中,先获取待推送新闻消息,并确定待推送新闻消息对应的事件类型;根据事件类型从预设股票样本数据库中查找对应的股票冲击样本;根据股票冲击样本的收益参数确定事件类型对应的冲击结果;根据冲击结果和待推送新闻消息生成待推送消息,并将待推送消息发送至目标客户端。本发明在为用户推送实时的新闻消息时,还提供了相同事件类型的新闻消息在历史时间上对股价的冲击结果,使用户获得更明确的投资交易信号以及预警信号,辅助用户指定投资交易策略,提高了用户的体验。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的基于大数据的新闻消息推送设备的结构示意图;
图2为本发明基于大数据的新闻消息推送方法第一实施例的流程示意图;
图3为本发明基于大数据的新闻消息推送方法第二实施例的流程示意图;
图4为本发明基于大数据的新闻消息推送方法第三实施例的流程示意图;
图5为本发明基于大数据的新闻消息推送装置第一实施例的结构框图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
参照图1,图1为本发明实施例方案涉及的硬件运行环境的基于大数据的新闻消息推送设备结构示意图。
如图1所示,该基于大数据的新闻消息推送设备可以包括:处理器1001,例如中央处理器(Central Processing Unit,CPU),通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display),可选用户接口1003还可以包括标准的有线接口、无线接口,对于用户接口1003的有线接口在本发明中可为USB接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真(WIreless-FIdelity,WI-FI)接口)。存储器1005可以是高速的随机存取存储器(Random Access Memory,RAM)存储器,也可以是稳定的存储器(Non-volatile Memory,NVM),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的结构并不构成对基于大数据的新闻消息推送设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,认定为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及基于大数据的新闻消息推送程序。
在图1所示的基于大数据的新闻消息推送设备中,网络接口1004主要用于连接后台服务器,与所述后台服务器进行数据通信;用户接口1003主要用于连接用户设备;所述基于大数据的新闻消息推送设备通过处理器1001调用存储器1005中存储的基于大数据的新闻消息推送程序,并执行本发明实施例提供的基于大数据的新闻消息推送方法。
基于上述硬件结构,提出本发明基于大数据的新闻消息推送方法的实施例。
参照图2,图2为本发明基于大数据的新闻消息推送方法第一实施例的流程示意图,提出本发明基于大数据的新闻消息推送方法第一实施例。
在第一实施例中,所述基于大数据的新闻消息推送方法包括以下步骤:
步骤S10:获取待推送新闻消息,并确定待推送新闻消息对应的事件类型。
应理解的是,本实施例的执行主体是为上述基于大数据的新闻消息推送设备,该基于大数据的新闻消息推送设备具有数据处理、数据通信及程序运行等功能,基于大数据的新闻消息推送设备可以为平板、电脑或服务器等计算机设备,当然,还可为其他具有相似功能的设备,本实施方式对此不加以限制。
可以理解的是,待推送新闻消息为需要向用户提供的新闻消息。通常,用户对于自身所持股票的相关信息具有较高的关注度,需要及时了解相关的新闻消息。在本实施方式中,基于大数据的新闻消息推送设备可先根据用户持有的股票对应的上市公司或者行业,确定需要为用户推送的信息消息,作为待推送新闻消息。
需要说明的是,事件类型主要用于描述待推送新闻消息的主体信息类别,用于于对新闻消息的分类。其中,事件类型可包括高层人员变动、合作关系变动、营收上升、营收下降等。在具体实现时,基于大数据的新闻消息推送设备可对待推送新闻消息进行文本分析,获取待推送新闻消息的大概内容,从而将待推送新闻消息归类至预设的事件类型下。
步骤S20:根据事件类型从预设股票样本数据库中查找对应的股票冲击样本。
需要说明的是,股票冲击样本是指因各事件类型的新闻信息而在历史时间内发生股价波动的股票样本。例如,在过去一个月内,存在一事件类型为“高层人员变动”的新闻信息,该新闻信息相关联的股票A在该事件发生时间点前后一段时间内发生了股价变化,该股票A可认为股票冲击样本。
需要说明的是,为了使对待推送新闻消息的分析具有更高的可信度,本实施方式预先建立了预设股票样本数据库。预设股票样本数据库中对各种预预设的事件类型匹配了不同的股票冲击样本。基于大数据的新闻消息推送设备在需要对待推送新闻消息进行分析时,可根据待推送新闻消息对应的事件类型,从预设股票样本数据库提取相应的股票冲击样本,作为分析样本。
步骤S30:根据股票冲击样本的收益参数确定事件类型对应的冲击结果。
需要说明的是,收益参数可以为股票冲击样本在过去的交易价格信息等。例如收,益参数可以为股票冲击样本在预设时间段内的超额收益率。其中,预设时间段内可以为该股票冲击样本对应的新闻消息发生时间点的前后一天、一周或者一个月。收益参数可在股票冲击样本存入股票样本数据库之前计算,并随股票冲击样本同时存储至股票样本数据库中,以便于后续直接读取各股票冲击样本的收益参数。
需要说明的是,冲击结果是指事件类型对股价的影响倾向,本实施方式可分为正向冲击或负向冲击。其中,正向冲击是指该事件类型通常能带来股价上升,负向冲击则相反。
在具体实现时,可根据预设统计公式对各股票冲击样本的收益参数进行计算,获得统计结果;根据预设分级调节对统计结果进行分类,获得冲击结果。其中,统计公式可以为均值计算公式、方差计算公式或分位数计算公式。
具体地,以方差计算公式为例,其计算方式如下:
其中,s为收益参数,x1、x2、xn为各股票冲击样本对应的收益参数,m为各股票冲击样本对应的超额收益率的平均值,n各股票冲击样本的数量。当前,冲击结果的计算方式还可以采用其他方式,本实施方式对此不加以限制。
步骤S40:根据冲击结果和待推送新闻消息生成待推送消息,并将待推送消息发送至目标客户端。
需要说明的是,待推送消息可以为冲击结果和待推送新闻消息组合后的消息,当然,还可以包括各股票冲击样本的收益参数。此外,还可以根据待推送新闻消息确定对应的股票,将该股票发送至客户端,若冲击结果为正向冲击,则将该股票作为推荐交易股票;若冲击结果为负向冲击,则将该股票作为推荐预警股票。
在第一实施例中,先获取待推送新闻消息,并确定待推送新闻消息对应的事件类型;根据事件类型从预设股票样本数据库中查找对应的股票冲击样本;根据股票冲击样本的收益参数确定事件类型对应的冲击结果;根据冲击结果和待推送新闻消息生成待推送消息,并将待推送消息发送至目标客户端。本实施例在为用户推送实时的新闻消息时,还提供了相同事件类型的新闻消息在历史时间上对股价的冲击结果,使用户获得更明确的投资交易信号以及预警信号,辅助用户指定投资交易策略,提高了用户的体验。
参照图3,图3为本发明基于大数据的新闻消息推送方法第二实施例的流程示意图,基于第一实施例,提出本发明基于大数据的新闻消息推送方法的第二实施例。
在第二实施例中,所述步骤S20之前,还包括:
步骤S110:获取预设时间段内的新闻消息,并根据预设事件类型对新闻消息进行分类,获得分类结果。
需要说明的是,为了使历史样本数据更全面,预设时间段可以为一年、两年等。基于大数据的新闻消息推送设备可通过爬虫等技术,从各大网站获取一年或两年的内的新闻消息。为了提高获取效果,相关网站可设置为规模较大的财经网站。
应理解的是,对新闻消息进行分类的过程可以采用如第一实施例中确定待推送新闻信息的事件类似的方式。其具体实现方式可参照本发明其他实施例,在次不在赘述。
步骤S111:获取新闻消息对应的股票冲击样本。
可以理解的是,对于财经类新闻消息,其涉及到的主体大多为上市公司或股东等。因此,为了获取各事件类型对应的股票冲击样本,可根据新闻消息涉及的主体确定对应的股票冲击样本。例如,若主体为上市公司的名称,则可根据该名称对股票数据库进行查找,从而获得对应的股票冲击样本。
步骤S112:根据股票冲击样本和分类结果建立预设股票样本数据库。
可以理解的是,由于新闻消息同时对应有事件类型及股票冲击样本,故可根据该对应关系建立各股票冲击样本与各事件类型之间的关联关系,从而建立预设股票样本数据库。
为了进一步提高预设股票样本数据库中数据的可参考性,本实施方式还对各股票冲击样本与各事件类型之间的关联关系进行分级。再具体实现时,根据分类结果确定新闻消息与预设事件类型之间的匹配度;根据匹配度确定股票冲击样本对应的分类等级;根据分类等级建立股票冲击样本与预设事件类型之间的关联关系,以建立预设股票样本数据库。
需要说明的是,对新闻消息的分类结果可以包含该新闻信息与被归类事件类型之间的匹配度。例如,若采用语义分析模型对新闻消息进行分类,语义分析模型在输出该新闻消息所对应的事件类型时,还可以输出结果的可信度,该可信度即可作为新闻消息与预设事件类型之间的匹配度。
可以理解的是,新闻消息与预设事件类型之间的匹配度可作为新闻消息对应的股票冲击样本与预设事件类型之间的匹配度。故,可根据各股票冲击样本对应的新闻消息与事件类型的匹配程度对各股票冲击样本进行分级,如一级样本、二级样本等。其中,匹配程度可根据各新闻消息与事件类型的匹配成功次数进行确定,例如,若新闻消息中的词段与事件类型的标签之间的可信度超过80%,则为将该新闻消息对应的股票冲击样本作为一级标签;若大于60%而小于80%,则为二级样本。
此外,为进一步提高对事件类型分析结果的可参考性,在本实施方式,步骤S30还可以为:根据分类等级确定股票冲击样本对应的权重值;获取股票冲击样本在预设时间段内的收益参数;根据收益参数及权重值确定事件类型对应的冲击参数;根据第一预设条件确定冲击参数对应的冲击结果。
计算公式如下:
其中,s为收益参数,a、b、c为权重值,根据不同的样本等级,权重值可设置不同数值。如,一级样本对应权重值a,其数值可为1.2,二级样本对应权重值b,其数值可为1,三级样本对应权重值c,其数值可为0.8。
需要说明的是,冲击结果是指事件类型对股价的影响倾向,可分为正向冲击或负向冲击。在本实施方式中,根据收益参数的值确定冲击参数对应的冲击结果,如若收益参数为正数,则为正向冲击,若为负数,则为负向冲击。
在第二实施例中,根据历史新闻信息及历史股票数据建立预设股票样本数据库,同时,对预设股票样本数据库中的各股票冲击样本与各事件类型之间的关联程度进行分级。本实施例中的预设股票样本数据库可为后续对待推送新闻消息的分析提供可靠的参考数据,从而提高推送结果的可信度。
参照图4,图4为本发明基于大数据的新闻消息推送方法第三实施例的流程示意图,基于第一实施例和第二实施例,提出本发明基于大数据的新闻消息推送方法的第三实施例。本实施以第一实施例为基础进行说明。
在第三实施例中,所述步骤S10之后,还包括:
步骤S101:获取待推送新闻消息,并对待推送新闻消息进行分词处理,获得分词词段。
需要说明的是,为提高对待推送新闻消息分类结果的准确性,本实施方式基于分词对待推送新闻消息进行分类。分词处理是指对待推送新闻消息中的文本进行切分,获得多个分词词段。
在具体实现时,可根据预先建立分词库对待推送新闻消息中的文本进行提取。分词库中保存有对于分类有帮助的词语,如,“辞职”、“上任”“利润”等。当然,分词处理还可以采用其他方案,本实施方式对此不加以限制。
步骤S102:将分词词段与预设事件类型标签进行匹配,获得匹配结果。
为便于分类,本实施方式为每个事件类型分配有对应的标签,例如,对于事件类型“高层人员变动”可配置标签“董事长离职”、“总经理上任”等。
在具体实现时,匹配过程可以为:获取分词词语与预设事件类型标签之间的词义相似度;将词义相似度与预设相似度阈值进行比对,获得比对结果;根据比对结果确定分词词段与预设事件类型标签之间的匹配结果。
需要说明的是,根据语义分析法(method of semantic differential)可对分词词段所包含的语义进行分析,并根据分析结果确定分词词语与预设事件类型标签之间的词义相似度。其中,分析结果可包括分词词段对于语义的概率,该概率可作为词义相似度。预设相似度阈值可以设置为85%,若词义相似度大于85%,则该分词词语对应的标签则为待推送新闻消息对应的标签。
步骤S103:根据匹配结果确定待推送新闻消息对应的事件类型。
可以理解的是,确定待推送新闻消息对应的标签后,即可确定待推送新闻消息对应的事件类型。例如,若待推送新闻消息对应的标签为“董事长离职”,则待推送新闻消息对应的事件类型为“高层人员变动”。
在本实施例中,为了提高待推送新闻消息的可参考性,步骤S10之前,还包括:获取用户持有股票的股票信息,并根据股票信息生成搜索关键词;根据搜索关键词从预设新闻消息库中查找对应的待选新闻消息;获取待选新闻信息的时间信息;根据第二预设条件和时间信息从待选新闻消息中确定目标新闻信息,并将目标新闻消息作为待推送新闻消息。
需要说明的是,股票信息可以为股票对应的上市公司的名称,根据上市公司的名称生成搜索关键词。预设新闻消息库中包含了在各新闻网站中提取的新闻消息。为了避免信息的落后,对于同一公司的相关新闻信息仅推送最新新闻消息。例如,若查找到对应的待选新闻消息有多条,则计算待选新闻消息的时间信息与当前的时间之间的时间差,将时间差最小的新闻消息中作为目标新闻信息。
在第三实施例中,获取待推送新闻消息,并对待推送新闻消息进行分词处理,获得分词词段;将分词词段与预设事件类型标签进行匹配,获得匹配结果根据匹配结果确定待推送新闻消息对应的事件类型。本实施基于自然语言处理(NLP)对待推送新闻消息进行分类,保证事件类型归类的准确性,从而提高推送信息的可参考性。
此外,本发明实施例还提出一种基于大数据的新闻消息推送装置。参照图5,图5为本发明基于大数据的新闻消息推送装置第一实施例的结构框图。
在本实施例中,基于大数据的新闻消息推送装置包括:
分类模块10,用于获取待推送新闻消息,并确定待推送新闻消息对应的事件类型;
查找模块20,用于根据事件类型从预设股票样本数据库中查找对应的股票冲击样本;
冲击计算模块30,用于根据股票冲击样本的收益参数确定事件类型对应的冲击结果;
推送模块40,用于根据冲击结果和待推送新闻消息生成待推送消息,并将待推送消息发送至目标客户端。
在本实施例中,基于大数据的新闻消息推送装置先获取待推送新闻消息,并确定待推送新闻消息对应的事件类型;根据事件类型从预设股票样本数据库中查找对应的股票冲击样本;根据股票冲击样本的收益参数确定事件类型对应的冲击结果;根据冲击结果和待推送新闻消息生成待推送消息,并将待推送消息发送至目标客户端。本实施例在为用户推送实时的新闻消息时,还提供了相同事件类型的新闻消息在历史时间上对股价的冲击结果,使用户获得更明确的投资交易信号以及预警信号,辅助用户指定投资交易策略,提高了用户的体验。
在一实施例中,基于大数据的新闻消息推送装置还包括数据库创建模块;数据库创建模块,用于获取预设时间段内的新闻消息,并根据预设事件类型对新闻消息进行分类,获得分类结果;获取新闻消息对应的股票冲击样本;根据股票冲击样本和分类结果建立预设股票样本数据库。
在一实施例中,数据库创建模块,还用于根据分类结果确定新闻消息与预设事件类型之间的匹配度;根据匹配度确定股票冲击样本对应的分类等级;根据分类等级建立股票冲击样本与预设事件类型之间的关联关系,以建立预设股票样本数据库。
在一实施例中,冲击计算模块30,还用于根据分类等级确定股票冲击样本对应的权重值;获取股票冲击样本在预设时间段内的收益参数;根据收益参数及权重值确定事件类型对应的冲击参数;根据第一预设条件确定冲击参数对应的冲击结果。
在一实施例中,分类模块10,还用于获取待推送新闻消息,并对待推送新闻消息进行分词处理,获得分词词段;将分词词段与预设事件类型标签进行匹配,获得匹配结果;根据匹配结果确定待推送新闻消息对应的事件类型。
在一实施例中,分类模块10,还用于获取分词词语与预设事件类型标签之间的词义相似度;将词义相似度与预设相似度阈值进行比对,获得比对结果;根据比对结果确定分词词段与预设事件类型标签之间的匹配结果。
在一实施例中,基于大数据的新闻消息推送装置还包括选择模块;选择模块,用于获取用户持有股票的股票信息,并根据股票信息生成搜索关键词;根据搜索关键词从预设新闻消息库中查找对应的待选新闻消息;获取待选新闻信息的时间信息;根据第二预设条件和时间信息从待选新闻消息中确定目标新闻信息,并将目标新闻消息作为待推送新闻消息。
本发明所述基于大数据的新闻消息推送装置的其他实施例或具体实现方式可参照上述各方法实施例,此处不再赘述。
此外,本发明实施例还提出一种存储介质,所述存储介质上存储有基于大数据的新闻消息推送程序,所述基于大数据的新闻消息推送程序被处理器执行时实现如上文所述的基于大数据的新闻消息推送方法的步骤。
由于本存储介质采用了上述所有实施例的全部技术方案,因此至少具有上述实施例的技术方案所带来的所有有益效果,在此不再一一赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。词语第一、第二、以及第三等的使用不表示任何顺序,可将这些词语解释为名称。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如只读存储器镜像(Read Only Memory image,ROM)/随机存取存储器(Random AccessMemory,RAM)、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种基于大数据的新闻消息推送方法,其特征在于,所述方法包括以下步骤:
获取待推送新闻消息,并确定所述待推送新闻消息对应的事件类型;
根据所述事件类型从预设股票样本数据库中查找对应的股票冲击样本;
根据所述股票冲击样本的收益参数确定所述事件类型对应的冲击结果;
根据所述冲击结果和所述待推送新闻消息生成待推送消息,并将所述待推送消息发送至目标客户端。
2.如权利要求1所述的基于大数据的新闻消息推送方法,其特征在于,所述根据所述事件类型从预设股票样本数据库中查找对应的股票冲击样本,之前,还包括:
获取预设时间段内的新闻消息,并根据预设事件类型对所述新闻消息进行分类,获得分类结果;
获取所述新闻消息对应的股票冲击样本;
根据所述股票冲击样本和所述分类结果建立预设股票样本数据库。
3.如权利要求2所述的基于大数据的新闻消息推送方法,其特征在于,所述根据所述股票冲击样本和所述分类结果建立预设股票样本数据库,包括:
根据所述分类结果确定所述新闻消息与预设事件类型之间的匹配度;
根据所述匹配度确定所述股票冲击样本对应的分类等级;
根据所述分类等级建立所述股票冲击样本与所述预设事件类型之间的关联关系,以建立预设股票样本数据库。
4.如权利要求3所述的基于大数据的新闻消息推送方法,其特征在于,所述根据所述股票冲击样本的收益参数确定所述事件类型对应的冲击结果,包括:
根据所述分类等级确定所述股票冲击样本对应的权重值;
获取所述股票冲击样本在预设时间段内的收益参数;
根据所述收益参数及所述权重值确定所述事件类型对应的冲击参数;
根据第一预设条件确定所述冲击参数对应的冲击结果。
5.如权利要求1-4中任一项所述的基于大数据的新闻消息推送方法,其特征在于,所述获取待推送新闻消息,并确定所述待推送新闻消息对应的事件类型,包括:
获取待推送新闻消息,并对所述待推送新闻消息进行分词处理,获得分词词段;
将所述分词词段与预设事件类型标签进行匹配,获得匹配结果;
根据所述匹配结果确定所述待推送新闻消息对应的事件类型。
6.如权利要求5所述的基于大数据的新闻消息推送方法,其特征在于,所述将所述分词词段与预设事件类型标签进行匹配,获得匹配结果,包括:
获取所述分词词语与预设事件类型标签之间的词义相似度;
将所述词义相似度与预设相似度阈值进行比对,获得比对结果;
根据所述比对结果确定所述分词词段与所述预设事件类型标签之间的匹配结果。
7.如权利要求1-4中任一项所述的基于大数据的新闻消息推送方法,其特征在于,所述获取待推送新闻消息,并确定所述待推送新闻消息对应的事件类型之前,还包括:
获取用户持有股票的股票信息,并根据所述股票信息生成搜索关键词;
根据所述搜索关键词从预设新闻消息库中查找对应的待选新闻消息;
获取所述待选新闻信息的时间信息;
根据第二预设条件和所述时间信息从所述待选新闻消息中确定目标新闻信息,并将所述目标新闻消息作为待推送新闻消息。
8.一种基于大数据的新闻消息推送装置,其特征在于,所述装置包括:
分类模块,用于获取待推送新闻消息,并确定所述待推送新闻消息对应的事件类型;
查找模块,用于根据所述事件类型从预设股票样本数据库中查找对应的股票冲击样本;
冲击计算模块,用于根据所述股票冲击样本的收益参数确定所述事件类型对应的冲击结果;
推送模块,用于根据所述冲击结果和所述待推送新闻消息生成待推送消息,并将所述待推送消息发送至目标客户端。
9.一种基于大数据的新闻消息推送设备,其特征在于,所述基于大数据的新闻消息推送设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于大数据的新闻消息推送程序,所述基于大数据的新闻消息推送程序被所述处理器执行时实现如权利要求1至7中任一项所述的基于大数据的新闻消息推送方法的步骤。
10.一种存储介质,其特征在于,所述存储介质上存储有基于大数据的新闻消息推送程序,所述基于大数据的新闻消息推送程序被处理器执行时实现如权利要求1至7中任一项所述的基于大数据的新闻消息推送方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011473050.3A CN112487808A (zh) | 2020-12-18 | 2020-12-18 | 基于大数据的新闻消息推送方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011473050.3A CN112487808A (zh) | 2020-12-18 | 2020-12-18 | 基于大数据的新闻消息推送方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112487808A true CN112487808A (zh) | 2021-03-12 |
Family
ID=74917783
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011473050.3A Pending CN112487808A (zh) | 2020-12-18 | 2020-12-18 | 基于大数据的新闻消息推送方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112487808A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114493883A (zh) * | 2022-02-14 | 2022-05-13 | 深圳市伊登软件有限公司 | 多渠道数据汇总处理方法及系统 |
CN116776005A (zh) * | 2023-08-24 | 2023-09-19 | 青岛嘉迅信息技术有限公司 | 一种基于大数据的新闻个性化推送方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105956770A (zh) * | 2016-05-03 | 2016-09-21 | 中国科学院大学 | 一种股市风险预测平台及其文本挖掘方法 |
CN110489631A (zh) * | 2019-07-10 | 2019-11-22 | 平安科技(深圳)有限公司 | 股市趋势预测方法、装置、计算机设备和存储介质 |
-
2020
- 2020-12-18 CN CN202011473050.3A patent/CN112487808A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105956770A (zh) * | 2016-05-03 | 2016-09-21 | 中国科学院大学 | 一种股市风险预测平台及其文本挖掘方法 |
CN110489631A (zh) * | 2019-07-10 | 2019-11-22 | 平安科技(深圳)有限公司 | 股市趋势预测方法、装置、计算机设备和存储介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114493883A (zh) * | 2022-02-14 | 2022-05-13 | 深圳市伊登软件有限公司 | 多渠道数据汇总处理方法及系统 |
CN116776005A (zh) * | 2023-08-24 | 2023-09-19 | 青岛嘉迅信息技术有限公司 | 一种基于大数据的新闻个性化推送方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9990356B2 (en) | Device and method for analyzing reputation for objects by data mining | |
US10255550B1 (en) | Machine learning using multiple input data types | |
CN112163424B (zh) | 数据的标注方法、装置、设备和介质 | |
US8374983B1 (en) | Distributed object classification | |
CN110008343B (zh) | 文本分类方法、装置、设备及计算机可读存储介质 | |
CN112182246B (zh) | 通过大数据分析建立企业画像的方法、系统、介质及应用 | |
US20190213488A1 (en) | Systems and methods for semantic analysis based on knowledge graph | |
CN111680073A (zh) | 一种基于用户数据的金融服务平台政策资讯推荐方法 | |
WO2018171295A1 (zh) | 一种给文章标注标签的方法、装置、终端及计算机可读存储介质 | |
CN112487808A (zh) | 基于大数据的新闻消息推送方法、装置、设备及存储介质 | |
CN113051911A (zh) | 提取敏感词的方法、装置、设备、介质及程序产品 | |
CN117112782A (zh) | 一种招标公告信息提取方法 | |
CN112182451A (zh) | 网页内容摘要生成方法、设备、存储介质及装置 | |
CN116542800A (zh) | 基于云端ai技术的智能化财务报表分析系统 | |
CN115249007A (zh) | 一种基于电子投标文件比对的围串标行为检测方法及装置 | |
CN113392920B (zh) | 生成作弊预测模型的方法、装置、设备、介质及程序产品 | |
CN114092948A (zh) | 一种票据识别方法、装置、设备以及存储介质 | |
CN117077668A (zh) | 风险画像展示方法、装置、计算机设备和可读存储介质 | |
CN111798214B (zh) | 职位技能标签生成系统及方法 | |
CN114741501A (zh) | 舆情预警方法、装置、可读存储介质及电子设备 | |
CN110119464B (zh) | 一种合同中数值的智能推荐方法及装置 | |
CN113901817A (zh) | 文档分类方法、装置、计算机设备和存储介质 | |
CN113536788A (zh) | 信息处理方法、装置、存储介质及设备 | |
CN113962573A (zh) | 一种区域金融发展态势预测方法及设备 | |
CN112862305A (zh) | 确定对象风险状态的方法、装置、设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |