CN109284369B - 证券新闻资讯重要性的判定方法、系统、装置及介质 - Google Patents

证券新闻资讯重要性的判定方法、系统、装置及介质 Download PDF

Info

Publication number
CN109284369B
CN109284369B CN201810864091.1A CN201810864091A CN109284369B CN 109284369 B CN109284369 B CN 109284369B CN 201810864091 A CN201810864091 A CN 201810864091A CN 109284369 B CN109284369 B CN 109284369B
Authority
CN
China
Prior art keywords
news information
information
importance
news
security
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810864091.1A
Other languages
English (en)
Other versions
CN109284369A (zh
Inventor
刘晓伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Data Horizon Guangzhou Technology Co ltd
Original Assignee
Data Horizon Guangzhou Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Data Horizon Guangzhou Technology Co ltd filed Critical Data Horizon Guangzhou Technology Co ltd
Priority to CN201810864091.1A priority Critical patent/CN109284369B/zh
Publication of CN109284369A publication Critical patent/CN109284369A/zh
Application granted granted Critical
Publication of CN109284369B publication Critical patent/CN109284369B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开一种证券新闻资讯重要性的判定方法、系统、装置及介质,涉及数据挖掘技术领域,通过定位证券交易异常时间点并定义异常时间窗口,获取异常窗口内的所有历史新闻资讯;对所获历史新闻资讯进行主题分类,通过半监督的方式构建重要资讯种子库;实时获取新的新闻资讯,并对新的新闻资讯进行主题分类;将新的新闻资讯与重要资讯种子库中的新闻资讯进行比对,完成证券新闻资讯重要性的判定;通过本发明所提出的新闻资讯重要性判定技术不仅能够对新闻资讯的重要性进行分类,而且能够得到与当前重要资讯相似的历史重要资讯,并将历史重要资讯对证券交易、价格等造成的影响提供给用户,从而面向用户提供直接的、有价值的参考与指导。

Description

证券新闻资讯重要性的判定方法、系统、装置及介质
技术领域
本发明涉及数据挖掘技术领域,尤其涉及一种证券新闻资讯重要性的判定方法、系统、装置及介质。
背景技术
为了解决信息过载的问题,从海量信息中挖掘出用户感兴趣的信息,推荐系统得到了迅猛发展和广泛应用。目前,几乎所有的大型电子商务系统,如亚马逊、eBay等不同程度的使用了各种形式的推荐系统;国内方面,几乎全部的购物网站淘宝、京东、当当、苏宁易购等也都广泛构建和应用了个性化推荐服务系统。个性化推荐系统能有效地增加用户粘性,提高电子商务网站的服务能力,成功的推荐系统会带来巨大的效益。在信息爆棚的今天,实施个性化推荐势在必行。
与推荐系统的应用场景相同,面对互联网中每天海量的新闻资讯,证券相关人员(包括投资人、分析师、交易员、征信人员、研究人员以及普通证券投资者等各类用户)如何从中挖掘出对其有意义的、有指导价值的新闻资讯(既包括用户意识到的需求,也包括用户没有意识到的需求),是一个具有极大研究意义的问题。
面对用户无明确需求的问题,可以通过分析用户的历史行为和用户的潜在需求面向用户建模,从而主动向用户推荐能够引起其兴趣和需求的新闻资讯:建立起用户和信息(新闻资讯)的联系,一方面帮助用户发现对自己有价值的信息,另一方面让信息能够展示在对它感兴趣的用户面前,实现信息使用者和信息提供者的双赢。
而目前的证券新闻资讯中有大量的词汇,更多涉及到证券的专有词汇,如何从大量的关键字中提取出来所需的不同重要等级的词语,实现高效、准确、目的性明确的效果,目前是一个难题。
发明内容
本发明针对背景技术的问题提供一种证券新闻资讯重要性的判定方法、系统、装置及介质,本发明是指按照资讯对证券相关人员的价值,将资讯分为不同的重要性等级,新闻资讯的重要性等级越高,表征该资讯向用户提供的参考价值、指导价值越大。
为了实现上述目的,本发明提出一种证券新闻资讯重要性的判定方法,包括如下步骤:
S10、获取证券交易异常时间点对应的异常窗口内的所有历史新闻资讯;
S20、对所获历史新闻资讯进行主题分类,通过半监督的方式构建重要资讯种子库;
S30、实时获取新的新闻资讯,并对新的新闻资讯进行主题分类;
S40、将新的新闻资讯与重要资讯种子库中的新闻资讯进行比对,完成证券新闻资讯重要性的判定。
优选地,在步骤S10之前还包括:
S00、定位证券交易异常时间点。
优选地,步骤S20中所述的半监督的方式,具体为:自动化主题分类后的结果再进行人工复核。
优选地,步骤S40所述的将新的新闻资讯与重要资讯种子库中的新闻资讯进行比对,完成证券新闻资讯重要性的判定,具体包括如下步骤:
S401、对每篇新闻资讯进行数据处理;
S402、对新闻资讯中的关键词进行特征提取;
S403、根据所提取的特征,获得新的新闻资讯与重要资讯种子库中的新闻资讯的相似度;
S404、将所获相似度与设定阈值进行比较,确定证券新闻资讯的重要性。
优选地,所述的主题分类,包括:政策类、供给类、需求类、重点企业类、行情类、行业类和研究类。
优选地,步骤S20中还包括:将种子资讯存储至搜索服务器中。
优选地,步骤S00所述的定位证券交易异常时间点,具体为:
S01、对日收益率区间进行统计计数,形成正态分布;
S02、通过设定阈值确定目标收益区间;
S03、将目标收益率区间作为证券交易的异常时间点。
本发明还提出一种证券新闻资讯重要性的判定系统,包括:
历史新闻资讯获取单元:用于获取证券交易异常时间点对应的异常窗口内的所有历史新闻资讯,并将历史新闻资讯发送至新闻资讯主题分类单元中;
新闻资讯实时获取单元:用于实时获取新的新闻资讯,并将实时获取的新闻资讯发送至新闻资讯主题分类单元中;
新闻资讯主题分类单元:用于对新闻资讯进行主题分类,并将分类后的新闻资讯发送至重要资讯种子库构建单元中或重要性判定单元中;
重要资讯种子库构建单元:用于通过半监督的方式构建重要资讯种子库;
重要性判定单元:用于将新的新闻资讯与重要资讯种子库中的新闻资讯进行比对。
优选地,所述的历史新闻资讯获取单元,还用于定位证券交易异常时间点。
优选地,所述的重要性判定单元,具体包括:
数据处理模块:用于对每篇新闻资讯进行数据处理;
特征提取模块:用于对新闻资讯中的关键词进行特征提取;
相似度获取模块:用于根据所提取的特征获得新的新闻资讯与重要资讯种子库中的新闻资讯的相似度;
阈值判定模块:用于将所获相似度与设定阈值进行比较,确定证券新闻资讯的重要性。
本发明还提出一种证券新闻资讯重要性的判定装置,包括:
处理器;
存储器,耦合至所述的处理器并存储有指令,所述的指令在由所述处理器执行实现所述的证券新闻资讯重要性的判定方法的步骤。
本发明还提出一种计算机可读取存储介质,所述计算机可读取存储介质存储有证券新闻资讯重要性的判定方法的应用程序,所述应用程序实现如所述的证券新闻资讯重要性的判定方法的步骤。
本发明提出一种证券新闻资讯重要性的判定方法、系统、装置及介质,通过定位证券交易异常时间点并定义异常时间窗口,获取异常时间窗口内证券相关的新闻资讯数据;针对获取的新闻资讯数据对新闻资讯进行主题分类,从而通过半监督的方式构建重要资讯种子库;对于新的证券新闻的资讯重要性判定,首先通过上述的主题分类模型,对证券新闻资讯数据进行初步筛选,过滤出无信息量的非重要新闻资讯,然后通过与所构建的重要资讯种子库中的新闻资讯进行检索和相似度计算,只有相似度得分超过所设定的相似度阈值的新闻资讯被判定为是重要资讯,否则新闻资讯被判定为非重要。通过本发明所提出的新闻资讯重要性判定技术不仅能够对新闻资讯的重要性进行分类,而且能够得到与当前重要资讯相似的历史重要资讯,并将历史重要资讯对证券交易、价格等造成的影响提供给用户,从而面向用户提供直接的、有价值的参考与指导。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。
图1为本发明一种实施例中证券新闻资讯重要性的判定方法流程图;
图2为本发明一种实施例中定位证券交易异常时间点方法流程图;
图3为本发明一种实施例中新的新闻资讯与重要资讯种子库中的新闻资讯进行比对流程图;
图4为本发明一种实施例中证券新闻资讯重要性的判定系统结构框图;
图5为本发明一种实施例中重要性判定单元结构框图;
图6为本发明一种实施例中证券新闻资讯重要性的判定装置结构示意图;
图7为本发明一种实施例中计算机可读取存储介质结构示意图;
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明,若本发明实施例中有涉及方向性指示(诸如上、下、左、右、前、后……),则该方向性指示仅用于解释在某一特定姿态(如附图所示)下各部件之间的相对位置关系、运动情况等,如果该特定姿态发生改变时,则该方向性指示也相应地随之改变。
另外,若本发明实施例中有涉及“第一”、“第二”等的描述,则该“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
本发明提出一种证券新闻资讯重要性的判定方法;
本发明一种优选实施例中,如图1所示,包括如下步骤:
S00、定位证券交易异常时间点,如图2所示,具体为:
S01、对日收益率区间进行统计计数,形成正态分布;
本发明实施例中,通过计算证券的日收益率,并对日收益率区间进行统计计数,日收益率区间统计结果呈现近似正态分布;
S02、通过设定阈值确定目标收益区间;
本发明实施例中,选取计数统计占比小于5%的日收益率区间作为证券交易的异常时间点,即选取日收益率大于收益率阈值上界的日期和日收益率小于收益率阈值下界的日期;
S03、将目标收益率区间作为证券交易的异常时间点。
S10、获取证券交易异常时间点对应的异常窗口内的所有历史新闻资讯;
本发明实施例中,获取证券交易异常时间点对应的异常时间窗口内的所有历史新闻资讯(本发明根据研究场景,采用的异常时间窗口为三天,包括当天和前两天);通过数据抓取或数据购买获得证券相关的历史与实时新闻资讯数据;
S20、对所获历史新闻资讯进行主题分类,通过半监督的方式构建重要资讯种子库,并将种子资讯存储至搜索服务器中;
本发明实施例中,将所获取的异常时间窗口内的全部历史新闻资讯进行主题分类,本发明根据研究场景将新闻资讯划分为政策类、供给类、需求类、重点企业类、行情类、行业类、研究类七个大类,并将得到的政策类、供给类、需求类三类的资讯,通过半监督的方式(基于自动化主题分类的结果,进行人工复核,确定哪些资讯属于重要资讯和非重要资讯)构建重要资讯种子库,将种子资讯存储到Elasticsearch等搜索服务器。
S30、实时获取新的新闻资讯,并对新的新闻资讯进行主题分类;
本发明实施例中,对于实时获取到的新的新闻资讯,同样先进行主题分类,后续只处理政策类、供给类、需求类三类的资讯;通过主题分类对证券新闻资讯数据进行初步筛选,过滤出无信息量的非重要新闻资讯,可以有效地减少后续的数据检索和相似度计算的计算负载,从而显著提升新闻资讯重要性判定过程的整体运行效率,并对重要性判定的准确率提供积极的影响;
S40、将新的新闻资讯与重要资讯种子库中的新闻资讯进行比对,完成证券新闻资讯重要性的判定。
本发明一种优选实施例中,如图3所示,包括如下步骤:
S401、对每篇新闻资讯进行数据处理;
本发明实施例中,对于新的新闻资讯与重要资讯种子库中的新闻资讯均进行数据处理,包括通过重复新闻去重、停用词(的、是、和等)去除、连词、副词、介词去除等对新闻进行清洗和预处理;
S402、对新闻资讯中的关键词进行特征提取;
本发明实施例中,提取每篇新闻的关键词,并通过预训练的词向量模型(根据具体的业务场景,选择相应的语料进行词向量模型的训练,本发明采用的词向量模型是使用股票、期货等相应领域的历史新闻数据训练得到的;所构建的词向量模型用于获取新闻关键词的词向量)将所提取的新闻关键词转换为其所对应的词向量,进而得到每篇新闻资讯的关键词词向量或词向量矩阵;
S403、根据所提取的特征,获得新的新闻资讯与重要资讯种子库中的新闻资讯的相似度;
本发明实施例中,通过所得到的新闻资讯的关键词词向量或词向量矩阵,将实时获取到的新的新闻资讯与重要新闻种子库中的新闻进行相似度计算;
S404、将所获相似度与设定阈值进行比较,确定证券新闻资讯的重要性。
本发明实施例中,只有相似度得分超过所设定的相似度阈值(例如,本发明设定的相似度阈值是40%,在实际应用中应根据实际的业务场景对相似度阈值进行适当的调整)的新闻资讯被判定为是重要资讯,否则新闻资讯被判定为非重要。
本发明还提出一种证券新闻资讯重要性的判定系统;
本发明一种优选实施例中,如图4所示,包括:
历史新闻资讯获取单元:用于定位证券交易异常时间点,获取证券交易异常时间点对应的异常窗口内的所有历史新闻资讯,并将历史新闻资讯发送至新闻资讯主题分类单元中;
本发明实施例中,历史新闻资讯获取单元通过计算证券的日收益率,并对日收益率区间进行统计计数,日收益率区间统计结果呈现近似正态分布,选取计数统计占比小于5%的日收益率区间作为证券交易的异常时间点,即选取日收益率大于收益率阈值上界的日期和日收益率小于收益率阈值下界的日期,将其作为证券交易的异常时间点;获取证券交易异常时间点对应的异常时间窗口内的所有历史新闻资讯(本发明根据研究场景,采用的异常时间窗口为三天,包括当天和前两天);通过数据抓取或数据购买获得证券相关的历史与实时新闻资讯数据;
新闻资讯实时获取单元:用于实时获取新的新闻资讯,并将实时获取的新闻资讯发送至新闻资讯主题分类单元中;
新闻资讯主题分类单元:用于对新闻资讯进行主题分类,并将分类后的新闻资讯发送至重要资讯种子库构建单元中或重要性判定单元中;
本发明实施例中,当新闻资讯主题分类单元接收新闻资讯实时获取单元发送的新的新闻资讯时,将完成分类的新闻资讯发送至重要性判定单元中;当新闻资讯主题分类单元接收历史新闻资讯获取单元发送的新闻资讯时,将完成分类的新闻资讯发送至重要资讯种子库构建单元中;所述的主题分类包括政策类、供给类、需求类、重点企业类、行情类、行业类、研究类七个大类;
重要资讯种子库构建单元:用于通过半监督的方式构建重要资讯种子库;
本发明实施例中,重要资讯种子库构建单元基于自动化主题分类的结果,进行人工复核,确定哪些资讯属于重要资讯和非重要资讯,构建重要资讯种子库;
重要性判定单元:用于将新的新闻资讯与重要资讯种子库中的新闻资讯进行比对;
本发明实施例中,重要性判定单元采用相似度计算的基本原理将将新的新闻资讯与重要资讯种子库中的新闻资讯进行比对;如图5所示,具体包括:
数据处理模块:用于对每篇新闻资讯进行数据处理;
本发明实施例中,数据处理模块对数据进行处理,包括通过重复新闻去重、停用词(的、是、和等)去除、连词、副词、介词去除等对新闻进行清洗和预处理;
特征提取模块:用于对新闻资讯中的关键词进行特征提取;
本发明实施例中,特征提取模块对新闻资讯中的关键词进行提取作为相似度对比的特征;
相似度获取模块:用于根据所提取的特征获得新的新闻资讯与重要资讯种子库中的新闻资讯的相似度;
本发明实施例中,通过预训练的词向量模型将所提取的新闻关键词转换为其所对应的词向量,进而得到每篇新闻资讯的关键词词向量或词向量矩阵;通过所得到的新闻资讯的关键词词向量或词向量矩阵,将实时获取到的新的新闻资讯与重要新闻种子库中的新闻进行相似度计算;
阈值判定模块:用于将所获相似度与设定阈值进行比较,确定证券新闻资讯的重要性。
本发明实施例中,设置阈值,将相似度计算值与阈值进行比较,只有相似度得分超过所设定的相似度阈值的新闻资讯被判定为是重要资讯,否则新闻资讯被判定为非重要。
本发明还提出一种证券新闻资讯重要性的判定装置,如图6所示,包括:处理器;存储器,耦合至所述的处理器并存储有指令,所述的指令在由所述处理器执行实现所述的证券新闻资讯重要性的判定方法的步骤,例如:
S10、获取证券交易异常时间点对应的异常窗口内的所有历史新闻资讯;
S20、对所获历史新闻资讯进行主题分类,通过半监督的方式构建重要资讯种子库;
S30、实时获取新的新闻资讯,并对新的新闻资讯进行主题分类;
S40、将新的新闻资讯与重要资讯种子库中的新闻资讯进行比对,完成证券新闻资讯重要性的判定。
具体步骤细节上文已经叙述,此处不再复述;
本发明实施例中,所述的证券新闻资讯重要性的判定装置内置处理器,可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。处理器利用各种接口和线路连接取各个部件,通过运行或执行存储在存储器内的程序或者单元,以及调用存储在存储器内的数据,以执行证券新闻资讯重要性的判定的各种功能和处理数据;
存储器用于存储程序代码和各种数据,安装在证券新闻资讯重要性的判定装置中,并在运行过程中实现高速、自动地完成程序或数据的存取。所述存储器包括只读存储器(Read-Only Memory,ROM)、随机存储器(Random Access Memory,RAM)、可编程只读存储器(Programmable Read-Only Memory,PROM)、可擦除可编程只读存储器(ErasableProgrammable Read-Only Memory,EPROM)、一次可编程只读存储器(One-timeProgrammable Read-Only Memory,OTPROM)、电子擦除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
本发明还提出一种计算机可读取存储介质,如图7所示,所述计算机可读取存储介质存储有证券新闻资讯重要性的判定方法的应用程序,所述应用程序实现如所述的证券新闻资讯重要性的判定方法的步骤,例如:
S10、获取证券交易异常时间点对应的异常窗口内的所有历史新闻资讯;
S20、对所获历史新闻资讯进行主题分类,通过半监督的方式构建重要资讯种子库;
S30、实时获取新的新闻资讯,并对新的新闻资讯进行主题分类;
S40、将新的新闻资讯与重要资讯种子库中的新闻资讯进行比对,完成证券新闻资讯重要性的判定。
具体步骤细节上文已经叙述,此处不再复述;
在本发明的实施方式的描述中,需要说明的是,流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理模块的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读取介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读取介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是在本发明的发明构思下,利用本发明说明书及附图内容所作的等效结构变换,或直接/间接运用在其他相关的技术领域均包括在本发明的专利保护范围内。

Claims (12)

1.一种证券新闻资讯重要性的判定方法,其特征在于,包括如下步骤:
S10、获取证券交易异常时间点对应的异常窗口内的所有历史新闻资讯;
S20、对所获历史新闻资讯进行主题分类,通过半监督的方式构建重要资讯种子库;
S30、实时获取新的新闻资讯,并对新的新闻资讯进行主题分类;
S40、将新的新闻资讯与重要资讯种子库中的新闻资讯进行比对,完成证券新闻资讯重要性的判定。
2.根据权利要求1所述的证券新闻资讯重要性的判定方法,其特征在于,在步骤S10之前还包括:
S00、定位证券交易异常时间点。
3.根据权利要求1所述的证券新闻资讯重要性的判定方法,其特征在于,步骤S20中所述的半监督的方式,具体为:对自动化主题分类后的结果再进行人工复核。
4.根据权利要求1所述的证券新闻资讯重要性的判定方法,其特征在于,步骤S40所述的将新的新闻资讯与重要资讯种子库中的新闻资讯进行比对,完成证券新闻资讯重要性的判定,具体包括如下步骤:
S401、对每篇新闻资讯进行数据处理;
S402、对新闻资讯中的关键词进行特征提取;
S403、根据所提取的特征,获得新的新闻资讯与重要资讯种子库中的新闻资讯的相似度;
S404、将所获相似度与设定阈值进行比较,确定证券新闻资讯的重要性。
5.根据权利要求1所述的证券新闻资讯重要性的判定方法,其特征在于,所述的主题分类,包括:政策类、供给类、需求类、重点企业类、行情类、行业类和研究类。
6.根据权利要求1所述的证券新闻资讯重要性的判定方法,其特征在于,步骤S20中还包括:将种子资讯存储至搜索服务器中。
7.根据权利要求2所述的证券新闻资讯重要性的判定方法,其特征在于,步骤S00所述的定位证券交易异常时间点,具体为:
S01、对日收益率区间进行统计计数,形成正态分布;
S02、通过设定阈值确定目标收益区间;
S03、将目标收益率区间作为证券交易的异常时间点。
8.一种证券新闻资讯重要性的判定系统,其特征在于,包括:
历史新闻资讯获取单元:用于获取证券交易异常时间点对应的异常窗口内的所有历史新闻资讯,并将历史新闻资讯发送至新闻资讯主题分类单元中;
新闻资讯实时获取单元:用于实时获取新的新闻资讯,并将实时获取的新闻资讯发送至新闻资讯主题分类单元中;
新闻资讯主题分类单元:用于对所述历史新闻资讯及实时获取的新闻资讯进行主题分类,将分类后的历史新闻资讯发送至重要资讯种子库构建单元中,将分类后的实时新闻资讯发送至重要性判定单元中;
重要资讯种子库构建单元:用于通过半监督的方式构建重要资讯种子库;
重要性判定单元:用于将新的新闻资讯与重要资讯种子库中的新闻资讯进行比对。
9.根据权利要求8所述的证券新闻资讯重要性的判定系统,其特征在于,所述的历史新闻资讯获取单元,还用于定位证券交易异常时间点。
10.根据权利要求8所述的证券新闻资讯重要性的判定系统,其特征在于,所述的重要性判定单元,具体包括:
数据处理模块:用于对每篇新闻资讯进行数据处理;
特征提取模块:用于对新闻资讯中的关键词进行特征提取;
相似度获取模块:用于根据所提取的特征获得新的新闻资讯与重要资讯种子库中的新闻资讯的相似度;
阈值判定模块:用于将所获相似度与设定阈值进行比较,确定证券新闻资讯的重要性。
11.一种证券新闻资讯重要性的判定装置,其特征在于,包括:
处理器;
存储器,耦合至所述的处理器并存储有指令,所述的指令在由所述处理器执行实现权利要求1至7中任一项所述的证券新闻资讯重要性的判定方法的步骤。
12.一种计算机可读取存储介质,其特征在于,所述计算机可读取存储介质存储有证券新闻资讯重要性的判定方法的应用程序,所述应用程序实现如权利要求1至7中任一项所述的证券新闻资讯重要性的判定方法的步骤。
CN201810864091.1A 2018-08-01 2018-08-01 证券新闻资讯重要性的判定方法、系统、装置及介质 Active CN109284369B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810864091.1A CN109284369B (zh) 2018-08-01 2018-08-01 证券新闻资讯重要性的判定方法、系统、装置及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810864091.1A CN109284369B (zh) 2018-08-01 2018-08-01 证券新闻资讯重要性的判定方法、系统、装置及介质

Publications (2)

Publication Number Publication Date
CN109284369A CN109284369A (zh) 2019-01-29
CN109284369B true CN109284369B (zh) 2020-10-09

Family

ID=65182899

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810864091.1A Active CN109284369B (zh) 2018-08-01 2018-08-01 证券新闻资讯重要性的判定方法、系统、装置及介质

Country Status (1)

Country Link
CN (1) CN109284369B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110517149B (zh) * 2019-08-29 2022-05-06 中国银行股份有限公司 向用户推送金融市场加工信息的方法及装置
TWI758676B (zh) * 2020-01-03 2022-03-21 華南商業銀行股份有限公司 金融交易量警示系統
TWI765847B (zh) * 2020-01-03 2022-05-21 華南商業銀行股份有限公司 具有優惠訊息推播功能的金融交易警示系統
CN112597380A (zh) * 2020-12-17 2021-04-02 中国科学院计算技术研究所数字经济产业研究院 基于微博平台的有价值新闻线索自动发现方法
CN114491102B (zh) * 2022-04-14 2022-06-28 深圳格隆汇信息科技有限公司 一种基于大数据的数据库监控方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060036542A1 (en) * 2004-07-09 2006-02-16 Mcnair Douglas S System and method for behavioral finance
CN105138558A (zh) * 2015-07-22 2015-12-09 山东大学 基于用户访问内容的实时个性化信息采集方法
CN105405051A (zh) * 2015-12-18 2016-03-16 百度在线网络技术(北京)有限公司 金融事件预测方法和装置
CN107403017A (zh) * 2017-08-09 2017-11-28 上海数旦信息技术有限公司 一种智能分析实时新闻对金融市场影响的方法
CN107544988A (zh) * 2016-06-27 2018-01-05 百度在线网络技术(北京)有限公司 一种获取舆情数据的方法和装置
CN108335210A (zh) * 2018-03-07 2018-07-27 浙江大学 一种基于舆论数据的股票异动分析方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060036542A1 (en) * 2004-07-09 2006-02-16 Mcnair Douglas S System and method for behavioral finance
CN105138558A (zh) * 2015-07-22 2015-12-09 山东大学 基于用户访问内容的实时个性化信息采集方法
CN105405051A (zh) * 2015-12-18 2016-03-16 百度在线网络技术(北京)有限公司 金融事件预测方法和装置
CN107544988A (zh) * 2016-06-27 2018-01-05 百度在线网络技术(北京)有限公司 一种获取舆情数据的方法和装置
CN107403017A (zh) * 2017-08-09 2017-11-28 上海数旦信息技术有限公司 一种智能分析实时新闻对金融市场影响的方法
CN108335210A (zh) * 2018-03-07 2018-07-27 浙江大学 一种基于舆论数据的股票异动分析方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
《面向证券应用的WEB主题观点挖掘若干关键问题研究》;薛利;《中国博士学位论文全文数据库 信息科技辑(月刊)计算机软件及计算机应用》;20130317(第3期);全文 *

Also Published As

Publication number Publication date
CN109284369A (zh) 2019-01-29

Similar Documents

Publication Publication Date Title
CN109284369B (zh) 证券新闻资讯重要性的判定方法、系统、装置及介质
US20120131438A1 (en) Method and System of Web Page Content Filtering
CN110428322A (zh) 一种业务数据的适配方法及装置
CN110458324B (zh) 风险概率的计算方法、装置和计算机设备
CN112926699A (zh) 异常对象识别方法、装置、设备及存储介质
CN107704512A (zh) 基于社交数据的金融产品推荐方法、电子装置及介质
CN104063450A (zh) 热点信息分析方法及设备
CN110659985A (zh) 一种捞回误拒潜在用户的方法、装置和电子设备
US20150154706A1 (en) Systems and methods for financial asset analysis
CN112966181A (zh) 服务推荐方法、装置、电子设备及存储介质
EP3407288A1 (en) Apparatus and method for generation of a financial event database
CN112561565A (zh) 一种基于行为日志的用户需求识别方法
CN111782946A (zh) 书友推荐方法、计算设备及计算机存储介质
CN114782201A (zh) 股票推荐方法、装置、计算机设备和存储介质
CN112950347B (zh) 资源数据处理的优化方法及装置、存储介质、终端
CN107368500A (zh) 数据抽取方法及系统
CN112801784A (zh) 一种数字货币交易所的比特币地址挖掘方法及装置
CN112487808A (zh) 基于大数据的新闻消息推送方法、装置、设备及存储介质
CN111242779A (zh) 金融数据特征选择和预测方法、装置、设备及存储介质
CN111221873A (zh) 基于关联网络的企业间同名人识别方法及系统
CN112328752B (zh) 基于搜索内容的课程推荐方法、装置、计算机设备及介质
CN110570301B (zh) 风险识别方法、装置、设备及介质
CN112508654A (zh) 产品信息推荐方法、装置、计算机设备及存储介质
KR100686466B1 (ko) 자산 평가 제공 방법 및 시스템과, 수익성에 대한 안정성 분석 제공 시스템
CN111695028A (zh) 相似词确定方法及装置、电子设备、存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant