CN105405051B - 金融事件预测方法和装置 - Google Patents

金融事件预测方法和装置 Download PDF

Info

Publication number
CN105405051B
CN105405051B CN201510958976.4A CN201510958976A CN105405051B CN 105405051 B CN105405051 B CN 105405051B CN 201510958976 A CN201510958976 A CN 201510958976A CN 105405051 B CN105405051 B CN 105405051B
Authority
CN
China
Prior art keywords
financial event
data
financial
early warning
event
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510958976.4A
Other languages
English (en)
Other versions
CN105405051A (zh
Inventor
张立邦
赵钕森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201510958976.4A priority Critical patent/CN105405051B/zh
Publication of CN105405051A publication Critical patent/CN105405051A/zh
Application granted granted Critical
Publication of CN105405051B publication Critical patent/CN105405051B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/06Asset management; Financial planning or analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Finance (AREA)
  • Databases & Information Systems (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Human Resources & Organizations (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明实施例公开了一种金融事件预警方法和装置,所述预警方法包括:实时监测互联网以获取用户输入类数据;按照金融事件关联规则,从所述用户输入类数据中提取金融事件关联数据;按照金融事件预警规则,基于所述金融事件关联数据产生金融事件预警信息。本发明的技术方案不再依据与金融事件直接相关的量价数据对金融事件进行预警,而是通过分析处理互联网中海量的用户输入类数据,产生金融事件预警信息,优化了现有的金融事件预测技术,在丰富了金融事件的预测形式的同时也提高了金融事件的预测精度。

Description

金融事件预测方法和装置
技术领域
本发明实施例涉及数据处理技术,尤其涉及一种金融事件预测方法和装置。
背景技术
在现实生活中有很多事件,尤其是金融事件,是可以通过对一些现有数据的运算处理来进行预测的。其中,量化投资就是一项非常典型的针对金融投资事件的预测方法。
所谓量化投资,就是指借助现代统计学、数学的方法,从海量历史数据中寻找能够带来超额收益的多种“大概率”策略,并纪律严明地按照这些策略所构建的数量化模型来指导投资,力求取得稳定的、可持续的、高于平均的超额回报。与传统的定性投资方法不同的是,量化投资不依靠人的感觉来管理资产,而是根据人的投资思想和投资经验来构建数学模型,并利用计算机来处理大量历史数据,在较短的时间内验证模型的有效性,只有当模型在历史数据上的表现满足要求时,才会被进一步应用到实盘交易中。
现有技术中的量化投资方法都是基于已有的股票量价数据实现的。而由于量价数据中的噪音较多且数据完全公开,仅仅以此为数据源构建有效的投资策略难度极大,往往收效甚微。原因是股票投资本质上是一种博弈行为,只依据完全公开的信息进行决策没有任何优势。
发明内容
有鉴于此,本发明实施例提供一种金融事件预警方法和装置,以提供有效的金融事件预警方式。
第一方面,本发明实施例提供了一种金融事件预警方法,包括:
实时监测互联网以获取用户输入类数据;
按照金融事件关联规则,从所述用户输入类数据中提取金融事件关联数据;
按照金融事件预警规则,基于所述金融事件关联数据产生金融事件预警信息。
第二方面,本发明实施例提供了一种金融事件预警装置,包括:
数据获取模块,用于实时监测互联网以获取用户输入类数据;
关联数据提取模块,用于按照金融事件关联规则,从所述用户输入类数据中提取金融事件关联数据;
预警信息产生模块,用于按照金融事件预警规则,基于所述金融事件关联数据产生金融事件预警信息。
本发明实施例通过实时监测互联网以获取用户输入类数据;按照金融事件关联规则,从所述用户输入类数据中提取金融事件关联数据;按照金融事件预警规则,基于所述金融事件关联数据产生金融事件预警信息的技术手段,实现不再依据与金融事件直接相关的量价数据对金融事件进行预警,而是通过分析处理互联网中海量的用户输入类数据,产生金融事件预警信息,本实施例的技术方案优化了现有的金融事件预测技术,在丰富了金融事件的预测形式的同时也提高了金融事件的预测精度。
附图说明
图1是本发明实施例一的一种金融事件预警方法的流程图;
图2是本发明实施例二的一种金融事件预警方法的流程图;
图3是本发明实施例三的一种金融事件预警方法的流程图;
图4是本发明实施例四的一种金融事件预警装置的结构图;
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图对本发明具体实施例作进一步的详细描述。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部内容。
另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部内容。在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
为了便于理解本发明各实施例,首先将本发明的发明构思简述如下:
如背景技术所述,现有技术在对用户的金融交易进行预测指导时,依靠的只是与该金融事件直接关联的金融数据,典型的,股票的量价数据。但是,除了典型的金融数据会对金融事件产生影响之外,现实生活中实际发生的事件也会对金融事件产生影响,特别是大众对股市的预估、信心等都会影响金融市场的发展趋势。还以股票为例,如果发生了某公司的法人被立案调查、某公司因为经济问题而裁员或者某公司收购了几个子公司等事件,如果用户通过各种途径在关注、讨论这些事件,则这些事件在发生后同样可能会对股票的涨跌产生影响。而这些事件必然会以各种形式在互联网数据中体现出来,因此在本发明实施例中,创造性的提出了利用自然语言处理以及数据挖掘技术等方式来处理互联网数据,通过从互联网数据中提取出金融事件关联数据来对金融事件进行预警。特别是,从互联网的用户输入类数据中提取关联数据,用户输入类数据反映了人们关注的事件。
实施例一
图1为本发明实施例一提供的一种金融事件预警方法的流程图,本实施例的方法可以由金融事件预警装置来执行,该装置可通过硬件和/或软件的方式实现,并一般可集成于存储海量互联网数据的服务器中,并可与提供金融投资指导服务的客户端配合使用。其中,所述服务器可以为单个服务器,也可以为多个服务器构成的集群服务器。
本实施例的方法具体包括:
110、实时监测互联网以获取用户输入类数据。
在本实施例中,所述用户输入类数据具体是指用户通过客户端应用程序提供的人机交互界面输入的,面向互联网的数据。具体的,所述用户输入类数据可以包括:用户通过设定搜索引擎输入的搜索词或者搜索式;用户通过社区论坛或者个人博客等信息发布网站发表的帖子或者状态消息等。
其中,可以通过收集不同客户端应用程序的后台服务器(搜索引擎后台服务器或者“XX论坛”的后台服务器等)中存储的用户输入日志,获取用户输入类数据;也可以通过使用网络爬虫(Web Spider)在各种网页中抓取信息的方式,获取用户输入类数据。
其中,获取用户输入类数据的时间间隔可以根据实际情况进行预设,例如,12小时、1天或者1周等,本实施例对此并不进行限制。
120、按照金融事件关联规则,从所述用户输入类数据中提取金融事件关联数据。
在本实施例中,所述金融事件可以包括如股票、基金以及期货等金融投资事件,也可以包括如物品价格上涨或者下跌等价格波动事件,本实施对此并不进行限制。
金融事件关联数据具体是指数据内容与金融事件直接或者间接相关的用户输入类数据,换句话说,金融事件关联数据是指可以对金融事件进行预警的数据。可以理解的是,虽然海量的用户输入类数据中包括有对金融事件进行预警的数据,但是其中更多的是与金融事件完全无关的数据。因此,在对金融事件进行预警之前,需要首先提取用户输入类数据中与金融事件关联的数据。
优选的,按照金融事件关联规则,从所述用户输入类数据中提取金融事件关联数据可以包括:按照金融事件字典库中的关键词或关键句式,从所述用户输入类数据中提取金融事件关联数据。
举例而言,金融事件字典库中存储有“XX被立案调查”这一关键句式,如果获取的用户输入类数据包括“AAA被立案调查”时,则将“AAA被立案调查”作为金融事件关联数据。
其中,可以通过人工选取的方式或者按照词频选取的方式生成金融事件字典库中的关键词或关键句式。
其中,按照词频选取的方式生成金融事件字典库中的关键词或关键句式的方法可以包括:获取金融类常用词以及常用句式;将获取的各常用词以及常用句式按照在互联网中的出现频率进行排序;根据排序结果生成金融事件字典库中的关键词或关键句式。
按照金融事件关联规则,从所述用户输入类数据中提取金融事件关联数据具体还可以包括:基于金融事件确定网络获取渠道,从与所述网络获取渠道对应的用户输入类数据中提取金融事件关联数据。
举例而言,如果需要预警的金融事件为股票投资事件,可以将在“股票吧”或者“XX论坛”的“股民世界”板块中抓取的数据直接作为金融事件关联数据。
130、按照金融事件预警规则,基于所述金融事件关联数据产生金融事件预警信息。
显然,一个会对金融事件产生影响的具体事件(例如,“XX公司裁员”),在其发生前后的一段时间内,其所对应的关键词在互联网中的出现次数一定会产生异常,因此,可以根据金融事件关联数据的出现次数随时间的变化规律选取适宜的金融事件预警规则,以实现对金融事件的预警。
例如,“破产”这一词语在某一天的出现次数超过该词语历史平均出现次数很多(大于设定门限阈值),因此,可以直接根据该异常情况对股票投资事件进行预警(例如,对股票大盘熊市进行预警);也可以根据该词语与金融事件的历史关联性(典型的,该词语对金融事件的历史命中概率),产生对应的金融预警信息,例如,如果“破产”对股票大盘熊市的历史命中概率大于70%,则根据“破产”的异常情况对股票大盘熊市进行预警。
本发明实施例通过实时监测互联网以获取用户输入类数据;按照金融事件关联规则,从所述用户输入类数据中提取金融事件关联数据;按照金融事件预警规则,基于所述金融事件关联数据产生金融事件预警信息的技术手段,实现不再依据与金融事件直接相关的数据(典型的,股票的量价数据)对金融事件进行预警,而是通过分析处理互联网中海量的用户输入类数据,产生金融事件预警信息,本实施例的技术方案优化了现有的金融事件预测技术,在丰富了金融事件的预测形式的同时也提高了对金融事件的预测精度。
实施例二
图2是本发明实施例二的一种金融事件预警方法的流程图。本实施例以上述实施例为基础进行优化,在本实施例中,将实时监测互联网以获取用户输入类数据优选包括下述至少一项:通过搜索引擎获取用户输入的搜索式,作为用户输入类数据;在论坛或微博网站,抓取用户发帖信息,作为用户输入类数据;
同时,在通过搜索引擎获取用户输入的搜索式之后,还优选包括:基于检索排除规则,根据用户在检索结果中的点击操作或浏览操作,对所述搜索式进行筛选。
相应的,本实施例的方法具体包括:
210、通过搜索引擎获取用户输入的搜索式,作为第一用户输入类数据。
在本实施例中,考虑到一件具体事件发生后,基于该事件的影响度会有一定数量的用户通过搜索引擎对该事件进行搜索,因此可以通过获取用户输入的搜索式作为用户输入类数据。
具体的,可以通过搜索引擎服务器中存储的用户输入日志获取用户输入的搜索式。其中,搜索式可以包括一个或者多个词组。
搜索式相对于新闻等长文档而言,属于短文档的语句,指向性更强,能够更准确的反映用户所关注的信息。
220、基于检索排除规则,根据用户在检索结果中的点击操作或浏览操作,对所述搜索式进行筛选。
考虑到同样的搜索式会对应多于一种的检索需求,例如,用户在搜索引擎中输入“破产”,既有可能是想查看“XX公司破产”的相关消息,也有可能是想查看美剧“破产姐妹”的相关消息,因此在从输入类数据中提取金融事件关联数据之前,需要首先基于设定的检索排除规则,将第一用户输入类数据中与金融事件明显无关的数据筛除掉。
优选的,可以根据用户在与搜索式对应的检索结果中的点击操作或浏览操作,对所述搜索式进行筛选。例如,如果识别到用户的点击对象与金融领域无官,则滤除该搜索式。如果识别到用户对金融领域检索结果的浏览时间小于设定值,也说明用户关注的不是金融领域,则该检索式也可滤除。
230、在论坛或微博网站,抓取用户发帖信息,作为第二用户输入类数据。
典型的,可以通过网络爬虫在论坛或微博网站中抓取用户发帖信息。其中,可以预先指定在访问量或者发帖量大于设定阈值的论坛或微博网站中抓取用户发帖信息。
240、按照金融事件字典库中的关键词或关键句式,从所述第一用户输入类数据以及第二用户输入类数据中提取金融事件关联数据。
250、按照金融事件预警规则,基于所述金融事件关联数据产生金融事件预警信息。
本实施例的方法通过在搜索引擎、论坛或微博网站中获取用户输入信息作为基础数据,按照金融事件字典库中的关键词或关键句式,从基础数据中提取金融事件关联数据以产生金融事件预警信息的技术手段,可以实现在海量的互联网数据中全面而有效的获取金融事件关联数据,为后续的金融事件预警提供了充足的数据量,同时通过采取检索排除规则对搜索式进行筛选的技术手段,可以准确滤除与金融事件无关的数据,据此可以进一步提高对金融事件的预测精度。
实施例三
图3是本发明实施例三的一种金融事件预警方法的流程图。本实施例以上述实施例为基础进行优化,在本实施例中,将按照金融事件预警规则,基于所述金融事件关联数据产生金融事件预警信息具体优化为:统计所述金融事件关联数据的出现次数随时间的变化规律,并进行异常识别;如果识别到出现异常,则根据所述出现异常的金融事件关联数据与金融事件的历史关联性,产生金融事件预警信息。
相应的,本实施例的方法具体包括:
310、实时监测互联网以获取用户输入类数据。
320、按照金融事件关联规则,从所述用户输入类数据中提取金融事件关联数据。
330、统计所述金融事件关联数据的出现次数随时间的变化规律,并进行异常识别。
具体的,可以选取设定时间区间(例如,1天、2天或者一周等)作为标准时间单元;实时统计标准时间单元下,不同金融事件关联数据的实时出现次数;根据各金融事件关联数据的出现次数随时间的变化规律,进行异常识别。
举例而言,在2015.12.12这一天,从用户输入类数据中提取出的金融事件关联数据以及对应的实时出现次数包括:“破产”,24310次,“资金链断裂”,43218次以及“资产重组”,432次。通过基于上述三个词语各自的出现次数随时间的变化规律,完成异常识别。
340、判断是否识别到出现异常:若是,执行350;否则,返回执行310。
在本实施例的一个优选的实施方式中,根据各金融事件关联数据出现次数随时间的变化规律,进行异常识别可以包括:
获取目标金融事件关联数据(例如,“破产”)的实时出现次数与该目标数据的历史平均出现次数进行比对;
如果所述实时出现次数与所述历史平均出现次数的阈值大于第一差异门限,则确定所述目标金融事件关联数据发生异常。
在本实施例的另一个优选的实施方式中,根据各金融事件关联数据出现次数随时间的变化规律,进行异常识别可以包括:
将当前标准时间单元下的目标金融事件关联数据的实时出现次数与所述目标金融事件关联数据在前一标准时间单元下的历史出现次数进行比对;
如果所述实时出现次数与所述历史出现次数的阈值大于第二差异门限,则确定所述目标金融事件关联数据发生异常。
350、根据所述出现异常的金融事件关联数据与金融事件的历史关联性,产生金融事件预警信息。
在本实施例中,金融事件关联数据与金融事件的历史关联性具体可以指金融事件关联数据对所述金融事件的历史命中概率。相应的,金融事件预警信息具体是指对金融事件的发生进行预警的信息。
典型的,所述金融事件可以为股票投资事件,所述预警信息可以包括:股票大盘牛市和股票大盘熊市。
其中,由于需要根据不同标准时间单元下,金融事件关联数据的出现次数来完成对金融事件关联数据的异常识别,因此,在确定一个金融事件关联数据发生异常时,可以进而确定该金融事件关联数据的异常时间,进而可以通过一个金融事件关联数据的全部异常时间,以及所述金融事件的历史发生时间,计算金融事件关联数据对所述金融事件的历史命中概率。
举例而言,与一个金融事件关联数据(例如,“破产”)对应的全部异常时间分别为2000.1.3、2000.8.5、2005.5.31以及2005.6.1;
通过以各异常时间为起点,选取设定长度的时间间隔,例如15天,可以构造出与该金融事件关联数据对应的时间验证区间为:(2000.1.3~2000.1.17)、(2000.8.5~2000.8.19)、(2005.5.31~2005.6.14)以及(2005.6.1~2005.6.15)。
假设金融事件的全部历史发生时间分别为:2000.1.12、2001.10.9以及2005.6.8,可见,金融事件关联数据的4个时间验证区间内,有2个区间命中了该金融事件。因此,可以确定该金融事件关联数据对所述金融事件的历史命中概率为50%。
典型的,由于各个金融事件关联数据均是出自于金融事件字典库中。因此,可以预先计算并存储所述金融事件字典库中各个关键词或者关键句式的对金融事件的历史命中概率,并实时更新所述命中概率值。
在本实施例中,根据所述出现异常的金融事件关联数据与金融事件的历史关联性,产生金融事件预警信息可以包括:获取与出现异常的金融事件关联数据对金融事件的历史命中概率,如果所述历史命中概率超过设定的预警门限,则产生对应的金融事件预警信息;也可以包括:获取与出现异常的金融事件关联数据对金融事件的历史命中概率,根据该历史命中概率以及其他参考信息(例如,金融事件关联数据的来源以及内容等),加权计算预警值,如果计算得到的预警值超过设定的预警门限,则产生对应的金融事件预警信息。
本实施例的方法通过统计所述金融事件关联数据的出现次数随时间的变化规律,并进行异常识别;如果识别到出现异常,则根据所述出现异常的金融事件关联数据与金融事件的历史关联性,产生金融事件预警信息的技术手段,可以实现将一个具体事件对金融事件的影响完全通过大数据的挖掘以及数据处理技术进行量化,优化了现有的金融事件预测技术,在丰富了金融事件的预测形式的同时也提高了对金融事件的预测精度。
在上述各实施例的基础上,根据所述出现异常的金融事件关联数据与金融事件的历史关联性,产生金融事件预警信息,具体可以包括:
根据所述出现异常的金融事件关联数据与金融事件的历史关联性,加权计算预警值;根据所述预警值产生对应的金融事件预警信息。
其中,权重项包括金融事件关联数据的下述至少一个属性项:数据来源、数据内容和异常等级。
在一个具体例子中,可以根据实际情况设定预警值表达式,例如:预警值C=k1*A+k2*B+k3*C;A、B和C为计算预警值的三个权重项。k1、k2以及k3为与三个权重项分别对应的权重值,k1、k2以及k3可以根据实际情况进行预设,也可以根据实际情况进行实时调整,本实施例对此并不进行限制。
其中,A的取值可以通过出现异常的金融事件关联数据的数据来源计算,例如,“破产”这一词语在2015.12.12这一天出现异常,出现次数为2000876次,可以根据这2000876个“破产”的不同来源(搜索引擎、论坛或者微博网站),计算得到A,优选的,令A=m1*N1+m2*N2,其中,m1、m2为设定的比例系数,m1+m2=1,N1为通过搜索引擎获取的“破产”次数,N2为通过论坛或微博网站获取的“破产”次数。
其中,B的取值可以通过出现异常的金融事件关联数据的数据内容来计算。优选的,可以在金融事件字典库中为各个关键词以及关键句式设定内容权重值,例如,“破产”的内容权重值为“500”,“裁员”的内容权重值为“300”以及“非公开发行”的内容权重值为“200”等。在获取出现异常的金融事件关联数据后可以通过查询金融事件字典库来确定与该数据对应的内容权重值来计算B。
其中,C的取值可以通过出现异常的金融事件关联数据的异常等级来确定。优选的,异常等级可以根据金融事件关联数据对金融事件的历史命中概率来确定,优选的,可以包括“高”、“中”和“低”三个异常等级,不同异常等级对应不同的异常等级权重值以及不同的历史命中概率范围。例如,与“高”异常等级对应的异常等级权重值为“500”,对应的历史命中概率范围为“>70%”等。在获取出现异常的金融事件关联数据后,可以通过查询金融事件字典库来确定该数据对金融事件的历史命中概率来确定与该数据对应的异常等级,进而通过与该异常等级对应的异常等级权重值来计算C。
在上述各实施例的技术上,将根据所述预警值产生对应的金融事件预警信息之后,还可以包括:将所述金融事件预警信息与实际金融事件信息进行比对验证;根据验证结果迭代调整各所述权重项的权重值,直至验证结果稳定。
举例而言,在2015.12.12这一天对股票投资事件产生了股票大盘熊市的预警信息,在设定的检验区间内(例如,15天)验证该预警信息是否成功预测了股票大盘熊市,并根据验证结果调整各所述权重项(如前例所述的A、B和C)的权重值(如前例所述的k1、k2和k3),通过根据不同金融事件预警信息与实际金融事件信息进行比对验证的结果迭代调整各所述权重项的权重值,最终使得验证结果趋于稳定(典型的,稳定的预警成功概率)。
实施例四
在图4中示出了本发明实施例四的一种金融事件预警装置的结构图。如图4所示,所述装置包括:
数据获取模块41,用于实时监测互联网以获取用户输入类数据。
关联数据提取模块42,用于按照金融事件关联规则,从所述用户输入类数据中提取金融事件关联数据。
预警信息产生模块43,用于按照金融事件预警规则,基于所述金融事件关联数据产生金融事件预警信息。
本发明实施例通过实时监测互联网以获取用户输入类数据;按照金融事件关联规则,从所述用户输入类数据中提取金融事件关联数据;按照金融事件预警规则,基于所述金融事件关联数据产生金融事件预警信息的技术手段,实现不再依据与金融事件直接相关的数据(典型的,股票的量价数据)对金融事件进行预警,而是通过分析处理互联网中海量的用户输入类数据,产生金融事件预警信息,本实施例的技术方案优化了现有的金融事件预测技术,在丰富了金融事件的预测形式的同时也提高了金融事件的预测精度。
在上述各实施例的基础上,数据获取模块具体可以包括:
第一数据获取单元,用于通过搜索引擎获取用户输入的搜索式,作为用户输入类数据;和/或
第二数据获取单元,用于在论坛或微博网站,抓取用户发帖信息,作为用户输入类数据。
在上述各实施例的基础上,第一数据获取单元还可以用于:
通过搜索引擎获取用户输入的搜索式之后,基于检索排除规则,根据用户在检索结果中的点击操作或浏览操作,对所述搜索式进行筛选。
在上述各实施例的基础上,关联数据提取模块具体可以用于:
按照金融事件字典库中的关键词或关键句式,从所述用户输入类数据中提取金融事件关联数据。
在上述各实施例的基础上,预警信息产生模块可以包括:
异常识别单元,用于统计所述金融事件关联数据的出现次数随时间的变化规律,并进行异常识别;
信息产生单元,用于如果识别到出现异常,则根据所述出现异常的金融事件关联数据与金融事件的历史关联性,产生金融事件预警信息。
在上述各实施例的基础上,信息产生单元具体可以用于:
根据所述出现异常的金融事件关联数据与金融事件的历史关联性,加权计算预警值;
根据所述预警值产生对应的金融事件预警信息;
其中,权重项包括金融事件关联数据的下述至少一个属性项:数据来源、数据内容和异常等级。
在上述各实施例的基础上,信息产生单元具体还可以用于:
根据所述预警值产生对应的金融事件预警信息之后,将所述金融事件预警信息与实际金融事件信息进行比对验证;
根据验证结果迭代调整各所述权重项的权重值,直至验证结果稳定。
在上述各实施例的基础上,所述金融事件可以为股票投资事件,所述预警信息可以包括:股票大盘牛市和股票大盘熊市。
本发明实施例所提供的金融事件预警装置可用于执行本发明任意实施例提供的金融事件预警方法,具备相应的功能模块,实现相同的有益效果。
显然,本领域技术人员应该明白,上述的本发明的各模块或各步骤可以通过如上所述的服务器来实施。可选地,本发明实施例可以用计算机装置可执行的程序来实现,从而可以将它们存储在存储装置中由处理器来执行,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等;或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件的结合。
以上所述仅为本发明的优选实施例,并不用于限制本发明,对于本领域技术人员而言,本发明可以有各种改动和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (12)

1.一种金融事件预警方法,其特征在于,包括:
预先计算并存储金融事件字典库中各个关键词或者关键句式的对金融事件的历史命中概率,其中,通过一个金融事件关联数据的全部异常时间,以及所述金融事件的历史发生时间,计算金融事件关联数据对所述金融事件的历史命中概率;
实时监测互联网以获取用户输入类数据;
按照所述金融事件字典库中的关键词或关键句式,从所述用户输入类数据中提取金融事件关联数据;
实时统计标准时间单元下,不同金融事件关联数据的实时出现次数,根据各所述金融事件关联数据的出现次数随时间的变化规律,进行异常识别;
如果识别到出现异常,则根据所述出现异常的金融事件关联数据的历史命中概率,产生金融事件预警信息。
2.根据权利要求1所述的方法,其特征在于,实时监测互联网以获取用户输入类数据包括下述至少一项:
通过搜索引擎获取用户输入的搜索式,作为用户输入类数据;
在论坛或微博网站,抓取用户发帖信息,作为用户输入类数据。
3.根据权利要求2所述的方法,其特征在于,通过搜索引擎获取用户输入的搜索式之后,还包括:
基于检索排除规则,根据用户在检索结果中的点击操作或浏览操作,对所述搜索式进行筛选。
4.根据权利要求1所述的方法,其特征在于,根据所述出现异常的金融事件关联数据与金融事件的历史关联性,产生金融事件预警信息,包括:
根据所述出现异常的金融事件关联数据与金融事件的历史关联性,加权计算预警值;
根据所述预警值产生对应的金融事件预警信息;
其中,权重项包括金融事件关联数据的下述至少一个属性项:数据来源、数据内容和异常等级。
5.根据权利要求4所述的方法,其特征在于,根据所述预警值产生对应的金融事件预警信息之后,还包括:
将所述金融事件预警信息与实际金融事件信息进行比对验证;
根据验证结果迭代调整各所述权重项的权重值,直至验证结果稳定。
6.根据权利要求1所述的方法,其特征在于:
所述金融事件为股票投资事件,所述预警信息包括:股票大盘牛市和股票大盘熊市。
7.一种金融事件预警装置,其特征在于,包括:
数据存储模块,用于预先计算并存储金融事件字典库中各个关键词或者关键句式的对金融事件的历史命中概率,其中,通过一个金融事件关联数据的全部异常时间,以及所述金融事件的历史发生时间,计算金融事件关联数据对所述金融事件的历史命中概率;
数据获取模块,用于实时监测互联网以获取用户输入类数据;
关联数据提取模块,用于按照所述金融事件字典库中的关键词或关键句式,从所述用户输入类数据中提取金融事件关联数据;
异常识别模块,用于实时统计标准时间单元下,不同金融事件关联数据的实时出现次数,根据各所述金融事件关联数据的出现次数随时间的变化规律,进行异常识别;
预警信息产生模块,用于如果识别到出现异常,则根据所述出现异常的金融事件关联数据的历史命中概率,产生金融事件预警信息。
8.根据权利要求7所述的装置,其特征在于,数据获取模块具体包括:
第一数据获取单元,用于通过搜索引擎获取用户输入的搜索式,作为用户输入类数据;和/或
第二数据获取单元,用于在论坛或微博网站,抓取用户发帖信息,作为用户输入类数据。
9.根据权利要求8所述的装置,其特征在于:
第一数据获取单元还用于,通过搜索引擎获取用户输入的搜索式之后,基于检索排除规则,根据用户在检索结果中的点击操作或浏览操作,对所述搜索式进行筛选。
10.根据权利要求7所述的装置,其特征在于,预警信息产生模块具体用于:
根据所述出现异常的金融事件关联数据与金融事件的历史关联性,加权计算预警值;
根据所述预警值产生对应的金融事件预警信息;
其中,权重项包括金融事件关联数据的下述至少一个属性项:数据来源、数据内容和异常等级。
11.根据权利要求10所述的装置,其特征在于,预警信息产生模块具体还用于:
根据所述预警值产生对应的金融事件预警信息之后,将所述金融事件预警信息与实际金融事件信息进行比对验证;
根据验证结果迭代调整各所述权重项的权重值,直至验证结果稳定。
12.根据权利要求7所述的装置,其特征在于:
所述金融事件为股票投资事件,所述预警信息包括:股票大盘牛市和股票大盘熊市。
CN201510958976.4A 2015-12-18 2015-12-18 金融事件预测方法和装置 Active CN105405051B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510958976.4A CN105405051B (zh) 2015-12-18 2015-12-18 金融事件预测方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510958976.4A CN105405051B (zh) 2015-12-18 2015-12-18 金融事件预测方法和装置

Publications (2)

Publication Number Publication Date
CN105405051A CN105405051A (zh) 2016-03-16
CN105405051B true CN105405051B (zh) 2020-09-25

Family

ID=55470522

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510958976.4A Active CN105405051B (zh) 2015-12-18 2015-12-18 金融事件预测方法和装置

Country Status (1)

Country Link
CN (1) CN105405051B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108805444A (zh) * 2018-06-07 2018-11-13 北京字节跳动网络技术有限公司 评估方法、装置、设备和计算机可读存储介质
CN109284369B (zh) * 2018-08-01 2020-10-09 数据地平线(广州)科技有限公司 证券新闻资讯重要性的判定方法、系统、装置及介质
CN109410543B (zh) * 2018-10-17 2022-09-09 深圳壹账通智能科技有限公司 预警测试控制方法、装置、计算机设备及存储介质
CN110245995A (zh) * 2019-06-25 2019-09-17 北京向上一心科技有限公司 分析方法、装置、电子设备和计算机可读存储介质
CN115426129B (zh) * 2022-07-21 2024-08-06 深圳市世强元件网络有限公司 基于网站行为事件响应的网络身份识别方法及装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1787006A (zh) * 2005-10-28 2006-06-14 常明哲 证券投资个股风险价值评估系统和方法
CN201247480Y (zh) * 2008-02-01 2009-05-27 北京中鼎宝源投资管理有限公司 投资者互动沟通平台系统
CN101714273A (zh) * 2009-05-26 2010-05-26 北京银丰新融科技开发有限公司 一种基于规则引擎的银行异常业务监控方法和系统
JP2011505636A (ja) * 2007-11-30 2011-02-24 クレディ・スイス・セキュリティーズ(ユーエスエイ)エルエルシー 金融ベンチマークを生成および維持するコンピュータシステムと方法
CN103164753A (zh) * 2011-12-08 2013-06-19 荣成纸业股份有限公司 客户交易数据管理系统
CN103258034A (zh) * 2013-05-14 2013-08-21 江苏名通信息科技有限公司 一种基于社交媒体的经济金融行为分析系统模型
CN103412915A (zh) * 2013-08-06 2013-11-27 复旦大学 一种面向金融高频交易数据的情景感知测定方法和系统
CN103559207A (zh) * 2013-10-10 2014-02-05 江苏名通信息科技有限公司 一种基于社交媒体计算的金融行为分析系统

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1787006A (zh) * 2005-10-28 2006-06-14 常明哲 证券投资个股风险价值评估系统和方法
JP2011505636A (ja) * 2007-11-30 2011-02-24 クレディ・スイス・セキュリティーズ(ユーエスエイ)エルエルシー 金融ベンチマークを生成および維持するコンピュータシステムと方法
CN201247480Y (zh) * 2008-02-01 2009-05-27 北京中鼎宝源投资管理有限公司 投资者互动沟通平台系统
CN101714273A (zh) * 2009-05-26 2010-05-26 北京银丰新融科技开发有限公司 一种基于规则引擎的银行异常业务监控方法和系统
CN103164753A (zh) * 2011-12-08 2013-06-19 荣成纸业股份有限公司 客户交易数据管理系统
CN103258034A (zh) * 2013-05-14 2013-08-21 江苏名通信息科技有限公司 一种基于社交媒体的经济金融行为分析系统模型
CN103412915A (zh) * 2013-08-06 2013-11-27 复旦大学 一种面向金融高频交易数据的情景感知测定方法和系统
CN103559207A (zh) * 2013-10-10 2014-02-05 江苏名通信息科技有限公司 一种基于社交媒体计算的金融行为分析系统

Also Published As

Publication number Publication date
CN105405051A (zh) 2016-03-16

Similar Documents

Publication Publication Date Title
CN105405051B (zh) 金融事件预测方法和装置
US10678798B2 (en) Method and system for scoring credibility of information sources
US10614073B2 (en) System and method for using data incident based modeling and prediction
CN108364106A (zh) 一种报销单风险预测方法、装置、终端设备及存储介质
EP2866421A1 (en) Method and apparatus for identifying a same user in multiple social networks
US10387805B2 (en) System and method for ranking news feeds
CN106557558A (zh) 一种数据分析方法及装置
CN112116464B (zh) 基于事件序列频繁项集的异常交易行为分析方法和系统
US20180336272A1 (en) Generation of natural language processing events using machine intelligence
US20180336250A1 (en) Apparatus and method for generation of a financial event database
Xu et al. Improving quality of training data for learning to rank using click-through data
WO2015030112A1 (ja) 文書分別システム及び文書分別方法並びに文書分別プログラム
CN107464019A (zh) 一种金融事件预警方法
CN117495538B (zh) 订单融资的风险性评估方法和模型训练方法
US11880394B2 (en) System and method for machine learning architecture for interdependence detection
WO2019095569A1 (zh) 基于微博财经事件的金融分析方法、应用服务器及计算机可读存储介质
CN115794898B (zh) 一种金融资讯推荐方法、装置、电子设备及存储介质
WO2018044955A1 (en) Systems and methods for measuring collected content significance
JP2017188004A (ja) ソーシャルメディアにおける特定テーマの投稿の時系列変化を追跡的に分析するコンピューティング
CN115048487A (zh) 基于人工智能的舆情分析方法、装置、计算机设备及介质
CN109284354B (zh) 脚本搜索方法、装置、计算机设备及存储介质
CN105787075A (zh) 一种基于数据挖掘的事件预测方法和装置
CN113111075A (zh) 投融资信息挖掘方法、装置、电子设备和存储介质
KR20120075553A (ko) 카테고리 매칭을 이용한 키워드 추출 시스템 및 방법
CN112132689A (zh) 一种基于时序因子事件的推荐方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20160316

Assignee: SHANGHAI YOUYANG NEW MEDIA INFORMATION TECHNOLOGY Co.,Ltd.

Assignor: BEIJING BAIDU NETCOM SCIENCE AND TECHNOLOGY Co.,Ltd.

Contract record no.: X2019110000005

Denomination of invention: Financial event prediction method and apparatus

License type: Common License

Record date: 20191119

EE01 Entry into force of recordation of patent licensing contract
GR01 Patent grant
GR01 Patent grant