CN110692077A - 股价分析装置 - Google Patents
股价分析装置 Download PDFInfo
- Publication number
- CN110692077A CN110692077A CN201780091446.1A CN201780091446A CN110692077A CN 110692077 A CN110692077 A CN 110692077A CN 201780091446 A CN201780091446 A CN 201780091446A CN 110692077 A CN110692077 A CN 110692077A
- Authority
- CN
- China
- Prior art keywords
- stock price
- information
- group
- text information
- function
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 44
- 238000004364 calculation method Methods 0.000 claims abstract description 39
- 230000007423 decrease Effects 0.000 claims abstract description 25
- 230000006870 function Effects 0.000 claims description 84
- 238000000034 method Methods 0.000 description 23
- 238000004891 communication Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 6
- 238000000605 extraction Methods 0.000 description 6
- 230000000630 rising effect Effects 0.000 description 6
- 238000001514 detection method Methods 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/06—Asset management; Financial planning or analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0283—Price estimation or determination
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Development Economics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Technology Law (AREA)
- Human Resources & Organizations (AREA)
- Operations Research (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
从股价相关信息中读取股价上涨和下跌两方面的概率,并预测股价的未来趋势。股价分析装置具备:获取部,用于获取股价相关信息;第1计算部,用于根据第1函数计算股价未来上涨度,其中第1函数学习当输入在预定时期内上涨的第1组股价相关信息时和当输入在预定时期内下跌的第2组股价相关信息时输出不同数值;第2计算部,用于根据第2函数计算股价未来下跌度,其中第2函数学习当输入第1组股价相关信息时和当输入第2组股价相关信息时输出不同的数值,并且使其相对于第1组股价相关信息及第2组股价相关信息来说具有与第1函数不同的依存关系;以及第3计算部,用于通过组合上涨度与下跌度,来计算用于预测股价未来趋势的得分。
Description
技术领域
本发明涉及一种股价分析装置。
背景技术
传统上,根据公司财务信息与新闻信息来预测该公司股价的未来趋势。对股价未来趋势的预测是预测股价上涨的概率,或者预测股价下跌的概率。
例如,在下述专利文献1中,记载了投资判断支持信息提供装置,该装置根据通过统计处理各个公司的新闻报道和股价波动之间的关系而得到的统计信息、以及与某个公司相关的报道数据,将用于支持股票投资判断的信息添加到报道数据中。
在先技术文献
[专利文献]
[专利文献1]日本特开2005-100221号公报
[发明概要]
[发明所要解決的课题]
当根据股价的相关信息预测股价的未来趋势时,分析过去所记录的股价趋势与可能影响股价的信息之间的关系,当获取了与过去所记录的信息相类似的信息时,假设股价呈现与过去所记录的趋势相类似的变化,则可以预测股价的未来趋势。
但是,即使获取了与过去所记录的信息相类似的信息,股价也不一定会呈现与过去记录的趋势相似的变化。例如,即使获得乍一看预示股价上涨的信息时,也可能是与事实不同的信息,或表示股价过度上涨的信息。
因此,本发明的目的在于提供一种股价分析装置,其用于从股价相关信息中读取股价上涨和下跌两方面的概率,并预测股价的未来趋势。
[用于解决课题的方案]
本发明的一种形态所涉及的股价分析装置,其具备:获取部,用于获取股价相关信息;第1计算部,用于根据第1函数计算股价未来上涨度,其中第1函数学习当输入在预定时期内上涨的第1组股价相关信息时和当输入在预定时期内下跌的第2组股价相关信息时输出不同数值;第2计算部,用于根据第2函数计算股价未来下跌度,其中第2函数学习当输入第1组股价相关信息时和当输入第2组股价相关信息时输出不同的数值,并且使其相对于第1组股价相关信息及第2组股价相关信息来说具有与第1函数不同的依存关系;以及第3计算部,用于通过组合上涨度与下跌度,来计算用于预测股价未来趋势的得分。
根据本形态,由第1计算部根据股价相关信息计算股价上涨度,由第2计算部根据股价相关信息计算股价下跌度,对其进行组合后计算得分,从股价相关信息中读取股价上涨与下跌两方面的概率,从而可以预测股价的未来趋势。
在上述形态中,获取部获取与股价相关的数值信息和文本信息,并进一步具备分类部,该分类部利用根据第1组股价相关的文本信息和第2组股价相关的文本信息进行学习的分类器,将通过获取部获取的文本信息分类成第1组文本信息或第2组文本信息;第1计算部将根据分类部的分类结果量化的文本信息的数值输入第1函数,以计算上涨度;第2计算部将根据分类部的分类结果量化的文本信息的数值输入第2函数,以计算下跌度。
根据本形态,通过量化与股价相关的文本信息,并将其和与股价相关的数值信息一起输入至第1函数和第2函数中,从而可以根据更多种类的信息来预测股价的未来趋势。
在上述形态中,分类部可以使用分类器,对由获取部所获取的文本信息进行分类,其中,分类器学习将过去所记录的第1组股价相关的文本信息分类为第1组文本信息、将过去所记录的第2组股价相关的文本信息分类为第2组文本信息。
根据本形态,无论文本信息的内容如何,通过分类器的学习以使其将第1组股价相关的文本信息分类为第1组文本信息以及将第2组股价相关的文本信息分类为第2组文本信息,从而可以正确地评估文本信息对所预示的股价的影响。
在上述形态中,分类部可以通过使用分类器,对文本信息进行分类;其中,分类器相对于第1组股价与第2组股价,自与该股价的过去趋势比较发生相对较大变化的时刻起,根据过去所记录的第1组股价相关的文本信息与第2组股价相关的文本信息而进行学习。
根据本形态,通过与股价的过去趋势比较发生相对较大变化的时刻来确定事件发生日,使用事件发生日之前所记录的文本信息来使分类器学习,并且可以准确地判断是否应将文本信息分类成第1组或第2组中的一个。
在上述形态中,数值信息包括与股价相关的财务信息,文本信息包括与股价相关的新闻信息和与股价相关的声誉信息中的至少一个,第3计算部可以计算与新闻信息、财务信息和声誉信息中任意一个相对应的得分。
根据本形态,通过计算与多个信息源相对应的多个得分,可以从多个不同的观点来预测股价的未来趋势。
[发明效果]
根据本发明,提供了一种股价分析装置,其用于从股价相关信息中读取股价上涨和下跌两方面的概率,并预测股价的未来趋势。
[附图说明]
[图1]是示出本发明实施方式所涉及的股价分析装置的网络配置的图。
[图2]是示出本发明实施方式所涉及的股价分析装置的物理配置的图。
[图3]是本发明实施方式所涉及的股价分析装置的功能框图。
[图4]是通过本发明实施方式所涉及的股价分析装置来执行的得分计算处理的流程图。
[图5]是通过本发明实施方式所涉及的股价分析装置来执行的分类器学习处理的流程图。
[图6]是通过本发明实施方式所涉及的股价分析装置来执行的第1函数和第2函数学习处理的流程图。
[图7]是示出本发明实施方式所涉及的股价分析装置计算出的得分和股价变化的图表。
[图8]是通过本发明实施方式所涉及的股价分析装置来执行的领先度计算处理的流程图。
[具体实施方式]
参考附图,对本发明的实施方式进行说明。此外,在各图中,带有相同符号的装置具有相同或相似的结构。
图1是示出本发明实施方式所涉及的股价分析装置10的网络配置的图。根据本实施方式所涉及的股价分析装置10经由通信网络N连接至IR(Investor Relations)信息服务器20、新闻发布服务器30、SNS(Social Networking Service)服务器40以及股价相关信息数据库DB。股价分析装置10基于从IR信息服务器20、新闻发布服务器30、SNS服务器40以及股价相关信息数据库DB中获取的股价相关信息,来计算用于预测股价的未来趋势的得分。此外,在图1中,分别示出了一台IR信息服务器20、一台新闻发布服务器30、一台SNS服务器40以及一台股价相关信息数据库DB,但是,也可以多台IR信息服务器20、新闻发布服务器30、SNS服务器40以及股价相关信息数据库DB连接至通信网络N。
通信网络N是有线通信网络或无线通信网络,例如可以是互联网。IR信息服务器20是用于披露公司IR信息的服务器。IR信息是针对投资者的公告信息,包括与每季度结算相关的财务信息、以及与公司经营方针相关的信息等。新闻发布服务器30是用于发布与股价相关的新闻信息的服务器。与股价相关的新闻信息包括与公司经营相关的新闻和与业绩相关的新闻等。此外,新闻信息有时包括IR信息,但是区别在于IR信息是由公司发布的信息,而新闻信息是由新闻机构发布的信息。
SNS服务器40是用于提供与SNS用户的投稿数据相关的信息的服务器。股价分析装置10可以通过使用例如API(Application Program Interface),从SNS服务器40中获取与投稿数据相关的信息。更具体地说,股价分析装置10例如可以从SNS服务器40获取包括股价相关的特定关键词在内的投稿数据。所获取的投稿数据例如包括股价相关的声誉信息。股价相关的声誉信息包括股价相关的传闻与个人观点等。股价相关信息数据库DB是用于将过去所记录的股价与该股价相关的IR信息、新闻信息和声誉信息一起存储的数据库。
图2是示出本发明实施方式所涉及的股价分析装置10的物理配置的图。股价分析装置10具有相当于硬件处理器的CPU(Central Processing Unit)10a、相当于存储器的RAM(Random Access Memory)10b、相当于存储器的ROM(Read only Memory)10c、通信部10d、输入部10e以及显示部10f。这些组件经由总线相互连接,以便可以发送和接收数据。
CPU 10a是用于进行与存储在RAM 10b或ROM 10c中的程序执行相关的控制、数据运算及加工的控制部。CPU 10a是用于执行股价分析相关的程序(股价分析程序)的运算装置。CPU 10a从输入部10e和通信部10d接收各种输入数据,将输入数据的运算结果显示在显示部10f上,或者将其存储在RAM 10b和ROM 10c中。
RAM 10b是能够重写数据的存储部,例如由半导体存储元件组成。RAM 10b用于存储由CPU 10a执行的应用等程序和数据。
ROM 10c是只能读取数据的存储部,例如由半导体存储元件组成。ROM 10c用于存储例如固件等程序和数据。
通信部10d是用于将股价分析装置10连接到通信网络N的接口,例如,连接至通过有线网络或无线网络的数据传输路径配置而成的LAN(Local Area Network)、WAN(WideArea Network)、互联网等的通讯网络N中。
输入部10e用于接收来自用户的数据输入,例如由键盘、鼠标以及触摸面板构成。
显示部10f用于可视地显示CPU 10a的运算结果,例如由LCD(Liquid CrystalDisplay)构成。
股价分析程序可以通过存储在RAM 10b和ROM 10c等计算机的可读存储介质中来提供,或者可以经由通过通信部10d相连接的通信网络来提供。在股价分析装置10中,通过CPU 10a执行股价分析程序,从而可以实现用下图说明的各种功能。此外,这些物理配置是一个示例,也可以是非独立配置。例如,股价分析装置10可以具备CPU 10a、RAM 10b和ROM10c一体化的LSI(Large-Scale Integration)。
图3是本发明实施方式所涉及的股价分析装置10的功能框图。股价分析装置10包括获取部11、计算部12、提取部13、分类部14以及检测部15。
获取部11获取与股价相关的信息。在这里,与股价相关的信息,不单单是指与特定股票相关的信息,还包括与股价指数相关的信息以及与整个行业相关的信息等,即可以影响市场的信息。获取部11可以获取与股价相关的数值信息和文本信息。在这里,数值信息包括与股价相关的财务信息,文本信息可以包括与股价相关的新闻信息和与股价相关的声誉信息中的至少一个。获取部11可以经由通信网络N从IR信息服务器20获取财务信息,从新闻发布服务器30获取新闻信息,并且从SNS服务器40获取声誉信息。另外,获取部11可以从股价相关信息数据库DB中获取过去所记录的股价相关信息。
计算部12包括第1计算部12a、第2计算部12b、第3计算部12c以及第4计算部12d。第1计算部12a根据第1函数计算股价未来上涨度,其中,第1函数学习当输入在预定时期内上涨的第1组股价相关信息时与当输入在预定时期内下跌的第2组股价相关信息时输出不同数值。在这里,所谓上涨度,是指对股价未来上涨的概率进行量化的数值。后面将详细说明第1函数。另外,可以任意设定预定时期,例如,一年。
第2计算部12b根据第2函数计算股价未来下跌度,其中,第2函数学习当输入第1组股价相关信息时与当输入第2组股价相关信息时输出不同的数值,并且相对于第1组股价相关信息及第2组股价相关信息来说具有与第1函数不同的依存关系。更具体地说,第2计算部12b根据第2函数计算股价未来下跌度,其中,第2函数学习为相对于第1组股价相关信息与第2组股价相关信息来说具有与第1函数相反的依存关系。在这里,所谓下跌度,是指对股价未来下跌的概率进行量化的数值。后面将详细说明第2函数。
第3计算部12c,用于通过组合股价未来上涨度与下跌度,来计算用于预测股价未来趋势的得分。更具体地说,第3计算部12c根据股价未来上涨度与下跌度的差值来计算得分。另外,第3计算部12c可以计算与财务信息、新闻信息和声誉信息中任意一个相对应的得分。也就是说,第3计算部12c可以计算与信息源相对应的多种得分。
第4计算部12d计算得分相对于股价的领先度。领先度是用于表示得分领先股价多少天的数值。后面将详细说明领先度。
提取部13在预定期间所记录的多个股价中,从价格涨跌率处于高位的股票中抽取第1组股票,从涨跌率处于低位的股票中抽取第2组股票。提取部13可以从涨跌率不小于高位1σ(1个标准偏差)的股票、且波动率为高位的股票中提取第1组算式。在这里,涨跌率的标准偏差可以是整个上市股票的涨跌率分布的标准偏差。另外,还可以从价格涨跌率不大于低位-1σ(-1个标准偏差)的股票、且波动率为高位的股票中提取第2组股票。在本说明书中,第1组股票的价格被称为第1组股价,第2组股票的价格被称为第2组股价。
分类部14利用根据第1组股价相关的文本信息与第2组股价相关的文本信息进行学习的分类器,将通过获取部11获取的文本信息分类为第1组文本信息或第2组文本信息。在这里,第1组文本信息是被判断为预示股价上涨的文本信息,第2组文本信息是被判断为预示股价下跌的文本信息。分类部14使用分类器,对由获取部11所获取的文本信息进行分类,其中,分类器学习将过去所记录的第1组股价相关的文本信息分类为第1组文本信息、将过去所记录的第2组股价相关的文本信息分类为第2组文本信息。
第1计算部12a将根据分类部14的分类结果对文本信息进行量化后的数值输入第1函数,计算出上涨度。更具体地说,第1计算部12a将通过第1组文本信息占整体信息的比率与第2组文本信息占整体信息的比率来量化文本信息后的数值输入第1函数,计算出上涨度。另外,第2计算部12b将根据分类部14的分类结果对文本信息进行量化后的数值输入第2函数,计算出下跌度。更具体地说,第2计算部12b将通过第1组文本信息占整体信息的比率与第2组文本信息占整体信息的比率来量化文本信息后的数值输入第2函数,计算出下跌度。
检测部15对于第1组股价与第2组股价,检测出与该股价的过去趋势比较发生相对较大变化的时刻。分类部14可以使用分类器对文本信息进行分类,其中,分类器自检测部15检测出的时刻起,根据过去所记录的第1组股价相关的文本信息及第2组股价相关的文本信息进行学习。
图4是通过本发明实施方式所涉及的股价分析装置10来执行的得分计算处理的流程图。得分计算处理是一种通过使用预先学习的分类器、第1函数和第2函数来计算用于预测股价的未来趋势的得分的处理。
首先,股价分析装置10通过获取部11来获取与股价相关的数值信息和文本信息(S10)。在这里,可以将数值信息标准化。数值信息的标准化,例如,可以通过将数值在0至1的范围内切换来执行。但是,也可以不对数值信息进行标准化处理。
股价分析装置10通过分类部14将文本信息分类为第1组文本信息或第2组文本信息(S11)。分类部14,例如,可以通过使用预先学习的朴素贝叶斯分类器将文本信息分类为第1组文本信息或第2组文本信息。但是,分类部14可以使用任意分类器对文本信息进行分类。
股价分析装置10通过利用第1组文本信息占整体信息的比率与第2组文本信息占整体信息的比率来量化文本信息(S12)。例如,当获取N条(N是任意自然数)文本信息时,通过分类部14将N1条(N1≤N)文本信息分类为第1组、并且将N2条(N2=N-N1)的文本信息分类为第2组时,股价分析装置10通过p1=N1/N来计算出第1组文本信息占整体信息的比率,以及通过p2=N2/N来计算出第2组文本信息占整体信息的比率。
在股价分析装置10中,由第1计算部12a根据第1函数来计算上涨度(S13)。上涨度可以是第1函数的数值。当将i条(i是任意自然数)数值信息表示为x1,x2,...,xi,并且将第1组文本信息占整体信息的比率表示为p1、将第2组文本信息占整体信息的比率表示为p2时,则第1函数为f1(x1,x2,...,xi,p1,p2)=a1×x1+a2×x2+...+ai×xi+b1×p1+b2×p2。在这里,a1,a2,...,ai,b1,b2是通过已预先执行的学习处理来确定的系数。第1函数的函数形式不限于上述形式,还可以采用非线性函数。
在股价分析装置10中,由第2计算部12b根据第2函数计算下跌度(S14)。下跌度可以是第2函数的数值。当将i条(i是任意自然数)数值信息表示为x1,x2,...,xi,并且将第1组文本信息占整体信息的比率表示为p1、将第2组文本信息占整体信息的比率表示为p2时,则第2函数为f2(x1,x2,...,xi,p1,p2)=c1×x1+c2×x2+...+ci×xi+d1×p1+d2×p2。在这里,c1,c2,...,ci,d1,d2是通过已预先执行的学习处理来确定的系数。第2函数的函数形式不限于上述形式,还可以采用非线性函数。
此外,股价分析装置10可以分信息源计算出量化文本信息后的数值。例如,当获取部11从新闻发布服务器30获取K条(K是任意自然数)新闻信息、并且从SNS服务器40获取L条(L是任意自然数)声誉信息时,文本信息可以按照下述方式进行量化。首先,分类部14将新闻信息分类为K1条(K1≤K)第1组新闻信息和K2条(K2=K-K1)第2组新闻信息,并且将声誉信息分类为L1条(L1≤L)第1组声誉信息和L2条(L2=L-L1)第2组声誉信息。然后,通过K1/K计算出第1组新闻信息占整体信息的比率,通过K2/K计算出第2组新闻信息占整体信息的比率,通过L1/L计算出第1组声誉信息占整体信息的比率,通过L2/L计算出第2组声誉信息占整体信息的比率。
分信息源计算出量化文本信息后的数值,并且当量化文本信息后的数值有j个(j是任意自然数)并表示为p1,p2,...,pj时,则第1函数为f1(x1,x2,...,xi,p1,p2,...,pj)=a1×x1+a2×x2+...+ai×xi+b1×p1+b2×p2+..bj×pj。在这里,a1,a2,...,ai,b1,b2,...,bj是通过已预先执行的学习处理来确定的系数。另外,第2函数为f2(x1,x2,...,xi,p1,p2,...,pj)=c1×x1+c2×x2+...+ci×xi+d1×p1+d2×p2+...+dj×pj。在这里,c1,c2,...,ci,d1,d2,...,dj是通过已预先执行的学习处理来确定的系数。
第1计算部12a可以使用由多个信息源分别定义的多个第1函数,来计算出与多个信息源相对应的多个上涨度。同样地,第2计算部12b可以使用由多个信息源分别定义的多个第2函数,来计算出与多个信息源相对应的多个下跌度。例如,可以将与数值信息x1,x2,...,xi相对应的第1函数作为g1(x1,x2,...,xi)=a1×x1+a2×x2+...+ai×xi,可以将与数值信息相对应的第2函数作为g2(x1,x2,...,xi)=c1×x1+c2×x2+...+ci×xi。另外,当将量化新闻信息后的数值表示为p1、p2时,可以将与新闻信息相对应的第1函数作为h1(p1,p2)=b1×p1+b2×p2,将与新闻信息相对应的第2函数作为h2(p1,p2)=d1×p1+d2×p2。与声誉信息相对应的第1函数和第2函数可以具有与新闻信息相对应的第1函数和第2函数相同的配置。
在股价分析装置10中,由第3计算部12c根据上涨度与下跌度的差值来计算出用于预测股价未来趋势的得分(S15)。第3计算部12c可以通过第1函数的数值和第2函数的数值间的差值即f1-f2,来计算出得分。
当计算多个信息源中的每一个信息源的得分时,例如,可以通过与数值信息相对应的第1函数g1和第2函数g2间的差值g1-g2来计算出与数值信息相对应的得分。另外,可以通过与新闻信息相对应的第1函数h1和第2函数h2间的差值h1-h2来计算出与新闻信息相对应的得分。在计算与声誉信息相对应的得分时,也是如此。
股价分析装置10判断所计算出的得分是否满足预定条件(S16)。在这里,所谓预定条件,例如,可以是得分超过上阈值或低于下阈值的条件,也可以是得分符号反转的条件,或者对得分进行标准化后的指标值超过上阈值或低于下阈值的条件。在这里,对得分进行标准化后的指标值,可以是从得分数值中减去得分平均值,并将结果除以得分标准偏差后获得的数值。当计算多个信息源中的每一个信息源的得分时,可以为多个得分中的每一个设定预定条件以判断是否满足条件。当计算多个得分时,预定条件可以根据多种得分之间的关系进行确定。例如,预定条件可以是2种得分之间大小关系发生反转的条件。
当计算出的得分满足预定条件时(S16:Yes),股价分析装置10向用户发送通知信号(S17)。另一方面,当计算出的得分不满足预定条件时(S16:No),则结束处理。至此,通过本实施方式所涉及的股价分析装置10完成了得分计算处理。
根据本实施方式所涉及的股价分析装置10,由第1计算部12a根据股价相关信息计算股价上涨度,由第2计算部12b根据股价相关信息计算股价下跌度,对其进行组合后计算得分,从股价相关信息中读取股价上涨与下跌两方面的概率,从而可以预测股价的未来趋势。
另外,通过量化与股价相关的文本信息,并将其和与股价相关的数值信息一起输入至第1函数和第2函数中,从而可以根据更多种类的信息来预测股价的未来趋势。
进一步地,通过计算与多个信息源相对应的多个得分,可以从多个不同的观点来预测股价的未来趋势。
图5是通过本发明实施方式所涉及的股价分析装置10来执行的分类器学习处理的流程图。分类器的学习处理是根据过去所记录的文本信息,使分类部14所使用的分类器进行学习的处理。
首先,在股价分析装置10中,由提取部13从过去所记录的股价中价格涨跌率不小于高位1σ的股票中提取第1组股票(S20)。另外,在股价分析装置10中,由提取部13从过去所记录的股价中价格涨跌率不大于低位-1σ的股票中提取第2组股票(S21)。如此一来,根据预定标准提取第1组股票和第2组股票,从而可以在排除人为影响的情况下使分类器进行学习,并且可以更客观地分类文本信息。当然,第1组股票和第2组股票的提取不一定由提取部13执行,也可以根据用户的指定来执行。
股价分析装置10将第1标签赋给与第1组股票价格即第1组股价相关的文本信息(S22),并且将第2标签赋给与第2组股票价格即第2组股价相关的文本信息(S23)。在这里,第1标签是用于预示股价上涨的标签,第2标签是用于预示股价下跌的标签。
然后,股价分析装置10通过检测部15对于第1组股价与第2组股价,检测出与该股价的过去趋势比较发生相对较大变化的时刻以作为事件发生日。具体而言,将股价从移动平均线升至不小于3σ(3个标准偏差)的日期指定为事件发生日,或将股价从移动平均线降至不大于-3σ(-3个标准偏差)的日期指定为事件发生日(S24)。在这里,可以使用任意天数的移动平均数,例如可以使用25天的移动平均数。
股价分析装置10根据自事件发生日起过去所记录的、与第1组股价相关的文本信息和与第2组股价相关的文本信息,使分类器进行学习(S25)。具体而言,使分类器进行学习,以便将被赋予第1标签的文本信息分类为第1组文本信息,将被赋予第2标签的文本信息分类为第2组文本信息。也就是说,股价分析装置10可以使分类器进行学习,以便将过去所记录的与第1组股价相关的文本信息分类为第1组文本信息,并且将过去所记录的与第2组股价相关的文本信息分类为第2组文本信息。通过以上步骤,完成了分类器的学习处理。
根据本实施方式所涉及的股价分析装置10,无论文本信息的内容如何,通过分类器的学习以使其将第1组股价相关的文本信息分类为第1组文本信息以及将第2组股价相关的文本信息分类为第2组文本信息,从而可以正确地评估文本信息对所预示的股价的影响。
另外,通过与股价的过去趋势比较发生相对较大变化的时刻来确定事件发生日,使用事件发生日之前所记录的文本信息来使分类器学习,从而在事件发生之前通过所出现的趋势中所包含的文本信息使分类器进行学习,并且可以准确地判断是否应将文本信息分类成第1组或第2组中的一个。
图6是通过本发明实施方式所涉及的股价分析装置10来执行的第1函数和第2函数学习处理的流程图。第1函数及第2函数的学习处理是分别对第1计算部12a和第2计算部12b所使用的第1函数和第2函数进行学习的处理。具体而言,是执行线性回归分析的处理,包括用于确定第1函数f1的系数a1,a2,...,ai,b1,b2等的处理、以及用于确定第2函数f2的系数c1,c2,...,ci,d1,d2等的处理。
股价分析装置10学习第1函数,以便当输入在预定时期内上涨的第1组股价相关信息时与当输入在预定时期内下跌的第2组股价相关信息时输出不同数值。具体而言,学习第1函数,以使其当输入第1组股价相关信息时输出1,当输入第2组股价相关信息时输出0(S30)。也就是说,当第1函数表示为f1(x1,x2,...,xi,p1,p2)=a1×x1+a2×x2+...+ai×xi+b1×p1+b2×p2时,代入第1组股价相关信息x1,x2,...,xi,p1,p2,并且施加1=a1×x1+a2×x2+...+ai×xi+b1×p1+b2×p2的条件,代入第2组股价相关信息x1,x2,...,xi,p1,p2,并且施加0=a1×x1+a2×x2+...+ai×xi+b1×p1+b2×p2的条件,以确定系数a1,a2,...,ai,b1,b2。
另外,股价分析装置10学习第2函数,以便当输入第1组股价相关信息时与当输入第2组股价相关信息时输出不同的数值,并且使其相对于第1组股价相关信息及第2组股价相关信息来说具有与第1函数不同的依存关系。根据本实施方式所涉及的股价分析装置10学习第2函数,从而使其相对于第1组股价相关信息与第2组股价相关信息来说具有与第1函数相反的依存关系。具体而言,学习第2函数,以使其当输入第1组股价相关信息时输出0,当输入第2组股价相关信息时输出1(S31)。也就是说,当第2函数表示为f2(x1,x2,...,xi,p1,p2)=c1×x1+c2×x2+...+ci×xi+d1×p1+d2×p2时,代入第1组股价相关信息x1,x2,...,xi,p1,p2,并且施加0=c1×x1+c2×x2+...+ci×xi+d1×p1+d2×p2的条件,代入第2组股价相关信息x1,x2,...,xi,p1,p2,并且施加1=c1×x1+c2×x2+...+ci×xi+d1×p1+d2×p2的条件,以确定系数c1,c2,...,ci,d1,d2。如此一来,完成了第1函数和第2函数的学习处理。
根据本实施方式所涉及的股价分析装置10,学习第1函数和第2函数,以使其与第1组股价相关信息和第2组股价相关信息具有相反的依存关系,从而能够以共同的标准评估股价的上涨度与下跌度。
图7是示出本发明实施方式所涉及的股价分析装置10计算出的得分和股价变化的图表。在同一图中,纵轴表示得分值及标准化的股价值,横轴表示日期。在图表中,实线表示股价SP,虚线表示与声誉信息相对应的第1得分SC1,单点划线表示与财务信息相对应的第2得分SC2,双点划线表示与新闻信息相对应的第3得分SC3。另外,向上箭头表示得分所预示的股价未来趋势变化的时刻以作为第1时刻T1、第2时刻T2、第3时刻T3和第4时刻T4。
在第1时刻T1,与新闻信息相对应的第3得分SC3先于股价SP之前下降。在此,与声誉信息相对应的第2得分SC2几乎与股价SP同时下降,并且与财务信息相对应的第1得分SC1在该季度中没有变化,因此也没有变化。例如,这可以解释为在报告负面新闻信息之后股价SP已经下跌,并且声誉信息可以解释为包括谣传股价SP已经下跌的信息。
在第2时刻T2,与新闻信息相对应的第3得分SC3在与财务信息相对应的第1得分SC1下降之前下降,此后股价SP下降。这可以解释为股价SP下降,例如,新闻信息包括向下修正业绩等负面预测、公司公布的财务信息实际上包括向下修正。
在第3时刻T3,与声誉信息相对应的第2得分SC2先于股价SP之前下降。这可以解释为股价SP实际上在逐渐下降,例如,在有关股价SP的利空谣言在互联网上流传开来之后。
在第4时刻T4,按照与新闻信息相对应的第3得分SC3、与财务信息相对应的第1得分SC1、以及与声誉信息相对应的第2得分SC2的顺序恢复得分。此后,股价SP也开始恢复。这可以解释为股价SP实际上在逐渐上涨:例如,新闻信息包括向上修正业绩等积极的预测、公司公布的财务信息实际上包括向上修正、以及在有关股价SP的利好传言在互联网上流传开来之后。
如上所述,根据本实施方式所涉及的股价分析装置10,可以先于股价变化之前计算出得分。另外,可以计算出与多个信息源相对应的多个得分,并根据信息源的特性进行股价预测。
图8是通过本发明实施方式所涉及的股价分析装置10来执行的领先度计算处理的流程图。领先度的计算处理是计算用于表示得分领先于股价多少的领先度的处理。
股价分析装置10计算仅仅使得分滞后预定天数的滞后得分(S40)。例如,股价分析装置10可以以10天为单位,计算最多可以滞后100天的10种滞后得分。
然后,股价分析装置10计算滞后得分与股价之间的一致度(S41)。在这里,滞后得分与股价之间的一致度可以根据滞后得分与标准化股价之间的差值来计算。例如,当以10天为单位计算最多可以滞后100天的10种滞后得分时,可以分别计算这10种滞后得分中的每一个与股价的一致度。
股价分析装置10确定一致度最高的滞后天数(S42)。例如,当以10天为单位计算最多可以滞后100天的10种滞后得分时,在这10种滞后得分中确定所计算出的一致度最高的滞后得分,并且可以将该确定后的滞后得分的滞后天数指定为一致度最高的滞后天数。
在股价分析装置10中,由第4计算部12d计算得分相对于股价的领先度(S43)。领先度可以是一致度最高的滞后天数,也可以是将滞后天数指数化后的数值。这样就完成了领先度的计算处理。
根据本实施方式所涉及的股价分析装置10,通过计算领先度,可以掌握得分领先于股价多少,并且根据投资时间跨度来分开使用得分。
上述实施方式是为了促进对本发明的理解,而并非用以限制本发明。实施方式中所具备的每个元件及其配置、材料、条件、形状以及尺寸等并不限于这些例示的内容,还可以适当地变更。另外,还可以部分替换或相互组合在不同实施方式中示出的这些结构。
Claims (5)
1.一种股价分析装置,其具备:
获取部,用于获取股价相关信息;
第1计算部,用于根据第1函数计算所述股价未来上涨度,其中第1函数学习当输入在预定时期内上涨的第1组股价相关信息时和当输入在所述预定时期内下跌的第2组股价相关信息时输出不同数值;
第2计算部,用于根据第2函数计算所述股价未来下跌度,其中第2函数学习当输入所述第1组股价相关信息时和当输入所述第2组股价相关信息时输出不同的数值,并且使其相对于所述第1组股价相关信息及所述第2组股价相关信息来说具有与所述第1函数不同的依存关系;
以及第3计算部,用于通过组合所述上涨度与所述下跌度,来计算用于预测所述股价未来趋势的得分。
2.根据权利要求1所述的股价分析装置,
所述获取部获取与所述股价相关的数值信息和文本信息,
并进一步具备分类部,该分类部利用根据所述第1组股价相关的文本信息和所述第2组股价相关的文本信息进行学习的分类器,将通过所述获取部获取的所述文本信息分类成第1组文本信息或第2组文本信息;
所述第1计算部将根据所述分类部的分类结果量化的所述文本信息的数值输入所述第1函数,以计算所述上涨度;
所述第2计算部将根据所述分类部的分类结果量化的所述文本信息的数值输入所述第2函数,以计算所述下跌度。
3.根据权利要求2所述的股价分析装置,
所述分类部使用所述分类器,对由所述获取部所获取的所述文本信息进行分类,其中,所述分类器学习将过去所记录的所述第1组股价相关的文本信息分类为所述第1组文本信息、将过去所记录的所述第2组股价相关的文本信息分类为所述第2组文本信息。
4.根据权利要求2或3所述的股价分析装置,
所述分类部通过使用所述分类器,对所述文本信息进行分类,其中,所述分类器相对于所述第1组股价与所述第2组股价,自与该股价的过去趋势比较发生相对较大变化的时刻起,根据过去所记录的所述第1组股价相关的文本信息与所述第2组股价相关的文本信息而进行学习。
5.根据权利要求2至4中任意一项所述的股价分析装置,
所述数值信息包括与所述股价相关的财务信息,
所述文本信息包括与所述股价相关的新闻信息和与所述股价相关的声誉信息中的至少一个,
所述第3计算部可以计算与所述新闻信息、所述财务信息和所述声誉信息中任意一个相对应的所述得分。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2017/019943 WO2018220685A1 (ja) | 2017-05-29 | 2017-05-29 | 株価分析装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110692077A true CN110692077A (zh) | 2020-01-14 |
Family
ID=64455780
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201780091446.1A Pending CN110692077A (zh) | 2017-05-29 | 2017-05-29 | 股价分析装置 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20200098047A1 (zh) |
EP (1) | EP3633586A4 (zh) |
JP (1) | JP6774567B2 (zh) |
CN (1) | CN110692077A (zh) |
CA (1) | CA3049848A1 (zh) |
WO (1) | WO2018220685A1 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7364228B2 (ja) * | 2020-03-31 | 2023-10-18 | 久美子 石井 | 情報処理装置、その制御方法、プログラム、ならびに、学習済モデル |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7467108B2 (en) * | 2002-01-18 | 2008-12-16 | Ron Papka | System and method for predicting security price movements using financial news |
JP2005100221A (ja) | 2003-09-26 | 2005-04-14 | Nomura Research Institute Ltd | 投資判断支援情報提供装置および方法 |
-
2017
- 2017-05-29 EP EP17911534.0A patent/EP3633586A4/en not_active Withdrawn
- 2017-05-29 CA CA3049848A patent/CA3049848A1/en active Pending
- 2017-05-29 CN CN201780091446.1A patent/CN110692077A/zh active Pending
- 2017-05-29 WO PCT/JP2017/019943 patent/WO2018220685A1/ja active Application Filing
- 2017-05-29 JP JP2019521548A patent/JP6774567B2/ja active Active
-
2019
- 2019-11-27 US US16/697,959 patent/US20200098047A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
JPWO2018220685A1 (ja) | 2019-12-19 |
EP3633586A4 (en) | 2020-10-28 |
WO2018220685A1 (ja) | 2018-12-06 |
EP3633586A1 (en) | 2020-04-08 |
CA3049848A1 (en) | 2018-12-06 |
JP6774567B2 (ja) | 2020-10-28 |
US20200098047A1 (en) | 2020-03-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Boz et al. | Global trade and the dollar | |
CN109145215B (zh) | 网络舆情分析方法、装置及存储介质 | |
JP6703031B2 (ja) | キーワードと資産価格との関連性評価方法及びその装置及び資産情報のディスプレイ方法 | |
CN103154991A (zh) | 信用风险采集 | |
US10067964B2 (en) | System and method for analyzing popularity of one or more user defined topics among the big data | |
US20230237055A1 (en) | Method and system for analytic based connections among user types in an online platform | |
US9269057B1 (en) | Using specialized workers to improve performance in machine learning | |
US20150339600A1 (en) | Method and system for analysing data | |
CN110852785B (zh) | 用户分级方法、装置及计算机可读存储介质 | |
CN104951843A (zh) | 销量预测系统及方法 | |
Javedani Sadaei et al. | Multilayer stock forecasting model using fuzzy time series | |
Lu et al. | The effects and applicability of financial media reports on corporate default ratings | |
US10719561B2 (en) | System and method for analyzing popularity of one or more user defined topics among the big data | |
Park et al. | Information fusion of stock prices and sentiment in social media using Granger causality | |
Bartolucci et al. | Ranking scientific journals via latent class models for polytomous item response data | |
CN110692077A (zh) | 股价分析装置 | |
CN116523622A (zh) | 对象风险预测方法和装置、电子设备及存储介质 | |
Farooq et al. | Revenue generation from recommendation system using sentimental analysis | |
CN115034762A (zh) | 一种岗位推荐方法、装置、存储介质、电子设备及产品 | |
JP2023170924A (ja) | 情報処理方法、情報処理装置およびプログラム | |
US20180189699A1 (en) | A method and system for locating regulatory information | |
CN112434083A (zh) | 一种基于大数据的事件处理方法和装置 | |
CA3137134A1 (en) | Company size estimation system | |
US20220358150A1 (en) | Natural language processing and machine-learning for event impact analysis | |
CN117391367A (zh) | 保单任务的分配方法、装置、终端设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200114 |