CN107480857A - 一种股票基因库诊断方法及系统 - Google Patents
一种股票基因库诊断方法及系统 Download PDFInfo
- Publication number
- CN107480857A CN107480857A CN201710558224.8A CN201710558224A CN107480857A CN 107480857 A CN107480857 A CN 107480857A CN 201710558224 A CN201710558224 A CN 201710558224A CN 107480857 A CN107480857 A CN 107480857A
- Authority
- CN
- China
- Prior art keywords
- stock
- unit
- factor
- storehouse
- client
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0637—Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Economics (AREA)
- Databases & Information Systems (AREA)
- Strategic Management (AREA)
- Fuzzy Systems (AREA)
- Educational Administration (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Computational Linguistics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Software Systems (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Mathematical Physics (AREA)
- Quality & Reliability (AREA)
- Technology Law (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Tourism & Hospitality (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明提供了一种股票基因库诊断方法及系统,系统包括:客户端和服务器端,在所述客户端,用以设置用户基本信息,在所述服务器端包括:数据采集单元、因子库单元、因子特征单元、订单管理单元,所述数据采集单元,用以获取股票实时数据和/或期货实时数据,所述因子库单元,用以按照设定因子建立一因子库,所述因子特征单元,用以对所述因子库进行分组,得到所述分组内的股票因子特征,所述订单管理单元,用以按照所述股票因子特征向所述客户端推荐股票。本发明能够基于股票基因库进行诊断,从而实现辅助投资者判断该股票的投资风格、操作方向的功能。
Description
技术领域
本发明涉及计算机软件领域,特别涉及一种股票基因库诊断方法及系统。
背景技术
股票量化投资的重要模型是经济/金融学家创造和发展的。以在A股中大 行其道的多因子模型为例,1993年Eugene F.Fama和Kenneth R.French发 表了三因子模型,这是世界上第一个多因子模型,他们认为股票市值、账面市 值比和市场风险3个因子可以显著地解释股票价格的变动。比如,一些人会选 择估值低、基本面较好的股票,也许还会考虑过去一段时间的涨跌幅,这就涉 及了3个因子,然后选择上述三个方面表现都不错的股票买入。股票多因子量 化投资就是将上述人脑决策过程写成程序。
量化模型大致分为两派:P quant和Q quant。前者通常是股票量化投资, 使用统计工具,后者通常是利率/汇率衍生品量化投资,使用随机数学作为工 具。Q quant最擅长预测利率/汇率的未来走势,而这类方法恰好可以预测因 子的未来效果,筛选出未来有效因子之后,投资收益和信息比都显著提高,从 而静态多因子变成了动态多因子。
现有中的缺陷在于:
1)股票因子考虑维度并不全面,
2)缺少可辅助投资者判断研投资风格或操作方向的完善诊断。
发明内容
本发明要解决的技术问题是,提供一种可辅助投资者更好地进行投资和操 作的一种股票基因库诊断方法。
解决上述技术问题,本发明提供了一种股票基因库诊断系统,包括:客户 端和服务器端,在所述客户端,用以设置用户基本信息,
在所述服务器端包括:数据采集单元、因子库单元、因子特征单元、风险 管理单元,
所述数据采集单元,用以获取股票实时数据和/或期货实时数据,
所述因子库单元,用以按照设定因子建立一因子库,
所述因子特征单元,用以对所述因子库进行分组,得到所述分组内的股票 因子特征,
所述订单管理单元,用以按照所述股票因子特征向所述客户端推荐股票。
更进一步,所述因子库单元包括:第一因子库、第二因子库、第三因子库 以及第四因子库,
所述第一因子库,用以建立股票财务因子库,
所述第二因子库,用以建立股票资金因子库,
所述第三因子库,用以建立股票热度因子库,
所述第四因子库,用以建立股票第三方因子库。
更进一步,所述数据采集单元包括:股票单元、行情数据单元、期货单元,
所述股票单元,用以采集股票实时数据,
所述行情数据单元,用以采集行情实时数据,
所述期货单元,用以采集期货实时数据。
更进一步,所述订单管理单元包括:风险管理单元和订单统计单元,
所述风险管理单元,用以按照设定的风险控制规则和从所述因子特征单元 接收的因子特征,并管理订单,
所述订单统计单元,用以统计从所述客户端中提交的订单。
更进一步,所述因子特征单元包括:基因定义单元、基因分组单元、策略 执行单元、机器学习单元、投资建议单元,
所述基因定义单元,用以根据不同的维度定义得到股票基因,例如:根据 上述风险维度对股票数据进行数据统计,并通过多元回归方法将每只股票的风 险程度进行量化处理,最后得出股票的风险偏好。将股票可以按照极高风险、 高风险、风险中性、低风险、极低风险进行分组。
所述基因分组单元,用以按照所述股票基因将股票进行分组;策略的参数 包括样本长度、调仓频率、滑点设置、止盈止损、回测天数等策略实施过程中 所需的程序参数,同时还包括了客户的股票历史操作风格等数据。
所述策略执行单元,用以从所述客户端接收策略参数作为策略执行的规 则;
所述机器学习单元,用以根据机器学习算法对分组后的股票进行特征提 取;在本专利中采用了多种不同的机器学习算法,例如支持向量机、人工神经 网络、增强算法、决策树算法、遗传算法等。
所述投资建议单元,用以根据所述特征提取对股票风格进行判断与分类, 以及根据股票风格,以及投资者的投资风格和风险控制规则得到相应的投资建 议。
更进一步,所述客户端包括:账户管理单元、仓位管控单元、策略单元、 执行单元,
所述账户管理单元,用以提供投资者账户管理接口,
所述仓位管控单元,用以提供投资者所选择的仓位管理、控制接口,
所述策略单元,用以提供策略参数,
所述执行单元,用以根据策略参数在客户端上的执行相应操作。
更进一步,系统还包括:管理员单元,用以提供在服务器端的诊断操作权 限,以及人工管理窗口。
更进一步,系统还包括:数据库/行情中心,用以作为所述服务器端的股 票数据源。
更进一步,上述客户端和服务器端通过StocKet套接字进行通信。
基于上述,本发明还提供了一种股票基因库诊断方法,包括如下步骤:
设置用户基本信息,
获取股票实时数据和/或期货实时数据,
按照设定因子建立一因子库,
对所述因子库进行分组,得到所述分组内的股票因子特征,
按照所述股票因子特征推荐股票。
本发明的有益效果:
在本发明中的股票基因库诊断系统,由于包括:客户端和服务器端,在所 述服务器端包括:数据采集单元、因子库单元、因子特征单元、风险管理单元, 可以在因子库单元中基于股票财务、资金、技术、指标、消息、热度等因子, 建立全部票的因子库。可以在因子特征单元中将股票按照不同的维度进行分 组,并且在所述因子特征单元通过机器学习和大数据技术分析每个分组内的股 票的所有因子,找出各个分组内股票因子的特征。通过匹配该股票和全部股票 的因子,挖掘出该股票具备的基因,再根据在所述订单管理单元中该股票的基 因诊断结果,辅助投资者判断该股票的投资风格、操作方向等。
附图说明
图1是本发明一实施例中的股票基因库诊断系统结构示意图;
图2是图1中的因子库单元结构示意图;
图3是图1中的数据采集单元结构示意图;
图4是图1中的订单管理单元结构示意图;
图5是图1中的因子特征单元结构示意图;
图6是图1中的客户端结构示意图;
图7是图1中系统的一优选实施例中的结构示意图;
图8是图1中系统的另一优选实施例中的结构示意图;
图9是本发明一实施例中的方法流程示意图;
图10是系统原理示意图;
图11是具体执行策略流程示意图。
具体实施方式
现在将参考一些示例实施例描述本公开的原理。可以理解,这些实施例仅 出于说明并且帮助本领域的技术人员理解和实施例本公开的目的而描述,而非 建议对本公开的范围的任何限制。在此描述的本公开的内容可以以下文描述的 方式之外的各种方式实施。
如本文中所述,术语“包括”及其各种变体可以被理解为开放式术语,其 意味着“包括但不限于”。术语“基于”可以被理解为“至少部分地基于”。 术语“一个实施例”可以被理解为“至少一个实施例”。术语“另一实施例” 可以被理解为“至少一个其它实施例”。
请参考图1是本发明一实施例中的股票基因库诊断系统结构示意图,一种 股票基因库诊断系统,包括:客户端1和服务器端2,在所述客户端1,用以 设置用户基本信息,在所述服务器端2包括:数据采集单元21、因子库单元 22、因子特征单元23、订单管理单元24,所述数据采集单元21,用以获取股 票实时数据和/或期货实时数据,不仅包括实时的股票、期货等相关数据,同 时包含客户所感兴趣的股票历史数据、财务数据相关金融数据;所述因子库单 元22,用以按照设定因子建立一因子库,所述因子特征单元23,用以对所述 因子库进行分组,得到所述分组内的股票因子特征,所述订单管理单元24, 用以按照所述股票因子特征向所述客户端推荐股票。可以在因子库单元22中 基于股票财务、资金、技术、指标、消息、热度等因子,建立全部票的因子库。 因子特征单元23中将股票按照不同的维度进行分组,并且在所述因子特征单 元通过机器学习和大数据技术分析每个分组内的股票的所有因子,找出各个分 组内股票因子的特征。通过匹配该股票和全部股票的因子,挖掘出该股票具备 的基因,再根据在所述订单管理单元中该股票的基因诊断结果,辅助投资者判断该股票的投资风格、操作方向等。
优选地,上述客户端和服务器端通过StocKet套接字进行通信。计算机操 作系统为应用程序与TCP/IP协议交互提供了称为套接字(Socket)的接口, 区分不同应用程序进程间的网络通信和连接。生成套接字,主要有3个参数: 通信的目的IP地址、使用的传输层协议(TCP或UDP)和使用的端口号。
请参考图2是图1中的因子库单元结构示意图;可以根据不同的维度对因 子进行分析与判断,在本实施例中通过四个方面对因子进行库的分类,所述因 子库单元包括:第一因子库221、第二因子库222、第三因子库223、第四因 子库224,所述第一因子库221,用以建立股票财务因子库,所述第二因子库 222,用以建立股票资金因子库,所述第三因子库223,用以建立股票热度因 子库,所述第四因子库224,用以建立股票第三方因子库。
作为本实施例中的优选,请参考图3是图1中的数据采集单元结构示意图, 所述数据采集单元21包括:股票单元211、行情数据单元213、期货单元212, 所述股票单元211,用以采集股票实时数据,所述行情数据单元213,用以采 集行情实时数据,所述期货单元212,用以采集期货实时数据。
所述股票单元211采用股票实时数据查询接口API,上证股票是股票代码 后面加上.ss深证股票是股票代码后面加上.sz,例如:000001=000001.sz。 查询大盘指数,比如,查询上证综合指数(000001): http://hq.sinajs.cn/list=s_sh000001
服务器返回的数据为:var hq_str_s_sh000001="上证指 数,2245.722,-37.936,-1.66,961537,7842727";数据含义分别为:指数名称, 当前指数,今日变化值,今日变化百分比,成交量(手),成交额(万元);
查询深圳成指数:http://hq.sinajs.cn/list=s_sz399001
服务器返回的数据为:var hq_str_s_sz399001="深证成 指,9033.616,-136.439,-1.49,114896246,8404494";
深市数据链接:
http://table.finance.yahoo.com/table.csv?s=000001.sz
上市数据链接:
http://table.finance.yahoo.com/table.csv?s=600000.ss
上证综指代码:000001.ss,深证成指代码:399001.SZ,沪深300代码: 000300.ss
上海交易所=cn.finance.yahoo.com,.SS,Chinese,sl1d1t1c1ohgv
深圳交易所=cn.finance.yahoo.com,.SZ,Chinese,sl1d1t1c1ohgv
美国交易所=finance.yahoo.com,,United States,sl1d1t1c1ohgv
加拿大=ca.finance.yahoo.com,.TO,Toronto,sl1d1t1c1ohgv
新西兰=au.finance.yahoo.com,.NZ,sl1d1t1c1ohgv
新加坡=sg.finance.yahoo.com,.SI,Singapore,sl1d1t1c1ohgv
中国香港=hk.finance.yahoo.com,.HK,Hong Kong,sl1d1t1c1ohgv
中国台湾=tw.finance.yahoo.com,.TW,Taiwan,sl1d1t1c1ohgv
印度=in.finance.yahoo.com,.BO,Bombay,sl1d1t1c1ohgv
伦敦=uk.finance.yahoo.com,.L,London,sl1d1t1c1ohgv
澳洲=au.finance.yahoo.com,.AX,Sydney,sl1d1t1c1ohgv
巴西=br.finance.yahoo.com,.SA,Sao Paulo,sl1d1t1c1ohgv
瑞典=se.finance.yahoo.com,.ST,Stockholm,sl1d1t1c1ohgv
行情数据单元213,用门户网站的API获取财经版块股票数据接口。
期货单元212,用以从期货数据API接口获得期货数据。
作为本实施例中的优选,请参考图4是图1中的订单管理单元结构示意图, 所述订单管理单元24包括:风险管理单元241和订单统计单元242,所述风 险管理单元241,用以按照设定的风险控制规则和从所述因子特征单元接收的 因子特征,并管理订单。本实施例中的风险管理单元241的风险控制规则包括 但不限于:控制资金投入比例、适可而止的投资原则、选股要回避“险礁暗滩”、 分散投资、克服暴利思维等不同的规则。订单统计单元242,用以统计从所述 客户端中提交的订单。
在一些实施例中,所述风险管理单元241基于风险控制原则,基于一要控 制资金投入比例。在行情初期,不宜重仓操作。在涨势初期,最适合的资金投 入比例为30%。这种资金投入比例适合于空仓或者浅套的投资者采用,对于重 仓套牢的投资者而言,应该放弃短线机会,将有限的剩余资金用于长远规划。
在一些实施例中,所述风险管理单元241基于适可而止的投资原则。在市 场整体趋势向好之际,不能盲目乐观,更不能忘记了风险而随意追高。股市风 险不仅存在于熊市中,在牛市行情中也一样有风险。如果不注意,即使是上涨 行情也同样会亏损。
在一些实施例中,所述风险管理单元241基于选股要回避“险礁暗滩”。 碰上“险礁暗滩”就要“翻船”,股市的“险礁暗滩”是指被基金等机构重仓 持有、涨幅巨大的“新庄股”,如近期的有色金属股。其次,问题股、巨亏股、 戴帽戴星股。
在一些实施例中,所述风险管理单元241基于分散投资原则,规避市场非 系统性风险。当然,分散投资要适度,持有股票种类数过多时,风险将不会继 续降低,反而会使收益减少。
在一些实施例中,所述风险管理单元241基于克服暴利思维原则。有的投 资者喜欢追求暴利,行情走好时总是一味地幻想大牛市来临,将每一次反弹都 幻想成反转,不愿参与利润不大的波段操作或滚动式操作,而是热衷于追涨翻 番暴涨股。
所述订单统计单元,用以统计从所述客户端中提交的订单。
请参考图5是图1中的因子特征单元结构示意图,所述因子特征单元23 包括:基因定义单元231、基因分组单元232、策略执行单元233、机器学习 单元234、投资建议单元235,
所述基因定义单元231,用以根据不同的维度定义得到股票基因,维度定 义比如:可根据不同的风险维度对股票基因进行定义,包括但不限于:市场风 险、市值风险、账面市值比风险、盈利水平风险、投资水平风险。
其中,
市场风险是指大盘走势变化所引起的不确定性;
市值风险是指公司的规模对该公司股票的风险有着接影响;
账面市值比风险描述了公司的额外财务困境风险;
盈利水平风险是指盈利能力较高的行业一般会伴随着更高的风险;
投资水平风险可以用再投资率来衡量;
所述基因定义单元231被配置为:投资率偏低的公司风险较大,投资者对 这些公司有更高的收益率要求,反之亦然。
所述基因分组单元232,用以按照所述股票基因将股票进行分组;在一些 实施例中的分组方法为:根据上述的风险维度对股票数据进行数据统计,并通 过多元回归方法(根据一个或几个变量的值,预测或控制另一个变量的取值, 并且可以知道这种预测或控制能达到什么样的精确度)将每只股票的风险程度 进行量化处理,最后得出股票的风险偏好。将股票可以按照极高风险、高风险、 风险中性、低风险、极低风险进行分组。
所述策略执行单元233,用以从所述客户端接收策略参数作为策略执行的 规则;所述策略参数包括但不限于:样本长度、调仓频率、滑点设置、止盈止 损、回测天数等策略实施过程中所需的程序参数,同时还包括了客户的股票历 史操作风格等数据。
所述机器学习单元234,用以根据机器学习算法对分组后的股票进行特征 提取;所述机器学习算法包括但不限于:支持向量机、人工神经网络、增强算 法、决策树算法、遗传算法等等。
所述投资建议单元235,用以根据所述特征提取对股票风格进行判断与分 类,以及投资者的投资风格和风险控制规则得到相应的投资建议。
所述股票风格,比如,账面市值比的走势有明显的趋势,例如:在股市大 涨时,市场喜欢买入高估值的成长股,而在大跌时买入净资产占比高的股票。 则可以将股票的风格判断为趋势型。
所述投资风格包括但不限于:机构或个人在构建投资组合和选择股票的过 程中所表现出的理念、操作、风险意识等外部表现的总称。根据不同的方法投 资风格有不同的分类,在本实施例中根据投资股票的市值、基本面分析、技术 面分析等多个维度对投资风格进行了分类。
上述基本面分析,以判断金融市场未来走势为目标,对经济和政治数据的 透彻分析。基本面从字面上的意思可以理解为共同拥有的属性指标这一方面, 按股票的基本面来讲,是指那一些各自都拥有的基本情况的汇总。一般我们所 讲的基本面分析是指对宏观经济面、公司主营业务所处行业、公司业务同行业 竞争水平和公司内部管理水平包括对管理层的考察这诸多方面的分析,数据在 这里充当了最大的分析依据,但往往不能以数据来做最终的投资决策,如果数 据可以解决问题,那计算机早就代替人脑完成基本面分析,事实上除了数据还 要包括许许多多无法以数据来衡量的东西。
上述技术面分析,就是应用金融市场最简单的供求关系变化规律,寻找、 摸索出一套分析市场走势、预测市场未来趋势的金融市场分析方法。包括但不 限于:道琼斯理论、斐波纳契反驰现象、埃利奥特氏波、K线理论、MACD和布 林通道。
上述市值,是指一家上市公司的发行股份按市场价格计算出来的股票总价 值,其计算方法为每股股票的市场价格乘以发行总股数。整个股市上所有上市 公司的市值总和,即为股票总市值。股票的市场交易价格主要有:开市价,收 市价,最高价,最低价。收市价是最重要的,是研究分析股市以及抑制股票市 场行情图表采用的基本数据。
作为本实施例中的优选,请参考图6是图1中的客户端结构示意图,所述 客户端1包括:账户管理单元13、仓位管控单元11、策略单元12、执行单元 14,所述账户管理单元13,用以提供投资者账户管理接口,所述仓位管控单 元11,用以提供投资者所选择的仓位管理、控制接口,所述策略单元12,用 以提供策略参数,所述执行单元14,用以根据策略参数在客户端上的执行相 应操作。所述账户管理单元13中投资者账户管理接口为手机号或者邮箱账号 管理。仓位管控单元11,用以提供投资者选择的仓位管理、控制,比如,仓 位管理就是在你决定做多某个投资对象时,决定如何分批入场,又如何止损/ 止赢离场的技术--是的,仓位管理不涉及选股选时技术,甚至有仓位管理专家 试验过,通过抛硬币决定做多还是做空,在这样的随机决策下,依托好的仓位 管理技术依旧可以赚到钱。仓位管理方法包括但不限于:漏斗型仓位管理法、 矩形仓位管理法、金字塔形仓位管理法等。在所述策略单元12,比如周期的 选择遵循以下三个原则:一是指标测算周期和市场运动周期大致相同,也就是 很多培训中提及的参数和市场的共振,可以达到利润的最大化。二是选择交易成绩稳定和收益曲线具有惯性的周期,不考虑动态调整参数,稳定性高于一切。 稳定亏损并不是坏现象,保持逆向思维,策略也可逆向使用。三是选择使用同 一策略但不同参数来提高策略的稳定性,在市场运动周期发生变化的情况下, 仍可全身而退,同时也变相起到了加减仓的效果。
请参考图7是图1中系统的一优选实施例中的结构示意图,系统包括:客 户端1和服务器端2,在所述客户端1,用以设置用户基本信息,在所述服务 器端2包括:数据采集单元21、因子库单元22、因子特征单元23、订单管理 单元24,所述数据采集单元21,用以获取股票实时数据和/或期货实时数据, 所述因子库单元22,用以按照设定因子建立一因子库,所述因子特征单元23, 用以对所述因子库进行分组,得到所述分组内的股票因子特征,所述订单管理 单元24,用以按照所述股票因子特征向所述客户端推荐股票。还包括:管理 员单元3,用以提供在服务器端的诊断操作权限,以及人工管理窗口。
请参考图8是图1中系统的另一优选实施例中的结构示意图,系统包括: 客户端1和服务器端2,在所述客户端1,用以设置用户基本信息,在所述服 务器端2包括:数据采集单元21、因子库单元22、因子特征单元23、订单管 理单元24,所述数据采集单元21,用以获取股票实时数据和/或期货实时数据, 所述因子库单元22,用以按照设定因子建立一因子库,所述因子特征单元23, 用以对所述因子库进行分组,得到所述分组内的股票因子特征,所述订单管理 单元24,用以按照所述股票因子特征向所述客户端推荐股票。优选地,系统还包括:数据库/行情中心4,用以作为所述服务器端的股票数据源。提供包 括但不限于:大陆沪深股市最新股票行情,FLASH版本分时走势、K线图、KDJ、 MACD、交易量等技术指标图等等。
请参考图9是本发明一实施例中的方法流程示意图,本实施例中的一种股 票基因库诊断方法,具体而言包括如下步骤:
步骤S100设置用户基本信息,
步骤S101获取股票实时数据和/或期货实时数据,
步骤S102按照设定因子建立一因子库,
步骤S103对所述因子库进行分组,得到所述分组内的股票因子特征,
步骤S104按照所述股票因子特征推荐股票。
通过在因子库单元中基于股票财务、资金、技术、指标、消息、热度等因 子,建立全部票的因子库。可以在因子特征单元中将股票按照不同的维度进行 分组,并且在所述因子特征单元通过机器学习和大数据技术分析每个分组内的 股票的所有因子,找出各个分组内股票因子的特征。通过匹配该股票和全部股 票的因子,挖掘出该股票具备的基因,再根据在所述订单管理单元中该股票的 基因诊断结果,辅助投资者判断该股票的投资风格、操作方向等。
上述步骤S101中还包括:
采集股票实时数据,
采集行情实时数据,
采集期货实时数据。
上述步骤S104中还包括:
按照设定的风险控制规则和从所述因子特征单元接收的因子特征,并管理 订单,
统计从所述客户端中提交的订单。
上述步骤S102中还包括:
根据不同的维度定义得到股票基因,
按照所述股票基因将股票进行分组;
从所述客户端接收策略参数作为策略执行的规则;
所述机器学习单元,用以根据机器学习算法对分组后的股票进行特征提 取;
根据所述特征提取对股票风格进行判断与分类,以及投资者的投资风格和 风险控制规则得到相应的投资建议。
上述步骤还包括:提供在服务器端的诊断操作权限,以及人工管理窗口。
上述步骤还包括:提供数据库/行情中心,用以作为所述服务器端的股票 数据源。
请参考图10是系统原理示意图,首先,用户设置策略的基本信息,包括账 户的管理、仓位的控制与管理、策略的参数管理、策略的执行控制参数。
其次,从数据中心与行情中心获取股票与期货的实时数据以及其他金融数 据。具体内容包括但不限于:最高价、最低价、收盘价、开盘价等基础行情数 据,市盈率、市值等财务数据,以及MACD、KDJ、MA等技术指标。
进一步,根据股票财务、资金、技术、指标、消息、热度等因子,建立全 部股票的因子库,并对因字库进行相关的处理。
进一步,通过机器学习和大数据技术分析每个分组内的股票的所有因子, 找出各个分组内股票因子的特征。即某个股票基因需要满足哪些特征。
进一步,通过上步骤所获取的股票风格结合风险管理为客户提供相应的股 票推荐,完成订单。
请参考图11是具体执行策略流程示意图,包括步骤为:
步骤S200开始,并在完成基本的框架后开始进行策略的实施,
步骤S201股票基因定义,读取需要用到的对应的数据,并根据不同的维度 对股票基因进行定义,
步骤S202股票分组,根据步骤201中所给出的股票基因将股票进行分组,
步骤S203参数设置,获取到使用者设定的参数作为策略执行的规则,
步骤S204特征提取,根据机器学习的方法对股票数据进行特征提取,
步骤S205股票风格判断,根据机器学习所获取的股票特征对股票的风格进 行判断与分类,所述机器学习包括但不限于,支持向量机、人工神经网络、增 强算法、决策树算法、遗传算法等等。
步骤S206股票投资建议,根据股票的风格,结合投资者的投资风格与风险 控制给出相应的投资建议,
步骤S207结束,如果投资策略符合客户需求则完成整个策略过程,如果没 有达到最优则继续策略直至获取最优的结果。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。 在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执 行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方 式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有 用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合 逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA) 等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示 例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述 的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。 在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。 而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例 或示例中以合适的方式结合。
总体而言,本公开的各种实施例可以以硬件或专用电路、软件、逻辑或其 任意组合实施。一些方面可以以硬件实施,而其它一些方面可以以固件或软件 实施,该固件或软件可以由控制器、微处理器或其它计算设备执行。虽然本公 开的各种方面被示出和描述为框图、流程图或使用其它一些绘图表示,但是可 以理解本文描述的框、设备、系统、技术或方法可以以非限制性的方式以硬件、 软件、固件、专用电路或逻辑、通用硬件或控制器或其它计算设备或其一些组 合实施。
此外,虽然操作以特定顺序描述,但是这不应被理解为要求这类操作以所 示的顺序执行或是以顺序序列执行,或是要求所有所示的操作被执行以实现期 望结果。在一些情形下,多任务或并行处理可以是有利的。类似地,虽然若干 具体实现方式的细节在上面的讨论中被包含,但是这些不应被解释为对本公开 的范围的任何限制,而是特征的描述仅是针对具体实施例。在分离的一些实施 例中描述的某些特征也可以在单个实施例中组合地执行。相反对,在单个实施 例中描述的各种特征也可以在多个实施例中分离地实施或是以任何合适的子 组合的方式实施。
Claims (10)
1.一种股票基因库诊断系统,其特征在于,包括:客户端和服务器端,在所述客户端,用以设置用户基本信息,
在所述服务器端包括:数据采集单元、因子库单元、因子特征单元、订单管理单元,
所述数据采集单元,用以获取股票实时数据和/或期货实时数据,
所述因子库单元,用以按照设定因子建立一因子库,
所述因子特征单元,用以对所述因子库进行分组,得到所述分组内的股票因子特征,
所述订单管理单元,用以按照所述股票因子特征向所述客户端推荐股票。
2.根据权利要求1所述的股票基因库诊断系统,其特征在于,所述因子库单元包括:第一因子库、第二因子库、第三因子库、第四因子库,
所述第一因子库,用以建立股票财务因子库,
所述第二因子库,用以建立股票资金因子库,
所述第三因子库,用以建立股票热度因子库,
所述第四因子库,用以建立股票第三方因子库。
3.根据权利要求1所述的股票基因库诊断系统,其特征在于,所述数据采集单元包括:股票单元、行情数据单元、期货单元,
所述股票单元,用以采集股票实时数据,
所述行情数据单元,用以采集行情实时数据,
所述期货单元,用以采集期货实时数据。
4.根据权利要求1所述的股票基因库诊断系统,其特征在于,所述订单管理单元包括:风险管理单元和订单统计单元,
所述风险管理单元,用以按照设定的风险控制规则和从所述因子特征单元接收的因子特征,并管理订单,
所述订单统计单元,用以统计从所述客户端中提交的订单。
5.根据权利要求1所述的股票基因库诊断系统,其特征在于,所述因子特征单元包括:基因定义单元、基因分组单元、策略执行单元、机器学习单元、投资建议单元,
所述基因定义单元,用以根据不同的维度定义得到股票基因,
所述基因分组单元,用以按照所述股票基因将股票进行分组;
所述策略执行单元,用以从所述客户端接收策略参数作为策略执行的规则;
所述机器学习单元,用以根据机器学习算法对分组后的股票进行特征提取;
所述投资建议单元,用以根据所述特征提取对股票风格进行判断与分类,以及投资者的投资风格和风险控制规则得到相应的投资建议。
6.根据权利要求1所述的股票基因库诊断系统,其特征在于,所述客户端包括:账户管理单元、仓位管控单元、策略单元、执行单元,
所述账户管理单元,用以提供投资者账户管理接口,
所述仓位管控单元,用以提供投资者所选择的仓位管理、控制接口,
所述策略单元,用以提供策略参数,
所述执行单元,用以根据策略参数在客户端上的执行相应操作。
7.根据权利要求1所述的股票基因库诊断系统,其特征在于,还包括:管理员单元,用以提供在服务器端的诊断操作权限,以及人工管理窗口。
8.根据权利要求1所述的股票基因库诊断系统,其特征在于,还包括:数据库/行情中心,用以作为所述服务器端的股票数据源。
9.根据权利要求1所述的股票基因库诊断系统,其特征在于,上述客户端和服务器端通过StocKet套接字进行通信。
10.一种股票基因库诊断方法,其特征在于,包括如下步骤:
设置用户基本信息,
获取股票实时数据和/或期货实时数据,
按照设定因子建立一因子库,
对所述因子库进行分组,得到所述分组内的股票因子特征,
按照所述股票因子特征推荐股票。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710558224.8A CN107480857A (zh) | 2017-07-10 | 2017-07-10 | 一种股票基因库诊断方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710558224.8A CN107480857A (zh) | 2017-07-10 | 2017-07-10 | 一种股票基因库诊断方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107480857A true CN107480857A (zh) | 2017-12-15 |
Family
ID=60596129
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710558224.8A Pending CN107480857A (zh) | 2017-07-10 | 2017-07-10 | 一种股票基因库诊断方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107480857A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110827148A (zh) * | 2019-10-24 | 2020-02-21 | 宋亚童 | 基于降维技术优化的循环神经网络的股市数据分析方法 |
CN112785430A (zh) * | 2021-01-12 | 2021-05-11 | 沈阳麟龙科技股份有限公司 | 一种股票成交状态分析方法及系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030225660A1 (en) * | 2002-02-22 | 2003-12-04 | Eugene Noser | Systems and methods for analysis of portfolio returns and trade cost measurement based on fiduciary roles |
CN101794430A (zh) * | 2010-02-11 | 2010-08-04 | 帅亿 | 全自动操盘服务器 |
CN102236870A (zh) * | 2010-04-26 | 2011-11-09 | 上海无花果信息科技有限公司 | 一种用于获得稳定回报的数量化多因子投资组合控制方法 |
US20150254556A1 (en) * | 2014-03-07 | 2015-09-10 | Capitalogix, LLC | Systems and Methods for Allocating Capital to Trading Strategies for Big Data Trading in Financial Markets |
CN105447759A (zh) * | 2015-12-18 | 2016-03-30 | 深圳市佐学科技有限公司 | 一种基于大数据的混合估值型智能股票交易系统 |
CN106355504A (zh) * | 2016-08-24 | 2017-01-25 | 深圳市崇广科技有限公司 | 一种金融产品配置方法和设备 |
-
2017
- 2017-07-10 CN CN201710558224.8A patent/CN107480857A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030225660A1 (en) * | 2002-02-22 | 2003-12-04 | Eugene Noser | Systems and methods for analysis of portfolio returns and trade cost measurement based on fiduciary roles |
CN101794430A (zh) * | 2010-02-11 | 2010-08-04 | 帅亿 | 全自动操盘服务器 |
CN102236870A (zh) * | 2010-04-26 | 2011-11-09 | 上海无花果信息科技有限公司 | 一种用于获得稳定回报的数量化多因子投资组合控制方法 |
US20150254556A1 (en) * | 2014-03-07 | 2015-09-10 | Capitalogix, LLC | Systems and Methods for Allocating Capital to Trading Strategies for Big Data Trading in Financial Markets |
CN105447759A (zh) * | 2015-12-18 | 2016-03-30 | 深圳市佐学科技有限公司 | 一种基于大数据的混合估值型智能股票交易系统 |
CN106355504A (zh) * | 2016-08-24 | 2017-01-25 | 深圳市崇广科技有限公司 | 一种金融产品配置方法和设备 |
Non-Patent Citations (1)
Title |
---|
周亮: "影响股票收益的基本面因子略探_基于中小板上市公司的实证分析", 《金融理论与实践》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110827148A (zh) * | 2019-10-24 | 2020-02-21 | 宋亚童 | 基于降维技术优化的循环神经网络的股市数据分析方法 |
CN112785430A (zh) * | 2021-01-12 | 2021-05-11 | 沈阳麟龙科技股份有限公司 | 一种股票成交状态分析方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Yalcin et al. | A multi-criteria performance analysis of Initial Public Offering (IPO) firms using CRITIC and VIKOR methods | |
US7472084B2 (en) | Method and apparatus for creating and managing a visual representation of a portfolio and determining an efficient allocation | |
US20100010935A1 (en) | Systems and methods for credit worthiness scoring and loan facilitation | |
Marshall et al. | Are candlestick technical trading strategies profitable in the Japanese equity market? | |
CN108154436A (zh) | 一种选股方法、装置、电子设备及计算机可读存储介质 | |
Bayramov et al. | A comparative study on development of small and medium enterprises (SMEs) in Azerbaijan | |
CN107004223A (zh) | 交易平台系统及方法 | |
WO2020057659A1 (en) | A computer implemented method for compiling a portfolio of assets | |
Yousaf et al. | Connectedness of non-fungible tokens and conventional cryptocurrencies with metals | |
CN107808254A (zh) | 一种公募基金评价及投资建议方法 | |
CN107122386A (zh) | 数据的筛选方法及装置 | |
Visalakshmi et al. | An integrated fuzzy DEMATEL-TOPSIS approach for financial performance evaluation of GREENEX industries | |
Zhang et al. | Valuation of stock loan under uncertain environment | |
Musah et al. | Market timing and selectivity performance of mutual funds in Ghana | |
CN107480857A (zh) | 一种股票基因库诊断方法及系统 | |
US20210358044A1 (en) | Analysis and visual presentation of dataset components | |
Zarutska | Structural-functional analysis of the Ukraine banking system | |
Zehra et al. | Household finance: a systematic literature review and directions for future research | |
Day et al. | Portfolio dynamic trading strategies using deep reinforcement learning | |
Hung et al. | Factor analysis of SPACs: Impact on SPACs performance by management factors | |
Dupleich et al. | Unbundling common style exposures, time variance and style timing of hedge fund beta | |
Koutmos et al. | In search of winning mutual funds in the Chinese stock market | |
Kartiwi et al. | Sukuk rating prediction using voting ensemble strategy | |
Šmejkal et al. | COMPANY INVESTMENTS IN THE CONTEXT OF FINANCIAL STRATEGIES. | |
CN109961367A (zh) | 一种期货因子库诊断方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20171215 |