CN106780020A

CN106780020A - 一种基于强匹配排序的股票趋势分析与选股方法

Info

Publication number: CN106780020A
Application number: CN201611038882.6A
Authority: CN
Inventors: 吴梅红; 洪志令
Original assignee: Individual
Current assignee: Individual
Priority date: 2016-11-23
Filing date: 2016-11-23
Publication date: 2017-05-31

Abstract

本发明公开了一种基于强匹配排序的股票趋势分析与选股方法。方法的主要思想是以每只股票近期一段时间的走势，在全局所有股票的环境下进行匹配，获取与每只股票的最小匹配值及对应的交易日期；而后根据匹配值获取具有较好匹配度的强匹配列表；基于此列表，根据对应的交易日期之后的走势形成股票的候选趋势池；最后基于在强匹配列表中的排序和趋势池的趋势情况进行综合考虑选股。方法是一种准确性优先的股票选股及趋势分析方法，可为用户短线操作的选股提供决策支持。

Description

一种基于强匹配排序的股票趋势分析与选股方法

技术领域

本发明涉及股票数据挖掘技术领域，尤其是涉及一种基于强匹配排序的股票趋势分析与选股方法。

背景技术

每时每刻都有许多的股票在进行交易，股价的变化往往是政治、经济、社会因素的综合反映，所以股票指数预测具有变换幅度大，变化因素多，变化不稳定等特性，如何判断和把握整个股票市场股价变动水平与变化趋势是股票买卖者最关心的问题。对股票价格的分析和选股方法，主要可以分为两大类：一个是基本因素分析方法；另一个是技术因素分析方法。

基本分析方法，也称为基本面分析方法，是指把对股票的分析研究重点放在它本身的内在价值上。基本分析法利用丰富的统计资料，运用多种多样的经济指标，采用比例、动态的分析方法从研究宏观的经济大气候开始，逐步开始中观的行业兴衰分析，进而根据微观的企业经营、盈利的现状和前景，对企业所发行的股票做出接近现实的客观评价，并尽可能预测其未来的变化，作为投资者选购的依据。

技术分析方法试图通过对股票过去价格、交易量和其它证券交易指标的研究来预测价格的未来走势。常用的技术分析法有K线理论、波浪理论、移动平均线理论和技术指标分析等，这些方法简单、直观，不足之处在于图表的分析与指标的选择大多需要依靠主观经验的判断；为了避免这些不足，研究者们转向数据挖掘和人工智能的方法，如时间序列分析、多元回归模型、人工神经网络、遗传算法等。

发明内容

本发明公开了一种基于强匹配排序的股票趋势分析与选股方法。方法的主要思想是以每只股票近期一段时间的走势，在全局所有股票的环境下进行匹配，获取与每只股票的最小匹配值及对应的交易日期；而后根据匹配值获取具有较好匹配度的强匹配列表；基于此列表，根据对应的交易日期之后的走势形成股票的候选趋势池；最后基于在强匹配列表中的排序和趋势池的趋势情况进行综合考虑选股。

本发明方法是一种准确性优先的股票选股及趋势分析方法，可为用户短线操作的选股提供决策支持。

假设股票列表为S,S=[S₁, S₂,…,S_i,…,S_n],n为股票池中股票的数量，如中国上市股票的数量或美国上市股票的数量。本发明方法的步骤如下：

（1）股票数据加载和准备；

（2）与所有股票进行匹配，获取与每只股票的最小匹配值及对应的交易日期；

（3）获取强匹配股票列表；

（4）获取股票的候选趋势池；

（5）对股票进行综合分析并选股。

其中，步骤(1)的股票数据加载和准备，具体为从原始股票数据库中获取待处理股票S_m的近期交易日数据和待匹配的股票的历史交易日数据。待处理股票S_m近期交易日数据为近L个交易日的涨跌幅数据，形成一个数组，记为A，L的取值一般取30即可。待匹配股票的历史交易日数据为某个时间点以来（如2005年1月1日），到当前交易日的前L个交易日的数据，形成另一个数组，记为B_i,i=[1,n]；另外同时获取B_i每个位置对应的交易日期。每个B_i的长度k是不一定相等的，因为股票中间有停牌等因素的影响。

其中，步骤(2)的与所有股票进行匹配，获取与每只股票的最小匹配值及对应的交易日期，具体为：对待处理股票S_m的片段A，先与一只待匹配股票B_i进行比较，获取股票内局部最相似片段。而后片段A以类似的方法与所有的其它股票进行比较，获得与每只股票的最小匹配值及对应的交易日期，并形成数组Q，Q=[Q_i], i=[1,n], Q_i=[V_i,D_i]，其中，V_i的值即为与单只股票的最小匹配值，D_i即为其最小匹配值对应的匹配日期。

与单只股票进行匹配的过程为：首先以步长为1，循环从B_i中获取长度L的涨跌幅数据，每次取得的片段记为B；而后A与B进行比较，比较公式为：，

其中，w₀=1;之后w_j+1=w_j+1/L。最后记录所有比较的匹配值，并获得最小值和其对应的匹配日期，作为A与B_i匹配的最终结果，这一结果称为待处理股票与某一股票匹配的股票内局部最相似片段。

其中，步骤(3)的获取强匹配股票列表，具体为：首先获取数组Q中具有最小V_i值所对应的股票和V_i值所对应的匹配日期，获得与待处理股票唯一的一只最相似的股票和对应的匹配日期；进一步的，对于每只股票S_m, m=1,…,n ，获得其股票间全局最相似片段，并形成最佳匹配二维数组G，

G=[G_i],i=1…n; 其中, G_i= [S_i股票代码，匹配股票代码，匹配日期，匹配值]，

代表S_i股票在全局所有股票环境下的最佳匹配股票，及其匹配日期和匹配值；最后对二维数组G中的匹配值从小到大排序，排完序后获取最小的前N只股票，这些股票即构成强匹配列表H。

其中，步骤(4)的获取股票的候选趋势池，具体为：基于强匹配列表H,对于H中的每一条记录H_j,

H_j=[ S_j股票代码，匹配股票代码，匹配日期，匹配值],j=[1…N] ，

获取匹配股票代码和匹配日期，而后搜索数据库，直接获取匹配日期之后30天的走势数据，包括每日的涨跌幅、开盘价，收盘价、最高价、最低价和成交量，并将这些数据输出为k线图图表。

其中，步骤(5)的对股票进行综合分析并选股，具体为：按匹配值从小到大顺序考察强匹配股票列表，即时展示相应的匹配日期之后的后期走势，同时提供换手率，成交量，流通值等基本行情信息供用户参考，用户可根据查看的股票后期走势的可能涨跌情况及在强匹配列表中的位置综合考虑选股。

附图说明

图1 是本发明基于强匹配排序的股票趋势分析与选股方法的流程图。

图2 是基于本发明方法输出的强匹配股票列表结果。具体为2016年11月1日基于本发明方法输出的强匹配股票列表。基于本列表，以第一条记录为例，与原股票美康生物（300439）匹配的股票为青岛啤酒（600600），其匹配日期为2016年9月6日，也就是说美康生物（300439）2016年11月1日之后的走势将很可能复制青岛啤酒（600600）2016年9月6日之后的走势。

具体实施方式

下面结合附图和实例，对本发明进行详细的描述。

本发明方法的主要思想是以每只股票近期一段时间的走势，在全局所有股票的环境下进行匹配，获取与每只股票的最小匹配值及对应的交易日期；而后根据匹配值获取具有较好匹配度的强匹配列表；基于此列表，根据对应的交易日期之后的走势形成股票的候选趋势池；最后基于在强匹配列表中的排序和趋势池的趋势情况进行综合考虑选股。

假设股票列表为S,S=[S₁, S₂,…,S_i,…,S_n],n为股票池中股票的数量，如中国上市股票的数量或美国上市股票的数量。

一、股票数据的加载和准备。

该步骤主要完成数据的准备过程，从原始股票数据库中获取待处理股票S_m的近期交易日数据和待匹配的股票的历史交易日数据。

1.1 获取待处理股票S_m的近L个交易日的涨跌幅数据，形成一个数组，记为A，

A=[a₁,a₂,…,a_i,…a_L]，

其中，a_i代表近L-i的交易日的涨跌幅。a₀代表当前交易日的涨跌幅。L的取值至少得符合短期预测交易日的要求，如>=20。

1.2 对S中的每只股票，获取某个时间点以来（如2005年1月1日），到当前交易日的前L个交易日的数据，形成另一个数组，记为B_i,i=[1,n],

B_i=[b_i1,b_i2,…,b_ij,…b_ik]，

其中，b_ij代表第i只股票的j位置对应交易日的涨跌幅。每个B_i的长度k是不一定相等的，因为股票中间有停牌等因素的影响，同时记录b_ij的交易日期，记为另一数组C_i,i=[1,n],

C_i=[c_i1,c_i2,…,c_ij,…c_ik]，

其中，c_ij代表第i只股票的j位置对应交易日期。

二、全局搜索匹配。

该步骤主要是要完成待处理股票的片段与某只待匹配股票之间的匹配过程，并获取得到与待匹配股票某个片段匹配的最小值和对应匹配日期。匹配过程在A和B_i展开，A的长度为L, B_i的长度为K, K>=L，具体匹配过程如下。

（1）以步长为1，循环从B_i中获取长度L的涨跌幅数据，每次取得的片段记为B。

（2） A与B进行比较，得到匹配值。 A与B的比较过程基于几个因素的考虑：A与B的涨跌幅差异；A与B中涨跌幅位置的权重；A与B中涨跌幅同向的加权，综合这些因素，最后匹配的公式具体为：

其中，w₀=1;之后w_j+1=w_j+1/L。

（3）记录所有比较的匹配值，并获得最小值和其对应的匹配日期，作为A与B_i匹配的最终结果，记为P, P=[V,D]，其中，V代表A与B_i的最小匹配值，D代表最小匹配值对应的匹配日期。该匹配结果我们暂称之为待处理股票与某一股票匹配的股票内局部最相似片段。

（4）将当前待处理股票S_m的片段与所有的其它股票进行上述类似步骤的比较，获得与每只待匹配股票的最小匹配值和对应匹配日期，记为Q=[Q_i], i=[1,n], Q_i=[V_i,D_i]，其中，V_i的值即为与单只股票的最小匹配值，D_i即为其最小匹配值对应的匹配日期。

三、获取强匹配股票列表。

本步骤经过多重匹配和比较，获取具有较好匹配度的强匹配列表。

3.1获取数组Q中具有最小V_i值所对应的股票和V_i值所对应的匹配日期。也就是说，每只股票在全局所有股票的环境下进行匹配，获得了唯一的一只最相似的股票和对应的匹配日期。对于当前股票S_m，可得到如下一维数组结果：

G_m=[S_m股票代码，匹配的股票代码，匹配日期，匹配值]，

该匹配结果我们暂称之为待处理股票与所有股票匹配的股票间全局最相似片段。

3.2 进一步的，对于每只股票S_m, m=1,…,n ，获得其股票间全局最相似片段，并形成最佳匹配二维数组G，G=[G_i],i=1…n; 其中,

G_i= [S_i股票代码，匹配股票代码，匹配日期，匹配值]，代表S_i股票在全局所有股票环境下的最佳匹配股票，及其匹配日期和匹配值。

3.3 最后获取强匹配列表。强匹配是指进行匹配的两只股票的时间序列片段具有较好的匹配度，也就是走势形态比较相似。获取强匹配股票列表的过程是：对二维数组G中的匹配值从小到大排序，排完序后获取最小的前N只股票，这些股票即构成强匹配列表H。

四、获取股票的候选趋势池。

由于强匹配列表中的股票匹配度很好，也就是说，匹配股票匹配日期之后的走势都具有较高的准确性。本步骤获取强匹配股票列表中每只股票的匹配日期之后的后期走势，并截图输出。具体为：基于强匹配列表H,对于H中的每一条记录H_j,

H_j=[ S_j股票代码，匹配股票代码，匹配日期，匹配值],j=[1…N]，

获取匹配股票代码和匹配日期，而后搜索数据库，直接获取匹配日期之后30天的走势数据，包括每日的涨跌幅、开盘价，收盘价、最高价、最低价和成交量，并将这些数据输出为k线图图表。所有的这些走势图表形成候选趋势池。

五、对股票进行综合分析并选股。

该步骤的综合分析和选股过程需要人工的参与。在强匹配股票列表中，由于是一种强匹配的方式，因此匹配股票的后期走势可以很好的作为考察股票的后期走势，从而对考察股票进行趋势分析，而后根据股票的趋势涨跌幅进行选股操作。具体为：按匹配值从小到大顺序考察强匹配股票列表，即时展示相应的匹配日期之后的后期走势，同时提供换手率，成交量，流通值等基本行情信息供用户参考，用户可根据查看的股票后期走势的可能涨跌情况及在强匹配列表中的位置综合考虑选股。在强匹配列表中的位置实际上是一种准确性的体现，因此需要在后期涨幅与准确性之间进行一个折中，挑选优质的股票。

综上所述，本发明公开了一种基于强匹配排序的股票趋势分析与选股方法。方法经过多重的排序比较获得强匹配股票列表，并基于此进行股票综合分析与选股。方法是一种准确性优先的股票选股及趋势分析策略，可为用户短线操作的选股提供决策支持。

本发明方法同样可应用于证券类具有时间序列特征的数据，如基金、期货等。因此，尽管为说明目的公开了本发明的具体实施例和附图，其目的在于帮助理解本发明的内容并据以实施，但是本领域的技术人员可以理解：在不脱离本发明及所附的权利要求的精神和范围内，各种替换、变化和修改都是不可能的。因此，本发明不应局限于最佳实施例和附图所公开的内容。当前公开的实施例在所有方面应被理解为说明性的而非对其请求保护的范围的限制。

Claims

1.一种基于强匹配排序的股票趋势分析与选股方法，其特征在于所述方法包括如下步骤：

（1）股票数据加载和准备；

（3）获取强匹配股票列表；

（4）获取股票的候选趋势池；

（5）对股票进行综合分析并选股。

2.根据权利要求1所述的基于强匹配排序的股票趋势分析与选股方法，其特征在于，在获取与每只股票的最小匹配值及对应的交易日期时，匹配过程综合了各种因素，包括涨跌幅差异、涨跌幅位置的权重、涨跌幅同向的加权等，这些处理方式使得匹配结果更倾向于匹配段右侧即近期走势的相似。

3.根据权利要求1所述的基于强匹配排序的股票趋势分析与选股方法，其特征在于，在获取强匹配股票列表的过程中，为获得具有较好相似度的股票，经过了三重的排序择优过程，包括待处理股票与某一股票匹配的股票内局部最相似片段择优、待处理股票与所有股票匹配的股票间全局最相似片段择优、所有股票的全局最相似片段的优中择优过程。

4.根据权利要求1所述的基于强匹配排序的股票趋势分析与选股方法，其特征在于，在股票的选股过程中，是在准确性优先的前提下，顺序考察强匹配列表中与原股票的匹配股票在匹配日期之后的走势，结合其他因素综合分析后进行选股操作。