CN113222261A

CN113222261A - 一种基于灰色预测和bp-arima的科创板企业估值系统

Info

Publication number: CN113222261A
Application number: CN202110547539.9A
Authority: CN
Inventors: 胡五龙; 黄河; 戴铭阳; 陈渊泽; 占洋
Original assignee: Wuhan University of Technology WUT
Current assignee: Wuhan University of Technology WUT
Priority date: 2021-05-19
Filing date: 2021-05-19
Publication date: 2021-08-06

Abstract

本发明公开了一种基于灰色预测和BP‑ARIMA的科创板企业估值系统，包括：数据获取模块，用于根据已有数据进行第D年中国A股市场和美国NASDAQ市场基本面指标、流动性指标预测，获取预测数据；估值指标预测模块，用于根据美国NASDAQ市场的市销率关联模型和第D年基本面指标、流动性指标预测值，进行估值指标预测；估值修正模块，用于采集中国A股市场与美国NASDAQ市场的平均市销率资料，并确定这两个市场的估值溢价或折价水平作为修正系数；估值模块，用于根据修正系数修正估值指标预测模块中的估值指标，得到科创板拟上市企业估值。本发明提供了一种可量化的企业估值系统。

Description

一种基于灰色预测和BP-ARIMA的科创板企业估值系统

技术领域

本发明涉及自动化技术，尤其涉及一种基于灰色预测和BP-ARIMA的科创板企业估值系统。

背景技术

科创板企业如何估值对于投资者来说至关重要。传统企业上市后估值通常采用市盈率法，对于科创板企业上市后估值方法可以考虑采用市销率法(科创板对企业盈利不做要求，暂未盈利的企业采用市销率法较为合理)。由于是新型板块，估值可参照美国同类型市场NASDAQ上市公司的平均市销率，但由于国内市场与美国市场上市的企业盈利能力不同以及投资者结构不同，造成基本面与流动性均存在较大差异，从而导致中国与美国的股票市场估值水平存在估值溢价或折价。上海证券交易所开始受理科创板企业的上市发行申请，科创板企业整体估值水平对于投资者来说至关重要。

发明内容

本发明要解决的技术问题在于针对现有技术中的缺陷，提供一种基于灰色预测和BP-ARIMA的科创板企业估值系统。

本发明解决其技术问题所采用的技术方案是：一种基于灰色预测和BP-ARIMA的科创板企业估值系统，包括：

数据获取模块，用于根据已有数据进行第D年中国A股市场和美国NASDAQ市场基本面指标、流动性指标预测，获取预测数据；其中，D为科创板企业的上市年份；所述基本面指标包括年度营业收入、年度归母净利润、年度净资产收益率；流动性指标包括年度单只股票交易量、年度单只股票交易金额、年度单只股票平均换手率；

估值指标预测模块；用于根据美国NASDAQ市场的市销率关联模型和第D年基本面指标、流动性指标预测值，进行估值指标预测；

其中，市销率关联模型为用于确定市销率与基本面指标、流动性指标关系的关联模型；

市销率关联模型为bp神经网络模型，隐含层设为5个节点，输入层6个节点，输出层1个节点；输入数据为年度营业收入、年度归母净利润、年度净资产收益率、年度单只股票交易量、年度单只股票交易金额、年度单只股票平均换手率；输出为估值指标；

估值修正模块，用于采集中国A股市场与美国NASDAQ市场的平均市销率资料，并确定这两个市场的估值溢价或折价水平作为修正系数；

估值模块，用于根据修正系数修正估值指标预测模块中的估值指标，得到科创板拟上市企业估值。

按上述方案，所述数据获取模块中，根据已有数据进行第D年中国A股市场和美国NASDAQ市场基本面指标、流动性指标预测为利用基于时间序列的ARIMA-BP模型对中国A股市场和美国NASDAQ市场的基本面指标、流动性指标进行预测；具体如下：

1)对已有数据进行平稳化处理，根据时间序列的散点图、自相关函数和偏自相关函数图以ADF单位根检验其方差，对序列的平稳性进行识别；

其中，对非平稳序列进行平稳化处理；如果数据序列是非平稳的，并存在一定的增长或下降趋势，则需要对数据进行差分处理，如果数据存在异方差，则需对数据进行处理，直到处理后的数据的自相关函数值和偏相关函数值无显著地异于零；

2)处理后对新的平稳时序建立差分自回归滑动平均ARIMA(p,d,q)模型；包括：自回归模型AR、滑动平均模型MA、自回归滑动平均模型ARMA(p,q)；

自回归模型AR

y_t＝c+φ₁y_t-1+φ₂y_t-2+…φ_py_t-p+ε_t

滑动平均模型MA

y_t＝ε_t-θ₁ε_t-1-θ₂ε_t-2-…-θ_qε_t-q

自回归滑动平均模型ARMA(p,q)

Y_t＝c+φ₁y_t-1+φ₂y_t-2+…+φ_py_t-p+ε_t-θ₁ε_t-1-θ₂ε_t-2-…-θ_qε_t-q

3)根据时间序列模型的识别规则，建立相应的模型。若平稳序列的偏相关函数是“截尾”的，而自相关函数是“拖尾”的，确定序列使用AR模型；若平稳序列的偏相关函数是“拖尾”的，而自相关函数是“截尾”的，则序列使用MA模型；若平稳序列的偏相关函数和自相关函数均是“拖尾”的，则序列使用ARMA模型。

4)模型求解：进行参数估计，检验是否具有统计意义；进行假设检验，诊断残差序列是否为白噪声；利用已通过检验的模型进行预测分析。

本发明产生的有益效果是：本发明基于BP神经网络，构建出企业估值指标与基础面和流动性指标的非线性关系。并建立基于时间序列的差分自回归滑动平均模型(ARIMA)对各指标进行预测，对科创板拟上市企业估值问题进行了深入的讨论和研究，提供了一种可量化的企业估值方式。

附图说明

下面将结合附图及实施例对本发明作进一步说明，附图中：

图1是本发明实施例的结构示意图；

图2是本发明实施例数据预处理的方法流程图；

图3是本发明实施例的中美市场2019年估值指标的计算示意图；

图4是本发明实施例的中美市场的级数比图；

图5是本发明实施例的函数拟合数据图；

图6是本发明实施例构建BP神经网络的方法流程图；

图7是本发明实施例的神经网络结构图；

图8是本发明实施例的ARIMA模型流程图；

图9是本发明实施例的营业收入时序图；

图10是本发明实施例的中国医药股份营业收入预测图；

图11是本发明实施例的六大行业的年成交量与平均换手率图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。

如图1所示，一种基于灰色预测和BP-ARIMA的科创板拟上市企业估值系统，

一种基于灰色预测和BP-ARIMA的科创板企业估值系统，包括：

估值修正模块，用于采集中国A股市场与美国NASDAQ市场的平均市销率资料，并确定这两个市场的估值溢价或折价水平作为修正系数；具体如下：

1)拟上市企业的上市年份为D，获得(D-10)年至(D-2)年中美市场的平均市销率，得到参考数据列x⁽⁰⁾＝(x⁽⁰⁾(1),x⁽⁰⁾(2),…,x⁽⁰⁾(9))；

则得到(D-1)年中美市场的平均市销率预测值：

对原始市销率数据x⁽⁰⁾作一次累加得到x⁽¹⁾，构造数据矩阵B及数据向量Y；

其中，z⁽¹⁾(k)＝αx⁽¹⁾(k)+(1-α)x⁽¹⁾，α为自定义的系数；

计算得到

建立方程：

2)估值溢价或折价水平的计算

根据(D-1)年中美市场的平均市销率预测值与(D-1)年中美市场的平均市销率，计算估值溢价或折价水平作为修正系数；

本发明系统的一个使用实例如下：

首先，根据最短距离原则建立最优平均市销率求解方程，通过对各企业的总市值进行归一化，对距离进行修正加权。以平均市销率作为市场的估值水平，求得2018年中美市场的估值水平，利用该方法对2009-2017年中美市场的估值水平进行计算，并通过灰色预测模型求得2018年中美市场的预测估值水平分别计算中美市场的溢价与折价水平。其次，如图2所示，对数据进行预处理，得到中国A股市场和美国NASDAQ市场的各企业的完整指标数据，构建BP神经网络建立非线性系统，将估值指标作为输出层，各项指标作为输入层，进行网络训练，结合网络层的各权值对它们进行定量分析，并比较中国与美国的差异。然后如图3所示，分别将中国A股市场与美国NASDAQ市场每一个具有完整信息的企业股票整理出来。将其看成一个基于时间序列的预测问题，建立BP神经网络与差分自回归平均滑动模型(BP-ARIMA模型)。最后对中国A股市场和科创板市场的企业进行分类，用A股市场中各类型企业的流动性指标数据的加权平均值代替科创板市场同类型企业的流动性指标数据，对科创板市场中的各类型企业的基础面数据进行平均化处理，用训练后的BP神经网络，对科创板各类型企业的估值水平进行预测，再最终加权求得创业板的估值水平。

(2)符号说明

2.基于平均市销率测算2018年中国A股市场与美国NASDAQ市场的估值水平

结合数据，建立加权的最短距离关键点模型，用求得的关键点的市销率代替并反映市场的估值水平。再对2009-2017年的平均市销率进行灰关联预测，求出2018年的预测估值水平。再根据预测值与实际值分别计算其中的溢价或折价部分，最终求出两个市场的估值溢价或折价水平。

(1)估值水平的计算

一个市场的估值水平要能够代表该市场中绝大多数企业的平均水平。由于市场中存在极个别特大市销率的企业(如北汽蓝谷的市销率高达698.73)，因此将市销率进行算术平均来代替市场的估值水平明显不够合理。

建立加权的最短距离关键点模型，用市场中某一企业的市销率来代表整个市场的平均市销率。设市场内各公司的市销率坐标为(U_i,0)，则可建立市场内所有公司的市销率坐标集合A{(U₁,0),(U₂,0),…,(U_i,0)}。设关键点坐标为(U_x,0)，其中

。则可定量描述两点之间的距离d_i：d_i＝|U_x-U_i|。

设总距离为D_x，则：

不断改变关键点U_x的位置，求得总距离集合D{D₁,D₂,…,D_i}，D₀＝minD{D₁,D₂,…,D_i}即为最短距离。则(U₀,0)为最短距离关键点，该点的市销率可以代表整个市场的估值水平。

考虑到体量不同的企业对市场的影响力大小不同，故对已有的最短距离关键点模型进行改进。通常，一个企业的体量由该企业的总市值决定。而总市值满足以下公式：

总市值＝市销率*营业收入

因此，根据附件已知条件求得市场内各企业的总市值，Q_i为各个企业的总市值，对此进行归一化处理：

Q_i′＝Q_i-Q_min/Q_max-Q_min

用求得的归一化结果作为权重带入总距离的求值过程中，现对两点直接的距离d_i进行修正：

d_i′＝|U_x-U_i|*Q_i′

求得修正后的总距离集合D′{D₁′,D₂′,…,D_i′}，D₀′＝minD′{D₁′,D₂′,…,D_i′}即为最短距离。则(U₀′,0)为最短距离点，将该点的市销率作为代表整个市场的估值水平，即平均市销率。

由以上方法得出2018年实际估值水平如表1所示：

表1 2018年实际估值水平

(2)测算2018年中国A股市场与美国NASDAQ市场的估值水平

根据构建的估值水平计算模型，求解2009-2017年中美市场的估值水平。具体结果如表2所示：

表2 2009-2017年中美市场的实际估值水平

得到参考数据列x⁽⁰⁾＝(x⁽⁰⁾(1),x⁽⁰⁾(2),…,x⁽⁰⁾(9))。

根据估值水平的计算，求解2009-2017年中美市场的估值水平。得到参考数据列x⁽⁰⁾＝(x⁽⁰⁾(1),x⁽⁰⁾(2),…,x⁽⁰⁾(9))。

求λ(k)：

根据2009-2017年中美市场的估值水平，求得级数比λ(k)的具体结果如图4所示。

通过对比各级数比与标准线可知，除了美国市场在2017年的级数比超过了标准上线外，所有的λ(k)∈[e^-1/5,e^2/11]，综合数据真实性方面考虑，序列x⁽⁰⁾仍可以作为模型的数据进行灰关联预测。

对原始数据x⁽⁰⁾作一次累加得到x⁽¹⁾，构造数据矩阵B及数据向量Y。由：

计算得到

建立方程：

则可得到预测值：

令残差为ξ(k)，

由计算可得ξ(k)＜0.1，所以该预测的精度较高，能够较好地进行预测。

由以上模型的结果得到2018年的预测估值水平如表3所示：

表3 2018年预测估值水平

(3)估值溢价或折价水平的计算

用已得到的预测估值水平与实际估值水平进行比较，多出的部分即为溢价部分，少于的部分即为折价部分。由计算公式：、

估值溢价水平＝溢价部分/实际估值水平

估值折价水平＝折价部分/实际估值水平

由计算可得，2018年中国A股市场(上证指数成分股)与美国NASDAQ市场的估值溢价或折价水平如表4所示：

表4中美市场估值溢价或折价水平

由表4数据可知，中国A股市场在2018年出现估值折价，但折价水平较低，基本保持一个平稳的行情走势；而美国纳斯达克股票市场在2018年出现了估值溢价，且溢价水平较高，这意味着美国纳斯达克股票市场在2017年的整体态势较为旺盛，行情普遍看涨。

3中国A股市场和美国NASDAQ市场的估值指标与基本面指标、流动性指标关系的定量分析

结合数据，利用BP神经网络进行非线性系统建立模型，构建三层神经网络，分别对中国A股市场和美国NASDAQ市场的市销率与其基本面指标、流动性指标之间进行非线性拟合，最终利用输入层和隐含层、隐含层和输出层之间的权值对各指标进行定量分析，并且结合测试集与该网络预测出市销率之间的图像，比较中国和美国之间的差异。

(1)数据预处理

①数据整理

分别将2009年至2018年数据统一在一起。对于中国市场的数据，首先剔除代码开头为900的B股，剩下的即为中国A股市场各企业的各项指标数据。由于ST股是财务状况或其它状况出现异常的上市公司股票交易进行特别处理的股票，它与基本面信息的关系比较小，对其估值无法通过模型进行测定和把握，若把这类股票与其他股票混在一起进行模型建立，反而会影响模型的精度，降低模型的实用性。因此剔除ST股的企业股票。接下来就是剔除含缺失数据的企业股票，将中国A股市场数据和美国NASDAQ市场数据中含有未公开数据的企业剔除，以防止给模型的准确度带来影响。

②初等函数拟合试探

由于各项经济指标中每个指标的单位都不同，并且一些指标的值十分巨大，为消除每个指标的单位不同，并且某一些指标的值十分巨大，为消除这些影响，将各项指标数据进行最大最小归一化。

接下来利用处理好的数据，通过MATLAB的函数拟合工具箱进行初等函数拟合，检验各项指标与市销率之间是否存在线性关系或者初等函数关系。下表所示为中国A股市场各指标与估值指标的函数拟合R方表。

表5函数拟合R方表

由上表即可看出，基本上没有函数可以进行拟合，虽然有两个R方达到了0.9989，可是其和方差SSE都是10⁷的数量级，表明拟合很不精确，故接下来我们对各指标绘出了其关于估值指标的散点图。

③绘制散点图

利用MATLAB对整理好的数据分别进行绘图，如图5所示。

由图5可知，各指标数据基本都是聚集在某一段区间内，当取同一指标值时，市销率对应有非常多值，因此很明显上面进行函数拟合时R方大多趋近于0是合理的，故构建基于BP神经网络的非线性系统对市场的估值指标与各指标之间的关系进行定量分析。

(2)构建BP神经网络的指标分析模型

各项指标与估值指标是复杂的非线性系统，这些系统状态方程很复杂，难以用数学方法准确建模。因此把该未知的系统看成一个黑箱，首先构建网络，然后用系统的输入输出数据训练BP神经网络，使网络能够表达该未知函数，然后利用输入层到隐含层各节点和隐含层各节点到输出层的权值对各指标与估值指标之间的关系进行定量分析，算法流程图如图6。

探寻非线性函数：

y＝f(x₁)+f(x₂)+f(x₃)+f(x₄)+f(x₅)+f(x₆)

其中x_i(i＝1,...,6)分别表示年度营业收入、年度归母净利润、年度净资产收益率、年交易量、年交易金额、年平均换手率。

①构建BP神经网络

该神经网络为6个输入参数，1个输出参数，结构设为6-5-1，隐含层设为5个节点，输入层6个节点，输出层含一个节点。

②BP神经网络的训练

网络参数设置：迭代次数：100次；学习率：0.1；目标：0.0004；训练步数：50。

(3)估值指标与基本面指标、流动性指标关系的定量分析

由于BP神经网络是一个自我学习的过程，程序经过学习后给出输入层与输出层的隐含映射关系，无法形成可读性的函数来描述六个变量与输出层之间的关系，但可以给出输入层到隐含层，隐含层到输出层的各变量的权值。本文考虑应用BP神经网络层次之间的权值定量关系，定性分析出各变量在决定估值数据中所占的比重大小。

本文考虑借用多元复合函数的思想解读BP神经网络图，现设输入层变量集合为X＝{x₁,x₂,…,x₆}，隐含层函数集合F_x{f₁,f₂,…,f₅}，输出层结果值为Z。

下面给出对BP神经网络过程的简化理解：易知隐含层中的每一个函数f_i均是多元函数，其值由输入层的各变量共同决定，本文认为输出层的输出值由隐含层各多元函数通过线性组合决定，而对应的系数即为隐含层到输出层的权值数。因此该BP神经网络图可以简化为一组多元复合函数各变量影响权重的求解。由于神经网络的结构过于复杂，故求得到的影响权重值不是精确定量值，但可以依此为参考定性分析各权重的影响力范围。

定义由输入层变量x_i至隐含层变量f_j的权值为第一层权，记作ω_ij；由隐含层变量f_i至输出层Z的权值为第二层权，记作λ_i。赋权值后的BP神经网络结构图如图7所示.

通过BP神经网络不同层次之间的权值，定性分析各变量在决定估值数据中所占的比重大小。权重值计算如下：对每个第一层权和第二层权，分别进行归一化处理，其结果记为w_ij：

各变量的对输出层的影响权重值由与其含该变量的对应第一层权和第二层权的乘积之和所决定。计算结果为x_i′：

x_i′＝ω_ij′*T_i′

最终计算得到各变量对中美市场评估指标的影响力权重值如表6所示：

表6各指标影响力权重值

依照表6数据对中美股票市场决定评估指标的影响力大小进行排序：

对于中国A股市场，决定评估指标的影响力大小排序为：平均换手率>年成交额>年成交量>净资产收益率>营业收入>归母净利润。

对于美国NASDAQ市场，决定评估指标的影响力大小排序为：营业收入>平均换手率>年成交额>净资产收益率>归母净利润>年成交量。

4.中国A股市场和美国NASDAQ市场2019年基本面指标、流动性指标预测

对于基本面指标和流动性指标变量，影响其发展变化的因素太多，难以建立回归模型来发现其变化发展规律进行预测。而时间序列分析模型就具有优势，仅需变量本身的数据即可对未来值进行预测。因此利用基于时间序列的BP-ARIMA模型对中国A股市场和美国NASDAQ市场2019年的基本面指标、流动性指标进行预测。

(1)建立差分自回归滑动平均(ARIMA(p,d,q))模型

针对ARMA(p,q)模型，具有趋势性非平稳性的时间序列不能直接建立ARMA模型，只能经过平稳化处理，处理后对新的平稳时序建立ARIMA(p,d,q)模型。

(2)ARIMA模型预测的求解

ARIMA模型流程图见图8。

①根据时间序列的散点图、自相关函数和偏自相关函数图以ADF单位根检验其方差、趋势及其季节性变化规律，对序列的平稳性进行识别。

②对非平稳序列进行平稳化处理。如果数据序列是非平稳的，并存在一定的增长或下降趋势，则需要对数据进行差分处理，如果数据存在异方差，则需对数据进行技术处理，直到处理后的数据的自相关函数值和偏相关函数值无显著地异于零。

③根据时间序列模型的识别规则，建立相应的模型。若平稳序列的偏相关函数是“截尾”的，而自相关函数是“拖尾”的，可断定序列适合AR模型；若平稳序列的偏相关函数是“拖尾”的，而自相关函数是“截尾”的，则可断定序列适合MA模型；若平稳序列的偏相关函数和自相关函数均是“拖尾”的，则序列适合ARMA模型。

④进行参数估计，检验是否具有统计意义。

⑤进行假设检验，诊断残差序列是否为白噪声。

⑥利用已通过检验的模型进行预测分析。

(3)2019市场估值指标的计算

①数据整理

分别将中国A股市场和美国NASDAQ市场的各大企业10年的数据以时间为轴排列，然后剔除含有缺失数据或者未知数据的企业，最终得到A股市场企业和NASDAQ市场企业。然后利用ARIMA模型分别对这些企业的2019年基本面指标和流动性指标进行预测。接下来用中国A股市场中的中国医药股份的2019年营业收入指标预测作为示例。

②观察时间序列的平稳性和随机性

ARIMA模型建模的基本条件是要求待预测的数列满足平稳的条件，即个体值要围绕序列均值上下波动，不能有明显的上升或下降趋势，如果出现上升或下降趋势，需要对原始序列进行差分平稳化处理。故首先绘制中国医药10年营业收入的时序图，如图9。观察时序图，可以发现数据具有长期增长的趋势，并非在某一个常数上下波动，因此判断该序列为非平稳时间序列。同时结合营业收入数据判断数据的平稳性，该序列为非平稳时间序列。

③对序列作差分处理，形成稳定随机序列

由以上分析，不能直接用ARIMA模型进行建模。首先对数列进行一阶差分，可以消除数据增长趋势性和季节性，预测数列作一阶差分后的图形显示基本消除了长期趋势性的影响，趋于平稳化，满足ARIMA模型建模的基本要求。一阶差分后的数据没有明显的线性趋势，处理比较成功。接下来需要去观察自相关图和偏自相关图，需要通过拖尾和截尾来确定参数。

④模型参数的估计

模型识别即是确定自回归阶数p和滑动平均阶数q的过程，p和q的定阶直接影响到预测结果的精确性。时间序列预测模块的自相关分析包括对自相关系数和偏相关系数的分析，通过对比分析从而实现对时间序列特性的识别。

对上面的ACF图和PACF图进行观察，得到阶数，主要看偏自相关图实际是逐步减少，可以认为是拖尾；自相关图有一个系数明显异常可以认为是1阶截尾。自相关函数1步截尾，偏自相关函数3步截尾。根据变换数列的自相关函数和偏自相关函数的特点，并经过反复测试，那么对ARIMA模型的参数进行估计，三个参数定为d＝1，p＝3和q＝1即模型为ARIMA(3,1,0)。

⑤数据预测

利用MATLAB进行对2019年的营业收入进行预测如图10。得到预测值为30942000000。通过MATLAB编程，利用以上方法，最终预测得出中国A股市场和美国NASDAQ市场2019年的基本面指标和流动性指标的各项指标值，部分结果见下表7、8所示。

表7中国A股市场基本面指标和流动性指标的2019年预测值

表8中国美国NASDAQ市场基本面指标和流动性指标的2019年预测值

⑥2019市场估值指标的计算

基于3所构建的神经网络模型，通过ARIMA模型对2019年两市场的各企业指标进行预测后，将其作为预测集输入问题二中的神经网络，通过其非线性的关系计算出2019年各企业的市销率，即估值指标。部分结果如下表所示。

表9中国A股市场市销率的2019年神经网络计算值

5.中国首批科创板企业上市估值水平的预测

一个板块的估值水平可由板块内各企业的估值指标与总体量共同决定。对某个企业的估值指标可由它前一年的基本面与流动性数据进行预测。因此根据以上两个基本概念，对94家企业进行数据处理，并构建基本面与流动性指标的加权平均模型，最后通过训练后的BP神经网络得到科创板的估值水平。

(1)数据处理

①企业分类

查阅相关文献可知；科创板重点支持信息技术、高端装备、新材料、新能源、节能环保以及生物医药行业。若以A股市场内所有的股票的流动性数据作为衡量科创板市场流动性的参考值，则其他行业(如地产行业、钢铁石油行业等)的股票数据将会对科创板市场数据预测产生干扰。因此，在中国A股市场中对上述属于六大行业的公司进行挑选，并对科创板拟上市的企业进行了分类。其中，科创板拟上市企业分类数据如表10所示：

表10分类数据

②流动性指标数据的加权平均值

对A股市场中属于六大行业的企业进行挑选，在每一类别中，选取所有公司2018年流动性指标数据，按总市值归一化加权后的流动性指标数据作为该类科创企业现阶段的流动性指标数据。以生物医药为例描述具体操作过程：

在A股市场中查询到主营业务为生物医药的企业共有105家，利用它们的市销率与流动性的基础数据，根据1的方法，分别计算出各家公司的总市值。得到A股市场生物医药企业总市值集合T{T₁,T₂,…,T₁₀₅}，按总市值分配各公司流动性数据在市场流动性数据中的权重，计算公式如下：

再用求得的权重对各公司流动性数据基础值分别进行加权平均，得到最终A股市场生物医药企业的平均流动性数据，以此数据代替科创板生物医药企业的平均流动性数据。最后分别对剩余五大类行业的平均流动性数据进行计算，最终汇总数据，六大行业平均流动性数据如表11所示：

表11六大行业平均流动性指标数据

根据其中具有分析意义的年成交量(股)和平均换手率(％)数据构建二元折线图，如图11所示。由图11可知：六大行业在A股市场中2018年股票成交情况为：信息技术类与新能源类大部分散户选择持有股票不抛售；而新材料类类大量散户抛售股票；而节能环保、高端设备与生物医药则维持相对平衡的状态。

③基本面指标数据的平均值

现将科创板已受理企业按照主营业务划分到规定的六大产业当中。由于基本面数据衡量了一个企业的宏观经济运行态势，本身已经受到了公司体量的影响。故考虑用直接平均法衡量各大行业在科创板中基本面指标数据的平均表现。对科创板中各大类企业所给出的2018年基本面指标值求平均值，计算结果如表12所示：

表12 2018年基本面指标值平均值

(2)估值水平的计算

①六大行业估值水平计算

对数据进行的处理后，得到2018年科创板各行业基本面与流动性指标数据，

将其代入训练好后的神经网络中，便可计算出相应的平均市销率，即科创板各行业的估值水平。其结果如表13所示：

表13各行业的估值水平

由表13数据可知：科创板企业上市后，高科技创新技术类都具有较高的估值水平，有良好的发展前景，以生物医药产业和新材料产业最为突出。而新能源产业和节能环保产业较之相比较为黯淡。需要结合中央合理的政策支持，提升其在科创板市场内的企业创新能力，从而得到更好的发展。

②科创板估值水平计算

根据5科创板六大行业的分类数据，按照2的求解思路，以行业为单位，用行业总营销额与行业平均市销率求得行业的总市值，按总市值为标准对行业间进行归一化和加权化处理，再利用加权平均的方法，六大行业总市值与归一化后的权值如表14所示：

表14六大行业总市值与权值表

再利用加权平均的方法，求得2019年科创板估值水平为：9.83。

应当理解的是，对本领域普通技术人员来说，可以根据上述说明加以改进或变换，而所有这些改进和变换都应属于本发明所附权利要求的保护范围。

Claims

1.一种基于灰色预测和BP-ARIMA的科创板企业估值系统，其特征在于，包括：

估值指标预测模块，用于根据美国NASDAQ市场的市销率关联模型和第D年基本面指标、流动性指标预测值，进行估值指标预测；

2.根据权利要求1所述的基于灰色预测和BP-ARIMA的科创板企业估值系统，其特征在于，所述数据获取模块中，根据已有数据进行第D年中国A股市场和美国NASDAQ市场基本面指标、流动性指标预测为利用基于时间序列的ARIMA-BP模型对中国A股市场和美国NASDAQ市场的基本面指标、流动性指标进行预测；具体如下：

3)根据时间序列模型的识别规则，建立相应的模型。若平稳序列的偏相关函数是截尾的，而自相关函数是拖尾的，则序列使用AR模型；若平稳序列的偏相关函数是拖尾的，而自相关函数是截尾的，则序列使用MA模型；若平稳序列的偏相关函数和自相关函数均是拖尾的，则序列使用ARMA模型。

3.根据权利要求1所述的基于灰色预测和BP-ARIMA的科创板企业估值系统，其特征在于，所述估值修正模块中，修正系数计算具体如下：

则得到(D-1)年中美市场的平均市销率预测值：

计算得到

建立方程：

2)估值溢价或折价水平的计算

根据(D-1)年中美市场的平均市销率预测值与(D-1)年中美市场的平均市销率，计算估值溢价或折价水平作为修正系数。

4.根据权利要求1所述的基于灰色预测和BP-ARIMA的科创板企业估值系统，其特征在于，所述估值指标预测模块中，市销率关联模型为bp神经网络模型，隐含层设为5个节点，输入层6个节点，输出层1个节点；输入数据为年度营业收入、年度归母净利润、年度净资产收益率、年度单只股票交易量、年度单只股票交易金额、年度单只股票平均换手率；输出为估值指标。