CN106874686A - 指标关系网构建方法 - Google Patents

指标关系网构建方法 Download PDF

Info

Publication number
CN106874686A
CN106874686A CN201710122799.5A CN201710122799A CN106874686A CN 106874686 A CN106874686 A CN 106874686A CN 201710122799 A CN201710122799 A CN 201710122799A CN 106874686 A CN106874686 A CN 106874686A
Authority
CN
China
Prior art keywords
index
level
personal connections
degree
construction method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710122799.5A
Other languages
English (en)
Inventor
夏粟
夏一粟
刘红跃
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Beijing Hoze Data Technology Co Ltd
Original Assignee
Beijing Beijing Hoze Data Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Beijing Hoze Data Technology Co Ltd filed Critical Beijing Beijing Hoze Data Technology Co Ltd
Priority to CN201710122799.5A priority Critical patent/CN106874686A/zh
Publication of CN106874686A publication Critical patent/CN106874686A/zh
Pending legal-status Critical Current

Links

Classifications

    • G06F19/32

Abstract

本发明提供了一种指标关系网构建方法,包括:步骤1,收集同一时间段内所有管理指标的数据;步骤2,计算所述管理指标中的两个指标之间的关联程度,并输出具有强关联关系的指标对;步骤3,检验所述指标对内的两个指标之间的因果关系,并根据因果关系赋予该指标对相关性的影响方向。通过本发明中的指标关系网构建方法建立的医院管理指标关系网,在某个指标出现异常时,利用该关系网可以自动定位导致异常的根源指标,当出现异常时可追溯异常的根本原因,不需要人工根据业务关系梳理异常的原因;此外,当某个指标异常时,我们可以根据该关系网预测由它指向的其他指标可能会出项异常,在该异常引发更严重的问题之前及时控制并解决。

Description

指标关系网构建方法
技术领域
本发明涉及指标异常预测领域,特别是一种指标关系网构建方法。
背景技术
现有技术中,当医院管理指标关系网中的某个指标出现异常时,需要人工根据业务关系梳理异常的原因,不但需要依靠管理者的经验,而且无法及时地预测出由它指向的哪些其他指标可能会出项异常,常常会导致更严重的问题。
发明内容
本发明提供了一种指标关系网构建方法,以解决现有技术中需要人工根据业务关系梳理异常的原因,无法及时地预测出由它指向的哪些其他指标可能会出项异常,以致导致更严重后果的问题。
为解决上述问题,作为本发明的一个方面,提供了一种指标关系网构建方法,包括:步骤1,收集同一时间段内所有管理指标的数据;步骤2,计算所述管理指标中的两个指标之间的关联程度,并输出具有强关联关系的指标对;步骤3,检验所述指标对内的两个指标之间的因果关系,并根据因果关系赋予该指标对相关性的影响方向。
优选地,所述步骤2包括:步骤21,对所有管理指标的数据进行标准化处理;步骤22,在所有管理指标中选取一个指标为参考数列,将其余的管理指标作为比较数列;步骤23,计算所述参考数列与比较数列之间的关联系数;步骤24,计算参考数列与比较数列之间的关联度;步骤25,检查是否所有的管理指标都做过参考数列,若否,重复步骤22-24,若是,则转到步骤26;步骤26,根据步骤22-25得到所有管理指标中两两指标间的关联度;步骤27,设定指标对关联度阈值;步骤28:根据关联度阈值和管理指标中两两指标间的关联度确定具有强关联关系的指标对。
优选地,所述步骤23中的关联系数采用下式计算得到:
其中,
ρ∈(0,∞),称为分辨系数
Y={Y(k)|k=1,2,Λ,n}为参考数列;
Xi={Xi(k)|k=1,2,Λ,n}为比较数列,其中,i=1,2,Λ,m。
优选地,所述步骤24通过下式计算关联度:
其中,ri为关联度,ξi(k)为关联系数,n为数列的长度。
优选地,所述步骤28中,如果两个管理指标之间的关联度大于等于关联度阈值,则确定这两个管理指标之间存在强关联关系。
优选地,所述步骤3包括:步骤31,获取具有强关联关系的两个管理指标x和y;步骤32,检验x是否为y的原因;步骤33,检验y是否为x的原因;步骤34,重复步骤31至33,直到检验完所有具有强关联关系的指标因果关系。
优选地,所述步骤3或步骤4采用下述方法确定一个管理指标是否为另一个管理指标的原因:步骤a,取其中一个管理指标A,将A对所有A的滞后项At-1,At-2,…,At-q和另一个管理指标B做回归;步骤b,计算步骤a回归结果的残差平方和RSSR;步骤c,将A对所有A的滞后项At-1,At-2,…,At-q和另一个管理指标B以及B的滞后项做回归;步骤d,计算步骤c回归结果的残差平方和RSSUR;步骤e,零假设是B的滞后项不属于此回归;步骤f,用F检验检验步骤e的零假设;步骤g,根据步骤f的检验结果判断B是否为A的原因。
优选地,步骤e采用下式进行检验:
它遵循自由度为q和(n-k)的F分布,其中,n是样本容量,q等于滞后项B的个数,即有约束回归方程中待估参数的个数,k是无约束回归中待估参数的个数。
优选地,步骤g包括:如果在选定的显著性水平α上计算的F值超过临界Fα值,则拒绝零假设,这样滞后B项就属于此回归,表明B是A的原因。
通过本发明中的指标关系网构建方法建立的医院管理指标关系网,在某个指标出现异常时,利用该关系网可以自动定位导致异常的根源指标,当出现异常时可追溯异常的根本原因,不需要人工根据业务关系梳理异常的原因;此外,当某个指标异常时,我们可以根据该关系网预测由它指向的其他指标可能会出项异常,在该异常引发更严重的问题之前及时控制并解决。
附图说明
图1示意性地示出了本发明的整体流程图;
图2示意性地示出了步骤2的流程图;
图3示意性地示出了步骤3的流程图。
具体实施方式
以下结合附图对本发明的实施例进行详细说明,但是本发明可以由权利要求限定和覆盖的多种不同方式实施。
本发明提供了一种指标关系网构建方法,其可用于学校、银行等具有复杂指标体系的系统。该方法包括以下步骤:
步骤1,收集同一时间段内所有管理指标的数据;
步骤2,计算所述管理指标中的两个指标之间的关联程度,并输出具有强关联关系的指标对;例如,可通过灰色关联分析法、线性相关、秩相关、余弦、皮尔逊相关性、欧式距离等方法计算关联程度。
步骤3,检验所述指标对内的两个指标之间的因果关系,并根据因果关系赋予该指标对相关性的影响方向。即,由判断出的因果关系赋予两个指标的指向性,由原因指标指向结果指标。
通过本发明中的指标关系网构建方法建立的医院管理指标关系网,其意义在于:当某个指标出现异常时,利用该关系网可以自动定位导致异常的根源指标,当出现异常时可追溯异常的根本原因,不需要人工根据业务关系梳理异常的原因;此外,当某个指标异常时,我们可以根据该关系网预测由它指向的其他指标可能会出项异常,在该异常引发更严重的问题之前及时控制并解决。
优选地,所述步骤2包括:
步骤21,对所有管理指标的数据进行标准化处理;
步骤22,在所有管理指标中选取一个指标为参考数列,将其余的管理指标作为比较数列;
步骤23,计算所述参考数列与比较数列之间的关联系数;
步骤24,计算参考数列与比较数列之间的关联度;
步骤25,检查是否所有的管理指标都做过参考数列,若否,重复步骤22-24,若是,则转到步骤26;
步骤26,根据步骤22-25得到所有管理指标中两两指标间的关联度;
步骤27,设定指标对关联度阈值。以医院为例,可根据医院内已知的具有确定关系的关联度来确定,例如,已知的医院门诊量和门诊收入是具有强关联关系的,那么我们定义的关联度阈值要小于门诊量和门诊收入的关联度。
步骤28:根据关联度阈值和管理指标中两两指标间的关联度确定具有强关联关系的指标对。
例如:给出已出初值化的序列如下:
x0=(1,1.1,2,2.25,3,4)
x1=(1,1.166,1.834,2,2.314,3)
x2=(1,1.125,1.075,1.375,1.625,1.75)
x3=(1,1,0.7,0.8,0.9,1.2)
可按下述方式分三步计算关联系数:
步骤(1):求差序列
各个时刻xi与x0的绝对差如下
步骤(2):求两级最小差与最大差
步骤(3):算关联系数
将数据代入关联系数计算公式,得
作关联系数ξ1(k)在各个时刻的值的集合,得关联系数序ξ1
ξ1=(ξ1(1),ξ1(2),ξ1(3),ξ1(4),ξ1(5),ξ1(6))=(1,0.955,0.894,0.848,0.679,0.583)同理有
ξ2=(ξ2(1),ξ2(2),ξ2(3),ξ2(4),ξ2(5),ξ2(6))=(1,0.982,0.602,0.615,0.797,0.383)
ξ3=(ξ3(1),ξ3(2),ξ3(3),ξ3(4),ξ3(5),ξ3(6))=(1,0.933,0.52,0,49,0.4,0.34)
优选地,所述步骤23中的关联系数采用下式计算得到:
其中,
ρ∈(0,∞),称为分辨系数
其中,y为参考数列,xi为比较数列,y(k)为参考数列中的第k个值,xi(k)为比较数列中的第k个值。例如y=(2,1,4,3,2),那么y(1)=2,y(2)=1,y(3)=4,…
假设k=1,2,…,n,i=1,2,…,m,先求出当i=1时,计算y(1)-x1(1),y(2)-x1(2),…,y(n)-x1(n)这n个值中的最小值,记为a1,同理当i=2时,计算y(1)-x2(1),y(2)-x2(2),…,y(n)-x2(n)这n个值中的最小值,记为a2,同理得到a3,a4,…,am,再计算a1,a2,…,am的最小值即为的值。
优选地,所述步骤24通过下式计算关联度:
其中,ri为关联度,ξi(k)为关联系数,n为数列的长度(优选地,可以是y的长度,也可以是xi的长度,因为y和xi的长度是相同的)。
优选地,所述步骤28中,如果两个管理指标之间的关联度大于等于关联度阈值,则确定这两个管理指标之间存在强关联关系。
优选地,所述步骤3包括:
步骤31,获取具有强关联关系的两个管理指标x和y;
步骤32,检验x是否为y的原因;
步骤33,检验y是否为x的原因;
步骤34,重复步骤31至33,直到检验完所有具有强关联关系的指标因果关系。
优选地,所述步骤3或步骤4采用下述方法确定一个管理指标是否为另一个管理指标的原因:
步骤a,取其中一个管理指标A,将A对所有A的滞后项At-1,At-2,…,At-q和另一个管理指标B做回归;
步骤b,计算步骤a回归结果的残差平方和RSSR
步骤c,将A对所有A的滞后项At-1,At-2,…,At-q和另一个管理指标B以及B的滞后项做回归;
步骤d,计算步骤c回归结果的残差平方和RSSUR
步骤e,零假设是B的滞后项不属于此回归;
步骤f,用F检验检验步骤e的零假设;
需要说明的是,步骤e-f根据一定假设条件由样本推断总体,具体做法是:根据问题的需要对所研究的总体作某种假设,即为零假设,此处的零假设是B的滞后项不属于此回归,也就是B不是A的格兰杰原因,F统计量是检验线性回归的参数的显著性的,若通过F统计量的检验B的滞后项会明显的影响A则B的滞后项的系数不为零,及B的滞后项属于此回归。
其中,格兰杰因果关系的定义为:若在包含了变量A,B的过去信息的条件下,对变量B的预测效果要优于只单独由B的过去信息对B进行的预测效果,即变量A有助于解释变量B的将来变化,则认为变量A是引致变量B的格兰杰原因。F统计量是统计学上的定义,此处用F统计量来检验线性回归参数的显著性。
步骤g,根据步骤f的检验结果判断B是否为A的原因。例如,A和B通过灰色关联分析法确定是否强关联,若强关联,则需要A和B哪个是因,哪个是果,或者是互为因果。如果实际中A是B的因,若B出现异常,可以进一步根据因果关系网找到出现异常的根本原因。
优选地,步骤e采用下式进行检验:
它遵循自由度为q和(n-k)的F分布,其中,n是样本容量,q等于滞后项B的个数,即有约束回归方程中待估参数的个数,k是无约束回归中待估参数的个数。
优选地,步骤g包括:如果在选定的显著性水平α上计算的F值超过临界Fα值,则拒绝零假设,这样滞后B项就属于此回归,表明B是A的原因。也就是说,α表示原假设为真时,拒绝原假设的概率,1-α为置信度置信水平,其表明了区间估计的可靠性。
本发明步骤3最终建立的关系网是有向图,而步骤2输出的强关联关系是无向图,步骤2输出的只是关系对及关系对的关联强度,计算两两指标间的关联度,超过关联度阈值的两个指标具有强关联关系,输出这两个指标对及对应的关联度,而小于关联度阈值的指标认为不存在强关联关系。
步骤2输出的结果类似下面:
Node Node 关联度
指标1 指标4 0.65
指标1 指标7 0.84
指标2 指标3 0.66
指标2 指标4 0.69
上表中两个node没有方向性。有了强因果关系后,指标关系网变为了有向图,
source Target 关联度
指标1 指标4 0.65
指标1 指标7 0.84
指标2 指标3 0.66
指标2 指标4 0.69
上表中source和Target是有方向性的,由source指向Target。
无向图解决的问题是某个指标和哪些指标是相关的,相关的强度是多少,无向图解决的是某个指标出现问题时,找根源时,是需要找到哪些指标是指向该指标的。有了上述强因果关系列表就有了关系网。其中,关系网是从图的展示的层面说的,关系列表是从图的数据存储层面说的。
有了这个管理指标关系网,当某个指标出现异常时,利用该关系网可以自动定位导致异常的根源指标,不需要人工根据业务关系梳理异常的原因,还有当某个指标异常时,我们可以根据该关系网预测由它指向的其他指标可能会出项异常,在该异常引发更严重的问题之前及时控制并解决。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种指标关系网构建方法,其特征在于,包括:
步骤1,收集同一时间段内所有管理指标的数据;
步骤2,计算所述管理指标中的两个指标之间的关联程度,并输出具有强关联关系的指标对;
步骤3,检验所述指标对内的两个指标之间的因果关系,并根据因果关系赋予该指标对相关性的影响方向。
2.根据权利要求1所述的指标关系网构建方法,其特征在于,所述步骤2包括:
步骤21,对所有管理指标的数据进行标准化处理;
步骤22,在所有管理指标中选取一个指标为参考数列,将其余的管理指标作为比较数列;
步骤23,计算所述参考数列与比较数列之间的关联系数;
步骤24,计算参考数列与比较数列之间的关联度;
步骤25,检查是否所有的管理指标都做过参考数列,若否,重复步骤22-24,若是,则转到步骤26;
步骤26,根据步骤22-25得到所有管理指标中两两指标间的关联度;
步骤27,设定指标对关联度阈值;
步骤28:根据关联度阈值和管理指标中两两指标间的关联度确定具有强关联关系的指标对。
3.根据权利要求2所述的指标关系网构建方法,其特征在于,所述步骤23中的关联系数采用下式计算得到:
ξ i ( k ) = min i min k | y ( k ) - x i ( k ) | + ρ max i max k | y ( k ) - x i ( k ) | | y ( k ) - x i ( k ) | + ρ max i max k | y ( k ) - x i ( k ) |
其中,y(k)为参考数列,xi(k)为比较数列,ρ∈(0,∞)为分辨系数,k是数列的每一个值,i是取每一个比较数列。
4.根据权利要求3所述的指标关系网构建方法,其特征在于,所述步骤24通过下式计算关联度:
r i = 1 n Σ k = 1 n ξ i ( k ) , k = 1 , 2 , Λ , n
其中,ri为关联度,ξi(k)为关联系数,n为数列的长度。
5.根据权利要求4所述的指标关系网构建方法,其特征在于,所述步骤28中,如果两个管理指标之间的关联度大于等于关联度阈值,则确定这两个管理指标之间存在强关联关系。
6.根据权利要求1所述的指标关系网构建方法,其特征在于,所述步骤3包括:
步骤31,获取具有强关联关系的两个管理指标x和y;
步骤32,检验x是否为y的原因;
步骤33,检验y是否为x的原因;
步骤34,重复步骤31至33,直到检验完所有具有强关联关系的指标因果关系。
7.根据权利要求6所述的指标关系网构建方法,其特征在于,所述步骤3或步骤4采用下述方法确定一个管理指标是否为另一个管理指标的原因:
步骤a,取其中一个管理指标A,将A对所有A的滞后项At-1,At-2,…,At-q和另一个管理指标B做回归;
步骤b,计算步骤a回归结果的残差平方和RSSR
步骤c,将A对所有A的滞后项At-1,At-2,…,At-q和另一个管理指标B以及B的滞后项做回归;
步骤d,计算步骤c回归结果的残差平方和RSSUR
步骤e,零假设是B的滞后项不属于此回归;
步骤f,用F检验检验步骤e的零假设;
步骤g,根据步骤f的检验结果判断B是否为A的原因。
8.根据权利要求7所述的指标关系网构建方法,其特征在于,步骤e采用下式进行检验:
F = ( RSS R - RSS U R ) / q RSS U R / ( n - k )
它遵循自由度为q和(n-k)的F分布,其中,n是样本容量,q等于滞后项B的个数,即有约束回归方程中待估参数的个数,k是无约束回归中待估参数的个数。
9.根据权利要求7所述的指标关系网构建方法,其特征在于,步骤g包括:
如果在选定的显著性水平α上计算的F值超过临界Fα值,则拒绝零假设,这样滞后B项就属于此回归,表明B是A的原因。
CN201710122799.5A 2017-03-03 2017-03-03 指标关系网构建方法 Pending CN106874686A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710122799.5A CN106874686A (zh) 2017-03-03 2017-03-03 指标关系网构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710122799.5A CN106874686A (zh) 2017-03-03 2017-03-03 指标关系网构建方法

Publications (1)

Publication Number Publication Date
CN106874686A true CN106874686A (zh) 2017-06-20

Family

ID=59169558

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710122799.5A Pending CN106874686A (zh) 2017-03-03 2017-03-03 指标关系网构建方法

Country Status (1)

Country Link
CN (1) CN106874686A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107832927A (zh) * 2017-10-25 2018-03-23 国网冀北电力有限公司电力科学研究院 基于灰色关联分析法的10kV线路线变关系评价方法
CN108009040A (zh) * 2017-12-12 2018-05-08 杭州时趣信息技术有限公司 一种确定故障根因的方法、系统和计算机可读存储介质
CN108876041A (zh) * 2018-06-21 2018-11-23 清华大学 基于因果影响网络算法的极地海冰面积预测方法及装置
CN109840185A (zh) * 2019-01-11 2019-06-04 新华三大数据技术有限公司 一种指标关联方法及装置
CN110262937A (zh) * 2019-05-06 2019-09-20 阿里巴巴集团控股有限公司 一种指标异常原因的识别方法及装置
CN113505501A (zh) * 2021-09-10 2021-10-15 南京国睿信维软件有限公司 基于复杂装备型号研制的指标体系设计及优化方法

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107832927A (zh) * 2017-10-25 2018-03-23 国网冀北电力有限公司电力科学研究院 基于灰色关联分析法的10kV线路线变关系评价方法
CN108009040A (zh) * 2017-12-12 2018-05-08 杭州时趣信息技术有限公司 一种确定故障根因的方法、系统和计算机可读存储介质
CN108009040B (zh) * 2017-12-12 2021-05-04 杭州时趣信息技术有限公司 一种确定故障根因的方法、系统和计算机可读存储介质
CN108876041A (zh) * 2018-06-21 2018-11-23 清华大学 基于因果影响网络算法的极地海冰面积预测方法及装置
WO2019242779A1 (zh) * 2018-06-21 2019-12-26 清华大学 基于因果影响网络算法的极地海冰面积预测方法及装置
CN108876041B (zh) * 2018-06-21 2020-07-28 清华大学 基于因果影响网络算法的极地海冰面积预测方法及装置
CN109840185A (zh) * 2019-01-11 2019-06-04 新华三大数据技术有限公司 一种指标关联方法及装置
CN110262937A (zh) * 2019-05-06 2019-09-20 阿里巴巴集团控股有限公司 一种指标异常原因的识别方法及装置
CN110262937B (zh) * 2019-05-06 2023-07-18 创新先进技术有限公司 一种指标异常原因的识别方法及装置
CN113505501A (zh) * 2021-09-10 2021-10-15 南京国睿信维软件有限公司 基于复杂装备型号研制的指标体系设计及优化方法

Similar Documents

Publication Publication Date Title
CN106874686A (zh) 指标关系网构建方法
CN113822499B (zh) 一种基于模型融合的列车备件损耗预测方法
CN112418603A (zh) 基于设备健康指数的etc门架系统状态评价方法、电子设备、存储介质
Zhang et al. Autoregressive mediation models using composite scores and latent variables: Comparisons and recommendations.
CN115471097A (zh) 一种数据驱动的井下局部区域安全状态评估方法
Georgiadis et al. A methodology for the reassessment of hull-girder ultimate strength of a VLCC tanker based on corrosion model updating
CN114519519A (zh) 基于gbdt算法与逻辑回归模型的企业违约风险评估方法设备及介质
Taylor Procedures for evaluating trends in public opinion
CN113011788A (zh) 一种海上交通事故应急决策方法、终端设备及存储介质
CN101527016A (zh) 出入境检验检疫符合性条件的筛选方法
Wongkhamdi et al. A comparison of classical discriminant analysis and artificial neural networks in predicting student graduation outcomes
Godase et al. The SPRT control charts for the Maxwell distribution
San et al. Dc-srgm: Deep cross-project software reliability growth model
Vasco et al. Segmentation of potential fraud taxpayers and characterization in personal income tax using data mining techniques
CN115409226A (zh) 一种数据处理方法和数据处理系统
Ritschel Impact of political-economy variables on cost growth in military weapon system contracts
Kral et al. Evaluation of prediction ability of bankruptcy prediction models applying logistic regression (LOGIT)
Bozsik Artificial neural networks in default forecast
Omolohunnu et al. Modelling Air Passenger Traffic Flow in Murtala Muhammad International Airport Lagos, Nigeria: A Time Series Approach
Yunita Volatility Modeling Using ARCH/GARCH Method: Aplication on Asia Pasific Index
Trzęsiok Measuring the quality of multivariate statistical models
CN111160419B (zh) 一种基于深度学习的电子式互感器数据分类预测方法及装置
Kryukova et al. ECONOMETRIC FORECAST OF THE SHARE PRICE ON THE EXAMPLE OF PJSC “OIL COMPANY “ROSNEFT”
Zhang et al. Neural network methods for forecasting turning points in economic time series: an asymmetric verification to business cycles
Bachkir Statistical methods of forecasting and detection of bankruptcy

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170620