CN112348318B - 一种供应链风险预测模型的训练和应用方法及装置 - Google Patents
一种供应链风险预测模型的训练和应用方法及装置 Download PDFInfo
- Publication number
- CN112348318B CN112348318B CN202011119200.0A CN202011119200A CN112348318B CN 112348318 B CN112348318 B CN 112348318B CN 202011119200 A CN202011119200 A CN 202011119200A CN 112348318 B CN112348318 B CN 112348318B
- Authority
- CN
- China
- Prior art keywords
- supply chain
- risk prediction
- target
- prediction model
- network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013058 risk prediction model Methods 0.000 title claims abstract description 146
- 238000012549 training Methods 0.000 title claims abstract description 140
- 238000000034 method Methods 0.000 title claims abstract description 28
- 238000004422 calculation algorithm Methods 0.000 claims description 50
- 238000004891 communication Methods 0.000 claims description 17
- 238000011156 evaluation Methods 0.000 claims description 13
- 238000003860 storage Methods 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 10
- 238000012512 characterization method Methods 0.000 claims 1
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 14
- 238000004364 calculation method Methods 0.000 description 8
- 238000011144 upstream manufacturing Methods 0.000 description 7
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000007477 logistic regression Methods 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- Educational Administration (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本公开涉及本发明涉及人工智能领域,特别涉及一种供应链风险预测模型的训练和应用方法及装置。用以及时有效的对供应链网络中的风险进行预测,该方法为:服务器基于供应链网络提供的训练样本数据集合包含的各个特征描述信息,对供应链风险预测模型进行训练,输出相应的目标供应链风险预测模型,其中,一个训练样本数据的特征描述信息包含至少两个目标对象的业务特征以及拓扑网络特征;这样,在供应链网络中,当有一个目标对象发生风险事件后,可以采用上述目标供应链风险预测模型,及时地对供应链网络中其他目标对象也发生风险事件的概率进行预测,从而及时向其他目标对象提出预警,通知其他目标对象提前采取应对措施,以减少企业损失。
Description
技术领域
本发明涉及人工智能领域,特别涉及一种供应链风险预测模型的训练和应用方法及装置。
背景技术
随着社会发展的进步,各个企业之间形成的供应链网络存在着高度的相互依存性。在供应链网络中,当某个企业发生风险事件,如,断供、违约、退订,贸易战等等,风险会沿着供应链网络进行传播。
显然,企业的经营不止会影响到自身,还会影响到所述企业上下游的相关联企业的经营,甚至会影响到所述企业所在的供应链网络中其他企业的经营。
但是,由于企业数目巨大,且供应链网络结构复杂,因而导致判断一个企业遭遇的风险事件,是否会波及其他企业的因素过多,因此,已有技术下,并没有一个有效的解决方案,可以在供应链网络中,进行有效地风险预测。
因此,需要设计一种新的供应链风险预测模型的训练和应用方法,用以及时有效的对供应链网络中的风险进行预测,减小企业损失。
发明内容
本发明提供一种供应链风险预测模型的训练和应用方法及装置,用以及时有效的对供应链网络中的风险进行预测,减小企业损失。
本发明提供的具体技术方案如下:
第一方面,一种供应链风险预测模型的训练方法,包括:
基于供应链网络提供的训练样本数据集合,获得各个训练样本数据的特征描述信息,其中,一个训练样本数据的特征描述信息包含至少两个目标对象的业务特征以及拓扑网络特征,一个目标对象的拓扑网络特征表征所述一个目标对象与拓扑网络中其他目标对象之间的连通方式和关联程度,其中,所述目标对象为企业,所述业务特征用于表征企业的运营状态;
基于所述训练样本数据集合对供应链风险预测模型进行训练,得到目标损失信息,并基于所述目标损失信息对所述供应链风险预测模型的模型参数进行调整并进行迭代训练;
在满足预设的收敛条件时,输出训练后的目标供应链风险预测模型。
可选的,基于供应链网络提供的训练样本数据集合,获得各个训练样本数据的特征描述信息,包括:
基于供应链网络提供的训练样本数据集合,获得各个目标对象的注册资本,规模信息、评级信息、资产负债率和流动资产负债率中的任意一种或任意组合,作为相应目标对象的业务特征。
可选的,基于供应链网络提供的训练样本数据集合,获得各个训练样本数据的特征描述信息,进一步包括:
基于供应链网络提供的训练样本数据集合,获得各个目标对象的供应链社区特征、强连通分支特征、超文本敏感标题搜索Hits特征和度中心性特征中的任意一种或组合,作为相应目标对象的拓扑网络特征;
其中,
所述供应链社区特征,表征目标对象所在的群组发生风险事件占整个拓扑网络中风险事件的比例;
所述强边通分支特征,表征目标对象在拓扑网络中是否位于环状结构内,以及若位于环状结构内,所述环状结构包含的目标对象数目;
所述超文本敏感标题搜索特征,包括目标对象的权威度和枢纽度,其中,所述权威度表征所述目标对象在拓扑网络中的重要程度,所述枢纽度表征拓扑网络中经过所述目标对象到达所述各个其他目标对象的可能性;
所述度中心特征,表征所述目标对象,在拓扑网络中作为任意两个其他目标对象之间最短路径包含的连接点的次数。
可选的,基于所述训练样本数据集合对供应链风险预测模型进行训练,得到目标损失信息,并基于所述目标损失信息对所述供应链风险预测模型的模型参数进行调整并进行迭代训练,模型训练分别采用以下算法:
基于所述训练样本数据集合,分别采用第一算法、第二算法和第三算法,执行以下操作:对供应链风险预测模型进行训练,得到目标损失信息,并基于所述目标损失信息对所述供应链风险预测模型的模型参数进行调整并进行迭代训练。
可选的,在满足预设的收敛条件时,输出训练后的目标供应链风险预测模型,包括:
在满足预设的收敛条件时,输出分别对应所述第一算法、所述第二算法和所述第三算法的三种候选供应链风险预测模型;
分别计算三种候选供应链风险预测模型的模型评估指标;
基于模型评估指标,选择一个候选供应链风险预测模型作为目标供应链风险预测模型。
可选的,选择一个候选供应链风险预测模型作为目标供应链风险预测模型之后,进一步包括:
获得供应链网络提供的待预测数据;
提取所述待预测数据的业务特征和拓扑网络特征,并输入所述目标供应链风险预测模型;
获得所述目标供应链风险预测模型输出的供应链风险预测结果。
第二方面,一种供应链风险预测模型的训练装置,包括:
获取单元,用于基于供应链网络提供的训练样本数据集合,获得各个训练样本数据的特征描述信息,其中,一个训练样本数据的特征描述信息包含至少两个目标对象的业务特征以及拓扑网络特征,一个目标对象的拓扑网络特征表征所述一个目标对象与拓扑网络中其他目标对象之间的连通方式和关联程度,其中,所述目标对象为企业,所述业务特征用于表征企业的运营状态;
训练单元,基于所述训练样本数据集合对供应链风险预测模型进行训练,得到目标损失信息,并基于所述目标损失信息对所述供应链风险预测模型的模型参数进行调整并进行迭代训练;
输出单元,在满足预设的收敛条件时,输出训练后的目标供应链风险预测模型。
可选的,基于供应链网络提供的训练样本数据集合,获得各个训练样本数据的特征描述信息,所述获取单元用于:
基于供应链网络提供的训练样本数据集合,获得各个目标对象的注册资本,规模信息、评级信息、资产负债率和流动资产负债率中的任意一种或任意组合,作为相应目标对象的业务特征。
可选的,基于供应链网络提供的训练样本数据集合,获得各个训练样本数据的特征描述信息,所述获取单元进一步用于:
基于供应链网络提供的训练样本数据集合,获得各个目标对象的供应链社区特征、强连通分支特征、超文本敏感标题搜索Hits特征和度中心性特征中的任意一种或组合,作为相应目标对象的拓扑网络特征;
其中,
所述供应链社区特征,表征目标对象所在的群组发生风险事件占整个拓扑网络中风险事件的比例;
所述强边通分支特征,表征目标对象在拓扑网络中是否位于环状结构内,以及若位于环状结构内,所述环状结构包含的目标对象数目;
所述超文本敏感标题搜索特征,包括目标对象的权威度和枢纽度,其中,所述权威度表征所述目标对象在拓扑网络中的重要程度,所述枢纽度表征拓扑网络中经过所述目标对象到达所述各个其他目标对象的可能性;
所述度中心特征,表征所述目标对象,在拓扑网络中作为任意两个其他目标对象之间最短路径包含的连接点的次数。
可选的,基于所述训练样本数据集合对供应链风险预测模型进行训练,得到目标损失信息,并基于所述目标损失信息对所述供应链风险预测模型的模型参数进行调整并进行迭代训练,所述训练单元用于:
基于所述训练样本数据集合,分别采用第一算法、第二算法和第三算法,分别执行以下操作:对供应链风险预测模型进行训练,得到目标损失信息,并基于所述目标损失信息对所述供应链风险预测模型的模型参数进行调整并进行迭代训练。
可选的,在满足预设的收敛条件时,输出训练后的目标供应链风险预测模型,所述输出单元用于:
在满足预设的收敛条件时,输出分别对应所述第一算法、所述第二算法和所述第三算法的三种候选供应链风险预测模型;
分别计算三种候选供应链风险预测模型的模型评估指标;
基于模型评估指标,选择一个候选供应链风险预测模型作为目标供应链风险预测模型。
可选的,进一步包括:
预测单元,用于在选择一个候选供应链风险预测模型作为目标供应链风险预测模型之后,执行以下操作:
获得供应链网络提供的待预测数据;
提取所述待预测数据的业务特征和拓扑网络特征,并输入所述目标供应链风险预测模型;
获得所述目标供应链风险预测模型输出的供应链风险预测结果。
第三方面,一种供应链风险预测模型的训练装置,包括:
存储器,用于存储可执行计算机程序;
处理器,用于读取并执行所述存储器中存储的可执行指令,以实现如第一方面中任一项所述的方法。
第四方面,一种计算机可读存储介质,当所述存储介质中的指令由处理器执行时,使得所述处理器能够执行如第一方面中任一项所述的方法。
本公开实施例中,服务器基于供应链网络提供的训练样本数据集合包含的各个特征描述信息,对供应链风险预测模型进行训练,输出相应的目标供应链风险预测模型,其中,一个训练样本数据的特征描述信息包含至少两个目标对象的业务特征以及拓扑网络特征,一个目标对象的拓扑网络特征表征所述一个目标对象与拓扑网络中其他目标对象之间的连通方式和关联程度;
这样,就可以在供应链网络中,当有一个目标对象发生风险事件后,可以采用上述目标供应链风险预测模型,及时高效地对供应链网络中其他目标对象也发生风险事件的概率进行预测,从而及时向其他目标对象提出预警,通知其他目标对象提前采取应对措施,以减少企业损失。
附图说明
图1为本公开实施例中供应链风险预测模型训练流程示意图;
图2为本公开实施例中供应链网络示意图;
图3为本公开实施例中供应链社区特征示意图;
图4A和4B为本公开实施例中强边通分支特征示意图;
图5为本公开实施例中超文本敏感标题搜索特征示意图;
图6为本公开实施例中度中心特征示意图;
图7为本公开实施例中供应链风险预测模型应用流程示意图;
图8为本公开实施例中服务器的逻辑架构示意图;
图9为本公开实施例中服务器的实体架构示意图。
具体实施方式
为了对及时有效的对供应链网络中的风险进行预测,减小企业损失。本公开实施例中,服务器基于供应链网络提供的训练样本数据集合,获得各个训练样本数据的业务特征和拓扑网络特征,一个目标对象的拓扑网络特征表征所述一个目标对象与拓扑网络中其他目标对象之间的连通方式和关联程度;以及服务器基于所述训练样本数据集合对供应链风险预测模型进行训练,得到目标损失信息,并基于所述目标损失信息对所述供应链风险预测模型的模型参数进行调整并进行迭代训练;在满足预设的收敛条件时,输出训练后的目标供应链风险预测模型。
实际应用中,供应链网络可以是任意的具有供应关系的实体构建成的网络,本公开实施例中企业之间的供应链网络为例。
下面结合附图对本发明优选的实施方式做出进一步详细说明。
参阅图1所示,本公开实施例中,服务器对供应链风险预测模型进行训练的详细流程如下:
步骤100:基于供应链网络提供的训练样本数据集合,获得各个训练样本数据的特征描述信息。
实际应用中,供应链网络通常包含了若干目标对象,每个目标对象可以表征一种客观实体(如,企业),参阅图2所示,基于供应链网络绘制的拓扑网络中,可以清楚地呈现各个目标对象之间的关联关系。
进一步的,在图2中,每一个黑点代表一个企业,图中箭头指向的企业代表上游企业,箭头指出的企业为下游企业。再进一步的,一个训练样本数据,包括箭头两端的两个企业,以及这两个企业之间的关系。
以图中的企业A,企业B和企业C为例。企业C指出箭头,指向企业B,此时企业C相对于企业B是下游企业,企业B相对于企业C是上游企业。但是,当企业B指出箭头,指向企业A,此时B就是相对于企业A的下游企业,企业A是相对于企业B的上游企业。
具体实施中,在步骤100中,一条训练样本数据的特征描述信息包含至少两个目标对象的业务特征以及拓扑网络特征,一个目标对象的拓扑网络特征表征所述一个目标对象与拓扑网络中其他目标对象之间的连通方式和关联程度。
实际应用中,服务器基于各个企业的供应链网络提供的训练样本数据集合,获得各个企业的注册资本,规模信息、评级信息、资产负债率和流动资产负债率中的任意一种或任意组合,作为相应目标对象的业务特征;以及,
服务器基于各个企业的供应链网络提供的训练样本数据集合,获得各个企业的供应链社区特征、强连通分支特征、超文本敏感标题搜索(Hits)特征和度中心性特征中的任意一种或组合,作为相应目标对象的拓扑网络特征。
其中,
所述供应链社区特征,表征目标对象所在的群组发生风险事件占整个拓扑网络中风险事件的比例。
例如,参阅图3所示,A、B、C分别为三个不同的社区,A、B、C中的黑色小点代表社区中的企业,假设社区A发生风险事件的占比为50%,假设社区B发生风险事件的占比为30%,假设社区C发生风险事件的占比为20%,则可以认为企业a受到风险影响概率高于企业b,企业b受到风险影响概率高于企业c。
所述强边通分支特征,表征目标对象在拓扑网络中是否位于环状结构内,以及若位于环状结构内,所述环状结构包含的目标对象数目。
例如,参阅图4A所示,假设存在一个环状拓扑网络X,由企业A、企业B、企业C构成,其中,企业A是企业B的供应商,企业B是企业C的供应商,企业C是企业A的供应商,企业D是独立于企业A、企业B、企业C构成的环状拓扑网络X之外的一家企业。则可以认为企业D在环状网络之外,此时,若企业A发生风险实现,企业A对企业B和企业C的影响远远大于对企业D的影响。
此外,参阅图4B所示,有另一个环状拓扑网络Y,由企业E、企业F、企业G、企业H构成,其中,企业E是企业F的供应商,企业F是企业G的供应商,企业G是企业H的供应商,企业H是企业E的供应商,则可以认为环状拓扑网络X的规模小于环状拓扑网络Y,若此时环状拓扑网络X、环状拓扑网络Y中均有一家企业发生风险事件,则环状拓扑网络X中其他未发生风险事件的企业受到风险影响概率高于Y中其他未发生风险事件的企业。
所述超文本敏感标题搜索特征,包括目标对象的权威度和枢纽度,其中,所述权威度表征所述目标对象在拓扑网络中的重要程度,所述枢纽度表征拓扑网络中经过所述目标对象到达所述各个其他目标对象的可能性。
具体的,超文本敏感标题搜索特征是通过超文本敏感标题搜索算法得到的,其中,算法基于以下两个假设:
1)拓扑网络中,一个高质量的权威节点会被很多高质量的枢纽节点所指向;
2)拓扑网络中,一个高质量的枢纽节点会指向很多高质量的权威节点。
本公开实施例中,采用h(p)表示节点p的枢纽度的值,a(p)表示节点p的权威度的值。首先令初始的枢纽度的值h(p)为1,初始的权威度的值a(p)也为1。然后就开始迭代计算的过程:
为了防止上述迭代公式无休止的计算下去,可以采取以下两种方式中任意一种加以控制:
1)设置一个迭代次数的上限,对迭代次数加以控制。
2)设置一个变化门限值,当迭代计算的数值变化小于预设门限值时,即可停止迭代计算。
例如,参阅图5所示,假设存在企业A、企业B、企业C,采用h(A)、h(B)、h(C)表示企业A、企业B、企业C的枢纽度的值,a(A)、a(B)、a(C)表示企业A、企业B、企业C的权威度的值。首先令初始的枢纽度的值h(A)、h(B)、h(C)为1,初始的权威度的值a(A)、a(B)、a(C)也为1,然后就开始迭代计算的过程。
假设迭代次数设定为2,则,根据公式可以计算出:
a(A)=0 (B)=0 a(C)=4;
h(A)=4 (C)=4 h(B)=0;
或者假设预设门限值为2,则,根据公式可以计算出:
a(A)=0 (B)=0 a(C)=4;
h(A)=4 (C)=4 h(B)=0;
所述度中心特征,表征所述目标对象,在拓扑网络中作为任意两个其他目标对象之间最短路径包含的连接点的次数。
本公开实施例中,参阅图6所示,存在企业A、企业B、企业C、企业D。
以企业B为例,企业B作为任意两个其他企业之间最短路径包含的连接点的次数为2。
步骤110:基于供应链网络提供的训练样本数据集合,对供应链网络提供的训练样本数据进行样本划分。
具体的,实际应用中,服务器在执行步骤110和步骤100时,并没有严格的先后顺序的区分。
进一步,假设存在企业A,和与A的有关联的企业B,所述有关联,指企业B为企业A的上游企业,或企业B为企业A的下游企业。当企业A在某时刻T发生风险事件后,在一定的时间区间M内(T时刻到T+M时刻区间内)发生了风险事件,则认定企业A与企业B以及他们之间的关系构成的样本数据为正样本;否则,认定为负样本。
步骤120:基于所述训练样本数据集合对供应链风险预测模型进行训练,得到目标损失信息,并基于所述目标损失信息对所述供应链风险预测模型的模型参数进行调整并进行迭代训练。
具体的,基于所述训练样本数据集合,可以采用以下三种算法分别对供应链风险预测模型进行训练:
(Xgboost)算法;
梯度下降树(Gradient Boosting Decision Tree,GBDT)算法;
逻辑回归(Logistic Regression,LR)算法。
实际应用中,对供应链风险预测模型训练的算法不仅限于采用上述三种算法,此处仅为举例,下文中不再赘述。
进一步的,分别得到采用不同算法训练的供应链风险预测模型的目标损失信息,并基于所述目标损失信息,对所述各个供应链风险预测模型的模型参数进行调整并进行迭代训练。
步骤130:在满足预设的收敛条件时,输出训练后的目标供应链风险预测模型。
具体的,待三个采用不同算法的供应链风险预测模型,满足预设的收敛条件时,分别计算三种候选供应链风险预测模型的模型评估指标;基于模型评估指标,选择一个候选供应链风险预测模型作为目标供应链风险预测模型。
进一步的,分别计算三种候选供应链风险预测模型的以下参量中的任意一种或任意组合,作为相应的模型评估指标:
1)候选供应链风险预测模型的接受者操作特征(receiver operatingcharacteristic curve,ROC)曲线下面积(Area Under Curve,AUC),所述AUC表示所述训练样本数据集合中,被正确预测的样本的占比。
具体的,AUC的取值在1~0之间,取值越大,代表被正确预测的样本占比越高。
例如,假设采用GBDT算法的供应链风险预测模型的AUC为0.91,采用LR算法的供应链风险预测模型的AUC为0.85,则可以说明GBDT算法预测的正确预测样本的能力强于LR算法。
2)候选供应链风险预测模型的召回率,所述召回率表示所述训练样本数据集合包含的各个正样本中,被正确预测的正样本的占比。
具体的,假设采用LR算法训练供应链风险预测模型,预测的结果中,存在有正确的将正样本预测为正样本的结果,也存在错误的将正样本预测为负样本的结果,召回率是计算所有本身为正样本的数据中,被模型正确预测的占比。具体可以参照以下公式:
3)候选供应链风险预测模型的正样本准确率,所述正样本准确率表示所有被预测为正样本的训练样本数据中,实际包含正样本的训练样本数据的占比。
具体的,假设采用LR算法训练供应链风险预测模型,预测的结果中,存在有正确的将正样本预测为正样本的结果,也存在错误的将负样本预测为正样本的结果,正样本准确率是计算所有预测结果为正样本的数据中,真正为正样本的占比。具体可以参照以下公式:
4)候选供应链风险预测模型的全部样本准确率,所述全部样本准确率表示所述训练样本数据集合中,被正确预测的样本的占比。
具体的,假设采用LR算法训练供应链风险预测模型,预测的结果中,存在有正确的预测结果,也存在错误的预测结果,全部样本准确率是所有预测结果中,正确的预测结果的占比。具体可以参照以下公式:
5)候选供应链风险预测模型的F1值,所述F1值基于准确率和召回率计算的折中取值;
具体的,假设采用LR算法训练供应链风险预测模型,在计算出召回率和正样本准确率之后,F1值的计算具体可以参照以下公式:
6)候选供应链风险预测模型的柯尔莫哥洛夫-斯米尔诺夫检验(Колмогоров-Смирнов,ks)值,所述ks值表示候选供应链风险预测模型的正样本和负样本的区分程度;
7)候选供应链风险预测模型的基尼(Gini coefficient,gini)系数,所述gini系数表示候选供应链风险预测模型的正样本和负样本区分的程度;
8)候选供应链风险预测模型的稳定度指标(population stability index,PSI),所述PSI表示预测结果的样本分布与期望的样本分布的差异性。
具体的,假设采用LR算法训练供应链风险预测模型,在得到所述供应链风险预测模型全部样本准确率,PSI的计算具体可以参照以下公式:
其中,所述期望准确率表示,预先设定的希望供应链风险预测模型的全部样本准确率最少应达到的值。
在得到目标供应链风险预测模型后,参阅图7所示,本公开实施例中,对供应链风险预测模型进行应用的详细流程如下:
步骤700:基于供应链网络提供的待预测数据,获得待预测数据的特征描述信息。
具体的,待预测数据的构成元素与步骤100中训练样本数据的构成元素相同。
具体实施中,在步骤700中,一条待预测数据的特征描述信息包含至少两个目标对象的业务特征以及拓扑网络特征,一个目标对象的拓扑网络特征表征所述一个目标对象与拓扑网络中其他目标对象之间的连通方式和关联程度。
实际应用中,服务器基于企业的供应链网络提供的待预测数据,获得企业的注册资本,规模信息、评级信息、资产负债率和流动资产负债率中的任意一种或任意组合,作为相应目标对象的业务特征;以及,
服务器基于企业的供应链网络提供的待预测数据,获得企业的供应链社区特征、强连通分支特征、超文本敏感标题搜索(Hits)特征和度中心性特征中的任意一种或组合,作为相应目标对象的拓扑网络特征。
进一步,假设存在两组待预测数据,待预测数据甲包括:企业A,企业B,其中企业A是企业B的上游企业。待预测数据乙包括:企业C,企业D,其中企业C是企业D的上游企业。服务器基于两组所述待预测数据,分别得到:
企业A:注册资本100 000 000元,企业A处在一个包含有企业B且由100个企业的构成的环状拓扑网络中。
企业B:注册资本200 000 000元,企业B处在一个包含有企业A且由100个企业的构成的环状拓扑网络中。
企业C:注册资本100 000元,企业C处在一个包含有企业D且由3个企业的构成的环状拓扑网络中。
企业D:注册资本200 000元,企业D处在一个包含有企业C且由3个企业的构成的环状拓扑网络中。
步骤710:将所述待预测数据输入到目标供应链风险预测模型中进行预测,输出预测结果。
具体的,假设将上述两组待预测数据输入到目标供应链风险预测模型中进行预测,则输出结果中,待预测数据甲中企业A的发生风险事件后,企业B发生风险事件的概率要小于待预测数据乙中企业C的发生风险事件后,企业D发生风险事件的概率。例如,若目标供应链风险预测模型预测待预测数据甲中企业A的发生风险事件后,企业B发生风险事件的概率为5%,则目标供应链风险预测模型预测待预测数据乙中企业C的发生风险事件后,企业D发生风险事件的概率为15%。
基于同一发明构思,参阅图8所示,本公开实施例提供一种供应链风险预测模型的训练装置(如,一种服务器),包括:
获取单元801,用于基于供应链网络提供的训练样本数据集合,获得各个训练样本数据的特征描述信息,其中,一个训练样本数据的特征描述信息包含至少两个目标对象的业务特征以及拓扑网络特征,一个目标对象的拓扑网络特征表征所述一个目标对象与拓扑网络中其他目标对象之间的连通方式和关联程度,其中,所述目标对象为企业,所述业务特征用于表征企业的运营状态;
训练单元802,基于所述训练样本数据集合对供应链风险预测模型进行训练,得到目标损失信息,并基于所述目标损失信息对所述供应链风险预测模型的模型参数进行调整并进行迭代训练;
输出单元803,在满足预设的收敛条件时,输出训练后的目标供应链风险预测模型。
可选的,基于供应链网络提供的训练样本数据集合,获得各个训练样本数据的特征描述信息,所述获取单元801用于:
基于供应链网络提供的训练样本数据集合,获得各个目标对象的注册资本,规模信息、评级信息、资产负债率和流动资产负债率中的任意一种或任意组合,作为相应目标对象的业务特征。
可选的,基于供应链网络提供的训练样本数据集合,获得各个训练样本数据的特征描述信息,所述获取单元801进一步用于:
基于供应链网络提供的训练样本数据集合,获得各个目标对象的供应链社区特征、强连通分支特征、超文本敏感标题搜索Hits特征和度中心性特征中的任意一种或组合,作为相应目标对象的拓扑网络特征;
其中,
所述供应链社区特征,表征目标对象所在的群组发生风险事件占整个拓扑网络中风险事件的比例;
所述强边通分支特征,表征目标对象在拓扑网络中是否位于环状结构内,以及若位于环状结构内,所述环状结构包含的目标对象数目;
所述超文本敏感标题搜索特征,包括目标对象的权威度和枢纽度,其中,所述权威度表征所述目标对象在拓扑网络中的重要程度,所述枢纽度表征拓扑网络中经过所述目标对象到达所述各个其他目标对象的可能性;
所述度中心特征,表征所述目标对象,在拓扑网络中作为任意两个其他目标对象之间最短路径包含的连接点的次数。
可选的,基于所述训练样本数据集合对供应链风险预测模型进行训练,得到目标损失信息,并基于所述目标损失信息对所述供应链风险预测模型的模型参数进行调整并进行迭代训练,所述训练单元802用于:
基于所述训练样本数据集合,分别采用第一算法、第二算法和第三算法,分别执行以下操作:对供应链风险预测模型进行训练,得到目标损失信息,并基于所述目标损失信息对所述供应链风险预测模型的模型参数进行调整并进行迭代训练。
可选的,在满足预设的收敛条件时,输出训练后的目标供应链风险预测模型,所述输出单元803用于:
在满足预设的收敛条件时,输出分别对应所述第一算法、所述第二算法和所述第三算法的三种候选供应链风险预测模型;
分别计算三种候选供应链风险预测模型的模型评估指标;
基于模型评估指标,选择一个候选供应链风险预测模型作为目标供应链风险预测模型。
可选的,进一步包括:
预测单元804,用于在选择一个候选供应链风险预测模型作为目标供应链风险预测模型之后,执行以下操作:
获得供应链网络提供的待预测数据;
提取所述待预测数据的业务特征和拓扑网络特征,并输入所述目标供应链风险预测模型;
获得所述目标供应链风险预测模型输出的供应链风险预测结果。
基于同一发明构思,参阅图9所示,本公开实施例提供一种服务器,包括:
存储器901,用于存储可执行计算机程序;
处理器902,用于读取并执行所述存储器中存储的可执行指令,以实现上述各个实施例中服务器执行的任意一种方法。
基于同一发明构思,本公开实施例提供一种计算机可读存储介质,当所述存储介质中的指令由处理器执行时,使得所述处理器能够执行上述各个实施例中服务器执行的任意一种方法。
综上所述,本公开实施例中,服务器基于供应链网络提供的训练样本数据集合包含的各个特征描述信息,对供应链风险预测模型进行训练,输出相应的目标供应链风险预测模型,其中,一个训练样本数据的特征描述信息包含至少两个目标对象的业务特征以及拓扑网络特征,一个目标对象的拓扑网络特征表征所述一个目标对象与拓扑网络中其他目标对象之间的连通方式和关联程度;
这样,就可以在供应链网络中,当有一个目标对象发生风险事件后,可以采用上述目标供应链风险预测模型,及时高效地对供应链网络中其他目标对象也发生风险事件的概率进行预测,从而及时向其他目标对象提出预警,通知其他目标对象提前采取应对措施,以减少企业损失。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明实施例进行各种改动和变型而不脱离本发明实施例的精神和范围。这样,倘若本发明实施例的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (12)
1.一种供应链风险预测模型的训练方法,其特征在于,包括:
基于供应链网络提供的训练样本数据集合,获得各个训练样本数据的特征描述信息,其中,一个训练样本数据的特征描述信息包含至少两个目标对象的业务特征以及拓扑网络特征,一个目标对象的拓扑网络特征表征所述一个目标对象与拓扑网络中其他目标对象之间的连通方式和关联程度,其中,所述目标对象为企业,所述业务特征用于表征企业的运营状态;
基于所述训练样本数据集合对供应链风险预测模型进行训练,得到目标损失信息,并基于所述目标损失信息对所述供应链风险预测模型的模型参数进行调整并进行迭代训练;
在满足预设的收敛条件时,输出训练后的目标供应链风险预测模型;
其中,所述基于供应链网络提供的训练样本数据集合,获得各个训练样本数据的特征描述信息,包括:
基于供应链网络提供的训练样本数据集合,获得各个目标对象的供应链社区特征、强连通分支特征、超文本敏感标题搜索Hits特征和度中心性特征中的任意一种或组合,作为相应目标对象的拓扑网络特征;
其中,所述供应链社区特征,表征目标对象所在的群组发生风险事件占整个拓扑网络中风险事件的比例;所述强连通分支特征,表征目标对象在拓扑网络中是否位于环状结构内,以及若位于环状结构内,所述环状结构包含的目标对象数目;所述超文本敏感标题搜索Hits特征,包括目标对象的权威度和枢纽度,其中,所述权威度表征所述目标对象在拓扑网络中的重要程度,所述枢纽度表征拓扑网络中经过所述目标对象到达各个其他目标对象的可能性;所述度中心性特征,表征所述目标对象,在拓扑网络中作为任意两个其他目标对象之间最短路径包含的连接点的次数。
2.如权利要求1所述的方法,其特征在于,基于供应链网络提供的训练样本数据集合,获得各个训练样本数据的特征描述信息,还包括:
基于供应链网络提供的训练样本数据集合,获得各个目标对象的注册资本,规模信息、评级信息、资产负债率和流动资产负债率中的任意一种或任意组合,作为相应目标对象的业务特征。
3.如权利要求1或2所述的方法,其特征在于,基于所述训练样本数据集合对供应链风险预测模型进行训练,得到目标损失信息,并基于所述目标损失信息对所述供应链风险预测模型的模型参数进行调整并进行迭代训练,模型训练分别采用以下算法:
基于所述训练样本数据集合,分别采用第一算法、第二算法和第三算法,执行以下操作:对供应链风险预测模型进行训练,得到目标损失信息,并基于所述目标损失信息对所述供应链风险预测模型的模型参数进行调整并进行迭代训练。
4.如权利要求3所述的方法,其特征在于,在满足预设的收敛条件时,输出训练后的目标供应链风险预测模型,包括:
在满足预设的收敛条件时,输出分别对应所述第一算法、所述第二算法和所述第三算法的三种候选供应链风险预测模型;
分别计算三种候选供应链风险预测模型的模型评估指标;
基于模型评估指标,选择一个候选供应链风险预测模型作为目标供应链风险预测模型。
5.如权利要求4所述的方法,其特征在于,选择一个候选供应链风险预测模型作为目标供应链风险预测模型之后,进一步包括:
获得供应链网络提供的待预测数据;
提取所述待预测数据的业务特征和拓扑网络特征,并输入所述目标供应链风险预测模型;
获得所述目标供应链风险预测模型输出的供应链风险预测结果。
6.一种供应链风险预测模型的训练装置,其特征在于,包括:
获取单元,用于基于供应链网络提供的训练样本数据集合,获得各个训练样本数据的特征描述信息,其中,一个训练样本数据的特征描述信息包含至少两个目标对象的业务特征以及拓扑网络特征,一个目标对象的拓扑网络特征表征所述一个目标对象与拓扑网络中其他目标对象之间的连通方式和关联程度,其中,所述目标对象为企业,所述业务特征用于表征企业的运营状态;
训练单元,基于所述训练样本数据集合对供应链风险预测模型进行训练,得到目标损失信息,并基于所述目标损失信息对所述供应链风险预测模型的模型参数进行调整并进行迭代训练;
输出单元,在满足预设的收敛条件时,输出训练后的目标供应链风险预测模型;
所述获取单元具体用于:
基于供应链网络提供的训练样本数据集合,获得各个目标对象的供应链社区特征、强连通分支特征、超文本敏感标题搜索Hits特征和度中心性特征中的任意一种或组合,作为相应目标对象的拓扑网络特征;
其中,
所述供应链社区特征,表征目标对象所在的群组发生风险事件占整个拓扑网络中风险事件的比例;
所述强连通分支特征,表征目标对象在拓扑网络中是否位于环状结构内,以及若位于环状结构内,所述环状结构包含的目标对象数目;
所述超文本敏感标题搜索Hits特征,包括目标对象的权威度和枢纽度,其中,所述权威度表征所述目标对象在拓扑网络中的重要程度,所述枢纽度表征拓扑网络中经过所述目标对象到达各个其他目标对象的可能性;
所述度中心性特征,表征所述目标对象,在拓扑网络中作为任意两个其他目标对象之间最短路径包含的连接点的次数。
7.如权利要求6所述的装置,其特征在于,基于供应链网络提供的训练样本数据集合,获得各个训练样本数据的特征描述信息,所述获取单元还用于:
基于供应链网络提供的训练样本数据集合,获得各个目标对象的注册资本,规模信息、评级信息、资产负债率和流动资产负债率中的任意一种或任意组合,作为相应目标对象的业务特征。
8.如权利要求6或7所述的装置,其特征在于,基于所述训练样本数据集合对供应链风险预测模型进行训练,得到目标损失信息,并基于所述目标损失信息对所述供应链风险预测模型的模型参数进行调整并进行迭代训练,所述训练单元用于:
基于所述训练样本数据集合,分别采用第一算法、第二算法和第三算法,执行以下操作:对供应链风险预测模型进行训练,得到目标损失信息,并基于所述目标损失信息对所述供应链风险预测模型的模型参数进行调整并进行迭代训练。
9.如权利要求8所述的装置,其特征在于,在满足预设的收敛条件时,输出训练后的目标供应链风险预测模型,所述输出单元用于:
在满足预设的收敛条件时,输出分别对应所述第一算法、所述第二算法和所述第三算法的三种候选供应链风险预测模型;
分别计算三种候选供应链风险预测模型的模型评估指标;
基于模型评估指标,选择一个候选供应链风险预测模型作为目标供应链风险预测模型。
10.如权利要求9所述的装置,其特征在于,进一步包括:
预测单元,用于在选择一个候选供应链风险预测模型作为目标供应链风险预测模型之后,执行以下操作:
获得供应链网络提供的待预测数据;
提取所述待预测数据的业务特征和拓扑网络特征,并输入所述目标供应链风险预测模型;
获得所述目标供应链风险预测模型输出的供应链风险预测结果。
11.一种供应链风险预测模型的训练装置,其特征在于,包括:
存储器,用于存储可执行计算机程序;
处理器,用于读取并执行所述存储器中存储的可执行指令,以实现如权利要求1-5任一项所述供应链风险预测模型的训练方法。
12.一种计算机可读存储介质,其特征在于,当所述存储介质中的指令由处理器执行时,使得所述处理器能够执行如权利要求1-5任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011119200.0A CN112348318B (zh) | 2020-10-19 | 2020-10-19 | 一种供应链风险预测模型的训练和应用方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011119200.0A CN112348318B (zh) | 2020-10-19 | 2020-10-19 | 一种供应链风险预测模型的训练和应用方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112348318A CN112348318A (zh) | 2021-02-09 |
CN112348318B true CN112348318B (zh) | 2024-04-23 |
Family
ID=74362202
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011119200.0A Active CN112348318B (zh) | 2020-10-19 | 2020-10-19 | 一种供应链风险预测模型的训练和应用方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112348318B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114357308B (zh) * | 2021-09-17 | 2022-09-02 | 北京能科瑞元数字技术有限公司 | 一种基于推荐的制造企业供需对接方法及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019223139A1 (zh) * | 2018-05-22 | 2019-11-28 | 深圳壹账通智能科技有限公司 | 一种风险预测方法、装置、存储介质和服务器 |
CN110570111A (zh) * | 2019-08-30 | 2019-12-13 | 阿里巴巴集团控股有限公司 | 企业风险预测方法、模型训练方法、装置及设备 |
CN111489065A (zh) * | 2020-03-27 | 2020-08-04 | 北京理工大学 | 融合ict供应链网络拓扑和产品商业信息的节点风险评估 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10515315B2 (en) * | 2016-03-11 | 2019-12-24 | Wipro Limited | System and method for predicting and managing the risks in a supply chain network |
-
2020
- 2020-10-19 CN CN202011119200.0A patent/CN112348318B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019223139A1 (zh) * | 2018-05-22 | 2019-11-28 | 深圳壹账通智能科技有限公司 | 一种风险预测方法、装置、存储介质和服务器 |
CN110570111A (zh) * | 2019-08-30 | 2019-12-13 | 阿里巴巴集团控股有限公司 | 企业风险预测方法、模型训练方法、装置及设备 |
CN111489065A (zh) * | 2020-03-27 | 2020-08-04 | 北京理工大学 | 融合ict供应链网络拓扑和产品商业信息的节点风险评估 |
Also Published As
Publication number | Publication date |
---|---|
CN112348318A (zh) | 2021-02-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109753591B (zh) | 业务流程预测性监控方法 | |
CN107169768B (zh) | 异常交易数据的获取方法和装置 | |
CN109871954B (zh) | 训练样本生成方法、异常检测方法及装置 | |
US20070260563A1 (en) | Method to continuously diagnose and model changes of real-valued streaming variables | |
CN109327480B (zh) | 一种多步攻击场景挖掘方法 | |
Kadwe et al. | A review on concept drift | |
CN110874744B (zh) | 一种数据异常检测方法及装置 | |
CN110247910A (zh) | 一种异常流量的检测方法、系统及相关组件 | |
WO2022116862A1 (zh) | 信息推送方法和系统、模型训练方法及相关设备 | |
CN114757432A (zh) | 基于流程日志和多任务学习的未来执行活动及时间预测方法及系统 | |
CN117041017B (zh) | 数据中心的智能运维管理方法及系统 | |
CN111160959A (zh) | 一种用户点击转化预估方法及装置 | |
CN112348318B (zh) | 一种供应链风险预测模型的训练和应用方法及装置 | |
CN114091360B (zh) | 一种多模型融合的电压互感器误差状态评估方法 | |
CN113642727B (zh) | 神经网络模型的训练方法和多媒体信息的处理方法、装置 | |
CN112115996B (zh) | 图像数据的处理方法、装置、设备及存储介质 | |
CN113344091A (zh) | 基于标签相关性的多标签流特征确定最优特征子集的方法 | |
CN110880117A (zh) | 虚假业务识别方法、装置、设备和存储介质 | |
US20230401591A1 (en) | Anomaly detection systems and methods | |
CN113259158B (zh) | 网络流量预测方法和设备、模型构建及训练方法和装置 | |
CN115659232A (zh) | 一种挖掘异常规则的方法及装置 | |
CN111967671B (zh) | 基于支持向量数据域描述的跨境活跃用户识别方法及装置 | |
CN114662116A (zh) | 基于大数据的业务运行漏洞查找方法及云端深度学习系统 | |
CN114330090A (zh) | 一种缺陷检测方法、装置、计算机设备和存储介质 | |
Gaykar et al. | A Hybrid Supervised Learning Approach for Detection and Mitigation of Job Failure with Virtual Machines in Distributed Environments. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |