CN113283582A - 纺织行业金融损失预测方法、装置、存储介质及处理器 - Google Patents
纺织行业金融损失预测方法、装置、存储介质及处理器 Download PDFInfo
- Publication number
- CN113283582A CN113283582A CN202110538369.8A CN202110538369A CN113283582A CN 113283582 A CN113283582 A CN 113283582A CN 202110538369 A CN202110538369 A CN 202110538369A CN 113283582 A CN113283582 A CN 113283582A
- Authority
- CN
- China
- Prior art keywords
- data
- layer
- structured data
- information
- textile industry
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000004753 textile Substances 0.000 title claims abstract description 50
- 238000000034 method Methods 0.000 title claims abstract description 49
- 238000003860 storage Methods 0.000 title claims abstract description 19
- 239000004744 fabric Substances 0.000 claims description 55
- 238000012549 training Methods 0.000 claims description 31
- 230000004913 activation Effects 0.000 claims description 21
- 238000012360 testing method Methods 0.000 claims description 20
- 238000012545 processing Methods 0.000 claims description 14
- 238000010606 normalization Methods 0.000 claims description 9
- 238000004140 cleaning Methods 0.000 claims description 5
- 230000008676 import Effects 0.000 claims description 5
- 230000008569 process Effects 0.000 abstract description 6
- 238000007405 data analysis Methods 0.000 abstract description 2
- 230000006870 function Effects 0.000 description 32
- 238000010586 diagram Methods 0.000 description 19
- 238000004422 calculation algorithm Methods 0.000 description 18
- 238000004590 computer program Methods 0.000 description 11
- 238000004364 calculation method Methods 0.000 description 7
- 239000011159 matrix material Substances 0.000 description 5
- 235000004257 Cordia myxa Nutrition 0.000 description 4
- 244000157795 Cordia myxa Species 0.000 description 4
- 238000013135 deep learning Methods 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000013136 deep learning model Methods 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 230000003321 amplification Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000012886 linear function Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000012502 risk assessment Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 238000009941 weaving Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/08—Insurance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/04—Manufacturing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Finance (AREA)
- Marketing (AREA)
- Accounting & Taxation (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Probability & Statistics with Applications (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Tourism & Hospitality (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Manufacturing & Machinery (AREA)
- Fuzzy Systems (AREA)
- Quality & Reliability (AREA)
- Primary Health Care (AREA)
- Human Resources & Organizations (AREA)
- Development Economics (AREA)
- Technology Law (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明实施例提供一种纺织行业金融损失预测方法、装置、处理器及存储介质。方法包括:获取所述纺织行业待预测订单的结构化数据;将所述结构化数据输入至损失预测模型中;通过所述损失预测模型确定所述待预测订单的经济损失值。这一预测方法有效地利用了纺织行业的结构化数据,也有效地使用了传统数据分析过程中容易被特征工程筛选过滤掉的稀疏特征数据,提高了模型预测的评分,降低了均方误差,能够有效直接地对订单的经济损失值进行预测。
Description
技术领域
本发明涉及计算机技术领域,具体地涉及一种纺织行业金融损失预测方法、装置、存储介质及处理器。
背景技术
纺织行业由于业务性质的因素,偶尔会面临:布料采购商没有充足资金可以购买布料,而布料供应商又不愿意承担风险预先提供布料给布料采购商,待布料采购商销售之后再付款给布料供应商。因此产生了一个整合商债权人进行风险承担,上游承接布料供应商,先付款购买布料;下游承接布料采购商,先提供布料后间隔一定时日才收款。然而此种金融贷款商品的方式,却面临了布料采购商家可能无法按时支付还款或欠款的问题。
现有纺织行业放贷风险的评估方法,通常会寻求银行的协助进行风险评估,然而由于银行缺乏纺织行业放贷使布料采购商能够买布料的业务,或缺乏相关业务数据,会导致对于风险的评估并不准确。
发明内容
本发明实施例的目的是提供一种纺织行业金融损失预测方法、装置、存储介质及处理器。
为了实现上述目的,本发明第一方面提供一种纺织行业金融损失预测方法,包括:
获取所述纺织行业待预测订单的结构化数据;
将所述结构化数据输入至损失预测模型中;
通过所述损失预测模型确定所述待预测订单的经济损失值。
可选地,损失预测模型包括:输入层、标准化层、多个全连接层和输出层。
可选地,全连接层至少包括5个,所述通过所述损失预测模型确定所述待预测订单的经济损失值包括:在所述输入层获取到所述结构化数据后,所述输入层将所述结构化数据导入至所述标准化层;通过所述标准化层对所述结构化数据进行标准化,再将标准化后的结构化数据输出至第一全连接层;通过所述第一全连接层对所述标准化后的结构化数据进行放大;通过第二全连接层对放大后的结构化数据进行延伸;通过第三全连接层对延伸后的结构化数据进行浓缩;通过第四连接层对浓缩后的结构化数据进行再次放大;通过第五连接层对再次放大后的结构化数据进行再次浓缩;将再次浓缩后的结构化数据传输至所述输出层;通过所述输出层输入对结构化数据进行经济损失预测所得到的经济损失值。
可选地,输出层包括的激活函数如以下公式(1):
其中,x为所述激活函数的输入值,α的值为1.67326324,c的值为1.05070098。
可选地,方法还包括:获取所述纺织行业的历史结构化数据;对所述历史结构化数据进行清洗,将不符合预设条件的数据进行剔除;对剔除后的历史结构化数据进行标准化处理;对标准化处理后的历史结构化数据进行串接合并;对串接合并后的历史结构化数据进行统计汇整,并将所述分成训练数据集和测试数据集。
可选地,方法还包括:利用所述训练数据集对损失预测模型进行训练;利用所述测试数据集对训练的损失预测模型进行测试;在测试通过后,确定损失预测模型训练完毕。
本发明第二方面提供一种纺织行业金融损失预测装置,包括:
数据获取模块,用于获取所述纺织行业待预测订单的结构化数据;
预测模块,用于将所述结构化数据输入至损失预测模型中;通过所述损失预测模型确定所述待预测订单的经济损失值。
本发明第三方面提供一种机器可读存储介质,该机器可读存储介质上存储有指令,该指令在被处理器执行时使得所述处理器被配置成执行上述的纺织行业金融损失预测方法。
本发明第四方面提供一种处理器,被配置成执行上述的纺织行业金融损失预测方法。
上述纺织行业金融损失预测方法,通过获取纺织行业待预测订单的结构化数据,将结构化数据输入至损失预测模型中,通过损失预测模型确定待预测订单的经济损失值,这一预测方法有效地利用了纺织行业的结构化数据,也有效地使用了传统数据分析过程中容易被特征工程筛选过滤掉的稀疏特征数据,提高了模型预测的评分,降低了均方误差,能够有效直接地对订单的经济损失值进行预测。
本发明实施例的其它特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
附图是用来提供对本发明实施例的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本发明实施例,但并不构成对本发明实施例的限制。在附图中:
图1示意性示出了根据本发明实施例的纺织行业金融损失预测方法的流程示意图;
图2示意性示出了根据本发明实施例的损失预测模型的结构示意图;
图3示意性示出了根据本发明实施例的激活函数的输出的示意图;
图4示意性示出了根据本发明实施例的损失预测模型的训练示意图;
图5示意性示出了根据本发明实施例的纺织行业金融损失预测装置的结构框图;
图6示意性示出了根据本发明实施例的计算机设备的内部结构图。
具体实施方式
以下结合附图对本发明实施例的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明实施例,并不用于限制本发明实施例。
图1示意性示出了根据本发明实施例的纺织行业金融损失预测方法的流程示意图。如图1所示,在本发明一实施例中,提供了一种纺织行业金融损失预测方法,包括以下步骤:
步骤101,获取纺织行业待预测订单的结构化数据。
步骤102,将结构化数据输入至损失预测模型中。
步骤103,通过损失预测模型确定待预测订单的经济损失值。
纺织行业的数据较为特殊,通常为结构化数据。针对待预测的订单,可以获取到该订单的结构化数据,并将该结构化数据输入至损失预测模型中。
在一个实施例中,结构化数据包括布料采购商基本信息、布料采购商信用信息、布料采购商历史订单信息及市场金融信息中的至少一者;布料采购商基本信息包括布料采购商的注册资本、成立日期及员工人数中的至少一者;布料采购商信用信息包括法律信息、企业信用信息及经营信息中的至少一者;布料采购商历史订单信息包括订单金额、订单品类、面料数据及还款信息中的至少一者;市场金融信息包括布料市场信息、金融市场信息及竞品信息中的至少一者。
通过损失预测模型可以确定待预测订单的经济损失值。其中,经济损失值指的是采购商所借款的金额,在拖欠还款期间所产生的利息,可以采用银行利率换算为日利率。
在一个实施例中,损失预测模型包括:输入层、标准化层、多个全连接层和输出层。
其中,损失预测模型使用结构化宽表数据进行输入,根据不同的预测目标输出为一个维度的数据。如图2所示,提供了一种损失预测模型的结构示意图。根据图2可以看出,损失预测模型中包含的连接层(全连接层)有多个。
在一个实施例中,全连接层至少包括5个,通过损失预测模型确定待预测订单的经济损失值包括:在输入层获取到结构化数据后,输入层将结构化数据导入至标准化层;通过标准化层对结构化数据进行标准化,再将标准化后的结构化数据输出至第一全连接层;通过第一全连接层对标准化后的结构化数据进行放大;通过第二全连接层对放大后的结构化数据进行延伸;通过第三全连接层对延伸后的结构化数据进行浓缩;通过第四连接层对浓缩后的结构化数据进行再次放大;通过第五连接层对再次放大后的结构化数据进行再次浓缩;将再次浓缩后的结构化数据传输至输出层;通过输出层输入对结构化数据进行经济损失预测所得到的经济损失值。
在本实施例中,损失预测模型中包含的全连接层至少有5层。具体地,第一层为输入层:将结构化数据导入损失预测模型,以结构化输入数据120个字段的宽表为例,此处的数据维度是(120,)。第二层为标准化层:将输入数据进行标准化,更适合模型的训练和实际预测,输入的数据将会转化为平均为零、标准差近似1的数据。以结构化输入数据120个字段的宽表为例,此处的数据维度是(120,)。第三层为全连接层:连接上一层与下一层数据节点,将信息计算并进行传递。以结构化输入数据120个字段的宽表为例,此处的数据维度约为输入数据的两倍(256,),第三层的目的是放大数据的组合。具体可以使用Linear算法作为激活函数。第四层为全连接层:连接上一层与下一层数据节点,将信息计算并进行传递。以结构化输入数据120个字段的宽表为例,此处的数据维度约为上一层数据的一半(128,),第四层的目的是延伸数据的组合。具体可以使用Relu算法作为激活函数。第五层为全连接层:连接上一层与下一层数据节点,将信息计算并进行传递。以结构化输入数据120个字段的宽表为例,此处的数据维度约等于上一层(32,),第五层的目的是浓缩数据的组合。具体可以使用Relu算法作为激活函数。第六层为全连接层:连接上一层与下一层数据节点,将信息计算并进行传递。以结构化输入数据120个字段的宽表为例,此处的数据维度约为上一层的两倍(64,),第六层的目的是进行第二阶段的组合放大。具体使用Sigmoid算法作为激活函数。第七层为全连接层:连接上一层与下一层数据节点,将信息计算并进行传递。以结构化输入数据120个字段的宽表为例,此处的数据维度约为上一层的一半(32,),第七层的目的是进行第二阶段的数据组合浓缩。具体使用Softplus算法作为激活函数。第八层为输出层:将模型计算结果输出。以结构化数据输出预测采购商还款所造成金融损失为例,此处的数据维度为(1,),具体可以使用Selu算法作为激活函数。
在一个实施例中,在将损失预测模型投入至实际使用之前,还需要先对该模型进行训练。训练步骤包括:获取纺织行业的历史结构化数据;对历史结构化数据进行清洗,将不符合预设条件的数据进行剔除;对剔除后的历史结构化数据进行标准化处理;对标准化处理后的历史结构化数据进行串接合并;对串接合并后的历史结构化数据进行统计汇整,并将分成训练数据集和测试数据集;利用训练数据集对损失预测模型进行训练;利用测试数据集对训练的损失预测模型进行测试;在测试通过后,确定损失预测模型训练完毕。
在一个实施例中,针对损失预测模型的训练步骤具体如下:
1、数据获取:包含自动获取数据库数据、网络数据等。
其中,数据种类主要分为布料采购商基本信息、布料采购商信用信息、布料采购商历史订单信息、市场金融信息、及多种指标等。布料采购商基本信息包含:注册资本、成立日期、员工人数等;布料采购商信用信息包含:法律信息、企业信用信息、经营信息等;布料采购商历史订单信息包含:订单金额、订单品类及面料相关数据、还款信息等;市场金融信息包含:布料市场信息、金融市场信息、竞品信息等;其他指标包含汇率、物价指数等。数据来源包括但不限于:网络公开信息数据、向第三方购买信息数据、整合商债权人自有历史信息数据等。在将数据输入至模型中时,可以采用整合后的宽表形式作为数据输入。在获取到数据后,还可以对数据进行清洗及预处理操作。
2、数据清洗与预处理:将获取到的信息进行整理与清洗,处理数据编码、处理缺失值、处理字串及时间等数据类型。
具体地,可以去除无法定义是否逾期的订单数据,去除无法确认经济损失的订单数据,去除缺失订单时间及采购商编号的数据。还可以对数据进行标准化处理,可以针对不同数据类型进行对应的数据标准化处理操作。时间类型数据可以采用时间相减的方式转换为数值型数据;类别型数据可以采用多维度的独热转换方法,将其转换为稀疏数值矩阵,与现有风控数据分析不同的是,由于使用深度学习算法,采用较丰富的数据进行建模,而不作过度的特征筛选过滤,目的是保留容易被检定过滤掉的细微风险特征,因此将保留稀疏矩阵中去重比例未超过原有数据量的一成或未超过100种种类的类别型数据。
3、数据汇整:进行必要的数据串接、数据维度转换、及计算衍生字段,将原始数据转化为算法模型适合的输入数据。
数据串接合并,所有不同表格的数据,将透过主要的串表键值串接至订单信息表,成为一个初始的宽表,保留订单时间及采购商代号作为后续数据统计的主要维度。数据统计汇整,类别型维度的转化数据,包含布料类型、织造类型、弹力类型、布料品质。例如是否为净色布、是否为花型布、是否为无纺、是否为梭织、是否为针织,共计约40项以上字段,总计约120项以上字段内容作为数据输入。
4、特征处理:依照建模时所筛选的特征进行过滤,并计算衍生字段。
5、模型预测输出:调用已经训练好的算法模型,输入符合模型的输入数据,模型将会输出预测结果。
可以将数据切分为训练集与测试集。主要有两种切分方式。其一:可以以时间为切分主体,整体数据以去重的时间维度作为切分数据的依据,例如以80比20的比例区分为训练集数据及测试集数据;其二可以以客户为切分主体,整体数据以去重的客户维度作为切分数据的依据,例如以80比20的比例区分为训练集数据及测试集数据。
具体地,损失预测模型包含:标准化层、全连接层、输入层、输出层等,激活函数具体包含:Sigmoid函数、Relu函数、Selu函数、Softplus函数、Linear函数。激活函数输出的对应图形如图3所示。根据不同的预测目标适合使用不同的深度学习模型结构,预测逾期还款所造成的经济损失方面:模型结构由第一层输入层、第二层标准化层、第三到第七层为连接层、最后加上第八层输出层组成,模型各层节点数量以第三层和第六层为相对较多,第五层及第八层节点数量相对较少,实现数据传输过程中矩阵先膨胀后收缩再膨胀再收缩的传递特性,使得预测经济损失金额的重要预测因子能淬炼并保留传输至最后的输出层。
如图4所示,提供了一实施例中,损失预测模型的输入与输出的示意图。图中以不使用批量训练的情形进行说明,一次将会输入一笔订单维度的宽表数据,若字段数为120,则此处的输入数据维度为(120,),经过模型各层计算之后,将会输出维度为(1,)的预测数据,此处预测的是采购商使用金融商品逾期还款所造成的相应金融损失。模型训练及预测过程可以选用批量进行。
其中,第一层输入层:将数据导入模型,以结构化输入数据120个字段的宽表为例,此处的数据维度是(120,)。
第二层标准化层:将输入数据进行标准化,更适合模型训练,输入的数据将会转化为平均为零、标准差近似1的数据。以结构化输入数据120个字段的宽表为例,此处的数据维度是(120,)。
第三层全连接层:连接上一层与下一层数据节点,将信息计算并进行传递。以结构化输入数据120个字段的宽表为例,此处的数据维度约为输入数据的两倍(256,),第三层的目的是放大数据的组合。具体使用Linear算法作为激活函数。
第四层全连接层:连接上一层与下一层数据节点,将信息计算并进行传递。以结构化输入数据120个字段的宽表为例,此处的数据维度约为上一层数据的一半(128,),第四层的目的是延伸数据的组合。具体使用Relu算法作为激活函数。
第五层全连接层:连接上一层与下一层数据节点,将信息计算并进行传递。以结构化输入数据120个字段的宽表为例,此处的数据维度约等于上一层(32,),第五层的目的是浓缩数据的组合。具体使用Relu算法作为激活函数。
第六层全连接层:连接上一层与下一层数据节点,将信息计算并进行传递。以结构化输入数据120个字段的宽表为例,此处的数据维度约为上一层的两倍(64,),第六层的目的是进行第二阶段的组合放大。具体使用Sigmoid算法作为激活函数。
第七层全连接层:连接上一层与下一层数据节点,将信息计算并进行传递。以结构化输入数据120个字段的宽表为例,此处的数据维度约为上一层的一半(32,),第七层的目的是进行第二阶段的数据组合浓缩。具体使用Softplus算法作为激活函数。
第八层输出层:将模型计算结果输出。以结构化数据输出预测采购商还款所造成金融损失为例,此处的数据维度为(1,),具体使用Selu算法作为激活函数。
与其他深度学习模型架构不同的是,此模型架构适合分析上述结构化数据的输入,相较于其他算法,结构化数据的纺织行业采购商违约所造成金融损失的评估预测方面具有更低的均方误差。
其中,输入数据的部份,与图像分类的深度学习模型作比较,一个长宽为256×256的图像分类的深度学习模型,若图层为四层,1万笔输入数据,其输入数据的维度是(10000,256,256,4);而此采购商违约所造成金融损失的预测模型的输入数据,以宽表120个维度、1万笔输入数据为例,其输入数据的维度是(10000,120),由于输入的数据结构是单维度的,且各个字段彼此间不存在如同图形数据的位移关系,因此不适合使用CNN卷积神经网络,且输入数据非时序或有序数列,因此也不适合采用RNN循环神经网络,故在此主要使用多层的全连接层进行模型架构的构建。模型输出方面,主要输出目标为预测逾期还款所造成的经济损失,经济损失指的是采购商所借款的金额,拖欠还款期间所应产生的利息,采用银行利率换算为日利率。以1万笔输入数据为例,其输出的维度为(10000,1),输出的每一笔数据为大于零的金额,即以订单为单位判断每一个订单采购商使用金融商品进行贷款所可能造成的金融损失金额。
模型训练采用长时间的重复多次训练迭代,并进行测试比较与筛选,模型筛选主要考虑的评分参数包含:均方误差、平均绝对误差等。由于深度学习模型在初期训练学习阶段,模型的评分存在较大的波动幅度,故需要进行一段时间的训练与验证,待模型波动幅度收敛至可以接受的范围之后再进行落地应用。相同的深度学习算法结构可训练多次产生多个不同的算法模型,进行筛选与比较以选择出更好的模型。
具体地,在一个实施例中,Relu函数为Selu函数为:Softplus函数为:f(x)=loge(1+ex);Linear函数为:f(x)=x;Sigmoid函数为:f(x)=1÷(1+e-x)。其中,x具体表示激活函数的输入数字,即为每层深度学习节点运算之后的数据。α具体为预设常数1.67326324。c具体为预设常数1.05070098。
各层全连接层的计算公式如下:
输出=激活函数(输入矩阵×系数+乖离率);其中,输入矩阵即为深度学习各层的输入数据,系数及乖离率将在训练模型时以梯度下降的方式进行拟合计算。
另外,本损失预测模型中,损失函数采用的是均方误差的计算方式。采用这种方式时,对模型进行持续训练可以获得更佳的评分效果。具体地,损失预测模型大约在1000次训练之后,其评分超越了表现最优的线性回归及岭回归,且经过3000次训练之后,其均方误差依然呈现下降的趋势,即持续训练可以取得更佳的预测效果。
上述纺织行业金融损失预测方法,通过获取纺织行业待预测订单的结构化数据,将结构化数据输入至损失预测模型中,通过损失预测模型确定待预测订单的经济损失值,这一预测方法有效地利用了纺织行业的结构化数据,也有效地使用了传统数据分析过程中容易被特征工程筛选过滤掉的稀疏特征数据,提高了模型预测的评分,降低了均方误差,能够有效直接地对订单的经济损失值进行预测。
在一个实施例中,如图5所示,提供了一种纺织行业金融损失预测装置,包括:
数据获取模块501,用于获取纺织行业待预测订单的结构化数据;
预测模块502,用于将结构化数据输入至损失预测模型中;通过损失预测模型确定待预测订单的经济损失值。
在一个实施例中,损失预测模型包括:输入层、标准化层、多个全连接层和输出层。
在一个实施例中,预测模块502还用于在输入层获取到结构化数据后,输入层将结构化数据导入至标准化层;通过标准化层对结构化数据进行标准化,再将标准化后的结构化数据输出至第一全连接层;通过第一全连接层对标准化后的结构化数据进行放大;通过第二全连接层对放大后的结构化数据进行延伸;通过第三全连接层对延伸后的结构化数据进行浓缩;通过第四连接层对浓缩后的结构化数据进行再次放大;通过第五连接层对再次放大后的结构化数据进行再次浓缩;将再次浓缩后的结构化数据传输至输出层;通过输出层输入对结构化数据进行经济损失预测所得到的经济损失值。
在一个实施例中,纺织行业金融损失预测装置还包括训练模块(图中未示出),用于获取纺织行业的历史结构化数据;对历史结构化数据进行清洗,将不符合预设条件的数据进行剔除;对剔除后的历史结构化数据进行标准化处理;对标准化处理后的历史结构化数据进行串接合并;对串接合并后的历史结构化数据进行统计汇整,并将分成训练数据集和测试数据集。
在一个实施例中,训练模块还用于利用训练数据集对损失预测模型进行训练;利用测试数据集对训练的损失预测模型进行测试;在测试通过后,确定损失预测模型训练完毕。
在一个实施例中,结构化数据包括布料采购商基本信息、布料采购商信用信息、布料采购商历史订单信息及市场金融信息中的至少一者;布料采购商基本信息包括布料采购商的注册资本、成立日期及员工人数中的至少一者;布料采购商信用信息包括法律信息、企业信用信息及经营信息中的至少一者;布料采购商历史订单信息包括订单金额、订单品类、面料数据及还款信息中的至少一者;市场金融信息包括布料市场信息、金融市场信息及竞品信息中的至少一者。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来实现上述的纺织行业金融损失预测方法。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本发明实施例提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现上述纺织行业金融损失预测方法。
本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述纺织行业金融损失预测方法。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器A01、网络接口A02、存储器(图中未示出)和数据库(图中未示出)。其中,该计算机设备的处理器A01用于提供计算和控制能力。该计算机设备的存储器包括内存储器A03和非易失性存储介质A04。该非易失性存储介质A04存储有操作系统B01、计算机程序B02和数据库(图中未示出)。该内存储器A03为非易失性存储介质A04中的操作系统B01和计算机程序B02的运行提供环境。该计算机设备的数据库用于存储纺织行业的结构化数据等。该计算机设备的网络接口A02用于与外部的终端通过网络连接通信。该计算机程序B02被处理器A01执行时以实现一种纺织行业金融损失预测方法。
本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
本发明实施例提供了一种设备,设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现上述纺织行业金融损失预测方法的步骤。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有上述纺织行业金融损失预测方法步骤的程序。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (10)
1.一种纺织行业金融损失预测方法,其特征在于,所述方法包括:
获取所述纺织行业待预测订单的结构化数据;
将所述结构化数据输入至损失预测模型中;
通过所述损失预测模型确定所述待预测订单的经济损失值。
2.根据权利要求1所述的方法,其特征在于,所述损失预测模型包括:输入层、标准化层、多个全连接层和输出层。
3.根据权利要求2所述的方法,其特征在于,所述全连接层至少包括5个,所述通过所述损失预测模型确定所述待预测订单的经济损失值包括:
在所述输入层获取到所述结构化数据后,所述输入层将所述结构化数据导入至所述标准化层;
通过所述标准化层对所述结构化数据进行标准化,再将标准化后的结构化数据输出至第一全连接层;
通过所述第一全连接层对所述标准化后的结构化数据进行放大;
通过第二全连接层对放大后的结构化数据进行延伸;
通过第三全连接层对延伸后的结构化数据进行浓缩;
通过第四连接层对浓缩后的结构化数据进行再次放大;
通过第五连接层对再次放大后的结构化数据进行再次浓缩;
将再次浓缩后的结构化数据传输至所述输出层;
通过所述输出层输入对结构化数据进行经济损失预测所得到的经济损失值。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取所述纺织行业的历史结构化数据;
对所述历史结构化数据进行清洗,将不符合预设条件的数据进行剔除;
对剔除后的历史结构化数据进行标准化处理;
对标准化处理后的历史结构化数据进行串接合并;
对串接合并后的历史结构化数据进行统计汇整,并将所述分成训练数据集和测试数据集。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
利用所述训练数据集对损失预测模型进行训练;
利用所述测试数据集对训练的损失预测模型进行测试;
在测试通过后,确定损失预测模型训练完毕。
7.根据权利要求1所述的方法,其特征在于,所述结构化数据包括布料采购商基本信息、布料采购商信用信息、布料采购商历史订单信息及市场金融信息中的至少一者;所述布料采购商基本信息包括布料采购商的注册资本、成立日期及员工人数中的至少一者;所述布料采购商信用信息包括法律信息、企业信用信息及经营信息中的至少一者;所述布料采购商历史订单信息包括订单金额、订单品类、面料数据及还款信息中的至少一者;所述市场金融信息包括布料市场信息、金融市场信息及竞品信息中的至少一者。
8.一种纺织行业金融损失预测装置,其特征在于,所述装置包括:
数据获取模块,用于获取所述纺织行业待预测订单的结构化数据;
预测模块,用于将所述结构化数据输入至损失预测模型中;通过所述损失预测模型确定所述待预测订单的经济损失值。
9.一种机器可读存储介质,该机器可读存储介质上存储有指令,其特征在于,该指令在被处理器执行时使得所述处理器被配置成执行根据权利要求1至7中任一项所述的纺织行业金融损失预测方法。
10.一种处理器,其特征在于,被配置成执行根据权利要求1至7中任意一项所述的纺织行业金融损失预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110538369.8A CN113283582A (zh) | 2021-05-18 | 2021-05-18 | 纺织行业金融损失预测方法、装置、存储介质及处理器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110538369.8A CN113283582A (zh) | 2021-05-18 | 2021-05-18 | 纺织行业金融损失预测方法、装置、存储介质及处理器 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113283582A true CN113283582A (zh) | 2021-08-20 |
Family
ID=77279515
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110538369.8A Pending CN113283582A (zh) | 2021-05-18 | 2021-05-18 | 纺织行业金融损失预测方法、装置、存储介质及处理器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113283582A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115187026A (zh) * | 2022-06-28 | 2022-10-14 | 北京融信数联科技有限公司 | 一种产业风险监控方法、系统和可读存储介质 |
CN116051296A (zh) * | 2022-12-28 | 2023-05-02 | 中国银行保险信息技术管理有限公司 | 基于标准化保险数据的客户评价分析方法及系统 |
-
2021
- 2021-05-18 CN CN202110538369.8A patent/CN113283582A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115187026A (zh) * | 2022-06-28 | 2022-10-14 | 北京融信数联科技有限公司 | 一种产业风险监控方法、系统和可读存储介质 |
CN116051296A (zh) * | 2022-12-28 | 2023-05-02 | 中国银行保险信息技术管理有限公司 | 基于标准化保险数据的客户评价分析方法及系统 |
CN116051296B (zh) * | 2022-12-28 | 2023-09-29 | 中国银行保险信息技术管理有限公司 | 基于标准化保险数据的客户评价分析方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11790383B2 (en) | System and method for selecting promotional products for retail | |
CN116235183A (zh) | 用于交易数据处理的神经网络架构 | |
US7899767B2 (en) | Probabilistic model generation method, apparatus, and program | |
US11783338B2 (en) | Systems and methods for outlier detection of transactions | |
KR102461415B1 (ko) | 외부 데이터를 고려한 신용 평가 방법 및 이러한 방법을 수행하는 장치 | |
CN113283582A (zh) | 纺织行业金融损失预测方法、装置、存储介质及处理器 | |
CN115205011B (zh) | 基于lsf-fc算法的银行用户画像模型生成方法 | |
CN111932044A (zh) | 一种基于机器学习的钢铁产品价格预测系统和方法 | |
CN116401379A (zh) | 金融产品数据推送方法、装置、设备及存储介质 | |
Zhang | A deep learning model for ERP enterprise financial management system | |
CN111667307B (zh) | 一种理财产品销量的预测方法及装置 | |
CN112508689A (zh) | 一种基于多维度实现决策评估的方法 | |
CN117114812A (zh) | 一种针对企业的金融产品推荐方法及装置 | |
CN116703568A (zh) | 信用卡异常交易识别方法及装置 | |
KR102464995B1 (ko) | 이커머스 솔루션의 구매, 판매, 재고, 물류, 유통, 정산 과정에서 발생하는 엔드 투 엔드 데이터 기반의 신용 평가 방법 및 이러한 방법을 수행하는 장치 | |
KR102464994B1 (ko) | Wms의 이커머스 물류 이동 프로세스에서 발생하는 데이터 기반의 신용 평가 방법 및 이러한 방법을 수행하는 장치 | |
KR102433933B1 (ko) | 이커머스 판매 및 유통 관리 시스템 플랫폼 취합 데이터를 기반으로 한 신용 평가 방법 및 이러한 방법을 수행하는 장치 | |
KR102464993B1 (ko) | Oms 상에서 온라인 판매자 및 소비자 간 발생하는 주문 데이터 기반의 신용 평가 방법 및 이러한 방법을 수행하는 장치 | |
Wu et al. | Customer churn prediction for commercial banks using customer-value-weighted machine learning models | |
CN113283583A (zh) | 纺织行业违约率预测方法、装置、存储介质及处理器 | |
Awasthi | Customer Churn Prediction on E-Commerce Data using Stacking Classifier | |
Konda et al. | An In-Depth Evaluation of Machine Learning Techniques for Anticipating Effective Human Health Outcomes | |
CN117217522A (zh) | 基于人工智能的财务预开票风险管控系统及其运行方法 | |
JP2000099497A (ja) | 入力デ―タシ―ケンスに関わる変数の未来値の予測方法およびそのための装置 | |
Pollesel | Machine Learning applied to Credit Rating for Italian listed companies |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |