CN114298472A - 数字工厂上下游企业画像评价方法以及系统 - Google Patents

数字工厂上下游企业画像评价方法以及系统 Download PDF

Info

Publication number
CN114298472A
CN114298472A CN202111438061.2A CN202111438061A CN114298472A CN 114298472 A CN114298472 A CN 114298472A CN 202111438061 A CN202111438061 A CN 202111438061A CN 114298472 A CN114298472 A CN 114298472A
Authority
CN
China
Prior art keywords
transaction record
record data
neural network
model
quality score
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111438061.2A
Other languages
English (en)
Inventor
程宏
韩彩亮
陆一啸
顾兵兵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huiding Data Technology Shanghai Co ltd
Original Assignee
Huiding Data Technology Shanghai Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huiding Data Technology Shanghai Co ltd filed Critical Huiding Data Technology Shanghai Co ltd
Priority to CN202111438061.2A priority Critical patent/CN114298472A/zh
Publication of CN114298472A publication Critical patent/CN114298472A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明适用于计算机技术领域,提供了一种数字工厂上下游企业画像评价方法以及系统,包括;获取待评分客户的交易记录数据;根据所述交易记录数据以及预设的基于时间递归神经网络建立的交易记录数据‑质量分数模型,确定所述待评分客户的质量分数。所述预设的基于时间递归神经网络建立的交易记录数据‑质量分数模型是通过多个客户的交易记录数据样本训练生成。本发明能够自主学习客户的历史表现,经实证分析并建立模型,能够帮助企业实现自动化的客户评分,在随机划分的20%验证集上,模型给出的客户得分与人工评分的平均误差为6.08分(样本得分全距的8.0%),为银行对中小企业实施贷后监管提供帮助。

Description

数字工厂上下游企业画像评价方法以及系统
技术领域
本发明属于计算机技术领域,尤其涉及一种数字工厂上下游企业画像评价方法以及系统。
背景技术
企业画像通常描述的是企业财务状况、经营状况、行业状况、厂区实景多维度的企业商业信息数据,以帮助我们能够全面了解企业的状况。
在传统的供应链金融中,上游供应商通常以经销人员进行人工分析企业画像,结合具有专家评分的人工评价流程,以此评定下游经销商的客户质量并进行人工评分,对评价人员的技术水平要求高,人工成本高;而现有技术中采用传统的打分卡模型所用计算模型结构简单,不能够全面的反映客户本身情况,也无法反映客户企业与上游供应商的协同关系,存在对客户质量评价准确程度较低的问题。
由此可见,现有技术中的企业质量评价方法存在人工成本高,不能够全面的反映企业本身情况,对客户质量评价准确程度较低的问题。
发明内容
本发明实施例的目的在于提供一种数字工厂上下游企业画像评价方法,旨在解决现有技术中的企业质量评价方法存在人工成本高,不能够全面的反映企业本身情况,对客户质量评价准确程度较低的问题。
本发明实施例是这样实现的,一种数字工厂上下游企业画像评价方法,包括:
获取待评分客户的交易记录数据;
根据所述交易记录数据以及预设的基于时间递归神经网络建立的交易记录数据-质量分数模型,确定所述待评分客户的质量分数;
所述预设的基于时间递归神经网络建立的交易记录数据-质量分数模型通过预先采集的多个客户的交易记录数据样本经过时间递归神经网络训练生成。
本发明实施例的另一目的在于一种数字工厂上下游企业画像评价系统,包括:
交易记录数据获取单元,用于获取待评分客户的交易记录数据;
质量分数确定单元,用于根据所述交易记录数据以及预设的基于时间递归神经网络建立的交易记录数据-质量分数模型,确定所述待评分客户的质量分数,所述基于时间递归神经网络建立的交易记录数据-质量分数模型通过预先采集的多个客户的交易记录数据样本经过时间递归神经网络训练生成。
本发明实施例提供的数字工厂上下游企业画像评价方法,由于预设的基于时间递归神经网络建立的交易记录数据-质量分数模型是通过多个客户的交易记录数据样本训练生成,可以用于表述交易记录数据与质量分数的一种隐含关系,因此在接收待评分客户的交易记录数据后,利用该预设的基于时间递归神经网络建立的交易记录数据-质量分数模型即可确定所述待评分客户的质量分数。本发明能够自主学习客户的历史表现,经实证分析并建立模型,能够帮助企业实现自动化的客户评分,在随机划分的20%验证集上,模型给出的客户得分与人工评分的平均误差为6.08分(样本得分全距的8.0%),为银行对中小企业实施贷后监管提供帮助。
附图说明
图1为本发明实施例提供的数字工厂总指数框架图;
图2为本发明实施例提供的一种数字工厂上下游企业画像评价方法的流程图;
图3为本发明实施例中生成预设的基于时间递归神经网络建立的交易记录数据-质量分数模型的步骤流程图;
图4为本发明实施例提供的交易记录随时间分布直方图;
图5为本发明实施例提供的每个客户的交易记录数量柱状图;
图6为本发明实施例提供的交易记录中各指标的分布图;
图7为本发明实施例提供的评分神经网络结构图;
图8为本发明实施例提供的损失函数确定步骤流程图;
图9为本发明实施例提供的交易记录数据预处理步骤流程图;
图10为本发明实施例提供的3D矩阵数据的示意图;
图11为本发明实施例提供的另一种数字工厂上下游企业画像评价方法的流程图;
图12为本发明实施例提供的一种数字工厂上下游企业画像评价系统的结构框图;
图13为本发明实施例提供的另一种数字工厂上下游企业画像评价系统的结构框图;
图14为本发明实施例提供的神经网络训练过程示意图;
图15为本发明实施例提供的客户质量评分误差的直方图;
图16为本发明实施例提供的客户质量分级ROC曲线图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例为了解决现有技术中的企业质量评价方法存在人工成本高,不能够全面的反映企业本身情况,对客户质量评价准确程度较低的问题,提供了数字工厂上下游企业画像评价方法,由于预设的基于时间递归神经网络建立的交易记录数据-质量分数模型是通过多个客户的交易记录数据样本训练生成,可以用于表述交易记录数据与质量分数的一种隐含关系,因此在接收待评分客户的交易记录数据后,利用该预设的基于时间递归神经网络建立的交易记录数据-质量分数模型即可确定所述待评分客户的质量分数。本发明能够自主学习客户的历史表现,经实证分析并建立模型,能够帮助企业实现自动化的客户评分,在随机划分的20%验证集上,模型给出的客户得分与人工评分的平均误差为6.08分(样本得分全距的8.0%),为银行对中小企业实施贷后监管提供帮助。
现有技术采用过于单一的财务指标、部分交易数据作为企业画像的主要评估范围,不能够较全面的反映企业本身情况,因此,本发明实施例采用更为综合的数据进行企业画像的分析,例如,考虑了企业生产运营感知情况、更完整的供应链交易行为以及部分涉及行业、企业的公开爬虫数据。
具体地,本发明实施例围绕纺织、化纤等行业,进行中小企业画像分析,构建企业画像综合指数,主要包含交易指数、客研指数、爬虫指数以及感知指数构成,涵盖工厂评价、工厂等级、产品线、产品线排名、区域信息,其中,交易指数主要涉及企业交易订单信息、购买商品质量以及货款支付时间等维度,通过特征工程,具体表现为:稳定性、交易量、未来趋势。爬虫指数主要涉及企业财务风险、人员(董监高)风险以及行业风险三个方面。运营感知指数主要为工厂生产运营状态。图1为数字工厂总指数框架。
本发明实施例以化纤供应链的客户管理系统(CRM)为实证对象,研究数字企业画像问题。上游石油化工企业利用石油提取物制造化学纤维,供应给数千家下游的服装企业,在交易过程中形成大量交易记录。上游企业需要评价下游服装企业的购买力,并且提供不同的折扣优惠,以及赊账等金融服务便利。因此,上游企业从业务等4个角度评价客户:(1)交易特征:主要分析订单流水,根据客户购买的稳定性,体量,质量和未来购买的前景趋势。(2)财务特征:根据下游企业的财务报表,判断经营状况。(3)口碑特征:通过监控网络信息,根据对方公司网站是否正常,第三方企业信用平台,高层管理人员的个人行为,以及行业景气指数判断该公司的经营状况。(4)感知特征:通过对方厂区的传感器,计算存货量、周转速度、雇员进出厂门的时间、夜间灯光亮度等信息,判断该公司的经营状况。
其中,财务和口碑特征为截面数据,交易特征为面板数据,感知特征为面板形式的计算机视觉数据,并且,人工评分过程中,交易特征的分数为最主要的依据。因此本发明实施例主要聚焦研究交易特征。
如图2所示,在一个实施例中,提出了一种数字工厂上下游企业画像评价方法,具体可以包括以下步骤:
步骤S201,获取待评分客户的交易记录数据。
在本发明实施例中,交易记录数据包括公司名称、交易时间、商品称重、交易金额、商品质量和2项化学纤维的描述指标:DTEX和filament。交易金额以人民币元为单位,用美元结算的按1:7换算为人民币。商品质量根据查阅化纤质量检测标准,拟定为百分制评分,换算规则如表1所示。
表1商品质量等级-量化分数换算
等级 AAA AA A B C
质量 100 90 80 60 30
步骤S202,根据所述交易记录数据以及预设的基于时间递归神经网络建立的交易记录数据-质量分数模型,确定所述待评分客户的质量分数。
在本发明实施例中,所述基于时间递归神经网络建立的交易记录数据-质量分数模型是通过预先采集的多个客户的交易记录数据样本经过时间递归神经网络训练生成。
在本发明实施例中,所述通过预先采集的多个客户的交易记录数据样本经过时间递归神经网络训练生成交易记录数据-质量分数模型的步骤请参阅图3。
在本发明实施例中,在根据所述交易记录数据以及预设的基于时间递归神经网络建立的交易记录数据-质量分数模型,确定所述待评分客户的质量分数的步骤之前,还涉及对交易记录数据进行数据处理,具体预处理步骤请参阅图10。
本发明实施例提供的数字工厂上下游企业画像评价方法,由于预设的基于时间递归神经网络建立的交易记录数据-质量分数模型是通过多个客户的交易记录数据样本训练生成,可以用于表述交易记录数据与质量分数的一种隐含关系,因此在接收待评分客户的交易记录数据后,利用该预设的基于时间递归神经网络建立的交易记录数据-质量分数模型即可确定所述待评分客户的质量分数。本发明能够自主学习客户的历史表现,经实证分析并建立模型,能够帮助企业实现自动化的客户评分,在随机划分的20%验证集上,模型给出的客户得分与人工评分的平均误差为6.08分(样本得分全距的8.0%),为银行对中小企业实施贷后监管提供帮助。
图3为本发明实施例中生成预设的基于时间递归神经网络建立的交易记录数据-质量分数模型的步骤流程图,详述如下。
步骤S301,获取多个客户的交易记录数据样本以及所述多个客户的交易记录数据样本对应的目标质量分数。
在本发明实施例中,样本共有9200余家工厂(企业),4条产品线,因此,分别对以上4条产品线设计评分模型,构建工厂在不同产品线的评价以及排名等级,和工厂的综合评级以及等级:POY产品线,FDY产品线,DTY产品线,切片产品线,;所收集的训练数据为专家通过业务逻辑打分(交易指数);分产品线等级共划分为4类:普通、潜力、核心、VIP客户。
在交易订单数据中,包含DTY、POY、FDY三种主要产品,和短纤维,切片等少量其他产品。在本发明获得的人工评级数据中,在产品线,评分时间和评分范围方面并未统一。为尽可能使数据符合实际评分逻辑,本发明对数据作如下基本处理:
首先,由于所有评分未标注评分时间,结合本发明在调研时了解的实际情况,认为所有分数在2020年4月结束时给出,是对2020年下半年客户质量的判断。若一个客户被多次评分则取均值。接着,所有的订单从企业数据库中获取,未标注客户是否为2018年1月以后新注册,也未标注客户是否在2020年4 月前停止经营。因此,无法区分客户无记录的状态是未购买还是已不在研究范围。在这种情况下,本发明认为所有有记录的客户的存续时间,均为数据采集的全部时间跨度,即2018年1月至2020年4月。最后,由于每个产品线的数据情况类似,本发明仅以DTY为例分析。
为此,本发明采集了上游企业在DTY产品线上关于3969个客户在2018年 1月至2020年4月的81875条交易记录数据,和对应的客户得分(目标质量分数)。其中,交易记录的时间分布如图4所示;每个客户的交易记录数量如图5 所示,其中,柱状图按从小到大排序,横坐标为工厂的排序序号,纵坐标为订单数量的自然对数,纵坐标为0即有e0=1条记录;交易记录中各指标的分布如图6所示,其中,Weight of Products(商品称重)和Amount(交易金额)已取自然对数。
步骤S302,根据所述多个客户的交易记录数据样本与所述目标质量分数以及含有可变参数的时间递归神经网络模型确定模型的损失函数。
在本发明实施例中,为实现客户评分,本发明建立神经网络模型,结构如图7所示。其中包括一个时间序列处理器即input_1后接部分,和一个特征处理器即input_2后接部分,每层参数如表2所示。
表2神经网络模型每层参数
Figure RE-GDA0003529556740000081
在自编码器中,神经网络完成评分任务,具体原理如图7-8所示。
在本发明实施例中,如图8所示,所述步骤S302,包括以下步骤:
步骤S801,将所述多个客户的交易记录数据样本按照预设时间规则划分为训练序列数据以及目标预测序列数据。
在本发明实施例中,对多个客户的交易记录数据进行预处理的过程步骤如图9所示。
在本发明实施例中,将长度为w的时间序列拆分为两段:训练序列和预测序列。将矩阵按时间轴的切片V′[:,i,:]简写为xi,则首先将矩阵分为x1:k和xk+1:w这2个部分,分别代表前k周的所有客户的所有交易特征,和后w-k周的上述数据。
步骤S802,根据所述训练序列数据以及含有可变参数的时间递归神经网络模型确定响应预测序列数据以及所述预测序列数据对应的响应质量分数。
在本发明实施例中,用前k周的数据初始化LSTM神经网络层,并预测第k+1 周的数据,神经网络层获得状态hk。接着用前k+1周的数据一起预测k+2周的数据,神经网络层更新到状态hk+1,依此类推。直至用前w-1周的数据一起预测第 w周的数据,神经网络层更新到最终状态hw
步骤S803,根据所述响应质量分数与所述目标预测序列数据对应的目标质量分数,确定模型的损失函数。
在本发明实施例中,将hw通过分支①输出到解码器部分。hw是一个32维的特征向量,代表一个客户在当前时间的交易特征。后续神经元层将特征向量拟合到评分y^与真实分数y比较,计算损失函数C,评分输出即图7中所示dense_3 神经网络层。
在本发明实施例中,损失函数C采用模型评分与真是分数之间的MAE损失函数C,使用优化器Adam训练模型。训练时固定随机种子,将数据集V'随机分为80%的训练集和20%的验证集,输出训练集和验证集上的每项损失函数。
步骤S303,判断所述模型的损失函数是否满足预设的阈值条件。
在本发明实施例中,本发明使用早停机制控制神经网络训练,设置最大迭代次数1000次,但是每次迭代监控验证集上的总损失函数。若连续30次迭代损失函数没有突破历史最小值,则停止训练并保存最优模型。
在本发明实施例中,当判断所述模型总损失函数不满足预设的阈值条件时,表明训练出的交易记录数据-质量分数模型误差较大,执行步骤S304;当判断所述模型总损失函数满足预设的阈值条件时,表明训练出的交易记录数据-质量分数模型较为稳定,执行步骤S305。
步骤S304,调整所述时间递归神经网络模型中的可变参数。
在本发明实施例中,可以根据反向传播算法或者梯度下降算法,调整所述时间递归神经网络模型中的可变参数,但调整所述可变参数后,返回至步骤 S302,重新计算总损失函数。
步骤S305,将当前所述含有可变参数的时间递归神经网络模型确定为预设的基于时间递归神经网络建立的交易记录数据-质量分数模型。
在一个实施例中,如图9所示,所述步骤S202之前对交易记录数据进行数据预处理的过程包括以下步骤:
步骤S901,将所述交易记录数据按照预设等间隔时间进行采样,并根据所述交易记录数据构建3D矩阵数据。
在本发明实施例中,在整个订单流中,数据以样本形式存在,即所有客户在所有时间的订单以序列形式排出,时间间隔是散乱的。单独取出一个客户的全部订单,将订单数据看作采样样本,数据形式为不等间隔采样,难以建立时间序列模型。
在本发明实施例中,观察订单的频率,本发明考虑将数据按周采样。设置初始时间T1和结束时间Tw,将这段时间等分为w周。并且,数据集中合计有N个客户S1,...,SN,建立N×w的空白格子。若任意记录属于客户Si,发生时间Ti∈[Tj,Tj+1),则记录被存入格子(i,j)。
在本发明实施例中,操作上述步骤后,每个格子中不含或含有若干条记录,每个包含5项交易特征即商品称重,交易金额,DTEX,filament,商品质量。对商品称重和交易金额求和,对其余特征求均值,构成长度为5的向量Fij。对每个格子分别统计,对所有格子汇总后,所有订单数据构成3D矩阵,如图10所示。矩阵的尺寸为N×w×5。沿着样本轴S1~SN,每一个切片称作1个样本,对应因变量中1个分数。
步骤S902,对所述3D矩阵数据进行映射变换处理,得变换后的3D矩阵数据。
在本发明实施例中,变换后的3D矩阵数据形式为适合时间递归神经网络训练的数据形式。由图6可知商品称重和交易金额更合适取自然对数形式,因此对这2个特征作对数变换,变换后的样本分布比变换前更接近正态分布.为防止除零错误且所有原始数据大于等于0,变换函数为
f(X)=ln(X+1) (1)
在预处理中涉及取对数后数据相加的,加法函数为
h(X)=ln(∑(eX-1)+1) (1)
同时,若X为0则f(X)=0,使得金额为0的空订单与无订单等效,无订单时商品称重和订单金额填0即可。
在本发明实施例中,为提高深度学习模型的运行效率,对所有数据再做0-1 压缩变换,即设3D矩阵中的任意分量vijk,矩阵在特征轴的第k个切片V::k上的最小值为m=minV::k,最大值为M=maxV::k,则
Figure RE-GDA0003529556740000111
整个3D矩阵变换为V′,即所有样本所有时间上,某个特征的最小值为0,最大值为1。同理,因变量Y也经过0-1压缩变换,记作Y′。
步骤S903,将所述变换后的3D矩阵数据进行缺失值填补处理,得预处理后的交易记录数据。
在本发明实施例中,考虑交易特征的实际意义,在无订单状态下商品称重和订单金额的实际值均为0,且空订单的取值为0,该值经过0-1压缩变换后仍为0,因此这2个特征的缺失值补0。其余3个特征均为商品的质检指标,在无订单情况下默认客户未来需要平均质量的商品。由于已经过0-1压缩变换,实际填充值为
Figure RE-GDA0003529556740000121
补充完缺失值后,与因变量分数作匹配对应,缺失分数的补最低分,即0-1 压缩变换后补0值。
在一个实施例中,如图11所示,一种数字工厂上下游企业画像评价方法,其与图2所示的方法相比,区别在于,还包括步骤S1101。
步骤S1101,根据所述质量分数,确定所述待评分客户的质量分级。
在本发明实施例中,在通常所说的机器学习分类任务例如鸢尾花分类任务中,类别标签为名义字段。而客户质量分级,是根据客户质量评分排序,以分数线形式划分为多个类别。因此,类别标签为定序字段,不能用传统的多分类问题。
在作出ROC曲线,实现模型评价时,将这个多分类问题拆解为数个二分类问题,如表3所示。
表3定序分类问题类别转换
序号 负样本对应分类 正样本对应分类
1 B,C,D A
2 C,D A,B
3 D A,B,C
因此,在每个二分类问题中,可以用一个阈值将正负样本划开,即高于阈值的是正样本,并且类别集合互斥。
本发明实施例提供的数字工厂上下游企业画像评价方法,以石油化工和化纤供应链中的上游核心企业和3969家下游经销商为例,根据2018年1月至2020 年7月的人工客户评价数据,进行实证分析并建立模型。在随机划分的20%验证集上,模型给出的客户得分与人工评分的平均误差为6.08分(样本得分全距的8.90%)。另外,在人工评分过程中,供应商通常将客户按比例划分为四个等级,按照人工评分时客户标定的分数线,本发明提出的模型的分类准确率为 78.7%。本发明的研究成果能够应用于CRM系统,为数字工厂智能发现潜在客户提供帮助。
如图12所示,在一个实施例中,提供了一种数字工厂上下游企业画像评价系统,具体可以包括:
交易记录数据获取单元1210,用于获取待评分客户的交易记录数据。
在本发明实施例中,交易记录数据包括公司名称、交易时间、商品称重、交易金额、商品质量和2项化学纤维的描述指标:DTEX和filament。交易金额以人民币元为单位,用美元结算的按1:7换算为人民币。商品质量根据查阅化纤质量检测标准,拟定为百分制评分,换算规则如表1所示。
质量分数确定单元1220,用于根据所述交易记录数据以及预设的基于时间递归神经网络建立的交易记录数据-质量分数模型,确定所述待评分客户的质量分数。
在本发明实施例中,所述基于时间递归神经网络建立的交易记录数据-质量分数模型是通过预先采集的多个客户的交易记录数据样本经过时间递归神经网络训练生成。
在本发明实施例中,在根据所述交易记录数据以及预设的基于时间递归神经网络建立的交易记录数据-质量分数模型,确定所述待评分客户的质量分数的步骤之前,还涉及对交易记录数据进行数据处理,具体预处理步骤请参阅图9。
如图13所示,在一个实施例中,提供了一种数字工厂上下游企业画像评价系统,其与图12所示的系统的区别在于,还包括模型训练单元1310,用于生成预设的基于时间递归神经网络建立的交易记录数据-质量分数模型。
在本发明实施例中,所述通过预先采集的多个客户的交易记录数据样本经过时间递归神经网络训练生成交易记录数据-质量分数模型的步骤请参阅图3。
本发明实施例提供的数字工厂上下游企业画像评价系统,由于预设的基于时间递归神经网络建立的交易记录数据-质量分数模型是通过多个客户的交易记录数据样本训练生成,可以用于表述交易记录数据与质量分数的一种隐含关系,因此在接收待评分客户的交易记录数据后,利用该预设的基于时间递归神经网络建立的交易记录数据-质量分数模型即可确定所述待评分客户的质量分数。本发明能够自主学习客户的历史表现,经实证分析并建立模型,能够帮助企业实现自动化的客户评分,在随机划分的20%验证集上,模型给出的客户得分与人工评分的平均误差为6.08分(样本得分全距的8.0%),为银行对中小企业实施贷后监管提供帮助。
以下内容为本发明针对所建立的交易记录数据-质量分数模型进行评价,具体如下:
对本发明获得的交易记录数据,最早时间为2018.1.1,最晚时间为2020.4.27,将这个时期分为121周。交易记录包含3969个客户的数据,3D矩阵数据集的尺寸为3969×121×5。设置多步预测中,以前101周初始化模型,通过20步预测到121周。
早停机制在验证集损失函数无明显下降后60次迭代后停止,保存验证集上损失函数最小时的模型。训练集和验证集上,损失函数下降的过程如图14所示, Prediction为多步预测的损失函数C1,scoring为模型评分的损失函数C2。横坐标为迭代次数,纵坐标为MAE函数值。MAE计算时数据处在0-1压缩变换的状态,函数值乘以全距为实际平均绝对误差。
预测验证集上的分数,预测分数与真实分数的误差如图15所示,横坐标为分数误差,纵坐标为计数。预测分数的平均误差为6.08分。
进一步,DTY产品线上,根据供应商给出的分数线,将预测分数和真实分数转换为A,B,C,D四个等级。混淆矩阵如表4所示,分类准确度为78.7%。
表4验证集上的混淆矩阵
Figure RE-GDA0003529556740000151
若模型输出的评分不固定阈值,按上述将定序分类问题转换为3个二分类问题,作出ROC曲线如图16所示。
综上,本发明通过一系列数据预处理方法,将订单流填充为3D矩阵作为机器学习数据集,通过神经网络模型,训练并在验证集上预测客户质量评分。对将客户根据评分分级的定序分类问题,本发明将其转换为2分类问题并作出混淆矩阵和ROC曲线。在CRM系统领域,上游核心企业经常需要通过客户的购买行为判断质量,从而提供不同的折扣和金融便利。传统上,销售人员需要人工判断客户的口碑和经营状况,而本发明的模型能够帮助企业实现自动化的客户评分和分级,建立数字工厂平台。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种数字工厂上下游企业画像评价方法,其特征在于,包括:
获取待评分客户的交易记录数据;
根据所述交易记录数据以及预设的基于时间递归神经网络建立的交易记录数据-质量分数模型,确定所述待评分客户的质量分数;
所述预设的基于时间递归神经网络建立的交易记录数据-质量分数模型通过预先采集的多个客户的交易记录数据样本经过时间递归神经网络训练生成。
2.根据权利要求1所述的数字工厂上下游企业画像评价方法,其特征在于,在所述根据所述交易记录数据以及预设的基于时间递归神经网络建立的交易记录数据-质量分数模型,确定所述待评分客户的质量分数的步骤之前,还包括:
将所述交易记录数据按照预设等间隔时间进行采样,并根据所述交易记录数据构建3D矩阵数据;
对所述3D矩阵数据进行映射变换处理,得变换后的3D矩阵数据;
将所述变换后的3D矩阵数据进行缺失值填补处理,得预处理后的交易记录数据。
3.根据权利要求1所述的数字工厂上下游企业画像评价方法,其特征在于,所述生成预设的基于时间递归神经网络建立的交易记录数据-质量分数模型的步骤,具体包括:
获取多个客户的交易记录数据样本以及所述多个客户的交易记录数据样本对应的目标质量分数;
根据所述多个客户的交易记录数据样本与所述目标质量分数以及含有可变参数的时间递归神经网络模型确定模型总损失函数;
判断所述模型总损失函数是否满足预设的阈值条件;
当判断所述模型总损失函数不满足预设的阈值条件时,调整所述时间递归神经网络模型中的可变参数,并返回至所述根据所述多个客户的交易记录数据样本与所述目标质量分数以及含有可变参数的时间递归神经网络模型确定模型的损失函数的步骤;
当判断所述模型的损失函数满足预设的阈值条件时,将当前所述含有可变参数的时间递归神经网络模型确定为预设的基于时间递归神经网络建立的交易记录数据-质量分数模型。
4.根据权利要求3所述的数字工厂上下游企业画像评价方法,其特征在于,所述根据所述多个客户的交易记录数据样本与所述目标质量分数以及含有可变参数的时间递归神经网络模型确定模型的损失函数的步骤,包括:
将所述多个客户的交易记录数据样本按照预设时间规则划分为训练序列数据以及目标预测序列数据;
根据所述训练序列数据以及含有可变参数的时间递归神经网络模型确定响应预测序列数据以及所述预测序列数据对应的响应质量分数;
根据所述响应质量分数与所述目标预测序列数据对应的目标质量分数,确定模型的损失函数。
5.根据权利要求1所述的数字工厂上下游企业画像评价方法,其特征在于,所述质量分数确定方法还包括:
根据所述质量分数,确定所述待评分客户的质量分级。
6.根据权利要求1所述的数字工厂上下游企业画像评价方法,其特征在于,所述交易记录数据包括交易时间、商品称重、交易金额、商品质量以及商品描述指标。
7.一种数字工厂上下游企业画像评价方法系统,其特征在于,包括:
交易记录数据获取单元,用于获取待评分客户的交易记录数据;
质量分数确定单元,用于根据所述交易记录数据以及预设的基于时间递归神经网络建立的交易记录数据-质量分数模型,确定所述待评分客户的质量分数,所述预设的基于时间递归神经网络建立的交易记录数据-质量分数模型通过预先采集的多个客户的交易记录数据样本经过时间递归神经网络训练生成。
8.根据权利要求7所述的数字工厂上下游企业画像评价系统,其特征在于,所述数字工厂上下游企业画像评价系统还包括模型训练单元;
所述模型训练单元,用于生成预设的基于时间递归神经网络建立的交易记录数据-质量分数模型。
CN202111438061.2A 2021-11-29 2021-11-29 数字工厂上下游企业画像评价方法以及系统 Pending CN114298472A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111438061.2A CN114298472A (zh) 2021-11-29 2021-11-29 数字工厂上下游企业画像评价方法以及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111438061.2A CN114298472A (zh) 2021-11-29 2021-11-29 数字工厂上下游企业画像评价方法以及系统

Publications (1)

Publication Number Publication Date
CN114298472A true CN114298472A (zh) 2022-04-08

Family

ID=80964978

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111438061.2A Pending CN114298472A (zh) 2021-11-29 2021-11-29 数字工厂上下游企业画像评价方法以及系统

Country Status (1)

Country Link
CN (1) CN114298472A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117575769A (zh) * 2023-11-02 2024-02-20 睿智合创(北京)科技有限公司 一种信贷机构客户流量质量评估方法及系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117575769A (zh) * 2023-11-02 2024-02-20 睿智合创(北京)科技有限公司 一种信贷机构客户流量质量评估方法及系统

Similar Documents

Publication Publication Date Title
CN108564286B (zh) 一种基于大数据征信的人工智能金融风控授信评定方法和系统
CN111507831A (zh) 信贷风险自动评估方法和装置
CN112116184A (zh) 使用历史检验数据的工厂风险估计
CN107609771A (zh) 一种供应商价值评价方法
Nyitrai Dynamization of bankruptcy models via indicator variables
CN113537807A (zh) 一种企业智慧风控方法及设备
CN113869768A (zh) 产业链强弱度的评价方法、装置、设备及可读介质
CN107133862A (zh) 动态产生增强信用评估的详细交易支付经历的方法和系统
CN116468273A (zh) 客户风险识别方法及装置
CN114118793A (zh) 一种地方交易所风险预警方法、装置及设备
Anupa et al. Artificial neural network based demand forecasting integrated with federal funds rate
CN114298472A (zh) 数字工厂上下游企业画像评价方法以及系统
CN113283673A (zh) 一种模型性能衰减评价方法、模型训练方法及装置
CN117114812A (zh) 一种针对企业的金融产品推荐方法及装置
Gleue et al. Decision support for the automotive industry: Forecasting residual values using artificial neural networks
CN113421154B (zh) 基于控制图的信贷风险评估方法及系统
CN114626940A (zh) 数据分析方法、装置及电子设备
CN113537759A (zh) 一种基于权重自适应的用户体验度量模型
Reinaldo et al. Prediction of Customer Data Classification by Company Category Using Decision Tree Algorithm (Case Study: PT. Teknik Kreasi Solusindo)
CN113763032B (zh) 一种商品购买意愿识别方法及装置
Prasad et al. Machine Learning Based Cost prediction for Acquiring New Customers
CN111913940B (zh) 一种温度会员标签预测方法、装置、电子设备及存储介质
Purwanto et al. SALES TRANSACTION DATA EVALUATION INFORMATION SYSTEM USING CLUSTERING MODEL
Nazari et al. Using the Hybrid Model for Credit Scoring (Case Study: Credit Clients of microloans, Bank Refah-Kargeran of Zanjan, Iran)
CN118296389A (zh) 一种数据指标模型的构建及评估方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination