CN116703216A - 业务场景评分方法、装置、计算机设备和存储介质 - Google Patents
业务场景评分方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN116703216A CN116703216A CN202310665215.4A CN202310665215A CN116703216A CN 116703216 A CN116703216 A CN 116703216A CN 202310665215 A CN202310665215 A CN 202310665215A CN 116703216 A CN116703216 A CN 116703216A
- Authority
- CN
- China
- Prior art keywords
- influence data
- data
- weight
- service scene
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013077 scoring method Methods 0.000 title claims abstract description 18
- 238000012417 linear regression Methods 0.000 claims abstract description 151
- 238000000034 method Methods 0.000 claims abstract description 30
- 238000012360 testing method Methods 0.000 claims description 130
- 238000004590 computer program Methods 0.000 claims description 47
- 238000011156 evaluation Methods 0.000 claims description 19
- 238000007781 pre-processing Methods 0.000 claims description 16
- 238000012795 verification Methods 0.000 claims description 12
- 238000013473 artificial intelligence Methods 0.000 abstract description 3
- 238000004364 calculation method Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 8
- 238000012545 processing Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000010276 construction Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 229910021389 graphene Inorganic materials 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Physics (AREA)
- Operations Research (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Educational Administration (AREA)
- Computational Mathematics (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Business, Economics & Management (AREA)
- Evolutionary Biology (AREA)
- Tourism & Hospitality (AREA)
- Bioinformatics & Computational Biology (AREA)
- Probability & Statistics with Applications (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Algebra (AREA)
- Marketing (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请涉及一种业务场景评分方法、装置、计算机设备和存储介质,涉及人工智能领域。所述方法包括:获取当前时段内待评分业务场景的目标影响数据,通过多元线性回归模型,根据目标影响数据,确定待评分业务场景的预测权重,根据待评分业务场景的目标影响数据和预测权重,确定待评分业务场景的最终评分。采用本方法能够无需再依赖于人工的主观性判断,降低了人工成本的同时,提高了预测权重确定的准确性和合理性,从而进一步提高确定出的最终评分的准确性。
Description
技术领域
本申请涉及人工智能技术领域,特别是涉及一种业务场景评分方法、装置、计算机设备和存储介质。
背景技术
随着人工智能的发展,出现了一种对各种业务场景进行评分的技术,该技术基于业务场景的影响数据和业务权重(即业务场景使用率越高,业务权重越高),来对业务场景进行评分。
但由于现有技术中,业务权重通常是基于人工对该业务场景的主观评价而设置的,在对复杂业务场景进行评分(即一个复杂业务场景中包含多个单一业务场景)时,需要大量人力成本的投入,且业务权重是基于人工主观性判断而得的,设置的业务权重可能产生较大误差,因此存在人工成本高且准确率低的问题,从而进一步导致对业务场景最终评分的准确率较低,以及对业务场景的评分效率较低的问题。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高业务场景最终评分的评分效率和准确率的业务场景评分方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
第一方面,本申请提供了一种业务场景评分方法。所述方法包括:
获取当前时段内待评分业务场景的目标影响数据;
通过多元线性回归模型,根据目标影响数据,确定待评分业务场景的预测权重;其中,多元线性回归模型的网络参数包括截距值、误差值,以及目标影响数据的相关系数;
根据待评分业务场景的目标影响数据和预测权重,确定待评分业务场景的最终评分。
在其中一个实施例中,获取当前时段内待评分业务场景的目标影响数据,包括:
获取当前时段内的待评分业务场景的原始影响数据;
对原始影响数据进行标准化和/或去重化处理,得到预处理影响数据;
从预处理影响数据中剔除不满足影响阈值的预处理影响数据,得到当前时段内待评分业务场景的目标影响数据。
在其中一个实施例中,根据待评分业务场景的目标影响数据和预测权重,确定待评分业务场景的最终评分,包括:
若待评分业务场景的目标影响数据为至少两个维度的数据,则根据各维度的目标影响数据所落入的数据区间对应的区间分数值,确定各维度的目标影响数据对应的数据子分数值;
对各维度的目标影响数据对应的数据子分数值进行融合,得到各维度的目标影响数据对应的数据总分数值;
基于待评分业务场景的预测权值,对数据总分数值进行加权处理,得到待评分业务场景的最终评分。
在其中一个实施例中,多元线性回归模型中目标影响数据的相关系数的确定方式,包括:
获取历史时段内的样本业务场景的样本影响数据,以及样本业务场景的权重标签;
确定样本业务场景的样本影响数据与样本业务场景的权重标签之间的协方差;
确定样本业务场景的样本影响数据和权重标签的标准差乘积;
将协方差在标准差乘积中的占比,作为多元线性回归模型中目标影响数据的相关系数。
在其中一个实施例中,多元线性回归模型中截距值的确定方式,包括:
将样本影响数据为空的样本业务场景的权重标签的数值,作为多元线性回归模型中的截距值。
在其中一个实施例中,多元线性回归模型中误差值的确定方式,包括:
以目标影响数据的相关系数和截距值为网络参数,构建初始模型;
通过初始模型,根据样本业务场景的样本影响数据,确定样本业务场景的预测权重;
将样本业务场景的预测权重和权重标签的平均差值,作为多元线性回归模型中的误差值。
在其中一个实施例中,确定多元线性回归模型的网络参数之后,还包括:
获取历史时段内的测试业务场景的测试影响数据,以及测试业务场景的权重标签;
基于R2评估指标,根据测试业务场景的测试影响数据,以及测试业务场景的权重标签,对多元线性回归模型的网络参数进行准确性验证。
在其中一个实施例中,基于R2评估指标,根据测试业务场景的测试影响数据,以及测试业务场景的权重标签,对多元线性回归模型的网络参数进行准确性验证,包括:
通过多元线性回归模型,根据测试业务场景的测试影响数据,确定测试业务场景的预测权值;
根据测试业务场景的权重标签,确定测试业务场景的平均权重;
将测试业务场景的第一误差平方值和第二误差平方值的比值,作为多元线性回归模型的R2评估指标的指标值;其中,第一误差平方值为预测权值与测试业务场景的权重标签之间的误差平方值;第二误差平方值为预测权值与平均权重之间的误差平方值;
若R2评估指标的指标值大于指标阈值,则确定对多元线性回归模型的网络参数进行准确性验证通过。
第二方面,本申请还提供了一种业务场景评分装置。所述装置包括:
数据获取模块,用于获取当前时段内待评分业务场景的目标影响数据;
权重确定模块,用于通过多元线性回归模型,根据目标影响数据,确定待评分业务场景的预测权重;其中,多元线性回归模型的网络参数包括截距值、误差值,以及目标影响数据的相关系数;
评分确定模块,用于根据待评分业务场景的目标影响数据和预测权重,确定待评分业务场景的最终评分。
第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取当前时段内待评分业务场景的目标影响数据;
通过多元线性回归模型,根据目标影响数据,确定待评分业务场景的预测权重;其中,多元线性回归模型的网络参数包括截距值、误差值,以及目标影响数据的相关系数;
根据待评分业务场景的目标影响数据和预测权重,确定待评分业务场景的最终评分。
第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取当前时段内待评分业务场景的目标影响数据;
通过多元线性回归模型,根据目标影响数据,确定待评分业务场景的预测权重;其中,多元线性回归模型的网络参数包括截距值、误差值,以及目标影响数据的相关系数;
根据待评分业务场景的目标影响数据和预测权重,确定待评分业务场景的最终评分。
第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
获取当前时段内待评分业务场景的目标影响数据;
通过多元线性回归模型,根据目标影响数据,确定待评分业务场景的预测权重;其中,多元线性回归模型的网络参数包括截距值、误差值,以及目标影响数据的相关系数;
根据待评分业务场景的目标影响数据和预测权重,确定待评分业务场景的最终评分。
上述业务场景评分方法、装置、计算机设备和存储介质,通过多元线性回归模型对获取到的目标影响数据进行计算,得到预测权重,无需再依赖于人工的主观性判断,降低了人工成本的同时,提高了预测权重确定的准确性和合理性,并基于较为准确且合理的预测权重,确定待评分业务场景的最终评分,进一步提高了获取得到的最终评分的准确性。
附图说明
图1为本实施例提供的一种业务场景评分方法的应用环境图;
图2为本实施例提供的第一种业务场景评分方法的流程示意图;
图3为本实施例提供的一种构建多元线性回归模型的流程示意图;
图4为本实施例提供的一种验证多元线性回归模型的流程示意图;
图5为本实施例提供的第二种业务场景评分方法的流程示意图;
图6为本实施例提供的第一种业务场景评分装置的结构框图;
图7为本实施例提供的第二种业务场景评分装置的结构框图;
图8为本实施例提供的第三种业务场景评分装置的结构框图;
图9为本实施例提供的一种计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例提供的业务场景评分方法,可以应用于如图1所示的应用环境中。在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图1所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储目标影响数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种业务场景评分方法。
在一个实施例中,如图2所示,提供了一种业务场景评分方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
S201,获取当前时段内待评分业务场景的目标影响数据。
其中,待评分业务场景可以是需要进行评分的用于交易、资讯和服务等业务的场景。可选地,该待评分业务可以是债务交易业务场景。
其中,目标影响数据可以是从待评分业务场景中获取到的可能对该待评分业务场景的最终评分产生影响的数据。可选地,该目标影响数据可以包括但不限于待评分业务场景的交易数、访问数和调用数等数据。
可选地,获取当前时段内待评分业务场景的目标影响数据的方式有多种,本申请对此不做限定。
其中一种可选实现方式可以是,直接将本地设备中存储的当前时段内待评分业务场景的影响数据,作为目标影响数据。
另一种可选实现方式可以是,获取当前时段内的待评分业务场景的原始影响数据;对原始影响数据进行标准化和/或去重化处理,得到预处理影响数据;从预处理影响数据中剔除不满足影响阈值的预处理影响数据,得到当前时段内待评分业务场景的目标影响数据。
具体的,从本地设备中获取当前时段内的待评分业务场景的原始影响数据,并对原始影响数据进行标准化和/或去重化的预处理,得到预处理后的影响数据,由于该预处理影响数据中可能存在数据值较小的影响数据,且该数据值较小的影响数据无法对最终评分结果产生较为显著的影响,因此可以去除此部分数据值的影响数据,从而降低后续的计算量以达到减少计算机的资源浪费的目的,即,根据预先设置的影响阈值,从预处理影响数据中剔除不满足影响阈值的预处理影响数据,得到当前时段内待评分业务场景的目标影响数据。
可选地,针对原始影响数据的预处理,本实施例可以仅对每一原始影响数据进行标准化处理,即针对每一原始影响数据,均计算出该原始影响数据与所有原始影响数据的均值之间的差值,并计算该差值与所有原始影响数据标准差之间的商值,并将该商值作为该原始影响数据对应的预处理影响数据。本实施例也可以仅对原始影响数据进行去重化处理,即针对任意多个相同的原始影响数据,仅保留一个原始影响数据作为该原始影响数据对应的预处理影响数据。本实施例还可以同时对原始影响数据进行标准化和去重化的预处理,并将最终得到的预处理结果作为预处理影响数据。
需要说明的是,由于目标影响数据可能存在多个维度(如交易数和调用数,即为两个维度的目标影响数据),且每一维度的目标影响数据可能存在多个(如3月这一当前时段内可能存在1日当前子时段交易数1、2日当前子时段交易数2、3日当前子时段交易数3等若干目标影响数据),因此,在得到目标后,还应对目标影响数据进行筛选,即确保同一时段内的各维度的目标影响数据均存在数据值,以保证各维度目标影响数据的完整性。
S202,通过多元线性回归模型,根据目标影响数据,确定待评分业务场景的预测权重。
其中,多元线性回归模型的网络参数包括截距值、误差值,以及目标影响数据的相关系数。
可选地,将目标影响数据输入至多元线性回归模型中,该多元线性回归模型会计算每一目标影响数据与该目标影响数据对应相关系数之间的乘积,并对该乘积、多元线性回归模型中的截距值和误差值进行求和计算,并将求和结果作为待评分业务场景的预测权重。
示例性的,多元线性回归模型的计算公式如下公式(1-1)所示,将i个维度的目标影响数据分别作为各xi的值输入到该多元线性回归模型中,计算各维度的目标影响数据与该维度目标影响数据对应相关系数之间的乘积,并将该乘积结果与截距值对应的截距常数项(公式1-1中的b0),以及误差值对应的误差常数项(公式1-1中的ε)进行求和,得到y代表的预测权重。
y=b0+b1x1+b2x2+…+bixi+ε (1-1)
其中,y是多元线性模型预测得到的预测权重,b1是第1个维度的目标影响数据对应的相关系数,x1是第1个维度的目标影响数据,b2是第2个维度的目标影响数据对应的相关系数,x2是第2个维度的目标影响数据,bi是第i个维度的目标影响数据对应的相关系数,xi是第i个维度的目标影响数据,b0是截距值,ε是误差值。
需要说明的是,由于目标影响数据可能存在多个维度,且每一维度的目标影响数据可能存在多个,因此,可以在通过多元线性回归模型计算预测权重之前,针对每一维度的目标影响数据进行均值或中位数计算,并将该均值或中位数作为多元线性回归模型的输入值;也可以针对每一当前子时段的各维度目标影响数据均通过多元线性回归模型计算一个权重,并计算所有权重的均值或中位数,并将该均值或中位数作为待评分业务场景的预测权重。
S203,根据待评分业务场景的目标影响数据和预测权重,确定待评分业务场景的最终评分。
其中,最终评分可以是用于评价待评分业务场景优劣程度的参考评分,如评分越低,待评分业务场景的使用率越低,存在该待评分业务场景被停用的可能性。
可选地,根据待评分业务场景的目标影响数据和预测权重,确定待评分业务场景的最终评分的方式有多种,本申请对此不做限定。
其中一种可选方式可以是,若待评分业务场景的目标影响数据为至少两个维度的数据,根据待评分业务场景的目标影响数据和预测权重,计算各维度的目标影响数据与该预测权重之间的乘积,并确定该乘积落入的数据区间对应的区间分数值,得到子分数值,再对各子分数值进行求和计算,并将最终的求和结果作为待评分业务场景的最终评分。
另一种可选方式可以是,若待评分业务场景的目标影响数据为至少两个维度的数据,则根据各维度的目标影响数据所落入的数据区间对应的区间分数值,确定各维度的目标影响数据对应的数据子分数值。对各维度的目标影响数据对应的数据子分数值进行融合,得到各维度的目标影响数据对应的数据总分数值。基于待评分业务场景的预测权值,对数据总分数值进行加权处理,得到待评分业务场景的最终评分。
具体的,若待评分业务场景的目标影响数据为至少两个维度的数据,则针对每一维度的目标影响数据,均确定出该目标影响数据所落入的数据区间,并确定出该数据区间对应的区间分数值,将该区间分数值作为该维度的目标影响数据对应的数据子分数值,针对得到的各维度目标影响数据的子分数值进行求和计算,并将最终求和结果作为该待评分业务场景的数据总分数值,最终计算该数据总分数值与该预测权重的乘积,并将该乘积结果作为该待评分业务场景的最终评分。
需要说明的是,由于目标影响数据可能存在多个维度,且每一维度的目标影响数据可能存在多个,因此,若存在多个维度的目标影响数据,且每一维度的目标影响数据存在多个数据值,那么,还可以在计算最终评分之前,将每一维度的目标影响数据进行均值或中位数计算,并将该均值或中位数作为进行最终评分计算的目标影响数据。也可以针对每一当前子时段对应的各维度目标影响数据,均计算出一个评分结果,并计算所有当前子时段对应评分结果的均值或中位值,并将该均值或中位数作为待评分业务场景的最终评分。
上述业务场景评分方法,通过多元线性回归模型对获取到的目标影响数据进行计算,得到预测权重,无需再依赖于人工的主观性判断,降低了人工成本的同时,提高了预测权重确定的准确性和合理性,并基于较为准确且合理的预测权重,确定待评分业务场景的最终评分,进一步提高了获取得到的最终评分的准确性。
图3为一个实施例中构建多元线性回归模型的流程示意图。本实施例中,多元线性回归模型的网络参数确定的准确性,直接影响了多元线性回归模型构建的准确性,因此,如何确定多元线性回归模型的网络参数至关重要,本实施例给出了一种构建多元线性回归模型的可选方式,包括如下步骤:
S301,获取历史时段内的样本业务场景的样本影响数据,以及样本业务场景的权重标签。
其中,样本业务场景可以是用于对多元线性回归模型进行构建时所用的业务场景。需要说明的是,为保证构建出的多元线性回归模型可以应用在各个种类的业务场景中,该样本业务场景的种类需要尽可能的涵盖各种类的待评分业务场景。
其中,样本影响数据用于对多元线性回归模型进行构建时所需要的数据。可选地,为保证构建出的多元线性回归模型能够进行更为精准的预测,该样本影响数据的维度的数量应当不少于目标影响数据的维度的数量。
可选地,从本地设备中直接获取历史时段内的样本业务场景的样本影响数据,并基于人工确定该样本业务场景中历史时段内每一历史子时段对应的权重值,并将每一历史子时段对应的权重值以标签的形式添加到该样本业务场景上。
S302,确定样本业务场景的样本影响数据与样本业务场景的权重标签之间的协方差。
可选地,针对每一样本业务场景,获取到该样本业务场景的各维度样本影响数据,针对每一维度的样本影响数据,计算同一历史子时段对应的样本影响数据与权重标签之间的协方差。
S303,确定样本业务场景的样本影响数据和权重标签的标准差乘积。
可选地,针对获取到的样本业务场景的样本影响数据,计算每一样本影响数据与所有样本影响数据均值之间的方差,并基于所有方差的和进行算数平方根计算,得到该样本影响数据对应的样本标准差;针对获取到的权重标签,计算每一权重值与所有权重值的均值之间的方差,并基于所有方差的和进行算数平方根计算,得到该权重标签对应的权重标准差;计算样本标准差与权重标准差之间的乘积,并将该乘积结果作为标准差乘积。
S304,将协方差在标准差乘积中的占比,作为多元线性回归模型中目标影响数据的相关系数。
可选地,基于获取到的每一维度样本影响数据对应的协方差和标准差,计算该协方差与标准差之间的商值,并将该商值作为该维度的目标影响数据对应的相关系数。
示例性的,目标影响数据对应的相关系数的计算公式如下公式(1-2)所示:
其中,bi为第i个维度的样本影响数据对应的相关系数,cov(xi,y)为第i个维度的样本影响数据与权重标签之间的协方差,σxi为第i个维度的样本影响数据的样本标准差,σy为权重标签对应的权重标准差。
需要说明的是,由于在确定目标影响数据对应的相关系数的过程中,使用的样本影响数据说涵盖的维度较多,所以计算得到的相关系数对应的维度也较多,因此,在多元线性回归模型的实际应用中,当存在某些相关系数没有对应的目标影响数据进行计算的情况时,将该相关系数对应的目标影响数据设置为0,以保证缺失的部分目标影响数据不影响多元线性回归模型的计算。
S305,将样本影响数据为空的样本业务场景的权重标签的数值,作为多元线性回归模型中的截距值。
可选地,为保证构建多元线性回归模型的准确性,在获取样本影响数据时,不但要获取存在数据值的样本影响数据,还要获取数据值为空的影响数据,因此,获取各维度样本影响数据为空时,样本影响数据对应权重的权重值,并将该权重值作为多元线性回归模型中的截距值。
S306,以目标影响数据的相关系数和截距值为网络参数,构建初始模型。
其中,初始模型可以是未经过训练的多元线性回归模型。
可选地,基于获取到的目标影响数据的相关系数和截距值,将目标影响数据的相关系数和截距值作为网络参数,将待输入的每一维度的影响数据作为该维度对应的变量,构建每一维度的变量与相关系数的乘积作为乘积项,将所有维度的乘积项与截距值进行相加,完成初始模型的构建。
示例性的,初始模型的计算公式如下公式(1-3)所示,将i个维度的影响数据作为输入到该初始模型中的xi,将截距值作为初始模型中的截距常数项。
y’=b0+b1x1+b2x2+…+bixi (1-3)
其中,y’是初始模型预测得到的预测权重,b1是第1个维度的影响数据对应的相关系数,x1是第1个维度的影响数据,b2是第2个维度的影响数据对应的相关系数,x2是第2个维度的影响数据,bi是第i个维度的影响数据对应的相关系数,xi是第i个维度的影响数据,b0是截距值对应的截距常数项。
S307,通过初始模型,根据样本业务场景的样本影响数据,确定样本业务场景的预测权重。
可选地,将样本业务场景的样本影响数据输入至初始模型中,计算每一样本影响数据与该样本影响数据对应相关系数之间的乘积,并计算所有乘积的和值,再将该和值与截距值进行求和,并将最终求和结果作为样本影响数据对应的样本业务场景的预测权重。
示例性的,多元线性回归模型的计算公式如上述公式(1-1)所示,将i个维度的样本影响数据作为xi的值输入到该多元线性回归模型中,计算各维度的样本影响数据与该维度对应相关系数之间的乘积,并将该乘积结果与截距值对应的截距常数项,以及误差值对应的误差常数项进行求和,得到y’代表的预测权重。
S308,将样本业务场景的预测权重和权重标签的平均差值,作为多元线性回归模型中的误差值。
可选地,根据预测得到的样本业务场景的预测权重,与该预测权重对应权重标签的权重值,计算所有预测权重对应的均值,并将该均值作为预测均值,计算所有权重值对应的均值,并将该均值作为真实均值,将预测均值与真实均值进行相减处理,并将该相减结果作为平均差值,最终将该差值作为多元线性回归模型中的误差值。
S309,根据误差值,对初始模型进行更新,得到多元线性回归模型。
可选地,基于构建完成的初始模型,将误差值作为一个常数值以加法的形式添加到该初始模型中,完成对初始模型进行更新,得到多元线性回归模型。
上述构建多元线性回归模型方法,通过样本影响数据和权重标签确定出相关系数和截距值,并基于该相关系数和截距值构建初始模型,再次根据样本影响数据,通过初始模型进行计算,最终得到多元线性回归模型中的误差值,在得到多元线性回归模型的各网络参数后构建多元线性回归模型,使得构建出的多元线性回归模型的准确性和合理性更高。
图4为一个实施例中验证多元线性回归模型的流程示意图。为保证构建完成的多元线性回归模型的准确性,应当对多元线性回归模型进行验证,以保证通过多元线性回归模型得到的预测权重的准确性,因此,本实施例给出了一种验证多元线性回归模型的可选方式,包括如下步骤:
S401,获取历史时段内的测试业务场景的测试影响数据,以及测试业务场景的权重标签;
其中,测试业务场景可以是用于对多元线性回归模型进行测试时所用的业务场景。需要说明的是,为保证对多元线性回归模型的性能进行充分验证,该该测试业务场景的种类需要尽可能的涵盖各种类的待评分业务场景。
其中,测试影响数据可以是用于对多元线性回归模型进行测试时所输入的数据。需要说明的是,由于测试影响数据主要应用于对多元线性回归模型的性能进行验证,因此该测试影响数据的维度应尽可能的涵盖各种不同维度的影响数据。
可选地,从本地设备中直接获取历史时段内的测试业务场景的测试影响数据,并基于人工确定该测试业务场景中历史时段内每一历史子时段对应的权重值,并将每一历史子时段对应的权重值以标签的形式添加到该测试业务场景上。
S402,基于R2评估指标,根据测试业务场景的测试影响数据,以及测试业务场景的权重标签,对多元线性回归模型的网络参数进行准确性验证。
其中,R2评估指标可以是用于评估多元线性回归模型准确度的指标,该R2评估指标的值越趋近于1,证明该多元线性回归模型的准确性越高。可选地,该R2评估指标可以是确定系数(R-square,R2)。
可选地,通过多元线性回归模型,根据测试业务场景的测试影响数据,确定测试业务场景的预测权值;根据测试业务场景的权重标签,确定测试业务场景的平均权重;将测试业务场景的第一误差平方值和第二误差平方值的比值,作为多元线性回归模型的R2评估指标的指标值;若R2评估指标的指标值大于指标阈值,则确定对多元线性回归模型的网络参数进行准确性验证通过。
其中,第一误差平方值为预测权值与测试业务场景的权重标签之间的误差平方值;第二误差平方值为预测权值与平均权重之间的误差平方值。
具体的,将测试业务场景的测试影响数据输入至多元线性回归模型中,该多元线性回归模型对测试影响数据进行计算,得到测试业务场景的预测权值,同时,根据该测试业务场景的权重标签中记录的所有权重值进行均值计算,并将得到的均值计算结果作为测试业务场景的平均权重;计算同一历史子时段对应的预测权值与测试业务场景的权重标签之间第一差值,并对该第一差值进行平方计算,得到第一平方值,然后求得所有历史子时段对应的第一平方值的和作为第一和值,并将该第一和值作为第一误差平方值;计算同一历史子时段对应的预测权值与平均权重之间第二差值,并对该第二差值进行平方计算,得到第二平方值,然后求得所有历史子时段对应的第二平方值的和作为第二和值,并将该第二和值作为第二误差平方值;计算第一误差平方值和第二误差平方值的商值,并计算常数1与该商值之间的差值,并将该差值作为多元线性回归模型的R2评估指标的指标值;若R2评估指标的指标值大于指标阈值(如0.8),则证明该多元线性回归模型的准确性满足用户需求,因此,确定多元线性回归模型网络参数的准确性验证通过。
示例性的,R2评估指标的计算公式如下(1-4)所示:
其中,R2为R2评估指标,yi为测试业务场景中第i个历史子时段对应的预测权值,为权重标签中第i个历史子时段对应的权重值,/>为测试业务场景中权重标签对应的权重平均值。
上述验证多元线性回归模型,根据测试业务场景的测试影响数据,以及测试业务场景的权重标签,通过R2评估指标确定该多元线性回归模型的网络参数的准确性,能够确定多元线性回归模型的网络参数的准确性,以保证在实际应用中的多元线性回归模型能够准确得到预测权重,为后续通过预测权重得到最终评分提供保障。
在一个实施例中,本实施例给出了一种业务场景评分的可选方式,以该方法应用于服务器为例进行说明。如图5所示,该方法包括如下步骤:
S501,获取历史时段内的样本业务场景的样本影响数据,以及样本业务场景的权重标签。
S502,确定样本业务场景的样本影响数据与样本业务场景的权重标签之间的协方差。
S503,确定样本业务场景的样本影响数据和权重标签的标准差乘积。
S504,将协方差在标准差乘积中的占比,作为多元线性回归模型中目标影响数据的相关系数。
S505,将样本影响数据为空的样本业务场景的权重标签的数值,作为多元线性回归模型中的截距值。
S506,以目标影响数据的相关系数和截距值为网络参数,构建初始模型。
S507,通过初始模型,根据样本业务场景的样本影响数据,确定样本业务场景的预测权重。
S508,将样本业务场景的预测权重和权重标签的平均差值,作为多元线性回归模型中的误差值。
S509,根据误差值,对初始模型进行更新,得到多元线性回归模型。
S510,获取历史时段内的测试业务场景的测试影响数据,以及测试业务场景的权重标签。
S511,通过多元线性回归模型,根据测试业务场景的测试影响数据,确定测试业务场景的预测权值。
S512,根据测试业务场景的权重标签,确定测试业务场景的平均权重。
S513,将测试业务场景的第一误差平方值和第二误差平方值的比值,作为多元线性回归模型的R2评估指标的指标值。
其中,第一误差平方值为预测权值与测试业务场景的权重标签之间的误差平方值;第二误差平方值为预测权值与平均权重之间的误差平方值。
S514,若R2评估指标的指标值大于指标阈值,则确定对多元线性回归模型的网络参数进行准确性验证通过。
S515,获取当前时段内的待评分业务场景的原始影响数据。
S516,对原始影响数据进行标准化和/或去重化处理,得到预处理影响数据。
S517,从预处理影响数据中剔除不满足影响阈值的预处理影响数据,得到当前时段内待评分业务场景的目标影响数据。
S518,,通过多元线性回归模型,根据目标影响数据,确定待评分业务场景的预测权重。
其中,多元线性回归模型的网络参数包括截距值、误差值,以及目标影响数据的相关系数。
S519若待评分业务场景的目标影响数据为至少两个维度的数据,则根据各维度的目标影响数据所落入的数据区间对应的区间分数值,确定各维度的目标影响数据对应的数据子分数值。
S520,对各维度的目标影响数据对应的数据子分数值进行融合,得到各维度的目标影响数据对应的数据总分数值。
S521,基于待评分业务场景的预测权值,对数据总分数值进行加权处理,得到待评分业务场景的最终评分。
需要说明的是,本实施例中步骤S501-S509是构建多元线性回归模型的过程,步骤S510-S514是对构建完成的多元线性回归模型进行验证的过程,步骤S515-S521是基于多元线性回归模型对影响数据进行计算,得到待评分业务场景的最终评分的过程。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的业务场景评分方法的业务场景评分装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个业务场景评分装置实施例中的具体限定可以参见上文中对于业务场景评分方法的限定,在此不再赘述。
在一个实施例中,如图6所示,提供了一种业务场景评分装置1,包括:数据获取模块10、权重确定模块11和评分确定模块12,其中:
数据获取模块10,用于获取当前时段内待评分业务场景的目标影响数据。
权重确定模块11,用于通过多元线性回归模型,根据目标影响数据,确定待评分业务场景的预测权重。其中,多元线性回归模型的网络参数包括截距值、误差值,以及目标影响数据的相关系数。
评分确定模块12,用于根据待评分业务场景的目标影响数据和预测权重,确定待评分业务场景的最终评分。
在一个实施例中,如图7所示,图6中的数据获取模块10,包括:
数据获取单元100,用于获取当前时段内的待评分业务场景的原始影响数据。
数据处理单元101,用于对原始影响数据进行标准化和/或去重化处理,得到预处理影响数据。
数据剔除单元102,用于从预处理影响数据中剔除不满足影响阈值的预处理影响数据,得到当前时段内待评分业务场景的目标影响数据。
在一个实施例中,如图8所示,图6中的评分确定模块12,包括:
子分确定单元120,用于若待评分业务场景的目标影响数据为至少两个维度的数据,则根据各维度的目标影响数据所落入的数据区间对应的区间分数值,确定各维度的目标影响数据对应的数据子分数值。
总分确定单元121,用于对各维度的目标影响数据对应的数据子分数值进行融合,得到各维度的目标影响数据对应的数据总分数值。
评分确定单元122,用于基于待评分业务场景的预测权值,对数据总分数值进行加权处理,得到待评分业务场景的最终评分。
在一个实施例中,图6中的业务场景评分装置1,包括:
历史数据获取模块,用于获取历史时段内的样本业务场景的样本影响数据,以及样本业务场景的权重标签。
协方差确定模块,用于确定样本业务场景的样本影响数据与样本业务场景的权重标签之间的协方差。
乘积确定模块,用于确定样本业务场景的样本影响数据和权重标签的标准差乘积。
系数确定模块,用于将协方差在标准差乘积中的占比,作为多元线性回归模型中目标影响数据的相关系数。
在一个实施例中,图6中的业务场景评分装置1,包括:
截距值获取模块,用于将样本影响数据为空的样本业务场景的权重标签的数值,作为多元线性回归模型中的截距值。
在一个实施例中,图6中的业务场景评分装置1,包括:
初始模型构建模块,用于以目标影响数据的相关系数和截距值为网络参数,构建初始模型。
权重确定模块,用于通过初始模型,根据样本业务场景的样本影响数据,确定样本业务场景的预测权重。
误差值确定模块,用于将样本业务场景的预测权重和权重标签的平均差值,作为多元线性回归模型中的误差值。
在一个实施例中,图6中的业务场景评分装置1,包括:
测试数据获取模块,用于获取历史时段内的测试业务场景的测试影响数据,以及测试业务场景的权重标签。
模型验证模块,用于基于R2评估指标,根据测试业务场景的测试影响数据,以及测试业务场景的权重标签,对多元线性回归模型的网络参数进行准确性验证。
在一个实施例中,图6中的模型验证模块22,包括:
权重预测单元,用于通过多元线性回归模型,根据测试业务场景的测试影响数据,确定测试业务场景的预测权值。
平均权重确定单元,用于根据测试业务场景的权重标签,确定测试业务场景的平均权重。
指标值确定单元,用于将测试业务场景的第一误差平方值和第二误差平方值的比值,作为多元线性回归模型的R2评估指标的指标值。其中,第一误差平方值为预测权值与测试业务场景的权重标签之间的误差平方值。第二误差平方值为预测权值与平均权重之间的误差平方值。
验证单元,用于若R2评估指标的指标值大于指标阈值,则确定对多元线性回归模型的网络参数进行准确性验证通过。
上述业务场景评分装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图9所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、移动蜂窝网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种业务场景评分方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图9中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
获取当前时段内待评分业务场景的目标影响数据;
通过多元线性回归模型,根据目标影响数据,确定待评分业务场景的预测权重;其中,多元线性回归模型的网络参数包括截距值、误差值,以及目标影响数据的相关系数;
根据待评分业务场景的目标影响数据和预测权重,确定待评分业务场景的最终评分。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
获取当前时段内的待评分业务场景的原始影响数据;
对原始影响数据进行标准化和/或去重化处理,得到预处理影响数据;
从预处理影响数据中剔除不满足影响阈值的预处理影响数据,得到当前时段内待评分业务场景的目标影响数据。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
若待评分业务场景的目标影响数据为至少两个维度的数据,则根据各维度的目标影响数据所落入的数据区间对应的区间分数值,确定各维度的目标影响数据对应的数据子分数值;
对各维度的目标影响数据对应的数据子分数值进行融合,得到各维度的目标影响数据对应的数据总分数值;
基于待评分业务场景的预测权值,对数据总分数值进行加权处理,得到待评分业务场景的最终评分。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
获取历史时段内的样本业务场景的样本影响数据,以及样本业务场景的权重标签;
确定样本业务场景的样本影响数据与样本业务场景的权重标签之间的协方差;
确定样本业务场景的样本影响数据和权重标签的标准差乘积;
将协方差在标准差乘积中的占比,作为多元线性回归模型中目标影响数据的相关系数。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
将样本影响数据为空的样本业务场景的权重标签的数值,作为多元线性回归模型中的截距值。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
以目标影响数据的相关系数和截距值为网络参数,构建初始模型;
通过初始模型,根据样本业务场景的样本影响数据,确定样本业务场景的预测权重;
将样本业务场景的预测权重和权重标签的平均差值,作为多元线性回归模型中的误差值。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
获取历史时段内的测试业务场景的测试影响数据,以及测试业务场景的权重标签;
基于R2评估指标,根据测试业务场景的测试影响数据,以及测试业务场景的权重标签,对多元线性回归模型的网络参数进行准确性验证。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
通过多元线性回归模型,根据测试业务场景的测试影响数据,确定测试业务场景的预测权值;
根据测试业务场景的权重标签,确定测试业务场景的平均权重;
将测试业务场景的第一误差平方值和第二误差平方值的比值,作为多元线性回归模型的R2评估指标的指标值;其中,第一误差平方值为预测权值与测试业务场景的权重标签之间的误差平方值;第二误差平方值为预测权值与平均权重之间的误差平方值;
若R2评估指标的指标值大于指标阈值,则确定对多元线性回归模型的网络参数进行准确性验证通过。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取当前时段内待评分业务场景的目标影响数据;
通过多元线性回归模型,根据目标影响数据,确定待评分业务场景的预测权重;其中,多元线性回归模型的网络参数包括截距值、误差值,以及目标影响数据的相关系数;
根据待评分业务场景的目标影响数据和预测权重,确定待评分业务场景的最终评分。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
获取当前时段内的待评分业务场景的原始影响数据;
对原始影响数据进行标准化和/或去重化处理,得到预处理影响数据;
从预处理影响数据中剔除不满足影响阈值的预处理影响数据,得到当前时段内待评分业务场景的目标影响数据。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
若待评分业务场景的目标影响数据为至少两个维度的数据,则根据各维度的目标影响数据所落入的数据区间对应的区间分数值,确定各维度的目标影响数据对应的数据子分数值;
对各维度的目标影响数据对应的数据子分数值进行融合,得到各维度的目标影响数据对应的数据总分数值;
基于待评分业务场景的预测权值,对数据总分数值进行加权处理,得到待评分业务场景的最终评分。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
获取历史时段内的样本业务场景的样本影响数据,以及样本业务场景的权重标签;
确定样本业务场景的样本影响数据与样本业务场景的权重标签之间的协方差;
确定样本业务场景的样本影响数据和权重标签的标准差乘积;
将协方差在标准差乘积中的占比,作为多元线性回归模型中目标影响数据的相关系数。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
将样本影响数据为空的样本业务场景的权重标签的数值,作为多元线性回归模型中的截距值。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
以目标影响数据的相关系数和截距值为网络参数,构建初始模型;
通过初始模型,根据样本业务场景的样本影响数据,确定样本业务场景的预测权重;
将样本业务场景的预测权重和权重标签的平均差值,作为多元线性回归模型中的误差值。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
获取历史时段内的测试业务场景的测试影响数据,以及测试业务场景的权重标签;
基于R2评估指标,根据测试业务场景的测试影响数据,以及测试业务场景的权重标签,对多元线性回归模型的网络参数进行准确性验证。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
通过多元线性回归模型,根据测试业务场景的测试影响数据,确定测试业务场景的预测权值;
根据测试业务场景的权重标签,确定测试业务场景的平均权重;
将测试业务场景的第一误差平方值和第二误差平方值的比值,作为多元线性回归模型的R2评估指标的指标值;其中,第一误差平方值为预测权值与测试业务场景的权重标签之间的误差平方值;第二误差平方值为预测权值与平均权重之间的误差平方值;
若R2评估指标的指标值大于指标阈值,则确定对多元线性回归模型的网络参数进行准确性验证通过。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
获取当前时段内待评分业务场景的目标影响数据;
通过多元线性回归模型,根据目标影响数据,确定待评分业务场景的预测权重;其中,多元线性回归模型的网络参数包括截距值、误差值,以及目标影响数据的相关系数;
根据待评分业务场景的目标影响数据和预测权重,确定待评分业务场景的最终评分。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
获取当前时段内的待评分业务场景的原始影响数据;
对原始影响数据进行标准化和/或去重化处理,得到预处理影响数据;
从预处理影响数据中剔除不满足影响阈值的预处理影响数据,得到当前时段内待评分业务场景的目标影响数据。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
若待评分业务场景的目标影响数据为至少两个维度的数据,则根据各维度的目标影响数据所落入的数据区间对应的区间分数值,确定各维度的目标影响数据对应的数据子分数值;
对各维度的目标影响数据对应的数据子分数值进行融合,得到各维度的目标影响数据对应的数据总分数值;
基于待评分业务场景的预测权值,对数据总分数值进行加权处理,得到待评分业务场景的最终评分。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
获取历史时段内的样本业务场景的样本影响数据,以及样本业务场景的权重标签;
确定样本业务场景的样本影响数据与样本业务场景的权重标签之间的协方差;
确定样本业务场景的样本影响数据和权重标签的标准差乘积;
将协方差在标准差乘积中的占比,作为多元线性回归模型中目标影响数据的相关系数。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
将样本影响数据为空的样本业务场景的权重标签的数值,作为多元线性回归模型中的截距值。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
以目标影响数据的相关系数和截距值为网络参数,构建初始模型;
通过初始模型,根据样本业务场景的样本影响数据,确定样本业务场景的预测权重;
将样本业务场景的预测权重和权重标签的平均差值,作为多元线性回归模型中的误差值。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
获取历史时段内的测试业务场景的测试影响数据,以及测试业务场景的权重标签;
基于R2评估指标,根据测试业务场景的测试影响数据,以及测试业务场景的权重标签,对多元线性回归模型的网络参数进行准确性验证。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
通过多元线性回归模型,根据测试业务场景的测试影响数据,确定测试业务场景的预测权值;
根据测试业务场景的权重标签,确定测试业务场景的平均权重;
将测试业务场景的第一误差平方值和第二误差平方值的比值,作为多元线性回归模型的R2评估指标的指标值;其中,第一误差平方值为预测权值与测试业务场景的权重标签之间的误差平方值;第二误差平方值为预测权值与平均权重之间的误差平方值;
若R2评估指标的指标值大于指标阈值,则确定对多元线性回归模型的网络参数进行准确性验证通过。
需要说明的是,本申请所涉及的数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。
Claims (12)
1.一种业务场景评分方法,其特征在于,所述方法包括:
获取当前时段内待评分业务场景的目标影响数据;
通过多元线性回归模型,根据所述目标影响数据,确定所述待评分业务场景的预测权重;其中,所述多元线性回归模型的网络参数包括截距值、误差值,以及所述目标影响数据的相关系数;
根据所述待评分业务场景的目标影响数据和所述预测权重,确定所述待评分业务场景的最终评分。
2.根据权利要求1所述的方法,其特征在于,所述获取当前时段内待评分业务场景的目标影响数据,包括:
获取当前时段内的待评分业务场景的原始影响数据;
对所述原始影响数据进行标准化和/或去重化处理,得到预处理影响数据;
从所述预处理影响数据中剔除不满足影响阈值的预处理影响数据,得到当前时段内待评分业务场景的目标影响数据。
3.根据权利要求1所述的方法,其特征在于,所述根据所述待评分业务场景的目标影响数据和所述预测权重,确定所述待评分业务场景的最终评分,包括:
若所述待评分业务场景的目标影响数据为至少两个维度的数据,则根据各维度的目标影响数据所落入的数据区间对应的区间分数值,确定所述各维度的目标影响数据对应的数据子分数值;
对各维度的目标影响数据对应的数据子分数值进行融合,得到各维度的目标影响数据对应的数据总分数值;
基于所述待评分业务场景的预测权值,对所述数据总分数值进行加权处理,得到所述待评分业务场景的最终评分。
4.根据权利要求1-3中任意一项所述的方法,其特征在于,所述多元线性回归模型中目标影响数据的相关系数的确定方式,包括:
获取历史时段内的样本业务场景的样本影响数据,以及所述样本业务场景的权重标签;
确定所述样本业务场景的样本影响数据与所述样本业务场景的权重标签之间的协方差;
确定所述样本业务场景的样本影响数据和权重标签的标准差乘积;
将所述协方差在所述标准差乘积中的占比,作为所述多元线性回归模型中目标影响数据的相关系数。
5.根据权利要求4所述的方法,其特征在于,所述多元线性回归模型中截距值的确定方式,包括:
将样本影响数据为空的样本业务场景的权重标签的数值,作为所述多元线性回归模型中的截距值。
6.根据权利要求5所述的方法,其特征在于,所述多元线性回归模型中误差值的确定方式,包括:
以所述目标影响数据的相关系数和所述截距值为网络参数,构建初始模型;
通过所述初始模型,根据所述样本业务场景的样本影响数据,确定所述样本业务场景的预测权重;
将所述样本业务场景的预测权重和所述权重标签的平均差值,作为所述多元线性回归模型中的误差值。
7.根据权利要求6所述的方法,其特征在于,确定多元线性回归模型的网络参数之后,还包括:
获取历史时段内的测试业务场景的测试影响数据,以及所述测试业务场景的权重标签;
基于R2评估指标,根据测试业务场景的测试影响数据,以及所述测试业务场景的权重标签,对所述多元线性回归模型的网络参数进行准确性验证。
8.根据权利要求7所述的方法,其特征在于,基于R2评估指标,根据测试业务场景的测试影响数据,以及所述测试业务场景的权重标签,对所述多元线性回归模型的网络参数进行准确性验证,包括:
通过所述多元线性回归模型,根据测试业务场景的测试影响数据,确定所述测试业务场景的预测权值;
根据所述测试业务场景的权重标签,确定所述测试业务场景的平均权重;
将所述测试业务场景的第一误差平方值和第二误差平方值的比值,作为所述多元线性回归模型的R2评估指标的指标值;其中,所述第一误差平方值为所述预测权值与所述测试业务场景的权重标签之间的误差平方值;所述第二误差平方值为所述预测权值与所述平均权重之间的误差平方值;
若所述R2评估指标的指标值大于指标阈值,则确定对所述多元线性回归模型的网络参数进行准确性验证通过。
9.一种业务场景评分装置,其特征在于,所述装置包括:
数据获取模块,用于获取当前时段内待评分业务场景的目标影响数据;
权重确定模块,用于通过多元线性回归模型,根据所述目标影响数据,确定所述待评分业务场景的预测权重;其中,所述多元线性回归模型的网络参数包括截距值、误差值,以及所述目标影响数据的相关系数;
评分确定模块,用于根据所述待评分业务场景的目标影响数据和所述预测权重,确定所述待评分业务场景的最终评分。
10.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至8中任一项所述的方法的步骤。
11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8中任一项所述的方法的步骤。
12.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至8中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310665215.4A CN116703216A (zh) | 2023-06-06 | 2023-06-06 | 业务场景评分方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310665215.4A CN116703216A (zh) | 2023-06-06 | 2023-06-06 | 业务场景评分方法、装置、计算机设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116703216A true CN116703216A (zh) | 2023-09-05 |
Family
ID=87840400
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310665215.4A Pending CN116703216A (zh) | 2023-06-06 | 2023-06-06 | 业务场景评分方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116703216A (zh) |
-
2023
- 2023-06-06 CN CN202310665215.4A patent/CN116703216A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Grantham et al. | Diminishing return on investment for biodiversity data in conservation planning | |
Guo et al. | ModEco: an integrated software package for ecological niche modeling | |
Cang | A comparative analysis of three types of tourism demand forecasting models: Individual, linear combination and non‐linear combination | |
Wooldridge et al. | Altmetric scores: An early indicator of research impact | |
Callejón et al. | A System of Insolvency Prediction for industrial companies using a financial alternative model with neural networks | |
Duan | Clustered defaults | |
Hossain et al. | Shrinkage and penalty estimators of a Poisson regression model | |
Kim | Spatiotemporal scale dependency and other sensitivities in dynamic land-use change simulations | |
CN115564152A (zh) | 基于stirpat模型的碳排放量预测方法及装置 | |
Chao | Estimating project overheads rate in bidding: DSS approach using neural networks | |
Calabrese | Optimal cut-off for rare events and unbalanced misclassification costs | |
CN108764553B (zh) | 用户规模预测方法、装置及计算机设备 | |
Lee et al. | An entropy decision model for selection of enterprise resource planning system | |
CN112257958A (zh) | 一种电力饱和负荷预测方法及装置 | |
Dong et al. | Time to delisted status for listed firms in Chinese stock markets: An analysis using a mixture cure model with time-varying covariates | |
Berteloot et al. | A novel credit rating migration modeling approach using macroeconomic indicators | |
CN114363004B (zh) | 风险评估方法、装置、计算机设备和存储介质 | |
CN116703216A (zh) | 业务场景评分方法、装置、计算机设备和存储介质 | |
CN115130887A (zh) | 水库大坝环境影响评价方法和装置、电子设备和存储介质 | |
CN112581250B (zh) | 模型生成方法、装置、计算机设备和存储介质 | |
CN114170000A (zh) | 信用卡用户风险类别识别方法、装置、计算机设备和介质 | |
Anfuso et al. | A sound basel iii compliant framework for backtesting credit exposure models | |
Lee | Reduced the risk in agriculture management for government using support vector regression with dynamic optimization parameters | |
De Virgilis et al. | Estimation of Individual Claim Liabilities | |
Lum et al. | The effects of data mining techniques on software cost estimation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |