CN112308704A - 数据评估方法、装置、电子设备及存储介质 - Google Patents

数据评估方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN112308704A
CN112308704A CN202011207642.0A CN202011207642A CN112308704A CN 112308704 A CN112308704 A CN 112308704A CN 202011207642 A CN202011207642 A CN 202011207642A CN 112308704 A CN112308704 A CN 112308704A
Authority
CN
China
Prior art keywords
index
evaluation
index value
variable
test sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011207642.0A
Other languages
English (en)
Inventor
邓婕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Huantai Digital Technology Co ltd
Original Assignee
Guangdong Oppo Mobile Telecommunications Corp Ltd
Shenzhen Huantai Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Oppo Mobile Telecommunications Corp Ltd, Shenzhen Huantai Technology Co Ltd filed Critical Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority to CN202011207642.0A priority Critical patent/CN112308704A/zh
Publication of CN112308704A publication Critical patent/CN112308704A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Physics & Mathematics (AREA)
  • Finance (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Marketing (AREA)
  • Educational Administration (AREA)
  • Technology Law (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种数据评估方法、装置、电子设备及存储介质。该数据评估方法包括获取变量测试样本的各指标的第一评估指标值,确定各所述第一评估指标值对应的指标评分;确定各所述指标对应的第一权重,并基于各所述第一权重以及各所述指标评分计算所述变量测试样本的综合评分;基于所述综合评分对所述变量测试样本对应的变量数据进行评估。本方案实现了选取指标对多维度的评估指标进行量化,并通过对多个评估指标进行赋权,来对变量数据给出综合评分,提供了一种统一的评估思路,具有统一的评估标准,在对多家外部数据同时评估时评分也更为公平。

Description

数据评估方法、装置、电子设备及存储介质
技术领域
本申请涉及数据评估领域,具体而言,涉及一种数据评估方法、装置、电子设备及存储介质。
背景技术
信贷机构评估客户的风险往往需要客户多头借贷、消费支付、收入负债、手机行为等多个维度的数据,但实际情况是,其自有数据往往只能覆盖其中的几个部分,不能满足风控需求,因此会通过第三方平台接入更丰富的数据源以获得更多关于客户的信息,从而对客户风险进行更精准的识别。然而,现有评估方案从某几个维度分别评估,具有较强的主观性,在多家数据源需要进行同等对比的情况下,评估标准不一,使得评估结果不够准确。
发明内容
为了解决上述问题,本申请实施例提供了一种数据评估方法、装置、电子设备及存储介质。
第一方面,本申请实施例提供了一种数据评估方法,所述方法包括:
获取变量测试样本的各指标的第一评估指标值,确定各所述第一评估指标值对应的指标评分;
确定各所述指标对应的第一权重,并基于各所述第一权重以及各所述指标评分计算所述变量测试样本的综合评分;
基于所述综合评分对所述变量测试样本对应的变量数据进行评估。
第二方面,本申请实施例提供了一种数据评估装置,所述装置包括:
获取模块,用于获取变量测试样本的各指标的第一评估指标值,确定各所述第一评估指标值对应的指标评分;
确定模块,用于确定各所述指标对应的第一权重,并基于各所述第一权重以及各所述指标评分计算所述变量测试样本的综合评分;
评估模块,用于基于所述综合评分对所述变量测试样本对应的变量数据进行评估。
第三方面,本申请实施例提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面或第一方面的任意一种可能的实现方式提供的方法的步骤。
第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面或第一方面的任意一种可能的实现方式提供的方法。
在本申请一个或多个实施例中,从变量数据中选取一段数据作为变量测试样本,获取变量测试样本的各个评估指标(如覆盖度、有效性、分布稳定性、效果稳定性、排序性等)的第一评估指标值,并将第一评估指标值转化成更加便于进行评估的指标评分,基于各指标的第一权重对各指标评分进行计算便可得到变量测试样本的综合评分,进而基于综合评分对变量数据进行评估。以此实现了选取指标对多维度的评估指标进行量化,并通过对多个评估指标进行赋权,来对变量数据给出综合评分,提供了一种统一的评估思路,具有统一的评估标准,在对多家外部数据同时评估时评分也更为公平。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例中所需使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种数据评估方法的流程示意图;
图2a为本申请实施例提供的排序性良好时的ROC曲线分布的举例示意图;
图2b为本申请实施例提供的排序性波动时的ROC曲线分布的举例示意图;
图3为本申请实施例提供的又一种数据评估方法的流程示意图;
图4为本申请实施例提供的各指标的第一评估指标值计算表格的举例示意图;
图5为本申请实施例提供的各指标的指标评分计算表格的举例示意图;
图6为本申请实施例提供的又一种数据评估方法的流程示意图;
图7为本申请实施例提供的判断矩阵的矩阵结构的举例示意图;
图8为本申请实施例提供的一种数据评估装置的结构示意图;
图9为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。
在下述介绍中,术语“第一”、“第二”仅为用于描述的目的,而不能理解为指示或暗示相对重要性。下述介绍提供了本申请的多个实施例,不同实施例之间可以替换或者合并组合,因此本申请也可认为包含所记载的相同和/或不同实施例的所有可能组合。因而,如果一个实施例包含特征A、B、C,另一个实施例包含特征B、D,那么本申请也应视为包括含有A、B、C、D的一个或多个所有其他可能的组合的实施例,尽管该实施例可能并未在以下内容中有明确的文字记载。
下面的描述提供了示例,并且不对权利要求书中阐述的范围、适用性或示例进行限制。可以在不脱离本申请内容的范围的情况下,对描述的元素的功能和布置做出改变。各个示例可以适当省略、替代或添加各种过程或组件。例如所描述的方法可以以所描述的顺序不同的顺序来执行,并且可以添加、省略或组合各种步骤。此外,可以将关于一些示例描述的特征组合到其他示例中。
服务器用于负责对变量测试样本赋值、计算等处理工作,服务器可以是提供各种服务的服务器,可以但不限于是硬件服务器、虚拟服务器、云服务器等。具体的,服务器可以是硬件也可以是软件。
可能地,当服务器为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。
可能地,当服务器为软件时,可以实现成多个软件或软件模块,也可以实现成单个软件或软件模块,在此不做具体限定。
参见图1,图1是本申请实施例提供的一种数据评估方法的流程示意图。本实施例主要强调对变量测试样本进行综合评分的过程。在本申请实施例中,所述方法包括:
S101、获取变量测试样本的各指标的第一评估指标值,确定各所述第一评估指标值对应的指标评分。
所述变量测试样本在本申请实施例中可以理解为从需要进行评估的变量类外部数据中选取的用以进行数据评估的样本数据。
所述指标是说明总体综合数量特征的概念,它体现了事物质的规定性和量的规定性两个方面的特点。所述指标在本申请实施例中可以理解为覆盖度、有效性、分布稳定性、效果稳定性、排序性几个方面的指标。
具体的,覆盖度指外部数据覆盖的客群应与本机构的客群有较高的重叠度,其可以用查得率来评估,查得率=匹配到的样本数/总查询样本数。
具体的,有效性指变量数据应该有较强的区分好坏客户的能力,其可以用信息值(Information Value,IV)来评估:
Figure BDA0002757630680000041
其中pyi为第i组坏样本占所有坏样本的比例,pni为第i组好样本占所有好样本的比例。IV越大说明变量的价值越高,对好坏样本的区分能力越强,一般认为IV在0.1以上的变量具有较强的预测性,在0.02以下的变量基本没有效果。
具体的,分布稳定性指变量数据应该在不同样本上有较稳定的分布,可以用群体稳定性指标(Population Stability Index,PSI)来评估:
Figure BDA0002757630680000042
其中选取基准样本(A),按某种分段标准确定分段点(一般为等频分段),在评估样本(B)上按照分段点对样本进行切分,Bi为评估样本上第i组样本占总样本的比例,Ai为为基准样本上第i组样本占总样本的比例。PSI越小,变量在评估样本上的分布和基准样本上越接近,变量分布越稳定,一般认为PSI在0.05以下的变量是稳定的,在0.2以上的变量不稳定。
具体的,效果稳定性指考虑到互金市场的波动性,变量需要在不同时间窗口有较稳定的信息值,变异系数(Coefficient of Variation,CV)可以用来衡量数据的波动水平:
Figure BDA0002757630680000043
其中SD为信息值IV在各时间窗口的标准偏差,Mean为信息值IV在各时间窗口的平均值,变异系数可以消除量纲的影响,变异系数越小,波动越小,稳定性越好。
具体的,排序性指有序变量在各分段对坏样本的识别程度应具有排序性,ROC曲线可以用来反映这种排序性。将样本按变量取值排序,从大到小设定分类阈值,计算各阈值下预测的正类中实际坏样本占所有坏样本的比例和实际好样本占所有好好样本的比例,绘制成点并连接成曲线,各点对应累计区间的变量识别效果,如果排序性良好,ROC曲线会在对角线上方(如图2a所示),如果排序性出现波动,则会在中间出现交叉(如图2b所示)。ROC曲线下方面积AUC可以用来量化排序性指标。
所述第一评估指标值在本申请实施例中可以理解为各指标基于对应的评估公式所得到的评估指标值。
所述指标评分在本申请实施例中可以理解为将第一评估指标值转换的处于0到100之间的评分数值。
在本申请实施例中,服务器在选取了变量测试样本后,将获取变量测试样本的各指标的第一评估标准值,即每一个指标都有一个对应的第一评估标准值,并将各第一评估指标值转换成处于0到100区间的指标评分,以此便于清晰直观的看出每个指标的优劣。
S102、确定各所述指标对应的第一权重,并基于各所述第一权重以及各所述指标评分计算所述变量测试样本的综合评分。
所述权重指某一因素或指标相对于某一事物的重要程度,其不同于一般的比重,体现的不仅仅是某一因素或指标所占的百分比,强调的是因素或指标的相对重要程度,倾向于贡献度或重要性。所述第一权重在本申请实施例中可以理解为各指标相对于变量测试样本的重要程度。
所述综合评分在本申请实施例中可以理解为综合各指标的指标评分所得到的变量测试样本的综合分数。
在本申请实施例中,服务器在得到各指标的指标评分后,由于对于变量测试样本而言,各指标的重要性是不同的,因此服务器将根据各指标的重要成都确定各指标对应的第一权重,并基于第一权重和指标评分计算出变量测试样本最终的综合评分。
S103、基于所述综合评分对所述变量测试样本对应的变量数据进行评估。
所述变量数据在本申请实施例中可以理解为包含有变量测试样本的变量类外部数据。
在本申请实施例中,由于变量数据的数据量可能非常庞大,对变量数据的全部数据进行评估较为困难,因而选取变量数据中的变量测试样本来进行综合评分的评估,基于最终所得到的变量测试样本的综合评分便可评估出变量数据的优劣。
可能的,上述方法可以应用于建模过程中的变量数据筛选,还可以应用于其他场景下的变量数据效果评估,本申请实施例对此不作限定。
通过上述步骤,服务器从变量数据中选取一段数据作为变量测试样本,获取变量测试样本的各个评估指标(如覆盖度、有效性、分布稳定性、效果稳定性、排序性等)的第一评估指标值,并将第一评估指标值转化成更加便于进行评估的指标评分,基于各指标的第一权重对各指标评分进行计算便可得到变量测试样本的综合评分,进而基于综合评分对变量数据进行评估。以此实现了选取指标对多维度的评估指标进行量化,并通过对多个评估指标进行赋权,来对变量数据给出综合评分,提供了一种统一的评估思路,具有统一的评估标准,在对多家外部数据同时评估时评分也更为公平。
参见图3,图3是本申请实施例的又一种数据评估方法的流程示意图。本实施例主要强调对变量测试样本按时间段划分的过程。如图3所示,所述方法包括:
S301、获取变量测试样本并根据预设的时间段划分所述变量测试样本,得到至少一个变量分段样本。
所述变量分段样本在本申请实施例可以理解为根据时间段将变量测试样本划分成若干份后所得到的分段数据。
在本申请实施例中,由于互金市场客群变动较快,自身策略调整或市场环境变动都有可能造成样本的偏移,为避免客群波动对测试效果造成的偏差,本申请将变量测试样本按照预设的时间段进行划分,得到变量分段样本,以此评估变量在各时间段上的表现。
具体的,预设的时间段的划分标准可以是按照自然月进行划分,也可以是按照自身策略调整或市场环境变动时点进行划分。一般可以按照时间段将变量测试样本划分为3-5段。
S302、基于客群匹配程度生成各所述变量分段样本对应的第二权重。
所述客群匹配程度在本申请实施例可以理解为与变量测试样本所对应的消费者群体的匹配程度。
在本申请实施例中,将变量测试样本划分为变量分段样本后,可以将与当前或未来一段时间策略接近或客群相同的时间段对应的变量分段样本赋予较高的第二权重,在评估时将更侧重变量在这些变量分段样本上的表现。
S303、计算所述变量分段样本的各指标的第二评估指标值。
所述第二评估指标值在本申请实施例中可以理解为划分后的变量分段样本的各指标的评估指标值。
在本申请实施例中,服务器在生成变量分段样本的第二权重后,将计算变量分段样本中各指标的第二评估指标值,便于后续根据各第二评估指标值来计算变量测试样本的第一评估指标值。
S304、根据所述第二权重对各所述第二评估指标值进行加权求和,得到第一评估指标值。
在本申请实施例中,服务器将会根据加权求和对各第二评估指标值计算,得到变量测试样本的各指标的第一评估指标值。
例如,如图4所示,由于各样本均分配有第二权重,且各样本均分别计算了自身各指标的第二评估指标值,故将各个变量分段样本的相同指标的第二评估指标值进行加权求和,即可得到该指标在变量测试样本中的第一评估指标值。如样本1、样本2、样本3、样本4的查得率CDL的第一评估指标值分别为cdl1、cdl2、cdl3、cdl4,且样本1、样本2、样本3、样本4的第二权重分别为a、b、c、d,则变量测试样本的查得率cdl=cdl1*a+cdl2*b+cdl3*c+cdl4*d。
S305、判断所述第一评估指标值是否处于预设的指标值范围内,所述指标值范围包括最大指标值和最小指标值。
在本申请实施例中,由于最终目的是输出变量的综合评分,需要先将指标值转换为评分,不同指标的评估标准不同,故可以结合指标特点和业务经验预先设置每一个指标的指标值范围,指标值范围中的最大指标值对应于评分的100分,指标值范围中的最小指标值对应于评分的0分。
S306、若是,则根据所述第一评估指标值、所述最大指标值以及所述最小指标值计算所述第一评估指标值对应的指标评分。
在本申请实施例中,如图5所示,当第一评估指标值处于指标值范围中时,将通过第一评估指标值减去最小指标值的差值除以最大指标值减去最小指标值的差值来计算出第一评估指标值对应的指标评分。
S307、若否,则将所述第一评估指标值更新为所述指标值范围内最接近所述第一评估指标值的目标指标值,根据所述目标指标值、所述最大指标值以及所述最小指标值计算所述第一评估指标值对应的指标评分。
在本申请实施例中,当第一评估指标值不在指标值范围中时,将确定指标值范围内最接近第一评估指标值的目标指标值,将第一评估指标值的指标值更新为目标指标值并进行指标评分的计算。例如,当第一评估指标值小于最小指标值时,则最接近的第一评估指标值的目标指标值就是最小指标值;当第一评估指标值大于最大指标值时,则最接近的第一评估指标值的目标指标值就是最大指标值。
通过上述步骤,服务器从变量数据中选取一段数据作为变量测试样本,将变量测试样本分段后分别对变量分段样本赋权和计算第二评估指标值,以此确定变量测试样本的各个评估指标(如覆盖度、有效性、分布稳定性、效果稳定性、排序性等)的第一评估指标值,并通过预设的指标值范围将第一评估指标值转化成更加便于进行评估的指标评分,基于各指标的第一权重对各指标评分进行计算便可得到变量测试样本的综合评分,进而基于综合评分对变量数据进行评估。以此实现了选取指标对多维度的评估指标进行量化,并通过对多个评估指标进行赋权,来对变量数据给出综合评分,提供了一种统一的评估思路,具有统一的评估标准,在对多家外部数据同时评估时评分也更为公平。还通过对样本按时间分段并赋权,考虑了自身策略调整与市场环境变化对造成的客群变动,重点关注与当前或未来一段时间策略接近或客群相同的样本的同时,兼顾了变量的趋势性变动,使得评估结果更加准确。
参见图6,图6是本申请实施例的又一种数据评估方法的流程示意图。本申请实施例主要强调层次分析法确定第一权重的过程。如图6所示,所述方法包括:
S601、获取变量测试样本的各指标的第一评估指标值,确定各所述第一评估指标值对应的指标评分。
具体过程如步骤S101所示,故在此不再赘述。
S602、对各所述指标两两比较,生成判断矩阵。
在本申请实施例中,如图7所示,在对各指标进行两两比较后,生成判断矩阵:
A=(aij)n×n
其中,aij表示第i个元素相对于第j个元素的比较结果,aij为aji的倒数。按照1-9标度法给出指标相对重要性等级,aij=1表示第i个元素与第j个元素重要性相同,aij=3表示第i个元素比第j个元素略重要,aij=5表示第i个元素比第j个元素重要,aij=7表示第i个元素比第j个元素重要的多,aij=9表示第i个元素相较于第j个元素极其重要。
S603、基于所述判断矩阵计算一致性比率。
在本申请实施例中,在生成判断矩阵后,将基于判断矩阵计算一致性比率CR,以此来判断判断矩阵是否具有满意的一致性,或判断矩阵的不一致程度是否可以接受。
在一种可实施方式中,步骤S603包括:
计算所述判断矩阵的最大特征根,并获取所述最大特征根对应的特征向量;
根据所述最大特征根计算不一致指标,并基于所述不一致指标对应的平均随机一致性指标计算一致性比率。
在本申请实施例中,服务器首先将计算出判断矩阵的最大特征根λmax(A),同时得到最大特征根对应的特征向量x。再根据最大特征根来计算不一致指标:
Figure BDA0002757630680000091
并查阅对应表格确定其对应的平均随机一致性指标RI,继而通过不一致指标CI除以平均随机一致性指标RI计算出一致性比率CR。
S604、当所述一致性比率小于预设值时,基于所述判断矩阵确定各所述指标对应的第一权重。
在本申请实施例中,当一致性比率小于预设值(如0.1)时,即认为判断矩阵A具有满意的一致性或者说其不一致程度是可以接受的,故将基于该判断矩阵确定各指标的第一权重。
在一种可实施方式中,步骤S604还包括:
当所述一致性比率小于预设值时,将所述特征向量的各参数依次确定为各所述指标对应的第一权重。
在本申请实施例中,第一权重的具体确定方法可以是通过最大特征根对应的特征向量确定,特征向量x=[x1,x2,x3,x4,x5],将向量的各参数按顺序依次确定为各指标对应的第一权重。
S605、当所述一致性比率不小于预设值时,调整各所述指标两两比较的顺序,生成新的判断矩阵,执行所述基于所述判断矩阵计算一致性比率的步骤。
在本申请实施例中,当一致性比率不小于预设值时,即认为判断矩阵A的一致性不满意或者说其不一致程度无法接受,服务器将调整指标两两比较的顺序来生成新的判断矩阵并重新计算新的判断矩阵的一致性比率直至一致性比率小于预设值。
可能的,由于判断矩阵A的aij是第i个指标元素相对于第j个指标元素比较的结果,调整指标两两比较的顺序具体可以包括调整指标元素的初始排列顺序。例如,指标元素的初始排列顺序为CDL、IV、PSI、CV、AUC,a12即为CDL元素与IV元素的比较结果,调整指标元素的初始排列顺序为CDL、PSI、IV、CV、AUC,则a12即为CDL元素与PSI元素的比较结果。
S606、基于各所述第一权重以及各所述指标评分计算所述变量测试样本的综合评分。
具体过程如步骤S102所示,故在此不再赘述。
S607、基于所述综合评分对所述变量测试样本对应的变量数据进行评估。
具体过程如步骤S103所示,故在此不再赘述。
通过上述步骤,服务器从变量数据中选取一段数据作为变量测试样本,获取变量测试样本的各个评估指标(如覆盖度、有效性、分布稳定性、效果稳定性、排序性等)的第一评估指标值,并将第一评估指标值转化成更加便于进行评估的指标评分,基于各指标的第一权重对各指标评分进行计算便可得到变量测试样本的综合评分,进而基于综合评分对变量数据进行评估。其中,第一权重将通过对指标两两比较生成的判断矩阵而计算一致性比率得来,且当一致性比率不满意时继续调整判断矩阵直至得到满意的一致性比率。以此实现了选取指标对多维度的评估指标进行量化,并通过对多个评估指标进行赋权,来对变量数据给出综合评分,提供了一种统一的评估思路,具有统一的评估标准,在对多家外部数据同时评估时评分也更为公平。
下面将结合附图8,对本申请实施例提供的数据评估装置进行详细介绍。需要说明的是,附图8所示的数据评估装置,用于执行本申请图1、图3、图6所示实施例的方法,为了便于说明,仅示出了与本申请实施例相关的部分,具体技术细节未揭示的,请参照本申请图1、图3、图6所示的实施例。
请参见图8,图8是本申请实施例提供的一种数据评估装置的结构示意图。如图8所示,所述装置包括:
获取模块801,用于获取变量测试样本的各指标的第一评估指标值,确定各所述第一评估指标值对应的指标评分;
确定模块802,用于确定各所述指标对应的第一权重,并基于各所述第一权重以及各所述指标评分计算所述变量测试样本的综合评分;
评估模块803,用于基于所述综合评分对所述变量测试样本对应的变量数据进行评估。
在一种可实施方式中,获取模块801具体用于:
获取变量测试样本并根据预设的时间段划分所述变量测试样本,得到至少一个变量分段样本;
基于客群匹配程度生成各所述变量分段样本对应的第二权重;
计算所述变量分段样本的各指标的第二评估指标值;
根据所述第二权重对各所述第二评估指标值进行加权求和,得到第一评估指标值。
在一种可实施方式中,获取模块801具体用于:
判断所述第一评估指标值是否处于预设的指标值范围内,所述指标值范围包括最大指标值和最小指标值;
若是,则根据所述第一评估指标值、所述最大指标值以及所述最小指标值计算所述第一评估指标值对应的指标评分;
若否,则将所述第一评估指标值更新为所述指标值范围内最接近所述第一评估指标值的目标指标值,根据所述目标指标值、所述最大指标值以及所述最小指标值计算所述第一评估指标值对应的指标评分。
在一种可实施方式中,确定模块802包括:
确定单元,用于基于层次分析法确定各所述指标对应的第一权重。
在一种可实施方式中,确认单元包括:
生成元件,用于对各所述指标两两比较,生成判断矩阵;
计算元件,用于基于所述判断矩阵计算一致性比率;
确定元件,用于当所述一致性比率小于预设值时,基于所述判断矩阵确定各所述指标对应的第一权重。
在一种可实施方式中,确认单元还包括:
调整元件,用于当所述一致性比率不小于预设值时,调整各所述指标两两比较的顺序,生成新的判断矩阵;
执行元件,用于执行所述基于所述判断矩阵计算一致性比率的步骤。
在一种可实施方式中,计算单元具体用于:
计算所述判断矩阵的最大特征根,并获取所述最大特征根对应的特征向量;
根据所述最大特征根计算不一致指标,并基于所述不一致指标对应的平均随机一致性指标计算一致性比率。
在一种可实施方式中,确认单元具体用于:
当所述一致性比率小于预设值时,将所述特征向量的各参数依次确定为各所述指标对应的第一权重。
本领域的技术人员可以清楚地了解到本申请实施例的技术方案可借助软件和/或硬件来实现。本说明书中的“单元”和“模块”是指能够独立完成或与其他部件配合完成特定功能的软件和/或硬件,其中硬件例如可以是现场可编程门阵列(Field-ProgrammableGate Array,FPGA)、集成电路(Integrated Circuit,IC)等。
本申请实施例的各处理单元和/或模块,可通过实现本申请实施例所述的功能的模拟电路而实现,也可以通过执行本申请实施例所述的功能的软件而实现。
参见图9,其示出了本申请实施例所涉及的一种电子设备的结构示意图,该电子设备可以用于实施图1、图3、图6所示实施例中的方法。如图9所示,电子设备900可以包括:至少一个中央处理器901,至少一个网络接口904,用户接口903,存储器905,至少一个通信总线902。
其中,通信总线902用于实现这些组件之间的连接通信。
其中,用户接口903可以包括显示屏(Display)、摄像头(Camera),可选用户接口903还可以包括标准的有线接口、无线接口。
其中,网络接口904可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。
其中,中央处理器901可以包括一个或者多个处理核心。中央处理器901利用各种接口和线路连接整个终端900内的各个部分,通过运行或执行存储在存储器905内的指令、程序、代码集或指令集,以及调用存储在存储器905内的数据,执行终端900的各种功能和处理数据。可选的,中央处理器901可以采用数字信号处理(Digital Signal Processing,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(Programmable Logic Array,PLA)中的至少一种硬件形式来实现。中央处理器901可集成中央中央处理器(Central Processing Unit,CPU)、图像中央处理器(GraphicsProcessing Unit,GPU)和调制解调器等中的一种或几种的组合。其中,CPU主要处理操作系统、用户界面和应用程序等;GPU用于负责显示屏所需要显示的内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到中央处理器901中,单独通过一块芯片进行实现。
其中,存储器905可以包括随机存储器(Random Access Memory,RAM),也可以包括只读存储器(Read-Only Memory)。可选的,该存储器905包括非瞬时性计算机可读介质(non-transitory computer-readable storage medium)。存储器905可用于存储指令、程序、代码、代码集或指令集。存储器905可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现上述各个方法实施例的指令等;存储数据区可存储上面各个方法实施例中涉及到的数据等。存储器905可选的还可以是至少一个位于远离前述中央处理器901的存储装置。如图9所示,作为一种计算机存储介质的存储器905中可以包括操作系统、网络通信模块、用户接口模块以及程序指令。
在图9所示的电子设备900中,用户接口903主要用于为用户提供输入的接口,获取用户输入的数据;而处理器901可以用于调用存储器905中存储的数据评估应用程序,并具体执行以下操作:
获取变量测试样本的各指标的第一评估指标值,确定各所述第一评估指标值对应的指标评分;
确定各所述指标对应的第一权重,并基于各所述第一权重以及各所述指标评分计算所述变量测试样本的综合评分;
基于所述综合评分对所述变量测试样本对应的变量数据进行评估。
本申请还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述方法的步骤。其中,计算机可读存储介质可以包括但不限于任何类型的盘,包括软盘、光盘、DVD、CD-ROM、微型驱动器以及磁光盘、ROM、RAM、EPROM、EEPROM、DRAM、VRAM、闪速存储器设备、磁卡或光卡、纳米系统(包括分子存储器IC),或适合于存储指令和/或数据的任何类型的媒介或设备。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些服务接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储器包括:U盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通进程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(Random AccessMemory,RAM)、磁盘或光盘等。
以上所述者,仅为本公开的示例性实施例,不能以此限定本公开的范围。即但凡依本公开教导所作的等效变化与修饰,皆仍属本公开涵盖的范围内。本领域技术人员在考虑说明书及实践这里的公开后,将容易想到本公开的其实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未记载的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的范围和精神由权利要求限定。

Claims (11)

1.一种数据评估方法,其特征在于,包括:
获取变量测试样本的各指标的第一评估指标值,确定各所述第一评估指标值对应的指标评分;
确定各所述指标对应的第一权重,并基于各所述第一权重以及各所述指标评分计算所述变量测试样本的综合评分;
基于所述综合评分对所述变量测试样本对应的变量数据进行评估。
2.根据权利要求1所述的方法,其特征在于,所述获取变量测试样本的各指标的第一评估指标值,包括:
获取变量测试样本并根据预设的时间段划分所述变量测试样本,得到至少一个变量分段样本;
基于客群匹配程度生成各所述变量分段样本对应的第二权重;
计算所述变量分段样本的各指标的第二评估指标值;
根据所述第二权重对各所述第二评估指标值进行加权求和,得到第一评估指标值。
3.根据权利要求1所述的方法,其特征在于,所述确定各所述第一评估指标值对应的指标评分,包括:
判断所述第一评估指标值是否处于预设的指标值范围内,所述指标值范围包括最大指标值和最小指标值;
若是,则根据所述第一评估指标值、所述最大指标值以及所述最小指标值计算所述第一评估指标值对应的指标评分;
若否,则将所述第一评估指标值更新为所述指标值范围内最接近所述第一评估指标值的目标指标值,根据所述目标指标值、所述最大指标值以及所述最小指标值计算所述第一评估指标值对应的指标评分。
4.根据权利要求1所述的方法,其特征在于,所述确定各所述指标对应的第一权重,包括:
基于层次分析法确定各所述指标对应的第一权重。
5.根据权利要求4所述的方法,其特征在于,所述基于层次分析法确定各所述指标对应的第一权重,包括:
对各所述指标两两比较,生成判断矩阵;
基于所述判断矩阵计算一致性比率;
当所述一致性比率小于预设值时,基于所述判断矩阵确定各所述指标对应的第一权重。
6.根据权利要求5所述的方法,其特征在于,所述当所述一致性比率小于预设值时,基于所述判断矩阵确定各所述指标对应的第一权重之后,还包括:
当所述一致性比率不小于预设值时,调整各所述指标两两比较的顺序,生成新的判断矩阵;
执行所述基于所述判断矩阵计算一致性比率的步骤。
7.根据权利要求5所述的方法,其特征在于,所述基于所述判断矩阵计算一致性比率,包括:
计算所述判断矩阵的最大特征根,并获取所述最大特征根对应的特征向量;
根据所述最大特征根计算不一致指标,并基于所述不一致指标对应的平均随机一致性指标计算一致性比率。
8.根据权利要求7所述的方法,其特征在于,所述当所述一致性比率小于预设值时,基于所述判断矩阵确定各所述指标对应的第一权重,包括:
当所述一致性比率小于预设值时,将所述特征向量的各参数依次确定为各所述指标对应的第一权重。
9.一种数据评估装置,其特征在于,包括:
获取模块,用于获取变量测试样本的各指标的第一评估指标值,确定各所述第一评估指标值对应的指标评分;
确定模块,用于确定各所述指标对应的第一权重,并基于各所述第一权重以及各所述指标评分计算所述变量测试样本的综合评分;
评估模块,用于基于所述综合评分对所述变量测试样本对应的变量数据进行评估。
10.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-8任一项所述方法的步骤。
11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-8任一项所述方法的步骤。
CN202011207642.0A 2020-11-03 2020-11-03 数据评估方法、装置、电子设备及存储介质 Pending CN112308704A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011207642.0A CN112308704A (zh) 2020-11-03 2020-11-03 数据评估方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011207642.0A CN112308704A (zh) 2020-11-03 2020-11-03 数据评估方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN112308704A true CN112308704A (zh) 2021-02-02

Family

ID=74332414

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011207642.0A Pending CN112308704A (zh) 2020-11-03 2020-11-03 数据评估方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN112308704A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113516197A (zh) * 2021-07-27 2021-10-19 浙江大华技术股份有限公司 算法模型的评估方法及装置、存储介质、电子装置
CN113590691A (zh) * 2021-08-04 2021-11-02 浙江网商银行股份有限公司 目标对象处理方法以及装置
CN114003739A (zh) * 2021-10-29 2022-02-01 北京达佳互联信息技术有限公司 一种多媒体资源的处理方法及装置
CN114219220A (zh) * 2021-11-18 2022-03-22 中国电子产品可靠性与环境试验研究所((工业和信息化部电子第五研究所)(中国赛宝实验室)) 人机工效评估方法、系统、计算机设备和存储介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113516197A (zh) * 2021-07-27 2021-10-19 浙江大华技术股份有限公司 算法模型的评估方法及装置、存储介质、电子装置
CN113590691A (zh) * 2021-08-04 2021-11-02 浙江网商银行股份有限公司 目标对象处理方法以及装置
CN114003739A (zh) * 2021-10-29 2022-02-01 北京达佳互联信息技术有限公司 一种多媒体资源的处理方法及装置
CN114219220A (zh) * 2021-11-18 2022-03-22 中国电子产品可靠性与环境试验研究所((工业和信息化部电子第五研究所)(中国赛宝实验室)) 人机工效评估方法、系统、计算机设备和存储介质

Similar Documents

Publication Publication Date Title
CN112308704A (zh) 数据评估方法、装置、电子设备及存储介质
CN108564286B (zh) 一种基于大数据征信的人工智能金融风控授信评定方法和系统
CN109345374A (zh) 风险控制方法、装置、计算机设备和存储介质
KR100921618B1 (ko) 기술창업기업에 대한 기술평가방법
CN112633962B (zh) 业务推荐方法、装置、计算机设备和存储介质
CN110738527A (zh) 一种特征重要性排序方法、装置、设备和存储介质
US20220415046A1 (en) Method for determining video coding test sequence, electronic device and computer storage medium
NO20230189A1 (en) Environmental, social, and governance (esg) performance trends
CN112184046A (zh) 广告业务用户价值评估方法、装置、设备及存储介质
CN112927069A (zh) 用户信贷风险评估方法、装置和电子设备
CN116128627A (zh) 风险预测方法、装置、电子设备及存储介质
CN115238588A (zh) 图数据处理方法、风险预测模型训练方法及装置
CN114218077A (zh) 一种软件的质量评价方法、装置、设备及可读存储介质
CN114612220A (zh) 风控策略调整方法、装置、电子设备以及存储介质
CN115099933A (zh) 一种业务预算方法、装置及设备
CN114240599A (zh) 贷款测算方法、装置、计算机设备和存储介质
CN111881008B (zh) 一种数据评测、模型训练方法、装置、设备及存储介质
CN115545088A (zh) 模型构建方法、分类方法、装置和电子设备
CN112862602B (zh) 一种用户请求的确定方法及存储介质、电子装置
CN113537666B (zh) 评测模型训练方法、评测和业务审核方法、装置及设备
CN115271934A (zh) 信贷客户的多层次评价方法、装置、设备及存储介质
CN117078298A (zh) 客户满意度的确定方法、装置、存储介质及电子设备
CN117078300A (zh) 客户分群方法、装置、设备及存储介质
CN115688998A (zh) 房租收入预测方法、装置、电子设备和存储介质
CN118673431A (zh) 对象监测方法、装置及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20210721

Address after: 518000 2501, office building T2, Qianhai China Resources Financial Center, No. 55, guiwan 4th Road, Nanshan street, Qianhai Shenzhen Hong Kong cooperation zone, Shenzhen, Guangdong

Applicant after: Shenzhen Huantai Digital Technology Co.,Ltd.

Address before: 518057 Fuan Science and Technology Building, Block B, No. 13, Yuehai Street, Nanshan District, Shenzhen City, Guangdong Province, 207-2

Applicant before: Shenzhen Huantai Technology Co.,Ltd.

Applicant before: GUANGDONG OPPO MOBILE TELECOMMUNICATIONS Corp.,Ltd.

RJ01 Rejection of invention patent application after publication

Application publication date: 20210202