CN107169534A - 模型训练方法及装置、存储介质、电子设备 - Google Patents
模型训练方法及装置、存储介质、电子设备 Download PDFInfo
- Publication number
- CN107169534A CN107169534A CN201710537412.2A CN201710537412A CN107169534A CN 107169534 A CN107169534 A CN 107169534A CN 201710537412 A CN201710537412 A CN 201710537412A CN 107169534 A CN107169534 A CN 107169534A
- Authority
- CN
- China
- Prior art keywords
- training sample
- training
- model
- decision function
- fraction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开是关于一种模型训练方法及装置,该方法包括:构建一决策函数模型并对所述决策函数模型进行训练得到多个训练样本的重要性度量值;根据各所述重要性度量值对各所述训练样本进行降序排列,并将排序后的各所述训练样本生成一特征子空间;对所述特征子空间的各所述训练样本进行分类并得到多个分类结果,将多个所述分类结果进行加权整合得到一预测分数;判断所述预测分数是否与预设分数相同,并在判断所述预测分数与所述预设分数不同时,对所述决策函数模型的参数进行调整。该方法提高了预测分数的准确性。
Description
技术领域
本公开涉及数据处理技术领域,具体而言,涉及一种模型训练方法、模型训练装置、计算机可读存储介质以及电子设备。
背景技术
近年来,消费信贷迅速发展,住房、购车、信用卡、助学贷款等各种贷款义务规模不断扩大,日益增长的信贷规模给银行的风险评估能力带来很大的挑战。银行为了控制风险,不得不采取严格的信贷审核程序,导致贷款手续过于复杂,增加了消费信贷的交易成本;为了解决上述问题,建立一个完善的个人信用体系尤为重要,而个人信用评分是该体系中的重要技术环节。
目前已有多种统计模型应用于个人信用评分,例如Logistic回归、神经网络技术、支持向量机等方法,均有不同程度应用于信用评分建模,但单一模型的问题在于分类精度不够高,且面对信用数据变化时显得不够稳健。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的目的在于提供一种模型训练方法、模型训练装置、计算机可读存储介质以及电子设备,进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的一个或者多个问题。
根据本公开的一个方面,提供一种模型训练方法,包括:
构建一决策函数模型并对所述决策函数模型进行训练得到多个训练样本的重要性度量值;
根据各所述重要性度量值对各所述训练样本进行降序排列,并将排序后的各所述训练样本生成一特征子空间;
对所述特征子空间的各所述训练样本进行分类并得到多个分类结果,将多个所述分类结果进行加权整合得到一预测分数;
判断所述预测分数是否与预设分数相同,并在判断所述预测分数与所述预设分数不同时,对所述决策函数模型的参数进行调整。
在本公开的一种示例性实施例中,构建一决策函数模型包括:
选择一线性核函数构建决策函数:f(x)=<w,x>+b;
其中,f(x)为决策函数,<w,x>为线性核函数,w为重要性度量值,x为自变量,b为常数。
在本公开的一种示例性实施例中,对所述决策函数模型进行训练得到多个训练样本的重要性度量值包括:
假定所述决策函数的约束条件为:yi[(wi,xi)+b]-1≥0;其中,xi为第i个训练样本,yi为与所述第i个训练样本对应的结果标签,b为常数,wi为第i个训练样本的重要性度量值;
将多个训练样本以及与多个所述训练样本一一对应的结果标签代入所述约束条件中并判断所述约束条件是否成立;
将约束条件成立的各所述训练样本所对应的决策函数组成一最小化特征子集J,其中,J={J1,J2,...,Jm},m为使约束条件成立的训练样本的个数;
对所述最小化特征子集J中的各训练样本所对应的决策函数进行泰勒展开得到:其中,ΔJ(i)为最小化目标函数J在第i个训练样本的增量,Δwi为重要性度量值w在第i个训练样本的增量,为最小化目标函数J的一阶偏导数,为最小化目标函数J的二阶偏导数;
根据第i个所述训练样本对所述最小化目标函数的影响得出在所述最小化目标函数的最优点上,一阶偏导数为0,求解得到wi。
在本公开的一种示例性实施例中,将排序后的各所述各所述训练样本生成一特征子空间包括:
S10,配置一空集的特征序列F以及一特征子集S;其中,F=[],S=[1,…,p],p为排序后的训练样本的个数且p≤m;
S20,判断所述特征子集S是否与φ相同并在判断所述特征子序列S与φ不相同时,将m个所述训练样本生成支持向量;
S30,根据各所述训练样本的特征值wi计算所述支持向量中各所述训练样本的排序规则Ri,其中:Ri=(wi)2;
S40,根据所述排序规则Ri的大小,查找到最小排序规则对应的所述训练样本的序号,并将所述训练样本的序号添加至所述特征序列F中;
S50,重复步骤S30以及步骤S40,直至所述特征子集S与φ相同为止,并将每一次查找到的训练样本的序号添加至特征序列F中以得到特征子空间。
在本公开的一种示例性实施例中,对所述特征子空间的各所述训练样本进行分类并得到多个分类结果,将多个所述分类结果进行加权整合得到一预测分数包括:
利用多个分类器对所述特征序列F中的各序号对应的训练样本进行分类得到多个分类结果;
根据各所述分类结果绘制准确率与召回率曲线,并根据准确率与召回率曲线下面积计算各所述分类器的权重wk,其中:
AUCk为第k个分类器的准确率与召回率曲线下面积,MIN(AUC)为各所述分类器中准确率与召回率曲线下面积的最小值,MAX(AUC)为各所述分类器中准确率与召回率曲线下面积的最大值;
根据各所述分类器的权重wk对多个所述预测分数进行整合得到所述预测分数Q,其中:qk为第k个分类器的输出结果。
在本公开的一种示例性实施例中,所述模型训练方法还包括:
获取包括多个所述训练样本以及与多个所述训练样本一一对应的结果标签的样本集。
在本公开的一种示例性实施例中,所述模型训练方法还包括:
对多个所述训练样本进行数据预处理。
在本公开的一种示例性实施例中,所述数据预处理包括数据采集、缺失数据填补、数据异常值处理以及数据归一化中的一种或多种。
根据本公开的一个方面,提供一种模型训练装置,包括:
模型训练模块,用于构建一决策函数模型并对所述决策函数模型进行训练得到多个训练样本的重要性度量值;
特征子空间生成模块,用于根据各所述重要性度量值对各所述训练样本进行降序排列,并将排序后的各所述训练样本生成一特征子空间;
训练样本分类模块,用于对所述特征子空间的各所述训练样本进行分类并得到多个分类结果,将多个所述分类结果进行加权整合得到一预测分数;
参数调整模块,用于判断所述预测分数是否与预设分数相同,并在判断所述预测分数与所述预设分数不同时,对所述决策函数模型的参数进行调整。
根据本公开的一个方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一项所述的模型训练方法。
根据本公开的一个方面,提供一种电子设备,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行上述任意一项所述的模型训练方法。
本公开一种模型训练方法及装置,通过构建决策函数模型并得到多个训练样本的重要性度量值,然后对重要性度量值进行降序排列并生成特征子空间,最后对特征子空间的训练样本进行分类并对分类结果进行加权整合得到预测分数,最后根据预测分数调整决策函数模型;一方面,通过对训练样本的的重要性度量值进行排序然后生成一特征子空间,可以提炼出更加精简、准确的训练样本集,减少了冗余数据对分类结果的影响;另一方面,通过对分类结果进行加权整合,得到最终的预测分数,提高了预测分数的准确性;再一方面,通过决策函数模型得到各训练样本的重要性度量值,不再依赖专家知识和业务经验得出各训练样本的重要性度量值,由于不同专家看法不同而使得统一训练样本的重要性度量值不同的问题,提高了各训练样本的重要性度量值的可靠性。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示意性示出一种等级评估结构示例图。
图2示意性示出一种模型训练方法的流程图。
图3示意性示出一种生成特征子空间的方法流程图。。
图4示意性示出一种ROC曲线示例图。
图5示意性示出一种模型训练装置的框图。
图6示意性示出一种用于实现上述模型训练方法的电子设备示例图。
图7示意性示出一种用于实现上述模型训练方法的计算机存储介质。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本公开的实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而省略所述特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知技术方案以避免喧宾夺主而使得本公开的各方面变得模糊。
此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
在一种信用等级评估方法中,参考图1所示,首先确定待评估目标,然后构建指标体系(指标体系可以包括X1,年龄;X2,性别;X3,婚姻;…;Xn,贷款金额),然后对指标体系进行数据预处理,数据预处理可以包括数据采集、缺失数据填补、异常值处理以及不平衡数据处理;当数据预处理完成后,进行模型设计与选择,然后对模型进行效果测试与对比,最后当效果测试与对比完成后,再对模型进行应用。
但是,上述信用等级评估方法中,体系指标的构建需要依据专家知识和业务经验,指标重要性不同专家学者的看法不同,孰优孰劣不能达成共识;另外,未能考虑到各个指标之间的相互影响,不能消除数据中的冗余,无法保证指标的稳定性。
进一步的,上述信用等级评估方法在模型设计与选择上,只能选择单一的算法进行设计。其中,Logistic回归算法虽然无需假定特征变量的概率分布,也不要求协方差齐性,但是分类精度不高;决策树算法中参数和规则的设置对最后决策树的生成规模以及预测精度有非常大的影响,同时在很大程度上,也依赖着专家经验,需要经过反复测试才能获得合适的决策树规模,并且决策树的表现缺乏稳健性;贝叶斯网络、神经网络、支持向量机等方法,均可以应用于个人信用评分模型,但它们的精度或稳健性均有所欠缺,不能实现模型建的优势互补。
本示例实施方式中首先提供了一种模型训练方法。参考图2所示,该模型训练方法可以包括以下步骤。
步骤S210.构建一决策函数模型并对所述决策函数模型进行训练得到多个训练样本的重要性度量值。
步骤S220.根据各所述重要性度量值对各所述训练样本进行降序排列,并将排序后的各所述训练样本生成一特征子空间。
步骤S230.对所述特征子空间的各所述训练样本进行分类并得到多个分类结果,将多个所述分类结果进行加权整合得到一预测分数。
步骤S240.判断所述预测分数是否与预设分数相同,并在判断所述预测分数与所述预设分数不同时,对所述决策函数模型的参数进行调整。
上述模型训练方法中,一方面,通过对训练样本的的重要性度量值进行排序然后生成一特征子空间,可以提炼出更加精简、准确的训练样本集,减少了冗余数据对分类结果的影响;另一方面,通过对分类结果进行加权整合,得到最终的预测分数,保证了预测分数的准确性;再一方面,通过决策函数模型得到各训练样本的重要性度量值,不再依赖专家知识和业务经验得出各训练样本的重要性度量值,由于不同专家看法不同而使得统一训练样本的重要性度量值不同的问题,提高了各训练样本的重要性度量值的可靠性。
下面,将对本示例实施方式中上述模型训练方法的各步骤进行详细的说明。
在步骤S210中,构建一决策函数模型并对所述决策函数模型进行训练得到多个训练样本的重要性度量值。详细而言:
首先,选择一线性核函数构建决策函数f(x),并有f(x)=<w,x>+b;其中,f(x)为决策函数,<w,x>为线性核函数,w为重要性度量值,x为自变量,b为常数;此处需要说明的是,对于线性核函数<w,x>来说,有<w,x>=w·x=wx;因此,上述决策函数f(x)也可以改写为f(x)=wx+b。
其次,假定所述决策函数的约束条件为:yi[(wi,xi)+b]-1≥0;其中,xi为第i个训练样本(训练样本可以包括训练样本序号以及训练样本序号所对应的训练样本内容,可以参考下表1所示);yi为与所述第i个训练样本对应的结果标签,yi的取值可以为1或者-1;b为常数;wi为第i个训练样本的重要性度量值。
在本示例实施方式中,上述训练样本可以参考下表1所示:
表1
训练样本序号 | 训练样本内容 |
X1 | 年龄 |
X2 | 性别 |
X3 | 婚姻 |
X4 | 教育程度 |
X5 | 单位类型 |
X6 | 职称 |
X7 | 收入 |
X8 | 在本银行的账户 |
X9 | 储蓄账户的储蓄金额 |
X10 | 在本职位的时间 |
X11 | 家庭净收入 |
X12 | 贷款金额 |
X13 | 违约记录 |
… | … |
紧接着,将多个训练样本以及与多个所述训练样本一一对应的结果标签代入所述约束条件中并判断所述约束条件是否成立。
然后,将约束条件成立的各所述训练样本所对应的决策函数组成一最小化特征子集J,其中,J={J1,J2,...,Jm},m为使约束条件成立的训练样本的个数。
再次,对所述最小化特征子集J中的各训练样本所对应的决策函数进行泰勒展开得到:其中,ΔJ(i)为最小化目标函数J在第i个训练样本的增量,Δwi为重要性度量值w在第i个训练样本的增量,为最小化目标函数J的一阶偏导数,为最小化目标函数J的二阶偏导数。
最后,根据第i个所述训练样本对所述最小化目标函数的影响得出在所述最小化目标函数的最优点上,一阶偏导数为0,求解得到wi。
在步骤S220中,根据各所述重要性度量值对各所述训练样本进行降序排列,并将排序后的各所述训练样本生成一特征子空间。参考图3所示,将排序后的各所述训练样本生成一特征子空间可以包括S10-S50。其中:
S10,配置一空集的特征序列F以及一特征子集S;其中,F=[],S=[1,…,p],p为排序后的训练样本的个数且p≤m。
S20,判断所述特征子集S是否与φ相同并在判断所述特征子序列S与φ不相同时,将m个所述训练样本生成支持向量。
S30,根据各所述训练样本的特征值wi计算所述支持向量中各所述训练样本的排序规则Ri,其中:Ri=(wi)2。
S40,根据所述排序规则Ri的大小,查找到最小排序规则对应的所述训练样本的序号,并将所述训练样本的序号添加至所述特征序列F中。
S50,重复步骤S30以及步骤S40,直至所述特征子集S与φ相同为止,并将每一次查找到的训练样本的序号添加至特征序列F中以得到特征子空间。
在步骤S230中,对所述特征子空间的各所述训练样本进行分类并得到多个分类结果,将多个所述分类结果进行加权整合得到一预测分数。详细而言:
首先,利用多个分类器对所述特征序列F中的各序号对应的训练样本进行分类得到多个分类结果。
在本示例实施方式中,上述分类器可以包括分类器包括Logistic回归,贝叶斯网络以及支持向量机等等,也可以包括其他的分类器,例如可以是线性分类器等,本示例实施方式对此不做特殊限制;举例而言:
上述特征序列F中各序号对应的训练样本例如可以包括:X3,婚姻;X4,教育程度;X7,收入;X11,家庭净收入等等,则可以通过上述分类器将训练样本分为家庭类:X3,婚姻;X11,家庭净收入;个人自身情况:X4,教育程度;X7,收入等等;也可以分为其他的类型,本示例实施方式对此不做特殊限制。
其次,根据各所述分类结果绘制准确率与召回率曲线,并根据准确率与召回率曲线下面积计算各所述分类器的权重wk,其中:
AUCk为第k个分类器的准确率与召回率曲线下面积,MIN(AUC)为各所述分类器中准确率与召回率曲线下面积的最小值,MAX(AUC)为各所述分类器中准确率与召回率曲线下面积的最大值。
在本示例实施方式中,上述准确率与召回率曲线可以参考图4所示。其中,用于绘制准确率与召回率曲线的标准可以参考如下表2所示:
表2
进一步的,FP rate=FP/N;Specificity=1-FP rate=TN/N;Recall=TP/P;Precision=TP/(TP+FP);Accuracy=(TP+TN)/(P+N);F-score=precision*Recall;其中,N=TN+FP,P=TP+FN。
更进一步的,利用ROC(Receiver Operating Characteristic,准确率与召回率曲线)作为评估单一分类器总体精确度的参考依据,ROC是在TPR和FPR两个不同维度上绘制的点图,结果越接近左上角,分类精度越高;因此,AUC(Area Under the ROC Curve,ROC曲线下面积)评价标准可以衡量数据类别在任何分布或者任何错误代价下分类算法的总体性能。
最后,根据各所述分类器的权重wk对多个所述预测分数进行整合得到所述预测分数Q,其中:qk为第k个分类器的输出结果。
在步骤S240中,判断所述预测分数是否与预设分数相同,并在判断所述预测分数与所述预设分数不同时,对所述决策函数模型的参数进行调整。
本公开还提供了另一种模型训练方法,该方法还可以包括:获取包括多个所述训练样本以及与多个所述训练样本一一对应的结果标签的样本集。
在本示例实施方式中,可以获取一历史时间段内(例如截止当前日期起的前三个月、六个月或者八个月等等,本示例实施方式对此不做特殊限制)的数据作为样本集;其中,样本集可以包括多个训练样本,例如上述的xi;以及与各训练样本一一对应的结果标签,例如上述的yi,也可以包括其他内容,例如可以是该样本集的获取日期等等,本示例实施方式对此不做特殊限制。
在本公开的一种示例性实施方式中,上述模型训练方法还可以包括:对多个所述训练样本进行数据预处理。详细而言:
对训练样本进行数据预处理可以包括数据采集、缺失数据填补、数据异常值处理以及数据归一化等等,也可以包括数据过滤等,本示例实施方式对此不做特殊限制。其中,数据采集可以包括对历史数据的获取等,例如获取某一个历史时间内的某一个数据表格中的各项数据作为训练样本;缺失数据填补可以包括对各训练样本的数据进行补充等,例如在某一样本集中,训练样本内容所对应的训练样本序号为空,则可以对该训练样本序号进行补充;数据异常值处理可以包括对各训练样本出现的数据异常进行修订或删除,例如在某一样本集中,有一训练样本为步行上下班,则可以将该训练样本对应的数据删除掉;数据归一化可以包括对各训练样本中出现的数据格式不统一的情况进行统一,例如出现的数字有大写有小写,还有英文,则可以将其统一成十进制的数字。
本示例实施方式还提供了一种模型训练装置。参考图5所示,该模型训练装置可以包括模型训练模块510、特征子空间生成模块520、训练样本分类模块530以及参数调整模块540。其中:
模型训练模块510可以用于构建一决策函数模型并对所述决策函数模型进行训练得到多个训练样本的重要性度量值。
特征子空间生成模块520可以用于根据各所述重要性度量值对各所述训练样本进行降序排列,并将排序后的各所述训练样本生成一特征子空间。
训练样本分类模块530可以用于对所述特征子空间的各所述训练样本进行分类并得到多个分类结果,将多个所述分类结果进行加权整合得到一预测分数。
参数调整模块540可以用于判断所述预测分数是否与预设分数相同,并在判断所述预测分数与所述预设分数不同时,对所述决策函数模型的参数进行调整。
上述模型训练装置中各模块的具体细节已经在对应的模型训练方法中进行了详细的描述,因此此处不再赘述。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
此外,尽管在附图中以特定顺序描述了本公开中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、移动终端、或者网络设备等)执行根据本公开实施方式的方法。
在本公开的示例性实施例中,还提供了一种能够实现上述方法的电子设备。
所属技术领域的技术人员能够理解,本发明的各个方面可以实现为系统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
下面参照图6来描述根据本发明的这种实施方式的电子设备600。图6显示的电子设备600仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图6所示,电子设备600以通用计算设备的形式表现。电子设备600的组件可以包括但不限于:上述至少一个处理单元610、上述至少一个存储单元620、连接不同系统组件(包括存储单元620和处理单元610)的总线630、显示单元640。
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元610执行,使得所述处理单元610执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的步骤。例如,所述处理单元610可以执行如图2中所示的步骤S110:检测是否接收到第一触控起始操作,并在检测接收到所述第一触控起始操作时判断所述第一触控起始操作是否发生所述第二区域步骤S120:在判断所述第一触控起始操作发生在所述第二区域时,控制所述虚拟对象根据与所述第一触控起始操作连续的滑动操作移动;步骤S130:检测是否接收到与所述滑动操作连续的第一触控结束操作并在检测接收到所述第一触控结束操作时,判断所述第一触控结束操作是否发生在所述第一子区域;步骤S140:在判断所述第一触控结束操作发生在所述第一子区域时,控制所述虚拟对象进入转向状态以在所述转向状态下根据目标转动方向控制转向。
存储单元620可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)6201和/或高速缓存存储单元6202,还可以进一步包括只读存储单元(ROM)6203。
存储单元620还可以包括具有一组(至少一个)程序模块6205的程序/实用工具6204,这样的程序模块6205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线630可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备600也可以与一个或多个外部设备700(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备600交互的设备通信,和/或与使得该电子设备600能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口650进行。并且,电子设备600还可以通过网络适配器660与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器660通过总线630与电子设备600的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备600使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开实施方式的方法。
在本公开的示例性实施例中,还提供了一种计算机可读存储介质,其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的步骤。
参考图7所示,描述了根据本发明的实施方式的用于实现上述方法的程序产品800,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
此外,上述附图仅是根据本发明示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其他实施例。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限。
Claims (11)
1.一种模型训练方法,其特征在于,包括:
构建一决策函数模型并对所述决策函数模型进行训练得到多个训练样本的重要性度量值;
根据各所述重要性度量值对各所述训练样本进行降序排列,并将排序后的各所述训练样本生成一特征子空间;
对所述特征子空间的各所述训练样本进行分类并得到多个分类结果,将多个所述分类结果进行加权整合得到一预测分数;
判断所述预测分数是否与预设分数相同,并在判断所述预测分数与所述预设分数不同时,对所述决策函数模型的参数进行调整。
2.根据权利要求1所述的模型训练方法,其特征在于,构建一决策函数模型包括:
选择一线性核函数构建决策函数:f(x)=<w,x>+b;
其中,f(x)为决策函数,<w,x>为线性核函数,w为重要性度量值,x为自变量,b为常数。
3.根据权利要求2所述的模型训练方法,其特征在于,对所述决策函数模型进行训练得到多个训练样本的重要性度量值包括:
假定所述决策函数的约束条件为:yi[(wi,xi)+b]-1≥0;其中,xi为第i个训练样本,yi为与所述第i个训练样本对应的结果标签,b为常数,wi为第i个训练样本的重要性度量值;
将多个训练样本以及与多个所述训练样本一一对应的结果标签代入所述约束条件中并判断所述约束条件是否成立;
将约束条件成立的各所述训练样本所对应的决策函数组成一最小化特征子集J,其中,J={J1,J2,...,Jm},m为使约束条件成立的训练样本的个数;
对所述最小化特征子集J中的各训练样本所对应的决策函数进行泰勒展开得到:其中,ΔJ(i)为最小化目标函数J在第i个训练样本的增量,Δwi为重要性度量值w在第i个训练样本的增量,为最小化目标函数J的一阶偏导数,为最小化目标函数J的二阶偏导数;
根据第i个所述训练样本对所述最小化目标函数的影响得出在所述最小化目标函数的最优点上,一阶偏导数为0,求解得到wi。
4.根据权利要求3所述的模型训练方法,其特征在于,将排序后的各所述各所述训练样本生成一特征子空间包括:
S10,配置一空集的特征序列F以及一特征子集S;其中,F=[],S=[1,…,p],p为排序后的训练样本的个数且p≤m;
S20,判断所述特征子集S是否与φ相同并在判断所述特征子序列S与φ不相同时,将m个所述训练样本生成支持向量;
S30,根据各所述训练样本的特征值wi计算所述支持向量中各所述训练样本的排序规则Ri,其中:Ri=(wi)2;
S40,根据所述排序规则Ri的大小,查找到最小排序规则对应的所述训练样本的序号,并将所述训练样本的序号添加至所述特征序列F中;
S50,重复步骤S30以及步骤S40,直至所述特征子集S与φ相同为止,并将每一次查找到的训练样本的序号添加至特征序列F中以得到特征子空间。
5.根据权利要求4所述的模型训练方法,其特征在于,对所述特征子空间的各所述训练样本进行分类并得到多个分类结果,将多个所述分类结果进行加权整合得到一预测分数包括:
利用多个分类器对所述特征序列F中的各序号对应的训练样本进行分类得到多个分类结果;
根据各所述分类结果绘制准确率与召回率曲线,并根据准确率与召回率曲线下面积计算各所述分类器的权重wk,其中:
AUCk为第k个分类器的准确率与召回率曲线下面积,MIN(AUC)为各所述分类器中准确率与召回率曲线下面积的最小值,MAX(AUC)为各所述分类器中准确率与召回率曲线下面积的最大值;
根据各所述分类器的权重wk对多个所述预测分数进行整合得到所述预测分数Q,其中:qk为第k个分类器的输出结果。
6.根据根据权利要求1所述的模型训练方法,其特征在于,所述模型训练方法还包括:
获取包括多个所述训练样本以及与多个所述训练样本一一对应的结果标签的样本集。
7.根据根据权利要求6所述的模型训练方法,其特征在于,所述模型训练方法还包括:
对多个所述训练样本进行数据预处理。
8.根据根据权利要求7所述的模型训练方法,其特征在于,所述数据预处理包括数据采集、缺失数据填补、数据异常值处理以及数据归一化中的一种或多种。
9.一种模型训练装置,其特征在于,包括:
模型训练模块,用于构建一决策函数模型并对所述决策函数模型进行训练得到多个训练样本的重要性度量值;
特征子空间生成模块,用于根据各所述重要性度量值对各所述训练样本进行降序排列,并将排序后的各所述训练样本生成一特征子空间;
训练样本分类模块,用于对所述特征子空间的各所述训练样本进行分类并得到多个分类结果,将多个所述分类结果进行加权整合得到一预测分数;
参数调整模块,用于判断所述预测分数是否与预设分数相同,并在判断所述预测分数与所述预设分数不同时,对所述决策函数模型的参数进行调整。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-8任一项所述的模型训练方法。
11.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1-8任一项所述的模型训练方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710537412.2A CN107169534A (zh) | 2017-07-04 | 2017-07-04 | 模型训练方法及装置、存储介质、电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710537412.2A CN107169534A (zh) | 2017-07-04 | 2017-07-04 | 模型训练方法及装置、存储介质、电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107169534A true CN107169534A (zh) | 2017-09-15 |
Family
ID=59822470
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710537412.2A Pending CN107169534A (zh) | 2017-07-04 | 2017-07-04 | 模型训练方法及装置、存储介质、电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107169534A (zh) |
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107633455A (zh) * | 2017-09-04 | 2018-01-26 | 深圳市华傲数据技术有限公司 | 基于数据模型的信用评估方法及装置 |
CN107870810A (zh) * | 2017-10-31 | 2018-04-03 | 广东欧珀移动通信有限公司 | 应用清理方法、装置、存储介质及电子设备 |
CN107910066A (zh) * | 2017-11-13 | 2018-04-13 | 医渡云(北京)技术有限公司 | 病历评估方法、装置、电子设备及存储介质 |
CN108304354A (zh) * | 2018-01-25 | 2018-07-20 | 腾讯科技(深圳)有限公司 | 一种预测模型训练方法及装置、存储介质、电子设备 |
CN108830454A (zh) * | 2018-05-08 | 2018-11-16 | 阿里巴巴集团控股有限公司 | 业务的决策方法、装置及电子设备 |
EP3468159A1 (en) * | 2017-09-19 | 2019-04-10 | Beijing Xiaomi Mobile Software Co., Ltd. | Method and apparatus for detecting state of a mobile terminal and storage medium |
CN109815991A (zh) * | 2018-12-29 | 2019-05-28 | 北京城市网邻信息技术有限公司 | 机器学习模型的训练方法、装置、电子设备及存储介质 |
CN109886299A (zh) * | 2019-01-16 | 2019-06-14 | 平安科技(深圳)有限公司 | 一种用户画像方法、装置、可读存储介质及终端设备 |
CN109947939A (zh) * | 2019-01-30 | 2019-06-28 | 中兴飞流信息科技有限公司 | 文本分类方法、电子设备和计算机可读存储介质 |
CN110222762A (zh) * | 2019-06-04 | 2019-09-10 | 恒安嘉新(北京)科技股份公司 | 对象预测方法、装置、设备、及介质 |
CN110838069A (zh) * | 2019-10-15 | 2020-02-25 | 支付宝(杭州)信息技术有限公司 | 数据处理方法、装置以及系统 |
CN110909147A (zh) * | 2019-12-02 | 2020-03-24 | 支付宝(杭州)信息技术有限公司 | 一种训练排序结果选择模型输出标准问法的方法和系统 |
CN110931131A (zh) * | 2019-12-30 | 2020-03-27 | 华中科技大学鄂州工业技术研究院 | 一种平衡能力评价方法及装置 |
CN110956303A (zh) * | 2019-10-12 | 2020-04-03 | 未鲲(上海)科技服务有限公司 | 信息预测方法、装置、终端及可读存储介质 |
CN110995770A (zh) * | 2020-03-02 | 2020-04-10 | 信联科技(南京)有限公司 | 一种模糊测试应用效果对比方法 |
CN111008263A (zh) * | 2019-11-29 | 2020-04-14 | 支付宝(杭州)信息技术有限公司 | 问答匹配模型的更新方法和装置 |
WO2020087758A1 (zh) * | 2018-11-02 | 2020-05-07 | 平安科技(深圳)有限公司 | 异常流量数据识别方法、装置、计算机设备和存储介质 |
CN111833171A (zh) * | 2020-03-06 | 2020-10-27 | 北京芯盾时代科技有限公司 | 异常操作检测和模型训练方法、装置以及可读存储介质 |
CN114662611A (zh) * | 2022-04-07 | 2022-06-24 | 中科三清科技有限公司 | 颗粒物组分数据的修复方法、装置、电子设备及存储介质 |
CN109886299B (zh) * | 2019-01-16 | 2024-05-24 | 平安科技(深圳)有限公司 | 一种用户画像方法、装置、可读存储介质及终端设备 |
-
2017
- 2017-07-04 CN CN201710537412.2A patent/CN107169534A/zh active Pending
Cited By (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107633455A (zh) * | 2017-09-04 | 2018-01-26 | 深圳市华傲数据技术有限公司 | 基于数据模型的信用评估方法及装置 |
EP3468159A1 (en) * | 2017-09-19 | 2019-04-10 | Beijing Xiaomi Mobile Software Co., Ltd. | Method and apparatus for detecting state of a mobile terminal and storage medium |
US10764425B2 (en) | 2017-09-19 | 2020-09-01 | Beijing Xiaomi Mobile Software Co., Ltd. | Method and apparatus for detecting state |
CN107870810A (zh) * | 2017-10-31 | 2018-04-03 | 广东欧珀移动通信有限公司 | 应用清理方法、装置、存储介质及电子设备 |
CN107870810B (zh) * | 2017-10-31 | 2020-05-12 | Oppo广东移动通信有限公司 | 应用清理方法、装置、存储介质及电子设备 |
CN107910066A (zh) * | 2017-11-13 | 2018-04-13 | 医渡云(北京)技术有限公司 | 病历评估方法、装置、电子设备及存储介质 |
CN108304354A (zh) * | 2018-01-25 | 2018-07-20 | 腾讯科技(深圳)有限公司 | 一种预测模型训练方法及装置、存储介质、电子设备 |
CN108304354B (zh) * | 2018-01-25 | 2021-08-24 | 腾讯科技(深圳)有限公司 | 一种预测模型训练方法及装置、存储介质、电子设备 |
CN108830454A (zh) * | 2018-05-08 | 2018-11-16 | 阿里巴巴集团控股有限公司 | 业务的决策方法、装置及电子设备 |
CN108830454B (zh) * | 2018-05-08 | 2021-12-28 | 创新先进技术有限公司 | 业务的决策方法、装置及电子设备 |
WO2020087758A1 (zh) * | 2018-11-02 | 2020-05-07 | 平安科技(深圳)有限公司 | 异常流量数据识别方法、装置、计算机设备和存储介质 |
CN109815991A (zh) * | 2018-12-29 | 2019-05-28 | 北京城市网邻信息技术有限公司 | 机器学习模型的训练方法、装置、电子设备及存储介质 |
CN109815991B (zh) * | 2018-12-29 | 2021-02-19 | 北京城市网邻信息技术有限公司 | 机器学习模型的训练方法、装置、电子设备及存储介质 |
CN109886299B (zh) * | 2019-01-16 | 2024-05-24 | 平安科技(深圳)有限公司 | 一种用户画像方法、装置、可读存储介质及终端设备 |
CN109886299A (zh) * | 2019-01-16 | 2019-06-14 | 平安科技(深圳)有限公司 | 一种用户画像方法、装置、可读存储介质及终端设备 |
CN109947939A (zh) * | 2019-01-30 | 2019-06-28 | 中兴飞流信息科技有限公司 | 文本分类方法、电子设备和计算机可读存储介质 |
CN110222762A (zh) * | 2019-06-04 | 2019-09-10 | 恒安嘉新(北京)科技股份公司 | 对象预测方法、装置、设备、及介质 |
CN110956303A (zh) * | 2019-10-12 | 2020-04-03 | 未鲲(上海)科技服务有限公司 | 信息预测方法、装置、终端及可读存储介质 |
CN110838069A (zh) * | 2019-10-15 | 2020-02-25 | 支付宝(杭州)信息技术有限公司 | 数据处理方法、装置以及系统 |
CN111008263A (zh) * | 2019-11-29 | 2020-04-14 | 支付宝(杭州)信息技术有限公司 | 问答匹配模型的更新方法和装置 |
CN111008263B (zh) * | 2019-11-29 | 2023-06-09 | 支付宝(杭州)信息技术有限公司 | 问答匹配模型的更新方法和装置 |
CN110909147A (zh) * | 2019-12-02 | 2020-03-24 | 支付宝(杭州)信息技术有限公司 | 一种训练排序结果选择模型输出标准问法的方法和系统 |
CN110931131A (zh) * | 2019-12-30 | 2020-03-27 | 华中科技大学鄂州工业技术研究院 | 一种平衡能力评价方法及装置 |
CN110931131B (zh) * | 2019-12-30 | 2023-04-28 | 华中科技大学鄂州工业技术研究院 | 一种平衡能力评价方法及装置 |
CN110995770A (zh) * | 2020-03-02 | 2020-04-10 | 信联科技(南京)有限公司 | 一种模糊测试应用效果对比方法 |
CN111833171A (zh) * | 2020-03-06 | 2020-10-27 | 北京芯盾时代科技有限公司 | 异常操作检测和模型训练方法、装置以及可读存储介质 |
CN114662611A (zh) * | 2022-04-07 | 2022-06-24 | 中科三清科技有限公司 | 颗粒物组分数据的修复方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107169534A (zh) | 模型训练方法及装置、存储介质、电子设备 | |
CN106471527B (zh) | 从全局模型进行本地化学习 | |
CN109064278B (zh) | 目标对象推荐方法及装置、电子设备、存储介质 | |
US11551239B2 (en) | Characterizing and modifying user experience of computing environments based on behavior logs | |
WO2019006373A1 (en) | METHOD AND APPARATUS FOR PREDICTING VEHICLE INSURANCE RISK, AND SERVER | |
CN109657805A (zh) | 超参数确定方法、装置、电子设备及计算机可读介质 | |
US20190147369A1 (en) | Rule Determination for Black-Box Machine-Learning Models | |
KR102170199B1 (ko) | 비교 세트를 사용한 입력 예시들 분류 | |
CN106471525A (zh) | 增强神经网络以生成附加输出 | |
US9129190B1 (en) | Identifying objects in images | |
CN109360012A (zh) | 广告投放渠道的选择方法及装置、存储介质、电子设备 | |
CN111344710A (zh) | 使用基于机器学习的模型进行成本有效的热力学流体特性预测的方法 | |
CN105160397A (zh) | 训练精炼的机器学习模型 | |
US11741398B2 (en) | Multi-layered machine learning system to support ensemble learning | |
CN105719001A (zh) | 使用散列的神经网络中的大规模分类 | |
CN108846077A (zh) | 问答文本的语义匹配方法、装置、介质及电子设备 | |
JP7405775B2 (ja) | コンピュータで実行される見積もり方法、見積もり装置、電子機器及び記憶媒体 | |
CN104516897B (zh) | 一种针对应用对象进行排序的方法和装置 | |
EP3893169A2 (en) | Method, apparatus and device for generating model and storage medium | |
CN109035028A (zh) | 智能投顾策略生成方法及装置、电子设备、存储介质 | |
CN110059112A (zh) | 基于机器学习的用户挖掘方法及装置、电子设备、介质 | |
US11410073B1 (en) | Systems and methods for robust feature selection | |
US11410111B1 (en) | Generating predicted values based on data analysis using machine learning | |
CN109993638A (zh) | 产品推荐的方法、装置、介质和电子设备 | |
CN110781970A (zh) | 分类器的生成方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170915 |