CN111523649A - 针对业务模型进行数据预处理的方法及装置 - Google Patents

针对业务模型进行数据预处理的方法及装置 Download PDF

Info

Publication number
CN111523649A
CN111523649A CN202010384217.2A CN202010384217A CN111523649A CN 111523649 A CN111523649 A CN 111523649A CN 202010384217 A CN202010384217 A CN 202010384217A CN 111523649 A CN111523649 A CN 111523649A
Authority
CN
China
Prior art keywords
vector
sample
feature
layer
service
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010384217.2A
Other languages
English (en)
Other versions
CN111523649B (zh
Inventor
曹绍升
崔卿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN202010384217.2A priority Critical patent/CN111523649B/zh
Publication of CN111523649A publication Critical patent/CN111523649A/zh
Application granted granted Critical
Publication of CN111523649B publication Critical patent/CN111523649B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof

Abstract

本发明涉及针对业务模型进行数据预处理的方法及装置。本说明书实施例提供一种新型的用于处理分类业务的业务模型,该业务模型通过多个深度网络实现,在多个深度网络中,通过引入描述不同特征值的特征表达向量,以及与各个分类类别分别对应的各个层标签向量,可以在每一个深度网络中,都充分考虑各个业务特征对于相应分类类别的重要度。在利用业务模型进行目标类别确定时,可以针对每个分类类别确定其作为待处理的业务数据的目标类别的可能性,从而提高业务模型的准确度,并且由于在各个深度网络中确定了相应业务特征的重要度系数,使得业务模型的业务处理结果具有可追溯性,提高使用体验。

Description

针对业务模型进行数据预处理的方法及装置
技术领域
本说明书一个或多个实施例涉及计算机技术领域,尤其涉及通过针对业务模型进行数据预处理,以及利用经过数据预处理的业务模型处理业务数据的方法和装置。
背景技术
随着机器学习技术的发展,深度神经网络(Deep Neural Network,DNN)由于模仿人脑的思考方式,比简单的线性模型有更好的效果,而受到本领域技术人员的青睐。深度神经网络是一种具备至少一个隐层的神经网络,能够为复杂非线性系统提供建模,因而提高了模型的能力。然而,常规的深度神经网络方法,由于复杂的网络结构,而不能给出可解释性。
作为示例,假设在借贷场景,判断某用户借贷风险程度,如果该用户的风险较高,会增加金融平台的资损风险,因此,这个问题就可以看作为一个二分类问题(高风险不可借贷/低风险可借贷)。常规技术中,如果是人工设计规则或使用简单的线性分类模型,预测准确度上通常较差;而传统深度神经网络准确度高,但不能提供良好的解释性,比如对用户不可借贷原因的解释,如历史借贷存在违约、使用相关金融平台次数非常低(新用户)、共享单车经常违规停车等等,这时如果不能给出合理的解释,就会影响用户体验。
因此,亟需提供一种可解释的深度神经网络,可以兼顾良好的预测效果,和可解释性。
发明内容
本说明书一个或多个实施例描述了一种针对业务模型进行数据预处理的方法及装置,提出一种新的业务模型架构,充分考虑各个网络层上的各个业务特征相对于相应业务类别的重要度,在提高业务模型的准确度的同时,可以追溯各个特征的重要度,为业务模型处理实际分类业务提供较高的可追溯性。
根据第一方面,提供了一种针对业务模型进行数据预处理的方法,所述业务模型用于针对给定的业务数据从多个预定类别上确定出目标类别,所述业务模型包括多个深度网络,所述多个深度网络中的第一深度网络包括第一向量分配层和第一向量融合层,以及分别对应于所述多个预定类别的各个层标签向量;用于对所述业务模型进行数据预处理的训练样本包括第一样本,所述第一样本对应有第一样本标签;
所述方法包括:基于所述第一样本确定所述第一深度网络对应的多个业务特征上的各个样本特征值;通过所述第一向量分配层,为各个业务特征分别分配用于描述相应样本特征值的各个样本特征表达向量;利用所述第一向量融合层,通过以下方式对各个样本特征表达向量执行向量融合操作:从各个层标签向量中,获取与所述第一样本标签对应的第一层标签向量;基于各个样本特征表达向量分别与所述第一层标签向量的相关性,确定各个业务特征分别对应的各个样本重要度系数;利用各个样本重要度系数融合各个样本特征表达向量,得到所述第一深度网络的样本输出向量;以最大化所述样本输出向量与所述第一深度网络的目标向量的相关度为目标,至少更新各个业务特征各自对应的样本特征表达向量及所述第一层标签向量。
在一个实施例中:在所述第一深度网络是第一个深度网络的情况下,所述多个业务特征上的各个样本特征值从所述第一样本中提取;在所述第一深度网络是第二个或以后的深度网络时,所述多个业务特征上的各个样本特征值通过前一深度网络的样本输出向量确定。
根据一个实施例,所述多个业务特征包括第一特征,所述第一特征对应m1个离散特征值,所述m1个离散特征值分别对应m1个候选向量;所述通过所述第一向量分配层,为各个业务特征分别分配用于描述相应样本特征值的各个样本特征表达向量包括:从所述m1个离散特征值中确定与所述第一特征的样本特征值大小最接近的离散特征值;将所述最接近的离散特征值对应的候选向量,确定为针对所述第一样本,对应所述第一特征的样本特征表达向量。
根据一个实施例,所述多个业务特征包括第二特征,所述第二特征对应m2个数值区间,所述m2个数值区间分别对应m2个候选向量;所述通过所述第一向量分配层,为各个业务特征分别分配用于描述相应样本特征值的各个样本特征表达向量包括:针对所述第一样本在所述第二特征上的样本特征值,检测在所述m2个数值区间中所落入的第一数值区间;将所述第一数值区间对应的候选向量确定为,针对所述第一样本,对应所述第一特征的样本特征表达向量。
根据一个实施例,所述多个业务特征包括第三特征,所述第三特征对应第三样本特征表达向量,所述基于各个样本特征表达向量分别与所述第一层标签向量的相关性,确定各个业务特征分别对应的各个样本重要度系数包括:基于所述第三样本特征表达向量与所述第一层标签向量的相似度,确定所述第三特征对应的重要度因子,其中,所述第三特征对应的重要度因子和所述第三样本特征表达向量与所述第一层标签向量的相似度正相关;将所述第三重要度因子与所述多个业务特征分别对应的各个重要度因子之和的比值,作为所述第一样本对应所述第三特征的样本重要度系数。
在一个进一步的实施例中: 在所述第一层标签向量的维数与所述第三样本特征表达向量的维数一致的情况下,所述第三样本特征表达向量与所述第一层标签向量的相似度为,所述第三样本特征表达向量与对应于所述第一层标签向量的乘积;在所述第一层标签向量的维数与所述第三样本特征表达向量的维数不一致的情况下,所述第三样本特征表达向量与所述第一层标签向量的相似度为,所述第三样本特征表达向量、辅助矩阵与所述第一层标签向量的乘积。
根据一个实施例,所述利用各个样本重要度系数融合各个样本特征表达向量,得到所述第一深度网络的样本输出向量包括:将以各个样本重要度系数为样本相应特征表达向量的权重,对各个样本特征表达向量加权求和得到的和向量,作为所述第一深度网络的样本输出向量。
根据一个实施例,所述以最大化所述样本输出向量与所述第一深度网络的目标向量的相关度为目标,至少更新各个业务特征各自对应的样本特征表达向量及所述第一层标签向量包括:令损失函数与以下项负相关:所述样本输出向量与所述目标向量的相关度;向损失函数减小的方向,至少调整各个业务特征各自对应的样本特征表达向量及所述第一层标签向量。
在一个进一步的实施例中,所述损失函数还与以下项正相关:所述样本输出向量与所述第一深度网络的负例参考向量的相关度,其中,所述负例参考向量是从所述目标向量之外随机选择的其他参考向量。
根据一个实施例,所述多个业务特征包括第四特征,所述第四特征对应m3个候选向量,所述以最大化所述样本输出向量与所述第一深度网络的目标向量的相关度为目标,至少更新各个业务特征各自对应的样本特征表达向量及所述第一层标签向量包括:以最大化所述样本输出向量与所述第一深度网络的目标向量的相关度为目标,调整所述第四特征对应的第四样本特征表达向量;从所述m3个候选向量中检测与调整后的第四样本特征表达向量相似度最高的候选向量;用调整后的第四样本特征表达向量更新所确定的相似度最高的候选向量。
在一个进一步的实施例中,所述方法还包括:利用所更新的候选向量确定所述第四特征的目标值;基于所述第四特征的目标值生成前一深度网络对应的目标向量,用以更新所述业务模型的前一深度网络中的相应数据。
在另一个进一步的实施例中,在所述第一深度网络是所述业务模型的最后一个深度网络的情况下,所述第一深度网络的目标向量是所述第一样本标签对应的标签向量。
根据第二方面,提供了一种利用业务模型处理分类业务的方法,所述业务模型用于针对待处理的业务数据从所述多个预定类别上确定出目标类别,所述业务模型包括多个深度网络,所述多个深度网络中的第一深度网络包括第一向量分配层和第一向量融合层,以及分别对应于所述多个预定类别的各个层标签向量,所述第一深度网络通过如第一方面提供的方式进行数据预处理;
针对所述多个预定类别中的第一类别,所述方法包括:获取待处理的业务数据在所述第一深度网络对应的多个业务特征上的各个特征值;通过所述第一向量分配层,为各个业务特征分别分配用于描述相应特征值的各个特征表达向量;利用所述第一向量融合层,通过以下方式对各个特征表达向量执行向量融合操作:从各个层标签向量中,获取与所述第一类别对应的第二层标签向量;基于各个特征表达向量分别与所述第二层标签向量的相关性,确定各个业务特征分别对应的各个重要度系数;利用各个重要度系数融合各个特征表达向量,得到所述第一深度网络的输出向量;基于所述输出向量,确定所述待处理的业务数据对应的目标类别为所述第一类别的可能性。
在一个实施例中,所述基于所述输出向量,确定所述待处理的业务数据对应的目标类别为所述第一类别的可能性包括:基于所述输出向量,得到经过所述多个深度网络的逐层递进处理,确定的最终输出向量;检测所述最终输出向量与所述第一类别对应的标签向量的第一相似度;利用所述第一相似度衡量所述待处理的业务数据对应的目标类别为所述第一类别的可能性。
在一个进一步的实施例中,所述利用所述第一相似度衡量所述待处理的业务数据对应的目标类别为所述第一类别的可能性包括:对比所述第一相似度与各个其他相似度的大小,其中,各个其他相似度分别用于衡量所述待处理的业务数据对应的目标类别为所述多个预定类别中的其他各个类别的可能性;按照各个相似度的大小对比结果确定所述第一类别是否为所述待处理的业务数据的目标类别。
在一个实施例中,在所述第一深度网络是第一层,所述第一类别被确定为所述待处理的业务数据对应的目标类别的情况下,所述方法还包括:按照各个重要度系数由大到小的顺序,确定重要度系数最大的预定数量的业务特征;将所确定的预定数量的业务特征作为目标特征。
根据第三方面,提供了一种针对业务模型进行数据预处理的装置,所述业务模型用于针对给定的业务数据从多个预定类别上确定出目标类别,所述业务模型包括多个深度网络,所述多个深度网络中的第一深度网络包括第一向量分配层和第一向量融合层,以及分别对应于所述多个预定类别的各个层标签向量;用于对所述业务模型进行数据预处理的训练样本包括第一样本,所述第一样本对应有第一样本标签;所述装置包括:
获取单元,配置为基于所述第一样本确定所述第一深度网络对应的多个业务特征上的各个样本特征值;
向量分配单元,配置为通过所述第一向量分配层,为各个业务特征分别分配用于描述相应样本特征值的各个样本特征表达向量;
向量融合单元,配置为利用所述第一向量融合层,通过以下方式对各个样本特征表达向量执行向量融合操作:从各个层标签向量中,获取与所述第一样本标签对应的第一层标签向量;基于各个样本特征表达向量分别与所述第一层标签向量的相关性,确定各个业务特征分别对应的各个样本重要度系数;利用各个样本重要度系数融合各个样本特征表达向量,得到所述第一深度网络的样本输出向量;
调整单元,配置为以最大化所述样本输出向量与所述第一深度网络的目标向量的相关度为目标,至少更新各个业务特征各自对应的样本特征表达向量及所述第一层标签向量。
根据第四方面,提供了一种利用业务模型处理分类业务的装置,所述业务模型用于针对待处理的业务数据从所述多个预定类别上确定出目标类别,所述业务模型包括多个深度网络,所述多个深度网络中的第一深度网络包括第一向量分配层和第一向量融合层,以及分别对应于所述多个预定类别的各个层标签向量,所述第一深度网络通过如第三方面的装置进行数据预处理;第四方面提供的装置包括以下单元,针对所述多个预定类别中的第一类别:
获取单元,配置为获取待处理的业务数据在所述第一深度网络对应的多个业务特征上的各个特征值;
向量分配单元,配置为通过所述第一向量分配层,为各个业务特征分别分配用于描述相应特征值的各个特征表达向量;
向量融合单元,配置为利用所述第一向量融合层,通过以下方式对各个特征表达向量执行向量融合操作:从各个层标签向量中,获取与所述第一类别对应的第二层标签向量;基于各个特征表达向量分别与所述第二层标签向量的相关性,确定各个业务特征分别对应的各个重要度系数;利用各个重要度系数融合各个特征表达向量,得到所述第一深度网络的输出向量;
决策单元,配置为基于所述输出向量,确定所述待处理的业务数据对应的目标类别为所述第一类别的可能性。
根据第五方面,提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行第一方面或第二方面的方法。
根据第六方面,提供了一种计算设备,包括存储器和处理器,其特征在于,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现第一方面或第二方面的方法。
通过本说明书实施例提供的方法和装置,针对用于处理分类业务的业务模型通过多个深度网络实现,在多个深度网络中,通过引入描述不同特征值的特征表达向量,以及与各个分类类别分别对应的各个层标签向量,可以在每一个深度网络中,都充分考虑各个业务特征对于相应分类类别的重要度。在利用业务模型进行目标类别确定时,可以针对每个分类类别确定其作为待处理的业务数据的目标类别的可能性,从而提高业务模型的准确度,并且由于在各个深度网络中确定了相应业务特征的重要度系数,使得业务模型的业务处理结果具有可追溯性,提高使用体验。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1示出本说明书技术构思的实施架构示意图;
图2示出本说明书技术构思下对业务模型进行数据预处理的实施架构示意图;
图3示出根据一个实施例的针对业务模型进行数据预处理的方法流程图;
图4示出根据一个实施例的利用业务模型进行分类业务处理的方法流程图;
图5示出本说明书技术构思中利用业务模型进行分类业务处理的实施架构示意图;
图6示出根据一个实施例的针对业务模型进行数据预处理的装置的示意性框图;
图7示出根据一个实施例的利用业务模型进行分类业务处理的装置的示意性框图。
具体实施方式
下面结合附图,对本说明书提供的方案进行描述。
图1示出了根据本说明书技术构思的一个总的实施架构示意图。图1的实施架构针对的业务模型可以用于处理各种分类业务。分类业务即,根据业务数据从多个预定类别中确定出相应的目标类别的业务。这里的分类业务例如可以具体为目标识别业务(如对应业务类别包括人物图片、非人物图片等)、决策业务(如对应业务类别为非高风险用户允许借贷、高风险用户不允许借贷等),等等。
如图1所示,在本说明书的技术构思下,业务模型可以包括多个(至少2层)深度网络。各个深度网络按照次序依次相连。第一个深度网络的输出向量作为第二个深度网络的输入向量(也可以称为业务特征向量),以此类推。各个深度网络的输入向量中,每个向量元素可以作为该深度网络在相应业务特征上的特征值。图1示出的业务模型架构中,包括k-1个深度网络,在第k层网络中,将第k-1层的输出向量与具体分类类别对应的标签向量进行相似性比较。就整体而言,本说明书技术构思的基本思想是,业务模型接收业务特征向量,并逐个深度网络迭代传递处理,根据最后一个深度网络得到的输出向量,在最后一层网络(如图1所示的第k个网络)中检测该最终的输出向量与分类类别对应的标签向量的相似性,从而最终确定目标类别。这里,由于最后一层(第k层)网络之前的其他各个网络的结构相似,都可以称为深度网络。下面对各个深度网络进行详细介绍。
如图1所示,具体到每个深度网络中,可以至少包括向量分配层和向量融合层,还可以对应有各个分类类别分别在当前深度网络中的各个层标签向量。可以理解,如果将每个深度网络看作一个大的层单元,该层单元上针对单个分类类别进行描述的向量可以称为相应分类类别的层标签向量。图2示出了一个对业务模型进行数据预处理的具体架构,其中包含了更详细的深度网络原理信息。参考图2所示,假设业务模型的分类类别有3个时,每一个深度网络中可以对应3个层标签向量,分别与3个分类类别一一对应。在业务模型训练过程中,层标签向量可以体现相应样本标签的特点,从而起到辅助作用。
可以理解的是,每个深度网络可以接收一个业务特征向量,业务特征向量中的各个元素,可以描述当前深度网络的相应特征,也就是相应业务特征上行的特征值。在第一个深度网络中,各个业务特征可以是直接从业务数据中获取的,并可以对应有确切的含义,例如识别目标绵羊的业务数据中,卷曲毛为一个业务特征,当扫描到的目标包含卷曲毛属性时,相应特征值为1,否则相应特征值为0。在后续各个深度网络中(如第2至第k-1个深度网络),业务特征也可能是没有确切含义的,这样的特征通常不对应实际属性,而作为隐含特征。为了对各个深度网络进行统一描述,在本说明书中,将各个深度网络的特征统称为业务特征,例如图2中的x1 1、x1 2等等。
对于当前深度网络的各个业务特征,向量分配层可以用于为当前深度网络的各个业务特征分配相应特征值的表达向量。如图2所示,在每个深度网络中,可以针对单个业务特征对应有至少一个候选向量,来描述该单个业务特征上的不同特征值。如图2所示,假设业务模型包括k个子网络,第1至第k-1个子网络为深度网络,在单个深度网络上,针对单个业务特征,都可以按照可能的特征值大小,通过多个表达向量来描述。这多个表达向量可以称为相应业务特征的候选向量。当确定业务特征的具体特征值时,向量分配单元可以把相应候选向量分配给该业务特征,用于该业务特征上的当前特征表达向量。
在一种实施例中,可以将一个业务特征上所有可能的取值进行罗列,每个取值对应一个候选向量。例如,人的头发可以罗列出卷曲和直发两种状态,例如分别用0和1表示,那么表示头发弯曲状态的业务特征上,可能对应有两种状态的候选向量,如:0→向量A,1→向量B。在接收到该业务特征上的特征值为0时,将向量A分配到该特务特征作为当前的特征表达向量。
在另一种实施例中,一个业务特征的状态也可能是无法罗列的,其可以是连续状态,例如是在一种状态到另一种状态之间的任意状态。以人的肤色为例,将如将白色记为0,黑色记为1,则不同的人肤色可能为0-1之间的任意值。此时,可以将业务特征的可能特征值进行离散化处理,或称为分箱。即,将业务特征的可能状态进行离散划分,例如,将人的肤色划分为5种状态(或5个等级),分别对应0-1之间的5个特征值,或者5个区间。每个状态可以对应当前业务特征(如人的肤色)的一个候选向量,用于描述该状态下的特征值。在通过5个特征值表示人的肤色的5种状态的情况下,例如是0.1、0.3、0.5、0.7、0.9,当接收到真实的特征值时,可以检测真实的特征值更接近哪个数值,就将相应状态确定为真实特征值对应的状态。在通过5个区间表示人的肤色的5种状态的情况下,可以用阈值进行描述,例如0.2、0.4、0.6、0.8、1.0,各个数值分别表示当前状态的特征值的最大值,或者还可以用区间表示,如[0,0.2)、[0.2,0.4)、[0.4,0.6)、[0.6,0.8)、[0.8,1]等,每个区间表示一种状态。接收到相应特征的真实特征值落入的区间,可以确定为真实特征值对应的状态区间。
作为示例,假设当前深层网络接收的特征向量是经过归一化处理的向量,即所有元素和为1,各个业务特征对应的特征值(向量中的各个元素)都在0-1区间内。当前深层网络接收到业务特征向量时,向量分配层分别按照各个业务特征在业务特征向量中对应的特征值,从相应业务特征各自的候选向量中,为其分配特征表达向量。假设该层的两个层特征为x1和x2,x1通过数值0.1、0.3、0.5、0.7、0.9表示5种特征状态,x2通过区间[0,0.3)、[0.3,0.4)、[0.4,0.6)、[0.6,1)表示4中状态。如果接收到的特征向量为(0.28,0.72),对于业务特征x1,特征值为0.28,由于更接近数值0.3,则可以向其分配0.3对应的候选向量作为特征表达向量,对于业务特征x2,特征值为0.72,落入区间[0.6,1),则将业务特征x2的区间[0.6,1)对应候选向量作为其当前的特征表达向量。
可以理解的是,业务特征向量的维度与候选向量的维度可以相互独立,如图2中,假设第一个深度网络对应有n0个业务特征,每个业务特征分别可以对应至少一个n1维的候选向量,其中,n0和n1之间可以相互独立,其可以相同也可以不相同,在此不作限定。第2至第k-1个深度神经网络中,各层的业务特征向量的维度与前一深度网络的候选向量的维度一致。
进一步地,向量融合层可以对向量分配层为各个业务特征分配的特征表达向量进行融合,得到当前深度网络的输出向量。在对特征表达向量进行融合的过程中,可以先根据特征表达向量与层标签向量的相似性,确定相应业务特征在当前深度网络中的重要性,该重要性例如用重要度系数表示。之后,向量融合层可以根据重要度系数融合当前深度网络中的各个特征表达向量,得到输出向量。在第1至第k-1个深度网络中,当前深度网络的输出向量可以作为下一网络的输入向量,第1至第k-2个深度网络的输出向量中的各个元素对应下一深度网络中的各个业务特征的特征值。
值得说明的是,关于层标签向量,由于单个深度网络中对应有各个分类类别的层标签向量,在对业务模型进行数据预处理阶段,训练样本的样本标签(即目标类别)是确定的,因此,可以根据该确定的样本标签,获取当前深度网络中相应的层标签向量。在通过业务模型为业务数据在多个分类类别中确定目标类别时,由于业务数据的目标类别是不确定项,因此,可以选定一个分类类别,作为当前的待判定类别,从而在每层深度网络中可以获取该选定的待判定类别对应的层标签向量,检测业务数据的目标类别为该待判定类别的可能性。
如此,由于在每个深度网络中,都要对当前深度网络中各个业务特征的重要性进行检测,因此,有利于根据业务特征的重要度系数进行溯源,使得业务模型具有可解释性。
下面分别从针对业务模型的数据预处理,以及使用业务模型为业务数据确定目标类别两方面详细描述本说明书的技术构思。
图3示出一个实施例的针对业务模型进行数据预处理的流程。其中,这里的业务模型可以是用于分类业务的模型,即针对给定的业务数据从多个预定业务类别中确定出至少一个目标类别。这里的业务数据可以是文字、图像、语音、视频等各种类型的数据。例如,在目标识别(如识别狗)的分类业务中,业务数据可以是图片,预定业务类别可以是预定目标(如狗图片)、非预定目标(如非狗图片)等等。该流程的执行主体可以是具有一定计算能力的系统、设备、装置、平台或服务器。
如图1和图2所示,业务模型可以包括多个深度网络。这里为了描述方便,在图3的流程中选择多个深度网络(例如图1或图2中的第1至第k-1个深度网络)中的任一个深度网络(这里称为第一深度网络)为例,针对第一样本进行数据预处理的过程进行描述。其中,第一样本可以包括样本业务数据,并对应有第一样本标签。可以理解,业务数据可以是用于描述与当前业务相关的各种业务属性或状态的数据,例如,在借贷业务中,一条业务数据可以对应一个用户,包括用户历史借贷行为、职业等基本信息画像、消费倾向等等。样本业务数据可以是作为训练样本的业务数据,各个训练样本都可以对应有预先标注的样本标签。例如,针对第一样本,预先标注有“高风险用户”或“低风险用户”的样本标签。
通过第一样本,可以提取相应的样本特征,多个样本特征构成样本特征向量输入业务模型。由于业务模型对数据的层层递进处理,可以根据该输入的样本特征向量,确定第一深度网络的各个业务特征上的特征值。在第一深度网络中,还可以对应有与多个预定类别一一对应的各个层标签向量,其中包括与第一样本标签相应的第一层标签向量。
以第一样本为例,如图3所示,针对业务模型进行数据预处理的方法可以包括以下步骤:步骤301,基于第一样本确定第一深度网络对应的多个业务特征上的各个样本特征值;步骤302,通过第一向量分配层,为各个业务特征分别分配用于描述相应样本特征值的各个样本特征表达向量;步骤303,利用第一向量融合层,通过以下方式对各个样本特征表达向量执行向量融合操作:从各个层标签向量中,获取与第一样本标签对应的第一层标签向量;基于各个样本特征表达向量分别与第一层标签向量的相关性,确定各个业务特征分别对应的各个样本重要度系数;利用各个样本重要度系数融合各个样本特征表达向量,得到第一深度网络的样本输出向量;步骤304,以最大化样本输出向量与第一深度网络的目标向量的相关度为目标,至少更新各个业务特征各自对应的样本特征表达向量及第一层标签向量。
值得说明的是,图2示出的是本说明书实施架构下,一个具体例子的对业务模型进行数据预处理的架构示意图,在图3示出的流程中,结合图2示出的架构进行描述。
首先,在步骤301中,基于第一样本确定第一深度网络对应的多个业务特征上的各个样本特征值。
可以理解,通过第一样本,可以提取初始的样本特征。初始的样本特征可以通过向量形式表示。向量中的各个元素对应着相应样本特征的特征值。例如,样本特征包括用户历史借贷次数,那么用户历史借贷次数如5,可以作为初始的样本特征向量中相应元素的值。在可选的实施例中,还可以对初始的样本特征上的特征值进行归一化。例如包含特征历史借贷次数、历史守约次数、大额消费频率(次/月)、职业类型对应的收入等级(如分为1-10级),从业务数据中得到具体数值构成的向量为(8,6,2,4),则可以将该向量作为初始的样本特征向量,也可以将其归一化为(0.4,0.3,0.1,0.2)作为初始的样本特征向量。
初始的样本特征向量,通常是对应着业务模型第一个深度网络的特征向量。因此,在第一深度网络是第一个深度网络的情况下,初始的样本特征向量可以是输入第一深度网络的特征向量,初始的样本特征向量中的各个元素,分别为第一深度网络的相应业务特征上的特征值。
结合图2对本说明书技术构思的描述,第2及之后的各个深度网络,可以接收前一个深度网络的输出向量,作为当前的深度网络的业务特征向量,因此,有了第一层的样本特征向量,可以根据当前的模型参数逐层确定后续各个深度网络的业务特征向量。在第一深度网络是第2或之后的某个深度网络(如图1中的第2至k-1个深度网络)的情况下,第一深度网络的各个业务特征上的特征值可以由前一个深度网络的输出向量获取。前一个深度网络的输出向量中的各个元素,分别是第一深度网络相应业务特征上的特征值。
在可选的实施例中,第一深度网络各个业务特征上的特征值还可以是归一化的特征值。即,各个业务特征上的特征值之和为1。归一化的方式例如是当前元素的归一化结果为,当前元素与各个元素之和的比值。例如,前一个深度网络的输出向量为(3,1),经过归一化后,得到向量(0.75,0.25)。则第一深度网络上的两个业务特征的特征值分别为0.75、0.25。
接着,在步骤302,通过第一向量分配层,为各个业务特征分别分配用于描述相应样本特征值的各个样本特征表达向量。如前文所述,在本说明书技术构思下,每个业务特征可以按数值、区间等划分为多个状态,对于属于不同状态的特征值,可以对应有不同的候选向量。针对真实的特征值,可以将相应候选向量分配给相应业务特征,作为当前特征值下的特征表达向量。在本说明书中,为了区分训练样本和待处理的业务数据,可以将第一样本对应的特征值称为样本特征值,将第一样本对应的特征表达向量称为样本特征表达向量。
其中,对每个业务特征而言,离散化的多个状态可以通过中位值、分割值、区间等各种方式表达,在此不作限定。各个业务特征各自离散化过程中,离散化规则可以相同,也可以不同,视具体业务需求而定。
候选向量中的各个元素可以通过预定方式初始化,并在本说明书实施例的数据预处理流程中进行迭代调整。这里的预定方式例如是针对各个元素在预定数值范围内完全随机赋值、在预定数值区间(如0-1)内保证各元素和不超过预定值(如1)的情形下随机赋值,等等。初始的候选向量经过调整后,在当前流程中,对应经过前一次调整后的结果。
对于步骤301获取的单个业务特征上的单个特征值,可以先确定出相应特征状态。也就是对应到哪个中位值、分割值或区间等。假如将第一深度网络的业务特征中的任意业务特征记为第一特征,如果第一特征对应m1个离散特征值,则m1个离散特征值分别对应m1个候选向量,可以从m1个离散特征值中确定与第一样本在该第一特征上的特征值大小最接近的离散特征值,并将该最接近的离散特征值对应的候选向量确定为,针对第一样本,第一特征对应的样本特征表达向量。对于另一个业务特征,例如为第二特征,如果第二特征对应m2个数值区间, m2个数值区间分别可以对应m2个候选向量,针对第一样本在第二特征上的特征值,可以检测其在m2个数值区间中落入的第一数值区间,并将第一数值区间对应的候选向量确定为,针对第一样本,第一特征对应的样本特征表达向量。
具体地,结合图2的示例,假设第一深度网络为第1个深度网络,第一特征为x1 1,第一样本对应于第一特征的特征值为0.77,可以对应到0.7的特征状态,或者[0.6,0.8)的特征状态,那么可以用描述0.7或者[0.6,0.8)的特征状态对应的候选向量,例如是f12 1,作为样本特征表达向量来描述第一样本的该业务特征x1 1。更具体地,以第一深度网络为第k-1个深度网络,包括2个业务特征为例,业务特征x1 k-1、x2 k-1均对应0.1、0.3、0.5、0.7、0.9五个状态的候选向量为例,由第k-2个深度网络得到的输出向量用(x1 k-1,x2 k-1)表示,两个元素x1 k-1、x1 k-1分别对应第k-1层的2个业务特征,假设x1 k-1的特征值为0.75,对应到第k-1层第1个业务特征的第4个状态(0.7对应的状态),则该特征值可以通过第k-1层第1个特征的第4个候选向量f14 k-1=(a141 k-1,a142 k-1,a143 k-1)来描述, x2 k-1为0.25,对应到第k-1层第2个特征的第2个状态(0.3对应的状态),则可以通过第k-1层第2个特征的第2个候选向量f22 k-1=(a221 k-1,a222 k-1,a223 k-1)来描述。
如此,可以针对第一样本,对于第一深度网络中的各个业务特征,分别从各自的候选向量中确定针对步骤301获取的业务特征的特征值的样本特征表达向量。
然后,通过步骤303,利用第一向量融合层,对各个样本特征表达向量执行向量融合操作。可以理解,步骤302中确定的样本特征表达向量描述了第一样本在第一深度网络的各个业务特征,因此,在第一深度网络中,针对第一样本,对各个业务特征的融合可以转化为对各个样本特征表达向量的融合。也就是说,各个样本特征表达向量的融合结果可以代表针对第一样本,对各个业务特征的融合结果。
在本说明书架构下,在对各个样本特征表达向量的融合过程中,为了确定各个业务特征的重要度,引入与分类类别对应的层标签向量。在第一深度网络中,可以有各个类别分别对应的各个层标签向量。其中,第一样本标签对应的层标签向量相应称为第一层标签向量。层标签向量可以作为业务模型数据预处理过程中待确定的模型参数。与候选向量相似地,层标签向量也可以通过预定方式初始化,并在业务模型的预处理过程中,通过样本业务数据迭代调整。在当前流程中,层标签向量是前一次调整后的当前向量,在此不再赘述。
步骤303的向量融合操作的具体思想可以为:从各个层标签向量中,获取与第一样本标签对应的第一层标签向量;基于各个样本特征表达向量分别与第一层标签向量的相关性,确定各个业务特征分别对应的各个样本重要度系数;利用各个样本重要度系数融合各个样本特征表达向量,得到第一深度网络的样本输出向量。
容易得知,在常规的神经网络中,每一层的业务特征可以对应相应的权重,当神经网络训练结束时,各个业务特征对应的权重可以确定下来。然而,在实际的业务数据中,每条业务数据各不相同,那么各个业务特征的重要度也会不同。在本说明书的实施架构下,考虑业务特征在不同的特征值组合(即各个业务特征取不同的值)下对于最终结果具有不同的贡献度。也就是说,该步骤303基于一个假设,在第一深度网络中,一个业务特征对应的样本特征表达向量与第一深度网络中对应于第一样本标签的层标签向量(即上述的第一层标签向量)的相关性越高,该业务特征对于第一样本分类到第一样本标签的贡献度越大。
据此,从各个层标签向量中获取与第一样本标签对应的第一层标签向量后,可以基于各个样本特征表达向量分别与第一层标签向量的相关性,确定各个业务特征分别对应的各个样本重要度系数。这里的重要度系数就可以描述出相应业务特征对于第一样本分类到第一样本标签的贡献度。或者说当前业务特征对于第一样本标签的重要程度。
根据一种实施方式,可以将单个样本特征表达向量与第一层标签向量的余弦系数、Jaccard相似系数等等作为相应的相关性衡量指标。以余弦系数为例,向量x、y的相似度通常为cosθ=(x
Figure 562881DEST_PATH_IMAGE001
y)/(|x|
Figure 794142DEST_PATH_IMAGE001
|y|),θ为向量x、y之间的夹角。余弦系数越大,两个向量的越相关。假设第一深度网络中的2个业务特征对应的样本特征表达向量分别为:x1 i→f4 i=(a41 i,a42 i,a43 i)、x2 i→f2 i=(a21 i,a22 i,a23 i),第一层标签向量为yi→fy i=(by1 i,by2 i,by3 i),则这2个业务特征的样本重要度系数分别可以为:
Figure 693834DEST_PATH_IMAGE002
Figure 352348DEST_PATH_IMAGE003
其中,
Figure 986592DEST_PATH_IMAGE004
为x1 i与yi之间的夹角,
Figure 287123DEST_PATH_IMAGE005
为x2 i与yi之间的夹角。
根据另一种实施方式,可以利用注意力机制,将各个样本特征表达向量的注意力值作为衡量相应样本特征重要度的指标。根据注意力机制,各个样本特征表达向量对应的注意力值(重要度系数)可以是当前业务特征相对于第一层标签向量的重要度因子与各个业务特征相对于对第一层标签向量的重要度因子之和的比值。其中,重要度因子可以与相应样本特征表达向量和第一层标签向量的乘积正相关。
以下以第一深度网络中有n1个业务特征,其中包括的第三特征为例进行说明。其中,这里的第三特征为了与前述的第一特征、第二特征在名称上进行区别,而不对特征本身进行其他限定,其可以是前述的第一特征或第二特征,在此不作限定。
例如,在第三特征是上述例子中提到的业务特征x1 i的情况下,其样本重要度系数可以表示为:
Figure 323212DEST_PATH_IMAGE006
在第三特征是上述例子中提到的业务特征x2 i的情况下,其重要度系数可以表示为:
Figure 152628DEST_PATH_IMAGE007
其中,
Figure 750532DEST_PATH_IMAGE008
表示相似度函数,对于两个向量
Figure 589175DEST_PATH_IMAGE009
Figure 683033DEST_PATH_IMAGE010
(j为1至n1之间的自然数),
Figure 198197DEST_PATH_IMAGE011
可以称为向量
Figure 275874DEST_PATH_IMAGE009
所描述的业务特征的重要度因子。
Figure 918208DEST_PATH_IMAGE008
可以是包括但不限于以下定义的相似度确定方式:
Figure 397731DEST_PATH_IMAGE012
Figure 585261DEST_PATH_IMAGE013
其中,
Figure 415814DEST_PATH_IMAGE014
为权重矩阵,在
Figure 861839DEST_PATH_IMAGE009
Figure 195868DEST_PATH_IMAGE015
的维度不同的情况下,可以通过权重矩阵进行辅助运算,因此也可以称之为第i层的辅助矩阵。
在更多实施方式中,还可以有更多合理的样本重要度系数确定方式,在此不再赘述。
得到第一样本在各个业务特征分别对应的各个重要度系数之后,还可以利用各个样本重要度系数融合各个样本特征表达向量,得到第一深度网络的样本输出向量。
在一个实施例中,可以利用各个样本重要度系数分别作为各个业务特征的权重,对各个业务特征的样本特征表达向量进行加权求和,得到的和向量(向量融合结果)作为输出向量。例如,将第一深度网络记为第i个深度网络,相应的输出向量记为
Figure 69146DEST_PATH_IMAGE016
,则有:
Figure 573946DEST_PATH_IMAGE017
这里,
Figure 292503DEST_PATH_IMAGE018
为第一深度网络中第j个业务特征当前的样本特征表达向量,
Figure 12197DEST_PATH_IMAGE019
为第j个业务特征对应的重要度系数。对于第一样本来说,输出向量
Figure 56377DEST_PATH_IMAGE016
中的各个元素例如是x1 i+1、x2 i +1、……xni i+1,可以作为下一个深度网络的各个业务特征上的样本特征值。
在进一步的实施例中,为了增加模型的非线性表现能力,还可以在加权求和的基础上添加偏移项,并利用激励函数处理相关结果,得到第一深度网络的输出向量。例如:
Figure 343745DEST_PATH_IMAGE020
其中,
Figure 131572DEST_PATH_IMAGE021
作为偏移项,是业务模型的模型参数,激励函数
Figure 705773DEST_PATH_IMAGE022
还可以通过其他激励函数代替。
如此,在第一深度网络,可以利用样本特征表达向量代替特征值,并按照样本重要度系数指示的重要度信息融合各个样本特征表达向量,得到输出向量。可以理解,对于第一深度网络而言,输出向量与业务特征的样本特征表达向量具有相同维度,该维度可以与业务特征数量相同,也可以与业务特征数量不同。如图2所示,第一个深度网络的业务特征为n0个,对应输出向量维度为n1,则第二个深度网络的业务特征为n1个,对应输出向量维度为n2……
在另一个实施例中,如果输出向量的维度和业务特征的个数相同,还可以利用业务特征向量与样本重要度系数向量的圈积来得到输出向量。如:
Figure DEST_PATH_IMAGE023
其中,
Figure 389696DEST_PATH_IMAGE024
表示第i个深度网络中的业务特征向量(或第i-1个深度网络中的输出向量),
Figure 416557DEST_PATH_IMAGE016
表示第i个深度网络中的输出向量,
Figure 8076DEST_PATH_IMAGE025
表示各个业务特征对应的各个样本重要度系数构成的向量。⊙表示将两个矩阵的对应元素相乘(如哈达玛积)。例如,向量(A,B,C)⊙(a,b,c)的结果为(Aa,Bb,Cc)。
在更多实施例中,还可以通过其他方式对样本特征表达向量进行融合,以确定第一深度网络的输出向量,在此不再赘述。如图2所示,第一深度网络的输出向量,可以被下一个网络获取,也就是说,该输出向量是输出到下一个网络的向量。当下一个网络仍是深度网络时,该输出向量是下一个深度网络的业务特征向量,为下一个深度网络的各个业务特征提供相应特征值。
在该步骤303中,在对各个业务特征分别对应的样本特征表达向量融合过程中,充分考虑各个业务特征针对第一层标签向量的重要程度,而第一层标签向量是与第一样本标签对应的,相当于最终考虑了各个业务特征对于第一样本标签的贡献度,使得模型在第一深度网络中更多地关注更重要的业务特征。
如此,每一个深度网络中,对相应样本标签向量的当前更重要的业务特征通过样本重要度系数给予更多的关注度。经过各个深度网络逐层传递,使得最后一层(如图2中的第k层)得到的输出向量能够体现各层的业务特征的重要性特点,从而模型具有可追溯性。
接着,通过步骤304,以最大化样本输出向量与第一深度网络的目标向量的相关度为目标,至少更新各个业务特征各自对应的样本特征表达向量及第一层标签向量。
可以理解,在业务模型的数据预处理过程中,目的是通过训练样本,将业务模型中的通用参数确定下来。这些参数例如可以包括各个深度网络中的候选向量、层标签向量等,可选地,还可以包括辅助矩阵、常数参数等等。更新这些参数的最终目的,是使得最后一层网络(如图2中的第k层)得到的输出向量与样本标签向量更接近。对于第一样本而言,这里的样本标签向量,就是预先标注的第一样本标签对应的标签向量。值得说明的是,在机器学习领域,分类模型对应的分类类别可以通过字符或数字表示。在本实施例中,各个分类类别通过标签向量表示,并且各个分类类别与各个标签向量具有一一对应关系。
参数调整过程是一个由果究因的过程。就业务模型整体来说,在本说明书实施架构下,可以反向逐层溯源调整业务模型的相关参数。为了描述方便,可以参考图2所示。为了使得第k层得到的向量(第k-1个深度网络的输出向量)与第一样本标签更接近,可以将第一样本标签对应的样本标签向量,作为第k-1个深度网络的输出向量的目标向量,以最大化第k-1个深度网络的输出向量与第一样本标签对应的标签向量的相关度为目标,调整第k-1层上的样本特征表达向量,以及与第一样本标签对应的层标签向量,使得由第k-1层上的样本特征表达向量和层标签向量确定的重要度系数,可以得到更接近第一样本标签对应的标签向量的输出向量。
第k-1个深度网络的输出向量与第一样本标签对应的标签向量的相关度,例如可以通过诸如余弦相似性、方差、平均绝对误差、总体相对误差、欧氏距离等等方式确定。其中,余弦相似性越大,两个向量的相关度越大,方差、平均绝对误差、总体相对误差、欧氏距离等等越小,两个向量的相关度越大。
根据一个实施方式,可以令第k-1个深度网络的损失函数与“第k-1个深度网络的输出向量与第一样本标签对应的标签向量的相关度”负相关。向损失函数减小的方向调整第k-1个深度网络的各个业务特征各自对应的特征表达向量及与第一样本标签对应的层标签向量(如第一层标签向量)。例如作为一个具体示例,第k-1个深度网络对应的损失函数例如可以为:
Figure 623734DEST_PATH_IMAGE026
其中,σ表示激励函数sigmoid函数(也可以替换为其他激励函数),
Figure DEST_PATH_IMAGE027
表示第k-1个深度网络的输出向量
Figure 478557DEST_PATH_IMAGE028
的转置向量,
Figure 743448DEST_PATH_IMAGE029
为第一样本标签对应的标签向量,也就是第k-1层的目标向量。
Figure 341919DEST_PATH_IMAGE027
Figure 359554DEST_PATH_IMAGE029
的点积可以得到一个描述着两个向量的相似性的标量结果(点积越大,相似性越大)。令损失函数减小,则需要第k-1个深度网络的输出向量与第一样本标签对应的标签向量的点积增大,即相关度提高。其中,根据步骤303的向量融合操作可知,
Figure 182016DEST_PATH_IMAGE028
可以通过第k-1个深度网络中各个业务特征对应的样本特征表达向量与对应于第一样本标签的层标签向量确定,因此,可以通过调整各个样本特征表达向量与相应的层标签向量,令当前的损失函数减小。
在可选的实施例中,为了使得模型参数具有更快的收敛速度,还可以随机确定预定数量的负标签,同时基于第k-1个深度网络的输出向量与第一样本标签及负标签分别对应的标签向量的对比,调整第k-1个深度网络中的相关参数。这里,负标签也可以理解为错误标签,是正确标签外的其他分类类别标签。例如,在目标识别业务中,一张样本图片为狗的图片,正确的样本标签(第一样本标签)为“狗”,负标签可能为“猫”或“羊”等。此时,模型参数的调整目标可以包括,第k-1个深度网络的输出向量与“狗”对应的标签向量的相关度尽可能大,同时,第k-1个深度网络的输出向量与负标签“猫”或“羊”等对应的标签向量的相关度尽可能小。在负标签有多个时,模型参数的调整目标还可以包括,第k-1个深度网络的输出向量与各个负标签对应的标签向量的相关度之和尽可能小。
可选地,损失函数还可以与“第k-1个深度网络的输出向量与与各个负标签对应的标签向量的相关度之和”正相关。在一个具体示例中,以上损失函数可以变更为:
Figure 432738DEST_PATH_IMAGE030
其中,
Figure DEST_PATH_IMAGE031
为预先设定的超参数,例如是2-10之间的数,
Figure 834900DEST_PATH_IMAGE032
是随机抽取的负标签,Y是当前业务模型的全部分类类别构成的集合。
可以理解,通过损失函数调整后的第k-1个深度网络上的样本特征表达向量,可以作为对第k-1个深度网络的各个业务特征当前被分配的样本特征表达向量。而样本特征向量是通过候选向量分配的,调整后的样本特征向量如果不在候选向量中,则违背了业务模型的构思初衷。
因此,在一个实施例中,还可以进一步根据样本特征表达向量的调整结果,调整候选向量。例如可以将调整后的某个样本特征表达向量与相应业务特征的多个候选向量分别进行比较,从中选择与该调整后的样本特征表达向量距离最近(或最相似)的候选向量,并用该调整后的样本特征表达向量更新该候选向量。为了描述方便,可以将第一深度网络的任一个特征称为第四特征(这里,名称为了与前文的第一特征、第二特征、第三特征进行区别,不对特征本身进行限定,其也可以是第一特征、第二特征、第三特征中的任一个特征),假设第四特征对应了m3个候选向量,则向损失函数减小的方向调整第四特征对应的第四样本特征表达向量之后,可以从m3个候选向量中确定与调整后的第四样本特征表达向量相似度最高的候选向量,将所确定的候选向量更新为调整后的第四样本特征表达向量。
而该被更新的候选向量也可能不是最初分配给相应业务特征的候选向量。例如,假如第k-1个深度网络的一个业务特征(如第前述的四特征)为x1 k-1,对应特征值0.3,样本特征表达向量为候选向量f12 k-1(第k-1层第1个层特征的第2个候选向量),按照损失函数调整f12 k-1,得到一个样本特征表达向量f12 (k-1)'。经过检测,样本特征表达向量f12 (k-1)'与业务特征x1 k-1对应的候选向量中的候选向量f14 k-1(第k-1层第1个层特征的第4个候选向量,对应特征值0.7)的距离最近。那么,可以将特征值0.7对应的候选向量f14 k-1调整为f2 (k-1)'
此时,对于业务特征为x1 k-1而言,对应着描述特征值0.7的候选向量f14 k-1(f2 (k -1)'),对应的特征值为0.3,两者不一致对应。
于是,在进一步的实施例中,还可以按照所更新的候选向量对应的特征状态所描述的特征值,根据调整后的样本表达向量所描述的特征值确定相应业务特征的目标值。例如,在前述例子中,可以将0.7作为业务特征x1 k-1的目标值。
可以理解,第k-1个深度网络的业务特征的目标值,也就是第k-2个深度网络的输出向量的相应元素的目标值。第k-1个深度网络的各个业务特征分别对应的各个目标值构成的向量,就可以作为第k-2个深度网络的输出向量的目标向量。
如图2所示,在第k-1个深度网络的模型参数调整完成后,为了进一步调整第k-2个深度网络的模型参数,还可以根据第k-1个深度网络的模型参数调整过程中确定的、第k-2个深度网络的输出向量的目标向量进行。以此类推,反向逐级调整各个深度网络对应的模型参数,并生成前一个深度网络的目标向量,直至第一个深度网络。
其中,第一个深度网络各个业务特征上的特征值由第一样本中的业务数据确定,且没有前一个深度网络,因此,无需再确定业务特征的目标值。根据一个可能的设计,在第一个深度网络中,对样本特征表达向量进行调整之后,可以用该调整后的样本特征表达向量取调整与相应业务特征的特征值对应的候选向量,而不是去查找最相近的候选向量进行调整。在前述的例子中,在k=2的情况下,第k-1个深度网络的业务特征x1 k-1,对应特征值0.3,样本特征表达向量为候选向量f12 k-1(第k-1层第1个层特征的第2个候选向量),按照损失函数调整f12 k-1,得到一个样本特征表达向量f12 (k-1)'。则用该样本特征表达向量f12 (k-1)'调整候选向量f12 k-1即可。
如此,通过大量训练样本,调整的模型参数可以覆盖到第一深度网络中的各个业务特征的候选向量,以及各个层标签向量,至模型参数(或损失函数)趋于收敛,从而完成对业务模型的数据预处理。
当对业务模型进行数据预处理完毕之后,可以利用处理好的业务模型进行相关分类业务处理。如图4所示,示出了利用业务模型进行分类业务处理的一个流程。该流程的执行主体可以是具有一定计算、处理能力的计算机。该流程可以用于针对待处理的业务数据,从多个候选业务类别中确定出一个业务类别。业务模型可以是通过图3示出的流程进行数据预处理得到的。
可以理解,图3示出的流程以业务模型中的第一深度网络为例进行描述,该第一深度网络可以是业务模型中的任意深度网络,在利用业务模型进行分类业务处理时,该第一深度网络必然会参与其中。因此,图4示出的流程中,仍以任一个深度网络为例进行说明,该任一个深度网络也可以是第一深度网络。为了便于描述,图4示出的流程仍以第一深度网络为例进行描述。相应地,第一深度网络包括第一向量分配层和第一向量融合层,以及与多个预定类别一一对应的各个层标签向量。值得注意的是,即使是同一个深度网络,图3示出的流程中的深度网络与图4示出的流程中的深度网络,模型参数也不一定相同。这是因为,图3示出的流程中,模型参数是被调整项,图4示出的流程中,模型参数是确定的。
对于从业务模型所针对的多个预定类别中选定的第一类别,图4示出的利用业务模型进行分类业务处理的流程包括:步骤401,获取待处理的业务数据在第一深度网络对应的多个业务特征上的各个特征值;步骤402,通过第一向量分配层,为各个业务特征分别分配用于描述相应特征值的各个特征表达向量;步骤403,利用第一向量融合层,通过以下方式对各个特征表达向量执行向量融合操作:从各个层标签向量中,获取与第一类别对应的第二层标签向量;基于各个特征表达向量分别与第二层标签向量的相关性,确定各个业务特征分别对应的各个重要度系数;利用各个重要度系数融合各个特征表达向量,得到第一深度网络的输出向量;步骤404,基于输出向量,确定待处理的业务数据对应的目标类别为第一类别的可能性。
首先,在步骤401,获取待处理的业务数据在第一深度网络对应的多个业务特征上的各个特征值。
从待处理的业务数据中,可以提取初始的特征向量。提取方法与步骤301类似,在此不再赘述。
在第一深度网络是第一个深度网络的情况下,第一深度网络的业务特征的各个特征值可以从所提取的初始的特征向量中的相应元素获取。
在第一深度网络是第一个深度网络之后的深度网络(如图2中的第2至k-1层)的情况下,其各个业务特征对应的特征值可以是由初始的特征向量从第一个深度网络起逐层计算确定的,其具体可以为前一个深度网络的输出向量中的相应元素。
接着,在步骤402,通过第一向量分配层,为各个业务特征分别分配用于描述相应特征值的各个特征表达向量。可以理解,第一深度网络中的单个业务特征,可以对应有至少一个候选向量,用于描述该单个业务特征的不同取值。当一个业务特征的特征值确定时,可以从相应的至少一个候选向量中找到对应的候选向量,作为该业务特征取该特征值时的特征表达向量。对于各个业务的各个层特征,都可以通过向量分配层,确定一个相应的特征表达向量。
进一步地,在步骤403,利用第一向量融合层,对各个特征表达向量执行向量融合操作。这里,第一类别可以是业务模型对应的分类类别中的任意一个类别。在第一深度网络中,可以包括与第一类别唯一对应的层标签向量,为了与图3流程中的第一样本对应的第一层标签向量进行区别,在该流程中可以称与第一类别对应的层标签向量为第二层标签向量。
层标签向量在业务模型的数据预处理流程中被确定,可以用于辅助检测各个业务特征相对于第一类别的重要度程度。本步骤403中,从各个层标签向量中获取与第一类别对应的第二层标签向量后,可以基于各个特征表达向量分别与第二层标签向量的相关性,确定各个业务特征分别对应的各个重要度系数。
这里,各个特征表达向量分别与第二层标签向量的相关性,可以体现出针对当前待处理的业务数据对应第一类别时,第一深度网络的各个业务特征对这个分类结果的贡献度。
由于各个业务特征对于最终结果的贡献度需要一层层传递才能确定,仅就第一深度网络而言,可以通过与第一类别对应的第二层标签向量进行辅助运算,从而确定出各个业务特征对于第二层标签向量的贡献度,作为其样本重要度系数。
根据一种实施方式,可以将样本特征表达向量与第二层标签向量的余弦系数、Jaccard相似系数等等作为相关性衡量指标。
根据另一种实施方式,可以利用注意力机制,将各个特征表达向量的注意力值作为衡量相应特征重要度的指标。根据注意力机制,各个业务特征对应的注意力值(重要度系数)可以是当前业务特征对第二层标签向量的贡献度(重要度)与各个业务特征对层标签向量的贡献度之和的比值。这里的贡献度可以用重要度因子来表示。在一个具体示例中,单个业务特征j的重要度因子例如可以表示为:
Figure 972621DEST_PATH_IMAGE011
值得说明的是,待处理的业务数据中,第一深度网络的各个业务特征的重要度系数确定方法与业务模型数据预处理过程中的样本重要度系数确定方法一致,详见步骤304,在此不再赘述。
进一步地,可以利用各个重要度系数融合各个业务特征分别对应的各个特征表达向量进行融合,得到第一深度网络的输出向量。
在一个实施例中,可以利用各个重要度系数分别作为各个特征表达向量的权重,对各个特征表达向量进行加权求和,得到的和向量作为融合结果,进一步地,可以根据融合结果确定第一深度网络的输出向量。进一步可选地,为了增加模型的非线性表现能力,还可以在加权求和的基础上添加偏移项,并利用激励函数处理相关结果,得到向量融合结果。
如此,可以利用特征表达向量代替特征值,并按照业务特征的重要度系数指示的重要度信息确定第一深度网络的输出向量。当输出向量作为下一个深度网络的业务特征向量,各个元素描述下一个深度网络的各个业务特征时,经过深度网络的逐层迭代,可以提高处理结果的准确度,并使得业务模型具有可追溯性。具体过程可以对应参考步骤303中的向量融合操作。
接着,在步骤404,基于上述输出向量,确定待处理的业务数据对应的目标类别为第一类别的可能性。
根据本说明书的技术构思,在每一个深度网络中,都需要通过相应网络的层标签向量确定各个业务特征的重要度系数,并据此确定下一个深度网络中各个业务特征的特征值。然而,在业务模型的数据预处理阶段,各个深度网络的层标签向量是与样本标签对应的、可以确定的,而在利用业务模型处理业务数据时,各个深度网络中层标签向量有分别对应于各个分类类别的多种选择。如此,使得利用业务模型处理分类业务的流程与业务模型的数据预处理过程有所区别。
该区别在于,利用业务模型处理分类业务的流程中,分别针对每个分类类别,通过业务模型确定待处理的业务数据的目标类别为该分类类别的可能性。因此,需要对于每个分类类别,通过业务模型逐层计算输出向量,直到最后一个深度网络。
如图5所示,示出针对一条待处理的业务数据,利用业务模型处理分类业务的一个具体实施架构。在该实施架构下,针对各个分类类别,都可以通过本说明书的技术构思提供的利用业务模型处理分类业务的流程,确定出目标类别是相应分类类别的可能性。然后,可以将各个分类类别作为目标类别的可能性进行比较,就可以确定待处理的业务数据的目标类别。
回到该步骤404,最后一个深度网络得到的输出向量,如果与相应分类类别对应的标签向量越一致,代表着当前分类类别是待处理的业务数据的目标类别的可能性越大。在针对单个分类类别的数据处理过程中,可以根据第一深度网络的输出向量,确定待处理的业务数据对应的目标类别为第一类别的可能性。
容易理解,如果第一深度网络是最后一个深度网络(如图5示出的第k-1个深度网络),那么步骤403中确定的输出向量就可以作为最后一层网络中的向量(如图5示出的第k层的输入向量),在第k层网络中,可以检测该输出向量与当前选定的第一类别对应的标签向量的一致性。如果第一深度网络不是最后一个深度网络(如图5中的第1至第k-2个深度网络),那么根据步骤403中确定的输出向量向后续各层,经过逐层递进的计算,可以得到最后一层深度网络的输出向量,在第k层网络中,可以检测最后一层深度网络的输出向量与当前选定的第一类别对应的标签向量的一致性。
最后一个深度网络的输出向量与第一类别对应的标签向量的一致性例如可以通过两个向量的相似度作为衡量指标进行衡量。两个向量的相似度可以采用诸如点积、方差、余弦距离等等方式确定,在此不做限定。其中,点积、余弦距离越小,两个向量的相似度越高,方差越小,两个向量的相似度越高。最后一个深度网络的输出向量与第一类别对应的标签向量之间的相似度可以相应记为第一相似度。进一步地,可以利用第一相似度衡量第一类别是否为待处理的业务数据对应的目标类别。
在一个实施例中,可以检测第一相似度是否大于预先设定的阈值,在第一相似度大于预先设定的阈值的情况下,确定第一类别为待处理的业务数据对应的目标类别。该实施方式尤其适合待处理的业务数据可以对应多个预定类别中任意数量的目标类别的情形,例如可以对应0个目标类别、1个目标类别、100个目标类别都是合理的情形。例如,车辆损伤识别业务场景下,损伤部件作为目标类别的情形。
在另一个实施例中,可以利用以上方法分别针对待处理的业务数据,确定得到的最后一个深度网络的输出向量分别与其他分类类别对应的标签向量的各个其他相似度。这里通过对比第一相似度与各个其他相似度的大小,将相似度由大到小排列靠前的预定数量(如1个)的各个相似度分别对应的各个分类类别确定为待处理的业务类别的目标类别。如果第一相似度是排列靠前的预定数量的各个相似度之一,则可以确定第一类别为待处理的业务数据对应的目标类别。
在一个可能的设计中,还可以根据最终确定的目标类别,对上述待处理的业务数据在第一个深度网络上的各个业务特征对应的重要度系数进行分析,查找产生相应业务结果的原因。这是因为,第一个深度网络的各个业务特征的重要度系数,代表了待处理的业务数据中的初始业务特征相应类别被确定为目标类别的贡献度,因此可以追溯到得到目标类别的最初始的因素。作为示例,在背景技术中给出的例子中,如果第一个深度网络对应的业务特征包括历史借贷存在违约行为、使用相关金融平台次数较低、共享单车存在违规停车等,得到目标类别为高风险用户不可借贷,第一个深度网络的业务特征分别对应的重要度系数为0.7、0.2、0.1,那么,可以解释为该用户历史借贷存在违约行为的可能性较大,从而为用户提供明确的拒绝借贷理由。如此,使得业务模型具有可解释性,提供更好的使用体验。
回顾以上过程,用于处理分类业务的业务模型包括多个新型的深度网络,在针对业务模型的数据预处理过程中,通过在单个深度网络中引入描述不同特征值的特征表达向量,以及与分类类别一一对应的层标签向量,并基于特征表达向量与层标签向量的相似性,确定各个业务特征的重要性。如此,可以在每一个深度网络中,都可以充分考虑各个业务特征对于相应分类类别的重要度。在利用业务模型进行目标类别确定时,可以针对每个分类类别确定其作为待处理的业务数据的目标类别的可能性,从而提高业务模型的准确度,并且由于在各个深度网络中确定了相应业务特征的重要度系数,使得业务模型的业务处理结果具有可追溯性,提高使用体验。
根据另一方面的实施例,还提供一种针对业务模型进行数据预处理的装置。图6示出根据一个实施例的针对业务模型进行数据预处理的装置的示意性框图。这里的业务模型包括多个深度网络,以多个深度网络中的第一深度网络为例,其可以包括第一向量分配层和第一向量融合层,以及分别对应于多个预定类别的各个层标签向量。用于对业务模型进行数据预处理的训练样本包括第一样本,第一样本对应有第一样本标签。下面针对第一样本对图6示出的针对业务模型进行数据预处理的装置600进行描述。
如图6所示,装置600包括:获取单元61,配置为基于第一样本确定第一深度网络对应的多个业务特征上的各个样本特征值;向量分配单元62,配置为通过第一向量分配层,为各个业务特征分别分配用于描述相应样本特征值的各个样本特征表达向量;向量融合单元63,配置为利用第一向量融合层,通过以下方式对各个样本特征表达向量执行向量融合操作:从各个层标签向量中,获取与第一样本标签对应的第一层标签向量;基于各个样本特征表达向量分别与第一层标签向量的相关性,确定各个业务特征分别对应的各个样本重要度系数;利用各个样本重要度系数融合各个样本特征表达向量,得到第一深度网络的样本输出向量;调整单元64,配置为以最大化样本输出向量与第一深度网络的目标向量的相关度为目标,至少更新各个业务特征各自对应的样本特征表达向量及第一层标签向量。
其中,在第一深度网络是第一个深度网络的情况下,多个业务特征上的各个样本特征值从第一样本中提取;
在第一深度网络是第二个或以后的深度网络时,多个业务特征上的各个样本特征值通过前一深度网络的样本输出向量确定。
根据一个实施方式,多个业务特征包括第一特征,第一特征对应m1个离散特征值,m1个离散特征值分别对应m1个候选向量;向量分配单元62还配置为:
从m1个离散特征值中确定与第一特征的样本特征值大小最接近的离散特征值;
将最接近的离散特征值对应的候选向量,确定为针对第一样本,对应第一特征的样本特征表达向量。
根据另一个实施方式,多个业务特征包括第二特征,第二特征对应m2个数值区间,m2个数值区间分别对应m2个候选向量;向量分配单元62还配置为:
针对第一样本在第二特征上的样本特征值,检测在m2个数值区间中所落入的第一数值区间;
将第一数值区间对应的候选向量确定为,针对第一样本,对应第一特征的样本特征表达向量。
在一个实施例中,多个业务特征包括第三特征,第三特征对应第三样本特征表达向量,向量融合单元63进一步配置为通过以下方式确定各个业务特征分别对应的各个样本重要度系数:
基于第三样本特征表达向量与第一层标签向量的相似度,确定第三特征对应的重要度因子,其中,第三特征对应的重要度因子和第三样本特征表达向量与第一层标签向量的相似度正相关;
将第三重要度因子与多个业务特征分别对应的各个重要度因子之和的比值,作为第一样本对应第三特征的样本重要度系数。
根据一个可能的设计,在第一层标签向量的维数与第三样本特征表达向量的维数一致的情况下,第三样本特征表达向量与第一层标签向量的相似度为,第三样本特征表达向量与对应于第一层标签向量的乘积;
在第一层标签向量的维数与第三样本特征表达向量的维数不一致的情况下,第三样本特征表达向量与第一层标签向量的相似度为,第三样本特征表达向量、辅助矩阵与第一层标签向量的乘积。
在一个可选的实现方式中,向量融合单元63可以通过以下方式利用各个样本重要度系数融合各个样本特征表达向量,得到第一深度网络的样本输出向量:
将以各个样本重要度系数为样本相应特征表达向量的权重,对各个样本特征表达向量加权求和得到的和向量,作为第一深度网络的样本输出向量。
在一个可能的实施方式中,调整单元64进一步配置为:
令损失函数与以下项负相关:样本输出向量与目标向量的相关度;
向损失函数减小的方向,至少调整各个业务特征各自对应的样本特征表达向量及第一层标签向量。
根据一个进一步的实施例,损失函数还与以下项正相关:样本输出向量与第一深度网络的负例参考向量的相关度,其中,负例参考向量是从目标向量之外随机选择的其他参考向量。
其中,假设多个业务特征包括第四特征,第四特征对应m3个候选向量,调整单元64进一步可以配置为:
以最大化样本输出向量与第一深度网络的目标向量的相关度为目标,调整第四特征对应的第四样本特征表达向量;
从m3个候选向量中检测与调整后的第四样本特征表达向量相似度最高的候选向量;
用调整后的第四样本特征表达向量更新所确定的相似度最高的候选向量。
在进一步的实施例中,调整单元64还配置为:
利用所更新的候选向量确定第四特征的目标值;
基于第四特征的目标值生成前一深度网络对应的目标向量,用以更新业务模型的前一深度网络中的相应数据。
在其他进一步的实施例中,第一深度网络是业务模型的最后一个深度网络的情况下,第一深度网络的目标向量是第一样本标签对应的标签向量。
值得说明的是,图6所示的装置600是与图3示出的方法实施例相对应的装置实施例,图3示出的方法实施例中的相应描述同样适用于装置600,在此不再赘述。
根据另一方面的实施例,还提供一种利用业务模型处理分类业务的装置,图7示出该装置的一个示例性框图。这里的业务模型可以是通过图6所示的装置进行数据预处理的业务模型。装置700包括以下单元,针对多个预定类别中的第一类别:
获取单元71,配置为获取待处理的业务数据在第一深度网络对应的多个业务特征上的各个特征值;
向量分配单元72,配置为通过第一向量分配层,为各个业务特征分别分配用于描述相应特征值的各个特征表达向量;
向量融合单元73,配置为利用第一向量融合层,通过以下方式对各个特征表达向量执行向量融合操作:从各个层标签向量中,获取与第一类别对应的第二层标签向量;基于各个特征表达向量分别与第二层标签向量的相关性,确定各个业务特征分别对应的各个重要度系数;利用各个重要度系数融合各个特征表达向量,得到第一深度网络的输出向量;
确定单元74,配置为基于输出向量,确定待处理的业务数据对应的目标类别为第一类别的可能性。
可以看出,图7示出的装置700和图6示出的装置600在结构单元上具有相似性,例如获取单元61和71、向量分配单元62和72、向量融合单元63和73等。事实上,这些单元具有相同的处理逻辑,区别在于,所针对的对象和模型参数不同,装置600针对训练样本,其中涉及的模型参数为待调整数据,装置700针对待处理的业务数据,其中涉及的模型参数是确定的。在一些可选的实现的方式中,这些对应的单元可以是相同的处理单元,前文对于相应单元的原理、功能等描述可以相互适用,在此不再赘述。
装置700的处理对象是待处理的业务数据,因此,与装置600相比,其不需要调整单元64,而是通过决策单元74确定待处理的业务数据的目标类别。
在一个可能的设计中,决策单元74进一步配置为:
基于输出向量,得到经过多个深度网络的逐层递进处理,确定的最终输出向量;
检测最终输出向量与第一类别对应的标签向量的第一相似度;
利用第一相似度衡量待处理的业务数据对应的目标类别为第一类别的可能性。
在进一步的实施例中,决策单元74还可以配置为:
对比第一相似度与各个其他相似度的大小,其中,各个其他相似度分别用于衡量待处理的业务数据对应的目标类别为多个预定类别中的其他各个类别的可能性;
按照各个相似度的大小对比结果确定第一类别是否为待处理的业务数据的目标类别。
根据一个可能的实现方式,在第一深度网络是第一层,第一类别被确定为待处理的业务数据对应的目标类别的情况下,决策单元74还配置为:
按照各个重要度系数由大到小的顺序,确定重要度系数最大的预定数量的业务特征;
将所确定的预定数量的业务特征作为目标特征。
值得说明的是,图7所示的装置700是与图4示出的方法实施例相对应的装置实施例,图4示出的方法实施例中的相应描述同样适用于装置700,在此不再赘述。
根据另一方面的实施例,还提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行结合图3或图4所描述的方法。
根据再一方面的实施例,还提供一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现结合图3或图4所述的方法。
本领域技术人员应该可以意识到,在上述一个或多个示例中,本说明书实施例所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。
以上所述的具体实施方式,对本说明书的技术构思的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本说明书的技术构思的具体实施方式而已,并不用于限定本说明书的技术构思的保护范围,凡在本说明书实施例的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本说明书的技术构思的保护范围之内。

Claims (20)

1.一种针对业务模型进行数据预处理的方法,所述业务模型用于针对给定的业务数据从多个预定类别上确定出目标类别,所述业务模型包括多个深度网络,所述多个深度网络中的第一深度网络包括第一向量分配层和第一向量融合层,以及分别对应于所述多个预定类别的各个层标签向量;用于对所述业务模型进行数据预处理的训练样本包括第一样本,所述第一样本对应有第一样本标签;所述方法包括:
基于所述第一样本确定所述第一深度网络对应的多个业务特征上的各个样本特征值;
通过所述第一向量分配层,为各个业务特征分别分配用于描述相应样本特征值的各个样本特征表达向量;
利用所述第一向量融合层,通过以下方式对各个样本特征表达向量执行向量融合操作:从各个层标签向量中,获取与所述第一样本标签对应的第一层标签向量;基于各个样本特征表达向量分别与所述第一层标签向量的相关性,确定各个业务特征分别对应的各个样本重要度系数;利用各个样本重要度系数融合各个样本特征表达向量,得到所述第一深度网络的样本输出向量;
以最大化所述样本输出向量与所述第一深度网络的目标向量的相关度为目标,至少更新各个业务特征各自对应的样本特征表达向量及所述第一层标签向量。
2.根据权利要求1所述的方法,其中:
在所述第一深度网络是第一个深度网络的情况下,所述多个业务特征上的各个样本特征值从所述第一样本中提取;
在所述第一深度网络是第二个或以后的深度网络时,所述多个业务特征上的各个样本特征值通过前一深度网络的样本输出向量确定。
3.根据权利要求1所述的方法,其中,所述多个业务特征包括第一特征,所述第一特征对应m1个离散特征值,所述m1个离散特征值分别对应m1个候选向量;所述通过所述第一向量分配层,为各个业务特征分别分配用于描述相应样本特征值的各个样本特征表达向量包括:
从所述m1个离散特征值中确定与所述第一特征的样本特征值大小最接近的离散特征值;
将所述最接近的离散特征值对应的候选向量,确定为针对所述第一样本,对应所述第一特征的样本特征表达向量。
4.根据权利要求1所述的方法,其中,所述多个业务特征包括第二特征,所述第二特征对应m2个数值区间,所述m2个数值区间分别对应m2个候选向量;所述通过所述第一向量分配层,为各个业务特征分别分配用于描述相应样本特征值的各个样本特征表达向量包括:
针对所述第一样本在所述第二特征上的样本特征值,检测在所述m2个数值区间中所落入的第一数值区间;
将所述第一数值区间对应的候选向量确定为,针对所述第一样本,对应所述第一特征的样本特征表达向量。
5.根据权利要求1所述的方法,其中,所述多个业务特征包括第三特征,所述第三特征对应第三样本特征表达向量,所述基于各个样本特征表达向量分别与所述第一层标签向量的相关性,确定各个业务特征分别对应的各个样本重要度系数包括:
基于所述第三样本特征表达向量与所述第一层标签向量的相似度,确定所述第三特征对应的重要度因子,其中,所述第三特征对应的重要度因子和所述第三样本特征表达向量与所述第一层标签向量的相似度正相关;
将所述第三重要度因子与所述多个业务特征分别对应的各个重要度因子之和的比值,作为所述第一样本对应所述第三特征的样本重要度系数。
6.根据权利要求5所述的方法,其中:
在所述第一层标签向量的维数与所述第三样本特征表达向量的维数一致的情况下,所述第三样本特征表达向量与所述第一层标签向量的相似度为,所述第三样本特征表达向量与对应于所述第一层标签向量的乘积;
在所述第一层标签向量的维数与所述第三样本特征表达向量的维数不一致的情况下,所述第三样本特征表达向量与所述第一层标签向量的相似度为,所述第三样本特征表达向量、辅助矩阵与所述第一层标签向量的乘积。
7.根据权利要求1所述的方法,其中,所述利用各个样本重要度系数融合各个样本特征表达向量,得到所述第一深度网络的样本输出向量包括:
将以各个样本重要度系数为样本相应特征表达向量的权重,对各个样本特征表达向量加权求和得到的和向量,作为所述第一深度网络的样本输出向量。
8.根据权利要求1所述的方法,其中,所述以最大化所述样本输出向量与所述第一深度网络的目标向量的相关度为目标,至少更新各个业务特征各自对应的样本特征表达向量及所述第一层标签向量包括:
令损失函数与以下项负相关:所述样本输出向量与所述目标向量的相关度;
向损失函数减小的方向,至少调整各个业务特征各自对应的样本特征表达向量及所述第一层标签向量。
9.根据权利要求8所述的方法,其中,所述损失函数还与以下项正相关:所述样本输出向量与所述第一深度网络的负例参考向量的相关度,其中,所述负例参考向量是从所述目标向量之外随机选择的其他参考向量。
10.根据权利要求1所述的方法,其中,所述多个业务特征包括第四特征,所述第四特征对应m3个候选向量,所述以最大化所述样本输出向量与所述第一深度网络的目标向量的相关度为目标,至少更新各个业务特征各自对应的样本特征表达向量及所述第一层标签向量包括:
以最大化所述样本输出向量与所述第一深度网络的目标向量的相关度为目标,调整所述第四特征对应的第四样本特征表达向量;
从所述m3个候选向量中检测与调整后的第四样本特征表达向量相似度最高的候选向量;
用调整后的第四样本特征表达向量更新所确定的相似度最高的候选向量。
11.根据权利要求10所述的方法,所述方法还包括:
利用所更新的候选向量确定所述第四特征的目标值;
基于所述第四特征的目标值生成前一深度网络对应的目标向量,用以更新所述业务模型的前一深度网络中的相应数据。
12.根据权利要求10所述的方法,在所述第一深度网络是所述业务模型的最后一个深度网络的情况下,所述第一深度网络的目标向量是所述第一样本标签对应的标签向量。
13.一种利用业务模型处理分类业务的方法,所述业务模型用于针对待处理的业务数据从所述多个预定类别上确定出目标类别,所述业务模型包括多个深度网络,所述多个深度网络中的第一深度网络包括第一向量分配层和第一向量融合层,以及分别对应于所述多个预定类别的各个层标签向量,所述第一深度网络通过如权利要求1所述的方式进行数据预处理;针对所述多个预定类别中的第一类别,所述方法包括:
获取待处理的业务数据在所述第一深度网络对应的多个业务特征上的各个特征值;
通过所述第一向量分配层,为各个业务特征分别分配用于描述相应特征值的各个特征表达向量;
利用所述第一向量融合层,通过以下方式对各个特征表达向量执行向量融合操作:从各个层标签向量中,获取与所述第一类别对应的第二层标签向量;基于各个特征表达向量分别与所述第二层标签向量的相关性,确定各个业务特征分别对应的各个重要度系数;利用各个重要度系数融合各个特征表达向量,得到所述第一深度网络的输出向量;
基于所述输出向量,确定所述待处理的业务数据对应的目标类别为所述第一类别的可能性。
14.根据权利要求13所述的方法,其中,所述基于所述输出向量,确定所述待处理的业务数据对应的目标类别为所述第一类别的可能性包括:
基于所述输出向量,得到经过所述多个深度网络的逐层递进处理,确定的最终输出向量;
检测所述最终输出向量与所述第一类别对应的标签向量的第一相似度;
利用所述第一相似度衡量所述待处理的业务数据对应的目标类别为所述第一类别的可能性。
15.根据权利要求14所述的方法,其中,所述利用所述第一相似度衡量所述待处理的业务数据对应的目标类别为所述第一类别的可能性包括:
对比所述第一相似度与各个其他相似度的大小,其中,各个其他相似度分别用于衡量所述待处理的业务数据对应的目标类别为所述多个预定类别中的其他各个类别的可能性;
按照各个相似度的大小对比结果确定所述第一类别是否为所述待处理的业务数据的目标类别。
16.根据权利要求13所述的方法,在所述第一深度网络是第一层,所述第一类别被确定为所述待处理的业务数据对应的目标类别的情况下,所述方法还包括:
按照各个重要度系数由大到小的顺序,确定重要度系数最大的预定数量的业务特征;
将所确定的预定数量的业务特征作为目标特征。
17.一种针对业务模型进行数据预处理的装置,所述业务模型用于针对给定的业务数据从多个预定类别上确定出目标类别,所述业务模型包括多个深度网络,所述多个深度网络中的第一深度网络包括第一向量分配层和第一向量融合层,以及分别对应于所述多个预定类别的各个层标签向量;用于对所述业务模型进行数据预处理的训练样本包括第一样本,所述第一样本对应有第一样本标签;所述装置包括:
获取单元,配置为基于所述第一样本确定所述第一深度网络对应的多个业务特征上的各个样本特征值;
向量分配单元,配置为通过所述第一向量分配层,为各个业务特征分别分配用于描述相应样本特征值的各个样本特征表达向量;
向量融合单元,配置为利用所述第一向量融合层,通过以下方式对各个样本特征表达向量执行向量融合操作:从各个层标签向量中,获取与所述第一样本标签对应的第一层标签向量;基于各个样本特征表达向量分别与所述第一层标签向量的相关性,确定各个业务特征分别对应的各个样本重要度系数;利用各个样本重要度系数融合各个样本特征表达向量,得到所述第一深度网络的样本输出向量;
调整单元,配置为以最大化所述样本输出向量与所述第一深度网络的目标向量的相关度为目标,至少更新各个业务特征各自对应的样本特征表达向量及所述第一层标签向量。
18.一种利用业务模型处理分类业务的装置,所述业务模型用于针对待处理的业务数据从所述多个预定类别上确定出目标类别,所述业务模型包括多个深度网络,所述多个深度网络中的第一深度网络包括第一向量分配层和第一向量融合层,以及分别对应于所述多个预定类别的各个层标签向量,所述第一深度网络通过如权利要求17中的装置进行数据预处理;所述装置包括以下单元,针对所述多个预定类别中的第一类别:
获取单元,配置为获取待处理的业务数据在所述第一深度网络对应的多个业务特征上的各个特征值;
向量分配单元,配置为通过所述第一向量分配层,为各个业务特征分别分配用于描述相应特征值的各个特征表达向量;
向量融合单元,配置为利用所述第一向量融合层,通过以下方式对各个特征表达向量执行向量融合操作:从各个层标签向量中,获取与所述第一类别对应的第二层标签向量;基于各个特征表达向量分别与所述第二层标签向量的相关性,确定各个业务特征分别对应的各个重要度系数;利用各个重要度系数融合各个特征表达向量,得到所述第一深度网络的输出向量;
决策单元,配置为基于所述输出向量,确定所述待处理的业务数据对应的目标类别为所述第一类别的可能性。
19.一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行权利要求1-16中任一项的所述的方法。
20.一种计算设备,包括存储器和处理器,其特征在于,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现权利要求1-16中任一项所述的方法。
CN202010384217.2A 2020-05-09 2020-05-09 针对业务模型进行数据预处理的方法及装置 Active CN111523649B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010384217.2A CN111523649B (zh) 2020-05-09 2020-05-09 针对业务模型进行数据预处理的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010384217.2A CN111523649B (zh) 2020-05-09 2020-05-09 针对业务模型进行数据预处理的方法及装置

Publications (2)

Publication Number Publication Date
CN111523649A true CN111523649A (zh) 2020-08-11
CN111523649B CN111523649B (zh) 2022-06-10

Family

ID=71905069

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010384217.2A Active CN111523649B (zh) 2020-05-09 2020-05-09 针对业务模型进行数据预处理的方法及装置

Country Status (1)

Country Link
CN (1) CN111523649B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115102871A (zh) * 2022-05-20 2022-09-23 浙江大学 基于业务特征向量的能源互联网控制终端业务处理方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190042895A1 (en) * 2016-06-12 2019-02-07 Grg Banking Equipment Co., Ltd. Offline identity authentication method and apparatus
CN109902798A (zh) * 2018-05-31 2019-06-18 华为技术有限公司 深度神经网络的训练方法和装置
CN109961089A (zh) * 2019-02-26 2019-07-02 中山大学 基于度量学习和元学习的小样本和零样本图像分类方法
CN110210513A (zh) * 2019-04-23 2019-09-06 深圳信息职业技术学院 数据分类方法、装置及终端设备
CN110362668A (zh) * 2019-07-16 2019-10-22 阿里巴巴集团控股有限公司 针对用户问句的分类方法和装置
CN110516745A (zh) * 2019-08-28 2019-11-29 北京达佳互联信息技术有限公司 图像识别模型的训练方法、装置及电子设备
CN110705889A (zh) * 2019-10-10 2020-01-17 华夏幸福产业投资有限公司 一种企业筛选方法、装置、设备及存储介质
CN110990608A (zh) * 2019-12-03 2020-04-10 哈尔滨工业大学 一种基于Siamese结构双向长短时记忆网络的三维模型检索方法
CN111080123A (zh) * 2019-12-14 2020-04-28 支付宝(杭州)信息技术有限公司 用户风险评估方法及装置、电子设备、存储介质

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190042895A1 (en) * 2016-06-12 2019-02-07 Grg Banking Equipment Co., Ltd. Offline identity authentication method and apparatus
CN109902798A (zh) * 2018-05-31 2019-06-18 华为技术有限公司 深度神经网络的训练方法和装置
CN109961089A (zh) * 2019-02-26 2019-07-02 中山大学 基于度量学习和元学习的小样本和零样本图像分类方法
CN110210513A (zh) * 2019-04-23 2019-09-06 深圳信息职业技术学院 数据分类方法、装置及终端设备
CN110362668A (zh) * 2019-07-16 2019-10-22 阿里巴巴集团控股有限公司 针对用户问句的分类方法和装置
CN110516745A (zh) * 2019-08-28 2019-11-29 北京达佳互联信息技术有限公司 图像识别模型的训练方法、装置及电子设备
CN110705889A (zh) * 2019-10-10 2020-01-17 华夏幸福产业投资有限公司 一种企业筛选方法、装置、设备及存储介质
CN110990608A (zh) * 2019-12-03 2020-04-10 哈尔滨工业大学 一种基于Siamese结构双向长短时记忆网络的三维模型检索方法
CN111080123A (zh) * 2019-12-14 2020-04-28 支付宝(杭州)信息技术有限公司 用户风险评估方法及装置、电子设备、存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115102871A (zh) * 2022-05-20 2022-09-23 浙江大学 基于业务特征向量的能源互联网控制终端业务处理方法
CN115102871B (zh) * 2022-05-20 2023-10-03 浙江大学 基于业务特征向量的能源互联网控制终端业务处理方法

Also Published As

Publication number Publication date
CN111523649B (zh) 2022-06-10

Similar Documents

Publication Publication Date Title
US20210201107A1 (en) Neural architecture search based on synaptic connectivity graphs
CN110462607B (zh) 从梯度增强机识别原因代码
US11568201B2 (en) Predicting neuron types based on synaptic connectivity graphs
US11625611B2 (en) Training artificial neural networks based on synaptic connectivity graphs
CN108446741B (zh) 机器学习超参数重要性评估方法、系统及存储介质
CN110826638A (zh) 基于重复注意力网络的零样本图像分类模型及其方法
CN109766454A (zh) 一种投资者分类方法、装置、设备及介质
CN110852881B (zh) 风险账户识别方法、装置、电子设备及介质
US20210201119A1 (en) Artificial neural network architectures based on synaptic connectivity graphs
CN111881722B (zh) 一种跨年龄人脸识别方法、系统、装置及存储介质
US11631000B2 (en) Training artificial neural networks based on synaptic connectivity graphs
CN109726918A (zh) 基于生成式对抗网络和半监督学习的个人信用确定方法
Tiwari Supervised learning: From theory to applications
CN110414541B (zh) 用于识别物体的方法、设备和计算机可读存储介质
Crabbé et al. Label-free explainability for unsupervised models
CN114144770A (zh) 用于生成用于模型重新训练的数据集的系统和方法
CN110458600A (zh) 画像模型训练方法、装置、计算机设备及存储介质
Asim et al. An adaptive model for identification of influential bloggers based on case-based reasoning using random forest
CN111523649B (zh) 针对业务模型进行数据预处理的方法及装置
Lim et al. More powerful selective kernel tests for feature selection
US20210042625A1 (en) Performance of neural networks using learned specialized transformation functions
CN114255381B (zh) 图像识别模型的训练方法、图像识别方法、装置及介质
CN109886299A (zh) 一种用户画像方法、装置、可读存储介质及终端设备
Hartung et al. Support for the use of hierarchical temporal memory systems in automated design evaluation: A first experiment
CN114937166A (zh) 图像分类模型构建方法、图像分类方法及装置、电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant