CN113052679A - 基于多视角学习的模型训练方法、预测方法、装置和电子设备 - Google Patents
基于多视角学习的模型训练方法、预测方法、装置和电子设备 Download PDFInfo
- Publication number
- CN113052679A CN113052679A CN202110409585.2A CN202110409585A CN113052679A CN 113052679 A CN113052679 A CN 113052679A CN 202110409585 A CN202110409585 A CN 202110409585A CN 113052679 A CN113052679 A CN 113052679A
- Authority
- CN
- China
- Prior art keywords
- sub
- sample
- model
- prediction
- constraint term
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 238000012549 training Methods 0.000 title claims abstract description 43
- 230000000007 visual effect Effects 0.000 claims abstract description 41
- 230000006870 function Effects 0.000 claims abstract description 35
- 238000012545 processing Methods 0.000 claims description 8
- 230000010354 integration Effects 0.000 claims description 7
- 238000010276 construction Methods 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 3
- 238000005457 optimization Methods 0.000 claims description 3
- 230000000694 effects Effects 0.000 abstract description 10
- 230000006872 improvement Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000006399 behavior Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000013145 classification model Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/067—Enterprise or organisation modelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/08—Insurance
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- General Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Development Economics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Marketing (AREA)
- Human Resources & Organizations (AREA)
- Entrepreneurship & Innovation (AREA)
- Technology Law (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Educational Administration (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本说明书实施例公开了一种基于多视角学习的模型训练方法、预测方法、装置和电子设备。所述模型训练方法包括:构建样本集;所述样本集包括多个样本,每个样本包括标签和多种特征数据;将样本的特征数据输入至与该特征数据对应了同一视角的预测子模型,得到样本的多个子预测结果;每个子预测结果对应一种视角;根据标签和子预测结果,确定业务模型的损失函数的值;所述损失函数包括第一约束项和第二约束项,所述第一约束项用于约束同一视角下不同样本的子预测结果的差异程度,所述第二约束项用于约束同一样本在不同视角下的子预测结果的差异程度;根据损失函数的值,优化业务模型的模型参数。本说明书实施例可以提高模型训练效果以及预测的准确性。
Description
技术领域
本说明书实施例涉及计算机技术领域,特别涉及一种基于多视角学习的模型训练方法、预测方法、装置和电子设备。
背景技术
随着信息科技的发展,多视角学习(Multi-View Learning,MVL)获得了广泛的应用。多视角学习可以利用样本在多种视角下的特征数据训练机器学习模型。
但是,目前多视角学习的模型训练效果不佳。
发明内容
本说明书实施例提供一种基于多视角学习的模型训练方法、预测方法、装置和电子设备,以提高模型训练效果。本说明书实施例的技术方案如下。
本说明书实施例的第一方面,提供了一种基于多视角学习的模型训练方法,所述方法用于训练业务模型,所述业务模型包括多个预测子模型,每个预测子模型对应一种视角;所述方法包括:
构建样本集;所述样本集包括多个样本,每个样本包括标签和多种特征数据,所述标签用于表示样本的类型,每种特征数据对应一种视角;
将样本的特征数据输入至与该特征数据对应了同一视角的预测子模型,得到样本的多个子预测结果;每个子预测结果对应一种视角;
根据标签和子预测结果,确定业务模型的损失函数的值;所述损失函数包括第一约束项和第二约束项,所述第一约束项用于约束同一视角下不同样本的子预测结果的差异程度,所述第二约束项用于约束同一样本在不同视角下的子预测结果的差异程度;
根据损失函数的值,优化业务模型的模型参数。
本说明书实施例的第二方面,提供了一种预测方法,包括:
从业务数据中提取多种特征数据;每种特征数据对应一种视角;
将特征数据输入至业务模型中与该特征数据对应了同一视角的预测子模型,得到多个子预测结果;所述业务模型包括多个预测子模型和集成子模型,每个预测子模型对应一种视角;
将所述多个子预测结果输入至集成子模型,得到预测结果。
本说明书实施例的第三方面,提供了一种基于多视角学习的模型训练装置,所述装置用于训练业务模型,所述业务模型包括多个预测子模型,每个预测子模型对应一种视角;所述装置包括:
构建单元,用于构建样本集;所述样本集包括多个样本,所述样本包括标签和多种特征数据,所述标签用于表示样本的类型,每种特征数据对应一种视角;
输入单元,用于将样本的特征数据输入至与该特征数据对应了同一视角的预测子模型,得到样本的多个子预测结果;每个子预测结果对应一种视角;
确定单元,用于根据标签和子预测结果,确定业务模型的损失函数的值;所述损失函数包括第一约束项和第二约束项,所述第一约束项用于约束同一视角下不同样本的子预测结果的差异程度,所述第二约束项用于约束同一样本在不同视角下的子预测结果的差异程度;
优化单元,用于根据损失函数的取值,优化业务模型的模型参数。
本说明书实施例的第四方面,提供了一种预测装置,包括:
提取单元,用于从业务数据中提取多种特征数据;每种特征数据对应一种视角;
第一输入单元,用于将特征数据输入至业务模型中与该特征数据对应了同一视角的预测子模型,得到多个子预测结果;所述业务模型包括多个预测子模型和集成子模型,每个预测子模型对应一种视角;
第二输入单元,用于将所述多个子预测结果输入至集成子模型,得到预测结果。
本说明书实施例的第四方面,提供了一种电子设备,包括:
至少一个处理器;
存储有程序指令的存储器,其中,所述程序指令被配置为适于由所述至少一个处理器执行,所述程序指令包括用于执行如第一方面或者第二方面所述方法的指令。
本说明书实施例提供的一种技术方案,业务模型的损失函数中包含第一约束项和第二约束项。所述第一约束项用于约束在同一视角下不同样本的子预测结果的差异程度,所述第二约束项用于约束同一样本在不同视角下的子预测结果的差异程度。这样可以使得在空间分布上距离较近的同类样本,在输出上更为接近;在空间分布上距离较近的异类样本,在输出上更为远离。并且,同一样本在不同视角的输出也尽可能接近。从而提高了模型训练效果。
本说明书实施例提供的一种技术方案,可以利用基于多视角学习的模型训练方法训练得到的业务模型对业务数据进行预测,得到预测结果,提高了预测结果的准确性。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本说明书实施例中业务模型的结构示意图;
图2为本说明书实施例中模型训练方法的流程示意图;
图3为本说明书实施例中预测方法的流程示意图;
图4为本说明书实施例中模型训练装置的结构示意图;
图5为本说明书实施例中预测装置的结构示意图;
图6为本说明书实施例中电子设备的结构示意图。
具体实施方式
下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
在空间分布上距离较近的样本可以称为为近邻样本。样本在空间分布上的距离可以通过欧式距离、曼哈顿距离或者切比雪夫距离等距离度量方式确定。另外,样本还可以具有标签,所述标签可以用于表示样本的类型。标签相同的样本可以称为同类样本,标签不同的样本可以称为异类样本。相关技术中的多视角学习方法,一方面,同等地对待在空间分布上距离较近和距离较远的样本,忽略了样本之间的空间分布情况。另一方面,虽然样本有多个视角,但是同一样本的各个视角都独立地完成从特征数据到标签的学习,没有利用不同视角之间的输出进行优化。以上因素使得多视角学习的模型训练效果不佳。
考虑到在空间分布上距离较近的同类样本,在输出上也应该更为接近;在空间分布上距离较近的异类样本,在输出上也应该更为远离。并且,同一样本在不同视角的输出也应该尽可能接近。基于这样的考虑,本说明书实施例提供了一种基于多视角学习的模型训练方法。
本说明书实施例的模型训练方法,可以用于训练业务模型。请参阅图1,所述业务模型可以包括多个预测子模型和集成子模型。在所述多个预测子模型中,每个预测子模型对应一种视角,用于利用业务对象在该视角下的特征数据进行预测,得到业务对象在该视角下的子预测结果。所述集成子模型用于对业务对象在多种视角下的子预测结果进行集成,得到业务对象的最终预测结果。至于具体的集成方式本说明书实施例不作具体限定。例如,所述集成子模型可以通过投票的方式,从多个子预测结果选择一个子预测结果作为最终预测结果。或者,所述集成子模型还可以计算多个子预测结果的平均值,得到最终预测结果。
在一些场景示例中,所述业务模型可以包括分类模型。所述分类模型可以包括多个分类子模型和集成子模型。每个分类子模型对应一种视角,用于利用业务对象在该视角下的特征数据进行分类,得到业务对象在该视角下的子分类结果。所述集成子模型用于对业务对象在多种视角下的子分类结果进行集成,得到业务对象的最终分类结果。
请参阅图2,所述模型训练方法可以应用于电子设备,具体可以包括以下步骤。
步骤S11:构建样本集,所述样本集包括多个样本,每个样本包括标签和多种特征数据,所述标签用于表示样本的类型,每种特征数据对应一种视角。
在一些实施例中,可以采集多个业务对象的业务数据。所述业务对象可以包括用户、账户、基金、外汇等等。所述业务数据可以包括用户在金融机构的数据,包括但不限于资产相关数据、账户的行为数据、基金的价格数据、外汇的交易量数据等。可以根据业务对象的业务数据,对业务对象进行打标,得到业务对象的标签。所述标签用于表示业务对象的类型。可以对业务对象的业务数据进行特征工程处理,得到业务对象的多种特征数据。业务对象的每种特征数据可以对应一种视角。可以根据业务对象的标签和多种特征数据构建所述样本集中的样本。每个业务对象的标签和多种特征数据可以构成一个样本。
在一些实施例中,可以直接对采集的业务数据进行特征工程处理。或者,还可以对采集的业务数据进行预处理;可以对预处理后的业务数据进行特征工程处理。所述预处理包括但不限于缺失值补全处理、归一化处理等等。
在一些场景示例中,所述业务对象可以包括用户。所述业务数据可以包括用户在金融机构的数据。所述标签用于表示用户是否为资产流失客户。所述特征数据可以包括第一视角下的特征数据、第二视角下的特征数据、第三视角下的特征数据、第四视角下的特征数据。所述第一视角可以包括用户属性信息视角。所述第二视角可以包括用户资产信息视角。所述第三视角可以包括用户持有信息视角。所述第四视角可以包括用户行为信息视角。
例如,可以采集多个用户的业务数据。所述用户可以为前期的还款记录无问题、未来收入稳定、职业稳定的个人用户。可以对业务数据中的缺失项进行补全。具体地,例如,若缺失项的类型为数值类型,则采用0进行补全。若缺失项的类型为非数值类型,则采用unknown进行补全。可以根据用户的业务数据,对用户进行打标,得到用户的标签。具体地,例如,若用户表现期的资产相对观察期的资产减少50%,则将用户的标签设置为1。所述标签1用于表示用户为资产流失客户。否则,将用户与的标签设置为-1。所述标签-1用于表示用户不是资产流失客户。所述表现期和所述观察期均可以为一个时间段。例如,所述表现期可以为2020年1月~6月,所述观察期可以为2020年7-8月。可以对用户的业务数据进行特征工程处理,得到第一视角下的特征数据、第二视角下的特征数据、第三视角下的特征数据、第四视角下的特征数据。所述第一视角下的特征数据包括性别、年龄段、婚姻状况、住房、车辆、职业、行业等。所述第二视角下的特征数据包括日均资产、历史资产、时点资产等。所述第三视角下的特征数据包括活期余额、定期余额、债券余额、基金余额、黄金余额、本外币理财余额、第三方存管余额、保险余额、个人消费贷款余额等。所述第四视角下的特征数据包括消费笔数、消费金额、投资理财转成存款金额、存款转成投资理财、现金取款金额、归还信用卡金额、借记卡消费金额、近一年网银交易笔数、近一年手机银行交易笔数等。
步骤S13:将样本的特征数据输入至与该特征数据对应了同一视角的预测子模型,得到样本的多个子预测结果,每个子预测结果对应一种视角。
在一些实施例中,所述业务模型可以包括多个预测子模型,每个预测子模型对应一种视角。可以将样本的每种特征数据,输入至与该特征数据对应了同一视角的预测子模型,得到样本在该视角下的子预测结果。值得说明的是,每个样本可以包括多种特征数据。因而每个样本可以具有多个子预测结果,每个子预测结果对应一种视角。另外,样本的特征数据的种类数可以等于业务模型中预测子模型的数量。
在一些场景示例中,所述业务模型可以包括第一预测子模型、第二预测子模型、第三预测子模型、第四预测子模型。所述第一预测子模型对应第一视角,所述第二预测子模型对应第二视角,所述第三预测子模型对应第三视角,所述第四预测子模型对应第四视角。每个样本可以包括第一视角下的特征数据、第二视角下的特征数据、第三视角下的特征数据、第四视角下的特征数据。那么,对于每个样本,可以将该样本在第一视角下的特征数据,输入至第一预测子模型,得到第一视角下的子预测结果;可以将该样本在第二视角下的特征数据,输入至第二预测子模型,得到第二视角下的子预测结果;可以将该样本在第三视角下的特征数据,输入至第三预测子模型,得到第三视角下的子预测结果;可以将该样本在第四视角下的特征数据,输入至第四预测子模型,得到第四视角下的子预测结果。
步骤S15:根据标签和子预测结果,确定业务模型的损失函数的值;所述损失函数包括第一约束项和第二约束项,所述第一约束项用于约束同一视角下不同样本的子预测结果的差异程度,所述第二约束项用于约束同一样本在不同视角下的子预测结果的差异程度。
在一些实施例中,所述业务模型的损失函数可以包括第一约束项和第二约束项。所述第一约束项用于约束同一视角下不同样本的子预测结果的差异程度。所述第一约束项可以使得在视角内部,近邻并且同类的样本的子预测结果尽可能接近,近邻并且异类的样本的子预测结果尽可能不同。这样可以利用同类样本和异类样本的空间分布信息优化预测子模型,使预测子模型学习到样本的整体空间分布信息。所述第二约束项用于约束同一样本在不同视角下的子预测结果的差异程度。所述第二约束项可以使得同一样本在不同视角下的子预测结果尽可能接近。这样可以充分利用多视角学习的优势,使多个视角之间能够进行优化,从而利用多视角之间的协同学习,提升多视角学习的效果。当然,所述业务模型的损失函数还可以包括第三约束项。所述第三约束项用于约束样本的子预测结果与标签之间的差异程度。通过所述第三约束项可以最小化经验损失。
在实际中,可以确定同一视角下不同样本的相似度;可以确定同一视角下不同样本的子预测结果的第一差值;可以根据相似度和第一差值,确定第一约束项的值;可以确定同一样本在不同视角下的子预测结果的第二差值;可以根据第二差值,确定第二约束项的值;可以确定样本的子预测结果与样本的标签之间的第三差值;可以根据第三差值,确定第三约束项的值;可以根据第一约束项的值、第二约束项的值和第三约束项的值,确定损失函数的值。
在一些场景示例中,所述业务模型的损失函数可以为L=Remp+α·Rbcs+γ·Rvcl。其中,Rbcs表示第一约束项,Rvcl表示第二约束项,Remp表示第三约束项,α和γ表示权重。所述α和所述γ可以为超参数,用于调整第二约束项和第三约束项的权重。其中,所述第一约束项可以表示为所述第二约束项可以表示为所述第三约束项可以表示为V表示视角的种类数,N表示样本集中样本的个数,xi表示样本集中的第i个样本,fv(xi)表示样本xi在视角v下的子预测结果,xj表示样本集中的第j个样本,fv(xj)表示样本xj在视角v下的子预测结果,表示样本xi和样本xj在视角v下的相似度,fp(xi)表示样本xi在视角p下的子预测结果,fq(xi)表示样本xi在视角q下的子预测结果,yi表示样本xi的标签。
在视角内部,在空间分布上距离较近的同类样本相较于在空间分布上距离较远的同类样本,其输出也应该更为接近;在空间分布上距离较近的异类样本相较于在空间分布上距离较远的异类样本,其蕴含的信息更为准确和丰富。
为此,可以设定其中,si,j表示样本xi和样本xj的相似度。Nb(xj)表示样本xj的K近邻(K的取值可以根据实际需要设定,例如可以为5),Nb(xi)表示样本xi的K近邻。若样本xi和样本xj属于同类样本,并且样本xi属于样本xj的K近邻样本;或者,若样本xi和样本xj属于同类样本,并且样本xj属于样本xi的K近邻样本,则样本xi和样本xj的相似度为1。若样本xi和样本xj属于异类样本,并且样本xi属于样本xj的K近邻样本;或者,若样本xi和样本xj属于异类样本,并且样本xj属于样本xi的K近邻样本,则样本xi和样本xj的相似度为-1。其它情况下,样本xi和样本xj的相似度为0。
步骤S17:根据损失函数的值,优化业务模型的模型参数。
在一些实施例中,可以根据损失函数的值,优化业务模型中各预测子模型的模型参数。例如,可以采用梯度下降法,优化预测子模型的模型参数。在实际中,可以通过多轮迭代的方式优化业务模型中各预测子模型的模型参数。
在一些实施例中,所述业务模型中集成子模型的模型参数可以是预先设定好的。这样通过本说明书实施例的训练方法,便可以实现对所述业务模型的训练。或者,在本实施例中,还可以确定所述业务模型中集成子模型的模型参数。具体地,所述集成子模型的模型参数可以为经验值。例如,可以接收开发人员输入的所述集成子模型的模型参数。或者,还可以通过机器学习的方式对所述集成子模型进行训练,得到所述集成子模型的模型参数。这样通过本说明书实施例的训练方法,便可以实现对所述业务模型的训练。
在一些场景示例中,所述业务模型可以包括第一预测子模型、第二预测子模型、第三预测子模型、第四预测子模型、集成子模型。通过步骤S17,可以获得第一预测子模型的模型参数、第二预测子模型的模型参数、第三预测子模型的模型参数、以及第四预测子模型的模型参数。另外,所述业务模型的集成子模型可以表示为fv(x)表示样本x在视角v下的子预测结果。所述集成子模型的模型参数可以为经验值。
本说明书实施例的模型训练方法,业务模型的损失函数中包含第一约束项和第二约束项。所述第一约束项用于约束在同一视角下不同样本的子预测结果的差异程度,所述第二约束项用于约束同一样本在不同视角下的子预测结果的差异程度。这样可以使得在空间分布上距离较近的同类样本,在输出上更为接近;在空间分布上距离较近的异类样本,在输出上更为远离。并且,同一样本在不同视角的输出也尽可能接近。从而提高了多视角学习的学习效果。
本说明书实施例还提供一种预测方法。
请参阅图3,所述预测方法可以应用于电子设备,具体可以包括以下步骤。
步骤S21:从业务数据中提取多种特征数据,每种特征数据对应一种视角。
在一些实施例中,可以采集业务对象的业务数据;可以对业务数据进行特征工程处理,得到多种特征数据。每种特征数据对应一种视角。
步骤S23:将特征数据输入至业务模型中与该特征数据对应了同一视角的预测子模型,得到多个子预测结果;所述业务模型包括多个预测子模型和集成子模型,每个预测子模型对应一种视角。
在一些实施例中,所述业务模型可以基于图2所对应的模型训练方法训练得到。
所述业务模型可以包括多个预测子模型和集成子模型。在所述多个预测子模型中,每个预测子模型对应一种视角,用于利用业务对象在该视角下的特征数据进行预测,得到业务对象在该视角下的子预测结果。所述集成子模型用于对业务对象在多种视角下的子预测结果进行集成,得到业务对象的最终预测结果。
在一些实施例中,可以将每种特征数据,输入至与该特征数据对应了同一视角的预测子模型,得到该视角下的子预测结果。值得说明的是,特征数据的数量可以为多种。因而通过步骤S23可以获得多个子预测结果。每个子预测结果对应一种视角。另外,特征数据的种类数可以等于业务模型中预测子模型的数量。
步骤S25:将所述多个子预测结果输入至集成子模型,得到预测结果。
在一些实施例中,可以将获得的多个子预测结果输入至集成子模型,得到预测结果。在一些场景示例中,所述业务对象可以包括用户,所述业务数据可以包括用户的资产数据。所述预测结果可以用于表示所述用户是否为资产流失用户。
本说明书实施例的预测方法,可以利用基于多视角学习的模型训练方法训练得到的业务模型对业务数据进行预测,得到预测结果,提高了预测结果的准确性。
以下介绍本说明书实施例的一个场景示例。
随着金融行业的发展,客户更换金融服务机构的成本越来越低。如果客户资产持续流失,将会对银行造成不利影响,导致银行口碑下降,盈利减少等。如果能在客户资产流失之前准确预测出客户具有流失倾向,营销人员就能在客户资产流失之前精准营销,进行客户挽留工作,减少银行损失。在客户资产流失预测场景中,可以考虑训练业务模型,使用训练得到的业务模型预测客户是否为资产流失客户。在训练业务模型的过程中,样本往往包含多种不同类别的特征数据。如果把不同类别的特征数据直接拼接在一起,特征数量太多使得在训练过程中容易造成“维度灾难问题”。并且,这些特征往往含义相差较大,进行拼接容易使其失去原有的含义,使得训练后的业务模型对的预测准确率较低。不同类别的特征数据可以构成样本的不同视角。因而可以考虑使用多视角学习技术训练业务模型。
但是,目前主流的多视角学习技术仍有不足,主要有两点。第一,目前的多视角学习技术没有考虑样本的空间分布信息,同等地对待在空间分布上距离较近和距离较远的样本,忽略了样本之间的空间分布情况。实际上在空间分布上距离较近的同类样本,在输出上也应该更为接近。在空间分布上距离较近的异类样本,蕴含的判别信息更为准确和丰富,在输出上也应该更为远离。第二,虽然样本有多个视角,但是同一样本的各个视角都独立地完成从特征数据到标签的学习,没有利用不同视角之间的输出进行优化。实际上,样本的各个视角都是从不同的角度描述样本,因此同一个样本在不同视角下的输出也应该尽可能接近。
为了提高模型训练效果,本场景示例提供一种基于多视角学习的模型训练方法,具有以下特性。一方面,基于客户资产流失预测场景的特性,构建了基本信息视角、资产信息视角、持有信息视角和行为信息视角等4个视角。另一方面,在空间分布上距离较近的同类样本相较于在空间分布上距离较远的同类样本,其输出也应该更为接近;在空间分布上距离较近的异类样本相较于在空间分布上距离较远的异类样本,其蕴含的信息更为丰富。因而根据样本的同类近邻关系和异类近邻关系构建类间相似度约束项(第一约束项),使业务模型充分学习到同类近邻样本和异类近邻样本之间的信息,优化业务模型的泛化效果。另一方面,充分利用多视角学习的优势,构建了多视角对比学习约束项(第二约束项),使得同一样本在不同视角下的输出尽可能接近。利用多视角之间的协同学习,提高多视角学习的效果。
利用训练后的业务模型,在客户资产可能流失之前进行精准预测。营销人员可以参考预测结果进行相应的处理,避免客户资产的流失,减少损失,提升金融机构在同行业的竞争力。
本说明书实施例提供一种基于多视角学习的模型训练装置,所述装置用于训练业务模型,所述业务模型包括多个预测子模型,每个预测子模型对应一种视角。
请参阅图4,所述装置可以包括以下单元。
构建单元31,用于构建样本集;所述样本集包括多个样本,所述样本包括标签和多种特征数据,所述标签用于表示样本的类型,每种特征数据对应一种视角;
输入单元33,用于将样本的特征数据输入至与该特征数据对应了同一视角的预测子模型,得到样本的多个子预测结果;每个子预测结果对应一种视角;
确定单元35,用于根据标签和子预测结果,确定业务模型的损失函数的值;所述损失函数包括第一约束项和第二约束项,所述第一约束项用于约束同一视角下不同样本的子预测结果的差异程度,所述第二约束项用于约束同一样本在不同视角下的子预测结果的差异程度;
优化单元37,用于根据损失函数的取值,优化业务模型的模型参数。
本说明书实施例提供一种预测装置。请参阅图5,所述装置包括以下单元。
提取单元41,用于从业务数据中提取多种特征数据;每种特征数据对应一种视角;
第一输入单元43,用于将特征数据输入至业务模型中与该特征数据对应了同一视角的预测子模型,得到多个子预测结果;所述业务模型包括多个预测子模型和集成子模型,每个预测子模型对应一种视角;
第二输入单元45,用于将所述多个子预测结果输入至集成子模型,得到预测结果。
请参阅图6。本说明书实施例还提供一种计算设备。
所述计算设备可以包括存储器和处理器。
在本实施例中,所述存储器包括但不限于动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)和静态随机存取存储器(Static Random Access Memory,SRAM)等。所述存储器可以用于存储计算机指令。
在本实施例中,所述处理器可以按任何适当的方式实现。例如,所述处理器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式等等。所述处理器可以用于执行所述计算机指令以实现图2或者图3所对应的实施例。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同或相似的部分互相参见即可,每个实施例重点说明的都是与其它实施例的不同之处。尤其,对于装置实施例和计算设备实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。另外,可以理解的是,本领域技术人员在阅读本说明书文件之后,可以无需创造性劳动想到将本说明书列举的部分或全部实施例进行任意组合,这些组合也在本说明书公开和保护的范围内。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本说明书可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本说明书的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本说明书各个实施例或者实施例的某些部分所述的方法。
本说明书可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
虽然通过实施例描绘了本说明书,本领域普通技术人员知道,本说明书有许多变形和变化而不脱离本说明书的精神,希望所附的权利要求包括这些变形和变化而不脱离本说明书的精神。
Claims (13)
1.一种基于多视角学习的模型训练方法,所述方法用于训练业务模型,所述业务模型包括多个预测子模型,每个预测子模型对应一种视角;所述方法包括:
构建样本集;所述样本集包括多个样本,每个样本包括标签和多种特征数据,所述标签用于表示样本的类型,每种特征数据对应一种视角;
将样本的特征数据输入至与该特征数据对应了同一视角的预测子模型,得到样本的多个子预测结果;每个子预测结果对应一种视角;
根据标签和子预测结果,确定业务模型的损失函数的值;所述损失函数包括第一约束项和第二约束项,所述第一约束项用于约束同一视角下不同样本的子预测结果的差异程度,所述第二约束项用于约束同一样本在不同视角下的子预测结果的差异程度;
根据损失函数的值,优化业务模型的模型参数。
2.如权利要求1所述的方法,所述构建样本集,包括:
采集业务对象的业务数据;
根据业务数据,对业务对象进行打标,得到业务对象的标签;
对业务数据进行特征工程处理,得到业务对象的多种特征数据;
根据业务对象的标签和多种特征数据构建所述样本集中的样本。
3.如权利要求1所述的方法,所述损失函数还包括第三约束项,所述第三约束项用于约束样本的子预测结果与标签之间的差异程度。
4.如权利要求3所述的方法,所述确定所述业务模型的损失函数的值,包括:
确定同一视角下不同样本的相似度;
确定同一视角下不同样本的子预测结果的第一差值;
根据相似度和第一差值,确定第一约束项的值;
确定同一样本在不同视角下的子预测结果的第二差值;
根据第二差值,确定第二约束项的值;
确定样本的子预测结果与样本的标签之间的第三差值;
根据第三差值,确定第三约束项的值;
根据第一约束项的值、第二约束项的值和第三约束项的值,确定损失函数的值。
5.如权利要求3所述的方法,所述损失函数包括L=Remp+α·Rbcs+γ·Rvcl;Rbcs表示第一约束项,Rvcl表示第二约束项,Remp表示第三约束项,α和γ表示权重。
7.如权利要求1所述的方法,所述优化业务模型的模型参数,包括:
根据损失函数的值,优化预测子模型的模型参数。
8.如权利要求1所述的方法,所述业务模型还包括集成子模型,所述集成子模型用于对多个预测子模型输出的多个子预测结果进行集成;所述方法还包括:
确定集成子模型的模型参数。
9.一种预测方法,包括:
从业务数据中提取多种特征数据;每种特征数据对应一种视角;
将特征数据输入至业务模型中与该特征数据对应了同一视角的预测子模型,得到多个子预测结果;所述业务模型包括多个预测子模型和集成子模型,每个预测子模型对应一种视角;
将所述多个子预测结果输入至集成子模型,得到预测结果。
10.如权利要求9所述的方法,所述业务数据包括用户的资产数据;所述预测结果用于表示所述用户是否为资产流失用户,所述业务模型基于权利要求1-8中任一项方法训练得到。
11.一种基于多视角学习的模型训练装置,所述装置用于训练业务模型,所述业务模型包括多个预测子模型,每个预测子模型对应一种视角;所述装置包括:
构建单元,用于构建样本集;所述样本集包括多个样本,所述样本包括标签和多种特征数据,所述标签用于表示样本的类型,每种特征数据对应一种视角;
输入单元,用于将样本的特征数据输入至与该特征数据对应了同一视角的预测子模型,得到样本的多个子预测结果;每个子预测结果对应一种视角;
确定单元,用于根据标签和子预测结果,确定业务模型的损失函数的值;所述损失函数包括第一约束项和第二约束项,所述第一约束项用于约束同一视角下不同样本的子预测结果的差异程度,所述第二约束项用于约束同一样本在不同视角下的子预测结果的差异程度;
优化单元,用于根据损失函数的取值,优化业务模型的模型参数。
12.一种预测装置,包括:
提取单元,用于从业务数据中提取多种特征数据;每种特征数据对应一种视角;
第一输入单元,用于将特征数据输入至业务模型中与该特征数据对应了同一视角的预测子模型,得到多个子预测结果;所述业务模型包括多个预测子模型和集成子模型,每个预测子模型对应一种视角;
第二输入单元,用于将所述多个子预测结果输入至集成子模型,得到预测结果。
13.一种电子设备,包括:
至少一个处理器;
存储有程序指令的存储器,其中,所述程序指令被配置为适于由所述至少一个处理器执行,所述程序指令包括用于执行如权利要求1-10中任一项所述方法的指令。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110409585.2A CN113052679A (zh) | 2021-04-16 | 2021-04-16 | 基于多视角学习的模型训练方法、预测方法、装置和电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110409585.2A CN113052679A (zh) | 2021-04-16 | 2021-04-16 | 基于多视角学习的模型训练方法、预测方法、装置和电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113052679A true CN113052679A (zh) | 2021-06-29 |
Family
ID=76520316
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110409585.2A Pending CN113052679A (zh) | 2021-04-16 | 2021-04-16 | 基于多视角学习的模型训练方法、预测方法、装置和电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113052679A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114742144A (zh) * | 2022-04-02 | 2022-07-12 | 中国建设银行股份有限公司 | 对象流失概率的确定方法、装置、计算机设备和存储介质 |
-
2021
- 2021-04-16 CN CN202110409585.2A patent/CN113052679A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114742144A (zh) * | 2022-04-02 | 2022-07-12 | 中国建设银行股份有限公司 | 对象流失概率的确定方法、装置、计算机设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhang et al. | Deeplob: Deep convolutional neural networks for limit order books | |
WO2019114434A1 (zh) | 一种基于图结构模型的交易风险控制方法、装置以及设备 | |
Yousaf et al. | The relationship between trading volume, volatility and returns of non-fungible tokens: evidence from a quantile approach | |
TW201944338A (zh) | 保險欺詐識別的資料處理方法、裝置、設備及伺服器 | |
Vieira et al. | How banks can better serve their customers through artificial techniques | |
US11210673B2 (en) | Transaction feature generation | |
CN111783039B (zh) | 风险确定方法、装置、计算机系统和存储介质 | |
CN112102049A (zh) | 一种模型训练方法、业务处理方法、装置及设备 | |
CN115545886A (zh) | 逾期风险识别方法、装置、设备及存储介质 | |
CN112328869A (zh) | 一种用户贷款意愿的预测方法、装置及计算机系统 | |
Wang et al. | A document analysis deep learning regression model for initial coin offerings success prediction | |
US20200210907A1 (en) | Utilizing econometric and machine learning models to identify analytics data for an entity | |
CN113052679A (zh) | 基于多视角学习的模型训练方法、预测方法、装置和电子设备 | |
Khadivizand et al. | Towards intelligent feature engineering for risk-based customer segmentation in banking | |
Biswas et al. | Automated credit assessment framework using ETL process and machine learning | |
US20230186385A1 (en) | Computer-implemented system and method of facilitating artificial intelligence based lending strategies and business revenue management | |
CN116800831A (zh) | 一种业务数据推送方法、装置、存储介质及处理器 | |
Mu et al. | Internet financial interest rate risk measure based on genetic rough set reduction | |
CN116523556A (zh) | 一种商家需求的预测方法和系统 | |
McPhail et al. | Machine learning implications for banking regulation | |
CN112836742A (zh) | 系统资源调整方法、装置及设备 | |
Zand | Towards intelligent risk-based customer segmentation in banking | |
Inal | IMPORTANCE OF FINTECHS IN DIGITAL AGE FOR TURKEY AND THE ROLE OF INFORMATION TECHNOLOGIES | |
CN113344066A (zh) | 一种模型训练方法、业务分配方法、装置及设备 | |
Aeshah et al. | Artificial intelligence application in the adoption of e-commerce in small and medium enterprises in Libya |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210629 |