CN111582565A - 数据融合方法、装置和电子设备 - Google Patents
数据融合方法、装置和电子设备 Download PDFInfo
- Publication number
- CN111582565A CN111582565A CN202010339014.1A CN202010339014A CN111582565A CN 111582565 A CN111582565 A CN 111582565A CN 202010339014 A CN202010339014 A CN 202010339014A CN 111582565 A CN111582565 A CN 111582565A
- Authority
- CN
- China
- Prior art keywords
- predicted value
- model
- predicted
- fusion
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
Abstract
本说明书实施例公开了一种数据融合方法、装置和电子设备的实施例。所述方法包括:获取业务对象的第一预测值和第二预测值,所述第一预测值由第一模型预测得到,所述第二预测值由第二模型预测得到,所述第一模型和所述第二模型分别对应不同的业务维度;根据第一预测值对应的业务等级和第二预测值对应的业务等级,确定第一融合策略;根据第一融合策略,对所述第一预测值和所述第二预测值进行融合。本说明书实施例的数据融合方法、装置和电子设备,可以提高预测结果的准确性。
Description
技术领域
本说明书实施例涉及计算机技术领域,特别涉及一种数据融合方法、装置和电子设备。
背景技术
随着互联网的发展,通常需要对业务对象的风险水平进行评估,并根据评估结果来支撑业务的运营。为此可以训练机器学习模型,进而根据机器学习模型评估业务对象的风险水平。
但是,业务形式的变化是较快的,机器学习模型往往无法跟随业务形势的变化及时更新,使得通过机器学习模型所获得的预测结果的准确性不高。
如何提高预测结果的准确性是当前亟需解决的技术问题。
发明内容
本说明书实施例提供一种数据融合方法、装置和电子设备,以提高预测结果的准确性。本说明书实施例的技术方案如下。
本说明书实施例的第一方面,提供了一种数据融合方法,包括:获取业务对象的第一预测值和第二预测值,所述第一预测值由第一模型预测得到,所述第二预测值由第二模型预测得到,所述第一模型和所述第二模型分别对应不同的业务维度;根据第一预测值对应的业务等级和第二预测值对应的业务等级,确定第一融合策略;根据第一融合策略,对所述第一预测值和所述第二预测值进行融合。
本说明书实施例的第二方面,提供了一种数据融合装置,包括:获取模块,用于获取业务对象的第一预测值和第二预测值,所述第一预测值由第一模型预测得到,所述第二预测值由第二模型预测得到,所述第一模型和所述第二模型分别对应不同的业务维度;确定模块,用于根据第一预测值对应的业务等级和第二预测值对应的业务等级,确定第一融合策略;融合模块,用于根据第一融合策略,对所述第一预测值和所述第二预测值进行融合。
本说明书实施例的第三方面,提供了一种电子设备,包括:至少一个处理器;存储有程序指令的存储器,其中,所述程序指令被配置为适于由所述至少一个处理器执行,所述程序指令包括用于执行如第一方面所述方法的指令。
本说明书实施例提供的技术方案,第一模型和第二模型分别对应了不同的业务维度。服务器可以根据业务等级对第一模型的第一预测值和第二模型的第二预测值进行融合处理,实现了将不同业务维度下的预测值进行融合,从而提高了预测结果的准确性,方便高效。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本说明书实施例中数据融合方法的流程示意图;
图2为本说明书实施例中数据融合过程的示意图;
图3为本说明书实施例中通过迭代过程对多个第二预测值进行融合的流程示意图;
图4为本说明书实施例中数据融合装置的结构示意图;
图5为本说明书实施例中电子设备的结构示意图。
具体实施方式
下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。本说明书的一个或多个实施例中采用术语第一、第二、第三等来描述各种信息,但这些信息并不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书实施例范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。
在业务的运营中存在已获得使用的机器学习模型。所述机器学习模型可以对应一种或多种业务维度。所述机器学习模型是利用所述一种或多种业务维度下的历史业务数据训练得到的。因而所述机器学习模型可以利用所述一种或多种业务维度下的业务数据进行预测。所述业务维度包括但不限于工商信息维度、经营状况维度、关系图谱维度、新闻舆情维度等。鉴于业务形势变化较快,往往需要增加新的业务维度,从而将新的业务维度反映在最终的预测结果中。所述新的业务维度包括但不限于涉诉维度、非法集资维度等。但是,新的业务维度下所累积的业务数据往往较少,不足以对所述机器学习模型进行重新训练。另外,重新训练所述机器学习模型耗时也较长,无法将新的业务维度快速地反映在最终的预测结果中,从而无法快速地提升预测效果。基于以上的考虑,发明人发现可以为新的业务维度构建专家模型。所述专家模型可以理解为:基于业务专家的经验所构建的数据处理逻辑。所述专家模型例如可以包括评分规则等。所述专家模型可以利用新的业务维度下的业务数据进行预测。通过将机器学习模型的预测结果和专家模型的预测结果进行融合,可以得到最终的预测结果,从而实现将新的业务维度快速地反映在最终的预测结果中。
基于以上的技术构思,本说明书提供一种数据融合方法的实施例,所述数据融合方法可以应用于服务器。所述服务器可以为单个服务器、由多个服务器构成的服务器集群、或部署在云端的服务器。请参阅图1和图2。所述数据融合方法可以包括可以下步骤。
步骤S12:获取业务对象的第一预测值和第二预测值。
在一些实施例中,所述业务对象包括但不限于个人、企业等。
在一些实施例中,所述第一预测值可以根据第一模型预测得到。所述第一模型包括通过机器学习训练得到的机器学习模型。所述机器学习模型包括但不限于逻辑回归模型、决策树模型、神经网络模型等。所述第一模型对应一种或多种业务维度。所述服务器可以将所述业务对象的在所述一种或多种业务维度下的业务数据,输入至所述第一模型,得到第一预测值。
例如,所述业务对象可以为企业。所述第一模型对应的业务维度可以包括工商信息维度、经营状况维度、关系图谱维度、以及新闻舆情维度等。工商信息维度下的业务数据包括股东人数、以及注册资本等。经营状况维度下的业务数据包括营业额、以及利润额等。关系图谱维度下的业务数据包括所投资公司的数量等。新闻舆情维度下的业务数据包括正面事件的数量、以及负面事件的数量等。又例如,所述业务对象可以为个人。所述第一模型对应的业务维度可以包括身份信息维度。身份信息维度下的业务数据包括学历等。
在实际应用中,所述第一模型可以为在业务的运营中已获得使用的模型。所述第一模型例如可以为评分模型。所述第一预测值例如可以为风险值或信用值等。
在一些实施例中,所述第二预测值可以通过第二模型预测得到。所述第二模型可以为通过机器学习训练得到的机器学习模型;或者,还可以为通过专家经验构建得到的模型。所述第二模型可以对应一种业务维度(或者,也可以对应多种业务维度)。所述服务器可以将所述业务对象的在所述业务维度下的业务数据,输入至所述第二模型,得到所述第二预测值。具体地,所述第二模型的数量可以为一个。所述服务器可以将所述第二模型所对应业务维度下的业务数据,输入至所述第二模型,得到第二预测值。这样所述服务器可以得到一个第二预测值。或者,所述第二模型的数量还可以为多个。针对每个第二模型,所述服务器可以将该第二模型所对应业务维度下的业务数据,输入至该第二模型,得到第二预测值。这样所述服务器可以得到多个第二预测值。
例如,所述业务对象可以为企业。所述第二模型对应的业务维度可以为涉诉维度或非法集资维度。涉诉维度下的业务数据包括涉诉次数、涉诉金额、涉诉时间等。非法集资维度下的业务数据包括非法集资金额等。又例如,所述业务对象可以为个人。所述第二模型对应的业务维度可以为资金状况维度。资金状况维度下的业务数据包括个人收入等。
其中,第二模型和第一模型对应的业务维度可以不同。另外,当第二模型的数量为多个时,各个第二模型对应的业务维度也可以不同。例如,第一模型对应的业务维度可以包括业务维度A、业务维度B、以及业务维度C。第二模型M1对应的业务维度可以为业务维度D。第二模型M2对应的业务维度可以为业务维度E。
在实际应用中,所述第二模型可以包括为新的业务维度构建的模型。所述第二模型例如可以为评分模型。所述第二预测值例如可以为风险值或信用值等。
值得说明的是,每种业务维度可以对应一种数据指标(又称为标签)。所述标签能够表征业务对象在业务维度下的行为特征。例如,涉诉维度下的业务数据包括涉诉次数、涉诉金额、涉诉时间等。涉诉维度对应的标签包括通过对涉诉次数、涉诉金额、涉诉时间等进行量化得到的涉诉数值。又例如,非法集资维度下的业务数据包括非法集资金额等。非法集资维度对应的标签包括通过非法集资金额等进行量化得到的非法集资数值。所述第一模型可以对应一种或多种业务维度,每种业务维度可以对应一种标签。使得所述第一模型可以对应一种或多种标签。类似地,所述第二模型可以对应一种或多种标签。第二模型和第一模型对应的标签种类可以不同。当第二模型的数量为多个时,各个第二模型对应的标签种类也可以不同。
步骤S14:根据第一预测值对应的业务等级和第二预测值对应的业务等级,确定第一融合策略。
在一些实施例中,所述第一预测值和所述第二预测值可以分别为预测结果区间中的数值。所述预测结果区间可以包括多个子区间。每个子区间可以对应一个业务等级。所述业务等级例如可以为风险等级或信用等级等。每个业务等级表示一种业务含义。在业务含义上,业务等级的大小具有可比较性。例如,业务等级越大表示风险越高。
在一些场景示例中,所述预测结果区间可以为[0,100]。所述预测结果区间[0,100]可以包括子区间[0,30)、[30,50)、[50,70)、以及[70,100)。子区间[0,30)、[30,50)、[50,70)、以及 [70,100)对应的业务等级具体如下表1所示。
表1
上述表1中,风险等级R1、风险等级R2、风险等级R3、风险等级R4依次增大。风险等级R1、风险等级R2、风险等级R3、风险等级R4表示的风险依次增高。
值得说明的是,在业务含义上,子区间内数值的大小具有可比较性。例如,子区间内数值越大表示风险越高。另外,所述预测结果区间可以通过归一化的方法得到。具体地,所述第一模型的输出范围和所述第二模型的输出范围有可能是不同的。为此,所述服务器可以将所述第一模型的输出范围和所述第二模型的输出范围归一化到所述预测结果区间,使得所述第一预测值和所述第二预测值分别为所述预测结果区间中的数值。
在一些实施例中,每个业务等级可以对应一种融合策略。不同的业务等级对应的融合策略可以相同或不同。所述融合策略用于对两个或两个以上的预测值进行融合处理。所述融合策略包括但不限于对所述两个或两个以上的预测值取平均值、对所述两个或两个以上的预测值取加权平均值、对所述两个或两个以上的预测值取中位数等等。当然,所述融合策略还可以采用其它的方式实现,在此不再一一列举。
延续前面的场景示例,风险等级R1、风险等级R2、风险等级R3、以及风险等级R4对应的融合策略可以分别如下所示。
Sm和St表示待融合的两个预测值,Rm表示预测值Sm对应的业务等级,Rt表示预测值St对应的业务等级,Smax=max(Sm,SR),Smin=min(Sm,SR),R=max(Rm,Rt);
SR表示业务等级R所对应子区间的上边界值,SR1表示业务等级R1所对应子区间的上边界值,SR2表示业务等级R2所对应子区间的上边界值,SR3表示业务等级R3所对应子区间的上边界值,SR4表示业务等级R4所对应子区间的上边界值;
在一些实施例中,所述服务器可以得到一个第二预测值。如此所述服务器可以根据第一预测值对应的业务等级和第二预测值对应的业务等级,确定第一融合策略。
所述服务器可以确定第一预测值所在的子区间;可以将该子区间所对应的业务等级作为第一预测值对应的业务等级。类似地,所述服务器可以确定第二预测值所在的子区间;可以将该子区间所对应的业务等级作为第二预测值对应的业务等级。
所述服务器可以获取第一预测值对应的业务等级和第二预测值对应的业务等级中的较大者;可以将较大者对应的融合策略确定为第一融合策略。当然,所述服务器还可以采用其它的方式确定第一融合策略。例如,所述服务器还可以获取第一预测值对应的业务等级和第二预测值对应的业务等级中的较小者;可以将较小者对应的融合策略确定为第一融合策略。
在一些实施例中,所述服务器可以得到多个第二预测值。如此所述服务器可以对所述多个第二预测值进行融合,得到第三预测值;可以根据第三预测值对应的业务等级和第一预测值对应的业务等级,确定第一融合策略。
在本实施例的一些实施方式中,所述服务器可以通过迭代过程对所述多个第二预测值进行融合。请参阅图3,所述迭代过程可以包括以下步骤。
步骤S1402:从数据集中不放回地抽取两个第二预测值。
所述数据集可以包括所述多个第二预测值。从所述数据集中不放回地抽取两个第二预测值可以理解为:从所述数据集中抽取两个第二预测值,并从所述数据集中删除抽取的两个第二预测值。具体地,所述服务器可以从所述数据集中抽取数值最大的第二预测值、以及数值最小的第二预测值。进一步地,所述服务器可以直接从所述数据集中抽取数值最大的第二预测值、以及数值最小的当然预测值。或者,所述服务器还可以对所述数据集中的第二预测值进行排序;可以从排序后的数据集中抽取位于首端的第二预测值、以及位于末端的第二预测值。当然,所述服务器还可以采用其它的方式从所述数据集中抽取两个第二预测值。例如,所述服务器可以从所述数据集中随机抽取两个第二预测值。
步骤S1404:对抽取的两个第二预测值进行融合。
所述服务器可以根据抽取的两个第二预测值对应的业务等级,确定第二融合策略;可以根据第二融合策略,对抽取的两个第二预测值进行融合。
针对抽取的每个第二预测值,所述服务器可以确定该第二预测值所在的子区间;可以将该子区间所对应的业务等级作为该第二预测值对应的业务等级。所述服务器可以获取抽取的两个第二预测值所对应业务等级中的较大者;可以将较大者对应的融合策略作为第二融合策略。当然,所述服务器还可以采用其它方式确定第一融合策略。例如,所述服务器可以获取抽取的两个第二预测值所对应业务等级中的较小者;可以将较小者对应的融合策略作为第二融合策略。利用所述第二融合策略,所述服务器可以获得抽取的两个第二预测值的融合结果。
例如,抽取的两个第二预测值可以分别表示为Se1和Se2。第二预测值Se1对应的业务等级可以表示为Re1=R2,第二预测值Se2对应的业务等级可以表示为Re2=R3。其中, R=max(Re1,Re2)=max(R2,R3)=R3, 那么,所述服务器可以利用业务等级R3对应的融合策略获得第二预测值Se1和Se2的融合结果。
步骤S1406:将融合结果作为第二预测值添加至数据集中。
步骤S1408:判断数据集中第二预测值的数量是否为一个。
若数据集中第二预测值的数量大于或等于两个,所述服务器可以返回执行步骤S1402。若数据集中第二预测值的数量为一个,所述服务器可以执行步骤S1410。
步骤S1410:将数据集中的第二预测值确定为第三预测值。
通过迭代的方式,所述服务器可以实现将多种业务维度的第二预测值逐步融合。另外,所述服务器是根据业务等级对应的融合策略,对抽取的两个第二预测值进行融合的。这样所述服务器可以根据业务等级进行融合,方便高效。
在本实施例的一些实施方式中,所述服务器可以确定第三预测值所在的子区间;可以将该子区间所对应的业务等级作为第三预测值对应的业务等级。类似地,所述服务器可以确定第一预测值所在的子区间;可以将该子区间所对应的业务等级作为第一预测值对应的业务等级。所述服务器可以获取第三预测值对应的业务等级和第一预测值对应的业务等级中的较大者;可以将较大者对应的融合策略确定为第一融合策略。当然,所述服务器还可以采用其它的方式确定第一融合策略。例如,所述服务器还可以获取第三预测值对应的业务等级和第一预测值对应的业务等级中的较小者;可以将较小者对应的融合策略确定为第一融合策略。
在本实施例的一些实施方式中,每种业务维度可以对应一种标签。每种标签对应有标签注释信息。所述标签注释信息用于对标签进行说明介绍。
每个第二预测值是由一个第二模型预测得到的,每个第二模型对应一种或多种业务维度,每种业务维度对应一种标签,每种标签对应有标签注释信息。使得每个第二预测值可以对应有标签注释信息。这样所述服务器可以将所述多个第二预测值的标签注释信息进行合并处理。
步骤S16:根据第一融合策略,对所述第一预测值和所述第二预测值进行融合。
在一些实施例中,如前面所述,所述服务器可以得到一个第二预测值;可以根据第一预测值对应的业务等级和第二预测值对应的业务等级,确定第一融合策略。如此所述服务器可以根据第一融合策略对第一预测值和第二预测值进行融合,得到最终的预测结果。
例如,所述第一预测值可以表示为Sf1,所述第二预测值可以表示为Sf2。第一预测值Sf1对应的业务等级可以表示为Rf1=R2。第二预测值Sf2对应的业务等级可以表示为Rf2=R3。其中,R=max(Rf1,Rf2)=max(R2,R3)=R3, 那么,所述服务器可以利用业务等级R3对应的融合策略获得第一预测值Sf1和第二预测值Sf2的融合结果。
或者,如前面所述,所述服务器可以得到多个第二预测值;可以对所述多个第二预测值进行融合,得到第三预测值;可以根据第三预测值对应的业务等级和第一预测值对应的业务等级,确定第一融合策略。如此所述服务器可以根据第一融合策略对第一预测值和第三预测值进行融合,得到最终的预测结果。
在一些实施例中,每种业务维度对应一种标签,每种标签对应有标签注释信息。如此所述服务器可以将第一模型所对应业务维度的标签注释信息和第二模型所对应业务维度的标签注释信息进行合并处理。具体地,所述第二模型的数量可以为一个。所述服务器可以将第一模型所对应业务维度的标签注释信息和一个第二模型所对应业务维度的标签注释信息进行合并处理。或者,所述第二模型的数量可以为多个。所述服务器可以将第一模型所对应业务维度的标签注释信息和多个第二模型所对应业务维度的标签注释信息进行合并处理。
在一些实施例中,在新的业务维度下所累积的业务数据达到一定数量后,所述服务器可以对新的业务维度进行评估。若评估结果为新的业务维度适合纳入所述第一模型,所述服务器可以利用新的业务维度下的业务数据,对所述第一模型进行重新训练,实现将新的业务维度纳入第一模型。这样在后续过程可以直接利用重新训练后的第一模型获得最终的预测结果。
本说明书实施例的数据融合方法,第一模型和第二模型分别对应了不同的业务维度。所述服务器可以根据业务等级对第一模型的第一预测值和第二模型的第二预测值进行融合处理,实现了将不同业务维度下的预测值进行融合,从而能够在第一模型和第二模型解耦的条件下提高预测结果的准确性,方便高效。
以下介绍本说明书实施例的一个应用场景示例。
在金融风控领域,通常需要识别企业的金融风险。在业务的运营中存在已获得使用的第一模型。所述第一模型包括机器学习模型。所述第一模型对应的业务维度包括工商信息维度、经营状况维度、关系图谱维度、以及新闻舆情维度等。鉴于业务形势变化较快,需要增加涉诉维度、非法集资维度等新的业务维度。为此可以为涉诉维度构建专家模型作为第二模型;可以为非法集资维度构建另一专家模型作为另一第二模型。所述服务器可以获取根据第一模型预测得到的第一预测值、以及根据两个第二模型预测得到的两个第二预测值;可以对所述两个第二预测值进行融合,得到第三预测值。所述服务器可以根据第三预测值对应的业务等级和第一预测值对应的业务等级,确定第一融合策略;可以根据第一融合策略,对所述第一预测值和所述第二预测值进行融合,得到最终的预测结果。这样可以将涉诉维度、非法集资维度等新的业务维度快速地反映在最终的预测结果中,快速地提升企业金融风险的预测效果。
请参阅图4。本说明书还提供数据融合装置的一个实施例。
所述数据融合装置可以包括以下模块单元。
获取模块42,用于获取业务对象的第一预测值和第二预测值,所述第一预测值由第一模型预测得到,所述第二预测值由第二模型预测得到,所述第一模型和所述第二模型分别对应不同的业务维度;
确定模块44,用于根据第一预测值对应的业务等级和第二预测值对应的业务等级,确定第一融合策略;
融合模块46,用于根据第一融合策略,对所述第一预测值和所述第二预测值进行融合。
下面介绍本说明书电子设备的一个实施例。图5是该实施例中电子设备的硬件结构示意图。如图5所示,该电子设备可以包括一个或多个(图中仅示出一个)处理器、存储器和传输模块。当然,本领域普通技术人员可以理解,图5所示的硬件结构仅为示意,其并不对上述电子设备的硬件结构造成限定。在实际中该电子设备还可以包括比图5所示更多或者更少的组件单元;或者,具有与图5所示不同的配置。
所述存储器可以包括高速随机存储器;或者,还可以包括非易失性存储器,例如一个或者多个磁性存储装置、闪存或者其他非易失性固态存储器。当然,所述存储器还可以包括远程设置的网络存储器。所述远程设置的网络存储器可以通过诸如互联网、企业内部网、局域网、移动通信网等网络连接至所述电子设备。所述存储器可以用于存储应用软件的程序指令或模块,例如本说明书附图图1所对应实施例的程序指令或模块。
所述处理器可以按任何适当的方式实现。例如,所述处理器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific IntegratedCircuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式等等。所述处理器可以读取并执行所述存储器中的程序指令或模块。
所述传输模块可以用于经由网络进行数据传输,例如经由诸如互联网、企业内部网、局域网、移动通信网等网络进行数据传输。
本说明书还提供计算机存储介质的一个实施例。所述计算机存储介质包括但不限于随机存取存储器(Random Access Memory,RAM)、只读存储器(Read-Only Memory,ROM)、缓存(Cache)、硬盘(Hard Disk Drive,HDD)、存储卡(Memory Card)等等。所述计算机存储介质存储有计算机程序指令。在所述计算机程序指令被执行时实现:本说明书附图图1所对应实施例的程序指令或模块。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同或相似的部分互相参见即可,每个实施例重点说明的都是与其它实施例的不同之处。尤其,对于装置实施例、电子设备实施例、以及计算机存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。另外,可以理解的是,本领域技术人员在阅读本说明书文件之后,可以无需创造性劳动想到将本说明书列举的部分或全部实施例进行任意组合,这些组合也在本说明书公开和保护的范围内。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray, FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、 CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language) 等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog2。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本说明书可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本说明书的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本说明书各个实施例或者实施例的某些部分所述的方法。
本说明书可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
虽然通过实施例描绘了本说明书,本领域普通技术人员知道,本说明书有许多变形和变化而不脱离本说明书的精神,希望所附的权利要求包括这些变形和变化而不脱离本说明书的精神。
Claims (12)
1.一种数据融合方法,包括:
获取业务对象的第一预测值和第二预测值,所述第一预测值由第一模型预测得到,所述第二预测值由第二模型预测得到,所述第一模型和所述第二模型分别对应不同的业务维度;
根据第一预测值对应的业务等级和第二预测值对应的业务等级,确定第一融合策略;
根据第一融合策略,对所述第一预测值和所述第二预测值进行融合。
2.如权利要求1所述的方法,所述第一模型通过机器学习训练得到、且对应一种或多种业务维度,所述第二模型根据专家经验构建得到、且对应一种业务维度。
3.如权利要求1所述的方法,所述第一预测值和所述第二预测值均包括风险值,所述业务等级包括风险等级。
4.如权利要求1所述的方法,所述确定第一融合策略,包括:
获取第一预测值对应的业务等级和第二预测值对应的业务等级中的较大者;
获取较大者对应的融合策略作为第一融合策略。
5.如权利要求1所述的方法,所述获取业务对象的第二预测值,包括:
获取业务对象的多个第二预测值,所述多个第二预测值根据多个第二模型预测得到;
所述确定第一融合策略,包括:
对所述多个第二预测值进行融合,得到第三预测值;
根据第三预测值对应的业务等级和第一预测值对应的业务等级,确定第一融合策略;
所述对所述第一预测值和所述第二预测值进行融合,包括:
根据第一融合策略,对所述第一预测值和所述第三预测值进行融合。
6.如权利要求5所述的方法,所述对所述多个第二预测值进行融合,包括:
从数据集中不放回地抽取两个第二预测值,所述数据集包括所述多个第二预测值;
对抽取的两个第二预测值进行融合;
将融合结果作为第二预测值添加至数据集中;
利用以上抽取、融合和添加步骤进行迭代处理,直至数据集中第二预测值的数量为一个;
将数据集中的第二预测值确定为第三预测值。
7.如权利要求6所述的方法,所述从数据集中不放回地抽取两个第二预测值,包括:
从数据集中不放回地抽取数值最大的第二预测值、以及数值最小的第二预测值。
8.如权利要求6所述的方法,所述对抽取的两个第二预测值进行融合,包括:
根据抽取的两个第二预测值对应的业务等级,确定第二融合策略;
根据第二融合策略,对抽取的两个第二预测值进行融合。
9.如权利要求8所述的方法,所述确定第二融合策略,包括:
获取抽取的两个第二预测值对应的业务等级中的较大者;
获取较大者对应的融合策略作为第二融合策略。
10.如权利要求1所述的方法,还包括:
将第一模型所对应业务维度的标签注释信息和第二模型所对应业务维度的标签注释信息进行合并处理。
11.一种数据融合装置,包括:
获取模块,用于获取业务对象的第一预测值和第二预测值,所述第一预测值由第一模型预测得到,所述第二预测值由第二模型预测得到,所述第一模型和所述第二模型分别对应不同的业务维度;
确定模块,用于根据第一预测值对应的业务等级和第二预测值对应的业务等级,确定第一融合策略;
融合模块,用于根据第一融合策略,对所述第一预测值和所述第二预测值进行融合。
12.一种电子设备,包括:
至少一个处理器;
存储有程序指令的存储器,其中,所述程序指令被配置为适于由所述至少一个处理器执行,所述程序指令包括用于执行如权利要求1-10中任一项所述方法的指令。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010339014.1A CN111582565A (zh) | 2020-04-26 | 2020-04-26 | 数据融合方法、装置和电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010339014.1A CN111582565A (zh) | 2020-04-26 | 2020-04-26 | 数据融合方法、装置和电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111582565A true CN111582565A (zh) | 2020-08-25 |
Family
ID=72124499
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010339014.1A Pending CN111582565A (zh) | 2020-04-26 | 2020-04-26 | 数据融合方法、装置和电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111582565A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112580992A (zh) * | 2020-12-23 | 2021-03-30 | 成都数联铭品科技有限公司 | 类金融企业的非法集资风险监测系统 |
CN112767056A (zh) * | 2021-02-04 | 2021-05-07 | 腾讯科技(深圳)有限公司 | 业务数据预测方法、装置、计算机设备和存储介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107644375A (zh) * | 2016-07-22 | 2018-01-30 | 花生米浙江数据信息服务股份有限公司 | 一种专家模型与机器学习模型融合的小商户信用评估方法 |
CN108052979A (zh) * | 2017-12-15 | 2018-05-18 | 阿里巴巴集团控股有限公司 | 对模型预测值进行融合的方法、装置和设备 |
CN109598285A (zh) * | 2018-10-24 | 2019-04-09 | 阿里巴巴集团控股有限公司 | 一种模型的处理方法、装置及设备 |
CN110222762A (zh) * | 2019-06-04 | 2019-09-10 | 恒安嘉新(北京)科技股份公司 | 对象预测方法、装置、设备、及介质 |
CN110222869A (zh) * | 2019-04-30 | 2019-09-10 | 北京三快在线科技有限公司 | 商家逃单行为的识别方法、装置、电子设备及存储介质 |
CN110930249A (zh) * | 2020-02-07 | 2020-03-27 | 成都数联铭品科技有限公司 | 大型企业信用风险预测方法及系统、存储介质及电子设备 |
CN110956275A (zh) * | 2019-11-27 | 2020-04-03 | 支付宝(杭州)信息技术有限公司 | 风险预测和风险预测模型的训练方法、装置及电子设备 |
CN111062563A (zh) * | 2019-11-08 | 2020-04-24 | 支付宝(杭州)信息技术有限公司 | 风险预测模型的训练方法、风险预测方法及相关装置 |
CN111062444A (zh) * | 2019-12-21 | 2020-04-24 | 湖南大学 | 信用风险预测方法、系统、终端及存储介质 |
-
2020
- 2020-04-26 CN CN202010339014.1A patent/CN111582565A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107644375A (zh) * | 2016-07-22 | 2018-01-30 | 花生米浙江数据信息服务股份有限公司 | 一种专家模型与机器学习模型融合的小商户信用评估方法 |
CN108052979A (zh) * | 2017-12-15 | 2018-05-18 | 阿里巴巴集团控股有限公司 | 对模型预测值进行融合的方法、装置和设备 |
CN109598285A (zh) * | 2018-10-24 | 2019-04-09 | 阿里巴巴集团控股有限公司 | 一种模型的处理方法、装置及设备 |
CN110222869A (zh) * | 2019-04-30 | 2019-09-10 | 北京三快在线科技有限公司 | 商家逃单行为的识别方法、装置、电子设备及存储介质 |
CN110222762A (zh) * | 2019-06-04 | 2019-09-10 | 恒安嘉新(北京)科技股份公司 | 对象预测方法、装置、设备、及介质 |
CN111062563A (zh) * | 2019-11-08 | 2020-04-24 | 支付宝(杭州)信息技术有限公司 | 风险预测模型的训练方法、风险预测方法及相关装置 |
CN110956275A (zh) * | 2019-11-27 | 2020-04-03 | 支付宝(杭州)信息技术有限公司 | 风险预测和风险预测模型的训练方法、装置及电子设备 |
CN111062444A (zh) * | 2019-12-21 | 2020-04-24 | 湖南大学 | 信用风险预测方法、系统、终端及存储介质 |
CN110930249A (zh) * | 2020-02-07 | 2020-03-27 | 成都数联铭品科技有限公司 | 大型企业信用风险预测方法及系统、存储介质及电子设备 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112580992A (zh) * | 2020-12-23 | 2021-03-30 | 成都数联铭品科技有限公司 | 类金融企业的非法集资风险监测系统 |
CN112580992B (zh) * | 2020-12-23 | 2024-04-09 | 成都数联铭品科技有限公司 | 类金融企业的非法集资风险监测系统 |
CN112767056A (zh) * | 2021-02-04 | 2021-05-07 | 腾讯科技(深圳)有限公司 | 业务数据预测方法、装置、计算机设备和存储介质 |
CN112767056B (zh) * | 2021-02-04 | 2023-07-25 | 腾讯科技(深圳)有限公司 | 业务数据预测方法、装置、计算机设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110377759B (zh) | 事件关系图谱构建方法及装置 | |
CN111143681B (zh) | 一种资讯推荐装置、方法、设备及系统 | |
CN108885623A (zh) | 基于知识图谱的语意分析系统及方法 | |
CN108346107B (zh) | 一种社交内容风险识别方法、装置以及设备 | |
CN111538794B (zh) | 一种数据融合方法、装置及设备 | |
CN108764915B (zh) | 模型训练方法、数据类型识别方法和计算机设备 | |
CN111538766B (zh) | 一种文本分类方法、装置、处理设备和票据分类系统 | |
CN111930623B (zh) | 一种测试案例构建方法、装置及电子设备 | |
CN111080304A (zh) | 一种可信关系识别方法、装置及设备 | |
CN110674188A (zh) | 一种特征提取方法、装置及设备 | |
CN109918678B (zh) | 一种字段含义识别方法和装置 | |
CN111582565A (zh) | 数据融合方法、装置和电子设备 | |
CN112966113A (zh) | 一种数据的风险防控方法、装置及设备 | |
Aralikatte et al. | Fault in your stars: an analysis of android app reviews | |
CN110263817B (zh) | 一种基于用户账号的风险等级划分方法及装置 | |
CN110909540A (zh) | 短信垃圾新词识别方法、装置及电子设备 | |
CN111047220A (zh) | 一种风控阈值条件确定方法、装置、设备和可读介质 | |
CN113378090B (zh) | 一种互联网网站相似度分析方法、装置以及可读存储介质 | |
CN111259975B (zh) | 分类器的生成方法及装置、文本的分类方法及装置 | |
CN113221717A (zh) | 一种基于隐私保护的模型构建方法、装置及设备 | |
CN116308738B (zh) | 一种模型训练的方法、业务风控的方法及装置 | |
KR102472447B1 (ko) | 머신러닝을 이용한 복합 문서내 특정 콘텐츠 자동 차단 시스템 및 방법 | |
CN113705201B (zh) | 基于文本的事件概率预测评估算法、电子设备及存储介质 | |
CN111523995B (zh) | 一种模型迁移的特征值确定方法、装置及设备 | |
US11762896B2 (en) | Relationship discovery and quantification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40035932 Country of ref document: HK |
|
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200825 |