CN111340212A - 一种数据联盟的信誉度确定方法及装置 - Google Patents

一种数据联盟的信誉度确定方法及装置 Download PDF

Info

Publication number
CN111340212A
CN111340212A CN202010103011.8A CN202010103011A CN111340212A CN 111340212 A CN111340212 A CN 111340212A CN 202010103011 A CN202010103011 A CN 202010103011A CN 111340212 A CN111340212 A CN 111340212A
Authority
CN
China
Prior art keywords
data
participant
alliance
federation
reputation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010103011.8A
Other languages
English (en)
Inventor
刘洋
于涵
陈天健
杨强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
WeBank Co Ltd
Original Assignee
WeBank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by WeBank Co Ltd filed Critical WeBank Co Ltd
Priority to CN202010103011.8A priority Critical patent/CN111340212A/zh
Publication of CN111340212A publication Critical patent/CN111340212A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Technology Law (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种数据联盟的信誉度确定方法及装置,该方法包括:获取待处理数据联盟的参与方个数和联盟成本控制偏好;根据所述待处理数据联盟的联盟类型,查询与所述待处理数据联盟相同或者相似的数据联盟;根据所述参与方个数、所述联盟成本控制偏好、查询数据联盟的信誉度和预设信誉度确定模型,确定所述待处理数据联盟的信誉度,其中,所述预设信誉度确定模型是根据预设博弈算法对历史数据联邦的信誉度、各个参与方模型质量、各个参与方成本控制偏好进行分析得的。采用上述方法,可以避免数据联盟的信誉值偏高或偏低,获得合理的准入门槛值,提高数据联盟收益。

Description

一种数据联盟的信誉度确定方法及装置
技术领域
本发明涉及金融科技(Fintech)领域以及人工智能技术领域,尤其涉及一种数据联盟的信誉度确定方法及装置。
背景技术
随着计算机技术的发展,越来越多的技术应用在金融领域,传统金融业正在逐步向金融科技(Fintech)转变。但由于金融行业的安全性、实时性要求,也对技术提出更高的要求。目前,金融科技领域中许多金融策略的调整都依赖于对大量金融交易数据进行联邦学习的结果,相应金融策略的调整很可能对金融机构的盈亏造成影响。因此,对一个金融机构来说,其联邦学习模型的精确性至关重要。
联邦学习能有效帮助多个参与方在满足用户隐私保护、数据安全和政府法规的要求下,进行数据使用和机器学习建模。而联邦学习进行机器学习建模时需要参与方贡献数据模型,且数据模型的质量高低会影响联邦学习模型的精确性。因此,联邦学习在选择参与方时,需要设置参与方数据模型的质量的准入门槛值,准入门槛值高会提高参与方贡献的数据模型质量,同时也提高了联邦学习模型的精确性;但准入门槛值高会使得参与方数量减少,也会造成参与方对联邦学习的负面评价,以至联邦学习的信誉值降低;在未来进行联邦学习时,低的信誉值会进一步造成参与方的减少;相应的,准入门槛值低虽然会使得参与方的数量增加,但会降低参与方贡献的数据模型质量,也降低了联邦学习模型的精确性;因此,参与方得到的联邦优化后的数据模型质量不好,同样会造成参与方对联邦学习的负面评价,以至联邦学习的信誉值降低。
现有技术,根据参与方对联邦学习的打分结果,确定数据联盟的信誉度,然而,由于参与方在联邦学习机制中的主观性,参与方对该联邦学习打分偏高和偏低都会造成联邦学习的信誉值偏高或偏低。
发明内容
本发明提供一种数据联盟的信誉度确定方法及装置,用于避免数据联盟的信誉值偏高或偏低,获得合理的准入门槛值,提高数据联盟收益。
第一方面,本发明提供一种数据联盟的信誉度确定方法,该方法包括:
获取待处理数据联盟的参与方个数和联盟成本控制偏好;根据所述待处理数据联盟的联盟类型,查询与所述待处理数据联盟相同或者相似的数据联盟;根据所述参与方个数、所述联盟成本控制偏好、查询数据联盟的信誉度和预设信誉度确定模型,确定所述待处理数据联盟的信誉度,其中,所述预设信誉度确定模型是根据预设博弈算法对历史数据联邦的信誉度、各个参与方模型质量、各个参与方成本控制偏好进行分析得的。
采用上述方法,通过获取待处理数据联盟的参与方个数和联盟成本控制偏好,再通过待处理数据联盟的联盟类型查询与待处理数据联盟相同或者相似的数据联盟;从而得到并根据参与方个数、联盟成本控制偏好、查询数据联盟的信誉度和预设信誉度确定模型,确定待处理数据联盟的信誉度。如此,可以得到合理的信誉度值,进一步地,因为信誉度值与准入门槛值得强关联性,根据合理的信誉度值获得数据联盟的准入门槛值。因此,一方面,使得准入门槛值不会过高,有效防止参加待处理数据联盟的参与方减少,以及降低参与方给予该待处理数据联盟的负面评价;另一方面,使得准入门槛值不会过低,保证待处理数据联盟的数据模型的质量,进一步保证未来吸引足够的参与方参加待处理数据联盟。
在一种可能的设计中,所述联盟成本控制偏好通过联盟成本控制的重视程度值表示,所述根据所述参与方个数、所述联盟成本控制偏好、查询数据联盟的信誉度和预设信誉度确定模型,确定所述待处理数据联盟的信誉度,包括:根据查询数据联盟的信誉度和个数,计算查询数据联盟的平均信誉度值;将所述参与方个数、所述重视程度值和所述平均信誉度值输入到预设信誉度确定模型中,以确定所述待处理数据联盟的信誉度。
采用上述方法,通过获得查询数据联盟的信誉度和个数,计算出查询数据联盟的平均信誉度值,如此可以得知与待处理数据联盟相同或相似类型的查询数据联盟的一般信誉度值,使得平均信誉度值可以影响待处理数据联盟信誉度的计算,以使待处理数据联盟的信誉度值更接近真实信誉度值。将参与方个数、重视程度值和平均信誉度值输入到预设信誉度确定模型中,以确定待处理数据联盟的信誉度。如此,可以通过参与方个数影响预设信誉度确定模型中待处理数据联盟的规模,再通过重视程度值表达在预设信誉度确定模型中待处理数据联盟对成本控制的重视程度。因此,使得综合考虑了待处理数据联盟的规模、成本控制重视程度,和相同类型或相似类型数据联盟的一般信誉度值的预设信誉度确定模型可以准确得到合理的待处理数据联盟的信誉度值。
在一种可能的设计中,所述将所述参与方个数、所述重视程度值和所述平均信誉度值输入到预设信誉度确定模型中,以计算所述待处理数据联盟的信誉度,包括:将所述参与方个数、所述重视程度值和所述平均信誉度值输入到预设信誉度确定模型中;以计算所述参与方个数和所述平均信誉度值的乘积,根据所述乘积与所述重视程度值之商的开方,确定所述待处理数据联盟的信誉度。
在一种可能的设计中,所述获取待处理数据联盟的参与方个数和联盟成本控制偏好之前,所述方法还包括:获取所述历史数据联邦的信誉度、所述各个参与方模型质量和所述各个参与方成本控制偏好;根据预设博弈算法、对所述历史数据联邦的信誉度、所述各个参与方模型质量和各个参与方成本控制偏好进行分析,得到所述预设信誉度确定模型。
采用上述方法,通过根据预设博弈算法,对历史数据联邦的信誉度、各个参与方模型质量和各个参与方成本控制偏好进行分析,得到所述预设信誉度确定模型。可以使得预设信誉度确定模型基于考虑参与方的模型质量、参与方成本控制偏好,和历史数据联邦的信誉度获得。如此增加预设信誉度确定模型的可靠性,更加科学合理的得到待处理数据联盟的信誉度值。
在一种可能的设计中,所述预设博弈算法为收益兼顾模型质量和成本的博弈算法,所述根据预设博弈算法,对所述历史数据联邦的信誉度、所述各个参与方模型质量和所述各个参与方成本控制偏好进行博弈分析,得到所述预设信誉度确定模型,包括:获取预设参与方收益函数,所述预设参与方收益函数为参与方收益随着参与方模型质量和联盟信誉度增加而减少的函数;根据所述历史数据联邦的信誉度和所述各个参与方模型质量,确定所述历史数据联邦的参与方收益;根据所述各个参与方成本控制偏好和所述各个参与方模型质量,确定所述历史数据联邦的各个参与方成本;根据所述各个参与方质量最优原则、所述参与方收益和所述各个参与方成本,对所述预设参与方收益函数进行信誉度解析训练,得到所述预设信誉度确定模型。
采用上述方法,获取随着参与方模型质量和联盟信誉度增加,参与方收益减少的预设参与方收益函数;进一步,基于参与方收益函数根据历史数据联邦的信誉度和各个参与方模型质量,确定历史数据联邦的各个参与方成本;再进一步的,根据各个参与方成本、参与方收益、参与方质量最优原则对参与方收益函数训练。基于训练后所得的参与方收益函数确定预设信誉度确定模型。如此,可以使得预设信誉度确定模型充分考虑参与方的收益情况,以使预设信誉度确定模型所确定的待处理数据联盟的信誉度更加合理,且吸引足够多的参与方。
在一种可能的设计中,所述历史数据联邦的信誉度包括:所述历史数据联邦在任一轮联邦训练时间点的信誉度、所述历史数据联邦的各个参与方模型质量包括:历史数据联邦的各个参与方在所述任一轮联邦训练中的本地模型质量。
在一种可能的设计中,所述确定所述待处理数据联盟的信誉度之后,所述方法还包括:根据待处理数据联盟的信誉度和预设准入门槛模型,确定所述待处理数据联盟的准入门槛,所述预设准入门槛模型为基于预设学习算法对所述历史数据联邦的信誉度和准入门槛进行训练得的。
采用上述方法,首先,通过预设学习算法对所述历史数据联邦的信誉度和准入门槛进行训练,获得预设准入门槛模型。如此,在确定待处理数据联盟的信誉度之后,根据待处理数据联盟的信誉度和预设准入门槛模型获得准入门槛值,增加准入门槛值设置的合理性。
在一种可能的设计中,获取待处理数据联盟的参与方成本控制偏好,包括:
根据待处理数据联盟的信誉度和预设参与方成本控制偏好模型,确定待处理数据联盟的参与方成本控制偏好;或者,接收所述待处理数据联盟的参与方上报的参与方成本控制偏好。
采用上述方法,通过接收待处理数据联盟的参与方上报的参与方成本控制偏好,或者,预设参与方成本控制偏好模型计算待处理数据联盟的参与方成本控制偏好。如此,使得获得的参与方成本控制偏好更准确。
第二方面,本发明提供一种数据联盟的信誉度确定装置,该装置包括:
获取模块,用于获取待处理数据联盟的参与方个数和联盟成本控制偏好;
处理模块,用于根据所述待处理数据联盟的联盟类型,查询与所述待处理数据联盟相同或者相似的数据联盟;
所述处理模块还用于,根据所述参与方个数、所述联盟成本控制偏好、查询数据联盟的信誉度和预设信誉度确定模型,确定所述待处理数据联盟的信誉度,其中,所述预设信誉度模型是根据预设博弈算法对历史数据联邦的信誉度、各个参与方模型质量、各个参与方成本控制偏好进行分析得的。
第三方面,本发明提供一种计算设备,包括:存储器,用于存储程序指令;处理器,用于调用所述存储器中存储的程序指令,按照获得的程序执行如第一方面的各种可能的设计中所述的方法。
第四方面,本发明还提供一种计算机可读非易失性存储介质,包括计算机可读指令,当计算机读取并执行所述计算机可读指令时,使得计算机执行如第一方面的各种可能的设计中所述的方法。
本发明的这些实现方式或其他实现方式在以下实施例的描述中会更加简明易懂。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种数据联盟的信誉度确定的架构示意图;
图2为本发明实施例提供的一种数据联盟的信誉度确定方法的流程示意图;
图3为本发明实施例提供的一种数据联盟的信誉度确定的架构示意图;
图4为本发明实施例提供的一种数据联盟的信誉度确定方法的流程示意图;
图5为本发明实施例提供的一种数据联盟的信誉度确定的装置示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
本发明实施例提供的一种数据联盟的信誉度确定的架构示意图,如图1所示,获取单元101获取参与待处理数据联盟的参与方个数N、待处理数据联盟成本控制偏好、查询数据联盟的信誉度,输入模型训练计算单元102,模型训练计算单元102根据训练的模型-预设信誉度确定模型,和待处理数据联盟的参与方个数N、待处理数据联盟成本控制偏好、查询数据联盟的信誉度确定待处理数据联盟的信誉度值,将待处理数据联盟的信誉度值输出到结果单元103。这里模型训练计算单元102可以先根据预设准入门槛模型,通过待处理数据联盟的信誉度值获取待处理数据联盟的准入门槛值,输出到结果单元103。以此,避免待处理数据联盟的信誉值偏高或偏低,进而得到合理的待处理数据联盟的准入门槛值,提高数据联盟收益。
基于此,本发明实施例提出一种数据联盟的信誉度确定的方法,以用来为待处理数据联盟确定出合理的信誉度值。
图2为本发明实施例提供的一种数据联盟的信誉度确定方法所对应的流程示意图,如图2所示,包括:
步骤201、获取待处理数据联盟的参与方个数和联盟成本控制偏好;
此处,待处理数据联盟又可称作联邦学习、联合学习,是一个机器学习的框架,能够有效帮助多个机构在满足隐私保护、数据安全和政府法规的要求下,进行数据使用和机器学习建模。参与方可以是指为待处理数据联盟提供数据模型的企业,相应地,待处理数据联盟可以通过将多个参与方提供的数据模型进行训练,以得到更优的数据模型,如此,参与方可以根据优化后的数据模型获得更大的收益。联盟成本控制偏好为待处理数据联盟对成本控制的重视程度。
步骤202、根据所述待处理数据联盟的联盟类型,查询与所述待处理数据联盟相同或者相似的数据联盟;
此处,待处理数据联盟的联盟类型可以由待处理数据联盟的数据特征区分,如,横向联邦学习、纵向联邦学习、联邦迁移学习等,或者,由待处理数据联盟的数据联盟规模等划分,具体不做限定。也就是说,根据待处理数据联盟的联盟类型,查询与待处理数据联盟相同类型或相似类型的数据联盟。以数据特征区分类型举例,如,待处理数据联盟根据数据特征应用横向联邦学习,有100个参与方;则查询应用横向联邦学习,且有100个左右的参与方的数据联盟;
步骤203、根据所述参与方个数、所述联盟成本控制偏好、查询数据联盟的信誉度和预设信誉度确定模型,确定所述待处理数据联盟的信誉度,其中,所述预设信誉度确定模型是根据预设博弈算法对历史数据联邦的信誉度、各个参与方模型质量、各个参与方成本控制偏好进行分析得的。
此处,查询数据联盟的信誉度为与待处理数据联盟相同或者相似类型的数据联盟的信誉度,信誉度为该数据联盟训练数据模型、该数据联盟政策、该数据联盟公平度等的综合质量的表征方式。也就是说,可以将参与方个数、联盟成本控制偏好、查询数据联盟的信誉度输入预设信誉度确定模型,则可以获得该待处理数据联盟的信誉度值。
其中,所述联盟成本控制偏好通过联盟成本控制的重视程度值表示,所述根据所述参与方个数、所述联盟成本控制偏好、查询数据联盟的信誉度和预设信誉度确定模型,确定所述待处理数据联盟的信誉度,包括:
根据查询数据联盟的信誉度和个数,计算查询数据联盟的平均信誉度值;
将所述参与方个数、所述重视程度值和所述平均信誉度值输入到预设信誉度确定模型中,以确定所述待处理数据联盟的信誉度。
此处,联盟成本控制偏好可以通过联盟成本控制的重视程度值表示。输入的查询数据联盟的信誉度可以是根据查询数据联盟的信誉度和个数,计算查询数据联盟的平均信誉度值。如此,参与方个数、重视程度值和平均信誉度值输入到预设信誉度确定模型中,获得该待处理数据联盟的信誉度。
其中,所述将所述参与方个数、所述重视程度值和所述平均信誉度值输入到预设信誉度确定模型中,以计算所述待处理数据联盟的信誉度,包括:
将所述参与方个数、所述重视程度值和所述平均信誉度值输入到预设信誉度确定模型中;以计算所述参与方个数和所述平均信誉度值的乘积,根据所述乘积与所述重视程度值之商的开方,确定所述待处理数据联盟的信誉度。
此处,参与方个数可以用N来表示。重视程度值可以用βj表示(j为βj对应的数据联盟)。平均信誉度值可以用
Figure BDA0002387495000000081
表示。如此,将N、βj
Figure BDA0002387495000000082
代入预设信誉度确定模型,计算参与方个数N和平均信誉度值
Figure BDA0002387495000000083
的乘积,根据乘积与重视程度值之商的开方
Figure BDA0002387495000000084
确定待处理数据联盟的信誉度
Figure BDA0002387495000000085
另外,在获取待处理数据联盟的参与方个数和联盟成本控制偏好之前,所述方法还包括:获取所述历史数据联邦的信誉度、所述各个参与方模型质量和所述各个参与方成本控制偏好;根据预设博弈算法、对所述历史数据联邦的信誉度、所述各个参与方模型质量和各个参与方成本控制偏好进行分析,得到所述预设信誉度确定模型。
此处,历史数据联邦的信誉度是在此次待处理数据联盟进行数据模型训练之前,已知的数据联盟对应的已知信誉度。如此,获得历史数据联邦的信誉度、历史数据联邦对应的各个参与方模型质量以及各个参与方成本控制偏好,即,历史的数据联盟的数据模型训练相关数据。也就是说,在获取待处理数据联盟的参与方个数和联盟成本控制偏好之前,通过预设博弈算法对这些历史相关数据训练分析获得预设信誉度模型。
其中,所述预设博弈算法为收益兼顾模型质量和成本的博弈算法,所述根据预设博弈算法,对所述历史数据联邦的信誉度、所述各个参与方模型质量和所述各个参与方成本控制偏好进行博弈分析,得到所述预设信誉度确定模型,包括:
获取预设参与方收益函数,所述预设参与方收益函数为参与方收益随着参与方模型质量和联盟信誉度增加而减少的函数;
根据所述历史数据联邦的信誉度和所述各个参与方模型质量,确定所述历史数据联邦的参与方收益;
根据所述各个参与方成本控制偏好和所述各个参与方模型质量,确定所述历史数据联邦的各个参与方成本;
根据所述各个参与方质量最优原则、所述参与方收益和所述各个参与方成本,对所述预设参与方收益函数进行信誉度解析训练,得到所述预设信誉度确定模型。
此处,参与方的成本体现在以下考虑,即一个贡献高质量数据模型的参与方和一个贡献低质量数据模型的参与方同时参加同一个数据联盟,得到的优化后的数据模型质量都会达到一个新的质量标准。其中,高质量数据模型的参与方所占市场份额一般都会高于低质量数据模型的参与方,当高质量数据模型的参与方与低质量数据模型的参与方获得新的质量标准的数据模型后,高质量数据模型的参与方凭借新的质量标准的数据模型扩大市场占有份额的幅度,相对来说,会低于低质量数据模型的参与方凭借新的质量标准的数据模型扩大市场占有份额的幅度。更甚的低质量数据模型的参与方会侵占高质量数据模型的参与方的市场占有份额。如此,贡献低质量数据模型的参与方相当于贡献低成本收获高收益,贡献高质量数据模型的参与方相当于贡献高成本收获低收益。因此,这里对于参与方来说有一个博弈情况,即,参与方贡献的数据模型质量可以看做参与方参与数据联盟的成本,参与方获得的优化后的数据模型质量后,通过优化后的数据模型获取的收益。因此,预设博弈算法为收益兼顾模型质量和成本的博弈算法。另外,由于数据联盟会根据信誉度值设置参与数据联盟要求。参与方参与数据联盟时,要保证贡献的数据模型质量符合数据联盟要求才可以参与该数据联盟。因此,还需要获取预设参与方收益函数,预设参与方收益函数为参与方收益随着参与方模型质量和联盟信誉度增加而减少的函数。
因此,为了获取预设参与方收益函数,可以根据历史数据联邦的相关数据训练分析。即,根据历史数据联邦的信誉度和参与该历史数据联邦的各个参与方模型质量,确定历史数据联邦的参与方收益;其中,参与该历史数据联邦的各个参与方模型质量为优化后的数据模型可使得本地数据模型更新的质量为qij(t)∈[0,1](i为获得优化后数据模型的参与方,j为该参与方参与的数据联盟),历史数据联邦的信誉度为可以表示为rj(t)∈[0,1],如此,历史数据联邦的参与方收益可以表示为函数:f(qij(t),rj(t))=ln[1+rj(t)qij(t)]。通过参与方收益函数在综合提高收益和成本控制两方面的因素下,参与方i可以设置一个优化目标函数:
ln[1+rj(t)qij(t)]-αiqij(t)
其中,αi>0是一个正规化参数,用来表达参与方i的成本控制重视程度,可以称作参与方i的成本控制偏好。参与方i的成本控制偏好可以是根据数据联盟的信誉度和预设参与方成本控制偏好模型确定的;或者,接收数据联盟的参与方上报的参与方成本控制偏好。
在该目标函数中,还可以进一步设置约束:
Figure BDA0002387495000000116
若要最大化参与方收益,则可以将其对qij(t)求导并将结果设置为0,即:
Figure BDA0002387495000000111
由此可得参与方i的最佳应对策略为:
Figure BDA0002387495000000112
由于qij(t)∈[0,1],因此将上述公式变换为如下表达式:
Figure BDA0002387495000000113
如此根据各个参与方成本控制偏好αi和所述各个参与方模型质量qij(t),确定所述历史数据联邦的各个参与方成本。
如此,对于上述获得的参与方收益和各个参与方成本,根据各个参与方质量最优原则,对预设参与方收益函数进行信誉度解析训练,即:数据联盟j希望得到尽可能高质量的来自参与方的数据模型,由于维持一个较高的信誉度,虽然可以吸引更多参与方,但若是参与方无法达到该信誉度值相应的要求,则无法加入数据联盟j,进而限制了参与方参与该数据联盟j的数量。若降低该信誉度值相应的要求,得到的参与方提供的低质量数据模型,可能会对数据联盟j的优化后的数据模型的质量产生负面影响,进而导致数据联盟j的优化后的数据模型的质量不高,导致参与方对数据联盟j作出负面评价等。因此,数据联盟j并不希望一直保持最高的信誉度。而为了保持竞争力,数据联盟j的信誉度应尽量保持在当前市场中同类数据联盟的平均信誉度
Figure BDA0002387495000000114
以上。
综合考虑,为避免信誉度值过高或过低,数据联盟j可以设置一个优化目标函数:
Figure BDA0002387495000000115
其中,
Figure BDA0002387495000000117
βj>0是一个正规化参数,用来表达数据联盟j对成本控制的重视程度,可以称作数据联盟成本控制偏好。N是数据联盟j的参与方总数。为了确保质量目标与成本控制目标处于同一数量级,在设置βj值时可以令βj≈N。
若要最大化以上目标函数,我们将公式(1)中qij(t)的最佳应对策略代入数据联盟j的目标函数,可得:
Figure BDA0002387495000000121
将其的对rj(t)求导并将结果设置为0,则:
Figure BDA0002387495000000122
由此可得数据联盟j的最佳应对策略为:
Figure BDA0002387495000000123
即,预设信誉度确定模型。
为确保rj(t)∈[0,1]的物理意义,我们将以上结论写作:
Figure BDA0002387495000000124
最后,根据公式(2)计算出数据联盟j为了优化自身利益所需要保持的最低信誉度值。
上述内容中,所述历史数据联邦的信誉度包括:所述历史数据联邦在任一轮联邦训练时间点的信誉度、所述历史数据联邦的各个参与方模型质量包括:历史数据联邦的各个参与方在所述任一轮联邦训练中的本地模型质量。
此处,历史数据联邦对数据模型的训练与优化可以是多轮进行,如此,在每轮数据模型训练与优化会产生相应的信誉度,如上述rj(t)可以是数据联盟j在第t轮训练与优化数据模型时产生的相应的信誉度。相应的,对于历史数据联邦的各个参与方模型质量,则可以是该历史数据联邦的任一轮产生的训练与优化数据模型使得对应参与方提高的本地模型质量。
其中,所述确定所述待处理数据联盟的信誉度之后,所述方法还包括:
根据待处理数据联盟的信誉度和预设准入门槛模型,确定所述待处理数据联盟的准入门槛,所述预设准入门槛模型为基于预设学习算法对所述历史数据联邦的信誉度和准入门槛进行训练得的。
此处,准入门槛值为参与方参加待处理数据联盟需要满足的要求,准入门槛值可以通过准入门槛值模型获得,而准入门槛值模型是基于预设学习算法对历史数据联邦信誉度和准入门槛值训练得来的。也就是说,通过历史数据联邦的信誉度和准入门槛值确定信誉度与准入门槛值呈线性回归或相关函数等逻辑,通过这些逻辑和待处理数据联盟的信誉度即可获得准入门槛值。
采用上述方法,通过获取待处理数据联盟的参与方个数和联盟成本控制偏好,再通过待处理数据联盟的联盟类型查询与待处理数据联盟相同或者相似的数据联盟;从而得到并根据参与方个数、联盟成本控制偏好、查询数据联盟的信誉度和预设信誉度确定模型,确定待处理数据联盟的信誉度。如此,可以得到合理的信誉度值,进一步地,因为信誉度值与准入门槛值得强关联性,根据合理的信誉度值获得数据联盟的准入门槛值。因此,一方面,使得准入门槛值不会过高,有效防止参加待处理数据联盟的参与方减少,以及降低参与方给予该待处理数据联盟的负面评价;另一方面,使得准入门槛值不会过低,保证待处理数据联盟的数据模型的质量,进一步保证未来吸引足够的参与方参加待处理数据联盟。
为使得本发明实施例更为清楚,下面结合图3做进一步的说明。如图3所示,预设参与方成本控制偏好模型数据库301、查询数据联盟信誉度数据库302、待处理数据联盟当前参与方数据库303等三项用于提供输入信息。具体来说,预设参与方成本控制偏好模型数据库301中可以包括多个参与方的成本控制偏好模型等信息,比如可以包括参与方i的成本控制偏好模型。查询数据联盟信誉度数据库302可以包括多个与待处理数据联盟相同或相似类型的数据联盟(包括数据联盟j)的当前最新信誉度值等信息。数据联盟当前参与方数据库303可以包括待处理数据联盟当前参与方的个数等信息。
进一步地,基于上述三项所提供的输入信息和待处理数据联盟的预设信誉度模型304,从而可以得到待处理数据联盟的优化信誉度值,进而根据待处理数据联盟的预设准入门槛模型305处理优化信誉度值和准入门槛值之间的函数关系,计算得到待处理数据联盟的新的准入门槛值,并使用新的准入门槛值更新原准入门槛值,然后公布待处理数据联盟的准入门槛值306,以使符合更新后的准入门槛值条件的参与方参与待处理数据联盟。
基于此,本发明实施例提供的一种数据联盟的信誉度确定方法,如图4所示的,数据联盟的信誉度确定方法的流程示意图。
步骤401、获取历史数据联邦的相关信息,根据预设博弈算法,对历史数据联邦的信誉度、历史数据联邦的各个参与方模型质量和历史数据联邦的各个参与方成本控制偏好进行博弈分析,得到待处理数据联盟的预设信誉度确定模型。
步骤402、根据历史数据联邦的信誉度值与准入门槛值的关系确定预设准入门槛模型。
步骤403、获取待处理数据联盟各个参与方的预设参与方成本控制偏好模型或待处理数据联盟各个参与方上报的参与方成本控制偏好,以得到处理数据联盟各个参与方成本控制偏好。
步骤404、获取待处理数据联盟的参与方个数和联盟成本控制偏好,以及待处理数据联盟的数据联盟类型。
步骤405、根据处理数据联盟的数据联盟类型,查询相同类型或相似类型的数据联盟,获取查询数据联盟的个数和查询数据联盟信誉度值,确定查询数据联盟的平均信誉度值。
步骤406、将查询数据联盟的平均信誉度值、待处理数据联盟的参与方个数、待处理数据联盟的成本控制偏好输入到基于各个参与方成本控制偏好的预设信誉度数据模型中,获得待处理数据模型的信誉度值。
步骤407、将待处理数据联盟的信誉度值带入到预设准入门槛模型中,获得待处理数据模型的准入门槛。
步骤408、待处理数据联盟更新准入门槛。
步骤409、待处理数据联盟公布准入门槛。
基于同样的构思,本发明实施例提供一种更新数据联盟的准入门槛值的装置,图5为本发明实施例提供的一种更新数据联盟的准入门槛值的装置示意图,如图5示,包括:
获取模块501,用于获取待处理数据联盟的参与方个数和联盟成本控制偏好;
处理模块502,用于根据所述待处理数据联盟的联盟类型,查询与所述待处理数据联盟相同或者相似的数据联盟;
所述处理模块502还用于,根据所述参与方个数、所述联盟成本控制偏好、查询数据联盟的信誉度和预设信誉度确定模型,确定所述待处理数据联盟的信誉度,其中,所述预设信誉度模型是根据预设博弈算法对历史数据联邦的信誉度、各个参与方模型质量、各个参与方成本控制偏好进行分析得的。
在一种可能的设计中,所述处理模块502具体用于:根据查询数据联盟的信誉度和个数,计算查询数据联盟的平均信誉度值;将所述参与方个数、所述重视程度值和所述平均信誉度值输入到预设信誉度确定模型中,以确定所述待处理数据联盟的信誉度。
在一种可能的设计中,所述处理模块502还用于:将所述参与方个数、所述重视程度值和所述平均信誉度值输入到预设信誉度确定模型中;以计算所述参与方个数和所述平均信誉度值的乘积,根据所述乘积与所述重视程度值之商的开方,确定所述待处理数据联盟的信誉度。
在一种可能的设计中,所述处理模块502还用于:获取所述历史数据联邦的信誉度、所述各个参与方模型质量和所述各个参与方成本控制偏好;根据预设博弈算法、对所述历史数据联邦的信誉度、所述各个参与方模型质量和各个参与方成本控制偏好进行分析,得到所述预设信誉度确定模型。
在一种可能的设计中,所述处理模块502具体用于:获取预设参与方收益函数,所述预设参与方收益函数为参与方收益随着参与方模型质量和联盟信誉度增加而减少的函数;根据所述历史数据联邦的信誉度和所述各个参与方模型质量,确定所述历史数据联邦的参与方收益;根据所述各个参与方成本控制偏好和所述各个参与方模型质量,确定所述历史数据联邦的各个参与方成本;根据所述各个参与方质量最优原则、所述参与方收益和所述各个参与方成本,对所述预设参与方收益函数进行信誉度解析训练,得到所述预设信誉度确定模型。
在一种可能的设计中,所述历史数据联邦的信誉度包括:所述历史数据联邦在任一轮联邦训练时间点的信誉度、所述历史数据联邦的各个参与方模型质量包括:历史数据联邦的各个参与方在所述任一轮联邦训练中的本地模型质量。
在一种可能的设计中,所述确定所述待处理数据联盟的信誉度之后,所述处理模块502还用于:
根据待处理数据联盟的信誉度和预设准入门槛模型,确定所述待处理数据联盟的准入门槛,所述预设准入门槛模型为基于预设学习算法对所述历史数据联邦的信誉度和准入门槛进行训练得的。
在一种可能的设计中,所述获取模块501具体用于:根据待处理数据联盟的信誉度和预设参与方成本控制偏好模型,确定待处理数据联盟的参与方成本控制偏好;或者,接收所述待处理数据联盟的参与方上报的参与方成本控制偏好。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (11)

1.一种数据联盟的信誉度确定方法,其特征在于,包括:
获取待处理数据联盟的参与方个数和联盟成本控制偏好;
根据所述待处理数据联盟的联盟类型,查询与所述待处理数据联盟相同或者相似的数据联盟;
根据所述参与方个数、所述联盟成本控制偏好、查询数据联盟的信誉度和预设信誉度确定模型,确定所述待处理数据联盟的信誉度,其中,所述预设信誉度确定模型是根据预设博弈算法对历史数据联邦的信誉度、各个参与方模型质量、各个参与方成本控制偏好进行分析得的。
2.根据权利要求1所述的方法,其特征在于,所述联盟成本控制偏好通过联盟成本控制的重视程度值表示,所述根据所述参与方个数、所述联盟成本控制偏好、查询数据联盟的信誉度和预设信誉度确定模型,确定所述待处理数据联盟的信誉度,包括:
根据查询数据联盟的信誉度和个数,计算查询数据联盟的平均信誉度值;
将所述参与方个数、所述重视程度值和所述平均信誉度值输入到预设信誉度确定模型中,以确定所述待处理数据联盟的信誉度。
3.根据权利要求2所述的方法,其特征在于,所述将所述参与方个数、所述重视程度值和所述平均信誉度值输入到预设信誉度确定模型中,以计算所述待处理数据联盟的信誉度,包括:
将所述参与方个数、所述重视程度值和所述平均信誉度值输入到预设信誉度确定模型中;以计算所述参与方个数和所述平均信誉度值的乘积,根据所述乘积与所述重视程度值之商的开方,确定所述待处理数据联盟的信誉度。
4.根据权利要求1所述的方法,其特征在于,所述获取待处理数据联盟的参与方个数和联盟成本控制偏好之前,所述方法还包括:
获取所述历史数据联邦的信誉度、所述各个参与方模型质量和所述各个参与方成本控制偏好;
根据预设博弈算法、对所述历史数据联邦的信誉度、所述各个参与方模型质量和各个参与方成本控制偏好进行分析,得到所述预设信誉度确定模型。
5.根据权利要求4所述的方法,其特征在于,所述预设博弈算法为收益兼顾模型质量和成本的博弈算法,所述根据预设博弈算法,对所述历史数据联邦的信誉度、所述各个参与方模型质量和所述各个参与方成本控制偏好进行博弈分析,得到所述预设信誉度确定模型,包括:
获取预设参与方收益函数,所述预设参与方收益函数为参与方收益随着参与方模型质量和联盟信誉度增加而减少的函数;
根据所述历史数据联邦的信誉度和所述各个参与方模型质量,确定所述历史数据联邦的参与方收益;
根据所述各个参与方成本控制偏好和所述各个参与方模型质量,确定所述历史数据联邦的各个参与方成本;
根据所述各个参与方质量最优原则、所述参与方收益和所述各个参与方成本,对所述预设参与方收益函数进行信誉度解析训练,得到所述预设信誉度确定模型。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述历史数据联邦的信誉度包括:所述历史数据联邦在任一轮联邦训练时间点的信誉度、所述历史数据联邦的各个参与方模型质量包括:历史数据联邦的各个参与方在所述任一轮联邦训练中的本地模型质量。
7.根据权利要求1-5任一项所述的方法,其特征在于,所述确定所述待处理数据联盟的信誉度之后,所述方法还包括:
根据待处理数据联盟的信誉度和预设准入门槛模型,确定所述待处理数据联盟的准入门槛,所述预设准入门槛模型为基于预设学习算法对所述历史数据联邦的信誉度和准入门槛进行训练得的。
8.根据权利要求4所述的方法,其特征在于,获取待处理数据联盟的参与方成本控制偏好,包括:
根据待处理数据联盟的信誉度和预设参与方成本控制偏好模型,确定待处理数据联盟的参与方成本控制偏好;或者,
接收所述待处理数据联盟的参与方上报的参与方成本控制偏好。
9.一种数据联盟的信誉度确定装置,其特征在于,所述装置包括:
获取模块,用于获取待处理数据联盟的参与方个数和联盟成本控制偏好;
处理模块,用于根据所述待处理数据联盟的联盟类型,查询与所述待处理数据联盟相同或者相似的数据联盟;
所述处理模块还用于,根据所述参与方个数、所述联盟成本控制偏好、查询数据联盟的信誉度和预设信誉度确定模型,确定所述待处理数据联盟的信誉度,其中,所述预设信誉度模型是根据预设博弈算法对历史数据联邦的信誉度、各个参与方模型质量、各个参与方成本控制偏好进行分析得的。
10.一种计算设备,其特征在于,包括:
存储器,用于存储程序指令;
处理器,用于调用所述存储器中存储的程序指令,按照获得的程序执行权利要求1至8任一项所述的方法。
11.一种计算机可读非易失性存储介质,其特征在于,包括计算机可读指令,当计算机读取并执行所述计算机可读指令时,使得计算机执行如权利要求1至8任一项所述的方法。
CN202010103011.8A 2020-02-19 2020-02-19 一种数据联盟的信誉度确定方法及装置 Pending CN111340212A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010103011.8A CN111340212A (zh) 2020-02-19 2020-02-19 一种数据联盟的信誉度确定方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010103011.8A CN111340212A (zh) 2020-02-19 2020-02-19 一种数据联盟的信誉度确定方法及装置

Publications (1)

Publication Number Publication Date
CN111340212A true CN111340212A (zh) 2020-06-26

Family

ID=71183504

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010103011.8A Pending CN111340212A (zh) 2020-02-19 2020-02-19 一种数据联盟的信誉度确定方法及装置

Country Status (1)

Country Link
CN (1) CN111340212A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115017548A (zh) * 2022-08-04 2022-09-06 湖南工商大学 数据定价方法、装置及相关设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115017548A (zh) * 2022-08-04 2022-09-06 湖南工商大学 数据定价方法、装置及相关设备
CN115017548B (zh) * 2022-08-04 2022-11-08 湖南工商大学 数据定价方法、装置及相关设备

Similar Documents

Publication Publication Date Title
WO2019205325A1 (zh) 确定用户风险等级的方法、终端设备及计算机可读存储介质
US20160314533A1 (en) System for resource allocation assessment and electronic communication
US20070124236A1 (en) Credit risk profiling method and system
US20170364825A1 (en) Adaptive augmented decision engine
CN110717671B (zh) 一种确定参与方贡献度的方法及装置
US11915311B2 (en) User score model training and calculation
US20200090269A1 (en) Data collection method and apparatus for risk evaluation, and electronic device
US20160117772A1 (en) Centralized and Customized Asset Allocation Recommendation and Planning Using Household Profiling
US20170186089A1 (en) System for customizing resource allocation assessments and electronic communication
US20210312541A1 (en) Computer systems and methods for generating valuation data of a private company
CN110415036B (zh) 用户等级的确定方法、装置、计算机设备和存储介质
US11144844B2 (en) Refining customer financial security trades data model for modeling likelihood of successful completion of financial security trades
CN105260171A (zh) 一种虚拟道具的生成方法及装置
CN111160745A (zh) 用户账户数据的处理方法及装置
Xidonas et al. Environmental corporate responsibility for investments evaluation: an alternative multi-objective programming model
CN116739759A (zh) 基于订单风险识别的资产资金匹配方法、装置及设备
US11042677B1 (en) Systems and methods for time series simulation
US20140344020A1 (en) Competitor pricing strategy determination
CN111340212A (zh) 一种数据联盟的信誉度确定方法及装置
US20240046922A1 (en) Systems and methods for dynamically updating machine learning models that provide conversational responses
US20180260903A1 (en) Computerized machine learning based recommendations
US10902428B1 (en) Maintaining a risk model using feedback directed to other risk models
KR102174608B1 (ko) 기계 학습 기반의 채무불이행 예측 장치 및 방법
US20140344021A1 (en) Reactive competitor price determination using a competitor response model
US20140344022A1 (en) Competitor response model based pricing tool

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200626