CN114003951A - 信用评分方法、装置以及计算机可读存储介质 - Google Patents

信用评分方法、装置以及计算机可读存储介质 Download PDF

Info

Publication number
CN114003951A
CN114003951A CN202111275724.3A CN202111275724A CN114003951A CN 114003951 A CN114003951 A CN 114003951A CN 202111275724 A CN202111275724 A CN 202111275724A CN 114003951 A CN114003951 A CN 114003951A
Authority
CN
China
Prior art keywords
function
credit
operator
model
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111275724.3A
Other languages
English (en)
Inventor
张晓武
翁谦
张豪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yuncong Technology Group Co Ltd
Original Assignee
Yuncong Technology Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yuncong Technology Group Co Ltd filed Critical Yuncong Technology Group Co Ltd
Priority to CN202111275724.3A priority Critical patent/CN114003951A/zh
Publication of CN114003951A publication Critical patent/CN114003951A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Computer Hardware Design (AREA)
  • Marketing (AREA)
  • Computer Security & Cryptography (AREA)
  • General Business, Economics & Management (AREA)
  • Technology Law (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Strategic Management (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Biology (AREA)
  • Finance (AREA)
  • Economics (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Development Economics (AREA)
  • Algebra (AREA)
  • Accounting & Taxation (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明涉及数据处理技术领域,具体提供一种信用评分方法、装置以及计算机可读存储介质,旨在解决如何通过模型对信用数据进行有效且准确地的信用评分的问题。为此目的,本发明的方法包括采用多方安全计算方法控制多个计算节点联合使用不同数据提供方提供的信用数据样本对同一违约概率模型进行协同训练,从而在不同数据提供方不泄露各自信用数据样本的情况下,共同完成违约概率模型的训练。进而再采用多方安全计算方法控制多个计算节点使用违约概率模型确定由不同数据提供方提供的待评分信用数据的信用分。无论是在违约概率模型的训练过程中还是使用违约概率模型确定信用分的过程中都不会泄露任意一个数据提供方的数据,极大地提到了数据的安全性。

Description

信用评分方法、装置以及计算机可读存储介质
技术领域
本发明涉及数据处理技术领域,具体提供一种信用评分方法、装置以及计算机可读存储介质。
背景技术
在金融技术领域中通常采用评分卡模型对用户提供的信用数据进行评分,以确定用户是否存在较高的违约风险。为了提高评分卡模型的准确性,需要采用不同用户的信用数据对评分卡模型进行训练,但是由于信用数据往往包含用户的隐私数据,为了防止隐私数据泄露,这些用户不会向其他用户以及独立于所有用户以外的第三方机构分享信用数据。在这种情况下,将无法联合使用不同用户的信用数据训练评分卡模型,进而无法对用户的信用数据进行有效且准确地的信用评分。
发明内容
为了克服上述缺陷,提出了本发明,以提供解决或至少部分地解决如何在保护不同用户的信用数据的情况下联合使用不同用户的信用数据训练模型以及如何通过模型对用户的信用数据进行有效且准确地的信用评分的技术问题的信用评分方法、装置以及计算机可读存储介质。
在第一方面,本发明提供一种信用评分方法,所述方法包括:
采用多方安全计算方法控制多个计算节点根据各自持有的信用数据样本中至少一部分数据对同一违约概率模型进行协同训练,以确定违约概率模型的模型参数;其中,所述违约概率模型的违约概率计算函数是以信用数据样本的WOE值为自变量,以所述模型参数为所述自变量的权重,以违约概率为因变量构建的LR逻辑回归函数;
采用多方安全计算方法控制多个计算节点根据各自持有的模型参数中至少一部分参数对所述违约概率计算函数进行协同转换,以将所述违约概率计算函数由所述LR逻辑回归函数转换成多元线性回归函数并根据所述多元线性回归函数确定不同类型信用数据样本对应的回归系数;
控制多个计算节点根据所述回归系数以及各自持有的待评分信用数据中至少一部分数据对同一评分映射函数进行协同计算,得到所述待评分信用数据的信用分;其中,所述评分映射函数是以不同类型信用数据样本的WOE值为自变量,以所述回归系数为所述自变量的权重,以所述信用数据样本的信用分为因变量构建的函数。
在上述信用评分方法的一个技术方案中,“对违约概率模型进行协同训练”的步骤具体包括:
获取所述违约概率模型的模型训练函数,所述模型训练函数包括根据所述违约概率计算函数的函数值构建的模型损失函数以及根据违约概率计算函数的函数值与模型损失函数的函数值构建的模型参数优化函数;
采用多方安全计算方法控制每个计算节点根据各自持有的模型参数中至少一部分参数分别加载违约概率模型,并通过所述违约概率模型与各自持有的信用数据样本中至少一部分数据,协同计算所述模型训练函数的函数值,以根据所述函数值对所述违约概率模型进行迭代协同训练。
在上述信用评分方法的一个技术方案中,“协同计算所述模型训练函数的函数值”的步骤具体包括:
根据所述模型训练函数的运算逻辑,确定通过相互组合能够实现所述运算逻辑的运算算子,所述运算算子至少包括乘法算子、加法算子、减法算子、数乘算子和多项式分段算子;
控制每个计算节点根据各自持有的信用数据样本中至少一部分数据分别计算每个运算算子的算子结果,并通过数据交换获取其他计算节点计算得到的算子结果;
控制每个计算节点根据各自计算得到的算子结果与通过数据交换获取到的算子结果,确定所述模型训练函数的函数值。
在上述信用评分方法的一个技术方案中,“对评分映射函数进行协同计算”的步骤具体包括:
根据所述评分映射函数的运算逻辑,确定通过相互组合能够实现所述运算逻辑的运算算子,所述运算算子至少包括乘法算子、加法算子和减法算子;
控制多个计算节点根据所述回归系数以及各自持有的待评分信用数据中至少一部分数据分别计算每个运算算子的算子结果,并通过数据交换获取其他计算节点计算得到的算子结果;
控制每个计算节点根据各自计算得到的算子结果与通过数据交换获取到的算子结果,确定所述评分映射函数的函数值,以得到所述待评分信用数据的信用分。
在上述信用评分方法的一个技术方案中,所述方法还包括:
将所述信用数据样本以秘密分享的方式分别分发至每个计算节点,以确定每个计算节点各自持有的信用数据样本;
和/或,将所述待评分信用数据以秘密分享的方式分别分发至每个计算节点,以确定每个计算节点各自持有的待评分信用数据;
和/或,将所述模型参数以秘密分享的方式分别分发至每个计算节点,以确定每个计算节点各自持有的模型参数。
第二方面,提供一种信用评分装置,所述装置包括:
模型训练模块,其被配置成采用多方安全计算方法控制多个计算节点根据各自持有的信用数据样本中至少一部分数据对同一违约概率模型进行协同训练,以确定违约概率模型的模型参数;其中,所述违约概率模型的违约概率计算函数是以信用数据样本的WOE值为自变量,以所述模型参数为所述自变量的权重,以违约概率为因变量构建的LR逻辑回归函数;
信用评分模块,其被配置成执行下列操作:
采用多方安全计算方法控制多个计算节点根据各自持有的模型参数中至少一部分参数对所述违约概率计算函数进行协同转换,以将所述违约概率计算函数由所述LR逻辑回归函数转换成多元线性回归函数并根据所述多元线性回归函数确定不同类型信用数据样本对应的回归系数;
控制多个计算节点根据所述回归系数以及各自持有的待评分信用数据中至少一部分数据对同一评分映射函数进行协同计算,得到所述待评分信用数据的信用分;其中,所述评分映射函数是以不同类型信用数据样本的WOE值为自变量,以所述回归系数为所述自变量的权重,以所述信用数据样本的信用分为因变量构建的函数。
在上述信用评分装置的一个技术方案中,所述模型训练模块被进一步配置成执行下列操作:
获取所述违约概率模型的模型训练函数,所述模型训练函数包括根据所述违约概率计算函数的函数值构建的模型损失函数以及根据违约概率计算函数的函数值与模型损失函数的函数值构建的模型参数优化函数;
采用多方安全计算方法控制每个计算节点根据各自持有的模型参数中至少一部分参数分别加载违约概率模型,并通过所述违约概率模型与各自持有的信用数据样本中至少一部分数据,协同计算所述模型训练函数的函数值,以根据所述函数值对所述违约概率模型进行迭代协同训练。
在上述信用评分装置的一个技术方案中,所述模型训练模块被进一步配置成执行下列操作:
根据所述模型训练函数的运算逻辑,确定通过相互组合能够实现所述运算逻辑的运算算子,所述运算算子至少包括乘法算子、加法算子、减法算子、数乘算子和多项式分段算子;
控制每个计算节点根据各自持有的信用数据样本中至少一部分数据分别计算每个运算算子的算子结果,并通过数据交换获取其他计算节点计算得到的算子结果;
控制每个计算节点根据各自计算得到的算子结果与通过数据交换获取到的算子结果,确定所述模型训练函数的函数值。
在上述信用评分装置的一个技术方案中,所述信用评分模块被进一步配置成执行下列操作:
根据所述评分映射函数的运算逻辑,确定通过相互组合能够实现所述运算逻辑的运算算子,所述运算算子至少包括乘法算子、加法算子和减法算子;
控制多个计算节点根据所述回归系数以及各自持有的待评分信用数据中至少一部分数据分别计算每个运算算子的算子结果,并通过数据交换获取其他计算节点计算得到的算子结果;
控制每个计算节点根据各自计算得到的算子结果与通过数据交换获取到的算子结果,确定所述评分映射函数的函数值,以得到所述待评分信用数据的信用分。
在上述信用评分装置的一个技术方案中,所述装置还包括信用数据样本分发模块和/或待评分信用数据分发模块和/或模型参数分发模块;
所述信用数据样本分发模块被配置成将所述信用数据样本以秘密分享的方式分别分发至每个计算节点,以确定每个计算节点各自持有的信用数据样本;
所述待评分信用数据分发模块被配置成将所述待评分信用数据以秘密分享的方式分别分发至每个计算节点,以确定每个计算节点各自持有的待评分信用数据;
所述模型参数分发模块被配置成将所述模型参数以秘密分享的方式分别分发至每个计算节点,以确定每个计算节点各自持有的模型参数。
在第三方面,提供一种控制装置,该控制装置包括处理器和存储装置,所述存储装置适于存储多条程序代码,所述程序代码适于由所述处理器加载并运行以执行上述信用评分方法的技术方案中任一项技术方案所述的信用评分方法。
在第四方面,提供一种计算机可读存储介质,该计算机可读存储介质其中存储有多条程序代码,所述程序代码适于由处理器加载并运行以执行上述信用评分方法的技术方案中任一项技术方案所述的信用评分方法。
本发明上述一个或多个技术方案,至少具有如下一种或多种有益效果:
在实施本发明的技术方案中,可以先采用多方安全计算方法控制多个计算节点联合使用不同数据提供方提供的信用数据样本对违约概率模型进行协同训练,从而在不同数据提供方不泄露各自信用数据样本的情况下,共同完成违约概率模型的训练。在训练好违约概率模型后再继续采用多方安全计算方法控制多个计算节点使用这个违约概率模型去确定由不同数据提供方提供的待评分信用数据的信用分。基于多方安全计算方法,无论是在违约概率模型的训练过程中还是使用违约概率模型确定信用分的过程中都不会泄露任意一个数据提供方的数据,极大地提到了数据的安全性。
一、在训练违约概率模型时,可以将信用数据样本以秘密分享的方式分别分发至每个计算节点,以保证一个或多个计算节点无法还原出真实的信用数据样本,提高信用数据样本的安全性,进而可以采用多方安全计算方法控制多个计算节点根据各自持有的信用数据样本中至少一部分数据对同一违约概率模型进行协同训练,以确定违约概率模型的模型参数。此外,在协同训练的每次迭代训练中违约概率模型的模型参数都是以秘密分享的方式分发至每个计算节点,从而保证一个或多个计算节点无法还原出真实的模型参数,保证了模型参数的安全性。
二、在使用违约概率模型确定待评分信用数据的信用分时,由于违约概率模型的违约概率计算函数是以信用数据样本的WOE值为自变量,以模型参数为自变量的权重,以违约概率为因变量构建的LR逻辑回归函数,因此可以先采用多方安全计算方法控制多个计算节点根据各自持有的模型参数中至少一部分参数对违约概率计算函数进行协同转换,以将违约概率计算函数由LR逻辑回归函数转换成多元线性回归函数并根据多元线性回归函数确定不同类型信用数据样本对应的回归系数;进而再采用多方安全计算方法控制多个计算节点根据回归系数以及各自持有的待评分信用数据中至少一部分数据对同一评分映射函数进行协同计算,得到待评分信用数据的信用分;其中,评分映射函数可以是以不同类型信用数据样本的WOE值为自变量,以回归系数为自变量的权重,以信用数据样本的信用分为因变量构建的函数。
在对违约概率计算函数进行协同转换时,由于违约概率模型的模型参数是以秘密分享的方式存储在每个计算节点上的,因此必须由一定数量的计算节点才能共同完成对违约概率计算函数的函数转换,避免通过少部分计算节点获取真实的函数转换结果。同时,待评分信用数据也可以是以秘密分享的方式存储在每个计算节点上的,同样也必须由一定数量的计算节点才能共同完成对评分映射函数的计算,避免通过少部分计算节点获取真实的待评分信用数据的信用分。
附图说明
参照附图,本发明的公开内容将变得更易理解。本领域技术人员容易理解的是:这些附图仅仅用于说明的目的,而并非意在对本发明的保护范围组成限制。此外,图中类似的数字用以表示类似的部件,其中:
图1是根据本发明的一个实施例的信用评分方法的主要步骤流程示意图;
图2是根据图1所示信用评分方法实施例的一个应用场景示意图;
图3是根据本发明的一个实施例的信用评分装置的主要结构框图示意图;
图4是根据本发明的一个实施例的多方安全计算的评分卡模型技术系统的主要结构框示意图;
图5是根据本发明的一个实施例的图4所示评分卡模型技术系统的主要系统流程示意图;
附图标记列表
11:模型训练模块;12:信用评分模块。
具体实施方式
下面参照附图来描述本发明的一些实施方式。本领域技术人员应当理解的是,这些实施方式仅仅用于解释本发明的技术原理,并非旨在限制本发明的保护范围。
在本发明的描述中,“模块”、“处理器”可以包括硬件、软件或者两者的组合。一个模块可以包括硬件电路,各种合适的感应器,通信端口,存储器,也可以包括软件部分,比如程序代码,也可以是软件和硬件的组合。处理器可以是中央处理器、微处理器、数字信号处理器或者其他任何合适的处理器。处理器具有数据和/或信号处理功能。处理器可以以软件方式实现、硬件方式实现或者二者结合方式实现。非暂时性的计算机可读存储介质包括任何合适的可存储程序代码的介质,比如磁碟、硬盘、光碟、闪存、只读存储器、随机存取存储器等等。术语“A和/或B”表示所有可能的A与B的组合,比如只是A、只是B或者A和B。术语“至少一个A或B”或者“A和B中的至少一个”含义与“A和/或B”类似,可以包括只是A、只是B或者A和B。单数形式的术语“一个”、“这个”也可以包含复数形式。
这里先解释本发明涉及到的一些术语。
多方安全计算方法(Secure Multi-Party Computation,SMPC)指的是针对无可信任的第三方的情况下使多个互不信任的数据提供方协同计算一个约定函数的方法,这种方法可以在每个数据提供方不向其他数据提供方或第三方分享原始数据的情况下将每个数据提供方提供的数据加密后分散至多个不同的计算节点进行计算,再融合所有计算节点的计算结果得到联合计算结果,实现了对数据的可用不可见。
秘密分享(Secret Sharing)指的是对秘密进行分割,并把秘密在多个个参与者中分享,使得只有多于特定个数的参与者合作才可以计算出或是恢复秘密,而少于特定个数的参与者则不可以得到有关秘密的方法。
WOE(Weight of Evidence)值指的是在对变量进行分箱后针对每个分箱通过WOE值计算方法计算得出的数值,WOE值能够衡量变量取值对于目标变量的影响。WOE值的绝对值越大,则表明当前变量取值对目标变量的影响越大;WOE值的绝对值越小,则表明当前变量取值对目标变量的影响越小;例如,如果变量是年龄,目标变量是违约概率,那么WOE值可以衡量年龄对违约率的影响。
WOE值计算方法的可以如下式(1)所示:
Figure BDA0003329937120000081
公式(1)中各参数含义如下:
WOEi表示第i个变量分箱对应的WOE值,yi表示第i个变量分箱中负样本的数量,yt表示所有变量分箱中负样本的数量,ni表示第i个变量分箱中正样本的数量,nt表示所有变量分箱中正样本的数量。
LR逻辑回归函数指的是机器学习技术领域中一种常规的分类学习函数,LR逻辑回归函数的一般解析式可以如下式(2)所示,而在本发明实施例中LR逻辑回归函数可以如下式(3)所示:
Figure BDA0003329937120000082
Figure BDA0003329937120000083
公式(2)中的参数含义是:y表示目标变量,x表示自变量。
公式(3)中的参数含义是:xi表示第i个信用数据(信用数据样本或待评分信用数据)的WOE值,W表示违约概率模型的模型参数,也即WOE值的权重,T表示转置符号,yi=1表示违约,(yi=1|W,xi)表示根据第i个信用数据的WOE值计算出的违约概率。
对公式(3)所示的LR逻辑回归函数进行函数转换,可以将其转换成多元线性回归函数,如下式(4)所示。
y=β01×x12×x2+…+βi×xi+…+βn×xn (4)
公式(4)中的参数含义是:y表示目标变量,xi表示第i个类型的自变量,βi表示第i个类型的自变量的回归系数。
下面先对本发明实施例中的信用评分方法进行说明。
参阅附图1,图1是根据本发明的一个实施例的信用评分方法的主要步骤流程示意图。如图1所示,本发明实施例中的信用评分方法主要包括下列步骤S101-步骤S103。
步骤S101:采用多方安全计算方法控制多个计算节点根据各自持有的信用数据样本中至少一部分数据对同一违约概率模型进行协同训练,以确定违约概率模型的模型参数。
违约概率模型的违约概率计算函数可以如公式(3)所示,即这个违约概率计算函数是以信用数据样本的WOE值为自变量,以模型参数为自变量的权重,以违约概率为因变量构建的LR逻辑回归函数。
计算节点指的是能够执行根据本发明实施例所述的信用评分方法的计算机设备等,这些计算节点相互独立的,并且这些计算节点可以获取数据提供方的数据并向数据提供方反馈待评分信用数据的信用分。
信用数据指的是能够用于衡量一个用户违约风险的数据,例如信用数据可以是用户的年龄、性别和工作年限等。信用数据的信用分指的是能够对用户违约风险进行量化的数值,信用分越高则表明用户的违约风险越低,信用分越低则表明用户的违约风险越高。
步骤S102:采用多方安全计算方法控制多个计算节点根据各自持有的模型参数中至少一部分参数对违约概率计算函数进行协同转换,以将违约概率计算函数由LR逻辑回归函数转换成多元线性回归函数并根据多元线性回归函数确定不同类型信用数据样本对应的回归系数。
参阅前述公式(4),公式(4)中的参数β1、β2…βn就是通过步骤S102确定的不同类型信用数据样本对应的回归系数,其中,在本实施例中βi可以表示第i类信用数据样本对应的回归系数。
在本实施例可以采用数学技术领域中常规的函数转换方法将LR逻辑回归函数转换成多元线性回归函数,在此不再赘述。但需要说明的是,在将LR逻辑回归函数转换成多元线性回归函数的过程中是由多个计算节点根据各自持有的模型参数中至少一部分参数共同对违约概率计算函数进行函数转换,最终得到的多元线性回归函数。
步骤S103:控制多个计算节点根据回归系数以及各自持有的待评分信用数据中至少一部分数据对同一评分映射函数进行协同计算,得到待评分信用数据的信用分。
评分映射函数可以是以不同类型信用数据样本的WOE值为自变量,以回归系数为自变量的权重,以信用数据样本的信用分为因变量构建的函数。在本实施例中评分映射函数可以如下式(5)所示:
score=A-B(β1×x12×x2+…+βi×xi+…+βn×xn) (5)
公式(5)中各参数含义如下:
score表示信用分,A表示信用分的补偿值,也即基础分,B表示分数刻度,xi表示第i类信用数据样本的WOE值,βi表示第i类信用数据样本的WOE值对应的回归系数。
在本实施例中可以采用评分卡技术领域中常规的评分卡补偿值获取方法以及分数刻度获取方法,分别确定公式(5)中补偿值A和分数刻度B的具体数值。例如:可以将两组score和p已知的数据代入到下式(6)中,就可以求解出补偿值A和分数刻度B的具体数值:
Figure BDA0003329937120000101
公式(6)各参数含义如下:
score表示信用分,A表示信用分的补偿值,B表示分数刻度,p表示通过违约概率计算函数计算出的违约概率,1-p表示不违约的概率。
需要说明的是,在本实施例中同样可以将待评分信用数据以秘密分享的方式分别分发至每个计算节点,以确定每个计算节点各自持有的待评分信用数据,以保证待评分信用数据的安全性。
此外,在本发明实施例中在使用信用数据样本训练模型以及确定待评分信用数据的信用分数,都可以先对信用数据样本和待评分信用数据进行数据转换,将信用数据样本和待评分信用数据转换成定点数,再基于定点数执行模型训练以及信用分确定等相关步骤。
基于上述步骤S101-步骤S103,无论是在违约概率模型的训练过程中还是使用违约概率模型确定信用分的过程中都不会泄露任意一个数据提供方的数据,极大地提到了数据的安全性,同时也可以有效得到准确的信用数据的信用分。
下面对上述步骤S101和步骤S103作进一步说明。
在上述步骤S101的一个实施方式中,可以采用多方安全计算方法控制多个计算节点根据各自持有的信用数据样本中至少一部分数据并通过下列步骤11至步骤12对违约概率模型进行协同训练。
步骤11:获取违约概率模型的模型训练函数,模型训练函数可以包括根据违约概率计算函数的函数值构建的模型损失函数,以及根据违约概率计算函数的函数值与模型损失函数的函数值构建的模型参数优化函数。其中,违约概率计算函数和模型损失函数构成了在训练违约概率模型时的前向传播函数,模型参数优化函数构成了在训练违约概率模型时的反向传播函数。
在本实施方式中可以采用机器学习技术领域中常规的分类损失函数如交叉熵损失函数构建模型损失函数,即以违约概率计算函数的函数值为交叉熵损失函数的因变量,以模型损失值loss为交叉熵损失函数的因变量去构建模型损失函数。同时,在本实施方式中也可以采用机器学习技术领域中常规的模型参数优化方法如梯度下降算法构建模型参数优化函数。当违约概率计算函数采用上述公式(3)所示的函数
Figure BDA0003329937120000111
Figure BDA0003329937120000112
时,采用梯度下降算法可以确定如下式(7)所示的模型参数优化函数:
Figure BDA0003329937120000113
公式(7)中各参数含义如下:
W表示模型参数的矩阵,该矩阵中的每个元素分别表示不同类型的信用数据的WOE值对应的模型参数(权重);XM表示不同类型的信用数据的WOE值的矩阵,该矩阵中每个元素分别表示不同类型的信用数据的WOE值;YM表示通过公式(3)计算得出的违约概率的矩阵,该矩阵中每个元素分别表示不同类型的信用数据的WOE值对应的违约概率,T表示转置符号,α表示预设的系数。
步骤12:采用多方安全计算方法控制每个计算节点根据各自持有的模型参数中至少一部分参数分别加载违约概率模型,并通过违约概率模型与各自持有的信用数据样本中至少一部分数据,协同计算模型训练函数的函数值,以根据函数值对违约概率模型进行迭代协同训练。
在每次迭代协同训练中均可以采用机器学习技术领域中常规的模型参数优化方法对违约概率模型的模型参数进行优化,以完成当前的迭代协同训练。具体而言,在本实施例中可以先控制每个计算节点协同计算模型训练函数中模型损失函数的函数值,再控制每个计算节点根据模型损失函数的函数值协同计算模型训练函数中模型参数优化函数的函数值,而模型参数优化函数的函数值就是优化后的模型参数。
在本实施例中可以将模型参数以秘密分享的方式分别分发至每个计算节点,以确定每个计算节点各自持有的模型参数。需要说明的是,不仅在首次进行迭代协同训练时初始模型参数通过秘密分享的方式分别分发至每个计算节点,在完成每次迭代协同训练后确定的新的模型参数也同样通过秘密分享的方式分别分发至每个计算节点,也就是说,在每个训练阶段中每个计算节点根据各自持有的模型参数都是通过秘密分享的方式得到的。
参阅附图2,假设存在三个计算节点(计算方P0、计算方P1和计算方P2)和n个数据拥有方(数据拥有方D0 Client至数据拥有方Dn Client),也即数据提供方。此外还有一个模型训练结果获取方Client,这个模型训练结果获取方Client可以是上述数据拥有方中的一个或多个,也可以是除了数据拥有方以外其他需要获取模型训练结果的一方。下面以两次迭代训练为例对控制上述三个计算节点使用n个数据拥有方提供的数据对安全模型,也即前述实施例所述的违约概率模型进行协同训练进行说明。
1、第一次迭代协同训练
在训练之前,将安全模型的初始模型参数以及n个数据拥有方提供的信用数据样本都以秘密分享的方式分发至计算方P0、计算方P1和计算方P2,以保证计算方P0、计算方P1和计算方P2都各自持有初始模型参数中的一部分参数以及信用数据样本中的一部分数据。
在训练时控制计算方P0、计算方P1和计算方P2根据各自持有的初始模型参数中至少一部分参数分别加载安全模型,并通过安全模型与各自持有的信用数据样本中至少一部分数据,协同计算安全模型的模型训练函数的函数值,以便根据函数值完成本次迭代协同训练。在完成本次迭代协同训练后,将本次迭代协同训练确定出模型参数同样以秘密分享的方式分发至计算方P0、计算方P1和计算方P2,更新了计算方P0、计算方P1和计算方P2根据各自持有的初始模型参数。
2、第二次迭代协同训练
在训练时再次控制计算方P0、计算方P1和计算方P2根据各自持有的初始模型参数中至少一部分参数分别加载安全模型,并通过安全模型与各自持有的信用数据样本中至少一部分数据,协同计算安全模型的模型训练函数的函数值,以便根据函数值完成本次迭代协同训练。
假设在完成两次迭代协同训练后,安全模型已经满足收敛条件可以停止训练,此时可以将安全模型及其模型参数发送至模型训练结果获取方Client。需要说明的是,在本实施例中同样由多个计算节点协同判断安全模型已经满足收敛条件。例如,控制多个计算节点协同计算模型损失函数的函数值是否小于阈值,若小于判定满足收敛条件。
进一步,在步骤12的一个实施方式中可以通过下列步骤121至步骤123协同计算模型训练函数的函数值。
步骤121:根据模型训练函数的运算逻辑,确定通过相互组合能够实现运算逻辑的运算算子,运算算子至少包括乘法算子、加法算子、减法算子、数乘算子和多项式分段算子。
以公式(3)所示的违约概率计算函数为例,根据违约概率计算函数的运算逻辑可以确定通过相互组合能够实现运算逻辑的运算算子包括乘法算子、加法算子、减法算子、数乘算子和多项式分段算子。
步骤122:控制每个计算节点根据各自持有的信用数据样本中至少一部分数据分别计算每个运算算子的算子结果,并通过数据交换获取其他计算节点计算得到的算子结果。
步骤123:控制每个计算节点根据各自计算得到的算子结果与通过数据交换获取到的算子结果,确定模型训练函数的函数值。
下面分别对通过乘法算子、加法算子、减法算子、数乘算子和多项式分段算子完成的模型训练函数的运算逻辑进行示例性说明。
1、针对模型训练函数的运算逻辑中的乘法逻辑
继续参阅附图2,假设将一个信用数据样本x经秘密分享分割成x1、x2和x3,而分发到计算方P0、P1和P2的信用数据样本的数据依次是(x1,x2)、(x2,x3)和(x3,x1);将另一个信用数据样本y经秘密分享分割成y1、y2和y3,而分发到计算方P0、P1和P2的信用数据样本的数据依次是(y1,y2)、(y2,y3)和(y3,y1)。假设此时的运算逻辑是计算z=xy,通过多项式分解可以得到真实的运算结果z如下式(8)所示:
z=(x1+x2+x3)×(y1+y2+y3)
=x1y1+x1y2+x1y3+x2y1+x2y2+x2y3+x3y1+x3y2+x3y3 (8)
在对信用数据样本x与y进行乘法运算时可以控制计算方P0、P1和P2先根据各自持有的信用数据样本计算乘法算子的算子结果。
计算方P0计算到的乘法算子的算子结果z1:x1y1+x1y2+x2y11
计算方P1计算到的乘法算子的算子结果z2:x2y2+x2y3+x3y22
计算方P2计算到的乘法算子的算子结果z3:x3y3+x3y1+x1y33
其中,α123=0。
计算方P0、P1和P2在计算得出上述算子结果z1、z2和z3后再通过数据交换获取其他计算方计算得到的算子结果,最后使得计算方P0、P1和P2同时获取到上述算子结果z1、z2和z3,进而计算方P0、P1和P2就可以根据这些算子结果再次计算加法算子的算子结果,而这个加法算子的算子结果就是对信用数据样本x与y进行乘法运算后真实的运算结果z。
2、针对模型训练函数的运算逻辑中的加减法和数乘运算逻辑继续参数前述的例子,假设此时的运算逻辑是计算z=ax+by±c。
在对信用数据样本x与y进行上述运算逻辑时可以控制计算方P0、P1和P2先根据各自持有的信用数据样本计算乘法算子的算子结果。
计算方P0计算到的乘法算子的算子结果z1:ax1+by1±c;
计算方P1计算到的乘法算子的算子结果z2:ax2+by2
计算方P2计算到的乘法算子的算子结果z3:ax3+by3
计算方P0、P1和P2在计算得出上述算子结果z1、z2和z3后再通过数据交换获取其他计算方计算得到的算子结果,最后使得计算方P0、P1和P2同时获取到上述算子结果z1、z2和z3,进而计算方P0、P1和P2就可以根据这些算子结果再次计算加法算子的算子结果,而这个加法算子的算子结果就是对信用数据样本x与y进行上述运算逻辑后得到的真实的运算结果z=ax+by±c。
3、针对模型训练函数的运算逻辑中的
Figure BDA0003329937120000151
运算逻辑
在本实施例中可以采用多项式分段算子近似实现上述
Figure BDA0003329937120000152
运算逻辑,多项式分段算子的表达是可以是
Figure BDA0003329937120000153
在上述步骤S103的一个实施方式中,可以控制多个计算节点根据回归系数以及各自持有的待评分信用数据中至少一部分数据并通过下列步骤对同一评分映射函数进行协同计算:
步骤21:根据评分映射函数的运算逻辑,确定通过相互组合能够实现运算逻辑的运算算子,运算算子至少包括乘法算子、加法算子和减法算子。
步骤22:控制多个计算节点根据回归系数以及各自持有的待评分信用数据中至少一部分数据分别计算每个运算算子的算子结果,并通过数据交换获取其他计算节点计算得到的算子结果。
步骤23:控制每个计算节点根据各自计算得到的算子结果与通过数据交换获取到的算子结果,确定评分映射函数的函数值,以得到待评分信用数据的信用分。
在本实施例中步骤21至步骤23所述的对评分映射函数进行协同计算得到待评分信用数据(评分映射函数的函数值)的方法,与前述步骤121至步骤123所述的协同计算模型训练函数的函数值的方法,为了描述简洁,在此不再赘述。
需要指出的是,尽管上述实施例中将各个步骤按照特定的先后顺序进行了描述,但是本领域技术人员可以理解,为了实现本发明的效果,不同的步骤之间并非必须按照这样的顺序执行,其可以同时(并行)执行或以其他顺序执行,这些变化都在本发明的保护范围之内。
进一步,本发明还提供了一种信用评分装置。
参阅附图3,图3是根据本发明的一个实施例的信用评分装置的主要结构框图。如图3所示,本发明实施例中的信用评分装置主要包括模型训练模块11和信用评分模块12。
模型训练模块11可以被配置成采用多方安全计算方法控制多个计算节点根据各自持有的信用数据样本中至少一部分数据对同一违约概率模型进行协同训练,以确定违约概率模型的模型参数;其中,违约概率模型的违约概率计算函数是以信用数据样本的WOE值为自变量,以模型参数为自变量的权重,以违约概率为因变量构建的LR逻辑回归函数;
信用评分模块12可以被配置成执行下列操作:采用多方安全计算方法控制多个计算节点根据各自持有的模型参数中至少一部分参数对违约概率计算函数进行协同转换,以将违约概率计算函数由LR逻辑回归函数转换成多元线性回归函数并根据多元线性回归函数确定不同类型信用数据样本对应的回归系数;控制多个计算节点根据回归系数以及各自持有的待评分信用数据中至少一部分数据对同一评分映射函数进行协同计算,得到待评分信用数据的信用分;其中,评分映射函数是以不同类型信用数据样本的WOE值为自变量,以回归系数为自变量的权重,以信用数据样本的信用分为因变量构建的函数。
进一步,在一个实施方式中,模型训练模块11可以被进一步配置成执行下列操作:获取违约概率模型的模型训练函数,模型训练函数可以包括根据违约概率计算函数的函数值构建的模型损失函数以及根据违约概率计算函数的函数值与模型损失函数的函数值构建的模型参数优化函数;采用多方安全计算方法控制每个计算节点根据各自持有的模型参数中至少一部分参数分别加载违约概率模型,并通过违约概率模型与各自持有的信用数据样本中至少一部分数据,协同计算模型训练函数的函数值,以根据函数值对违约概率模型进行迭代协同训练。
进一步,在一个实施方式中,模型训练模块11可以被进一步配置成执行下列操作:根据模型训练函数的运算逻辑,确定通过相互组合能够实现所述运算逻辑的运算算子,运算算子至少包括乘法算子、加法算子、减法算子、数乘算子和多项式分段算子;控制每个计算节点根据各自持有的信用数据样本中至少一部分数据分别计算每个运算算子的算子结果,并通过数据交换获取其他计算节点计算得到的算子结果;控制每个计算节点根据各自计算得到的算子结果与通过数据交换获取到的算子结果,确定模型训练函数的函数值。
进一步,在一个实施方式中,信用评分模块12可以被进一步配置成执行下列操作:根据评分映射函数的运算逻辑,确定通过相互组合能够实现运算逻辑的运算算子,运算算子至少包括乘法算子、加法算子和减法算子;控制多个计算节点根据回归系数以及各自持有的待评分信用数据中至少一部分数据分别计算每个运算算子的算子结果,并通过数据交换获取其他计算节点计算得到的算子结果;控制每个计算节点根据各自计算得到的算子结果与通过数据交换获取到的算子结果,确定评分映射函数的函数值,以得到待评分信用数据的信用分。
进一步,在一个实施方式中,信用评分装置还可以包括信用数据样本分发模块和/或待评分信用数据分发模块和/或模型参数分发模块。
信用数据样本分发模块可以被配置成将信用数据样本以秘密分享的方式分别分发至每个计算节点,以确定每个计算节点各自持有的信用数据样本;待评分信用数据分发模块可以被配置成将待评分信用数据以秘密分享的方式分别分发至每个计算节点,以确定每个计算节点各自持有的待评分信用数据;模型参数分发模块可以被配置成将模型参数以秘密分享的方式分别分发至每个计算节点,以确定每个计算节点各自持有的模型参数。
上述信用评分装置以用于执行图1所示的信用评分方法实施例,两者的技术原理、所解决的技术问题及产生的技术效果相似,本技术领域技术人员可以清楚地了解到,为了描述的方便和简洁,信用评分装置的具体工作过程及有关说明,可以参考信用评分方法的实施例所描述的内容,此处不再赘述。
进一步,本发明还提供了一种多方安全计算的评分卡模型技术系统。
参阅附图4和附图5,图4是根据本发明的一个实施例的多方安全计算的评分卡模型技术系统的主要结构框图,图5是评分卡模型技术系统的主要系统流程示意图。如图4所示,本发明实施例中的多方安全计算的评分卡模型技术系统主要包括定点数处理模块、秘密分析处理模块、逻辑回归算法训练模块、评分卡映射算法模块和评分卡算法预测模块。如图5所示,评分卡模型技术系统的主要系统流程主要包括下列步骤S201至步骤S205。
步骤S201:运行定点数处理模块。
通过运行定点数处理模块可以将信用数据样本和待评分信用数据转换成定点数,以便后续使用定点数进行模型训练。
步骤S202:运行秘密分享处理模块。
通过运行秘密分享处理模块将信用数据样本、评分信用数据和违约概率模型的模型参数以秘密分享的方式分发至每个计算节点。
步骤S203:运行逻辑回归算法训练模块。
通过运行逻辑回归算法训练模块,采用多方安全计算方法控制多个计算节点根据各自持有的信用数据样本中至少一部分数据对同一违约概率模型进行协同训练,以确定违约概率模型的模型参数,完成模型训练。
步骤S204:运行评分卡映射算法模块。
通过运行评分卡映射算法模块,采用多方安全计算方法控制多个计算节点根据各自持有的模型参数中至少一部分参数对违约概率计算函数进行协同转换,以将违约概率计算函数由LR逻辑回归函数转换成多元线性回归函数并根据多元线性回归函数确定不同类型信用数据样本对应的回归系数。
步骤S205:评分卡算法预测模块。
通过运行评分卡映射算法模块,控制多个计算节点根据回归系数以及各自持有的待评分信用数据中至少一部分数据对同一评分映射函数进行协同计算,得到待评分信用数据的信用分。
需要说明的是,上述多方安全计算的评分卡模型技术系统以用于执行图1所示的信用评分方法实施例,两者的技术原理、所解决的技术问题及产生的技术效果相似,本技术领域技术人员可以清楚地了解到,为了描述的方便和简洁,信用评分装置的具体工作过程及有关说明,可以参考信用评分方法的实施例所描述的内容,此处不再赘述。
本领域技术人员能够理解的是,本发明实现上述一实施例的方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读存储介质可以包括:能够携带所述计算机程序代码的任何实体或装置、介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器、随机存取存储器、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读存储介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读存储介质不包括电载波信号和电信信号。
进一步,本发明还提供了一种控制装置。在根据本发明的一个控制装置实施例中,控制装置包括处理器和存储装置,存储装置可以被配置成存储执行上述方法实施例的信用评分方法的程序,处理器可以被配置成用于执行存储装置中的程序,该程序包括但不限于执行上述方法实施例的信用评分方法的程序。为了便于说明,仅示出了与本发明实施例相关的部分,具体技术细节未揭示的,请参照本发明实施例方法部分。该控制装置可以是包括各种电子设备形成的控制装置设备。
进一步,本发明还提供了一种计算机可读存储介质。在根据本发明的一个计算机可读存储介质实施例中,计算机可读存储介质可以被配置成存储执行上述方法实施例的信用评分方法的程序,该程序可以由处理器加载并运行以实现上述信用评分方法。为了便于说明,仅示出了与本发明实施例相关的部分,具体技术细节未揭示的,请参照本发明实施例方法部分。该计算机可读存储介质可以是包括各种电子设备形成的存储装置设备,可选的,本发明实施例中计算机可读存储介质是非暂时性的计算机可读存储介质。
进一步,应该理解的是,由于各个模块的设定仅仅是为了说明本发明的装置的功能单元,这些模块对应的物理器件可以是处理器本身,或者处理器中软件的一部分,硬件的一部分,或者软件和硬件结合的一部分。因此,图中的各个模块的数量仅仅是示意性的。
本领域技术人员能够理解的是,可以对装置中的各个模块进行适应性地拆分或合并。对具体模块的这种拆分或合并并不会导致技术方案偏离本发明的原理,因此,拆分或合并之后的技术方案都将落入本发明的保护范围内。
至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征作出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。

Claims (12)

1.一种信用评分方法,其特征在于,所述方法包括:
采用多方安全计算方法控制多个计算节点根据各自持有的信用数据样本中至少一部分数据对同一违约概率模型进行协同训练,以确定违约概率模型的模型参数;其中,所述违约概率模型的违约概率计算函数是以信用数据样本的WOE值为自变量,以所述模型参数为所述自变量的权重,以违约概率为因变量构建的LR逻辑回归函数;
采用多方安全计算方法控制多个计算节点根据各自持有的模型参数中至少一部分参数对所述违约概率计算函数进行协同转换,以将所述违约概率计算函数由所述LR逻辑回归函数转换成多元线性回归函数并根据所述多元线性回归函数确定不同类型信用数据样本对应的回归系数;
控制多个计算节点根据所述回归系数以及各自持有的待评分信用数据中至少一部分数据对同一评分映射函数进行协同计算,得到所述待评分信用数据的信用分;其中,所述评分映射函数是以不同类型信用数据样本的WOE值为自变量,以所述回归系数为所述自变量的权重,以所述信用数据样本的信用分为因变量构建的函数。
2.根据权利要求1所述的信用评分方法,其特征在于,“对同一违约概率模型进行协同训练”的步骤具体包括:
获取所述违约概率模型的模型训练函数,所述模型训练函数包括根据所述违约概率计算函数的函数值构建的模型损失函数以及根据违约概率计算函数的函数值与模型损失函数的函数值构建的模型参数优化函数;
采用多方安全计算方法控制每个计算节点根据各自持有的模型参数中至少一部分参数分别加载违约概率模型,并通过所述违约概率模型与各自持有的信用数据样本中至少一部分数据,协同计算所述模型训练函数的函数值,以根据所述函数值对所述违约概率模型进行迭代协同训练。
3.根据权利要求2所述的信用评分方法,其特征在于,“协同计算所述模型训练函数的函数值”的步骤具体包括:
根据所述模型训练函数的运算逻辑,确定通过相互组合能够实现所述运算逻辑的运算算子,所述运算算子至少包括乘法算子、加法算子、减法算子、数乘算子和多项式分段算子;
控制每个计算节点根据各自持有的信用数据样本中至少一部分数据分别计算每个运算算子的算子结果,并通过数据交换获取其他计算节点计算得到的算子结果;
控制每个计算节点根据各自计算得到的算子结果与通过数据交换获取到的算子结果,确定所述模型训练函数的函数值。
4.根据权利要求1所述的信用评分方法,其特征在于,“对同一评分映射函数进行协同计算”的步骤具体包括:
根据所述评分映射函数的运算逻辑,确定通过相互组合能够实现所述运算逻辑的运算算子,所述运算算子至少包括乘法算子、加法算子和减法算子;
控制多个计算节点根据所述回归系数以及各自持有的待评分信用数据中至少一部分数据分别计算每个运算算子的算子结果,并通过数据交换获取其他计算节点计算得到的算子结果;
控制每个计算节点根据各自计算得到的算子结果与通过数据交换获取到的算子结果,确定所述评分映射函数的函数值,以得到所述待评分信用数据的信用分。
5.根据权利要求1所述的信用评分方法,其特征在于,所述方法还包括:
将所述信用数据样本以秘密分享的方式分别分发至每个计算节点,以确定每个计算节点各自持有的信用数据样本;
和/或,将所述待评分信用数据以秘密分享的方式分别分发至每个计算节点,以确定每个计算节点各自持有的待评分信用数据;
和/或,将所述模型参数以秘密分享的方式分别分发至每个计算节点,以确定每个计算节点各自持有的模型参数。
6.一种信用评分装置,其特征在于,所述装置包括:
模型训练模块,其被配置成采用多方安全计算方法控制多个计算节点根据各自持有的信用数据样本中至少一部分数据对同一违约概率模型进行协同训练,以确定违约概率模型的模型参数;其中,所述违约概率模型的违约概率计算函数是以信用数据样本的WOE值为自变量,以所述模型参数为所述自变量的权重,以违约概率为因变量构建的LR逻辑回归函数;
信用评分模块,其被配置成执行下列操作:
采用多方安全计算方法控制多个计算节点根据各自持有的模型参数中至少一部分参数对所述违约概率计算函数进行协同转换,以将所述违约概率计算函数由所述LR逻辑回归函数转换成多元线性回归函数并根据所述多元线性回归函数确定不同类型信用数据样本对应的回归系数;
控制多个计算节点根据所述回归系数以及各自持有的待评分信用数据中至少一部分数据对同一评分映射函数进行协同计算,得到所述待评分信用数据的信用分;其中,所述评分映射函数是以不同类型信用数据样本的WOE值为自变量,以所述回归系数为所述自变量的权重,以所述信用数据样本的信用分为因变量构建的函数。
7.根据权利要求6所述的信用评分装置,其特征在于,所述模型训练模块被进一步配置成执行下列操作:
获取所述违约概率模型的模型训练函数,所述模型训练函数包括根据所述违约概率计算函数的函数值构建的模型损失函数以及根据违约概率计算函数的函数值与模型损失函数的函数值构建的模型参数优化函数;
采用多方安全计算方法控制每个计算节点根据各自持有的模型参数中至少一部分参数分别加载违约概率模型,并通过所述违约概率模型与各自持有的信用数据样本中至少一部分数据,协同计算所述模型训练函数的函数值,以根据所述函数值对所述违约概率模型进行迭代协同训练。
8.根据权利要求7所述的信用评分装置,其特征在于,所述模型训练模块被进一步配置成执行下列操作:
根据所述模型训练函数的运算逻辑,确定通过相互组合能够实现所述运算逻辑的运算算子,所述运算算子至少包括乘法算子、加法算子、减法算子、数乘算子和多项式分段算子;
控制每个计算节点根据各自持有的信用数据样本中至少一部分数据分别计算每个运算算子的算子结果,并通过数据交换获取其他计算节点计算得到的算子结果;
控制每个计算节点根据各自计算得到的算子结果与通过数据交换获取到的算子结果,确定所述模型训练函数的函数值。
9.根据权利要求6所述的信用评分装置,其特征在于,所述信用评分模块被进一步配置成执行下列操作:
根据所述评分映射函数的运算逻辑,确定通过相互组合能够实现所述运算逻辑的运算算子,所述运算算子至少包括乘法算子、加法算子和减法算子;
控制多个计算节点根据所述回归系数以及各自持有的待评分信用数据中至少一部分数据分别计算每个运算算子的算子结果,并通过数据交换获取其他计算节点计算得到的算子结果;
控制每个计算节点根据各自计算得到的算子结果与通过数据交换获取到的算子结果,确定所述评分映射函数的函数值,以得到所述待评分信用数据的信用分。
10.根据权利要求6所述的信用评分装置,其特征在于,所述装置还包括信用数据样本分发模块和/或待评分信用数据分发模块和/或模型参数分发模块;
所述信用数据样本分发模块被配置成将所述信用数据样本以秘密分享的方式分别分发至每个计算节点,以确定每个计算节点各自持有的信用数据样本;
所述待评分信用数据分发模块被配置成将所述待评分信用数据以秘密分享的方式分别分发至每个计算节点,以确定每个计算节点各自持有的待评分信用数据;
所述模型参数分发模块被配置成将所述模型参数以秘密分享的方式分别分发至每个计算节点,以确定每个计算节点各自持有的模型参数。
11.一种控制装置,包括处理器和存储装置,所述存储装置适于存储多条程序代码,其特征在于,所述程序代码适于由所述处理器加载并运行以执行权利要求1至5中任一项所述的信用评分方法。
12.一种计算机可读存储介质,其中存储有多条程序代码,其特征在于,所述程序代码适于由处理器加载并运行以执行权利要求1至5中任一项所述的信用评分方法。
CN202111275724.3A 2021-10-29 2021-10-29 信用评分方法、装置以及计算机可读存储介质 Pending CN114003951A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111275724.3A CN114003951A (zh) 2021-10-29 2021-10-29 信用评分方法、装置以及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111275724.3A CN114003951A (zh) 2021-10-29 2021-10-29 信用评分方法、装置以及计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN114003951A true CN114003951A (zh) 2022-02-01

Family

ID=79925661

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111275724.3A Pending CN114003951A (zh) 2021-10-29 2021-10-29 信用评分方法、装置以及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN114003951A (zh)

Similar Documents

Publication Publication Date Title
CN111931950B (zh) 一种基于联邦学习进行模型参数更新的方法及系统
Pulido-Gaytan et al. Privacy-preserving neural networks with homomorphic encryption: C hallenges and opportunities
US10467389B2 (en) Secret shared random access machine
CN110998579A (zh) 隐私保护的分布式多方安全模型训练框架
CN110709863A (zh) 使用秘密共享的逻辑回归建模方案
CN114401079B (zh) 多方联合信息价值计算方法、相关设备及存储介质
CN111143894A (zh) 一种提升安全多方计算效率的方法及系统
CN108833458B (zh) 一种应用推荐方法、装置、介质及设备
CN112905187B (zh) 编译方法、装置、电子设备及存储介质
CN112818374A (zh) 一种模型的联合训练方法、设备、存储介质及程序产品
CN113379042B (zh) 保护数据隐私的业务预测模型训练方法及装置
JP7067632B2 (ja) 秘密シグモイド関数計算システム、秘密ロジスティック回帰計算システム、秘密シグモイド関数計算装置、秘密ロジスティック回帰計算装置、秘密シグモイド関数計算方法、秘密ロジスティック回帰計算方法、プログラム
EP4016506B1 (en) Softmax function secret calculation system, softmax function secret calculation device, softmax function secret calculation method, neural network secret calculation system, neural network secret learning system, and program
CN112001475A (zh) 一种数据处理系统和方法
CN111353554B (zh) 预测缺失的用户业务属性的方法及装置
Ilias et al. Machine learning for all: A more robust federated learning framework
Boura et al. High-precision privacy-preserving real-valued function evaluation
CN113965313A (zh) 基于同态加密的模型训练方法、装置、设备以及存储介质
Zhou et al. LEGO: A hybrid toolkit for efficient 2PC-based privacy-preserving machine learning
CN114036581A (zh) 基于神经网络模型的隐私计算方法
CN116432040B (zh) 基于联邦学习的模型训练方法、装置、介质以及电子设备
CN113051586A (zh) 联邦建模系统及方法、联邦模型预测方法、介质、设备
CN112507323A (zh) 基于单向网络的模型训练方法、装置和计算设备
CN115719094B (zh) 基于联邦学习的模型训练方法、装置、设备及存储介质
CN114003951A (zh) 信用评分方法、装置以及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination