CN115062347B - 一种保障数据价值准确性的数据隐私安全共享方法及系统 - Google Patents

一种保障数据价值准确性的数据隐私安全共享方法及系统 Download PDF

Info

Publication number
CN115062347B
CN115062347B CN202210985486.3A CN202210985486A CN115062347B CN 115062347 B CN115062347 B CN 115062347B CN 202210985486 A CN202210985486 A CN 202210985486A CN 115062347 B CN115062347 B CN 115062347B
Authority
CN
China
Prior art keywords
data
accuracy
index
value
blue
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210985486.3A
Other languages
English (en)
Other versions
CN115062347A (zh
Inventor
王萍
徐志华
贾坤
沈星
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan XW Bank Co Ltd
Original Assignee
Sichuan XW Bank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan XW Bank Co Ltd filed Critical Sichuan XW Bank Co Ltd
Priority to CN202210985486.3A priority Critical patent/CN115062347B/zh
Publication of CN115062347A publication Critical patent/CN115062347A/zh
Application granted granted Critical
Publication of CN115062347B publication Critical patent/CN115062347B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2471Distributed queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/02Details
    • H04L12/16Arrangements for providing special services to substations
    • H04L12/18Arrangements for providing special services to substations for broadcast or conference, e.g. multicast
    • H04L12/1804Arrangements for providing special services to substations for broadcast or conference, e.g. multicast for stock exchange and similar applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/04Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks
    • H04L63/0428Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks wherein the data content is protected, e.g. by encrypting or encapsulating the payload

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Educational Administration (AREA)
  • General Business, Economics & Management (AREA)
  • Computer Security & Cryptography (AREA)
  • Marketing (AREA)
  • Software Systems (AREA)
  • Tourism & Hospitality (AREA)
  • Finance (AREA)
  • Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Quality & Reliability (AREA)
  • Computer Hardware Design (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Accounting & Taxation (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Medical Informatics (AREA)
  • Technology Law (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computational Linguistics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种保障数据价值准确性的数据隐私安全共享方法及系统,属于大数据技术领域。本发明包括以下步骤:1)各金融机构将蓝名单数据上传至本地;2)请求方机构发起某客户的蓝名单查询请求,并将该请求定向隐私发送到DNS协调方的协调节点;3)协调节点将收到的请求通过广播的方式发送至其他金融机构;4)其他金融机构收到广播请求后在本地数据库进行查询,并将查询结果反馈至协调节点进行汇总;5)DNS协调方的算力平台计算每条查询结果的准确性,得到准确率数据;6)请求方机构基于准确率数据进行风险决策。本发明解决了传统中心数据库数据共享模式下共享数据准确率不足、安全性不足的难题,极大简化了准确性率判断的难题。

Description

一种保障数据价值准确性的数据隐私安全共享方法及系统
技术领域
本发明属于数据共享技术领域,具体涉及一种保障数据价值准确性的数据隐私安全共享方法及系统。
背景技术
数据要素是金融科技行业和企业发展的核心。如何在保障数据安全和以技术作为驱动的前提下,充分激活数据要素潜能,推动数据的高效治理、有序共享和综合应用是各家金融机构接下来的发力点。数据要素在流程中产生价值,如何实现数据价值的隐私的共享是当前行业的一个重点研究课题。
当前,行业主流的数据共享模式为基于中心式数据库的数据共享模式。传统的数据共享解决方案往往要求建立统一的数据中心,各个数据提供方需要将各自数据集中汇总到数据中心。这种方式基于端对端的交互模式,具有简单、高效的特点;其次,中心式的数据库便于数据维护,具有高可用性;最后,原始数据汇总到一个数据中心,数据价值高,具有高可用性。但同时,也面临几个问题,首先是,各家机构主动上报意愿弱,机构不愿意将自己的核心价值数据上报至数据中心;其次,端对端明文数据交互方式,存在数据隐私的问题,信息泄露的风险极大;最后,各家机构上传数据的准确性难以保证,准确性难题带来的管理成本和维护成本特别高。
基于中心数据库共享模式的痛点问题,本发明创造性的提出了中国零售金融多方风险管理非对称不可逆广播协议(英文缩写:COBP),简称COBP协议,并基于COBP协议设计了一种新的数据共享模式-COBP平台和识别共享数据准确率算法-COBP方法。COBP平台基于一种分布式的数据存储模式,通过多方安全技术解决隐私性不足的问题,通过COBP自适应算法实时计算共享数据准确性,实现多个参与方数据价值安全共享,并保障数据质量。
发明内容
针对现有技术中存在的问题,本发明提供一种保障数据价值准确性的数据隐私安全共享方法及系统,其目的在于:解决传统中心数据库数据共享模式下共享数据准确率不足、安全性不足的难题。
本发明采用的技术方案如下:
一种保障数据价值准确性的数据隐私安全共享方法,包括以下步骤:
步骤1:各金融机构将蓝名单数据上传至金融机构本地,所述蓝名单数据包含蓝名单加入时间、客户身份主键ID和蓝名单类型编码;
步骤2:请求方机构发起某个客户的蓝名单查询请求,并将该蓝名单查询请求定向隐私发送到DNS协调方的协调节点;
步骤3:DNS协调方的协调节点将收到的蓝名单请求通过广播的方式发送至其他金融机构;
步骤4:其他金融机构对于收到的广播请求,在本地的分布式数据库进行查询,并将查询到的蓝名单数据反馈至DNS协调方的协调节点进行汇总;
步骤5:DNS协调方的算力平台基于COBP算法计算每条查询到的蓝名单数据的准确性,得到准确率数据;
步骤6:请求方机构接收到各家金融机构共享的蓝名单数据,并基于步骤5得到的准确率数据进行风险决策。
优选的,步骤5具体包括以下步骤:
步骤5.1:初始化各个协调节点的准确率分布,定义各金融机构共享的蓝名单数据的准确率均为
Figure 469616DEST_PATH_IMAGE001
Figure 121177DEST_PATH_IMAGE002
步骤5.2:初始化各个协调节点的惩罚因子分布,定义各家机构共享数据的惩罚因子均为
Figure 868291DEST_PATH_IMAGE003
Figure 935604DEST_PATH_IMAGE004
步骤5.3:基于各个协调节点的准确率分布和惩罚因子分布,计算金融机构
Figure 484397DEST_PATH_IMAGE005
返回的蓝名单数据的准确率值
Figure 978964DEST_PATH_IMAGE006
步骤5.4:DNS协调方的协调节点汇总带有准确率值的蓝名单数据,同时将带有准确率值的蓝名单数据返回至请求节点。
优选的,步骤5.3的具体步骤包括:
步骤5.3.1:若协调节点上线m日以内,遍历惩罚因子列表和初始化准确率列表,若
Figure 980418DEST_PATH_IMAGE007
,则
Figure 344098DEST_PATH_IMAGE008
;否则
Figure 481818DEST_PATH_IMAGE009
;若上线m日以上,则进入步骤5.3.2;
步骤5.3.2:基于Critic算法,构建准确率统计值指标
Figure 209602DEST_PATH_IMAGE010
,对于金融机构
Figure 432773DEST_PATH_IMAGE011
,分别计算指标
Figure 841889DEST_PATH_IMAGE012
,对于任意金融机构
Figure 99695DEST_PATH_IMAGE013
和任意准确率统计值指标
Figure 998381DEST_PATH_IMAGE014
,其对应的指标值为
Figure 410646DEST_PATH_IMAGE015
,其中
Figure 420190DEST_PATH_IMAGE016
Figure 532502DEST_PATH_IMAGE017
,最终得到评价指标集
Figure 539773DEST_PATH_IMAGE018
Figure 737536DEST_PATH_IMAGE019
;其中
Figure 550771DEST_PATH_IMAGE020
为共享数据日均上传量的标准差,
Figure 219387DEST_PATH_IMAGE021
为共享数据日均差量的标准差,
Figure 194297DEST_PATH_IMAGE022
为各金融机构共享数据相关系数的平均值,
Figure 817039DEST_PATH_IMAGE023
为同机构下不同服务间的数据重合度,
Figure 433965DEST_PATH_IMAGE024
为各机构共享数据的互信贡献度;
步骤5.3.3:基于Critic算法及评价指标集
Figure 255291DEST_PATH_IMAGE025
,实时计算更新蓝名单数据准确率;
步骤5.3.4:对于金融机构
Figure 368478DEST_PATH_IMAGE026
,统计金融机构
Figure 275254DEST_PATH_IMAGE026
最近m日的日准确率标准差,记做
Figure 430292DEST_PATH_IMAGE027
,计算标准差列表的变异度,记做
Figure 574965DEST_PATH_IMAGE028
,
Figure 157256DEST_PATH_IMAGE029
,自适应更新数据准确率
Figure 816908DEST_PATH_IMAGE030
,得到最终的准确率
Figure 14452DEST_PATH_IMAGE031
Figure 748053DEST_PATH_IMAGE032
步骤5.3.5:根据惩罚因子列表,得到当次查询请求返回数据的准确率值,如果
Figure 501245DEST_PATH_IMAGE033
,则
Figure 648193DEST_PATH_IMAGE034
,否则
Figure 348295DEST_PATH_IMAGE035
优选的,步骤5.3.3的具体步骤包括:
步骤5.3.3.1:对指标
Figure 998720DEST_PATH_IMAGE036
进行无量纲化处理得到指标值
Figure 421348DEST_PATH_IMAGE037
,对于任意一个准确率统计值指标
Figure 727696DEST_PATH_IMAGE038
,计算每一个指标集的最大值和最小值,分别记做
Figure 965910DEST_PATH_IMAGE039
Figure 736420DEST_PATH_IMAGE040
,其中
Figure 831415DEST_PATH_IMAGE041
,
Figure 185911DEST_PATH_IMAGE042
,
Figure 227816DEST_PATH_IMAGE043
;则对于指标
Figure 587254DEST_PATH_IMAGE044
Figure 118729DEST_PATH_IMAGE045
Figure 399669DEST_PATH_IMAGE046
Figure 42003DEST_PATH_IMAGE047
Figure 285640DEST_PATH_IMAGE048
;对于指标
Figure 722438DEST_PATH_IMAGE049
Figure 490673DEST_PATH_IMAGE050
步骤5.3.3.2:对于任意一个准确率统计值指标
Figure 936698DEST_PATH_IMAGE051
,计算该指标集的平均值
Figure 270728DEST_PATH_IMAGE052
,
Figure 81689DEST_PATH_IMAGE053
,以标准差形式来度量指标变异度
Figure 384492DEST_PATH_IMAGE054
,
Figure 103050DEST_PATH_IMAGE055
步骤5.3.3.3:对于准确率统计值指标中的任意两个指标
Figure 760427DEST_PATH_IMAGE056
Figure 539027DEST_PATH_IMAGE057
,假设
Figure 344172DEST_PATH_IMAGE058
表示评价指标
Figure 866421DEST_PATH_IMAGE059
Figure 876840DEST_PATH_IMAGE057
的相关系数,则
Figure 826341DEST_PATH_IMAGE060
,其中
Figure 853203DEST_PATH_IMAGE061
,假设指标冲突性记做
Figure 179142DEST_PATH_IMAGE062
,则
Figure 545532DEST_PATH_IMAGE063
步骤5.3.3.4:对于准确率统计值指标
Figure 931514DEST_PATH_IMAGE064
,假设信息量记做
Figure 944207DEST_PATH_IMAGE065
,则
Figure 11521DEST_PATH_IMAGE066
,然后计算各个指标的客观权重
Figure 29155DEST_PATH_IMAGE067
Figure 851618DEST_PATH_IMAGE068
步骤5.3.3.5:更新数据准确率,对于机构
Figure 790755DEST_PATH_IMAGE069
,定义数据准确率更新值为
Figure 425873DEST_PATH_IMAGE070
,基于指标客观权重
Figure 563594DEST_PATH_IMAGE071
,计算机构准确率的信息量
Figure 494640DEST_PATH_IMAGE072
,
Figure 717811DEST_PATH_IMAGE073
,更新各机构的数据准确率,
Figure 189244DEST_PATH_IMAGE074
本发明还提供了一种保障数据价值准确性的数据隐私安全共享系统,包括:
分布式数据库:用于储存各金融机构蓝名单数据;
DNS协调方:包括协调节点和算力平台;
协调节点:用于接收蓝名单查询请求并通过广播的方式发送至其他金融机构,以及接收其他金融机构反馈的蓝名单数据;
算力平台:用于计算每条反馈的蓝名单数据的准确性,得到准确率数据;
决策模块:用于根据准确率数据进行风险决策。
综上所述,由于采用了上述技术方案,本发明的有益效果是:
1、本发明创新性的提出了中国零售金融多方风险管理非对称不可逆广播协议,基于广播方式设计分布式的COBP平台和COBP算法,解决传统中心数据库数据共享模式下共享数据准确率不足、安全性不足的难题,为多方数据共享提供了一种新的解决方案。
2、本发明将“共享准确率”转化为“查得准确率”,即:将共享数据的准确性判断后置到查询响应阶段进行判断,极大的简化准确性率判断的难题。
3、本发明融合统计学和机器学习算法思想,巧妙的设计了COBP算法,实现系统自适应的更新共享数据的准确率。
附图说明
本发明将通过例子并参照附图的方式说明,其中:
图1是本发明的数据共享系统的框架图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
在本申请实施例的描述中,需要说明的是,术语“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,或者是该发明产品使用时惯常摆放的方位或位置关系,仅是为了便于描述本申请和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本申请的限制。此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
下面结合图1对本发明作详细说明。
步骤1:各家金融机构将蓝名单数据上传至金融机构本地。限定蓝名单数据上传的逻辑,包含三要素信息:applyTime、eid、listTypeCode,其中applyTime指的是蓝名单加入时间,eid指的是客户身份主键ID,listTypeCode指的是蓝名单类型编码,形如:{"applyTime": "2022-02-10 00:00:11", "listTypeCode": "F01", "eid":A244AC0BE6B42208F91ED034231377FF"}。
步骤2:金融机构发起客户的查询。对于任意一家金融机构
Figure 181471DEST_PATH_IMAGE075
发起某个客户的蓝名单查询请求,并将该蓝名单查询请求定向隐私发送到DNS协调方的协调节点,入参仅包含一个即eid,如入参信息为{"eid":A244AC0BE6B42208F91ED034231377FF"}。
步骤3:DNS协调方进行隐私请求的广播。DNS协调方的协调节点,对于收到的蓝名单请求,通过广播的方式将其发送至另外N-1家金融机构。
步骤4:金融机构隐私响应至DNS协调方,协调节点进行返回数据的汇总。其他N-1家金融机构对于收到的广播请求,在本地的分布式数据库进行查询,并将查询结果反馈至DNS协调方的协调节点,返回结果形如{"applyTime": "2022-02-10 00:00:11", "listTypeCode": "F01"}格式。协调节点汇总所有收到的隐私响应,形成最终的数据集,形如{"eid":A244AC0BE6B42208F91ED034231377FF","data": [{"applyTime": "2022-01-0100:12:18","listTypeCode":"F01"},
{"applyTime":"2022-02-02 10:12:09","listTypeCode": "F02"},
{"applyTime":"2022-03-20 10:12:09","listTypeCode": "F03"},] }。
步骤5:DNS协调方的算力平台,基于COBP算法计算每条蓝名单数据的准确性。假设准确率取值为[0,1],数值越大表示数据越准确,数值越小表示表示越不准确。对于
Figure 53393DEST_PATH_IMAGE076
的N个分布式节点,准确率分布计算过程如下:
步骤5.1:初始化各个节点的准确率分布,假设各家金融机构共享数据的准确率均为
Figure 498281DEST_PATH_IMAGE077
,
Figure 711087DEST_PATH_IMAGE078
步骤5.2:初始化各个节点的惩罚因子分布,假设各家机构共享数据的惩罚因子均为
Figure 823400DEST_PATH_IMAGE079
Figure 892987DEST_PATH_IMAGE080
。实际过程中,当发现异常节点时,惩罚因子可以通过协调节点对某一个机构进行更新。
步骤5.3:自适应实时计算该条数据准确率。对于任意一家金融机构发起的任意一次查询请求,对于任意一家金融机构返回的数据(若同一家机构返回多条数据,则准确率相同),假设机构
Figure 294012DEST_PATH_IMAGE081
返回一条数据{"applyTime":"2022-01-01 00:12:18","listTypeCode":"F01"},需要计算该条数据准确率
Figure 340204DEST_PATH_IMAGE082
步骤5.3.1:新节点,上线30日内,遍历惩罚因子列表和初始化准确率列表,若
Figure 775864DEST_PATH_IMAGE083
,则
Figure 750773DEST_PATH_IMAGE084
;否则
Figure 701412DEST_PATH_IMAGE085
。若上线30日以上,则继续步骤5.3.2。
步骤5.3.2:基于Critic算法,构建准确率统计值指标。指标分为正向指标和逆向指标,其中正向指标的值越大越好,逆向指标的值越小越好。Critic算法是Diakoulaki提出一种评价指标客观赋权方法。该方法在对指标进行权重计算时围绕两个方面进行:对比度和矛盾性。
具体如下:
(1)构建指标
Figure 521600DEST_PATH_IMAGE086
Figure 342926DEST_PATH_IMAGE087
表示共享数据日均上传量的标准差,该指标为逆向指标。假设机构
Figure 456113DEST_PATH_IMAGE088
最近30日的共享的数据量分别为
Figure 362889DEST_PATH_IMAGE089
。首先计算其标准差,记做
Figure 517927DEST_PATH_IMAGE090
Figure 662600DEST_PATH_IMAGE091
,然后计算共享数据日均上传量的标准差
Figure 979312DEST_PATH_IMAGE092
Figure 638964DEST_PATH_IMAGE094
(2)构建指标
Figure 33911DEST_PATH_IMAGE095
Figure 829828DEST_PATH_IMAGE096
表示共享数据日均差量的标准差,该指标为正向指标。假设机构
Figure 848600DEST_PATH_IMAGE097
共享数据的日均上限为
Figure 933231DEST_PATH_IMAGE098
,最近30日的共享的数据量分别为
Figure 164492DEST_PATH_IMAGE099
。首先计算日共享数据的差量均值,记做
Figure 814916DEST_PATH_IMAGE100
Figure 497265DEST_PATH_IMAGE101
;然后计算共享数据日均差量的标准差
Figure 538033DEST_PATH_IMAGE102
Figure 572985DEST_PATH_IMAGE104
(3)构建指标
Figure 343495DEST_PATH_IMAGE105
Figure 641752DEST_PATH_IMAGE105
表示各个机构共享数据相关系数的平均值,该指标为正向指标。对于N家金融机构,假设各家金融上传的数据条数分别为
Figure 996248DEST_PATH_IMAGE106
。对于金融机构
Figure 834891DEST_PATH_IMAGE107
,分别计算共享数据与其他金融机构间的相关系数
Figure 663170DEST_PATH_IMAGE108
,
Figure 929066DEST_PATH_IMAGE109
。计算指标
Figure 272323DEST_PATH_IMAGE110
Figure 117919DEST_PATH_IMAGE111
(4)构建指标
Figure 95977DEST_PATH_IMAGE112
Figure 798354DEST_PATH_IMAGE112
表示同机构下不同服务间的数据重合度,该指标为正向指标。假设最近30日,机构
Figure 363327DEST_PATH_IMAGE113
上传蓝名单数据条数为
Figure 481456DEST_PATH_IMAGE114
,发起的查询笔数为
Figure 81065DEST_PATH_IMAGE115
,则
Figure 954343DEST_PATH_IMAGE116
(5)构建指标
Figure 6612DEST_PATH_IMAGE117
,统计各机构共享数据的互信贡献度,该指标为正向指标。统计最近30日,对于每一次查询,机构
Figure 426967DEST_PATH_IMAGE118
的共享数据与其他任意机构共享数据同时被返回的次数,记做
Figure 146661DEST_PATH_IMAGE119
对于金融机构
Figure 925262DEST_PATH_IMAGE120
,分别计算指标
Figure 668090DEST_PATH_IMAGE121
,对于任意机构
Figure 455917DEST_PATH_IMAGE122
和任意指标
Figure 764539DEST_PATH_IMAGE123
,其对应的指标值为
Figure 421697DEST_PATH_IMAGE124
,其中
Figure 448559DEST_PATH_IMAGE125
Figure 774498DEST_PATH_IMAGE126
。最终形成评价指标集
Figure 140888DEST_PATH_IMAGE127
Figure 261291DEST_PATH_IMAGE128
步骤5.3.3:基于Critic算法及指标集
Figure 41028DEST_PATH_IMAGE127
,实时计算更新响应数据(针对查询的回应,即蓝名单数据)准确率。主要包括无量纲化处理、指标变异性计算、指标冲突性、指标客观权重计算及数据准确率更新合计5个子步骤。
步骤5.3.3.1:进行无量纲化处理。对于指标
Figure 403614DEST_PATH_IMAGE129
,无量纲化处理之后的指标值记做
Figure 624511DEST_PATH_IMAGE130
。对于任意一个指标
Figure 446974DEST_PATH_IMAGE131
,计算每一个指标集的最大值和最小值,分别记做
Figure 182849DEST_PATH_IMAGE132
Figure 788273DEST_PATH_IMAGE133
,其中
Figure 158950DEST_PATH_IMAGE134
,
Figure 886734DEST_PATH_IMAGE135
,
Figure 47588DEST_PATH_IMAGE136
。则对于正向指标
Figure 784600DEST_PATH_IMAGE137
Figure 776827DEST_PATH_IMAGE138
;对于逆向指标
Figure 613196DEST_PATH_IMAGE139
Figure 87777DEST_PATH_IMAGE140
步骤5.3.3.2:计算指标变异度。对于任意一个指标
Figure 97322DEST_PATH_IMAGE141
,计算该指集的平均值,记做
Figure 147317DEST_PATH_IMAGE142
,
Figure 216904DEST_PATH_IMAGE143
。以标准差形式来度量指标变异度,记做
Figure 414667DEST_PATH_IMAGE144
,则
Figure 227903DEST_PATH_IMAGE145
步骤5.3.3.3:计算指标冲突性,以相关系数度量。对于指标中的任意两个指标
Figure 726597DEST_PATH_IMAGE146
Figure 967086DEST_PATH_IMAGE147
,假设
Figure 652145DEST_PATH_IMAGE148
表示评价指标
Figure 206754DEST_PATH_IMAGE146
Figure 28080DEST_PATH_IMAGE147
的相关系数,则
Figure 439469DEST_PATH_IMAGE149
,其中
Figure 48043DEST_PATH_IMAGE150
。假设指标冲突性记做
Figure 203081DEST_PATH_IMAGE151
,则
Figure 144492DEST_PATH_IMAGE152
步骤5.3.3.4:指标客观权重计算。首先计算信息量,对于指标
Figure 930045DEST_PATH_IMAGE153
,假设信息量记做
Figure 324118DEST_PATH_IMAGE154
,则
Figure 17267DEST_PATH_IMAGE155
。其次,计算各个指标的客观权重,记做
Figure 78764DEST_PATH_IMAGE156
,则
Figure 533754DEST_PATH_IMAGE157
步骤5.3.3.5:更新数据准确率,对于机构
Figure 149543DEST_PATH_IMAGE158
,假设数据准确率更新值为
Figure 911963DEST_PATH_IMAGE159
。首先,基于指标客观权重,计算机构准确率的信息量,记做
Figure 562387DEST_PATH_IMAGE160
,
Figure 955322DEST_PATH_IMAGE161
。其次,更新各机构的数据准确率,
Figure 323987DEST_PATH_IMAGE162
步骤5.3.4:利用boosting 算法,自适应更新
Figure 60736DEST_PATH_IMAGE163
,得到最终的准确率
Figure 565667DEST_PATH_IMAGE164
。对于机构
Figure 926241DEST_PATH_IMAGE165
,统计金融机构
Figure 719885DEST_PATH_IMAGE165
最近30日的日准确率标准差,记做
Figure 558528DEST_PATH_IMAGE166
。计算标准差列表的变异度,记做
Figure 449123DEST_PATH_IMAGE167
,
Figure 422676DEST_PATH_IMAGE168
。自适应更新数据准确率
Figure 500354DEST_PATH_IMAGE169
,得到最终的准确率
Figure 142688DEST_PATH_IMAGE170
Figure 622211DEST_PATH_IMAGE171
步骤5.3.5:根据惩罚因子列表,得到当次查询请求返回数据的准确率值。如果
Figure 262271DEST_PATH_IMAGE172
,则
Figure 92823DEST_PATH_IMAGE173
;否则
Figure 771804DEST_PATH_IMAGE174
步骤5.4:DNS协调方汇总进行准确率数据的隐私响应。协调节点汇总带有准确率值的查询结果,其中precision表示数据准确率,形如:
{"eid":A244AC0BE6B42208F91ED034231377FF",
"data": [{"applyTime": "2022-01-01 00:12:18", "listTypeCode":"F01","precision":
Figure 840254DEST_PATH_IMAGE175
},{"applyTime":"2022-02-0210:12:09","listTypeCode": "F02","precision":
Figure 651215DEST_PATH_IMAGE176
},
{"applyTime":"2022-03-2010:12:09","listTypeCode": "F03","precision":
Figure DEST_PATH_IMAGE177
}] }。同时,将带有准确率值的响应结果返回至请求节点。
步骤6:请求方机构接收到各家金融机构共享的数据列表,并基于准确率数据进行风险决策。一种最简单的处理方式,筛选准确率
Figure DEST_PATH_IMAGE178
的数据记录,认为是可信的,其余数据直接剔除。
以上,基于COBP平台实现了分布式的数据隐私交互,并通过COBP算法计算数据准确率,保障了共享数据的准确性。
以上所述实施例仅表达了本申请的具体实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请保护范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请技术方案构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。

Claims (2)

1.一种保障数据价值准确性的数据隐私安全共享方法,其特征在于,包括以下步骤:
步骤1:各金融机构将蓝名单数据上传至金融机构本地,所述蓝名单数据包含蓝名单加入时间、客户身份主键ID和蓝名单类型编码;
步骤2:请求方机构发起某个客户的蓝名单查询请求,并将该蓝名单查询请求定向隐私发送到DNS协调方的协调节点;
步骤3:DNS协调方的协调节点将收到的蓝名单请求通过广播的方式发送至其他金融机构;
步骤4:其他金融机构对于收到的广播请求,在本地的分布式数据库进行查询,并将查询到的蓝名单数据反馈至DNS协调方的协调节点进行汇总;
步骤5:DNS协调方的算力平台基于COBP算法计算每条查询到的蓝名单数据的准确性,得到准确率数据;
步骤6:请求方机构接收到各家金融机构共享的蓝名单数据,并基于步骤5得到的准确率数据进行风险决策;
步骤5具体包括以下步骤:
步骤5.1:初始化各个协调节点的准确率分布,定义各金融机构共享的蓝名单数据的准确率均为
Figure FDA0003860597070000011
步骤5.2:初始化各个协调节点的惩罚因子分布,定义各家机构共享数据的惩罚因子均为γi=-1,i=1,…,N;
步骤5.3:基于各个协调节点的准确率分布和惩罚因子分布,计算金融机构Ai返回的蓝名单数据的准确率值ωi
步骤5.4:DNS协调方的协调节点汇总带有准确率值的蓝名单数据,同时将带有准确率值的蓝名单数据返回至请求节点;
步骤5.3的具体步骤包括:
步骤5.3.1:若协调节点上线m日以内,遍历惩罚因子列表和初始化准确率列表,若γi≥0,则ωi=γi;否则
Figure FDA0003860597070000012
若上线m日以上,则进入步骤5.3.2;
步骤5.3.2:基于Critic算法,构建准确率统计值指标Bj,对于金融机构A1,A2,……,AN,分别计算指标B1,B2,B3,B4,B5,对于任意金融机构Ai和任意准确率统计值指标Bj,其对应的指标值为bij,其中N=1,2,,,,N;j=1,2,,,,5,最终得到评价指标集S,
Figure FDA0003860597070000013
Figure FDA0003860597070000021
其中B1为共享数据日均上传量的标准差,B2为共享数据日均差量的标准差,B3为各金融机构共享数据相关系数的平均值,B4为同机构下不同服务间的数据重合度,B5为各机构共享数据的互信贡献度;
步骤5.3.3:基于Critic算法及评价指标集S,实时计算更新蓝名单数据准确率;
步骤5.3.4:对于金融机构Ai,统计金融机构Ai最近m日的日准确率标准差,记做Di,计算标准差列表的变异度,记做Fi,
Figure FDA0003860597070000022
自适应更新数据准确率
Figure FDA0003860597070000023
得到最终的准确率
Figure FDA0003860597070000024
Figure FDA0003860597070000025
步骤5.3.5:根据惩罚因子列表,得到当次查询请求返回数据的准确率值,如果γi≥0,则
Figure FDA0003860597070000026
否则ωi=γi
步骤5.3.3的具体步骤包括:
步骤5.3.3.1:对指标bij进行无量纲化处理得到指标值
Figure FDA0003860597070000027
对于任意一个准确率统计值指标Bj,计算每一个指标集的最大值和最小值,分别记做
Figure FDA0003860597070000028
Figure FDA0003860597070000029
其中
Figure FDA00038605970700000210
Figure FDA00038605970700000211
则对于指标B2,B3,B4,B5
Figure FDA00038605970700000212
对于指标B1
Figure FDA00038605970700000213
步骤5.3.3.2:对于任意一个准确率统计值指标Bj,计算该指标集的平均值
Figure FDA00038605970700000214
Figure FDA00038605970700000223
Figure FDA00038605970700000215
以标准差形式来度量指标变异度Sj,
Figure FDA00038605970700000216
步骤5.3.3.3:对于准确率统计值指标中的任意两个指标Bt和Bj,假设rtj表示评价指标Bt和Bj的相关系数,则
Figure FDA00038605970700000217
其中1≤t,j≤5,假设指标冲突性记做Rj,则
Figure FDA00038605970700000218
步骤5.3.3.4:对于准确率统计值指标Bj,假设信息量记做Cj,则Cj=SjRj,然后计算各个指标的客观权重Wj
Figure FDA00038605970700000219
步骤5.3.3.5:更新数据准确率,对于机构Ai,定义数据准确率更新值为
Figure FDA00038605970700000220
基于指标客观权重Wj,计算机构准确率的信息量Yi,
Figure FDA00038605970700000221
更新各机构的数据准确率,
Figure FDA00038605970700000222
2.一种实现权利要求1所述保障数据价值准确性的数据隐私安全共享方法的系统,其特征在于,包括:
分布式数据库:用于储存各金融机构蓝名单数据;
DNS协调方:包括协调节点和算力平台;
协调节点:用于接收蓝名单查询请求并通过广播的方式发送至其他金融机构,以及接收其他金融机构反馈的蓝名单数据;
算力平台:用于计算每条反馈的蓝名单数据的准确性,得到准确率数据;
决策模块:用于根据准确率数据进行风险决策。
CN202210985486.3A 2022-08-17 2022-08-17 一种保障数据价值准确性的数据隐私安全共享方法及系统 Active CN115062347B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210985486.3A CN115062347B (zh) 2022-08-17 2022-08-17 一种保障数据价值准确性的数据隐私安全共享方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210985486.3A CN115062347B (zh) 2022-08-17 2022-08-17 一种保障数据价值准确性的数据隐私安全共享方法及系统

Publications (2)

Publication Number Publication Date
CN115062347A CN115062347A (zh) 2022-09-16
CN115062347B true CN115062347B (zh) 2022-11-04

Family

ID=83207343

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210985486.3A Active CN115062347B (zh) 2022-08-17 2022-08-17 一种保障数据价值准确性的数据隐私安全共享方法及系统

Country Status (1)

Country Link
CN (1) CN115062347B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018120129A1 (zh) * 2016-12-30 2018-07-05 深圳前海达闼云端智能科技有限公司 数据查询方法、装置及节点设备
CN109766362A (zh) * 2018-12-28 2019-05-17 北京字节跳动网络技术有限公司 数据处理方法及装置
CN112132589A (zh) * 2020-11-30 2020-12-25 四川新网银行股份有限公司 一种基于多次融合构建欺诈识别模型的方法
CN112215616A (zh) * 2020-11-30 2021-01-12 四川新网银行股份有限公司 一种基于网络的自动识别资金异常交易的方法和系统
CN113515538A (zh) * 2021-06-08 2021-10-19 四川新网银行股份有限公司 一种基于多方安全计算的机构间隐私数据查询及预警方法
CN114255123A (zh) * 2021-12-29 2022-03-29 上海金仕达软件科技有限公司 风险排查方法、装置、计算机设备、存储介质和产品

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016138183A1 (en) * 2015-02-24 2016-09-01 Pneuron Corp. Distributed money laundering detection system
US11847617B2 (en) * 2017-02-07 2023-12-19 Johnson Controls Tyco IP Holdings LLP Model predictive maintenance system with financial analysis functionality
US11747800B2 (en) * 2017-05-25 2023-09-05 Johnson Controls Tyco IP Holdings LLP Model predictive maintenance system with automatic service work order generation
CN108229891A (zh) * 2018-02-07 2018-06-29 徐颂 兼容标准物品编码的供应链数据采集、验证方法和系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018120129A1 (zh) * 2016-12-30 2018-07-05 深圳前海达闼云端智能科技有限公司 数据查询方法、装置及节点设备
CN109766362A (zh) * 2018-12-28 2019-05-17 北京字节跳动网络技术有限公司 数据处理方法及装置
CN112132589A (zh) * 2020-11-30 2020-12-25 四川新网银行股份有限公司 一种基于多次融合构建欺诈识别模型的方法
CN112215616A (zh) * 2020-11-30 2021-01-12 四川新网银行股份有限公司 一种基于网络的自动识别资金异常交易的方法和系统
CN113515538A (zh) * 2021-06-08 2021-10-19 四川新网银行股份有限公司 一种基于多方安全计算的机构间隐私数据查询及预警方法
CN114255123A (zh) * 2021-12-29 2022-03-29 上海金仕达软件科技有限公司 风险排查方法、装置、计算机设备、存储介质和产品

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Efficent Distributed Database Clustering Algorithm for Big Data Processing;LianTian Li;《网页在线公开:https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=9470351》;20210712;第1-4页 *
分布式数据库分片关系变换自适应查询技术研究;李淑兰等;《科学资讯》;20200805(第32期);第142页 *
分布式数据库查询优化研究;刘娜;《微型电脑应用》;20210916;第37卷(第8期);第108-111页 *

Also Published As

Publication number Publication date
CN115062347A (zh) 2022-09-16

Similar Documents

Publication Publication Date Title
US11176277B2 (en) Automatic generating analytics from blockchain data
CN102668457B (zh) 用于确定社区内的连接性的系统和方法
Zhang et al. Faithful edge federated learning: Scalability and privacy
CN109286676B (zh) 一种基于区块链的电力数据安全信息系统
Lee et al. Interviewing in two‐sided matching markets
CN115510494B (zh) 一种基于区块链与联邦学习的多方安全数据共享方法
Wang et al. Explaining the variance in underpricing among venture capital‐backed IPOs: A comparison between private and corporate VC Firms
CN113065143A (zh) 基于区块链的工业数据安全共享
Zeng et al. Incentive mechanisms in federated learning and a game-theoretical approach
Shi et al. Fedfaim: A model performance-based fair incentive mechanism for federated learning
CN109831545A (zh) 一种基于区块链的域名滥用处理方法及系统
CN114553661A (zh) 一种面向无线联邦学习的移动用户设备分簇训练方法
Zhang et al. Trade‐offs between sustainable tourism development goals: An analysis of Tibet (China)
CN114912717B (zh) 基于物联网的智慧城市保障住房申请风险评估方法和系统
CN114398634A (zh) 一种基于信息熵的联邦学习参与方权重计算方法
Liu et al. Three‐way decisions with single‐valued neutrosophic decision theory rough sets based on grey relational analysis
CN113360514A (zh) 联合更新模型的方法、装置及系统
CN115062347B (zh) 一种保障数据价值准确性的数据隐私安全共享方法及系统
CN117391536A (zh) 一种数据协同响应绩效评估方法、系统、设备及介质
Thomas et al. Development of network measures for knowledge processes: A relational framework
CN116451806A (zh) 一种基于区块链的联邦学习激励分配方法及装置
CN111522882A (zh) 一种基于区块链的内模管理系统及方法
Wang et al. [Retracted] Agricultural Productive Service System Based on the Block Chain and Edge Computing
Bandara et al. Indy528—Federated learning model Tokenization with non-fungible tokens (NFT) and model cards
Dong Prediction of college employment rate based on big data analysis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant