CN116522402B - 基于隐私计算的客户识别方法、装置、设备及介质 - Google Patents

基于隐私计算的客户识别方法、装置、设备及介质 Download PDF

Info

Publication number
CN116522402B
CN116522402B CN202310811761.4A CN202310811761A CN116522402B CN 116522402 B CN116522402 B CN 116522402B CN 202310811761 A CN202310811761 A CN 202310811761A CN 116522402 B CN116522402 B CN 116522402B
Authority
CN
China
Prior art keywords
transaction amount
data set
client
subsidiary
customer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310811761.4A
Other languages
English (en)
Other versions
CN116522402A (zh
Inventor
张剑
陈曦
申志彬
陈晓敏
胡姣姣
蒙雄发
李如先
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Qianhai Huanrong Lianyi Information Technology Service Co Ltd
Original Assignee
Shenzhen Qianhai Huanrong Lianyi Information Technology Service Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Qianhai Huanrong Lianyi Information Technology Service Co Ltd filed Critical Shenzhen Qianhai Huanrong Lianyi Information Technology Service Co Ltd
Priority to CN202310811761.4A priority Critical patent/CN116522402B/zh
Publication of CN116522402A publication Critical patent/CN116522402A/zh
Application granted granted Critical
Publication of CN116522402B publication Critical patent/CN116522402B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Finance (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Bioethics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Data Mining & Analysis (AREA)
  • Medical Informatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Hardware Design (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)

Abstract

本申请涉及大数据技术领域,提供了基于隐私计算的客户识别方法、装置、设备及介质,一方面,通过节点转发实现两两不互通节点的PSI,对目标企业的每两个子公司的数据集执行隐匿求交,使数据在不出本地的情况下执行交集运算,保护了数据隐私;另一方面,再结合多方安全计算,对网络不互通的各个子公司中客户的交易量进行联合排序,在各方输入数据不泄露的情况下得到客户交易量排序结果,并根据客户交易量排序结果确定目标企业的重点客户,以便后续对重点客户进行针对性维护。

Description

基于隐私计算的客户识别方法、装置、设备及介质
技术领域
本申请涉及大数据的数据处理技术领域,尤其涉及一种基于隐私计算的客户识别方法、装置、设备及介质。
背景技术
随着各个企业的业务量不断加大,客户群体也越来越多样化,因此,为了更好的服务客户,通常需要识别到企业的重点客户,并对重点客户进行针对性服务,以提升客户的满意度,使客户与企业间进行更好的合作。
但是,在目前的数据安全性要求下,明文数据不能出本地,因此,如何解决不同机构间进行联合数据统计的需求与数据安全性间的矛盾,成为了亟待解决的问题。
发明内容
本申请实施例提供了一种基于隐私计算的客户识别方法、装置、设备及介质,旨在解决不同机构间在网络不通的情况下联合进行客户的交易量排序,以识别到企业重点客户的问题。
第一方面,本申请实施例提供了一种基于隐私计算的客户识别方法,其包括:
响应于对目标企业的重点客户识别指令,获取所述目标企业的网络不互通的多个子公司,及获取每个子公司的各个客户的交易量;
获取各个客户的客户标识,并利用各个客户的客户标识及每个子公司的各个客户的交易量构建每个子公司的数据集;
利用PSI算法对每两个子公司的数据集执行隐匿求交,得到每两个子公司的交集;
根据每两个子公司的交集对每个子公司的数据集进行拆分,得到每个子公司对应的交集数据集及独有数据集;
将每个子公司对应的交集数据集及独有数据集秘密共享至第一计算节点及第二计算节点;
基于多方安全计算对所述第一计算节点接收到的第一共享分片及所述第二计算节点接收到的第二共享分片进行联合排序,得到所述第一计算节点的第一客户交易量排序分片及所述第二计算节点的第二客户交易量排序分片;
将所述第一客户交易量排序分片及所述第二客户交易量排序分片发送至预设接收方;
在所述预设接收方根据所述第一客户交易量排序分片及所述第二客户交易量排序分片进行解密,得到所述目标企业的各个客户的客户交易量排序结果;
根据所述客户交易量排序结果确定所述目标企业的重点客户。
第二方面,本申请实施例提供了一种基于隐私计算的客户识别装置,其包括:
获取单元,用于响应于对目标企业的重点客户识别指令,获取所述目标企业的网络不互通的多个子公司,及获取每个子公司的各个客户的交易量;
构建单元,用于获取各个客户的客户标识,并利用各个客户的客户标识及每个子公司的各个客户的交易量构建每个子公司的数据集;
运算单元,用于利用PSI算法对每两个子公司的数据集执行隐匿求交,得到每两个子公司的交集;
拆分单元,用于根据每两个子公司的交集对每个子公司的数据集进行拆分,得到每个子公司对应的交集数据集及独有数据集;
共享单元,用于将每个子公司对应的交集数据集及独有数据集秘密共享至第一计算节点及第二计算节点;
排序单元,用于基于多方安全计算对所述第一计算节点接收到的第一共享分片及所述第二计算节点接收到的第二共享分片进行联合排序,得到所述第一计算节点的第一客户交易量排序分片及所述第二计算节点的第二客户交易量排序分片;
发送单元,用于将所述第一客户交易量排序分片及所述第二客户交易量排序分片发送至预设接收方;
解密单元,用于在所述预设接收方根据所述第一客户交易量排序分片及所述第二客户交易量排序分片进行解密,得到所述目标企业的各个客户的客户交易量排序结果;
确定单元,用于根据所述客户交易量排序结果确定所述目标企业的重点客户。
第三方面,本申请实施例又提供了一种计算机设备,其包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述的基于隐私计算的客户识别方法。
第四方面,本申请实施例还提供了一种计算机可读存储介质,其中所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行上述第一方面所述的基于隐私计算的客户识别方法。
本申请实施例提供了一种基于隐私计算的客户识别方法、装置、设备及介质,一方面,通过节点转发实现两两不互通节点的PSI,对目标企业的每两个子公司的数据集执行隐匿求交,使数据在不出本地的情况下执行交集运算,保护了数据隐私;另一方面,再结合多方安全计算,对网络不互通的各个子公司中客户的交易量进行联合排序,在各方输入数据不泄露的情况下得到客户交易量排序结果,并根据客户交易量排序结果确定目标企业的重点客户,以便后续对重点客户进行针对性维护。
附图说明
为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的基于隐私计算的客户识别方法的应用场景示意图;
图2为本申请实施例提供的基于隐私计算的客户识别方法的流程示意图;
图3为本申请实施例提供的基于隐私计算的客户识别装置的示意性框图;
图4为本申请实施例提供的计算机设备的示意性框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和 “包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本申请说明书和所附权利要求书中使用的术语“和/ 或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
请参阅图1和图2,图1为本申请实施例提供的基于隐私计算的客户识别方法的应用场景示意图;图2为本申请实施例提供的基于隐私计算的客户识别方法的流程示意图,该基于隐私计算的客户识别方法应用于服务器中,该方法通过安装于服务器中的应用软件进行执行。
如图2所示,该方法包括步骤S101~S109。
S101、响应于对目标企业的重点客户识别指令,获取所述目标企业的网络不互通的多个子公司,及获取每个子公司的各个客户的交易量。
在本实施例中,是以服务器为执行主体来描述技术方案。用户使用的用户端(如智能手机、平板电脑等智能终端)可与服务器进行数据交互,具体如服务器提供了一个重点客户识别平台,用户使用用户端可登录该重点客户识别平台。用户端的终端界面上显示有该重点客户识别平台的用户交互界面,且该用户交互界面中存在有至少一个数据上传接口。在触发对所述目标企业的重点客户识别指令后,从数据上传接口将该重点客户识别指令上传至服务器,在服务器中即可进行后续的重点客户识别。
在本实施例中,所述目标企业可以为一个集团,该集团下包括多个子公司,且各个子公司间的网络不互通。
在本实施例中,所述重点客户识别指令可以由市场营销等相关工作人员触发。
S102、获取各个客户的客户标识,并利用各个客户的客户标识及每个子公司的各个客户的交易量构建每个子公司的数据集。
其中,所述客户标识能够唯一确定一个客户。
在本实施例中,所述利用各个客户的客户标识及每个子公司的各个客户的交易量构建每个子公司的数据集,包括:
对于每个子公司,将各个客户的客户标识及对应的交易量分别作为一列构建数据表,所述子公司的数据集。
例如:对于子公司甲,该子公司甲包括客户01、客户03及客户04,对应的交易量分别为21、14及23,将客户标识表示为id,将交易量表示为value,则该子公司甲的数据集可以表示为:
S103、利用PSI(Private Set Intersection,隐私集合求交)算法对每两个子公司的数据集执行隐匿求交,得到每两个子公司的交集。
其中,所述PSI算法能够利用密码学算法在不泄露各方数据的情况下获得各方数据的交集,同时无法获取非交集数据的任何信息,避免造成数据泄露。
例如:子公司甲包括客户01、客户03及客户04,子公司乙包括客户02、客户03及客户05,子公司丙包括客户01、客户02及客户06,则子公司甲与子公司乙的交集为客户03,子公司乙与子公司丙的交集为客户02,子公司甲与子公司丙的交集为客户01。
S104、根据每两个子公司的交集对每个子公司的数据集进行拆分,得到每个子公司对应的交集数据集及独有数据集。
在本实施例中,所述根据每两个子公司的交集对每个子公司的数据集进行拆分,得到每个子公司对应的交集数据集及独有数据集,包括:
对于每个子公司的数据集,利用与其他子公司的数据集存在交集的客户标识及对应的交易量构建所述子公司的交集数据集;
利用与其他子公司的数据集不存在交集的客户标识及对应的交易量构建所述子公司的独有数据集。
例如:子公司甲包括客户01、客户03及客户04,子公司乙包括客户02、客户03及客户05,子公司丙包括客户01、客户02及客户06,则子公司甲中与其他子公司的数据集存在交集的为客户01及客户03,与其他子公司的数据集不存在交集的为客户04,则所述子公司甲的交集数据集中包括客户01、客户03及对应的交易量,所述子公司甲的独有数据集中包括客户04及对应的交易量。
S105、将每个子公司对应的交集数据集及独有数据集秘密共享至第一计算节点及第二计算节点。
其中,计算节点的数量可以为2个或者3个,在保证计算效果的同时也保证了计算效率。
在本实施例中,所述将每个子公司对应的交集数据集及独有数据集秘密共享至第一计算节点及第二计算节点,包括:
对于每个子公司对应的交集数据集及独有数据集中的任意数据集,获取该数据集中的每个交易量;
对每个交易量进行随机拆分,得到每个数据集拆分后的第一子数据集及第二子数据集;
将所述第一子数据集共享至所述第一计算节点,及将所述第二子数据集共享至所述第二计算节点。
其中,在进行随机拆分时,可以选择较大整数作为其中一个分片,另一个分片则为交易量与第一个分片的差,例如:对于客户01的交易量21,选择一个较大的随机数10作为其中一个分片,则另一个分片为21-10=11。
其中,拆分得到的分片的数量与计算节点的数量相同,当计算节点为两个时,则将数据量拆分为两个。
例如:对于子公司甲的数据集:
拆分后,可以得到第一子数据集:
以及,第二子数据集:
在上述实施例中,通过对数据进行随机拆分,将每个子公司对应的交集数据集及独有数据集秘密共享至第一计算节点及第二计算节点,使数据传输过程不泄露明文信息,提高了数据的安全性。
S106、基于多方安全计算(Secure Multi-party Computation,MPC)对所述第一计算节点接收到的第一共享分片及所述第二计算节点接收到的第二共享分片进行联合排序,得到所述第一计算节点的第一客户交易量排序分片及所述第二计算节点的第二客户交易量排序分片。
其中,对于多方安全计算,多个参与方均提供输入,在各方数据不暴露给其他参与方的情况下共同计算一个函数,最终可正确获得函数结果。
多方安全计算是在节点间可两两互相通信的网络中,多方共同执行算法协议以完成计算任务,在各方输入数据不泄露的情况下得到正确的计算结果。但实际中存在各种复杂的网络情况,安全算法难以实施。例如,不同机构间的网络难以互通,集团企业(即所述目标企业)中各家子公司之间的网络也不互通,网络结构复杂,难以完成算法执行所需的网络通信。同时多方安全计算的执行效率与参与方个数相关,当个数增大时,参与方之间的通信量增加,计算量增大,其算法执行效率会大大降低。
因此,针对上述问题,本实施例将多方安全计算与节点转发相结合,采用网络转发的方式实现不同节点之间的两两互通,从而实现MPC协议流程,实现网络不互通情况下的间接通信,并且,本实施例选择两个节点作为分布式网络中的计算节点,其他节点作为数据提供方将数据通过秘密共享的方式分发到计算节点,通过计算节点间运行多方计算算法以完成计算任务,不仅能够在网络不通的情况下利用多方安全计算,且保证了计算效率,实现了多方安全计算算法在异构网络中的多方执行。
本实施例解决了多方安全计算技术在实际场景中的应用问题,通过网络转发技术在MPC协议执行中的使用与计算节点代理计算模式的结合应用,解决了多方安全计算协议使用中的网络互通问题和算法执行效率问题。
S107、将所述第一客户交易量排序分片及所述第二客户交易量排序分片发送至预设接收方。
其中,所述预设接收方可以为预先约定的各个子公司中的任意子公司,或者,由于通常集团方有统计各个子公司的交易量等信息的需求,因此所述预设接收方也可以为各个子公司所属的集团方。
S108、在所述预设接收方根据所述第一客户交易量排序分片及所述第二客户交易量排序分片进行解密,得到所述目标企业的各个客户的客户交易量排序结果。
其中,任意客户交易量排序分片中不能得到数据原始明文的任何信息,只有获取到两份数据后才可以恢复明文信息。
在本实施例中,所述在所述预设接收方根据所述第一客户交易量排序分片及所述第二客户交易量排序分片进行解密,得到所述目标企业的各个客户的客户交易量排序结果,包括:
在所述预设接收方,对所述第一客户交易量排序分片及所述第二客户交易量排序分片按照客户标识计算对应的交易量的和,得到所述客户交易量排序结果;
其中,所述客户交易量排序结果中包括所述客户标识及对应的交易量。
解密后即可获得任意id对应的实际value值。
例如:当子公司甲中客户01的交易量为21,客户03的交易量为14,客户04的交易量为23,子公司乙中客户02的交易量为26,客户03的交易量为12,客户05的交易量为31,子公司丙中客户01的交易量为16,客户02的交易量为22,客户06的交易量为34时,则经过多方安全计算进行排序并解密后,得到的客户交易量排序结果中,客户的交易量由高到低分别为:客户02(交易量48)、客户01(交易量37)、客户06(交易量34)、客户05(交易量31)、客户03(交易量26)、客户04(交易量23)。
S109、根据所述客户交易量排序结果确定所述目标企业的重点客户。
在本实施例中,所述根据所述客户交易量排序结果确定所述目标企业的重点客户,包括:
根据所述客户交易量排序结果获取对应的交易量大于或者等于配置交易量的客户标识所对应的客户作为候选客户;
从所述候选客户中获取对应的交易量排在前预设位的客户作为所述重点客户。
其中,所述配置交易量及所述预设位可以进行自定义配置,以满足实际的业务需求。
在识别到重点客户后,即可针对这些重点客户进行针对性服务,并执行更优的维护策略,还可以对这些重点客户进行客户画像,以获取到具备哪些特征的客户具有更高的交易前景,并进行针对性地广告投放,提高获客率。
本实施例识别重点客户的过程中,结合PSI算法及多方安全计算进行多方联合隐私计算,不仅打破了数据孤岛问题,且促进了数据价值流通。隐私计算技术利用计算节点间的安全计算,保证计算过程中明文数据不出本地,计算过程不泄露明文信息,参与计算的各方最终只获得目标计算结果。并且,将PSI算法与节点转发的方式结合,实现了网络不互通情况下节点间的算法执行,降低网络打通的代价,在有更多节点接入时只需与中心转发节点进行连接即可,无需与其他参与方直接地打通网络连接。联合计算过程中,以计算节点代理的方式将多方计算的过程转化为两方计算,减少了计算过程中中间结果的通信量和节点的计算量,降低了对节点计算资源配置的要求。同时在网络结构中不需要各参与方(如各子公司等数据提供方)之间建立网络通信,降低了网络复杂性。
在本实施例中,所述利用PSI算法对每两个子公司的数据集执行隐匿求交后,所述方法还包括:
当所述目标企业对应的任意两个子公司的数据集间没有交集时,对每个子公司的各个客户的交易量进行直接排序,得到所述客户交易量排序结果。
在上述实施例中,对于没有交集的数据集,则可以直接进行排序,无需通过节点转发进行两两PSI过程。
在其他实施例中,对于统计总体占比情况、数据分布等场景,也可以利用本实施例中安全计算的方式,在此不赘述。
由以上技术方案可以看出,一方面,通过节点转发实现两两不互通节点的PSI,对目标企业的每两个子公司的数据集执行隐匿求交,使数据在不出本地的情况下执行交集运算,保护了数据隐私;另一方面,再结合多方安全计算,对网络不互通的各个子公司中客户的交易量进行联合排序,在各方输入数据不泄露的情况下得到客户交易量排序结果,并根据客户交易量排序结果确定目标企业的重点客户,以便后续对重点客户进行针对性维护。
本申请实施例还提供一种基于隐私计算的客户识别装置,该基于隐私计算的客户识别装置用于执行前述基于隐私计算的客户识别方法的任一实施例。具体地,请参阅图3,图3是本申请实施例提供的基于隐私计算的客户识别装置100的示意性框图。
其中,如图3所示,基于隐私计算的客户识别装置100包括获取单元101、构建单元102、运算单元103、拆分单元104、共享单元105、排序单元106、发送单元107、解密单元108、确定单元109。
其中,所述获取单元101,用于响应于对目标企业的重点客户识别指令,获取所述目标企业的网络不互通的多个子公司,及获取每个子公司的各个客户的交易量;
所述构建单元102,用于获取各个客户的客户标识,并利用各个客户的客户标识及每个子公司的各个客户的交易量构建每个子公司的数据集;
所述运算单元103,用于利用PSI算法对每两个子公司的数据集执行隐匿求交,得到每两个子公司的交集;
所述拆分单元104,用于根据每两个子公司的交集对每个子公司的数据集进行拆分,得到每个子公司对应的交集数据集及独有数据集;
所述共享单元105,用于将每个子公司对应的交集数据集及独有数据集秘密共享至第一计算节点及第二计算节点;
所述排序单元106,用于基于多方安全计算对所述第一计算节点接收到的第一共享分片及所述第二计算节点接收到的第二共享分片进行联合排序,得到所述第一计算节点的第一客户交易量排序分片及所述第二计算节点的第二客户交易量排序分片;
所述发送单元107,用于将所述第一客户交易量排序分片及所述第二客户交易量排序分片发送至预设接收方;
所述解密单元108,用于在所述预设接收方根据所述第一客户交易量排序分片及所述第二客户交易量排序分片进行解密,得到所述目标企业的各个客户的客户交易量排序结果;
所述确定单元109,用于根据所述客户交易量排序结果确定所述目标企业的重点客户。
由以上技术方案可以看出,本申请一方面,通过节点转发实现两两不互通节点的PSI,对目标企业的每两个子公司的数据集执行隐匿求交,使数据在不出本地的情况下执行交集运算,保护了数据隐私;另一方面,再结合多方安全计算,对网络不互通的各个子公司中客户的交易量进行联合排序,在各方输入数据不泄露的情况下得到客户交易量排序结果,并根据客户交易量排序结果确定目标企业的重点客户,以便后续对重点客户进行针对性维护。
上述基于隐私计算的客户识别装置可以实现为计算机程序的形式,该计算机程序可以在如图4所示的计算机设备上运行。
请参阅图4,图4是本申请实施例提供的计算机设备的示意性框图。该计算机设备400是服务器,也可以是服务器集群。服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
参阅图4,该计算机设备400包括通过装置总线401连接的处理器402、存储器和网络接口405,其中,存储器可以包括存储介质403和内存储器404。
该存储介质403可存储操作系统4031和计算机程序4032。该计算机程序4032被执行时,可使得处理器402执行基于隐私计算的客户识别方法。
该处理器402用于提供计算和控制能力,支撑整个计算机设备400的运行。
该内存储器404为存储介质403中的计算机程序4032的运行提供环境,该计算机程序4032被处理器402执行时,可使得处理器402执行基于隐私计算的客户识别方法。
该网络接口405用于进行网络通信,如提供数据信息的传输等。本领域技术人员可以理解,图4中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备400的限定,具体的计算机设备400可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
其中,所述处理器402用于运行存储在存储器中的计算机程序4032,以实现本申请实施例公开的基于隐私计算的客户识别方法。
本领域技术人员可以理解,图4中示出的计算机设备的实施例并不构成对计算机设备具体构成的限定,在其他实施例中,计算机设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。例如,在一些实施例中,计算机设备可以仅包括存储器及处理器,在这样的实施例中,存储器及处理器的结构及功能与图4所示实施例一致,在此不再赘述。
应当理解,在本申请实施例中,处理器402可以是中央处理单元 (CentralProcessing Unit,CPU),该处理器402还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路 (Application Specific IntegratedCircuit,ASIC)、现成可编程门阵列 (Field-Programmable Gate Array,FPGA) 或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
在本申请的另一实施例中提供计算机可读存储介质。该计算机可读存储介质可以为非易失性的计算机可读存储介质,也可以为易失性的计算机可读存储介质。该计算机可读存储介质存储有计算机程序,其中计算机程序被处理器执行时实现本申请实施例公开的基于隐私计算的客户识别方法。
需要说明的是,本案中所涉及到的数据均为合法取得。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的设备、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为逻辑功能划分,实际实现时可以有另外的划分方式,也可以将具有相同功能的单元集合成一个单元,例如多个单元或组件可以结合或者可以集成到另一个装置,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本申请实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备 ( 可以是个人计算机,后台服务器,或者网络设备等 ) 执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U 盘、移动硬盘、只读存储器 (ROM,Read-OnlyMemory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (9)

1.一种基于隐私计算的客户识别方法,其特征在于,包括:
响应于对目标企业的重点客户识别指令,获取所述目标企业的网络不互通的多个子公司,及获取每个子公司的各个客户的交易量;
获取各个客户的客户标识,并利用各个客户的客户标识及每个子公司的各个客户的交易量构建每个子公司的数据集;
利用PSI算法对每两个子公司的数据集执行隐匿求交,得到每两个子公司的交集;
根据每两个子公司的交集对每个子公司的数据集进行拆分,得到每个子公司对应的交集数据集及独有数据集;
将每个子公司对应的交集数据集及独有数据集秘密共享至第一计算节点及第二计算节点;
基于多方安全计算对所述第一计算节点接收到的第一共享分片及所述第二计算节点接收到的第二共享分片进行联合排序,得到所述第一计算节点的第一客户交易量排序分片及所述第二计算节点的第二客户交易量排序分片;
将所述第一客户交易量排序分片及所述第二客户交易量排序分片发送至预设接收方;
在所述预设接收方根据所述第一客户交易量排序分片及所述第二客户交易量排序分片进行解密,得到所述目标企业的各个客户的客户交易量排序结果;
根据所述客户交易量排序结果确定所述目标企业的重点客户;
所述将每个子公司对应的交集数据集及独有数据集秘密共享至第一计算节点及第二计算节点,包括:
对于每个子公司对应的交集数据集及独有数据集中的任意数据集,获取该数据集中的每个交易量;
对每个交易量进行随机拆分,得到每个数据集拆分后的第一子数据集及第二子数据集;
将所述第一子数据集共享至所述第一计算节点,及将所述第二子数据集共享至所述第二计算节点;
其中,所述第一子数据集为所述第一共享分片;所述第二子数据集为所述第二共享分片。
2.根据权利要求1所述的基于隐私计算的客户识别方法,其特征在于,所述利用各个客户的客户标识及每个子公司的各个客户的交易量构建每个子公司的数据集,包括:
对于每个子公司,将各个客户的客户标识及对应的交易量分别作为一列构建数据表,即所述子公司的数据集。
3.根据权利要求1所述的基于隐私计算的客户识别方法,其特征在于,所述根据每两个子公司的交集对每个子公司的数据集进行拆分,得到每个子公司对应的交集数据集及独有数据集,包括:
对于每个子公司的数据集,利用与其他子公司的数据集存在交集的客户标识及对应的交易量构建所述子公司的交集数据集;
利用与其他子公司的数据集不存在交集的客户标识及对应的交易量构建所述子公司的独有数据集。
4.根据权利要求1所述的基于隐私计算的客户识别方法,其特征在于,所述在所述预设接收方根据所述第一客户交易量排序分片及所述第二客户交易量排序分片进行解密,得到所述目标企业的各个客户的客户交易量排序结果,包括:
在所述预设接收方,对所述第一客户交易量排序分片及所述第二客户交易量排序分片按照客户标识计算对应的交易量的和,得到所述客户交易量排序结果;
其中,所述客户交易量排序结果中包括所述客户标识及对应的交易量。
5.根据权利要求1所述的基于隐私计算的客户识别方法,其特征在于,所述根据所述客户交易量排序结果确定所述目标企业的重点客户,包括:
根据所述客户交易量排序结果获取对应的交易量大于或者等于配置交易量的客户标识所对应的客户作为候选客户;
从所述候选客户中获取对应的交易量排在前预设位的客户作为所述重点客户。
6.根据权利要求1所述的基于隐私计算的客户识别方法,其特征在于,所述利用PSI算法对每两个子公司的数据集执行隐匿求交后,所述方法还包括:
当所述目标企业对应的任意两个子公司的数据集间没有交集时,对每个子公司的各个客户的交易量进行直接排序,得到所述客户交易量排序结果。
7.一种基于隐私计算的客户识别装置,其特征在于,包括:
获取单元,用于响应于对目标企业的重点客户识别指令,获取所述目标企业的网络不互通的多个子公司,及获取每个子公司的各个客户的交易量;
构建单元,用于获取各个客户的客户标识,并利用各个客户的客户标识及每个子公司的各个客户的交易量构建每个子公司的数据集;
运算单元,用于利用PSI算法对每两个子公司的数据集执行隐匿求交,得到每两个子公司的交集;
拆分单元,用于根据每两个子公司的交集对每个子公司的数据集进行拆分,得到每个子公司对应的交集数据集及独有数据集;
共享单元,用于将每个子公司对应的交集数据集及独有数据集秘密共享至第一计算节点及第二计算节点;
排序单元,用于基于多方安全计算对所述第一计算节点接收到的第一共享分片及所述第二计算节点接收到的第二共享分片进行联合排序,得到所述第一计算节点的第一客户交易量排序分片及所述第二计算节点的第二客户交易量排序分片;
发送单元,用于将所述第一客户交易量排序分片及所述第二客户交易量排序分片发送至预设接收方;
解密单元,用于在所述预设接收方根据所述第一客户交易量排序分片及所述第二客户交易量排序分片进行解密,得到所述目标企业的各个客户的客户交易量排序结果;
确定单元,用于根据所述客户交易量排序结果确定所述目标企业的重点客户;
所述共享单元,包括:
对于每个子公司对应的交集数据集及独有数据集中的任意数据集,获取该数据集中的每个交易量;
对每个交易量进行随机拆分,得到每个数据集拆分后的第一子数据集及第二子数据集;
将所述第一子数据集共享至所述第一计算节点,及将所述第二子数据集共享至所述第二计算节点;
其中,所述第一子数据集为所述第一共享分片;所述第二子数据集为所述第二共享分片。
8.一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6中任一项所述的基于隐私计算的客户识别方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行如权利要求1至6任一项所述的基于隐私计算的客户识别方法。
CN202310811761.4A 2023-07-04 2023-07-04 基于隐私计算的客户识别方法、装置、设备及介质 Active CN116522402B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310811761.4A CN116522402B (zh) 2023-07-04 2023-07-04 基于隐私计算的客户识别方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310811761.4A CN116522402B (zh) 2023-07-04 2023-07-04 基于隐私计算的客户识别方法、装置、设备及介质

Publications (2)

Publication Number Publication Date
CN116522402A CN116522402A (zh) 2023-08-01
CN116522402B true CN116522402B (zh) 2023-10-13

Family

ID=87392584

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310811761.4A Active CN116522402B (zh) 2023-07-04 2023-07-04 基于隐私计算的客户识别方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN116522402B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110851487A (zh) * 2018-07-30 2020-02-28 阿里巴巴集团控股有限公司 数据统计方法和装置
CN113438078A (zh) * 2021-08-26 2021-09-24 山东师范大学 多客户端交集数据计算过程中的隐私保护方法及系统
WO2022076605A1 (en) * 2020-10-07 2022-04-14 Visa International Service Association Secure and scalable private set intersection for large datasets
CN115292729A (zh) * 2022-07-22 2022-11-04 深圳市洞见智慧科技有限公司 一种隐私保护的多方数据处理方法、装置以及设备
CN115544559A (zh) * 2022-09-23 2022-12-30 深圳前海环融联易信息科技服务有限公司 数据排序处理方法、装置、计算机设备、介质和程序产品
CN116049909A (zh) * 2023-01-28 2023-05-02 腾讯科技(深圳)有限公司 联邦特征工程中的特征筛选方法、装置、设备及存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110851487A (zh) * 2018-07-30 2020-02-28 阿里巴巴集团控股有限公司 数据统计方法和装置
WO2022076605A1 (en) * 2020-10-07 2022-04-14 Visa International Service Association Secure and scalable private set intersection for large datasets
CN113438078A (zh) * 2021-08-26 2021-09-24 山东师范大学 多客户端交集数据计算过程中的隐私保护方法及系统
CN115292729A (zh) * 2022-07-22 2022-11-04 深圳市洞见智慧科技有限公司 一种隐私保护的多方数据处理方法、装置以及设备
CN115544559A (zh) * 2022-09-23 2022-12-30 深圳前海环融联易信息科技服务有限公司 数据排序处理方法、装置、计算机设备、介质和程序产品
CN116049909A (zh) * 2023-01-28 2023-05-02 腾讯科技(深圳)有限公司 联邦特征工程中的特征筛选方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN116522402A (zh) 2023-08-01

Similar Documents

Publication Publication Date Title
US11824768B2 (en) Verification of data processes in a network of computing resources
Angel et al. Unobservable communication over fully untrusted infrastructure
US11477135B2 (en) Verification of data processes in a network of computing resources
CN108900533B (zh) 一种共享数据隐私保护方法、系统、终端及介质
CN111556120B (zh) 基于区块链的数据处理方法、装置、存储介质及设备
EP3260979B1 (en) Verification of data processes in a network of computing resources
CN112073196B (zh) 业务数据处理方法、装置、电子设备及存储介质
CN115242371B (zh) 差分隐私保护的集合交集及其基数计算方法、装置及系统
Liu et al. Same initial states attack in Yang et al.’s quantum private comparison protocol and the improvement
CN114584294A (zh) 不经意分散排列方法及装置
CN105959105A (zh) 一种数据传输方法及设备
CN112600830B (zh) 业务数据处理方法、装置、电子设备及存储介质
CN116522402B (zh) 基于隐私计算的客户识别方法、装置、设备及介质
CN110598427B (zh) 数据的处理方法、系统和存储介质
CN117033012A (zh) 接口调用黑名单的查询方法及装置、电子设备及存储介质
US9929860B1 (en) Methods and apparatus for generalized password-based secret sharing
CN115544562A (zh) 一种数据求交方法、装置、系统、电子设备及存储介质
CN113452513B (zh) 密钥分发方法、装置和系统
CN110798529B (zh) 一种数据处理方法、区块链节点设备以及计算机存储介质
CN113254989A (zh) 目标数据的融合方法、装置和服务器
CN112598843A (zh) 投票数据的处理方法和装置及存储介质
CN116975887A (zh) 基于隐私计算的风险预警方法、装置、设备及存储介质
CN116910798A (zh) 基于区块链的隐私面部数据处理方法、装置及存储介质
Nguyen et al. Private Link Exchange over Social Graphs
Jin et al. Pwop: Intrusion-tolerant and privacy-preserving sensor fusion

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant