CN117454435B - 基于秘密多项式的跨数据库统计方法、系统及电子设备 - Google Patents
基于秘密多项式的跨数据库统计方法、系统及电子设备 Download PDFInfo
- Publication number
- CN117454435B CN117454435B CN202311776546.1A CN202311776546A CN117454435B CN 117454435 B CN117454435 B CN 117454435B CN 202311776546 A CN202311776546 A CN 202311776546A CN 117454435 B CN117454435 B CN 117454435B
- Authority
- CN
- China
- Prior art keywords
- candidate
- attribute
- database
- candidate attributes
- attributes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000007619 statistical method Methods 0.000 title claims abstract description 38
- 238000000034 method Methods 0.000 claims abstract description 44
- 238000012896 Statistical algorithm Methods 0.000 claims description 35
- 238000011084 recovery Methods 0.000 claims description 21
- 238000004364 calculation method Methods 0.000 claims description 18
- 239000011159 matrix material Substances 0.000 claims description 15
- 238000004891 communication Methods 0.000 claims description 8
- 238000012795 verification Methods 0.000 claims description 6
- 238000004422 calculation algorithm Methods 0.000 claims description 5
- 238000013507 mapping Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 abstract description 11
- 238000007792 addition Methods 0.000 description 13
- 230000006870 function Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- -1 electricity Substances 0.000 description 2
- 230000005611 electricity Effects 0.000 description 2
- 230000011664 signaling Effects 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 208000027691 Conduct disease Diseases 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 239000003245 coal Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000008399 tap water Substances 0.000 description 1
- 235000020679 tap water Nutrition 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6227—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database where protection concerns the structure of data, e.g. records, types, queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/64—Protecting data integrity, e.g. using checksums, certificates or signatures
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Security & Cryptography (AREA)
- Bioethics (AREA)
- General Health & Medical Sciences (AREA)
- Computer Hardware Design (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提供一种基于秘密多项式的跨数据库统计方法、系统及电子设备,涉及网络安全技术领域。为实现跨数据库统计,采用了秘密多项式的方式,将统计结果作为最终秘密多项式的常数项,通过秘密分享的方式基于数据库以及安全服务器确定最终的秘密多项式,并通过解析秘密多项式中的常数项确定跨数据库的统计结果,从而实现了跨数据库的属性统计。此外,在该过程中,安全服务器仅获取拆分后的部分数据,无法从局部共享结果中得知整体的共享结果。而各个数据库持有者直接获取最终结果,无法得知其它数据库的情况,保护了原始数据。
Description
技术领域
本申请涉及网络安全技术领域,具体涉及一种基于秘密多项式的跨数据库统计方法、系统及电子设备。
背景技术
随着科技的飞速发展,企事业机构不断积累大量数据,形成了规模庞大的数据库,这些数据库内含大量敏感信息,包括商业计划、金融机密、客户个人数据、医疗数据、研发成果等。一方面,这些数据库能通过数据共享和计算极大地解放数据价值,创造社会财富;另一方面,信息技术不断发展带来了更多信息安全的隐患,这反过来加剧了信息交流的障碍。
由此,如何在保护隐私数据的情况下实现跨数据库的数据共享是本领域技术人员亟待解决的技术问题。
发明内容
有鉴于此,本申请实施例提供了一种基于秘密多项式的跨数据库统计方法、系统及电子设备,基于秘密多项式执行秘密共享以解决前述问题。
第一方面,本申请提供一种基于秘密多项式的跨数据库统计方法,跨数据库统计方法应用于基于秘密多项式的跨数据库统计系统的多个数据库,基于秘密多项式的跨数据库统计系统还包括多个安全服务器,对于多个数据库中的任意一个,跨数据库统计方法包括:确定多个候选属性以及多个候选属性的属性值集合,其中,属性值集合包括与各个候选属性对应的属性值。确定素数值、恢复数/>并确定基数集合/>,其中,基数集合包括多个小于素数值的自然数:
,/>,/>为多个安全服务器的数量。基于基数集合以及属性值集合确定各个候选属性的秘密共享多项式,其中,秘密共享多项式:
,/>为在第i个数据库中第k个候选属性的属性值,j为与安全服务器序号有关的变量。基于秘密共享多项式确定多个候选属性中各个候选属性的共享值集合,其中,共享值集合包括与多个安全服务器对应的多个共享值,共享值为对应的安全服务器序号带入秘密共享多项式的结果值。将多个候选属性对应的多个共享值集合发送到多个安全服务器,以使多个安全服务器采用预设统计算法基于各个数据库中与多个候选属性对应的多个共享值确定多个候选属性的代表元集合,其中,代表元集合包括与多个候选属性对应的对应代表元,代表元至少包括对应候选属性在各个数据库中的各个共享值基于预设统计算法的计算结果,预设统计算法至少包括加法运算、常数乘法运算中的至少一种。确定多个安全服务器中各个安全服务器的多个候选属性的代表元集合,以确定多个候选属性中各个候选属性的多个代表元。基于各个候选属性的多个代表元进行多项式恢复,将恢复后各个候选属性对应的多项式中的常数项作为对应候选属性的属性值统计结果。
第二方面,本申请提供一种基于秘密多项式的跨数据库统计方法,跨数据库统计方法应用于基于秘密多项式的跨数据库统计系统的多个安全服务器,基于秘密多项式的跨数据库统计系统还包括多个数据库,对于多个安全服务器中的任意一个,跨数据库统计方法包括:确定多个候选属性,其中,多个数据库包括多个候选属性的属性值集合,属性值集合包括与各个候选属性对应的属性值。确定多个数据库中各个数据库与多个候选属性对应的多个共享值,其中,各个数据库包括各个候选属性的共享值集合,共享值集合包括与多个安全服务器对应的多个共享值,共享值为对应的安全服务器序号带入秘密共享多项式:
的结果值。/>为在第i个数据库中第k个候选属性的属性值,j为与安全服务器序号有关的变量,基数集合包括多个小于素数值的自然数:
。基于各个数据库中与多个候选属性对应的多个共享值确定多个候选属性的代表元集合,其中,代表元集合包括与多个候选属性对应的对应代表元,代表元至少包括对应候选属性在各个数据库中的各个共享值基于预设统计算法的计算结果,预设统计算法至少包括加法运算、常数乘法运算中的至少一种。将多个候选属性的代表元集合发送到多个数据库,以使多个数据库基于各个候选属性的多个代表元进行多项式恢复,将恢复后各个候选属性对应的多项式中的常数项作为对应候选属性的属性值统计结果。
第三方面,本申请提供一种基于秘密多项式的跨数据库统计方法,跨跨数据库统计方法应用于基于秘密多项式的跨数据库统计系统的多个数据库以及多个安全服务器,跨数据库统计方法包括:多个数据库确定多个候选属性以及多个候选属性的属性值集合,其中,属性值集合包括与各个候选属性对应的属性值。多个数据库确定素数值、恢复数/>并确定基数集合/>,其中,基数集合包括多个小于素数值的自然数:
,/>,/>为多个安全服务器的数量。多个数据库基于基数集合以及属性值集合确定各个候选属性的秘密共享多项式,其中,秘密共享多项式:
,/>为在第i个数据库中第k个候选属性的属性值,j为与安全服务器序号有关的变量。多个数据库基于秘密共享多项式确定多个候选属性中各个候选属性的共享值集合,其中,共享值集合包括与多个安全服务器对应的多个共享值,共享值为对应的安全服务器序号带入秘密共享多项式的结果值。多个数据库将多个候选属性对应的多个共享值集合发送到多个安全服务器。多个安全服务器确定多个候选属性以及多个数据库中各个数据库与多个候选属性对应的多个共享值。多个安全服务器采用预设统计算法基于各个数据库中与多个候选属性对应的多个共享值确定多个候选属性的代表元集合,其中,代表元集合包括与多个候选属性对应的对应代表元,代表元至少包括对应候选属性在各个数据库中的各个共享值基于预设统计算法的计算结果,预设统计算法至少包括加法运算、常数乘法运算中的至少一种。多个安全服务器将多个候选属性的代表元集合发送到多个数据库。多个数据库确定多个安全服务器中各个安全服务器的多个候选属性的代表元集合,以确定多个候选属性中各个候选属性的多个代表元。多个数据库基于各个候选属性的多个代表元进行多项式恢复,将恢复后各个候选属性对应的多项式中的常数项作为对应候选属性的属性值统计结果。
第四方面,本申请提供一种基于秘密多项式的跨数据库统计系统,跨数据库统计系统的多个数据库以及多个安全服务器:多个数据库用于:确定多个候选属性以及多个候选属性的属性值集合,其中,属性值集合包括与各个候选属性对应的属性值。确定素数值、恢复数/>并确定基数集合/>,其中,基数集合包括多个小于素数值的自然数:
,/>,/>为多个安全服务器的数量。基于基数集合以及属性值集合确定各个候选属性的秘密共享多项式,其中,秘密共享多项式
,/>为在第i个数据库中第k个候选属性的属性值,j为与安全服务器序号有关的变量。基于秘密共享多项式确定多个候选属性中各个候选属性的共享值集合,其中,共享值集合包括与多个安全服务器对应的多个共享值,共享值为对应的安全服务器序号带入秘密共享多项式的结果值。将多个候选属性对应的多个共享值集合发送到多个安全服务器。多个安全服务器用于:确定多个候选属性以及多个数据库中各个数据库与多个候选属性对应的多个共享值。采用预设统计算法基于各个数据库中与多个候选属性对应的多个共享值确定多个候选属性的代表元集合,其中,代表元集合包括与多个候选属性对应的对应代表元,代表元至少包括对应候选属性在各个数据库中的各个共享值基于预设统计算法的计算结果,预设统计算法至少包括加法运算、常数乘法运算中的至少一种。将多个候选属性的代表元集合发送到多个数据库。多个数据库还用于:确定多个安全服务器中各个安全服务器的多个候选属性的代表元集合,以确定多个候选属性中各个候选属性的多个代表元。基于各个候选属性的多个代表元进行多项式恢复,将恢复后各个候选属性对应的多项式中的常数项作为对应候选属性的属性值统计结果。
第五方面,本申请提供一种电子设备。电子设备包括:处理器以及用于存储可执行指令的存储器。其中,可执行指令被处理器执行时,实现第一方面或第二方面所述的基于秘密多项式的跨数据库统计方法。
由此,基于本申请提供的一种基于秘密多项式的跨数据库统计方法、系统及电子设备。为实现跨数据库统计,采用了秘密多项式的方式,将统计结果作为最终秘密多项式的常数项,通过秘密分享的方式基于数据库以及安全服务器确定最终的秘密多项式,并通过解析秘密多项式中的常数项确定跨数据库的统计结果,从而实现了跨数据库的属性统计。此外,在该过程中,安全服务器仅获取拆分后的部分数据,无法从局部共享结果中得知整体的共享结果。而各个数据库持有者直接获取最终结果,无法得知其它数据库的情况,保护了原始数据。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1是本申请一些实施例提供的跨数据库统计系统的应用场景图。
图2是本申请一些实施例提供的跨数据库统计方法的信令图。
图3是本申请一些实施例提供的候选属性有效性确定方法的示例性流程图。
图4是本申请一些实施例提供的安全服务器侧的跨数据库统计方法的示例性流程图。
图5是本申请一些实施例提供的数据库侧的跨数据库统计方法的示例性流程图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
申请概述
在数据库的数据共享中,跨数据库统计是一种重要的共享手段。其中,跨数据库统计可以是采用求并运算或求交运算实来筛选得到这些数据库中属性值的公共部分。具体地,可以识别各个数据库中属性值的交集或并集。
以属性值交集为例,在实际应用中,可以包括如下实例:不同的通信运营商需要针对共同用户推出联合产品,因此需要事先挖掘公共用户列表。不同的医疗机构进行病症研讨项目,则首先需要筛选出共有的病例;金融服务商对企业或个人投资偏好进行筛选,需要找出某个目标群体的共同特征。两个跨国机构需要找出同在两国注册的黑名单客户进行集中处理,等等。如果将这些应用场景简单地以双方公开数据库的方式处理,则交互各方都难以避免数据泄露的困境,无法在未建立信任的基础上保护己方数据库的安全。
本申请主要涉及跨数据库的数据统计,其中,跨数据库的数据统计一般为相同变量的变量加法(或引入常数乘法)。例如,在居民生活领域中自来水公司、电力公司与燃气公司各自持有大量用户数据,这些公司的公共居民用户在水电燃气上的总支出(即对水电燃气指出的跨数据库叠加)指向了政府需要的居民生活数据。再例如,在大宗商品领域的某一大类中有若干生产企业,那么作为这一大类商品生产企业的公共生产品类决定了这一大类消费中的核心品类,这些品类关联的销售总额、生产总值等对于政府和国家具有极其重要的意义。
在这样的应用场景中如果简单地以公开各买方购买记录(或平台收集各方购买记录)的方式处理,则会对买方的信息安全造成很大的隐患:尤其是在大宗商品市场、股票市场等大额市场中,买方的消费行为涉及到自身的商业机密,因此即使是在传统的交易市场中也会强调对买方的购买记录非常严格的保护和监管。在数据交集上做数据分析计算的现有手段仍主要停留在平台收集数据的形式上,目前没有对用户数据采取任何关于隐私保护的技术手段。
为实现以保护隐私数据为目的的跨数据库数据统计,本申请提供一种基于秘密多项式的跨数据库统计方法、系统及电子设备。为实现跨数据库统计,采用了秘密多项式的方式,将统计结果作为最终秘密多项式的常数项,通过秘密分享的方式基于数据库以及安全服务器确定最终的秘密多项式,并通过解析秘密多项式中的常数项确定跨数据库的统计结果,从而实现了跨数据库的属性统计。此外,在该过程中,安全服务器仅获取拆分后的部分数据,无法从局部共享结果中得知整体的共享结果。而各个数据库持有者直接获取最终结果,无法得知其它数据库的情况,保护了原始数据。
需要说明的是,本申请的技术方案中,跨数据库的数据统计一般为变量加法运算(即参数叠加)或引入常数乘法的变量加法(如加权求和、求平均值等)。对于变量乘法,也可以参见本申请的技术方案,采用乘法群的方式,将其转化为指数的多项式加法。
为进一步对跨数据库统计方法的技术细节进行说明,下面将结合图1-图5对本申请提供的跨数据库统计方法进行描述,以具体介绍本申请的各种非限制性实施例。
示例性应用场景
为进一步说明跨数据库统计的实际应用场景,本申请提供一种跨数据库统计系统的应用场景图。其中,本申请所述的跨数据库统计实际上是一种基于求交或求并构建的数据共享运算,可以根据实际应用场景调整名称。
如图1所示,在跨数据库统计系统100可以包括数据库集合110(即多个数据库)以及安全服务器集合120(即多个安全服务器)。
在本申请中,进行属性统计的对象可以记作有限取值集合SA,该有限取值集合SA中可以包括有限取值集合包括多个选项和/或选项的可选组合。各个选项/可选组合可以作为后续进行数据统计的候选属性。
在一些实施例中,数据库对有限取值集合SA中的各个候选属性的选取情况可以通过属性值集合进行描述。其中,属性值集合可以包括与各个候选属性对应的属性值,属性值为1或0并反映对应的候选属性在当前数据库中存在情况。由此,各个数据库对各个候选属性的选取情况可以表征为|SA|项的数值向量,|SA|表示有限取值集合的模长(即多个候选属性的数量)。其中,数值向量一般可以反映对应候选属性的持有数量。例如,各类煤炭的储存量、账户金额等。
数据库集合110可以包括m个数据库并记作。数据库可以存储有对与前述SA的多个候选属性的属性值集合。
安全服务器集合120可以包括n个安全服务器并记作。安全服务器负责进行秘密共享值的存储与计算,各服务器之间不进行除协议之外的通信。
在一些实施例中,跨数据库统计系统100还可以包括公示方130,公示方130可以对属性统计过程中涉及的参数进行配置。例如,公示方130可以配置前述有限取值集合SA以使各个数据库的参数信息转化为基于有限取值集合SA的属性值集合。再例如,公示方130还可以公示部分重要参数,如后续的素数值、恢复数、基数集合等参数,从而保证方法的顺利执行。
基于本申请提供的跨数据库统计方法,前述跨数据库统计系统100在执行相关方法的过程中:
多个数据库用于:
确定多个候选属性以及多个候选属性的属性值集合,其中,属性值集合包括与各个候选属性对应的属性值。
确定素数值、恢复数/>并确定基数集合/>,其中,基数集合包括多个小于素数值的自然数/>,/>,/>为多个安全服务器的数量。
基于基数集合以及属性值集合确定各个候选属性的秘密共享多项式,其中,秘密共享多项式,/>为在第i个数据库中第k个候选属性的属性值,j为与安全服务器序号有关的变量。
基于秘密共享多项式确定多个候选属性中各个候选属性的共享值集合,其中,共享值集合包括与多个安全服务器对应的多个共享值,共享值为对应的安全服务器序号带入秘密共享多项式的结果值。
将多个候选属性对应的多个共享值集合发送到多个安全服务器。
多个安全服务器用于:
确定多个候选属性以及多个数据库中各个数据库与多个候选属性对应的多个共享值。
采用预设统计算法基于各个数据库中与多个候选属性对应的多个共享值确定多个候选属性的代表元集合,其中,代表元集合包括与多个候选属性对应的对应代表元,代表元至少包括对应候选属性在各个数据库中的各个共享值基于预设统计算法的计算结果,预设统计算法至少包括加法运算、常数乘法运算中的至少一种。
将多个候选属性的代表元集合发送到多个数据库。
多个数据库还用于:
确定多个安全服务器中各个安全服务器的多个候选属性的代表元集合,以确定多个候选属性中各个候选属性的多个代表元。
基于各个候选属性的多个代表元进行多项式恢复,将恢复后各个候选属性对应的多项式中的常数项作为对应候选属性的属性值统计结果。
在一些实施例中,前述数据库以及安全服务器也可以基于电子设备构建。则对应的电子设备可以包括处理器以及用于存储处理器可执行指令的存储器。其中,处理器用于执行本申请实施例提供的任意一种的基于秘密多项式的跨数据库统计方法。
示例性跨数据库统计方法
图2是本申请一些实施例提供的跨数据库统计方法的信令图。其中,跨数据库统计方法可以由数据库以及安全服务器执行。
在一些实施例中,在执行P200之前,可以预设并公示本次P200过程中的各项参数,并限制多个安全服务器之间不进行本次属性统计要求之外的通信。其中,参数预设可以由公示方执行,通信的限制可以由通信性质执行。
如图2所示,在跨数据库统计方法的执行过程P200中,可以包括如下步骤:
S201、多个数据库确定多个候选属性以及多个候选属性的属性值集合。
参见前述图1的相关描述,属性值集合包括与各个候选属性对应的属性值,属性值为该数据库对该候选属性的实际取值。
在一些实施例中,S210可以理解为各个数据库确定对有限取值集合SA的取值,以确定对应的属性值集合。其中,对于第i个数据库,其属性值集合可以表现为如下私有列表:
。其中,/>可以反映第i个数据库对第k个候选属性的属性值(即数值取值)。
在一些实施例中,上述候选属性可以基于有限取值集合的预设置换确定。具体地,在确定属性值集合前,可以先确定有限取值集合SA的公开置换,以将中的各个选项转化为多个候选属性,其中,公开置换为有限取值集合与多个候选属性之间的唯一映射。具体可以为如下公式:
。
其中,对于的各个选项/组合,可以基于其映射结果的大小顺序作为候选属性,以确定属性值集合。即在属性值集合中对于第k个属性值/>,其取值反映有限取值集合SA中对应的选项的数值情况。
S202、多个数据库确定素数值、恢复数/>并确定基数集合/>。
其中,基数集合包括多个小于素数值的自然数,/>,/>为多个安全服务器的数量。
在一些实施例中,前述素数值可以用于形成循环群,并通过取余操作减小数据传输大小。基数集合可以用于构建秘密多项式。其中,前述素数值/>以及基数集合的数量(或尺寸)t可以由公示方确定,具体技术集合的选取可以由数据库执行。即对于第i个数据库,其随机选择/>个/>中的整数/>,以作为基数集合。
S203、多个数据库基于基数集合以及属性值集合确定各个候选属性的秘密共享多项式。
其中,秘密共享多项式可以呈现为如下公式:
。其中,j为与安全服务器序号有关的变量。
在一些实施例中,前述秘密分享多项式可以基于预设函数构建,即可以基于前述基数集合构建一个j为变量的t-1项的多项式,其常数项设置为x。则该多项式可以为j与x的函数,具体可以为:
。再将/>代入前述函数,即可得到前述秘密共享多项式。
S204、多个数据库基于秘密共享多项式确定多个候选属性中各个候选属性的共享值集合。
其中,共享值集合包括与多个安全服务器对应的多个共享值,共享值为对应的安全服务器序号带入秘密共享多项式的结果值。即将变量j根据各个安全服务器的序号进行取值即可。则第i个数据库的就第k个候选属性的共享值集合可以表征为:
。
S205、多个数据库将多个候选属性对应的多个共享值集合发送到多个安全服务器。
在一些实施例中,基于前述共享值的构建方式,各个数据库需要与各个服务器进行传输以传输对应的数据。以第i个数据库为例,其需要向第j个安全服务器发送的数据为:
。其中,/>为多个候选属性的数量。
S206、多个安全服务器确定多个候选属性以及多个数据库中各个数据库与多个候选属性对应的多个共享值。
在一些实施例中,各个安全服务器在接收到各个数据库的共享值后可以生成一个矩阵。具体地,对于第j个安全服务器,各个数据库与多个候选属性对应的多个共享值可以表征为阶的整数矩阵:
。
S207、多个安全服务器采用预设统计算法基于各个数据库中与多个候选属性对应的多个共享值确定多个候选属性的代表元集合。
其中,代表元集合包括与多个候选属性对应的对应代表元,代表元至少包括对应候选属性在各个数据库中的各个共享值基于预设统计算法的计算结果,预设统计算法至少包括加法运算、常数乘法运算中的至少一种。
在一些实施例中,可以直接采用加法运算,则此时,对于第j个安全服务器,第k个候选属性的代表元基于如下公式确定:
。其中,/>为第j个安全服务器,第k个候选属性的代表元。
在一些实施例中,还可以引入常数乘法。例如,可以对各个数据库的各个属性值配置权重,各个数据库的权重能表征为阶的整数矩阵:
。其中,/>为第i个数据库就第k个候选属性的权重,
基于以上权重,可以实现加权求和。即对于第j个安全服务器,第k个候选属性的代表元基于如下公式确定:
。其中,/>为第j个安全服务器,第k个候选属性的代表元。
在一些实施例中,引入的常数项也可以不呈现前述矩阵的形式,例如,可以为一个恒定的数值。例如,前述权重可以均配置为1/m,从而实现对平均数的计算。在一些实施例中,考虑到后续步骤可能引入有效性评估,则前述权重还可以配置为该候选数据中有效的数据库数量分之一,从而计算有效数据库的平均数。
S208、多个安全服务器将多个候选属性的代表元集合发送到多个数据库。
与前述S206类似,各个安全服务器也需要将数据传输给数据库。其对各个数据库的传输内容相同,均为前述代表元集合。
S209、多个数据库确定多个安全服务器中各个安全服务器的多个候选属性的代表元集合,以确定多个候选属性中各个候选属性的多个代表元。
在一些实施例中,各个数据库在接收到各个安全服务器的代表元后可以生成一个矩阵。具体地,对于数据库,各个安全服务器与多个候选属性对应的多个代表元能表征为阶的整数矩阵:
。
S210、多个数据库基于各个候选属性的多个代表元进行多项式恢复,将恢复后各个候选属性对应的多项式中的常数项作为对应候选属性的属性值统计结果。
在一些实施例中,在前述阶的整数矩阵,每行可以理解为基于安全服务器的序号以及统计结果的多项式。例如,对于第k个候选属性,可以单独提取为如下向量:
。基于前述/>的计算过程,该向量中的各个值可以理解为,并对每个j依次取值后的结果。/>为该属性的统计结果,可以作为该多项式的常数项。
由此,可以基于前述阶的整数矩阵各行构建多项式,通过推导多项式的常数值确定该属性的统计结果。
在一些实施例中,可以通过拉格朗日插值算法确定常数项。即对于各个候选属性的多个代表元选取个代表元进行拉格朗日插值,确定插值多项式,其中,插值多项式的项数为/>。确定插值多项式的常数项,并作为对应候选属性的属性值统计结果。
在一些实施例中,前述步骤P200还可以包括检查属性值统计结果是否准确的步骤,即P200还包括:
S211、对于各个候选属性的多个代表元重新选取至少部分不同个代表元进行拉格朗日插值,确定验证多项式。
其中,插值多项式的项数为。
S212、确定验证多项式的常数项并对插值多项式进行验证。
其中,S212重新确定的常数项与前述S210确定的一致或误差在预设范围内,可以认为验证通过。反之,则可以认为验证不通过。
由此,基于上述提供的一种基于秘密多项式的跨数据库统计方法,为实现跨数据库统计,采用了秘密多项式的方式,将统计结果作为最终秘密多项式的常数项,通过秘密分享的方式基于数据库以及安全服务器确定最终的秘密多项式,并通过解析秘密多项式中的常数项确定跨数据库的统计结果,从而实现了跨数据库的属性统计。此外,在该过程中,安全服务器仅获取拆分后的部分数据,无法从局部共享结果中得知整体的共享结果。而各个数据库持有者直接获取最终结果,无法得知其它数据库的情况,保护了原始数据。
示例性候选属性有效性确定方法
在一些实施例中,在进行数据统计前可以对候选数据的有效性进行评估。其中,候选属性的有效性可以指前述候选属性反映其数值取值的属性集合外,还可以包括有效性集合。有效性集合的取值可以反映候选属性的有效性。当候选属性有效时,对该属性的取值进行统计,反之,则不处理。
在一些实施例中,候选属性的有效性可以基于候选属性本身的性质确定。例如,当数据库中不存在该候选属性时,则可以不进行统计。在一些实施例中,候选属性的有效性还可以基于数据库自身的设置而确定。例如,本申请所涉及的跨数据库数据统计用于确定线上交易的出货量时,不参与本次/该类目的统计对象,可以将对应数据库中的有效性集合设置为无效。
在一些实施例中,候选属性的有效性可以基于相关技术确定。例如,当有效性集合的取值为1是反映参与统计,0时反映不参与统计。对于属性求交(即所有数据库的有效性取值均为有效才执行统计)时,可以采用与本申请同日递交的数据对齐方法确定有效性集合。对于属性求并(对只要数据库中存在有效的取值就进行统计),可以采用与本申请同日递交的数据库属性统计方法确定有效性集合。
在一些实施例中,可以将确定的有效性集合引入本方法,以确定反映是否进行统计的代表元(图3)。如图3所示,P300可以包括如下步骤:
S310、确定多个候选属性还包括有效性集合。
其中,对于各个候选属性的有效性集合可以记作:
。其中,/>反映第k个候选属性的有效性,当/>时,对第k个候选属性进行数据统计。当/>,不对第k个候选属性进行数据统计。
关于S310的执行方法可以参见前述内容。
S320、基于恢复数并确定公用基数集合/>。
其中,基数集合包括多个小于素数值的自然数:
。
S330、基于公用基数集合以及属性值集合确定各个候选属性的有效性共享多项式。
其中,秘密共享多项式,j为与安全服务器序号有关的变量。
S340、基于有效性共享多项式确定多个候选属性中各个候选属性的有效性共享值集合。
其中,有效性共享值集合包括与多个安全服务器对应的多个有效性共享值,有效性共享值为对应的安全服务器序号带入有效性共享多项式的结果值。
S350、将多个候选属性对应的多个共享值集合发送到多个安全服务器,以使代表元反映对应候选属性的有效性。
其中,S320~S340可以理解为基于有效性集合的秘密多项式构建,可以参见前述P200的相关内容。
在S350中,可以将有效性引入代表元,从而使代表元还能反映候选属性是否有效。其中,S350可以基于乘法实现,以使代表元解析出的常数项为0时,候选属性无效。非0时候选属性有效。而避免了挑选候选属性的过程。
在前述S350的过程中,对于第j个安全服务器,各个数据库与多个候选属性对应的多个有效性共享值能表征为维的整数向量:
。
考虑到前述整数向量,可以在代表元确定过程中引入有效性,即对于第j个安全服务器,第k个候选属性的代表元基于如下公式确定:
其中,为第j个安全服务器,第k个候选属性的代表元。/>为第j个安全服务器,第k个候选属性的各个共享值基于预设统计算法的计算结果。
由此,前述可以理解为常数,以使解析出的常数项为/>。从而可以根据该解析结果是否为0,反映对应的候选属性是否参与。/>
安全服务器侧的跨数据库统计方法
图4是本申请一些实施例提供安全服务器侧的跨数据库统计方法的示例性流程图。其中,图4所示的方法可以由安全服务器执行。
如图4所示,P400可以包括如下步骤:
S410、确定多个候选属性以及多个候选属性的属性值集合。
其中,属性值集合包括与各个候选属性对应的属性值。
S420、确定素数值、恢复数/>并确定基数集合/>。
其中,基数集合包括多个小于素数值的自然数,/>,/>为多个安全服务器的数量。
S430、基于基数集合以及属性值集合确定各个候选属性的秘密共享多项式。
其中,秘密共享多项式,/>为在第i个数据库中第k个候选属性的属性值,j为与安全服务器序号有关的变量。
S440、基于秘密共享多项式确定多个候选属性中各个候选属性的共享值集合。
其中,共享值集合包括与多个安全服务器对应的多个共享值,共享值为对应的安全服务器序号带入秘密共享多项式的结果值。
S450、将多个候选属性对应的多个共享值集合发送到多个安全服务器,以使多个安全服务器采用预设统计算法基于各个数据库中与多个候选属性对应的多个共享值确定多个候选属性的代表元集合。
其中,代表元集合包括与多个候选属性对应的对应代表元,代表元至少包括对应候选属性在各个数据库中的各个共享值基于预设统计算法的计算结果,预设统计算法至少包括加法运算、常数乘法运算中的至少一种。
S460、确定多个安全服务器中各个安全服务器的多个候选属性的代表元集合,以确定多个候选属性中各个候选属性的多个代表元。
S470、基于各个候选属性的多个代表元进行多项式恢复,将恢复后各个候选属性对应的多项式中的常数项作为对应候选属性的属性值统计结果。
关于前述P400的技术细节可以参见前述P200的相关描述,在此不做赘述。
数据库侧的跨数据库统计方法
图5是本申请一些实施例提供数据库侧的跨数据库统计方法的示例性流程图。其中,图5所示的方法可以由数据库执行。
如图5所示,P500可以包括如下步骤:
S510、确定多个候选属性。
其中,多个数据库包括多个候选属性的属性值集合,属性值集合包括与各个候选属性对应的属性值。
S520、确定多个数据库中各个数据库与多个候选属性对应的多个共享值。
其中,各个数据库包括各个候选属性的共享值集合,共享值集合包括与多个安全服务器对应的多个共享值,共享值为对应的安全服务器序号带入秘密共享多项式的结果值。/>为在第i个数据库中第k个候选属性的属性值,j为与安全服务器序号有关的变量,基数集合包括多个小于素数值的自然数/>。
S530、基于各个数据库中与多个候选属性对应的多个共享值确定多个候选属性的代表元集合。
其中,代表元集合包括与多个候选属性对应的对应代表元,代表元至少包括对应候选属性在各个数据库中的各个共享值基于预设统计算法的计算结果,预设统计算法至少包括加法运算、常数乘法运算中的至少一种。
S540、将多个候选属性的代表元集合发送到多个数据库,以使多个数据库基于各个候选属性的多个代表元进行多项式恢复,将恢复后各个候选属性对应的多项式中的常数项作为对应候选属性的属性值统计结果。
关于前述P500的技术细节可以参见前述P200的相关描述,在此不做赘述。
上述所有可选技术方案,可采用任意结合形成本申请的可选实施例,在此不再一一赘述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序校验码的介质。
需要说明的是,在本申请的描述中,术语“第一”、“第二”、“第三”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本申请的描述中,除非另有说明,“多个”的含义是两个或两个以上。
以上所述仅为本申请的较佳实施例而已,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换等,均应包含在本申请的保护范围之内。
Claims (14)
1.一种基于秘密多项式的跨数据库统计方法,其特征在于,所述跨数据库统计方法应用于基于秘密多项式的跨数据库统计系统的多个数据库,所述基于秘密多项式的跨数据库统计系统还包括多个安全服务器,对于所述多个数据库中的任意一个,所述跨数据库统计方法包括:
确定多个候选属性以及所述多个候选属性的属性值集合,其中,所述属性值集合包括与各个候选属性对应的属性值;
确定素数值、恢复数/>并确定基数集合/>,其中,所述基数集合包括多个小于所述素数值的自然数/>,/>,/>为所述多个安全服务器的数量;
基于所述基数集合以及属性值集合确定各个候选属性的秘密共享多项式,其中,秘密共享多项式,/>为在第i个数据库中第k个候选属性的属性值,j为与安全服务器序号有关的变量;
基于所述秘密共享多项式确定所述多个候选属性中各个候选属性的共享值集合,其中,所述共享值集合包括与所述多个安全服务器对应的多个共享值,所述共享值为对应的安全服务器序号带入所述秘密共享多项式的结果值;
将所述多个候选属性对应的多个共享值集合发送到所述多个安全服务器,以使所述多个安全服务器采用预设统计算法基于各个数据库中与所述多个候选属性对应的多个共享值确定所述多个候选属性的代表元集合,其中,所述代表元集合包括与所述多个候选属性对应的对应代表元,所述代表元至少包括对应候选属性在各个数据库中的各个共享值基于所述预设统计算法的计算结果,所述预设统计算法至少包括加法运算、常数乘法运算中的至少一种;
确定所述多个安全服务器中各个安全服务器的所述多个候选属性的代表元集合,以确定所述多个候选属性中各个候选属性的多个代表元;
基于各个候选属性的多个代表元进行多项式恢复,将恢复后各个候选属性对应的多项式中的常数项作为对应候选属性的属性值统计结果。
2.根据权利要求1所述的跨数据库统计方法,其特征在于,所述基于各个候选属性的多个代表元进行多项式恢复,将恢复后各个候选属性对应的多项式中的常数项作为对应候选属性的属性值统计结果,包括:
对于各个候选属性的多个代表元选取个代表元进行拉格朗日插值,确定插值多项式,其中,所述插值多项式的项数为/>;
确定所述插值多项式的常数项,并作为对应候选属性的属性值统计结果。
3.根据权利要求2所述的跨数据库统计方法,其特征在于,所述方法还包括:
对于各个候选属性的多个代表元重新选取至少个不同代表元进行拉格朗日插值,确定验证多项式,其中,所述插值多项式的项数为/>;
确定所述验证多项式的常数项并对所述插值多项式进行验证。
4.根据权利要求2所述的跨数据库统计方法,其特征在于,当所述预设统计算法被配置为加法运算,对于第j个安全服务器,各个数据库与所述多个候选属性对应的多个共享值能表征为阶的整数矩阵:
其中,为所述多个候选属性的数量,/>为所述多个数据库的数量;
对于第j个安全服务器,第k个候选属性的代表元基于如下公式确定:
其中,为第j个安全服务器,第k个候选属性的代表元;
各个安全服务器与所述多个候选属性对应的多个代表元能表征为阶的整数矩阵:
其中,所述拉格朗日插值能对各行的任意个代表元执行。
5.根据权利要求2所述的跨数据库统计方法,其特征在于,当所述预设统计算法被配置为加权加法运算,对于第j个安全服务器,各个数据库与所述多个候选属性对应的多个共享值能表征为阶的整数矩阵:
其中,为所述多个候选属性的数量,/>为所述多个数据库的数量;
各个数据库的权重能表征为阶的整数矩阵:
其中,为第i个数据库中第k个候选属性的权重,
对于第j个安全服务器,第k个候选属性的代表元基于如下公式确定:
其中,为第j个安全服务器,第k个候选属性的代表元;
各个安全服务器与所述多个候选属性对应的多个代表元能表征为阶的整数矩阵:
其中,所述拉格朗日插值能对各行的任意个代表元执行。
6.根据权利要求2所述的跨数据库统计方法,其特征在于,所述方法还包括:
确定所述多个候选属性还包括有效性集合,其中,/>反映第k个候选属性的有效性,当/>时,对第k个候选属性进行数据统计;当/>,不对第k个候选属性进行数据统计;
基于恢复数并确定公用基数集合/>,其中,所述基数集合包括多个小于所述素数值的自然数/>;
基于所述公用基数集合以及属性值集合确定各个候选属性的有效性共享多项式,其中,秘密共享多项式,j为与安全服务器序号有关的变量;
基于所述有效性共享多项式确定所述多个候选属性中各个候选属性的有效性共享值集合,其中,所述有效性共享值集合包括与所述多个安全服务器对应的多个有效性共享值,所述有效性共享值为对应的安全服务器序号带入所述有效性共享多项式的结果值;
将所述多个候选属性对应的多个共享值集合发送到所述多个安全服务器,以使所述代表元反映对应候选属性的有效性。
7.根据权利要求6所述的跨数据库统计方法,其特征在于,对于第j个安全服务器,各个数据库与所述多个候选属性对应的多个共享值能表征为阶的整数矩阵:
其中,为所述多个候选属性的数量,/>为所述多个数据库的数量;
对于第j个安全服务器,各个数据库与所述多个候选属性对应的多个有效性共享值能表征为维的整数向量:
对于第j个安全服务器,第k个候选属性的代表元基于如下公式确定:
其中,为第j个安全服务器,第k个候选属性的代表元;/>为第j个安全服务器,第k个候选属性的各个共享值基于预设统计算法的计算结果;
各个安全服务器与所述多个候选属性对应的多个代表元能表征为阶的整数矩阵:
其中,所述拉格朗日插值能对各行的任意个代表元执行。
8.根据权利要求4所述的跨数据库统计方法,其特征在于,所述常数项为0时,反映对应的候选属性不进行数据统计,所述常数项为非0值时,反映对应的候选属性进行数据统计且数据统计结果为对应的常数项的取值;
有效性集合基于数据对齐算法确定。
9.根据权利要求1所述的跨数据库统计方法,其特征在于,所述确定多个候选属性包括:
确定待合并的有限取值集合,其中,所述有限取值集合包括多个选项和/或选项的可选组合;
确定公开置换,以确定所述多个候选属性,其中,所述公开置换为所述有限取值集合与所述多个候选属性之间的唯一映射。
10.根据权利要求1所述的跨数据库统计方法,其特征在于,所述方法还包括:
预设并公示本次属性统计的各项参数;
限制所述多个安全服务器之间不进行本次属性统计要求之外的通信。
11.一种基于秘密多项式的跨数据库统计方法,其特征在于,所述跨数据库统计方法应用于基于秘密多项式的跨数据库统计系统的多个安全服务器,所述基于秘密多项式的跨数据库统计系统还包括多个数据库,对于所述多个安全服务器中的任意一个,所述跨数据库统计方法包括:
确定多个候选属性,其中,所述多个数据库包括所述多个候选属性的属性值集合,所述属性值集合包括与各个候选属性对应的属性值;
确定所述多个数据库中各个数据库与所述多个候选属性对应的多个共享值,其中,各个数据库包括各个候选属性的共享值集合,所述共享值集合包括与所述多个安全服务器对应的多个共享值,所述共享值为对应的安全服务器序号带入秘密共享多项式的结果值;/>为在第i个数据库中第k个候选属性的属性值,j为与安全服务器序号有关的变量,基数集合包括多个小于素数值的自然数;
基于各个数据库中与所述多个候选属性对应的多个共享值确定所述多个候选属性的代表元集合,其中,所述代表元集合包括与所述多个候选属性对应的对应代表元,所述代表元至少包括对应候选属性在各个数据库中的各个共享值基于预设统计算法的计算结果,所述预设统计算法至少包括加法运算、常数乘法运算中的至少一种;
将所述多个候选属性的代表元集合发送到所述多个数据库,以使所述多个数据库基于各个候选属性的多个代表元进行多项式恢复,将恢复后各个候选属性对应的多项式中的常数项作为对应候选属性的属性值统计结果。
12.一种基于秘密多项式的跨数据库统计方法,其特征在于,所述跨数据库统计方法应用于基于秘密多项式的跨数据库统计系统的多个数据库以及多个安全服务器,所述跨数据库统计方法包括:
所述多个数据库确定多个候选属性以及所述多个候选属性的属性值集合,其中,所述属性值集合包括与各个候选属性对应的属性值;
所述多个数据库确定素数值、恢复数/>并确定基数集合/>,其中,所述基数集合包括多个小于所述素数值的自然数/>,/>,/>为所述多个安全服务器的数量;
所述多个数据库基于所述基数集合以及属性值集合确定各个候选属性的秘密共享多项式,其中,秘密共享多项式,/>为在第i个数据库中第k个候选属性的属性值,j为与安全服务器序号有关的变量;
所述多个数据库基于所述秘密共享多项式确定所述多个候选属性中各个候选属性的共享值集合,其中,所述共享值集合包括与所述多个安全服务器对应的多个共享值,所述共享值为对应的安全服务器序号带入所述秘密共享多项式的结果值;
所述多个数据库将所述多个候选属性对应的多个共享值集合发送到所述多个安全服务器;
所述多个安全服务器确定多个候选属性以及所述多个数据库中各个数据库与所述多个候选属性对应的多个共享值;
所述多个安全服务器采用预设统计算法基于各个数据库中与所述多个候选属性对应的多个共享值确定所述多个候选属性的代表元集合,其中,所述代表元集合包括与所述多个候选属性对应的对应代表元,所述代表元至少包括对应候选属性在各个数据库中的各个共享值基于所述预设统计算法的计算结果,所述预设统计算法至少包括加法运算、常数乘法运算中的至少一种;
所述多个安全服务器将所述多个候选属性的代表元集合发送到所述多个数据库;
所述多个数据库确定所述多个安全服务器中各个安全服务器的所述多个候选属性的代表元集合,以确定所述多个候选属性中各个候选属性的多个代表元;
所述多个数据库基于各个候选属性的多个代表元进行多项式恢复,将恢复后各个候选属性对应的多项式中的常数项作为对应候选属性的属性值统计结果。
13.一种基于秘密多项式的跨数据库统计系统,其特征在于,所述跨数据库统计系统的多个数据库以及多个安全服务器:
所述多个数据库用于:
确定多个候选属性以及所述多个候选属性的属性值集合,其中,所述属性值集合包括与各个候选属性对应的属性值;
确定素数值、恢复数/>并确定基数集合/>,其中,所述基数集合包括多个小于所述素数值的自然数/>,/>,/>为所述多个安全服务器的数量;
基于所述基数集合以及属性值集合确定各个候选属性的秘密共享多项式,其中,秘密共享多项式,/>为在第i个数据库中第k个候选属性的属性值,j为与安全服务器序号有关的变量;
基于所述秘密共享多项式确定所述多个候选属性中各个候选属性的共享值集合,其中,所述共享值集合包括与所述多个安全服务器对应的多个共享值,所述共享值为对应的安全服务器序号带入所述秘密共享多项式的结果值;
将所述多个候选属性对应的多个共享值集合发送到所述多个安全服务器;
所述多个安全服务器用于:
确定多个候选属性以及所述多个数据库中各个数据库与所述多个候选属性对应的多个共享值;
采用预设统计算法基于各个数据库中与所述多个候选属性对应的多个共享值确定所述多个候选属性的代表元集合,其中,所述代表元集合包括与所述多个候选属性对应的对应代表元,所述代表元至少包括对应候选属性在各个数据库中的各个共享值基于所述预设统计算法的计算结果,所述预设统计算法至少包括加法运算、常数乘法运算中的至少一种;
将所述多个候选属性的代表元集合发送到所述多个数据库;
所述多个数据库还用于:
确定所述多个安全服务器中各个安全服务器的所述多个候选属性的代表元集合,以确定所述多个候选属性中各个候选属性的多个代表元;
基于各个候选属性的多个代表元进行多项式恢复,将恢复后各个候选属性对应的多项式中的常数项作为对应候选属性的属性值统计结果。
14.一种电子设备,其特征在于,所述电子设备包括:
处理器;
用于存储所述处理器可执行指令的存储器,
其中,所述处理器用于执行上述权利要求1-12中任意一项所述基于秘密多项式的跨数据库统计方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311776546.1A CN117454435B (zh) | 2023-12-22 | 2023-12-22 | 基于秘密多项式的跨数据库统计方法、系统及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311776546.1A CN117454435B (zh) | 2023-12-22 | 2023-12-22 | 基于秘密多项式的跨数据库统计方法、系统及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117454435A CN117454435A (zh) | 2024-01-26 |
CN117454435B true CN117454435B (zh) | 2024-03-15 |
Family
ID=89591532
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311776546.1A Active CN117454435B (zh) | 2023-12-22 | 2023-12-22 | 基于秘密多项式的跨数据库统计方法、系统及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117454435B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107968780A (zh) * | 2017-11-20 | 2018-04-27 | 上海海事大学 | 一种移动云存储共享数据的隐私保护方法 |
CN108763940A (zh) * | 2018-05-15 | 2018-11-06 | 华南农业大学 | 一种基于秘密共享的可检验数据库加密检索方法及系统 |
CN110610105A (zh) * | 2019-09-25 | 2019-12-24 | 郑州轻工业学院 | 一种云环境下基于秘密共享的三维模型文件的认证方法 |
CN110830473A (zh) * | 2019-11-08 | 2020-02-21 | 浙江工业大学 | 一种基于属性加密的多授权访问控制系统及方法 |
CN115455488A (zh) * | 2022-11-15 | 2022-12-09 | 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) | 基于复制秘密共享的密态数据库查询方法及装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4996757B1 (ja) * | 2011-03-29 | 2012-08-08 | 株式会社東芝 | 秘密分散システム、装置及びプログラム |
EP3317998B1 (en) * | 2015-07-02 | 2021-04-28 | Leading Software Limited | Resilient secret sharing cloud based architecture for data vault |
-
2023
- 2023-12-22 CN CN202311776546.1A patent/CN117454435B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107968780A (zh) * | 2017-11-20 | 2018-04-27 | 上海海事大学 | 一种移动云存储共享数据的隐私保护方法 |
CN108763940A (zh) * | 2018-05-15 | 2018-11-06 | 华南农业大学 | 一种基于秘密共享的可检验数据库加密检索方法及系统 |
CN110610105A (zh) * | 2019-09-25 | 2019-12-24 | 郑州轻工业学院 | 一种云环境下基于秘密共享的三维模型文件的认证方法 |
CN110830473A (zh) * | 2019-11-08 | 2020-02-21 | 浙江工业大学 | 一种基于属性加密的多授权访问控制系统及方法 |
CN115455488A (zh) * | 2022-11-15 | 2022-12-09 | 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) | 基于复制秘密共享的密态数据库查询方法及装置 |
Non-Patent Citations (1)
Title |
---|
基于加法共享的可验证秘密再分发协议;于佳 等;计算机研究与发展;20060128;第43卷(第01期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN117454435A (zh) | 2024-01-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11625730B2 (en) | Synthetic online entity detection | |
Yenisey et al. | Perceived security determinants in e-commerce among Turkish university students | |
US11886598B2 (en) | System and method for scalable cyber-risk assessment of computer systems | |
EP3465523B1 (en) | Secure collection of sensitive data | |
KR20180127506A (ko) | 동형적으로 암호화된 데이터의 유효성 확인 및 이에 대한 연산을 수행하기 위한 시스템 및 방법 | |
CN112200382B (zh) | 一种风险预测模型的训练方法和装置 | |
Johri et al. | Exploring customer awareness towards their cyber security in the Kingdom of Saudi Arabia: A study in the era of banking digital transformation | |
WO2022237175A1 (zh) | 图数据的处理方法、装置、设备、存储介质及程序产品 | |
Engwanda | Factors affecting mobile banking adoption in the United States | |
CN117454435B (zh) | 基于秘密多项式的跨数据库统计方法、系统及电子设备 | |
Liu | Research on consumers' personal information security and perception based on digital twins and Internet of Things | |
Revathi et al. | Profile similarity communication matching approaches for detection of duplicate profiles in online social network | |
CN108696530B (zh) | 一种在线加密数据安全评估方法和装置 | |
Batmetan et al. | Understanding Cyber Crime Behavior on E-Commerce Application Users | |
CN117454436B (zh) | 基于乘法群的数据对齐方法、系统及电子设备 | |
US11374753B2 (en) | System and method for selective transparency for public ledgers | |
CN117454434B (zh) | 基于秘密共享的数据库属性统计方法、系统及电子设备 | |
Bogdanov et al. | K-Anonymity Versus PSI3 for Depersonalization and Security Assessment of Large Data Structures | |
US11755571B2 (en) | Customized data scanning in a heterogeneous data storage environment | |
CN117807631A (zh) | 基于多方安全计算的在线评估方法及系统 | |
Lang et al. | Application of Personal Information Privacy Protection Based on Machine Learning Algorithm | |
Rajakumari | Secured Banking Authentication by Pixel Correlation for Online Shopping | |
Cheang et al. | Online payment scam: What have caused it? | |
Pendino | BLOCKCHAIN NETWORK BEHAVIOR-BASED ANOMALY DETECTION | |
Kudu et al. | Fuzzy Analytic Hierarchy Process-based Learner Profile Sensitive Attributes Determination in Learning Management System |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |