CN114817997A

CN114817997A - 一种基于秘密分享的共享数据随机排序方法

Info

Publication number: CN114817997A
Application number: CN202210721855.8A
Authority: CN
Inventors: 王玥; 吴泽成; 刘文博; 马煜翔; 冯黎明; 邢冰
Original assignee: Lanxiang Zhilian Hangzhou Technology Co ltd
Current assignee: Lanxiang Zhilian Hangzhou Technology Co ltd
Priority date: 2022-06-24
Filing date: 2022-06-24
Publication date: 2022-07-29
Anticipated expiration: 2042-06-24
Also published as: CN114817997B

Abstract

本发明公开了一种基于秘密分享的共享数据随机排序方法。它包括以下步骤：原始数据向量X以和共享分片存储于第一方和第二方，第一方持有共享分片向量X₀，第二方持有共享分片向量X₁；第一方将1至n这n个数值随机排列生成随机向量f₀，第二方将1至n这n个数值随机排列生成随机向量f₁；第一方、第二方依据共享分片向量X₀、随机向量f₁进行一次置换洗牌操作，第一方得到向量b₀，第二方得到向量P₁；第一方、第二方依据共享分片向量X₁、向量P₁、随机向量f₀、向量b₀进行一次置换洗牌操作，第二方得到向量d₁，第一方得到向量P₀，P₀(i)=X(f₁(f₀(i)))‑d₁(i))。本发明将共享数据去标识化，共享数据后续可直接参与机器学习，降低了数据主体风险，计算和通信开销都较低。

Description

一种基于秘密分享的共享数据随机排序方法

技术领域

本发明涉及数据共享技术领域，尤其涉及一种基于秘密分享的共享数据随机排序方法。

背景技术

随着个人信息保护法的实施，传统的机器学习面临监管挑战，隐私保护机器学习开始兴起。隐私保护机器学习的核心问题包括如何使用户id与用户数据脱钩，即用户数据的去标识化。去标识化是指个人信息经过处理，使其在不借助额外信息的情况下无法识别特定自然人的过程。

秘密分享的共享数据常用于金融风控场景的联邦学习。目前，发起方、参与方为了进行联邦学习，会先进行求交操作，找出交集的用户id，然后将自身持有的交集的用户id对应的特征数据以加性秘密分享的方式共享给另一方，这样双方就会知道每个共享数据与哪个用户id对应，即没有将用户数据去标识化，数据主体存在泄密风险。

发明内容

本发明为了解决上述技术问题，提供了一种基于秘密分享的共享数据随机排序方法，其将共享数据去标识化，共享数据后续可直接参与机器学习，降低了数据主体风险，计算和通信开销都较低，便于实现大规模商用。

为了解决上述问题，本发明采用以下技术方案予以实现：

本发明的一种基于秘密分享的共享数据随机排序方法，原始数据向量X以和共享分片存储于第一方和第二方，第一方持有共享分片向量X₀，第二方持有共享分片向量X₁，原始数据向量X中的数据个数为n，其特征在于，包括以下步骤：

S1：第一方将1至n这n个数值随机排列生成随机向量f₀，第二方将1至n这n个数值随机排列生成随机向量f₁；

S2：第一方、第二方依据共享分片向量X₀、随机向量f₁进行一次置换洗牌操作，第一方得到向量b₀，第二方得到向量P₁，所述向量b₀与向量P₁的和为共享分片向量X₀按照随机向量f₁重新排序后的结果；

S3：第一方、第二方依据共享分片向量X₁、向量P₁、随机向量f₀、向量b₀进行一次置换洗牌操作，第二方得到向量d₁，第一方得到向量P₀，所述向量d₁与向量P₀的和为原始数据向量X按照向量f₁(f₀)重新排序后的结果，所述向量f₁(f₀)为随机向量f₁按照随机向量f₀重新排序后的结果。

在本方案中，初始时，原始数据向量X通过某些隐私计算组件拆分为加性秘密分享的两个共享分片向量X₀、X₁，第一方持有共享分片向量X₀，第二方持有共享分片向量X₁，X={X(1), X(2),……X(n)}，X₀={X₀(1), X₀(2),……X₀(n)}，X₁={X₁(1), X₁(2),……X₁(n)}，X(i)=X₀(i)+X₁(i)，1≤i≤n，此时，共享分片向量X₀、X₁中的数据分片与用户ID还是绑定的，例如：原始数据向量X中的数据X(1)对应的用户ID为1，当数据X(1)被拆分为共享分片向量X₀中的X₀(1)、共享分片向量X₁中的X₁(1)后，X₀(1)对应的用户ID还是1，X₁(1)对应的用户ID还是1，即共享数据与原用户ID依然是绑定的，没有脱钩，当第一方、第二方将共享分片向量X₀与共享分片向量X₁相加后就可以还原出原始数据向量X。

接着，第一方将1至n这n个数值随机排列生成随机向量f₀，f₀={f₀(1), f₀(2),……f₀(n)}，第二方将1至n这n个数值随机排列生成随机向量f₁，f₁={f₁(1), f₁(2),……f₁(n)}。第一方、第二方依据共享分片向量X₀、随机向量f₁进行一次置换洗牌操作，第一方得到向量b₀，b₀={b₀(1),b₀(2),……b₀(n)}，第二方得到向量P₁，P₁={P₁(1), P₁(2),……P₁(n)}，P₁(i)=X₀(f₁(i))-b₀(i)；第一方、第二方依据共享分片向量X₁、向量P₁、随机向量f₀、向量b₀进行一次置换洗牌操作，第二方得到向量d₁，d₁={d₁(1),d₁(2),……d₁(n)}，第一方得到向量P₀，P₀={P₀(1), P₀(2),……P₀(n)}，P₀(i)=X(f₁(f₀(i)))-d₁(i)。

共享分片向量X₀、共享分片向量X₁经过上述方法置换洗牌后，最终，第一方持有向量P₀、第二方持有向量d₁，第一方、第二方将向量P₀、向量d₁相加后得到向量X(f₁(f₀(i)))，即得到了将原始数据向量X重新排序后的向量X(f₁(f₀(i)))，由于，第一方不知道随机向量f₁，第二方不知道随机向量f₀，所以双方都无法还原出向量X(f₁(f₀(i)))与原始数据向量X之间的顺序对应关系，一般用于机器学习的数据是非常多的，存在大量的重复数据，所以通过本方法随机排序后，第一方、第二方只能共同持有原始数据向量X内的数据，但都无法还原出原始数据向量X的顺序，即无法推导出原始数据向量X内的数据与哪个用户ID对应，将数据与用户ID实现了脱钩，降低了数据主体风险。

本方法的计算复杂度是n²，由于本方法采用的是加减运算，复杂度系数更小，实际计算需求会少，而通信量仅为茫然可穿刺矩阵（opv）传输的部分为nlog₂n，当n=10000时，数据规模也仅有14万，综合性能优，所以本方法计算和通信开销都较低，便于实现大规模商用。

第一方、第二方可直接使用重新随机排序后的向量P₀、向量d₁进行金融风控场景的联邦学习，还可配合解密出向量X(f₁(f₀(i)))内的一些数据，使用X(f₁(f₀(i)))内的一些数据进行求均值、和值等运算进行数据分析，由于X(f₁(f₀(i))) 与原始数据向量X之间的顺序对应关系第一方、第二方都无法知道，X(f₁(f₀(i)))内的数据一般都有几万甚至几百万个，存在大量的重复数据，所以第一方、第二方无法知道X(f₁(f₀(i)))内的数据与用户ID的对应关系，从而保护了用户隐私。

作为优选，所述步骤S2包括以下步骤：

S21：第一方生成n×n的茫然可穿刺矩阵D1，对茫然可穿刺矩阵D1的每一列元素求和得到每一列元素对应的求和值，所有求和值构成向量a₀，a₀={a₀(1),a₀(2),……a₀(n)}，a₀(i)表示第i列元素对应的求和值，对茫然可穿刺矩阵D1的每一行元素求和得到每一行元素对应的求和值，所有求和值的负数构成向量b₀，b₀={b₀(1),b₀(2),……b₀(n)}，b₀(i)表示第i行元素对应的求和值的负数；

S22：第一方、第二方依据n选n-1的不经意传输协议、随机向量f₁内的数值将第一方的茫然可穿刺矩阵D1的每一行元素发送到第二方，第二方得到茫然可穿刺矩阵D1每一行除了缺位元素之外的其他所有元素，将缺位元素记为0，从而得到n×n的缺位矩阵E；

S23：第二方对缺位矩阵E的每一列元素求和得到每一列元素对应的求和值，所有求和值构成向量a₁，a₁={a₁(1),a₁(2),……a₁(n)}，a₁(i)表示第i列元素对应的求和值，对缺位矩阵E的每一行元素求和得到每一行元素对应的求和值，所有求和值的负数构成向量b₁，b₁={b₁(1),b₁(2),……b₁(n)}，b₁(i)表示第i行元素对应的求和值的负数；

S24：第一方将共享分片向量X₀、向量a₀相加计算出向量G₀，G₀={G₀(1),G₀(2),……G₀(n)}，G₀(i)=X₀(i)+a₀(i)，第一方将向量G₀发送给第二方；

S25：第二方根据向量G₀、随机向量f₁、向量a₁、向量b₁计算出向量P₁，P₁={P₁(1), P₁(2),……P₁(n)}，

P₁(i)=G₀(f₁(i))-a₁(f₁(i))-b₁(i)=X₀(f₁(i))+a₀(f₁(i))-a₁(f₁(i))-b₁(i)=X₀(f₁(i))-b₀(i)。

第一方、第二方依据n选n-1的不经意传输协议、随机向量f₁内的第i个数值f₁(i)将第一方的茫然可穿刺矩阵D1的第i行元素发送到第二方，第二方得到茫然可穿刺矩阵D1第i行除了第f₁(i)个元素之外的其他所有元素，第f₁(i)个元素为缺位元素，将缺位元素记为0。

由于a₀(f₁(i))-a₁(f₁(i))的值就是缺位矩阵E的第f₁(i)列的缺位元素原先的数值，第f₁(i)列的缺位元素就是缺位矩阵E第i行的第f₁(i)个元素，则a₀(f₁(i))-a₁(f₁(i))-b₁(i)的值就是b₀(i)的负数，即a₀(f₁(i))-a₁(f₁(i))-b₁(i)=-b₀(i)，所以，

作为优选，所述步骤S22中n×n的缺位矩阵E为：

，

缺位矩阵E的第i行的缺位元素为

，

表示第i行的第f₁(i)个元素，f₁(i) 表示随机向量f₁内的第i个数值，1≤i≤n。

作为优选，所述步骤S23中计算第i列元素对应的求和值a₁(i)的公式如下：

，1≤j≤n，

所述步骤S23中计算第i行元素对应的求和值的负数b₁(i)的公式如下：

。

作为优选，所述步骤S3包括以下步骤：

S31：第二方生成n×n的茫然可穿刺矩阵D2，对茫然可穿刺矩阵D2的每一列元素求和得到每一列元素对应的求和值，所有求和值构成向量c₁，c₁={c₁(1),c₁(2),……c₁(n)}，c₁(i)表示第i列元素对应的求和值，对茫然可穿刺矩阵D2的每一行元素求和得到每一行元素对应的求和值，所有求和值的负数构成向量d₁，d₁={d₁(1),d₁(2),……d₁(n)}，d₁(i)表示第i行元素对应的求和值的负数；

S32：第一方、第二方依据n选n-1的不经意传输协议、随机向量f₀内的数值将第二方的茫然可穿刺矩阵D2的每一行元素发送到第一方，第一方得到茫然可穿刺矩阵D2每一行除了缺位元素之外的其他所有元素，将缺位元素记为0，从而得到n×n的缺位矩阵F；

S33：第一方对缺位矩阵F的每一列元素求和得到每一列元素对应的求和值，所有求和值构成向量c₀，c₀={c₀(1),c₀(2),……c₀(n)}，c₀(i)表示第i列元素对应的求和值，对缺位矩阵F的每一行元素求和得到每一行元素对应的求和值，所有求和值的负数构成向量d₀，d₀={d₀(1),d₀(2),……d₀(n)}，d₀(i)表示第i行元素对应的求和值的负数；

S34：第二方根据向量P₁、共享分片向量X₁、随机向量f₁、向量c₁计算出向量G₁，G₁={G₁(1),G₁(2),……G₁(n)}，

G₁(i)=P₁(i)+X₁(f₁(i))+c₁(i)=X₀(f₁(i))-b₀(i)+X₁(f₁(i))+c₁(i)=X(f₁(i))-b₀(i)+c₁(i)，

第二方将向量G₁发送给第一方；

S35：第一方根据向量G₁、随机向量f₀、向量c₀、向量d₀、向量b₀计算出向量P₀，P₀={P₀(1), P₀(2),……P₀(n)}，

P₀(i)=G₁(f₀(i))-c₀(f₀(i))-d₀(i)-b₀(f₀(i))=X(f₁(f₀(i)))-b₀(f₀(i))+c₁(f₀(i))-c₀(f₀(i))-d₀(i)-b₀(f₀(i))=X(f₁(f₀(i)))-d₁(i)；

最终，第一方持有向量P₀，第二方持有向量d₁。

第一方、第二方依据n选n-1的不经意传输协议、随机向量f₀内的第i个数值f₀(i)将第二方的茫然可穿刺矩阵D2的第i行元素发送到第一方，第一方得到茫然可穿刺矩阵D2第i行除了第f₀(i)个元素之外的其他所有元素，第f₀(i)个元素为缺位元素，将缺位元素记为0。

由于c₁(f₀(i))-c₀(f₀(i)) 的值就是缺位矩阵F的第f₀(i)列的缺位元素原先的数值，第f₀(i)列的缺位元素就是缺位矩阵F第i行的第f₀(i)个元素，则c₁(f₀(i))-c₀(f₀(i))-d₀(i)的值就是d₁(i)的负数，即c₁(f₀(i))-c₀(f₀(i))-d₀(i)=-d₁(i)，另外第一方还持有向量b₀、随机向量f₀，则第一方知道b₀(f₀(i))的数值，所以P₀(i)=G₁(f₀(i))-c₀(f₀(i))-d₀(i)-b₀(f₀(i))=X(f₁(f₀(i)))-b₀(f₀(i))+c₁(f₀(i))-c₀(f₀(i))-d₀(i)-b₀(f₀(i))=X(f₁(f₀(i)))-d₁(i)。

作为优选，所述步骤S32中n×n的缺位矩阵F为：

，

缺位矩阵F的第i行的缺位元素为

，

表示第i行的第f₀(i)个元素，f₀(i) 表示随机向量f₀内的第i个数值，1≤i≤n。

作为优选，所述步骤S33中计算第i列元素对应的求和值c₀(i)的公式如下：

，1≤j≤n，

所述步骤S33中计算第i行元素对应的求和值的负数d₀(i) 的公式如下：

。

本发明的有益效果是：将共享数据去标识化，共享数据后续可直接参与机器学习，降低了数据主体风险，计算和通信开销都较低，便于实现大规模商用。

附图说明

图1是实施例的流程图；

图2是举例的原始数据向量X以及共享分片向量X₀、X₁的关系图；

图3是随机向量f₀、随机向量f₁的数据表；

图4是茫然可穿刺矩阵D1、向量a₀、向量b₀的关系图；

图5是缺位矩阵E、向量a₁、向量b₁的关系图；

图6是向量P₁的数据表；

图7是茫然可穿刺矩阵D2、向量c₁、向量d₁的关系图；

图8是缺位矩阵F、向量c₀、向量d₀的关系图；

图9是向量P₀、向量d₁以及复合结果X(f₁(f₀(i)))的关系图；

图10是始数据向量X、复合结果X(f₁(f₀(i)))的关系图。

具体实施方式

下面通过实施例，并结合附图，对本发明的技术方案作进一步具体的说明。

实施例：本实施例的一种基于秘密分享的共享数据随机排序方法，如图1所示，原始数据向量X以和共享分片存储于第一方和第二方，X={X(1), X(2),……X(n)}，第一方持有共享分片向量X₀，X₀={X₀(1), X₀(2),……X₀(n)}，第二方持有共享分片向量X₁，X₁={X₁(1),X₁(2),……X₁(n)}，X(i)=X₀(i)+X₁(i)，1≤i≤n，n为原始数据向量X中的数据个数，X(i)为原始数据向量X中的第i个数据，X₀(i)为共享分片向量X₀中的第i个数据，X₁(i)为共享分片向量X₁中的第i个数据，包括以下步骤：

S1：第一方将1至n这n个数值随机排列生成随机向量f₀，f₀={f₀(1), f₀(2),……f₀(n)}，第二方将1至n这n个数值随机排列生成随机向量f₁，f₁={f₁(1), f₁(2),……f₁(n)}，f₀(i)为随机向量f₀中的第i个数值，f₁(i)为随机向量f₁中的第i个数值；

S2：第一方、第二方依据共享分片向量X₀、随机向量f₁进行一次置换洗牌操作，第一方得到向量b₀，b₀={b₀(1),b₀(2),……b₀(n)}，第二方得到向量P₁，P₁={P₁(1), P₁(2),……P₁(n)}，P₁(i)= X₀(f₁(i))-b₀(i)，b₀(i)为向量b₀中的第i个数据，P₁(i)为向量P₁中的第i个数据；

S3：第一方、第二方依据共享分片向量X₁、向量P₁、随机向量f₀、向量b₀进行一次置换洗牌操作，第二方得到向量d₁，d₁={d₁(1),d₁(2),……d₁(n)}，第一方得到向量P₀，P₀={P₀(1), P₀(2),……P₀(n)}，P₀(i)=X(f₁(f₀(i)))-d₁(i)，P₀(i)为向量P₀中的第i个数据，d₁(i)为向量d₁中的第i个数据。

步骤S2包括以下步骤：

n×n的缺位矩阵E为：

，

缺位矩阵E的第i行的缺位元素为

，

表示第i行的第f₁(i)个元素，

第一方、第二方依据n选n-1的不经意传输协议、随机向量f₁内的第i个数值f₁(i)将第一方的茫然可穿刺矩阵D1的第i行元素发送到第二方，第二方得到茫然可穿刺矩阵D1第i行除了第f₁(i)个元素之外的其他所有元素，第f₁(i)个元素为缺位元素，将缺位元素记为0；

计算第i列元素对应的求和值a₁(i)的公式如下：

，1≤j≤n，

计算第i行元素对应的求和值的负数b₁(i)的公式如下：

；

S24：第一方根据共享分片向量X₀、向量a₀计算出向量G₀，G₀={G₀(1),G₀(2),……G₀(n)}，G₀(i)=X₀(i)+a₀(i)，G₀(i)为向量G₀中的第i个数据，第一方将向量G₀发送给第二方；

步骤S3包括以下步骤：

n×n的缺位矩阵F为：

，

缺位矩阵F的第i行的缺位元素为

，

表示第i行的第f₀(i)个元素；

第一方、第二方依据n选n-1的不经意传输协议、随机向量f₀内的第i个数值f₀(i)将第二方的茫然可穿刺矩阵D2的第i行元素发送到第一方，第一方得到茫然可穿刺矩阵D2第i行除了第f₀(i)个元素之外的其他所有元素，第f₀(i)个元素为缺位元素，将缺位元素记为0；

计算第i列元素对应的求和值c₀(i)的公式如下：

，1≤j≤n，

计算第i行元素对应的求和值的负数d₀(i) 的公式如下：

；

S34：第二方根据向量P₁、共享分片向量X₁、随机向量f₁、向量c₁计算出向量G₁，G₁={G₁(1),G₁(2),……G₁(n)}，G₁(i)为向量G₁中的第i个数据，

第二方将向量G₁发送给第一方；

最终，第一方持有向量P₀，第二方持有向量d₁。

在本方案中，初始时，原始数据向量X通过某些隐私计算组件拆分为加性秘密分享的两个共享分片向量X₀、X₁，第一方持有共享分片向量X₀，第二方持有共享分片向量X₁，此时，共享分片向量X₀、X₁中的数据分片与用户ID还是绑定的，例如：原始数据向量X中的数据X(1)对应的用户ID为1，当数据X(1)被拆分为共享分片向量X₀中的X₀(1)、共享分片向量X₁中的X₁(1)后，X₀(1)对应的用户ID还是1，X₁(1)对应的用户ID还是1，即共享数据与原用户ID依然是绑定的，没有脱钩，当第一方、第二方将共享分片向量X₀与共享分片向量X₁相加后就可以还原出原始数据向量X。

共享分片向量X₀、共享分片向量X₁经过本方法随机排序后，最终，第一方持有向量P₀、第二方持有向量d₁，第一方、第二方将向量P₀、向量d₁相加后得到向量X(f₁(f₀(i)))，即得到了将原始数据向量X重新排序后的向量X(f₁(f₀(i)))，由于，第一方不知道随机向量f₁，第二方不知道随机向量f₀，所以双方都无法还原出向量X(f₁(f₀(i)))与原始数据向量X之间的顺序对应关系，一般用于机器学习的数据是非常多的，存在大量的重复数据，所以通过本方法随机排序后，第一方、第二方只能共同持有原始数据向量X内的数据，但都无法还原出原始数据向量X的顺序，即将数据与用户ID实现了脱钩，降低了数据主体风险。

举例说明：

原始数据向量X={X(1), X(2), X(3), X(4), X(5), X(6), X(7),X(8)}= {1100,1101, 1102, 1103, 1104, 1105, 1106, 1107}，第一方持有共享分片向量X₀，第二方持有共享分片向量X₁，如图2所示，共享分片向量X₀与共享分片向量X₁相加可以还原出原始数据向量X。

由于原始数据向量X内有8个数据，所以，第一方将1至8这8个数值随机排列生成随机向量f₀，f₀={f₀(1), f₀(2),……f₀(8)} ={7,5,4,1,2,8,6,3}，第二方将1至8这8个数值随机排列生成随机向量f₁，f₁={f₁(1), f₁(2),……f₁(8)}={1,4,3,5,2,6,7, 8}，如图3所示。

第一方生成8×8的茫然可穿刺矩阵D1，对茫然可穿刺矩阵D1的每一列元素求和得到每一列元素对应的求和值，所有求和值构成向量a₀，对茫然可穿刺矩阵D1的每一行元素求和得到每一行元素对应的求和值，所有求和值的负数构成向量b₀，如图4所示。例如图4中，茫然可穿刺矩阵D1的第一列元素的求和值为15329059524，向量a₀的第一个数据a₀(1)为15329059524，茫然可穿刺矩阵D1的第一行元素的求和值的负数为-20223698873，向量b₀的第一个数据b₀(1)为-20223698873。

第一方、第二方依据8选7的不经意传输协议、随机向量f₁内的数值将第一方的茫然可穿刺矩阵D1的每一行元素发送到第二方，第二方得到茫然可穿刺矩阵D1每一行除了缺位元素之外的其他所有元素，将缺位元素记为0，从而得到n×n的缺位矩阵E，第二方对缺位矩阵E的每一列元素求和得到每一列元素对应的求和值，所有求和值构成向量a₁，对缺位矩阵E的每一行元素求和得到每一行元素对应的求和值，所有求和值的负数构成向量b₁，如图5所示。由于f₁={1,4,3,5,2,6,7, 8}，从图5中可以看到，茫然可穿刺矩阵D1的第一行的缺位元素位于1行1列，第二行的缺位元素位于2行4列，第三行的缺位元素位于3行3列，第四行的缺位元素位于4行5列，第五行的缺位元素位于5行2列，第六行的缺位元素位于6行6列，第七行的缺位元素位于7行7列，第八行的缺位元素位于8行8列，即第i行的缺位元素位于第i行的第f₁(i)列。

第一方根据共享分片向量X₀、向量a₀计算出向量G₀，G₀={G₀(1),G₀(2),……G₀(8)}，G₀(i)=X₀(i)+a₀(i)，第一方将向量G₀发送给第二方，第二方根据向量G₀、随机向量f₁、向量a₁、向量b₁计算出向量P₁，P₁={P₁(1), P₁(2),……P₁(n)}，向量P₁的值如图6所示。从图4、图5中可以看出a₀(f₁(i))-a₁(f₁(i))的值就是缺位矩阵E的第f₁(i)列的缺位元素原先的数值，第f₁(i)列的缺位元素就是缺位矩阵E第i行的第f₁(i)个元素，则a₀(f₁(i))-a₁(f₁(i))-b₁(i)的值就是b₀(i)的负数，即a₀(f₁(i))-a₁(f₁(i))-b₁(i)=-b₀(i)，所以，

P₁(i)=G₀(f₁(i))-a₁(f₁(i))-b₁(i)=X₀(f₁(i))+a₀(f₁(i))-a₁(f₁(i))-b₁(i)=X₀(f₁(i))-b₀(i)。例如：a₀(f₁(2))-a₁(f₁(2))的值为a₀(4)-a₁(4)=17572726836-16088366586=1484360250，就是缺位矩阵E的第4列的缺位元素原先的数值，第4列的缺位元素就是缺位矩阵E第2行的第4个元素，所以a₀(f₁(2))-a₁(f₁(2))-b₁(2)=a₀(4)-a₁(4)-b₁(2)= 1484360250+14166402122=15650762372，就是b₀(2)的负数值，所以P₁(2)= X₀(f₁(2))-b₀(2)= X₀(4)-b₀(2)=171463691+15650762372=17365399287，与图6中的数值一致。

第二方生成8×8的茫然可穿刺矩阵D2，对茫然可穿刺矩阵D2的每一列元素求和得到每一列元素对应的求和值，所有求和值构成向量c₁，对茫然可穿刺矩阵D2的每一行元素求和得到每一行元素对应的求和值，所有求和值的负数构成向量d₁，如图7所示。例如图7中，茫然可穿刺矩阵D2的第一列元素的求和值为19236352818，向量c₁的第一个数据c₁(1)为19236352818，茫然可穿刺矩阵D2的第一行元素的求和值的负数为-18831864544，向量d₁的第一个数据d₁ (1)为-18831864544。

第一方、第二方依据8选7的不经意传输协议、随机向量f₀内的数值将第二方的茫然可穿刺矩阵D2的每一行元素发送到第一方，第一方得到茫然可穿刺矩阵D2每一行除了缺位元素之外的其他所有元素，将缺位元素记为0，从而得到n×n的缺位矩阵F，第一方对缺位矩阵F的每一列元素求和得到每一列元素对应的求和值，所有求和值构成向量c₀，对缺位矩阵F的每一行元素求和得到每一行元素对应的求和值，所有求和值的负数构成向量d₀，如图8所示。由于f₀={7,5,4,1,2,8,6,3}，从图8中可以看到，茫然可穿刺矩阵D2的第一行的缺位元素位于1行7列，第二行的缺位元素位于2行5列，第三行的缺位元素位于3行4列，第四行的缺位元素位于4行1列，第五行的缺位元素位于5行2列，第六行的缺位元素位于6行8列，第七行的缺位元素位于7行6列，第八行的缺位元素位于8行3列，即第i行的缺位元素位于第i行的第f₀(i)列。

第二方根据向量P₁、共享分片向量X₁、向量c₁计算出向量G₁，G₁={G₁(1),G₁(2),……G₁(8)}，G₁(i)=P₁(i)+X₁(f₁(i))+c₁(i)=X₀(f₁(i))-b₀(i)+X₁(f₁(i))+c₁(i)=X(f₁(i))-b₀(i)+c₁(i)，第二方将向量G₁发送给第一方。第一方根据向量G₁、随机向量f₀、向量c₀、向量d₀、向量b₀计算出向量P₀，P₀={P₀(1), P₀(2),……P₀(n)}，

从图7、图8中可以看出c₁(f₀(i))-c₀(f₀(i)) 的值就是缺位矩阵F的第f₀(i)列的缺位元素原先的数值，第f₀(i)列的缺位元素就是缺位矩阵F第i行的第f₀(i)个元素，则c₁(f₀(i))-c₀(f₀(i))-d₀(i)的值就是d₁(i)的负数，即c₁(f₀(i))-c₀(f₀(i))-d₀(i)=-d₁(i)，另外第一方还持有向量b₀、随机向量f₀，则第一方知道b₀(f₀(i))的数值，所以P₀(i)=G₁(f₀(i))-c₀(f₀(i))-d₀(i)-b₀(f₀(i))=X(f₁(f₀(i)))-b₀(f₀(i))+c₁(f₀(i))-c₀(f₀(i))-d₀(i)-b₀(f₀(i))=X(f₁(f₀(i)))-d₁(i)，向量P₀的值如图9所示。

例如：c₁(f₀(2))-c₀(f₀(2))的值为c₁(5)-c₀(5)=16922434711-13655402903=3267031868，即就是缺位矩阵F的第5列的缺位元素原先的数值，第5列的缺位元素就是缺位矩阵F第2行的第5个元素，所以c₁(f₀(2))-c₀(f₀(2))-d₀(2)=c₁(5)-c₀(5)-d₀(2)=3267031868+15503761035=18770792903，就是d₁(2)的负数值，所以P₀(2)= X(f₁(f₀(2)))-d₁(2)=X(2)-d₁(2)=1101+18770792903=18770794004，与图9中的数值一致。

共享分片向量X₀、共享分片向量X₁经过本方法随机排序后，最终，如图9所示，第一方持有向量P₀、第二方持有向量d₁，第一方、第二方将向量P₀、向量d₁相加后得到向量X(f₁(f₀(i)))，即得到了将原始数据向量X重新排序后的向量X(f₁(f₀(i)))，由于，第一方不知道随机向量f₁，第二方不知道随机向量f₀，所以双方都无法还原出向量X(f₁(f₀(i)))与原始数据向量X之间的顺序对应关系。

原始数据向量X、复合结果X(f₁(f₀(i)))的关系，如图10所示，从图10中可看出第一方、第二方将向量P₀、向量d₁相加后得到向量X(f₁(f₀(i)))是将数据向量X中的数据按照向量f₁(f₀(i))重新进行了排序，由于，第一方不知道随机向量f₁，第二方不知道随机向量f₀，所以双方都无法还原出向量X(f₁(f₀(i)))与原始数据向量X之间的顺序对应关系，即第一方、第二方都无法知道或反推出向量X(f₁(f₀(i)))中的数据与用户ID之间的对应关系，即将数据与用户ID实现了脱钩，降低了数据主体风险。