CN110569655A

CN110569655A - 一种群组隐私信息发现方法及系统

Info

Publication number: CN110569655A
Application number: CN201910846455.8A
Authority: CN
Inventors: 李凤华; 牛犇; 何媛媛; 尹沛捷
Original assignee: Institute of Information Engineering of CAS
Current assignee: Institute of Information Engineering of CAS
Priority date: 2019-09-06
Filing date: 2019-09-06
Publication date: 2019-12-13
Anticipated expiration: 2039-09-06
Also published as: CN110569655B

Abstract

本发明提供一种群组隐私信息发现方法及系统，基于中继服务器对隐私信息进行保护，在不牺牲聚类质量的前提下，通过中继服务器对用户上传的信息进行DP聚类，同时保护用户上传的敏感信息。其中，聚类操作将从用户的移动设备转移到中继服务器进行，允许用户在提交需求后可以离线，同时避免迭代计算，提升计算效率。根据聚类结果，在满足用户需求的前提下对结果进一步优化，扩大服务的覆盖范围。本发明能较大幅度地降低用户移动设备的计算和通信成本，同时帮助群组服务提供商节约开销和增大覆盖范围。

Description

一种群组隐私信息发现方法及系统

技术领域

本发明属于信息技术领域，具体涉及一种群组隐私信息发现方法及系统。

背景技术

近年来，随着信息服务化的迅速普及、移动通信技术的快速发展，移动互联网以其便携性和实时性促进了众多新型网络服务模式的发展，其中群组服务更是渗透到人们的日常生活。此类服务通过分析用户提交的需求，为一批需求相似的人群提供服务。服务提供商需要收集用户的部分个人信息或需求，才能为用户找出合适的共享对象，并以群组的方式提供服务。然而，因为服务提供商并不完全可信，这种形式的群组服务存在着巨大的隐私泄露风险。服务提供商根据收集到的用户信息，不仅可以推测出用户的潜在信息，甚至可能将用户提交的信息与潜在信息联系起来，推测出用户的家庭住址、个人偏好、财务状况等敏感信息。因此，如何在提供群组服务功能的同时，有效保护用户提交的数据中蕴含的隐私信息，而不泄露给其他用户和服务提供商是当前面临的主要技术挑战。

目前大多数隐私保护方法使用隐私保护聚类(Privacy-Preserving Clustering,PPC)算法来解决群组服务中的隐私泄露问题。现有的PPC方案采用的隐私保护技术可分为随机化或加密技术两种。随机技术是通过添加噪声来保护敏感数据，加密技术可以在不牺牲聚类质量的情况下实现相对强大的隐私保护。为了寻求隐私与聚类质量之间的平衡，接下来将介绍两种较经典的基于随机或加密技术的隐私保护聚类方法。Agrawal等人首先对数据集添加随机噪声，提出PPC方案(参照R.Agrawal and R.Srikant.Privacy-preservingdata mining[C].Proceedings of the 2000ACM SIGMOD International Conference onManagement of Data,2000,pp.439–450.)；B.Pinkas在数据聚类过程中，利用安全多方计算和同态加密保护用户的隐私信息(参照B.Pinkas.Cryptographic techniques forprivacy-preserving data mining[J].ACM SIGKDD,vol.4,no.2,pp.12–19,2002.)。

现有的隐私保护聚类技术应用于群组服务有以下三点局限性：

1.在现存的群组服务中，为了同时保障隐私保护效果和聚类质量，用户需要保持在线状态，频繁地与服务提供商交互，在每次交互迭代中执行加密和解密操作。这导致用户资源受限的移动设备端仍需承担较大的计算和通信开销。

2.在与位置相关的群组服务中，用户位置通常具有空间正相关性，即处于邻近区域的用户行程数据将以更大概率聚集在同一类中。利用空间正相关性，服务提供商能提升聚类收敛速度。然而，若用户加密位置信息后提交给服务器，服务器很难从密文中快速识别地理位置相近的用户们，并利用空间正相关性加速聚类收敛。

3.多数服务提供商会把某几类用户需求合并为一类需求，在减少服务种类的同时，能有效增加服务覆盖率，然而这与用户需要快速获取服务的实际需求相矛盾，降低用户体验。

发明内容

本发明的目的在于提供一种群组隐私信息发现方法及系统，基于中继服务器对隐私信息进行保护，在不牺牲聚类质量的前提下，通过中继服务器对用户上传的信息进行密度峰值(Density Peaks,DP)聚类，同时保护用户上传的敏感信息。在本发明中，聚类操作将从用户的移动设备转移到中继服务器进行，允许用户在提交需求后可以离线，同时避免迭代计算，提升计算效率。根据聚类结果，在满足用户需求的前提下对结果进一步优化，扩大服务的覆盖范围。本发明方法能较大幅度地降低用户移动设备的计算和通信成本，同时帮助群组服务提供商节约开销和增大覆盖范围。

为实现上述目的，本发明采用如下技术方案：

一种群组隐私信息发现方法，将中继服务器部署于面向群组服务的用户终端设备和服务器之间，该方法主要包括以下步骤：

1)隐私信息初始化，将系统公钥-私钥对中的私钥随机分解成两部分，一部分作为中继服务器的私钥，另一部分作为服务器的私钥，利用两部分私钥对使用系统公钥加密的信息共同解密可得到明文数据；

2)用户终端设备发送请求，使用系统公钥、为用户分配的公钥和覆盖该用户当前位置的所有中继服务器的公钥对该请求进行加密，所述覆盖该用户的所有中继服务器包括最近中继服务器和与该用户相邻的中继服务器；

3)最近中继服务器收集其覆盖范围内用户与其邻近用户的请求密文后，利用其私钥解密请求密文并进行随机化处理，该随机化处理是指使用固定范围内的随机数加入密文中，再与相邻中继服务器交换密文信息；

4)相邻各中继服务器对接收到密文使用各自私钥解密并进行验证，若验证通过，则可从密文中移除随机数得到原始密文，再将各中继服务器覆盖范围内的用户及其邻近用户的两部分密文分别存储并发送至服务器；

5)服务器向接收到的请求密文中加入随机数，利用其私钥进行部分解密后返回至相应的中继服务器；

6)中继服务器将含有随机数的密文利用其私钥进行部分解密，结合步骤5)中服务器部分解密了的密文，得到含有随机数的明文，对其计算处理后使用系统公钥加密并将密文发送给服务器，服务器移除密文中的随机数后，再次对密文随机化处理，得到新密文，并与相应中继服务器联合解密，并将解密后的结果处理后发送至相应中继服务器；

7)中继服务器根据步骤6)所得结果，辅助服务器进行DP聚类计算，获得聚类中心和属于各个聚类中心的成员集；

8)根据步骤7)所得聚类结果，服务器配合中继服务器为用户提供服务，并进一步优化，以提高服务覆盖率。

进一步地，每个用户具有一个中继服务器集合，该集合包括覆盖该用户当前位置的所有中继服务器(即最近中继服务器和与该用户相邻的中继服务器)；每个中继服务器具有一个用户集合，该集合包括该中继服务器所覆盖的所有用户与覆盖范围内用户的邻近用户(邻近用户可能不在该用户所在中继服务器的服务覆盖范围内)。

进一步地，用户发送的请求可表示为其中，pk_i,j表示系统给用户分配的公钥加密请求信息，表示使用系统公钥pk加密请求信息生成的密文，表示使用最近中继服务器的公钥pk_i加密随机数生成的密文，表示使用相邻中继服务器的公钥将随机数与随机数的哈希拼接所得明文进行加密得到的密文。

进一步地，步骤3)具体包括以下步骤：

最近中继服务器使用其私钥解密密文，并进行随机化处理得密文；

将和密文发送给相邻中继服务器。

进一步地，步骤4)具体包括以下步骤：

相邻中继服务器接收到密文后，使用各自私钥对密文进行解密验证，若解密后得到的随机数经过哈希后的值与解密后得到的值一致，则说明验证通过，可得到随机数r_i,j ⁽³⁾，便可从密文中移除该随机数，得到原始请求密文

各中继服务器将收集到的覆盖范围内的用户及覆盖范围内用户的邻近用户的两部分密文分别存储并发送给服务器。

进一步地，步骤6)具体包括以下步骤：

中继服务器将接收到的含有随机数的密文进行部分解密，结合步骤5)中服务器部分解密了的密文，得到含有随机数的明文，对其计算处理后使用系统公钥加密并将密文发送给服务器；

服务器在接收到密文后，移除步骤5)中加入的随机数，再选取一定范围内的随机数再次对该密文进行随机化处理，得到新的密文；

服务器与相应中继服务器联合对新的密文进行解密，得到随机化的距离明文，再对任意两个明文进行比较，并将所有计算结果发送给中继服务器。

进一步地，随机化处理是指使用固定范围内的随机数加入密文中。

进一步地，DP聚类计算的步骤包括：

以每个用户作为以固定长度为半径的圆心，用圆内的其他用户的数目表示该用户的密度；

将各个中继服务器内收集到的用户间的密度相互比较，找出比当前用户密度大的用户并计算二者之间的距离，通过不断比较每个用户，可得到比当前用户的密度大并且距离最小的用户，此最小距离为当前用户的距离，选取密度和距离均较大的用户作为聚类中心，其余低密度的用户为聚类成员，聚类中心和聚类成员组成聚类结果。

进一步地，步骤8)具体包括以下步骤：

服务器与每个中继服务器进行通信，以获得聚类中心；

服务器对接收到的信息进行解密，获取每一个聚类中心信息；

根据得到的聚类中心以及给定的约束条件，在满足用户可接受范围内的前提下，为用户提供最优化服务方案；

服务器使用为用户分配的公钥加密最优化服务方案信息，并通过用户所在的中继服务器转发给用户；

用户可在线时下载并用其私钥解密从中继服务器发来的服务信息。

一种群组隐私信息发现系统，包括：

用户终端设备，用于发出用户请求，并使用系统公钥、为用户分配的公钥和覆盖该用户当前位置的所有中继服务器的公钥对请求进行加密；

中继服务器，用于对用户发来的请求密文进行随机化处理，对服务器发来的含有随机数的密文进行部分解密，并对计算处理后的信息进行加密，辅助服务器进行DP聚类计算和与用户进行数据交换的服务需求；

服务器，用于对中继服务器随机化处理后的请求密文加入随机数并进行部分解密，用于对中继服务器使用公钥加密后的密文进行新的随机化处理，联合中继服务器进行DP聚类计算和为用户提供服务。

进一步地，每个用户终端设备具有一个中继服务器集合，该集合包括覆盖该用户当前位置的所有中继服务器(即最近中继服务器和与该用户相邻的中继服务器)；每个中继服务器具有一个用户集合，该集合包括该中继服务器所覆盖的所有用户与覆盖范围内用户的邻近用户(邻近用户可能不在该用户所在中继服务器的服务覆盖范围内)。

本发明将中继服务器引入到群组服务中，并部署在终端设备和服务器之间，存储从各自服务区域收集到的用户数据。如此可将原本安置在用户移动终端进行的用户数据预处理计算转移到中继服务器进行，从而降低用户移动终端的计算和通信成本，并支持用户离线。同时，本发明利用中继服务器的数据局部性来提高DP聚类的性能，且通过中继服务器间的交互来保证聚类质量。基于聚类结果，服务器配合中继服务器为用户提供服务并进一步优化，以扩大服务范围、节约开销。用户提交信息时使用公钥加密用户信息，然后发送到相应的中继服务器，此后用户便可以处于离线状态。在中继服务器与服务器处理完毕后，中继服务器向用户返回使用用户公钥加密了的服务结果。当用户在线时，下载并解密接收到的数据便可获取服务提供商提供的服务信息。由于中继服务器并不完全可信，中继服务器只被允许访问用户加密的需求信息和在密文上执行聚类所需运算。

利用本发明提供的方法在群组服务过程中，具有以下优点：

1、本发明无需迭代计算，降低了DP聚类算法的计算复杂度，提升了计算效率，执行时间较短，同时用户移动设备只需极少的计算和通信开销，有效降低了在用户移动设备上的计算成本，为用户节省在线流量。

2、本发明提出的方法在保护用户个人隐私的前提下提升聚类收敛速度，同时不影响原有算法的聚类质量。

3、本发明在满足用户需求的前提下，对服务进一步优化，能有效扩大服务覆盖范围和节约开销。

附图说明

图1是实施例中的本发明应用于共享巴士服务的方法流程图。

图2是实施例中的雾节点间交换部分用户的行程密文的流程图。

图3是实施例中的行程距离比较的流程图。

图4是实施例中的DP聚类计算的流程图。

图5是实施例中的规划出行路线的流程图。

图6A-6B是实施例中的本发明用于实现共享巴士服务的系统示意图。

具体实施方式

本发明提供的群组隐私信息发现方法，适用于任意面向群组服务的移动终端用户，该方法主要包括以下四个步骤：

第一步，隐私信息初始化：在给定安全参数的情况下，通过运行算法生成系统的公钥-私钥对，并将系统私钥随机分解成两部分，一部分作为中继服务器的私钥，另一部分作为服务器的私钥，只有使用两部分私钥都进行解密计算后才能解密由系统公钥加密后的密文。

第二步，中继服务器辅助服务提供商进行DP聚类计算：由于每个中继服务器只对起点在本服务区域内的用户数据信息进行聚类计算，利用中继服务器的数据局部性来划分用户集。每个用户需创建一个中继服务器集合，包括覆盖该用户及其邻近用户的所有中继服务器。该用户选取随机数、使用其中继服务器集合的每个中继服务器的公钥加密，并提交密文给所在的中继服务器。中继服务器解密得该随机数，使用此随机数对系统公钥加密的用户请求信息进行随机化处理，把处理后的用户请求密文和相邻中继服务器公钥加密后的随机数发送给相应的相邻中继服务器。通过这种方式，每个中继服务器能获取该用户所有的邻近用户的请求密文，以保证下一个步骤中局部密度计算的精确性，从而保障聚类结果的正确性。

第三步，用户数据隐私化聚类：中继服务器根据第二步收集到的用户请求密文，与服务提供商联合执行隐私保护的DP聚类计算。本步骤结束后，服务提供商能获取每个用户的局部密度、与局部密度高于自己的相邻用户的最小距离和用户分类结果。其中，用户分类结果包括每一类的中心和成员集。

第四步，按用户需求提供服务：根据第三步计算出的结果，服务器为用户以群组的方式提供服务，并进一步优化，以提高服务提供商的利润和服务覆盖率。

1、该方法提出引入中继服务器辅助的DP聚类机制，该方法利用中继服务器的数据局部性减少DP聚类所需的比较大小运算次数，以提升DP聚类的性能，同时利用用户的邻近中继服务器集合间的交互保证聚类质量。给定群组服务系统中的n个用户请求，原DP聚类算法的计算复杂度为O(n²)，得益于中继服务器的局部性质，改进后的DP聚类算法的计算复杂度降低至O(n_in)，其中n_i表示中继服务器服务区域中的用户数，通常n_i<<n。

2、该方法设计一种新的隐私保护的聚类算法，该算法对基于中继服务器的DP聚类算法进行隐私化处理，实现隐私保护的聚类计算，保护用户的敏感信息不泄露给服务提供商、中继服务器和其他用户。由于中继服务器和服务提供商承担了绝大部分运算工作，极大地方便了资源有限的移动终端用户。该方法允许用户在提交请求后，处于离线状态，不参与聚类计算，只需最后接收服务结果。

3、该方法为需求相似的用户提供服务，同时根据各类用户需求间的关系，把多类用户合并为一个大类，集中提供服务，能有效增加服务提供商的利润，并扩大服务提供商的服务覆盖率。

为使本发明的上述特征和优点能更明显易懂，下文特举实施例，并配合所附图作详细说明如下。

本实施例将本发明的群组隐私信息发现方法应用于共享巴士服务上。

本发明方法适用于基于雾节点的共享巴士服务方案，雾节点部署在终端设备和服务器之间作为中继服务器。当用户将生成的请求信息提交至距离最近的雾节点后，雾节点对接收到的信息进行解密和随机化处理，然后发送给相邻雾节点。通过雾节点之间的相互交互，使得每个雾节点均能得到自己覆盖范围内以及相邻雾节点范围内部分用户的行程信息，从而保证聚类质量。然后每个雾节点将收集到的行程密文发送给服务器，服务器选取随机数加入到接收到的密文中，进行部分解密后返回至对应的雾节点。雾节点将接收到的加了随机数的行程密文进行部分解密，使用随机化了的行程信息计算行程间的距离并加密发送给服务器。服务器接收到密文后，移除加密距离中的随机数，并对任意两个加密距离进行比较计算。最后服务器配合雾节点只对本服务区域内及相邻雾节点的部分用户的距离密文进行DP聚类计算，不需要将系统内的所有用户都进行聚类计算，大大降低了计算量，进而获得聚类中心和属于各个聚类中心的成员集。

本方法的处理过程如图1所示，具体包括以下步骤：

步骤11、隐私信息初始化。在给定安全参数的情况下，将系统生成的公钥-私钥对(pk,sk)中的私钥(sk)随机分解为两个部分，一部分作为雾节点的私钥，另一部分作为服务器的私钥。因此，当使用系统公钥加密时，需要雾节点和服务器共同解密，才能得到明文数据，从而提高系统安全性。

步骤12、生成用户请求信息。用户u_i,j生成乘车请求发送至距离用户最近的雾节点。

所述u_i,j表示在第i个雾节点覆盖范围内的第j个用户。

所述pk_i,j表示系统为用户u_i,j生成的公钥。

所述表示使用系统公钥pk加密行程信息tr_i,j生成的密文，即

所述行程信息tr_i,j表示用户的具体出行信息，包括起点、终点和预期到达时间，即tr_i,j＝(s_i,j,d_i,j,t_i,j)，其中s_i,j表示第i个雾节点覆盖范围内第j个用户的起点位置坐标，d_i,j表示第i个雾节点覆盖范围内第j个用户的终点位置坐标，t_i,j表示第i个雾节点覆盖范围内第j个用户的期望到达时间。

所述表示使用第i个雾节点的公钥pk_i加密随机数r_i,j ⁽³⁾生成的密文，即

所述r_i,j ⁽³⁾表示第i个雾节点覆盖范围内的第j个用户生成的随机数。

所述表示使用相邻雾节点的公钥将随机数与随机数的哈希拼接得到的明文进行加密得到的密文，即

所述相邻雾节点特指与用户u_i,j相邻的雾节点，记为第l_i,j个雾节点。相邻雾节点可能覆盖用户u_i,j的邻近用户。

所述表示相邻雾节点(第l_i,j个雾节点)的公钥。

步骤13、雾节点间交换部分用户的行程密文。雾节点收集本服务区域内所有用户与相邻雾节点中部分用户的行程密文，经处理后将两部分行程密文分别存储并发送给服务器，其大致流程如图2所示。所述部分用户特指与相邻雾节点交界处的用户。所述步骤如下：

步骤131、使用该雾节点的私钥解密行程请求中的密文，并进行随机化处理得密文。

步骤132、将接收到的行程请求中的密文和随机化处理所得密文发送给相邻雾节点。

步骤133、相邻的各雾节点接收到密文后首先对使用各自私钥进行解密，若解密成功则说明雾节点恰好需要收集该用户提交的行程密文，便可得到随机数r_i,j ⁽³⁾，进而从密文中移除该随机数得到用户的原始行程密文

所述解密成功指雾节点解密后得到的随机数经过哈希后的值与解密后得到的值一致。

步骤134、雾节点将本节点覆盖范围内以及覆盖范围内用户的邻近用户的两部分密文分别发送至服务器。

步骤14、服务器随机化密文。服务器向接收到的行程密文中加入随机数，并部分解密后返回至雾节点。

所述部分解密特指服务器使用系统分给它的部分私钥进行解密。

步骤15、行程距离比较。雾节点计算各节点覆盖范围内以及相邻雾节点的部分用户行程间的距离，使用系统公钥加密后交由服务器进行距离比较，其大致流程如图3所示。所述步骤如下：

步骤151、雾节点计算用户间距离。雾节点将接收到的含有随机数的密文进行部分解密，进而通过欧几里得距离公式计算行程距离，最后使用系统公钥加密距离密文发送给服务器。

所述部分解密特指雾节点使用系统分给它的部分私钥进行解密。

所述行程距离表示通过欧几里得距离公式计算得到的各用户间起点与起点、终点与终点、期望到达时间三个维度上的三元数组。

步骤152、服务器移除随机数并进行距离比较。服务器在接收到密文后，首先移除步骤14中向密文中加入的秘密随机数；然后选取一定范围内的随机数再次对密文进行随机化处理，得到新的密文；然后与相应雾节点联合将得到的距离密文进行解密；最后对任意两个随机化后的距离进行比较，并将所有计算的结果发送给雾节点。

所述随机化处理表示使用固定范围内的随机数加入密文中，此步骤可实现距离的大小比较，同时不泄露原始距离值。

步骤16、DP聚类计算。每个雾节点根据步骤15所得各个距离值间的大小关系，通过DP聚类最终获得聚类中心和属于各个聚类中心的成员集，其大致流程如图4所示。DP聚类和雾节点计算的结合，实现了在不损失聚类质量的情况下，提高DP聚类的性能。

所述DP聚类算法基于两个观察点。其一，任何一个聚类中心都应该被较低局部密度的相邻点包围；其二，每一个聚类中心都远离其他具有高局部密度的点。因此，DP算法通过量化数据点的局部密度和从其他任何高密度点到数据点的最小距离来定位密度峰值，即为聚类中心。所述步骤如下：

步骤161、每个用户先作为一个以固定长度为半径的圆心，用圆内所在其他用户的数目表示该用户的密度。

步骤162、将各个雾节点内收集到的用户间的密度相互比较，找出比本用户密度大的用户并计算它们之间的距离，最后通过不断比较每个用户可得到比本用户的密度大并且距离最小的用户，此最小距离为当前用户的距离，选取密度和距离均较大的用户作即为聚类中心，其余低密度的用户为聚类成员。

步骤17、规划出行路线。根据聚类结果，服务器配合雾节点为用户提供定制的出行线路，并进一步优化，以提高服务提供商的利润和服务覆盖率，节省开销，其大致流程如图5所示。具体步骤如下：

步骤171、服务器与每个雾节点进行通信，以获得聚类中心信息。

步骤172、服务器对接收到的信息进行解密，获取每一个聚类中心的信息，并进一步估计距离值、出发时间、目的地等行程信息，以确保用户能够在预期到达时间之前到达目的地。

步骤173、根据得到的聚类中心、以及给定的约束条件，对路线进一步优化，将多条路线在满足用户可接受范围内的前提下，如出发时间、预期到达时间、最终到达终点等要求，合并为一条路线，既能扩大服务覆盖率，又可以节省开销。

所述约束条件包括五个，第一个约束条件是确保在巴士在每个停车站点能容纳所有乘客；第二个约束条件是确保巴士在每个乘客的预期到达时间之前到达每位乘客的目的地；第三个约束条件是避免过多路线合并成一条路线后造成总路线长度过长，无法满足用户快速到达目的地的需求；第四个约束条件是确保巴士在选择下一个停靠站点时距乘客的目的地更近，以帮助每位乘客尽快到达每位乘客的目的地；最后一个约束条件确保所有的出行路线的可行性。

步骤174、服务器使用系统为用户生成的公钥加密巴士票据信息，并发送给用户所在的雾节点，雾节点转发给用户加密的巴士票据。

步骤175、当用户在线时，下载并用其私钥解密从雾节点返回的数据便可以获取路线信息。如果用户接受定制的出行路线，在支付车票后便可以享受共享巴士服务提供的行程。

本实施例还公开一种群组隐私信息发现系统，应用于共享巴士服务上。

本系统如图6A-6B所示，由三个实体组成：用户终端设备、雾节点(即中继服务器)和服务器；其中，用户终端设备包括行程加密模块、请求信息生成模块、路线信息解密模块及票据信息下载模块；雾节点包括行程密文模块和计算模块，其中行程密文模块具体包括n个雾节点预处理模块，计算模块具体包括行程信息间计算距离模块、加密模块、部分解密模块、DP聚类计算模块及配合服务器制定路线模块；服务器包括加入秘密随机数模块、密文部分解密模块、移除秘密随机数模块、加密距离比较模块、定制线路模块及优化线路模块。各实体间的工作流程如下：

用户终端设备从管理该服务的提供商购买公共汽车票，其中用户的行程请求隐藏有关其行程信息；用户向附近的雾节点提交行程请求后，用户便可以处于离线状态；雾节点与相邻的雾节点交换用户提交的加密行程信息，以便对出行路线进行优化；雾节点与服务器合作进行DP聚类，在聚类中收集相似的用户行程；根据聚类结果，在满足用户需求的前提下，服务器按照用户需求设计出行线路，并进一步对其优化，以提高共享巴士服务系统的利润和服务覆盖率。

用户不需要在提交出行请求后参与出行聚类和路线规划过程，每个用户只需要完成自己的上车地点、下车地点、出发时间和到达时间的信息提交。当用户在线时，下载系统返回的出行路线并支付所需费用便可以享用服务，实现在没有或较少中间停车站点的情况下快速出行。同时，资源有限的用户移动设备可以节省资源来完成其他重要任务。

所述服务器是为出行的人们提供共享巴士服务的平台，具有强大的计算能力和充足的存储空间。服务器与雾节点相互通信，在聚类中收集相似的行程，但服务器并不了解具体每个用户的行程信息。基于聚类结果，服务器在满足用户需求的前提下，设计按用户出行要求的出行线路，在此基础上进一步对出行线路进行优化，将多条路线在满足用户可接受范围内的前提下，包括出发时间、到达时间、下车位置和上车位置要求，将多条线路合并为一条总线路，使得优化后的出行线路能够为更多的乘客提供服务，既能节约开销，由能为用户制定相对快速和便宜的出行路线。

所述总线路，表示从任意一个聚类中心的源点开始，到任意一个聚类中心的目的点结束，在到达某个聚类中心的目的点之前应访问该聚类中心的源点。

所述雾节点部署在互联网边缘，可以是蜂窝基站、WiFi接入点或微型基站路由器，其信号有效覆盖范围半径一般为500-3000米。每个雾节点都可以为在其覆盖区域内拥有移动设备的用户提供服务。在雾节点辅助架构中，每个雾节点仅持有自己的部分私有密钥，如果没有服务器的部分私有密钥，则无法解密密文。雾节点接收到用户的请求并与相邻的雾节点交换用户提交的加密行程信息，然后与服务器进行高效的DP聚类，从而实现在不损失聚类质量和用户隐私的前提下提高聚类计算的性能。

所述高效的DP聚类表现在雾节点根据数据局部性将所有用户的集合划分为多个子集，并在每个分区内执行比较操作，从而减少DP聚类的比较操作次数。

需要说明的是，图6A-6B所示系统的各个模块组成仅仅是本发明系统应用本实施例的具体呈现，只是一种特例，并不用于限制本发明系统的模块组成，例如在本系统用于其他方面时，就不会具有路线信息解密模块、票据信息下载模块、行程信息间计算距离模块、配合服务器制定路线模块、加密距离比较模块、定制线路模块及优化线路模块等，而是由根据实际情况命名的模块来实现对应的功能，因此本发明系统的组成及各部分功能应以权利要求所做限定为准。

以上实施例仅用以说明本发明的技术方案而非对其进行限制，本领域的普通技术人员可以对本发明的技术方案进行修改或者等同替换，而不脱离本发明的精神和范围，本发明的保护范围应以权利要求书所述为准。

Claims

1.一种群组隐私信息发现方法，将中继服务器部署于面向群组服务的用户终端设备和服务器之间，该方法主要包括以下步骤：

4)相邻各中继服务器对接收到密文使用各自私钥解密并进行验证，若验证通过，则可从密文中移除随机数得到原始密文，再将各中继服务器覆盖范围内的用户及覆盖范围内用户的邻近用户的两部分密文分别存储并发送至服务器；

5)服务器向接收到的请求密文中加入随机数，利用其私钥进行部分解密后返回至相应中继服务器；

8)根据步骤7)所得聚类结果，服务器配合中继服务器为用户提供服务。

2.如权利要求1所述的方法，其特征在于，每个用户具有一个中继服务器集合，该集合包括覆盖该用户当前位置的所有中继服务器；每个中继服务器具有一个用户集合，该集合包括该中继服务器所覆盖的所有用户与覆盖范围内用户的邻近用户。

3.如权利要求1所述的方法，其特征在于，用户发送的请求可表示为其中，pk_i，j表示系统给用户分配的公钥加密请求信息，表示使用系统公钥pk加密请求信息生成的密文，表示使用最近中继服务器的公钥pk_i加密随机数生成的密文，表示使用相邻中继服务器的公钥将随机数与随机数的哈希拼接所得明文进行加密得到的密文。

4.如权利要求3所述的方法，其特征在于，步骤3)具体包括以下步骤：

将和密文发送给相邻中继服务器。

5.如权利要求4所述的方法，其特征在于，步骤4)具体包括以下步骤：

相邻中继服务器接收到密文后，使用各自私钥对密文进行解密验证，若解密后得到的随机数经过哈希后的值与解密后得到的值一致，则说明验证通过，可得到随机数r_i，j ⁽³⁾，便可从密文中移除该随机数，得到原始请求密文

各中继服务器将收集到的覆盖范围内及覆盖范围内用户的邻近用户的两部分密文分别存储并发送至服务器。

6.如权利要求1所述的方法，其特征在于，步骤6)具体包括以下步骤：

7.如权利要求1所述的方法，其特征在于，DP聚类计算的步骤包括：

8.如权利要求1所述的方法，其特征在于，步骤8)具体包括以下步骤：

服务器与每个中继服务器进行通信，以获得聚类中心；

9.一种群组隐私信息发现系统，包括：

10.如权利要求9所述的系统，其特征在于，每个用户终端设备具有一个中继服务器集合，该集合包括覆盖该用户当前位置的所有中继服务器；每个中继服务器具有一个用户集合，该集合包括该中继服务器所覆盖的所有用户与覆盖范围内用户的邻近用户。