CN113612598A

CN113612598A - 基于秘密共享和联邦学习的车联网数据共享系统及方法

Info

Publication number: CN113612598A
Application number: CN202110880835.0A
Authority: CN
Inventors: 范兴民; 胡晓雅; 王励成; 索婧雯
Original assignee: Beijing University of Posts and Telecommunications
Current assignee: Beijing University of Posts and Telecommunications
Priority date: 2021-08-02
Filing date: 2021-08-02
Publication date: 2021-11-05
Anticipated expiration: 2041-08-02
Also published as: CN113612598B

Abstract

本发明实施例提供了一种基于秘密共享和联邦学习的车联网数据共享系统，包括：请求方、路边单元集合和数据拥有方；请求方用于向路边单元发送数据请求，路边单元集合用于确定全局模型和数据拥有方上传到区块链的指定区块；各数据拥有方用于训练全局模型得到本地模型；同态加密再公钥加密后发送至路边单元集合；路边单元集合还用于得到汇总结果反馈至各数据拥有方；各数据拥有方还用于得到更新后的全局模型加密后发送至路边单元集合；路边单元集合还用于判断更新后的全局模型是否收敛，若不收敛，向各数据拥有方发送更新后的全局模型，以使各数据拥有方更新直至收敛；若收敛，向请求方反馈预测结果，实现了在车联网系统中共享数据时保障数据的安全。

Description

基于秘密共享和联邦学习的车联网数据共享系统及方法

技术领域

本发明涉及数据处理技术领域，特别是涉及基于秘密共享和联邦学习的车联网数据共享系统及方法。

背景技术

车联网系统是将车辆与可能对车辆造成影响的相关设备进行通信连接的系统，通过车联网系统内部数据共享可以为车辆提供更好的交通体验。为了保障车辆与设备的数据隐私安全，车联网系统可以采用联邦学习的方式来进行数据使用和机器学习建模。通过联邦学习，车辆和设备与第三方之间只共享模型参数，而保留本地数据不被第三方获取，对模型参数进行加密处理，实现数据在密文状态下进行运算，并通过建立车辆和设备与第三方之间的信道来传输数据。

然而，现有技术中通常假设车辆和设备与第三方之间的数据传输信道是安全的，但这种安全信道在真实的应用中一般不存在，一旦窃听者通过数据传输信道窃听到所有梯度份额便可聚合得到完整的梯度信息，进而从梯度信息通过推理攻击反推出车辆与设备的数据，导致数据的泄露。

发明内容

本发明实施例的目的在于提供基于秘密共享和联邦学习的车联网数据共享方法，以保障车联网共享数据时数据的安全。具体技术方案如下：

第一方面，本发明实施例提供了一种基于秘密共享和联邦学习的车联网数据共享系统，所述系统包括：请求方、路边单元集合和多个数据拥有方；

所述请求方，用于向所述路边单元集合发送数据请求，其中，所述数据请求包括：数据请求的服务类型和请求数据；

所述路边单元集合，用于基于所述数据请求确定对应的全局模型和多个所述数据拥有方；获取并将多个所述数据拥有方的信息和所述全局模型上传到区块链的指定区块；将自身的公钥进行广播；

各所述数据拥有方，用于获取所述指定区块中的所述全局模型；利用自身拥有的数据对所述全局模型进行训练，得到本地模型；对所述本地模型进行同态加密，得到同态加密后的模型；根据接收到的公钥对所述同态加密后的模型进行加密，得到公钥加密后的模型，并将所述公钥加密后的模型发送至所述路边单元集合；

所述路边单元集合，还用于利用自身的私钥对各所述数据拥有方发送的所述公钥加密后的模型进行解密，得到多个所述同态加密后的模型；对多个所述同态加密后的模型进行汇总，并将汇总结果反馈至各所述数据拥有方；

各所述数据拥有方，还用于接收并解密所述汇总结果，聚合解密后的汇总结果，得到并根据聚合结果对所述全局模型进行更新，得到更新后的全局模型；根据所述公钥对所述更新后的全局模型进行加密，并向所述路边单元集合发送加密的所述更新后的全局模型；

所述路边单元集合，还用于接收并解密加密的更新后的全局模型，得到更新后的全局模型，判断所述更新后的全局模型是否收敛，若不收敛，则向各所述数据拥有方发送所述更新后的全局模型，以使各所述数据拥有方利用自身拥有的数据对所述更新后的全局模型进行训练，直至得到更新后的全局模型收敛；若收敛，则通过所述更新后的全局模型对所述请求数据进行计算，得到预测结果并向所述请求方进行反馈。

本发明的一个实施例中，所述路边单元集合，还用于基于预先获取的各所述数据拥有方的数据质量指数，选取一个或多个数据质量指数最高的数据拥有方，作为指定数据拥有方，通过所述指定数据拥有方获取所述指定区块中的所述全局模型；利用自身拥有的数据对所述全局模型进行训练，得到本地模型；根据接收到的公钥对所述本地模型进行加密，并将加密后的模型发送至所述路边单元集合。

本发明的一个实施例中，所述路边单元集合包括多个路边单元；

所述指定数据拥有方，用于根据路边单元集合中路边单元的个数，对所述本地模型进行分片，得到多个模型分片；基于预设同态加密算法，加密各所述模型分片，得到多个模型分片密文；根据接收到的所述路边单元集合中各路边单元的公钥对各所述模型分片密文进行加密，得到多个秘密分片；将各所述秘密分片发送至所述路边单元集合中的各路边单元；

所述路边单元集合，还用于根据所述路边单元集合中各路边单元的私钥对各所述指定数据拥有方发送的各所述秘密分片进行解密，得到多个所述模型分片密文；通过所述路边单元集合中各路边单元，聚合各所述模型分片，得到各所述路边单元的聚合密文；将各所述聚合密文发送至所述指定数据拥有方；

所述指定数据拥有方，用于接收并解密各所述路边单元的聚合密文，聚合解密后的各聚合密文，得到并根据聚合结果对所述全局模型进行更新，得到更新后的全局模型；根据所述公钥对所述更新后的全局模型进行加密，并向所述路边单元集合发送加密的所述更新后的全局模型。

本发明的一个实施例中，所述路边单元集合，还用于根据预先计算得到的各所述数据拥有方的数据质量指数，计算各所述数据拥有方的贡献度；基于各所述数据拥有方的贡献度，对所述更新后的全局模型的收益进行分配，并将收益分配结果上传到所述指定区块上。

第二方面，本发明实施例提供了一种基于秘密共享和联邦学习的车联网数据共享方法，应用于基于秘密共享和联邦学习的车联网数据共享系统，所述方法包括：

通过请求方向路边单元集合发送数据请求，其中，数据请求包括：数据请求的服务类型和请求数据；

利用路边单元集合基于所述数据请求确定对应的全局模型和多个数据拥有方；获取并将多个所述数据拥有方的信息和所述全局模型上传到区块链的指定区块；将自身的公钥进行广播；

通过各所述数据拥有方获取所述指定区块中的所述全局模型；利用自身拥有的数据对所述全局模型进行训练，得到本地模型；对所述本地模型进行同态加密，得到同态加密后的模型；根据接收到的公钥对所述同态加密后的模型进行加密，得到公钥加密后的模型，并将所述公钥加密后的模型发送至所述路边单元集合；

通过所述路边单元集合利用自身的私钥对各所述数据拥有方发送的所述公钥加密后的模型进行解密，得到多个所述同态加密后的模型；对多个所述同态加密后的模型进行汇总，并将汇总结果反馈至各所述数据拥有方；

通过各所述数据拥有方接收并解密所述汇总结果，聚合解密后的汇总结果，得到并根据聚合结果对所述全局模型进行更新，得到更新后的全局模型；根据所述公钥对所述更新后的全局模型进行加密，并向所述路边单元集合发送加密的所述更新后的全局模型；

通过所述路边单元集合接收并解密加密的更新后的全局模型，得到更新后的全局模型，判断所述更新后的全局模型是否收敛，若不收敛，则向各所述数据拥有方发送所述更新后的全局模型，以使各所述数据拥有方利用自身拥有的数据对所述更新后的全局模型进行更新，直至得到更新后的全局模型收敛；若收敛，则通过所述更新后的全局模型对所述请求数据进行计算，得到预测结果并向所述请求方进行反馈。

本发明的一个实施例中，所述利用路边单元集合基于所述数据请求确定对应的全局模型和多个数据拥有方，包括：

利用路边单元集合基于预先获取的各所述数据拥有方的数据质量指数，选取一个或多个数据质量指数最高的数据拥有方，作为指定数据拥有方；

通过所述指定数据拥有获取所述指定区块中的所述全局模型；利用自身拥有的数据对所述全局模型进行训练，得到本地模型；根据接收到的公钥对所述本地模型进行加密，并将加密后的模型发送至所述路边单元集合。

本发明的一个实施例中，所述通过各所述数据拥有方获取所述指定区块中的所述全局模型；利用自身拥有的数据对所述全局模型进行训练，得到本地模型；对所述本地模型进行同态加密，得到同态加密后的模型；根据接收到的公钥对所述同态加密后的模型进行加密，得到公钥加密后的模型，并将所述公钥加密后的模型发送至所述路边单元集合，包括：

所述路边单元集合包括多个路边单元；

通过各所述数据拥有方获取所述指定区块中的所述全局模型；利用自身拥有的数据对所述全局模型进行训练，得到本地模型；根据路边单元集合中路边单元的个数，对所述本地模型进行分片，得到多个模型分片；基于预设同态加密算法，加密各所述模型分片，得到多个模型分片密文；根据接收到的所述路边单元集合中各路边单元的公钥对各所述模型分片密文进行加密，得到多个秘密分片；将各所述秘密分片发送至所述路边单元集合中的各路边单元；

所述通过所述路边单元集合利用自身的私钥对各所述数据拥有方发送的所述公钥加密后的模型进行解密，得到多个所述同态加密后的模型；对多个所述同态加密后的模型进行汇总，并将汇总结果反馈至各所述数据拥有方，包括：

通过路边单元集合根据所述路边单元集合中各路边单元的私钥对各所述指定数据拥有方发送的各所述秘密分片进行解密，得到多个所述模型分片密文；通过所述路边单元集合中各路边单元，聚合各所述模型分片密文，得到各所述路边单元的聚合密文；将各所述聚合密文发送至所述指定数据拥有方；

所述通过各所述数据拥有方接收并解密所述汇总结果，聚合解密后的汇总结果，得到并根据聚合结果对所述全局模型进行更新，得到更新后的全局模型；根据所述公钥对所述更新后的全局模型进行加密，并向所述路边单元集合发送加密的所述更新后的全局模型，包括：

通过所述指定数据拥有方接收并解密各所述路边单元的聚合密文，聚合解密后的各聚合密文，得到并根据聚合结果对所述全局模型进行更新，得到更新后的全局模型；根据所述公钥对所述更新后的全局模型进行加密，并向所述路边单元集合发送加密的所述更新后的全局模型。

本发明的一个实施例中，所述方法还包括：

通过路边单元集合根据预先计算得到的各所述数据拥有方的数据质量指数，计算各所述数据拥有方的贡献度；基于各所述数据拥有方的贡献度，对所述更新后的全局模型的收益进行分配，并将收益分配结果上传到所述指定区块上。

第三方面，本发明实施例还提供了一种电子设备，包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；

存储器，用于存放计算机程序；

处理器，用于执行存储器上所存放的程序时，实现上述任一所述的方法步骤。

第四方面，本发明实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现上述任一所述的方法步骤。

本发明实施例有益效果：

本发明实施例提供的基于秘密共享和联邦学习的车联网数据共享系统，包括：请求方、路边单元集合和多个数据拥有方；请求方用于向边路节点发送数据请求，路边单元集合用于基于数据请求确定对应的全局模型和多个数据拥有方；获取并将数据拥有方的信息和全局模型上传到区块链的指定区块；将自身的公钥在所述区块链中进行广播；各数据拥有方用于获取指定区块中的全局模型；利用自身拥有的数据对全局模型进行训练，得到本地模型；对本地模型进行同态加密，得到同态加密后的模型；根据接收到的公钥对同态加密后的模型进行加密，得到公钥加密后的模型，并将公钥加密后的模型发送至路边单元集合；路边单元集合还用于利用自身的私钥对各数据拥有方发送的公钥加密后的模型进行解密，得到多个同态加密后的模型；对各同态加密后的模型进行汇总，并将汇总结果反馈至各数据拥有方；各数据拥有方还用于接收并解密汇总结果，聚合解密后的汇总结果，得到并根据聚合结果对全局模型进行更新，得到更新后的全局模型；根据公钥对更新后的全局模型进行加密，并向路边单元集合发送加密的更新后的全局模型。路边单元集合还用于接收并解密加密的更新后的全局模型，得到更新后的全局模型，判断更新后的全局模型是否收敛，若不收敛，则向各数据拥有方发送更新后的全局模型，以使各数据拥有方利用自身拥有的数据对更新后的全局模型进行训练，直至得到更新后的全局模型收敛；若收敛，则通过更新后的全局模型对请求数据进行计算，得到预测结果并向请求方进行反馈。

由此可见，应用上述实施例提供的系统共享数据时，首先通过数据拥有方对本地模型进行同态加密，再将同态加密后的模型基于路边单元集合中的各路边单元的公钥进行二次加密，然后根据路边单元集合对来自各数据拥有方的同态加密后的模型进行汇总，再通过数据拥有方解密汇总结果并对各汇总结果进行聚合得到聚合结果，根据聚合结果来对全局模型进行更新得到更新后的全局模型，再将更新后的全局模型根据公钥加密后发送给路边单元集合，最后通过路边单元集合解密得到更新后的全局模型，在判断更新后的全局模型收敛后，通过收敛的更新后的全局模型来对请求数据进行计算，得到预测结果反馈给请求方，从而能够保证在整个联邦学习过程中，完整的模型无法被路边单元集合、数据拥有方任意一方直接解密得到，使得联邦学习过程中任一方都无法直接获取真实的模型参数，同时也使得模型在传输过程中无法被窃听，并且由于本发明实施例还利用了区块链的存证功能，所以进一步提高了车联网系统在联邦学习过程中共享数据时数据的安全。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，还可以根据这些附图获得其他的实施例。

图1为本发明实施例提供的一种基于秘密共享和联邦学习的车联网数据共享系统的结构示意图；

图2为本发明实施例提供的一种基于秘密共享和联邦学习的车联网数据共享系统的信令流程示意图；

图3为本发明实施例提供的一种基于秘密共享和联邦学习的车联网数据共享方法的流程示意图；

图4为本发明实施例的一种可能的实现方式的示意图；

图5为本发明实施例中步骤S33、步骤S34和步骤S35的一种可能的实现方式的示意图；

图6为本发明实施例的一种可能的实现方式的示意图；

图7为本发明实施例提供的电子设备的一种结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员基于本申请所获得的所有其他实施例，都属于本发明保护的范围。

由于应用现有技术在车联网系统中共享数据时，容易产生数据泄露，为解决这一技术问题，本发明实施例提供了一种基于秘密共享和联邦学习的车联网数据共享系统及方法。

本发明的的第一方面，首先，提供了一种基于秘密共享和联邦学习的车联网数据共享系统，上述系统包括：

请求方、路边单元集合和多个数据拥有方；

请求方，用于向路边单元集合发送数据请求，其中，数据请求包括：数据请求的服务类型和请求数据；

路边单元集合，用于基于数据请求确定对应的全局模型和多个数据拥有方；获取并将多个数据拥有方的信息和全局模型上传到区块链的指定区块；将自身的公钥进行广播；

各数据拥有方，用于获取指定区块中的全局模型；利用自身拥有的数据对全局模型进行训练，得到本地模型；对本地模型进行同态加密，得到同态加密后的模型；根据接收到的公钥对同态加密后的模型进行加密，得到公钥加密后的模型，并将公钥加密后的模型发送至路边单元集合；

路边单元集合，还用于利用自身的私钥对各数据拥有方发送的公钥加密后的模型进行解密，得到多个同态加密后的模型；对多个同态加密后的模型进行汇总，并将汇总结果反馈至各数据拥有方；

各数据拥有方，还用于接收并解密汇总结果，聚合解密后的汇总结果，得到并根据聚合结果对全局模型进行更新，得到更新后的全局模型；根据公钥对更新后的全局模型进行加密，并向路边单元集合发送加密的更新后的全局模型；

路边单元集合，还用于接收并解密加密的更新后的全局模型，得到更新后的全局模型，判断更新后的全局模型是否收敛，若不收敛，则向各数据拥有方发送更新后的全局模型，以使各数据拥有方利用自身拥有的数据对更新后的全局模型进行训练，直至得到更新后的全局模型收敛；若收敛，则通过更新后的全局模型对请求数据进行计算，得到预测结果并向请求方进行反馈。

下面通过具体实施例对本发明实施例提供的基于秘密共享和联邦学习的车联网数据共享系统进行详细说明。

参见图1，提供了一种基于秘密共享和联邦学习的车联网数据共享系统的结构示意图，上述系统包括：请求方101、路边单元集合102和多个数据拥有方103；

请求方101，用于向路边单元集合102发送数据请求，其中，数据请求包括：数据请求的服务类型和请求数据；

路边单元集合102，用于基于数据请求确定对应的全局模型和多个数据拥有方103；获取并将多个数据拥有方103的信息和全局模型上传到区块链的指定区块；将自身的公钥进行广播；

各数据拥有方103，用于获取指定区块中的全局模型；利用自身拥有的数据对全局模型进行训练，得到本地模型；对本地模型进行同态加密，得到同态加密后的模型；根据接收到的公钥对同态加密后的模型进行加密，得到公钥加密后的模型，并将公钥加密后的模型发送至路边单元集合102；

路边单元集合102，还用于利用自身的私钥对各数据拥有方103发送的公钥加密后的模型进行解密，得到多个同态加密后的模型；对多个同态加密后的模型进行汇总，并将汇总结果反馈至各数据拥有方103；

各数据拥有方103，还用于接收并解密汇总结果，聚合解密后的汇总结果，得到并根据聚合结果对全局模型进行更新，得到更新后的全局模型；根据公钥对更新后的全局模型进行加密，并向路边单元集合102发送加密的更新后的全局模型；

路边单元集合102，还用于接收并解密加密的更新后的全局模型，得到更新后的全局模型，判断更新后的全局模型是否收敛，若不收敛，则向各数据拥有方103发送更新后的全局模型，以使各数据拥有方103利用自身拥有的数据对上一轮更新后的全局模型进行训练，直至得到更新后的全局模型收敛；若收敛，则通过收敛后的全局模型对请求数据进行计算，得到预测结果并向请求方101进行反馈。

上述请求方101可以是通信接入车联网系统的一辆车辆，该车辆可以处于行驶过程中，也可以处于静止状态。当该车辆需要请求数据时，可以向路边单元发送数据请求，数据请求中可以包含请求的服务类型和请求的输入数据。例如，数据请求可以是请求车辆附近电影院位置，对应的服务类型为休闲娱乐设施推荐服务，输入数据为车辆当前位置。

上述路边单元集合可以是请求方101在发出数据请求时，请求方101所在的地理位置附近的多个路边单元的集合，可以包括多个路边单元。具体的，路边单元可以是车联网系统中的一个数据处理单元，如车联网系统中的RSU(Road Side Unit，路侧单元)节点等。其中，地理位置距离或网络距离请求方101最近的一个路边单元可以接收请求方101发送的数据请求，该路边单元可以根据所接收到的数据请求中携带的请求的服务类型，确定本次数据请求所对应的联邦学习模型，作为全局模型。

一个例子中，车联网系统可以预先对多种数据请求所请求的服务类型进行总结和分类，对各种服务类型预设对应的模型类型，其中，不同的服务类型可以对应不同类型的模型。上述路边单元可以根据所接收到的数据请求中携带的请求的服务类型，确定该服务类型预设对应的联邦学习模型类型，作为全局模型。

上述全局模型可以是机器学习模型，例如，逻辑回归模型、决策树模型等机器学习模型；也可以是推荐系统等各种深度学习模型。

该路边单元可以根据全局模型的类型，来确定车联网系统中拥有该模型训练过程中所需的数据的车辆，作为数据拥有方103。例如，该路边单元可以收到来自请求方101发起的“前方路段是否堵车”的数据请求，请求数据可以是车辆当前位置。该路边单元可以根据车联网系统中预设对应的模型类型，确定该数据请求对应的模型类型为逻辑回归模型，相对应的数据拥有方103可以为请求方当前位置附近的车辆。

在该路边单元确定全局模型和数据拥有方103之后，可以将上述数据请求、数据拥有方103的信息和全局模型上传到区块链的指定区块。上述数据拥有方103的信息可以是各数据拥有方103的基础信息，例如，各数据拥有方103的身份信息等，也可以是各数据拥有方103所拥有的数据的类型。

上述指定区块可以是区块链中的一个空白区块，上述数据请求、数据拥有方103的信息和全局模型可以作为一次数据请求任务，写入该空白区块，然后上传到区块链上。

一个例子中，上述一次数据请求任务中还可以包括请求方101的身份信息。可以将上述数据请求、数据拥有方103的信息和全局模型，以及请求方101的身份信息作为一次数据请求任务，写入该空白区块，然后上传到区块链上。

在上传完毕后，该路边单元还可以接收上述路边单元集合102中各路边单元发送的加密公钥，并且，可以将所接收到的加密公钥广播给各数据拥有方103，以待后续使用。上述广播加密公钥可以通过区块链来广播给各数据拥有方103，也可以通过相关的广播模型来广播给各数据拥有方103。

由于区块链是公开的，所以上述路边单元确定的各数据拥有方103可以从区块链上直接下载该指定区块，获取指定区块中的上述数据请求、数据拥有方103的信息和全局模型，以及请求方101的身份信息，然后利用各数据拥有方103本地拥有的数据，对全局模型进行训练，得到本地模型。

一个例子中，上述路边单元将数据请求广播给各数据拥有方103时，可以有其中一个数据拥有方率先接收到该数据请求，这个数据拥有方可以作为初始数据拥有方。在上述各数据拥有方103对本地模型进行同态加密的过程中，各数据拥有方103可以将自身的公钥发送至上述初始数据拥有方，然后初始数据拥有方可以在基于预设同态加密算法生成预设钥对后，分别利用所接收到的各数据拥有方103的公钥对预设钥对进行加密，将加密后的预设公私钥对发送至各数据拥有方103。

各数据拥有方103接收到上述加密后的预设钥对后，可以基于上述各数据拥有方103自身的公钥所对应的私钥，解密预设钥对，并基于预设钥对中的公钥对各数据拥有方103本地本地模型进行同态加密。在此之后，各数据拥有方103可以利用接收到的上述路边单元集合102的中各路边单元的公钥，对同态加密后的训练后模型进行二次加密，并将二次加密后的模型发送至路边单元集合102中的各路边单元。

一个例子中，上述预设同态加密算法可以是Paillier(公钥加密)算法，所生成的预设钥对可以是Paillier公私钥对。路边单元集合102中的各路边单元在接收到二次加密后的模型后，可以根据上述路边单元集合102中的各路边单元的公钥对应的私钥，对二次加密后的模型进行解密，来得到多个同态加密后的模型。然后路边单元集合102中的各路边单元可以对各同态加密后的模型进行汇总，并将汇总结果反馈至各数据拥有方103。

各数据拥有方103所接收到汇总结果仍为同态加密后的数据，所以各数据拥有方103在接收到各路边单元发送的汇总结果后，可以根据上述预设钥对中的私钥对汇总结果进行同态解密，然后将解密后的各路边单元的汇总结果进行聚合，得到聚合结果，再根据聚合结果对全局模型进行更新，得到更新后的全局模型，然后将更新后的全局模型再次根据路边单元集合102中的各路边单元的公钥进行加密后，发送至路边单元集合102中上述接收请求方101数据请求，并与请求方101距离最近的一个路边单元。

该路边单元在接收到加密的更新后的全局模型之后，可以根据自身的私钥解密加密的更新后的全局模型，得到更新后的全局模型。此时该路边单元判断更新后的全局模型是否收敛：若不收敛，路边单元可以向各数据拥有方103发送更新后的全局模型，以使各数据拥有方103利用自身拥有的数据对上一轮更新后的全局模型进行训练得到新的本地模型，并迭代重复上述各数据拥有方103和路边单元集合102对本地模型加密、汇总和传输交互的过程，直至得到更新后的全局模型收敛；若收敛，路边单元可以通过收敛的更新后的全局模型对请求数据进行计算，得到预测结果并向请求方101进行反馈。

一个例子中，上述路边单元可以接收到来自多个数据拥有方103发送的加密后的更新后的全局模型，该路边单元可以只判断最先接收到的更新后的全局模型是否收敛，若该更新后的全局模型不收敛，路边单元可以将该更新后的全局模型上传到上述指定区块，并将训练帧广播给数据拥有方103，示意数据拥有方103全局模型已经更新，使得各数据拥有方下载上述指定区块来获取该更新后的全局模型，利用自身拥有的数据对该更新后的全局模型进行训练，进入新一轮的迭代重复训练过程，直到路边单元判断再次接收到的更新后的全局模型收敛。

上述路边单元判断接收到的更新后的全局模型收敛之后，可以将该收敛的更新后的全局模型上传到上述指定区块，并将停止帧广播给数据拥有方103，示意数据拥有方103停止更新全局模型，迭代结束。同时路边单元可以通过该收敛的更新后的全局模型对请求数据进行计算，得到预测结果并向请求方101进行反馈。

上述路边单元将训练帧和停止帧广播给数据拥有方103可以通过区块链来来广播，也可以通过相关的广播模型来广播给数据拥有方103，此处不作限定。

由此可见，应用上述实施例提供的系统共享数据时，首先通过数据拥有方103对本地模型进行同态加密，再将同态加密后的模型基于路边单元集合102中的各路边单元的公钥进行二次加密，然后根据路边单元集合102对来自各数据拥有方103的同态加密后的模型进行汇总，再通过数据拥有方103解密汇总结果并对各汇总结果进行聚合得到聚合结果，根据聚合结果来对全局模型进行更新得到更新后的全局模型，再将更新后的全局模型根据公钥加密后发送给路边单元集合102，最后通过路边单元集合102解密得到更新后的全局模型，在判断更新后的全局模型收敛后，通过收敛的更新后的全局模型来对请求数据进行计算，得到预测结果反馈给请求方101，从而能够保证在整个联邦学习过程中，完整的模型无法被路边单元集合102、数据拥有方103任意一方直接解密得到，使得联邦学习过程中任一方都无法直接获取真实的模型参数，同时也使得模型在传输过程中无法被窃听，并且由于本发明实施例还利用了区块链的存证功能，所以进一步提高了车联网系统在联邦学习过程中共享数据时数据的安全。

本发明的一个实施例中，路边单元集合102还可以基于预先获取的各数据拥有方103的数据质量指数，选取一个或多个数据质量指数最高的数据拥有方103，作为指定数据拥有方，然后通过指定数据拥有方获取指定区块中的全局模型，利用自身拥有的数据对全局模型进行训练，得到本地模型；根据接收到的公钥对本地模型进行加密，并将加密后的模型发送至路边单元集合102。

上述各数据拥有方103的数据质量指数可以通过以下方式来得到：

在各数据拥有方103接收到全局模型后，基于各自的本地数据集，根据预设选择算法生成测试数据集，然后并基于测试数据集对全局模型进行多轮训练，可以得到各数据拥有方103的模型准确率。再根据各数据拥有方103的模型准确率和各数据拥有方103的数据数量，按照以下方式，可以得到数据拥有方103的数据质量指数：

且0≤Q_i≤1

其中，Q_i为数据质量指数，Acc_i为模型准确率，N_i为数据数量。

一个例子中，上述预设选择算法可以是DPGAN(Differentially PrivateGenerative Adversarial Network，差分隐私的生成对抗网络)算法。DPGAN可以通过对本地数据集添加差分隐私噪声，利用GAN(Generative Adversarial Networks，生成式对抗网络)生成不同于本地数据集但仍保存本地数据集统计信息的测试数据集。在保护本地数据集不被泄露的同时，可以利用生成的测试数据集得到该数据训练模型的准确率，从而得到数据质量指数。

由上可见，应用本发明实施例提供的系统共享数据时，路边单元集合102可以根据各数据拥有方103的数据质量指数来选取参与本次数据共享的指定数据拥有方，能够尽可能地避免恶意数据拥有方来参与数据共享，提高了数据的安全性。

为了对上述基于秘密共享和联邦学习的车联网数据共享系统进行说明，如图2所示，本发明实施例还提供了一种基于秘密共享和联邦学习的车联网数据共享系统的信令流程示意图，下面结合图1所示的结构示意图，对本实施例所提供的系统进行说明。

步骤S21：指定数据拥有方根据路边单元集合102中路边单元的个数，对本地模型进行分片，得到多个模型分片；基于预设同态加密算法，加密各模型分片，得到多个模型分片密文；根据接收到的路边单元集合102中各路边单元的公钥对各模型分片密文进行加密，得到多个秘密分片；将各秘密分片发送至路边单元集合102中的各路边单元。

步骤22：路边单元集合102根据路边单元集合102中各路边单元的私钥对各指定数据拥有方发送的各秘密分片进行解密，得到多个模型分片密文；通过路边单元集合102中各路边单元，聚合各模型分片密文，得到各路边单元的聚合密文；将各聚合密文发送至指定数据拥有方。

步骤23：指定数据拥有方接收并解密各路边单元的聚合密文，聚合解密后的各聚合密文，得到并根据聚合结果对全局模型进行更新，得到更新后的全局模型；根据公钥对更新后的全局模型进行加密，并向路边单元集合102发送加密的更新后的全局模型。

上述各指定数据拥有方可以根据路边单元集合102中路边单元的个数，对本地模型进行分片，得到模型分片。在此之后，各指定数据拥有方基于上述预设钥对，对模型分片进行同态加密，来得到模型分片密文。然后再根据路边单元集合102中的各路边单元的公钥对模型分片密文进行二次加密，得到秘密分片，将各秘密分片分别发送至路边单元集合102中的各路边单元。

各路边单元对所接收到的来自各指定数据拥有方的各秘密分片进行解密，得到模型分片密文，将各模型分片密文聚合，得到各路边单元的聚合密文，然后将各聚合密文发送至指定数据拥有方。

上述聚合各模型分片密文，可以通过聚合算法来进行，例如，FedAverage(联邦平均)聚合算法，此处不做具体限定。

指定数据拥有方接收到各路边单元的聚合密文后，根据上述预设钥对的私钥解密各路边单元的聚合密文，然后聚合解密后的各聚合密文，得到聚合结果，再根据各聚合结果对全局模型进行更新，得到更新后的全局模型；根据公钥对更新后的全局模型进行加密，并向路边单元集合102发送加密的更新后的全局模型。

由上可知，应用本发明实施例提供的系统共享数据时，通过指定数据拥有方对模型进行分片后，对模型分片来进行的加密，避免传输过程中以及路边单元集合102接收到的是完整的模型，避免了恶意设备在模型传输过程中的窃听，同时避免了当路边单元出现恶意时数据的泄露，从而更加提高了共享数据时数据的安全性。

本发明的一个实施例中，路边单元集合102可以根据预先计算得到的各数据拥有方103的数据质量指数，计算各数据拥有方103的贡献度；基于各数据拥有方103的贡献度，对更新后的全局模型的收益进行分配，并将收益分配结果上传到指定区块上。

上述更新后的全局模型可以是上文中路边单元集合102判断收敛后的更新后的全局模型，对更新后的全局模型的收益进行分配，可以是对收敛的更新后的全局模型进行分配。

由上可见，应用本发明实施例提供的系统共享数据时，根据各数据拥有方103的数据质量指数分配更新后的全局模型的收益，并将收益分配结果上传到指定区块上，不仅通过这样的激励制度加强了系统内的各数据拥有方的信任，也降低了恶意数据拥有方参与数据共享的可能性。

本发明实施例的第二方面，还提供了一种基于秘密共享和联邦学习的车联网数据共享方法，与上述业务请求系统相对应，如图3所示。图3为本发明实施例提供的一种基于秘密共享和联邦学习的车联网数据共享方法的流程示意图，应用于上述基于秘密共享和联邦学习的车联网数据共享系统，上述方法包括以下步骤S31-S36。

步骤S31：通过请求方向路边单元集合发送数据请求。

其中，数据请求包括：数据请求的服务类型和请求数据。

步骤S32：利用路边单元集合基于数据请求确定对应的全局模型和多个数据拥有方；获取并将多个数据拥有方的信息和全局模型上传到区块链的指定区块；将自身的公钥进行广播。

步骤S33：通过各数据拥有方获取指定区块中的全局模型；利用自身拥有的数据对全局模型进行训练，得到本地模型；对本地模型进行同态加密，得到同态加密后的模型；根据接收到的公钥对同态加密后的模型进行加密，得到公钥加密后的模型，并将公钥加密后的模型发送至路边单元集合。

步骤S34：通过路边单元集合利用自身的私钥对各数据拥有方发送的公钥加密后的模型进行解密，得到多个同态加密后的模型；对多个同态加密后的模型进行汇总，并将汇总结果反馈至各数据拥有方。

步骤S35：通过各数据拥有方接收并解密汇总结果，聚合解密后的汇总结果，得到并根据聚合结果对全局模型进行更新，得到更新后的全局模型；根据公钥对更新后的全局模型进行加密，并向路边单元集合发送加密的更新后的全局模型。

步骤S36：通过路边单元集合接收并解密加密的更新后的全局模型，得到更新后的全局模型，判断更新后的全局模型是否收敛，若不收敛，则向各数据拥有方发送更新后的全局模型，以使各数据拥有方利用自身拥有的数据对更新后的全局模型进行训练，直至得到更新后的全局模型收敛；若收敛，则通过更新后的全局模型对请求数据进行计算，得到预测结果并向请求方进行反馈。

在一种可能的实施方式中，参见图4，上述利用路边单元集合基于数据请求确定对应的全局模型和多个数据拥有方，包括：

步骤S41：利用路边单元集合基于预先获取的各数据拥有方的数据质量指数，选取一个或多个数据质量指数最高的数据拥有方，作为指定数据拥有方。

步骤S42：通过指定数据拥有方获取指定区块中的所述全局模型；利用自身拥有的数据对全局模型进行训练，得到本地模型；根据接收到的公钥对本地模型进行加密，并将加密后的模型发送至路边单元集合。

其中：路边单元集合包括多个路边单元。

由上可见，应用本发明实施例提供的系统共享数据时，路边单元集合可以根据各数据拥有方的数据质量指数来选取参与本次数据共享的指定数据拥有方，能够尽可能地避免恶意数据拥有方来参与数据共享，提高了数据的安全性。

在一种可能的实施方式中，参见图5，上述步骤S33通过各数据拥有方获取指定区块中的全局模型；利用自身拥有的数据对全局模型进行训练，得到本地模型；对本地模型进行同态加密，得到同态加密后的模型；根据接收到的公钥对同态加密后的模型进行加密，得到公钥加密后的模型，并将公钥加密后的模型发送至路边单元集合，包括：

步骤S331：通过各指定数据拥有方获取指定区块中的全局模型；利用自身拥有的数据对全局模型进行训练，得到本地模型；根据路边单元集合中路边单元的个数，对本地模型进行分片，得到多个模型分片；基于预设同态加密算法，加密各模型分片，得到多个模型分片密文；根据接收到的路边单元集合中各路边单元的公钥对各模型分片密文进行加密，得到多个秘密分片；将各秘密分片发送至所述路边单元集合中的各路边单元。

上述步骤S34通过路边单元集合利用自身的私钥对各数据拥有方发送的公钥加密后的模型进行解密，得到多个同态加密后的模型；对多个同态加密后的模型进行汇总，并将汇总结果反馈至各数据拥有方，包括：

步骤S341：通过路边单元集合根据路边单元集合中各路边单元的私钥对各指定数据拥有方发送的各秘密分片进行解密，得到多个模型分片密文；通过路边单元集合中各路边单元，聚合各模型分片密文，得到各路边单元的聚合密文；将各聚合密文发送至指定数据拥有方。

上述步骤S35通过各数据拥有方接收并解密汇总结果，聚合解密后的汇总结果，得到并根据聚合结果对全局模型进行更新，得到更新后的全局模型；根据公钥对更新后的全局模型进行加密，并向路边单元集合发送加密的更新后的全局模型，包括：

步骤S351：通过指定数据拥有方接收并解密各路边单元的聚合密文，聚合解密后的各聚合密文，得到并根据聚合结果，对全局模型进行更新，得到更新后的全局模型；根据公钥对更新后的全局模型进行加密，并向路边单元集合发送加密的更新后的全局模型。

由上可知，应用本发明实施例提供的系统共享数据时，通过指定数据拥有方对模型进行分片后，对模型分片来进行的加密，避免传输过程中以及路边单元集合接收到的是完整的模型，避免了恶意设备在模型传输过程中的窃听，同时避免了当路边单元出现恶意时数据的泄露，从而更加提高了共享数据时数据的安全性。

在一种可能实现的方式中，参见图6，上述方法还包括：

步骤S61：通过路边单元集合根据预先计算得到的各数据拥有方的数据质量指数，计算各数据拥有方的贡献度。

步骤S62：基于各数据拥有方的贡献度，对更新后的全局模型的收益进行分配，并将收益分配结果上传到指定区块上。

由上可见，应用本发明实施例提供的方法共享数据时，根据各数据拥有方的数据质量指数分配更新后的全局模型的收益，并将收益分配结果上传到指定区块上，不仅通过这样的激励制度加强了系统内的各数据拥有方的信任，也降低了恶意数据拥有方参与数据共享的可能性。

本发明实施例还提供了一种电子设备，如图7所示，包括处理器701、通信接口702、存储器703和通信总线704，其中，处理器701，通信接口702，存储器703通过通信总线704完成相互间的通信，

存储器703，用于存放计算机程序；

处理器701，用于执行存储器703上所存放的程序时，实现上述实施例中任一方法步骤。

上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect，PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture，EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示，图中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

通信接口用于上述电子设备与其他设备之间的通信。

存储器可以包括随机存取存储器(Random Access Memory，RAM)，也可以包括非易失性存储器(Non-Volatile Memory，NVM)，例如至少一个磁盘存储器。可选的，存储器还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器可以是通用处理器，包括中央处理器(Central Processing Unit，CPU)、网络处理器(Network Processor，NP)等；还可以是数字信号处理器(Digital SignalProcessor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

在本发明提供的又一实施例中，还提供了一种计算机可读存储介质，该计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现上述任一基于秘密共享和联邦学习的车联网数据共享方法的步骤。

在本发明提供的又一实施例中，还提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述实施例中任一基于秘密共享和联邦学习的车联网数据共享方法。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于方法、电子设备、存储介质和程序产品实施例而言，由于其基本相似于系统实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本发明的较佳实施例，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等，均包含在本发明的保护范围内。

Claims

1.一种基于秘密共享和联邦学习的车联网数据共享系统，其特征在于，所述系统包括：请求方、路边单元集合和多个数据拥有方；

2.根据权利要求1所述的系统，其特征在于，

所述路边单元集合，还用于基于预先获取的各所述数据拥有方的数据质量指数，选取一个或多个数据质量指数最高的数据拥有方，作为指定数据拥有方，通过所述指定数据拥有方获取所述指定区块中的所述全局模型；利用自身拥有的数据对所述全局模型进行训练，得到本地模型；根据接收到的公钥对所述本地模型进行加密，并将加密后的模型发送至所述路边单元集合。

3.根据权利要求2所述的系统，其特征在于，所述路边单元集合包括多个路边单元；

所述路边单元集合，还用于根据所述路边单元集合中各路边单元的私钥对各所述指定数据拥有方发送的各所述秘密分片进行解密，得到多个所述模型分片密文；通过所述路边单元集合中各路边单元，聚合各所述模型分片密文，得到各所述路边单元的聚合密文；将各所述聚合密文发送至所述指定数据拥有方；

所述指定数据拥有方，还用于接收并解密各所述路边单元的聚合密文，聚合解密后的各聚合密文，得到并根据聚合结果对所述全局模型进行更新，得到更新后的全局模型；根据所述公钥对所述更新后的全局模型进行加密，并向所述路边单元集合发送加密的所述更新后的全局模型。

4.根据权利要求1所述的系统，其特征在于，

所述路边单元集合，还用于根据预先计算得到的各所述数据拥有方的数据质量指数，计算各所述数据拥有方的贡献度；基于各所述数据拥有方的贡献度，对所述更新后的全局模型的收益进行分配，并将收益分配结果上传到所述指定区块上。

5.一种基于秘密共享和联邦学习的车联网数据共享方法，其特征在于，应用于基于秘密共享和联邦学习的车联网数据共享系统，所述方法包括：

通过所述路边单元集合接收并解密加密的更新后的全局模型，得到更新后的全局模型，判断所述更新后的全局模型是否收敛，若不收敛，则向各所述数据拥有方发送所述更新后的全局模型，以使各所述数据拥有方利用自身拥有的数据对所述更新后的全局模型进行训练，直至得到更新后的全局模型收敛；若收敛，则通过所述更新后的全局模型对所述请求数据进行计算，得到预测结果并向所述请求方进行反馈。

6.根据权利要求5所述的方法，其特征在于，所述利用路边单元集合基于所述数据请求确定对应的全局模型和多个数据拥有方，包括：

通过所述指定数据拥有方获取所述指定区块中的所述全局模型；利用自身拥有的数据对所述全局模型进行训练，得到本地模型；根据接收到的公钥对所述本地模型进行加密，并将加密后的模型发送至所述路边单元集合。

7.根据权利要求5-6任一项中所述的方法，其特征在于，所述通过各所述数据拥有方获取所述指定区块中的所述全局模型；利用自身拥有的数据对所述全局模型进行训练，得到本地模型；对所述本地模型进行同态加密，得到同态加密后的模型；根据接收到的公钥对所述同态加密后的模型进行加密，得到公钥加密后的模型，并将所述公钥加密后的模型发送至所述路边单元集合，包括：

所述路边单元集合包括多个路边单元；

通过各所述指定数据拥有方获取所述指定区块中的所述全局模型；利用自身拥有的数据对所述全局模型进行训练，得到本地模型；根据路边单元集合中路边单元的个数，对所述本地模型进行分片，得到多个模型分片；基于预设同态加密算法，加密各所述模型分片，得到多个模型分片密文；根据接收到的所述路边单元集合中各路边单元的公钥对各所述模型分片密文进行加密，得到多个秘密分片；将各所述秘密分片发送至所述路边单元集合中的各路边单元；

8.根据权利要求5所述的方法，其特征在于，所述方法还包括：

9.一种电子设备，其特征在于，包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；

存储器，用于存放计算机程序；

处理器，用于执行存储器上所存放的程序时，实现权利要求5-8任一所述的方法步骤。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现权利要求5-8任一所述的方法步骤。