CN112990612B

CN112990612B - 一种基于联邦学习的预测系统及方法

Info

Publication number: CN112990612B
Application number: CN202110532140.3A
Authority: CN
Inventors: 路博; 宋志明; 戚惠敏; 杨成林; 严彪
Original assignee: Hunan Sanxiang Bank Co Ltd
Current assignee: Hunan Sanxiang Bank Co Ltd
Priority date: 2021-05-17
Filing date: 2021-05-17
Publication date: 2021-08-10
Anticipated expiration: 2041-05-17
Also published as: CN112990612A

Abstract

本发明涉及一种基于联邦学习的预测系统及方法，包括：收集单元，用以收集用户预测请求以确定用户预测请求的关键词数量和实际数据长度；对齐单元，用以将所述收集单元收集到的预测请求进行数据对齐；联邦学习单元，用以将已经对齐的数据进行预测以得到预测结果；反馈单元，用以将预测结果反馈至发出预测请求的用户；控制单元，其分别与所述收集单元和所述对齐单元连接，用以控制用户的预测请求对应数据的对齐过程；从而能够根据关键词数量确定数据长度，进而根据数据长度确定数据容量，进而通过数据容量差值对数据容量进行精确确定以准确判断数据是否对齐，进而能够在确保数据对齐的情况下获得更为准确的预测结果，有效提高了预测结果的准确率。

Description

一种基于联邦学习的预测系统及方法

技术领域

本发明涉及人工智能技术领域，尤其涉及一种基于联邦学习的预测系统及方法。

背景技术

联邦机器学习(Federated machine learning/Federated Learning)，又名联邦学习，联合学习，联盟学习。联邦机器学习是一个机器学习框架，能有效帮助多个机构在满足用户隐私保护、数据安全和政府法规的要求下，进行数据使用和机器学习建模。

经历了多年发展，人工智能进入了发展的深入区，已经从概念普及发展到产品验证、落地、审批、商业化方面的探索。

目前，人工智能在各产业的发展需要通过多种工具或设备来收集数据，然而在很多行业，获取高质量的数据难度较大，一方面是由于数据预处理、标注需要投入的工作量巨大，另一方面在于数据的隐私性要求，数据拥有方采取高度保护措施。典型地例如在医疗行业，当前医疗领域标注的数据非常有限，如果多方医疗机构不进行数据交换和整合，则通过人工智能模型训练和预测得到的效果指标不理想，难以落地应用；研究界和企业界目前的情况是把收集数据和使用数据分开，如A方收集数据、B方清洗数据、C方建模训练、D方使用模型。然而，这种数据在实体间转移、交换和交易的形式违反了欧盟在2018年正式施行的法案《通用数据保护条例》(General Data Protection Regulation，GDPR)和中国从2017年实施的《中华人民共和国网络安全法》和《中华人民共和国民法总则》。

所以，通过收集数据的方式进行人工智能模型训练和使用已经不能满足例如医疗等特定行业发展的需求。在数据信息爆炸的时代，数据的网络传输、数据交互范围逐步扩大，为人们信息共享提供便捷，但是在数据网络传输、数据交互过程中存在安全隐患，数据信息被窃取，隐私可能暴露给不可信的第三方，而且在数据传输、数据交互过程中，容易出现信息的不对称性，数据信息中样本编号或者用户编号不同，无法实现数据之间准确的共享，因而，无法在保证数据安全的前提下，进行数据之前准确的对齐共享。

目前，已经有一些基于联邦学习的预测系统及方法，但普遍不能不能通过数据容量差值对数据容量进行精确确定以准确判断数据是否对齐，进而提高预测结果的准确率。

发明内容

为此，本发明提供一种基于联邦学习的预测系统及方法，可以有效解决现有技术中不能通过数据容量差值对数据容量进行精确确定以准确判断数据是否对齐进而导致预测结果准确率低的技术问题。

为实现上述目的，本发明提供一种基于联邦学习的预测系统及方法，包括：

收集单元，用以收集用户预测请求以确定用户预测请求的关键词数量和实际数据长度；

对齐单元，其与所述收集单元连接，用以将所述收集单元收集到的预测请求进行数据对齐；

联邦学习单元，其与所述对齐单元连接，用以将已经对齐的数据进行预测以得到预测结果；

反馈单元，其与所述联邦学习单元连接，用以将预测结果反馈至发出预测请求的用户；

控制单元，其分别与所述收集单元和所述对齐单元连接，用以控制用户的预测请求对应数据的对齐过程；

所述用户的预测请求在进行数据对齐时，所述控制单元将实际数据容量A与标准数据容量进行比较以确定数据是否对齐，将数据容量差值P与标准数据容量差值进行比较以确定对齐补偿参数和数据容量调节量△Q并根据预设公式确定调节后数据容量Q’，将调节后数据容量Q’与标准数据容量进行比较以再次确定数据是否对齐；

所述实际数据容量A根据实际数据长度R和数据容量计算参数确定；

所述实际数据长度R根据数据关键词数量确定。

进一步地，所述用户的预测请求在进行数据对齐时，所述控制单元获取预测请求的数据的数据容量并将其设置为实际数据容量A，设置完成时，控制单元将实际数据容量A与标准数据容量进行比较以确定数据是否对齐，控制单元判定数据已对齐时将用户的预测请求传输至所述联邦学习单元进行预测以得到预测结果，控制单元判定数据未对齐时计算数据容量差值；

其中，所述控制单元设置有标准数据容量，包括标准数据第一容量Q1和标准数据第二容量Q2，其中，Q1＜Q2；

若A＜Q1，所述控制单元判定数据未对齐；

若Q1≤A≤Q2，所述控制单元判定数据已对齐；

若A＞Q2，所述控制单元判定数据未对齐。

进一步地，所述控制单元判定数据未对齐时，控制单元计算数据容量差值P，计算完成时，控制单元将数据容量差值P与标准数据容量差值进行比较以确定对齐补偿参数，控制单元确定对齐补偿参数为σi时计算数据容量调节量△Q，设定△Q=σi×P，i=1，2,3,4；

其中，所述控制单元还设置有标准数据容量差值和标准对齐补偿参数，所述标准数据容量差值包括标准数据容量第一差值P1，标准数据容量第二差值P2和标准数据容量第三差值P3，其中，P1＜P2＜P3；所述标准对齐补偿参数包括第一标准对齐补偿参数σ1，第二标准对齐补偿参数σ2，第三标准对齐补偿参数σ3和第四标准对齐补偿参数σ4，其中，σ1+σ2+σ3+σ4=1；

若P＜P1，所述控制单元判定对齐补偿参数为σ1；

若P1≤P＜P2，所述控制单元判定对齐补偿参数为σ2；

若P2≤P＜P3，所述控制单元判定对齐补偿参数为σ3；

若P≥P3，所述控制单元判定对齐补偿参数为σ4。

进一步地，所述控制单元确定数据容量调节量△Q时，控制单元计算调节后数据容量Q’,其计算公式如下：

Q’=A±△Q；

式中，A表示实际数据容量，当A＜Q1时，Q’=A+△Q，当A＞Q2时，Q’=A-△Q。

进一步地，所述控制单元确定调节后数据容量Q’时，控制单元将调节后数据容量Q’与标准数据容量进行比较以再次确定数据是否对齐，控制单元判定数据已对齐时将用户的预测请求传输至所述联邦学习单元进行预测以得到预测结果，控制单元判定数据未对齐时重新收集用户的预测请求；

若Q'＜Q1，所述控制单元判定数据未对齐；

若Q1≤Q'≤Q2，所述控制单元判定数据已对齐；

若Q'＞Q2，所述控制单元判定数据未对齐。

进一步地，所述控制单元判定数据未对齐时，控制单元计算数据容量差值P，其计算公式如下：

P=Q1-A或P=A-Q2；

式中，A表示是数据容量，Q1表示标准数据第一容量，Q2表示标准数据第二容量，当A＜Q1时，P=Q1-A，当A＞Q2时，P=A-Q2。

进一步地，所述用户的预测请求在进行数据对齐时，所述控制单元获取预测请求的数据的数据长度并将其设置为实际数据长度R，设置完成时，控制单元将实际数据长度R与预设数据长度进行比较以确定数据容量计算参数；

其中，所述控制单元还设置有预设数据长度和标准数据容量计算参数，所述预设数据长度包括第一预设数据长度R1,第二预设数据长度R2和第三预设数据长度R3，其中，R1＜R2＜R3；所述标准数据容量计算参数包括标准数据容量第一计算参数σ1，标准数据容量第二计算参数σ2，标准数据容量第三计算参数σ3和标准数据容量第四计算参数σ4，其中，σ1+σ2+σ3+σ4=2；

若R＜R1，所述控制单元判定数据容量计算参数为σ1；

若R1≤R＜R2，所述控制单元判定数据容量计算参数为σ2；

若R2≤R＜R3，所述控制单元判定数据容量计算参数为σ3；

若R≥R3，所述控制单元判定数据容量计算参数为σ4。

进一步地，所述控制单元确定数据容量计算参数为σi时，控制单元计算实际数据容量A，设定A=R×σi，i=1，2,3,4。

进一步地，所述用户的预测请求在进行数据对齐时，所述控制单元获取用户的预测请求的关键词数量并将其设置为K，设置完成时，控制单元将关键词数量K与预设关键词数量进行比较以确定实际数据长度R；

其中，所述控制单元还设置有预设关键词数量和标准数据长度，包括第一预设关键词数量K01,第二预设关键词数量K02和第三预设关键词数量K03，其中，K01＜K02＜K03；所述标准数据长度包括第一标准数据长度L1，第二标准数据长度L2，第三标准数据长度L3和第四标准数据长度L4，其中，L1＜L2＜L3＜L4；

若K＜K01，所述控制单元判定实际数据长度为L1；

若K01≤K＜K02，所述控制单元判定实际数据长度为L2；

若K02≤K＜K03，所述控制单元判定实际数据长度为L3；

若K≥K03，所述控制单元判定实际数据长度为L4。

进一步地，包括：

步骤S1，收集单元收集用户的预测请求并将其传输至对齐单元进行数据对齐；

步骤S2，控制单元将对所述齐单元接收到的数据进行数据对齐后传输至联邦学习单元进行预测以得到预测结果；

步骤S3，反馈单元将所述预测结果反馈至发出预测请求的用户并收集用户的反馈信息；

步骤S4，所述联邦学习单元根据用户的反馈信息对预测结果进行优化并将优化后的预测结果进行储存并通过所述反馈单元将优化后的预测结果反馈至用户。

与现有技术相比，本发明的有益效果在于，本发明通过设置控制单元和对齐单元，在用户的预测请求数据进行数据对齐时，通过将实际数据容量与标准数据容量进行比较以确定数据是否对齐，将数据容量差值与标准数据容量差值进行比较以确定对齐补偿参数和数据容量调节量，并根据预设公式确定调节后数据容量，将调节后数据容量与标准数据容量进行比较以再次确定数据是否对齐，其中，实际数据容量根据实际数据长度和数据容量计算参数确定，实际数据长度根据数据关键词数量确定。从而能够根据关键词数量确定数据长度，进而根据数据长度确定数据容量，进而通过数据容量差值对数据容量进行精确确定以准确判断数据是否对齐，进而能够在确保数据对齐的情况下获得更为准确的预测结果，有效提高了预测结果的准确率。

进一步地，本发明通过将将实际数据容量A与标准数据容量进行比较以确定数据是否对齐，将数据容量差值P与标准数据容量差值进行比较以确定对齐补偿参数和数据容量调节量△Q并根据预设公式确定调节后数据容量Q’，将调节后数据容量Q’与标准数据容量进行比较以再次确定数据是否对齐，其中，实际数据容量A根据实际数据长度R和数据容量计算参数确定，实际数据长度R根据数据关键词数量确定。从而能够根据关键词数量确定数据长度，进而根据数据长度确定数据容量，进而通过数据容量差值对数据容量进行精确确定以准确判断数据是否对齐，进而能够在确保数据对齐的情况下获得更为准确的预测结果，有效提高了预测结果的准确率。

进一步地，本发明通过将实际数据容量A与标准数据容量进行比较以确定数据是否对齐，从而能够根据关键词数量确定数据长度，进而根据数据长度确定数据容量，进而通过数据容量差值对数据容量进行精确确定以准确判断数据是否对齐，进而能够在确保数据对齐的情况下获得更为准确的预测结果，有效提高了预测结果的准确率。

进一步地，本发明通过将数据容量差值P与标准数据容量差值进行比较以确定对齐补偿参数，进而通过预设公式确定数据容量调节量△Q，从而能够根据关键词数量确定数据长度，进而根据数据长度确定数据容量，进而通过数据容量差值对数据容量进行精确确定以准确判断数据是否对齐，进而能够在确保数据对齐的情况下获得更为准确的预测结果，有效提高了预测结果的准确率。

进一步地，本发明通过将调节后数据容量Q’与标准数据容量进行比较以再次确定数据是否对齐，从而能够根据关键词数量确定数据长度，进而根据数据长度确定数据容量，进而通过数据容量差值对数据容量进行精确确定以准确判断数据是否对齐，进而能够在确保数据对齐的情况下获得更为准确的预测结果，有效提高了预测结果的准确率。

进一步地，本发明通过将实际数据长度R与预设数据长度进行比较以确定数据容量计算参数，从而能够根据关键词数量确定数据长度，进而根据数据长度确定数据容量，进而通过数据容量差值对数据容量进行精确确定以准确判断数据是否对齐，进而能够在确保数据对齐的情况下获得更为准确的预测结果，有效提高了预测结果的准确率。

进一步地，本发明通过结合数据容量计算参数并结合预设公式确定实际数据容量A，从而能够根据关键词数量确定数据长度，进而根据数据长度确定数据容量，进而通过数据容量差值对数据容量进行精确确定以准确判断数据是否对齐，进而能够在确保数据对齐的情况下获得更为准确的预测结果，有效提高了预测结果的准确率。

进一步地，本发明通过将关键词数量K与预设关键词数量进行比较以确定实际数据长度R，从而能够根据关键词数量确定数据长度，进而根据数据长度确定数据容量，进而通过数据容量差值对数据容量进行精确确定以准确判断数据是否对齐，进而能够在确保数据对齐的情况下获得更为准确的预测结果，有效提高了预测结果的准确率。

附图说明

图1为本发明实施例基于联邦学习的预测系统的结构示意图；

图2为本发明实施例基于联邦学习的预测方法的流程示意图；

图中标记说明：1、收集单元；11、第一传输单元；2、对齐单元；21、第二传输单元；3、联邦学习单元；31、第三传输单元；4、反馈单元；5、控制单元。

具体实施方式

为了使本发明的目的和优点更加清楚明白，下面结合实施例对本发明作进一步描述；应当理解，此处所描述的具体实施例仅仅用于解释本发明，并不用于限定本发明。

下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是，这些实施方式仅仅用于解释本发明的技术原理，并非在限制本发明的保护范围。

需要说明的是，在本发明的描述中，术语“上”、“下”、“左”、“右”、“内”、“外”等指示的方向或位置关系的术语是基于附图所示的方向或位置关系，这仅仅是为了便于描述，而不是指示或暗示所述装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。

此外，还需要说明的是，在本发明的描述中，除非另有明确的规定和限定，术语“安装”、“相连”、“连接”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通。对于本领域技术人员而言，可根据具体情况理解上述术语在本发明中的具体含义。

请参阅图1和图2所示，图1为本发明实施例基于联邦学习的预测系统的结构示意图，图2为本发明实施例基于联邦学习的预测方法的流程示意图，本实施例的基于联邦学习的预测系统，包括：

收集单元1，用以收集用户预测请求以确定用户预测请求的关键词数量和实际数据长度；

对齐单元2，其与所述收集单元1连接，用以将所述收集单元1收集到的预测请求进行数据对齐；

联邦学习单元3，其与所述对齐单元连接，用以将已经对齐的数据进行预测以得到预测结果；

反馈单元4，其与所述联邦学习单元3连接，用以将预测结果反馈至发出预测请求的用户；

控制单元5，其分别与所述收集单元1和所述对齐单元2连接，用以控制用户的预测请求对应数据的对齐过程；

所述用户的预测请求在进行数据对齐时，所述控制单元5将实际数据容量A与标准数据容量进行比较以确定数据是否对齐，将数据容量差值P与标准数据容量差值进行比较以确定对齐补偿参数和数据容量调节量△Q并根据预设公式确定调节后数据容量Q’，将调节后数据容量Q’与标准数据容量进行比较以再次确定数据是否对齐；

所述实际数据长度R根据数据关键词数量确定。

具体而言，本发明通过将将实际数据容量A与标准数据容量进行比较以确定数据是否对齐，将数据容量差值P与标准数据容量差值进行比较以确定对齐补偿参数和数据容量调节量△Q并根据预设公式确定调节后数据容量Q’，将调节后数据容量Q’与标准数据容量进行比较以再次确定数据是否对齐，其中，实际数据容量A根据实际数据长度R和数据容量计算参数确定，实际数据长度R根据数据关键词数量确定。从而能够根据关键词数量确定数据长度，进而根据数据长度确定数据容量，进而通过数据容量差值对数据容量进行精确确定以准确判断数据是否对齐，进而能够在确保数据对齐的情况下获得更为准确的预测结果，有效提高了预测结果的准确率。

继续参阅图1所示，传输单元，其分别与所述收集单元1、所述对齐单元2、所述联邦学习单元3、所述反馈单元4和所述控制单元5连接，包括第一传输单元11、第二传输单元21和第三传输单元31，第一传输单元11分别与收集单元1和对齐单元2连接以将收集单元1收集到的数据传递至对齐单元2，第二传输单元21分别与对齐单元2和联邦学习单元3连接以将对齐单元2对齐的数据传递至联邦学习单元3进行预测，第三传输单元31分别与联邦学习单元3和反馈单元4连接以将联邦学习单元3的预测结果传输至反馈单元4进行用户反馈并将用户的反馈结果从反馈单元4传递至联邦学习单元3。

具体而言，所述用户的预测请求在进行数据对齐时，所述控制单元5获取预测请求的数据的数据容量并将其设置为实际数据容量A，设置完成时，控制单元5将实际数据容量A与标准数据容量进行比较以确定数据是否对齐，控制单元5判定数据已对齐时将用户的预测请求传输至所述联邦学习单元3进行预测以得到预测结果，控制单元5判定数据未对齐时计算数据容量差值；

其中，所述控制单元5设置有标准数据容量，包括标准数据第一容量Q1和标准数据第二容量Q2，其中，Q1＜Q2；

若A＜Q1，所述控制单元5判定数据未对齐；

若Q1≤A≤Q2，所述控制单元5判定数据已对齐；

若A＞Q2，所述控制单元5判定数据未对齐。

本实施例中，数据容量过小或者过小，可能是加密过程中引入了其他数据以致预测请求的数据容量发生变化，因此，数据容量在预设的适宜范围内才能显示数据对齐。控制单元5内设置有PLC控制板。

具体而言，本发明通过将实际数据容量A与标准数据容量进行比较以确定数据是否对齐，从而能够根据关键词数量确定数据长度，进而根据数据长度确定数据容量，进而通过数据容量差值对数据容量进行精确确定以准确判断数据是否对齐，进而能够在确保数据对齐的情况下获得更为准确的预测结果，有效提高了预测结果的准确率。

具体而言，所述控制单元5判定数据未对齐时，控制单元5计算数据容量差值P，计算完成时，控制单元5将数据容量差值P与标准数据容量差值进行比较以确定对齐补偿参数，控制单元5确定对齐补偿参数为σi时计算数据容量调节量△Q，设定△Q=σi×P，i=1，2,3,4；

其中，所述控制单元5还设置有标准数据容量差值和标准对齐补偿参数，所述标准数据容量差值包括标准数据容量第一差值P1，标准数据容量第二差值P2和标准数据容量第三差值P3，其中，P1＜P2＜P3；所述标准对齐补偿参数包括第一标准对齐补偿参数σ1，第二标准对齐补偿参数σ2，第三标准对齐补偿参数σ3和第四标准对齐补偿参数σ4，其中，σ1+σ2+σ3+σ4=1；

若P＜P1，所述控制单元5判定对齐补偿参数为σ1；

若P1≤P＜P2，所述控制单元5判定对齐补偿参数为σ2；

若P2≤P＜P3，所述控制单元5判定对齐补偿参数为σ3；

若P≥P3，所述控制单元5判定对齐补偿参数为σ4。

具体而言，本发明通过将数据容量差值P与标准数据容量差值进行比较以确定对齐补偿参数，进而通过预设公式确定数据容量调节量△Q，从而能够根据关键词数量确定数据长度，进而根据数据长度确定数据容量，进而通过数据容量差值对数据容量进行精确确定以准确判断数据是否对齐，进而能够在确保数据对齐的情况下获得更为准确的预测结果，有效提高了预测结果的准确率。

具体而言，所述控制单元5确定数据容量调节量△Q时，控制单元5计算调节后数据容量Q’,其计算公式如下：

Q’=A±△Q；

具体而言，所述控制单元5确定调节后数据容量Q’时，控制单元5将调节后数据容量Q’与标准数据容量进行比较以再次确定数据是否对齐，控制单元5判定数据已对齐时将用户的预测请求传输至所述联邦学习单元3进行预测以得到预测结果，控制单元5判定数据未对齐时重新收集用户的预测请求；

若Q'＜Q1，所述控制单元5判定数据未对齐；

若Q1≤Q'≤Q2，所述控制单元5判定数据已对齐；

若Q'＞Q2，所述控制单元5判定数据未对齐。

具体而言，本发明通过将调节后数据容量Q’与标准数据容量进行比较以再次确定数据是否对齐，从而能够根据关键词数量确定数据长度，进而根据数据长度确定数据容量，进而通过数据容量差值对数据容量进行精确确定以准确判断数据是否对齐，进而能够在确保数据对齐的情况下获得更为准确的预测结果，有效提高了预测结果的准确率。

具体而言，所述控制单元5判定数据未对齐时，控制单元5计算数据容量差值P，其计算公式如下：

P=Q1-A或P=A-Q2；

具体而言，所述用户的预测请求在进行数据对齐时，所述控制单元5获取预测请求的数据的数据长度并将其设置为实际数据长度R，设置完成时，控制单元5将实际数据长度R与预设数据长度进行比较以确定数据容量计算参数；

其中，所述控制单元5还设置有预设数据长度和标准数据容量计算参数，所述预设数据长度包括第一预设数据长度R1,第二预设数据长度R2和第三预设数据长度R3，其中，R1＜R2＜R3；所述标准数据容量计算参数包括标准数据容量第一计算参数σ1，标准数据容量第二计算参数σ2，标准数据容量第三计算参数σ3和标准数据容量第四计算参数σ4，其中，σ1+σ2+σ3+σ4=2；

若R＜R1，所述控制单元5判定数据容量计算参数为σ1；

若R1≤R＜R2，所述控制单元5判定数据容量计算参数为σ2；

若R2≤R＜R3，所述控制单元5判定数据容量计算参数为σ3；

若R≥R3，所述控制单元5判定数据容量计算参数为σ4。

具体而言，本发明通过将实际数据长度R与预设数据长度进行比较以确定数据容量计算参数，从而能够根据关键词数量确定数据长度，进而根据数据长度确定数据容量，进而通过数据容量差值对数据容量进行精确确定以准确判断数据是否对齐，进而能够在确保数据对齐的情况下获得更为准确的预测结果，有效提高了预测结果的准确率。

具体而言，所述控制单元5确定数据容量计算参数为σi时，控制单元5计算实际数据容量A，设定A=R×σi，i=1，2,3,4。

具体而言，本发明通过结合数据容量计算参数并结合预设公式确定实际数据容量A，从而能够根据关键词数量确定数据长度，进而根据数据长度确定数据容量，进而通过数据容量差值对数据容量进行精确确定以准确判断数据是否对齐，进而能够在确保数据对齐的情况下获得更为准确的预测结果，有效提高了预测结果的准确率。

具体而言，所述用户的预测请求在进行数据对齐时，所述控制单元5获取用户的预测请求的关键词数量并将其设置为K，设置完成时，控制单元5将关键词数量K与预设关键词数量进行比较以确定实际数据长度R；

其中，所述控制单元5还设置有预设关键词数量和标准数据长度，包括第一预设关键词数量K01,第二预设关键词数量K02和第三预设关键词数量K03，其中，K01＜K02＜K03；所述标准数据长度包括第一标准数据长度L1，第二标准数据长度L2，第三标准数据长度L3和第四标准数据长度L4，其中，L1＜L2＜L3＜L4；

若K＜K01，所述控制单元5判定实际数据长度为L1；

若K01≤K＜K02，所述控制单元5判定实际数据长度为L2；

若K02≤K＜K03，所述控制单元5判定实际数据长度为L3；

若K≥K03，所述控制单元5判定实际数据长度为L4。

本实施例中，标准数据长度仅用以确定实际数据长度，与上述预设数据长度之间没有关系。

具体而言，本发明通过将关键词数量K与预设关键词数量进行比较以确定实际数据长度R，从而能够根据关键词数量确定数据长度，进而根据数据长度确定数据容量，进而通过数据容量差值对数据容量进行精确确定以准确判断数据是否对齐，进而能够在确保数据对齐的情况下获得更为准确的预测结果，有效提高了预测结果的准确率。

参阅图2所示，本实施例的基于联邦学习的预测方法，包括：

步骤S1，收集单元1收集用户的预测请求并将其传输至对齐单元2进行数据对齐；

步骤S2，控制单元5将对所述齐单元接收到的数据进行数据对齐后传输至联邦学习单元3进行预测以得到预测结果；

步骤S3，反馈单元4将所述预测结果反馈至发出预测请求的用户并收集用户的反馈信息；

步骤S4，所述联邦学习单元3根据用户的反馈信息对预测结果进行优化并将优化后的预测结果进行储存并通过所述反馈单元4将优化后的预测结果反馈至用户。

本实施例中，联邦学习单元3并非收到用户对预测结果的任何反馈信息都会进行优化，会先进行是否需要进行优化判断，若确实需要进行优化后才会进行优化，若经过判断无需进行优化，则联邦学习单元3也会将该不能优化的情况经过反馈单元4反馈至用户。

至此，已经结合附图所示的优选实施方式描述了本发明的技术方案，但是，本领域技术人员容易理解的是，本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下，本领域技术人员可以对相关技术特征做出等同的更改或替换，这些更改或替换之后的技术方案都将落入本发明的保护范围之内。

Claims

1.一种基于联邦学习的预测系统，其特征在于，包括：

所述实际数据长度R根据数据关键词数量确定；

所述用户的预测请求在进行数据对齐时，所述控制单元获取预测请求的数据的数据容量并将其设置为实际数据容量A，设置完成时，控制单元将实际数据容量A与标准数据容量进行比较以确定数据是否对齐，控制单元判定数据已对齐时将用户的预测请求传输至所述联邦学习单元进行预测以得到预测结果，控制单元判定数据未对齐时计算数据容量差值；

若A＜Q1，所述控制单元判定数据未对齐；

若Q1≤A≤Q2，所述控制单元判定数据已对齐；

若A＞Q2，所述控制单元判定数据未对齐；

所述控制单元判定数据未对齐时，控制单元计算数据容量差值P，计算完成时，控制单元将数据容量差值P与标准数据容量差值进行比较以确定对齐补偿参数，控制单元确定对齐补偿参数为σi时计算数据容量调节量△Q，设定△Q=σi×P，i=1，2,3,4；

若P＜P1，所述控制单元判定对齐补偿参数为σ1；

若P1≤P＜P2，所述控制单元判定对齐补偿参数为σ2；

若P2≤P＜P3，所述控制单元判定对齐补偿参数为σ3；

若P≥P3，所述控制单元判定对齐补偿参数为σ4；

所述控制单元确定数据容量调节量△Q时，控制单元计算调节后数据容量Q’,其计算公式如下：

Q’=A±△Q；

式中，A表示实际数据容量，当A＜Q1时，Q’=A+△Q，当A＞Q2时，Q’=A-△Q；

所述控制单元确定调节后数据容量Q’时，控制单元将调节后数据容量Q’与标准数据容量进行比较以再次确定数据是否对齐，控制单元判定数据已对齐时将用户的预测请求传输至所述联邦学习单元进行预测以得到预测结果，控制单元判定数据未对齐时重新收集用户的预测请求；

若Q'＜Q1，所述控制单元判定数据未对齐；

若Q1≤Q'≤Q2，所述控制单元判定数据已对齐；

若Q'＞Q2，所述控制单元判定数据未对齐。

2.根据权利要求1所述的基于联邦学习的预测系统，其特征在于，所述控制单元判定数据未对齐时，控制单元计算数据容量差值P，其计算公式如下：

P=Q1-A或P=A-Q2；

3.根据权利要求1所述的基于联邦学习的预测系统，其特征在于，所述用户的预测请求在进行数据对齐时，所述控制单元获取预测请求的数据的数据长度并将其设置为实际数据长度R，设置完成时，控制单元将实际数据长度R与预设数据长度进行比较以确定数据容量计算参数；

其中，所述控制单元还设置有预设数据长度和标准数据容量计算参数，所述预设数据长度包括第一预设数据长度R1,第二预设数据长度R2和第三预设数据长度R3，其中，R1＜R2＜R3；所述标准数据容量计算参数包括标准数据容量第一计算参数δ1，标准数据容量第二计算参数δ2，标准数据容量第三计算参数δ3和标准数据容量第四计算参数δ4，其中，δ1+δ2+δ3+δ4=2；

若R＜R1，所述控制单元判定数据容量计算参数为δ1；

若R1≤R＜R2，所述控制单元判定数据容量计算参数为δ2；

若R2≤R＜R3，所述控制单元判定数据容量计算参数为δ3；

若R≥R3，所述控制单元判定数据容量计算参数为δ4。

4.根据权利要求3所述的基于联邦学习的预测系统，其特征在于，所述控制单元确定数据容量计算参数为δi时，控制单元计算实际数据容量A，设定A=R×δi，i=1，2,3,4。

5.根据权利要求4所述的基于联邦学习的预测系统，其特征在于，所述用户的预测请求在进行数据对齐时，所述控制单元获取用户的预测请求的关键词数量并将其设置为K，设置完成时，控制单元将关键词数量K与预设关键词数量进行比较以确定实际数据长度R；

若K＜K01，所述控制单元判定实际数据长度为L1；

若K01≤K＜K02，所述控制单元判定实际数据长度为L2；

若K02≤K＜K03，所述控制单元判定实际数据长度为L3；

若K≥K03，所述控制单元判定实际数据长度为L4。

6.一种用于权利要求1-5任一所述的基于联邦学习的预测系统的基于联邦学习的预测方法，其特征在于，包括：