CN112990612A - 一种基于联邦学习的预测系统及方法 - Google Patents

一种基于联邦学习的预测系统及方法 Download PDF

Info

Publication number
CN112990612A
CN112990612A CN202110532140.3A CN202110532140A CN112990612A CN 112990612 A CN112990612 A CN 112990612A CN 202110532140 A CN202110532140 A CN 202110532140A CN 112990612 A CN112990612 A CN 112990612A
Authority
CN
China
Prior art keywords
data
control unit
data capacity
capacity
standard
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110532140.3A
Other languages
English (en)
Other versions
CN112990612B (zh
Inventor
路博
宋志明
戚惠敏
杨成林
严彪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan Sanxiang Bank Co Ltd
Original Assignee
Hunan Sanxiang Bank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan Sanxiang Bank Co Ltd filed Critical Hunan Sanxiang Bank Co Ltd
Priority to CN202110532140.3A priority Critical patent/CN112990612B/zh
Publication of CN112990612A publication Critical patent/CN112990612A/zh
Application granted granted Critical
Publication of CN112990612B publication Critical patent/CN112990612B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Operations Research (AREA)
  • Data Mining & Analysis (AREA)
  • Tourism & Hospitality (AREA)
  • Game Theory and Decision Science (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Quality & Reliability (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于联邦学习的预测系统及方法,包括:收集单元,用以收集用户预测请求以确定用户预测请求的关键词数量和实际数据长度;对齐单元,用以将所述收集单元收集到的预测请求进行数据对齐;联邦学习单元,用以将已经对齐的数据进行预测以得到预测结果;反馈单元,用以将预测结果反馈至发出预测请求的用户;控制单元,其分别与所述收集单元和所述对齐单元连接,用以控制用户的预测请求对应数据的对齐过程;从而能够根据关键词数量确定数据长度,进而根据数据长度确定数据容量,进而通过数据容量差值对数据容量进行精确确定以准确判断数据是否对齐,进而能够在确保数据对齐的情况下获得更为准确的预测结果,有效提高了预测结果的准确率。

Description

一种基于联邦学习的预测系统及方法
技术领域
本发明涉及人工智能技术领域,尤其涉及一种基于联邦学习的预测系统及方法。
背景技术
联邦机器学习(Federated machine learning/Federated Learning),又名联邦学习,联合学习,联盟学习。联邦机器学习是一个机器学习框架,能有效帮助多个机构在满足用户隐私保护、数据安全和政府法规的要求下,进行数据使用和机器学习建模。
经历了多年发展,人工智能进入了发展的深入区,已经从概念普及发展到产品验证、落地、审批、商业化方面的探索。
目前,人工智能在各产业的发展需要通过多种工具或设备来收集数据,然而在很多行业,获取高质量的数据难度较大,一方面是由于数据预处理、标注需要投入的工作量巨大,另一方面在于数据的隐私性要求,数据拥有方采取高度保护措施。典型地例如在医疗行业,当前医疗领域标注的数据非常有限,如果多方医疗机构不进行数据交换和整合,则通过人工智能模型训练和预测得到的效果指标不理想,难以落地应用;研究界和企业界目前的情况是把收集数据和使用数据分开,如A方收集数据、B方清洗数据、C方建模训练、D方使用模型。然而,这种数据在实体间转移、交换和交易的形式违反了欧盟在2018年正式施行的法案《通用数据保护条例》(General Data Protection Regulation,GDPR)和中国从2017年实施的《中华人民共和国网络安全法》和《中华人民共和国民法总则》。
所以,通过收集数据的方式进行人工智能模型训练和使用已经不能满足例如医疗等特定行业发展的需求。在数据信息爆炸的时代,数据的网络传输、数据交互范围逐步扩大,为人们信息共享提供便捷,但是在数据网络传输、数据交互过程中存在安全隐患,数据信息被窃取,隐私可能暴露给不可信的第三方,而且在数据传输、数据交互过程中,容易出现信息的不对称性,数据信息中样本编号或者用户编号不同,无法实现数据之间准确的共享,因而,无法在保证数据安全的前提下,进行数据之前准确的对齐共享。
目前,已经有一些基于联邦学习的预测系统及方法,但普遍不能不能通过数据容量差值对数据容量进行精确确定以准确判断数据是否对齐,进而提高预测结果的准确率。
发明内容
为此,本发明提供一种基于联邦学习的预测系统及方法,可以有效解决现有技术中不能通过数据容量差值对数据容量进行精确确定以准确判断数据是否对齐进而导致预测结果准确率低的技术问题。
为实现上述目的,本发明提供一种基于联邦学习的预测系统及方法,包括:
收集单元,用以收集用户预测请求以确定用户预测请求的关键词数量和实际数据长度;
对齐单元,其与所述收集单元连接,用以将所述收集单元收集到的预测请求进行数据对齐;
联邦学习单元,其与所述对齐单元连接,用以将已经对齐的数据进行预测以得到预测结果;
反馈单元,其与所述联邦学习单元连接,用以将预测结果反馈至发出预测请求的用户;
控制单元,其分别与所述收集单元和所述对齐单元连接,用以控制用户的预测请求对应数据的对齐过程;
所述用户的预测请求在进行数据对齐时,所述控制单元将实际数据容量A与标准数据容量进行比较以确定数据是否对齐,将数据容量差值P与标准数据容量差值进行比较以确定对齐补偿参数和数据容量调节量△Q并根据预设公式确定调节后数据容量Q’,将调节后数据容量Q’与标准数据容量进行比较以再次确定数据是否对齐;
所述实际数据容量A根据实际数据长度R和数据容量计算参数确定;
所述实际数据长度R根据数据关键词数量确定。
进一步地,所述用户的预测请求在进行数据对齐时,所述控制单元获取预测请求的数据的数据容量并将其设置为实际数据容量A,设置完成时,控制单元将实际数据容量A与标准数据容量进行比较以确定数据是否对齐,控制单元判定数据已对齐时将用户的预测请求传输至所述联邦学习单元进行预测以得到预测结果,控制单元判定数据未对齐时计算数据容量差值;
其中,所述控制单元设置有标准数据容量,包括标准数据第一容量Q1和标准数据第二容量Q2,其中,Q1<Q2;
若A<Q1,所述控制单元判定数据未对齐;
若Q1≤A≤Q2,所述控制单元判定数据已对齐;
若A>Q2,所述控制单元判定数据未对齐。
进一步地,所述控制单元判定数据未对齐时,控制单元计算数据容量差值P,计算完成时,控制单元将数据容量差值P与标准数据容量差值进行比较以确定对齐补偿参数,控制单元确定对齐补偿参数为σi时计算数据容量调节量△Q,设定△Q=σi×P,i=1,2,3,4;
其中,所述控制单元还设置有标准数据容量差值和标准对齐补偿参数,所述标准数据容量差值包括标准数据容量第一差值P1,标准数据容量第二差值P2和标准数据容量第三差值P3,其中,P1<P2<P3;所述标准对齐补偿参数包括第一标准对齐补偿参数σ1,第二标准对齐补偿参数σ2,第三标准对齐补偿参数σ3和第四标准对齐补偿参数σ4,其中,σ1+σ2+σ3+σ4=1;
若P<P1,所述控制单元判定对齐补偿参数为σ1;
若P1≤P<P2,所述控制单元判定对齐补偿参数为σ2;
若P2≤P<P3,所述控制单元判定对齐补偿参数为σ3;
若P≥P3,所述控制单元判定对齐补偿参数为σ4。
进一步地,所述控制单元确定数据容量调节量△Q时,控制单元计算调节后数据容量Q’,其计算公式如下:
Q’=A±△Q;
式中,A表示实际数据容量,当A<Q1时,Q’=A+△Q,当A>Q2时,Q’=A-△Q。
进一步地,所述控制单元确定调节后数据容量Q’时,控制单元将调节后数据容量Q’与标准数据容量进行比较以再次确定数据是否对齐,控制单元判定数据已对齐时将用户的预测请求传输至所述联邦学习单元进行预测以得到预测结果,控制单元判定数据未对齐时重新收集用户的预测请求;
若Q'<Q1,所述控制单元判定数据未对齐;
若Q1≤Q'≤Q2,所述控制单元判定数据已对齐;
若Q'>Q2,所述控制单元判定数据未对齐。
进一步地,所述控制单元判定数据未对齐时,控制单元计算数据容量差值P,其计算公式如下:
P=Q1-A或P=A-Q2;
式中,A表示是数据容量,Q1表示标准数据第一容量,Q2表示标准数据第二容量,当A<Q1时,P=Q1-A,,当A>Q2时,P=A-Q2。
进一步地,所述用户的预测请求在进行数据对齐时,所述控制单元获取预测请求的数据的数据长度并将其设置为实际数据长度R,设置完成时,控制单元将实际数据长度R与预设数据长度进行比较以确定数据容量计算参数;
其中,所述控制单元还设置有预设数据长度和标准数据容量计算参数,所述预设数据长度包括第一预设数据长度R1,第二预设数据长度R2和第三预设数据长度R3,其中,R1<R2<R3;所述标准数据容量计算参数包括标准数据容量第一计算参数σ1,标准数据容量第二计算参数σ2,标准数据容量第三计算参数σ3和标准数据容量第四计算参数σ4,其中,σ1+σ2+σ3+σ4=2;
若R<R1,所述控制单元判定数据容量计算参数为σ1;
若R1≤R<R2,所述控制单元判定数据容量计算参数为σ2;
若R2≤R<R3,所述控制单元判定数据容量计算参数为σ3;
若R≥R3,所述控制单元判定数据容量计算参数为σ4。
进一步地,所述控制单元确定数据容量计算参数为σi时,控制单元计算实际数据容量A,设定A=R×σi,i=1,2,3,4。
进一步地,所述用户的预测请求在进行数据对齐时,所述控制单元获取用户的预测请求的关键词数量并将其设置为K,设置完成时,控制单元将关键词数量K与预设关键词数量进行比较以确定实际数据长度R;
其中,所述控制单元还设置有预设关键词数量和标准数据长度,包括第一预设关键词数量K01,第二预设关键词数量K02和第三预设关键词数量K03,其中,K01<K02<K03;所述标准数据长度包括第一标准数据长度L1,第二标准数据长度L2,第三标准数据长度L3和第四标准数据长度L4,其中,L1<L2<L3<L4;
若K<K01,所述控制单元判定实际数据长度为L1;
若K01≤K<K02,所述控制单元判定实际数据长度为L2;
若K02≤K<K03,所述控制单元判定实际数据长度为L3;
若K≥K03,所述控制单元判定实际数据长度为L4。
进一步地,包括:
步骤S1,收集单元收集用户的预测请求并将其传输至对齐单元进行数据对齐;
步骤S2,控制单元将对所述齐单元接收到的数据进行数据对齐后传输至联邦学习单元进行预测以得到预测结果;
步骤S3,反馈单元将所述预测结果反馈至发出预测请求的用户并收集用户的反馈信息;
步骤S4,所述联邦学习单元根据用户的反馈信息对预测结果进行优化并将优化后的预测结果进行储存并通过所述反馈单元将优化后的预测结果反馈至用户。
与现有技术相比,本发明的有益效果在于,本发明通过设置控制单元和对齐单元,在用户的预测请求数据进行数据对齐时,通过将实际数据容量与标准数据容量进行比较以确定数据是否对齐,将数据容量差值与标准数据容量差值进行比较以确定对齐补偿参数和数据容量调节量,并根据预设公式确定调节后数据容量,将调节后数据容量与标准数据容量进行比较以再次确定数据是否对齐,其中,实际数据容量根据实际数据长度和数据容量计算参数确定,实际数据长度根据数据关键词数量确定。从而能够根据关键词数量确定数据长度,进而根据数据长度确定数据容量,进而通过数据容量差值对数据容量进行精确确定以准确判断数据是否对齐,进而能够在确保数据对齐的情况下获得更为准确的预测结果,有效提高了预测结果的准确率。
进一步地,本发明通过将将实际数据容量A与标准数据容量进行比较以确定数据是否对齐,将数据容量差值P与标准数据容量差值进行比较以确定对齐补偿参数和数据容量调节量△Q并根据预设公式确定调节后数据容量Q’,将调节后数据容量Q’与标准数据容量进行比较以再次确定数据是否对齐,其中,实际数据容量A根据实际数据长度R和数据容量计算参数确定,实际数据长度R根据数据关键词数量确定。从而能够根据关键词数量确定数据长度,进而根据数据长度确定数据容量,进而通过数据容量差值对数据容量进行精确确定以准确判断数据是否对齐,进而能够在确保数据对齐的情况下获得更为准确的预测结果,有效提高了预测结果的准确率。
进一步地,本发明通过将实际数据容量A与标准数据容量进行比较以确定数据是否对齐,从而能够根据关键词数量确定数据长度,进而根据数据长度确定数据容量,进而通过数据容量差值对数据容量进行精确确定以准确判断数据是否对齐,进而能够在确保数据对齐的情况下获得更为准确的预测结果,有效提高了预测结果的准确率。
进一步地,本发明通过将数据容量差值P与标准数据容量差值进行比较以确定对齐补偿参数,进而通过预设公式确定数据容量调节量△Q,从而能够根据关键词数量确定数据长度,进而根据数据长度确定数据容量,进而通过数据容量差值对数据容量进行精确确定以准确判断数据是否对齐,进而能够在确保数据对齐的情况下获得更为准确的预测结果,有效提高了预测结果的准确率。
进一步地,本发明通过将调节后数据容量Q’与标准数据容量进行比较以再次确定数据是否对齐,从而能够根据关键词数量确定数据长度,进而根据数据长度确定数据容量,进而通过数据容量差值对数据容量进行精确确定以准确判断数据是否对齐,进而能够在确保数据对齐的情况下获得更为准确的预测结果,有效提高了预测结果的准确率。
进一步地,本发明通过将实际数据长度R与预设数据长度进行比较以确定数据容量计算参数,从而能够根据关键词数量确定数据长度,进而根据数据长度确定数据容量,进而通过数据容量差值对数据容量进行精确确定以准确判断数据是否对齐,进而能够在确保数据对齐的情况下获得更为准确的预测结果,有效提高了预测结果的准确率。
进一步地,本发明通过结合数据容量计算参数并结合预设公式确定实际数据容量A,从而能够根据关键词数量确定数据长度,进而根据数据长度确定数据容量,进而通过数据容量差值对数据容量进行精确确定以准确判断数据是否对齐,进而能够在确保数据对齐的情况下获得更为准确的预测结果,有效提高了预测结果的准确率。
进一步地,本发明通过将关键词数量K与预设关键词数量进行比较以确定实际数据长度R,从而能够根据关键词数量确定数据长度,进而根据数据长度确定数据容量,进而通过数据容量差值对数据容量进行精确确定以准确判断数据是否对齐,进而能够在确保数据对齐的情况下获得更为准确的预测结果,有效提高了预测结果的准确率。
附图说明
图1为本发明实施例基于联邦学习的预测系统的结构示意图;
图2为本发明实施例基于联邦学习的预测方法的流程示意图;
图中标记说明:1、收集单元;11、第一传输单元;2、对齐单元;21、第二传输单元;3、联邦学习单元;31、第三传输单元;4、反馈单元;5、控制单元。
具体实施方式
为了使本发明的目的和优点更加清楚明白,下面结合实施例对本发明作进一步描述;应当理解,此处所描述的具体实施例仅仅用于解释本发明,并不用于限定本发明。
下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是,这些实施方式仅仅用于解释本发明的技术原理,并非在限制本发明的保护范围。
需要说明的是,在本发明的描述中,术语“上”、“下”、“左”、“右”、“内”、“外”等指示的方向或位置关系的术语是基于附图所示的方向或位置关系,这仅仅是为了便于描述,而不是指示或暗示所述装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
此外,还需要说明的是,在本发明的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域技术人员而言,可根据具体情况理解上述术语在本发明中的具体含义。
请参阅图1和图2所示,图1为本发明实施例基于联邦学习的预测系统的结构示意图,图2为本发明实施例基于联邦学习的预测方法的流程示意图,本实施例的基于联邦学习的预测系统,包括:
收集单元1,用以收集用户预测请求以确定用户预测请求的关键词数量和实际数据长度;
对齐单元2,其与所述收集单元1连接,用以将所述收集单元1收集到的预测请求进行数据对齐;
联邦学习单元3,其与所述对齐单元连接,用以将已经对齐的数据进行预测以得到预测结果;
反馈单元4,其与所述联邦学习单元3连接,用以将预测结果反馈至发出预测请求的用户;
控制单元5,其分别与所述收集单元1和所述对齐单元2连接,用以控制用户的预测请求对应数据的对齐过程;
所述用户的预测请求在进行数据对齐时,所述控制单元5将实际数据容量A与标准数据容量进行比较以确定数据是否对齐,将数据容量差值P与标准数据容量差值进行比较以确定对齐补偿参数和数据容量调节量△Q并根据预设公式确定调节后数据容量Q’,将调节后数据容量Q’与标准数据容量进行比较以再次确定数据是否对齐;
所述实际数据容量A根据实际数据长度R和数据容量计算参数确定;
所述实际数据长度R根据数据关键词数量确定。
具体而言,本发明通过将将实际数据容量A与标准数据容量进行比较以确定数据是否对齐,将数据容量差值P与标准数据容量差值进行比较以确定对齐补偿参数和数据容量调节量△Q并根据预设公式确定调节后数据容量Q’,将调节后数据容量Q’与标准数据容量进行比较以再次确定数据是否对齐,其中,实际数据容量A根据实际数据长度R和数据容量计算参数确定,实际数据长度R根据数据关键词数量确定。从而能够根据关键词数量确定数据长度,进而根据数据长度确定数据容量,进而通过数据容量差值对数据容量进行精确确定以准确判断数据是否对齐,进而能够在确保数据对齐的情况下获得更为准确的预测结果,有效提高了预测结果的准确率。
继续参阅图1所示,传输单元,其分别与所述收集单元1、所述对齐单元2、所述联邦学习单元3、所述反馈单元4和所述控制单元5连接,包括第一传输单元11、第二传输单元21和第三传输单元31,第一传输单元11分别与收集单元1和对齐单元2连接以将收集单元1收集到的数据传递至对齐单元2,第二传输单元21分别与对齐单元2和联邦学习单元3连接以将对齐单元2对齐的数据传递至联邦学习单元3进行预测,第三传输单元31分别与联邦学习单元3和反馈单元4连接以将联邦学习单元3的预测结果传输至反馈单元4进行用户反馈并将用户的反馈结果从反馈单元4传递至联邦学习单元3。
具体而言,所述用户的预测请求在进行数据对齐时,所述控制单元5获取预测请求的数据的数据容量并将其设置为实际数据容量A,设置完成时,控制单元5将实际数据容量A与标准数据容量进行比较以确定数据是否对齐,控制单元5判定数据已对齐时将用户的预测请求传输至所述联邦学习单元3进行预测以得到预测结果,控制单元5判定数据未对齐时计算数据容量差值;
其中,所述控制单元5设置有标准数据容量,包括标准数据第一容量Q1和标准数据第二容量Q2,其中,Q1<Q2;
若A<Q1,所述控制单元5判定数据未对齐;
若Q1≤A≤Q2,所述控制单元5判定数据已对齐;
若A>Q2,所述控制单元5判定数据未对齐。
本实施例中,数据容量过小或者过小,可能是加密过程中引入了其他数据以致预测请求的数据容量发生变化,因此,数据容量在预设的适宜范围内才能显示数据对齐。控制单元5内设置有PLC控制板。
具体而言,本发明通过将实际数据容量A与标准数据容量进行比较以确定数据是否对齐,从而能够根据关键词数量确定数据长度,进而根据数据长度确定数据容量,进而通过数据容量差值对数据容量进行精确确定以准确判断数据是否对齐,进而能够在确保数据对齐的情况下获得更为准确的预测结果,有效提高了预测结果的准确率。
具体而言,所述控制单元5判定数据未对齐时,控制单元5计算数据容量差值P,计算完成时,控制单元5将数据容量差值P与标准数据容量差值进行比较以确定对齐补偿参数,控制单元5确定对齐补偿参数为σi时计算数据容量调节量△Q,设定△Q=σi×P,i=1,2,3,4;
其中,所述控制单元5还设置有标准数据容量差值和标准对齐补偿参数,所述标准数据容量差值包括标准数据容量第一差值P1,标准数据容量第二差值P2和标准数据容量第三差值P3,其中,P1<P2<P3;所述标准对齐补偿参数包括第一标准对齐补偿参数σ1,第二标准对齐补偿参数σ2,第三标准对齐补偿参数σ3和第四标准对齐补偿参数σ4,其中,σ1+σ2+σ3+σ4=1;
若P<P1,所述控制单元5判定对齐补偿参数为σ1;
若P1≤P<P2,所述控制单元5判定对齐补偿参数为σ2;
若P2≤P<P3,所述控制单元5判定对齐补偿参数为σ3;
若P≥P3,所述控制单元5判定对齐补偿参数为σ4。
具体而言,本发明通过将数据容量差值P与标准数据容量差值进行比较以确定对齐补偿参数,进而通过预设公式确定数据容量调节量△Q,从而能够根据关键词数量确定数据长度,进而根据数据长度确定数据容量,进而通过数据容量差值对数据容量进行精确确定以准确判断数据是否对齐,进而能够在确保数据对齐的情况下获得更为准确的预测结果,有效提高了预测结果的准确率。
具体而言,所述控制单元5确定数据容量调节量△Q时,控制单元5计算调节后数据容量Q’,其计算公式如下:
Q’=A±△Q;
式中,A表示实际数据容量,当A<Q1时,Q’=A+△Q,当A>Q2时,Q’=A-△Q。
具体而言,所述控制单元5确定调节后数据容量Q’时,控制单元5将调节后数据容量Q’与标准数据容量进行比较以再次确定数据是否对齐,控制单元5判定数据已对齐时将用户的预测请求传输至所述联邦学习单元3进行预测以得到预测结果,控制单元5判定数据未对齐时重新收集用户的预测请求;
若Q'<Q1,所述控制单元5判定数据未对齐;
若Q1≤Q'≤Q2,所述控制单元5判定数据已对齐;
若Q'>Q2,所述控制单元5判定数据未对齐。
具体而言,本发明通过将调节后数据容量Q’与标准数据容量进行比较以再次确定数据是否对齐,从而能够根据关键词数量确定数据长度,进而根据数据长度确定数据容量,进而通过数据容量差值对数据容量进行精确确定以准确判断数据是否对齐,进而能够在确保数据对齐的情况下获得更为准确的预测结果,有效提高了预测结果的准确率。
具体而言,所述控制单元5判定数据未对齐时,控制单元5计算数据容量差值P,其计算公式如下:
P=Q1-A或P=A-Q2;
式中,A表示是数据容量,Q1表示标准数据第一容量,Q2表示标准数据第二容量,当A<Q1时,P=Q1-A,,当A>Q2时,P=A-Q2。
具体而言,所述用户的预测请求在进行数据对齐时,所述控制单元5获取预测请求的数据的数据长度并将其设置为实际数据长度R,设置完成时,控制单元5将实际数据长度R与预设数据长度进行比较以确定数据容量计算参数;
其中,所述控制单元5还设置有预设数据长度和标准数据容量计算参数,所述预设数据长度包括第一预设数据长度R1,第二预设数据长度R2和第三预设数据长度R3,其中,R1<R2<R3;所述标准数据容量计算参数包括标准数据容量第一计算参数σ1,标准数据容量第二计算参数σ2,标准数据容量第三计算参数σ3和标准数据容量第四计算参数σ4,其中,σ1+σ2+σ3+σ4=2;
若R<R1,所述控制单元5判定数据容量计算参数为σ1;
若R1≤R<R2,所述控制单元5判定数据容量计算参数为σ2;
若R2≤R<R3,所述控制单元5判定数据容量计算参数为σ3;
若R≥R3,所述控制单元5判定数据容量计算参数为σ4。
具体而言,本发明通过将实际数据长度R与预设数据长度进行比较以确定数据容量计算参数,从而能够根据关键词数量确定数据长度,进而根据数据长度确定数据容量,进而通过数据容量差值对数据容量进行精确确定以准确判断数据是否对齐,进而能够在确保数据对齐的情况下获得更为准确的预测结果,有效提高了预测结果的准确率。
具体而言,所述控制单元5确定数据容量计算参数为σi时,控制单元5计算实际数据容量A,设定A=R×σi,i=1,2,3,4。
具体而言,本发明通过结合数据容量计算参数并结合预设公式确定实际数据容量A,从而能够根据关键词数量确定数据长度,进而根据数据长度确定数据容量,进而通过数据容量差值对数据容量进行精确确定以准确判断数据是否对齐,进而能够在确保数据对齐的情况下获得更为准确的预测结果,有效提高了预测结果的准确率。
具体而言,所述用户的预测请求在进行数据对齐时,所述控制单元5获取用户的预测请求的关键词数量并将其设置为K,设置完成时,控制单元5将关键词数量K与预设关键词数量进行比较以确定实际数据长度R;
其中,所述控制单元5还设置有预设关键词数量和标准数据长度,包括第一预设关键词数量K01,第二预设关键词数量K02和第三预设关键词数量K03,其中,K01<K02<K03;所述标准数据长度包括第一标准数据长度L1,第二标准数据长度L2,第三标准数据长度L3和第四标准数据长度L4,其中,L1<L2<L3<L4;
若K<K01,所述控制单元5判定实际数据长度为L1;
若K01≤K<K02,所述控制单元5判定实际数据长度为L2;
若K02≤K<K03,所述控制单元5判定实际数据长度为L3;
若K≥K03,所述控制单元5判定实际数据长度为L4。
本实施例中,标准数据长度仅用以确定实际数据长度,与上述预设数据长度之间没有关系。
具体而言,本发明通过将关键词数量K与预设关键词数量进行比较以确定实际数据长度R,从而能够根据关键词数量确定数据长度,进而根据数据长度确定数据容量,进而通过数据容量差值对数据容量进行精确确定以准确判断数据是否对齐,进而能够在确保数据对齐的情况下获得更为准确的预测结果,有效提高了预测结果的准确率。
参阅图2所示,本实施例的基于联邦学习的预测方法,包括:
步骤S1,收集单元1收集用户的预测请求并将其传输至对齐单元2进行数据对齐;
步骤S2,控制单元5将对所述齐单元接收到的数据进行数据对齐后传输至联邦学习单元3进行预测以得到预测结果;
步骤S3,反馈单元4将所述预测结果反馈至发出预测请求的用户并收集用户的反馈信息;
步骤S4,所述联邦学习单元3根据用户的反馈信息对预测结果进行优化并将优化后的预测结果进行储存并通过所述反馈单元4将优化后的预测结果反馈至用户。
本实施例中,联邦学习单元3并非收到用户对预测结果的任何反馈信息都会进行优化,会先进行是否需要进行优化判断,若确实需要进行优化后才会进行优化,若经过判断无需进行优化,则联邦学习单元3也会将该不能优化的情况经过反馈单元4反馈至用户。
至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征做出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。

Claims (10)

1.一种基于联邦学习的预测系统,其特征在于,包括:
收集单元,用以收集用户预测请求以确定用户预测请求的关键词数量和实际数据长度;
对齐单元,其与所述收集单元连接,用以将所述收集单元收集到的预测请求进行数据对齐;
联邦学习单元,其与所述对齐单元连接,用以将已经对齐的数据进行预测以得到预测结果;
反馈单元,其与所述联邦学习单元连接,用以将预测结果反馈至发出预测请求的用户;
控制单元,其分别与所述收集单元和所述对齐单元连接,用以控制用户的预测请求对应数据的对齐过程;
所述用户的预测请求在进行数据对齐时,所述控制单元将实际数据容量A与标准数据容量进行比较以确定数据是否对齐,将数据容量差值P与标准数据容量差值进行比较以确定对齐补偿参数和数据容量调节量△Q并根据预设公式确定调节后数据容量Q’,将调节后数据容量Q’与标准数据容量进行比较以再次确定数据是否对齐;
所述实际数据容量A根据实际数据长度R和数据容量计算参数确定;
所述实际数据长度R根据数据关键词数量确定。
2.根据权利要求1所述的基于联邦学习的预测系统,其特征在于,所述用户的预测请求在进行数据对齐时,所述控制单元获取预测请求的数据的数据容量并将其设置为实际数据容量A,设置完成时,控制单元将实际数据容量A与标准数据容量进行比较以确定数据是否对齐,控制单元判定数据已对齐时将用户的预测请求传输至所述联邦学习单元进行预测以得到预测结果,控制单元判定数据未对齐时计算数据容量差值;
其中,所述控制单元设置有标准数据容量,包括标准数据第一容量Q1和标准数据第二容量Q2,其中,Q1<Q2;
若A<Q1,所述控制单元判定数据未对齐;
若Q1≤A≤Q2,所述控制单元判定数据已对齐;
若A>Q2,所述控制单元判定数据未对齐。
3.根据权利要求2所述的基于联邦学习的预测系统,其特征在于,所述控制单元判定数据未对齐时,控制单元计算数据容量差值P,计算完成时,控制单元将数据容量差值P与标准数据容量差值进行比较以确定对齐补偿参数,控制单元确定对齐补偿参数为σi时计算数据容量调节量△Q,设定△Q=σi×P,i=1,2,3,4;
其中,所述控制单元还设置有标准数据容量差值和标准对齐补偿参数,所述标准数据容量差值包括标准数据容量第一差值P1,标准数据容量第二差值P2和标准数据容量第三差值P3,其中,P1<P2<P3;所述标准对齐补偿参数包括第一标准对齐补偿参数σ1,第二标准对齐补偿参数σ2,第三标准对齐补偿参数σ3和第四标准对齐补偿参数σ4,其中,σ1+σ2+σ3+σ4=1;
若P<P1,所述控制单元判定对齐补偿参数为σ1;
若P1≤P<P2,所述控制单元判定对齐补偿参数为σ2;
若P2≤P<P3,所述控制单元判定对齐补偿参数为σ3;
若P≥P3,所述控制单元判定对齐补偿参数为σ4。
4.根据权利要求3所述的基于联邦学习的预测系统,其特征在于,所述控制单元确定数据容量调节量△Q时,控制单元计算调节后数据容量Q’,其计算公式如下:
Q’=A±△Q;
式中,A表示实际数据容量,当A<Q1时,Q’=A+△Q,当A>Q2时,Q’=A-△Q。
5.根据权利要求4所述的基于联邦学习的预测系统,其特征在于,所述控制单元确定调节后数据容量Q’时,控制单元将调节后数据容量Q’与标准数据容量进行比较以再次确定数据是否对齐,控制单元判定数据已对齐时将用户的预测请求传输至所述联邦学习单元进行预测以得到预测结果,控制单元判定数据未对齐时重新收集用户的预测请求;
若Q'<Q1,所述控制单元判定数据未对齐;
若Q1≤Q'≤Q2,所述控制单元判定数据已对齐;
若Q'>Q2,所述控制单元判定数据未对齐。
6.根据权利要求3所述的基于联邦学习的预测系统,其特征在于,所述控制单元判定数据未对齐时,控制单元计算数据容量差值P,其计算公式如下:
P=Q1-A或P=A-Q2;
式中,A表示是数据容量,Q1表示标准数据第一容量,Q2表示标准数据第二容量,当A<Q1时,P=Q1-A,当A>Q2时,P=A-Q2。
7.根据权利要求5所述的基于联邦学习的预测系统,其特征在于,所述用户的预测请求在进行数据对齐时,所述控制单元获取预测请求的数据的数据长度并将其设置为实际数据长度R,设置完成时,控制单元将实际数据长度R与预设数据长度进行比较以确定数据容量计算参数;
其中,所述控制单元还设置有预设数据长度和标准数据容量计算参数,所述预设数据长度包括第一预设数据长度R1,第二预设数据长度R2和第三预设数据长度R3,其中,R1<R2<R3;所述标准数据容量计算参数包括标准数据容量第一计算参数σ1,标准数据容量第二计算参数σ2,标准数据容量第三计算参数σ3和标准数据容量第四计算参数σ4,其中,σ1+σ2+σ3+σ4=2;
若R<R1,所述控制单元判定数据容量计算参数为σ1;
若R1≤R<R2,所述控制单元判定数据容量计算参数为σ2;
若R2≤R<R3,所述控制单元判定数据容量计算参数为σ3;
若R≥R3,所述控制单元判定数据容量计算参数为σ4。
8.根据权利要求7所述的基于联邦学习的预测系统,其特征在于,所述控制单元确定数据容量计算参数为σi时,控制单元计算实际数据容量A,设定A=R×σi,i=1,2,3,4。
9.根据权利要求8所述的基于联邦学习的预测系统,其特征在于,所述用户的预测请求在进行数据对齐时,所述控制单元获取用户的预测请求的关键词数量并将其设置为K,设置完成时,控制单元将关键词数量K与预设关键词数量进行比较以确定实际数据长度R;
其中,所述控制单元还设置有预设关键词数量和标准数据长度,包括第一预设关键词数量K01,第二预设关键词数量K02和第三预设关键词数量K03,其中,K01<K02<K03;所述标准数据长度包括第一标准数据长度L1,第二标准数据长度L2,第三标准数据长度L3和第四标准数据长度L4,其中,L1<L2<L3<L4;
若K<K01,所述控制单元判定实际数据长度为L1;
若K01≤K<K02,所述控制单元判定实际数据长度为L2;
若K02≤K<K03,所述控制单元判定实际数据长度为L3;
若K≥K03,所述控制单元判定实际数据长度为L4。
10.一种用于权利要求1-9任一所述的基于联邦学习的预测系统的基于联邦学习的预测方法,其特征在于,包括:
步骤S1,收集单元收集用户的预测请求并将其传输至对齐单元进行数据对齐;
步骤S2,控制单元将对所述齐单元接收到的数据进行数据对齐后传输至联邦学习单元进行预测以得到预测结果;
步骤S3,反馈单元将所述预测结果反馈至发出预测请求的用户并收集用户的反馈信息;
步骤S4,所述联邦学习单元根据用户的反馈信息对预测结果进行优化并将优化后的预测结果进行储存并通过所述反馈单元将优化后的预测结果反馈至用户。
CN202110532140.3A 2021-05-17 2021-05-17 一种基于联邦学习的预测系统及方法 Active CN112990612B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110532140.3A CN112990612B (zh) 2021-05-17 2021-05-17 一种基于联邦学习的预测系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110532140.3A CN112990612B (zh) 2021-05-17 2021-05-17 一种基于联邦学习的预测系统及方法

Publications (2)

Publication Number Publication Date
CN112990612A true CN112990612A (zh) 2021-06-18
CN112990612B CN112990612B (zh) 2021-08-10

Family

ID=76336583

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110532140.3A Active CN112990612B (zh) 2021-05-17 2021-05-17 一种基于联邦学习的预测系统及方法

Country Status (1)

Country Link
CN (1) CN112990612B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113610279A (zh) * 2021-07-20 2021-11-05 中国石油大学(华东) 基于数据集规整度的事故预测方法
CN117437039A (zh) * 2023-12-21 2024-01-23 湖南三湘银行股份有限公司 一种基于纵向联邦学习的商业银行贷款风控方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170285949A1 (en) * 2016-04-02 2017-10-05 Intel Corporation Search and replace operations in a memory device
CN107817946A (zh) * 2016-09-13 2018-03-20 阿里巴巴集团控股有限公司 用于混合存储设备读写数据的方法以及装置
CN110245510A (zh) * 2019-06-19 2019-09-17 北京百度网讯科技有限公司 用于预测信息的方法和装置
CN111555984A (zh) * 2020-04-23 2020-08-18 海尔优家智能科技(北京)有限公司 用于数据传输的方法及装置、智能家居设备、存储介质
CN111583965A (zh) * 2020-04-28 2020-08-25 北京慧闻科技(集团)有限公司 一种语音情绪识别方法、装置、设备及存储介质
CN111625546A (zh) * 2020-05-07 2020-09-04 苏州浪潮智能科技有限公司 一种数据写入方法、装置、设备、介质
CN112148437A (zh) * 2020-10-21 2020-12-29 深圳致星科技有限公司 用于联邦学习的计算任务加速处理方法、装置及设备
CN112348084A (zh) * 2020-11-08 2021-02-09 大连大学 改进k-means的未知协议数据帧分类方法
US20210073678A1 (en) * 2019-09-09 2021-03-11 Huawei Technologies Co., Ltd. Method, apparatus and system for secure vertical federated learning

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170285949A1 (en) * 2016-04-02 2017-10-05 Intel Corporation Search and replace operations in a memory device
CN107817946A (zh) * 2016-09-13 2018-03-20 阿里巴巴集团控股有限公司 用于混合存储设备读写数据的方法以及装置
CN110245510A (zh) * 2019-06-19 2019-09-17 北京百度网讯科技有限公司 用于预测信息的方法和装置
US20210073678A1 (en) * 2019-09-09 2021-03-11 Huawei Technologies Co., Ltd. Method, apparatus and system for secure vertical federated learning
CN111555984A (zh) * 2020-04-23 2020-08-18 海尔优家智能科技(北京)有限公司 用于数据传输的方法及装置、智能家居设备、存储介质
CN111583965A (zh) * 2020-04-28 2020-08-25 北京慧闻科技(集团)有限公司 一种语音情绪识别方法、装置、设备及存储介质
CN111625546A (zh) * 2020-05-07 2020-09-04 苏州浪潮智能科技有限公司 一种数据写入方法、装置、设备、介质
CN112148437A (zh) * 2020-10-21 2020-12-29 深圳致星科技有限公司 用于联邦学习的计算任务加速处理方法、装置及设备
CN112348084A (zh) * 2020-11-08 2021-02-09 大连大学 改进k-means的未知协议数据帧分类方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
苏建明 等: "联邦学习在商业银行反欺诈领域的应用", 《视角》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113610279A (zh) * 2021-07-20 2021-11-05 中国石油大学(华东) 基于数据集规整度的事故预测方法
CN117437039A (zh) * 2023-12-21 2024-01-23 湖南三湘银行股份有限公司 一种基于纵向联邦学习的商业银行贷款风控方法
CN117437039B (zh) * 2023-12-21 2024-04-30 湖南三湘银行股份有限公司 一种基于纵向联邦学习的商业银行贷款风控方法

Also Published As

Publication number Publication date
CN112990612B (zh) 2021-08-10

Similar Documents

Publication Publication Date Title
CN112990612B (zh) 一种基于联邦学习的预测系统及方法
US20240006038A1 (en) Team-based tele-diagnostics blockchain-enabled system
CN110797124A (zh) 一种模型多端协同训练方法、医疗风险预测方法和装置
CN108364134B (zh) 基于bim技术的建筑工程成本管理系统
CN106708712A (zh) 用于对便携式计算机测试工具进行云服务资产管理的系统和方法
CN109345029A (zh) 一种基于改进Topsis法的隧道施工优选方法
CN107085772A (zh) 一种主网电力系统工作票预判管理系统和方法
CN116644825B (zh) 一种基于大数据的门诊信息查询预约管理系统
CN114817739B (zh) 一种基于人工智能算法的工业大数据处理系统
CN105335900A (zh) 一种基于电力设备状态监测系统的数据集成处理方法
CN102930458B (zh) 电价评估仿真方法及系统
CN108108359A (zh) 一种设备数据自动化统计报表系统及其使用方法
WO2020015195A1 (zh) 报销方法、装置、计算机设备和存储介质
CN104657491A (zh) 一种向客户端发送数据的方法
CN105488940A (zh) 用于基于安全因素来预警电气火灾的系统和方法
CN112434323A (zh) 模型参数获取方法、装置、计算机设备及存储介质
CN113139168A (zh) 用于处理从客户端发送的数据请求的装置和方法
CN110262313B (zh) 基于物联网技术的电力物资关键点远程监测系统
CN109949013A (zh) 公文处理流转方法及系统
CN115271735A (zh) 代理支付业务场景下的日志分析方法及系统
CN103745314A (zh) 一种单据表传输的方法和装置
CN106970605A (zh) 实现随时查看工厂生产数据的方法
CN106600221A (zh) 一种新型城镇化社区管理系统
CN102005006A (zh) 基于信用评级系统的多项目合同管理方法
CN113362191A (zh) 设备投保数据处理方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant