CN115392493A - 一种分布式预测方法、系统、服务器及存储介质 - Google Patents

一种分布式预测方法、系统、服务器及存储介质 Download PDF

Info

Publication number
CN115392493A
CN115392493A CN202211333745.0A CN202211333745A CN115392493A CN 115392493 A CN115392493 A CN 115392493A CN 202211333745 A CN202211333745 A CN 202211333745A CN 115392493 A CN115392493 A CN 115392493A
Authority
CN
China
Prior art keywords
distribution
test sample
distributed
variance
nodes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211333745.0A
Other languages
English (en)
Inventor
张旭
吴睿振
王小伟
孙华锦
王凛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202211333745.0A priority Critical patent/CN115392493A/zh
Publication of CN115392493A publication Critical patent/CN115392493A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提出了一种分布式预测方法、系统、服务器及存储介质,其中,方法包括:本发明通过步骤S1给出了一个测试样本集合的先验概率分布,而后在步骤S2中利用上述先验概率密度分布预测了一个新的测试样本的后验概率分布;并在步骤S3中给出了一种确定从先验概率分布到后验概率分布的熵的变化的方式,并以此作为每个分布节点的预测精度的权重系数;最后在步骤S5中利用本发明提出的广义PoE聚合算法(为每个因子增加了权重系数)聚合来自多个分布节点的预测结果,从而实现对该新的测试样本的全局预测。本发明方法能够避免使用深度神经网络模型时的诸多缺陷且能够实现在线学习。

Description

一种分布式预测方法、系统、服务器及存储介质
技术领域
本发明设计机器学习领域,尤其涉及一种分布式预测方法、系统、服务器及存储介质。
背景技术
分布式机器学习的诞生,主要解决几类问题:一是计算量太大,二是训练数据太多,三是模型规模太大。对于计算量太大的情形,可以采取基于共享内存(或虚拟内存)的多线程或多机并行运算。对于训练数据太多的情形,需要将数据进行划分,并分配到多个工作节点上进行训练,这样每个工作节点的局部数据都在容限之内。每个工作节点会根据局部数据训练出一个子模型,并且会按照一定的规律和其他工作节点进行通信(通信的内容主要是子模型参数或者参数更新),以保证最终可以有效整合来自各个工作节点的训练结果并得到全局的机器学习模型。对于模型规模太大的情形,则需要对模型进行划分,并且分配到不同的工作节点上进行训练。与数据并行不同,模型并行的框架下各个子模型之间的依赖关系非常强,因为某个子模型的输出可能是另外一个子模型的输入,如果不进行中间计算结果的通信,则无法完成整个模型训练。并且现有技术中多采用深度神经网络模型作为机器学习模型,其不但存在上述缺陷,还仅适用于离线学习,而在实际应用中,工作机(分布节点)在实时产生数据流;
因此一种能够避免上述深度神经网络模型在应用过程中的缺陷的、且能够实现在线学习的分布式预测方案是本领域内所亟需的。
发明内容
为了解决背景技术中所提到的技术问题,在本发明的第一方面提出了一种分布式预测方法,所述方法包括:由分布节点对获得的测试样本集合进行高斯过程分析,获得符合高斯分布的局部预测模型以及针对所述测试样本集合的先验概率分布的第一期望和第一方差;响应于获得新的测试样本而将所述新的测试样本发送给多个所述分布节点,并由每个所述分布节点基于对应的局部预测模型通过高斯过程回归分析方法对所述新的测试样本进行局部预测,并获得针对新的测试样本集合的后验概率分布的第二期望及第二方差;以所述第一方差和所述第二方差的差值作为所述分布节点的权重系数;将多个所述分布节点的第二期望、第二方差以及对应的权重系数发送给云服务器;由所述云服务器采用PoE聚合算法根据多个所述分布节点的第二期望、第二方差以及对应的权重系数构建全局预测模型并输出对所述新的测试样本的全局预测结果。
在一个或多个实施例中,所述一种分布式预测方法,还包括:获取历史观测数据,所述历史观测数据包括观测输入及对应的观测输出;根据所述分布节点的个数,将所述历史观测数据划分到多个测试样本集合中并分派给各个分布节点。
在一个或多个实施例中,所述新的测试样本集合包括:在原始的所述测试样本集合中新增所述新的测试样本以及所述新的测试样本的局部预测输出后形成的测试样本集合。
在一个或多个实施例中,所述一种分布式预测方法还包括对所述新的测试样本集合进行精简,精简步骤包括:将所述新的测试样本集合投影到更高维度的空间中;在更高维度的空间中以所述新的测试样本的投影点为中心,以预设领域半径获得邻域内的邻域投影点;
获取对应所述邻域投影点的原始测试样本,并与所述新的测试样本组成精简后的测试样本集合。
在一个或多个实施例中,所述方法还包括:判断所述邻域投影点的个数是否大于等于预设值;响应于获得的邻域投影点的个数小于所述预设值,按照预设步长增大所述领域半径,直至获得邻域投影点的个数大于等于所述预设值。
在一个或多个实施例中,所述邻域投影点中应至少存在两个邻域投影点,且分别位于所述新的测试样本的投影点的不同方向上。
在一个或多个实施例中,所述方法还包括对所述新的测试样本集合进行精简,精简步骤包括:
定义历史观测输入x和新的测试样本
Figure 957514DEST_PATH_IMAGE001
之间的距离为
Figure 993603DEST_PATH_IMAGE002
,历史观测 输入x到集合
Figure 478811DEST_PATH_IMAGE003
的距离为
Figure 69193DEST_PATH_IMAGE004
;历史观测输入x到测试样本集合
Figure 173415DEST_PATH_IMAGE003
的投影集 合为
Figure 188644DEST_PATH_IMAGE005
;获得每一个分布节点
Figure 720120DEST_PATH_IMAGE006
及其局部训练数据集
Figure 797797DEST_PATH_IMAGE007
, 针对测试数据
Figure 564765DEST_PATH_IMAGE008
,计算测试数据
Figure 309867DEST_PATH_IMAGE008
到训练集
Figure 12244DEST_PATH_IMAGE009
的投影
Figure 842797DEST_PATH_IMAGE010
在每一个时刻
Figure 742069DEST_PATH_IMAGE011
,局部投影集合
Figure 341677DEST_PATH_IMAGE012
包含有
Figure 949376DEST_PATH_IMAGE013
个投影数据,即
Figure 391859DEST_PATH_IMAGE014
;对每一个分布节点
Figure 641574DEST_PATH_IMAGE015
及其投影集合
Figure 95689DEST_PATH_IMAGE016
,取出每一个投影点
Figure 998923DEST_PATH_IMAGE017
,其中,
Figure 804068DEST_PATH_IMAGE018
表示第
Figure 591896DEST_PATH_IMAGE019
个投影点,并针对每一个投影点
Figure 166097DEST_PATH_IMAGE020
,找出该投影点
Figure 505811DEST_PATH_IMAGE021
的一个 邻域
Figure 798252DEST_PATH_IMAGE022
使得
Figure 124191DEST_PATH_IMAGE023
并保证
Figure 552899DEST_PATH_IMAGE024
Figure 564979DEST_PATH_IMAGE025
Figure 79137DEST_PATH_IMAGE026
;对每一个分布节点
Figure 208767DEST_PATH_IMAGE027
,构 造新的训练集合
Figure 882194DEST_PATH_IMAGE028
在一个或多个实施例中,所述由分布节点对获得的测试样本集合进行高斯过程分 析,获得符合高斯分布的局部预测模型,包括:定义符合高斯分布的目标函数
Figure 173498DEST_PATH_IMAGE029
,其中
Figure 174952DEST_PATH_IMAGE030
Figure 232907DEST_PATH_IMAGE031
维输入空间,不失一般性,设输出y为一维,即
Figure 636206DEST_PATH_IMAGE032
;在时刻t,给定
Figure 363991DEST_PATH_IMAGE033
,获得 符合高斯分布的局部预测模型
Figure 852741DEST_PATH_IMAGE034
,其中,
Figure 183228DEST_PATH_IMAGE035
是服从均值为0,方差为
Figure 441034DEST_PATH_IMAGE036
的高斯概率分布 的高斯噪声,即
Figure 605299DEST_PATH_IMAGE037
在一个或多个实施例中,所述由每个所述分布节点基于对应的局部预测模型通过高斯过程回归分析方法对所述新的测试样本进行局部预测,包括:确定对称正半定的核函数;利用所述正半定的核函数构建所述新的测试样本与所述样本集合中的观测输入之间的关系
Figure 204515DEST_PATH_IMAGE038
其中,
Figure 948480DEST_PATH_IMAGE039
,x为测试样本集合中的观测输入,
Figure 326371DEST_PATH_IMAGE040
为新的测试样本,
Figure 520592DEST_PATH_IMAGE041
为测度; 让
Figure 983935DEST_PATH_IMAGE042
返回列向量,使得所述列向量的第
Figure 531591DEST_PATH_IMAGE043
个元素等于
Figure 888623DEST_PATH_IMAGE044
;根据所述
Figure 394690DEST_PATH_IMAGE045
的先验概率分布 的均值函数
Figure 79750DEST_PATH_IMAGE046
以及所述核函数是
Figure 696676DEST_PATH_IMAGE047
,获得观测输出和预测输出
Figure 642635DEST_PATH_IMAGE048
之间的关系,即服从联合 概率分布
Figure 319604DEST_PATH_IMAGE049
,
其中,
Figure 491959DEST_PATH_IMAGE050
Figure 273096DEST_PATH_IMAGE051
将分别返回由
Figure 480086DEST_PATH_IMAGE052
Figure 327957DEST_PATH_IMAGE053
组成的向量,
Figure 987608DEST_PATH_IMAGE054
返回一个 矩阵使得第
Figure 70971DEST_PATH_IMAGE055
行第
Figure 601309DEST_PATH_IMAGE056
列的元素是
Figure 620081DEST_PATH_IMAGE057
在一个或多个实施例中,所述获得针对新的测试样本集合的后验概率分布的第二 期望及第二方差,包括:在高斯回归分析过程中利用高斯过程的性质
Figure 891662DEST_PATH_IMAGE058
, 获得针对所述新的测试样本集合的后验概率分布的第二期望为
Figure 654082DEST_PATH_IMAGE059
;
获得针对所述新的测试样本集合的后验概率分布的第二方差为
Figure 570085DEST_PATH_IMAGE060
在一个或多个实施例中,所述对称正半定的核函数,包括:
Figure 494179DEST_PATH_IMAGE061
其中,x为历史观测输入,
Figure 987477DEST_PATH_IMAGE062
为新的测试样本,
Figure 288008DEST_PATH_IMAGE063
Figure 324097DEST_PATH_IMAGE064
为核函数的两个超参数。
在一个或多个实施例中,所述由所述云服务器采用PoE聚合算法根据多个所述分布节点的第二期望、第二方差以及对应的权重系数构建全局预测模型,包括:
根据多个所述分布节点的第二期望、第二方差以及对应的权重系数构造目标概率分布为多个概率密度的成绩,
Figure 782541DEST_PATH_IMAGE065
其中,
Figure 904081DEST_PATH_IMAGE066
是每个分布节点给出的条件概率分布,由每个分布节点的第二期望和 第二方差计算获得,
Figure 8303DEST_PATH_IMAGE067
为所述权重系数,表示对第i个工作机在输入x点对输出预测可靠性 的度量,所述全局预测模型包括期望为
Figure 757954DEST_PATH_IMAGE068
;所述全局预测模型还包括方差为
Figure 289429DEST_PATH_IMAGE069
; 其中,
Figure 632686DEST_PATH_IMAGE070
为第i各分布节点的第二期望,
Figure 540599DEST_PATH_IMAGE071
为第i个分布节点的第二方差,
Figure 410335DEST_PATH_IMAGE072
表示第i个分布节点在输入点x时的精度。
在一个或多个实施例中,所述方法还包括:在构造目标概率分布为多个概率密度的成绩的过程中,排除所述权重系数小于预设阈值的第二期望及第二方差。
在一个或多个实施例中,所述预设阈值为0.6。
在一个或多个实施例中,所述方法还包括:将所述全局预测模型返回给多个所述分布节点;在每个分布节点中分别进行局部预测模型与所述全局预测模型的融合。
在一个或多个实施例中,所述多个分布节点包括多个虚拟机。
在一个或多个实施例中,所述多个分布节点包括多个物理机。
在本发明的第二方面,提出了一种分布式预测系统,包括:多个分布节点,配置用于对获得的测试样本集合进行高斯过程分析,获得符合高斯分布的局部预测模型以及针对所述测试样本集合的先验概率分布的第一期望和第一方差;分配节点:配置用于响应于获得新的测试样本而将所述新的测试样本发送给多个所述分布节点;所述多个分布节点还配置用于由每个所述分布节点基于对应的局部预测模型通过高斯过程回归分析方法对所述新的测试样本进行局部预测,并获得针对新的测试样本集合的后验概率分布的第二期望及第二方差;以所述第一方差和所述第二方差的差值作为所述分布节点的权重系数;将多个所述分布节点的第二期望、第二方差以及对应的权重系数发送给云服务器;云服务器,配置用于采用PoE聚合算法根据多个所述分布节点的第二期望、第二方差以及对应的权重系数构建全局预测模型并输出对所述新的测试样本的全局预测结果。
在本发明的第三方面,提出了一种服务器,包括:至少一个处理器;以及存储器,所述存储器中存储有可执行的计算机程序,所述计算机程序被所述至少一个处理器执行时用于实现如上述权利要求1-12任意一项所述的一种分布式预测方法的相应步骤。
在本发明的第四方面,提出了一种可读存储介质,包括:可执行的计算机程序,所述计算机程序被执行时用于实现如上述权利要求1-12任意一项所述的一种分布式预测方法的相应步骤。
本发明的有益效果包括:本发明提出了利用高斯过程回归模型作为分布式机器学习模型,并在此基础上给出了基于广义上PoE(Product of experts)专家乘积的联合预测算法用于构建全局预测模型。本发明的分布式预测方法至少具有以下优势:第一,不需要联合训练,就可以将逐个预测联合起来;第二,预测联合的方式依赖于输入;第三,联合的预测是一个有效的概率模型;第四,不可靠的预测会自动在联合预测里被滤除掉。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的实施例。
图1为本发明的一种分布式预测方法的工作流程图;
图2为本发明的一种分布式预测系统的结构示意图;
图3为本发明的一种服务器的结构示意图;
图4为本发明的一种可读存储介质的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明实施例进一步详细说明。
需要说明的是,本发明实施例中所有使用“第一”和“第二”的表述均是为了区分两个相同名称非相同的实体或者非相同的参量,可见“第一”“第二”仅为了表述的方便,不应理解为对本发明实施例的限定,后续实施例对此不再一一说明。
针对在线学习问题,高斯过程回归是一个有效的解决手段之一。实际上,高斯过程模型在某种意义下可以等价为现有的机器学习模型,如Bayesian(贝叶斯)线性模型或多层神经网络。根据中心极限定理,假设神经网络中的权重服从高斯正态分布,随着神经网络的宽度趋近于无穷,那么这样的神经网络等价于高斯过程回归。然而高斯过程回归是一个非超参数的统计概率模型,不像传统的学习模型,比如线性回归,逻辑回归,神经网络,需要求解优化问题使得损失函数最小来得到最优的模型参数,高斯过程回归并不需要求解优化问题。给定训练数据和测试输入,高斯过程回归的预测分为推断和预测两步。推断过程假设要学习的函数服从高斯过程,给出模型的高斯先验概率分布,然后利用观测值和Bayesian(贝叶斯)规则,求出模型的高斯后验概率分布。当完成局部模型预测之后,各个工作机将所得到的局部预测的期望和方差发送至服务器,让服务器完成全局模型的计算,例如,利用平均聚合算法求取全局模型。但是一般在多个概率模型的融合算法中,期望满足以下四个特性:第一,不需要联合训练,就可以将逐个预测联合起来;第二,预测联合的方式依赖于输入;第三,联合的预测是一个有效的概率模型;第四,不可靠的预测会自动在联合预测里被滤除掉。第一个特性允许每一个工作机进行独立的训练,使得总体的模型利用并行化可以容易的扩展。第二个特性给出了对于模型输入更强大的表达。第三个特性使得不确定性可以被量化,然后在接下来的建模或者决策中被应用。第四个特性确保了联合预测对于某些不够准确的预测是具有鲁棒性的。
本发明提出了利用高斯过程回归模型作为分布式机器学习模型,并在此基础上给出了基于广义上PoE(Product of experts)专家乘积(一种聚合算法)的预测算法,本发明为每个PoE算法的对应因子上增加用于刻画对应分布节点的预测精度的权重,且由于本发明中选用了高斯过程回归模型,因此,该权重的一个自然选择是从先验概率分布到后验概率分布的熵的变化。本发明提出的广义的PoE算法可以同时满足前述提到的四个特性。并且,比起平均算法,本发明基于广义PoE算法的预测算法可以保证预测是满足一致性的,即当训练集无限扩大时,那么模型预测结果将趋近于函数的真实值。以下将结合附图对本发明的技术方案进行更加详细的阐述。
图1为本发明的一种分布式预测方法的工作流程图。如图1所示,本发明的分布式预测方法的工作流程包括:步骤S1、由分布节点对获得的测试样本集合进行高斯过程分析,获得符合高斯分布的局部预测模型以及针对测试样本集合的先验概率分布的第一期望和第一方差;步骤S2、响应于获得新的测试样本而将新的测试样本发送给多个分布节点,并由每个分布节点基于对应的局部预测模型通过高斯过程回归分析方法对新的测试样本进行局部预测,并获得针对新的测试样本集合的后验概率分布的第二期望及第二方差;步骤S3、以第一方差和第二方差的差值作为分布节点的权重系数;步骤S4、将多个分布节点的第二期望、第二方差以及对应的权重系数发送给云服务器;步骤S5、由云服务器采用PoE聚合算法根据多个分布节点的第二期望、第二方差以及对应的权重系数构建全局预测模型并输出对新的测试样本的全局预测结果。
在本实施例中,本发明通过步骤S1给出了一个测试样本集合的先验概率分布,而后在步骤S2中利用上述先验概率密度分布预测了一个新的测试样本的后验概率分布;并在步骤S3中给出了一种确定从先验概率分布到后验概率分布的熵的变化的方式,即利用后验概率分布的方差与先验概率分布的方差之间的差值代表熵的变化,并以此作为每个分布节点的预测精度的权重系数;最后在步骤S5中利用本发明提出的广义PoE聚合算法聚合来自多个分布节点的预测结果,从而形成全局预测模型,并给出全局预测结果。
在进一步的实施例中,本发明的一种分布式预测方法还包括:获取历史观测数据,历史观测数据包括观测输入及对应的观测输出;根据分布节点的个数,将历史观测数据划分到多个测试样本集合中并分派给各个分布节点。其中,上述历史观测输入和观测输出均为量测值。
在进一步的实施例中,新的测试样本集合包括:在原始的测试样本集合中新增新的测试样本以及新的测试样本的局部预测输出结果后形成的测试样本集合。
在进一步的实施例中,本发明的方法还包括对新的测试样本集合进行精简,精简步骤包括:将新的测试样本集合投影到更高维度的空间中;在更高维度的空间中以新的测试样本的投影点为中心,以预设领域半径获得邻域内的邻域投影点;获取对应邻域投影点的原始测试样本,并与新的测试样本组成精简后的测试样本集合。
在进一步的实施例中,本发明的方法还包括:判断邻域投影点的个数是否大于等于预设值;响应于获得的邻域投影点的个数小于预设值,按照预设步长增大领域半径,直至获得邻域投影点的个数大于等于预设值。
在进一步的实施例中,邻域投影点中应至少存在两个邻域投影点,且分别位于新的测试样本的投影点的不同方向上。在一个优选的实施例中,若获得的两个邻域投影点在新的测试样本的投影点的同一方向上或同一侧,则可以通过再次增大邻域半径来获得更多的邻域投影点。
通过对新的测试样本集合的精简步骤能够大大降低计算后验概率分布的计算量,并保证预测速度不会随着测试样本增多而下降。精简操作的更具体的操作步骤请参照下面的一个实施例:
在进一步的实施例中,为了减少分布节点的计算量,本发明的方法还包括对新的测试样本集合进行精简,具体精简步骤包括:
定义历史观测输入x和新的测试样本
Figure 112712DEST_PATH_IMAGE001
之间的距离为
Figure 677685DEST_PATH_IMAGE073
,历史观测输 入x到集合
Figure 248344DEST_PATH_IMAGE003
的距离为
Figure 847952DEST_PATH_IMAGE074
历史观测输入x到测试样本集合
Figure 721230DEST_PATH_IMAGE003
的投影集合为
Figure 39079DEST_PATH_IMAGE075
获得每一个分布节点
Figure 383735DEST_PATH_IMAGE076
及其局部训练数据集
Figure 103429DEST_PATH_IMAGE077
,针对测试数据
Figure 147609DEST_PATH_IMAGE078
,计算测试数据
Figure 77388DEST_PATH_IMAGE079
到训练集
Figure 599636DEST_PATH_IMAGE080
的投影
Figure 173837DEST_PATH_IMAGE081
在每一个时刻
Figure 513551DEST_PATH_IMAGE082
,局部投影集合
Figure 540413DEST_PATH_IMAGE012
包含有
Figure 131931DEST_PATH_IMAGE013
个投影数据,即
Figure 419693DEST_PATH_IMAGE014
对每一个分布节点
Figure 805675DEST_PATH_IMAGE006
及其投影集合
Figure 585412DEST_PATH_IMAGE016
,取出每一个投影点
Figure 715042DEST_PATH_IMAGE017
,其中,
Figure 621425DEST_PATH_IMAGE083
表示 第
Figure 178308DEST_PATH_IMAGE084
个投影点,并针对每一个投影点
Figure 179762DEST_PATH_IMAGE020
,找出该投影点
Figure 972138DEST_PATH_IMAGE021
的一个邻域
Figure 109858DEST_PATH_IMAGE022
使得
Figure 962277DEST_PATH_IMAGE085
并保证
Figure 451027DEST_PATH_IMAGE086
Figure 922459DEST_PATH_IMAGE025
Figure 180265DEST_PATH_IMAGE087
对每一个分布节点
Figure 469164DEST_PATH_IMAGE006
,构造新的训练集合
Figure 179631DEST_PATH_IMAGE028
需要说明的是,本步骤可以在计算新的测试样本集合的后验概率分布的期望和方差之前计算。
以下将对本发明的步骤S1到S 5的具体实现步骤进行说明:
步骤S1的具体实现步骤包括:定义符合高斯分布的目标函数
Figure 454755DEST_PATH_IMAGE088
,其中
Figure 193166DEST_PATH_IMAGE030
Figure 262753DEST_PATH_IMAGE089
维输入空间,不失一般性,设输出y为一维,即
Figure 726095DEST_PATH_IMAGE090
在时刻t,给定
Figure 539331DEST_PATH_IMAGE091
,获得符合高斯分布的局部预测模型
Figure 896363DEST_PATH_IMAGE092
,其中,
Figure 136851DEST_PATH_IMAGE035
是 服从均值为0,方差为
Figure 87490DEST_PATH_IMAGE036
的高斯概率分布的高斯噪声,即
Figure 704416DEST_PATH_IMAGE037
。定义如下形式的训练 集
Figure 650375DEST_PATH_IMAGE093
,其中
Figure 327344DEST_PATH_IMAGE094
是观测输入数据集合,
Figure 499699DEST_PATH_IMAGE095
是聚合了 观测输出的列向量。高斯过程回归分析的目标是利用训练集
Figure 779371DEST_PATH_IMAGE096
在测试数据集合
Figure 986361DEST_PATH_IMAGE097
上逼近函数
Figure 568653DEST_PATH_IMAGE098
,高斯过程分析的目的是为了高斯过程回归分析做好准备,包括确定函 数
Figure 228304DEST_PATH_IMAGE098
,以及计算测试样本的先验概率分布、期望和方差。
步骤S2的具体实现步骤包括:确定对称正半定的核函数;利用正半定的核函数构建新的测试样本与样本集合中的观测输入之间的关系,如下:
Figure 538763DEST_PATH_IMAGE099
其中,
Figure 600260DEST_PATH_IMAGE100
,x为测试样本集合中的观测输入,
Figure 619032DEST_PATH_IMAGE101
为新的测试样本,
Figure 890613DEST_PATH_IMAGE041
为测度;
Figure 387453DEST_PATH_IMAGE102
返回列向量,使得列向量的第
Figure 303457DEST_PATH_IMAGE103
个元素等于
Figure 493130DEST_PATH_IMAGE104
根据
Figure 986428DEST_PATH_IMAGE105
的先验概率分布的均值函数
Figure 552538DEST_PATH_IMAGE106
以及核函数是
Figure 57469DEST_PATH_IMAGE047
,获得观测输出和预测输 出
Figure 542677DEST_PATH_IMAGE107
Figure 664217DEST_PATH_IMAGE108
即为新的测试样本
Figure 502860DEST_PATH_IMAGE109
的特征向量)之间的关系,其也服从联合概率分布,如下:
Figure 393455DEST_PATH_IMAGE049
其中,
Figure 285450DEST_PATH_IMAGE110
Figure 628707DEST_PATH_IMAGE111
将分别返回由
Figure 536620DEST_PATH_IMAGE112
Figure 406356DEST_PATH_IMAGE113
组成的向量,
Figure 108733DEST_PATH_IMAGE114
返回一个矩阵 使得第
Figure 939286DEST_PATH_IMAGE055
行第
Figure 978786DEST_PATH_IMAGE056
列的元素是
Figure 843974DEST_PATH_IMAGE115
在高斯回归分析过程中利用高斯过程的性质,即
Figure 717252DEST_PATH_IMAGE116
,获得针对新的测试样本集合的第二期望为
Figure 894155DEST_PATH_IMAGE117
;
获得针对新的测试样本集合的第二方差为
Figure 878292DEST_PATH_IMAGE118
在针对新的测试样本集合计算上述第二期望和第二方差之前,既可以先对新的测试样本集合利用前述的精简方法进行处理,以降低分布节点的计算量。
在一个可选的实施例中,步骤S2中确定的对称正半定的核函数为:
Figure 597986DEST_PATH_IMAGE119
其中,x为历史观测输入,
Figure 642165DEST_PATH_IMAGE120
为新的测试样本,
Figure 70479DEST_PATH_IMAGE121
Figure 592727DEST_PATH_IMAGE122
为核函数的两个超参数。
步骤S3的具体实现步骤包括:
根据多个分布节点的第二期望、第二方差以及对应的权重系数构造目标概率分布为多个概率密度的成绩作为全局预测模型,
Figure 166928DEST_PATH_IMAGE065
其中,
Figure 506643DEST_PATH_IMAGE066
是每个分布节点给出的条件概率分布,可由每个分布节点的第二期望 和第二方差计算获得,
Figure 533505DEST_PATH_IMAGE067
为权重系数,表示对第i个工作机在输入x点对输出预测可靠性的 度量,全局预测模型还包括全局预测的期望,
Figure 859444DEST_PATH_IMAGE068
全局预测模型还包括全局预测的方差,
Figure 412785DEST_PATH_IMAGE069
其中,
Figure 798767DEST_PATH_IMAGE070
为第i各分布节点的第二期望,
Figure 578504DEST_PATH_IMAGE071
为第i个分布节点的第二方差,
Figure 567189DEST_PATH_IMAGE072
表示第i个分布节点在输入点x时的精度。
在进一步的实施例中,本发明的方法还包括:在构造目标概率分布为多个概率密度的成绩的过程中,排除权重系数小于预设阈值的第二期望及第二方差。其中,在一个可选的实施例中,预设阈值可以设为0.6。通过本实施例,能够去除明显不准确的局部预测结果对全局预测模型的影响,进而提升全局预测结果的准确度。
本发明采用广义PoE聚合算法具有如下好处:第一,不需要联合训练,就可以将逐个预测联合起来;第二,预测联合的方式依赖于输入;第三,联合的预测是一个有效的概率模型,可以量化预测不确定性;第四,不可靠的预测会自动在联合预测里被滤除掉,确保了联合预测对于某些不够好的预测是具有鲁棒性的;第五,模型预测可以满足一致性估计。因此,将广义PoE聚合算法应用在本发明的分布式在线学习框架中,有利于提升全局模型预测的准确性。
在进一步的实施例中,本发明的一种分布式预测方法还包括:将全局预测模型返回给多个分布节点;在每个分布节点中分别进行局部预测模型与全局预测模型的融合。其中,多个分布节点包括多个虚拟机或多个物理机。
在本发明的第二方面,提出了一种分布式预测系统。图2为本发明的一种分布式预测系统的结构示意图。如图2所示,本发明的分布式预测系统包括:多个分布节点100,配置用于对获得的测试样本集合进行高斯过程分析,获得符合高斯分布的局部预测模型以及针对测试样本集合的先验概率分布的第一期望和第一方差;分配节点200:配置用于响应于获得新的测试样本而将新的测试样本发送给多个分布节点;多个分布节点100还配置用于由每个分布节点基于对应的局部预测模型通过高斯过程回归分析方法对新的测试样本进行局部预测,并获得针对新的测试样本集合的后验概率分布的第二期望及第二方差;以第一方差和第二方差的差值作为分布节点的权重系数;将多个分布节点的第二期望、第二方差以及对应的权重系数发送给云服务器;云服务器300,配置用于采用PoE聚合算法根据多个分布节点的第二期望、第二方差以及对应的权重系数构建全局预测模型并输出对新的测试样本的全局预测结果。
在本发明的第三方面,提出了一种服务器。图3为本发明的一种服务器的结构示意图。如图3所示,本发明的服务器400包括:至少一个处理器401;以及存储器402,存储器402中存储有可执行的计算机程序,计算机程序被至少一个处理器401执行时用于实现如上述任意一实施例中的一种分布式预测方法的相应步骤。
在本发明的第四方面,提出了一种可读存储介质。图4为本发明的一种可读存储介质的结构示意图。如图4所示,本发明的可读存储介质500包括:可执行的计算机程序501,计算机程序501被执行时用于实现如上述任意一实施例中的一种分布式预测方法的相应步骤。
以上是本发明公开的示例性实施例,但是应当注意,在不背离权利要求限定的本发明实施例公开的范围的前提下,可以进行多种改变和修改。根据这里描述的公开实施例的方法权利要求的功能、步骤和/或动作不需以任何特定顺序执行。此外,尽管本发明实施例公开的元素可以以个体形式描述或要求,但除非明确限制为单数,也可以理解为多个。
应当理解的是,在本文中使用的,除非上下文清楚地支持例外情况,单数形式“一个”旨在也包括复数形式。还应当理解的是,在本文中使用的“和/或”是指包括一个或者一个以上相关联地列出的项目的任意和所有可能组合。
上述本发明实施例公开实施例序号仅仅为了描述,不代表实施例的优劣。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本发明实施例公开的范围(包括权利要求)被限于这些例子;在本发明实施例的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,并存在如上的本发明实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。因此,凡在本发明实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明实施例的保护范围之内。

Claims (20)

1.一种分布式预测方法,其特征在于,所述方法包括:
由分布节点对获得的测试样本集合进行高斯过程分析,获得符合高斯分布的局部预测模型以及针对所述测试样本集合的先验概率分布的第一期望和第一方差;
响应于获得新的测试样本而将所述新的测试样本发送给多个所述分布节点,并由每个所述分布节点基于对应的局部预测模型通过高斯过程回归分析方法对所述新的测试样本进行局部预测,并获得针对新的测试样本集合的后验概率分布的第二期望及第二方差;
以所述第一方差和所述第二方差的差值作为所述分布节点的权重系数;
将多个所述分布节点的第二期望、第二方差以及对应的权重系数发送给云服务器;
由所述云服务器采用PoE聚合算法根据多个所述分布节点的第二期望、第二方差以及对应的权重系数构建全局预测模型并输出对所述新的测试样本的全局预测结果。
2.根据权利要求1所述的一种分布式预测方法,其特征在于,所述方法还包括:
获取历史观测数据,所述历史观测数据包括观测输入及对应的观测输出;
根据所述分布节点的个数,将所述历史观测数据划分到多个测试样本集合中并分派给各个分布节点。
3.根据权利要求1所述的一种分布式预测方法,其特征在于,所述新的测试样本集合包括:在原始的所述测试样本集合中新增所述新的测试样本以及所述新的测试样本的局部预测输出后形成的测试样本集合。
4.根据权利要求3所述的一种分布式预测方法,其特征在于,所述方法还包括对所述新的测试样本集合进行精简,精简步骤包括:
将所述新的测试样本集合投影到更高维度的空间中;
在更高维度的空间中以所述新的测试样本的投影点为中心,以预设领域半径获得邻域内的邻域投影点;
获取对应所述邻域投影点的原始测试样本,并与所述新的测试样本组成精简后的测试样本集合。
5.根据权利要求4所述的一种分布式预测方法,其特征在于,所述方法还包括:
判断所述邻域投影点的个数是否大于等于预设值;
响应于获得的邻域投影点的个数小于所述预设值,按照预设步长增大所述领域半径,直至获得邻域投影点的个数大于等于所述预设值。
6.根据权利要求5所述的一种分布式预测方法,其特征在于,所述邻域投影点中应至少存在两个邻域投影点,且分别位于所述新的测试样本的投影点的不同方向上。
7.根据权利要求3所述的一种分布式预测方法,其特征在于,所述方法还包括对所述新的测试样本集合进行精简,精简步骤包括:
定义历史观测输入x和新的测试样本
Figure 25428DEST_PATH_IMAGE001
之间的距离为
Figure 685080DEST_PATH_IMAGE002
,历史观测输入x 到集合
Figure 269907DEST_PATH_IMAGE003
的距离为
Figure 331404DEST_PATH_IMAGE004
历史观测输入x到测试样本集合
Figure 350175DEST_PATH_IMAGE003
的投影集合为
Figure 90598DEST_PATH_IMAGE005
获得每一个分布节点
Figure 853018DEST_PATH_IMAGE006
及其局部训练数据集
Figure 769021DEST_PATH_IMAGE007
,针对测试数据
Figure 958694DEST_PATH_IMAGE008
,计算测试数据
Figure 717572DEST_PATH_IMAGE009
到训练集
Figure 752524DEST_PATH_IMAGE010
的投影
Figure 523034DEST_PATH_IMAGE011
在每一个时刻
Figure 8242DEST_PATH_IMAGE012
,局部投影集合
Figure 864202DEST_PATH_IMAGE013
包含有
Figure 968425DEST_PATH_IMAGE014
个投影数据,即
Figure 859020DEST_PATH_IMAGE015
对每一个分布节点
Figure 13665DEST_PATH_IMAGE006
及其投影集合
Figure 356921DEST_PATH_IMAGE016
,取出每一个投影点
Figure 999255DEST_PATH_IMAGE017
,其中,
Figure 744357DEST_PATH_IMAGE018
表示第
Figure 305789DEST_PATH_IMAGE019
个投影点,并针对每一个投影点
Figure 136341DEST_PATH_IMAGE020
,找出该投影点
Figure 582366DEST_PATH_IMAGE021
的一个邻域
Figure 572188DEST_PATH_IMAGE022
使得
Figure 445466DEST_PATH_IMAGE023
并保证
Figure 497736DEST_PATH_IMAGE024
Figure 606506DEST_PATH_IMAGE025
Figure 326200DEST_PATH_IMAGE026
对每一个分布节点
Figure 370380DEST_PATH_IMAGE027
,构造新的训练集合
Figure 909945DEST_PATH_IMAGE028
8.根据权利要求2所述的一种分布式预测方法,其特征在于,所述由分布节点对获得的测试样本集合进行高斯过程分析,获得符合高斯分布的局部预测模型,包括:
定义符合高斯分布的目标函数
Figure 323871DEST_PATH_IMAGE029
,其中
Figure 898072DEST_PATH_IMAGE030
Figure 113153DEST_PATH_IMAGE031
维输入空间,不失一般性,设 输出y为一维,即
Figure 405594DEST_PATH_IMAGE032
在时刻t,给定
Figure 856167DEST_PATH_IMAGE033
,获得符合高斯分布的局部预测模型
Figure 550453DEST_PATH_IMAGE034
,其中,
Figure 936435DEST_PATH_IMAGE035
是服从均值 为0,方差为
Figure 450593DEST_PATH_IMAGE036
的高斯概率分布的高斯噪声,即
Figure 439278DEST_PATH_IMAGE037
9.根据权利要求8所述的一种分布式预测方法,其特征在于,所述由每个所述分布节点基于对应的局部预测模型通过高斯过程回归分析方法对所述新的测试样本进行局部预测,包括:
确定对称正半定的核函数;
利用所述正半定的核函数构建所述新的测试样本与所述样本集合中的观测输入之间的关系
Figure 988071DEST_PATH_IMAGE038
其中,
Figure 544954DEST_PATH_IMAGE039
,x为测试样本集合中的观测输入,
Figure 671042DEST_PATH_IMAGE040
为新的测试样本,
Figure 604363DEST_PATH_IMAGE041
为测度;
Figure 7662DEST_PATH_IMAGE042
返回列向量,使得所述列向量的第
Figure 735447DEST_PATH_IMAGE043
个元素等于
Figure 853226DEST_PATH_IMAGE044
根据所述
Figure 324658DEST_PATH_IMAGE045
的先验概率分布的均值函数
Figure 582464DEST_PATH_IMAGE046
以及所述核函数是
Figure 605784DEST_PATH_IMAGE047
,获得观测输出和预测 输出
Figure 581830DEST_PATH_IMAGE048
之间的关系,即服从联合概率分布
Figure 856954DEST_PATH_IMAGE049
,
其中,
Figure 969266DEST_PATH_IMAGE050
Figure 429066DEST_PATH_IMAGE051
将分别返回由
Figure 626829DEST_PATH_IMAGE052
Figure 705644DEST_PATH_IMAGE053
组成的向量,
Figure 531517DEST_PATH_IMAGE054
返回一个矩阵 使得第
Figure 37585DEST_PATH_IMAGE055
行第
Figure 722644DEST_PATH_IMAGE056
列的元素是
Figure 339571DEST_PATH_IMAGE057
10.根据权利要求9所述的一种分布式预测方法,其特征在于,所述获得针对新的测试样本集合的后验概率分布的第二期望及第二方差,包括:
在高斯回归分析过程中利用高斯过程的性质
Figure 52574DEST_PATH_IMAGE058
,获得针对所述 新的测试样本集合的后验概率分布的第二期望为
Figure 729543DEST_PATH_IMAGE059
;
获得针对所述新的测试样本集合的后验概率分布的第二方差为
Figure 901898DEST_PATH_IMAGE060
11.根据权利要求10所述的一种分布式预测方法,其特征在于,所述对称正半定的核函数,包括:
Figure 322515DEST_PATH_IMAGE061
其中,x为历史观测输入,
Figure 388560DEST_PATH_IMAGE062
为新的测试样本,
Figure 970851DEST_PATH_IMAGE063
Figure 630503DEST_PATH_IMAGE064
为核函数的两个超参数。
12.根据权利要求11所述的一种分布式预测方法,其特征在于,所述由所述云服务器采用PoE聚合算法根据多个所述分布节点的第二期望、第二方差以及对应的权重系数构建全局预测模型,包括:
根据多个所述分布节点的第二期望、第二方差以及对应的权重系数构造目标概率分布为多个概率密度的成绩,
Figure 713865DEST_PATH_IMAGE065
其中,
Figure 775362DEST_PATH_IMAGE066
是每个分布节点给出的条件概率分布,由每个分布节点的第二期望和第二 方差计算获得,
Figure 528555DEST_PATH_IMAGE067
为所述权重系数,表示对第i个工作机在输入x点对输出预测可靠性的度 量,所述全局预测模型包括期望为
Figure 675502DEST_PATH_IMAGE068
所述全局预测模型还包括方差为
Figure 562556DEST_PATH_IMAGE069
其中,
Figure 478559DEST_PATH_IMAGE070
为第i各分布节点的第二期望,
Figure 668232DEST_PATH_IMAGE071
为第i个分布节点的第二方差,
Figure 394486DEST_PATH_IMAGE072
表示第i个分布节点在输入点x时的精度。
13.根据权利要求12所述的一种分布式预测方法,其特征在于,所述方法还包括:
在构造目标概率分布为多个概率密度的成绩的过程中,排除所述权重系数小于预设阈值的第二期望及第二方差。
14.根据权利要求13所述的一种分布式预测方法,其特征在于,所述预设阈值为0.6。
15.根据权利要求1所述的一种分布式预测方法,其特征在于,所述方法还包括:
将所述全局预测模型返回给多个所述分布节点;
在每个分布节点中分别进行局部预测模型与所述全局预测模型的融合。
16.根据权利要求1所述的一种分布式预测方法,其特征在于,所述多个分布节点包括多个虚拟机。
17.根据权利要求1所述的一种分布式预测方法,其特征在于,所述多个分布节点包括多个物理机。
18.一种分布式预测系统,其特征在于,包括:
多个分布节点,配置用于对获得的测试样本集合进行高斯过程分析,获得符合高斯分布的局部预测模型以及针对所述测试样本集合的先验概率分布的第一期望和第一方差;
分配节点:配置用于响应于获得新的测试样本而将所述新的测试样本发送给多个所述分布节点;
所述多个分布节点还配置用于由每个所述分布节点基于对应的局部预测模型通过高斯过程回归分析方法对所述新的测试样本进行局部预测,并获得针对新的测试样本集合的后验概率分布的第二期望及第二方差;
以所述第一方差和所述第二方差的差值作为所述分布节点的权重系数;
将多个所述分布节点的第二期望、第二方差以及对应的权重系数发送给云服务器;
云服务器,配置用于采用PoE聚合算法根据多个所述分布节点的第二期望、第二方差以及对应的权重系数构建全局预测模型并输出对所述新的测试样本的全局预测结果。
19.一种服务器,其特征在于,包括:
至少一个处理器;以及
存储器,所述存储器中存储有可执行的计算机程序,所述计算机程序被所述至少一个处理器执行时用于实现如上述权利要求1-17任意一项所述的一种分布式预测方法的相应步骤。
20.一种可读存储介质,其特征在于,包括:
可执行的计算机程序,所述计算机程序被执行时用于实现如上述权利要求1-17任意一项所述的一种分布式预测方法的相应步骤。
CN202211333745.0A 2022-10-28 2022-10-28 一种分布式预测方法、系统、服务器及存储介质 Pending CN115392493A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211333745.0A CN115392493A (zh) 2022-10-28 2022-10-28 一种分布式预测方法、系统、服务器及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211333745.0A CN115392493A (zh) 2022-10-28 2022-10-28 一种分布式预测方法、系统、服务器及存储介质

Publications (1)

Publication Number Publication Date
CN115392493A true CN115392493A (zh) 2022-11-25

Family

ID=84114896

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211333745.0A Pending CN115392493A (zh) 2022-10-28 2022-10-28 一种分布式预测方法、系统、服务器及存储介质

Country Status (1)

Country Link
CN (1) CN115392493A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116611744A (zh) * 2023-07-17 2023-08-18 中国石油大学(华东) 一种用于sofc热电联供系统综合评价的综合赋权方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112766318A (zh) * 2020-12-31 2021-05-07 新智数字科技有限公司 业务任务执行方法、装置以及计算机可读存储介质
CN114511063A (zh) * 2021-12-31 2022-05-17 国网冀北电力有限公司信息通信分公司 电力数据预测模型构建方法、装置、设备、介质及程序
CN115174191A (zh) * 2022-06-30 2022-10-11 山东云海国创云计算装备产业创新中心有限公司 一种局部预测值安全传输方法、计算机设备和存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112766318A (zh) * 2020-12-31 2021-05-07 新智数字科技有限公司 业务任务执行方法、装置以及计算机可读存储介质
CN114511063A (zh) * 2021-12-31 2022-05-17 国网冀北电力有限公司信息通信分公司 电力数据预测模型构建方法、装置、设备、介质及程序
CN115174191A (zh) * 2022-06-30 2022-10-11 山东云海国创云计算装备产业创新中心有限公司 一种局部预测值安全传输方法、计算机设备和存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116611744A (zh) * 2023-07-17 2023-08-18 中国石油大学(华东) 一种用于sofc热电联供系统综合评价的综合赋权方法
CN116611744B (zh) * 2023-07-17 2023-10-27 中国石油大学(华东) 一种用于sofc热电联供系统综合评价的综合赋权方法

Similar Documents

Publication Publication Date Title
CN111124840B (zh) 业务运维中告警的预测方法、装置与电子设备
Bottou et al. Optimization methods for large-scale machine learning
WO2021007812A1 (zh) 一种深度神经网络超参数优化方法、电子设备及存储介质
Wang et al. Deep Boltzmann machine based condition prediction for smart manufacturing
CN111324993B (zh) 一种湍流场更新方法、装置及其相关设备
US20200372342A1 (en) Systems and methods for predictive early stopping in neural network training
Jayaram et al. A Neural Network Approach To Tolerance Synthesis and Cost Optimisation in Assembly
CN115456202B (zh) 一种提高工作机学习性能的方法、装置、设备及介质
CN110995487A (zh) 多服务质量预测方法、装置、计算机设备及可读存储介质
Ciancio et al. Heuristic techniques to optimize neural network architecture in manufacturing applications
CN115563858A (zh) 一种工作机稳态性能提升的方法、装置、设备及介质
CN115392493A (zh) 一种分布式预测方法、系统、服务器及存储介质
Saguil et al. A layer-partitioning approach for faster execution of neural network-based embedded applications in edge networks
CN117250914A (zh) 制造过程捕获的测量数据训练机器学习模型的方法和系统
CN114817571A (zh) 基于动态知识图谱的成果被引用量预测方法、介质及设备
Vuong et al. Uncertainty-aware model-based policy optimization
Saxena et al. Software effort estimation using neuro-fuzzy approach
JP6645509B2 (ja) 構造解析方法、及び構造解析プログラム
CN109299725B (zh) 一种张量链并行实现高阶主特征值分解的预测系统和装置
Guo et al. New algorithms of feature selection and big data assignment for CBR system integrated by bayesian network
Cooper et al. Error homogenization in physics-informed neural networks for modeling in manufacturing
JP2022182628A (ja) 情報処理装置、情報処理方法、情報処理プログラム、及び学習モデル生成装置
CN117474128B (zh) 一种基于多云服务器的分布式在线机器学习模型构建方法
CN117474127B (zh) 分布式机器学习模型训练系统、方法、装置及电子设备
Kumar et al. MapReduce-based fuzzy very fast decision tree for constructing prediction intervals

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination