CN112766318A - 业务任务执行方法、装置以及计算机可读存储介质 - Google Patents

业务任务执行方法、装置以及计算机可读存储介质 Download PDF

Info

Publication number
CN112766318A
CN112766318A CN202011635733.4A CN202011635733A CN112766318A CN 112766318 A CN112766318 A CN 112766318A CN 202011635733 A CN202011635733 A CN 202011635733A CN 112766318 A CN112766318 A CN 112766318A
Authority
CN
China
Prior art keywords
center points
target
similarity
data
label data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011635733.4A
Other languages
English (en)
Other versions
CN112766318B (zh
Inventor
杨杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xinao Xinzhi Technology Co ltd
Original Assignee
Ennew Digital Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ennew Digital Technology Co Ltd filed Critical Ennew Digital Technology Co Ltd
Priority to CN202011635733.4A priority Critical patent/CN112766318B/zh
Publication of CN112766318A publication Critical patent/CN112766318A/zh
Priority to PCT/CN2021/101318 priority patent/WO2022142179A1/zh
Priority to US18/157,086 priority patent/US20230161823A1/en
Application granted granted Critical
Publication of CN112766318B publication Critical patent/CN112766318B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Economics (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Mathematical Physics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computing Systems (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Evolutionary Biology (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Probability & Statistics with Applications (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种业务任务执行方法、装置、计算机可读存储介质及电子设备,方法包括:对目标用户的业务任务对应的多个非标签数据进行聚类,以确定至少两个聚类中心点;根据所述至少两个聚类中心点以及所述多个非标签数据,确定联合用户的多个标签数据各自对应的权重,所述多个标签数据和所述业务任务对应;根据各个所述联合用户各自的所述多个标签数据以及所述多个标签数据各自对应的权重,构建联合学习模型,所述联合学习模型用于执行所述目标用户的业务任务。通过本发明的技术方案,可在目标用户不具有标签的前提下,通过标签数据的权重,将非标签数据迁移到了标签数据上,确保能够实现目标用户的业务任务。

Description

业务任务执行方法、装置以及计算机可读存储介质
技术领域
本发明涉及能源技术领域,尤其涉及业务任务执行方法、装置以及计算机可读存储介质。
背景技术
作为一种新型机器学习理念,联合学习通过分布式训练及加密技术确保用户隐私数据得到最大限度的保护,以提升用户对人工智能技术的信任。在联合学习机制下,联合学习服务器初始化全局模型,下发给每个用户作为初始化模型,用户根据自身数据训练本地的局部模型,然后上传局部模型到联合学习服务器,联合学习服务器聚合局部模型再下发到每个用户作为初始化模型训练,如此迭代直至模型收敛,最后得到全局模型,通过联合每个用户数据信息,在数据不出本地的情况下提高全局模型的精度。
目前,首先通过联合学习得到目标用户的全局模型,然后根据目标用户的本地数据微调全局模型,得到适合目标用户的模型。
但是,微调全局模型需要利用目标用户的标签数据,然而在很多应用场景下,目标用户的标签数据难以获取,使得此类方式在使用时面临困难。
发明内容
本发明提供了一种业务任务执行方法、装置、计算机可读存储介质及电子设备,可在目标用户不具有标签的前提下,通过标签数据的权重,将非标签数据迁移到了标签数据上,确保能够实现目标用户的业务任务。
第一方面,本发明提供了一种业务任务执行方法,包括:
对目标用户的业务任务对应的多个非标签数据进行聚类,以确定至少两个聚类中心点;
根据所述至少两个聚类中心点以及所述多个非标签数据,确定联合用户的多个标签数据各自对应的权重,所述多个标签数据和所述业务任务对应;
根据所述联合用户的所述多个标签数据以及所述多个标签数据各自对应的权重,构建联合学习模型,所述联合学习模型用于执行所述目标用户的业务任务。
第二方面,本发明提供了一种业务任务执行装置,包括:
聚类模块,用于对目标用户的业务任务对应的多个非标签数据进行聚类,以确定至少两个聚类中心点;
权重确定模块,用于根据所述至少两个聚类中心点以及所述多个非标签数据,确定联合用户的多个标签数据各自对应的权重,所述多个标签数据和所述业务任务对应;
构建模块,用于根据所述联合用户的所述多个标签数据以及所述多个标签数据各自对应的权重,构建联合学习模型,所述联合学习模型用于执行所述目标用户的业务任务。
第三方面,本发明提供了一种计算机可读存储介质,包括执行指令,当电子设备的处理器执行所述执行指令时,所述处理器执行如第一方面中任一所述的方法。
第四方面,本发明提供了一种电子设备,包括处理器以及存储有执行指令的存储器,当所述处理器执行所述存储器存储的所述执行指令时,所述处理器执行如第一方面中任一所述的方法。
本发明提供了一种业务任务执行方法、装置、计算机可读存储介质及电子设备,该方法通过对目标用户的业务任务对应的多个非标签数据进行聚类,以确定两个或多个聚类中心点,然后,根据两个或多个聚类中心点以及多个非标签数据,确定联合用户的多个标签数据各自对应的权重,多个标签数据和业务任务对应,之后,根据联合用户的多个标签数据以及多个标签数据各自对应的权重,构建联合学习模型,联合学习模型用于执行目标用户的业务任务。综上所述,通过本发明的技术方案,可在目标用户不具有标签的前提下,通过标签数据的权重,将非标签数据迁移到了标签数据上,确保能够实现目标用户的业务任务。
上述的非惯用的优选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
为了更清楚地说明本发明实施例或现有的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一实施例提供的一种业务任务执行方法的流程示意图;
图2为本发明一实施例提供的另一种业务任务执行方法的结构示意图;
图3为本发明一实施例提供的一种业务任务执行装置的结构示意图;
图4为本发明一实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合具体实施例及相应的附图对本发明的技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,为本发明实施例提供的一种业务任务执行方法。本发明实施例所提供的方法可应用在电子设备上,具体可以应用于服务器或一般计算机上。本实施例中,所述方法具体包括以下步骤:
步骤101、对目标用户的业务任务对应的多个非标签数据进行聚类,以确定至少两个聚类中心点。
目标用户指的是具有业务需求的设备,可以是能源设备,比如燃气蒸汽锅炉、光伏电站、燃气内燃机、燃气轮机等。
业务任务指的是目标用户最终要实现的目标,比如,可以是故障预测、设备剩余使用寿命预测、变量预测等。
非标签数据指的是不具有标签的特征数据,特征数据是一个一维行向量,行向量包括多个特征各自对应的特征值,其中,特征指的是影响业务任务的影响因素,应当理解的,多个非标签数据具有顺序号,每个非标签数据对应的多个特征相同,且多个特征具有顺序号,在实际应用中,第i个非标签数据表示为[xi,1,xi,2,……,xi,j-1,xi,j],这里,xi,j表示第i个非标签数据中的第j个特征对应的特征值,其他数据项表示含义类似,这里不做过多赘述。
具体地,通过聚类算法对多个非标签数据进行聚类,从而确定两个或多个聚类中心点。其中,聚类算法可以是k-means聚类、层次聚类算法或密度聚类,优选K-means聚类。在一些可能的情况中,聚类中心点和多个非标签数据中的任意一个非标签数据不同,从而确保了数据安全。具体地,通过聚类算法对多个非标签数据进行聚类,以确定若干个聚类簇,针对每个聚类簇,计算聚类簇中的多个非标签数据的均值,当计算得到的均值为非标签数据时,将该均值以及距离该均值最近的非标签数据之间的均值确定为聚类中心点。
步骤102、根据所述至少两个聚类中心点以及所述多个非标签数据,确定联合用户的多个标签数据各自对应的权重,所述多个标签数据和所述业务任务对应。
本实施例通过两个或多个聚类中心点以及多个非标签数据,确定出联合用户的多个标签数据各自对应的权重,在目标用户不具有标签的前提下,将非标签数据迁移到了标签数据上,确保能够实现目标用户的业务任务。
可以理解的,标签数据指的是具有标签的特征数据,标签数据和非标签数据对应的多个特征相同,从而使得目标用户和联合用户之间能够进行横向联合学习。其中,标签和业务任务有关,比如,业务任务是故障预测,则标签可以是故障类型,业务任务是烟气含氧量预测,则标签可以是烟气含氧量,业务任务是设备剩余使用寿命,则标签可以是设备剩余使用寿命,在实际应用中,第i个标签数据表示为[xi,1,xi,2,……,xi,j-1,xi,j,yi],这里,xi,j表示第i个标签数据中的第j个特征对应的特征值,yi表征第i个标签数据对应的标签,其他数据项表示含义类似,这里不做过多赘述。
具体地,标签数据的权重指的是标签数据相对于非标签数据的重要程度,从而将非标签数据迁移到标签数据上。
在一些可行的实施例中,步骤102包括:
根据所述至少两个聚类中心点和所述多个非标签数据,确定所述至少两个聚类中心点各自与所述多个非标签数据之间的目标相似度;
根据所述至少两个聚类中心点、所述至少两个聚类中心点各自与所述多个非标签数据之间的目标相似度以及联合用户的多个标签数据,确定所述至少两个聚类中心点各自对应的相似度权重;
根据所述至少两个聚类中心点各自对应的相似度权重,确定所述联合用户的多个标签数据各自对应的权重。
本实施例中,通过确定聚类中心点与多个非标签数据之间的目标相似度,并基于聚类中心点和聚类中心点与多个非标签数据之间的目标相似度,确定聚类中心点对应的相似度权重,基于所有聚类中心点各自对应的相似度权重,确定联合用户的多个标签数据各自对应的权重,并不涉及到非标签数据和标签数据之间的交互,确保了数据安全,同时,聚类中心点和目标相似度能够表征多个非标签数据之间的关系,从而确保多个标签数据各自对应的权重的参考价值,且得到的权重综合考虑到聚类中心点对应的相似度权重,具有相对较高的准确性。其中,聚类中心点对应的相似度权重指示了聚类中心点和联合用户的标签数据之间的相似度的重要程度。
可选地,针对每个聚类中心点,基于多个非标签数据各自与聚类中心点之间的相似度,然后对多个非标签数据各自与聚类中心点之间的相似度进行平均,得到聚类中心点与多个非标签数据之间的目标相似度,即所述目标相似度基于对所述多个标签数据各自与所述聚类中心点之间的目标相似度进行平均得到。具体地,可通过任何现有技术中的相似度计算方法确定聚类中心点和非标签数据之间的相似度,比如,可以通过计算聚类中心点和非标签数据之间的距离,并将该距离确定为相似度,也可以通过核函数,计算聚类中心点和标签数据之间的核函数值,并将核函数值确定为相似度,换言之,非标签数据与聚类中心点之间的相似度可以通过核函数计算,其中,核函数可以是现有技术中的任意一种核函数,比如,多项式核函数、线性核函数、径向基核函数、指数核函数,优选径向基核函数中的高斯核函数。具体可通过如下第一公式计算聚类中心点与多个非标签数据之间的目标相似度;其中,所述第一公式包括:
Figure BDA0002881066690000061
其中,
Figure BDA0002881066690000062
表征第l个聚类中心点与多个非标签数据的目标相似度;n表征多个非标签数据的数据个数;xi表征第i个非标签数据;xl表征第l个聚类中心点;K(·)表征核函数。应当理解的,基于核函数K(·)所计算出来的核函数值理解为聚类中心点和非标签数据之间的相似度。优选高斯核函数。
可选地,针对所述联合用户的每个所述标签数据,根据所述至少两个聚类中心点各自对应的相似度权重,对所述至少两个聚类中心点各自与所述标签数据之间的相似度进行加权求和,以确定所述标签数据对应的权重。具体可通过如下第六公式计算标签数据的权重;其中,所述第六公式如下:
Figure BDA0002881066690000071
其中,
Figure BDA0002881066690000072
表征第j个标签数据的权重;xj表征第j个标签数据;xl表征第l个聚类中心点;
Figure BDA0002881066690000073
表征第l个聚类中心点对应的相似度权重;k表征聚类中心点的个数;K(·)表征核函数。这里,k个聚类中心点各自对应的相似度权重之和等于1。
具体可通过如下两种实现方式实现根据所述至少两个聚类中心点、所述至少两个聚类中心点各自与所述多个非标签数据之间的目标相似度以及联合用户的多个标签数据,确定所述至少两个聚类中心点各自对应的相似度权重。
实现方式1:根据所述至少两个聚类中心点以及联合用户的多个标签数据,确定所述至少两个聚类中心点各自与所述多个标签数据之间的参考相似度;针对每个所述聚类中心点,计算所述聚类中心点与所述多个非标签数据之间的目标相似度,以及所述聚类中心点与所述多个标签数据之间的参考相似度的比值,并将该比值确定为所述聚类中心点对应的相似度权重。需要说明的是,目标相似度和参考相似度的计算方法相同,区别仅仅在于目标相似度是针对目标用户的非标签数据,参考相似度是针对联合用户的标签数据。
实现方式2:根据所述至少两个聚类中心点和所述多个非标签数据,确定所述至少两个聚类中心点中任意两个聚类中心点之间的初始相关性;根据所述任意两个聚类中心点以及联合用户的多个标签数据,确定所述任意两个聚类中心点之间的参考相关性;根据所述任意两个聚类中心点之间的初始相关性以及参考相关性,确定所述任意两个聚类中心点之间的目标相关性;根据所述任意两个聚类中心点之间的目标相关性和所述至少两个聚类中心点各自与所述多个非标签数据之间的目标相似度,确定所述至少两个聚类中心点各自对应的相似度权重。
在实现方式2中,通过任意两个聚类中心对应在联合用户的多个标签数据上的参考相关性,以及任意两个聚类中心对应在目标用户的多个非标签数据上的初始相关性,确定出任意两个聚类中心对应的目标相关性,目标相关性用于表征目标用户和联合用户之间的数据相关程度,之后,基于任意两个聚类中心点之间的目标相关性和所有聚类中心点各自与联合用户的多个非标签数据之间的目标相似度,确定出所有的聚类中心点各自对应的相似度权重。可以理解的,得到的相似度权重综合考虑到聚类中心点,聚类中心点与多个非标签数据之间的目标相似度,任意两个聚类中心点之间的初始相关性以及参考相关性,具有相对较高的准确性。其中,两个聚类中心点之间的初始相关性指示了两个聚类中心点对应在目标用户的多个非标签数据上的相关程度,初始相关性越大,则说明两个聚类中心点对应在非标签数据上的相关性越大。两个聚类中心点之间的参考相关性指示了两个聚类中心点对应在联合用户的多个标签数据上的相关程度。
在实现方式2中,可选地,所述初始相关性基于目标概率分布权重,对所述多个非标签数据各自对应的目标相似度乘积值的平均值进行修正得到,所述目标相似度乘积值基于对所述任意两个聚类中心点各自与所述非标签数据之间的目标相似度进行相乘得到。在实际应用中,针对任意两个聚类中心点,计算任意两个聚类中心点各自与同一非标签数据之间的目标相似度,并对任意两个聚类中心点各自与同一非标签数据之间的目标相似度进行相乘,得到目标相似度乘积值,之后,得到多个非标签数据各自对应的目标相似度乘积值,对多个非标签数据各自对应的目标相似度乘积值进行平均,得到平均结果,基于目标概率分布权重,对平均结果进行修正,得到该聚类中心对应的初始相关性。具体可通过如下第二公式计算所述任意两个聚类中心点之间的初始相关性;其中,所述第二公式包括:
Figure BDA0002881066690000081
其中,
Figure BDA0002881066690000082
表征第l个聚类中心点和第l′个聚类中心点之间的初始相关性;n表征各个所述非标签数据的数据个数;xi表征第i个所述非标签数据;xl表征第l个聚类中心点;xl′表征第l′个聚类中心点;α表征目标概率分布权重;K(·)表征核函数。
对应的,所述参考相关性基于参考概率分布权重,对所述多个标签数据各自对应的参考相似度乘积值的平均值进行修正得到,所述参考相似度乘积值基于对所述任意两个聚类中心点各自与所述标签数据之间的参考相似度进行相乘得到。在实际应用中,通过如下第三公式计算所述任意两个聚类中心点之间的参考相关性;其中,所述第三公式包括:
Figure BDA0002881066690000091
其中,
Figure BDA0002881066690000092
表征第l个聚类中心点和第l′个聚类中心点之间的参考相关性;xj表征所述联合用户的第j个所述标签数据;m表征所述联合用户的各个所述标签数据的数据个数;1-α表征参考概率分布权重,α表征目标概率分布权重。
应当理解的,目标概率分布权重指示了目标用户的多个非标签数据的概率分布的重要性,作为一种可能的实现方式,可根据实际需求人为设定。作为另一种可能的情况,具体可通过如下方式确定目标概率分布权重:
获取所述多个非标签数据对应的多个验证数据以及预设概率分布权重;
根据所述预设概率分布权重以及所述多个验证数据,确定所述多个验证数据各自对应的验证权重;
根据所述多个验证数据各自对应的权重标签和所述多个验证数据各自对应的验证权重,确定所述预设概率分布权重对应的误差数据;
根据各个所述预设概率分布权重对应的误差数据,确定所述目标概率分布权重。
本实施例中,采用确定联合用户的多个标签数据各自对应的权重的相同方法,通过预设概率分布权重,确定多个验证数据各自对应的验证权重,然后,判断多个验证数据各自对应的权重标签和多个验证数据各自对应的验证权重,确定预设概率分布权重对应的误差数据,基于误差数据判断预设概率分布权重的准确性,将准确性最高的预设概率分布权重确定为目标概率分布权重,从而确保基于目标概率分布权重确定出的联合用户的多个标签数据各自对应的权重的准确性。这里,多个验证数据可以是目标用户的业务任务的其他非标签数据,也可以是联合用户的业务任务的多个标签数据,具体需要结合实际情况确定。误差数据可以是多个验证数据各自对应的权重标签和验证权重之间的差值的标准差、方差等用于评价误差的参数,此处不做具体限定。应当理解的,确定验证数据的验证权重与确定联合用户的标签数据的权重的方法是相同的。
在实现方式2中,作为一种可能的情况,通过如下方式实现根据所述任意两个聚类中心点之间的目标相关性和所述至少两个聚类中心点各自与所述多个非标签数据之间的目标相似度,确定所述至少两个聚类中心点各自对应的相似度权重:
根据所述任意两个聚类中心点之间的目标相关性,确定所述至少两个聚类中心点对应的目标相关性矩阵;根据所述至少两个聚类中心点各自与所述多个非标签数据之间的目标相似度,确定目标相似度向量;根据正则化参数以及单位矩阵,对所述目标相关性矩阵进行修正,以确定修正相关性矩阵;根据所述修正相关性矩阵和所述目标相似度向量,确定相似度权重向量,所述相似度权重向量包括所述至少两个聚类中心点各自对应的相似度权重。
可以理解的,为了防止过拟合,采用正则化参数和单位矩阵对相关性矩阵进行了修正,确定了修正相关性矩阵,然后根据修正相关性矩阵和相似度向量,确定相似度权重向量,从而得到各个聚类中心点各自对应的相似度权重。
具体地,对正则化参数和相似度向量相乘后得到的结果,与相关性矩阵相加,得到修正相关性矩阵,然后修正相关性矩阵的倒数和相似度向量相乘得到相似度权重向量。在实际应用中,通过如下第四公式计算所述修正相关性矩阵;其中,所述第四公式包括:
Figure BDA0002881066690000101
其中,
Figure BDA0002881066690000111
表征所述修正相关性矩阵;
Figure BDA0002881066690000112
表征所述相关性矩阵;λ表征所述正则化参数;In表征所述单位矩阵。
通过如下第五公式计算相似度权重向量;其中,所述第五公式包括:
Figure BDA0002881066690000113
其中,
Figure BDA0002881066690000114
表征相似度权重向量;
Figure BDA0002881066690000115
表征所述修正相关性矩阵;
Figure BDA0002881066690000116
表征所述目标相似度向量。
需要说明的是,目标相关性矩阵中的聚类中心点的编号和目标相似度向量中的聚类中心点的编号相同,应当理解的,聚类中心点的编号大小指示了聚类中心点的顺序。
具体地,目标相关性矩阵中的矩阵元素综合考虑两个聚类中心点之间的初始相关性以及参考相关性,确保了相关性矩阵的参考价值。具体可通过如下2种实现方式确定目标相关性。
实现方式1,所述目标相关性基于对所述任意两个聚类中心点之间的所述初始相关性以及所述参考相关性相加得到。具体地,对两个或多个聚类中心点进行编号,构建二维矩阵,将任意两个聚类中心点之间的初始相关性和参考相关性放入二维矩阵中成为元素,计算任意两个聚类中心点之间的初始相关性和参考相关性之和,以得到目标相关性矩阵。应当理解的,不同联合用户各自计算任意两个聚类中心点的目标相关性。
应当理解的,本实施例中的核心思路是计算目标用户的概率分布p(x)和每个联合用户的概率分布q(x)的概率分布比率w(x),从而为联合用户的标签数据设定权重,多个联合用户的计算过程相同,这里以一个联合用户为例进行说明,假设多个非标签数据表示为
Figure BDA0002881066690000117
其中,n表示非标签数据的数据个数,联合用户的多个标签数据表示为
Figure BDA0002881066690000118
其中,m表示标签数据的数据个数。
Figure BDA0002881066690000119
基于数据和几个聚类点之间的相似度的线性组合的思路构建回归模型,另
Figure BDA00028810666900001110
Figure BDA0002881066690000121
其中,K(x,xl)表征核函数,然后最小化损失函数
Figure BDA0002881066690000122
Figure BDA0002881066690000123
其中,θ具有解析解,
Figure BDA0002881066690000124
其中,λ表征正则化参数;ln表征单位矩阵,
Figure BDA0002881066690000125
表征向量;
Figure BDA0002881066690000126
表征矩阵。
Figure BDA0002881066690000127
中的每个元素表示如下:
Figure BDA0002881066690000128
其中,
Figure BDA0002881066690000129
表征第l行和第l′列相交位置的矩阵元素;n表征各个所述非标签数据的数据个数;xi表征第i个所述非标签数据;xl表征第l个聚类簇的聚类中心点;xl′表征第l′个聚类簇的聚类中心点;α表征目标概率分布权重;K(·)表征核函数;xj表征所述联合用户的第j个所述标签数据;m表征所述联合用户的各个所述标签数据的数据个数;1-α表征参考概率分布权重。
Figure BDA00028810666900001210
中的向量元素表示如下:
Figure BDA00028810666900001211
其中,
Figure BDA00028810666900001212
表征第l个元素;n表征各个所述非标签数据的数据个数;xi表征第i个所述非标签数据;xl表征第l个聚类簇的聚类中心点;K(·)表征核函数。
在实现方式1中,进一步的,还包括:
根据所述多个非标签数据、所述至少两个聚类中心点以及所述至少两个聚类中心点各自对应的相似度权重,确定所述目标用户和所述联合用户之间的数据分布相似度;
根据各个所述联合用户各自与所述目标用户之间的数据分布相似度,确定各个所述联合用户各自的重要性;
根据各个所述联合用户各自的重要性,调整所述联合学习模型。
具体地,通过如下第七公式计算目标用户和联合用户之间的数据分布相似度;其中,第七公式如下:
Figure BDA0002881066690000131
其中,
Figure BDA0002881066690000132
表征目标用户和第s个联合用户的数据分布相似度,
Figure BDA0002881066690000133
表示第s个联合用户的第l个聚类中心点的相似度权重。
具体地,通过如下第八公式计算联合用户的重要性:
Figure BDA0002881066690000134
其中,Scores表征第s个联合用户;N表征联合用户的用户数量。
在实际应用中,获取目标用户将采用联合学习模型进行预测的预测值和预测值对应的真实值,当预测值和真实值之间的误差较大时,比如,大于预设阈值时,此时,可以基于目标用户和联合用户之间的数据分布相似度,确定联合用户的重要性,将重要性较低的联合用户进行删除,保留重要性较高的用户,并通过重要性较高的联合用户进行联合学习,对联合学习模型进行修正,得到准确性更高的联合学习模型。还可以基于联合用户的重要性,对联合用户进行奖励,使得重要性较高的联合用户提供更多的标签数据,从而对联合学习模型进行修正,得到准确性更高的联合学习模型。
实现方式2,基于目标用户的初始相关性和不同联合用户各自的参考相关性进行融合,得到共享的目标相关性,换言之,不同联合用户共享任意两个聚类中心点之间的目标相关性。换言之,各个所述联合用户共享所述任意两个聚类中心点之间的目标相关性;所述目标相关性基于所述任意两个聚类中心点之间的所述初始相关性以及各个所述联合用户各自的所述任意两个聚类中心点之间的参考相关性确定。
具体地,针对所有聚类中心点中的任意两个聚类中心点,目标相关性可以是各个联合用户各自的任意两个聚类中心点之间的参考相关性的均值,与任意两个聚类中心点之间的初始相关性之和,本实施例对如何得到目标相关性不做具体限定,任何基于任意两个聚类中心点之间的初始相关性以及各个联合用户各自的任意两个聚类中心点之间的参考相关性确定的相关性即可。
步骤103、根据各个所述联合用户各自的所述多个标签数据以及所述多个标签数据各自对应的权重,构建联合学习模型,所述联合学习模型用于执行所述目标用户的业务任务。
具体地,针对每个联合用户,根据联合用户的多个标签数据及其各自对应的权重进行初始模型的训练,得到联合用户的局部模型,之后,将各个联合用户各自的局部模型发送到目标用户,目标用户对各个联合用户各自的局部模型聚合后得到更新后的模型,将更新后的模型再下发到每个联合用户作为初始化模型进行训练,如此迭代直至模型收敛,最后得到联合学习模型。得到的联合学习模型用于执行业务任务,比如,当业务任务是故障类型预测时,联合学习模型用于预测目标用户的故障类型。
应当理解的,联合用户的多个标签数据各自对应的权重用于调整模型中的模型参数,从而使得调整后的模型能够反映出目标用户的非标签数据和业务任务之间的联系,确保联合学习模型的模型精度。在实际应用中,具体可通过如下实现方式确定联合用户的局部模型:
A1、根据将标签数据中的多个特征数据分别代入初始模型中的预测结果以及标签数据中的多个特征数据各自对应的标签,确定标签数据对应的第一误差,对多个标签数据各自对应的第一误差以及权重进行相乘计算,以确定多个标签数据各自对应的第二误差;
A2、判断是否满足迭代次数或者多个标签数据各自对应的第二误差是否满足预设条件,如果是,则将初始模型确定为局部模型,如果否,则执行A3;
A3、根据多个标签数据各自对应的第二误差,对初始模型中的模型参数进行调整,以确定调整后的模型参数,并将初始模型中的模型参数替换为调整后的模型参数,执行A1。
需要说明的是,各个联合用户各自的多个标签数据分布在物联网中的不同的节点,共享数据会产生数据安全问题,通过节点中的非共享数据以及非共享数据的权重进行联合学习,进而得到节点的局部模型,实现将非共享数据迁移到目标用户上,使得节点之间不存在数据共享,避免了直接共享数据带来的数据安全问题。其中,节点能进行数据处理以及数据交互,包括但不限于边缘服务器、边缘网关以及边缘控制器中的任意一种或多种。目标用户和联合用户之间的数据交互仅仅涉及到目标相似度、初始相关性以及聚类中心点,并不涉及到非标签数据的交互。
作为一种可能的情况,联合用户和目标用户之间的数据分布相似度不小于预设阈值。这里,数据分布相似度可以基于上述第七公式进行计算。
通过以上技术方案可知,本实施例存在的有益效果是:对目标用户的业务任务对应的多个非标签数据进行聚类,确定聚类中心点,并确定聚类中心点与多个非标签数据,确定联合用户的标签数据的权重,将非标签数据迁移到了标签数据上,实现了数据迁移,确保了数据量,之后,根据联合用户的多个标签数据以及多个标签数据各自对应的权重,构建联合学习模型,联合学习模型用于执行目标用户的业务任务,在目标用户缺少标签的前提下,能够完成目标用户的业务任务。
图1所示仅为本发明所述方法的基础实施例,在其基础上进行一定的优化和拓展,还能够得到所述方法的其他优选实施例。
如图2所示,为本发明所述业务任务执行方法的另一个具体实施例。本实施例在前述实施例的基础上,结合应用场景进行了更加具体的描述。
本实施例所结合的具体场景为:目标用户的多个非标签数据表示为
Figure BDA0002881066690000151
其中,n表示非标签数据的数据个数,联合用户的多个标签数据表示为
Figure BDA0002881066690000152
其中,m表示标签数据的数据个数。多个联合用户的计算过程相同,这里仅以一个联合用户为例进行说明。
所述方法具体包括以下步骤:
步骤201、对目标用户的业务任务对应的多个非标签数据进行聚类,以确定至少两个聚类中心点。
目标用户通过K-means聚类算法对多个非标签数据进行聚类,得到k个聚类簇以及每个聚类簇的聚类中心点,每个聚类中心点均与非标签数据不同,确保数据安全与隐私。
步骤202、根据所述至少两个聚类中心点以及所述多个非标签数据,确定所述至少两个聚类中心点各自与所述多个非标签数据之间的目标相似度以及所述至少两个聚类中心点中的任意两个聚类中心点之间的初始相关性。
目标用户通过上述第一公式
Figure BDA0002881066690000161
计算聚类中心点与多个非标签数据之间的目标相似度,得到k个聚类中心点各自对应的目标相似度,k个目标相似度分别表示为
Figure BDA0002881066690000162
其中,K(·)为高斯核函数。
目标用户通过上述第二公式
Figure BDA0002881066690000163
计算任意两个聚类中心点之间的初始相关性,得到k2个初始相关性,通过如下表格1表示:
Figure BDA0002881066690000164
表1
步骤203、根据所述任意两个聚类中心点以及联合用户的多个标签数据,确定所述任意两个聚类中心点之间的参考相关性;根据所述任意两个聚类中心点之间的初始相关性以及参考相关性,确定所述任意两个聚类中心点之间的目标相关性。
目标用户将k个聚类中心点各自对应的目标相似度和表1中k2个初始相关性发给联合用户,联合用户通过上述第三公式
Figure BDA0002881066690000171
计算任意两个聚类中心点之间的参考相关性,得到k2个参考相关性,通过如下表格2表示:
Figure BDA0002881066690000172
表2
作为一种可能的情况,每个联合用户各自计算任意两个聚类中心点的目标相关性,针对每个联合用户,任意两个聚类中心点的目标相关性为任意两个聚类中心点的初始相关性以及参考相关性之和,通过如下表格3表示k2个目标相关性:
Figure BDA0002881066690000173
表3
作为一种可能的情况,每个联合用户共享任意两个聚类中心点之间的目标相关性。针对任意两个聚类中心点,任意两个聚类中心点之间的目标相关性为对所有联合用户各自的任意两个聚类中心点之间的参考相关性平均后,加上任意两个聚类中心点之间的初始相关性的求和结果。比如,联合用户有N个,第i个联合用户的任意两个聚类中心点之间的参考相关性表示为
Figure BDA0002881066690000181
则任意两个聚类中心点之间的目标相关性为
Figure BDA0002881066690000182
步骤204、根据所述任意两个聚类中心点之间的目标相关性,确定所述至少两个聚类中心点对应的目标相关性矩阵;根据所述至少两个聚类中心点各自与所述多个非标签数据之间的目标相似度,确定目标相似度向量;根据正则化参数以及单位矩阵,对所述目标相关性矩阵进行修正,以确定修正相关性矩阵。
通过上述第四公式
Figure BDA0002881066690000183
计算修正相关性矩阵。
步骤205、根据所述修正相关性矩阵和所述目标相似度向量,确定相似度权重向量,所述相似度权重向量包括所述至少两个聚类中心点各自对应的相似度权重。
通过上述第五公式
Figure BDA0002881066690000184
计算相似度权重向量。
步骤206、针对所述联合用户的每个所述标签数据,根据所述至少两个聚类中心点各自对应的相似度权重,对所述至少两个聚类中心点各自与所述标签数据之间的相似性进行加权求和,以确定所述标签数据对应的权重。
通过上述第六公式
Figure BDA0002881066690000185
计算每个标签数据对应的权重。
步骤207、根据所述多个非标签数据、所述至少两个聚类中心点以及所述至少两个聚类中心点各自对应的相似度权重,确定所述目标用户和所述联合用户之间的数据分布相似度。
通过上述第七公式
Figure BDA0002881066690000186
计算联合用户和目标用户之间的数据分布相似度。
步骤208、将满足联合学习条件的数据分布相似度对应的联合用户作为目标联合用户,根据所述目标联合用户的所述多个标签数据以及所述多个标签数据各自对应的权重,构建联合学习模型。
通过以上技术方案可知,本实施例存在的有益效果是:对目标用户的业务任务对应的多个非标签数据进行聚类,确定聚类中心点,并确定聚类中心点与多个非标签数据之间的目标相似度以及任意两个聚类中心点之间的初始相关性,从而得到非标签数据的描述信息,确保数据隐私和安全,根据聚类中心点、聚类中心点与多个非标签数据之间的目标相似度、任意两个聚类中心点之间的初始相关性、任意两个聚类中心点之间的参考相关性,确定所有聚类中心点各自对应的相似度权重,根据所有聚类中心点各自对应的相似度权重,对标签数据与所有的聚类中心点之间的相似度进行加权,确定标签数据对应的权重,将非标签数据迁移到了标签数据上,实现了数据迁移,确保了数据量,之后,基于联合用户和目标用户之间的数据分布相似度,对联合用户进行选择,基于数据分布相似度较高的联合用户的多个标签数据以及多个标签数据各自对应的权重,构建联合学习模型,联合学习模型用于执行目标用户的业务任务,在目标用户缺少标签的前提下,能够完成目标用户的业务任务,同时确保模型精度。
基于与本发明方法实施例相同的构思,请参考图3,本发明实施例还提供了一种业务任务执行装置,包括:
聚类模块301,用于对目标用户的业务任务对应的多个非标签数据进行聚类,以确定至少两个聚类中心点;
权重确定模块302,用于根据所述至少两个聚类中心点以及所述多个非标签数据,确定联合用户的多个标签数据各自对应的权重,所述多个标签数据和所述业务任务对应;
构建模块303,用于根据所述联合用户的所述多个标签数据以及所述多个标签数据各自对应的权重,构建联合学习模型,所述联合学习模型用于执行所述目标用户的业务任务。
本发明一个实施例中,所述权重确定模块302,包括:相似度确定单元、第一权重确定单元以及第二权重确定单元;其中,
所述相似度确定单元,用于根据所述至少两个聚类中心点和所述多个非标签数据,确定所述至少两个聚类中心点各自与所述多个非标签数据之间的目标相似度;
所述第一权重确定单元,用于根据所述至少两个聚类中心点、所述至少两个聚类中心点各自与所述多个非标签数据之间的目标相似度以及联合用户的多个标签数据,确定所述至少两个聚类中心点各自对应的相似度权重;
所述第二权重确定单元,用于根据所述至少两个聚类中心点各自对应的相似度权重,确定所述联合用户的多个标签数据各自对应的权重。
本发明一个实施例中,还包括:相关性确定模块;
所述相关性确定模块,用于根据所述至少两个聚类中心点中任意两个聚类中心点以及所述多个非标签数据,确定所述任意两个聚类中心点之间的初始相关性;
所述第一权重确定单元,包括:第一相关性确定子单元、第二相关性确定子单元以及第一权重确定子单元;其中,
所述第一相关性确定子单元,用于根据所述任意两个聚类中心点以及联合用户的多个标签数据,确定所述任意两个聚类中心点之间的参考相关性;
所述第二相关性确定子单元,用于根据所述任意两个聚类中心点之间的初始相关性以及参考相关性,确定所述任意两个聚类中心点之间的目标相关性;
所述第一权重确定子单元,用于根据所述任意两个聚类中心点之间的目标相关性和所述至少两个聚类中心点各自与所述多个非标签数据之间的目标相似度,确定所述至少两个聚类中心点各自对应的相似度权重。
在一个实施例中,所述第二权重确定单元,包括:第二权重确定子单元;其中,
所述第二权重确定子单元,用于针对所述联合用户的每个所述标签数据,根据所述至少两个聚类中心点各自对应的相似度权重,对所述至少两个聚类中心点各自与所述标签数据之间的相似度进行加权求和,以确定所述标签数据对应的权重。
在一个实施例中,还包括:相似度计算模块、重要性计算模块以及调整模块;其中,
所述相似度计算模块,用于根据所述多个非标签数据、所述至少两个聚类中心点以及所述至少两个聚类中心点各自对应的相似度权重,确定所述目标用户和所述联合用户之间的数据分布相似度;
所述重要性计算模块,用于根据各个所述联合用户各自与所述目标用户之间的数据分布相似度,确定各个所述联合用户各自的重要性;
所述调整模块,用于根据各个所述联合用户各自的重要性,调整所述联合学习模型。
在一个实施例中,所述第一权重确定子单元,用于执行如下步骤:
根据所述任意两个聚类中心点之间的目标相关性,确定所述至少两个聚类中心点对应的目标相关性矩阵;
根据所述至少两个聚类中心点各自与所述多个非标签数据之间的目标相似度,确定目标相似度向量;
根据正则化参数以及单位矩阵,对所述目标相关性矩阵进行修正,以确定修正相关性矩阵;
根据所述修正相关性矩阵和所述目标相似度向量,确定相似度权重向量,所述相似度权重向量包括所述至少两个聚类中心点各自对应的相似度权重。
在一个实施例中,所述修正相关性矩阵基于对所述目标相关性矩阵以及所述正则化参数与所述单位矩阵相乘的结果进行求和得到;
所述相似度权重向量基于对所述修正相关性矩阵的倒数与所述相似度向量相乘得到;
所述目标相关性基于对所述任意两个聚类中心点之间的所述初始相关性以及所述参考相关性相加得到;
所述目标相似度基于对所述多个标签数据各自与所述聚类中心点之间的目标相似度进行平均得到;
所述初始相关性基于目标概率分布权重,对所述多个非标签数据各自对应的目标相似度乘积值的平均值进行修正得到,所述目标相似度乘积值基于对所述任意两个聚类中心点各自与所述非标签数据之间的目标相似度进行相乘得到;
所述参考相关性基于参考概率分布权重,对所述多个标签数据各自对应的参考相似度乘积值的平均值进行修正得到,所述参考相似度乘积值基于对所述任意两个聚类中心点各自与所述标签数据之间的参考相似度进行相乘得到;
其中,所述目标概率分布权重和所述参考概率分布权重之和等于1,所述参考相似度和所述目标相似度基于相同的核函数计算得到。
在一个实施例中,各个所述联合用户共享所述任意两个聚类中心点之间的目标相关性;
所述目标相关性基于所述任意两个聚类中心点之间的所述初始相关性以及各个所述联合用户各自的所述任意两个聚类中心点之间的参考相关性确定。
在一个实施例中,所述聚类中心点和所述多个非标签数据中的任意一个非标签数据不同。
图4是本发明实施例提供的一种电子设备的结构示意图。在硬件层面,该电子设备包括处理器401以及存储有执行指令的存储器402,可选地还包括内部总线403及网络接口404。其中,存储器402可能包含内存4021,例如高速随机存取存储器(Random-AccessMemory,RAM),也可能还包括非易失性存储器4022(non-volatile memory),例如至少1个磁盘存储器等;处理器401、网络接口404和存储器402可以通过内部总线403相互连接,该内部总线403可以是ISA(Industry Standard Architecture,工业标准体系结构)总线、PCI(Peripheral Component Interconnect,外设部件互连标准)总线或EISA(ExtendedIndustry Standard Architecture,扩展工业标准结构)总线等;内部总线403可以分为地址总线、数据总线、控制总线等,为便于表示,图4中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。当然,该电子设备还可能包括其他业务所需要的硬件。当处理器401执行存储器402存储的执行指令时,处理器401执行本发明任意一个实施例中的方法,并至少用于执行如图1或图2所示的方法。
在一种可能实现的方式中,处理器从非易失性存储器中读取对应的执行指令到内存中然后运行,也可从其它设备上获取相应的执行指令,以在逻辑层面上形成一种业务任务执行装置。处理器执行存储器所存放的执行指令,以通过执行的执行指令实现本发明任一实施例中提供的一种业务任务执行方法。
处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
本发明实施例还提供了一种计算机可读存储介质,包括执行指令,当电子设备的处理器执行执行指令时,所述处理器执行本发明任意一个实施例中提供的方法。该电子设备具体可以是如图4所示的电子设备;执行指令是一种业务任务执行装置所对应计算机程序。
本领域内的技术人员应明白,本发明的实施例可提供为方法或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例,或软件和硬件相结合的形式。
本发明中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上所述仅为本发明的实施例而已,并不用于限制本发明。对于本领域技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。

Claims (10)

1.一种业务任务执行方法,其特征在于,包括:
对目标用户的业务任务对应的多个非标签数据进行聚类,以确定至少两个聚类中心点;
根据所述至少两个聚类中心点以及所述多个非标签数据,确定联合用户的多个标签数据各自对应的权重,所述多个标签数据和所述业务任务对应;
根据各个所述联合用户各自的所述多个标签数据以及所述多个标签数据各自对应的权重,构建联合学习模型,所述联合学习模型用于执行所述目标用户的业务任务。
2.根据权利要求1所述的方法,其特征在于,所述根据所述至少两个聚类中心点以及所述多个非标签数据,确定联合用户的多个标签数据各自对应的权重,包括:
根据所述至少两个聚类中心点和所述多个非标签数据,确定所述至少两个聚类中心点各自与所述多个非标签数据之间的目标相似度;
根据所述至少两个聚类中心点、所述至少两个聚类中心点各自与所述多个非标签数据之间的目标相似度以及联合用户的多个标签数据,确定所述至少两个聚类中心点各自对应的相似度权重;
根据所述至少两个聚类中心点各自对应的相似度权重,确定所述联合用户的多个标签数据各自对应的权重。
3.根据权利要求2所述的方法,其特征在于,还包括:
根据所述至少两个聚类中心点中任意两个聚类中心点以及所述多个非标签数据,确定所述任意两个聚类中心点之间的初始相关性;
所述根据所述至少两个聚类中心点、所述至少两个聚类中心点各自与所述多个非标签数据之间的目标相似度以及联合用户的多个标签数据,确定所述至少两个聚类中心点各自对应的相似度权重,包括:
根据所述任意两个聚类中心点以及联合用户的多个标签数据,确定所述任意两个聚类中心点之间的参考相关性;
根据所述任意两个聚类中心点之间的初始相关性以及参考相关性,确定所述任意两个聚类中心点之间的目标相关性;
根据所述任意两个聚类中心点之间的目标相关性和所述至少两个聚类中心点各自与所述多个非标签数据之间的目标相似度,确定所述至少两个聚类中心点各自对应的相似度权重。
4.根据权利要求3所述的方法,其特征在于,还包括:
根据所述多个非标签数据、所述至少两个聚类中心点以及所述至少两个聚类中心点各自对应的相似度权重,确定所述目标用户和所述联合用户之间的数据分布相似度;
根据各个所述联合用户各自与所述目标用户之间的数据分布相似度,确定各个所述联合用户各自的重要性;
根据各个所述联合用户各自的重要性,调整所述联合学习模型。
5.根据权利要求3所述的方法,其特征在于,所述根据所述任意两个聚类中心点之间的目标相关性和所述至少两个聚类中心点各自与所述多个非标签数据之间的目标相似度,确定所述至少两个聚类中心点各自对应的相似度权重,包括:
根据所述任意两个聚类中心点之间的目标相关性,确定所述至少两个聚类中心点对应的目标相关性矩阵;
根据所述至少两个聚类中心点各自与所述多个非标签数据之间的目标相似度,确定目标相似度向量;
根据正则化参数以及单位矩阵,对所述目标相关性矩阵进行修正,以确定修正相关性矩阵;
根据所述修正相关性矩阵和所述目标相似度向量,确定相似度权重向量,所述相似度权重向量包括所述至少两个聚类中心点各自对应的相似度权重。
6.根据权利要求5所述的方法,其特征在于,所述修正相关性矩阵基于对所述目标相关性矩阵以及所述正则化参数与所述单位矩阵相乘的结果进行求和得到;
所述相似度权重向量基于对所述修正相关性矩阵的倒数与所述相似度向量相乘得到;
所述目标相关性基于对所述任意两个聚类中心点之间的所述初始相关性以及所述参考相关性相加得到;
所述目标相似度基于对所述多个标签数据各自与所述聚类中心点之间的目标相似度进行平均得到;
所述初始相关性基于目标概率分布权重,对所述多个非标签数据各自对应的目标相似度乘积值的平均值进行修正得到,所述目标相似度乘积值基于对所述任意两个聚类中心点各自与所述非标签数据之间的目标相似度进行相乘得到;
所述参考相关性基于参考概率分布权重,对所述多个标签数据各自对应的参考相似度乘积值的平均值进行修正得到,所述参考相似度乘积值基于对所述任意两个聚类中心点各自与所述标签数据之间的参考相似度进行相乘得到;
其中,所述目标概率分布权重和所述参考概率分布权重之和等于1,所述参考相似度和所述目标相似度基于相同的核函数计算得到。
7.根据权利要求3所述的方法,其特征在于,各个所述联合用户共享所述任意两个聚类中心点之间的目标相关性;
所述目标相关性基于所述任意两个聚类中心点之间的所述初始相关性以及各个所述联合用户各自的所述任意两个聚类中心点之间的参考相关性确定。
8.根据权利要求2所述的方法,其特征在于,所述根据所述至少两个聚类中心点各自对应的相似度权重,确定所述联合用户的多个标签数据各自对应的权重,包括:
针对所述联合用户的每个所述标签数据,根据所述至少两个聚类中心点各自对应的相似度权重,对所述至少两个聚类中心点各自与所述标签数据之间的相似度进行加权求和,以确定所述标签数据对应的权重。
9.根据权利要求1至8中任一项所述的方法,其特征在于,所述聚类中心点和所述多个非标签数据中的任意一个非标签数据不同。
10.一种业务任务执行装置,其特征在于,包括:
聚类模块,用于对目标用户的业务任务对应的多个非标签数据进行聚类,以确定至少两个聚类中心点;
权重确定模块,用于根据所述至少两个聚类中心点以及所述多个非标签数据,确定联合用户的多个标签数据各自对应的权重,所述多个标签数据和所述业务任务对应;
构建模块,用于根据所述联合用户的所述多个标签数据以及所述多个标签数据各自对应的权重,构建联合学习模型,所述联合学习模型用于执行所述目标用户的业务任务。
CN202011635733.4A 2020-12-31 2020-12-31 业务任务执行方法、装置以及计算机可读存储介质 Active CN112766318B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202011635733.4A CN112766318B (zh) 2020-12-31 2020-12-31 业务任务执行方法、装置以及计算机可读存储介质
PCT/CN2021/101318 WO2022142179A1 (zh) 2020-12-31 2021-06-21 业务任务执行方法、装置以及计算机可读存储介质
US18/157,086 US20230161823A1 (en) 2020-12-31 2023-01-20 Service task execution method and apparatus, and computer-readable storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011635733.4A CN112766318B (zh) 2020-12-31 2020-12-31 业务任务执行方法、装置以及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN112766318A true CN112766318A (zh) 2021-05-07
CN112766318B CN112766318B (zh) 2023-12-26

Family

ID=75698099

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011635733.4A Active CN112766318B (zh) 2020-12-31 2020-12-31 业务任务执行方法、装置以及计算机可读存储介质

Country Status (3)

Country Link
US (1) US20230161823A1 (zh)
CN (1) CN112766318B (zh)
WO (1) WO2022142179A1 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113487085A (zh) * 2021-07-06 2021-10-08 新智数字科技有限公司 基于联合学习框架的设备使用寿命的预测方法、装置、计算机设备及计算机可读存储介质
CN114118540A (zh) * 2021-11-11 2022-03-01 新智我来网络科技有限公司 基于样本迁移的烟气含氧量负荷预测方法及装置
CN114118542A (zh) * 2021-11-11 2022-03-01 新智我来网络科技有限公司 烟气含氧量负荷预测模型的选择方法及装置
WO2022142179A1 (zh) * 2020-12-31 2022-07-07 新智数字科技有限公司 业务任务执行方法、装置以及计算机可读存储介质
CN115392493A (zh) * 2022-10-28 2022-11-25 苏州浪潮智能科技有限公司 一种分布式预测方法、系统、服务器及存储介质
CN116922391A (zh) * 2023-08-24 2023-10-24 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) 一种基于多层条件概率运动原语的空间机械臂技能自主学习与优化方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040002930A1 (en) * 2002-06-26 2004-01-01 Oliver Nuria M. Maximizing mutual information between observations and hidden states to minimize classification errors
CN105095920A (zh) * 2015-09-10 2015-11-25 大连理工大学 基于聚类的大规模多标签分类方法
CN109241816A (zh) * 2018-07-02 2019-01-18 北京交通大学 一种基于标签优化的图像再识别系统及损失函数确定方法
US20200134535A1 (en) * 2017-07-11 2020-04-30 Cybage Software Private Limited A computer implemented appraisal system and method thereof
CN112115781A (zh) * 2020-08-11 2020-12-22 西安交通大学 基于对抗攻击样本和多视图聚类的无监督行人重识别方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112766318B (zh) * 2020-12-31 2023-12-26 新奥新智科技有限公司 业务任务执行方法、装置以及计算机可读存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040002930A1 (en) * 2002-06-26 2004-01-01 Oliver Nuria M. Maximizing mutual information between observations and hidden states to minimize classification errors
CN105095920A (zh) * 2015-09-10 2015-11-25 大连理工大学 基于聚类的大规模多标签分类方法
US20200134535A1 (en) * 2017-07-11 2020-04-30 Cybage Software Private Limited A computer implemented appraisal system and method thereof
CN109241816A (zh) * 2018-07-02 2019-01-18 北京交通大学 一种基于标签优化的图像再识别系统及损失函数确定方法
CN112115781A (zh) * 2020-08-11 2020-12-22 西安交通大学 基于对抗攻击样本和多视图聚类的无监督行人重识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
PEANUT_范: "迁移学习-Domain Adaptation", HTTPS://BLOG.CSDN.NET/U013841196/ARTICLE/DETAILS/80956828, pages 1 - 2 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022142179A1 (zh) * 2020-12-31 2022-07-07 新智数字科技有限公司 业务任务执行方法、装置以及计算机可读存储介质
CN113487085A (zh) * 2021-07-06 2021-10-08 新智数字科技有限公司 基于联合学习框架的设备使用寿命的预测方法、装置、计算机设备及计算机可读存储介质
CN114118540A (zh) * 2021-11-11 2022-03-01 新智我来网络科技有限公司 基于样本迁移的烟气含氧量负荷预测方法及装置
CN114118542A (zh) * 2021-11-11 2022-03-01 新智我来网络科技有限公司 烟气含氧量负荷预测模型的选择方法及装置
CN115392493A (zh) * 2022-10-28 2022-11-25 苏州浪潮智能科技有限公司 一种分布式预测方法、系统、服务器及存储介质
CN116922391A (zh) * 2023-08-24 2023-10-24 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) 一种基于多层条件概率运动原语的空间机械臂技能自主学习与优化方法
CN116922391B (zh) * 2023-08-24 2024-08-20 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) 一种空间机械臂技能自主学习与优化方法

Also Published As

Publication number Publication date
US20230161823A1 (en) 2023-05-25
CN112766318B (zh) 2023-12-26
WO2022142179A1 (zh) 2022-07-07

Similar Documents

Publication Publication Date Title
CN112766318B (zh) 业务任务执行方法、装置以及计算机可读存储介质
Ryu et al. Location-based web service QoS prediction via preference propagation to address cold start problem
CN111400555B (zh) 图数据查询任务处理方法、装置、计算机设备和存储介质
Zhang et al. Recurrent tensor factorization for time-aware service recommendation
CN111881477B (zh) 数据内容的标引方法、装置、计算机设备及存储介质
CN113822315A (zh) 属性图的处理方法、装置、电子设备及可读存储介质
US11704324B2 (en) Transition regularized matrix factorization for sequential recommendation
CN110705821A (zh) 基于多评价维度的热点学科预测方法、装置、终端、及介质
Jin et al. Neighborhood-aware web service quality prediction using deep learning
Chen et al. Trust-aware and location-based collaborative filtering for web service QoS prediction
CN110717116B (zh) 关系网络的链接预测方法及系统、设备、存储介质
CN111461188B (zh) 一种目标业务控制方法、装置、计算设备及存储介质
Aravazhi Irissappane et al. Filtering unfair ratings from dishonest advisors in multi-criteria e-markets: a biclustering-based approach
Wang et al. Blind Image Quality Assessment via Adaptive Graph Attention
CN112016840A (zh) 一种选择指标数据的方法、装置、设备及存储介质
US11315036B2 (en) Prediction for time series data using a space partitioning data structure
Romankevich et al. Fault-tolerant multiprocessor systems reliability estimation using statistical experiments with GL-models
CN114092162B (zh) 推荐质量确定方法、推荐质量确定模型的训练方法及装置
Mishra et al. Short term price prediction for preemptible VM instances in cloud computing
Xue et al. An improved extreme learning machine based on variable-length particle swarm optimization
CN114912627A (zh) 推荐模型训练方法、系统、计算机设备及存储介质
CN113361853A (zh) 新共识模型的卫星应急任务规划方案效能评估方法及系统
Huang et al. SMARPchain: A Smart Marker Based Reputational Probabilistic Blockchain for Multi-agent Systems
CN116089722B (zh) 基于图产出标签的实现方法、装置、计算设备和存储介质
Xiong et al. Collaborative web service QoS prediction via location-aware matrix factorization and unbalanced distribution

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20231130

Address after: 2101 Science and Technology Innovation Base, Hangyidao Free Trade Zone, Langfang Airport Economic Zone, Daxing District, Beijing, China (Hebei) Pilot Free Trade Zone, Daxing Airport Area

Applicant after: Xinao Xinzhi Technology Co.,Ltd.

Address before: 100020 10th floor, Motorola building, 1 Wangjing East Road, Chaoyang District, Beijing

Applicant before: ENNEW DIGITAL TECHNOLOGY Co.,Ltd.

GR01 Patent grant
GR01 Patent grant