CN110070104B - 一种用户推荐方法、装置及服务器 - Google Patents

一种用户推荐方法、装置及服务器 Download PDF

Info

Publication number
CN110070104B
CN110070104B CN201910220752.1A CN201910220752A CN110070104B CN 110070104 B CN110070104 B CN 110070104B CN 201910220752 A CN201910220752 A CN 201910220752A CN 110070104 B CN110070104 B CN 110070104B
Authority
CN
China
Prior art keywords
data
super
training
parameter
graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910220752.1A
Other languages
English (en)
Other versions
CN110070104A (zh
Inventor
林文清
何峰
程序
张发强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shanghai Co Ltd
Original Assignee
Tencent Technology Shanghai Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shanghai Co Ltd filed Critical Tencent Technology Shanghai Co Ltd
Priority to CN201910220752.1A priority Critical patent/CN110070104B/zh
Publication of CN110070104A publication Critical patent/CN110070104A/zh
Application granted granted Critical
Publication of CN110070104B publication Critical patent/CN110070104B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种用户推荐方法、装置及服务器,所述方法包括:获取待表征图数据的图属性向量;获取多个待筛选超参数组;基于所述图属性向量和所述多个待筛选超参数组生成多个组合特征向量;将所述多个组合特征向量输入超参数筛选模型进行超参数筛选处理,得到多个超参数测评数据,所述超参数测评数据表征待筛选超参数组所对应表征学习模型对所述待表征图数据的表征性能;根据所述多个超参数测评数据确定所述待表征图数据的目标超参数。利用本发明提供的技术方案可以快速的确定出合适的超参数,改善表征学习模型对图数据的表征性能。

Description

一种用户推荐方法、装置及服务器
技术领域
本发明涉及计算机技术领域,尤其涉及一种用户推荐方法、装置及服务器。
背景技术
机器学习是人工智能领域最热门的研究方向之一。在机器学习中,往往涉及到两类参数:超参数和普通参数。其中,超参数是在开始学习过程之前设置值的运行参数,而不是通过训练得到的参数数据。超参数定义了关于机器学习模型的高层次的概念,如复杂性或学习能力。因此,超参数对于算法性能有非常大的影响。
现有技术中超参数的选择方法主要可以包括暴力搜索。具体的,暴力搜索方法需要穷举超参数的所有可能值,从超参数的取值区间的最小值开始依次增加预算增量,慢慢增加,直到该超参数的取值区间的最大值;例如超参数的取值区间为[10,100],相应的,可以从10开始,依次增加0.005,直至100。然后依次运行相应的机器学习模型(即表征学习模型),得到相应的表征向量,进而来评测超参数,从而确定出最优超参数。但上述现有的超参数的选择方法中计算量大,处理效率低。因此,需要提供更高效的方案。
发明内容
本发明提供了一种用户推荐方法、装置及服务器,可以快速的确定出合适的超参数,改善表征学习模型对图数据的表征性能。
一方面,本发明提供了一种超参数确定方法,所述方法包括:
获取待表征图数据的图属性向量;
获取多个待筛选超参数组;
基于所述图属性向量和所述多个待筛选超参数组生成多个组合特征向量;
将所述多个组合特征向量输入超参数筛选模型进行超参数筛选处理,得到多个超参数测评数据,所述超参数测评数据表征待筛选超参数组所对应表征学习模型对所述待表征图数据的表征性能;
根据所述多个超参数测评数据确定所述待表征图数据的目标超参数。
另一方面提供了一种超参数确定装置,所述装置包括:
第一图属性向量获取模块,用于获取待表征图数据的图属性向量;
第一超参数组获取模块,用于获取多个待筛选超参数组;
第一组合特征向量生成模块,用于基于所述图属性向量和所述多个待筛选超参数组生成多个组合特征向量;
超参数筛选处理模块,用于将所述多个组合特征向量输入超参数筛选模型进行超参数筛选处理,得到多个超参数测评数据,所述超参数测评数据表征待筛选超参数组所对应表征学习模型对所述待表征图数据的表征性能;
目标超参数确定模块,用于根据所述多个超参数测评数据确定所述待表征图数据的目标超参数。
另一方面提供了一种超参数确定服务器,所述服务器包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上述的超参数确定方法。
另一方面提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如上述的超参数确定方法。
本发明提供的超参数确定方法、装置、服务器及存储介质,具有如下技术效果:
本发明通过将待表征图数据和待筛选超参数组进行组合,得到组合特征向量;然后,以该组合特征输入到预先训练好的超参数筛选模型中进行超参数的筛选学习,得到可以反映超参数组所对应的表征学习模型对待表征图数据表征性能的超参数测评数据;最后,根据超参数测评数据来确定出合适的目标超参数。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1是本发明实施例提供的一种超参数筛选模型训练方法的流程示意图;
图2是本发明实施例提供的一种获取多个训练图数据的图属性向量的流程示意图;
图3是本发明提供的一种图数据的结构示意图;
图4是本发明实施例提供的一种获取多个训练图数据的流程示意图;
图5是本发明实施例提供的一种获取多个训练超参数组的流程示意图;
图6是本发明实施例提供一种确定所述多个训练图数据所对应的训练测评数据的流程示意图;
图7是本发明实施例提供的超参数筛选模型训练和应用的一种示意图;
图8是本发明实施例提供的一种超参数确定方法的流程示意图;
图9是本发明实施例提供的一种根据所述多个超参数测评数据确定所述待表征图数据的目标超参数的流程示意图;
图10是本发明实施例提供的一种超参数确定系统进行离线训练和在线预测的示意图
图11是本发明实施例提供的一种超参数确定装置的结构示意图;
图12是本发明实施例提供的一种服务器的结构示意图;
图13是本发明实施例提供的一种基于本发明方案中的目标超参数确定推荐列表的示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或服务器不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
随着各类社交应用软件的普及,越来越多的人通过社交应用软件进行交流互动。在一些场景中,例如游戏社交软件中,常常需要进行用户推荐以增加用户之间的互动交流,提高用户体验。在这些推荐场景中,大量用户可以形成一个个包括用户和用户之间关联关系(例如好友、师徒等关系)的社交网络,利用表征学习模型可以对社交网络进行表征学习,得到社交网络中用户的特征向量,以便基于特征向量间的距离来确定出用户之间的相似度,向用户推荐与之具有高相似度的用户。这里表征学习模型表征社交网络的性能是影响推荐效果的重要因素之一。因此,需要选取合适的超参数,以提高表征学习模型性能。
本申请实施例提供一种超参数确定系统,具体的,所述超参数确定系统可以包括:离线训练模块和在线预测模块。
基于该超参数确定系统的离线训练模块和在线预测模块可以实现:离线的超参数筛选模型的学习训练,以及在线的超参数筛选确定处理。
以下具体介绍离线的超参数筛选模型的学习训练的实现过程,具体的,如图1所示,图1是本发明实施例提供的一种超参数筛选模型训练方法的流程示意图,本说明书提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的系统或服务器产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境)。具体的,所述方法可以包括:
S101:获取多个训练图数据的图属性向量。
本说明书实施例中,具体的,可以获取大量的图数据作为训练图数据,并根据图数据中节点数据和边数据的分布信息确定出图数据的图属性向量。
具体的,图数据可以包括由节点数据和连接相邻两个节点数据的边数据所组成的路径数据。其中,所述节点数据可以为用户,所述边数据可以为用户之间的关联关系。在实际应用中,可以结合图数据生成器来生成预设数量个训练图数据,所述图数据生成器可以包括但不限于GraphGen图数据生成器。
在一个具体的实施例中,如图2所示,获取多个训练图数据的图属性向量可以包括:
S201:确定节点数据的节点数量。
S203:基于所述节点数量确定边数据的边数量。
本说明书实施例中,边数据的边数量可以为节点数量减1。
S205:生成多个包括所述节点数量的节点数据和所述边数量的边数据的训练图数据。
本说明书实施例中,在确定了边数量和节点数量之后,可以结合图数据生成器生成包括该节点数量的节点数据和所述边数量的边数据的训练图数据。
在实际应用中,具有相同数量的边数据和节点数据的图数据之间,由于边数据连接的节点数据的不同,可以有多个不同的图数据。相应的,可以结合实际应用需求预先设定的生成训练图数据的数量。
S207:根据生成的多个训练图数据中节点数据和边数据的分布信息确定所述多个训练图数据的图属性向量。
本说明书实施例中,所述图属性向量可以包括表征图数据节点数据和边数据的分布情况的图属性信息所形成的向量。具体的,图属性信息可以包括但不限于下述之一:节点数量、边数量、图密度(边数量除以节点数)、图直径(图数据中最长的图距离,其中,图距离为两个节点数据间的最短路径所对应的边数据数量)、最大节点度数(邻居最多的节点数据的相邻节点数据的数量)、最小节点度数(邻居最少的节点数据的相邻节点数据的数量)、平均节点度数(节点数据的相邻节点数量的平均数量)。
在一个具体的实施例中,如图3所示,图3是本发明提供的一种图数据的结构示意图。假设图数据的图属性信息包括节点数量、边数量、图密度、图直径、最大节点度数、最小节点度数和平均节点度数。相应的,可以确定出图数据的图属性信息依次为6、8、4/3、3、3、2、8/3,相应的,图属性向量可以为(6,8,4/3,3,3,2,8/3)。
本说明书实施例中,获取多个训练图数据的方式并不仅限于上述的实施例,如图4所示,获取多个训练图数据可以包括:
S401:确定节点数据的节点数量。
S403:基于所述节点数量确定边数据的边数量。
本说明书实施例中,边数据的边数量可以为节点数量减1。
S405:生成多个包括所述节点数量的节点数据和所述边数量的边数据的训练图数据。
S407:将所述边数量加上预设边数增量得到更新后的边数量。
具体的,所述预设边数据增量可以结合实际应用需求进行设置,例如设置为当前的节点数量。
S409:判断所述更新后的边数量是否小于等于边数量上限值。
在实际应用中,当节点数量n一定时,边数量最大为n(n-1)/2。相应的,本说明书实施例中,可以根据节点数量来设置边数量上限值。
S411:当判断的结果为是时,将更新后的边数量作为所述边数据的边数量。
本说明书实施例中,当更新后的边数量未达到边数量上限值时,可以将更新后的边数量作为所述边数据的边数量,重复上述步骤405-409的步骤至判断出更新后的边数量大于边数量上限值。
S413:当判断的结果为否时,将所述节点数量加上预设节点数增量得到更新后的节点数量。
本说明书实施例中,当更新后的边数量达到边数量上限值时,可以将所述节点数量加上预设节点数增量得到更新后的节点数量。
S415:判断所述更新后的节点数量是否小于等于节点数量上限值。
在实际应用中,为了保证迭代的收敛,可以设置一个收敛条件,考虑到边数量是基于节点数量进行设置,这里可以设置一个节点数量上限值,以保证迭代的收敛。
S417:当判断出更新后的节点数量小于等于节点数量上限值时,将更新后的节点数量作为所述节点数据的节点数量。
本说明书实施例中,当判断出更新后的节点数量小于等于节点数量上限值时,将更新后的节点数量作为所述节点数据的节点数量,重复上述步骤S403-415的步骤,至判断出更新后的节点数量大于节点数量上限值。
S419:当判断出更新后的节点数量大于节点数量上限值时,将多次生成的训练图数据作为所述多个训练图数据。
本说明书实施例中,当判断出更新后的节点数量大于节点数量上限值时,可以将上述多次训练图数据作为最终的训练图数据。
本说明书实施例中,通过不断更新边数量和节点数量可以生成多种具有不同图属性的训练图数据,保证训练数据的丰富多样化,可以提高后续超参数筛选模型的超参数筛选准确率。
S103:获取多个训练超参数组。
在实际应用中,表征学习模型通常有一个或多个超参数,每个超参数具有一个取值区间。
在一些实施例中,如图5所示,获取多个训练超参数组可以包括:
S1031:获取预设数量个超参数的取值区间。
本说明书实施例中,所述预设数量的超参数可以包括表征学习模型对应的一个或多个超参数。
S1033:将超参数的取值区间划分为多个分段取值区间。
本说明书实施例中,超参数的取值区间划分后的分段取值区间的数量可以结合实际应用需求进行设置。一般的,当取值区间较大(取值区间的上限值与下限值相差较大)时,所述分段取值区间的数量可以相对较多;反之,当取值区间较小时,所述分段取值区间的数量可以相对较少。
具体的,在分段取值区间的数量后,可以结合超参数的取值区间的上下限值来确定多个分段取值区间。
在一个具体的实施例中,假设某一个超参数的取值区间是[10,100],需要将该取值区间划分为2段,相应的,可以计算得到分段取值区间的增量为(100-10)/2=45。相应的,该超参数的多个分段取值区间可以为[10,55)和[55,100]。
S1035:获取超参数所对应的多个分段取值区间的边界值集合。
在一个具体的实施例中,假设超参数的多个分段取值区间为[10,55)和[55,100],相应的,所述边界值集合可以为{10、55、100}。
S1037:基于所述边界值集合确定所述多个训练超参数组。
本说明书实施例中,当超参数的数量为1时,可以将该超参数所对应边界值集合中的超参数边界值作为所述多个训练超参数组。
本说明书实施例中,当超参数的数量为多个时,可以将多个超参数所对应的边界值集合中的元素(超参数)进行组合,得到多个训练超参数组。
在一个具体的实施例中,假设表征学习模型所对应的超参数的数量为两个,这两个超参数的边界值集合均为{10、55、100},将这个两个边界值集合的元素进行组合,得到多个训练超参数组为(10,10)、(10,55)、(10,100)、(55,10)、(55,55)、(55,100)、(100,10)、(100,55)和(100,100)。
本说明书实施例中通过对超参数的取值区间进行均匀的分段,然后,获取分段后的分段取值区间的边界值,并基于分段取值区间的边界值来确定训练超参数组,可以在保证选取的超参数组的质量的同时,有效降低数据处理量。
S105:基于所述图属性向量和所述训练超参数组生成多个组合特征向量。
本说明书实施例中,在获取图属性向量和训练超参数组之后,可以将图属性向量和训练超参数组一一组合,生成多个组合特征向量。具体的,组合特征向量的数量等于训练超参数组的数量与图属性向量(一个图属性向量对应一个训练图数据)的数量的乘积。
在一个具体的实施例中,假设图属性向量为(6,8,4/3,3,3,2,8/3),训练超参数组为(10,55),相应的,组合特征向量可以为(6,8,4/3,3,3,2,8/3,10,55)。
此外,需要说明的是,在将图属性向量和训练超参数组一一组合生成组合特征向量并不仅限于上述的组合方式,还可以包括将训练超参数组放在图属性向量前面等组合方式。
S107:分别根据多个训练图数据中节点数据间的空间距离和图距离确定所述多个训练图数据所对应的训练测评数据。
在实际应用中,图数据中每个节点数据的节点向量是对图数据的一个高度浓缩的表征方式,相应的,节点向量间空间距离的大小与图数据中节点数据间图距离的大小相似。本说明书实施例中,可以根据训练图数据中节点数据间的空间距离和图距离确定训练图数据所对应的训练测评数据。
在一个具体的实施例中,如图6所示,确定所述多个训练图数据所对应的训练测评数据可以包括:
S1071:获取每一训练图数据中节点数据的特征向量。
本说明书实施例中,可以为表征学习模型设置好超参数(这里设置的超参数为上述的多个训练超参数组),将训练图数据输入设置好超参数的表征学习模型进行机器学习,以得到训练图数据中节点数据的特征向量。
S1073:基于节点数据间的特征向量间的距离确定所述节点数据间的空间距离。
本说明书实施例中,可以将节点数据所对应的特征向量间的距离作为节点数据间的空间距离。具体的,特征向量间的距离可以包括但不限于欧式距离、余弦距离等。
S1075:获取节点数据间的最短路径数据。
本说明书实施例中,节点数据间的最短路径数据包括连接节点数据间的边数据最少的路径数据。
S1077:根据所述最短路径数据确定节点数据间的图距离。
S1079:比较每一训练图数据中任一目标节点数据分别与两个非目标节点数据间的图距离和空间距离的大小。
本说明书实施例中,所述非目标节点以外
S10711:根据比较的结果确定每一训练图数据的训练测评数据。
本说明书实施例中,对于训练图数据中任一设定的目标节点数据v,以及图数据中其他两个非目标节点数据u1和u2,可以设定一个如下的效用函数:
Figure GDA0003990612280000101
其中,d(v,u1)表示目标节点数据v与非目标节点数据u1之间的图距离;d(v,u2)表示目标节点数据v与非目标节点数据u2之间的图距离;r(v,u1)表示目标节点数据v与非目标节点数据u1之间的空间距离;r(v,u2)表示目标节点数据v与非目标节点数据u2之间的空间距离。
本说明书实施例中,为了保证两个节点数据之间的空间距离尽可能地与图距离相似,即节点数据间空间距离顺序与图距离顺序尽可能地相似,可以设定如下最小化的目标函数:
Figure GDA0003990612280000102
具体的,φ(g)表示图数据g的目标函数,所述目标函数可以表征节点间空间距离与图距离的相似性。本说明书实施例中,在最小化目标函数的过程中可以不断调整节点数据的特征向量,以使得节点数据间空间距离顺序与图距离顺序尽可能地相似。
此外,需要说明的是,本说明书实施例中,确定多个训练图数据所对应的训练测评数据并不仅限于上述的方式,在实际应用中,还可以结合链路预测和节点分类的准确率等方式确定。
具体的,基于链路预测的准确率来确定多个训练图数据所对应的训练测评数据可以包括如下步骤:
1)获取每一训练图数据中节点数据的特征向量。
具体的,这里获取节点数据的特征向量的具体步骤可以参见上述相关步骤,在此不再赘述。
2)删除每一训练图数据中一定数量n个边数据;
3)基于节点数据间的特征向量间的距离确定所述节点数据间的空间距离;
4)选取空间距离较小的前n个节点数据间的边数据;
5)将该前n个节点数据间的边数据与删除的n个边数据进行比较;
6)根据比较结果确定确定每一训练图数据的训练测评数据。
具体的,统计前n个节点数据间的边数据中是真实删除的边数据的数量,将该数量除以n,得到训练图数据的训练测评数据。
具体的,基于节点分类的准确率来确定多个训练图数据所对应的训练测评数据可以包括如下步骤:
1)获取每一训练图数据中节点数据的特征向量。
具体的,这里获取节点数据的特征向量的具体步骤可以参见上述相关步骤,在此不再赘述。
2)确定每一训练图数据中节点数据的节点标签。
3)获取一定数量m个节点数据,将该m个节点数据的特征向量作为二分类模型的输入特征,该m个节点数据的节点标签作为二分类模型的目标值(multi-labelbinaryclassifier)中进行训练,得到节点标签的识别模型。
4)将每一训练图数据中的预测节点数据(除上述训练的m个节点数据以外的节点数据)的特征向量输入节点标签的识别模型,得到预测节点标签。
具体的,训练和预测的节点数量之比可以结合实际应用进行设置,例如设置为7:3。
5)根据所述预测节点数据的预测节点标签与实际设置的节点标签确定训练图数据的训练测评数据。
具体的,可以将预测正确的标签数量除以/预测节点数据的总数量,得到训练图数据的训练测评数据。
S109:基于所述多个组合特征向量和所述训练测评数据对预设机器学习模型进行超参数筛选训练,得到超参数筛选模型。
本说明书实施例中,预设机器学习模型可以包括但不限于采用神经网络、回归树或逻辑回归等机器学习模型。
在一个具体的实施例中,以逻辑回归模型进行预设机器学习模型训练为例,可以包括:
将训练数据看作是一个矩阵H(训练数据为上述的多个组合特征向量,这里每一组合特征向量与一个训练测评数据相对应)输入到逻辑回归模型,逻辑回归模型的输出为多个组合特征向量(矩阵H)的多个测评数据(矩阵P),相应的,训练过程中根据模型输出的测评数据与相应的训练测评数据可以得到误差error;使用梯度下降法,更新每个组合特征向量所对应的权重阈值(权重向量x),再次训练逻辑回归模型。修改完的权重阈值会使得下一次模型输出的测评数据和训练测评数据之间的误差变得更小,当该误差小于一定值时,可以将当前的权重向量x所对应的逻辑回归模型作为超参数筛选模型。
如图7所示,图7是本发明实施例提供的超参数筛选模型训练和应用的一种示意图。从图中可见,基于由图属性向量和超参数组所组成的组合特征向量对表征学习模型进行超参数筛选训练得到的超参数筛选模型后,后续,将一个组合特征向量(由待表征图数据的图属性向量和超参数组)输入该超参数筛选模型,该超参数筛选模型可以输出组合特征向量所对应的测评数据,进而可以确定该待表征图数据所对应的目标超参数。
由以上本说明书实施例提供的技术方案可见,本说明书实施例中通过将节点数据以节点数据之间关联关系所对应的图数据来表示;然后,以图数据的图属性向量和超参数组进行组合得到组合特征数据;另外,获取图数据所对应的测评数据,将组合特征向量和测评数据作为学习数据,输入到预设机器学习模型中进行学习训练。预设机器学习模型基于包括图属性向量和超参数组的组合特征向量,来拟合测评数据,使得预设机器学习模型拟合出的测评数据与图数据实际的测评数据间的误差越来越小;最后,得到可以通过图数据的图属性向量和超参数组来快速预测超参数的超参数筛选模型。
以下介绍本发明一种超参数确定方法,图8是本发明实施例提供的一种超参数确定方法的流程示意图,本说明书提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的系统或服务器产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境)。具体的如图8所示,所述方法可以包括:
S801:获取待表征图数据的图属性向量。
本说明书实施例中,所述待表征图数据可以包括节点数据和表征节点数据间关联关系的边数据。具体的,所述节点数据可以包括用户;相应的,所述边数据可以包括用户间的关联关系。
本说明书实施例中,可以结合用户(节点数据)之间的关联关系来生成待表征图数据。具体的,这里获取待表征图数据的图属性向量的具体步骤可以参见上述获取训练图数据的图属性向量的相关步骤,在此不再赘述。
S803:获取多个待筛选超参数组。
本说明书实施例中,所述待筛选超参数组可以包括表征所述待表征图数据的表征学习模型所对应的超参数。
在一些实施例中,所述待筛选超参数组可以为超参数筛选模型训练过程中的训练超参数组,也可以为表征学习模型所对应的超参数的其他取值所组成的超参数组。
S805:基于所述图属性向量和所述多个待筛选超参数组生成多个组合特征向量。
本说明书实施例中,基于所述图属性向量和所述多个待筛选超参数组生成多个组合特征向量的具体步骤可以参见上述基于所述图属性向量和所述训练超参数组生成多个组合特征向量的步骤,在此不再赘述。
S807:将所述多个组合特征向量输入超参数筛选模型进行超参数筛选处理,得到多个超参数测评数据。
本说明书实施例中,所述超参数测评数据可以表征超参数所对应表征学习模型对待表征图数据的表征性能。具体的,所述超参数测评数据的数值大小与超参数所对应表征学习模型对图数据的表征性能成反比。具体的,超参数测评数据的数值越大,超参数所对应表征学习模型对图数据的表征性能越差;反之,超参数测评数据的数值越小,超参数所对应表征学习模型对图数据的表征性能越好。
S809:根据所述多个超参数测评数据确定所述待表征图数据的目标超参数。
本说明书实施例中,如图9所示,所述根据所述多个超参数测评数据确定所述待表征图数据的目标超参数可以包括:
S8091:比较所述多个超参数测评数据的数值大小。
S8093:确定最小的超参数测评数据所对应的待筛选超参数组。
S8095:将所述待筛选超参数组作为所述待表征图数据的目标超参数。
由以上本说明书实施例提供的技术方案可见,本说明书实施例中将节点数据以节点数据之间关联关系所对应的图数据来表示;然后,将待表征图数据和待筛选超参数组进行组合,得到组合特征向量;然后,以该组合特征输入到预先训练好的超参数筛选模型中进行超参数的筛选学习,得到可以反映超参数组所对应的表征学习模型对待表征图数据表征性能的超参数测评数据;最后,根据超参数测评数据来确定出合适的目标超参数。利用本说明书实施例提供技术方案可以快速的为待表征图数据所对应的表征学习模型筛选出合适的目标超参数,利用该目标超参数对表征图数据的表征学习模型进行运行参数的设置,可以改善表征学习模型表征图数据的性能。后续,基于目标超参数所对应的表征学习模型对图数据进行表征学习,得到图数据中节点数据的特征向量;基于该特征向量来计算节点数据(用户)之间的相似度,从而进行用户推荐,可以有效改善推荐效果。
在一个具体的实施例中,如图10所示,图10是本发明实施例提供的一种超参数确定系统进行离线训练和在线预测的示意图。具体的,在离线训练过程中,可以通过图数据生成图数据集合(k个图数据)。然后基于图数据确定出图属性向量;接着,结合大量超参数组(t个超参数组),生成训练数据(t*k个组合特征向量);然后,将训练数据和训练数据所对应的测评数据一起输入表征学习模型进行超参数筛选训练,得到超参数筛选模型。后续,线上预测模型,可以直接基于离线训练得到的超参数训练模型进行超参数的筛选。
在在线预测过程中,可以获取待表征图数据,确定该待表征图数据的图属性向量;然后,结合待筛选超参数组(这里假设待筛选超参数组可以与训练过程中超参数组相同),生成多个组合特征向量;接着,将多个组合特征向量输入训练好的超参数训练模型进行超参数筛选处理,可以得到多个超参数测评数据,将最小的测评数据所对应的超参数组作为该待表征图数据的目标超参数。
本发明实施例还提供了一种超参数确定装置,如图11所示,所述装置包括:
第一图属性向量获取模块1110,可以用于获取待表征图数据的图属性向量。
第一超参数组获取模块1120,可以用于获取多个待筛选超参数组。
第一组合特征向量生成模块1130,可以用于基于所述图属性向量和所述多个待筛选超参数组生成多个组合特征向量。
超参数筛选处理模块1140,可以用于将所述多个组合特征向量输入超参数筛选模型进行超参数筛选处理,得到多个超参数测评数据,所述超参数测评数据表征待筛选超参数组所对应表征学习模型对所述待表征图数据的表征性能。
目标超参数确定模块1150,可以用于根据所述多个超参数测评数据确定所述待表征图数据的目标超参数。
在一些实施例中,所述超参数筛选模型包括采用下述模块确定:
第二图属性向量获取模块,用于获取多个训练图数据的图属性向量;
第二超参数组获取模块,用于获取多个训练超参数组;
第二组合特征向量生成模块,用于基于所述图属性向量和所述训练超参数组生成多个组合特征向量;
训练测评数据确定模块,用于确定所述多个训练图数据所对应的训练测评数据;
超参数筛选训练模块,用于基于所述多个组合特征向量和所述训练测评数据对预设机器学习模型进行超参数筛选训练,得到超参数筛选模型。
在一些实施例中,所述第二图属性向量获取模块包括:
节点数量确定单元,用于确定节点数据的节点数量;
边数量确定单元,用于基于所述节点数量确定边数据的边数量;
第一训练图数据生成单元,用于生成多个包括所述节点数量的节点数据和所述边数量的边数据的训练图数据;
图属性向量确定单元,用于根据生成的多个训练图数据中节点数据和边数据的分布信息确定所述多个训练图数据的图属性向量。
在一些实施例中,所述第二图属性向量获取模块还包括:
第一边数量更新单元,用于在所述根据生成的多个训练图数据中节点数据和边数据的分布信息确定所述多个训练图数据的图属性向量之前,将所述边数量加上预设边数增量得到更新后的边数量;
第一判断单元,用于判断所述更新后的边数量是否小于等于边数量上限值;
第一数据处理单元,用于当所述第一判断单元判断的结果为是时,将更新后的边数量作为所述边数据的边数量,从生成训练图数据的开始重复上述步骤至判断出更新后的边数量大于边数量上限值;
节点数量更新单元,用于当判断的结果为否时,将所述节点数量加上预设节点数增量得到更新后的节点数量;
第二判断单元,用于判断所述更新后的节点数量是否小于等于节点数量上限值;
第二数据处理单元,用于当所述第二判断单元判断出更新后的节点数量小于等于节点数量上限值时,将更新后的节点数量作为所述节点数据的节点数量,从基于所述节点数量确定边数据的边数量开始重复上述步骤至判断出更新后的节点数量大于节点数量上限值;
第二训练图数据生成单元,用于当所述第二判断单元判断出更新后的节点数量大于节点数量上限值时,将多次生成的训练图数据作为所述多个训练图数据。
在一些实施例中,所述第二超参数组获取模块包括:
取值区间获取单元,用于获取预设数量个超参数的取值区间;
取值区间划分单元,用于将超参数的取值区间划分为多个分段取值区间;
边界值集合获取单元,用于获取超参数所对应的多个分段取值区间的边界值集合;
训练超参数组确定单元,用于基于所述边界值集合确定所述多个训练超参数组。
在一些实施例中,所述训练测评数据确定模块包括:
特征向量获取单元,用于获取每一训练图数据中节点数据的特征向量;
空间距离确定单元,用于基于节点数据间的特征向量间的距离确定所述节点数据间的空间距离;
最短路径数据获取单元,用于获取节点数据间的最短路径数据,所述最短路径数据包括连接节点数据间的边数据最少的路径数据;
图距离确定单元,用于根据所述最短路径数据确定节点数据间的图距离;
距离比较单元,用于比较每一训练图数据中任一目标节点数据分别与两个非目标节点数据间的图距离和空间距离的大小;
训练测评数据确定单元,用于根据比较的结果确定每一训练图数据的训练测评数据。
在一些实施例中,所述待筛选超参数组与所述训练超参数组相同。
在一些实施例中,所述目标超参数确定模块包括:
数值比较单元,用于比较所述多个超参数测评数据的数值大小;
目标超参数确定单元,用于确定最小的超参数测评数据所对应的待筛选超参数组,将所述待筛选超参数组作为所述待表征图数据的目标超参数。
所述的装置实施例中的装置与方法实施例基于同样地发明构思。
本发明实施例提供了一种超参数确定服务器,该超参数确定服务器包括处理器和存储器,该存储器中存储有至少一条指令、至少一段程序、代码集或指令集,该至少一条指令、该至少一段程序、该代码集或指令集由该处理器加载并执行以实现如上述方法实施例所提供的超参数确定方法。
存储器可用于存储软件程序以及模块,处理器通过运行存储在存储器的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、功能所需的应用程序等;存储数据区可存储根据所述设备的使用所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器还可以包括存储器控制器,以提供处理器对存储器的访问。
本发明实施例所提供的方法实施例可以在移动终端、计算机终端、服务器或者类似的运算装置中执行。以运行在服务器上为例,图12是本发明实施例提供的一种超参数确定方法的服务器的硬件结构框图。如图12所示,该服务器1200可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(CentralProcessingUnits,CPU)1210(处理器1210可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器1230,一个或一个以上存储应用程序1223或数据1222的存储介质1220(例如一个或一个以上海量存储设备)。其中,存储器1230和存储介质1220可以是短暂存储或持久存储。存储在存储介质1220的程序可以包括一个或一个以上模块,每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器1210可以设置为与存储介质1220通信,在服务器1200上执行存储介质1220中的一系列指令操作。服务器1200还可以包括一个或一个以上电源1260,一个或一个以上有线或无线网络接口1250,一个或一个以上输入输出接口1240,和/或,一个或一个以上操作系统1221,例如WindowsServerTM,MacOSXTM,UnixTM,LinuxTM,FreeBSDTM等等。
输入输出接口1240可以用于经由一个网络接收或者发送数据。上述的网络具体实例可包括服务器1200的通信供应商提供的无线网络。在一个实例中,输入输出接口1240包括一个网络适配器(NetworkInterfaceController,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,输入输出接口1240可以为射频(RadioFrequency,RF)模块,其用于通过无线方式与互联网进行通讯。
本领域普通技术人员可以理解,图12所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,服务器1200还可包括比图12中所示更多或者更少的组件,或者具有与图12所示不同的配置。
本发明的实施例还提供了一种存储介质,所述存储介质可设置于服务器之中以保存用于实现方法实施例中一种超参数确定方法相关的至少一条指令、至少一段程序、代码集或指令集,该至少一条指令、该至少一段程序、该代码集或指令集由该处理器加载并执行以实现上述方法实施例提供的超参数确定方法。
可选地,在本实施例中,上述存储介质可以位于计算机网络的多个网络服务器中的至少一个网络服务器。可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,RandomAccessMemory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以下结合游戏社交网络的用户推荐来介绍本发明提供的超参数确定方法的具体应用。
具体的,假设某游戏应用中,可以向一些初级玩家(或游戏水平较低的用户)推荐师傅(游戏水平较高的用户),为了提高后续推荐后的点击率,需要保证向初学者推荐的是与之相似度较高(即与之社交关系联系交紧密)的师傅。在这中推荐场景中,可以基于该游戏应用中用户之间的关联关系来确定该游戏应用所对应社交网络的图数据;然后,基于图数据的图属性向量和相应的待筛选超参数组确定组合特征向量,将该组合特征向量输入到利用本发明提供技术方案训练好的超参数筛选模型中,得到可以反映超参数组所对应的表征学习模型对待表征图数据表征性能的超参数测评数据,进而基于超参数测评数据确定出合适的超参数(目标超参数)。
进一步的,结合图13所示。图13是本发明实施例提供的一种基于本发明方案中的目标超参数确定推荐列表的示意图。在具体的推荐应用中,可以基于这些超参数设置表征学习模型,得到每个节点(用户)的特征向量。接着,根据这些节点的特征向量,计算每两个节点之间的相似度。最后,按相似度,从小到大依次排序,从而产生玩家的师傅推荐列表。
由上述本发明提供的超参数确定方法、装置、服务器或存储介质的实施例可见,本发明中基于由图属性向量和超参数组所组成的组合特征向量对表征学习模型进行超参数筛选训练,得到的可以通过图数据的图属性向量和超参数组来快速预测超参数的超参数筛选模型。在需要进行图数据表征时,可以直接将待表征图数据和超参数组进行组合,得到组合特征向量;然后,以该组合特征输入到预先训练好的超参数筛选模型中进行超参数的筛选学习,得到可以反映超参数组所对应的表征学习模型对待表征图数据表征性能的超参数测评数据;最后,根据超参数测评数据来确定出合适的目标超参数。
需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。且上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置和服务器实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (18)

1.一种用户推荐方法,其特征在于,所述方法由服务器执行,所述方法包括:
获取待表征图数据的图属性向量,所述待表征图数据包括用户数据和用户间的关联关系数据;所述图属性向量包括表征所述用户数据和所述用户间的关联关系数据的分布情况的图属性信息所形成的向量;
获取多个待筛选超参数组;
基于所述图属性向量和所述多个待筛选超参数组生成多个组合特征向量;
将所述多个组合特征向量输入超参数筛选模型进行超参数筛选处理,得到多个超参数测评数据,所述超参数测评数据表征待筛选超参数组所对应表征学习模型对所述待表征图数据的表征性能;
根据所述多个超参数测评数据确定所述待表征图数据的目标超参数;
基于所述目标超参数所对应的表征学习模型对所述待表征图数据进行表征学习,得到所述待表征图数据中所述用户数据的特征向量;
基于所述特征向量来计算所述用户间之间的相似度;
基于所述相似度进行用户推荐。
2.根据权利要求1所述的方法,其特征在于,所述超参数筛选模型包括采用下述方式确定:
获取多个训练图数据的图属性向量;
获取多个训练超参数组;
基于所述图属性向量和所述训练超参数组生成多个组合特征向量;
确定所述多个训练图数据所对应的训练测评数据;
基于所述多个组合特征向量和所述训练测评数据对预设机器学习模型进行超参数筛选训练,得到超参数筛选模型。
3.根据权利要求2所述的方法,其特征在于,所述获取多个训练图数据的图属性向量包括:
确定节点数据的节点数量;
基于所述节点数量确定边数据的边数量;
生成多个包括所述节点数量的节点数据和所述边数量的边数据的训练图数据;
根据生成的多个训练图数据中节点数据和边数据的分布信息确定所述多个训练图数据的图属性向量。
4.根据权利要求3所述的方法,其特征在于,在所述根据生成的多个训练图数据中节点数据和边数据的分布信息确定所述多个训练图数据的图属性向量之前,所述方法还包括:
将所述边数量加上预设边数增量得到更新后的边数量;
判断所述更新后的边数量是否小于等于边数量上限值;
当判断的结果为是时,将更新后的边数量作为所述边数据的边数量,从生成训练图数据的开始重复上述步骤至判断出更新后的边数量大于边数量上限值;
当判断的结果为否时,将所述节点数量加上预设节点数增量得到更新后的节点数量;
判断所述更新后的节点数量是否小于等于节点数量上限值;
当判断出更新后的节点数量小于等于节点数量上限值时,将更新后的节点数量作为所述节点数据的节点数量,从基于所述节点数量确定边数据的边数量开始重复上述步骤至判断出更新后的节点数量大于节点数量上限值;
当判断出更新后的节点数量大于节点数量上限值时,将多次生成的训练图数据作为所述多个训练图数据。
5.根据权利要求2所述的方法,其特征在于,所述获取多个训练超参数组包括:
获取预设数量个超参数的取值区间;
将超参数的取值区间划分为多个分段取值区间;
获取超参数所对应的多个分段取值区间的边界值集合;
基于所述边界值集合确定所述多个训练超参数组。
6.根据权利要求2所述的方法,其特征在于,所述确定所述多个训练图数据所对应的训练测评数据包括:
获取每一训练图数据中节点数据的特征向量;
基于节点数据间的特征向量间的距离确定所述节点数据间的空间距离;
获取节点数据间的最短路径数据,所述最短路径数据包括连接节点数据间的边数据最少的路径数据;
根据所述最短路径数据确定节点数据间的图距离;
比较每一训练图数据中任一目标节点数据分别与两个非目标节点数据间的图距离和空间距离的大小;
根据比较的结果确定每一训练图数据的训练测评数据。
7.根据权利要求2所述的方法,其特征在于,所述待筛选超参数组与所述训练超参数组相同。
8.根据权利要求1至7任一所述的方法,其特征在于,所述根据所述多个超参数测评数据确定所述待表征图数据的目标超参数包括:
比较所述多个超参数测评数据的数值大小;
确定最小的超参数测评数据所对应的待筛选超参数组;
将所述待筛选超参数组作为所述待表征图数据的目标超参数。
9.一种用户推荐装置,其特征在于,所述装置设置于服务器,所述装置包括:
第一图属性向量获取模块,用于获取待表征图数据的图属性向量,所述待表征图数据包括用户数据和用户间的关联关系数据;所述图属性向量包括表征所述用户数据和所述用户间的关联关系数据的分布情况的图属性信息所形成的向量;
第一超参数组获取模块,用于获取多个待筛选超参数组;
第一组合特征向量生成模块,用于基于所述图属性向量和所述多个待筛选超参数组生成多个组合特征向量;
超参数筛选处理模块,用于将所述多个组合特征向量输入超参数筛选模型进行超参数筛选处理,得到多个超参数测评数据,所述超参数测评数据表征待筛选超参数组所对应表征学习模型对所述待表征图数据的表征性能;
目标超参数确定模块,用于根据所述多个超参数测评数据确定所述待表征图数据的目标超参数;
表征学习模块,用于基于所述目标超参数所对应的表征学习模型对所述待表征图数据进行表征学习,得到所述待表征图数据中所述用户数据的特征向量;
相似度计算模块,用于基于所述特征向量来计算所述用户间之间的相似度;
用户推荐模块,用于基于所述相似度进行用户推荐。
10.根据权利要求9所述的装置,其特征在于,所述超参数筛选模型包括采用下述模块确定:
第二图属性向量获取模块,用于获取多个训练图数据的图属性向量;
第二超参数组获取模块,用于获取多个训练超参数组;
第二组合特征向量生成模块,用于基于所述图属性向量和所述训练超参数组生成多个组合特征向量;
训练测评数据确定模块,用于确定所述多个训练图数据所对应的训练测评数据;
超参数筛选训练模块,用于基于所述多个组合特征向量和所述训练测评数据对预设机器学习模型进行超参数筛选训练,得到超参数筛选模型。
11.根据权利要求10所述的装置,其特征在于,所述第二图属性向量获取模块包括:
节点数量确定单元,用于确定节点数据的节点数量;
边数量确定单元,用于基于所述节点数量确定边数据的边数量;
第一训练图数据生成单元,用于生成多个包括所述节点数量的节点数据和所述边数量的边数据的训练图数据;
图属性向量确定单元,用于根据生成的多个训练图数据中节点数据和边数据的分布信息确定所述多个训练图数据的图属性向量。
12.根据权利要求11所述的装置,其特征在于,所述第二图属性向量获取模块还包括:
第一边数量更新单元,用于在所述根据生成的多个训练图数据中节点数据和边数据的分布信息确定所述多个训练图数据的图属性向量之前,将所述边数量加上预设边数增量得到更新后的边数量;
第一判断单元,用于判断所述更新后的边数量是否小于等于边数量上限值;
第一数据处理单元,用于当所述第一判断单元判断的结果为是时,将更新后的边数量作为所述边数据的边数量,从生成训练图数据的开始重复上述步骤至判断出更新后的边数量大于边数量上限值;
节点数量更新单元,用于当判断的结果为否时,将所述节点数量加上预设节点数增量得到更新后的节点数量;
第二判断单元,用于判断所述更新后的节点数量是否小于等于节点数量上限值;
第二数据处理单元,用于当所述第二判断单元判断出更新后的节点数量小于等于节点数量上限值时,将更新后的节点数量作为所述节点数据的节点数量,从基于所述节点数量确定边数据的边数量开始重复上述步骤至判断出更新后的节点数量大于节点数量上限值;
第二训练图数据生成单元,用于当所述第二判断单元判断出更新后的节点数量大于节点数量上限值时,将多次生成的训练图数据作为所述多个训练图数据。
13.根据权利要求10所述的装置,其特征在于,所述第二超参数组获取模块包括:
取值区间获取单元,用于获取预设数量个超参数的取值区间;
取值区间划分单元,用于将超参数的取值区间划分为多个分段取值区间;
边界值集合获取单元,用于获取超参数所对应的多个分段取值区间的边界值集合;
训练超参数组确定单元,用于基于所述边界值集合确定所述多个训练超参数组。
14.根据权利要求10所述的装置,其特征在于,所述训练测评数据确定模块包括:
特征向量获取单元,用于获取每一训练图数据中节点数据的特征向量;
空间距离确定单元,用于基于节点数据间的特征向量间的距离确定所述节点数据间的空间距离;
最短路径数据获取单元,用于获取节点数据间的最短路径数据,所述最短路径数据包括连接节点数据间的边数据最少的路径数据;
图距离确定单元,用于根据所述最短路径数据确定节点数据间的图距离;
距离比较单元,用于比较每一训练图数据中任一目标节点数据分别与两个非目标节点数据间的图距离和空间距离的大小;
训练测评数据确定单元,用于根据比较的结果确定每一训练图数据的训练测评数据。
15.根据权利要求10所述的装置,其特征在于,所述待筛选超参数组与所述训练超参数组相同。
16.根据权利要求9至15任一所述的装置,其特征在于,所述目标超参数确定模块包括:
数值比较单元,用于比较所述多个超参数测评数据的数值大小;
目标超参数确定单元,用于确定最小的超参数测评数据所对应的待筛选超参数组,将所述待筛选超参数组作为所述待表征图数据的目标超参数。
17.一种用户推荐服务器,其特征在于,所述服务器包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如权利要求1至8任一所述的用户推荐方法。
18.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如权利要求1至8任一所述的用户推荐方法。
CN201910220752.1A 2019-03-22 2019-03-22 一种用户推荐方法、装置及服务器 Active CN110070104B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910220752.1A CN110070104B (zh) 2019-03-22 2019-03-22 一种用户推荐方法、装置及服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910220752.1A CN110070104B (zh) 2019-03-22 2019-03-22 一种用户推荐方法、装置及服务器

Publications (2)

Publication Number Publication Date
CN110070104A CN110070104A (zh) 2019-07-30
CN110070104B true CN110070104B (zh) 2023-06-13

Family

ID=67366475

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910220752.1A Active CN110070104B (zh) 2019-03-22 2019-03-22 一种用户推荐方法、装置及服务器

Country Status (1)

Country Link
CN (1) CN110070104B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111494964B (zh) * 2020-06-30 2020-11-20 腾讯科技(深圳)有限公司 虚拟物品的推荐方法、模型的训练方法、装置及存储介质
CN117724431A (zh) * 2024-02-07 2024-03-19 长沙矿冶研究院有限责任公司 一种反应釜中反应物料粒度的控制方法及控制系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107577682A (zh) * 2016-07-05 2018-01-12 上海交通大学 基于社交图片的用户兴趣挖掘和用户推荐方法及系统
CN109242105A (zh) * 2018-08-17 2019-01-18 第四范式(北京)技术有限公司 机器学习模型中超参数的调优方法、装置、设备及介质
CN109492691A (zh) * 2018-11-07 2019-03-19 南京信息工程大学 一种超图卷积网络模型及其半监督分类方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10606885B2 (en) * 2016-11-15 2020-03-31 Evolv Technology Solutions, Inc. Data object creation and recommendation using machine learning based online evolution

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107577682A (zh) * 2016-07-05 2018-01-12 上海交通大学 基于社交图片的用户兴趣挖掘和用户推荐方法及系统
CN109242105A (zh) * 2018-08-17 2019-01-18 第四范式(北京)技术有限公司 机器学习模型中超参数的调优方法、装置、设备及介质
CN109492691A (zh) * 2018-11-07 2019-03-19 南京信息工程大学 一种超图卷积网络模型及其半监督分类方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
融合用户信任度与相似度的推荐算法研究;徐毅;叶卫根;戴鑫;宋威;周贤泉;;小型微型计算机系统(01);全文 *

Also Published As

Publication number Publication date
CN110070104A (zh) 2019-07-30

Similar Documents

Publication Publication Date Title
Xue et al. Particle swarm optimization for feature selection in classification: A multi-objective approach
CN110766080B (zh) 一种标注样本确定方法、装置、设备及存储介质
CN110032682B (zh) 一种信息推荐列表生成方法、装置及设备
Fdez-Riverola et al. Using rough sets theory and minimum description length principle to improve a β-tsk fuzzy revision method for cbr systems
CN111494964B (zh) 虚拟物品的推荐方法、模型的训练方法、装置及存储介质
CN110070104B (zh) 一种用户推荐方法、装置及服务器
Burtini et al. Improving online marketing experiments with drifting multi-armed bandits
CN110738362A (zh) 一种基于改进的多元宇宙算法构建预测模型的方法
CN113536105A (zh) 推荐模型训练方法和装置
Yan et al. A novel clustering algorithm based on fitness proportionate sharing
CN117312881B (zh) 临床试验治疗效果评估方法、装置、设备及存储介质
Hakli et al. Levy flight distribution for scout bee in artificial bee colony algorithm
CN113299380A (zh) 基于智慧医疗大数据的信息提示方法及智慧医疗服务系统
Arunadevi et al. Comparison of feature selection strategies for classification using rapid miner
CN113627464B (zh) 图像处理方法、装置、设备和存储介质
Markid et al. Bidirectional ant colony optimization for feature selection
CN111949530B (zh) 测试结果的预测方法、装置、计算机设备及存储介质
CN115345303A (zh) 卷积神经网络权重调优方法、装置、存储介质和电子设备
CN114489966A (zh) 一种作业调度方法及装置
CN113836444A (zh) 一种线性时间好友推荐方法、系统、终端以及存储介质
CN113392867A (zh) 一种图像识别方法、装置、计算机设备及存储介质
CN113627513A (zh) 一种训练数据生成方法、系统、电子设备及存储介质
CN113590720A (zh) 数据分类方法、装置、计算机设备和存储介质
CN112906785A (zh) 基于融合的零样本物体种类识别方法、装置及设备
CN112052386A (zh) 信息推荐方法、装置和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant