CN108491423A - 一种排序方法及装置 - Google Patents

一种排序方法及装置 Download PDF

Info

Publication number
CN108491423A
CN108491423A CN201810123849.6A CN201810123849A CN108491423A CN 108491423 A CN108491423 A CN 108491423A CN 201810123849 A CN201810123849 A CN 201810123849A CN 108491423 A CN108491423 A CN 108491423A
Authority
CN
China
Prior art keywords
sample
information
sequencing information
preset model
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810123849.6A
Other languages
English (en)
Other versions
CN108491423B (zh
Inventor
崔龙
王睿旻
雷相阳
孙成龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing QIYI Century Science and Technology Co Ltd
Original Assignee
Beijing QIYI Century Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing QIYI Century Science and Technology Co Ltd filed Critical Beijing QIYI Century Science and Technology Co Ltd
Priority to CN201810123849.6A priority Critical patent/CN108491423B/zh
Publication of CN108491423A publication Critical patent/CN108491423A/zh
Application granted granted Critical
Publication of CN108491423B publication Critical patent/CN108491423B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种排序方法及装置,属于计算机技术领域。本发明实施例提供的排序方法及装置,可以提取待排序对象的第一排序信息以及第二排序信息,接着利用第一预设模型将待排序对象的第一排序信息转换为第三排序信息,然后利用第二预设模型,根据第二排序信息以及第三排序信息,确定待排序对象的排序参数,最后根据待排序对象的排序参数进行排序。相较于现有技术中基于单一的机器学习模型对待排序对象的部分特征信息进行处理,进而排序的方式,本发明实施例中,利用待排序对象的第一特征信息以及第二特征信息进行排序,更加充分的利用了有效的特征信息,进而使得排序结果能够更加贴合用户实际关心的内容,提高了排序效果。

Description

一种排序方法及装置
技术领域
本发明属于计算机技术领域,特别是涉及一种排序方法及装置。
背景技术
随着计算机技术的不断发展,网络系统中的网络对象越来越多,用户经常会利用搜索关键字在网络系统中搜索网络对象,比如,视频系统中会有大量的视频,用户可以通过搜索关键字搜索相关的视频。由于根据搜索关键字搜索到视频会比较多,因此,在向用户返回搜索结果时,往往需要对搜索到的视频进行排序。
现有技术中,通常是利用单一的机器学习模型,基于该机器学习模型所处理的特征信息预测用户对该网络对象的喜爱程度,然后根据用户对每个网络对象的喜爱程度进行排序。
但是,现有技术的排序方式由于不能充分利用有效的特征信息,进而会导致排序结果不能贴合用户实际关心的内容,排序效果较差。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种排序方法及装置。
依据本发明的第一方面,提供了一种排序方法,该方法包括:
提取待排序对象的第一排序信息以及第二排序信息;
利用第一预设模型将所述待排序对象的第一排序信息转换为第三排序信息;
利用第二预设模型,根据所述第二排序信息以及所述第三排序信息,确定所述待排序对象的排序参数;
根据所述待排序对象的排序参数进行排序;
其中,所述第一排序信息与第一特征对应,所述第二排序信息以及所述第三排序信息均与第二特征对应;所述第一特征和所述第二特征是通过预先对所有对象的属性进行分析确定的。
可选的,所述第二排序信息与第二特征对应时,所述提取待排序对象的第一排序信息以及第二排序信息,包括:
按照所述第一特征中包括的第一特征分量,提取所述待排序对象与所述第一特征分量对应的参数,得到第一排序信息;
按照所述第二特征中包括的第二特征分量,提取所述待排序对象与所述第二特征分量对应的参数,得到第二排序信息;
其中,所述第一特征中包括的第一特征分量由A个对象都具有的特征分量组成,所述A为正整数,所述A表示网络系统中所有对象的数量;所述第二特征中包括的第二特征分量由Q个对象所具有的特征分量组成,所述Q为小于所述A的正整数。
可选的,在所述利用第一预设模型将所述待排序对象的第一排序信息转换为第三排序信息之前,所述方法还包括:
利用第一样本数据进行训练,得到第一预设模型;
基于所述第一预设模型以及所述第一样本数据,确定第二样本数据;
利用所述第二样本数据进行训练,得到第二预设模型。
可选的,所述第一样本数据包括多个第一样本对,每个第一样本对由样本对象的第一样本信息以及标注值组成,所述第一样本信息与所述第一特征对应;
所述利用第一样本数据进行训练,得到第一预设模型,包括:
利用每个第一样本对构建强学习器;
将每个第一样本对代入所述强学习器,并计算每个第一样本对相对所述强学习器的负梯度;
对每个第一样本对中的第一样本信息和所述第一样本对的负梯度进行拟合,得到第一拟合函数;所述第一拟合函数包括多个叶子节点;
计算所述强学习器的损失函数的损失值;
在所述损失值在预设范围内时,将所述第一拟合函数确定为第一预设模型。
可选的,所述第二样本数据包括多个第二样本对,每个第二样本对由样本对象的第二样本信息、第三样本信息以及标注值组成,所述第二样本信息与所述第二特征对应,所述第三样本信息是利用所述第一拟合函数对每个样本对象的第一样本信息进行处理得到的;
所述基于所述第一预设模型以及所述第一样本数据,确定第二样本数据,包括:
将每个样本对象的第一样本信息作为所述第一预设模型的输入,计算所述第一预设模型中每个叶子节点的值,进而得到所述第一样本信息对应的第三样本信息;
将所述样本对象的第三样本信息与所述样本对象的第二样本信息组合,并利用所述样本对象组合后的样本信息以及标注值组成第二样本对,得到多个第二样本对。
可选的,所述利用第一预设模型将所述待排序对象的第一排序信息转换为第三排序信息,包括:
将所述第一排序信息输入第一预设模型进行处理,将所述第一预设模型的输出值确定为第三排序信息。
可选的,所述利用第二预设模型,根据所述第二排序信息以及所述第三排序信息,确定所述待排序对象的排序参数,包括:
将所述第一排序信息和所述第三排序信息组合;
将组合后的排序信息输入所述第二预设模型进行处理,将所述第二预设模型的输出值确定为所述待排序的对象的排序参数。
依据本发明的第二方面,提供了一种排序装置,该装置包括:
提取模块,用于提取待排序对象的第一排序信息以及第二排序信息;
转换模块,用于利用第一预设模型将所述待排序对象的第一排序信息转换为第三排序信息;
第一确定模块,用于利用第二预设模型,根据所述第二排序信息以及所述第三排序信息,确定所述待排序对象的排序参数;
排序模块,用于根据所述待排序对象的排序参数进行排序;
其中,所述第一排序信息与第一特征对应,所述第二排序信息以及所述第三排序信息均与第二特征对应;所述第一特征和所述第二特征是通过预先对所有对象的属性进行分析确定的。
可选的,所述第二排序信息与第二特征对应时,所述提取模块,用于:
按照所述第一特征中包括的第一特征分量,提取所述待排序对象与所述第一特征分量对应的参数,得到第一排序信息;
按照所述第二特征中包括的第二特征分量,提取所述待排序对象与所述第二特征分量对应的参数,得到第二排序信息;
其中,所述第一特征中包括的第一特征分量由A个对象都具有的特征分量组成,所述A为正整数,所述A表示网络系统中所有对象的数量;所述第二特征中包括的第二特征分量由Q个对象所具有的特征分量组成,所述Q为小于所述A的正整数。
可选的,所述装置还包括:
第一训练模块,用于利用第一样本数据进行训练,得到第一预设模型;
第二确定模块,用于基于所述第一预设模型以及所述第一样本数据,确定第二样本数据;
第二训练模块,用于利用所述第二样本数据进行训练,得到第二预设模型。
可选的,所述第一样本数据包括多个第一样本对,每个第一样本对由样本对象的第一样本信息以及标注值组成,所述第一样本信息与所述第一特征对应;
所述第一训练模块,用于:
利用每个第一样本对构建强学习器;
将每个第一样本对代入所述强学习器,并计算每个第一样本对相对所述强学习器的负梯度;
对每个第一样本对中的第一样本信息和所述第一样本对的负梯度进行拟合,得到第一拟合函数;所述第一拟合函数包括多个叶子节点;
计算所述强学习器的损失函数的损失值;
在所述损失值在预设范围内时,将所述第一拟合函数确定为第一预设模型。
可选的,所述第二样本数据包括多个第二样本对,每个第二样本对由样本对象的第二样本信息、第三样本信息以及标注值组成,所述第二样本信息与所述第二特征对应,所述第三样本信息是利用所述第一拟合函数对每个样本对象的第一样本信息进行处理得到的;
所述第二确定模块,用于:
将每个样本对象的第一样本信息作为所述第一预设模型的输入,计算所述第一预设模型中每个叶子节点的值,进而得到所述第一样本信息对应的第三样本信息;
将所述样本对象的第三样本信息与所述样本对象的第二样本信息组合,并利用所述样本对象组合后的样本信息以及标注值组成第二样本对,得到多个第二样本对。
可选的,所述转换模块,用于:
将所述第一排序信息输入第一预设模型进行处理,将所述第一预设模型的输出值确定为第三排序信息。
可选的,所述第一确定模块,用于:
将所述第一排序信息和所述第三排序信息组合;
将组合后的排序信息输入所述第二预设模型进行处理,将所述第二预设模型的输出值确定为所述待排序的对象的排序参数。
针对在先技术,本发明具备如下优点:本发明实施例提供的排序方式即装置,可以提取待排序对象的第一排序信息以及第二排序信息,接着利用第一预设模型将待排序对象的第一排序信息转换为第三排序信息,然后利用第二预设模型,根据第二排序信息以及第三排序信息,确定待排序对象的排序参数,最后根据待排序对象的排序参数进行排序。相较于现有技术中基于单一的机器学习模型对待排序对象的部分特征信息进行处理,进而排序的方式,本发明实施例中的排序方法可以基于第一预设模型以及第二预设模型,利用待排序对象的第一特征信息以及第二特征信息进行排序,由于更加充分的利用了有效的特征信息,进而使得排序结果能够更加贴合用户实际关心的内容,提高了排序效果。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1是本发明实施例一提供的一种排序方法的步骤流程图;
图2是本发明实施例二提供的一种排序方法的步骤流程图;
图3是本发明实施例三提供的一种排序装置的框图;
图4是本发明实施例四提供的一种排序装置的框图。
具体实施方式
下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
实施例一
图1是本发明实施例一提供的一种排序方法的步骤流程图,如图1所示,该方法可以包括:
步骤101、提取待排序对象的第一排序信息以及第二排序信息。
实际的应用场景中,每个对象会具有很多特征分量,每个对象所具有的所有特征分量可以分为第一特征和第二特征。其中,第一特征包括的第一特征分量可以由每个对象都具有的特征分量组成,第二特征包括的第二特征分量可以由部分对象所具有的特征分量组成。进一步地,每个对象都具有的特征分量的数量较少,即就是,第一特征中包括的第一特征分量的数量较少,因此,可以认为第一特征是低维特征,进一步的,由于每个对象都具有第一特征分量,即就是,拥有第一特征分量的对象的数量庞大,因此可以认为第一特征为低维稠密特征。相应地,部分对象所具有的特征分量的数量较多,即就是,第二特征中包括的第二特征分量的数量较多,因此,可以认为第二特征是高维特征,进一步的,由于仅有部分对象具有第二特征分量,即就是,拥有第二特征分量的对象的数量较少,因此可以认为第二特征为高维稀疏特征。
以该对象为视频为例,第一特征分量可以为视频时长、视频类型、视频的点击量、第二特征分量可以为视频标题中包含的标签等等。具体的,标签可以某个特定词语,等等。相应地,第一排序信息可以是“时长:1小时10分钟,类型:电影,点击量:5”,第二排序信息可以是“标签:国足赢了”
本发明实施例中,第一排序信息与第一特征对应,第二排序信息与第二特征对应。
步骤102、利用第一预设模型将所述待排序对象的第一排序信息转换为第三排序信息。
本发明实施例中,由于实际应用场景中,一个对象所具有的第一特征和第二特征是两种不同类型的异构特征,因此,无法直接利用第一排序信息和第二排序信息来排序,进而导致有效特征信息无法被充分利用。
本步骤中,可以利用第一预设模型将第一排序信息转换为第三排序信息,其中,第三排序信息对应的特征与第二排序信息对应的特征相同,即就是,第三排序信息与第二特征对应,通过转换使得第二排序信息与第三排序信息对应的特征的类型相同,这样,后续步骤中就可以同时利用第三排序信息以及第二排序信息进行排序,同时,由于第三排序信息是由第一排序信息转化来的,进而实现了基于第一排序信息和第二排序信息进行排序。
步骤103、利用第二预设模型,根据所述第二排序信息以及所述第三排序信息,确定所述待排序对象的排序参数。
本发明实施例中,排序参数可以是第二预设模型根据第二排序信息和第三排序信息,为待排序对象打出的分值,该分值可以是以第二排序信息和第三排序信息作为第二预设模型的输入时,第二预设模型的输出值。该分值可以用于体现用户选择该待排序对象的可能,分值越高,该排序对象被选择的可能性越高。
步骤104、根据所述待排序对象的排序参数进行排序。
本发明实施例中,由于排序参数是根据第三排序信息以及第二排序信息确定的,而第三排序信息是由第一排序信息转化来的,即就是,排序参数是基于待排序对象的所有特征信息,第一排序信息和第二排序信息确定的,因此,根据该排序参数进行排序,可以使得排序结果能够更加贴合用户实际关心的内容。
综上所述,本发明实施例一提供的排序方法,可以提取待排序对象的第一排序信息以及第二排序信息,接着利用第一预设模型将待排序对象的第一排序信息转换为第三排序信息,然后利用第二预设模型,根据第二排序信息以及第三排序信息,确定待排序对象的排序参数,最后根据待排序对象的排序参数进行排序。相较于现有技术中基于单一的机器学习模型对待排序对象的部分特征信息进行处理,进而排序的方式,本发明实施例中的排序方法可以基于第一预设模型以及第二预设模型,利用待排序对象的第一特征信息以及第二特征信息进行排序,由于更加充分的利用了有效的特征信息,进而使得排序结果能够更加贴合用户实际关心的内容,提高了排序效果。
实施例二
图2是本发明实施例二提供的一种排序方法的步骤流程图,如图2所示,该方法可以包括:
步骤201、利用第一样本数据进行训练,得到第一预设模型。
本发明实施例中,第一样本数据可以包括多个第一样本对,每个第一样本对可以由样本对象的第一样本信息以及标注值组成,该第一样本信息与第一特征对应。
本发明实施例中,该标注值可以是依据样本对象是否被用户选择过设置的,示例的,假设样本对象为样本视频,那么可以为被点击过的样本视频设置标注值为1,为没有被点击过的样本视频设置标注值为0,当然,实际应用中,还可以使用其他方式来设置标注值,比如,可以为被点击过的样本视频设置标注值为0,为没有被点击过的样本视频设置标注值为1,等等,本发明实施例对此不作限定。
相应地,利用第一样本数据进行训练,得到第一预设模型的过程,可以通过下述步骤2011~步骤2015来实现:
步骤2011、利用每个第一样本对构建强学习器。
示例的,假设第一样本数据中包括m个第一样本对,以D1表示第一样本数据对应的数据集,可以得到:
Dl={(x1,y1),(x2,y2)...(Xm,ym)}
其中,xm表示样本对象m的第一样本信息,ym表示样本对象m的标注值。
利用D1中的每个第一样本对进行初始化,可以得到如下所示的强学习器:
其中,argmin(F(X))表示的是另F(X)等于最小值时,自变量X的取值,L(*)表示损失函数(英文:Loss function),它是一个非负实值函数。
步骤2012、将每个第一样本对代入所述强学习器,并计算每个第一样本对相对所述强学习器的负梯度。
具体的,可以通过下述公式分别计算第一样本对1…第一样本对m的负梯度:
示例的,可以将第一样本对i的第一样本信息xi代入上述计算公式中,进而得到负梯度rti
步骤2013、对每个第一样本对中的第一样本信息和所述第一样本对的负梯度进行拟合,得到第一拟合函数;所述第一拟合函数包括多个叶子节点。
具体的,通过上述步骤2012可以得到m对第一样本信息和负梯度(x1,rt1),…,(xi,rti),…,(xm,rtm)。
利用(x1,rt1),…,(xi,rti),…,(xm,rtm)进行回归树拟合,可以得到一个包括J个叶子节点的回归树函数,该回归树函数对应的叶子节点区域可以表示为:Rtj,其中,j=1,2,...,J。
通过下述公式针对每一个叶子节点里的样本进行拟合,计算每个叶子节点的输出值ctj
进而得到第一拟合函数如下:
步骤2014、计算所述强学习器的损失函数的损失值。
本步骤中,可以采用指数损失函数,来计算所述强学习器的损失值,示例的,该损失函数可以为:
L(y,f(X))=exp(-y,f(x))
步骤2015、在所述损失值在预设范围内时,将所述第一拟合函数确定为第一预设模型。
本步骤中,该预设范围可以是开发人员根据实际需求预先定义的,本发明实施例对此不作限定。假设损失函数的损失值在该预设范围内,那么可以将ht(x)确定为第一预设模型。相应地,如果损失值不在预设范围内,那么可以利用第一拟合函数进行对强学习器进行更新,然后利用更新后的强学习器从步骤2012开始,继续进行迭代,直至强学习器的损失函数的损失值在预设范围内。
步骤202、基于所述第一预设模型以及所述第一样本数据,确定第二样本数据。
本步骤中,第二样本数据可以包括多个第二样本对,每个第二样本对可以由样本对象的第二样本信息、第三样本信息以及标注值组成,其中,第二样本信息与第二特征对应,第三样本信息是利用第一拟合函数对每个样本对象的第一样本信息进行处理得到的。
相应地,基于第一预设模型以及第一样本数据,确定第二样本数据的过程,可以通过下述步骤2021~步骤2024来实现:
步骤2021、将每个样本对象的第一样本信息作为所述第一预设模型的输入,计算所述第一预设模型中每个叶子节点的值,进而得到所述第一样本信息对应的第三样本信息。
具体的,可以第一样本信息x1输入第一预设模型中,得到第一预设模型中各个叶子节点的值,那么,第一样本信息x1对应的第三样本信息w1即为各个叶子节点的值,其中,第三样本信息的长度为叶子节点数之和。进一步地,以此类推,将x2,x3,…,xm分别作为第一预设模型的输入,可以得到x2,x3,…,xm对应的第三样本信息w2,w3,…,wm
步骤2022、将所述样本对象的第三样本信息与所述样本对象的第二样本信息组合,并利用所述样本对象组合后的样本信息以及标注值组成第二样本对,得到多个第二样本对。
假设每个样本对象1,样本对象2,…样本对象i,…,样本对象m的第二样本信息分别为z1,z2,…,zm,对于样本对象i,可以将wi和zi组合,得到vi,然后和样本对象i的标注值yi组成第二样本对i(vi,yi)。
步骤203、利用所述第二样本数据进行训练,得到第二预设模型。
本步骤中,可以先初始化原始表达式:
其中,b0、bi、bij为模型参数。
进一步地,二次项参数bij可以组成一个对称矩阵A,通过矩阵分解,可以得到A=GTG,G的第j列即为第j维特征的隐向量,即就是,每个参数bij可以表示为:
其中,gi是i维特征的隐向量,k表示隐向量的长度,k<<m。
更新原始表达式,可以得到:
通过对每个vi引入隐向量,可以对原始模型中的各个参数进行估计,进而得到第二预设模型。
步骤204、提取待排序对象的第一排序信息以及第二排序信息。
本步骤中,可以按照第一特征中包括的第一特征分量,提取待排序对象与每个第一特征分量对应的参数,得到第一排序信息;按照第二特征中包括的第二特征分量,提取待排序对象与每个第二特征分量对应的参数,得到第二排序信息。示例的,假设第一特征分量为视频类型、视频时长,该待排序对象的时长为1小时10分钟,类型为电影,那么可以得到第一排序信息为“时长:1小时10分钟,类型:电影”,假设第二特征分量为歌手名字,待排序对象的标题为“周X伦来西安啦,演唱会紧张筹备中”,那么可以得到第二排序信息为“周X伦”。
步骤205、利用第一预设模型将所述待排序对象的第一排序信息转换为第三排序信息。
本步骤中,可以将第一排序信息输入第一预设模型进行处理,将第一预设模型的输出值确定为第三排序信息。利用第一预设模型将第一排序信息转换为第三排序信息,这样,后续步骤中就可以同时利用第三排序信息以及第二排序信息进行排序,同时,由于第三排序信息是由第一排序信息转化来的,进而实现了基于第一排序信息和第二排序信息进行排序。
步骤206、利用第二预设模型,根据所述第二排序信息以及所述第三排序信息,确定所述待排序对象的排序参数。
本步骤中,可以将第一排序信息和第三排序信息组合,将组合后的排序信息输入第二预设模型进行处理,将第二预设模型的输出值确定为待排序的对象的排序参数。由于组合后的排序信息能够体现待排序对象的第一特征以及第二特征,因此,根据组合后的排序信息确定的排序参数,能够最大程度的代表待排序对象。
步骤207、根据所述待排序对象的排序参数进行排序。
具体的,本步骤的实现方式可以参考上述步骤104,本发明实施例在此不做赘述。
综上所述,本发明实施例二提供的排序方法,可以利用第一样本数据进行训练,得到第一预设模型,基于第一预设模型以及第一样本数据,确定第二样本数据,接着利用第二样本数据进行训练,得到第二预设模型,接着提取待排序对象的第一排序信息以及第二排序信息,然后利用第一预设模型将待排序对象的第一排序信息转换为第三排序信息,接着利用第二预设模型,根据第二排序信息以及第三排序信息,确定待排序对象的排序参数,最后根据待排序对象的排序参数进行排序。相较于现有技术中基于单一的机器学习模型对待排序对象的部分特征信息进行处理,进而排序的方式,本发明实施例中的排序方法可以基于第一预设模型以及第二预设模型,利用待排序对象的第一特征信息以及第二特征信息进行排序,由于更加充分的利用了有效的特征信息,进而使得排序结果能够更加贴合用户实际关心的内容,提高了排序效果。
实施例三
图3是本发明实施例三提供的一种排序装置的框图,如图3所示,该装置30可以包括:
提取模块301,用于提取待排序对象的第一排序信息以及第二排序信息;
转换模块302,用于利用第一预设模型将所述待排序对象的第一排序信息转换为第三排序信息;
第一确定模块303,用于利用第二预设模型,根据所述第二排序信息以及所述第三排序信息,确定所述待排序对象的排序参数;
排序模块304,用于根据所述待排序对象的排序参数进行排序;
其中,所述第一排序信息与第一特征对应,所述第二排序信息以及所述第三排序信息均与第二特征对应;所述第一特征和所述第二特征是通过预先对所有对象的属性进行分析确定的。
综上所述,本发明实施例三中的排序装置,提取模块可以提取待排序对象的第一排序信息以及第二排序信息,接着,转换模块可以利用第一预设模型将待排序对象的第一排序信息转换为第三排序信息,然后,第一确定模块可以利用第二预设模型,根据第二排序信息以及第三排序信息,确定待排序对象的排序参数,最后,排序模块可以根据待排序对象的排序参数进行排序。相较于现有技术中基于单一的机器学习模型对待排序对象的部分特征信息进行处理,进而排序的方式,本发明实施例中的排序方法可以基于第一预设模型以及第二预设模型,利用待排序对象的第一特征信息以及第二特征信息进行排序,由于更加充分的利用了有效的特征信息,进而使得排序结果能够更加贴合用户实际关心的内容,提高了排序效果。
实施例四
图4是本发明实施例四提供的一种排序装置的框图,如图4所示,该装置40可以包括:
提取模块401,用于提取待排序对象的第一排序信息以及第二排序信息;
转换模块402,用于利用第一预设模型将所述待排序对象的第一排序信息转换为第三排序信息;
第一确定模块403,用于利用第二预设模型,根据所述第二排序信息以及所述第三排序信息,确定所述待排序对象的排序参数;
排序模块404,用于根据所述待排序对象的排序参数进行排序;
其中,所述第一排序信息与第一特征对应,所述第二排序信息以及所述第三排序信息均与第二特征对应;所述第一特征和所述第二特征是通过预先对所有对象的属性进行分析确定的。
可选的,上述提取模块401,用于:
按照所述第一特征中包括的第一特征分量,提取所述待排序对象与所述第一特征分量对应的参数,得到第一排序信息;
按照所述第二特征中包括的第二特征分量,提取所述待排序对象与所述第二特征分量对应的参数,得到第二排序信息;
其中,所述第一特征中包括的第一特征分量由A个对象都具有的特征分量组成,所述A为正整数,所述A表示网络系统中所有对象的数量;所述第二特征中包括的第二特征分量由Q个对象所具有的特征分量组成,所述Q为小于所述A的正整数。
可选的,上述装置40还包括:
第一训练模块405,用于利用第一样本数据进行训练,得到第一预设模型;
第二确定模块406,用于基于所述第一预设模型以及所述第一样本数据,确定第二样本数据;
第二训练模块407,用于利用所述第二样本数据进行训练,得到第二预设模型。
可选的,所述第一样本数据包括多个第一样本对,每个第一样本对由样本对象的第一样本信息以及标注值组成,所述第一样本信息与所述第一特征对应;上述第一训练模块405,用于:
利用每个第一样本对构建强学习器;
将每个第一样本对代入所述强学习器,并计算每个第一样本对相对所述强学习器的负梯度;
对每个第一样本对中的第一样本信息和所述第一样本对的负梯度进行拟合,得到第一拟合函数;所述第一拟合函数包括多个叶子节点;
计算所述强学习器的损失函数的损失值;
在所述损失值在预设范围内时,将所述第一拟合函数确定为第一预设模型。
可选的,所述第二样本数据包括多个第二样本对,每个第二样本对由样本对象的第二样本信息、第三样本信息以及标注值组成,所述第二样本信息与所述第二特征对应,所述第三样本信息是利用所述第一拟合函数对每个样本对象的第一样本信息进行处理得到的;上述
可选的,上述第二确定模块406,用于:
将每个样本对象的第一样本信息作为所述第一预设模型的输入,计算所述第一预设模型中每个叶子节点的值,进而得到所述第一样本信息对应的第三样本信息;
将所述样本对象的第三样本信息与所述样本对象的第二样本信息组合,并利用所述样本对象组合后的样本信息以及标注值组成第二样本对,得到多个第二样本对。
可选的,上述转换模块402,用于:
将所述第一排序信息输入第一预设模型进行处理,将所述第一预设模型的输出值确定为第三排序信息。
可选的,上述第一确定模块403,用于:
将所述第一排序信息和所述第三排序信息组合;
将组合后的排序信息输入所述第二预设模型进行处理,将所述第二预设模型的输出值确定为所述待排序的对象的排序参数。
综上所述,本发明实施例四中的排序装置,第一训练模块可以利用第一样本数据进行训练,得到第一预设模型,第二确定模块可以基于第一预设模型以及第一样本数据,确定第二样本数据,第二训练模块可以利用第二样本数据进行训练,得到第二预设模型,接着,提取模块可以提取待排序对象的第一排序信息以及第二排序信息,然后,转换模块可以利用第一预设模型将待排序对象的第一排序信息转换为第三排序信息,接着,第一确定模块可以利用第二预设模型,根据第二排序信息以及第三排序信息,确定待排序对象的排序参数,最后,排序模块可以根据待排序对象的排序参数进行排序。相较于现有技术中基于单一的机器学习模型对待排序对象的部分特征信息进行处理,进而排序的方式,本发明实施例中的排序方法可以基于第一预设模型以及第二预设模型,利用待排序对象的第一特征信息以及第二特征信息进行排序,由于更加充分的利用了有效的特征信息,进而使得排序结果能够更加贴合用户实际关心的内容,提高了排序效果。
对于上述装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域技术人员易于想到的是:上述各个实施例的任意组合应用都是可行的,故上述各个实施例之间的任意组合都是本发明的实施方案,但是由于篇幅限制,本说明书在此就不一一详述了。
在此提供的排序方法不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造具有本发明方案的系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本发明并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的排序方法中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

Claims (14)

1.一种排序方法,其特征在于,所述方法包括:
提取待排序对象的第一排序信息以及第二排序信息;
利用第一预设模型将所述待排序对象的第一排序信息转换为第三排序信息;
利用第二预设模型,根据所述第二排序信息以及所述第三排序信息,确定所述待排序对象的排序参数;
根据所述待排序对象的排序参数进行排序;
其中,所述第一排序信息与第一特征对应,所述第二排序信息以及所述第三排序信息均与第二特征对应;所述第一特征和所述第二特征是通过预先对所有对象的属性进行分析确定的。
2.根据权利要求1所述的方法,其特征在于,所述提取待排序对象的第一排序信息以及第二排序信息,包括:
按照所述第一特征中包括的第一特征分量,提取所述待排序对象与所述第一特征分量对应的参数,得到第一排序信息;
按照所述第二特征中包括的第二特征分量,提取所述待排序对象与所述第二特征分量对应的参数,得到第二排序信息;
其中,所述第一特征中包括的第一特征分量由A个对象都具有的特征分量组成,所述A为正整数,所述A表示网络系统中所有对象的数量;所述第二特征中包括的第二特征分量由Q个对象所具有的特征分量组成,所述Q为小于所述A的正整数。
3.根据权利要求1所述的方法,其特征在于,在所述利用第一预设模型将所述待排序对象的第一排序信息转换为第三排序信息之前,所述方法还包括:
利用第一样本数据进行训练,得到第一预设模型;
基于所述第一预设模型以及所述第一样本数据,确定第二样本数据;
利用所述第二样本数据进行训练,得到第二预设模型。
4.根据权利要求3所述的方法,其特征在于,所述第一样本数据包括多个第一样本对,每个第一样本对由样本对象的第一样本信息以及标注值组成,所述第一样本信息与所述第一特征对应;
所述利用第一样本数据进行训练,得到第一预设模型,包括:
利用每个第一样本对构建强学习器;
将每个第一样本对代入所述强学习器,并计算每个第一样本对相对所述强学习器的负梯度;
对每个第一样本对中的第一样本信息和所述第一样本对的负梯度进行拟合,得到第一拟合函数;所述第一拟合函数包括多个叶子节点;
计算所述强学习器的损失函数的损失值;
在所述损失值在预设范围内时,将所述第一拟合函数确定为第一预设模型。
5.根据权利要求4所述的方法,其特征在于,所述第二样本数据包括多个第二样本对,每个第二样本对由样本对象的第二样本信息、第三样本信息以及标注值组成,所述第二样本信息与所述第二特征对应,所述第三样本信息是利用所述第一拟合函数对每个样本对象的第一样本信息进行处理得到的;
所述基于所述第一预设模型以及所述第一样本数据,确定第二样本数据,包括:
将每个样本对象的第一样本信息作为所述第一预设模型的输入,计算所述第一预设模型中每个叶子节点的值,进而得到所述第一样本信息对应的第三样本信息;
将所述样本对象的第三样本信息与所述样本对象的第二样本信息组合,并利用所述样本对象组合后的样本信息以及标注值组成第二样本对,得到多个第二样本对。
6.根据权利要求1所述的方法,其特征在于,所述利用第一预设模型将所述待排序对象的第一排序信息转换为第三排序信息,包括:
将所述第一排序信息输入第一预设模型进行处理,将所述第一预设模型的输出值确定为第三排序信息。
7.根据权利要求1所述的方法,其特征在于,所述利用第二预设模型,根据所述第二排序信息以及所述第三排序信息,确定所述待排序对象的排序参数,包括:
将所述第一排序信息和所述第三排序信息组合;
将组合后的排序信息输入所述第二预设模型进行处理,将所述第二预设模型的输出值确定为所述待排序的对象的排序参数。
8.一种排序装置,其特征在于,所述装置包括:
提取模块,用于提取待排序对象的第一排序信息以及第二排序信息;
转换模块,用于利用第一预设模型将所述待排序对象的第一排序信息转换为第三排序信息;
第一确定模块,用于利用第二预设模型,根据所述第二排序信息以及所述第三排序信息,确定所述待排序对象的排序参数;
排序模块,用于根据所述待排序对象的排序参数进行排序;
其中,所述第一排序信息与第一特征对应,所述第二排序信息以及所述第三排序信息均与第二特征对应;所述第一特征和所述第二特征是通过预先对所有对象的属性进行分析确定的。
9.根据权利要求8所述的装置,其特征在于,所述提取模块,用于:
按照所述第一特征中包括的第一特征分量,提取所述待排序对象与所述第一特征分量对应的参数,得到第一排序信息;
按照所述第二特征中包括的第二特征分量,提取所述待排序对象与所述第二特征分量对应的参数,得到第二排序信息;
其中,所述第一特征中包括的第一特征分量由A个对象都具有的特征分量组成,所述A为正整数,所述A表示网络系统中所有对象的数量;所述第二特征中包括的第二特征分量由Q个对象所具有的特征分量组成,所述Q为小于所述A的正整数。
10.根据权利要求8所述的装置,其特征在于,所述装置还包括:
第一训练模块,用于利用第一样本数据进行训练,得到第一预设模型;
第二确定模块,用于基于所述第一预设模型以及所述第一样本数据,确定第二样本数据;
第二训练模块,用于利用所述第二样本数据进行训练,得到第二预设模型。
11.根据权利要求10所述的装置,其特征在于,所述第一样本数据包括多个第一样本对,每个第一样本对由样本对象的第一样本信息以及标注值组成,所述第一样本信息与所述第一特征对应;
所述第一训练模块,用于:
利用每个第一样本对构建强学习器;
将每个第一样本对代入所述强学习器,并计算每个第一样本对相对所述强学习器的负梯度;
对每个第一样本对中的第一样本信息和所述第一样本对的负梯度进行拟合,得到第一拟合函数;所述第一拟合函数包括多个叶子节点;
计算所述强学习器的损失函数的损失值;
在所述损失值在预设范围内时,将所述第一拟合函数确定为第一预设模型。
12.根据权利要求11所述的装置,其特征在于,所述第二样本数据包括多个第二样本对,每个第二样本对由样本对象的第二样本信息、第三样本信息以及标注值组成,所述第二样本信息与所述第二特征对应,所述第三样本信息是利用所述第一拟合函数对每个样本对象的第一样本信息进行处理得到的;
所述第二确定模块,用于:
将每个样本对象的第一样本信息作为所述第一预设模型的输入,计算所述第一预设模型中每个叶子节点的值,进而得到所述第一样本信息对应的第三样本信息;
将所述样本对象的第三样本信息与所述样本对象的第二样本信息组合,并利用所述样本对象组合后的样本信息以及标注值组成第二样本对,得到多个第二样本对。
13.根据权利要求8所述的装置,其特征在于,所述转换模块,用于:
将所述第一排序信息输入第一预设模型进行处理,将所述第一预设模型的输出值确定为第三排序信息。
14.根据权利要求8所述的装置,其特征在于,所述第一确定模块,用于:
将所述第一排序信息和所述第三排序信息组合;
将组合后的排序信息输入所述第二预设模型进行处理,将所述第二预设模型的输出值确定为所述待排序的对象的排序参数。
CN201810123849.6A 2018-02-07 2018-02-07 一种排序方法及装置 Active CN108491423B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810123849.6A CN108491423B (zh) 2018-02-07 2018-02-07 一种排序方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810123849.6A CN108491423B (zh) 2018-02-07 2018-02-07 一种排序方法及装置

Publications (2)

Publication Number Publication Date
CN108491423A true CN108491423A (zh) 2018-09-04
CN108491423B CN108491423B (zh) 2020-09-01

Family

ID=63344695

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810123849.6A Active CN108491423B (zh) 2018-02-07 2018-02-07 一种排序方法及装置

Country Status (1)

Country Link
CN (1) CN108491423B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109190123A (zh) * 2018-09-14 2019-01-11 北京字节跳动网络技术有限公司 用于输出信息的方法和装置
CN113254513A (zh) * 2021-07-05 2021-08-13 北京达佳互联信息技术有限公司 排序模型生成方法、排序方法、装置、电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130132356A1 (en) * 2010-07-26 2013-05-23 Alibaba Group Holding Limited Method and Apparatus for Sorting Inquiry Results
CN103761426A (zh) * 2014-01-02 2014-04-30 中国科学院数学与系统科学研究院 一种在高维数据中快速识别特征组合的方法及系统
CN105589971A (zh) * 2016-01-08 2016-05-18 车智互联(北京)科技有限公司 训练推荐模型的方法、装置及推荐系统
CN106326904A (zh) * 2015-06-16 2017-01-11 富士通株式会社 获取特征排序模型的装置和方法以及特征排序方法
CN106909931A (zh) * 2015-12-23 2017-06-30 阿里巴巴集团控股有限公司 一种用于机器学习模型的特征生成方法、装置和电子设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130132356A1 (en) * 2010-07-26 2013-05-23 Alibaba Group Holding Limited Method and Apparatus for Sorting Inquiry Results
CN103761426A (zh) * 2014-01-02 2014-04-30 中国科学院数学与系统科学研究院 一种在高维数据中快速识别特征组合的方法及系统
CN106326904A (zh) * 2015-06-16 2017-01-11 富士通株式会社 获取特征排序模型的装置和方法以及特征排序方法
CN106909931A (zh) * 2015-12-23 2017-06-30 阿里巴巴集团控股有限公司 一种用于机器学习模型的特征生成方法、装置和电子设备
CN105589971A (zh) * 2016-01-08 2016-05-18 车智互联(北京)科技有限公司 训练推荐模型的方法、装置及推荐系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109190123A (zh) * 2018-09-14 2019-01-11 北京字节跳动网络技术有限公司 用于输出信息的方法和装置
CN109190123B (zh) * 2018-09-14 2020-03-27 北京字节跳动网络技术有限公司 用于输出信息的方法和装置
CN113254513A (zh) * 2021-07-05 2021-08-13 北京达佳互联信息技术有限公司 排序模型生成方法、排序方法、装置、电子设备

Also Published As

Publication number Publication date
CN108491423B (zh) 2020-09-01

Similar Documents

Publication Publication Date Title
CN111159223B (zh) 一种基于结构化嵌入的交互式代码搜索方法及装置
CN106599278A (zh) 应用搜索意图的识别方法及装置
CN108388425A (zh) 一种基于lstm自动补全代码的方法
CN111444320A (zh) 文本检索方法、装置、计算机设备和存储介质
CN109857868A (zh) 模型生成方法、文本分类方法、装置及计算机可读存储介质
US9996742B2 (en) System and method for global identification in a collection of documents
Liu et al. FastTagRec: fast tag recommendation for software information sites
CN110309511B (zh) 基于共享表示的多任务语言分析系统及方法
CN107220384A (zh) 一种基于相关性的搜索词处理方法、装置及计算设备
US20180232351A1 (en) Joining web data with spreadsheet data using examples
US11797281B2 (en) Multi-language source code search engine
CN112328800A (zh) 自动生成编程规范问题答案的系统及方法
CN109933216B (zh) 一种用于智能输入的词语联想提示方法、装置、设备以及计算机存储介质
CN110362663A (zh) 自适应多感知相似度检测和解析
CN109614103A (zh) 一种基于字符的代码补全方法及系统
Liu et al. Code execution with pre-trained language models
CN108491423A (zh) 一种排序方法及装置
CN117390192A (zh) 文本分类方法、装置、设备和计算机可读存储介质
CN107688609A (zh) 一种职位标签推荐方法和计算设备
CN114841103A (zh) 门级电路的并行仿真方法、系统、存储介质及设备
JP2023147236A (ja) 説明により強化された機械学習パイプライン
CN110427465A (zh) 一种基于词语知识图谱的内容推荐方法及装置
CN112487154B (zh) 一种基于自然语言的智能搜索方法
CN105893363A (zh) 一种获取知识点的相关知识点的方法及系统
Wang et al. Knowledge base question answering system based on knowledge graph representation learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant