CN102662941A - 基于random walk的排序方法 - Google Patents

基于random walk的排序方法 Download PDF

Info

Publication number
CN102662941A
CN102662941A CN2011104583617A CN201110458361A CN102662941A CN 102662941 A CN102662941 A CN 102662941A CN 2011104583617 A CN2011104583617 A CN 2011104583617A CN 201110458361 A CN201110458361 A CN 201110458361A CN 102662941 A CN102662941 A CN 102662941A
Authority
CN
China
Prior art keywords
node
random
random walk
digraph
win
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2011104583617A
Other languages
English (en)
Inventor
李琳
钟珞
袁景凌
夏红霞
刘东飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University of Technology WUT
Original Assignee
Wuhan University of Technology WUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University of Technology WUT filed Critical Wuhan University of Technology WUT
Priority to CN2011104583617A priority Critical patent/CN102662941A/zh
Publication of CN102662941A publication Critical patent/CN102662941A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于random walk的排序方法,包括如下步骤:(1)构建赢/输有向图,图的节点为待排序的对象,以竞争规则决定图中两节点之间边的方向;(2)在图上的游走均匀随机的选择下一跳节点实现random walk;(3)计算每个节点的重要性程度,进而得到最终的排序结果。本发明最终的排序结果不但得出了待排序对象之间竞争的输赢次数,还考虑了待排序对象自身的重要程度,能有效地针对不同的应用背景设计相应的算法,为算法的选择做出了理论指导,同时为实验中算法的验证和参数的调整提供了便利。

Description

基于random walk的排序方法
技术领域
本发明涉及排序融合算法,具体为一种基于random walk的排序方法,属于数据挖掘技术领域。
背景技术
排序融合技术是在一系列候选结果中融合不同的排列组合以获得一个较优的排序结果,而这些不同的排列是根据不同的条件或指标生成的序列。排序融合技术在很多学科都有研究,如学习理论中协作过滤和元搜索、社会学的选举机制等。常见的算法也很多,比如Borda计数法、最高排序法和逻辑回归法等。因此需要根据具体的应用背景和目标,选择相应的算法并且调整相应的排序函数中各个条件或指标的影响因子。
目前的排序融合算法通常根据各自的融合准则,或者称竞争规则,将不同的排列进行组合从而得到最终的排序。对于在不同的应用中选择何种排序融合算法的问题,一般都通过实现多种算法然后根据实验结果的验证选取效果最佳的算法。另外,当算法选定后,多种条件的影响因子也有待调整。所以如何能有效地实现算法的选取和影响因子的调整,是提高排序算法应用效率的一个难点问题。
为解决该问题,我们提出一种基于random walk的排序融合算法通用框架,通过理论指导和实验验证双方面的作用下,设计并实现适合不同应用的排序融合算法。
发明内容
本发明目的在于克服上述现有技术的不足而提供一种基于random walk(随机游走)的排序方法,包括以下步骤:
(1)将待排序对象作为图的节点,并在竞争规则下判断两节点,该两节点的链接方向为输的节点指向赢的节点,从而构建节点的赢/输有向图;
(2)赢/输有向图上的节点随机选择下一跳到另一点节点,完成random walk,其中随机选择下一条包括以下两种随机游走方式:一是从当前所在的节点的outlinks中均匀随机选择一个节点;二是从赢/输有向图中所有其它的节点中均匀随机选择一个;
(3)计算每个节点的重要性程度,根据重要性程度得到最终的节点排序结果。
上述技术方案中,步骤(1)中竞争规则为任一排序融合算法中采用的规则。
上述技术方案中,步骤(2)中随机选择下一跳时优先选择向重要性更高的节点移动。
上述技术方案中,步骤(2)中赢的一方是输的一方的outlink,outlinks是outlink的集合。
上述技术方案中,步骤(3)中每个节点的重要性程度即通过以下公式计算每个节点稳定不变的概率值,再根据此概率值对赢/输有向图中所有的节点排序,形成结果序列,
r ( t ) ( q ) = 1 - α | J q | + α Σ p ∈ I ( q ) r ( t - 1 ) ( p ) w ( p , q )
上述公式中,I(q)是所有指向节点q的节点的集合,w(p,q)是节点p指向节点q所在边的权重,J(q)是不包括节点q的赢/输有向图中所有其它节点的集合,α为步骤(2)所描述的两种随机游走方式的混合参数,取值范围为0<α<1。
与现有技术相比,本发明能将竞争规则不同的多种排序融合算法在统一的框架中完成设计和实现,包括权重的设置、混合参数的选取等。并且最终的排序结果不但计算了待排序对象之间竞争的输赢次数,还考虑了待排序对象自身的重要程度或者说区别对待了待排序的对象。本发明能有效地针对不同的应用背景设计相应的算法,为算法的选择做出了理论指导,同时为实验中算法的验证和参数的调整提供了便利。
通过以下的描述并结合附图,本发明将变得更加清晰,这些附图用于解释本发明的实施例。
附图说明
图1是基于random walk的排序方法的流程图。
图2是赢/输有向图的详细组成。
具体实施方式
现在参考附图描述本发明的实施例,对本发明作进一步的说明。
由上述技术方案可知,本实施例基于random walk的排序融合算法通用框架能将竞争规则不同的多种排序融合算法在统一的框架中完成设计和实现,包括权重的设置、混合参数的选取等。并且最终的排序结果不但计算了待排序对象之间竞争的输赢次数,还考虑了待排序对象自身的重要程度或者说区别对待了待排序的对象。排序融合算法通用框架的提出能有效地针对不同的应用背景设计相应的算法,为算法的选择做出了理论指导,同时为实验中算法的验证和参数的调整提供了便利。
如图1所示,图1中a、b、c、d、e五个节点代表待排序的对象。边的方向代表所链接的两个节点之间的竞争结果。如:节点a在竞争中赢了节点b,则边的方向为从节点b指向节点a。一个节点的入度代表该节点在与其它节点的竞争中赢的次数,而它的出度则为竞争中输的次数。再以图2中的节点a为例,它的出度为2说明它输了两次,分别输给e和c;它的入度为1说明它赢了一次,赢的对象是b。节点的入度是决定该节点的重要性的关键指标,入度越大越重要。
下面以图1中的五个节点说明本发明方法的步骤。方法步骤如图2所示,
步骤S1:由于需要对若干个排序的序列进行融合得到最终较优的结果序列,把这些序列中的对象作为待排序的对象,也就是图2中的节点。当某一竞争规则确定之后,对待排序的对象之间做两两竞争比赛,输的一方作为赢的一方的inlink或者说边的方向为从竞争输了的节点指向竞争赢了的节点。换句话说,赢的一方是输的一方的outlink,被竞争输了的节点所指。当所有待排序对象两两之间的竞争比赛全部结束了,构成了赢/输有向图。
步骤S2:在赢/输有向图上模拟random walk,假设一个行走者在图上移动有两种方式选择下一步移动的目的节点。一是从当前所在的节点的outlinks(outlinks的集合)中均匀随机选择一个节点。二是从图中所有其它的节点中均匀随机选择一个。Outlinks所链接的节点是在竞争中赢了的当前节点,比当前节点重要度要高。行走者每次优先选择向重要性更高的节点移动,也可以考虑不在outlinks内的其它节点。图2中行走者目前位于节点e,他优先选择节点d作为目标,也可以从a、b、c中均匀随机选择一个。
步骤S3:设定步骤S2中两种随机移动方法的选择参数,也就是各自的选择概率。通过选择参数混合这两种方式,这样赢/输有向图中每个节点经过反复迭代计算后,得到一个稳定的概率值。通过以下公式计算每个节点稳定不变的概率值
r ( t ) ( q ) = 1 - α | J q | + α Σ p ∈ I ( q ) r ( t - 1 ) ( p ) w ( p , q )
上述公式中,I(q)是所有指向节点q的节点的集合,w(p,q)是节点p指向节点q所在边的权重,J(q)是不包括节点q的赢/输有向图中所有其它节点的集合,α为步骤(2)所描述的两种随机游走方式的混合参数,取值范围为0<α<1。
该概率值表示行走者移动到该节点的概率,节点越重要,概率越大,在最终序列中排序越靠前。这样按概率值排序得到最终较优的结果序列。

Claims (5)

1.一种基于random walk的排序方法,其特征在于包括以下步骤:
(1)将待排序对象作为图的节点,并在竞争规则下判断两节点的赢输,该两节点的链接方向为输的节点指向赢的节点,从而构建节点的赢/输有向图;
(2)赢/输有向图上的节点随机选择下一跳到另一点节点,完成random walk,其中随机选择下一条包括以下两种随机游走方式:一是从当前所在的节点的outlinks中均匀随机选择一个节点;二是从赢/输有向图中所有其它的节点中均匀随机选择一个;
(3)计算每个节点的重要性程度,根据重要性程度得到最终的节点排序结果。
2.根据权利要求1所述基于random walk的排序方法,其特征在于:步骤(1)中所述竞争规则为任一排序融合算法中采用的规则。
3.根据权利要求1所述基于random walk的排序方法,其特征在于:步骤(2)中随机选择下一跳时优先选择向重要性更高的节点移动。
4.根据权利要求1所述基于random walk的排序方法,其特征在于:步骤(2)中赢的一方是输的一方的outlink,outlinks是outlink的集合。
5.根据权利要求1所述基于random walk的排序方法,其特征在于:步骤(3)中每个节点的重要性程度即通过以下公式计算每个节点稳定不变的概率值,再根据此概率值对赢/输有向图中所有的节点排序,形成结果序列,
r ( t ) ( q ) = 1 - α | J q | + α Σ p ∈ I ( q ) r ( t - 1 ) ( p ) w ( p , q )
上述公式中,I(q)是所有指向节点q的节点的集合,w(p,q)是节点p指向节点q所在边的权重,J(q)是不包括节点q的赢/输有向图中所有其它节点的集合,α为步骤(2)所描述的两种随机游走方式的混合参数,取值范围为0<α<1。
CN2011104583617A 2011-12-31 2011-12-31 基于random walk的排序方法 Pending CN102662941A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2011104583617A CN102662941A (zh) 2011-12-31 2011-12-31 基于random walk的排序方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2011104583617A CN102662941A (zh) 2011-12-31 2011-12-31 基于random walk的排序方法

Publications (1)

Publication Number Publication Date
CN102662941A true CN102662941A (zh) 2012-09-12

Family

ID=46772434

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011104583617A Pending CN102662941A (zh) 2011-12-31 2011-12-31 基于random walk的排序方法

Country Status (1)

Country Link
CN (1) CN102662941A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104156905A (zh) * 2014-08-15 2014-11-19 西安交通大学 一种基于纳税人利益关联网络的重点监控企业评估方法
CN105808739A (zh) * 2016-03-10 2016-07-27 哈尔滨工程大学 基于Borda算法的搜索结果排序方法
CN109873732A (zh) * 2017-12-05 2019-06-11 北京京东尚科信息技术有限公司 用于代理服务器的测试方法和装置
CN113744037A (zh) * 2021-08-16 2021-12-03 同盾科技有限公司 知识联邦中参与方通信方法、装置、电子设备及存储介质

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104156905A (zh) * 2014-08-15 2014-11-19 西安交通大学 一种基于纳税人利益关联网络的重点监控企业评估方法
CN105808739A (zh) * 2016-03-10 2016-07-27 哈尔滨工程大学 基于Borda算法的搜索结果排序方法
CN109873732A (zh) * 2017-12-05 2019-06-11 北京京东尚科信息技术有限公司 用于代理服务器的测试方法和装置
CN113744037A (zh) * 2021-08-16 2021-12-03 同盾科技有限公司 知识联邦中参与方通信方法、装置、电子设备及存储介质
CN113744037B (zh) * 2021-08-16 2023-09-29 同盾科技有限公司 知识联邦中参与方通信方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
Desmedt et al. Equilibria of plurality voting with abstentions
CN106650074A (zh) 一种基于遗传蚁群融合算法的数字微流控芯片灾难性故障测试方法
CN104978420B (zh) 行车路线匹配方法和装置
Li et al. Pedestrian evacuation behavior analysis and simulation in multi-exits case
CN102662941A (zh) 基于random walk的排序方法
CN102594909B (zh) 基于共邻矩阵谱信息的多目标社区检测方法
CN103810104A (zh) 一种软件测试用例优化方法及系统
CN104868465B (zh) 基于模糊机会约束的电力系统网架重构优化方法
Ding et al. A new hierarchical ranking aggregation method
CN104808661A (zh) 一种旅游路径规划方法
CN110097190A (zh) 一种基于双时间限制的群智感知任务分配方法
CN106682448A (zh) 基于多目标遗传规划算法的序贯测试优化方法
CN106202753A (zh) 基于bp神经网络与遗传算法实现盾构砂浆性能优化方法
CN105825075B (zh) 基于nga-ts算法的蛋白质结构预测方法
CN114021914B (zh) 一种无人机集群飞防调度方法及装置
Pourghanbar et al. EVEBO: A new election inspired optimization algorithm
CN105205347B (zh) 基于bsa-ts算法的蛋白质三维结构预测方法
Li et al. Pedestrian choice behavior analysis and simulation of ticket gate machine in rail transit station
CN110827563B (zh) 一种基于最可靠路径的停车诱导系统及方法
Kouwayè et al. Lasso based feature selection for malaria risk exposure prediction
Lou et al. A Binary-Differential Evolution algorithm based on Ordering of individuals
Krupa et al. Relaxation under outflow dynamics with random sequential updating
Shimomura et al. Ant colony optimization using genetic information for TSP
Karim et al. Coevolutionary genetic algorithm for variable ordering in CSPs
Karim A new approach to constraint weight learning for variable ordering in CSPs

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20120912