WO2015085969A1

WO2015085969A1 - 推荐算法优化方法、装置及系统

Info

Publication number: WO2015085969A1
Application number: PCT/CN2015/072713
Authority: WO
Inventors: 程章敏
Original assignee: 腾讯科技（深圳）有限公司
Priority date: 2013-12-13
Filing date: 2015-02-11
Publication date: 2015-06-18
Also published as: CN104090893A; CN104090893B; US20160379122A1

Abstract

获取统计的各个推荐算法的效果数据；根据每个推荐算法的所述效果数据在各个推荐算法中的比重获取每个推荐算法的流量分流概率；根据所述流量分流概率为每个推荐算法分配流量请求。

Description

推荐算法优化方法、装置及系统

本申请要求于2013年12月13日提交中国专利局、申请号为201310689281.1、发明名称为“推荐算法优化方法、装置及系统”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本发明涉及计算机技术领域，特别涉及一种推荐算法优化方法、装置及系统。

发明背景

推荐系统的推荐引擎中通常会同时运行多个推荐算法，在离线时统计每个推荐算法的效果数据；然后基于离线统计的结果，调整每个推荐算法的流量分配，从而进一步优化整体的推荐效果。

传统的推荐算法优化的流程如下：确定新推荐算法以及对应的少量流量；待推荐引擎准备好后，管理人员在前端为该新推荐算法进行流量分配；观察该新推荐算法的推荐效果，若推荐效果较优，则管理人员继续将流量分配给该新推荐算法；重复上面的流程直到将流量都分配给推荐效果最好的推荐算法。

发明内容

为了解决现有技术中在优化的过程中，需要人工为推荐算法分配流量，优化周期长的问题，本发明实施例提供了一种推荐算法优化方法、装置及系统。所述技术方案如下：

第一方面，提供了一种推荐算法优化方法，所述方法包括：

获取统计的各个推荐算法的效果数据，所述效果数据用于反映每个推荐算法在相同的统计时间窗口所对应的推荐成功率；

根据每个推荐算法的所述效果数据在各个推荐算法中的比重获取每个推荐算法的流量分流概率；

根据所述流量分流概率为每个推荐算法分配流量请求。

第二方面，提供了一种推荐算法优化装置，所述装置包括：

获取模块，用于获取统计的各个推荐算法的效果数据，所述效果数据用于反映每个推荐算法在相同的统计时间窗口所对应的推荐成功率；

计算模块，用于根据所述获取模块获取的每个推荐算法的所述效果数据在各个推荐算法中的比重获取每个推荐算法的流量分流概率；

分配模块，用于根据所述计算模块计算得到的所述流量分流概率为每个推荐算法分配流量请求。

第三方面，提供一种推荐算法优化装置，所述装置至少包括处理器、内存和非易失性存储器；其中，

所述非易失性存储器存储有用于实现推荐算法优化的计算机程序；

所述处理器用于将所述非易失性存储器中的所述计算机程序加载到所述内存中运行，形成计算机可执行指令，所述计算机可执行指令存储在获取模块，计算模块和分配模块中，其中：

获取模块用于获取统计的各个推荐算法的效果数据，所述效果数据用于反映每个推荐算法在相同的统计时间窗口所对应的推荐成功率；

计算模块用于根据所述获取模块获取的每个推荐算法的所述效果数据在各个推荐算法中的比重获取每个推荐算法的流量分流概率；

分配模块用于根据所述计算模块计算得到的所述流量分流概率为每个推荐算法分配流量请求。

第四方面，提供了一种推荐算法优化系统，所述系统包括服务器和至少一个终端；

所述服务器包括如第二方面或第三方面所述的推荐算法优化装置。

本发明实施例提供的技术方案带来的有益效果是：

通过获取统计的各个推荐算法的效果数据；根据每个推荐算法的效果数据计算每个推荐算法的流量分流概率；根据每个推荐算法的流量分流概率为每个推荐算法分配流量请求；解决了现有技术中在优化的过程中，需要人工为推荐算法分配流量，优化周期长的问题；这里推荐算法的效果数据反映了推荐算法的推荐成功率，由于可以根据统计的每个推荐算法的推荐成功率自动为每个推荐算法分配流量，能更好的为推荐成功率较高的推荐算法分配较多的流量，从而达到了可以大大降低优化周期，提高优化效率及准确率的效果。

附图简要说明

图1是本发明一个实施例中提供的推荐算法优化方法所涉及的实施环境的示意图；

图2是本发明一个实施例中提供的推荐算法优化方法的方法流程图；

图3A是本发明另一个实施例中提供的推荐算法优化方法的方法流程图；

图3B是本发明部分实施例中提供的对选取的各个时间段所对应的推荐成功率进行统计的统计示意图；

图4是部分实施例中所涉及的服务器的内部结构关系的示意图；

图5是一个实施例中为流量请求分配推荐算法的过程的流程图；

图6是本发明一个实施例中提供的推荐算法优化装置的结构示意图；

图7是本发明另一个实施例中提供的推荐算法优化装置的结构示意图；

图8是本发明部分实施例中提供的服务器的结构示意图；

图9是本发明一个实施例中提供的推荐算法优化系统的示意图；

图10是本发明另外一个实施例中提供的推荐方法优化装置的结构示意图。

实施本发明的方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明实施方式作进一步地详细描述。文中所讲的“至少一个”是指一个、两个或两个以上。

请参见图1所示，其示出了本发明一个实施例中提供的推荐算法优化方法所涉及的实施环境的示意图。该实施环境可以包括服务器120和至少一个终端140，服务器120可以通过有线网络方式或无线网络方式与终端140连接。

服务器120具有向终端140推荐业务的功能，比如可以根据该终端用户在浏览器中的浏览内容、搜索内容以及用户的操作等信息为该用户推荐相应的业务。该服务器120可以是一台服务器，或者由若干台服务器组成的服务器集群，或者是一个云计算服务中心。该服务器140可以是推荐系统的后台服务器。

终端140可以对服务器120发送的推荐业务进行响应，比如点击浏览该推荐业务。终端140通常可以包括智能手机、平板电脑、智能电视、电子书阅读器、MP3播放器(Moving Picture Experts Group Audio Layer III，动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group Audio Layer IV，动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。

请参见图2所示，其示出了本发明一个实施例中提供的推荐算法优化方法的方法流程图。该推荐算法优化方法主要以应用于图1所示的实施环境中的服务器120中进行举例说明。该推荐算法优化方法可以包括：

201，获取统计的各个推荐算法的效果数据，效果数据用于反映每个推荐算法在相同的统计时间窗口所对应的推荐成功率；

202，根据每个推荐算法的效果数据在各个推荐算法中的比重获取每个推荐算法的流量分流概率；

203，根据流量分流概率为每个推荐算法分配流量请求。

综上所述，本发明实施例提供的推荐算法优化方法，通过获取统计的各个推荐算法的效果数据；根据每个推荐算法的效果数据计算每个推荐算法的流量分流概率；根据流量分流概率为每个推荐算法分配流量请求；解决了现有技术中在优化的过程中，需要人工为推荐算法分配流量，优化周期长的问题；这里推荐算法的效果数据反映了推荐算法的推荐成功率，由于可以根据统计的每个推荐算法的推荐成功率自动为每个推荐算法分配流量，能更好的为推荐成功率较高的推荐算法分配较多的流量，从而达到了可以大大降低优化周期，提高优化效率及准确率的效果。

请参见图3A所示，其示出了本发明一个实施例中提供的推荐算法优化方法的方法流程图。该推荐算法优化方法主要以应用于图1所示的实施环境中的服务器120中进行举例说明。该推荐算法优化方法可以包括：

301，对于每一个推荐算法，获取推荐算法在属于统计时间窗口内的至少两个互相重叠的时间段所对应的推荐成功率，互相重叠的每个时间段具有相同的统计结束时刻和不同的统计开始时刻；

这里所讲的推荐算法可用于为终端提供推荐业务的服务。在实际应用中，提供推荐业务的服务器中通常可以包含有多个推荐算法，当终端向该服务器发送流量请求时，服务器则可以为该流量请求选择一个推荐算法，根据该推荐算法为该流量请求确定出推荐结果，并将推荐结果发送给终端，这样，终端则可以根据推荐结果进行响应，比如可以对推荐结果进行点击浏览等(即对推荐结果进行成功响应)，当然，终端也可以选择忽视该推荐结果，即不对该推荐结果进行任何响应或不进行成功响应。

服务器可以结合推荐算法的推荐成功率为推荐算法分配流量请求。很显然，在获取推荐算法成功率时，需要根据已收集到的终端对推荐算法所推荐的推荐结果进行的响应反馈来确定推荐算法的推荐成功率。

在实际应用的过程中，由于推荐算法的推荐成功率会受到很多因素的影响，很多时候在较短的时间段内并不稳定，比如一个推荐算法在1天前的每天内，推荐的成功率都比较低，但在这1天的推荐成功率突然增加很多(比如节日当天促销，网上售价比较低，此时推荐给终端的推荐成功率会比较高)，这1天的推荐成功率是不能准确代表该推荐算法的推荐成功率的，因此，在具体统计的过程中，通常会选取多个不同的时间段进行推荐算法的优化，每个时间段具有相同的统计结束时刻和不同的统计开始时刻。这里所讲的相同的统计结束时刻为统计时间窗口的结束时刻，该统计结束时刻可以与本次统计时的统计时刻相同，也可以与本次统计时的统计时刻不同，即可以为在本次统计的统计时刻之前的某一个时刻。

举例来讲，在同一个统计时刻对推荐算法所对应的一些时间段进行统计时，可以选择在该统计时刻之前的多个不同时间段进行统计，比如可以统计该推荐算法在统计时刻前的5分钟内的推荐成功率，还可以统计该推荐算法在统计时刻前的1小时内的推荐成功率，这里统计时间窗口的结束时刻与统计时刻相同。比如，统计时刻为2012年9月10日的上午9点，选取的时间段可以为以2012年9月10日的上午9点为结束时刻的5分钟内，以2012年9月10日的上午9点为结束时刻的1小时内，或以2012年9月10日的上午9点为结束时刻的1天内、1周内或1个月内等，并统计每个推荐算法分别在这些时间段内进行推荐的推荐成功率。

请参见图3B所示，其示出了本发明部分实施例中提供的对选取的各个时间段所对应的推荐成功率进行统计的统计示意图，图3B中示出了推荐算法1在选取的各个时间段所对应的推荐成功率，以及推荐算法2在选取的各个时间段所对应的推荐成功率，其中，选取的时间段分别为：统计时刻前的5分钟内(第一时间段)、统计时刻前的15分钟内(第二时间段)、统计时刻前的35分钟内(第三时间段)和统计时刻前的60分钟内(第四时间段)。对于推荐算法1来讲，在第一时间段内统计出的推荐成功率为37％，在第二时间段内统计出的推荐成功率为70％，在第三时间段内统计出的推荐成功率为24％，在第四时间段内统计出的推荐成功率为50％；对于推荐算法2来讲，在第一时间段内统计出的推荐成功率为64％，在第二时间段内统计出的推荐成功率为25％，在第三时间段内统计出的推荐成功率为50％，在第四时间段内统计出的推荐成功率为37％。

再举例来讲，在同一个统计时刻对推荐算法所对应的一些时间段进行统计时，可以选择在某一个指定时刻之前的多个不同时间段进行统计，这里所讲的指定时刻为统计时间窗口的结束时刻，该统计时间窗口的结束时刻为本次统计的统计时刻之前的某一个时刻。比如，统计时刻为2012年9月10日的上午9点，指定时刻可以为2012年9月9日的上午7点，这样选取的时间段可以为以2012年9月9日的上午7点为结束时刻的5分钟内，以2012年9月9日的上午7点为结束时刻的1 小时内，或以2012年9月9日的上午7点为结束时刻的1天内或1周内等，并统计每个推荐算法在这些时间段内进行推荐的推荐成功率。

在一种可能的实现方式中，获取推荐算法在每个时间段内的推荐成功率的具体过程如下：

第一，获取推荐算法在每个时间段中对应的响应动作和推荐结果，响应动作是至少一个终端在时间段内对根据推荐算法确定的推荐结果的成功响应，推荐结果是在时间段内根据推荐算法确定的推荐结果；

在具体应用时，终端会不断地向服务器发送流量请求，服务器在接收到流量请求之后，会为流量请求分配推荐算法，且服务器在为一个流量请求分配推荐算法之后，通常还对该流量请求进行标记，该标记用于表示该流量请求是标记的推荐算法进行推荐处理的，对应的，推荐算法对该流量请求进行处理，为该流量请求确定一个推荐结果，并将推荐结果反馈给发送该流量请求的终端，这样，终端则可以根据推荐结果进行积极的响应操作，比如点击浏览等，很显然，如果终端的用户对推荐结果没有兴趣，通常会选择忽略该推荐结果，比如不对该推荐结果进行响应或直接关闭该推荐结果。这里所讲的响应动作为终端根据推荐结果进行积极地响应操作，或者说终端根据推荐结果进行的成功响应。

由于将推荐结果发送给终端的时间以及终端反馈响应动作的时间均是可以确定的，因此可以获取在确定的时间段中某个推荐算法对应的响应动作和推荐结果。

第二，统计响应动作的数量与推荐结果的数量；

对于一个时间段来讲，服务器可以统计该时间段内每一个推荐算法所对应的响应动作的总数量和推荐结果的总数量。

第三，将响应动作的数量除以推荐结果的数量得到的商值确定为推荐算法在时间段内的推荐成功率。

对于一个时间段来讲，将统计出的某个推荐算法的响应动作的数量除以推荐结果的数量，得到一个商值，则可以将该商值作为该时间段内该推荐算法的推荐成功率。需要说明的是，在实际应用中，由于终端并不完全对推荐结果进行响应，因此该商值通常小于1。

值得注意的是，对于不同的推荐算法，选取的时间段均应当是相同的。举例来讲，对于推荐算法1来讲，选取的时间段为统计时刻前1小时的时间段和统计时刻前7天的时间段，相应的，对于推荐算法2来讲，选取的时间段也应当为统计时刻前1小时的时间段和统计时刻前7天的时间段。

302，将互相重叠的每个时间段所对应的推荐成功率和与时间段对应的权重相乘，得到乘积，将每个乘积相加得到的和值确定为推荐算法统计时间窗口的效果数据；

在通常情况下，由于不同的时间段对推荐成功率的影响可能是不同的，因此在确定推荐算法的总的推荐成功率时，通常需要根据实际情况预先为不同的时间段设置权重。举例来说，统计时刻前的7天内的第一时间段与统计时刻前的前5分钟内的第二时间段通常对推荐成功率的影响不同；通常，第一时间段由于时间跨度较长，在此时间段内的推荐成功率能更好的预估后续该推荐算法的推荐效果，即对推荐算法的影响可能比较大，而第二时间段由于时间跨度比较短，由于会存在网络状况等突发情况，在时间跨度较短的第二时间段确定出的推荐成功率的稳定性比较差；因此在考虑推荐效果时，通常会较少的考虑该时间段的影响。

对于一个推荐算法来讲，由于根据步骤301已经确定出了在多个时间段内该推荐算法的推荐成功率，则可以根据每个时间段所对应的推荐成功率以及权重确定该推荐算法的效果数据，即具体算法为：将该推荐算法的每个时间段内所对应的推荐成功率分别与对应的权重相乘，得到与每个时间段对应的乘积，然后将每个乘积相加得到的和值，将该和值确定为推荐算法的效果数据。举例来讲，若为推荐算法选取的时间段分别为统计时刻前的1个小时、统计时刻前的3个小时、统计时刻前的5个小时、统计时刻前的1天、统计时刻前的7天，统计出来的每个时间段对应的推荐成功率分别为w_1hour、w_3hour、w_5hour、w_1day和w_7day，每个时间段对应的权重分别为Effect_1hour、Effect_3hour、Effect_5hour、Effect_1day和Effect_7day，则最后得到的该推荐算法的效果数据则为：Effect_final＝w_1hour*Effect_1hour+w_3hour*Effect_3hour+w_5hour*Effect_5hour+w_1day*Effect_1day+w_7day*Effect_7day。

仍旧参见图3B，如果为第一时间段、第二时间段、第三时间段和第四时间段设置的权重分别为0.1、0.2、0.3和0.4，则推荐算法1的效果数据为：44.9％＝0.1*37％+0.2*70％+0.3*24％+0.4*50％；类似的，推荐算法2的效果数据为：41.2％＝0.1*64％+0.2*25％+0.3*50％+0.4*37％。

303，将每个推荐算法的效果数据相加，得到和值；

304，对于每一个推荐算法，将推荐算法的效果数据除以和值，得到推荐算法的流量分流概率；

举例来讲，存在三个推荐算法，分别为推荐算法1、推荐算法2和推荐算法3，每个推荐算法的效果数据分别为效果数据1、效果数据2和效果数据3，则推荐算法1的流量分流概率为：效果数据1/(效果数据1+效果数据2+效果数据3)，对应的，推荐算法2的流量分流概率为：效果数据2/(效果数据1+效果数据2+效果数据3)，推荐算法3的流量分流概率为：效果数据3/(效果数据1+效果数据2+效果数据3)。

仍旧参见图3B所示，假如仅存在推荐算法1和推荐算法2，则推荐算法1的流量分流概率为：44.9％/(44.9％+41.2％)＝52.15％，推荐算法2的流量分流概率为：41.2％/(44.9％+41.2％)＝47.85％。

305，在预定时间段内根据流量分流概率为每个推荐算法分配流量请求，预定时间段为本次的统计结束时刻与下一次的统计结束时刻之间的时间段。

在具体应用时，由于服务器可能会接收大量终端发送来的流量请求，因此需要不断地统计出最新的流量分流概率才能更好的提高对流量请求的推荐效果。由于服务器很可能在非常短的时间(比如1秒)中接收到大量的流量请求，如果每接收到一个流量请求，均去统计出一套新的流量分流概率，则会使得推荐时间比较长，对服务器的处理要求比较高，且由于在较短时间内对推荐算法分配接收到的流量请求时的差别也通常不会太大，因此在计算出流量分流概率之后，可以在持续的预定时间段内使用该计算出的流量分流概率为推荐算法分配流量请求，该预定时间段通常为本次的统计结束时刻与下一次的统计结束时刻之间的时间段。该预定时间段的选取可以根据实际确定，比如可以确定为1分钟、5分钟或1小时等。

换句话说，在本次统计完成后，服务器可以根据统计出来的推荐算法的流量分流概率为推荐算法分配流量请求，直到下一次统计完成得到新的推荐算法的流量分流概率，此时则丢弃原有的推荐算法的流量分流概率，使用新的推荐算法的流量分流概率为推荐算法分配流量请求。

在一种可能的实现方式中，请参见图4所示，其示出了部分实施例中所涉及的服务器的内部结构关系的示意图，该服务器120可以包括但不限于：用户接口处理单元42、接入层44、数据库46、统计单元48和存储单元410，其中，用户接口处理单元42可以用于获取终端140发送的各种信息，比如流量请求或响应动作；接入层44可以调用推荐算法so_1，推荐算法so_2和推荐算法so_3对流量请求进行处理，在实际应用中，可能还存在其他的推荐算法，这里仅是进行示意性举例；数据库46用于存放从终端140获取的响应动作的信息；统计单元48可以根据数据库46中的响应动作对每个推荐算法的效果数据进行统计，一般的，统计单元48可以实时对数据库46中的响应动作数据进行统计，比如实时统计每个推荐算法分别在1小时滑动窗口、3小时滑动窗口、5小时滑动窗口、1个自然天的固定窗口或7个自然天的固定窗口的效果数据；存储单元410用于存放统计单元48统计后的每个推荐算法的效果数据。

在具体实现时，用户接口处理单元42接收终端140发送的流量请求，并将该流量请求发送给接入层44，接入层44在接收到流量请求之后，则可以向存储单元410请求查询每个推荐算法的效果数据，存储单元410向接入层44返回每个推荐算法的效果数据，接入层44根据从存储单元410获取的每个推荐算法的效果数据计算出每个推荐算法的流量分流概率，接入层44根据计算得到的每个推荐算法流量分流概率为该流量请求分配推荐算法。接入层44在计算出每个推荐算法的流量分流概率之后，可以在指定时间段内持续使用该计算出的每个推荐算法的流量分流概率为流量请求分配推荐算法，比如可以将该指定时间设置为1分钟，当1分钟结束后，对接入层44中已经存储的每个推荐算法的流量分流概率进行删除，这样当接收到下一个流量请求时，继续执行向存储单元410请求查询每个推荐算法的效果数据的步骤。

一般来讲，该指定时间的设置是为了避免接入层在每接收到一个流量请求后，均要到存储单元410获取每个推荐算法的效果数据，并根据获取的每个推荐算法的效果数据计算出每个推荐算法的流量分流概率的情况，因为在短时间内从存储单元410中多次获取的每个推荐算法的效果数据可能都是相同或相近，对优化推荐算法的分配并无明显的改善，而这种频繁从存储单元410获取效果数据并计算流量分流概率会较多的消耗服务器的计算性能。

很显然，统计单元48可以直接根据统计出的每个推荐算法的效果数据计算出每个推荐算法的流量分流概率，并将每个推荐算法的流量分流概率存储至存储单元410中，此时，接入层44可以直接向存储单元410请求查询每个推荐算法的流量分流概率，存储单元410向接入层44返回每个推荐算法的流量分流概率。统计单元48可以在每接收到终端140发送的一个响应动作时或每隔预定时间间隔所指示的时刻时进行一次统计操作，将每次统计出的每个推荐算法的流量分流概率存储至存储单元410中，对应的，存储单元410可以将最后一次获取的每个推荐算法的流量分流概率替换原来存在的每个推荐算法的流量分流概率，或者存储单元410可以将每次获取的每个推荐算法的流量分流概率均按照统计时间进行保存，但这种情况下，当接入层44向存储单元410请求查询每个推荐算法的流量分流概率时，存储单元410可以向接入层44返回最晚统计时间所对应的每个推荐算法的效果数据。

接入层44还可以通过手动触发的方式查询存储单元410中每个推荐算法的效果数据或流量分流概率。

值得注意的是，由于服务器120可以是一台独立的服务器，也可以是多个服务器的组合，因此当服务器120为一台独立的服务器时，这里的接入层44、数据库46、统计单元48和存储单元410则为该台服务器中的组成结构，当服务器120为多个服务器的组合时，这里的接入层44、数据库46、统计单元48和存储单元410可以分别位于不同的服务器中。

在另一种可能的实现方式中，请参见图5所示，其示出了一个实施例中为流量请求分配推荐算法的过程的流程图，实现为流量请求分配推荐算法的过程的设备可以位于图4中所示服务器的接入层44中，为该流量请求分配推荐算法的过程可以包括：

501、接收至少一个终端发送的流量请求；

比如，首先可以通过用户接口处理单元42接收至少一个终端发送的流量请求，用户接口处理单元42将接收到的流量请求发送给接入层44，这样接入层44也会同步接收到至少一个终端发送的流量请求。

502、遍历缓存中所有推荐算法的效果数据；

接入层44可以遍历本地缓存中所有推荐算法的效果数据。

503、若检测到缓存中没有推荐算法的效果数据或检测到缓存中推荐算法的效果数据过期，则触发后端查询推荐算法的效果数据；

若接入层44检测到本地缓存中没有推荐算法的效果数据或检测到本地缓存中推荐算法的效果数据过期时，则可以触发后端的存储单元410查询推荐算法的效果数据。

504、若检测到缓存中推荐算法的效果数据未过期，则在缓存中查询推荐算法的效果数据；

若接入层44检测到缓存中推荐算法的效果数据未过期，则可以在本地缓存中查询推荐算法的效果数据。

505、若某一个推荐算法的效果数据查询失败，则排除该推荐算法，得到剩余有效的推荐算法；

506、根据有效的推荐算法的效果数据，计算每个有效的推荐算法的流量分流概率；

507、根据计算出的每个有效的推荐算法的流量分流概率为该流量请求随机分配推荐算法。

由上可知，由于推荐算法的效果数据反映了推荐算法的推荐成功率，且这里由于可以根据统计的每个推荐算法的推荐成功率自动为每个推荐算法分配流量，能更好的为推荐成功率较高的推荐算法分配较多的流量，从而达到了可以大大降低优化周期，自动实现分流优化，提高优化效率及准确率的效果；同时，由于接入层中的本地缓存中可以缓存有推荐算法的效果数据或流量分流概率，因此该推荐算法优化方法能避免某些推荐算法在特定情况下，推荐效果急剧下降，可以自动将流量分配给效果较好的推荐算法。

在其他可能的实现方式中，推荐算法在某个时间段内的效果数据还可以为该时间段内响应动作的总数量，对于一个推荐算法，可以将每个时间段所对应的效果数据乘以为该时间段设定的权重，得到乘积，将每个时间段所对应的乘积相加，得到的和值为推荐算法的总效果数据。根据每个推荐算法的总效果数据确定每个推荐算法所占的权重或者每个推荐算法的流量分流概率。

举例来讲，存在的推荐算法分别为推荐算法1、推荐算法2和推荐算法3，确定统计的时间段分别为时间段1、时间段2和时间段3，为每个时间段分配的权重分别为w1、w2和w3；

对于推荐算法1来讲，统计的时间段1内的与推荐算法1对应的响应动作的总数量为N11，统计的时间段2内的与推荐算法1对应的响应动作的总数量为N12，统计的时间段3内的与推荐算法1对应的响应动作的总数量为N13，据此得到的推荐算法1的总效果数据为：F1＝w1*N11+w2*N12+w3*N13；

对于推荐算法2来讲，统计的时间段1内的与推荐算法2对应的响应动作的总数量为N21，统计的时间段2内的与推荐算法2对应的响应动作的总数量为N22，统计的时间段3内的与推荐算法2对应的响应动作的总数量为N23，据此得到的推荐算法2的总效果数据为：F2＝w1*N21+w2*N22+w3*N23；

对于推荐算法3来讲，统计的时间段1内的与推荐算法3对应的响应动作的总数量为N31，统计的时间段2内的与推荐算法3对应的响应动作的总数量为N32，统计的时间段3内的与推荐算法3对应的响应动作的总数量为N33，据此得到的推荐算法3的总效果数据为：F3＝w1*N31+w2*N32+w3*N33；

这样推荐算法1最后所占的权重或者说流量分流概率为：F1/(F1+F2+F3)，推荐算法2最后所占的权重或者说流量分流概率为：F2/(F1+F2+F3)，推荐算法3最后所占的权重或者说流量分流概率为：F3/(F1+F2+F3)。

以下为本发明的装置实施例，对于其中未详尽描述的细节，可以参考上述对应的方法实施例。

请参见图6所示，其示出了本发明一个实施例中提供的推荐算法优化装置的结构示意图。该推荐算法优化装置主要以应用于图1所示的实施环境中的服务器120中进行举例说明。该推荐算法优化装置可以包括：获取模块602、计算模块604和分配模块606。

获取模块602，可以用于获取统计的各个推荐算法的效果数据，效果数据用于反映每个推荐算法在相同的统计时间窗口所对应的推荐成功率；

计算模块604，可以用于根据获取模块602获取的每个推荐算法的效果数据在各个推荐算法中的比重获取每个推荐算法的流量分流概率；

分配模块606，可以用于根据计算模块604计算得到的流量分流概率为每个推荐算法分配流量请求。

综上所述，本发明实施例提供的推荐算法优化装置，通过获取统计的各个推荐算法的效果数据；根据每个推荐算法的效果数据计算每个推荐算法的流量分流概率；根据流量分流概率为每个推荐算法分配流量请求；解决了现有技术中在优化的过程中，需要人工为推荐算法分配流量，优化周期长的问题；这里推荐算法的效果数据反映了推荐算法的推荐成功率，由于可以根据统计的每个推荐算法的推荐成功率自动为每个推荐算法分配流量，能更好的为推荐成功率较高的推荐算法分配较多的流量，从而达到了可以大大降低优化周期，提高优化效率及准确率的效果。

请参见图7所示，其示出了本发明一个实施例中提供的推荐算法优化装置的结构示意图。该推荐算法优化装置主要以应用于图1所示的实施环境中的服务器120中进行举例说明。该推荐算法优化装置可以包括：获取模块702、计算模块704和分配模块706。

获取模块702，可以用于获取统计的各个推荐算法的效果数据，效果数据用于反映每个推荐算法在相同的统计时间窗口所对应的推荐成功率；

计算模块704，可以用于根据获取模块702获取的每个推荐算法的效果数据在各个推荐算法中的比重获取每个推荐算法的流量分流概率；

分配模块706，可以用于根据计算模块704计算得到的流量分流概率为每个推荐算法分配流量请求。

在本实施例中的第一种可能的实现方式中，获取模块702可以包括：获取子模块702a和确定子模块702b。

获取子模块702a，可以用于对于每一个推荐算法，获取推荐算法在属于统计时间窗口内的至少两个互相重叠的时间段所对应的推荐成功率，互相重叠的每个时间段具有相同的统计结束时刻和不同的统计开始时刻；

确定子模块702b，可以用于将互相重叠的每个时间段所对应的推荐成功率和与时间段对应的权重相乘，得到乘积，将每个乘积相加得到的和值确定为推荐算法在统计时间窗口的效果数据。

在本实施例中的第二种可能的实现方式中，获取子模块702a可以包括：获取子单元702a1、统计子单元702a2和确定子单元702a3。

获取子单元702a1，可以用于获取推荐算法在每个时间段中对应的响应动作和推荐结果，响应动作是至少一个终端在时间段内对根据推荐算法确定的推荐结果的成功响应，推荐结果是在时间段内根据推荐算法确定的推荐结果；

统计子单元702a2，可以用于统计响应动作的数量与推荐结果的数量；

确定子单元702a3，可以用于将统计子单元702a2统计出的响应动作的数量除以统计子单元702a2统计出的推荐结果的数量得到的商值确定为推荐算法在时间段内的推荐成功率。

在本实施例中的第三种可能的实现方式中，计算模块704可以包括：和值获取子模块704a和概率获取子模块704b。

和值获取子模块704a，可以用于将每个推荐算法的效果数据相加，得到和值；

概率获取子模块704b，可以用于对于每一个推荐算法，将推荐算法的效果数据除以和值，得到推荐算法的流量分流概率。

在本实施例中的第四种可能的实现方式中，分配模块706还可以用于：

在预定时间段内根据流量分流概率为每个推荐算法分配流量请求，预定时间段为本次的统计结束时刻与下一次的统计结束时刻之间的时间段。

需要说明的是：上述实施例中提供的推荐算法优化装置在对推荐算法进行优化时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将服务器的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的推荐算法优化装置与推荐算法优化方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

请参见图8所示，其示出了本发明部分实施例中提供的服务器的结构方框图。该服务器800用于实施上述实施例提供的推荐算法优化方法。该服务器800包括中央处理单元(CPU)801、包括随机存取存储器(RAM)802和只读存储器(ROM)803的系统存储器804，以及连接系统存储器804和中央处理单元801的系统总线805。该服务器800还包括帮助计算机内的各个器件之间传输信息的基本输入/输出系统(I/O系统)806，和用于存储操作系统813、应用程序814和其他程序模块815的大容量存储设备807。

该基本输入/输出系统806包括有用于显示信息的显示器808和用于用户输入信息的诸如鼠标、键盘之类的输入设备809。其中该显示器808和输入设备809都通过连接到系统总线805的输入/输出控制器810连接到中央处理单元801。该基本输入/输出系统806还可以包括输入输出控制器810以用于接收和处理来自键盘、鼠标、或电子触控笔等多个其他设备的输入。类似地，输入输出控制器810还提供输出到显示屏、打印机或其他类型的输出设备。

该大容量存储设备807通过连接到系统总线805的大容量存储控制器(未示出)连接到中央处理单元801。该大容量存储设备807及其相关联的计算机可读介质为服务器800提供非易失性存储。也就是说，该大容量存储设备807可以包括诸如硬盘或者CD-ROM驱动器之类的计算机可读介质(未示出)。

不失一般性，该计算机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括RAM、ROM、EPROM、EEPROM、闪存或其他固态存储器技术，CD-ROM、DVD或其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备。当然，本领域技术人员可知该计算机存储介质不局限于上述几种。上述的系统存储器804和大容量存储设备807可以统称为存储器。

根据本发明公开的各种实施例，该服务器800还可以通过诸如因特网等网络连接到网络上的远程计算机运行。也即服务器800可以通过连接在该系统总线805上的网络接口单元811连接到网络812，或者说，也可以使用网络接口单元811来连接到其他类型的网络或远程计算机系统(未示出)。

该存储器还包括一个或者一个以上的程序，该一个或者一个以上程序存储于存储器中，且经配置以由一个或者一个以上中央处理单元801执行。上述一个或者多个中央处理单元801具有如下功能：

获取统计的各个推荐算法的效果数据，效果数据用于反映每个推荐算法在相同的统计时间窗口所对应的推荐成功率；

根据每个推荐算法的效果数据在各个推荐算法中的比重获取每个推荐算法的流量分流概率；

根据流量分流概率为每个推荐算法分配流量请求。

在本实施例中的第一种可能的实现方式中，获取统计的各个推荐算法的效果数据，包括：

对于每一个推荐算法，获取推荐算法在属于统计时间窗口内的至少两个互相重叠的时间段所对应的推荐成功率，互相重叠的每个时间段具有相同的统计结束时刻和不同的统计开始时刻；

将互相重叠的每个时间段所对应的推荐成功率和与时间段对应的权重相乘，得到乘积，将每个乘积相加得到的和值确定为推荐算法在统计时间窗口的效果数据。

在本实施例中的第二种可能的实现方式中，获取推荐算法在属于统计时间窗口内的至少两个互相重叠的时间段所对应的推荐成功率，包括：

获取推荐算法在每个时间段中对应的响应动作和推荐结果，响应动作是至少一个终端在时间段内对根据推荐算法确定的推荐结果的成功响应，推荐结果是在时间段内根据推荐算法确定的推荐结果；

统计响应动作的数量与推荐结果的数量；

将响应动作的数量除以推荐结果的数量得到的商值确定为推荐算法在时间段内的推荐成功率。

在本实施例中的第三种可能的实现方式中，根据每个推荐算法的效果数据在各个推荐算法中的比重获取每个推荐算法的流量分流概率，包括：

将每个推荐算法的效果数据相加，得到和值；

对于每一个推荐算法，将推荐算法的效果数据除以和值，得到推荐算法的流量分流概率。

在本实施例中的第四种可能的实现方式中，根据流量分流概率为每个推荐算法分配流量请求，包括：

请参见图9所示，其示出了本发明一个实施例中提供的推荐算法优化系统的示意图，该推荐算法优化系统主要以应用于图1所示的实施环境中进行举例说明。该推荐算法优化系统可以包括服务器902和至少一个终端904，服务器902通过有线网络方式或无线网络方式与终端904连接，终端904可以向服务器902发送流量请求，服务器902可以为终端904反馈推荐结果，对应的，终端904可以选择对该推荐结果进行响应。

服务器902可以包括图6或图7中所描述的推荐算法优化装置，或服务器902可以为图8中所描述的服务器。

综上所述，本发明实施例提供的推荐算法优化系统，通过在服务器获取统计的各个推荐算法的效果数据；根据每个推荐算法的效果数据计算每个推荐算法的流量分流概率；根据流量分流概率为每个推荐算法分配流量请求；解决了现有技术中在优化的过程中，需要人工为推荐算法分配流量，优化周期长的问题；这里推荐算法的效果数据反映了推荐算法的推荐成功率，由于可以根据统计的每个推荐算法的推荐成功率自动为每个推荐算法分配流量，能更好的为推荐成功率较高的推荐算法分配较多的流量，从而达到了可以大大降低优化周期，提高优化效率及准确率的效果。

图10为根据本发明实施方式的另外一种推荐方法优化装置的结构示意图。如图10所示，该视频播放装置可包括一中央处理器(CPU)100、一内存101、以及一非易失性存储器102。

其中，非易失性存储器102存储有用于实现推荐算法优化的计算机程序。

CPU100可以从非易失性存储器102中将所述计算机程序加载到内存101中运行，形成计算机可执行指令。其中所述计算机可执行指令存储在获取模块1011，计算模块1012和分配模块1013中。其中：

获取模块1011，可以用于获取统计的各个推荐算法的效果数据，效果数据用于反映每个推荐算法在相同的统计时间窗口所对应的推荐成功率；

计算模块1012，可以用于根据获取模块1011获取的每个推荐算法的效果数据在各个推荐算法中的比重获取每个推荐算法的流量分流概率；

分配模块1013，可以用于根据计算模块1012计算得到的流量分流概率为每个推荐算法分配流量请求。

在一个实施方式中，获取模块1011，计算模块1012和分配模块1013的功能可分别与图7所示的推荐算法优化装置中的获取模块702，计算模块704，以及分配模块706的功能相同，在此不再赘述。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

一种推荐算法优化方法，其特征在于，所述方法包括：

获取统计的各个推荐算法的效果数据，所述效果数据用于反映每个推荐算法在相同的统计时间窗口所对应的推荐成功率；

根据每个推荐算法的所述效果数据在各个推荐算法中的比重获取每个推荐算法的流量分流概率；

根据所述流量分流概率为每个推荐算法分配流量请求。
根据权利要求1所述的方法，其特征在于，所述获取统计的各个推荐算法的效果数据，包括：

对于每一个推荐算法，获取所述推荐算法在属于所述统计时间窗口内的至少两个互相重叠的时间段所对应的推荐成功率，互相重叠的每个时间段具有相同的统计结束时刻和不同的统计开始时刻；

将互相重叠的每个时间段所对应的推荐成功率和与所述时间段对应的权重相乘，得到乘积，将每个乘积相加得到的和值确定为所述推荐算法在所述统计时间窗口的效果数据。
根据权利要求2所述的方法，其特征在于，所述获取所述推荐算法在属于所述统计时间窗口内的至少两个互相重叠的时间段所对应的推荐成功率，包括：

获取所述推荐算法在每个时间段中对应的响应动作和推荐结果，所述响应动作是至少一个终端在所述时间段内对根据所述推荐算法确定的推荐结果的成功响应，所述推荐结果是在所述时间段内根据所述推荐算法确定的推荐结果；

统计所述响应动作的数量与所述推荐结果的数量；

将所述响应动作的数量除以所述推荐结果的数量得到的商值确定为所述推荐算法在所述时间段内的推荐成功率。
根据权利要求2或3所述的方法，其特征在于，所述根据每个推荐算法的所述效果数据在各个推荐算法中的比重获取每个推荐算法的流量分流概率，包括：

将每个推荐算法的所述效果数据相加，得到和值；

对于每一个推荐算法，将所述推荐算法的效果数据除以所述和值，得到所述推荐算法的流量分流概率。
根据权利要求4所述的方法，其特征在于，所述根据所述流量分流概率为每个推荐算法分配流量请求，包括：

在预定时间段内根据所述流量分流概率为每个推荐算法分配流量请求，所述预定时间段为本次的所述统计结束时刻与下一次的统计结束时刻之间的时间段。
一种推荐算法优化装置，其特征在于，所述装置包括：

获取模块，用于获取统计的各个推荐算法的效果数据，所述效果数据用于反映每个推荐算法在相同的统计时间窗口所对应的推荐成功率；

计算模块，用于根据所述获取模块获取的每个推荐算法的所述效果数据在各个推荐算法中的比重获取每个推荐算法的流量分流概率；

分配模块，用于根据所述计算模块计算得到的所述流量分流概率为每个推荐算法分配流量请求。
根据权利要求6所述的装置，其特征在于，所述获取模块包括：

获取子模块，用于对于每一个推荐算法，获取所述推荐算法在属于所述统计时间窗口内的至少两个互相重叠的时间段所对应的推荐成功率，互相重叠的每个时间段具有相同的统计结束时刻和不同的统计开始时刻；

确定子模块，用于将互相重叠的每个时间段所对应的推荐成功率和与所述时间段对应的权重相乘，得到乘积，将每个乘积相加得到的和值确定为所述推荐算法在所述统计时间窗口的效果数据。
根据权利要求7所述的装置，其特征在于，所述获取子模块包括：

获取子单元，用于获取所述推荐算法在每个时间段中对应的响应动作和推荐结果，所述响应动作是至少一个终端在所述时间段内对根据所述推荐算法确定的推荐结果的成功响应，所述推荐结果是在所述时间段内根据所述推荐算法确定的推荐结果；

统计子单元，用于统计所述响应动作的数量与所述推荐结果的数量；

确定子单元，用于将所述统计子单元统计出的所述响应动作的数量除以所述统计子单元统计出的所述推荐结果的数量得到的商值确定为所述推荐算法在所述时间段内的推荐成功率。
根据权利要求7或8所述的装置，其特征在于，所述计算模块包括：

和值获取子模块，用于将每个推荐算法的所述效果数据相加，得到和值；

概率获取子模块，对于每一个推荐算法，将所述推荐算法的效果数据除以所述和值，得到所述推荐算法的流量分流概率。
根据权利要求9所述的装置，其特征在于，所述分配模块，还用于：

在预定时间段内根据所述流量分流概率为每个推荐算法分配流量请求，所述预定时间段为本次的所述统计结束时刻与下一次的统计结束时刻之间的时间段。
一种推荐算法优化装置，其特征在于，该装置至少包括：处理器、内存和非易失性存储器；其中，

所述非易失性存储器存储有用于实现推荐算法优化的计算机程序；

所述处理器用于将所述非易失性存储器中的所述计算机程序加载到所述内存中运行，形成计算机可执行指令，所述计算机可执行指令存储在获取模块，计算模块和分配模块中，其中：

获取模块用于获取统计的各个推荐算法的效果数据，所述效果数据用于反映每个推荐算法在相同的统计时间窗口所对应的推荐成功率；

计算模块用于根据所述获取模块获取的每个推荐算法的所述效果数据在各个推荐算法中的比重获取每个推荐算法的流量分流概率；

分配模块用于根据所述计算模块计算得到的所述流量分流概率为每个推荐算法分配流量请求。
根据权利要求11所述的装置，其特征在于，所述获取模块包括：

获取子模块，用于对于每一个推荐算法，获取所述推荐算法在属于所述统计时间窗口内的至少两个互相重叠的时间段所对应的推荐成功率，互相重叠的每个时间段具有相同的统计结束时刻和不同的统计开始时刻；

确定子模块，用于将互相重叠的每个时间段所对应的推荐成功率和与所述时间段对应的权重相乘，得到乘积，将每个乘积相加得到的和值确定为所述推荐算法在所述统计时间窗口的效果数据。
根据权利要求12所述的装置，其特征在于，所述获取子模块包括：

获取子单元，用于获取所述推荐算法在每个时间段中对应的响应动作和推荐结果，所述响应动作是至少一个终端在所述时间段内对根据所述推荐算法确定的推荐结果的成功响应，所述推荐结果是在所述时间段内根据所述推荐算法确定的推荐结果；

统计子单元，用于统计所述响应动作的数量与所述推荐结果的数量；

确定子单元，用于将所述统计子单元统计出的所述响应动作的数量除以所述统计子单元统计出的所述推荐结果的数量得到的商值确定为所述推荐算法在所述时间段内的推荐成功率。
根据权利要求12或13所述的装置，其特征在于，所述计算模块包括：

和值获取子模块，用于将每个推荐算法的所述效果数据相加，得到和值；

概率获取子模块，对于每一个推荐算法，将所述推荐算法的效果数据除以所述和值，得到所述推荐算法的流量分流概率。
根据权利要求14所述的装置，其特征在于，所述分配模块还用于：

在预定时间段内根据所述流量分流概率为每个推荐算法分配流量请求，所述预定时间段为本次的所述统计结束时刻与下一次的统计结束时刻之间的时间段。
一种推荐算法优化系统，其特征在于，所述系统包括服务器和至少一个终端；

所述服务器包括如权利要求6至15中任一所述的推荐算法优化装置。