CN104965836A - 一种互联网的数据处理方法和装置 - Google Patents
一种互联网的数据处理方法和装置 Download PDFInfo
- Publication number
- CN104965836A CN104965836A CN201410422320.6A CN201410422320A CN104965836A CN 104965836 A CN104965836 A CN 104965836A CN 201410422320 A CN201410422320 A CN 201410422320A CN 104965836 A CN104965836 A CN 104965836A
- Authority
- CN
- China
- Prior art keywords
- task
- constraint condition
- stereotactic conditions
- parameter
- calculate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明公开了一种互联网的数据处理方法,包括:在离线阶段,通过重复迭代的方式获得需求(Demand)结点约束条件的对偶参数、以及供应(Supply)结点约束条件的对偶参数;根据所述Demand结点约束条件的对偶参数、以及Supply结点约束条件的对偶参数,获得每个任务在相应定向条件下的播放概率;将每个任务中的互联网信息、以及每个任务在相应定向条件下的播放概率,分发给所述相应定向条件下的Supply结点所处的互联网信息播放终端,指示相应终端按获得的所述播放概率播放相应任务中的互联网信息。本发明还公开了一种互联网的数据处理装置。
Description
技术领域
本发明涉及互联网技术领域,尤其涉及一种互联网的数据处理方法和装置。
背景技术
目前的互联网信息推送,主要是为实现互联网信息在一段时间内在某些定向条件下的播放。这个过程可以用二部图来建模,如图1所示,左侧的供应(Supply)端表示各种定向条件下的播放,不同Supply结点对应不同的权重si,表示该定向条件i下的预估播放量(或称播放次数),右侧的需求(Demand)端表示信息推送需求(为描述方便,后续简称信息推送任务或任务),包括预定义的互联网信息、定向条件和播放量等,不同Demand结点对应不同的权重dj,表示任务j所需求的互联网信息播放次数。si到dj的连接线表示si对应的定向条件符合任务j的dj中的需求,每个连接线对应权重xij,可以理解为在某一定向条件的播放量si到达时,展示任务j的互联网信息的概率为xij。xij实质上对应了Supply端播放量的库存在线分配方案,如何求解xij是互联网信息推送的关键问题。
定向条件有很多维度,如地域、内容、性别、年龄、时间、场景等,而每个维度又包含很多属性,如北京、上海属于地域维度下的两个不同的定向属性。这样,不同的定向属性组合之后的定向条件就会有数十亿种。如果直接全部计算每一个xij用于线上服务,那么需要存储维护大量的信息(空间复杂度为图1中Supply端到Demand端的连接线的数量),在实际的应用中是不可行的。
现有技术将xij的求解分为离线阶段和在线阶段这两个过程。离线阶段,根据预估出的每个定向条件的库存信息以及任务信息得到如图1所示的二部图模型,根据模型计算出每个任务对应的参数;在线阶段,当播放量到达时,得到所有符合该定向条件的任务,根据离线阶段计算出的任务参数推导出每个任务的展示概率。具体的算法过程如下:
离线阶段:
1)对所有的Demand结点按照dj/sj进行降序排列得到分配顺序,其中,dj为任务j所需求的互联网信息播放次数,sj为所有满足dj定向条件的si的预估播放量总和;
2)对所有的Supply结点,初始化即初始化为预估播放量;
3)按照Demand结点的分配顺序,计算ρj使得如果ρj不存在,则设置ρj=∞;其中,ρj表示si分配给任务j的播放次数占si播放总数的比例,每个Demand结点相对应的Supply结点都使用该比例,Bj表示所有满足Demand结点j定向条件的Supply结点;
并对所有满足Demand结点定向条件的Supply结点i∈Bj,更新其为
在线阶段:
1)当Supply结点i的播放量到达时,得到所有符合该定向条件的任务,并按所述分配顺序排序;
2)对每个任务j,计算分配顺序排在j之前的任务所对应的概率和P,如果P>1-ρj,则任务j被展示的概率为1-P,否则任务j被展示的概率为ρj。
上述算法实质上是启发式的贪心算法,通过对任务分配顺序的调节,使得比较难满足的任务优先分配,按照分配顺序生成每个任务的库存分配方案。当播放到达时,根据分配方案得到对应任务的展示概率xij。
然而,现有算法无法保证得到一个相对的最优解,计算xij的误差越大,会导致互联网信息推送的效率和准确率越低,无法满足互联网信息的播放需求。因此,如何使计算的xij达到相对的最优解,从而保证互联网信息推送的效率和准确率,尽量满足互联网信息的播放需求,是目前亟待解决的技术问题。
发明内容
为解决现有存在的技术问题,本发明提供一种互联网的数据处理方法和装置。
本发明提供一种互联网的数据处理方法,所述方法包括:
在离线阶段,通过重复迭代的方式获得需求Demand结点约束条件的对偶参数、以及供应Supply结点约束条件的对偶参数;
根据所述Demand结点约束条件的对偶参数、以及Supply结点约束条件的对偶参数,获得每个任务在相应定向条件下的播放概率;
将每个任务中的互联网信息、以及每个任务在相应定向条件下的播放概率,分发给所述相应定向条件下的Supply结点所处的互联网信息播放终端,指示相应终端按获得的所述播放概率播放相应任务中的互联网信息。
上述方案中,所述通过重复迭代的方式获得Demand结点约束条件的对偶参数、以及Supply结点约束条件的对偶参数,包括:
根据初始化的Demand结点约束条件的对偶参数计算所述Supply结点约束条件的对偶参数,根据计算所得Supply结点约束条件的对偶参数计算Demand结点约束条件的对偶参数;重复迭代所述Demand结点约束条件的对偶参数、Supply结点约束条件的对偶参数预定次数,输出迭代后的Demand结点约束条件的对偶参数、以及Supply结点约束条件的对偶参数。
上述方案中,所述通过重复迭代的方式获得Demand结点约束条件的对偶参数、以及Supply结点约束条件的对偶参数,包括:
a、对于所有任务j,初始化αj=0,αj表示Demand结点约束条件的对偶参数;
b、对于所有定向条件i,计算βi使得如果无解或者βi<0,则设置βi=0;其中,βi表示Supply结点约束条件的对偶参数,Γ(i)表示所有能够被的定向条件i满足的Demand结点,θij表示互联网信息的均匀分布标准,Vj表示任务j对播放均匀分布的要求级别;
c、对于所有任务j,计算αj使得如果αj>pj或者无解,则设置αj=pj;其中,si表示定向条件i下的预估播放量,dj表示任务j的需求播放量,pj表示补偿代价;
将所述步骤b和c迭代预定次数,得到迭代后输出的Demand结点约束条件的对偶参数αj、以及Supply结点约束条件的对偶参数βi。
上述方案中,所述根据Demand结点约束条件的对偶参数、以及Supply结点约束条件的对偶参数,获得每个任务在相应定向条件下的播放概率,包括:
离线阶段,对于所有定向条件i,初始化si表示定向条件i的预估播放量;
对于所有的定向条件i,计算βi使得如果无解或者βi<0,则设置βi=0;
对应每个任务j,按照分配顺序执行:
计算ζj使得如果无解则设置ζj=∞;对于满足任务j的所有定向条件i,更新用于下一任务的ζj计算,输出所有任务的αj、ζj;其中,ζj表示用于计算任务j在相应定向条件下播放概率的第一参数,Γ(j)表示所有满足任务j的Supply结点;
在线阶段,在每个si到达时,根据αj计算出βi,并由ζj和βi计算得出每个任务在相应定向条件下的播放概率。
上述方案中,所述分配顺序为:
对所有的Demand结点按照dj/sj进行降序排列,其中,dj表示任务j所需求的互联网信息播放次数,sj表示所有满足dj定向条件的si的预估播放量总和。
上述方案中,所述根据αj计算出βi,并由ζj和βi计算得出每个任务在相应定向条件下的播放概率,包括:
输入定向条件i和所有满足定向条件i的任务;
设置计算βi使得如果无解或者βi<0,则设置βi=0;
对于每个满足定向条件i的任务,按照分配顺序计算更新用于下一个任务的xij计算;其中,xij表示任务j在定向条件i下的播放概率。
本发明还提供一种互联网的数据处理装置,包括:
对偶参数获得单元,用于在离线阶段,通过重复迭代的方式获得需求Demand结点约束条件的对偶参数、以及供应Supply结点约束条件的对偶参数;
播放概率获得单元,用于根据所述Demand结点约束条件的对偶参数、以及Supply结点约束条件的对偶参数,获得每个任务在相应定向条件下的播放概率;
分发单元,用于将每个任务中的互联网信息、以及每个任务在相应定向条件下的播放概率,分发给所述相应定向条件下的Supply结点所处的互联网信息播放终端,指示相应终端按获得的所述播放概率播放相应任务中的互联网信息。
上述方案中,所述对偶参数获得单元进一步用于,根据初始化的Demand结点约束条件的对偶参数计算所述Supply结点约束条件的对偶参数,根据计算所得Supply结点约束条件的对偶参数计算Demand结点约束条件的对偶参数;重复迭代所述Demand结点约束条件的对偶参数、Supply结点约束条件的对偶参数预定次数,输出迭代后的Demand结点约束条件的对偶参数、以及Supply结点约束条件的对偶参数。
上述方案中,所述对偶参数获得单元进一步用于,通过以下方式获得所述对偶参数:
a、对于所有任务j,初始化αj=0,αj表示Demand结点约束条件的对偶参数;
b、对于所有定向条件i,计算βi使得如果无解或者βi<0,则设置βi=0;其中,βi表示Supply结点约束条件的对偶参数,Γ(i)表示所有能够被的定向条件i满足的Demand结点,θij表示互联网信息的均匀分布标准,Vj表示任务j对播放均匀分布的要求级别;
c、对于所有任务j,计算αj使得如果αj>pj或者无解,则设置αj=pj;其中,si表示定向条件i下的预估播放量,dj表示任务j的需求播放量,pj表示补偿代价;
将所述步骤b和c迭代预定次数,得到迭代后输出的Demand结点约束条件的对偶参数αj、以及Supply结点约束条件的对偶参数βi。
上述方案中,所述播放概率获得单元进一步用于,通过以下方式获得每个任务在相应定向条件下的播放概率:
离线阶段,对于所有定向条件i,初始化si表示定向条件i的预估播放量;
对于所有的定向条件i,计算βi使得如果无解或者βi<0,则设置βi=0;
对应每个任务j,按照分配顺序执行:
计算ζj使得如果无解则设置ζj=∞;对于满足任务j的所有定向条件i,更新用于下一任务的ζj计算,输出所有任务的αj、ζj;其中,ζj表示用于计算任务j在相应定向条件下播放概率的第一参数,Γ(j)表示所有满足任务j的Supply结点;
在线阶段,在每个si到达时,根据αj计算出βi,并由ζj和βi计算得出每个任务在相应定向条件下的播放概率。
上述方案中,所述分配顺序为:对所有的Demand结点按照dj/sj进行降序排列,其中,dj表示任务j所需求的互联网信息播放次数,sj表示所有满足dj定向条件的si的预估播放量总和。
上述方案中,所述播放概率获得单元进一步用于,通过以下方式计算每个任务在相应定向条件下的播放概率:
输入定向条件i和所有满足定向条件i的任务;
设置计算βi使得如果无解或者βi<0,则设置βi=0;
对于每个满足定向条件i的任务,按照分配顺序计算更新用于下一个任务的xij计算;其中,xij表示任务j在定向条件i下的播放概率。
本发明提供的一种互联网的数据处理方法和装置,能够使计算的xij达到相对的最优解,并使互联网信息的播放分布尽量趋向于均匀,从而保证互联网信息推送的效率和准确率,尽量满足互联网信息的播放需求。
附图说明
图1为相关技术中互联网信息在定向条件下播放的二部图建模示意图;
图2为本发明实施例一的互联网的数据处理方法流程图;
图3为本发明实施例二的互联网的数据处理装置结构示意图。
具体实施方式
下面结合附图和具体实施例对本发明的技术方案进一步详细阐述。
互联网信息推送算法应尽量保证信息推送方完成每个推送需求(任务),假设任务j未完成播放量为uj,对应的补偿代价为pj,则整体的补偿代价为:
Σjpjuj (I)
互联网信息推送算法应保证公式(1)的值尽量最小。
另外,任务中的互联网信息的播放也应当在其所需求的定向条件范围内分布相对均匀。定义Γ(j)为所有满足任务j的Supply结点,Γ(i)为所有能够被si的定向条件满足的Demand结点;定义Vj为任务j对播放均匀分布的要求级别,Vj越大表示播放的均匀分布越重要;定义sj=∑i∈Γ(j)si表示所有满足任务j的Supply结点播放总量,即任务j的可用库存;因此分配方案的均匀分布标准可以用θij=dj/sj来衡量,其中,dj表示任务j的需求播放量;则可以得到互联网信息播放分布均匀度的表达式:
公式(2)的值越小,表示互联网信息的播放分布越趋向于均匀。
为使计算的xij达到相对的最优解,并使互联网信息的播放分布尽量趋向于均匀,从而保证互联网信息推送的效率和准确率,本发明实施例将最优化方法和贪心的启发式方法相结合来求解xij,以期将原始最优化问题合理的对偶解转化为一个较好的原始问题的解。
下面对本发明实施例的互联网数据处理的方法进行详细说明。
实施例一
本发明实施例一的方法分为两个阶段,第一阶段通过迭代的方法找到原始问题的对偶问题的一个合理的解,每轮迭代都会向最优解逼近(如果一直迭代下去,算法会收敛到真正的最优解);第二阶段利用贪心的启发式方法将对偶问题的解还原成原始问题的一个较好解。
首先,根据公式(1)和公式(2),定义互联网信息推送的最优化问题如下:
1)最小化下式:
其中,si表示定向条件i下的预估播放量,Γ(j)表示所有满足任务j的Supply结点数量,Vj表示任务j对播放均匀分布的要求级别,θij表示互联网信息的均匀分布标准,uj表示任务j未完成播放量,pj表示与uj对应的补偿代价,xij表示在定向条件i的播放量si到达时,展示任务j的互联网信息的概率。
2)满足以下约束条件:
其中,公式(4)的约束条件是指:所有分配给任务j的播放量与任务j未完成播放量之和大于等于任务j的需求播放量;表示任意任务j;
公式(5)的约束条件是指:定向条件i下分配给所有任务的播放量不会超过自身的播放总量si;表示任意定向条件i;
公式(6)的约束条件是指:所有分配概率xij和未完成播放量uj的非负约束;表示任意定向条件i、任意任务j。
定义Demand约束条件(即公式(4)所对应的约束条件中的∑i∈Γ(j)sixij+uj)的对偶参数为αj;定义Supply约束条件(即公式(5)所对应的约束条件中的si∑j∈Γ(i)xij)的对偶参数为βi;定义非负约束条件中的xij的对偶参数为γij,uj的对偶参数为ψj。
由拉格朗日方程和KKT(卡罗需-库恩-塔克)条件可得:
1)Stationarity(稳定性条件):
对于所有定向条件i和任务j,
对于所有任务j,pj-αj-ψj=0 (8)
2)Complementary slackness(互补松弛条件):
对于所有任务j,αj=0,否则∑i∈Γ(j)sixij+uj=dj; (9)
对于所有定向条件i,βi=0,否则∑j∈Γ(i)sixij=si; (10)
对于所有定向条件i和任务j,γij=0,否则xij=0; (11)
对于所有任务j,ψj=0,否则uj=0; (12)
并且所有对偶参数非负,即αj≥0、βi≥0、γij≥0、ψj≥0。由于本发明实施例的最优化问题为凸优化问题,因此满足KKT条件的解即为最优解。
由稳定性条件可知:
而由互补松弛条件的公式(11)可知,γij=0否则xij=0。因此,如果为负值,则γij将会增大到足够大使得xij=0。可以得到:
其中,gij表示函数定义,对应函数
由公式(8)得到αj=pj-ψj,而ψj≥0,因此αj≤pj。
由公式(12)可知,如果ψj=0不成立,则uj=0,因此可以得到αj=pj,否则∑i∈Γ(j)sixij≥dj。进一步,当αj=pj不成立时,ψj=0不成立,所以uj=0。
进而由公式(9),当αj=0不成立时有∑i∈Γ(j)sixij=dj。而当αj=0时,由公式(14)可得到∑i∈Γ(j)sixij=∑i∈Γ(j)sigij(-βi)≤dj,所以∑i∈Γ(j)sixij=dj。
综上可得:
αj=pj,否则∑i∈Γ(j)sixij=dj (15)
由互补松弛条件的公式(10)可得:
βi=0,否则∑j∈Γ(i)xij=1 (16)
设α*、β*为最优解的对偶参数,由上述推导中的公式(14)、(15)、(16)可以得到如下结论:
1)原始问题的最优解为xij *=gij(αj *-βi *),gij(z)=max{0,θij(1+z/Vj)};xij *表示对偶问题的最优解,在满足KKT条件时,对偶问题的最优解与原始问题的最优解相同;z=αj *-βi *;
2)对于所有任务j,0≤αj *≤pj,并且αj *=pj,否则∑i∈Γ(j)six* ij=dj;
3)对于所有的定向条件i,βi≥0,并且βi=0,否则∑j∈Γ(i)x* ij=1。
根据以上结论,可以采取类似坐标下降法的方式迭代一定次数计算出一组α*、β*,再由启发式的贪心策略进一步约束α*、β*,求解出原始问题较优的解。两阶段算法描述如下:
阶段一:重复迭代2)、3)一定次数
1)初始化:对于所有任务j,设置αj=0
2)对于所有定向条件i,计算βi使得如果无解或者βi<0,则设置βi=0;
3)对于所有任务j,计算αj使得如果αj>pj或者无解,则设置αj=pj。
阶段二:
1)初始化:对于所有定向条件i,设置
2)对于所有的定向条件i,计算βi使得如果无解或者βi<0,则设置βi=0;
3)对应每个任务j,按照分配顺序执行:
a)计算ζj使得如果无解则设置ζj=∞;ζj用于计算任务j在相应定向条件下播放概率的第一参数;
b)对于满足任务j的所有定向条件i,更新输出所有任务的αj、ζj。
在算法的第一阶段,利用反复迭代αj和βi得到趋向于最优解的一组对偶参数、即αj *和βi *,αj *和βi *表示变量αj和βi在迭代后得到的值,此时并没有对定向条件i进行分配。在迭代一定次数得到αj *和βi *后,必须经过算法的第二阶段才能得到真正的分配方案。在算法的第二阶段,根据剩余库存的量调整ζj得到真正的分配方案。
当离线阶段采用上述两阶段算法计算输出αj和ζj后,在线服务只需要存储这两组参数即可,空间复杂度为任务数。在线阶段,当一个播放量si到达时,可以根据αj计算出βi,再由ζj和βi计算得出分配方案,具体算法如下:
输入:定向条件i和所有满足该定向条件的任务
1)设置计算βi使得如果无解或者βi<0,则设置βi=0;
2)对于每个满足该定向条件i的任务,按照分配顺序计算 更新
3)以概率xij展示任务j,如果∑jΓ(i)xij<1,则存在一定的概率不展示任何互联网信息。
在上述基础上,本发明实施例一提供的一种互联网的数据处理方法,如图2所示,包括:
步骤201,在离线阶段,通过重复迭代的方式获得Demand结点约束条件的对偶参数、以及Supply结点约束条件的对偶参数。
根据初始化的Demand结点约束条件的对偶参数计算所述Supply结点约束条件的对偶参数,根据计算所得Supply结点约束条件的对偶参数计算Demand结点约束条件的对偶参数;重复迭代所述Demand结点约束条件的对偶参数、Supply结点约束条件的对偶参数预定次数,输出迭代后的Demand结点约束条件的对偶参数、以及Supply结点约束条件的对偶参数。
步骤201具体包括:
a、对于所有任务j,初始化αj=0,αj表示Demand结点约束条件的对偶参数;
b、对于所有定向条件i,计算βi使得如果无解或者βi<0,则设置βi=0;其中,βi表示Supply结点约束条件的对偶参数,Γ(i)表示所有能够被的定向条件i满足的Demand结点,θij表示互联网信息的均匀分布标准,Vj表示任务j对播放均匀分布的要求级别;
c、对于所有任务j,计算αj使得如果αj>pj或者无解,则设置αj=pj;其中,si表示定向条件i下的预估播放量,dj表示任务j的需求播放量,pj表示补偿代价;
将所述步骤b和c迭代预定次数(即将步骤b计算所得βi代入步骤c中,将步骤c计算所得αj代入步骤b中),得到迭代后输出的Demand结点约束条件的对偶参数αj、以及Supply结点约束条件的对偶参数βi。
步骤202,根据Demand结点约束条件的对偶参数、以及Supply结点约束条件的对偶参数,获得每个任务在相应定向条件下的播放概率。
步骤202具体包括:
离线阶段,对于所有定向条件i,初始化即初始化为预估播放量;
对于所有的定向条件i,计算βi使得如果无解或者βi<0,则设置βi=0;
对应每个任务j,按照分配顺序执行:
计算ζj使得如果无解则设置ζj=∞;对于满足任务j的所有定向条件i,更新用于下一任务的ζj计算,输出所有任务的αj、ζj;其中,ζj表示用于计算任务j在相应定向条件下播放概率的第一参数,Γ(j)表示所有满足任务j的Supply结点;
在线阶段,在每个si到达时,根据αj计算出βi,并由ζj和βi计算得出每个任务在相应定向条件下的播放概率。
其中,分配顺序为:对所有的Demand结点按照dj/sj进行降序排列,其中,dj表示任务j所需求的互联网信息播放次数,sj表示所有满足dj定向条件的si的预估播放量总和。
所述根据αj计算出βi,并由ζj和βi计算得出每个任务在相应定向条件下的播放概率,包括:包括:
输入定向条件i和所有满足定向条件i的任务;
设置计算βi使得如果无解或者βi<0,则设置βi=0;
对于每个满足定向条件i的任务,按照分配顺序计算更新用于下一个任务的xij计算;其中,xij表示任务j在定向条件i下的播放概率。
步骤203,将每个任务中的互联网信息、以及每个任务在相应定向条件下的播放概率,分发给所述相应定向条件下的Supply结点所处的互联网信息播放终端,指示相应终端按获得的所述播放概率播放相应任务中的互联网信息。
所述终端获得所述播放概率后,会根据所述指示按获得的所述播放概率播放相应任务中的互联网信息。
需要说明的是,上述步骤201~203可以由同一设备实现;或者,步骤201~202由同一设备实现,步骤203由另一台设备实现。
实施例二
对应实施例一所述的互联网的数据处理方法,本发明实施例提供了一种互联网的数据处理装置,如图3所示,包括:
对偶参数获得单元10,用于在离线阶段,通过重复迭代的方式获得需求Demand结点约束条件的对偶参数、以及供应Supply结点约束条件的对偶参数;
播放概率获得单元20,用于根据所述Demand结点约束条件的对偶参数、以及Supply结点约束条件的对偶参数,获得每个任务在相应定向条件下的播放概率;
分发单元30,用于将每个任务中的互联网信息、以及每个任务在相应定向条件下的播放概率,分发给所述相应定向条件下的Supply结点,指示相应Supply结点按获得的所述播放概率播放相应任务中的互联网信息。
较佳的,对偶参数获得单元10进一步用于,根据初始化的Demand结点约束条件的对偶参数计算所述Supply结点约束条件的对偶参数,根据计算所得Supply结点约束条件的对偶参数计算Demand结点约束条件的对偶参数;重复迭代所述Demand结点约束条件的对偶参数、Supply结点约束条件的对偶参数预定次数,输出迭代后的Demand结点约束条件的对偶参数、以及Supply结点约束条件的对偶参数。
较佳的,对偶参数获得单元10进一步用于,通过以下方式获得所述对偶参数:
a、对于所有任务j,初始化αj=0,αj表示Demand结点约束条件的对偶参数;
b、对于所有定向条件i,计算βi使得如果无解或者βi<0,则设置βi=0;其中,βi表示Supply结点约束条件的对偶参数,Γ(i)表示所有能够被的定向条件i满足的Demand结点,θij表示互联网信息的均匀分布标准,Vj表示任务j对播放均匀分布的要求级别;
c、对于所有任务j,计算αj使得如果αj>pj或者无解,则设置αj=pj;其中,si表示定向条件i下的预估播放量,dj表示任务j的需求播放量,pj表示补偿代价;
将所述步骤b和c迭代预定次数,得到迭代后输出的Demand结点约束条件的对偶参数αj、以及Supply结点约束条件的对偶参数βi。
较佳的,播放概率获得单元20进一步用于,通过以下方式获得每个任务在相应定向条件下的播放概率:
离线阶段,对于所有定向条件i,初始化即初始化为预估播放量;
对于所有的定向条件i,计算βi使得如果无解或者βi<0,则设置βi=0;
对应每个任务j,按照分配顺序执行:
计算ζj使得如果无解则设置ζj=∞;对于满足任务j的所有定向条件i,更新用于下一任务的ζj计算,输出所有任务的αj、ζj;其中,ζj表示用于计算任务j在相应定向条件下播放概率的第一参数,Γ(j)表示所有满足任务j的Supply结点;
在线阶段,在每个si到达时,根据αj计算出βi,并由ζj和βi计算得出每个任务在相应定向条件下的播放概率。
较佳的,所述分配顺序为:对所有的Demand结点按照dj/sj进行降序排列,其中,dj表示任务j所需求的互联网信息播放次数,sj表示所有满足dj定向条件的si的预估播放量总和。
较佳的,所述播放概率获得单元20进一步用于,通过以下方式计算每个任务在相应定向条件下的播放概率:
输入定向条件i和所有满足定向条件i的任务;
设置计算βi使得如果无解或者βi<0,则设置βi=0;
对于每个满足定向条件i的任务,按照分配顺序计算更新用于下一个任务的xij计算;其中,xij表示任务j在定向条件i下的播放概率。
需要说明的是,上述对偶参数获得单元10、播放概率获得单元20和分发单元30可以由互联网的数据处理装置的中央处理器(CPU,Central ProcessingUnit)、微处理器(MPU,Micro Processing Unit)、数字信号处理器(DSP,DigitalSignal Processor)或现场可编辑逻辑阵列(FPGA,Field Programmable GateArray)实现。上述对偶参数获得单元10、播放概率获得单元20和分发单元30可以合设于同一设备中;或者,对偶参数获得单元10和播放概率获得单元20合设,分发单元30分设于另一设备中。
还需要说明的是,上述本发明实施例的互联网信息类型可以是但不仅限于文字、图片、视频等;所述每个任务在相应定向条件下的播放概率可以是每个任务中的文字、图片或视频在相应定向条件下的曝光概率;所述任务可以是互联网信息的曝光订单,订单中描述了互联网信息的推送需求,订单中至少包括:预定义的互联网信息(文字、图片或视频等)、定向条件和需求曝光量等。
本发明实施例还提供一种计算机可读存储介质,所述存储介质包括一组计算机可执行指令,所述指令用于执行本发明实施例所述的互联网的数据处理方法。
本发明实施例通过将最优化问题的求解和启发式的贪心算法相结合,能够使计算的xij达到相对的最优解,能够获得较好的互联网信息推送策略,使互联网信息的播放分布尽量趋向于均匀,从而保证互联网信息推送的效率和准确率,尽量满足互联网信息的播放需求。本发明实施例还具有以下主要有益效果:
1)发明实施例的算法可以在迭代少量次数(如5~20次)的情况下,仍能获得较好的效果;
2)发明实施例算法的空间复杂度和二部图模型中的边数无关,可扩展性较好,增加定向纬度和任务数目对系统影响较小;
3)如果算法迭代足够多的次数,可以收敛到一个全局最优解;
4)每个任务只需要存储空间复杂度O(1)的信息。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。
Claims (12)
1.一种互联网的数据处理方法,其特征在于,所述方法包括:
在离线阶段,通过重复迭代的方式获得需求Demand结点约束条件的对偶参数、以及供应Supply结点约束条件的对偶参数;
根据所述Demand结点约束条件的对偶参数、以及Supply结点约束条件的对偶参数,获得每个任务在相应定向条件下的播放概率;
将每个任务中的互联网信息、以及每个任务在相应定向条件下的播放概率,分发给所述相应定向条件下的Supply结点所处的互联网信息播放终端,指示相应终端按获得的所述播放概率播放相应任务中的互联网信息。
2.根据权利要求1所述互联网的数据处理方法,其特征在于,所述通过重复迭代的方式获得Demand结点约束条件的对偶参数、以及Supply结点约束条件的对偶参数,包括:
根据初始化的Demand结点约束条件的对偶参数计算所述Supply结点约束条件的对偶参数,根据计算所得Supply结点约束条件的对偶参数计算Demand结点约束条件的对偶参数;重复迭代所述Demand结点约束条件的对偶参数、Supply结点约束条件的对偶参数预定次数,输出迭代后的Demand结点约束条件的对偶参数、以及Supply结点约束条件的对偶参数。
3.根据权利要求2所述互联网的数据处理方法,其特征在于,所述通过重复迭代的方式获得Demand结点约束条件的对偶参数、以及Supply结点约束条件的对偶参数,包括:
a、对于所有任务j,初始化αj=0,αj表示Demand结点约束条件的对偶参数;
b、对于所有定向条件i,计算βi使得如果无解或者βi<0,则设置βi=0;其中,βi表示Supply结点约束条件的对偶参数,Γ(i)表示所有能够被的定向条件i满足的Demand结点,θij表示互联网信息的均匀分布标准,Vj表示任务j对播放均匀分布的要求级别;
c、对于所有任务j,计算αj使得如果αj>pj或者无解,则设置αj=pj;其中,si表示定向条件i下的预估播放量,dj表示任务j的需求播放量,pj表示补偿代价;
将所述步骤b和c迭代预定次数,得到迭代后输出的Demand结点约束条件的对偶参数αj、以及Supply结点约束条件的对偶参数βi。
4.根据权利要求1所述互联网的数据处理方法,其特征在于,所述根据Demand结点约束条件的对偶参数、以及Supply结点约束条件的对偶参数,获得每个任务在相应定向条件下的播放概率,包括:
离线阶段,对于所有定向条件i,初始化表示定向条件i的预估播放量;
对于所有的定向条件i,计算βi使得如果无解或者βi<0,则设置βi=0;
对应每个任务j,按照分配顺序执行:
计算ζj使得如果无解则设置ζj=∞;对于满足任务j的所有定向条件i,更新用于下一任务的ζj计算,输出所有任务的αj、ζj;其中,ζj表示用于计算任务j在相应定向条件下播放概率的第一参数,Γ(j)表示所有满足任务j的Supply结点;
在线阶段,在每个si到达时,根据αj计算出βi,并由ζj和βi计算得出每个任务在相应定向条件下的播放概率。
5.根据权利要求4所述互联网的数据处理方法,其特征在于,所述分配顺序为:
对所有的Demand结点按照dj/sj进行降序排列,其中,dj表示任务j所需求的互联网信息播放次数,sj表示所有满足dj定向条件的si的预估播放量总和。
6.根据权利要求4所述互联网的数据处理方法,其特征在于,所述根据αj计算出βi,并由ζj和βi计算得出每个任务在相应定向条件下的播放概率,包括:
输入定向条件i和所有满足定向条件i的任务;
设置计算βi使得如果无解或者βi<0,则设置βi=0;
对于每个满足定向条件i的任务,按照分配顺序计算更新用于下一个任务的xij计算;其中,xij表示任务j在定向条件i下的播放概率。
7.一种互联网的数据处理装置,其特征在于,包括:
对偶参数获得单元,用于在离线阶段,通过重复迭代的方式获得需求Demand结点约束条件的对偶参数、以及供应Supply结点约束条件的对偶参数;
播放概率获得单元,用于根据所述Demand结点约束条件的对偶参数、以及Supply结点约束条件的对偶参数,获得每个任务在相应定向条件下的播放概率;
分发单元,用于将每个任务中的互联网信息、以及每个任务在相应定向条件下的播放概率,分发给所述相应定向条件下的Supply结点所处的互联网信息播放终端,指示相应终端按获得的所述播放概率播放相应任务中的互联网信息。
8.根据权利要求7所述互联网的数据处理装置,其特征在于,所述对偶参数获得单元进一步用于,根据初始化的Demand结点约束条件的对偶参数计算所述Supply结点约束条件的对偶参数,根据计算所得Supply结点约束条件的对偶参数计算Demand结点约束条件的对偶参数;重复迭代所述Demand结点约束条件的对偶参数、Supply结点约束条件的对偶参数预定次数,输出迭代后的Demand结点约束条件的对偶参数、以及Supply结点约束条件的对偶参数。
9.根据权利要求8所述互联网的数据处理装置,其特征在于,所述对偶参数获得单元进一步用于,通过以下方式获得所述对偶参数:
a、对于所有任务j,初始化αj=0,αj表示Demand结点约束条件的对偶参数;
b、对于所有定向条件i,计算βi使得如果无解或者βi<0,则设置βi=0;其中,βi表示Supply结点约束条件的对偶参数,Γ(i)表示所有能够被的定向条件i满足的Demand结点,θij表示互联网信息的均匀分布标准,Vj表示任务j对播放均匀分布的要求级别;
c、对于所有任务j,计算αj使得如果αj>pj或者无解,则设置αj=pj;其中,si表示定向条件i下的预估播放量,dj表示任务j的需求播放量,pj表示补偿代价;
将所述步骤b和c迭代预定次数,得到迭代后输出的Demand结点约束条件的对偶参数αj、以及Supply结点约束条件的对偶参数βi。
10.根据权利要求7所述互联网的数据处理装置,其特征在于,所述播放概率获得单元进一步用于,通过以下方式获得每个任务在相应定向条件下的播放概率:
离线阶段,对于所有定向条件i,初始化si表示定向条件i的预估播放量;
对于所有的定向条件i,计算βi使得如果无解或者βi<0,则设置βi=0;
对应每个任务j,按照分配顺序执行:
计算ζj使得如果无解则设置ζj=∞;对于满足任务j的所有定向条件i,更新用于下一任务的ζj计算,输出所有任务的αj、ζj;其中,ζj表示用于计算任务j在相应定向条件下播放概率的第一参数,Γ(j)表示所有满足任务j的Supply结点;
在线阶段,在每个si到达时,根据αj计算出βi,并由ζj和βi计算得出每个任务在相应定向条件下的播放概率。
11.根据权利要求10所述互联网的数据处理装置,其特征在于,所述分配顺序为:对所有的Demand结点按照dj/sj进行降序排列,其中,dj表示任务j所需求的互联网信息播放次数,sj表示所有满足dj定向条件的si的预估播放量总和。
12.根据权利要求10所述互联网的数据处理装置,其特征在于,所述播放概率获得单元进一步用于,通过以下方式计算每个任务在相应定向条件下的播放概率:
输入定向条件i和所有满足定向条件i的任务;
设置计算βi使得如果无解或者βi<0,则设置βi=0;
对于每个满足定向条件i的任务,按照分配顺序计算更新用于下一个任务的xij计算;其中,xij表示任务j在定向条件i下的播放概率。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410422320.6A CN104965836B (zh) | 2014-08-25 | 2014-08-25 | 一种互联网的数据处理方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410422320.6A CN104965836B (zh) | 2014-08-25 | 2014-08-25 | 一种互联网的数据处理方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104965836A true CN104965836A (zh) | 2015-10-07 |
CN104965836B CN104965836B (zh) | 2018-10-30 |
Family
ID=54219872
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410422320.6A Active CN104965836B (zh) | 2014-08-25 | 2014-08-25 | 一种互联网的数据处理方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104965836B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108510299A (zh) * | 2017-02-28 | 2018-09-07 | 腾讯科技(北京)有限公司 | 确定多媒体资源投放策略的方法及装置 |
CN108965936A (zh) * | 2017-05-17 | 2018-12-07 | 腾讯科技(深圳)有限公司 | 一种媒体信息的播放控制方法、服务器及计算机存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7363126B1 (en) * | 2002-08-22 | 2008-04-22 | United Parcel Service Of America | Core area territory planning for optimizing driver familiarity and route flexibility |
CN102566423A (zh) * | 2011-12-09 | 2012-07-11 | 西南交通大学 | 一种单边装配线的平衡控制方法 |
CN103795697A (zh) * | 2012-11-01 | 2014-05-14 | 腾讯科技(深圳)有限公司 | 一种网络媒介信息投放效果模拟方法和系统 |
CN103970609A (zh) * | 2014-04-24 | 2014-08-06 | 南京信息工程大学 | 一种基于改进蚁群算法的云数据中心任务调度方法 |
-
2014
- 2014-08-25 CN CN201410422320.6A patent/CN104965836B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7363126B1 (en) * | 2002-08-22 | 2008-04-22 | United Parcel Service Of America | Core area territory planning for optimizing driver familiarity and route flexibility |
CN102566423A (zh) * | 2011-12-09 | 2012-07-11 | 西南交通大学 | 一种单边装配线的平衡控制方法 |
CN103795697A (zh) * | 2012-11-01 | 2014-05-14 | 腾讯科技(深圳)有限公司 | 一种网络媒介信息投放效果模拟方法和系统 |
CN103970609A (zh) * | 2014-04-24 | 2014-08-06 | 南京信息工程大学 | 一种基于改进蚁群算法的云数据中心任务调度方法 |
Non-Patent Citations (1)
Title |
---|
文斌 等: ""面向消费者的服务资源个性化主动定制"", 《小型微型计算机系统》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108510299A (zh) * | 2017-02-28 | 2018-09-07 | 腾讯科技(北京)有限公司 | 确定多媒体资源投放策略的方法及装置 |
CN108965936A (zh) * | 2017-05-17 | 2018-12-07 | 腾讯科技(深圳)有限公司 | 一种媒体信息的播放控制方法、服务器及计算机存储介质 |
CN108965936B (zh) * | 2017-05-17 | 2021-05-11 | 腾讯科技(深圳)有限公司 | 一种媒体信息的播放控制方法、服务器及计算机存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN104965836B (zh) | 2018-10-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113516255A (zh) | 联邦学习建模优化方法、设备、可读存储介质及程序产品 | |
CN113095512A (zh) | 联邦学习建模优化方法、设备、介质及计算机程序产品 | |
WO2019147851A2 (en) | Systems and methods for generating machine learning applications | |
TWI547817B (zh) | 叢集運算架構的資源規劃方法、系統及裝置 | |
CN110115015A (zh) | 通过监测其行为检测未知IoT设备的系统和方法 | |
CN104901989B (zh) | 一种现场服务提供系统及方法 | |
CN109284881A (zh) | 订单分配方法、装置、计算机可读存储介质及电子设备 | |
CN108075974B (zh) | 一种流量转发控制方法、装置及sdn架构系统 | |
CN115473901B (zh) | 一种分布式算力集群智慧调度方法、装置及计算机设备 | |
CN109976901A (zh) | 一种资源调度方法、装置、服务器及可读存储介质 | |
CN114298322A (zh) | 联邦学习方法和装置、系统、电子设备、计算机可读介质 | |
CN107786989B (zh) | 一种Lora智能水表网络网关部署方法及装置 | |
CN115049071A (zh) | 一种基于dag区块链的联邦学习方法 | |
CN104965836A (zh) | 一种互联网的数据处理方法和装置 | |
US20220269835A1 (en) | Resource prediction system for executing machine learning models | |
CN113516254A (zh) | 横向联邦学习建模优化方法、设备、介质及程序产品 | |
CN108289115B (zh) | 一种信息处理方法及系统 | |
CN113543160B (zh) | 5g切片资源配置方法、装置、计算设备及计算机存储介质 | |
CN117829307A (zh) | 一种面向数据异构性的联邦学习方法及系统 | |
CN109951330B (zh) | 一种自动识别设备类型的管理方法及通讯管理机 | |
CN115759241A (zh) | 一种基于遗传算法的神经网络切分方法及系统 | |
CN103677994B (zh) | 分布式数据处理系统、设备及方法 | |
CN109726232A (zh) | 一种模型可视化计算方法及系统 | |
CN114912627A (zh) | 推荐模型训练方法、系统、计算机设备及存储介质 | |
CN102438325B (zh) | 基于认知无线终端重构系统的资源调度方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |