发明内容
有鉴于此,本申请所要解决的技术问题是提供了一种推送列表多样性的评测方法及系统,简化了推送列表多样性的计算方式,降低了计算过程的复杂程度。
为了解决上述技术问题,本申请有如下技术方案:
一种推送列表多样性的评测方法,所述方法包括:
设定用户群集合,所述用户群集合中包括多个用户;设定项目集合,所述项目集合中包括多个推送项目;
为每个用户确定一个推送列表,所述推送列表中包括一个或多个项目集合中的推送项目;
按照推送列表中推送项目的数量,对用户进行排序,得到用户序列;
建立直角坐标系,根据所述用户序列,及用户的推送列表中推送项目的数量,为每个用户确定其在直角坐标系中的坐标;
根据所述用户坐标在所述直角坐标系中,生成推送列表曲线,并计算所述推送列表曲线的投影面积;以所述投影面积作为推送列表的多样性指数;
利用所述多样性指数对所述用户列表的多样性程度进行评测,得到评测结果。
优选的,所述按照推送列表中推送项目的数量,对用户进行排序具体为:
按照推送列表中推送项目的数量,对用户进行升序排序。
优选的,所述根据所述用户序列,及用户的推送列表中推送项目的数量,为每个用户确定其在直角坐标系中的坐标具体为:
将用户在所述用户序列中的序列号作为横坐标;将用户的推送列表中推送项目的数量作为纵坐标。
优选的,所述根据所述用户坐标在所述直角坐标系中,生成推送列表曲线具体为:
连接所述直角坐标系中的各个坐标点,生成推送列表曲线。
优选的,所述计算所述推送列表曲线的投影面积,以所述投影面积作为推送列表的多样性指数具体为:
其中,diversity代表多样性指数,M代表项目集合中推送项目的数量,N代表用户群集合中用户的数量,k代表用户在用户序列中的序号,mk代表在用户序列中,序号为k的用户的推送列表中推送项目的数量。
一种推送列表多样性的评测系统,所述系统包括:
集合模块,用于设定用户群集合,所述用户群集合中包括多个用户;设定项目集合,所述项目集合中包括多个推送项目;
列表模块,用于为每个用户确定一个推送列表,所述推送列表中包括一个或多个项目集合中的推送项目;
运算模块,用于按照推送列表中推送项目的数量,对用户进行排序,得到用户序列;建立直角坐标系,根据所述用户序列,及用户的推送列表中推送项目的数量,为每个用户确定其在直角坐标系中的坐标;根据所述用户坐标在所述直角坐标系中,生成推送列表曲线,并计算所述推送列表曲线的投影面积;以所述投影面积作为推送列表的多样性指数;
评测模块,用于利用所述多样性指数对所述用户列表的多样性程度进行评测,得到评测结果。
优选的,所述运算模块包括:
序列单元,用于按照推送列表中推送项目的数量,对用户进行升序排序;
坐标系单元,用于建立直角坐标系,根据所述用户序列,及用户的推送列表中推送项目的数量,为每个用户确定其在直角坐标系中的坐标;根据所述用户坐标在所述直角坐标系中,生成推送列表曲线;
投影单元,用于计算所述推送列表曲线的投影面积;以所述投影面积作为推送列表的多样性指数。
优选的,所述坐标系单元根据所述用户序列,及用户的推送列表中推送项目的数量,为每个用户确定其在直角坐标系中的坐标具体为:
将用户在所述用户序列中的序列号作为横坐标;将用户的推送列表中推送项目的数量作为纵坐标。
优选的,所述坐标系单元根据所述用户坐标在所述直角坐标系中,生成推送列表曲线具体为:
连接所述直角坐标系中的各个坐标点,生成推送列表曲线。
优选的,所述投影单元计算所述推送列表曲线的投影面积,以所述投影面积作为推送列表的多样性指数具体为:
其中,diversity代表多样性指数,M代表项目集合中推送项目的数量,N代表用户群集合中用户的数量,k代表用户在用户序列中的序号,mk代表在用户序列中,序号为k的用户的推送列表中推送项目的数量。
与现有技术相比,本申请所述的方法和系统,达到了如下效果:
显著的降低了推送列表多样性计算的次数和复杂程度,减少了多样性评测过程中对运算资源的消耗。
当然,实施本申请的任一产品必不一定需要同时达到以上所述的所有技术效果。
具体实施方式
如在说明书及权利要求当中使用了某些词汇来指称特定组件。本领域技术人员应可理解,硬件制造商可能会用不同名词来称呼同一个组件。本说明书及权利要求并不以名称的差异来作为区分组件的方式,而是以组件在功能上的差异来作为区分的准则。如在通篇说明书及权利要求当中所提及的“包含”为一开放式用语,故应解释成“包含但不限定于”。“大致”是指在可接收的误差范围内,本领域技术人员能够在一定误差范围内解决所述技术问题,基本达到所述技术效果。此外,“耦接”一词在此包含任何直接及间接的电性耦接手段。因此,若文中描述一第一装置耦接于一第二装置,则代表所述第一装置可直接电性耦接于所述第二装置,或通过其他装置或耦接手段间接地电性耦接至所述第二装置。说明书后续描述为实施本申请的较佳实施方式,然所述描述乃以说明本申请的一般原则为目的,并非用以限定本申请的范围。本申请的保护范围当视所附权利要求所界定者为准。
在现有技术当中,推送列表的多样性指数的计算方式,必须计算用户群中任意两个用户的推送列表的相似度。也就是说,假设N个推送列表要两两组合计算,计算次数达到N*N。从数学层面来说,其复杂度记作O(N2)。其计算复杂度很高,耗费运算资源。所以本申请中,将公开一种更简单的推送列表多样性的评测方法及系统,显著的降低多样性指数计算的复杂程度。
参见图1所示,为本申请所述方法的具体实施例。本实施例中所述方法包括以下步骤:
步骤101、设定用户群集合,所述用户群集合中包括多个用户;设定项目集合,所述项目集合中包括多个推送项目。
假设用户群集合中有N个用户,分别是{u1,u2,…,uN}。项目集合中包括M个推送项目,分别是{i1,i2,…,iM}。其中,所述推送项目可以是网络视频或者广告信息。
步骤102、为每个用户确定一个推送列表,所述推送列表中包括一个或多个项目集合中的推送项目。
每个用户都具有一个针对其制定的推送列表。所述推送列表中包括若干个项目集合中的推送项目。所述推送列表中的推送项目,即是针对推送给特定用户的相关项目。利用一个推送列表中,包含m个推送项目,则显然0<m<M,且m为整数。
步骤103、按照推送列表中推送项目的数量,对用户进行排序,得到用户序列。
已知每个用户均具有一个推送列表,并且推送列表中有若干推送项目,则本申请中以推送列表中推送项目的数量作为依据,对N个用户{u1,u2,…,uN}进行升序排序。
排序后即可得到一个用户序列,所述用户序列中每用户的序号为{1,2,…,k,…,N}。其中,k代表用户在用户序列中的序号,1≤k≤N。还可以得到用户群中各用户的推送项目数量的升序序列{m1,m2,…,mk,…,mN}。其中,mk意味着在用户序列中,序号为k的用户的推送列表中推送项目的数量,1≤mk≤M。
步骤104,建立直角坐标系,根据所述用户序列,及用户的推送列表中推送项目的数量,为每个用户确定其在直角坐标系中的坐标。
本实施例中,将用户在所述用户序列中的序列号作为横坐标;将用户的推送列表中推送项目的数量作为纵坐标。
按照前述就是说,用户uk的坐标为(k,mk)。
步骤105、根据所述用户坐标在所述直角坐标系中,生成推送列表曲线,并计算所述推送列表曲线的投影面积;以所述投影面积作为推送列表的多样性指数。
连接所述直角坐标系中的各个坐标点,即可生成推送列表曲线。参见图2所示,阴影区域的面积即所述投影面积。
投影面积的计算方式如下:
其中,diversity代表多样性指数,其数值相当于投影面积的值。
由此可见,本实施例中有N个推送列表,而在计算的过程中,仅仅是遍历N个列表,计算次数为N。从数学层面来说,其复杂度记作O(N)。相比现有技术计算次数达到N*N,复杂度为O(N2),本实施例中推送列表多样性的计算的次数和复杂程度显著降低。
步骤106、利用所述多样性指数对所述用户列表的多样性程度进行评测,得到评测结果。
通过以上技术方案可知,本实施例存在的有益效果是:显著的降低了推送列表多样性计算的次数和复杂程度,减少了多样性评测过程中对运算资源的消耗。
参见图3所示,为本申请实施例所述系统的结构示意图。本实施例中,所述系统用于实现图1所示实施例所述的方法,其技术方案本质上与图1所示实施例一致,图1所示实施例中相应的描述,同样适用于本实施例中。本实施例中所述系统包括:
集合模块301,用于设定用户群集合,所述用户群集合中包括多个用户;设定项目集合,所述项目集合中包括多个推送项目。
列表模块302,用于为每个用户确定一个推送列表,所述推送列表中包括一个或多个项目集合中的推送项目。
运算模块303,用于按照推送列表中推送项目的数量,对用户进行排序,得到用户序列;建立直角坐标系,根据所述用户序列,及用户的推送列表中推送项目的数量,为每个用户确定其在直角坐标系中的坐标;根据所述用户坐标在所述直角坐标系中,生成推送列表曲线,并计算所述推送列表曲线的投影面积;以所述投影面积作为推送列表的多样性指数。
所述运算模块303包括:
序列单元,用于按照推送列表中推送项目的数量,对用户进行升序排序。
坐标系单元,用于建立直角坐标系,根据所述用户序列,及用户的推送列表中推送项目的数量,为每个用户确定其在直角坐标系中的坐标;根据所述用户坐标在所述直角坐标系中,生成推送列表曲线。
投影单元,用于计算所述推送列表曲线的投影面积;以所述投影面积作为推送列表的多样性指数。
所述坐标系单元根据所述用户序列,及用户的推送列表中推送项目的数量,为每个用户确定其在直角坐标系中的坐标具体为:
将用户在所述用户序列中的序列号作为横坐标;将用户的推送列表中推送项目的数量作为纵坐标。
所述坐标系单元根据所述用户坐标在所述直角坐标系中,生成推送列表曲线具体为:
连接所述直角坐标系中的各个坐标点,生成推送列表曲线。
所述投影单元计算所述推送列表曲线的投影面积,以所述投影面积作为推送列表的多样性指数具体为:
其中,diversity代表多样性指数,M代表项目集合中推送项目的数量,N代表用户群集合中用户的数量,k代表用户在用户序列中的序号,mk代表在用户序列中,序号为k的用户的推送列表中推送项目的数量。
评测模块304,用于利用所述多样性指数对所述用户列表的多样性程度进行评测,得到评测结果。
通过以上技术方案可知,本实施例存在的有益效果是:显著的降低了推送列表多样性计算的次数和复杂程度,减少了多样性评测过程中对运算资源的消耗。
本领域内的技术人员应明白,本申请的实施例可提供为方法、装置、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
上述说明示出并描述了本申请的若干优选实施例,但如前所述,应当理解本申请并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述发明构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本申请的精神和范围,则都应在本申请所附权利要求的保护范围内。