CN104573113A - 一种信息处理方法及服务器 - Google Patents

一种信息处理方法及服务器 Download PDF

Info

Publication number
CN104573113A
CN104573113A CN201510056679.0A CN201510056679A CN104573113A CN 104573113 A CN104573113 A CN 104573113A CN 201510056679 A CN201510056679 A CN 201510056679A CN 104573113 A CN104573113 A CN 104573113A
Authority
CN
China
Prior art keywords
media information
group
feature parameter
user account
candidate group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510056679.0A
Other languages
English (en)
Other versions
CN104573113B (zh
Inventor
杨春风
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Tencent Computer Systems Co Ltd
Original Assignee
Shenzhen Tencent Computer Systems Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Tencent Computer Systems Co Ltd filed Critical Shenzhen Tencent Computer Systems Co Ltd
Priority to CN201510056679.0A priority Critical patent/CN104573113B/zh
Publication of CN104573113A publication Critical patent/CN104573113A/zh
Application granted granted Critical
Publication of CN104573113B publication Critical patent/CN104573113B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种信息处理方法及服务器,其中方法包括:从至少两个候选群组中选定目标群组;获取所述目标群组的操作记录,解析所述操作记录得到所述目标群组向信息数据库所请求的N个媒体信息;基于所述目标群组的操作记录确定针对N个媒体信息中每个媒体信息的请求次数,基于所述请求次数确定每个所述媒体信息对应的第一特征参数;基于所述至少两个候选群组的数量、以及请求所述N个媒体信息中每个媒体信息的候选群组的数量,计算得到所述N个媒体信息中每个媒体信息的第二特征参数;基于每个所述媒体信息对应的第一特征参数、以及第二特征参数对所述N个媒体信息排序得到排序结果,向所述目标群组中的用户账号推送的目标媒体信息。

Description

一种信息处理方法及服务器
技术领域
本发明涉及信息处理领域的处理技术,尤其涉及一种信息处理方法及服务器。
背景技术
随着通信技术的发展,具有相似特征或者属性的用户聚到一起形成一个群体,目前借助群体来推荐媒体信息有两种方法:
(1)个性化视频推荐:根据群内用户请求媒体信息的操作行为,在群内寻找与目标用户兴趣相似的用户,找到这些与目标用户最相似的用户们后把他们看过而目标用户没有看过的视频推荐给目标用户即可。
(2)非个性化视频推荐:将群成员请求媒体信息的操作次数进行统一的排序后的形成推荐列表,然后对每一个用户进行推荐。
但是,上述两种方法对于新加入群的用户或者行为较少用户无法使用或者效果差;并且计算复杂度较高,导致成本浪费;而仅使用观看次数最多的方式进行推荐,会导致无法体现多个群体之间的差异性,无法提升用户的使用体验。
发明内容
有鉴于此,本发明实施例的目的在于提供一种信息共享方法、装置及系统,能至少解决现有技术存在的上述问题。
本发明实施例提供了一种信息处理方法,所述方法包括:
从至少两个候选群组中选定目标群组;每个所述候选群组包括至少两个用户账号;
获取所述目标群组的操作记录,解析所述操作记录得到所述目标群组向信息数据库所请求的N个媒体信息;其中,N为大于等于1的正整数;
基于所述目标群组的操作记录确定针对N个媒体信息中每个媒体信息的请求次数,基于所述请求次数确定每个所述媒体信息对应的第一特征参数;
基于所述至少两个候选群组的数量、以及请求所述N个媒体信息中每个媒体信息的候选群组的数量,计算得到所述N个媒体信息中每个媒体信息的第二特征参数;
基于每个所述媒体信息对应的第一特征参数、以及每个所述媒体信息对应的第二特征参数对所述N个媒体信息排序得到排序结果,基于所述排序结果确定向所述目标群组中的用户账号推送的目标媒体信息。
上述方案中,所述基于所述目标群组的操作记录确定针对N个媒体信息中每个媒体信息的请求次数,基于所述请求次数确定每个所述媒体信息对应的第一特征参数,包括:
从所述目标群组的操作记录中逐个获取到针对N个媒体信息中每个媒体信息的全部请求;
将每个媒体信息的全部请求的次数直接作为每个所述媒体信息对应的第一特征参数。
上述方案中,所述基于所述目标群组的操作记录确定针对N个媒体信息中每个媒体信息的请求次数,基于所述请求次数确定每个所述媒体信息对应的第一特征参数,包括:
设置所述N个媒体信息中每个媒体信息对应的第一特征参数的初始值为零;
从所述目标群组的操作记录中逐个提取针对N个媒体信息中每个媒体信息的全部请求对应的M个用户账号,M为大于等于1的正整数;
逐个从所述M个用户账号中提取用户账号作为第一用户账号;
获取所述第一用户账号针对所述媒体信息发起的请求的次数;
判断所述次数是否满足第一预设条件,所述第一预设条件表征所述第一用户账号针对所述媒体信息发起的请求的次数为一;
当满足第一预设条件时,将所述第一用户账号针对所述媒体信息发起的请求的次数与第一预设权重值相乘得到计算结果,将计算结果与所述媒体信息的第一特征参数相加得到更新后的所述第一特征参数;
当不满足第一预设条件时,将所述第一用户账号针对所述媒体信息发起的请求的次数与第二预设权重值相乘得到计算结果,将计算结果与所述媒体信息第一特征参数相加得到更新后的所述第一特征参数;
其中,所述第一预设权重值与所述第二预设权重值不同,所述第二预设权重值小于所述第一预设权重值。
上述方案中,所述基于所述目标群组的操作记录确定针对N个媒体信息中每个媒体信息的请求次数,基于所述请求次数确定每个所述媒体信息对应的第一特征参数,包括:
从所述目标群组的操作记录中逐个提取针对N个媒体信息中每个媒体信息的全部请求对应的M个用户账号,M为大于等于1的正整数;
逐个从所述M个用户账号中提取用户账号作为第二用户账号;
获取所述第二用户账号针对所述媒体信息发起的请求的次数;
判断所述第二用户账号是否满足第二预设条件,所述第二预设条件表征所述第二用户账号加入所述目标群组的时长超过预设门限值;
当满足第二预设条件时,将所述第二用户账号针对所述媒体信息发起的请求的次数与第三预设权重值相乘得到计算结果,将计算结果与所述媒体信息的第一特征参数相加得到更新后的所述第一特征参数;
当不满足第二预设条件时,将所述第二用户账号针对所述媒体信息发起的请求的次数与第四预设权重值相乘得到计算结果,将计算结果与所述媒体信息的第一特征参数相加得到更新后的所述第一特征参数;其中,所述第四预设权重值小于所述第三预设权重值。
上述方案中,所述基于所述目标群组的操作记录确定针对N个媒体信息中每个媒体信息的请求次数,基于所述请求次数确定每个所述媒体信息对应的第一特征参数,包括:
从第一服务器中获取到针对所述N个媒体信息中每个媒体信息的第三特征参数;
利用第一预设模型以及所述第三特征参数,计算得到针对每个所述媒体信息的第五权重值;
利用所述第五权重值以及所述每个所述媒体信息的请求次数,计算得到所述媒体信息对应的第一特征参数。
上述方案中,所述获取到所述至少两个候选群组的操作记录;基于所述至少两个候选群组的数量、以及请求所述N个媒体信息中每个媒体信息的候选群组的数量,计算得到所述N个媒体信息中每个媒体信息的第二特征参数,包括:
获取到所述至少两个候选群组的操作记录,根据所述操作记录,确定所述至少两个候选群组的数量,并且确定所述至少两个候选群组中请求每个所述媒体信息的候选群组的数量;
计算所述至少两个候选群组的数量与所述请求每个媒体信息的候选群组的数量的比值;
根据所述至少两个候选群组的数量与所述请求每个媒体信息的候选群组的数量的比值,确定针对所述N个媒体信息中每个媒体信息的第二特征参数。
上述方案中,所述获取到所述至少两个候选群组的操作记录;基于所述至少两个候选群组的数量、以及请求所述N个媒体信息中每个媒体信息的候选群组的数量,计算得到所述N个媒体信息中每个媒体信息的第二特征参数,包括:
获取到所述至少两个候选群组的用户账号的数量作为所述至少两个候选群组的数量;
获取到所述至少两个候选群组的操作记录,根据所述操作记录确定所述至少两个候选群组中请求每个所述媒体信息的用户账号的数量作为候选群组的数量;
计算所述至少两个候选群组的用户账号的数量与所述至少两个候选群组中请求每个所述媒体信息的用户账号的数量的比值;
根据所述比值,确定针对所述N个媒体信息中每个媒体信息的第二特征参数。
本发明实施例还提供了一种服务器,所述服务器包括:
选取单元,用于从至少两个候选群组中选定目标群组;每个所述候选群组包括至少两个用户账号;获取所述目标群组的操作记录,解析所述操作记录得到所述目标群组向信息数据库所请求的N个媒体信息;其中,N为大于等于1的正整数;
第一计算单元,用于基于所述目标群组的操作记录确定针对N个媒体信息中每个媒体信息的请求次数,基于所述请求次数确定每个所述媒体信息对应的第一特征参数;
第二计算单元,用于基于所述至少两个候选群组的数量、以及请求所述N个媒体信息中每个媒体信息的候选群组的数量,计算得到所述N个媒体信息中每个媒体信息的第二特征参数;
处理单元,用于基于每个所述媒体信息对应的第一特征参数、以及每个所述媒体信息对应的第二特征参数对所述N个媒体信息排序得到排序结果,基于所述排序结果确定向所述目标群组中的用户账号推送的目标媒体信息。
上述方案中,所述第一计算单元,具体用于从所述目标群组的操作记录中逐个获取到针对N个媒体信息中每个媒体信息的全部请求;将每个媒体信息的全部请求的次数直接作为每个所述媒体信息对应的第一特征参数。
上述方案中,所述第一计算单元,具体用于设置所述N个媒体信息中每个媒体信息对应的第一特征参数的初始值为零;从所述目标群组的操作记录中逐个提取针对N个媒体信息中每个媒体信息的全部请求对应的M个用户账号,M为大于等于1的正整数;逐个从所述M个用户账号中提取用户账号作为第一用户账号;获取所述第一用户账号针对所述媒体信息发起的请求的次数;判断所述次数是否满足第一预设条件,所述第一预设条件表征所述第一用户账号针对所述媒体信息发起的请求的次数为一;当满足第一预设条件时,将所述第一用户账号针对所述媒体信息发起的请求的次数与第一预设权重值相乘得到计算结果,将计算结果与所述媒体信息的第一特征参数相加得到更新后的所述第一特征参数;当不满足第一预设条件时,将所述第一用户账号针对所述媒体信息发起的请求的次数与第二预设权重值相乘得到计算结果,将计算结果与所述媒体信息第一特征参数相加得到更新后的所述第一特征参数;
其中,所述第一预设权重值与所述第二预设权重值不同,所述第二预设权重值小于所述第一预设权重值。
上述方案中,所述第一计算单元,具体用于从所述目标群组的操作记录中逐个提取针对N个媒体信息中每个媒体信息的全部请求对应的M个用户账号,M为大于等于1的正整数;逐个从所述M个用户账号中提取用户账号作为第二用户账号;获取所述第二用户账号针对所述媒体信息发起的请求的次数;判断所述第二用户账号是否满足第二预设条件,所述第二预设条件表征所述第二用户账号加入所述目标群组的时长超过预设门限值;当满足第二预设条件时,将所述第二用户账号针对所述媒体信息发起的请求的次数与第三预设权重值相乘得到计算结果,将计算结果与所述媒体信息的第一特征参数相加得到更新后的所述第一特征参数;
当不满足第二预设条件时,将所述第二用户账号针对所述媒体信息发起的请求的次数与第四预设权重值相乘得到计算结果,将计算结果与所述媒体信息的第一特征参数相加得到更新后的所述第一特征参数;其中,所述第四预设权重值小于所述第三预设权重值。
上述方案中,所述第一计算单元,具体用于从第一服务器中获取到针对所述N个媒体信息中每个媒体信息的第三特征参数;利用第一预设模型以及所述第三特征参数,计算得到针对每个所述媒体信息的第五权重值;利用所述第五权重值以及所述每个所述媒体信息的请求次数,计算得到所述媒体信息对应的第一特征参数。
上述方案中,所述第二计算单元,具体用于获取到所述至少两个候选群组的操作记录,根据所述操作记录,确定所述至少两个候选群组的数量,并且确定所述至少两个候选群组中请求每个所述媒体信息的候选群组的数量;计算所述至少两个候选群组的数量与所述请求每个媒体信息的候选群组的数量的比值;根据所述至少两个候选群组的数量与所述请求每个媒体信息的候选群组的数量的比值,确定针对所述N个媒体信息中每个媒体信息的第二特征参数。
上述方案中,所述第一计算单元,具体用于获取到所述至少两个候选群组的用户账号的数量作为所述至少两个候选群组的数量;获取到所述至少两个候选群组的操作记录,根据所述操作记录确定所述至少两个候选群组中请求每个所述媒体信息的用户账号的数量作为候选群组的数量;计算所述至少两个候选群组的用户账号的数量与所述至少两个候选群组中请求每个所述媒体信息的用户账号的数量的比值;根据所述比值,确定针对所述N个媒体信息中每个媒体信息的第二特征参数。
本发明实施例所提供的信息处理方法及服务器,能基于目标群组的操作记录确定针对多个媒体信息的请求次数,进而确定第一特征参数;然后根据至少两个候选群组的数量以及请求所述至少两个候选群组中每个媒体信息的数量计算得到第二特征参数,根据多个媒体信息的第一特征参数以及第二特征参数确定所述多个媒体信息的排序,根据排序结果向目标群组中的用户推送媒体信息。如此,既考虑到目标群组针对媒体信息的操作又结合了全部全部针对媒体信息的操作,避免了目标群组内由于用户行为较少而无法获得最合理的推荐信息,又体现出了群组之间的差异性,提升用户的使用体验。
附图说明
图1为本发明实施例信息处理方法流程示意图;
图2为本发明实施例场景示意图一;
图3为本发明实施例第一特征参数计算流程示意图一;
图4为本发明实施例场景示意图二;
图5为本发明实施例第一特征参数计算流程示意图二;
图6为本发明实施例第一特征参数计算流程示意图三;
图7为本发明实施例第二特征参数方程式对应曲线图;
图8为本发明实施例场景示意图三;
图9为本发明实施例服务器组成结构示意图;
图10为本发明实施例服务器硬件组成结构示意图。
具体实施方式
下面结合附图及具体实施例对本发明实施例再作进一步详细的说明。
实施例一、
本发明实施例提供了一种信息处理方法,如图1所示,所述方法包括:
步骤101:从至少两个候选群组中选定目标群组;每个所述候选群组包括至少两个用户;
步骤102:获取所述目标群组的操作记录,解析所述操作记录得到所述目标群组向信息数据库所请求的N个媒体信息;其中,N为大于等于1的正整数;
步骤103:基于所述目标群组的操作记录确定针对N个媒体信息中每个媒体信息的请求次数,基于所述请求次数确定每个所述媒体信息对应的第一特征参数;
步骤104:基于所述至少两个候选群组的数量、以及请求所述N个媒体信息中每个媒体信息的候选群组的数量,计算得到所述N个媒体信息中每个媒体信息的第二特征参数;
步骤105:基于每个所述媒体信息对应的第一特征参数、以及每个所述媒体信息对应的第二特征参数对所述N个媒体信息排序得到排序结果,基于所述排序结果确定向所述目标群组中的用户账号推送的目标媒体信息。
这里,所述候选群组可以为具有相似特征或者属性的用户聚到一起形成一个群体。以群体形式的方式不同,所述候选群组可以由多种类型,比如可以为显式形成的群(explicitly formed group),如QQ群;或者为隐式产生的群(implicitly formed group),即用聚类(clustering)算法聚成的群。
另外,获取候选群组的信息的方法可以为从服务器中获取,比如,如果是对QQ群进行操作,那么就可以是在QQ应用服务器中获取到所有的候选群组的信息。
所述选定目标群组的方式可以为根据实际情况选定,比如,可以由管理人员在服务器一侧进行设置;或者,还可以周期性的从候选群组中逐个选取目标群组;或者,还可以为根据所述候选群组的属性信息确定所述目标群组,其中,所述属性信息可以表征所述候选群组的类型或者标签,比如,如果一个群组的属性信息表征所述群组为一个影视兴趣群,那么就可以选定该群组作为目标群组,如果一个群组的属性信息表征所述群组为一个商业群,那么就可以不选定该群组作为目标群组。
优选地,所述获取所述目标群组的操作记录可以为:从所述服务器中获取到所述目标群组的全部相关信息,从所述目标群组的全部相关信息中提取所述目标群组的操作记录。
所述操作记录用于记录目标群组中全部用户账号发起的操作,比如,可以包括有所述目标群组中全部用户账号发出以及获取到的文字或图片信息,还可以包括所述目标群组中所有用户账号从媒体数据库请求的所有媒体信息。
优选地,所述基于所述目标群组的操作记录确定针对N个媒体信息中每个媒体信息的请求次数,基于所述请求次数确定每个所述媒体信息对应的第一特征参数,可以包括:从所述目标群组的操作记录中逐个获取到针对N个媒体信息中每个媒体信息的全部请求;将每个媒体信息的全部请求的次数直接作为每个所述媒体信息对应的第一特征参数。其中,所述第一特征参数表征所述媒体信息的热度值,即媒体信息目标群组中的用户观看过的次数。
优选地,所述基于所述至少两个候选群组的数量、以及请求所述N个媒体信息中每个媒体信息的候选群组的数量,计算得到所述N个媒体信息中每个媒体信息的第二特征参数可以包括:获取到所述至少两个候选群组的操作记录,根据所述操作记录,确定所述至少两个候选群组的数量,并且确定所述至少两个候选群组中请求每个所述媒体信息的候选群组的数量;计算所述至少两个候选群组的数量与所述请求每个媒体信息的候选群组的数量的比值;根据所述至少两个候选群组的数量与所述请求每个媒体信息的候选群组的数量的比值,确定针对所述N个媒体信息中每个媒体信息的第二特征参数。
比如,如图2所示,候选群组为QQ群,假设有4个QQ群;N为2,即有两个媒体信息,分别为第一媒体信息和第二媒体信息;其中,4个QQ群中请求两个媒体信息的群分别为4个以及1个,那么针对这两个媒体信息分别计算4个与4个的比值,以及4个与1个的比值,然后将这两个比值分别作为上述两个媒体信息的第二特征参数。本实施例中所述第二特征参数能够表征媒体信息的群组差异度。
优选地,所述基于每个所述媒体信息对应的第一特征参数、以及每个所述媒体信息对应的第二特征参数对所述N个媒体信息排序得到排序结果,包括:
将每个所述媒体信息对应的第一特征参数与所述第二特征参数相乘,得到每个所述媒体信息的分值;
根据所述每个媒体信息的分值对所述N个媒体信息进行排序得到排序结果。
所述基于所述排序结果确定向所述目标群组中的用户账号推送的目标媒体信息可以包括:基于所述排序结果确定将前指定位的至少一个媒体信息作为目标媒体信息,向所述目标群组中的全部用户账号推送目标媒体信息;其中,所述前指定为可以为根据实际情况设置,可以设置为前一位,即将排序第一的媒体信息作为目标媒体信息推送给目标群组中的全部用户;或者,前指定位还可以为前两位,即将排序在前两位的媒体信息作为目标媒体信息推送给目标群组中的全部用户。
本实施例中所述媒体信息可以包括:图片、文字、视频等类型的信息。
可见,采用上述方案,基于目标群组的操作记录确定针对多个媒体信息的请求次数,进而确定第一特征参数;然后根据至少两个候选群组的数量以及请求所述至少两个候选群组中每个媒体信息的数量计算得到第二特征参数,根据多个媒体信息的第一特征参数以及第二特征参数确定所述多个媒体信息的排序,根据排序结果向目标群组中的用户推送媒体信息。如此,既考虑到目标群组针对媒体信息的操作又结合了全部全部针对媒体信息的操作,避免了目标群组内由于用户行为较少而无法获得最合理的推荐信息,又体现出了群组之间的差异性,提升用户的使用体验。
实施例二、
本发明实施例提供了一种信息处理方法,如图1所示,所述方法包括:
步骤101:从至少两个候选群组中选定目标群组;每个所述候选群组包括至少两个用户;
步骤102:获取所述目标群组的操作记录,解析所述操作记录得到所述目标群组向信息数据库所请求的N个媒体信息;其中,N为大于等于1的正整数;
步骤103:基于所述目标群组的操作记录确定针对N个媒体信息中每个媒体信息的请求次数,基于所述请求次数确定每个所述媒体信息对应的第一特征参数;
步骤104:基于所述至少两个候选群组的数量、以及请求所述N个媒体信息中每个媒体信息的候选群组的数量,计算得到所述N个媒体信息中每个媒体信息的第二特征参数;
步骤105:基于每个所述媒体信息对应的第一特征参数、以及每个所述媒体信息对应的第二特征参数对所述N个媒体信息排序得到排序结果,基于所述排序结果确定向所述目标群组中的用户账号推送的目标媒体信息。
这里,所述候选群组可以为具有相似特征或者属性的用户聚到一起形成一个群体。以群体形式的方式不同,所述候选群组可以由多种类型,比如可以为显式形成的群(explicitly formed group),如QQ群;或者为隐式产生的群(implicitly formed group),即用聚类(clustering)算法聚成的群。
另外,获取候选群组的信息的方法可以为从服务器中获取,比如,如果是对QQ群进行操作,那么就可以是在QQ应用服务器中获取到所有的候选群组的信息。
所述选定目标群组的方式可以为根据实际情况选定,比如,可以由管理人员在服务器一侧进行设置;或者,还可以周期性的从候选群组中逐个选取目标群组;或者,还可以为根据所述候选群组的属性信息确定所述目标群组,其中,所述属性信息可以表征所述候选群组的类型或者标签,比如,如果一个群组的属性信息表征所述群组为一个影视兴趣群,那么就可以选定该群组作为目标群组,如果一个群组的属性信息表征所述群组为一个商业群,那么就可以不选定该群组作为目标群组。
优选地,所述获取所述目标群组的操作记录可以为:从所述服务器中获取到所述目标群组的全部相关信息,从所述目标群组的全部相关信息中提取所述目标群组的操作记录。
所述操作记录用于记录目标群组中全部用户账号发起的操作,比如,可以包括有所述目标群组中全部用户账号发出以及获取到的文字或图片信息,还可以包括所述目标群组中所有用户账号从媒体数据库请求的所有媒体信息。
本实施例中所述媒体信息可以包括:图片、文字、视频等类型的信息。
优选地,所述基于所述目标群组的操作记录确定针对N个媒体信息中每个媒体信息的请求次数,基于所述请求次数确定每个所述媒体信息对应的第一特征参数,如图3所示,包括:
步骤301:设置所述N个媒体信息中每个媒体信息对应的第一特征参数的初始值为零;
步骤302:从所述目标群组的操作记录中逐个提取针对N个媒体信息中每个媒体信息的全部请求对应的M个用户账号,M为大于等于1的正整数;
步骤303:逐个从所述M个用户账号中提取用户账号作为第一用户账号;
步骤304:获取所述第一用户账号针对所述媒体信息发起的请求的次数;
步骤305:判断所述次数是否满足第一预设条件,所述第一预设条件表征所述第一用户账号针对所述媒体信息发起的请求的次数为一;当满足第一预设条件时,执行步骤306;当不满足第一预设条件时,执行步骤307;
步骤306:将所述第一用户账号针对所述媒体信息发起的请求的次数与第一预设权重值相乘得到计算结果,将计算结果与所述媒体信息的第一特征参数相加得到更新后的所述第一特征参数,结束处理流程;
步骤307:将所述第一用户账号针对所述媒体信息发起的请求的次数与第二预设权重值相乘得到计算结果,将计算结果与所述媒体信息第一特征参数相加得到更新后的所述第一特征参数;
其中,所述第一预设权重值与所述第二预设权重值不同,所述第二预设权重值小于所述第一预设权重值。比如,第一预设权重值为1,第二预设权重值为0.3。
比如,图4所示,假设N等于二,即目标群组中全部用户请求过的媒体信息为两个,分别为第一媒体信息41和第二媒体信息42;首先将两个媒体信息的第一特征参数初始值均设置为零;
然后逐个媒体信息进行分析,首先提取第一媒体信息41,目标群组中请求过第一媒体信息的用户数量为三个,分别为用户1、用户2和用户3;
从三个请求过第一媒体信息的用户中,用户1请求第一媒体信息的次数为2,用户1请求第一媒体信息的次数大于一,就降低该用户请求第一媒体信息的次数的权重值,将次数2与第二预设权重值相乘,假设第二预设权重值为0.3,则计算得到的结果为0.6,将计算得到的结果与第一特征值相加得到更新后的第一特征参数,即当前第一特征参数等于0.6;
再获取到用户2请求第一媒体信息的次数为3,同样降低用户2请求次数的权重值,将该次数与第二预设权重值相乘得到计算结果为0.9,再将计算结果与第一特征参数相加得到1.5,将1.5作为更新后的第一特征参数;
最后获取用户3请求第一媒体信息的次数为1,将次数与第一权重值相乘得到计算结果为1,将计算结果与第一特征参数相加结果为2.5,则2.5为更新后的第一媒体信息的第一特征参数。
按照上述计算方法,再计算第二媒体信息的第一特征参数。
如此,就能够通过增加用户账号的权重值,来进一步提升第一特征参数的准确性。
优选地,所述基于所述至少两个候选群组的数量、以及请求所述N个媒体信息中每个媒体信息的候选群组的数量,计算得到所述N个媒体信息中每个媒体信息的第二特征参数可以包括:获取到所述至少两个候选群组的操作记录,根据所述操作记录,确定所述至少两个候选群组的数量,并且确定所述至少两个候选群组中请求每个所述媒体信息的候选群组的数量;计算所述至少两个候选群组的数量与所述请求每个媒体信息的候选群组的数量的比值;根据所述至少两个候选群组的数量与所述请求每个媒体信息的候选群组的数量的比值,确定针对所述N个媒体信息中每个媒体信息的第二特征参数。
其中,所述根据所述至少两个候选群组的数量与所述请求每个媒体信息的候选群组的数量的比值,确定针对所述N个媒体信息中每个媒体信息的第二特征参数可以有两种实现方式:
方式一、直接将所述至少两个候选群组的数量与所述请求每个媒体信息的候选群组的数量的比值,作为所述N个媒体信息中每个媒体信息的第二特征参数;
方式二、计算将所述至少两个候选群组的数量与所述请求每个媒体信息的候选群组的数量的比值的对数值,将计算得到的对数值作为所述N个媒体信息中每个媒体信息的第二特征参数。
比如,候选群组为QQ群,假设有10个QQ群;N为2,即有两个媒体信息,其中,10个QQ群中请求两个媒体信息的群分别为4个以及3个,那么针对这两个媒体信息分别计算10个与4个的比值,以及10个与3个的比值,然后将这两个比值分别作为上述两个媒体信息的第二特征参数。本实施例中所述第二特征参数能够表征媒体信息的群组差异度。
优选地,所述基于每个所述媒体信息对应的第一特征参数、以及每个所述媒体信息对应的第二特征参数对所述N个媒体信息排序得到排序结果,包括:
将每个所述媒体信息对应的第一特征参数与所述第二特征参数相乘,得到每个所述媒体信息的分值;
根据所述每个媒体信息的分值对所述N个媒体信息进行排序得到排序结果。
本实施例根据第一特征参数和第二特征参数计算得到媒体信息的分值,可以采用以下公式来表示,假设媒体信息为视频:
local _ m _ count * log 2 ( total _ group _ count group _ with _ m _ count )
其中,local_m_count为视频被目标群组的群成员请求的次数,即局部热度,它度量了群内共同性;为全部群的数量与有观看过视频的群数量的比值的对数值,度量了群间差异性,即越少的群看了某部视频,则这个视频越能成为某个群的代表性视频。
优选地,所述基于所述排序结果确定向所述目标群组中的用户账号推送的目标媒体信息可以包括:基于所述排序结果确定将前指定位的至少一个媒体信息作为目标媒体信息,向所述目标群组中的全部用户账号推送目标媒体信息;其中,所述前指定为可以为根据实际情况设置,可以设置为前一位,即将排序第一的媒体信息作为目标媒体信息推送给目标群组中的全部用户;或者,前指定位还可以为前两位,即将排序在前两位的媒体信息作为目标媒体信息推送给目标群组中的全部用户。
可见,采用上述方案,基于目标群组的操作记录确定针对多个媒体信息的请求次数,进而确定第一特征参数;然后根据至少两个候选群组的数量以及请求所述至少两个候选群组中每个媒体信息的数量计算得到第二特征参数,根据多个媒体信息的第一特征参数以及第二特征参数确定所述多个媒体信息的排序,根据排序结果向目标群组中的用户推送媒体信息。如此,既考虑到目标群组针对媒体信息的操作又结合了全部全部针对媒体信息的操作,避免了目标群组内由于用户行为较少而无法获得最合理的推荐信息,又体现出了群组之间的差异性,提升用户的使用体验。
实施例三、
本发明实施例提供了一种信息处理方法,如图1所示,所述方法包括:
步骤101:从至少两个候选群组中选定目标群组;每个所述候选群组包括至少两个用户;
步骤102:获取所述目标群组的操作记录,解析所述操作记录得到所述目标群组向信息数据库所请求的N个媒体信息;其中,N为大于等于1的正整数;
步骤103:基于所述目标群组的操作记录确定针对N个媒体信息中每个媒体信息的请求次数,基于所述请求次数确定每个所述媒体信息对应的第一特征参数;
步骤104:基于所述至少两个候选群组的数量、以及请求所述N个媒体信息中每个媒体信息的候选群组的数量,计算得到所述N个媒体信息中每个媒体信息的第二特征参数;
步骤105:基于每个所述媒体信息对应的第一特征参数、以及每个所述媒体信息对应的第二特征参数对所述N个媒体信息排序得到排序结果,基于所述排序结果确定向所述目标群组中的用户账号推送的目标媒体信息。
这里,所述候选群组可以为具有相似特征或者属性的用户聚到一起形成一个群体。以群体形式的方式不同,所述候选群组可以由多种类型,比如可以为显式形成的群(explicitly formed group),如QQ群;或者为隐式产生的群(implicitly formed group),即用聚类(clustering)算法聚成的群。
另外,获取候选群组的信息的方法可以为从服务器中获取,比如,如果是对QQ群进行操作,那么就可以是在QQ应用服务器中获取到所有的候选群组的信息。
所述选定目标群组的方式可以为根据实际情况选定,比如,可以由管理人员在服务器一侧进行设置;或者,还可以周期性的从候选群组中逐个选取目标群组;或者,还可以为根据所述候选群组的属性信息确定所述目标群组,其中,所述属性信息可以表征所述候选群组的类型或者标签,比如,如果一个群组的属性信息表征所述群组为一个影视兴趣群,那么就可以选定该群组作为目标群组,如果一个群组的属性信息表征所述群组为一个商业群,那么就可以不选定该群组作为目标群组。
优选地,所述获取所述目标群组的操作记录可以为:从所述服务器中获取到所述目标群组的全部相关信息,从所述目标群组的全部相关信息中提取所述目标群组的操作记录。
所述操作记录用于记录目标群组中全部用户账号发起的操作,比如,可以包括有所述目标群组中全部用户账号发出以及获取到的文字或图片信息,还可以包括所述目标群组中所有用户账号从媒体数据库请求的所有媒体信息。
本实施例中所述媒体信息可以包括:图片、文字、视频等类型的信息。
优选地,所述基于所述目标群组的操作记录确定针对N个媒体信息中每个媒体信息的请求次数,基于所述请求次数确定每个所述媒体信息对应的第一特征参数,如图5所示,包括:
步骤501:从所述目标群组的操作记录中逐个提取针对N个媒体信息中每个媒体信息的全部请求对应的M个用户账号,M为大于等于1的正整数;
步骤502:逐个从所述M个用户账号中提取用户账号作为第二用户账号;
步骤503:获取所述第二用户账号针对所述媒体信息发起的请求的次数;
步骤504:判断所述第二用户账号是否满足第二预设条件,所述第二预设条件表征所述第二用户账号加入所述目标群组的时长超过预设门限值;当满足第二预设条件时,执行步骤505;当不满足第二预设条件时,执行步骤506;
步骤505:将所述第二用户账号针对所述媒体信息发起的请求的次数与第三预设权重值相乘得到计算结果,将计算结果与所述媒体信息的第一特征参数相加得到更新后的所述第一特征参数,结束;
步骤506:将所述第二用户账号针对所述媒体信息发起的请求的次数与第四预设权重值相乘得到计算结果,将计算结果与所述媒体信息的第一特征参数相加得到更新后的所述第一特征参数;其中,所述第四预设权重值小于所述第三预设权重值。比如,第三预设权重值可以为2,第四预设权重值为1。所述预设门限值可以为3个月。
比如N等于二,即目标群组中全部用户请求过的媒体信息为两个,分别为第一媒体信息和第二媒体信息;首先将两个媒体信息的第一特征参数初始值均设置为零;
然后逐个媒体信息进行分析,首先提取第一媒体信息,目标群组中请求过第一媒体信息的用户数量为三个,分别为用户1、用户2和用户3;
从三个请求过第一媒体信息的用户中,用户1请求第一媒体信息的次数为2,并且用户1加入目标群组的时长为1年,将次数2与第三预设权重值相乘,计算得到的结果为4,将计算得到的结果与第一特征值相加得到更新后的第一特征参数,即当前第一特征参数等于4;
再获取到用户2请求第一媒体信息的次数为3,并且用户2加入目标群组的时长为30天,将该次数与第四预设权重值相乘得到计算结果为3,再将计算结果与第一特征参数相加得到7,将7作为更新后的第一特征参数;
最后获取用户3请求第一媒体信息的次数为1,用户3加入目标群组的时长为1年,将次数与第三权重值相乘得到计算结果为2,将计算结果与第一特征参数相加结果为9,则9为更新后的第一媒体信息的第一特征参数。
按照上述计算方法,再计算第二媒体信息的第一特征参数。
如此,就能够根据用户加入目标群组的时长的权重值,来进一步提升第一特征参数的准确性。
优选地,所述基于所述至少两个候选群组的数量、以及请求所述N个媒体信息中每个媒体信息的候选群组的数量,计算得到所述N个媒体信息中每个媒体信息的第二特征参数可以包括:获取到所述至少两个候选群组的操作记录,根据所述操作记录,确定所述至少两个候选群组的数量,并且确定所述至少两个候选群组中请求每个所述媒体信息的候选群组的数量;计算所述至少两个候选群组的数量与所述请求每个媒体信息的候选群组的数量的比值;根据所述至少两个候选群组的数量与所述请求每个媒体信息的候选群组的数量的比值,确定针对所述N个媒体信息中每个媒体信息的第二特征参数。
其中,所述根据所述至少两个候选群组的数量与所述请求每个媒体信息的候选群组的数量的比值,确定针对所述N个媒体信息中每个媒体信息的第二特征参数可以有两种实现方式:
方式一、直接将所述至少两个候选群组的数量与所述请求每个媒体信息的候选群组的数量的比值,作为所述N个媒体信息中每个媒体信息的第二特征参数;
方式二、计算将所述至少两个候选群组的数量与所述请求每个媒体信息的候选群组的数量的比值的对数值,将计算得到的对数值作为所述N个媒体信息中每个媒体信息的第二特征参数。
比如,候选群组为QQ群,假设有10个QQ群;N为2,即有两个媒体信息,其中,10个QQ群中请求两个媒体信息的群分别为4个以及3个,那么针对这两个媒体信息分别计算10个与4个的比值,以及10个与3个的比值,然后将这两个比值分别作为上述两个媒体信息的第二特征参数。本实施例中所述第二特征参数能够表征媒体信息的群组差异度。
优选地,所述基于每个所述媒体信息对应的第一特征参数、以及每个所述媒体信息对应的第二特征参数对所述N个媒体信息排序得到排序结果,包括:
将每个所述媒体信息对应的第一特征参数与所述第二特征参数相乘,得到每个所述媒体信息的分值;
根据所述每个媒体信息的分值对所述N个媒体信息进行排序得到排序结果。
本实施例根据第一特征参数和第二特征参数计算得到媒体信息的分值,可以采用以下公式来表示,假设媒体信息为视频:
local _ m _ count * log 2 ( total _ group _ count group _ with _ m _ count )
其中,local_m_count为视频被目标群组的群成员请求的次数,即局部热度,它度量了群内共同性;为全部群的数量与有观看过视频的群数量的比值的对数值,度量了群间差异性,即越少的群看了某部视频,则这个视频越能成为某个群的代表性视频。
优选地,所述基于所述排序结果确定向所述目标群组中的用户账号推送的目标媒体信息可以包括:基于所述排序结果确定将前指定位的至少一个媒体信息作为目标媒体信息,向所述目标群组中的全部用户账号推送目标媒体信息;其中,所述前指定为可以为根据实际情况设置,可以设置为前一位,即将排序第一的媒体信息作为目标媒体信息推送给目标群组中的全部用户;或者,前指定位还可以为前两位,即将排序在前两位的媒体信息作为目标媒体信息推送给目标群组中的全部用户。
可见,采用上述方案,基于目标群组的操作记录确定针对多个媒体信息的请求次数确定第一特征参数,然后根据至少两个候选群组的数量以及请求所述至少两个候选群组中每个媒体信息的数量计算得到第二特征参数,确定多个媒体信息的第一特征参数以及第二特征参数确定所述多个媒体信息的排序,根据排序结果向目标群组中的用户推送媒体信息。如此,就能够结合目标群组以及全部候选群组获取媒体信息的操作情况,向用户合理的推荐媒体信息,提升用户的使用体验。
实施例四、
本发明实施例提供了一种信息处理方法,如图1所示,所述方法包括:
步骤101:从至少两个候选群组中选定目标群组;每个所述候选群组包括至少两个用户;
步骤102:获取所述目标群组的操作记录,解析所述操作记录得到所述目标群组向信息数据库所请求的N个媒体信息;其中,N为大于等于1的正整数;
步骤103:基于所述目标群组的操作记录确定针对N个媒体信息中每个媒体信息的请求次数,基于所述请求次数确定每个所述媒体信息对应的第一特征参数;
步骤104:基于所述至少两个候选群组的数量、以及请求所述N个媒体信息中每个媒体信息的候选群组的数量,计算得到所述N个媒体信息中每个媒体信息的第二特征参数;
步骤105:基于每个所述媒体信息对应的第一特征参数、以及每个所述媒体信息对应的第二特征参数对所述N个媒体信息排序得到排序结果,基于所述排序结果确定向所述目标群组中的用户账号推送的目标媒体信息。
这里,所述候选群组可以为具有相似特征或者属性的用户聚到一起形成一个群体。以群体形式的方式不同,所述候选群组可以由多种类型,比如可以为显式形成的群(explicitly formed group),如QQ群;或者为隐式产生的群(implicitly formed group),即用聚类(clustering)算法聚成的群。
另外,获取候选群组的信息的方法可以为从服务器中获取,比如,如果是对QQ群进行操作,那么就可以是在QQ应用服务器中获取到所有的候选群组的信息。
所述选定目标群组的方式可以为根据实际情况选定,比如,可以由管理人员在服务器一侧进行设置;或者,还可以周期性的从候选群组中逐个选取目标群组;或者,还可以为根据所述候选群组的属性信息确定所述目标群组,其中,所述属性信息可以表征所述候选群组的类型或者标签,比如,如果一个群组的属性信息表征所述群组为一个影视兴趣群,那么就可以选定该群组作为目标群组,如果一个群组的属性信息表征所述群组为一个商业群,那么就可以不选定该群组作为目标群组。
优选地,所述获取所述目标群组的操作记录可以为:从所述服务器中获取到所述目标群组的全部相关信息,从所述目标群组的全部相关信息中提取所述目标群组的操作记录。
所述操作记录用于记录目标群组中全部用户账号发起的操作,比如,可以包括有所述目标群组中全部用户账号发出以及获取到的文字或图片信息,还可以包括所述目标群组中所有用户账号从媒体数据库请求的所有媒体信息。
本实施例中所述媒体信息可以包括:图片、文字、视频等类型的信息。
优选地,所述基于所述目标群组的操作记录确定针对N个媒体信息中每个媒体信息的请求次数,基于所述请求次数确定每个所述媒体信息对应的第一特征参数,如图6所示,包括:
步骤601:从第一服务器中获取到针对所述N个媒体信息中每个媒体信息的第三特征参数;
步骤602:利用第一预设模型以及所述第三特征参数,计算得到针对每个所述媒体信息的第五权重值;
步骤603:利用所述第五权重值以及所述每个所述媒体信息的请求次数,计算得到所述媒体信息对应的第一特征参数。
其中,所述第一服务器可以为媒体信息所在的服务器,比如,当媒体信息为视频时,所述第一服务器即为视频服务器。
所述媒体信息的第三特征值可以为所述媒体信息在第一服务器中被请求的次数排名,比如,第一服务器为视频服务器时,第三特征值即表征某一个视频被用户观看过的次数排名。
所述第一预设模型可以为预设的公式,该公式的特征为:当媒体信息被请求的次数排名在小于媒体信息总数的一半时,使得计算结果随着请求的次数排名的增加而降低,当媒体信息被请求的次数排名不小于媒体信息总数的一半时,使得计算结果对着请求次数排名的增加而提升,比如,可以使用以下公式作为第一预设模型:
其中,ri为全站中媒体信息i被请求的次数的排名,最热的视频排名为1;a和b均为常数,可以将a设置为1、b设置为0;half_cnt是指第一服务器中保存的全部媒体信息的数量的一半;如,媒体信息为电影,第一服务器中现有7000部电影,则half_cnt=3500,该公式的函数曲线如图7所示,可见采用该公式可以使得计算结果随着请求的次数排名的增加而降低,当媒体信息被请求的次数排名不小于媒体信息总数的一半时,使得计算结果对着请求次数排名的增加而提升。
如此,能够根据不希望推荐太热或者太冷视频的思想,调整媒体信息的第一特征参数。
优选地,所述基于所述至少两个候选群组的数量、以及请求所述N个媒体信息中每个媒体信息的候选群组的数量,计算得到所述N个媒体信息中每个媒体信息的第二特征参数可以包括:获取到所述至少两个候选群组的操作记录,根据所述操作记录,确定所述至少两个候选群组的数量,并且确定所述至少两个候选群组中请求每个所述媒体信息的候选群组的数量;计算所述至少两个候选群组的数量与所述请求每个媒体信息的候选群组的数量的比值;根据所述至少两个候选群组的数量与所述请求每个媒体信息的候选群组的数量的比值,确定针对所述N个媒体信息中每个媒体信息的第二特征参数。
其中,所述根据所述至少两个候选群组的数量与所述请求每个媒体信息的候选群组的数量的比值,确定针对所述N个媒体信息中每个媒体信息的第二特征参数可以有两种实现方式:
方式一、直接将所述至少两个候选群组的数量与所述请求每个媒体信息的候选群组的数量的比值,作为所述N个媒体信息中每个媒体信息的第二特征参数;
方式二、计算将所述至少两个候选群组的数量与所述请求每个媒体信息的候选群组的数量的比值的对数值,将计算得到的对数值作为所述N个媒体信息中每个媒体信息的第二特征参数。
比如,候选群组为QQ群,假设有10个QQ群;N为2,即有两个媒体信息,其中,10个QQ群中请求两个媒体信息的群分别为4个以及3个,那么针对这两个媒体信息分别计算10个与4个的比值,以及10个与3个的比值,然后将这两个比值分别作为上述两个媒体信息的第二特征参数。本实施例中所述第二特征参数能够表征媒体信息的群组差异度。
另外,计算媒体信息的第二特征参数还可以采用以下方式:
获取到所述至少两个候选群组的用户账号的数量作为所述至少两个候选群组的数量;
获取到所述至少两个候选群组的操作记录,根据所述操作记录确定所述至少两个候选群组中请求每个所述媒体信息的用户账号的数量作为候选群组的数量;
计算所述至少两个候选群组的用户账号的数量与所述至少两个候选群组中请求每个所述媒体信息的用户账号的数量的比值;
根据所述比值,确定针对所述N个媒体信息中每个媒体信息的第二特征参数。
本实施例采用用户账号的数量计算第二特征参数的公式可以为:
local _ m _ count * log 2 ( total _ user _ count user _ with _ m _ count ) 其中,total-user-count表征全部用户数量,user-with-m-count表征请求过第m个媒体信息的用户数量,local-m-count表征目标群组中请求过第m个媒体信息的用户数量;如此,就能够完成了从群level到用户level的近似。
比如图8所示,候选群组为QQ群,假设有4个QQ群,其中有20用户;N为2,即有两个媒体信息,分别为第一媒体信息和第二媒体信息。其中,请求第一媒体信息的群为4个,使用用户数来近似时,为6个请求;相同的,请求第二媒体信息的有3个用户;那么针对这两个媒体信息分别计算20与6的比值,以及20与3的比值,然后将这两个比值分别作为上述两个媒体信息的第二特征参数。本实施例中所述第二特征参数能够表征媒体信息的群组差异度。
这一近似有2个好处,1)计算上,全部视频用户数,以及全局有多少用户看了某部视频这2种数据可以直接从服务器日志(server log)读出,免去大量的计算;2)这一近似也符合我们的直觉,当total_user_count=user_with_m_count时,即当一个非常热门的视频被所有的用户都看过了,那就不应该给任何人再推荐这个视频了,这种设计与这一直觉一致。
优选地,所述基于每个所述媒体信息对应的第一特征参数、以及每个所述媒体信息对应的第二特征参数对所述N个媒体信息排序得到排序结果,包括:
将每个所述媒体信息对应的第一特征参数与所述第二特征参数相乘,得到每个所述媒体信息的分值;
根据所述每个媒体信息的分值对所述N个媒体信息进行排序得到排序结果。
优选地,所述基于所述排序结果确定向所述目标群组中的用户账号推送的目标媒体信息可以包括:基于所述排序结果确定将前指定位的至少一个媒体信息作为目标媒体信息,向所述目标群组中的全部用户账号推送目标媒体信息;其中,所述前指定为可以为根据实际情况设置,可以设置为前一位,即将排序第一的媒体信息作为目标媒体信息推送给目标群组中的全部用户;或者,前指定位还可以为前两位,即将排序在前两位的媒体信息作为目标媒体信息推送给目标群组中的全部用户。
可见,采用上述方案,基于目标群组的操作记录确定针对多个媒体信息的请求次数确定第一特征参数,然后根据至少两个候选群组的数量以及请求所述至少两个候选群组中每个媒体信息的数量计算得到第二特征参数,确定多个媒体信息的第一特征参数以及第二特征参数确定所述多个媒体信息的排序,根据排序结果向目标群组中的用户推送媒体信息。如此,就能够结合目标群组以及全部候选群组获取媒体信息的操作情况,向用户合理的推荐媒体信息,提升用户的使用体验。
实施例五、
本发明实施例提供了一种服务器,如图9所示,所述服务器包括:
选取单元91,用于从至少两个候选群组中选定目标群组;每个所述候选群组包括至少两个用户账号;获取所述目标群组的操作记录,解析所述操作记录得到所述目标群组向信息数据库所请求的N个媒体信息;其中,N为大于等于1的正整数;
第一计算单元92,用于基于所述目标群组的操作记录确定针对N个媒体信息中每个媒体信息的请求次数,基于所述请求次数确定每个所述媒体信息对应的第一特征参数;
第二计算单元93,用于基于所述至少两个候选群组的数量、以及请求所述N个媒体信息中每个媒体信息的候选群组的数量,计算得到所述N个媒体信息中每个媒体信息的第二特征参数;
处理单元94,用于基于每个所述媒体信息对应的第一特征参数、以及每个所述媒体信息对应的第二特征参数对所述N个媒体信息排序得到排序结果,基于所述排序结果确定向所述目标群组中的用户账号推送的目标媒体信息。
这里,所述候选群组可以为具有相似特征或者属性的用户聚到一起形成一个群体。以群体形式的方式不同,所述候选群组可以由多种类型,比如可以为显式形成的群(explicitly formed group),如QQ群;或者为隐式产生的群(implicitly formed group),即用聚类(clustering)算法聚成的群。
另外,获取候选群组的信息的方法可以为从服务器中获取,比如,如果是对QQ群进行操作,那么就可以是在QQ应用服务器中获取到所有的候选群组的信息。
所述选定目标群组的方式可以为根据实际情况选定,比如,可以由管理人员在服务器一侧进行设置;或者,还可以周期性的从候选群组中逐个选取目标群组;或者,还可以为根据所述候选群组的属性信息确定所述目标群组,其中,所述属性信息可以表征所述候选群组的类型或者标签,比如,如果一个群组的属性信息表征所述群组为一个影视兴趣群,那么就可以选定该群组作为目标群组,如果一个群组的属性信息表征所述群组为一个商业群,那么就可以不选定该群组作为目标群组。
优选地,所述选取单元91,具体用于从所述服务器中获取到所述目标群组的全部相关信息,从所述目标群组的全部相关信息中提取所述目标群组的操作记录。
所述操作记录用于记录目标群组中全部用户账号发起的操作,比如,可以包括有所述目标群组中全部用户账号发出以及获取到的文字或图片信息,还可以包括所述目标群组中所有用户账号从媒体数据库请求的所有媒体信息。
优选地,所述第一计算单元92,具体用于从所述目标群组的操作记录中逐个获取到针对N个媒体信息中每个媒体信息的全部请求;将每个媒体信息的全部请求的次数直接作为每个所述媒体信息对应的第一特征参数。其中,所述第一特征参数表征所述媒体信息的热度值,即媒体信息目标群组中的用户观看过的次数。
优选地,所述第二计算单元93,具体用于获取到所述至少两个候选群组的操作记录,根据所述操作记录,确定所述至少两个候选群组的数量,并且确定所述至少两个候选群组中请求每个所述媒体信息的候选群组的数量;计算所述至少两个候选群组的数量与所述请求每个媒体信息的候选群组的数量的比值;根据所述至少两个候选群组的数量与所述请求每个媒体信息的候选群组的数量的比值,确定针对所述N个媒体信息中每个媒体信息的第二特征参数。
比如,候选群组为QQ群,假设有10个QQ群;N为2,即有两个媒体信息,其中,10个QQ群中请求两个媒体信息的群分别为4个以及3个,那么针对这两个媒体信息分别计算10个与4个的比值,以及10个与3个的比值,然后将这两个比值分别作为上述两个媒体信息的第二特征参数。本实施例中所述第二特征参数能够表征媒体信息的群组差异度。
优选地,所述处理单元94,具体用于将每个所述媒体信息对应的第一特征参数与所述第二特征参数相乘,得到每个所述媒体信息的分值;根据所述每个媒体信息的分值对所述N个媒体信息进行排序得到排序结果。
所述基于所述排序结果确定向所述目标群组中的用户账号推送的目标媒体信息可以包括:基于所述排序结果确定将前指定位的至少一个媒体信息作为目标媒体信息,向所述目标群组中的全部用户账号推送目标媒体信息;其中,所述前指定为可以为根据实际情况设置,可以设置为前一位,即将排序第一的媒体信息作为目标媒体信息推送给目标群组中的全部用户;或者,前指定位还可以为前两位,即将排序在前两位的媒体信息作为目标媒体信息推送给目标群组中的全部用户。
本实施例中所述媒体信息可以包括:图片、文字、视频等类型的信息。
可见,采用上述方案,基于目标群组的操作记录确定针对多个媒体信息的请求次数确定第一特征参数,然后根据至少两个候选群组的数量以及请求所述至少两个候选群组中每个媒体信息的数量计算得到第二特征参数,确定多个媒体信息的第一特征参数以及第二特征参数确定所述多个媒体信息的排序,根据排序结果向目标群组中的用户推送媒体信息。如此,就能够结合目标群组以及全部候选群组获取媒体信息的操作情况,向用户合理的推荐媒体信息,提升用户的使用体验。
实施例六、
本发明实施例提供了一种服务器,其特征在于,所述服务器包括:
选取单元,用于从至少两个候选群组中选定目标群组;每个所述候选群组包括至少两个用户账号;获取所述目标群组的操作记录,解析所述操作记录得到所述目标群组向信息数据库所请求的N个媒体信息;其中,N为大于等于1的正整数;
第一计算单元,用于基于所述目标群组的操作记录确定针对N个媒体信息中每个媒体信息的请求次数,基于所述请求次数确定每个所述媒体信息对应的第一特征参数;
第二计算单元,用于基于所述至少两个候选群组的数量、以及请求所述N个媒体信息中每个媒体信息的候选群组的数量,计算得到所述N个媒体信息中每个媒体信息的第二特征参数;
处理单元,用于基于每个所述媒体信息对应的第一特征参数、以及每个所述媒体信息对应的第二特征参数对所述N个媒体信息排序得到排序结果,基于所述排序结果确定向所述目标群组中的用户账号推送的目标媒体信息。
这里,所述候选群组可以为具有相似特征或者属性的用户聚到一起形成一个群体。以群体形式的方式不同,所述候选群组可以由多种类型,比如可以为显式形成的群(explicitly formed group),如QQ群;或者为隐式产生的群(implicitly formed group),即用聚类(clustering)算法聚成的群。
另外,获取候选群组的信息的方法可以为从服务器中获取,比如,如果是对QQ群进行操作,那么就可以是在QQ应用服务器中获取到所有的候选群组的信息。
所述选定目标群组的方式可以为根据实际情况选定,比如,可以由管理人员在服务器一侧进行设置;或者,还可以周期性的从候选群组中逐个选取目标群组;或者,还可以为根据所述候选群组的属性信息确定所述目标群组,其中,所述属性信息可以表征所述候选群组的类型或者标签,比如,如果一个群组的属性信息表征所述群组为一个影视兴趣群,那么就可以选定该群组作为目标群组,如果一个群组的属性信息表征所述群组为一个商业群,那么就可以不选定该群组作为目标群组。
优选地,所述获取所述目标群组的操作记录可以为:从所述服务器中获取到所述目标群组的全部相关信息,从所述目标群组的全部相关信息中提取所述目标群组的操作记录。
所述操作记录用于记录目标群组中全部用户账号发起的操作,比如,可以包括有所述目标群组中全部用户账号发出以及获取到的文字或图片信息,还可以包括所述目标群组中所有用户账号从媒体数据库请求的所有媒体信息。
本实施例中所述媒体信息可以包括:图片、文字、视频等类型的信息。
优选地,所述第一计算单元,具体用于设置所述N个媒体信息中每个媒体信息对应的第一特征参数的初始值为零;从所述目标群组的操作记录中逐个提取针对N个媒体信息中每个媒体信息的全部请求对应的M个用户账号,M为大于等于1的正整数;逐个从所述M个用户账号中提取用户账号作为第一用户账号;获取所述第一用户账号针对所述媒体信息发起的请求的次数;判断所述次数是否满足第一预设条件,所述第一预设条件表征所述第一用户账号针对所述媒体信息发起的请求的次数为一;当满足第一预设条件时,将所述第一用户账号针对所述媒体信息发起的请求的次数与第一预设权重值相乘得到计算结果,将计算结果与所述媒体信息的第一特征参数相加得到更新后的所述第一特征参数,结束处理流程;否则将所述第一用户账号针对所述媒体信息发起的请求的次数与第二预设权重值相乘得到计算结果,将计算结果与所述媒体信息第一特征参数相加得到更新后的所述第一特征参数;
其中,所述第一预设权重值与所述第二预设权重值不同,所述第二预设权重值小于所述第一预设权重值。比如,第一预设权重值为1,第二预设权重值为0.3。
比如,N等于二,即目标群组中全部用户请求过的媒体信息为两个,分别为第一媒体信息和第二媒体信息;首先将两个媒体信息的第一特征参数初始值均设置为零;
然后逐个媒体信息进行分析,首先提取第一媒体信息,目标群组中请求过第一媒体信息的用户数量为三个,分别为用户1、用户2和用户3;
从三个请求过第一媒体信息的用户中,用户1请求第一媒体信息的次数为2,用户1请求第一媒体信息的次数大于一,就降低该用户请求第一媒体信息的次数的权重值,将次数2与第二预设权重值相乘,假设第二预设权重值为0.3,则计算得到的结果为0.6,将计算得到的结果与第一特征值相加得到更新后的第一特征参数,即当前第一特征参数等于0.6;
再获取到用户2请求第一媒体信息的次数为3,同样降低用户2请求次数的权重值,将该次数与第二预设权重值相乘得到计算结果为0.9,再将计算结果与第一特征参数相加得到1.5,将1.5作为更新后的第一特征参数;
最后获取用户3请求第一媒体信息的次数为1,将次数与第一权重值相乘得到计算结果为1,将计算结果与第一特征参数相加结果为2.5,则2.5为更新后的第一媒体信息的第一特征参数。
按照上述计算方法,再计算第二媒体信息的第一特征参数。
如此,就能够通过增加用户账号的权重值,来进一步提升第一特征参数的准确性。
优选地,所述基于所述至少两个候选群组的数量、以及请求所述N个媒体信息中每个媒体信息的候选群组的数量,计算得到所述N个媒体信息中每个媒体信息的第二特征参数可以包括:获取到所述至少两个候选群组的操作记录,根据所述操作记录,确定所述至少两个候选群组的数量,并且确定所述至少两个候选群组中请求每个所述媒体信息的候选群组的数量;计算所述至少两个候选群组的数量与所述请求每个媒体信息的候选群组的数量的比值;根据所述至少两个候选群组的数量与所述请求每个媒体信息的候选群组的数量的比值,确定针对所述N个媒体信息中每个媒体信息的第二特征参数。
其中,所述根据所述至少两个候选群组的数量与所述请求每个媒体信息的候选群组的数量的比值,确定针对所述N个媒体信息中每个媒体信息的第二特征参数可以有两种实现方式:
方式一、直接将所述至少两个候选群组的数量与所述请求每个媒体信息的候选群组的数量的比值,作为所述N个媒体信息中每个媒体信息的第二特征参数;
方式二、计算将所述至少两个候选群组的数量与所述请求每个媒体信息的候选群组的数量的比值的对数值,将计算得到的对数值作为所述N个媒体信息中每个媒体信息的第二特征参数。
比如,候选群组为QQ群,假设有10个QQ群;N为2,即有两个媒体信息,其中,10个QQ群中请求两个媒体信息的群分别为4个以及3个,那么针对这两个媒体信息分别计算10个与4个的比值,以及10个与3个的比值,然后将这两个比值分别作为上述两个媒体信息的第二特征参数。本实施例中所述第二特征参数能够表征媒体信息的群组差异度。
优选地,所述基于每个所述媒体信息对应的第一特征参数、以及每个所述媒体信息对应的第二特征参数对所述N个媒体信息排序得到排序结果,包括:
将每个所述媒体信息对应的第一特征参数与所述第二特征参数相乘,得到每个所述媒体信息的分值;
根据所述每个媒体信息的分值对所述N个媒体信息进行排序得到排序结果。
本实施例根据第一特征参数和第二特征参数计算得到媒体信息的分值,可以采用以下公式来表示,假设媒体信息为视频:
local _ m _ count * log 2 ( total _ group _ count group _ with _ m _ count )
其中,local_m_count为视频被目标群组的群成员请求的次数,即局部热度,它度量了群内共同性;为全部群的数量与有观看过视频的群数量的比值的对数值,度量了群间差异性,即越少的群看了某部视频,则这个视频越能成为某个群的代表性视频。
优选地,所述基于所述排序结果确定向所述目标群组中的用户账号推送的目标媒体信息可以包括:基于所述排序结果确定将前指定位的至少一个媒体信息作为目标媒体信息,向所述目标群组中的全部用户账号推送目标媒体信息;其中,所述前指定为可以为根据实际情况设置,可以设置为前一位,即将排序第一的媒体信息作为目标媒体信息推送给目标群组中的全部用户;或者,前指定位还可以为前两位,即将排序在前两位的媒体信息作为目标媒体信息推送给目标群组中的全部用户。
可见,采用上述方案,基于目标群组的操作记录确定针对多个媒体信息的请求次数确定第一特征参数,然后根据至少两个候选群组的数量以及请求所述至少两个候选群组中每个媒体信息的数量计算得到第二特征参数,确定多个媒体信息的第一特征参数以及第二特征参数确定所述多个媒体信息的排序,根据排序结果向目标群组中的用户推送媒体信息。如此,就能够结合目标群组以及全部候选群组获取媒体信息的操作情况,向用户合理的推荐媒体信息,提升用户的使用体验。
实施例七、
本发明实施例提供了一种服务器,所述服务器包括:
选取单元,用于从至少两个候选群组中选定目标群组;每个所述候选群组包括至少两个用户账号;获取所述目标群组的操作记录,解析所述操作记录得到所述目标群组向信息数据库所请求的N个媒体信息;其中,N为大于等于1的正整数;
第一计算单元,用于基于所述目标群组的操作记录确定针对N个媒体信息中每个媒体信息的请求次数,基于所述请求次数确定每个所述媒体信息对应的第一特征参数;
第二计算单元,用于基于所述至少两个候选群组的数量、以及请求所述N个媒体信息中每个媒体信息的候选群组的数量,计算得到所述N个媒体信息中每个媒体信息的第二特征参数;
处理单元,用于基于每个所述媒体信息对应的第一特征参数、以及每个所述媒体信息对应的第二特征参数对所述N个媒体信息排序得到排序结果,基于所述排序结果确定向所述目标群组中的用户账号推送的目标媒体信息。
这里,所述候选群组可以为具有相似特征或者属性的用户聚到一起形成一个群体。以群体形式的方式不同,所述候选群组可以由多种类型,比如可以为显式形成的群(explicitly formed group),如QQ群;或者为隐式产生的群(implicitly formed group),即用聚类(clustering)算法聚成的群。
另外,获取候选群组的信息的方法可以为从服务器中获取,比如,如果是对QQ群进行操作,那么就可以是在QQ应用服务器中获取到所有的候选群组的信息。
所述选定目标群组的方式可以为根据实际情况选定,比如,可以由管理人员在服务器一侧进行设置;或者,还可以周期性的从候选群组中逐个选取目标群组;或者,还可以为根据所述候选群组的属性信息确定所述目标群组,其中,所述属性信息可以表征所述候选群组的类型或者标签,比如,如果一个群组的属性信息表征所述群组为一个影视兴趣群,那么就可以选定该群组作为目标群组,如果一个群组的属性信息表征所述群组为一个商业群,那么就可以不选定该群组作为目标群组。
优选地,所述获取所述目标群组的操作记录可以为:从所述服务器中获取到所述目标群组的全部相关信息,从所述目标群组的全部相关信息中提取所述目标群组的操作记录。
所述操作记录用于记录目标群组中全部用户账号发起的操作,比如,可以包括有所述目标群组中全部用户账号发出以及获取到的文字或图片信息,还可以包括所述目标群组中所有用户账号从媒体数据库请求的所有媒体信息。
本实施例中所述媒体信息可以包括:图片、文字、视频等类型的信息。
优选地,所述第一计算单元,具体用于从所述目标群组的操作记录中逐个提取针对N个媒体信息中每个媒体信息的全部请求对应的M个用户账号,M为大于等于1的正整数;逐个从所述M个用户账号中提取用户账号作为第二用户账号;获取所述第二用户账号针对所述媒体信息发起的请求的次数;判断所述第二用户账号是否满足第二预设条件,所述第二预设条件表征所述第二用户账号加入所述目标群组的时长超过预设门限值;当满足第二预设条件时,将所述第二用户账号针对所述媒体信息发起的请求的次数与第三预设权重值相乘得到计算结果,将计算结果与所述媒体信息的第一特征参数相加得到更新后的所述第一特征参数,结束;否则,将所述第二用户账号针对所述媒体信息发起的请求的次数与第四预设权重值相乘得到计算结果,将计算结果与所述媒体信息的第一特征参数相加得到更新后的所述第一特征参数;其中,所述第四预设权重值小于所述第三预设权重值。比如,第三预设权重值可以为2,第四预设权重值为1。所述预设门限值可以为3个月。
比如,N等于二,即目标群组中全部用户请求过的媒体信息为两个,分别为第一媒体信息和第二媒体信息;首先将两个媒体信息的第一特征参数初始值均设置为零;
然后逐个媒体信息进行分析,首先提取第一媒体信息,目标群组中请求过第一媒体信息的用户数量为三个,分别为用户1、用户2和用户3;
从三个请求过第一媒体信息的用户中,用户1请求第一媒体信息的次数为2,并且用户1加入目标群组的时长为1年,将次数2与第三预设权重值相乘,计算得到的结果为4,将计算得到的结果与第一特征值相加得到更新后的第一特征参数,即当前第一特征参数等于4;
再获取到用户2请求第一媒体信息的次数为3,并且用户2加入目标群组的时长为30天,将该次数与第四预设权重值相乘得到计算结果为3,再将计算结果与第一特征参数相加得到7,将7作为更新后的第一特征参数;
最后获取用户3请求第一媒体信息的次数为1,用户3加入目标群组的时长为1年,将次数与第三权重值相乘得到计算结果为2,将计算结果与第一特征参数相加结果为9,则9为更新后的第一媒体信息的第一特征参数。
按照上述计算方法,再计算第二媒体信息的第一特征参数。
如此,就能够根据用户加入目标群组的时长的权重值,来进一步提升第一特征参数的准确性。
优选地,所述基于所述至少两个候选群组的数量、以及请求所述N个媒体信息中每个媒体信息的候选群组的数量,计算得到所述N个媒体信息中每个媒体信息的第二特征参数可以包括:获取到所述至少两个候选群组的操作记录,根据所述操作记录,确定所述至少两个候选群组的数量,并且确定所述至少两个候选群组中请求每个所述媒体信息的候选群组的数量;计算所述至少两个候选群组的数量与所述请求每个媒体信息的候选群组的数量的比值;根据所述至少两个候选群组的数量与所述请求每个媒体信息的候选群组的数量的比值,确定针对所述N个媒体信息中每个媒体信息的第二特征参数。
其中,所述根据所述至少两个候选群组的数量与所述请求每个媒体信息的候选群组的数量的比值,确定针对所述N个媒体信息中每个媒体信息的第二特征参数可以有两种实现方式:
方式一、直接将所述至少两个候选群组的数量与所述请求每个媒体信息的候选群组的数量的比值,作为所述N个媒体信息中每个媒体信息的第二特征参数;
方式二、计算将所述至少两个候选群组的数量与所述请求每个媒体信息的候选群组的数量的比值的对数值,将计算得到的对数值作为所述N个媒体信息中每个媒体信息的第二特征参数。
比如,候选群组为QQ群,假设有10个QQ群;N为2,即有两个媒体信息,其中,10个QQ群中请求两个媒体信息的群分别为4个以及3个,那么针对这两个媒体信息分别计算10个与4个的比值,以及10个与3个的比值,然后将这两个比值分别作为上述两个媒体信息的第二特征参数。本实施例中所述第二特征参数能够表征媒体信息的群组差异度。
优选地,所述基于每个所述媒体信息对应的第一特征参数、以及每个所述媒体信息对应的第二特征参数对所述N个媒体信息排序得到排序结果,包括:
将每个所述媒体信息对应的第一特征参数与所述第二特征参数相乘,得到每个所述媒体信息的分值;
根据所述每个媒体信息的分值对所述N个媒体信息进行排序得到排序结果。
本实施例根据第一特征参数和第二特征参数计算得到媒体信息的分值,可以采用以下公式来表示,假设媒体信息为视频:
local _ m _ count * log 2 ( total _ group _ count group _ with _ m _ count )
其中,local_m_count为视频被目标群组的群成员请求的次数,即局部热度,它度量了群内共同性;为全部群的数量与有观看过视频的群数量的比值的对数值,度量了群间差异性,即越少的群看了某部视频,则这个视频越能成为某个群的代表性视频。
优选地,所述基于所述排序结果确定向所述目标群组中的用户账号推送的目标媒体信息可以包括:基于所述排序结果确定将前指定位的至少一个媒体信息作为目标媒体信息,向所述目标群组中的全部用户账号推送目标媒体信息;其中,所述前指定为可以为根据实际情况设置,可以设置为前一位,即将排序第一的媒体信息作为目标媒体信息推送给目标群组中的全部用户;或者,前指定位还可以为前两位,即将排序在前两位的媒体信息作为目标媒体信息推送给目标群组中的全部用户。
可见,采用上述方案,基于目标群组的操作记录确定针对多个媒体信息的请求次数确定第一特征参数,然后根据至少两个候选群组的数量以及请求所述至少两个候选群组中每个媒体信息的数量计算得到第二特征参数,确定多个媒体信息的第一特征参数以及第二特征参数确定所述多个媒体信息的排序,根据排序结果向目标群组中的用户推送媒体信息。如此,就能够结合目标群组以及全部候选群组获取媒体信息的操作情况,向用户合理的推荐媒体信息,提升用户的使用体验。
实施例八、
本发明实施例提供了一种服务器,所述服务器包括:
选取单元,用于从至少两个候选群组中选定目标群组;每个所述候选群组包括至少两个用户账号;获取所述目标群组的操作记录,解析所述操作记录得到所述目标群组向信息数据库所请求的N个媒体信息;其中,N为大于等于1的正整数;
第一计算单元,用于基于所述目标群组的操作记录确定针对N个媒体信息中每个媒体信息的请求次数,基于所述请求次数确定每个所述媒体信息对应的第一特征参数;
第二计算单元,用于基于所述至少两个候选群组的数量、以及请求所述N个媒体信息中每个媒体信息的候选群组的数量,计算得到所述N个媒体信息中每个媒体信息的第二特征参数;
处理单元,用于基于每个所述媒体信息对应的第一特征参数、以及每个所述媒体信息对应的第二特征参数对所述N个媒体信息排序得到排序结果,基于所述排序结果确定向所述目标群组中的用户账号推送的目标媒体信息。
这里,所述候选群组可以为具有相似特征或者属性的用户聚到一起形成一个群体。以群体形式的方式不同,所述候选群组可以由多种类型,比如可以为显式形成的群(explicitly formed group),如QQ群;或者为隐式产生的群(implicitly formed group),即用聚类(clustering)算法聚成的群。
另外,获取候选群组的信息的方法可以为从服务器中获取,比如,如果是对QQ群进行操作,那么就可以是在QQ应用服务器中获取到所有的候选群组的信息。
所述选定目标群组的方式可以为根据实际情况选定,比如,可以由管理人员在服务器一侧进行设置;或者,还可以周期性的从候选群组中逐个选取目标群组;或者,还可以为根据所述候选群组的属性信息确定所述目标群组,其中,所述属性信息可以表征所述候选群组的类型或者标签,比如,如果一个群组的属性信息表征所述群组为一个影视兴趣群,那么就可以选定该群组作为目标群组,如果一个群组的属性信息表征所述群组为一个商业群,那么就可以不选定该群组作为目标群组。
优选地,所述获取所述目标群组的操作记录可以为:从所述服务器中获取到所述目标群组的全部相关信息,从所述目标群组的全部相关信息中提取所述目标群组的操作记录。
所述操作记录用于记录目标群组中全部用户账号发起的操作,比如,可以包括有所述目标群组中全部用户账号发出以及获取到的文字或图片信息,还可以包括所述目标群组中所有用户账号从媒体数据库请求的所有媒体信息。
本实施例中所述媒体信息可以包括:图片、文字、视频等类型的信息。
优选地,所述第一计算单元,具体用于从第一服务器中获取到针对所述N个媒体信息中每个媒体信息的第三特征参数;利用第一预设模型以及所述第三特征参数,计算得到针对每个所述媒体信息的第五权重值;利用所述第五权重值以及所述每个所述媒体信息的请求次数,计算得到所述媒体信息对应的第一特征参数。
其中,所述第一服务器可以为媒体信息所在的服务器,比如,当媒体信息为视频时,所述第一服务器即为视频服务器。
所述媒体信息的第三特征值可以为所述媒体信息在第一服务器中被请求的次数排名,比如,第一服务器为视频服务器时,第三特征值即表征某一个视频被用户观看过的次数排名。
所述第一预设模型可以为预设的公式,该公式的特征为:当媒体信息被请求的次数排名在小于媒体信息总数的一半时,使得计算结果随着请求的次数排名的增加而降低,当媒体信息被请求的次数排名不小于媒体信息总数的一半时,使得计算结果对着请求次数排名的增加而提升,比如,可以使用以下公式作为第一预设模型:
其中,ri为全站中媒体信息i被请求的次数的排名,最热的视频排名为1;a和b均为常数,可以将a设置为1、b设置为0;half_cnt是指第一服务器中保存的全部媒体信息的数量的一半;如,媒体信息为电影,第一服务器中现有7000部电影,则half_cnt=3500。如此,能够根据不希望推荐太热或者太冷视频的思想,调整媒体信息的第一特征参数。
优选地,所述第二计算单元,具体用于获取到所述至少两个候选群组的操作记录,根据所述操作记录,确定所述至少两个候选群组的数量,并且确定所述至少两个候选群组中请求每个所述媒体信息的候选群组的数量;计算所述至少两个候选群组的数量与所述请求每个媒体信息的候选群组的数量的比值;根据所述至少两个候选群组的数量与所述请求每个媒体信息的候选群组的数量的比值,确定针对所述N个媒体信息中每个媒体信息的第二特征参数。
其中,所述根据所述至少两个候选群组的数量与所述请求每个媒体信息的候选群组的数量的比值,确定针对所述N个媒体信息中每个媒体信息的第二特征参数可以有两种实现方式:
方式一、直接将所述至少两个候选群组的数量与所述请求每个媒体信息的候选群组的数量的比值,作为所述N个媒体信息中每个媒体信息的第二特征参数;
方式二、计算将所述至少两个候选群组的数量与所述请求每个媒体信息的候选群组的数量的比值的对数值,将计算得到的对数值作为所述N个媒体信息中每个媒体信息的第二特征参数。
比如,候选群组为QQ群,假设有10个QQ群;N为2,即有两个媒体信息,其中,10个QQ群中请求两个媒体信息的群分别为4个以及3个,那么针对这两个媒体信息分别计算10个与4个的比值,以及10个与3个的比值,然后将这两个比值分别作为上述两个媒体信息的第二特征参数。本实施例中所述第二特征参数能够表征媒体信息的群组差异度。
另外,计算媒体信息的第二特征参数还可以采用以下方式:
获取到所述至少两个候选群组的用户账号的数量作为所述至少两个候选群组的数量;
获取到所述至少两个候选群组的操作记录,根据所述操作记录确定所述至少两个候选群组中请求每个所述媒体信息的用户账号的数量作为候选群组的数量;
计算所述至少两个候选群组的用户账号的数量与所述至少两个候选群组中请求每个所述媒体信息的用户账号的数量的比值;
根据所述比值,确定针对所述N个媒体信息中每个媒体信息的第二特征参数。
优选地,所述基于每个所述媒体信息对应的第一特征参数、以及每个所述媒体信息对应的第二特征参数对所述N个媒体信息排序得到排序结果,包括:
将每个所述媒体信息对应的第一特征参数与所述第二特征参数相乘,得到每个所述媒体信息的分值;
根据所述每个媒体信息的分值对所述N个媒体信息进行排序得到排序结果。
本实施例根据第一特征参数和第二特征参数计算得到媒体信息的分值,可以采用以下公式来表示,假设媒体信息为视频:
local _ m _ count * log 2 ( total _ group _ count group _ with _ m _ count )
其中,local_m_count为视频被目标群组的群成员请求的次数,即局部热度,它度量了群内共同性;为全部群的数量与有观看过视频的群数量的比值的对数值,度量了群间差异性,即越少的群看了某部视频,则这个视频越能成为某个群的代表性视频。
优选地,所述基于所述排序结果确定向所述目标群组中的用户账号推送的目标媒体信息可以包括:基于所述排序结果确定将前指定位的至少一个媒体信息作为目标媒体信息,向所述目标群组中的全部用户账号推送目标媒体信息;其中,所述前指定为可以为根据实际情况设置,可以设置为前一位,即将排序第一的媒体信息作为目标媒体信息推送给目标群组中的全部用户;或者,前指定位还可以为前两位,即将排序在前两位的媒体信息作为目标媒体信息推送给目标群组中的全部用户。
可见,采用上述方案,基于目标群组的操作记录确定针对多个媒体信息的请求次数确定第一特征参数,然后根据至少两个候选群组的数量以及请求所述至少两个候选群组中每个媒体信息的数量计算得到第二特征参数,确定多个媒体信息的第一特征参数以及第二特征参数确定所述多个媒体信息的排序,根据排序结果向目标群组中的用户推送媒体信息。如此,就能够结合目标群组以及全部候选群组获取媒体信息的操作情况,向用户合理的推荐媒体信息,提升用户的使用体验。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元,即可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
本实施例基于上述设备实施例提供一个具体的硬件,如图10所示,所述装置包括处理器1002、存储介质1004以及至少一个外部通信接口1001;所述处理器1002、存储介质1004以及外部通信接口1001均通过总线1003连接。所述处理器1002可为微处理器、中央处理器、数字信号处理器或可编程逻辑阵列等具有处理功能的电子元器件。所述存储介质中存储有计算机可执行代码。
所述硬件可以为所述服务器。所述处理器执行所述计算机可执行代码时,至少能实现以下功能:
从至少两个候选群组中选定目标群组;每个所述候选群组包括至少两个用户;
获取所述目标群组的操作记录,解析所述操作记录得到所述目标群组向信息数据库所请求的N个媒体信息;其中,N为大于等于1的正整数;
基于所述目标群组的操作记录确定针对N个媒体信息中每个媒体信息的请求次数,基于所述请求次数确定每个所述媒体信息对应的第一特征参数;
基于所述至少两个候选群组的数量、以及请求所述N个媒体信息中每个媒体信息的候选群组的数量,计算得到所述N个媒体信息中每个媒体信息的第二特征参数;
基于每个所述媒体信息对应的第一特征参数、以及每个所述媒体信息对应的第二特征参数对所述N个媒体信息排序得到排序结果,基于所述排序结果确定向所述目标群组中的用户账号推送的目标媒体信息。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (14)

1.一种信息处理方法,其特征在于,所述方法包括:
从至少两个候选群组中选定目标群组;每个所述候选群组包括至少两个用户账号;
获取所述目标群组的操作记录,解析所述操作记录得到所述目标群组向信息数据库所请求的N个媒体信息;其中,N为大于等于1的正整数;
基于所述目标群组的操作记录确定针对N个媒体信息中每个媒体信息的请求次数,基于所述请求次数确定每个所述媒体信息对应的第一特征参数;
基于所述至少两个候选群组的数量、以及请求所述N个媒体信息中每个媒体信息的候选群组的数量,计算得到所述N个媒体信息中每个媒体信息的第二特征参数;
基于每个所述媒体信息对应的第一特征参数、以及每个所述媒体信息对应的第二特征参数对所述N个媒体信息排序得到排序结果,基于所述排序结果确定向所述目标群组中的用户账号推送的目标媒体信息。
2.根据权利要求1所述的方法,其特征在于,所述基于所述目标群组的操作记录确定针对N个媒体信息中每个媒体信息的请求次数,基于所述请求次数确定每个所述媒体信息对应的第一特征参数,包括:
从所述目标群组的操作记录中逐个获取到针对N个媒体信息中每个媒体信息的全部请求;
将每个媒体信息的全部请求的次数直接作为每个所述媒体信息对应的第一特征参数。
3.根据权利要求1所述的方法,其特征在于,所述基于所述目标群组的操作记录确定针对N个媒体信息中每个媒体信息的请求次数,基于所述请求次数确定每个所述媒体信息对应的第一特征参数,包括:
设置所述N个媒体信息中每个媒体信息对应的第一特征参数的初始值为零;
从所述目标群组的操作记录中逐个提取针对N个媒体信息中每个媒体信息的全部请求对应的M个用户账号,M为大于等于1的正整数;
逐个从所述M个用户账号中提取用户账号作为第一用户账号;
获取所述第一用户账号针对所述媒体信息发起的请求的次数;
判断所述次数是否满足第一预设条件,所述第一预设条件表征所述第一用户账号针对所述媒体信息发起的请求的次数为一;
当满足第一预设条件时,将所述第一用户账号针对所述媒体信息发起的请求的次数与第一预设权重值相乘得到计算结果,将计算结果与所述媒体信息的第一特征参数相加得到更新后的所述第一特征参数;
当不满足第一预设条件时,将所述第一用户账号针对所述媒体信息发起的请求的次数与第二预设权重值相乘得到计算结果,将计算结果与所述媒体信息第一特征参数相加得到更新后的所述第一特征参数;
其中,所述第一预设权重值与所述第二预设权重值不同,所述第二预设权重值小于所述第一预设权重值。
4.根据权利要求1所述的方法,其特征在于,所述基于所述目标群组的操作记录确定针对N个媒体信息中每个媒体信息的请求次数,基于所述请求次数确定每个所述媒体信息对应的第一特征参数,包括:
从所述目标群组的操作记录中逐个提取针对N个媒体信息中每个媒体信息的全部请求对应的M个用户账号,M为大于等于1的正整数;
逐个从所述M个用户账号中提取用户账号作为第二用户账号;
获取所述第二用户账号针对所述媒体信息发起的请求的次数;
判断所述第二用户账号是否满足第二预设条件,所述第二预设条件表征所述第二用户账号加入所述目标群组的时长超过预设门限值;
当满足第二预设条件时,将所述第二用户账号针对所述媒体信息发起的请求的次数与第三预设权重值相乘得到计算结果,将计算结果与所述媒体信息的第一特征参数相加得到更新后的所述第一特征参数;
当不满足第二预设条件时,将所述第二用户账号针对所述媒体信息发起的请求的次数与第四预设权重值相乘得到计算结果,将计算结果与所述媒体信息的第一特征参数相加得到更新后的所述第一特征参数;其中,所述第四预设权重值小于所述第三预设权重值。
5.根据权利要求1所述的方法,其特征在于,所述基于所述目标群组的操作记录确定针对N个媒体信息中每个媒体信息的请求次数,基于所述请求次数确定每个所述媒体信息对应的第一特征参数,包括:
从第一服务器中获取到针对所述N个媒体信息中每个媒体信息的第三特征参数;
利用第一预设模型以及所述第三特征参数,计算得到针对每个所述媒体信息的第五权重值;
利用所述第五权重值以及所述每个所述媒体信息的请求次数,计算得到所述媒体信息对应的第一特征参数。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述获取到所述至少两个候选群组的操作记录;基于所述至少两个候选群组的数量、以及请求所述N个媒体信息中每个媒体信息的候选群组的数量,计算得到所述N个媒体信息中每个媒体信息的第二特征参数,包括:
获取到所述至少两个候选群组的操作记录,根据所述操作记录,确定所述至少两个候选群组的数量,并且确定所述至少两个候选群组中请求每个所述媒体信息的候选群组的数量;
计算所述至少两个候选群组的数量与所述请求每个媒体信息的候选群组的数量的比值;
根据所述至少两个候选群组的数量与所述请求每个媒体信息的候选群组的数量的比值,确定针对所述N个媒体信息中每个媒体信息的第二特征参数。
7.根据权利要求1-5任一项所述的方法,其特征在于,所述获取到所述至少两个候选群组的操作记录;基于所述至少两个候选群组的数量、以及请求所述N个媒体信息中每个媒体信息的候选群组的数量,计算得到所述N个媒体信息中每个媒体信息的第二特征参数,包括:
获取到所述至少两个候选群组的用户账号的数量作为所述至少两个候选群组的数量;
获取到所述至少两个候选群组的操作记录,根据所述操作记录确定所述至少两个候选群组中请求每个所述媒体信息的用户账号的数量作为候选群组的数量;
计算所述至少两个候选群组的用户账号的数量与所述至少两个候选群组中请求每个所述媒体信息的用户账号的数量的比值;
根据所述比值,确定针对所述N个媒体信息中每个媒体信息的第二特征参数。
8.一种服务器,其特征在于,所述服务器包括:
选取单元,用于从至少两个候选群组中选定目标群组;每个所述候选群组包括至少两个用户账号;获取所述目标群组的操作记录,解析所述操作记录得到所述目标群组向信息数据库所请求的N个媒体信息;其中,N为大于等于1的正整数;
第一计算单元,用于基于所述目标群组的操作记录确定针对N个媒体信息中每个媒体信息的请求次数,基于所述请求次数确定每个所述媒体信息对应的第一特征参数;
第二计算单元,用于基于所述至少两个候选群组的数量、以及请求所述N个媒体信息中每个媒体信息的候选群组的数量,计算得到所述N个媒体信息中每个媒体信息的第二特征参数;
处理单元,用于基于每个所述媒体信息对应的第一特征参数、以及每个所述媒体信息对应的第二特征参数对所述N个媒体信息排序得到排序结果,基于所述排序结果确定向所述目标群组中的用户账号推送的目标媒体信息。
9.根据权利要求8所述的服务器,其特征在于,所述第一计算单元,具体用于从所述目标群组的操作记录中逐个获取到针对N个媒体信息中每个媒体信息的全部请求;将每个媒体信息的全部请求的次数直接作为每个所述媒体信息对应的第一特征参数。
10.根据权利要求8所述的服务器,其特征在于,所述第一计算单元,具体用于设置所述N个媒体信息中每个媒体信息对应的第一特征参数的初始值为零;从所述目标群组的操作记录中逐个提取针对N个媒体信息中每个媒体信息的全部请求对应的M个用户账号,M为大于等于1的正整数;逐个从所述M个用户账号中提取用户账号作为第一用户账号;获取所述第一用户账号针对所述媒体信息发起的请求的次数;判断所述次数是否满足第一预设条件,所述第一预设条件表征所述第一用户账号针对所述媒体信息发起的请求的次数为一;当满足第一预设条件时,将所述第一用户账号针对所述媒体信息发起的请求的次数与第一预设权重值相乘得到计算结果,将计算结果与所述媒体信息的第一特征参数相加得到更新后的所述第一特征参数;当不满足第一预设条件时,将所述第一用户账号针对所述媒体信息发起的请求的次数与第二预设权重值相乘得到计算结果,将计算结果与所述媒体信息第一特征参数相加得到更新后的所述第一特征参数;
其中,所述第一预设权重值与所述第二预设权重值不同,所述第二预设权重值小于所述第一预设权重值。
11.根据权利要求8所述的服务器,其特征在于,所述第一计算单元,具体用于从所述目标群组的操作记录中逐个提取针对N个媒体信息中每个媒体信息的全部请求对应的M个用户账号,M为大于等于1的正整数;逐个从所述M个用户账号中提取用户账号作为第二用户账号;获取所述第二用户账号针对所述媒体信息发起的请求的次数;判断所述第二用户账号是否满足第二预设条件,所述第二预设条件表征所述第二用户账号加入所述目标群组的时长超过预设门限值;当满足第二预设条件时,将所述第二用户账号针对所述媒体信息发起的请求的次数与第三预设权重值相乘得到计算结果,将计算结果与所述媒体信息的第一特征参数相加得到更新后的所述第一特征参数;
当不满足第二预设条件时,将所述第二用户账号针对所述媒体信息发起的请求的次数与第四预设权重值相乘得到计算结果,将计算结果与所述媒体信息的第一特征参数相加得到更新后的所述第一特征参数;其中,所述第四预设权重值小于所述第三预设权重值。
12.根据权利要求8所述的服务器,其特征在于,所述第一计算单元,具体用于从第一服务器中获取到针对所述N个媒体信息中每个媒体信息的第三特征参数;利用第一预设模型以及所述第三特征参数,计算得到针对每个所述媒体信息的第五权重值;利用所述第五权重值以及所述每个所述媒体信息的请求次数,计算得到所述媒体信息对应的第一特征参数。
13.根据权利要求8所述的服务器,其特征在于,所述第二计算单元,具体用于获取到所述至少两个候选群组的操作记录,根据所述操作记录,确定所述至少两个候选群组的数量,并且确定所述至少两个候选群组中请求每个所述媒体信息的候选群组的数量;计算所述至少两个候选群组的数量与所述请求每个媒体信息的候选群组的数量的比值;根据所述至少两个候选群组的数量与所述请求每个媒体信息的候选群组的数量的比值,确定针对所述N个媒体信息中每个媒体信息的第二特征参数。
14.根据权利要求8所述的服务器,其特征在于,所述第一计算单元,具体用于获取到所述至少两个候选群组的用户账号的数量作为所述至少两个候选群组的数量;获取到所述至少两个候选群组的操作记录,根据所述操作记录确定所述至少两个候选群组中请求每个所述媒体信息的用户账号的数量作为候选群组的数量;计算所述至少两个候选群组的用户账号的数量与所述至少两个候选群组中请求每个所述媒体信息的用户账号的数量的比值;根据所述比值,确定针对所述N个媒体信息中每个媒体信息的第二特征参数。
CN201510056679.0A 2015-02-03 2015-02-03 一种信息处理方法及服务器 Active CN104573113B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510056679.0A CN104573113B (zh) 2015-02-03 2015-02-03 一种信息处理方法及服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510056679.0A CN104573113B (zh) 2015-02-03 2015-02-03 一种信息处理方法及服务器

Publications (2)

Publication Number Publication Date
CN104573113A true CN104573113A (zh) 2015-04-29
CN104573113B CN104573113B (zh) 2019-06-14

Family

ID=53089175

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510056679.0A Active CN104573113B (zh) 2015-02-03 2015-02-03 一种信息处理方法及服务器

Country Status (1)

Country Link
CN (1) CN104573113B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105072466A (zh) * 2015-06-30 2015-11-18 北京奇艺世纪科技有限公司 一种信息推送方法及装置
CN105608125A (zh) * 2015-12-15 2016-05-25 腾讯科技(深圳)有限公司 一种信息处理方法及服务器
CN106126519A (zh) * 2016-06-01 2016-11-16 腾讯科技(深圳)有限公司 媒体信息的展示方法及服务器
CN108241989A (zh) * 2016-12-26 2018-07-03 北京国双科技有限公司 差异性数据获取方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101957834A (zh) * 2010-08-12 2011-01-26 百度在线网络技术(北京)有限公司 一种基于用户特征进行内容推荐的方法与设备
CN102088626A (zh) * 2009-12-02 2011-06-08 Tcl集团股份有限公司 一种在线视频推荐方法及视频门户服务系统
CN102637178A (zh) * 2011-02-14 2012-08-15 北京瑞信在线系统技术有限公司 一种音乐推荐方法、装置及系统
CN102811207A (zh) * 2011-06-02 2012-12-05 腾讯科技(深圳)有限公司 网络信息推送方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102088626A (zh) * 2009-12-02 2011-06-08 Tcl集团股份有限公司 一种在线视频推荐方法及视频门户服务系统
CN101957834A (zh) * 2010-08-12 2011-01-26 百度在线网络技术(北京)有限公司 一种基于用户特征进行内容推荐的方法与设备
CN102637178A (zh) * 2011-02-14 2012-08-15 北京瑞信在线系统技术有限公司 一种音乐推荐方法、装置及系统
CN102811207A (zh) * 2011-06-02 2012-12-05 腾讯科技(深圳)有限公司 网络信息推送方法及系统

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105072466A (zh) * 2015-06-30 2015-11-18 北京奇艺世纪科技有限公司 一种信息推送方法及装置
CN105072466B (zh) * 2015-06-30 2018-02-09 北京奇艺世纪科技有限公司 一种信息推送方法及装置
CN105608125A (zh) * 2015-12-15 2016-05-25 腾讯科技(深圳)有限公司 一种信息处理方法及服务器
CN105608125B (zh) * 2015-12-15 2020-11-06 腾讯科技(深圳)有限公司 一种信息处理方法及服务器
CN106126519A (zh) * 2016-06-01 2016-11-16 腾讯科技(深圳)有限公司 媒体信息的展示方法及服务器
CN106126519B (zh) * 2016-06-01 2019-07-26 腾讯科技(深圳)有限公司 媒体信息的展示方法及服务器
US11030656B2 (en) 2016-06-01 2021-06-08 Tencent Technology (Shenzhen) Company Limited Media information presentation method, server, and storage medium
CN108241989A (zh) * 2016-12-26 2018-07-03 北京国双科技有限公司 差异性数据获取方法及装置

Also Published As

Publication number Publication date
CN104573113B (zh) 2019-06-14

Similar Documents

Publication Publication Date Title
CN110941740B (zh) 视频推荐方法及计算机可读存储介质
CN107222566B (zh) 信息推送方法、装置及服务器
CN108062573A (zh) 模型训练方法及装置
CN106897284B (zh) 电子书籍的推荐方法及装置
CN108833458B (zh) 一种应用推荐方法、装置、介质及设备
US9355414B2 (en) Collaborative filtering model having improved predictive performance
CN104079960B (zh) 文件推荐方法和装置
CN108090208A (zh) 融合数据处理方法及装置
CN105574045B (zh) 一种视频推荐方法和服务器
CN106446189A (zh) 一种资讯推荐方法及系统
CN104573113A (zh) 一种信息处理方法及服务器
CN109710611B (zh) 存储表数据的方法、查询表数据的方法、装置及存储介质
CN104270654B (zh) 互联网视频播放监测方法和装置
US11481449B2 (en) Learning affinities through design variations
WO2015175835A1 (en) Click through ratio estimation model
CN103365842B (zh) 一种页面浏览推荐方法及装置
CN108419135B (zh) 相似度确定方法、装置及电子设备
CN105260458A (zh) 一种用于显示装置的视频推荐方法及显示装置
US20140289334A1 (en) System and method for recommending multimedia information
US10346482B1 (en) Context- and activity-aware content selection
Yeung Do recommender systems benefit users? a modeling approach
Guan et al. Preference of online users and personalized recommendations
CN105447087B (zh) 一种视频推荐方法及装置
CN106484702B (zh) 目标网页访问量的展示方法和装置
CN106294456B (zh) 机器学习的方法和设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant