CN109753601A - 推荐信息点击率确定方法、装置及电子设备 - Google Patents

推荐信息点击率确定方法、装置及电子设备 Download PDF

Info

Publication number
CN109753601A
CN109753601A CN201811436037.3A CN201811436037A CN109753601A CN 109753601 A CN109753601 A CN 109753601A CN 201811436037 A CN201811436037 A CN 201811436037A CN 109753601 A CN109753601 A CN 109753601A
Authority
CN
China
Prior art keywords
recommendation information
information
user
row
recommendation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811436037.3A
Other languages
English (en)
Other versions
CN109753601B (zh
Inventor
梁召
胡军
陈英傑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing QIYI Century Science and Technology Co Ltd
Original Assignee
Beijing QIYI Century Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing QIYI Century Science and Technology Co Ltd filed Critical Beijing QIYI Century Science and Technology Co Ltd
Priority to CN201811436037.3A priority Critical patent/CN109753601B/zh
Publication of CN109753601A publication Critical patent/CN109753601A/zh
Application granted granted Critical
Publication of CN109753601B publication Critical patent/CN109753601B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供了推荐信息点击率确定方法、装置及电子设备,该方法包括:获取针对指定类型中推荐信息的信息选取指令;确定信息选取指令选取的目标推荐信息及目标推荐信息所在的行;更新目标推荐信息的点击次数;根据目标推荐信息所在的行及各推荐信息所在的行,通过指定类型对应的预设概率模型,确定各推荐信息被用户看到的概率,其中,同一行的各推荐信息被用户看到的概率相同;按照各推荐信息被用户看到的概率,更新各推荐信息的浏览次数;按照各推荐信息的点击次数及浏览次数,计算各推荐信息的点击率。通过本发明实施例的推荐信息点击率确定方法,点击率的计算更加合理准确。

Description

推荐信息点击率确定方法、装置及电子设备
技术领域
本发明涉及数据推荐技术领域,特别是涉及推荐信息点击率确定方法、装置及电子设备。
背景技术
随着互联网技术的发展,人们加速进入到信息化时代。伴随着大数据时代的来临,如何在海量的信息数据中,选取用户感兴趣的信息进行推荐,成为大数据时代的互联网的主要研究课题之一。在现有的推荐技术中,点击率被广泛应用于搜索、推荐、广告排序模型中。在排序模型中,点击率较高的信息通常更容易获得更高的排序位置。
在相关技术中,当计算点击率时,统计用户对各推荐信息的点击次数,并统计各推荐信息出现在展示页面中的展示次数,针对同一推荐信息,利用该推荐信息的点击次数除以该推荐信息的展示次数,从而确定该推荐信息的点击率。
然而,发明人在实现本发明的过程中发现,现有技术至少存在如下问题:
在展示页面中,通常包含几条甚至十几条推荐信息,相对于前几位推荐信息,用户看到排序靠后的推荐信息的概率较低。因此,在上述统计方法中排序靠后的推荐信息的展示次数会比用户真实看到的次数偏高,导致排序靠后的推荐信息的点击率偏计算不准确。
发明内容
本发明实施例的目的在于提供一种推荐信息点击率确定方法、装置及电子设备,以提高推荐信息的点击率的准确度。具体技术方案如下:
第一方面,本发明实施例提供了一种推荐信息点击率确定方法,所述方法包括:
获取针对指定类型中推荐信息的信息选取指令;
确定所述信息选取指令选取的目标推荐信息及所述目标推荐信息所在的行;
更新所述目标推荐信息的点击次数;
根据所述目标推荐信息所在的行及各推荐信息所在的行,通过所述指定类型对应的预设概率模型,确定各所述推荐信息被用户看到的概率,其中,同一行的各推荐信息被用户看到的概率相同;
按照各所述推荐信息被用户看到的概率,更新各所述推荐信息的浏览次数;
按照各所述推荐信息的点击次数及浏览次数,计算各所述推荐信息的点击率。
可选的,在所述获取针对指定类型中推荐信息的信息选取指令之前,所述方法还包括:
获取搜索指令,确定所述搜索指令搜索的指定类型的推荐信息;
按照所述指定类型的各推荐信息的点击率,排序所述指定类型的各推荐信息,并推荐排序后的各推荐信息。
可选的,所述预设概率模型为预先确定的用户浏览模型UBM,所述根据所述目标推荐信息所在的行及各推荐信息所在的行,通过所述指定类型对应的预设概率模型,确定各所述推荐信息被用户看到的概率,包括:
针对每个推荐信息,按照该推荐信息所在的行及所述目标推荐信息所在的行,通过所述指定类型对应的UBM,确定该推荐信息被用户看到的概率γrr′,其中,r为该推荐信息所在的行,r′为所述目标推荐信息所在的行。
可选的,所述按照各所述推荐信息被用户看到的概率,更新各所述推荐信息的浏览次数,包括:
针对每个推荐信息,获取该推荐信息的历史浏览次数,在该推荐信息的历史浏览次数上增加该推荐信息被用户看到的概率,以更新各所述推荐信息的浏览次数。
可选的,本发明实施例的推荐信息点击率确定方法还包括:
建立针对每个类型的日志数据信息,其中,任一类型的日志数据信息包括该类型中各推荐信息的标识、历史浏览次数及点击次数。
第二方面,本发明实施例提供了一种推荐信息点击率确定装置,所述装置包括:
选取指令获取模块,用于获取针对指定类型中推荐信息的信息选取指令;
目标信息确定模块,用于确定所述信息选取指令选取的目标推荐信息及所述目标推荐信息所在的行;
点击此处更新模块,用于更新所述目标推荐信息的点击次数;
浏览概率计算模块,用于根据所述目标推荐信息所在的行及各推荐信息所在的行,通过所述指定类型对应的预设概率模型,确定各所述推荐信息被用户看到的概率,其中,同一行的各推荐信息被用户看到的概率相同;
浏览次数更新模块,用于按照各所述推荐信息被用户看到的概率,更新各所述推荐信息的浏览次数;
点击率确定模块,用于按照各所述推荐信息的点击次数及浏览次数,计算各所述推荐信息的点击率。
可选的,本发明实施例的推荐信息点击率确定装置还包括:
搜索指令获取模块,用于获取搜索指令,确定所述搜索指令搜索的指定类型的推荐信息;
信息推荐模块,用于按照所述指定类型的各推荐信息的点击率,排序所述指定类型的各推荐信息,并推荐排序后的各推荐信息。
可选的,所述预设概率模型为预先确定的用户浏览模型UBM,所述浏览概率计算模块,具体用于:
针对每个推荐信息,按照该推荐信息所在的行及所述目标推荐信息所在的行,通过所述指定类型对应的UBM,确定该推荐信息被用户看到的概率γrr′,其中,r为该推荐信息所在的行,r′为所述目标推荐信息所在的行。
可选的,所述浏览次数更新模块,具体用于:
针对每个推荐信息,获取该推荐信息的历史浏览次数,在该推荐信息的历史浏览次数上增加该推荐信息被用户看到的概率,以更新各所述推荐信息的浏览次数。
可选的,本发明实施例的推荐信息点击率确定装置还包括:
日志数据建立模块,用于建立针对每个类型的日志数据信息,其中,任一类型的日志数据信息包括该类型中各推荐信息的标识、历史浏览次数及点击次数。
第三方面,本发明实施例提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,所述处理器,所述通信接口,所述存储器通过所述通信总线完成相互间的通信;
所述存储器,用于存放计算机程序;
所述处理器,用于执行存储器上所存放的程序时,实现上述第一方面任一所述的推荐信息点击率确定方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述第一方面任一所述的推荐信息点击率确定方法。
第五方面,本发明实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述第一方面任一所述的推荐信息点击率确定方法。
本发明实施例提供的推荐信息点击率确定方法、装置及电子设备,获取针对指定类型中推荐信息的信息选取指令;确定信息选取指令选取的目标推荐信息及目标推荐信息所在的行;更新目标推荐信息的点击次数;根据目标推荐信息所在的行及各推荐信息所在的行,通过指定类型对应的预设概率模型,确定各推荐信息被用户看到的概率,其中,同一行的各推荐信息被用户看到的概率相同;按照各推荐信息被用户看到的概率,更新各推荐信息的浏览次数;按照各推荐信息的点击次数及浏览次数,计算各推荐信息的点击率。计算推荐信息的浏览次数,利用浏览次数代替展示次数计算推荐信息的点击率,推荐信息点击率的计算更加合理准确。并且在计算推荐信息被用户看到的概率时,按照推荐信息所在的行进行计算,更加符合用户的真实浏览规律,推荐信息浏览次数的计算更加合理准确,从而使推荐信息点击率的计算更加合理准确。后续按照点击率对各推荐信息进行推荐,其推荐顺序也更加合理。当然,实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1为本发明实施例的推荐信息点击率确定方法的第一种流程示意图;
图2为本发明实施例的推荐信息点击率确定方法的第二种流程示意图;
图3为本发明实施例的推荐信息点击率确定方法的第三种流程示意图;
图4为本发明实施例的推荐信息点击率确定装置的一种示意图;
图5为本发明实施例的电子设备的一种示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行描述。
片库搜索是一种结构化搜索,按照多个维度对视频进行筛选排序,如按照视频的频道(例如,电视剧、电影、综艺、动漫等),地区(例如,中国香港、美国、泰国等),类型(例如,动作、喜剧、科幻等)及年代等多个维度搜索筛选。服务方会筛选出符合用户筛选要求的指定类型的视频,并在展示界面中按照视频的点击率,降序排列展示指定类型的各视频。
在现有技术中,统计用户对各推荐信息的点击次数,并统计各推荐信息出现在展示页面中的展示次数,针对同一推荐信息,利用该推荐信息的点击次数除以该推荐信息的展示次数,从而确定该推荐信息的点击率。
然而在展示页面中,通常包含几条甚至十几条推荐信息,相对于前几位推荐信息,用户看到排序靠后的推荐信息的概率较低。因此,在上述统计方法中排序靠后的推荐信息的展示次数会比用户真实看到的次数偏高,导致排序靠后的推荐信息的点击率偏计算不准确。从而引起排序中的马太效应:初始排序靠前的视频统计得到的点击率更高,使得排序位置更高,从而影响整个排序系统的生态循环。
有鉴于此,本发明实施例提供了一种推荐信息点击率确定方法,参见图1,该方法包括:
S101,获取针对指定类型中推荐信息的信息选取指令。
本发明实施例中的推荐信息点击率确定方法可以通过服务器实现,该服务器包括:处理器、存储器、通信接口和总线;处理器、存储器和通信接口通过总线连接并完成相互间的通信;存储器存储可执行程序代码;处理器通过读取存储器中存储的可执行程序代码来运行与可执行程序代码对应的程序,以用于执行本发明实施例的推荐信息点击率确定方法。
指定类型为符合用户检索需求的类型,用户在指定类型中发现感兴趣的推荐信息时,通过触摸屏或鼠标点击等方式生成信息选取指令,服务器获取该信息选取指令。本发明实施例中的推荐信息为任意的推荐信息,可以包括视频信息、音频信息、文本信息及图像信息中的一种或多种。
S102,确定信息选取指令选取的目标推荐信息及目标推荐信息所在的行。
服务器按照信息选取指令,确定信息选取指令选取的推荐信息,即目标推荐信息,并确定目标推荐信息在展示页面中的行数。
S103,更新目标推荐信息的点击次数。
服务器更新目标推荐信息的点击次数。服务器每获取到一个信息选取指令,便将该信息选取指令选取的推荐信息的点击次数增加1。
S104,根据目标推荐信息所在的行及各推荐信息所在的行,通过指定类型对应的预设概率模型,确定各推荐信息被用户看到的概率,其中,同一行的各推荐信息被用户看到的概率相同。
服务器以展示页面中的行作为概率计算的基本单位,将一行作为一个整体,计算各行的推荐信息被用户看到的概率,再按照各推荐信息所在的行,得到各推荐信息被用户看到的概率。不同的指定类型可以对应不同的预设概率模型,预设概率模型可以为UBM(User Browsing Model,用户浏览模型)、PBM (Population Balance Model,群体平衡模型)、DBN(Dynamic Bayesian Network Model,动态贝叶斯网络模型)或CM(Cascade Model,级联模型)等。
S105,按照各推荐信息被用户看到的概率,更新各推荐信息的浏览次数。
与展出次数不同,浏览次数是指推荐信息被用户看到的次数。服务器按照各推荐信息被用户看到的概率,更新各推荐信息的浏览次数。例如,针对推荐信息A,在一次展示的过程中,该推荐信息A被用户看到的概率为0.5,则将该推荐信息的浏览次数增加0.5。
本发明实施例中,S104需要在S105前执行,同时S103与S105需要在 S106前执行,但是并不限定S103与S104的执行顺序,也不限定S103与S105 的执行顺序。
S106,按照各推荐信息的点击次数及浏览次数,计算各推荐信息的点击率。
针对每个推荐信息,用该推荐信息的点击次数除以该推荐信息的浏览次数,得到该推荐信息的点击率。当用户数量很大时,为了减轻服务器的处理负载,服务器可以按照预设周期,周期性的计算各推荐信息的点击率;还可以按照总点击次数触发计算点击率,即总点击次数每增加预设数值时,服务器便各按照推荐信息的点击次数及浏览次数,计算各推荐信息的点击率。
在确定各推荐信息的点击率后,服务器还可以按照各推荐信息的点击率,更新指定类型中各推荐信息的排序,例如按照点击率对各推荐信息进行降序排序。
在本发明实施例中,计算推荐信息的浏览次数,利用浏览次数代替展示次数计算推荐信息的点击率,推荐信息点击率的计算更加合理准确。并且在计算推荐信息被用户看到的概率时,按照推荐信息所在的行进行计算,更加符合用户的真实浏览规律,推荐信息浏览次数的计算更加合理准确,从而使推荐信息点击率的计算更加合理准确。后续按照点击率对各推荐信息进行推荐,其推荐顺序也更加合理。
可选的,参见图2,在获取针对指定类型中推荐信息的信息选取指令之前,方法还包括:
S1001,获取搜索指令,确定搜索指令搜索的指定类型的推荐信息。
服务器获取由用户输入的搜索指令,并确定该搜索指令搜索的指定类型,例如,针对视频,该搜索指令可以指定搜索喜剧类型的视频等;或针对新闻,该搜索指令可以指定搜索财经类型的新闻等。服务器根据该搜索指令搜索的指定类型,确定该指定类型的各推荐信息。例如,当针对视频时,指定类型为粤语类型,则确定粤语类型的各推荐视频;或当针对音乐时,指定类型为摇滚类型,则确定摇滚类型的各推荐音乐。
S1002,按照指定类型的各推荐信息的点击率,排序指定类型的各推荐信息,并推荐排序后的各推荐信息。
服务器按照指定类型中各推荐信息的点击率,对各推荐信息进行排序,例如进行降序排序,并向用户推荐排序后的推荐信息。用户终端按照服务器发送的推荐信息,展示各推荐信息。例如,针对手机端,电影推荐每行可以显示3 个推荐信息、综艺推荐每行可以显示2个推荐信息、娱乐推荐每行可以显示1 个推荐信息等。
在本发明实施例中,通过搜索指令实现对不同类型的推荐信息的推荐,按照点击率排序推荐各推荐信息,能够满足用户的观看需要,提高用户体验。
可选的,预设概率模型为预先确定的用户浏览模型UBM,根据目标推荐信息所在的行及各推荐信息所在的行,通过指定类型对应的预设概率模型,确定各推荐信息被用户看到的概率,包括:
针对每个推荐信息,按照该推荐信息所在的行及目标推荐信息所在的行,通过指定类型对应的UBM,确定该推荐信息被用户看到的概率γrr′,其中,r 为该推荐信息所在的行,r′为目标推荐信息所在的行。
首选对UBM进行介绍,假设用户从上往下浏览推荐信息,当用户看到一个推荐信息时,用户点击该推荐信息的概率取决于推荐信息的相关性,即:
P(Cu=1)=P(Eu=1)·P(Au=1)
P(Au=1)=αuq (1)
其中,P(Cu=1)表示用户点击第u个推荐信息,P(Eu)表示第u个推荐信息被用户看到的概率,P(Au)表示第u个推荐信息和搜索词之间的相关度。
假设用户点击推荐信息的概率取决于上次点击推荐信息的位置和距离,距离越大,当前位置视频被浏览到的概率越小,简单的可以用如下公式表示:
P(Er=1|C1=c1,...,Cr-1=cr-1)=γrr′ (2)
因此,UBM包含两个参数,αuq和γrr′,后续统称为exam(测试)参数。基于搜索用户点击日志,采用EM(Expectation Maximization,期望最大化)算法训练迭代得到exam参数:
其中,exam参数γrr′的物理意义:当用户点击r′行视频后,用户浏览到r 行视频的概率。
在推荐信息为视频等信息时,直接应用方法效果较差,原因是片库搜索与普通搜索的场景不同,用户意图不同,对应训练出的参数差异较大。对于普通搜索,通常按相关性排序,而用户搜索意图明确,检索到相关结果后往下浏览的概率较小;而片库搜索中,用户的搜索意图不明确,浏览属性较强,且片库中不同频道的结果页,用户行为不同,对于长视频的频道,用户点击观看完成需要较长时间,完成后继续浏览的概率较小,对于短视频的频道,由于用户能很快观看完成,继续浏览的概率较大,因此有必要对搜索场景进行分类,对每个分类分别训练模型参数。
本发明实施例中应用训练好的exam参数估计用户看到每一个推荐信息的概率,对推荐信息的展示次数进行修正,得到推荐信息的浏览次数,进而计算得到更加真实的点击率。
可选的,按照各推荐信息被用户看到的概率,更新各推荐信息的浏览次数,包括:
针对每个推荐信息,获取该推荐信息的历史浏览次数,在该推荐信息的历史浏览次数上增加该推荐信息被用户看到的概率,以更新各推荐信息的浏览次数。
例如,对于推荐信息S,推荐信息S的历史浏览次数为22.4,本次展示过程中推荐信息S被用户看到的概率为0.3,则更新推荐信息S的浏览次数为 22.4+0.3=22.7。
可选的,本发明实施例的推荐信息点击率确定方法还包括:
建立针对每个类型的日志数据信息,其中,任一类型的日志数据信息包括该类型中各推荐信息的标识、历史浏览次数及点击次数。
服务器预先生成各类型的日志数据信息,日志数据信息中包括该日志数据信息所属的类型中各推荐信息的标识、历史浏览次数及点击次数,还可以包括推荐信息的展示位置及上下文分类等。例如,服务器生成的日志数据信息的格式可以为:search-class|event_id|impression|click|pos|docid_list_str|time。其中,search-class为上述搜索上下文分类;event_id为标识一次搜索/推荐展示行为的id;对于展示pingback,impression=1;对于点击pingback,click=1;pos 为推荐信息的展示位置;docid_list_str为推荐信息的id,对于展示pingback, docid_list_str是所有展示的推荐信息的id的拼接,对于点击pingback, docid_list_str为用户点击的推荐信息id;time为展示或者点击发生的时间。
在本发明实施例中,建立各类型的日志数据信息,方便数据的查询及后续分析。
本发明实施例的推荐信息点击率确定方法还可以如图3所示。按照搜索的平台(笔记本电脑、平板电脑或智能手机等)、频道、page(页)、排序模式等因素中的一种或几种组合进行分类,并且根据不同分类下,以行为单位,将每行作为一个位置进行训练,例如,手机端电影频道每行显示3个结果、手机端综艺频道每行显示2个结果、手机端娱乐频道每行显示1个结果。
训练过程采用UBM模型,估计每种类型下的exam参数。生成搜索日志数据格式:search-class|event_id|impression|click|pos|docid_list_str|time。其中,search-class是上述搜索上下文分类;event_id是标识一次搜索行为的id;对于展示pingback,impression=1;对于点击pingback,click=1;pos为推荐视频的展示位置;docid_list_str为推荐视频id,对于展示pingback,docid_list_str是所有展示的推荐视频的id的拼接,对于点击pingback,docid_list_str为用户点击的推荐视频id;time为展示或者点击发生的时间。采用开源工具,比如pyclick,训练上述数据,可以得到每个分类下exam参数。
常规点击率的计算ctr=click_count/impression_count,click_count是一段时间内某视频的点击量,impression_count是对应时间内的展示量。对于用户的每一次搜索请求,采用exam参数可以估计用户真实看到展示视频的概率。例如用户点击了第二行的某个推荐视频,可以判断用户浏览过前二行推荐视频,这两行的各推荐视频的浏览次数都+1;用户看到第三行视频的概率为γ32,该行的每个视频浏览次数+γ32;看到第四行的视频的概率为γ42,该行的每个视频浏览次数+γ42。按照这种方法,统计一段时间内,视频点击次数(click_count) 和浏览次数(fix_impression_count),可以计算修正后的fix_ctr=click_count/ fix_impression_count。上述相关性可以作为搜索排序特征,亦可作为生成训练数据集的label(标签)。
本发明实施例提供了一种推荐信息点击率确定装置,参见图4,该装置包括:
选取指令获取模块401,用于获取针对指定类型中推荐信息的信息选取指令;
目标信息确定模块402,用于确定信息选取指令选取的目标推荐信息及目标推荐信息所在的行;
点击此处更新模块403,用于更新目标推荐信息的点击次数;
浏览概率计算模块404,用于根据目标推荐信息所在的行及各推荐信息所在的行,通过指定类型对应的预设概率模型,确定各推荐信息被用户看到的概率,其中,同一行的各推荐信息被用户看到的概率相同;
浏览次数更新模块405,用于按照各推荐信息被用户看到的概率,更新各推荐信息的浏览次数;
点击率确定模块406,用于按照各推荐信息的点击次数及浏览次数,计算各推荐信息的点击率。
在本发明实施例中,计算推荐信息的浏览次数,利用浏览次数代替展示次数计算推荐信息的点击率,推荐信息点击率的计算更加合理准确。并且在计算推荐信息被用户看到的概率时,按照推荐信息所在的行进行计算,更加符合用户的真实浏览规律,推荐信息浏览次数的计算更加合理准确,从而使推荐信息点击率的计算更加合理准确。后续按照点击率对各推荐信息进行推荐,其推荐顺序也更加合理。
可选的,本发明实施例的推荐信息点击率确定装置还包括:
搜索指令获取模块,用于获取搜索指令,确定搜索指令搜索的指定类型的推荐信息;
信息推荐模块,用于按照指定类型的各推荐信息的点击率,排序指定类型的各推荐信息,并推荐排序后的各推荐信息。
可选的,预设概率模型为预先确定的用户浏览模型UBM,浏览概率计算模块404,具体用于:
针对每个推荐信息,按照该推荐信息所在的行及目标推荐信息所在的行,通过指定类型对应的UBM,确定该推荐信息被用户看到的概率γrr′,其中,r 为该推荐信息所在的行,r′为目标推荐信息所在的行。
可选的,浏览次数更新模块405,具体用于:
针对每个推荐信息,获取该推荐信息的历史浏览次数,在该推荐信息的历史浏览次数上增加该推荐信息被用户看到的概率,以更新各推荐信息的浏览次数。
可选的,本发明实施例的推荐信息点击率确定装置还包括:
日志数据建立模块,用于建立针对每个类型的日志数据信息,其中,任一类型的日志数据信息包括该类型中各推荐信息的标识、历史浏览次数及点击次数。
本发明实施例还提供了一种电子设备,如图5所示,包括处理器501、通信接口502、存储器503和通信总线504,其中,处理器501,通信接口502,存储器503通过通信总线504完成相互间的通信,
存储器503,用于存放计算机程序;
处理器501,用于执行存储器503上所存放的程序时,实现如下步骤:
获取针对指定类型中推荐信息的信息选取指令;
确定信息选取指令选取的目标推荐信息及目标推荐信息所在的行;
更新目标推荐信息的点击次数;
根据目标推荐信息所在的行及各推荐信息所在的行,通过指定类型对应的预设概率模型,确定各推荐信息被用户看到的概率,其中,同一行的各推荐信息被用户看到的概率相同;
按照各推荐信息被用户看到的概率,更新各推荐信息的浏览次数;
按照各推荐信息的点击次数及浏览次数,计算各推荐信息的点击率。
在本发明实施例中,计算推荐信息的浏览次数,利用浏览次数代替展示次数计算推荐信息的点击率,推荐信息点击率的计算更加合理准确。并且在计算推荐信息被用户看到的概率时,按照推荐信息所在的行进行计算,更加符合用户的真实浏览规律,推荐信息浏览次数的计算更加合理准确,从而使推荐信息点击率的计算更加合理准确。后续按照点击率对各推荐信息进行推荐,其推荐顺序也更加合理。
可选的,处理器501,用于执行存储器503上所存放的程序时,还能够实现任一推荐信息点击率确定方法。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的推荐信息点击率确定方法法。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的推荐信息点击率确定方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备、存储介质及计算机程序产品的实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (11)

1.一种推荐信息点击率确定方法,其特征在于,所述方法包括:
获取针对指定类型中推荐信息的信息选取指令;
确定所述信息选取指令选取的目标推荐信息及所述目标推荐信息所在的行;
更新所述目标推荐信息的点击次数;
根据所述目标推荐信息所在的行及各推荐信息所在的行,通过所述指定类型对应的预设概率模型,确定各所述推荐信息被用户看到的概率,其中,同一行的各推荐信息被用户看到的概率相同;
按照各所述推荐信息被用户看到的概率,更新各所述推荐信息的浏览次数;
按照各所述推荐信息的点击次数及浏览次数,计算各所述推荐信息的点击率。
2.根据权利要求1所述的方法,其特征在于,在所述获取针对指定类型中推荐信息的信息选取指令之前,所述方法还包括:
获取搜索指令,确定所述搜索指令搜索的指定类型的推荐信息;
按照所述指定类型的各推荐信息的点击率,排序所述指定类型的各推荐信息,并推荐排序后的各推荐信息。
3.根据权利要求1所述的方法,其特征在于,所述预设概率模型为预先确定的用户浏览模型UBM,所述根据所述目标推荐信息所在的行及各推荐信息所在的行,通过所述指定类型对应的预设概率模型,确定各所述推荐信息被用户看到的概率,包括:
针对每个推荐信息,按照该推荐信息所在的行及所述目标推荐信息所在的行,通过所述指定类型对应的UBM,确定该推荐信息被用户看到的概率γrr′,其中,r为该推荐信息所在的行,r′为所述目标推荐信息所在的行。
4.根据权利要求3所述的方法,其特征在于,所述按照各所述推荐信息被用户看到的概率,更新各所述推荐信息的浏览次数,包括:
针对每个推荐信息,获取该推荐信息的历史浏览次数,在该推荐信息的历史浏览次数上增加该推荐信息被用户看到的概率,以更新各所述推荐信息的浏览次数。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
建立针对每个类型的日志数据信息,其中,任一类型的日志数据信息包括该类型中各推荐信息的标识、历史浏览次数及点击次数。
6.一种推荐信息点击率确定装置,其特征在于,所述装置包括:
选取指令获取模块,用于获取针对指定类型中推荐信息的信息选取指令;
目标信息确定模块,用于确定所述信息选取指令选取的目标推荐信息及所述目标推荐信息所在的行;
点击此处更新模块,用于更新所述目标推荐信息的点击次数;
浏览概率计算模块,用于根据所述目标推荐信息所在的行及各推荐信息所在的行,通过所述指定类型对应的预设概率模型,确定各所述推荐信息被用户看到的概率,其中,同一行的各推荐信息被用户看到的概率相同;
浏览次数更新模块,用于按照各所述推荐信息被用户看到的概率,更新各所述推荐信息的浏览次数;
点击率确定模块,用于按照各所述推荐信息的点击次数及浏览次数,计算各所述推荐信息的点击率。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:
搜索指令获取模块,用于获取搜索指令,确定所述搜索指令搜索的指定类型的推荐信息;
信息推荐模块,用于按照所述指定类型的各推荐信息的点击率,排序所述指定类型的各推荐信息,并推荐排序后的各推荐信息。
8.根据权利要求6所述的装置,其特征在于,所述预设概率模型为预先确定的用户浏览模型UBM,所述浏览概率计算模块,具体用于:
针对每个推荐信息,按照该推荐信息所在的行及所述目标推荐信息所在的行,通过所述指定类型对应的UBM,确定该推荐信息被用户看到的概率γrr′,其中,r为该推荐信息所在的行,r′为所述目标推荐信息所在的行。
9.根据权利要求8所述的装置,其特征在于,所述浏览次数更新模块,具体用于:
针对每个推荐信息,获取该推荐信息的历史浏览次数,在该推荐信息的历史浏览次数上增加该推荐信息被用户看到的概率,以更新各所述推荐信息的浏览次数。
10.根据权利要求6所述的装置,其特征在于,所述装置还包括:
日志数据建立模块,用于建立针对每个类型的日志数据信息,其中,任一类型的日志数据信息包括该类型中各推荐信息的标识、历史浏览次数及点击次数。
11.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,所述处理器,所述通信接口,所述存储器通过所述通信总线完成相互间的通信;
所述存储器,用于存放计算机程序;
所述处理器,用于执行存储器上所存放的程序时,实现权利要求1-5任一所述的方法步骤。
CN201811436037.3A 2018-11-28 2018-11-28 推荐信息点击率确定方法、装置及电子设备 Active CN109753601B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811436037.3A CN109753601B (zh) 2018-11-28 2018-11-28 推荐信息点击率确定方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811436037.3A CN109753601B (zh) 2018-11-28 2018-11-28 推荐信息点击率确定方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN109753601A true CN109753601A (zh) 2019-05-14
CN109753601B CN109753601B (zh) 2021-10-22

Family

ID=66402577

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811436037.3A Active CN109753601B (zh) 2018-11-28 2018-11-28 推荐信息点击率确定方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN109753601B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111339355A (zh) * 2020-05-21 2020-06-26 北京搜狐新媒体信息技术有限公司 一种视频推荐方法及系统
CN111984839A (zh) * 2019-05-21 2020-11-24 北京沃东天骏信息技术有限公司 绘制用户画像的方法和装置
CN111984869A (zh) * 2020-08-25 2020-11-24 北京每日优鲜电子商务有限公司 物品信息推送方法、装置、电子设备和计算机可读介质
CN112307313A (zh) * 2019-07-31 2021-02-02 北京达佳互联信息技术有限公司 一种信息推荐方法、装置及存储介质
CN112417263A (zh) * 2019-08-23 2021-02-26 北京达佳互联信息技术有限公司 数据推荐方法、装置及存储介质
CN112487278A (zh) * 2019-09-11 2021-03-12 华为技术有限公司 推荐模型的训练方法、预测选择概率的方法及装置
CN113158020A (zh) * 2020-01-22 2021-07-23 北京达佳互联信息技术有限公司 视频的推荐方法及装置
CN115148330A (zh) * 2022-05-24 2022-10-04 中国医学科学院北京协和医院 Pop治疗方案形成方法及系统

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1677394A (zh) * 2004-03-22 2005-10-05 微软公司 优化付费列表收益的系统和方法
US20060010229A1 (en) * 2002-05-09 2006-01-12 Microsoft Corporation User intention modeling for web navigation
US8468197B2 (en) * 2006-10-18 2013-06-18 Google Inc. Generic online ranking system and method suitable for syndication
CN104424291A (zh) * 2013-09-02 2015-03-18 阿里巴巴集团控股有限公司 一种对搜索结果进行排序的方法及装置
US20150213368A1 (en) * 2012-10-08 2015-07-30 Tencent Technology (Shenzhen) Company Limited Information recommendation method, apparatus, and server
CN103116582B (zh) * 2011-11-16 2016-03-02 阿里巴巴集团控股有限公司 一种信息检索方法及相关系统和装置
CN103268344B (zh) * 2013-05-24 2016-04-06 华东师范大学 一种无位置偏见影响的广告与页面匹配的方法
CN105678335A (zh) * 2016-01-08 2016-06-15 车智互联(北京)科技有限公司 预估点击率的方法、装置及计算设备
CN106294497A (zh) * 2015-06-09 2017-01-04 深圳市腾讯计算机系统有限公司 信息推荐方法和装置
CN103207876B (zh) * 2012-01-17 2017-04-12 阿里巴巴集团控股有限公司 一种信息投放的方法及装置
CN107493467A (zh) * 2017-07-06 2017-12-19 北京奇艺世纪科技有限公司 一种视频质量评估方法及装置
CN107844525A (zh) * 2017-10-12 2018-03-27 广州艾媒数聚信息咨询股份有限公司 一种基于用户行为的资讯个性化推荐方法、系统及装置
CN108460085A (zh) * 2018-01-19 2018-08-28 北京奇艺世纪科技有限公司 一种基于用户日志的视频搜索排序训练集构建方法及装置
CN103593353B (zh) * 2012-08-15 2018-11-13 阿里巴巴集团控股有限公司 信息搜索方法、展示信息排序权重值确定方法及其装置
CN108804647A (zh) * 2018-06-06 2018-11-13 北京奇艺世纪科技有限公司 一种视频排序的方法及装置

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060010229A1 (en) * 2002-05-09 2006-01-12 Microsoft Corporation User intention modeling for web navigation
CN1677394A (zh) * 2004-03-22 2005-10-05 微软公司 优化付费列表收益的系统和方法
US8468197B2 (en) * 2006-10-18 2013-06-18 Google Inc. Generic online ranking system and method suitable for syndication
CN103116582B (zh) * 2011-11-16 2016-03-02 阿里巴巴集团控股有限公司 一种信息检索方法及相关系统和装置
CN103207876B (zh) * 2012-01-17 2017-04-12 阿里巴巴集团控股有限公司 一种信息投放的方法及装置
CN103593353B (zh) * 2012-08-15 2018-11-13 阿里巴巴集团控股有限公司 信息搜索方法、展示信息排序权重值确定方法及其装置
US20150213368A1 (en) * 2012-10-08 2015-07-30 Tencent Technology (Shenzhen) Company Limited Information recommendation method, apparatus, and server
CN103268344B (zh) * 2013-05-24 2016-04-06 华东师范大学 一种无位置偏见影响的广告与页面匹配的方法
CN104424291A (zh) * 2013-09-02 2015-03-18 阿里巴巴集团控股有限公司 一种对搜索结果进行排序的方法及装置
CN106294497A (zh) * 2015-06-09 2017-01-04 深圳市腾讯计算机系统有限公司 信息推荐方法和装置
CN105678335A (zh) * 2016-01-08 2016-06-15 车智互联(北京)科技有限公司 预估点击率的方法、装置及计算设备
CN107493467A (zh) * 2017-07-06 2017-12-19 北京奇艺世纪科技有限公司 一种视频质量评估方法及装置
CN107844525A (zh) * 2017-10-12 2018-03-27 广州艾媒数聚信息咨询股份有限公司 一种基于用户行为的资讯个性化推荐方法、系统及装置
CN108460085A (zh) * 2018-01-19 2018-08-28 北京奇艺世纪科技有限公司 一种基于用户日志的视频搜索排序训练集构建方法及装置
CN108804647A (zh) * 2018-06-06 2018-11-13 北京奇艺世纪科技有限公司 一种视频排序的方法及装置

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
GEORGES DUPRET,BENJAMIN PIWOWARSKI: "A User Browsing Model to Predict Search Engine Click Data from Past Observations", 《ACM》 *
OLIVIER CHAPELLE,YA ZHANG: "A Dynamic Bayesian Network Click Model for Web Search Ranking", 《ACM》 *
王超: "搜索引擎点击模型综述", 《智能系统学报》 *
纪文迪: "广告点击率估算技术综述", 《华东师范大学学报(自然科学版)》 *
陈巧红: "广告点击率预估技术综述", 《浙江理工大学学报(自然科学版)》 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111984839A (zh) * 2019-05-21 2020-11-24 北京沃东天骏信息技术有限公司 绘制用户画像的方法和装置
CN112307313A (zh) * 2019-07-31 2021-02-02 北京达佳互联信息技术有限公司 一种信息推荐方法、装置及存储介质
CN112307313B (zh) * 2019-07-31 2024-04-16 北京达佳互联信息技术有限公司 一种信息推荐方法、装置及存储介质
CN112417263A (zh) * 2019-08-23 2021-02-26 北京达佳互联信息技术有限公司 数据推荐方法、装置及存储介质
CN112417263B (zh) * 2019-08-23 2024-01-09 北京达佳互联信息技术有限公司 数据推荐方法、装置及存储介质
CN112487278A (zh) * 2019-09-11 2021-03-12 华为技术有限公司 推荐模型的训练方法、预测选择概率的方法及装置
WO2021047593A1 (zh) * 2019-09-11 2021-03-18 华为技术有限公司 推荐模型的训练方法、预测选择概率的方法及装置
CN113158020A (zh) * 2020-01-22 2021-07-23 北京达佳互联信息技术有限公司 视频的推荐方法及装置
CN111339355A (zh) * 2020-05-21 2020-06-26 北京搜狐新媒体信息技术有限公司 一种视频推荐方法及系统
CN111984869A (zh) * 2020-08-25 2020-11-24 北京每日优鲜电子商务有限公司 物品信息推送方法、装置、电子设备和计算机可读介质
CN115148330A (zh) * 2022-05-24 2022-10-04 中国医学科学院北京协和医院 Pop治疗方案形成方法及系统
CN115148330B (zh) * 2022-05-24 2023-07-25 中国医学科学院北京协和医院 Pop治疗方案形成方法及系统

Also Published As

Publication number Publication date
CN109753601B (zh) 2021-10-22

Similar Documents

Publication Publication Date Title
CN109753601A (zh) 推荐信息点击率确定方法、装置及电子设备
TWI636416B (zh) 內容個人化之多相排序方法和系統
TWI461939B (zh) 補充文章內容之方法、設備、電腦可讀取紀錄媒體、電腦程式產品、以及電腦系統
TWI582619B (zh) Method and apparatus for providing referral words
Agarwal et al. Statistical methods for recommender systems
CN110110201B (zh) 一种内容推荐方法和系统
KR100970335B1 (ko) 사용자의 관심 키워드를 업데이트 하는 방법과 그 방법을수행하기 위한 시스템
CN103198418A (zh) 一种应用推荐方法和系统
CN102197394A (zh) 通过基于注释聚集搜索结果来进行数字图像取得
CN106354867A (zh) 多媒体资源的推荐方法及装置
WO2020224128A1 (zh) 基于用户短期兴趣的新闻推荐方法及装置、电子设备及介质
CN109474542A (zh) 基于业务规则的消息推送请求流量控制方法、装置及介质
CN106951527B (zh) 一种歌曲推荐方法及装置
CN104462553A (zh) 问答页面相关问题推荐方法及装置
CN105915956A (zh) 视频内容的推荐方法、装置、服务器及系统
CN108153909B (zh) 关键词投放拓词方法、装置及电子设备、存储介质
CN107562939A (zh) 垂直领域新闻推荐方法、装置及可读储存介质
CN110175264A (zh) 视频用户画像的构建方法、服务器及计算机可读存储介质
CN111159563A (zh) 用户兴趣点信息的确定方法、装置、设备及存储介质
JP5813052B2 (ja) 情報処理装置、方法及びプログラム
CN103955480A (zh) 一种用于确定用户所对应的目标对象信息的方法与设备
CN107944026A (zh) 一种图集个性化推荐的方法、装置、服务器和存储介质
JP2006053616A (ja) サーバ装置、webサイト推奨方法およびプログラム
CN106445922B (zh) 确定多媒体资源的标题的方法及装置
JP2012059183A (ja) コンテンツ推薦装置,コンテンツ推薦プログラムおよびその記録媒体

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant