CN110532465A - 一种网站内容的推荐方法及推荐系统 - Google Patents

一种网站内容的推荐方法及推荐系统 Download PDF

Info

Publication number
CN110532465A
CN110532465A CN201910760803.XA CN201910760803A CN110532465A CN 110532465 A CN110532465 A CN 110532465A CN 201910760803 A CN201910760803 A CN 201910760803A CN 110532465 A CN110532465 A CN 110532465A
Authority
CN
China
Prior art keywords
corresponding content
difference
website traffic
content
recommendation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910760803.XA
Other languages
English (en)
Inventor
王晓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Cheerbright Technologies Co Ltd
Original Assignee
Beijing Cheerbright Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Cheerbright Technologies Co Ltd filed Critical Beijing Cheerbright Technologies Co Ltd
Priority to CN201910760803.XA priority Critical patent/CN110532465A/zh
Publication of CN110532465A publication Critical patent/CN110532465A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种网站内容的推荐方法及推荐系统。其中,方法包括步骤:通过预测部分流量对应的点击概率,来确定部分流量对应的内容的推荐顺序;通过比较网站流量的实际曝光量与基准曝光量,来调整网站流量对应的内容在下一次推荐时的投放权重;以及重复迭代上述确定推荐顺序的步骤和调整投放权重的步骤,以确定网站流量对应内容的推荐顺序。本发明一并公开了相应的计算设备。

Description

一种网站内容的推荐方法及推荐系统
技术领域
本发明涉及数据推荐技术领域,尤其是一种网站内容的推荐方法及推荐系统。
背景技术
目前市场上从事信息流推荐的企业中,因其内部繁多的业务线对于曝光流量都存在需求,故如何同时满足各业务线对曝光流量的需求,就成为一个不好解决的问题。
为解决这一问题,目前常采用的做法是:各业务线事先约定好各自的基准曝光量,然后在推荐算法中实现实际曝光量与基准曝光量的匹配。虽然这种处理方式考虑到了各业务线对曝光流量的需求,但由于强烈受制于各业务线的基准曝光量,其在给用户进行内容推荐时,并没有考量用户与内容的匹配度。也就是说,对于一些用户感兴趣的内容,可能会被推荐系统强制降权从而降低曝光;而对于一些用户并不感兴趣的内容,同样也可能会被推荐系统强制升权,推送给用户。这种做法对CTR(Click-Through-Rate,点击通过率)的提升造成了很大的局限性。
发明内容
为此,本发明提供了一种网站内容的推荐方法及推荐系统,以力图解决或者至少缓解上面存在的至少一个问题。
根据本发明的一个方面,提供了一种网站内容的推荐方法,适于在计算设备中执行,包括步骤:通过预测部分流量对应的点击概率,来确定部分流量对应的内容的推荐顺序;通过比较网站流量的实际曝光量与基准曝光量,来调整网站流量对应的内容在下一次推荐时的投放权重;以及重复迭代上述确定推荐顺序的步骤和调整投放权重的步骤,以确定网站流量对应内容的推荐顺序。
可选地,根据本发明的方法还包括步骤:对网站流量进行划分,以对所划分出的部分流量执行确定推荐顺序的步骤。
可选地,根据本发明的方法还包括步骤:实时获取网站流量的实际曝光量。
可选地,在根据本发明的方法中,通过预测部分流量对应的点击概率,来确定部分流量对应的内容的推荐顺序的步骤包括:采集部分流量中,与用户点击内容相关的数据;基于所采集的数据,生成特征数据;基于特征数据,预测出用户对于对应内容的点击概率;以及根据点击概率从高到低的顺序,确定部分流量对应内容的推荐顺序。
可选地,在根据本发明的方法中,通过比较网站流量的实际曝光量与基准曝光量,来调整网站流量对应的内容在下一次推荐时的投放权重的步骤包括:计算网站流量的实际曝光量与基准曝光量的差值;若差值不等于0,则根据差值调整对应内容在下一次推荐时的投放权重。
可选地,在根据本发明的方法中,若差值不等于0,则根据差值调整对应内容在下一次推荐时的投放权重的步骤包括:若差值大于0,则按照差值降低对应内容在下一次推荐时的投放权重;若差值小于0,则按照差值提高对应内容在下一次推荐时的投放权重。
可选地,在根据本发明的方法中,部分流量占网站流量的大多数。
可选地,在根据本发明的方法中,基于所采集的数据,生成特征数据的步骤包括:对所采集的数据进行预处理,生成样本数据;将样本数据输入XGBoost模型,生成样本数据对应的特征数据。
可选地,在根据本发明的方法中,基于特征数据,预测出用户对于对应内容的点击概率的步骤包括:利用逻辑回归模型,预测出用户对于对应内容的点击概率。
根据本发明的又一方面,提供了一种推荐系统,包括:自然推荐装置,适于通过预测部分流量对应的点击概率,来确定部分流量对应的内容的推荐顺序;以及智能投放装置,适于通过比较网站流量的实际曝光量与基准曝光量,来调整网站流量对应的内容在下一次推荐时的投放权重。
可选地,根据本发明的系统还包括流量划分装置,适于对网站流量进行划分,以将所划分出的部分流量输入自然推荐装置中确定推荐顺序,将所划分的另一部分流量输入智能投放装置中调整投放比重。
可选地,在根据本发明的系统中,自然推荐装置还适于计算部分流量的实际曝光量与基准曝光量的差值,并在差值不等于0时,将差值及其对应的内容标识发送给智能投放装置,以便于智能投放装置根据差值调整内容标识对应的内容在下一次推荐时的投放权重。
可选地,在根据本发明的系统中,智能投放装置还适于在差值大于0时,按照差值降低对应内容在下一次推荐时的投放权重;在差值小于0时,按照差值提高对应内容在下一次推荐时的投放权重。
可选地,根据本发明的系统还包括:曝光量监测装置,适于实时获取网站流量的实际曝光量。
可选地,在根据本发明的系统中,部分流量占网站流量的大多数。
根据本发明的另一方面,提供了一种计算设备,包括:一个或多个处理器;和存储器;一个或多个程序,其中一个或多个程序存储在存储器中并被配置为由一个或多个处理器执行,一个或多个程序包括用于执行如上所述方法中的任一方法的指令。
根据本发明的再一方面,提供了一种存储一个或多个程序的计算机可读存储介质,一个或多个程序包括指令,指令当计算设备执行时,使得计算设备执行如上所述方法中的任一方法。
根据本发明的推荐方案,一方面,利用推荐算法,结合用户的行为数据,预测大部分流量的点击概率,并由此确定出向用户推荐内容的顺序。另一方面,通过智能投放的动态控制,基于当前的实际曝光量与基准曝光量的差值,来调整下一次推荐时的投放权重,以满足各业务线对曝光量的需求。根据本发明的方案提供了一种在实现推荐效果最优的前提下,实现多种业务控频控量的方法。
附图说明
为了实现上述以及相关目的,本文结合下面的描述和附图来描述某些说明性方面,这些方面指示了可以实践本文所公开的原理的各种方式,并且所有方面及其等效方面旨在落入所要求保护的主题的范围内。通过结合附图阅读下面的详细描述,本公开的上述以及其它目的、特征和优势将变得更加明显。遍及本公开,相同的附图标记通常指代相同的部件或元素。
图1示出了根据本发明一个实施例的推荐系统100的环境示意图;
图2示出了根据本发明一个实施例的计算设备200的构造示意图;
图3示出了根据本发明一个实施例的网站内容的推荐方法300的流程图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
图1示出了根据本发明一个实施例的推荐系统100的环境示意图。应当了解,推荐系统100对应于在一个或多个计算机和/或计算系统中托管的在线服务,其中上述一个或多个计算机或计算系统是在整个网络中定位和/或分布的。通过网络彼此连接的一个或多个客户端001和一个或多个服务器002(通常是“主机”),组成了推荐系统100的环境。
一般地,响应于来自网络中客户端001的查询,推荐系统100从内容信息库(用于存储各业务线的内容信息,图1未示出)中提取中相应的内容,并返回推荐结果。通常,该推荐结果的显示顺序会影响用户关于推荐系统100的经验。
如前文所述,推荐系统100在进行内容推荐时,需要考虑各业务线的曝光需求,但这样的推荐方式忽略了内容与用户的匹配度。故根据本发明的实施方式,提供了一种新的推荐系统100,能够同时兼顾各业务线内容与用户的匹配度、以及各业务线的流量曝光需求。
根据本发明的一种实施例,推荐系统100至少包括自然推荐装置110和智能投放装置120。
其中,自然推荐装置110通过预测部分流量对应的点击概率,来确定部分流量对应的内容的推荐顺序。自然推荐装置110可以采用基于内容的协同过滤方法、结合用户的行为数据,得到符合每个用户需求的推荐结果。本发明的实施例对自然推荐装置具体采用各种推荐算法来计算点击概率、进而确定推荐顺序并不做过多限制。
例如,自然推荐装置110通过预测得到各业务线对应内容的点击概率分别为:业务线A为0.5、业务线B为0.2、业务线C为0.3,那么,按照点击概率从大到小的顺序,确定推荐顺序为业务线A、业务线C、业务线B。
智能投放装置120通过比较网站流量的实际曝光量与基准曝光量,来调整网站流量对应的内容在下一次推荐时的投放权重(在根据本发明的实施例中,投放比重即在下一轮推荐中,对应业务线内容的投放量占总投放量的比例)。这样,在下一次推荐时,推荐系统100就可以根据各业务线内容的投放比重,有目的地投放各业务线的内容,再由自然推荐装置110通过推荐算法计算点击概率,最终确定出推荐顺序。
除此之外,推荐系统100还可能包含流量划分装置130和曝光量监测装置140,如图1所示,流量划分装置130和曝光量监测装置140分别与自然推荐装置110和智能投放装置120相耦接。
根据一种实施例,流量划分装置130对网站流量进行划分,以将所划分出的部分流量(记作流量A)输入自然推荐装置110中,来确定推荐顺序,将所划分的另一部分流量(记作流量B)输入智能投放装置120中,来调整投放比重。
在一种实施例中,流量划分装置130可以看作是统一网关。通过统一网关来管理全站所有的流量,并将其划分成两部分:用于推荐的流量A和用于投放的流量B。
同时,流量划分装置130随机划分网站流量,为提高自然推荐的效果,一般部分流量占网站流量的大多数,即流量A占网站流量的比例大于流量B占网站流量的比例。例如,将网站流量划分为80%和20%两部分,其中,80%的流量输入自然推荐装置110中,确定推荐顺序;另外20%的流量输入智能投放装置120中,调整投放比重。本发明实施例对划分的具体比例并不做过多限制。
根据本发明的再一种实施例,曝光量监测装置140实时获取网站流量的实际曝光量。在一种实施例中,曝光量监测装置140按秒级实时获取所曝光内容的可见曝光占比,作为对应流量的实际曝光量。而基准曝光量可以是预先设置好的,例如可以设置业务线A的基准曝光占比为22%、业务线B的基准曝光占比为7.9%,等等。
自然推荐装置110在计算了部分流量的点击概率并确定推荐顺序后,接着计算部分流量的实际曝光量与基准曝光量的差值(即,用实际曝光量减去基准曝光量的差值)。当差值等于0时,说明当前的实际曝光量符合目标曝光量,自然推荐装置110结束本次计算。当差值不等于0时,自然推荐装置110将所计算出的差值及其对应的内容标识(即,该流量对应的业务线标识)发送给智能投放装置120,以便于智能投放装置120根据该差值调整内容标识对应的内容在下一次推荐时的投放权重。
优选地,若差值大于0,则说明该业务线内容的实际曝光量超过基准曝光量,智能投放装置120降低该业务线内容的投放权重,即,减少其在下一次推荐时的曝光;若差值小于0,则说明该业务线内容的实际曝光量低于基准曝光量,智能投放装置120动态提高该业务线内容的投放权重,即,进行曝光补差。从而在整体上达到实际曝光量与基准曝光量相匹配的目标。
综上,根据本发明的推荐系统100,在利用自然推荐装置110确定推荐顺序时,优先考虑了内容与用户的匹配度,而非实际曝光量与基准曝光量的匹配。同时,通过智能投放装置120的动态控制,来满足各业务线对可见曝光占比的需求。具体地,按秒级实时统计曝光内容中的各业务线实际曝光量,并与基准曝光量做比较,若某业务线实际曝光量超过基准曝光量,则动态调整,在智能投放装置120中降低该业务线内容的投放权重,减少其曝光;若某业务线实际曝光量低于基准曝光量,则通过智能投放装置120来动态提高该业务线内容的投放权重,进行曝光补差,从而在整体上达到实际的曝光量与基准曝光量相匹配的目标。系统100实现了在推荐效果最优的前提下,满足多业务控频控量的需求。
根据本发明的实施方式,系统100及其中的各装置,均可以通过如下所述的计算设备200来实现。图2示出了根据本发明一个实施例的计算设备200的示意图。
如图2所示,在基本的配置202中,计算设备200典型地包括系统存储器206和一个或者多个处理器204。存储器总线208可以用于在处理器204和系统存储器206之间的通信。
取决于期望的配置,处理器204可以是任何类型的处理,包括但不限于:微处理器(μP)、微控制器(μC)、数字信息处理器(DSP)或者它们的任何组合。处理器204可以包括诸如一级高速缓存210和二级高速缓存212之类的一个或者多个级别的高速缓存、处理器核心214和寄存器216。示例的处理器核心214可以包括运算逻辑单元(ALU)、浮点数单元(FPU)、数字信号处理核心(DSP核心)或者它们的任何组合。示例的存储器控制器218可以与处理器204一起使用,或者在一些实现中,存储器控制器218可以是处理器204的一个内部部分。
取决于期望的配置,系统存储器206可以是任意类型的存储器,包括但不限于:易失性存储器(诸如RAM)、非易失性存储器(诸如ROM、闪存等)或者它们的任何组合。系统存储器206可以包括操作系统220、一个或者多个应用222以及程序数据224。在一些实施方式中,应用222可以布置为在操作系统上由一个或多个处理器204利用程序数据224执行指令。
计算设备200还可以包括有助于从各种接口设备(例如,输出设备242、外设接口244和通信设备246)到基本配置202经由总线/接口控制器230的通信的接口总线240。示例的输出设备242包括图形处理单元248和音频处理单元250。它们可以被配置为有助于经由一个或者多个A/V端口252与诸如显示器或者扬声器之类的各种外部设备进行通信。示例外设接口244可以包括串行接口控制器254和并行接口控制器256,它们可以被配置为有助于经由一个或者多个I/O端口258和诸如输入设备(例如,键盘、鼠标、笔、语音输入设备、触摸输入设备)或者其他外设(例如打印机、扫描仪等)之类的外部设备进行通信。示例的通信设备246可以包括网络控制器260,其可以被布置为便于经由一个或者多个通信端口264与一个或者多个其他计算设备262通过网络通信链路的通信。
网络通信链路可以是通信介质的一个示例。通信介质通常可以体现为在诸如载波或者其他传输机制之类的调制数据信号中的计算机可读指令、数据结构、程序模块,并且可以包括任何信息递送介质。“调制数据信号”可以是这样的信号,它的数据集中的一个或者多个或者它的改变可以在信号中编码信息的方式进行。作为非限制性的示例,通信介质可以包括诸如有线网络或者专线网络之类的有线介质,以及诸如声音、射频(RF)、微波、红外(IR)或者其它无线介质在内的各种无线介质。这里使用的术语计算机可读介质可以包括存储介质和通信介质二者。
计算设备200可以实现为包括桌面计算机和笔记本计算机配置的个人计算机,也可以实现为服务器,例如文件服务器、数据库服务器、应用程序服务器和WEB服务器等。当然,计算设备200也可以实现为小尺寸便携(或者移动)电子设备的一部分。在根据本发明的实施例中,计算设备200被配置为执行根据本发明的网站内容的推荐方法300。计算设备200的应用222中包含执行根据本发明的方法300的多条程序指令。
图3示出了根据本发明一个实施例的网站内容的推荐方法300的流程示意图。方法300适于在如上所述的系统100中执行。如图3所示,方法300始于步骤S310。
在步骤S310中,对网站流量进行划分,以便于在后续步骤中,对所划分出的部分流量执行确定推荐顺序的步骤(即步骤S320),同时,对所划分出的除部分流量外的其他流量,执行调整投放比重的步骤(即步骤S330)。
如前文所述,通过统一网关来管理全站所有的流量,并将其随机划分成两部分:用于执行步骤S320的流量A和用于执行步骤S330的流量B,并且,部分流量(即,用于推荐的流量A)占网站流量的大多数。也就是说,在本发明的实施例中,只要保证用于确定推荐顺序的流量A要多于用于调整投放比重的流量B即可,而对于划分的具体比例,本发明实施例并不做过多限制。
随后在步骤S320中,通过预测部分流量(即流量A)对应的点击概率,来确定该部分流量对应的内容的推荐顺序。
根据本发明的实施方式,步骤S320可以按照如下的步骤来执行。
第一步,采集部分流量中,与用户点击内容相关的数据。
通常,在APP端、PC端、移动客户端的所有资源位均进行埋点,以记录用户行为数据和内容数据。此外,在本实施例中,还会对采集到的数据进行加工处理,去除脏数据以及重复数据,最终获取用户标识符(如user_id)维度对应的用户行为数据和相关内容数据。
第二步,基于所采集的数据,生成特征数据。
在一种实施例中,先对所采集的数据进行预处理,生成样本数据。而后,将样本数据输入XGBoost模型,生成样本数据对应的特征数据。
在根据本发明的实施场景中,推荐系统100通过推荐资源位向用户展示特定的内容。故,从所采集的数据中筛选出的样本数据应该至少包含以下三个维度的特征:
1)场景特征:时间信息、用户所处的位置、用户使用客户端(PC端、M端或APP端)、用户使用的设备信息等;
2)内容特征:内容所属业务线、内容所属产品线、浏览量、评论量、转发量、内容标签数据等;
3)用户特征:用户的基本属性数据(包括用户年龄、性别、收入等)、用户行为数据(包括用户的点击、收藏、评论、转发等)、用户画像特征等。
上述样本数据可以看作是一些连续的特征。将这些样本数据输入XGBoost模型中进行处理,以生成离散的特征。XGBoost(eXtreme Gradient Boosting,极端梯度提升)属于机器学习领域的常见算法,故此处不对模型的具体结构及训练过程进行过多阐述。
样本数据经模型处理后,得到K棵树,每棵树分别有n1,n2,…,nk个叶子结点。每个样本在每棵树中都会落在一个叶子结点上。以落在每棵树上的叶子结点ID作为该样本的特征值,就得到一个n1+n2+…+nk维的稀疏特征,作为该样本数据对应的特征数据。
第三步,基于特征数据,预测出用户对于对应内容的点击概率。
根据本发明的实施例,利用逻辑回归模型,预测出用户对于对应内容的点击概率。具体地,在得到上述特征数据后,将其再输入LR(Logistic Regression,逻辑回归)模型,同时,在逻辑回归模型中引入Sigmoid函数,将经线性回归的不确定范围的输出值映射到(0,1)范围内,最终输出预测的用户对于该特征数据对应流量的内容的点击概率。
第四步,根据点击概率从高到低的顺序,确定部分流量对应内容的推荐顺序。也就是说,将预测点击概率高的内容,优先推荐给用户。
根据本发明的实施例,运用XGBoost+LR,来预测部分流量对应的内容的点击概率,以确定出向用户推荐的顺序,这就保证了用户与内容的匹配度。
另一方面,在步骤S330中,通过比较网站流量的实际曝光量与基准曝光量,来调整网站流量对应的内容在下一次推荐时的投放权重。
在执行步骤S330之前,还包括步骤:实时(秒级)获取网站流量的实际曝光量。在一种实施例中,采用Flink处理框架,实时计算各业务线当前的可见曝光占比,作为实际曝光量。本发明实施例对如何获取网站流量的实际曝光量并不做过多限制,基于本发明实施例的描述,任何相关的算法均可以与本发明实施例相结合,来实现根据本发明的推荐算法。
根据本发明的实施例,在步骤S330中,计算网站流量的实际曝光量与基准曝光量的差值;若该差值不等于0,则根据该差值来调整对应内容在下一次推荐时的投放权重。
进一步地,步骤S330又可以分两步执行,分别记作步骤S332和步骤S334。
步骤S332接步骤S320,在步骤S332中,计算上述部分流量的实际曝光量与基准曝光量的差值,并判断该差值是否等于0。
若该差值等于0,则说明上述部分流量的实际曝光量符合基准曝光量,计算结束;若该差值不等于0,则将差值传给步骤S334,由其进行调整。
步骤S334接步骤S310,在划分好流量后,先开始执行步骤S320,来确定推荐顺序,步骤S334的执行会晚步骤S320一段时间(可选地,这两个步骤的执行错开的时间也是秒级)。
在步骤S334中,根据流量的实际曝光量与基准曝光量的差值,来调整流量对应内容在下一次推荐时的投放权重。一方面,会根据划分后的其他流量(即,流量B)的实际曝光量与基准曝光量的差值,来调整这一部分流量对应内容在下一次推荐时的投放权重;另一方面,接收来自步骤S332的差值,调整部分流量(即,流量A)中不符合基准曝光量的流量对应的内容的投放权重。
在根据本发明的实施例中,对两部分流量调整投放权重的方式是一致的。具体地,若该差值大于0,则按照该差值降低对应内容在下一次推荐时的投放权重;若该差值小于0,则按照该差值提高对应内容在下一次推荐时的投放权重。假设业务线A在当前的实际曝光量为20%,基准曝光量为17.5%,经计算,实际曝光量与基准曝光量的差值为2.5%,故需要将业务线A对应内容在下一次推荐时的投放权重降低2.5%。假设当前业务线A对应内容的投放权重是10%(初始的投放权重可以根据应用场景和业务线来进行设置),经调整后的投放权重就是7.5%。又如,业务线B在当前的实际曝光量为18%,基准曝光量为22%,经计算,实际曝光量与基准曝光量的差值为-4%,故需要将业务线A对应内容在下一次推荐时的投放权重提高4%(提高的投放权重值为差值的绝对值)。假设当前业务线B对应内容的投放权重是12%(同样,初始的投放权重可以根据应用场景和业务线来进行设置),经调整后的投放权重就是16%。
在随后的步骤S340中,重复迭代上述确定推荐顺序的步骤(即步骤S320)和调整投放权重(即步骤S330)的步骤,以确定网站流量对应内容的推荐顺序。
根据本发明的实施方式,根据调整后的投放比重对各业务线内容的投放量进行调整,在下一次推荐开始时,同样先执行步骤S320,根据大部分流量来确定推荐顺序;再执行步骤S330,来动态调整再下一次推荐时,各流量对应内容的投放权重。上述过程循环发生,并且以确定推荐顺序为主,调整投放权重为辅,最终在一天内实现满足各业务线基准曝光量的前提下,推荐效果的最优化。
应当了解,关于图1和图3的描述互为补充,篇幅所限,此处重复的内容不再一一赘述。
根据本发明的推荐方案,提供了一种在实现推荐效果最优的前提下,实现多种业务控频控量的方法。一方面,利用推荐算法,结合用户的行为数据,预测大部分流量的点击概率,并由此确定出向用户推荐内容的顺序。另一方面,通过智能投放的动态控制,基于当前的实际曝光量与基准曝光量的差值,来调整下一次推荐时的投放权重,以满足各业务线对曝光量的需求。根据本发明的方案对CTR提升非常友好。
本发明一并公开了:
A7、如A1-6中任一项所述的方法,其中,所述部分流量占所述网站流量的大多数。
A8、如A3所述的方法,其中,所述基于所采集的数据,生成特征数据的步骤包括:对所采集的数据进行预处理,生成样本数据;将样本数据输入XGBoost模型,生成样本数据对应的特征数据。
A9、如A3所述的方法,其中,基于特征数据,预测出用户对于对应内容的点击概率的步骤包括:利用逻辑回归模型,预测出用户对于对应内容的点击概率。
B12、如B10或11所述的推荐系统,其中,自然推荐装置还适于计算部分流量的实际曝光量与基准曝光量的差值,并在差值不等于0时,将差值及其对应的内容标识发送给智能投放装置,以便于智能投放装置根据差值调整内容标识对应的内容在下一次推荐时的投放权重。
B13、如B12所述的推荐系统,其中,智能投放装置还适于在差值大于0时,按照差值降低对应内容在下一次推荐时的投放权重;在差值小于0时,按照差值提高对应内容在下一次推荐时的投放权重。
B14、如B10-13中任一项所述的推荐系统,还包括:曝光量监测装置,适于实时获取网站流量的实际曝光量。
B15、如B11所述的推荐系统,其中,部分流量占所述网站流量的大多数。
应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员应当理解在本文所公开的示例中的设备的模块或单元或组件可以布置在如该实施例中所描述的设备中,或者可替换地可以定位在与该示例中的设备不同的一个或多个设备中。前述示例中的模块可以组合为一个模块或者此外可以分成多个子模块。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
这里描述的各种技术可结合硬件或软件,或者它们的组合一起实现。从而,本发明的方法和设备,或者本发明的方法和设备的某些方面或部分可采取嵌入有形媒介,例如软盘、CD-ROM、硬盘驱动器或者其它任意机器可读的存储介质中的程序代码(即指令)的形式,其中当程序被载入诸如计算机之类的机器,并被所述机器执行时,所述机器变成实践本发明的设备。
在程序代码在可编程计算机上执行的情况下,计算设备一般包括处理器、处理器可读的存储介质(包括易失性和非易失性存储器和/或存储元件),至少一个输入装置,和至少一个输出装置。其中,存储器被配置用于存储程序代码;处理器被配置用于根据该存储器中存储的所述程序代码中的指令,执行本发明所述的方法。
以示例而非限制的方式,计算机可读介质包括计算机存储介质和通信介质。计算机可读介质包括计算机存储介质和通信介质。计算机存储介质存储诸如计算机可读指令、数据结构、程序模块或其它数据等信息。通信介质一般以诸如载波或其它传输机制等已调制数据信号来体现计算机可读指令、数据结构、程序模块或其它数据,并且包括任何信息传递介质。以上的任一种的组合也包括在计算机可读介质的范围之内。
此外,所述实施例中的一些在此被描述成可以由计算机系统的处理器或者由执行所述功能的其它装置实施的方法或方法元素的组合。因此,具有用于实施所述方法或方法元素的必要指令的处理器形成用于实施该方法或方法元素的装置。此外,装置实施例的在此所述的元素是如下装置的例子:该装置用于实施由为了实施该发明的目的的元素所执行的功能。
如在此所使用的那样,除非另行规定,使用序数词“第一”、“第二”、“第三”等等来描述普通对象仅仅表示涉及类似对象的不同实例,并且并不意图暗示这样被描述的对象必须具有时间上、空间上、排序方面或者以任意其它方式的给定顺序。
尽管根据有限数量的实施例描述了本发明,但是受益于上面的描述,本技术领域内的技术人员明白,在由此描述的本发明的范围内,可以设想其它实施例。此外,应当注意,本说明书中使用的语言主要是为了可读性和教导的目的而选择的,而不是为了解释或者限定本发明的主题而选择的。因此,在不偏离所附权利要求书的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。对于本发明的范围,对本发明所做的公开是说明性的,而非限制性的,本发明的范围由所附权利要求书限定。

Claims (10)

1.一种网站内容的推荐方法,所述方法适于在计算设备中执行,包括步骤:
通过预测部分流量对应的点击概率,来确定所述部分流量对应的内容的推荐顺序;
通过比较网站流量的实际曝光量与基准曝光量,来调整所述网站流量对应的内容在下一次推荐时的投放权重;以及
重复迭代上述确定推荐顺序的步骤和调整投放权重的步骤,以确定所述网站流量对应内容的推荐顺序。
2.如权利要求1所述的方法,还包括步骤:
对所述网站流量进行划分,以对所划分出的部分流量执行所述确定推荐顺序的步骤。
3.如权利要求1或2所述的方法,在所述通过比较网站流量的实际曝光量与基准曝光量,来调整网站流量对应的内容在下一次推荐时的投放权重的步骤之前,还包括步骤:
实时获取所述网站流量的实际曝光量。
4.如权利要求1-3中任一项所述的方法,其中,所述通过预测部分流量对应的点击概率,来确定部分流量对应的内容的推荐顺序的步骤包括:
采集所述部分流量中,与用户点击内容相关的数据;
基于所采集的数据,生成特征数据;
基于所述特征数据,预测出用户对于对应内容的点击概率;以及
根据点击概率从高到低的顺序,确定所述部分流量对应内容的推荐顺序。
5.如权利要求1-4中任一项所述的方法,其中,所述通过比较网站流量的实际曝光量与基准曝光量,来调整网站流量对应的内容在下一次推荐时的投放权重的步骤包括:
计算网站流量的实际曝光量与基准曝光量的差值;
若所述差值不等于0,则根据所述差值调整对应内容在下一次推荐时的投放权重。
6.如权利要求5所述的方法,其中,所述若差值不等于0,则根据差值调整对应内容在下一次推荐时的投放权重的步骤包括:
若所述差值大于0,则按照所述差值降低对应内容在下一次推荐时的投放权重;
若所述差值小于0,则按照所述差值提高对应内容在下一次推荐时的投放权重。
7.一种推荐系统,包括:
自然推荐装置,适于通过预测部分流量对应的点击概率,来确定所述部分流量对应的内容的推荐顺序;以及
智能投放装置,适于通过比较网站流量的实际曝光量与基准曝光量,来调整所述网站流量对应的内容在下一次推荐时的投放权重。
8.如权利要求7所述的推荐系统,还包括:
流量划分装置,适于对所述网站流量进行划分,以将所划分出的部分流量输入所述自然推荐装置中确定推荐顺序,将所划分的另一部分流量输入所述智能投放装置中调整投放比重。
9.一种计算设备,包括:
一个或多个处理器;和
存储器;
一个或多个程序,其中所述一个或多个程序存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序包括用于执行根据权利要求1-6所述方法中的任一方法的指令。
10.一种存储一个或多个程序的计算机可读存储介质,所述一个或多个程序包括指令,所述指令当计算设备执行时,使得所述计算设备执行根据权利要求1-6所述的方法中的任一方法。
CN201910760803.XA 2019-08-16 2019-08-16 一种网站内容的推荐方法及推荐系统 Pending CN110532465A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910760803.XA CN110532465A (zh) 2019-08-16 2019-08-16 一种网站内容的推荐方法及推荐系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910760803.XA CN110532465A (zh) 2019-08-16 2019-08-16 一种网站内容的推荐方法及推荐系统

Publications (1)

Publication Number Publication Date
CN110532465A true CN110532465A (zh) 2019-12-03

Family

ID=68663573

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910760803.XA Pending CN110532465A (zh) 2019-08-16 2019-08-16 一种网站内容的推荐方法及推荐系统

Country Status (1)

Country Link
CN (1) CN110532465A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112365333A (zh) * 2020-11-18 2021-02-12 北京明略昭辉科技有限公司 实时动态流量分配方法、系统、电子设备及存储介质
CN112738227A (zh) * 2020-12-28 2021-04-30 广州金融科技股份有限公司 一种资讯热度的评估方法、计算机设备和存储介质
CN113378066A (zh) * 2021-07-12 2021-09-10 杭州弧途科技有限公司 一种兼职岗位推荐系统的流量控制方法
CN113592547A (zh) * 2021-07-29 2021-11-02 上海苍苔信息技术有限公司 一种渠道送量激励方法和系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104574160A (zh) * 2015-01-29 2015-04-29 深圳市英威诺科技有限公司 一种广告流量平滑控制的方法
US9098551B1 (en) * 2011-10-28 2015-08-04 Google Inc. Method and system for ranking content by click count and other web popularity signals
CN105631711A (zh) * 2015-12-30 2016-06-01 合一网络技术(北京)有限公司 一种广告投放方法及装置
CN106204113A (zh) * 2016-06-29 2016-12-07 北京小米移动软件有限公司 广告投放方法及装置
CN107977850A (zh) * 2016-10-25 2018-05-01 北星传媒(北京)有限公司 信息投放方法和系统
CN108960901A (zh) * 2018-06-13 2018-12-07 网易(杭州)网络有限公司 数据处理方法、装置、介质及电子设备
CN109840782A (zh) * 2017-11-24 2019-06-04 腾讯科技(深圳)有限公司 点击率预测方法、装置、服务器以及存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9098551B1 (en) * 2011-10-28 2015-08-04 Google Inc. Method and system for ranking content by click count and other web popularity signals
CN104574160A (zh) * 2015-01-29 2015-04-29 深圳市英威诺科技有限公司 一种广告流量平滑控制的方法
CN105631711A (zh) * 2015-12-30 2016-06-01 合一网络技术(北京)有限公司 一种广告投放方法及装置
CN106204113A (zh) * 2016-06-29 2016-12-07 北京小米移动软件有限公司 广告投放方法及装置
CN107977850A (zh) * 2016-10-25 2018-05-01 北星传媒(北京)有限公司 信息投放方法和系统
CN109840782A (zh) * 2017-11-24 2019-06-04 腾讯科技(深圳)有限公司 点击率预测方法、装置、服务器以及存储介质
CN108960901A (zh) * 2018-06-13 2018-12-07 网易(杭州)网络有限公司 数据处理方法、装置、介质及电子设备

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112365333A (zh) * 2020-11-18 2021-02-12 北京明略昭辉科技有限公司 实时动态流量分配方法、系统、电子设备及存储介质
CN112365333B (zh) * 2020-11-18 2024-04-05 北京明略昭辉科技有限公司 实时动态流量分配方法、系统、电子设备及存储介质
CN112738227A (zh) * 2020-12-28 2021-04-30 广州金融科技股份有限公司 一种资讯热度的评估方法、计算机设备和存储介质
CN112738227B (zh) * 2020-12-28 2022-10-18 广州金融科技股份有限公司 一种资讯热度的评估方法、计算机设备和存储介质
CN113378066A (zh) * 2021-07-12 2021-09-10 杭州弧途科技有限公司 一种兼职岗位推荐系统的流量控制方法
CN113378066B (zh) * 2021-07-12 2022-07-29 杭州弧途科技有限公司 一种兼职岗位推荐系统的流量控制方法
CN113592547A (zh) * 2021-07-29 2021-11-02 上海苍苔信息技术有限公司 一种渠道送量激励方法和系统

Similar Documents

Publication Publication Date Title
CN110532465A (zh) 一种网站内容的推荐方法及推荐系统
CN110866628A (zh) 利用动态时间上下文学习进行多界限时间序列预测的系统和方法
CN104462593B (zh) 一种提供用户个性化资源消息推送的方法和装置
CN107547214B (zh) 基于电子书的群组阅读方法、电子设备及计算机存储介质
CN109242013B (zh) 一种数据标注方法、装置、电子设备及存储介质
CN108833458B (zh) 一种应用推荐方法、装置、介质及设备
JP2021517295A (ja) レコメンダシステムのための高効率畳み込みネットワーク
CN114139714A (zh) 用于硬件感知的机器学习模型训练的方法和装置
CN110971659A (zh) 推荐消息的推送方法、装置及存储介质
Becker et al. ANP-based analysis of ICT usage in Central European enterprises
CN110532468A (zh) 一种网站资源的推荐方法、装置和计算设备
WO2016174678A1 (en) Auto-expanding campaign optimization
CN110413867B (zh) 用于内容推荐的方法及系统
US11727250B2 (en) Elastic-centroid based clustering
US20200074509A1 (en) Business data promotion method, device, terminal and computer-readable storage medium
JP2017509960A (ja) コンテンツ推奨のための方法、装置およびシステム
CN110533437B (zh) 广告投放预算分配方法及装置
CN109615504A (zh) 产品推荐方法、装置、电子设备和计算机可读存储介质
CN106575870B (zh) 用于确定用于发电系统的参数设置的系统、方法和设备及有形计算机可读介质
CN112131413A (zh) 一种多媒体信息处理方法、装置、电子设备及存储介质
US10313457B2 (en) Collaborative filtering in directed graph
CN112132601A (zh) 广告标题改写方法、装置和存储介质
CN106997360A (zh) 用户行为数据的处理方法和装置
CN111652282B (zh) 基于大数据的用户偏好分析方法、装置及电子设备
US20230011954A1 (en) Device, method, and system for business plan management

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20191203

RJ01 Rejection of invention patent application after publication