CN110543598B - 信息推荐方法、装置及终端 - Google Patents

信息推荐方法、装置及终端 Download PDF

Info

Publication number
CN110543598B
CN110543598B CN201910843373.8A CN201910843373A CN110543598B CN 110543598 B CN110543598 B CN 110543598B CN 201910843373 A CN201910843373 A CN 201910843373A CN 110543598 B CN110543598 B CN 110543598B
Authority
CN
China
Prior art keywords
information
pool
vector
user
cluster
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910843373.8A
Other languages
English (en)
Other versions
CN110543598A (zh
Inventor
黄玉兰
宋佳颖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201910843373.8A priority Critical patent/CN110543598B/zh
Publication of CN110543598A publication Critical patent/CN110543598A/zh
Application granted granted Critical
Publication of CN110543598B publication Critical patent/CN110543598B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Abstract

本申请公开了一种信息推荐方法、装置及终端,属于人工智能领域。在该方法中,响应信息推荐请求,得到与之对应的信息池,并根据信息点击率对信息池进行划分,得到第一信息池和第二信息池;按照召回策略分别对第一信息池和第二信息池进行召回处理,并根据得到的信息簇生成信息推荐列表。这样,对信息池按照信息点击率进行了划分,可以使得召回的信息一部分能够反映用户点击过的信息,另一部分可以表征对时新信息的召回,从而实现了对时新信息的召回,使得最终生成的信息推荐结果完整和准确。

Description

信息推荐方法、装置及终端
技术领域
本申请涉及人工智能技术领域,尤其涉及一种信息推荐方法、装置及终 端。
背景技术
随着信息技术的日益发展,信息推荐已经成为目前网络技术应用的一项 重要内容。例如,在用户浏览新闻时推荐其可能感兴趣的内容,在用户浏览 商品时推荐其倾向购买的商品等等。
通常在进行信息推荐时,需要从信息池中召回待推荐信息,生成信息推 荐列表并反馈至用户。其中,在对信息池进行召回处理时,目前通常是根据 用户点击率这一参数实现,导致现有的信息推荐方法得到的推荐信息往往都 是用户点击过的历史信息,会造成在进行信息推荐时某些信息的丢失,使得 信息推荐结果不完整和不准确。
发明内容
有鉴于此,本申请提供了一种信息推荐方法、装置及终端,以使得能够 提升推荐信息的完整性和准确性。
为实现上述目的,一方面,本申请提供了一种信息推荐方法,包括:
响应信息推荐请求,得到与所述信息推荐请求对应的信息池;
对所述信息池按照信息点击率进行划分,得到第一信息池和第二信息池, 所述第一信息池中信息的点击率大于阈值;所述第二信息池中信息的点击率 不大于所述阈值;
按照召回策略分别对所述第一信息池和所述第二信息池中的信息进行召 回处理,得到与所述第一信息池对应的第一信息簇,以及与所述第二信息池 对应的第二信息簇;
利用所述第一信息簇和所述第二信息簇,生成信息推荐列表。
在一种可能的实现方式中,该方法还包括:
获取训练样本集,所述训练样本集是带有用户和信息对应关系的样本日 志;
对所述训练样本集进行特征提取,获得至少包括信息点击率特征的第一 样本特征;以及不包括信息点击率特征和信息序列号特征的第二样本特征;
通过包括第一样本特征的训练样本集对神经网络进行训练,得到第一召 回模型,所述第一召回模型用于利用信息的点击率特征和信息的语义特征对 信息进行召回;
通过包括第二样本特征的训练样本集对神经网络进行训练,得到第二召 回模型,所述第二召回模型用于仅利用信息的语义特征对信息进行召回。
在又一种可能的实现方式中,所述按照召回策略分别对所述第一信息池 和所述第二信息池中的信息进行召回处理,得到与所述第一信息池对应的第 一信息簇,以及与所述第二信息池对应的第二信息簇,包括:
利用所述第一召回模型对所述第一信息池进行处理,得到第一信息向量, 所述第一信息向量表征至少包括信息点击率特征的向量;
通过所述第一信息向量对所述第一信息池的信息进行聚簇处理,得到第 一信息簇;
利用所述第二召回模型对所述第二信息池进行处理,得到第二信息向量, 所述第二信息向量为信息语义特征的向量;
通过所述第二信息向量对所述第二信息池的信息进行聚簇处理,得到第 二信息簇。
又一方面,本申请还提供了一种信息推荐装置,包括:
请求响应单元,用于响应信息推荐请求,得到与所述信息推荐请求对应 的信息池;
信息池划分单元,用于对所述信息池按照信息点击率进行划分,得到第 一信息池和第二信息池,所述第一信息池中信息的点击率大于阈值;所述第 二信息池中信息的点击率不大于所述阈值;
信息召回单元,用于按照召回策略分别对所述第一信息池和所述第二信 息池中的信息进行召回处理,得到与所述第一信息池对应的第一信息簇,以 及与所述第二信息池对应的第二信息簇;
推荐列表生成单元,用于利用所述第一信息簇和所述第二信息簇,生成 信息推荐列表。
又一方面,本申请还提供了一种终端,包括:
处理器和存储器;
其中,所述处理器用于执行所述存储器中存储的程序;
所述存储器用于存储程序,所述程序至少用于:
响应信息推荐请求,得到与所述信息推荐请求对应的信息池;
对所述信息池按照信息点击率进行划分,得到第一信息池和第二信息池, 所述第一信息池中信息的点击率大于阈值;所述第二信息池中信息的点击率 不大于所述阈值;
按照召回策略分别对所述第一信息池和所述第二信息池中的信息进行召 回处理,得到与所述第一信息池对应的第一信息簇,以及与所述第二信息池 对应的第二信息簇;
利用所述第一信息簇和所述第二信息簇,生成信息推荐列表。
可见,在期望获取推荐信息时,响应信息推荐请求,得到与之对应的信 息池,并根据信息点击率对信息池进行划分,得到第一信息池和第二信息池; 按照召回策略分别对第一信息池和第二信息池进行召回处理,并根据得到的 信息簇生成信息推荐列表。这样,对信息池按照信息点击率进行了划分,可 以使得召回的信息一部分能够反映用户点击过的信息,另一部分可以表征对 时新信息的召回,从而实现了对时新信息的召回,使得最终生成的信息推荐 结果完整和准确。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中 所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本 申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提 下,还可以根据提供的附图获得其他的附图。
图1示出了本申请实施例的一种信息推荐系统一种组成架构示意图;
图2示出了本申请实施例的一种信息推荐方法的一种流程交互示意图;
图3示出了本申请实施例的一种信息池的划分示意图;
图4示出了本申请实施例的终端展示推荐信息列表的一示例图;
图5示出了本申请实施例的一种召回模型的生成方法的流程示意图;
图6示出了本申请实施例的召回模型生成过程的示例图;
图7示出了本申请实施例的一种信息推荐列表生成的方法的流程示意图;
图8示出了本申请实施例的一种文章推荐系统的处理流程示意图;
图9示出了本申请实施例提供的一种视频推荐场景的示例图;
图10示出了本申请实施例的一种信息推荐装置的组成示意图;
图11示出了本申请实施例的一种终端的组成结构示意图。
具体实施方式
本申请的方案可以在用户浏览某些互联网应用或者访问相关信息,服务 器通过用户浏览的应用或者其他信息传输渠道,向当前用户推荐某些信息的 过程中,可以较为及时、准确地为用户提供除用户点击过的历史信息外的时 新信息的推荐,以保证推荐信息的准确性和完整性。
其中,在本申请实施例中,推荐的信息是指用于向用户推荐的各种能够 被传输和处理的内容,可以为音讯、消息、通讯系统等传输和处理的对象, 例如,推荐的信息可以是音频数据、视频数据、新闻资讯、商品信息等。召 回,是指在信息推荐系统的待推荐的信息集中,根据某些特征而选定的一批 待推荐的信息。
生成的信息推荐列表可以包括若干个针对当前信息推荐请求相匹配的信 息。例如,信息推荐请求表征的是获取推荐的音频信息,则信息推荐列表中 会包括若干条音频数据,并且这些音频数据会满足与信息推荐请求相匹配的 用户特征,或者满足该信息推荐请求产生的时间特征,又或者满足发出该信 息推荐请求的应用属性特征,等等。
为了便于理解本申请的信息推荐方法,下面对本申请的信息推荐方法所 适用的系统进行介绍,参见图1,其示出了本申请一种信息推荐系统一种组成 架构示意图。
如图1所示,本申请实施例提供的信息推荐系统包括:终端10和服务器20 用户通过在终端10中安装的信息应用的客户端,打开、登录或点击信息应用 的客户端后可以浏览信息页面。当用户在终端进行信息页面浏览时,会产生 信息推荐请求,终端将该信息推荐请求发送至服务器20中。实现本申请实施 例提供的信息推荐方法的信息推荐装置可以作为应用的服务端程序安装于服 务器20。当服务器20执行信息推荐方法时会应用召回策略,对与信息推荐请 求对应的信息池中的信息进行召回,需要说明的是在进行信息召回时首先需 要根据信息的点击率对信息池进行划分,然后对划分后的信息池分别进行信 息召回。
在本申请实施例中,信息推荐请求可以是用户通过终端10浏览信息应用 的客户端时产生的,也可以是信息应用定时产生的,如,每天下午15:00为用 户推荐相关信息的信息推荐请求。其中,终端10可以为手机、平板电脑等移 动终端,也可以为连接有信息显示或信息输出功能模块的个人计算机等固定 终端。
相应的,服务器20会识别终端10发送的信息推荐请求,并通过信息召回 处理匹配与该信息推荐请求对应的信息,生成信息推荐列表,将该信息推荐 列表返回给终端10,以使得终端10可以输出该信息推荐列表,从而达到向终 端的用户推荐信息的目的。
终端10与服务器20,以及服务器20和数据库30之间均是通过网络进行数 据传输和信息交互的。
下面对图1示出的信息推荐系统对应的信息推荐方法进行说明。请参见图 2,其示出了一种信息推荐方法一个实施例的流程交互示意图,本实施例的方 法可以包括:
S201、终端发送信息推荐请求至服务器。
当用户对终端中的信息应用客户端进行信息浏览时会生成信息推荐请 求,或者当用户对终端中的信息应用进行使用时,在某个固定时间段会生成 信息推荐请求,又或者当终端的某个应用设置有接收推荐信息的应用功能时, 即使用户没有使用或者浏览该应用,也会在固定时间段生成信息推荐请求。
在信息应用生成信息推荐请求后,终端会将该信息推荐请求发送至服务 器,以使得服务器能够接收到该信息推荐请求。
S202、服务器获得与信息推荐请求对应的信息池;
S203、服务器对信息池按照信息点击率进行划分,得到第一信息池和第 二信息池。
信息池包括若干个信息,并且对每个信息池内的信息均会按照点击率进 行划分,得到第一信息池和第二信息池,其中,第一信息池中信息的点击率 大于阈值,第二信息池中信息的点击率不大于所述阈值。阈值是指根据信息 推荐需求和精细粒度确定的,例如,将阈值设置为1,则对应的第一信息池中 的信息都满足历史点击数大于1的条件对应的信息,而第二信息池中的信息都 满足历史点击数不大于1的条件对应的信息。需要说明的是,该历史点击数量 是指在当前时刻之前的一段时间内的点击数量,如可以,是当前时刻的上一 个小时,也可以是特定的某个时间段。即对点击数量进行判断时是通过统计 周期内的点击数量来判断的。
信息池可以根据不同的信息属性标签进行划分,例如,包括音频信息池、 视频信息池、新闻资讯信息池、商品信息池等。并且,为了保证推荐的信息 能够满足用户的需求和具有时新醒,信息池中的信息可以是按照更新周期进 行更新的。例如,每隔一天对信息池中的信息进行更新。
服务器在接收到信息推荐请求时,需要对信息推荐请求进行解析,以获 得待推荐信息的信息属性标签以及用户属性标签。可以通过对生成信息推荐 请求的信息应用的相关标识信息进行解析,也可以对发送信息推荐请求的终 端信息进行解析,也可以对信息推荐请求携带的信息进行解析,通常信息推 荐请求会携带请求发送终端的信息、请求具体内容信息,请求信息类型信息 等。对信息推荐请求进行解析时,首先要获得待推荐信息的相关类型等属性 标签,即需要推荐的信息类型是什么。如,需要推荐的信息是新闻资讯,或者是视频信息。
举例说明,当用户访问某个视频客户端时,会生成一个信息推荐请求, 由于该视频客户端中会存在“热点视频”这一列表,当用户需要对某个视频 进行播放时,也会对应播放广告。因此,当用户访问该视频客户端时,生成 的信息推荐请求会包括请求视频信息和请求广告信息的关键信息。这样,服 务器根据该视频请求确定的信息池会包括视频信息池和广告信息池。
目前已知的信息推荐方式中,实质均是依赖于对用户自身的历史浏览信 息的行为分析确定。即通常是通过分析用户已经点击的信息,然后确定待推 荐的目标信息。这样会造成目标信息是用户点击过的历史信息,其中,用户 泛指所有对信息进行阅读、浏览和点击的用户对象,即统计的点击率不一定 来源于发出信息推荐请求的目标用户。该点击是指用户对某些信息的选定, 例如,用户点击某条新闻资讯,其可以浏览到该新闻资讯的具体内容;又例 如,用户在电商平台上浏览商品信息时对某个商品的点击,其可以对该商品的商品详情信息进行浏览。需要说明的是,在本申请实施例中的点击属性是 表征用户对某些信息是否进行浏览或选定的描述方式,在特殊的应用场景中, 点击属性并不一定是通过用户对某些信息的点击这个动作产生的。如,在眼 动控制场景中,信息的点击属性可以通过用户对信息的注视时长来体现,即 当用户注视某个信息一定时长后,就会展示该信息,则对应的用户这个注视 的动作也能作为体现信息的点击属性的执行动作。此时,阈值可以表征用户 的注视时长。
参见图3,其示出了本申请实施例中一种信息池的划分示意图。在图3中, 信息池包括视频信息池301,音频信息池302和新闻资讯信息池303。并按照用 户对新闻资讯的点击数量对新闻资讯信息池303中的新闻资讯进行划分,例 如,将历史点击数量大于2的新闻资讯划分到第一信息池3031中,将历史点击 数量不大于2的新闻资讯划分至第二信息池3032中。需要说明的是,第一信息 池中的点击事件并不一定来源于产生信息推荐请求对应的终端用户,也可以 是统计的其他用户的点击次数,即只要当前新闻资讯被点击过2次以上,无论 是哪个用户进行的点击,均可以被划分至第一信息池中。
S204、服务器按照召回策略分别对第一信息池和第二信息池中的信息进 行召回处理,得到与第一信息池对应的第一信息簇,以及与第二信息池对应 的第二信息簇;
该召回策略是分别针对第一信息池和第二信息池的,即分别针对具有点 击率的信息的召回,和没有点击率的信息或者点击率较低的信息的召回。
随着人工智能技术快速发展,从传统的机器学到目前的深度学习,人工 智能技术被广泛应用于多个领域。可以理解的是,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟延伸和扩 展的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技 术及应用系统。
在本申请实施例提供的信息推荐方法中,也应用了人工智能技术,即可 以通过深度学习的方法来确定召回策略,具体的,通过深度学习的方式来对 大量的样本信息进行学习,来获得样本信息之间的相似性和关联性,从而可 以实现计算机模拟或实现人类的学习行为,这样可以通过深度学习的方式来 学习获得信息召回的行为,从而可以确定信息召回策略,来获得召回信息。
该召回策略可以对第一信息池中的信息主要按照点击率进行聚簇分析, 得到点击率较高的信息簇,当然在对信息按照点击率进行聚簇分析的过程中, 也会考虑信息之间的语义相似度,使得召回的信息不仅具有较高的点击率还 具有语义管理;该召回策略可以对第二信息池中的信息进行语义分析,需要 说明的是,在对第二信息池中的信息进行语义分析时,是只通过信息的语义 特征进行分析,不考虑其点击属性,这样相当于忽略了信息是否被点击这个 特征,使得聚簇分析的结果也适用于对时新信息的召回。语义聚簇分析可以 为对信息进行类型聚簇分析,或者主题聚簇、标签聚簇等,得到语义关联较 相似的信息簇。
因此,召回策略分别针对不同的信息池进行处理,使得召回得到的信息 簇,至少包括两方面的信息,一方面是对具有点击率的信息进行召回,可以 保证信息的点击率;另一方面是对没有点击或者不满足点击统计数量的信息 进行召回,而这类信息由于没有产生点击数据,或者点击较少,通常能够反 映时新信息的特征,即反映实时更新的信息,因此可以实现对时新信息的召 回,能够保证召回信息中时新信息的占比,从而保证时新文章的分发量。
针对本申请实施例中的召回策略,将在本申请下面的实施例中进行具体 的说明。
S205、服务器利用第一信息簇和第二信息簇,生成信息推荐列表。
第一信息簇和第二信息簇中的信息表征的是信息推荐系统中产生的召回 信息。然后需要对召回信息根据设定的条件确定优先级,其中,优先级高(即 排序在前的)信息将被优先推荐给终端。
在本申请实施例中设定的条件是根据信息推荐请求中携带的信息确定 的。如,信息推荐请求中携带有目标用户的信息,则会根据目标用户的信息 来确定召回信息的优先级,即确定第一信息簇和第二信息簇中信息的优先级。 信息推荐请求中携带有用户访问应用的信息,也可以根据用户访问的应用的 相关信息来确定召回信息的优先级,如,用户访问的是某个视频客户端,在 获得召回视频时,可以根据是否是该视频客户端的自制视频来确定召回视频 的视频排序,这样,可以将该视频客户端的自制视频排在推荐较靠前的位置, 使得用户能够优先浏览或者访问该视频,便于稳定该视频客户端的用户群体。
需要说明的是,在本申请实施例中可以根据确定的信息优先级条件,分 别在第一信息簇和第二信息簇中筛选出目标信息,然后组成信息推荐列表。 可以根据实际的推荐请求和信息展示布局,选出对应数量的信息,即第从第 一消息队列中筛选出的信息和从第二消息队列中筛选出的信息的数量可以不 等。
S206、服务器将信息推荐列表发送给终端。
S207、终端输出该信息推荐列表。
其中,终端输出该信息推荐列表的方式可以有多种可能,主要根据信息 的特征属性、推荐信息的展示方式、终端信息显示的布局、信息推送的时间 等因素决定。参见图4,其示出了终端展示推荐信息列表的一示例图。如图4 (a),该终端中运行的应用是新闻信息应用时,并且在新闻应用的显示页面 中包括一个“热点新闻”的标签,则当用户选定该“热点新闻”的标签的时 候,会显示与信息推荐列表中对应的新闻资讯,在图4(a)中包括了五个可 以显示的新闻资讯位置栏,因此,对应的信息推荐列表中包括五条新闻资讯, 可以将第一信息队列中确定的目标推荐新闻对应显示在前三个新闻资讯位置 栏中,同时将第二信息队列中确定的目标推荐系新闻对应显示在后两个新闻 资讯位置栏中。
如图4(b),当用户进入新闻客户端时,会在新闻客户端中弹出一个界 面,该界面用于输出推荐信息,通常由于显示版面的局限,该推荐信息会以 信息链接的形式出现,如,将“周边的人都在看的新闻”作为展示信息,当 用户选定该展示信息,会显示对应的信息推荐列表中的详细信息。
通过本申请实施例提供的信息推荐方法,可以对与信息推荐请求对应的 信息池按照信息点击率进行划分,得到第一信息池和第二信息池,然后按照 召回策略分别对第一信息池和第二信息池进行召回处理,再根据召回得到的 信息簇生成信息推荐列表。由于对信息池按照点击率进行划分再召回,从而 获得的信息推荐列表中的信息即包括有点击率的历史信息,也可以包括时新 信息,一方面保证了信息推荐的准确性和完整性,另一方面也可以保证推荐 信息的点击率和分发率。
在本申请实施例中是根据召回策略对信息池中的信息进行召回的,为了 进一步实现信息召回的准确性和便捷性,可以通过召回模型进行信息的召回。
参见图5,其示出了本申请实施例提供的一种召回模型的生成方法的流程 示意图,该方法包括:
S501、获取训练样本集;
S502、对所述训练样本集进行特征提取,获得至少包括信息点击率特征 的第一样本特征;以及不包括信息点击率特征和信息序列号特征的第二样本 特征;
S503、通过包括第一样本特征的训练样本集对神经网络进行训练,得到 第一召回模型;
S504、通过包括第二样本特征的训练样本集对神经网络进行训练,得到 第二召回模型。
训练样本集是带有用户和信息对应关系的样本日志,即每一条样本日志 均包括用户特征和信息特征。其中,用户特征指根据用户的日志记录分析出 的特征或属性,每个类型的用户特征不同。用户特征可以包括用户的基本属 性信息,如,年龄、性别、职业等;用户的画像信息,如,兴趣、用户的类 目等;用户的行为特征信息,如,用户对信息的访问时间、短期或者长期访 问的信息种类等。信息特征指根据信息的日志记录分析出的特征或属性,如, 信息的类别、信息的属性等。训练样本即包括用户特征和信息特征的文本, 例如,信息推荐系统向用户推荐信息的推荐日志记录,也被称为样本日志。 其中,每一条样本日志都带有用户和信息的对应关系,即每一条样本日志中 都是用户特征与信息特征匹配存储的,例如,在新闻资讯系统中,每一条样 本日志都表征用户与对应的新闻资讯之间的关系,具体的如用户甲是否对当 前新闻资讯进行了点击,以及当前新闻资讯的特征列表和用户特征信息等。
在本申请实施例中获得了训练样本后,并不是直接根据训练样本中的所 有特征对神经网络进行训练,需要对训练样本进行进一步的特征提取,以保 证每个模型能够对特征信息进行准确的学习,从而使得生成的召回模型在后 续的信息召回过程中更加准确。
由于第一召回模型用于利用信息的点击率特征和信息语义特征对信息进 行召回,因此需要保证训练第一召回模型的训练样本中的每一条样本数据都 包括点击率特征。而第二召回模型用于仅利用信息的语义特征对信息进行召 回,实现的是对时新信息的召回,因此,为了能够实现对时新信息的召回, 需要训练样本的样本特征近似时新信息的特征,即此时样本特征不包括点击 率特征和信息序列号特征,其中,之所以不包括信息序列号特征是由于通常 被点击过的信息才会有信息序列号,而未被点击的信息通常在没有被利用的 情况下是不具备信息序列号的,这样可以使得后续该第二召回模型进行信息 召回时能够更准确召回得到相应的时新新闻。
在获得了包括各自样本特征的训练样本集后,需要对神经网络进行训练。 其中,神经网络(Neural Networks,NN)是人工智能领域兴起的研究热点。 它从信息处理角度对人脑神经元网络进行抽象,建立某种简单模型,按不同 的链接方式组成不同的网络。其是由大量、简单的处理单元(称为神经元) 广泛地互相连接而形成的复杂网络系统,它反映了人脑功能的许多基本特征, 是一个高度复杂的非线性动力学习系统。
在对神经网络训练时,需要将训练样本集中的数据输入到神经网络训练 模块中,更新网络参数生成新的模型即召回模型。对每一个训练样本,都沿 着神经网络传递得到一个数字,然后将这个数字与想要得到的实际数字做差 再求平方,这样计算出来的就是说预测值与真实值之间的距离,而训练神经 网络就是期望这个距离或损失函数减小。
例如,
Figure BDA0002194412830000121
上式中的y代表想要从神经网络得到的数字,
Figure BDA0002194412830000122
指的一个样本通过神经网 络得到的实际结果,i可以是训练样本的索引。假设以鉴别图片的属性为例, 图片的属性为第一属性和第二属性,有一个样本数据集,由第一属性的图片 和具有第二属性的图片组成,如果图片是第一属性对应的标签是1,如果图片 是第二属性,对应的标签是0。这个标签可以是上式中对应的y,在向神经网 络传递一张图片的时候想通过神经网络得到结果。为了计算损失函数,必须 遍历数据集中的每一张图片,为每一个样本计算y,然后按照上面的定义计算 损失函数。如果损失函数比较大,说明神经网络性能并不是很好,为了想要 损失函数尽可能的小,需要更新神经网络参数,例如,通过调节权值是改变 损失函数,得到一个较好的神经网络参数,生成新的模型。具体的,训练神 经网络模型的过程,除了调整损失函数还可以通过逆误差传播算法来进行训 练,对此,本申请实施例不做限制。
在本申请实施例中通过人工智能技术中的神经网络训练得到召回模型, 可以利用召回模型对信息池中的大量信息进行语义分析,来获得具有相似性 的信息簇来作为召回信息,实现了信息召回的智能化、自动化,提升了信息 召回的效率和准确性。
参见图6,其示出了本申请实施例中提供的召回模型生成过程的示例图。 在本申请实施例中需要生成两个召回模型,即第一召回模型和第二召回模型。 这两个召回模型的训练样本集可以相同,但是神经网络进行学习的特征不同, 这是由于第一召回模型用于对有点击特征的信息进行召回,而第二召回模型 用于对没有点击特征的信息进行召回。即,在生成第一召回模型时,训练样 本的信息特征标签至少包括:信息点击属性标签;在生成第二召回模型时, 训练样本的信息特征标签不包括信息点击属性标签和信息编号标签。如图6所 示,样本日志格式为(信息是否被点击,用户特征列表,信息特征列表)。 若在进行第一召回模型训练时,训练样本集包含的样本日志601采用的是全特 征训练,即包括信息是否被点击这个特征、用户全部的特征和信息的全部特 征,然后通过第一模型训练模块602进行模型训练,得到第一召回模型603。 对应的,在进行第二召回模型训练时,还需要对样本日志601通过特征过滤模 块604进行特征过滤,即对样本日志中的信息特征标签进行处理,只保留信息 侧语义相关特征,如信息标题,标签等特征,需要删除信息编号(ID)、信 息展示点击信息等。这是由于样本日志包括展示过的信息,在实际中,由于 很对信息没有被展示过,其就没有参与训练过程。在本申请实施例中对召回 模型进行训练时,删除信息编号以及点击属性特征,对没有参与训练的信息 相对公平,只靠信息的语义特征也可以把这些相关信息排到前面从而通过召 回模型进行召回。在对特征进行过滤后,通过然后通过第二模型训练模块605 进行模型训练,得到第二召回模型606。
通过生成第一召回模型可以对有点击的信息进行召回,通过第二召回模 型可以对没有点击的时新信息进行召回,这样保证了召回信息的完整性。
在获得了召回信息即第一信息簇和第二信息簇后,还需要获得推荐信息。 召回信息是在信息推荐系统的待推荐的信息中,根据特征而选定的一批待推 荐的信息,然后目标推荐信是对召回信息根据设定的条件确定优先级,再根 据优先级高的信息作为目标推荐信息。
通过召回信息生成信息推荐列表的一种简单的方式可以为根据召回信 息,如第一信息队列中的信息进行聚类分析,在每一类信息中随机选取一条 或多条信息作为推荐信息。或者可以根据聚类后的信息预先设置的权重,选 取其中的一类信息作为推荐信息。
但是为了能够使得推荐信息能够更加匹配当前的信息推荐请求,在本申 请实施例中还提供了一种信息推荐列表生成的方法,参见图7,其示出了本申 请实施例提供的一种信息推荐列表生成的方法的流程示意图,该方法包括:
S701、对信息推荐请求进行解析,得到目标用户;
S702、利用第一召回模型对目标用户进行用户特征组合,得到第一用户 特征向量;
S703、利用第二召回模型对目标用户进行用户特征组合,得到第二用户 特征向量;
S704、利用第一用户特征向量对第一信息簇进行搜索,得到第一待推荐 信息;
S705、利用第二用户特征向量对第二信息簇进行搜索,得到第二待推荐 信息;
S706、将所述第一待推荐信息和所述第二待推荐信息进行组合,得到信 息推荐列表。
为了使得生成的信息推荐列表中的信息能够更加匹配信息推荐请求,需 要对信息推荐请求进行解析,以获得该信息推荐请求中的目标用户,然后生 成目标用户的用户特征向量。使用用户特征向量在第一信息簇和第二信息簇 中进行搜索来获得召回信息,再对召回信息进行排序,得到信息推荐列表。 其中,第一用户特征向量包括用户对信息的点击率特征向量;第二用户特征 向量包括用户兴趣类别特征向量。
其中,目标用户是指需要将推荐信息推荐给的用户。用户特征是指根据 用户的用户表示获取到的特征或属性,如从用户的日志分析出的特征或属性。
在本申请实施例中预先创建的第一召回模型和第二召回模型,在进行神 经网络训练时,不仅对信息特征进行了学习,也对用户的相关特征进行了学 习。因此,可以通过第一召回模型和第二召回模型对用户的特征信息进行处 理,得到目标用户相应的特征向量。具体的,获取信息推荐请求的目标用户。 通过召回模型对目标用户进行特征组合,即能够对目标用户端的特征进行相 似性或者聚类分析,实现得到的第一用户特征向量更加能够反映用户对信息 的点击率特征,这样在根据第一用户特征向量搜索得到的第一待推荐信息, 往往是该目标用户点击率最高的类似新闻,而第二用户特征向量更加能够反 映用户兴趣类别特征向量,即根据用户第二特征向量得到的第二推荐信息更 能反映用户感兴趣的信息。之所以,通过两个召回模型分别获得用户的特征 向量,是因为在不同的召回模型训练时,使用的样本日志的特征不同,从而 可以根据不同的召回模型得到对应属性下更准确的用户特征向量,在后续的 召回信息筛选时,筛选到的推荐信息也更加准确。
具体的,在利用第一用户特征向量对第一信息簇进行搜索,得到第一待 推荐信息包括:利用所述第一用户特征向量对所述第一信息簇进行搜索,得 到属性相匹配的第一目标簇;在所述第一目标簇中按照属性相关度进行排序, 并根据排序结果得到第一待推荐信息。利用所述第一用户特征向量对所述第 一信息簇进行搜索,得到第一待推荐信息,包括:利用所述第二用户特征向 量对所述第二信息簇进行搜索,得到属性相匹配的第二目标簇;在所述第二 目标簇中按照属性相关度进行排序,并根据排序结果得到第二待推荐信息。
举例说明,使用用户特征向量,搜索有点击文章簇中最相近的K个簇, 从这些簇中挑选出最相似的排序靠前的T个文章,生成有点击的文章召回队 列。
在获得召回信息时,也是利用召回模型得到信息向量,从而获得召回信 息即信息簇。具体的,在本申请实施例中,利用所述第一召回模型对所述第 一信息池进行处理,得到第一信息向量,所述第一信息向量表征信息点击率 特征的向量;通过所述第一信息向量对所述第一信息池的信息进行聚簇处理, 得到第一信息簇;利用所述第二召回模型对所述第二信息池进行处理,得到 第二信息向量,所述第二信息向量表征信息语义特征的向量;通过所述第二 信息向量对所述第二信息池的信息进行聚簇处理,得到第二信息簇。实现了对有点击信息和时新信息的召回。
参见图8,其示出了一种文章推荐系统的处理流程示意图。在该实施例中, 信息推荐请求为文章推荐请求,在获得了该文章推荐请求后,需要对文章池 801进行划分,得到点击文章池802和时新文章池803,其中,将历史点击数大 于1的文章划入有点击文章池802中,剩余文章即历史点击数不大于1的文章, 也被称为时新度高的文章放入时新文章池803中。然后需要获得召回文章,即 得到文章簇。从数据库获取对应的点击召回模型804和时新召回模型805,对 有点击文章池802,利用点击召回模型804生成文章向量,然后可以利用kmeans 算法聚类,生成有点击文章簇806。对时新文章池803,利用时新召回模型805 生成文章向量,利用kmeans算法聚类,生成时新文章簇807。
然后,分别利用点击召回模型804和时新召回模型805对文章推荐请求中 的目标用户进行处理,生成用户向量。使用用户向量搜索有点击文章簇中最 相似的K个簇,从这些簇中挑选出最相似的排名靠前的若干个文章,生成有点 击的召回队列。对应的,使用用户向量,搜索时新文章簇中最相近的K个簇, 从这些簇中挑选出最相似的排名靠前的若干个文章,生成时新文章的召回队 列。从而根据有点击的召回队列和时新文章的召回队列得到目标推荐信息。 该实施例中使用两种文章池进行神经网络召回,有点击文章召回队列有效提 升点击率,时新文章召回队列保证文章分发,提升时新文章的占比。
需要说明的是,在本申请实施例中,为了保证召回模型的实时性,即需 要对召回模型中相关参数进行更新,使得召回模型更能适用于当前的信息召 回需求。例如,用户在不同的时期其对信息的需求不同,因此用户在不同时 期感兴趣的信息的类别不同,只有对召回模型进行不断更新,其召回得到的 信息才能更加准确。因此,训练样本集中的样本日志也是实时更新的,例如, 每小时获取用户上个小时的样本日志。在进行信息推荐处理时,对召回模型 进行加载时,也可以每个小时加载新的召回模型,即召回模型也是每个小时实时更新的。
参见图9,其示出了本申请实施例中提供的一种视频推荐场景的示例图。 在图9(a)中展示了目标用户的视频应用界面,在该界面中包括精选视频标 签901,当用户点击该精选视频标签时,会给用户展示目标推荐视频。在该实 施例中目标推荐视频包括根据当前用户的好友点击视频生成的第一目标推荐 视频列表和时新视频对应的推荐列表。
因此,当用户访问该视频应用时会随之产生视频推荐请求,然后对视频 推荐请求进行解析,即可以获得当前用户的登录账号信息,然后依据该登录 账号信息获得用户的好友信息。再通过调用的召回模型,生成好友信息对应 的用户向量。对视频池中视频进行划分,得到有点击的视频池和时新视频池, 然后再利用召回模型分别对两个视频池中的视频信息进行处理,得到推荐视 频。参见图9(b)所示,即当用户点击视频推荐标签901后,会展示出对应的 视频推荐队列,包括“好友都在看”的视频列表902,在该实施例中对应的包 括三条推荐视频,还包括“最新视频”的视频列表903,在该实施例中对应包 括两条推荐视频。因此,通过本申请实施例提供的视频推荐方法,可以同时 得到最新视频和能够保证用户进行点击的点击视频列表,实现了推荐信息的 完整性和准确性。
需要说明的是,为了满足对信息推荐请求的实时处理需求,在本申请的 另一实施例中还需要对第一召回模型和第二召回模型的参数进行更新,实现 对召回模型的定期更新。之所以要对模型进行更新,是因为信息具有实时性, 并且由于信息的更换速度较快,用户对某些信息的点击或者阅读习惯也会发 生改变。为了实现对模型的更新,本申请的实施例中还包括:根据设定周期 对所述训练样本集进行更新,得到更新后的训练样本集;通过更新后的训练 样本集和所述信息推荐列表,对所述第一召回模型和所述第二召回模型的模 型参数进行更新,得到更新后的第一召回模型和第二召回模型,使得更新后 的第一召回模型和第二召回模型实时满足对信息推荐请求的处理。
即当服务器生成信息推荐列表后也可以存储在数据库中,使得在对召回 模型进行更新时,可以利用数据库中的信息推荐列表中的信息进行机器学习, 从而获得待更新的参数,对召回模型进行更新。这样根据实时生成的推荐信 息列表进行模型更新,使得模型会更加准确。
又一方面,本申请还提供了一种基于人工智能的信息推荐装置,如参见 图10,其示出了本申请一种信息推荐装置一个实施例的组成示意图,本实施 例的装置可以应用于终端或者服务器,该装置可以包括:
请求响应单元1001,用于响应信息推荐请求,得到与所述信息推荐请求 对应的信息池;
信息池划分单元1002,用于对所述信息池按照信息点击率进行划分,得 到第一信息池和第二信息池,所述第一信息池中信息的点击率大于阈值;所 述第二信息池中信息的点击率不大于所述阈值;
信息召回单元1003,用于按照召回策略分别对所述第一信息池和所述第 二信息池中的信息进行召回处理,得到与所述第一信息池对应的第一信息簇, 以及与所述第二信息池对应的第二信息簇;
推荐列表生成单元1004,用于利用所述第一信息簇和所述第二信息簇, 生成信息推荐列表。
在一种可能的情况中,该装置还包括模型生成单元,所述模型生成单元 具体用于:
获取训练样本集,所述训练样本集是带有用户和信息对应关系的样本日 志;
对所述训练样本集进行特征提取,获得至少包括信息点击率特征的第一 样本特征;以及不包括信息点击率特征和信息序列号特征的第二样本特征;
通过包括第一样本特征的训练样本集对神经网络进行训练,得到第一召 回模型,所述第一召回模型用于利用信息的点击率特征和信息语义特征对信 息进行召回;
通过包括第二样本特征的训练样本集对神经网络进行训练,得到第二召 回模型,所述第二召回模型用于仅利用信息的语义特征对信息进行召回。
可选地,所述信息召回单元,包括:
第一处理子单元,用于利用所述第一召回模型对所述第一信息池进行处 理,得到第一信息向量,所述第一信息向量表征至少信息点击率特征的向量;
第一聚簇子单元,用于通过所述第一信息向量对所述第一信息池的信息 进行聚簇处理,得到第一信息簇;
第二处理子单元,用于利用所述第二召回模型对所述第二信息池进行处 理,得到第二信息向量,所述第二信息向量为信息语义特征的向量;
第二聚簇子单元,用于通过所述第二信息向量对所述第二信息池的信息 进行聚簇处理,得到第二信息簇。
可选地,所述装置还包括:
请求解析单元,用于对所述信息推荐请求进行解析,得到目标用户;
第一特征组合单元,用于利用所述第一召回模型对所述目标用户进行用 户特征组合,得到第一用户特征向量,所述第一用户特征向量包括用户对信 息的点击率特征向量;
第二特征组合单元,用于利用所述第二召回模型对所述目标用户进行用 户特征组合,得到第二用户特征向量,所述第二用户特征向量包括用户兴趣 类别特征向量。
可选地,所述推荐列表生成单元包括:
第一搜索子单元,用于利用所述第一用户特征向量对所述第一信息簇进 行搜索,得到第一待推荐信息;
第二搜索子单元,用于利用所述第二用户特征向量对所述第二信息簇进 行搜索,得到第二待推荐信息;
列表生成子单元,用于将所述第一待推荐信息和所述第二待推荐信息进 行组合,得到信息推荐列表。
在上述实施例的基础上,所述第一搜索子单元具体用于:
利用所述第一用户特征向量对所述第一信息簇进行搜索,得到属性相匹 配的第一目标簇;
在所述第一目标簇中按照属性相关度进行排序,并根据排序结果得到第 一待推荐信息;
所述第二搜索子单元具体用于:
利用所述第二用户特征向量对所述第二信息簇进行搜索,得到属性相匹 配的第二目标簇;
在所述第二目标簇中按照属性相关度进行排序,并根据排序结果得到第 二待推荐信息。
在又一种可能的实现方式中,所述装置还包括更新单元,所述更新单元 用于:
根据设定周期对所述训练样本集进行更新,得到更新后的训练样本集;
通过更新后的训练样本集和所述信息推荐列表,对所述第一召回模型和 所述第二召回模型的模型参数进行更新,得到更新后的第一召回模型和第二 召回模型,使得更新后的第一召回模型和第二召回模型实时满足对信息推荐 请求的处理。
另一方面,本申请还提供了一种终端,如参见图11,其示出了本申请的 终端的一种组成结构示意图,本实施例的终端1100可以包括:处理器1101和 存储器1102。
可选的,该终端还可以包括通信接口1103、输入单元1104和显示器1105 和通信总线1106。
处理器1101、存储器1102、通信接口1103、输入单元1104、显示器1105、 均通过通信总线1106完成相互间的通信。
在本申请实施例中,该处理器1101,可以为中央处理器(CentralProcessingUnit,CPU),特定应用集成电路,数字信号处理器、现成可编程门阵列或者 其他可编程逻辑器件等。
一些实施例中,处理器1101还可以包括AI(ArtificialIntelligence,人工智 能)处理器,该AI处理器用于处理有关机器学习的计算操作。
该处理器可以调用存储器1102中存储的程序。存储器1102中用于存放一 个或者一个以上程序,程序可以包括程序代码,所述程序代码包括计算机操 作指令,在本申请实施例中,该存储器中至少存储有用于实现以下功能的程 序:
响应信息推荐请求,得到与所述信息推荐请求对应的信息池;
对所述信息池按照信息点击率进行划分,得到第一信息池和第二信息池, 所述第一信息池中信息的点击率大于阈值;所述第二信息池中信息的点击率 不大于所述阈值;
按照召回策略分别对所述第一信息池和所述第二信息池中的信息进行召 回处理,得到与所述第一信息池对应的第一信息簇,以及与所述第二信息池 对应的第二信息簇;
利用所述第一信息簇和所述第二信息簇,生成信息推荐列表。
在一种可能的实现方式中,该存储器1102可包括存储程序区和存储数据 区,其中,存储程序区可存储操作系统、以及至少一个功能(比如神经网络 训练功能等)所需的应用程序等;存储数据区可存储根据计算机的使用过程 中所创建的数据,比如,召回模型及训练样本等等。
此外,存储器1102可以包括高速随机存取存储器,还可以包括非易失性 存储器,例如至少一个磁盘存储器件或其他易失性固态存储器件。
该通信接口1103可以为通信模块的接口,如GSM模块的接口。
本申请还可以包括显示器1104和输入单元1105等等。
当然,图11所示的终端的结构并不构成对本申请实施例中终端的限定, 在实际应用中终端可以包括比图11所示的更多或更少的部件,或者组合某些 部件。
另一方面,本申请实施例还提供了一种存储介质,所述存储介质中存储 有计算机可执行指令,所述计算机可执行指令被处理器加载并执行时,实现 如上任意一个实施例中的信息推荐方法。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个 实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似 的部分互相参见即可。对于装置类实施例而言,由于其与方法实施例基本相 似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语 仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求 或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术 语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包 括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括 没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备 所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素, 并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。
对所公开的实施例的上述说明,使本领域技术人员能够实现或使用本发 明。对这些实施例的多种修改对本领域技术人员来说将是显而易见的,本文 中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实 施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要 符合与本文所公开的原理和新颖特点相一致的最宽的范围。
以上仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技 术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰, 这些改进和润饰也应视为本发明的保护范围。

Claims (9)

1.一种信息推荐方法,其特征在于,包括:
响应信息推荐请求,得到与所述信息推荐请求对应的信息池;所述信息池为根据不同的信息属性标签进行划分的;
对所述信息池按照信息点击率进行划分,得到第一信息池和第二信息池,所述第一信息池中信息的点击率大于阈值;所述第二信息池中信息的点击率不大于所述阈值;
利用第一召回模型对所述第一信息池进行处理,得到第一信息向量,所述第一信息向量表征至少包括信息点击率特征的向量;
通过所述第一信息向量对所述第一信息池的信息进行聚簇处理,得到第一信息簇;
利用第二召回模型对所述第二信息池进行处理,得到第二信息向量,所述第二信息向量为信息语义特征的向量;
通过所述第二信息向量对所述第二信息池的信息进行聚簇处理,得到第二信息簇;
利用所述第一信息簇和所述第二信息簇,生成信息推荐列表。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取训练样本集,所述训练样本集是带有用户和信息对应关系的样本日志;
对所述训练样本集进行特征提取,获得至少包括信息点击率特征的第一样本特征;以及不包括信息点击率特征和信息序列号特征的第二样本特征;
通过包括第一样本特征的训练样本集对神经网络进行训练,得到所述第一召回模型,所述第一召回模型用于利用信息的点击率特征和信息的语义特征对信息进行召回;
通过包括第二样本特征的训练样本集对神经网络进行训练,得到所述第二召回模型,所述第二召回模型用于仅利用信息的语义特征对信息进行召回。
3.根据权利要求2所述的方法,其特征在于,该方法还包括:
对所述信息推荐请求进行解析,得到目标用户;
利用所述第一召回模型对所述目标用户进行用户特征组合,得到第一用户特征向量,所述第一用户特征向量包括用户对信息的点击率特征向量;
利用所述第二召回模型对所述目标用户进行用户特征组合,得到第二用户特征向量,所述第二用户特征向量包括用户兴趣类别特征向量。
4.根据权利要求3所述的方法,其特征在于,所述利用第一信息簇和第二信息簇,生成信息推荐列表,包括:
利用所述第一用户特征向量对所述第一信息簇进行搜索,得到第一待推荐信息;
利用所述第二用户特征向量对所述第二信息簇进行搜索,得到第二待推荐信息;
将所述第一待推荐信息和所述第二待推荐信息进行组合,得到信息推荐列表。
5.根据权利要求4所述的方法,其特征在于,所述利用所述第一用户特征向量对所述第一信息簇进行搜索,得到第一待推荐信息,包括:
利用所述第一用户特征向量对所述第一信息簇进行搜索,得到属性相匹配的第一目标簇;
在所述第一目标簇中按照属性相关度进行排序,并根据排序结果得到第一待推荐信息;
所述利用所述第二用户特征向量对所述第二信息簇进行搜索,得到第二待推荐信息,包括:
利用所述第二用户特征向量对所述第二信息簇进行搜索,得到属性相匹配的第二目标簇;
在所述第二目标簇中按照属性相关度进行排序,并根据排序结果得到第二待推荐信息。
6.根据权利要求2所述的方法,其特征在于,该方法还包括:
根据设定周期对所述训练样本集进行更新,得到更新后的训练样本集;
通过更新后的训练样本集和所述信息推荐列表,对所述第一召回模型和所述第二召回模型的模型参数进行更新,得到更新后的第一召回模型和第二召回模型,使得更新后的第一召回模型和第二召回模型实时满足对信息推荐请求的处理。
7.一种信息推荐装置,其特征在于,包括:
请求响应单元,用于响应信息推荐请求,得到与所述信息推荐请求对应的信息池;所述信息池为根据不同的信息属性标签进行划分的;
信息池划分单元,用于对所述信息池按照信息点击率进行划分,得到第一信息池和第二信息池,所述第一信息池中信息的点击率大于阈值;所述第二信息池中信息的点击率不大于所述阈值;
信息召回单元,包括:第一处理子单元、第一聚簇子单元、第二处理子单元以及第二聚簇子单元;
所述第一处理子单元,用于利用第一召回模型对所述第一信息池进行处理,得到第一信息向量,所述第一信息向量表征至少包括信息点击率特征的向量;
所述第一聚簇子单元,用于通过所述第一信息向量对所述第一信息池的信息进行聚簇处理,得到第一信息簇;
所述第二处理子单元,用于利用第二召回模型对所述第二信息池进行处理,得到第二信息向量,所述第二信息向量为信息语义特征的向量;
所述第二聚簇子单元,用于通过所述第二信息向量对所述第二信息池的信息进行聚簇处理,得到第二信息簇;
推荐列表生成单元,用于利用所述第一信息簇和所述第二信息簇,生成信息推荐列表。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
样本获取单元,用于获取训练样本集,所述训练样本集是带有用户和信息对应关系的样本日志;
特征提取单元,用于对所述训练样本集进行特征提取,获得至少包括信息点击率特征的第一样本特征;以及不包括信息点击率特征和信息序列号特征的第二样本特征;
第一训练单元,用于通过包括第一样本特征的训练样本集对神经网络进行训练,得到所述第一召回模型,所述第一召回模型用于利用信息的点击率特征和信息的语义特征对信息进行召回;
第二训练单元,用于通过包括第二样本特征的训练样本集对神经网络进行训练,得到所述第二召回模型,所述第二召回模型用于仅利用信息的语义特征对信息进行召回。
9.一种终端,其特征在于,包括:
处理器和存储器;
其中,所述处理器用于执行所述处理器中存储的程序;
所述存储器用于存储程序,所述程序至少用于:
响应信息推荐请求,得到与所述信息推荐请求对应的信息池;所述信息池为根据不同的信息属性标签进行划分的;
对所述信息池按照信息点击率进行划分,得到第一信息池和第二信息池,所述第一信息池中信息的点击率大于阈值;所述第二信息池中信息的点击率不大于所述阈值;
利用第一召回模型对所述第一信息池进行处理,得到第一信息向量,所述第一信息向量表征至少包括信息点击率特征的向量;
通过所述第一信息向量对所述第一信息池的信息进行聚簇处理,得到第一信息簇;
利用第二召回模型对所述第二信息池进行处理,得到第二信息向量,所述第二信息向量为信息语义特征的向量;
通过所述第二信息向量对所述第二信息池的信息进行聚簇处理,得到第二信息簇;
利用所述第一信息簇和所述第二信息簇,生成信息推荐列表。
CN201910843373.8A 2019-09-06 2019-09-06 信息推荐方法、装置及终端 Active CN110543598B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910843373.8A CN110543598B (zh) 2019-09-06 2019-09-06 信息推荐方法、装置及终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910843373.8A CN110543598B (zh) 2019-09-06 2019-09-06 信息推荐方法、装置及终端

Publications (2)

Publication Number Publication Date
CN110543598A CN110543598A (zh) 2019-12-06
CN110543598B true CN110543598B (zh) 2022-03-25

Family

ID=68713046

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910843373.8A Active CN110543598B (zh) 2019-09-06 2019-09-06 信息推荐方法、装置及终端

Country Status (1)

Country Link
CN (1) CN110543598B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111209477B (zh) * 2019-12-31 2023-06-09 广州市百果园信息技术有限公司 一种信息推荐的方法及装置、电子设备、存储介质
CN111177563B (zh) * 2019-12-31 2023-06-27 北京顺丰同城科技有限公司 一种信息推荐方法、装置、电子设备和存储介质
CN111369006B (zh) * 2020-02-28 2023-07-04 上海蓝书信息科技有限公司 召回模型的生成方法及装置
CN111444438B (zh) * 2020-03-24 2023-09-01 北京百度网讯科技有限公司 召回策略的准召率的确定方法、装置、设备及存储介质
CN111581545B (zh) * 2020-05-12 2023-09-19 腾讯科技(深圳)有限公司 一种召回文档的排序方法及相关设备
CN113763082A (zh) * 2020-09-04 2021-12-07 北京沃东天骏信息技术有限公司 一种信息推送方法和装置
CN113158026B (zh) * 2021-03-08 2024-03-15 咪咕文化科技有限公司 物品分发方法、电子设备和存储介质
CN113010790A (zh) * 2021-03-30 2021-06-22 广州酷狗计算机科技有限公司 内容推荐方法、装置、服务器及存储介质
CN113282831A (zh) * 2021-06-10 2021-08-20 北京爱奇艺科技有限公司 一种搜索信息的推荐方法、装置、电子设备及存储介质
CN113343091A (zh) * 2021-06-22 2021-09-03 力合科创集团有限公司 面向产业和企业的科技服务推荐计算方法、介质及程序
CN113744066B (zh) * 2021-09-01 2024-04-02 杭州隆埠科技有限公司 信息推送方法及装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103399884A (zh) * 2013-07-14 2013-11-20 王国栋 一种随机新闻系统及其自动刷新方法
CN106919693B (zh) * 2017-03-07 2020-12-01 阿里巴巴(中国)有限公司 一种提高热词曝光覆盖率的方法和装置
CN107729488A (zh) * 2017-10-17 2018-02-23 北京搜狐新媒体信息技术有限公司 一种信息推荐方法及装置
CN108259939B (zh) * 2017-12-25 2020-08-07 广州华多网络科技有限公司 新视频推送控制方法、装置及服务器
CN108230026A (zh) * 2017-12-29 2018-06-29 暴风集团股份有限公司 广告推荐方法和装置、电子设备、存储介质、程序
CN108629656B (zh) * 2018-04-18 2020-08-11 张丽 一种基于移动终端定位的商店智能推送系统和方法
CN108960901A (zh) * 2018-06-13 2018-12-07 网易(杭州)网络有限公司 数据处理方法、装置、介质及电子设备
CN109241451B (zh) * 2018-11-08 2021-07-16 北京一点网聚科技有限公司 一种内容组合推荐方法、装置及可读存储介质
CN109413216A (zh) * 2018-12-29 2019-03-01 微梦创科网络科技(中国)有限公司 一种信息推送方法、装置及移动终端
CN109862431B (zh) * 2019-01-23 2023-09-29 重庆第二师范学院 一种基于mcl-hcf算法的电视节目混合推荐方法

Also Published As

Publication number Publication date
CN110543598A (zh) 2019-12-06

Similar Documents

Publication Publication Date Title
CN110543598B (zh) 信息推荐方法、装置及终端
CN111444428B (zh) 基于人工智能的信息推荐方法、装置、电子设备及存储介质
CN110941740B (zh) 视频推荐方法及计算机可读存储介质
CN105224699B (zh) 一种新闻推荐方法及装置
CN110321422B (zh) 在线训练模型的方法、推送方法、装置以及设备
TWI636416B (zh) 內容個人化之多相排序方法和系統
US10152479B1 (en) Selecting representative media items based on match information
CN110163647B (zh) 一种数据处理方法及装置
CN110413870B (zh) 商品推荐方法、装置及服务器
CN110012060B (zh) 移动终端的信息推送方法、装置、存储介质和服务器
US20140280554A1 (en) Method and system for dynamic discovery and adaptive crawling of content from the internet
CN110413894B (zh) 内容推荐模型的训练方法、内容推荐的方法及相关装置
CN110175895B (zh) 一种物品推荐方法及装置
CN110163703B (zh) 一种分类模型建立方法、文案推送方法和服务器
CN109165975B (zh) 标签推荐方法、装置、计算机设备及存储介质
CN110413867B (zh) 用于内容推荐的方法及系统
CN108959323B (zh) 视频分类方法和装置
CN112052387A (zh) 一种内容推荐方法、装置和计算机可读存储介质
CN111061954B (zh) 搜索结果排序方法、装置及存储介质
CN112749330B (zh) 信息推送方法、装置、计算机设备和存储介质
CN111597446B (zh) 基于人工智能的内容推送方法、装置、服务器和存储介质
CN109819002B (zh) 数据推送方法和装置、存储介质及电子装置
Babu et al. An implementation of the user-based collaborative filtering algorithm
CN114329207A (zh) 多业务信息排序系统、方法、存储介质及电子设备
CN110083766B (zh) 一种基于元路径引导嵌入的查询推荐方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant