CN116150469A - 一种内容推荐方法、装置及相关产品 - Google Patents
一种内容推荐方法、装置及相关产品 Download PDFInfo
- Publication number
- CN116150469A CN116150469A CN202111399259.4A CN202111399259A CN116150469A CN 116150469 A CN116150469 A CN 116150469A CN 202111399259 A CN202111399259 A CN 202111399259A CN 116150469 A CN116150469 A CN 116150469A
- Authority
- CN
- China
- Prior art keywords
- content
- type
- type object
- feature
- features
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9538—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Abstract
本申请实施例公开了一种内容推荐方法、装置及相关产品。方法中先确定消费过第一类型对象推荐的内容的第二类型对象。根据第二类型对象的历史内容消费行为获取第二类型对象的特征。根据多位第二类型对象的特征构建第一类型对象的特征。根据第一类型对象的特征向第一类型对象推荐内容,以供第一类型对象进行内容推荐。由于向第一类型对象推荐的内容是以第一类型对象的特征作为依据,且第一类型对象的特征是通过消费过其推荐内容的第二类型对象的特征获取的,因此是以第二类型对象的特征为导向推荐内容给第一类型对象,以便第一类型对象向第二类型对象推荐更加满足第二类型对象实际需求的内容。本方案有助于实现第一类型对象对受众的内容精准推荐。
Description
技术领域
本申请涉及互联网信息技术领域,尤其涉及一种内容推荐方法、装置及相关产品。
背景技术
在互联网的许多应用场景中涉及到内容推荐。推荐的内容不限于店铺、商品、音乐、电子书等。其中,一些内容推荐发生在同类型的对象之间,例如消费者与消费者之间。另外,还有一些内容推荐发生在不同类型的对象之间,例如具有影响力的人和普通消费者之间。在直播平台等具体的推荐场景中,具有影响力的人可以称为“带货主播”或者“达人”,这一类人群可以先筛选出部分需要进行推荐的内容,再向普通消费者进行内容推荐。筛选需要进行推荐的内容的过程也被称为“选品”。
目前,达人的选品过程通常以个人主观偏好为依据。例如,达人根据自身以往的消费经历,在同类型的内容中喜好内容A而不喜欢内容B,则在选品时更容易将内容A选入要推荐给消费者的内容列表中。
由达人主观选品,忽视了受众的需求和/或喜好,因此依照现有方式选品导致达人推荐内容的精准性不足。提升达人进行内容推荐的精准性,已经成为当前领域亟待解决的技术问题。
发明内容
本申请实施例提供了一种内容推荐方法、装置及相关产品,以使具有高影响力的内容推荐者推荐内容更加精准。
有鉴于此,本申请第一方面提供了一种内容推荐方法,方法包括:
确定消费过第一类型对象推荐的内容的第二类型对象;
根据第二类型对象的历史内容消费行为获取第二类型对象的特征;
根据多位第二类型对象的特征构建第一类型对象的特征;
根据第一类型对象的特征向第一类型对象推荐内容,以供第一类型对象进行内容推荐。
本申请第二方面提供一种内容推荐装置,装置包括:
对象确定单元,用于确定消费过第一类型对象推荐的内容的第二类型对象;
特征获取单元,用于根据第二类型对象的历史内容消费行为获取第二类型对象的特征;
特征构建单元,用于根据多位第二类型对象的特征构建第一类型对象的特征;
内容推荐单元,用于根据第一类型对象的特征向第一类型对象推荐内容,以供第一类型对象进行内容推荐。
本申请第三方面提供一种计算机设备,所述设备包括处理器以及存储器:
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令,执行如上述第一方面所述的内容推荐方法的步骤。
本申请第四方面提供一种计算机可读存储介质,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行上述第一方面所述的内容推荐方法。
从以上技术方案可以看出,本申请实施例具有以下优点:
本申请实施例中,提供了一种内容推荐方法。该方法中,首先确定消费过第一类型对象推荐的内容的第二类型对象。其后,根据第二类型对象的历史内容消费行为获取第二类型对象的特征。接着,根据多位第二类型对象的特征构建第一类型对象的特征。最终,根据第一类型对象的特征向第一类型对象推荐内容,以供第一类型对象进行内容推荐。由于向第一类型对象推荐的内容是以第一类型对象的特征作为依据,且第一类型对象的特征是通过消费过其推荐内容的第二类型对象的特征获取的,因此在本申请是以第二类型对象的特征为导向推荐内容给第一类型对象,以便第一类型对象能够向第二类型对象推荐能够更加满足第二类型对象实际需求和/或喜好的内容。由此可见,本方案有助于实现第一类型对象对受众的内容精准推荐。
附图说明
图1为本申请实施例提供的一种内容推荐方法流程图;
图2为构建样本的示意图;
图3为在第一类型对象使用的终端设备的屏幕界面展示推荐的内容的预期推荐效果度量值的示意图;
图4为向达人推荐内容以供达人选品并推荐给用户的内容推荐方法流程示意图;
图5为本申请实施例提供的一种内容推荐装置的结构示意图;
图6为本申请实施例提供的一种用于内容推荐的服务器的结构示意图;
图7为本申请实施例提供的一种用于内容推荐的终端的结构示意图。
具体实施方式
以往技术中,达人通过主观偏好选品后向消费者推荐内容。但是这种推荐方式忽略了达人所面向的受众的需求和/或喜好,导致推荐的内容不够精准,难以匹配受众的真实需求。
为解决以上问题,发明人经过研究提供了一种内容推荐方法、装置及相关产品。通过分析作为内容推荐受众的第二类型对象的特征,构建出作为内容推荐者的第一类型对象的特征。再根据第一类型对象的特征为第一类型对象推荐内容,以供其推荐内容给第二类型对象。如此,实现对第二类型对象的精准内容推荐。
以上提及的内容推荐方法可以应用于处理设备上,例如内容推荐功能的终端设备或服务器。该方法由终端设备或服务器独立执行,也可以应用于终端设备和服务器通信的网络场景,通过终端设备和服务器配合运行。其中,终端设备可以为手机、台式计算机、个人数字助理(Personal Digital Assistant,简称PDA)、平板电脑、智能家电、智能语音交互设备等设备。服务器可以理解为是应用服务器,也可以为Web服务器,在实际部署时,该服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。为便于说明,以下实施例中以终端设备作为示例性的执行主体进行方案的详细阐述。
为了便于理解,请参阅图1,图1为本申请实施例提供的一种内容推荐方法的流程图。如图1所示的内容推荐方法包括:
S101:终端设备确定消费过第一类型对象推荐的内容的第二类型对象。
介绍图1所示技术方案时提及的终端设备可以使第一类型对象选品或者向第二类型对象推荐内容所使用的终端设备,也可以是其他终端设备。例如与第一类型对象选品使用的终端设备通信连接的终端设备,或者是与第一类型对象推荐内容时使用的终端设备通信连接的终端设备。
第一类型对象是指在内容推荐场景中具有高于平均影响力水平的用户,例如购物平台上拥有1万以上粉丝数量的直播主播,或者在社交网站上具有1千以上粉丝数量的博主或者视频上传者等。因为不同的内容推荐场景中对于具有高影响力人群的称呼往往存在差异,因此在本申请实施例中,统称为第一类型对象。
第二类型对象则是指影响力水平普通的内容消费者。例如,购物平台上观看主播直播的观众,或者关注博主并常常点击博主分享的商品链接的粉丝人群。
为了区分影响力水平以及内容推荐者和内容消费者的差别,将这两类影响力不同且时常分处于内容推荐者和内容消费者两个位置上的对象称为第一类型对象和第二类型对象。可以理解的是,第一类型对象就是指前文提及的达人,第二类型对象就是指前文提及的普通消费者。在可能的实现方式中,第一类型对象和第二类型对象处于通过售卖情况结算的广告场景中,即按单提成(cost per sales,cps)。选品则是指第一类型对象选择做cps推荐的内容的过程。本申请实施例的实施目的就是在第一类型对象选品过程中或者选品前,向第一类型对象推荐内容,以影响其选品,辅助其实现更加精准的内容推荐。
为实现以上目的,在本申请实施例中,终端设备首先需要从大量的第二类型对象中确定出其用户组,即未来较容易消费其推荐的内容的第二类型对象的集合。在可选的实现方式中,可以在本步骤中将消费过第一类型对象推荐的内容的对象作为后续S102-S103步骤涉及的第二类型对象。
下面介绍确定消费过第一类型对象推荐的内容的第二类型对象的可选实现方式。从内容推荐数据中获取第一类型对象作为内容推荐者的推荐者追溯码;从内容消费数据中确定出与推荐者追溯码对应的第二类型对象标识;根据第二类型对象标识确定消费过所述第一类型对象推荐的内容的第二类型对象。
表1为内容推荐数据的列表。表1代表第一类型对象的选品结果。如表1所示,内容推荐数据中包括第一类型对象标识、内容标识和推荐者追溯码。不同的第一类型对象标识K0、K1即代表不同的第一类型对象,不同的内容标识P0、P1、P2代表不同的内容,不同的推荐者追溯码KIADsxaf01、KIADsxaf02、KIADsxaf03代表内容由不同的推荐者推荐。实际应用中,推荐者追溯码可以由第一类型对象分享内容链接而生成,同一第一类型对象分享(推荐)不同的内容,则产生不同的推荐者追溯码。
表1内容推荐数据列表
第一类型对象标识 | 内容标识 | 推荐者追溯码 |
K0 | P0 | KIADsxaf01 |
K0 | P1 | KIADsxaf02 |
K1 | P2 | KIADsxaf03 |
表2为内容消费数据的列表,表2代表平台上各用户的消费结果。如表2所示,内容消费数据中包括第二类型对象标识、内容标识、消费资源值、推荐者追踪码等。不同的第二类型对象标识C0、C1代表不同的第二类型对象,不同的消费资源值表示第二类型对象消耗了不同的资源值消费不同的内容。消费资源值在不同的场景中可以具有不同的表现形式。例如,资源值可以是人民币价格,美元价格等,也可以是消费内容的平台上支持的资源值,例如“钻石”、“玫瑰”等表征的资源值。本申请实施例中推荐者追溯码通常是数字编码或者字符串,用来关联内容推荐数据和内容消费数据,从而追溯到内容消费数据是由哪位第一类型对象推荐内容促成,作为结算归因。
表2内容消费数据列表
第二类型对象标识 | 内容标识 | 消费资源值 | 推荐者追溯码 | 其他… |
C0 | P0 | 19 | KIADsxaf01 | … |
C1 | P0 | 19 | KIADsxaf01 | … |
C0 | P1 | 25 | KIADsxaf02 | … |
以表1和表2为例,当需要确定标识为K0的第一类型对象的第二类型对象时,只需要从表1中确定其涉及到的选品的推荐者追溯码KIADsxaf01和KIADsxaf02,根据KIADsxaf01从表2中确定出相同的追溯码对应的第二类型对象标识C0和C1,以及根据KIADsxaf02从表2中确定出相同的追溯码对应的第二类型对象标识C1。由此可知,标识为C0和C1的第二类型对象为第一类型对象K0的受众。以此类推,可以构建出第二类型对象集合,每个第一类型对象对应一个第二类型对象集合。后文中仅以一个特定的第一类型对象为示例做出说明。
S102:终端设备根据第二类型对象的历史内容消费行为获取第二类型对象的特征。
终端设备在S101确定了消费过第一类型对象推荐的内容的第二类型对象之后,接下来通过S102需要获取第二类型对象的特征。具体实现时,可以获取第一类型对象的全部第二类型对象的特征,也可以仅获取一部分其第二类型对象的特征。例如共有该第一类型对象的1000个第二类型对象,本步骤中针对其中的700个第二类型对象,分别获取其特征。为便于描述,以下仅以获取一个第二类型对象的特征为示例进行介绍。
在实际应用中,终端设备可以根据第二类型对象的历史内容消费行为获取第二类型对象的特征。具体地,过去消费内容会记录在内容消费数据中,内容消费数据中带有第二类型对象标识和其消费的内容的标识。基于第二类型对象标识,可以在用户画像中查询到用户的多项对象属性。画像不会是用户显性提供给终端设备。需要终端设备根据用户日常行为进行数据挖掘,通过模型匹配已知用户、问卷等方案获取。画像数据通常有如下对象静态属性:年龄、性别、月收入、职业、工作地点、居住地点、消费习惯、婚育状态等,也会有些对象动态属性:有效消费内容、无效消费内容、收藏内容(或称兴趣内容)、近期消费资源值、是否对资源值敏感、消费资源值均值、完成消费的时间长度。可以理解的是,在本申请的具体实施方式中,涉及到的画像数据运用到具体产品或技术中时,需要获得用户许可或者同意,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。类似地,基于第二类型对象消费的内容的标识,可以从内容库中查询到内容的多项内容属性,内容的静态属性,如类目、消费资源值、首图,也包含内容动态属性,如消费数量、浏览量、收藏量、购物车量等。表3为内容的多项内容属性列表。
表3内容的多项内容属性列表
内容标识 | 类目 | 消费资源值 | 消费数量 | … |
P0 | 家居 | 19 | 251 | … |
在本申请中,为了获取第二类型对象的特征,特别引入了特征提取模型。该特征提取模型可以用于基于输入的第二类型对象的对象属性及该第二类型对象施加历史内容消费行为的内容的内容属性,获得第二类型对象在多项对象属性的特征。上述对象属性和内容属性可参照表4。
表4对象属性和内容属性综合列表
在表4中,前6列为第二类型对象的6项对象属性,后4列为其历史消费行为所作用的内容的4项内容属性。表4所示的内容刻画了一次历史消费行为:一位年轻的高收入工程师,未婚高收入,消费能力较强,对消费资源值不敏感,在内容消耗资源值高于过去半年80%的情况下,以2299资源值购买了一件销量很高的数码产品。
表4中仅仅以一部分对象属性和内容属性为示例。实际应用中,与第二类型对象的历史消费行为相关的对象属性和内容属性可能数量上非常丰富且复杂。通过特征提取模型基于内容属性和对象属性获得了各项对象属性的特征。例如,通过表4获得了第二类型对象在年龄、性别、职业、婚育、月收入和消费习惯的特征。接着,基于这些对象属性的特征,可以运算获得第二类型对象的特征。作为示例,第二类型对象在多项对象属性的特征通过特征向量的形式表示,则可以通过对这些特征向量累加的方式获得一个新的向量,以此作为第二类型对象的特征向量。
在以上实现方式中,第二类型对象的特征的获取不但依赖于第二类型对象自身的对象属性,还依赖于建立了历史消费行为的关系的内容属性。如此,使捕捉到的第二类型对象的特征包含了第二类型对象对于内容消费的倾向。在后文中将对特征提取模型的训练环节进行介绍,此处先不加赘述。
S103:终端设备根据多位第二类型对象的特征构建第一类型对象的特征。
由于S101确定的第二类型对象具体是消费过第一类型对象推荐的内容的对象,因此这些第二类型对象也能够反映出该第一类型对象的特点。为了实现更加精准的内容推荐,本申请实施例中通过本步骤,以S102获得的第二类型对象的特征为基础,构建第一类型对象的特征。
在构建第一类型对象的特征时,可以基于具体的内容推荐场景、优化目标等因素,对构建第一类型对象的方式进行选取。优化目标具体是指推荐内容时关注的指标,例如消费资源值、消费内容数量或者完成消费的时间长度等。完成消费的时间长度越短,代表消费内容的意愿越强烈。
例如,在第一种可能的实现方式中,不具备明确的、特定的推荐场景和优化目标,则可以计算第一类型对象的多位第二类型对象的特征向量的平均值,将平均值作为第一类型对象的特征向量。
在第二种可能的实现方式中,优化目标是通过执行本实施例技术方案,向第一类型对象推荐内容后,使其通过后续的选品、内容推荐,实现更高的资源消费值。即,优化目标是提升内容推荐后的消费资源值。因此,可以获取多位第二类型对象的消费资源值,基于消费资源值对多位第二类型对象的特征向量进行加权平均运算,获得第一类型对象的特征向量。
在第三种可能的实现方式中,优化目标是通过执行本实施例技术方案,向第一类型对象推荐内容后,使其通过后续的选品、内容推荐,实现更高的消费内容数量。即,优化目标是提升内容推荐后的消费内容数量。因此,可以获取多位第二类型对象的消费内容数量,基于消费内容数量对多位第二类型对象的特征向量进行加权平均运算,获得第一类型对象的特征向量。
在第四种可能的实现方式中,优化目标是通过执行本实施例技术方案,向第一类型对象推荐内容后,使其通过后续的选品、内容推荐,实现更短的完成消费时长。即,优化目标是缩短从点击内容到消费内容的消费时长,提高成单率。因此,可以获取多位第二类型对象完成消费的时间长度,基于时间长度作倒数对多位第二类型对象的特征向量进行加权平均运算,获得第一类型对象的特征向量。即在加权平均运算时,给与完成消费时间长度越短的第二类型对象越高的权重。
需要说明的是,为了获取第一类型对象特征,可以通过任何池化pooling操作将第二类型对象特征聚合到第一类型对象。
S104:终端设备根据第一类型对象的特征向第一类型对象推荐内容,以供第一类型对象进行内容推荐。
在本申请实施例中,第一类型对象的特征时基于消费过其推荐内容的第二类型对象的特征构建而来,因此第一类型对象的特征表征了受众(第二类型对象)的特性。为了提升推荐内容的精准性,本步骤中终端设备根据第一类型对象的特征向第一类型对象推荐内容。
在可选实现方式中,不单单可以基于第一类型对象的特征做内容推荐,还可以结合众多内容的特征做内容推荐。为此,需要提供一种内容特征的获取方式。本申请实施例中,内容特征的获取与第二类型对象的对象特征的获取方式相似。
具体地,基于历史内容消费行为对应的内容属性和对象属性,通过特征提取模型获得第二类型对象消费的内容在多项内容属性的特征。也就是说,特征提取模型不但可以学习获得对象在多项对象属性的特征,还可以学习获得内容在多项内容属性的特征。接着根据第二类型对象消费的内容在多项内容属性的特征,运算获得第二类型对象消费的内容的特征。当内容在多项内容属性的特征通过向量来表示时,获取内容的特征方式为:将第二类型对象消费的内容在多项内容属性的特征向量累加,获得累加后形成的向量作为给内容的特征向量,用以表征该内容的特征。
根据第一类型对象的特征向第一类型对象推荐内容,具体包括:根据第一类型对象的特征和内容集合中内容的特征,从内容集合中确定出备选内容;向第一类型对象推荐备选内容。即,后续再由第一类型对象结合备选内容进行选品和推荐。此处内容集合可以是内容库,也可以是内容库中的一部分,或者内容的初筛结果,还可以是第一类型对象推荐过的内容的集合等。故此处对于内容库的范畴不做限定。总之,内容集合中内容的特征均已被获取到。
下面介绍根据第一类型对象的特征和内容集合中内容的特征,从内容集合中确定出备选内容的两种示例实现方式。本质上都是将第一类型对象的特征和内容集合中内容的特征运用到了推荐逻辑。
在一种示例实现方式中,通过训练模型做排序筛选确定备选内容。具体地,通过第一类型对象的特征和第一类型对象在内容集合中推荐过的内容的特征构建第一样本;将第一类型对象对推荐过的内容的推荐效果度量值作为第一样本的标签;根据第一样本和第一样本的标签训练获得排序模型;通过排序模型从内容集合中确定出排序满足预设筛选条件的备选内容。其中推荐效果度量值可以是内容消费资源值或者内容消费数量。此处训练的排序模型具体可以是深度神经网络模型,作为对推荐效果度量值的预测使用。作为示例预设筛选条件可以是推荐效果度量值超过预设数值,或者推荐效果度量值由大到小排名前100名等。
在另一种示例实现方式中,通过特征向量相似度做向量索引,将第一类型对象的特征向量和内容的特征向量导入向量索引服务中。具体方式有两种:1、通过第一类型对象的特征索引内容特征;2、通过第一类型对象的特征索引近似的第一类型对象,以近似的第一类型对象推荐过的消费资源值较高和/或消费内容数量高的内容来推荐。对于前一种:基于第一类型对象的特征和内容集合中内容的特征进行相似索引,通过相似索引获得内容集合中特征与第一类型对象的特征相似度达到预设条件的内容作为第一目标内容,将第一目标内容作为备选内容。对于后一种:基于第一类型对象的特征检索与第一类型对象的特征相似的其他第一类型对象;基于其他第一类型对象的特征和内容集合中内容的特征,确定与其他第一类型对象的特征相似度达到预设条件的内容作为第二目标内容;将第二目标内容作为第一类型对象的备选内容。其中预设条件可以是关于向量相似度的约束条件或者限值。
在本申请实施例中,采用人工智能的技术实现模型的训练和运用。人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习、自动驾驶、智慧交通等几大方向。
其中,自然语言处理(Nature Language processing,NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
本申请实施例中,所训练的模型采用机器学习的方法训练而成,且在样本的构建和模型内部对于文本的一部分处理方式采用了自然语言处理技术。
在前文介绍了通过特征提取模型实现对内容的多项内容属性和对象的多项内容属性的特征提取。为了便于理解其具体的实现方式,以下先介绍该特征提取模型的训练过程。为了训练模型,首先需要构造样本,包括正样本和负样本。其中,根据发生有效内容消费行为的第一对象内容对构建正样本,并根据未发生有效内容消费行为的第二对象内容对构建负样本。其中有效内容消费行为是指第二类型对象执行了内容消费行为(例如购买、订阅),并且没有退购或者退订的操作。这样使内容被消费后没有退还的消费行为称为有效内容消费行为。反之,如果被退还,则称为未发生有效消费行为。作为示例,正样本可以通过成交的订单获取,负样本可以从退款订单关联对象内容、未付款订单关联对象内容、展示给对象但是未点击商品的组合、对象浏览但未成交内容组合、随机对象内容组合的方式来构建。图2为构建样本的示意图。正如以上示例,负样本可以通过规则来生成。为便于区分,将具有有效内容消费行为的内容和对象组建成第一对象内容对,用以区分第二对象内容对:未发生有效内容消费行为的内容和对象。正样本包括第一对象内容对中对象的属性和第一对象内容对中内容的属性;负样本包括第二对象内容对中对象的属性和第二对象内容对中内容的属性。
正样本和负样本的标签具有多种可能方式。例如正样本标签为1,负样本标签为0;或者正样本的标签为对象消费内容支付的资源值。对于负样本,则可以是将内容的晓菲资源值的负数作为标签。作为通过正样本、正样本的标签、负样本和负样本的标签,对初始模型进行训练,获得特征提取模型。
样本决定模型的上限,需要为模型准备足够贴近事实的样本。通过业务专家制定规则和特征工程,筛选有效特征,排除影响力小的特征,这是纵向的(对每条样本都生效的)优化方案。此外,可选地,还需要横向地优化样本数据,完全剔除对模型没有帮助、误导模型的数据。在通过正样本、正样本的标签、负样本和负样本的标签,对初始模型进行训练之前,方法还包括:基于以下任意一种或多种因素对正样本和负样本进行过滤,获得过滤后的正样本和过滤后的负样本:过期数据、刷单数据、时效性内容或者资源值异常的内容。
1.过期数据。数据有效期是人为定义的一个追溯周期,我们认为周期内的数据,是有效的;周期外的数据,由于达人运营思路、运作平台不同,在当前不具备足够的参考价值。
2.刷单数据。刷单是电商平台入驻商家为了提高店铺和内容权重常见的行为,刷单是针对店铺和内容的密集购买,是为了成交而成交,对普通消费者没有参考价值。刷单行为的判断,依赖风控系统。
3.时效性内容。时效性内容不具备普遍推荐意义,如中秋节前的月饼、端午节前的粽子,不能用这类成交记录判定用户喜欢购买食品品类。
4.低价内容(作为一种资源值异常的内容)。过于低价的内容可以认为是商家刷单的策略,只不过买家由商家自己变为了普通消费者;但由于内容价格过低,通常消费者不会有过多判断,所以也无法完整体现用户倾向。例如1元包邮的数据线,不应该给用户带来数码品类倾向的标签。
在本申请实施例中,基于历史内容消费行为对应的内容属性和对象属性,通过特征提取模型获得第二类型对象在多项对象属性的特征,包括:
基于历史消费行为对应的多项内容属性和多项对象属性进行独热(one-hot)编码,获得历史消费行为对应的多维度向量;将多维度向量作为特征提取模型的输入,通过特征提取模型获得第二类型对象的特征矩阵;根据多项对象属性在独热编码时对应的位置,从特征矩阵中获取命中位置的向量作为多项对象属性的特征向量。
例如用户年龄字段,在推荐系统中,并不具备严格的数值意义(例如40岁的用户不会确定在某方面是20岁用户的2倍),只是一种描述。如果将年龄划分为(0,20)、(20-30)、(30-40)、(40-50)、(50+)这几个区间,那年龄这一个特征维度,会变为一个5维特征(age_0,age_20,age_30,age_40,age_50),每个用户只会在一个维度上是1(年龄落在该区间),其他维度都是0。经过one-hot编码的样本集,是一个高维的系数矩阵,只含有大量0和少量1。训练模型的时候,将正样本和负样本均多个投入到模型中。
训练模型的主要目的,是得到内容的特征向量和对象的特征向量。向量可以有效描述该空间内的实体近似度(内容-内容,对象-对象)和倾向度(对象-内容)。向量距离度量的方案通常有:欧氏距离、夹角余弦、曼哈顿距离、切比雪夫距离、闵可夫斯基距离、标准化欧氏距离、马氏距离、汉明距离、杰卡德距离&杰卡德相似系数、相关系数&相关距离、信息熵。在该案中,可以采用欧式距离、夹角余弦。通过对达人(即第一类型对象)用户组(即第二类型对象的集合)内所有用户的向量做计算,得到用户组向量,是最有效、最准确、最简单的用户特征到达人特征的聚合传递方式。
可以做向量化的模型有:矩阵分解法(SVD)、因子分解机(FactorizationMachine,FM)模型、DNN-Embedding、word2vec类模型。本案采用FM模型,在计算复杂度、组合特征学习能力方面都非常突出。FM模型直接引入任意个特征的二阶特征组合,每个特征,学习一个大小为k的一维向量,于是,两个特征xi和xj的特征组合的权重值,通过特征对应的向量vi和vj的内积<vi,vj>来表示。FM相比于矩阵分解的优势,是可以学习未出现的特征组合。因为FM是学习单个特征的embedding,并不依赖某个特定的特征组合是否出现过,所以只要特征和其它任意特征组合出现过,那么就可以学习自己对应的embedding向量。经过FM训练,可以得到每个one-hot后内容属性或者对象属性对应的隐向量。每件内容的多项内容属性特征、每个第二类型对象的多项对象属性特征是固定的,并通过特征提取模型在之前的流程中已经取到。对找到第二类型对象的每项对象特征对应的embedding特征(隐向量),累加就得到了第二类型对象的特征向量。内容的特征向量亦雷同的方式计算。
另外,训练的模型也可以是任何将样本中的标识转换为embedding的模型。具体实现时可以根据业务需求来选择模型类型。
本申请实施例中提供的内容推荐方法中,首先确定消费过第一类型对象推荐的内容的第二类型对象。其后,根据第二类型对象的历史内容消费行为获取第二类型对象的特征。接着,根据多位第二类型对象的特征构建第一类型对象的特征。最终,根据第一类型对象的特征向第一类型对象推荐内容,以供第一类型对象进行内容推荐。由于向第一类型对象推荐的内容是以第一类型对象的特征作为依据,且第一类型对象的特征是通过消费过其推荐内容的第二类型对象的特征获取的,因此在本申请是以第二类型对象的特征为导向推荐内容给第一类型对象,以便第一类型对象能够向第二类型对象推荐能够更加满足第二类型对象实际需求和/或喜好的内容。由此可见,本方案有助于实现第一类型对象对受众的内容精准推荐。
实际应用中,即便将内容推荐给第一类型对象,第一类型对象也有可能因为主观喜好拒绝推荐的内容,不将其选入未来推荐给第二类型对象的队列中。为了保障内容推荐的精准性,达成优化目标,实际应用中在根据第一类型对象的特征向第一类型对象推荐内容时,还可以通过展示方式展示选中推荐的内容后预期推荐效果度量值。这一度量值可以是预期的消费数量、消费资源值或者消费数量和/或消费资源值的涨幅等。如图3为在第一类型对象使用的终端设备的屏幕界面展示推荐的内容(供选品)的预期推荐效果度量值的示意图。
图4为向达人推荐内容以供达人选品并推荐给用户的内容推荐方法流程示意图。如图4所示,首先收集用户的交易数据(内容消费数据)和商品数据,收集达人的带货数据(内容推荐数据),并给予用户在系统(此系统指的是用户和达人交互,用户消费的平台)的其他行为,例如填写问卷等行为,构建画像数据。经过上述数据的积累,来拼接样本,包括正样本和负样本。接着对样本进行过滤。将过滤后的样本通过one-hot编码后输入到初始模型中训练,获得训练好的特征提取模型。当需要为达人推荐内容时,通过模型获得用户在各属性的特征,进而获得用户特征。并结合带货数据锁定用户组,再基于该达人的所有用户的特征构建达人特征。最后基于达人特征和内容特征为达人推荐内容(作为示例可以是商品)。通过本方案的实施进行内容推荐,有助于提升选品成交效果、帮助业务收入增长。该技术主要应用在cps联盟场景,包括但不限于以下各类cps应用程序。达人在CPS联盟选择商品->分享商品给用户->用户成交->平台按成交订单结算佣金。本方案显著提升了选品流程的效率,在达人加载推荐商品列表时,推出最易成交商品,帮助达人提高用户成交率、成交额,从而帮助平台收入增长。
基于前述实施例提供的内容推荐方法,相应地,本申请还提供了内容推荐装置。参见图5,该图为内容推荐装置500的结构示意图。
如图5所示的内容推荐装置包括:
对象确定单元501,用于确定消费过第一类型对象推荐的内容的第二类型对象;
特征获取单元502,用于根据所述第二类型对象的历史内容消费行为获取所述第二类型对象的特征;
特征构建单元503,用于根据多位所述第二类型对象的特征构建所述第一类型对象的特征;
内容推荐单元504,用于根据所述第一类型对象的特征向所述第一类型对象推荐内容,以供所述第一类型对象进行内容推荐。
可选地,特征获取单元502,包括:
属性查询子单元,用于根据所述第二类型对象的历史内容消费行为,查询获得所述历史内容消费行为对应的内容属性和对象属性;
特征提取子单元,用于基于所述历史内容消费行为对应的内容属性和对象属性,通过特征提取模型获得所述第二类型对象在多项所述对象属性的特征;
特征运算子单元,用于根据所述第二类型对象在多项所述对象属性的特征,运算获得所述第二类型对象的特征。
可选地,内容推荐装置还包括:模型训练单元,用于训练获得特征提取模型。模型训练单元包括:
样本构建子单元,用于根据发生有效内容消费行为的第一对象内容对构建正样本,并根据未发生有效内容消费行为的第二对象内容对构建负样本;所述正样本包括所述第一对象内容对中对象的属性和所述第一对象内容对中内容的属性;所述负样本包括所述第二对象内容对中对象的属性和所述第二对象内容对中内容的属性;
训练子单元,用于通过所述正样本、所述正样本的标签、所述负样本和所述负样本的标签,对初始模型进行训练,获得所述特征提取模型。
可选地,内容推荐装置还包括:样本过滤单元,用于基于以下任意一种或多种因素对所述正样本和所述负样本进行过滤,获得过滤后的正样本和过滤后的负样本:
过期数据、刷单数据、时效性内容或者资源值异常的内容。
特征提取子单元,具体用于基于所述历史消费行为对应的多项内容属性和多项对象属性进行独热编码,获得所述历史消费行为对应的多维度向量;将所述多维度向量作为所述特征提取模型的输入,通过所述特征提取模型获得所述第二类型对象的特征矩阵;根据所述多项对象属性在独热编码时对应的位置,从所述特征矩阵中获取命中所述位置的向量作为多项所述对象属性的特征向量。
可选地,特征运算子单元具体用于将多项所述对象属性的特征向量进行向量累加,得到所述第二类型对象的特征向量。
可选地,特征构建单元503,用于通过以下方式构建第一类型对象的特征向量:获取多位所述第二类型对象的特征向量的平均值作为所述第一类型对象的特征向量;或者,
获取多位所述第二类型对象的消费资源值,基于所述消费资源值对多位所述第二类型对象的特征向量进行加权平均运算,获得所述第一类型对象的特征向量;或者,
获取多位所述第二类型对象的消费内容数量,基于所述消费内容数量对多位所述第二类型对象的特征向量进行加权平均运算,获得所述第一类型对象的特征向量;或者,
获取多位所述第二类型对象完成消费的时间长度,基于所述时间长度作倒数对多位所述第二类型对象的特征向量进行加权平均运算,获得所述第一类型对象的特征向量。
可选地,内容推荐装置还包括:
内容特征提取单元,用于基于所述历史内容消费行为对应的内容属性和对象属性,通过特征提取模型获得所述第二类型对象消费的内容在多项所述内容属性的特征;
内容特征运算单元,用于根据所述第二类型对象消费的内容在多项所述内容属性的特征,运算获得所述第二类型对象消费的内容的特征;
内容推荐单元504,具体用于根据所述第一类型对象的特征和内容集合中内容的特征,从所述内容集合中确定出备选内容;向所述第一类型对象推荐所述备选内容。
可选地,内容推荐单元504,包括:
第一样本构建子单元,用于通过所述第一类型对象的特征和所述第一类型对象在所述内容集合中推荐过的内容的特征构建第一样本;
第一标签确定子单元,用于将所述第一类型对象对所述推荐过的内容的推荐效果度量值作为所述第一样本的标签;
模型训练子单元,用于根据所述第一样本和所述第一样本的标签训练获得排序模型;
第一备选内容确定子单元,用于通过所述排序模型从所述内容集合中确定出排序满足预设筛选条件的备选内容。
可选地,内容推荐单元504,包括:
第二备选内容确定子单元,用于基于所述第一类型对象的特征和内容集合中内容的特征进行相似索引,通过相似索引获得所述内容集合中特征与所述第一类型对象的特征相似度达到预设条件的内容作为第一目标内容,将所述第一目标内容作为所述备选内容;或者,
第三备选内容确定子单元,用于基于所述第一类型对象的特征检索与所述第一类型对象的特征相似的其他第一类型对象;基于所述其他第一类型对象的特征和所述内容集合中内容的特征,确定与所述其他第一类型对象的特征相似度达到预设条件的内容作为第二目标内容;将所述第二目标内容作为所述第一类型对象的备选内容。
可选地,对象确定单元501,包括:
追溯码获取子单元,用于从内容推荐数据中获取所述第一类型对象作为内容推荐者的推荐者追溯码;
对象标识确定子单元,用于从内容消费数据中确定出与所述推荐者追溯码对应的第二类型对象标识;
对象确定子单元,用于根据所述第二类型对象标识确定消费过所述第一类型对象推荐的内容的第二类型对象。
可选地,内容推荐装置还包括:展示单元,用于展示向所述第一类型对象推荐的内容的预期推荐效果度量值。
图6是本申请实施例提供的一种服务器结构示意图,该服务器900可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processingunits,CPU)922(例如,一个或一个以上处理器)和存储器932,一个或一个以上存储应用程序942或数据944的存储介质930(例如一个或一个以上海量存储设备)。其中,存储器932和存储介质930可以是短暂存储或持久存储。存储在存储介质930的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器922可以设置为与存储介质930通信,在服务器900上执行存储介质930中的一系列指令操作。
服务器900还可以包括一个或一个以上电源926,一个或一个以上有线或无线网络接口950,一个或一个以上输入输出接口958,和/或,一个或一个以上操作系统941,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
上述实施例中由服务器所执行的步骤可以基于该图6所示的服务器结构。
其中,CPU 922用于执行如下步骤:
确定消费过第一类型对象推荐的内容的第二类型对象;
根据第二类型对象的历史内容消费行为获取第二类型对象的特征;
根据多位第二类型对象的特征构建第一类型对象的特征;
根据第一类型对象的特征向第一类型对象推荐内容,以供第一类型对象进行内容推荐。
本申请实施例还提供了另一种内容推荐设备,如图7所示,为了便于说明,仅示出了与本申请实施例相关的部分,具体技术细节未揭示的,请参照本申请实施例方法部分。该终端可以为包括手机、平板电脑、个人数字助理(英文全称:Personal Digital Assistant,英文缩写:PDA)、销售终端(英文全称:Point of Sales,英文缩写:POS)、车载电脑等任意终端设备,以终端为手机为例:
图7示出的是与本申请实施例提供的终端相关的手机的部分结构的框图。参考图7,手机包括:射频(英文全称:Radio Frequency,英文缩写:RF)电路1010、存储器1020、输入单元1030、显示单元1040、传感器1050、音频电路1060、无线保真(英文全称:wirelessfidelity,英文缩写:WiFi)模块1070、处理器1080、以及电源1090等部件。本领域技术人员可以理解,图7中示出的手机结构并不构成对手机的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
下面结合图7对手机的各个构成部件进行具体的介绍:
RF电路1010可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,给处理器1080处理;另外,将设计上行的数据发送给基站。通常,RF电路1010包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(英文全称:LowNoise Amplifier,英文缩写:LNA)、双工器等。此外,RF电路1010还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议,包括但不限于全球移动通讯系统(英文全称:Global System of Mobile communication,英文缩写:GSM)、通用分组无线服务(英文全称:General Packet Radio Service,GPRS)、码分多址(英文全称:CodeDivision Multiple Access,英文缩写:CDMA)、宽带码分多址(英文全称:Wideband CodeDivision Multiple Access,英文缩写:WCDMA)、长期演进(英文全称:Long TermEvolution,英文缩写:LTE)、电子邮件、短消息服务(英文全称:Short Messaging Service,SMS)等。
存储器1020可用于存储软件程序以及模块,处理器1080通过运行存储在存储器1020的软件程序以及模块,从而执行手机的各种功能应用以及数据处理。存储器1020可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器1020可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
输入单元1030可用于接收输入的数字或字符信息,以及产生与手机的用户设置以及功能控制有关的键信号输入。具体地,输入单元1030可包括触控面板1031以及其他输入设备1032。触控面板1031,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板1031上或在触控面板1031附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触控面板1031可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器1080,并能接收处理器1080发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板1031。除了触控面板1031,输入单元1030还可以包括其他输入设备1032。具体地,其他输入设备1032可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
显示单元1040可用于显示由用户输入的信息或提供给用户的信息以及手机的各种菜单。显示单元1040可包括显示面板1041,可选的,可以采用液晶显示器(英文全称:Liquid Crystal Display,英文缩写:LCD)、有机发光二极管(英文全称:Organic Light-Emitting Diode,英文缩写:OLED)等形式来配置显示面板1041。进一步的,触控面板1031可覆盖显示面板1041,当触控面板1031检测到在其上或附近的触摸操作后,传送给处理器1080以确定触摸事件的类型,随后处理器1080根据触摸事件的类型在显示面板1041上提供相应的视觉输出。虽然在图7中,触控面板1031与显示面板1041是作为两个独立的部件来实现手机的输入和输入功能,但是在某些实施例中,可以将触控面板1031与显示面板1041集成而实现手机的输入和输出功能。
手机还可包括至少一种传感器1050,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板1041的亮度,接近传感器可在手机移动到耳边时,关闭显示面板1041和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于手机还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
音频电路1060、扬声器1061,传声器1062可提供用户与手机之间的音频接口。音频电路1060可将接收到的音频数据转换后的电信号,传输到扬声器1061,由扬声器1061转换为声音信号输出;另一方面,传声器1062将收集的声音信号转换为电信号,由音频电路1060接收后转换为音频数据,再将音频数据输出处理器1080处理后,经RF电路1010以发送给比如另一手机,或者将音频数据输出至存储器1020以便进一步处理。
WiFi属于短距离无线传输技术,手机通过WiFi模块1070可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图7示出了WiFi模块1070,但是可以理解的是,其并不属于手机的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
处理器1080是手机的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器1020内的软件程序和/或模块,以及调用存储在存储器1020内的数据,执行手机的各种功能和处理数据,从而对手机进行整体监控。可选的,处理器1080可包括一个或多个处理单元;优选的,处理器1080可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器1080中。
手机还包括给各个部件供电的电源1090(比如电池),优选的,电源可以通过电源管理系统与处理器1080逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
尽管未示出,手机还可以包括摄像头、蓝牙模块等,在此不再赘述。
在本申请实施例中,该终端所包括的处理器1080还具有以下功能:
确定消费过第一类型对象推荐的内容的第二类型对象;
根据第二类型对象的历史内容消费行为获取第二类型对象的特征;
根据多位第二类型对象的特征构建第一类型对象的特征;
根据第一类型对象的特征向第一类型对象推荐内容,以供第一类型对象进行内容推荐。
本申请实施例还提供一种计算机可读存储介质,用于存储程序代码,该程序代码用于执行前述各个实施例所述的一种内容推荐方法中的任意一种实施方式。
本申请实施例还提供一种包括指令的计算机程序产品,当其在计算机上运行时,使得计算机执行前述各个实施例所述的一种内容推荐方法中的任意一种实施方式。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文全称:Read-OnlyMemory,英文缩写:ROM)、随机存取存储器(英文全称:Random Access Memory,英文缩写:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。
Claims (15)
1.一种内容推荐方法,其特征在于,包括:
确定消费过第一类型对象推荐的内容的第二类型对象;
根据所述第二类型对象的历史内容消费行为获取所述第二类型对象的特征;
根据多位所述第二类型对象的特征构建所述第一类型对象的特征;
根据所述第一类型对象的特征向所述第一类型对象推荐内容,以供所述第一类型对象进行内容推荐。
2.根据权利要求1所述的方法,其特征在于,所述根据所述第二类型对象的历史内容消费行为获取所述第二类型对象的特征,包括:
根据所述第二类型对象的历史内容消费行为,查询获得所述历史内容消费行为对应的内容属性和对象属性;
基于所述历史内容消费行为对应的内容属性和对象属性,通过特征提取模型获得所述第二类型对象在多项所述对象属性的特征;
根据所述第二类型对象在多项所述对象属性的特征,运算获得所述第二类型对象的特征。
3.根据权利要求2所述的方法,其特征在于,所述特征提取模型通过以下步骤训练获得:
根据发生有效内容消费行为的第一对象内容对构建正样本,并根据未发生有效内容消费行为的第二对象内容对构建负样本;所述正样本包括所述第一对象内容对中对象的属性和所述第一对象内容对中内容的属性;所述负样本包括所述第二对象内容对中对象的属性和所述第二对象内容对中内容的属性;
通过所述正样本、所述正样本的标签、所述负样本和所述负样本的标签,对初始模型进行训练,获得所述特征提取模型。
4.根据权利要求3所述的方法,其特征在于,在所述通过所述正样本、所述正样本的标签、所述负样本和所述负样本的标签,对初始模型进行训练之前,所述方法还包括:
基于以下任意一种或多种因素对所述正样本和所述负样本进行过滤,获得过滤后的正样本和过滤后的负样本:
过期数据、刷单数据、时效性内容或者资源值异常的内容。
5.根据权利要求3所述的方法,其特征在于,所述基于所述历史内容消费行为对应的内容属性和对象属性,通过特征提取模型获得所述第二类型对象在多项所述对象属性的特征,包括:
基于所述历史消费行为对应的多项内容属性和多项对象属性进行独热编码,获得所述历史消费行为对应的多维度向量;
将所述多维度向量作为所述特征提取模型的输入,通过所述特征提取模型获得所述第二类型对象的特征矩阵;
根据所述多项对象属性在独热编码时对应的位置,从所述特征矩阵中获取命中所述位置的向量作为多项所述对象属性的特征向量。
6.根据权利要求5所述的方法,其特征在于,所述根据所述第二类型对象在多项所述对象属性的特征,运算获得所述第二类型对象的特征,包括:
将多项所述对象属性的特征向量进行向量累加,得到所述第二类型对象的特征向量。
7.根据权利要求6所述的方法,其特征在于,所述根据多位所述第二类型对象的特征构建所述第一类型对象的特征,包括:
获取多位所述第二类型对象的特征向量的平均值作为所述第一类型对象的特征向量;或者,
获取多位所述第二类型对象的消费资源值,基于所述消费资源值对多位所述第二类型对象的特征向量进行加权平均运算,获得所述第一类型对象的特征向量;或者,
获取多位所述第二类型对象的消费内容数量,基于所述消费内容数量对多位所述第二类型对象的特征向量进行加权平均运算,获得所述第一类型对象的特征向量;或者,
获取多位所述第二类型对象完成消费的时间长度,基于所述时间长度作倒数对多位所述第二类型对象的特征向量进行加权平均运算,获得所述第一类型对象的特征向量。
8.根据权利要求2所述的方法,其特征在于,还包括:
基于所述历史内容消费行为对应的内容属性和对象属性,通过特征提取模型获得所述第二类型对象消费的内容在多项所述内容属性的特征;
根据所述第二类型对象消费的内容在多项所述内容属性的特征,运算获得所述第二类型对象消费的内容的特征;
所述根据所述第一类型对象的特征向所述第一类型对象推荐内容,具体包括:
根据所述第一类型对象的特征和内容集合中内容的特征,从所述内容集合中确定出备选内容;
向所述第一类型对象推荐所述备选内容。
9.根据权利要求8所述的方法,其特征在于,所述根据所述第一类型对象的特征和内容集合中内容的特征,从所述内容集合中确定出备选内容,包括:
通过所述第一类型对象的特征和所述第一类型对象在所述内容集合中推荐过的内容的特征构建第一样本;
将所述第一类型对象对所述推荐过的内容的推荐效果度量值作为所述第一样本的标签;
根据所述第一样本和所述第一样本的标签训练获得排序模型;
通过所述排序模型从所述内容集合中确定出排序满足预设筛选条件的备选内容。
10.根据权利要求8所述的方法,其特征在于,所述根据所述第一类型对象的特征和内容集合中内容的特征,从所述内容集合中确定出备选内容,包括:
基于所述第一类型对象的特征和内容集合中内容的特征进行相似索引,通过相似索引获得所述内容集合中特征与所述第一类型对象的特征相似度达到预设条件的内容作为第一目标内容,将所述第一目标内容作为所述备选内容;或者,
基于所述第一类型对象的特征检索与所述第一类型对象的特征相似的其他第一类型对象;基于所述其他第一类型对象的特征和所述内容集合中内容的特征,确定与所述其他第一类型对象的特征相似度达到预设条件的内容作为第二目标内容;将所述第二目标内容作为所述第一类型对象的备选内容。
11.根据权利要求1-10任一项所述的方法,其特征在于,所述确定消费过第一类型对象推荐的内容的第二类型对象,包括:
从内容推荐数据中获取所述第一类型对象作为内容推荐者的推荐者追溯码;
从内容消费数据中确定出与所述推荐者追溯码对应的第二类型对象标识;
根据所述第二类型对象标识确定消费过所述第一类型对象推荐的内容的第二类型对象。
12.根据权利要求1-10任一项所述的方法,其特征在于,在所述根据所述第一类型对象的特征向所述第一类型对象推荐内容时,所述方法还包括:
展示向所述第一类型对象推荐的内容的预期推荐效果度量值。
13.一种内容推荐装置,其特征在于,包括:
对象确定单元,用于确定消费过第一类型对象推荐的内容的第二类型对象;
特征获取单元,用于根据所述第二类型对象的历史内容消费行为获取所述第二类型对象的特征;
特征构建单元,用于根据多位所述第二类型对象的特征构建所述第一类型对象的特征;
内容推荐单元,用于根据所述第一类型对象的特征向所述第一类型对象推荐内容,以供所述第一类型对象进行内容推荐。
14.一种计算机设备,其特征在于,所述设备包括处理器以及存储器:
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行权利要求1-12任一项所述的内容推荐方法。
15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行权利要求1-12任一项所述的内容推荐方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111399259.4A CN116150469A (zh) | 2021-11-19 | 2021-11-19 | 一种内容推荐方法、装置及相关产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111399259.4A CN116150469A (zh) | 2021-11-19 | 2021-11-19 | 一种内容推荐方法、装置及相关产品 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116150469A true CN116150469A (zh) | 2023-05-23 |
Family
ID=86349399
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111399259.4A Pending CN116150469A (zh) | 2021-11-19 | 2021-11-19 | 一种内容推荐方法、装置及相关产品 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116150469A (zh) |
-
2021
- 2021-11-19 CN CN202111399259.4A patent/CN116150469A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109241431B (zh) | 一种资源推荐方法和装置 | |
CN109002490B (zh) | 用户画像生成方法、装置、服务器及存储介质 | |
RU2641268C2 (ru) | Способ, устройство и система для рекомендации информации о продукте | |
CN111310034B (zh) | 一种资源推荐方法及相关设备 | |
WO2018040069A1 (zh) | 信息推荐系统及方法 | |
US20210288928A1 (en) | Determining engagement scores for sub-categories in a digital domain by a computing system | |
CN107423308B (zh) | 主题推荐方法以及装置 | |
CN108073605A (zh) | 一种业务数据的加载、推送、交互信息的生成方法和装置 | |
CN111143697B (zh) | 一种内容推荐的方法以及相关装置 | |
KR101998400B1 (ko) | 빅데이터를 이용한 모바일 커머스 정보 추천 시스템 및 방법 | |
KR20190010173A (ko) | 사용자 의도 프로파일링 방법 및 이를 위한 장치 | |
WO2020238951A1 (zh) | 网络内容处理方法、装置、设备及计算机存储介质 | |
WO2019137485A1 (zh) | 一种业务分值的确定方法、装置及存储介质 | |
WO2021120875A1 (zh) | 搜索方法、装置、终端设备及存储介质 | |
CN109493101A (zh) | 目标品牌信息确定方法、装置、电子设备及存储介质 | |
CN109785000A (zh) | 客户资源分配方法、装置、存储介质和终端 | |
CN111914188A (zh) | 推荐目标用户的选择方法、系统、设备及存储介质 | |
CN113392150A (zh) | 一种基于业务域的数据表展示方法、装置、设备及介质 | |
CN111242709A (zh) | 一种消息推送方法及其装置、设备、存储介质 | |
Shokouhyar et al. | Toward customer-centric mobile phone reverse logistics: using the DEMATEL approach and social media data | |
CN112115710B (zh) | 一种行业信息识别方法及装置 | |
CN112329462B (zh) | 一种数据排序方法、装置、电子设备及存储介质 | |
CN116150469A (zh) | 一种内容推荐方法、装置及相关产品 | |
CN111325598B (zh) | 一种物品推荐方法、装置及终端设备 | |
CN115687745A (zh) | 多媒体数据推荐方法、装置、存储介质及计算机设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40086086 Country of ref document: HK |