CN111144974B - 一种信息展示方法及装置 - Google Patents
一种信息展示方法及装置 Download PDFInfo
- Publication number
- CN111144974B CN111144974B CN201911230136.0A CN201911230136A CN111144974B CN 111144974 B CN111144974 B CN 111144974B CN 201911230136 A CN201911230136 A CN 201911230136A CN 111144974 B CN111144974 B CN 111144974B
- Authority
- CN
- China
- Prior art keywords
- information
- sample
- display form
- user
- displayed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0641—Shopping interfaces
- G06Q30/0643—Graphical representation of items or shoppers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Finance (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Accounting & Taxation (AREA)
- Evolutionary Biology (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- User Interface Of Digital Computer (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本说明书公开一种信息展示方法和装置,根据用户的属性以及用户历史上点击的各样本信息的展示形式,确定出表征用户对信息的展示形式的偏好的样本用户特征。将用户历史上点击的各样本待展示信息被点击时的展示形式的展示形式特征作为正样本,将该被点击的展示形式对应的信息的未被点击的样本待展示信息未被点击时的展示形式的展示形式特征作为负样本。通过确定出的样本用户特征、正样本和负样本,共同训练用于确定用户特征的第一模型和用于确定展示形式特征的第二模型。进而,通过比较第一模型输出的用户特征与第二模型输出的展示形式特征的相似度,就能够确定信息的展示形式。本说明书中的方法无需在线上运行CTR预估模型,有效提高信息展示的效率。
Description
技术领域
本说明书涉及互联网领域,尤其涉及一种信息展示方法及装置。
背景技术
目前,在一些电商平台,如对话式点餐平台中,为了引导用户消费,通常可向用户展示商家、商品对应的信息,帮助用户找到自己想找的商家或者商品,最终完成下单。
在现有技术中,电商平台根据用户的信息展示请求,通过在线的方式在服务器端召回与该信息展示请求对应的各信息,每个信息均可对应若干种展示形式。然后在线预测出每种展示形式能够获得的点击率(Click Through Rate,CTR)。之后根据预测的结果,筛选出最可能被用户点击的展示形式,按照该筛选出的展示形式,将信息展示给用户。
然而,在实际的使用场景中,针对用户的信息请求召回的信息的展示形式的数量较多,对信息对应的每种展示形式均进行在线的计算,会导致电商平台在向用户展示信息的过程中,在线处理的数据的量较大,在线处理数据的负荷较大,预测CTR的模型结构较为复杂,影响信息展示的效率。
发明内容
本说明书实施例提供一种信息展示方法及装置,以部分的解决现有技术存在的上述问题。
本说明书实施例采用下述技术方案:
本说明书提供的第一种信息展示方法,所述方法包括:
针对用户历史上点击的各样本信息,确定用户点击该样本信息时该样本信息的展示形式,以及该用户的属性;
将确定出的所述用户的属性、所述用户点击该样本信息时所处的页面以及所述用户点击各样本信息时各样本信息的展示形式,输入待训练的第一模型,得到样本用户特征;
确定历史上向所述用户展示该样本信息时,展示给所述用户的所有信息,作为样本待展示信息;
针对每个所述样本待展示信息,将该样本待展示信息的每个展示形式输入待训练的第二模型,得到针对该展示形式的展示形式特征;
根据确定出的样本用户特征和该样本待展示信息对应的各展示形式特征,以样本用户特征与该样本待展示信息被点击时的展示形式的展示形式特征的相似度最大化,且,样本用户特征与该样本待展示信息未被点击时的展示形式的展示形式特征的相似度最小化为训练目标,训练第一模型和第二模型;
当接收到信息展示请求时,确定所述信息展示请求对应的目标待展示信息,并且采用训练后的第一模型确定发送所述信息展示请求的当前用户的用户特征,作为当前用户特征;
针对目标待展示信息的每种展示形式,根据所述当前用户特征与该展示形式的展示形式特征的相似度,在该目标待展示信息的各展示形式中,确定目标展示形式,并根据确定出的目标展示形式,展示所述目标待展示信息,其中,所述目标待展示信息的每种展示形式的展示形式特征是通过训练后的第二模型确定的。
可选地,所述展示形式包括:图片和/或文字中的至少一种。
可选地,将确定出的所述用户的属性、所述用户点击该样本信息时所处的页面以及所述用户点击各样本信息时各样本信息的展示形式,输入待训练的第一模型,得到样本用户特征,具体包括:
根据确定出的所述用户点击各样本信息时各样本信息的展示形式,确定样本展示全局特征;
将点击该样本信息时所述用户所处的页面、所述用户的属性以及所述样本展示全局特征,输入待训练的第一模型,得到样本用户特征。
可选地,根据确定出的所述用户点击各样本信息时各样本信息的展示形式,确定样本展示全局特征,具体包括:
针对确定出的所述用户点击各样本信息时各样本信息的展示形式,确定该展示形式的个体特征;
对所述用户点击各样本信息时各样本信息的展示形式的个体特征进行池化,得到样本展示全局特征,所述池化至少包括均值池化。
可选地,将该样本待展示信息的每个展示形式输入待训练的第二模型,具体包括:
确定出该样本待展示信息的每个展示形式的图片特征、文字特征和属性特征;
将该展示形式的图片特征、文字特征和属性特征输入待训练的第二模型。
可选地,所述样本用户特征和样本待展示信息对应的各展示形式特征均为特征向量;
以样本用户特征与该样本待展示信息被点击时的展示形式的展示形式特征的相似度最大化,且,样本用户特征与该样本待展示信息未被点击时的展示形式的展示形式特征的相似度最小化为训练目标,训练第一模型和第二模型,具体包括:
针对该样本待展示信息对应的每个展示形式的展示形式特征,确定该展示形式特征与所述样本用户特征的余弦距离;
以样本用户特征与该样本待展示信息被点击时的展示形式的展示形式特征的余弦距离最大化,且,以样本用户特征与该样本待展示信息未被点击时的展示形式的展示形式特征的余弦距离最小化为训练目标,训练第一模型和第二模型。
可选地,训练第一模型和第二模型之后,所述方法还包括:
采用训练后的第二模型,针对每个预存的待展示信息,确定该预存的待展示信息对应的各展示形式特征并保存。
可选地,针对目标待展示信息的每种展示形式,根据所述当前用户特征与该展示形式的展示形式特征的相似度,在该目标待展示信息的各展示形式中,确定目标展示形式,具体包括:
针对目标待展示信息的每种展示形式,在保存的各展示形式特征中,查找该展示形式的展示形式特征;
根据所述当前用户特征与目标待展示信息的每种展示形式的展示形式特征的相似度,在该目标待展示信息的各展示形式中,确定目标展示形式。
本说明书提供的第二种信息展示方法,所述方法包括:
接收信息展示请求;
确定所述信息展示请求对应的目标待展示信息;并将发送该信息展示请求的用户的属性、发送该信息展示请求时用户所处的页面、历史上用户点击各信息时各信息的展示形式,输入训练后的第一模型,得到当前用户特征;
针对目标待展示信息的每种展示形式,根据所述当前用户特征与该展示形式的展示形式特征的相似度,在该目标待展示信息的各展示形式中,确定目标展示形式;其中,所述目标待展示信息的每种展示形式的展示形式特征,是通过将该展示形式输入训练后的第二模型得到的;
根据确定出的目标展示形式,展示所述目标待展示信息。
本说明书提供的第一种信息展示装置,包括:
用户样本输入确定模块,用于针对用户历史上点击的各样本信息,确定用户点击该样本信息时该样本信息的展示形式,以及该用户的属性;
样本用户特征确定模块,用于将确定出的所述用户的属性、所述用户点击该样本信息时所处的页面以及所述用户点击各样本信息时各样本信息的展示形式,输入待训练的第一模型,得到样本用户特征;
样本待展示信息确定模块,用于确定历史上向所述用户展示该样本信息时,展示给所述用户的所有信息,作为样本待展示信息;
展示形式特征确定模块,用于针对每个所述样本待展示信息,将该样本待展示信息的每个展示形式输入待训练的第二模型,得到针对该展示形式的展示形式特征;
模型训练模块,用于根据确定出的样本用户特征和该样本待展示信息对应的各展示形式特征,以样本用户特征与该样本待展示信息被点击时的展示形式的展示形式特征的相似度最大化,且,样本用户特征与该样本待展示信息未被点击时的展示形式的展示形式特征的相似度最小化为训练目标,训练第一模型和第二模型;
当前用户特征确定模块,用于当接收到信息展示请求时,确定所述信息展示请求对应的目标待展示信息,并且采用训练后的第一模型确定发送所述信息展示请求的当前用户的用户特征,作为当前用户特征;
展示形式确定模块,用于针对目标待展示信息的每种展示形式,根据所述当前用户特征与该展示形式的展示形式特征的相似度,在该目标待展示信息的各展示形式中,确定目标展示形式,并根据确定出的目标展示形式,展示所述目标待展示信息,其中,所述目标待展示信息的每种展示形式的展示形式特征是通过训练后的第二模型确定的。
本说明书提供的第二种信息展示装置,包括:
接收模块,用于接收信息展示请求;
当前用户特征确定模块,用于确定所述信息展示请求对应的目标待展示信息;并将发送该信息展示请求的用户的属性、发送该信息展示请求时用户所处的页面、历史上用户点击各信息时各信息的展示形式,输入训练后的第一模型,得到当前用户特征;
目标展示形式确定模块,用于针对目标待展示信息的每种展示形式,根据所述当前用户特征与该展示形式的展示形式特征的相似度,在该目标待展示信息的各展示形式中,确定目标展示形式;其中,所述目标待展示信息的每种展示形式的展示形式特征,是通过将该展示形式输入训练后的第二模型得到的;
展示模块,用于根据确定出的目标展示形式,展示所述目标待展示信息。
本说明书提供的第一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述的第一种信息展示方法。
本说明书提供的第二种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述的第二种信息展示方法。
本说明书提供的第一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述第一种信息展示方法。
本说明书提供的第二种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述第二种信息展示方法。
本说明书实施例采用的上述至少一个技术方案能够达到以下有益效果:
本说明书实施例中的信息展示方法和装置,根据用户的属性以及用户历史上点击的各样本信息的展示形式,确定出能够表征用户对信息的展示形式的偏好的样本用户特征。并且,将用户历史上点击的各样本待展示信息被点击时的展示形式的展示形式特征作为正样本,将该被点击的展示形式对应的信息的未被点击的样本待展示信息未被点击时的展示形式的展示形式特征作为负样本。然后通过确定出的样本用户特征、正样本和负样本,共同训练用于确定用户特征的第一模型和用于确定展示形式特征的第二模型。在训练的过程中,使得第一模型和第二模型能够实现样本用户特征与正样本的相似度最大化,并且能够实现用户特征与负样本的相似度最小化。进而,通过比较第一模型输出的用户特征与第二模型输出的展示形式特征的相似度,即能够确定出该展示形式是否符合用户的偏好。使得本说明书中的方法无需在线上运行CTR预估模型,将针对CTR的预测简化为用户特征与展示形式特征的相似度的确定,较大程度的简化了模型结构,减少数据的处理量,有效提高了信息展示的效率。
附图说明
此处所说明的附图用来提供对本说明书的进一步理解,构成本说明书的一部分,本说明书的示意性实施例及其说明用于解释本说明书,并不构成对本说明书的不当限定。在附图中:
图1为本说明书实施例提供的第一种信息展示过程;
图2为本说明书实施例提供的第一种信息展示过程中的模型训练的过程;
图3为本说明书实施例提供的第一种信息展示过程中的,根据训练后的第一模型和第二模型确定信息展示形式的过程;
图4为本说明书实施例提供的第一种信息展示装置的结构示意图;
图5为本说明书实施例提供的第二种信息展示过程;
图6为本说明书实施例提供的第二种信息展示装置的结构示意图;
图7为本说明书实施例提供的对应于图1的第一种电子设备示意图;
图8为本说明书实施例提供的对应于图5的第二种电子设备示意图。
具体实施方式
在现有的信息展示方法中,服务器需根据用户的信息展示请求,在预存的各待展示信息中查找出与该信息展示请求相对应的各待展示信息。
以电商平台向用户展示商品为例,服务器中储存的某类商品的信息,可能包括来自于多个商家的不同品牌、不同型号的商品的信息。这就使得服务器根据用户的信息展示请求召回的待展示信息的数据可能较为庞大。
并且,为满足实际场景中用户多样性、用户个性化的需求,针对一个待展示信息,服务器中往往存储有多个与该待展示信息相对应的展示形式,每种展示形式面向不同的用户能够带来的CTR往往也是不同的。为引导用户消费,需要在一个待展示信息对应的多个展示形式中,筛选出最可能吸引用户点击的待展示信息的展示形式。
现有的方法是,针对根据信息展示请求召回的每个待展示信息,均通过在线的方式采用预设的CTR预估模型计算该待展示信息对应的每个展示形式可能带来的CTR。假设根据信息展示请求召回的待展示信息数量为n个,每个待展示信息均对应有m个展示形式,则需要CTR预估模型在线计算m×n次,才能够确定出每种待展示信息应该以何种展示形式展示给用户。
可见,现有的方法在线的计算量较大,占用服务器在线计算资源的问题较为严重,也影响了信息展示的效率。并且,现有的方法需要CTR预估模型才能够实现对用户请求的信息的展示,增加了信息展示过程中所需的模型的结构的复杂程度。
本说明书中摒弃基于预估CTR进行信息展示的方法,直接计算用户特征与待展示信息的每个展示形式的展示形式特征的相似度,基于计算的相似度进行信息展示,可简化信息展示过程中所需的模型的结构,提高信息展示的效率,下面对本说明书提供的信息展示方法进行详细说明。
为使本说明书的目的、技术方案和优点更加清楚,下面将结合本说明书具体实施例及相应的附图对本说明书技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本说明书一部分实施例,而不是全部的实施例。基于说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本说明书保护的范围。
以下结合附图,详细说明本说明书各实施例提供的技术方案。
图1为本说明书实施例提供的第一种信息展示的过程,具体可包括以下步骤:
S100:针对用户历史上点击的各样本信息,确定用户点击该样本信息时该样本信息的展示形式,以及该用户的属性。
本说明书中的第一种信息展示过程,可以包括离线的模型训练过程和在线的信息展示过程两个部分。离线的模型训练过程包括步骤S100至S108,在线的信息展示过程包括步骤S110和S112。
在步骤S100中,可确定出用于模型训练的样本,这些样本至少需要反映出用户所偏好的信息展示形式,因此,可根据用户历史的“点击”行为,确定用于模型训练的样本。
在实际的使用场景中,向用户展示过的所有信息中,可能仅有一小部分的信息被用户点击过。则可以将历史上被用户点击过的信息,作为至少部分的用于模型训练的样本信息。并且,针对某一个样本信息,在历史上可能已经通过多种展示形式向用户展示过多次,而仅当该样本信息通过其中一种或几种展示形式被展示时,才会被用户点击,则表明该能够引起用户点击的展示形式区别于其他的未能引起用户点击该样本信息的展示形式,该能够引起用户点击的展示形式符合用户的偏好,能够带来较高的CTR。该能够引起用户点击的展示形式可以在后续步骤中作为模型训练的正样本。
其中,展示形式可以为该展示形式对应的信息所包含的图文和/或文字。进一步地,展示形式还可以为该展示形式对应的信息所包含的图文和/或文字的组合方式,图片和/或文字的排布方式中的至少一种。用户的属性可以包括:用户的年龄、用户的性别等,可以作为样本的用户的数量不做限制。
S102:将确定出的所述用户的属性、所述用户点击该样本信息时所处的页面以及所述用户点击各样本信息时各样本信息的展示形式,输入待训练的第一模型,得到样本用户特征。
在本说明书中,用户可以通过用户终端实施对信息的点击操作。用户终端可以包括但不限于手机、平板电脑和个人计算机(Personal Computer,PC)。用户点击该样本信息时所处的页面,可以为用户点击该样本信息时,用户终端展示给用户的页面。例如,用户点击该样本信息时所处的页面可以为某商品的商家店铺页面,或者用户点击该样本信息时所处的页面可以为电商平台针对某商品的推广页面。
第一模型为预设的模型,第一模型可以根据用户的属性、所述用户点击该样本信息时所处的页面以及所述用户点击各样本信息时各样本信息的展示形式,确定出用户的偏好,并输出能够表征用户偏好的用户特征。
S104:确定历史上向所述用户展示该样本信息时,展示给所述用户的所有信息,作为样本待展示信息。
在历史上,服务器根据用户的某一信息展示请求,向用户展示的信息往往不只一个。
例如,用户的信息展示请求对应的商品为手机,服务器接收到了该信息展示请求后,向用户展示了A品牌的手机信息和B品牌的手机信息,并且A品牌的手机信息以展示形式a1向用户展示时,引起了用户的点击操作。则A品牌的手机信息和B品牌的手机信息均可以为本说明书中的样本待展示信息。
其中,A品牌的手机信息的展示形式a1可以在后续步骤中作为模型训练的正样本。B品牌的手机信息由于展示时未被点击,则该B品牌的手机信息的各展示形式可以在后续步骤中作为模型训练的负样本;并且,A品牌的手机信息的展示形式a2由于未能引起用户的点击,则该展示形式a2也可以作为模型训练的负样本。
S106:针对每个所述样本待展示信息,将该样本待展示信息的每个展示形式输入待训练的第二模型,得到针对该展示形式的展示形式特征。
第二模型为预设的模型。第二模型可以用于对输入的各展示形式,确定出能够从若干维度对该展示形式进行表征的展示形式特征,并输出该展示形式特征。
S108:根据确定出的样本用户特征和该样本待展示信息对应的各展示形式特征,以样本用户特征与该样本待展示信息被点击时的展示形式的展示形式特征的相似度最大化,且,样本用户特征与该样本待展示信息未被点击时的展示形式的展示形式特征的相似度最小化为训练目标,训练第一模型和第二模型。
在历史上向用户展示信息时,若以某一展示形式展示的待展示信息被用户点击过,表明该待展示信息的该展示形式(即正样本)符合用户的偏好,则该展示形式的展示形式特征(由待训练的第二模型输出)应该与该用户的样本用户特征(由待训练的第一模型输出)相似度较大。并且,若以某一展示形式展示的待展示信息未被用户点击过,表明该待展示信息不符合用户的偏好,或者该待展示信息的该展示形式不符合用户的偏好,则该展示形式(即负样本)的展示形式特征(由待训练的第二模型输出)应该与该用户的样本用户特征(由待训练的第一模型输出)相似度较小。
可见,模型训练过程中的第一模型和第二模型的输入均为已知;用户在历史上点击过的各信息的展示形式也为已知,可以根据用户的点击行为,推断出该用户的样本用户特征与各展示形式特征之间的相似度,进而可以实现同时对第一模型和第二模型的训练。
S110:当接收到信息展示请求时,确定所述信息展示请求对应的目标待展示信息,并且采用训练后的第一模型确定发送所述信息展示请求的当前用户的用户特征,作为当前用户特征。
本说明书中的信息展示请求可以为用户通过用户终端直接发送的请求,例如,用户通过输入关键词生成的对某类商品或店铺的搜索请求。此外,信息展示请求还可以为服务器根据用户的浏览行为间接确定出的请求,例如,用户在浏览页面过程中,在页面上显示的某一商品的信息上停留的时间较长,则可根据页面中的该商品生成信息展示请求。
确定出的目标待展示信息,至少能够表征信息展示请求中所表达的用户对商品或店铺的需求。仍以前述的手机商品为例,当用户的信息展示请求对应的商品为手机,则各手机相关的信息均可以为目标待展示信息。
采用训练后的第一模型得到的当前用户特征,至少能够表征当前用户对信息展示形式的偏好。
S112:针对目标待展示信息的每种展示形式,根据所述当前用户特征与该展示形式的展示形式特征的相似度,在该目标待展示信息的各展示形式中,确定目标展示形式,并根据确定出的目标展示形式,展示所述目标待展示信息,其中,所述目标待展示信息的每种展示形式的展示形式特征是通过训练后的第二模型确定的。
可见,本说明书中的信息展示的过程,通过比较第一模型输出的用户特征与第二模型输出的展示形式特征的相似度,即能够确定出该展示形式是否符合用户对信息展示形式的偏好。使得本说明书中的信息展示的过程无需设置CTR预估模型,也能够实现以提高CTR为前提的信息展示。由于确定相似度的复杂程度明显低于CTR的预测的复杂程度,本说明书中将针对CTR的预测简化为用户特征与展示形式特征的相似度的确定,能够显著提高信息展示的效率。
下面对本说明书中所述的信息展示的过程进行详细说明。
本说明书中的信息展示的过程涉及的储存设备中预先储存有各历史的信息,例如,用户历史上点击的各样本信息、用户点击该样本信息时该样本信息的展示形式以及该用户的属性。可选地,还可以在离线的步骤中,通过训练后的第二模型确定各待展示信息的各展示形式的展示形式特征,并将确定出的各展示形式特征存储在上述的存储设备中,以便在“在线信息展示过程”中,直接查找存储设备中存储的目标待展示信息的各展示形式的展示形式特征。
以下,对本说明书中的第一种信息展示的过程的“离线的模型训练过程”和“在线的信息展示过程”分别地进行说明。
一、离线的模型训练过程。
如图2所示,在本说明书中,步骤S102中的将确定出的所述用户的属性、所述用户点击该样本信息时所处的页面以及所述用户点击各样本信息时各样本信息的展示形式,输入待训练的第一模型,得到样本用户特征,具体的实施方式可以为:
(1)根据确定出的所述用户点击各样本信息时各样本信息的展示形式,确定出样本展示全局特征。该样本展示全局特征至少可以用于表征用户在历史中点击操作所体现出的用户对信息的展示形式的偏好。
(2)对用户点击该样本信息时所述用户所处的页面进行特征提取,并对特征提取的结果进行转换(Embedding),以得到该样本信息的页面特征。例如,第一模型包括预设的映射层,该映射层可以通过将特征提取的结果映射到预先设定的向量空间的方式,实现对特征提取的结果的转换。
(3)对该用户的属性进行特征提取,并将特征提取的结果映射到预先设定的向量空间,得到该用户的属性特征。
至此,在历史的各信息中选取的涉及用户的信息,均经过映射被处理为符合所述向量空间规则的统一格式。
对确定出的样本展示全局特征、样本信息的页面特征和该用户的属性特征进行拼接,得到对应于第一模型的用户样本输入。
(4)将确定出的用户样本输入,输入到待训练的第一模型,得到样本用户特征。
前述的步骤(1)、(2)和(3)的先后次序不限,可以根据实际的使用场景进行调整。
可选地,历史的各信息还可以包括该用户对该样本信息进行点击时所处的地理位置的信息,可将该地理位置的信息,作为确定样本用户特征所需的信息之一。则在特征提取过程中,对该地理位置的信息进行特征提取,并将特征提取的结果映射到预先设定的向量空间,得到地理位置特征。然后,对确定出的样本待展示全局特征、样本信息的页面特征、该用户的属性特征和该地理位置特征进行拼接,得到对应于第一模型的用户样本输入。
其中,步骤(1)中确定样本展示全局特征的过程具体可以包括:
1)针对确定出的所述用户点击各样本信息时各样本信息的展示形式,确定该展示形式的个体特征。
如图2所示,现以一样本信息被点击时的各展示形式中的一个展示形式k为例进行说明。
首先,确定出该展示形式k中的图片Pk、文字Wk和该展示形式的属性Sk。其中,该展示形式的属性Sk可以包括该展示形式k对应的商品的类型、商家为该展示形式确定的用户的年龄段等。
然后,针对从展示形式k中确定出的图片Pk,通过预设的卷积神经网络(Convolutional Neural Networks,CNN)模型进行特征提取,得到该展示形式k的样本图片特征。针对从展示形式k中确定出的文字Wk,通过预设的Word 2Vec模型进行特征提取,得到该展示形式k的样本文字特征。针对从展示形式k中确定出的展示形式的属性Sk,通过One-Hot编码,得到该展示形式k的样本属性特征。
将确定出的样本图片特征、样本文字特征和样本属性特征进行拼接,得到该展示形式k的个体特征Gk。
则针对各展示形式分别地实施本过程,就能够得到各展示形式各自的个体特征。
2)对所述用户点击各样本信息时各样本信息的展示形式的个体特征进行池化(Pooling),得到样本展示全局特征。所述池化至少包括均值池化(Mean Pooling)。
此外,池化的方式不局限于均值池化,还可以为一般池化(General Pooling)、最大池化(Max Pooling)、重叠池化(Overlapping Pooling)、随机池化(StochasticPooling)等。
相对应的,如图2所示,可以在储存设备中储存的涉及商品的各信息中,选取样本待展示信息。选取的样本待展示信息的数量可以为多个。再针对每个样本待展示信息,确定出该样本待展示信息的各展示形式。现以选取的各样本待展示信息中的第j个样本待展示信息为例进行说明。
首先,确定出该展示形式j中的图片Pj、文字Wj和该展示形式的属性Sj。
然后,针对从展示形式j中确定出的图片Pj,通过预设的CNN模型进行特征提取,得到该展示形式j的样本图片特征。针对从展示形式j中确定出的文字Wj,通过预设的Word2Vec模型进行特征提取,得到该展示形式j的样本文字特征。针对从展示形式j中确定出的展示形式的属性Sj,通过One-Hot编码,得到该展示形式j的样本属性特征。
将确定出的样本图片特征、样本文字特征和样本属性特征进行拼接,得到对应于第二模型的展示形式样本输入Ij。
则针对选取的各样本待展示信息的各展示形式均分别地实施本过程,就能够得到各样本待展示信息的各展示形式各自的展示形式样本输入。
然后,针对每个展示形式样本输入,将该展示形式样本输入输入到待训练的第二模型,得到该展示形式的展示形式特征。
由于已预先确定出了各样本待展示信息以何种展示形式被展示时被用户点击过。则可将该样本待展示信息被用户点击时的展示形式的展示形式特征与该用户的样本用户特征之间的相似度设置为较大的数值(表明两者相似度较高);将未能被用户点击的样本待展示信息和以某种展示形式被展示时未被用户点击的各展示形式的展示形式特征与该用户的样本用户特征之间的相似度设置为较小的数值(表明两者相似度较低)。
至此,训练第一模型和第二模型所需的各信息已确定完毕。
在本说明书一个可选的应用场景中,样本用户特征和样本待展示信息对应的各展示形式特征均可以为特征向量。即,通过上述过程获得的用户的属性特征、页面特征、样本展示全局特征、地理位置特征等,均可以通过特征向量的形式进行表示。并且,可以将展示形式特征与样本用户特征之间的余弦距离,作为该展示形式特征与该样本用户特征之间的相似度。
具体地,确定样本用户特征和该样本待展示信息被点击时的展示形式的展示形式特征的余弦距离,作为正样本输出,调整所述第一模型和第二模型,使得所述正样本输出趋近于样本余弦距离最大值(可以为1)。确定样本用户特征与该样本待展示信息未被点击时的展示形式的展示形式特征的余弦距离,作为负样本输出;调整所述第一模型和第二模型,使得所述负样本输出趋近于样本余弦距离最小值(可以为0)。
可见,在上述确定样本、特征提取和训练模型的过程中,以历史的各信息作为样本,例如,训练模型采用的各负样本中,既包括用户点击过的信息的不同展示形式中,未能引起点击的展示形式的展示形式特征,也包括了向用户展示过、但用户自始至终未点击过的信息的展示形式特征(此时,无法引起用户的点击行为的原因可能是展示形式,也可能是待展示信息自身)。使得通过上述各训练后的第一模型和第二模型不仅仅能够确定出用户对信息的展示形式的偏好,还能够确定出向用户展示的信息自身是否符合用户发送的信息展示请求。仍以前述的手机商品为例,服务器接收到了该信息展示请求后,向用户展示了A品牌的手机信息和B品牌的手机信息,由于用户对B品牌的手机不感兴趣,则无论B品牌的手机以何种行展示形式被展示给用户,用户也不会对B品牌的手机信息进行点击。
在完成上述的针对第一模型和第二模型的训练之后,即能够获得训练后的第一模型和第二模型。训练后的第一模型和第二模型至少可以用于根据用户发送的信息展示请求,确定出向用户展示的信息的展示形式。
本说明书中的信息展示的的过程,为进一步减少向用户进行信息展示时的在线数据处理的量,采用训练后的第二模型,针对每个预存的待展示信息,离线确定该预存的待展示信息对应的各展示形式特征,并将确定出的各展示形式特征保存在如图2、图3所示的储存设备中。
在实际的使用场景中,商家在将各待展示信息以及该待展示信息的各展示形式保存至储存设备之后,将不会在对其进行频繁的调整。则采用本说明书中的过程,在根据用户的信息展示请求向用户展示信息之前,将确定出的各待展示信息的各展示形式预先的保存在储存设备中,也不会信息展示的效果造成负面影响。
可选地,可以在每次商家对储存设备中存储的待展示信息和/或某一待展示信息的展示形式进行调整之后,通过训练后的第二模型,对储存设备中保存的相应的内容进行更新。
二、在线的信息展示过程。
在接收到用户发送的信息展示请求时,可根据该信息展示请求,通过训练后的第一模型以及储存设备中保存的至少部分的展示形式特征,向当前用户展示当前用户发送信息展示请求对应待展示信息的过程可以包括:
(1)确定目标待展示信息以及该目标待展示信息对应的各展示形式特征。
根据该信息展示请求和预设的业务规则,在预先储存的各待展示信息中,确定出该信息展示请求对应的目标待展示信息(可以为多个)。
预设的业务规则可以用于根据当前用户的浏览行为,在预先储存的各待展示信息中,确定与该当前用户的信息展示请求对应的目标待展示信息。例如,预设的业务规则可以为:根据用户当前的地理位置,在预先储存的各待展示信息中,确定出与当前用户的地理位置距离较近的商家对应的待展示信息,作为目标展示信息。
然后,针对该目标待展示信息的每种展示形式,在储存设备中保存的各展示形式特征中,查找该展示形式的展示形式特征。
(2)确定出当前用户的当前展示全局特征。
该确定当前用户的当前展示全局特征的过程,可以与前述“离线的模型训练过程”中的步骤(1)相似,在此不做赘述。
(3)确定出当前用户的页面特征。
对当前用户发送信息展示请求时,当前用户所处的页面进行特征提取,并将特征提取的结果映射到预先设定的向量空间,得到当前用户的页面特征。
(4)确定出当前用户的属性特征。
对当前用户的属性进行特征提取,并将特征提取的结果映射到预先设定的向量空间,得到该当前用户的属性特征。当前用户的属性可以预先的保存在储存设备中。
对确定出的当前用户的展示全局特征、页面特征和当前用户的属性特征进行拼接,得到当前用户输入。
(5)确定当前用户的当前用户特征。
将确定出的当前用户输入,输入到训练后的第一模型,得到当前用户特征。前述的步骤(2)、(3)和(4)的次序不限,可以根据实际的使用场景进行调整。
(6)确定目标待展示信息的目标展示形式特征。
针对该目标展示信息对应的每个展示形式特征,确定该展示形式特征与当前用户特征的相似度,以根据确定出的相似度,确定该展示形式是否为该目标待展示信息的目标展示形式。
之后,以确定出的目标展示形式,向当前用户展示该目标待展示信息。
可见,通过本说明书中的信息展示的过程,涉及在线数据处理的部分包括:确定当前用户的当前用户特征、比较确定出的当前用户特征与至少部分的预先保存的展示形式特征之间的相似度。就能够实现对各展示形式的筛选,以确定该信息展示请求对应的目标待展示信息应该以何种展示形式进行展示。
基于同样的思路,本说明书实施例提供的第二种信息展示的过程。该第二种信息展示的过程,可以根据训练后的第一模型和训练后的第二模型,在线的确定信息展示请求的展示形式。该第二种信息展示的过程具体可包括以下步骤:
S500:接收信息展示请求。
该信息展示请求可以为用户通过用户终端发送的请求。
S502:确定所述信息展示请求对应的目标待展示信息;并将发送该信息展示请求的用户的属性、发送该信息展示请求时用户所处的页面、历史上用户点击各信息时各信息的展示形式,输入训练后的第一模型,得到当前用户特征。
在信息展示请求可以为用户通过用户终端发送的请求时,可以通过直接读取用户终端中储存模块的方式,获取用户的属性。发送该信息展示请求时用户所处的页面、以及历史上用户点击各信息时各信息的展示形式,则可以存储于服务器的相应的模块中。
可选地,本步骤中的训练后的第一模型是通过步骤S100至S108得到的。
S504:针对目标待展示信息的每种展示形式,根据所述当前用户特征与该展示形式的展示形式特征的相似度,在该目标待展示信息的各展示形式中,确定目标展示形式;其中,所述目标待展示信息的每种展示形式的展示形式特征,是通过将该展示形式输入训练后的第二模型得到的。
在确定出目标待展示信息之后,直接在存储设备中查找该目标待展示信息的各展示形式的展示形式特征,以确定该目标待展示信息的每种展示形式的展示形式特征与步骤S502中确定出的当前用户特征的相似度。
可见,第二模型并不会直接参与在线的确定信息展示请求的展示形式的过程。
可选地,本步骤中的训练后的第二模型是通过步骤S110和S112得到的。
S506:根据确定出的目标展示形式,展示所述目标待展示信息。
基于同样的思路,本说明书实施例还提供了对应于图1所示过程的第一种信息展示装置,该信息展示装置如图4所示。
图4为本说明书实施例提供的第一种信息展示装置的结构示意图,该信息展示装置包括:
用户样本输入确定模块400,用于针对用户历史上点击的各样本信息,确定用户点击该样本信息时该样本信息的展示形式,以及该用户的属性;
样本用户特征确定模块402,用于将确定出的所述用户的属性、所述用户点击该样本信息时所处的页面以及所述用户点击各样本信息时各样本信息的展示形式,输入待训练的第一模型,得到样本用户特征4022;
样本待展示信息确定模块404,用于确定历史上向所述用户展示该样本信息时,展示给所述用户的所有信息,作为样本待展示信息;
展示形式特征确定模块406,用于针对每个所述样本待展示信息,将该样本待展示信息的每个展示形式输入待训练的第二模型,得到针对该展示形式的展示形式特征;
模型训练模块408,用于根据确定出的样本用户特征4022和该样本待展示信息对应的各展示形式特征,以样本用户特征4022与该样本待展示信息被点击时的展示形式的展示形式特征的相似度最大化,且,样本用户特征4022与该样本待展示信息未被点击时的展示形式的展示形式特征的相似度最小化为训练目标,训练第一模型和第二模型;
当前用户特征确定模块410,用于当接收到信息展示请求时,确定所述信息展示请求对应的目标待展示信息,并且采用训练后的第一模型确定发送所述信息展示请求的当前用户的用户特征,作为当前用户特征;
展示形式确定模块412,用于针对目标待展示信息的每种展示形式,根据所述当前用户特征与该展示形式的展示形式特征的相似度,在该目标待展示信息的各展示形式中,确定目标展示形式4122,并根据确定出的目标展示形式4122,展示所述目标待展示信息,其中,所述目标待展示信息的每种展示形式的展示形式特征是通过训练后的第二模型确定的。
其中,用户样本输入确定模块400与样本用户特征确定模块402电连接,样本待展示信息确定模块404与展示形式特征确定模块406电连接,模型训练模块408分别地与样本用户特征确定模块402、展示形式特征确定模块406、当前用户特征确定模块410和展示形式确定模块412电连接。
可选地,样本用户特征确定模块402包括:电连接的样本展示全局特征4020确定子模块和样本用户特征4022确定子模块。
样本展示全局特征4020确定子模块,用于根据确定出的所述用户点击各样本信息时各样本信息的展示形式,确定样本展示全局特征4020。
样本用户特征4022确定子模块,用于将点击该样本信息时所述用户所处的页面、所述用户的属性以及所述样本展示全局特征4020,输入待训练的第一模型,得到样本用户特征4022。
可选地,样本展示全局特征4020确定子模块包括:电连接的个体特征确定单元40200和池化单元40202。
个体特征确定单元40200,用于针对确定出的所述用户点击各样本信息时各样本信息的展示形式,确定该展示形式的个体特征。
池化单元40202,用于对所述用户点击各样本信息时各样本信息的展示形式的个体特征进行池化,得到样本展示全局特征4020,所述池化至少包括均值池化。
可选地,展示形式特征确定模块406包括:图片特征确定子模块4060、文字特征确定子模块4062、属性特征确定子模块4064和拼接子模块4066。拼接子模块4066分别地与图片特征确定子模块4060、文字特征确定子模块4062、属性特征确定子模块4064电连接。
图片特征确定子模块4060,用于确定出该样本待展示信息的每个展示形式的图片特征。
文字特征确定子模块4062,用于确定出该样本待展示信息的每个展示形式的文字特征。
属性特征确定子模块4064,用于确定出该样本待展示信息的每个展示形式的属性特征。
拼接子模块4066,用于对该样本待展示信息的图片特征、文字特征和属性特征进行拼接,并将拼接后的结果输入待训练的第二模型。
可选地,模型训练模块408包括:余弦距离确定子模块4080、正样本模型训练子模块4082和负样本模型训练子模块4084。余弦距离确定子模块4080分别地与正样本模型训练子模块4082、负样本模型训练子模块4084电连接。
余弦距离确定子模块4080,用于针对该样本待展示信息对应的每个展示形式的展示形式特征,确定该展示形式特征与所述样本用户特征4022的余弦距离。
正样本模型训练子模块4082,用于以样本用户特征4022与该样本待展示信息被点击时的展示形式的展示形式特征的余弦距离最大化为训练目标,训练第一模型和第二模型。
负样本模型训练子模块4084,用于以样本用户特征4022与该样本待展示信息未被点击时的展示形式的展示形式特征的余弦距离最小化为训练目标,训练第一模型和第二模型。
可选地,信息展示装置还包括展示形式特征保存模块414。展示形式特征保存模块414与模型训练模块408电连接。展示形式特征保存模块414用于采用训练后的第二模型,针对每个预存的待展示信息,确定该预存的待展示信息对应的各展示形式特征并保存。
可选地,展示形式确定模块412包括:电连接的查找子模块4120和目标展示形式4122确定子模块。
查找子模块4120,用于针对目标待展示信息的每种展示形式,在保存的各展示形式特征中,查找该展示形式的展示形式特征。
目标展示形式4122确定子模块,用于根据所述当前用户特征与目标待展示信息的每种展示形式的展示形式特征的相似度,在该目标待展示信息的各展示形式中,确定目标展示形式4122。
进一步地,基于同样的思路,本说明书实施例还提供了对应于图5所示过程的第二种信息展示装置,该信息展示装置如图6所示。
图6为本说明书实施例提供的第二种信息展示装置的结构示意图,该信息展示装置包括:
接收模块600,用于接收信息展示请求;
当前用户特征确定模块602,用于确定所述信息展示请求对应的目标待展示信息;并将发送该信息展示请求的用户的属性、发送该信息展示请求时用户所处的页面、历史上用户点击各信息时各信息的展示形式,输入训练后的第一模型,得到当前用户特征;
目标展示形式确定模块604,用于针对目标待展示信息的每种展示形式,根据所述当前用户特征与该展示形式的展示形式特征的相似度,在该目标待展示信息的各展示形式中,确定目标展示形式;其中,所述目标待展示信息的每种展示形式的展示形式特征,是通过将该展示形式输入训练后的第二模型得到的;
展示模块606,用于根据确定出的目标展示形式,展示所述目标待展示信息。
本说明书实施例还提供了第一种计算机可读存储介质,该存储介质存储有计算机程序,计算机程序可用于执行上述图1提供的信息展示的过程。
进一步地,本说明书实施例还提供了第二种计算机可读存储介质,该存储介质存储有计算机程序,计算机程序可用于执行上述图5提供的信息展示的过程。
本说明书实施例还提出了图7所示的第一种电子设备的示意结构图。如图7,在硬件层面,该电子设备包括处理器、内部总线、网络接口、内存以及非易失性存储器,当然还可能包括其他业务所需要的硬件。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,以实现上述图1所述的信息展示的过程。当然,除了软件实现方式之外,本说明书并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
进一步地,本说明书实施例还提出了图8所示的第二种电子设备的示意结构图。如图8,在硬件层面,该电子设备包括处理器、内部总线、网络接口、内存以及非易失性存储器,当然还可能包括其他业务所需要的硬件。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,以实现上述图5所述的信息展示的过程。当然,除了软件实现方式之外,本说明书并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本说明书的实施例可提供为方法、系统或计算机程序产品。因此,本说明书可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本说明书的实施例而已,并不用于限制本说明书。对于本领域技术人员来说,本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书的权利要求范围之内。
Claims (13)
1.一种信息展示方法,其特征在于,所述方法包括:
针对用户历史上点击的各样本信息,确定用户点击该样本信息时该样本信息的展示形式,以及该用户的属性;
将确定出的所述用户的属性、所述用户点击该样本信息时所处的页面以及所述用户点击各样本信息时各样本信息的展示形式,输入待训练的第一模型,得到样本用户特征;
确定历史上向所述用户展示该样本信息时,展示给所述用户的所有信息,作为样本待展示信息;
针对每个所述样本待展示信息,将该样本待展示信息的每个展示形式输入待训练的第二模型,得到针对该展示形式的展示形式特征;
根据确定出的样本用户特征和该样本待展示信息对应的各展示形式特征,确定训练目标,根据所述训练目标训练第一模型和第二模型;所述训练目标为:样本用户特征与该样本待展示信息被点击时的展示形式的展示形式特征的相似度最大化,且,样本用户特征与该样本待展示信息未被点击时的展示形式的展示形式特征的相似度最小化;
当接收到信息展示请求时,确定所述信息展示请求对应的目标待展示信息,并且采用训练后的第一模型确定发送所述信息展示请求的当前用户的用户特征,作为当前用户特征;
针对目标待展示信息的每种展示形式,根据所述当前用户特征与所述目标待展示信息的该展示形式的展示形式特征的相似度,在该目标待展示信息的各展示形式中,确定目标展示形式,并根据确定出的目标展示形式,展示所述目标待展示信息,其中,所述目标待展示信息的每种展示形式的展示形式特征是通过训练后的第二模型确定的。
2.如权利要求1所述的方法,其特征在于,所述展示形式包括:图片和/或文字中的至少一种。
3.如权利要求1所述的方法,其特征在于,将确定出的所述用户的属性、所述用户点击该样本信息时所处的页面以及所述用户点击各样本信息时各样本信息的展示形式,输入待训练的第一模型,得到样本用户特征,具体包括:
根据确定出的所述用户点击各样本信息时各样本信息的展示形式,确定样本展示全局特征;
将点击该样本信息时所述用户所处的页面、所述用户的属性以及所述样本展示全局特征,输入待训练的第一模型,得到样本用户特征。
4.如权利要求3所述的方法,其特征在于,根据确定出的所述用户点击各样本信息时各样本信息的展示形式,确定样本展示全局特征,具体包括:
针对确定出的所述用户点击各样本信息时各样本信息的展示形式,确定该展示形式的个体特征;
对所述用户点击各样本信息时各样本信息的展示形式的个体特征进行池化,得到样本展示全局特征,所述池化至少包括均值池化。
5.如权利要求1所述的方法,其特征在于,将该样本待展示信息的每个展示形式输入待训练的第二模型,具体包括:
确定出该样本待展示信息的每个展示形式的图片特征、文字特征和属性特征;
将该展示形式的图片特征、文字特征和属性特征输入待训练的第二模型。
6.如权利要求1所述的方法,其特征在于,所述样本用户特征和样本待展示信息对应的各展示形式特征均为特征向量;
根据确定出的样本用户特征和该样本待展示信息对应的各展示形式特征,确定训练目标,具体包括:
针对该样本待展示信息对应的每个展示形式的展示形式特征,确定该展示形式特征与所述样本用户特征的余弦距离;
将训练目标确定为:样本用户特征与该样本待展示信息被点击时的展示形式的展示形式特征的余弦距离最大化,且,以样本用户特征与该样本待展示信息未被点击时的展示形式的展示形式特征的余弦距离最小化。
7.如权利要求1所述的方法,其特征在于,训练第一模型和第二模型之后,所述方法还包括:
采用训练后的第二模型,针对每个预存的待展示信息,确定该预存的待展示信息对应的各展示形式特征并保存。
8.如权利要求6所述的方法,其特征在于,针对目标待展示信息的每种展示形式,根据所述当前用户特征与所述目标待展示信息的该展示形式的展示形式特征的相似度,在该目标待展示信息的各展示形式中,确定目标展示形式,具体包括:
针对目标待展示信息的每种展示形式,在保存的各展示形式特征中,查找所述目标待展示信息的该展示形式的展示形式特征;
根据所述当前用户特征与目标待展示信息的每种展示形式的展示形式特征的相似度,在该目标待展示信息的各展示形式中,确定目标展示形式。
9.一种信息展示方法,其特征在于,所述方法包括:
接收信息展示请求;
确定所述信息展示请求对应的目标待展示信息;并将发送该信息展示请求的用户的属性、发送该信息展示请求时用户所处的页面、历史上用户点击各信息时各信息的展示形式,输入训练后的第一模型,得到当前用户特征;
针对目标待展示信息的每种展示形式,根据所述当前用户特征与该展示形式的展示形式特征的相似度,在该目标待展示信息的各展示形式中,确定目标展示形式;其中,所述目标待展示信息的每种展示形式的展示形式特征,是通过将该展示形式输入训练后的第二模型得到的;
根据确定出的目标展示形式,展示所述目标待展示信息;
其中,所述第一模型和第二模型是预先根据训练目标训练得到的,所述训练目标为:第一模型输出的样本用户特征与第二模型输出的样本待展示信息被点击时的展示形式对应的各展示形式特征的相似度最大化,且,第一模型输出的样本用户特征与第二模型输出的样本待展示信息未被点击时的展示形式的展示形式特征的相似度最小化。
10.一种信息展示装置,其特征在于,包括:
用户样本输入确定模块,用于针对用户历史上点击的各样本信息,确定用户点击该样本信息时该样本信息的展示形式,以及该用户的属性;
样本用户特征确定模块,用于将确定出的所述用户的属性、所述用户点击该样本信息时所处的页面以及所述用户点击各样本信息时各样本信息的展示形式,输入待训练的第一模型,得到样本用户特征;
样本待展示信息确定模块,用于确定历史上向所述用户展示该样本信息时,展示给所述用户的所有信息,作为样本待展示信息;
展示形式特征确定模块,用于针对每个所述样本待展示信息,将该样本待展示信息的每个展示形式输入待训练的第二模型,得到针对该展示形式的展示形式特征;
模型训练模块,用于根据确定出的样本用户特征和该样本待展示信息对应的各展示形式特征,确定训练目标,根据所述训练目标训练第一模型和第二模型;所述训练目标为:样本用户特征与该样本待展示信息被点击时的展示形式的展示形式特征的相似度最大化,且,样本用户特征与该样本待展示信息未被点击时的展示形式的展示形式特征的相似度最小化;
当前用户特征确定模块,用于当接收到信息展示请求时,确定所述信息展示请求对应的目标待展示信息,并且采用训练后的第一模型确定发送所述信息展示请求的当前用户的用户特征,作为当前用户特征;
展示形式确定模块,用于针对目标待展示信息的每种展示形式,根据所述当前用户特征与所述目标待展示信息的该展示形式的展示形式特征的相似度,在该目标待展示信息的各展示形式中,确定目标展示形式,并根据确定出的目标展示形式,展示所述目标待展示信息,其中,所述目标待展示信息的每种展示形式的展示形式特征是通过训练后的第二模型确定的。
11.一种信息展示装置,其特征在于,包括:
接收模块,用于接收信息展示请求;
当前用户特征确定模块,用于确定所述信息展示请求对应的目标待展示信息;并将发送该信息展示请求的用户的属性、发送该信息展示请求时用户所处的页面、历史上用户点击各信息时各信息的展示形式,输入训练后的第一模型,得到当前用户特征;
目标展示形式确定模块,用于针对目标待展示信息的每种展示形式,根据所述当前用户特征与该展示形式的展示形式特征的相似度,在该目标待展示信息的各展示形式中,确定目标展示形式;其中,所述目标待展示信息的每种展示形式的展示形式特征,是通过将该展示形式输入训练后的第二模型得到的;
展示模块,用于根据确定出的目标展示形式,展示所述目标待展示信息;
其中,所述第一模型和第二模型是预先根据训练目标训练得到的,所述训练目标为:第一模型输出的样本用户特征与第二模型输出的样本待展示信息被点击时的展示形式对应的各展示形式特征的相似度最大化,且,第一模型输出的样本用户特征与第二模型输出的样本待展示信息未被点击时的展示形式的展示形式特征的相似度最小化。
12.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述权利要求1-8任一所述的方法或权利要求9所述的方法。
13.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现上述权利要求1-8任一所述的方法或权利要求9所述的方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911230136.0A CN111144974B (zh) | 2019-12-04 | 2019-12-04 | 一种信息展示方法及装置 |
PCT/CN2020/133075 WO2021109981A1 (zh) | 2019-12-04 | 2020-12-01 | 信息展示方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911230136.0A CN111144974B (zh) | 2019-12-04 | 2019-12-04 | 一种信息展示方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111144974A CN111144974A (zh) | 2020-05-12 |
CN111144974B true CN111144974B (zh) | 2022-03-08 |
Family
ID=70517648
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911230136.0A Active CN111144974B (zh) | 2019-12-04 | 2019-12-04 | 一种信息展示方法及装置 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN111144974B (zh) |
WO (1) | WO2021109981A1 (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111144974B (zh) * | 2019-12-04 | 2022-03-08 | 北京三快在线科技有限公司 | 一种信息展示方法及装置 |
CN112861963A (zh) * | 2021-02-04 | 2021-05-28 | 北京三快在线科技有限公司 | 训练实体特征提取模型的方法、装置和存储介质 |
CN113713378B (zh) * | 2021-09-02 | 2024-07-05 | 北京百度网讯科技有限公司 | 内容生成方法和装置 |
CN113741897B (zh) * | 2021-09-06 | 2024-05-28 | 抖音视界有限公司 | 一种问题列表生成方法、装置、设备以及存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105205071A (zh) * | 2014-06-24 | 2015-12-30 | 阿里巴巴集团控股有限公司 | 一种数据表展示的方法和系统 |
CN106027614A (zh) * | 2016-05-09 | 2016-10-12 | 百度在线网络技术(北京)有限公司 | 信息推送的方法、装置和系统 |
CN109460513A (zh) * | 2018-10-31 | 2019-03-12 | 北京字节跳动网络技术有限公司 | 用于生成点击率预测模型的方法和装置 |
CN109949096A (zh) * | 2019-03-21 | 2019-06-28 | 深圳乐信软件技术有限公司 | 一种优惠券展示方法、装置、设备及存储介质 |
CN109981787A (zh) * | 2019-04-03 | 2019-07-05 | 北京字节跳动网络技术有限公司 | 用于展示信息的方法和装置 |
WO2019174395A1 (zh) * | 2018-03-13 | 2019-09-19 | 阿里巴巴集团控股有限公司 | 一种信息推荐的方法、装置及设备 |
CN110458646A (zh) * | 2019-07-05 | 2019-11-15 | 深圳壹账通智能科技有限公司 | 页面展示方法、装置、计算机设备及存储介质 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104281622B (zh) * | 2013-07-11 | 2017-12-05 | 华为技术有限公司 | 一种社交媒体中的信息推荐方法和装置 |
CN106372249B (zh) * | 2016-09-23 | 2018-04-13 | 北京三快在线科技有限公司 | 一种点击率预估方法、装置及电子设备 |
CN108124184A (zh) * | 2016-11-28 | 2018-06-05 | 广州华多网络科技有限公司 | 一种直播互动的方法及装置 |
CN108334536B (zh) * | 2017-11-30 | 2023-10-24 | 中国电子科技集团公司电子科学研究院 | 一种信息推荐方法、设备和存储介质 |
CN110110210B (zh) * | 2018-01-22 | 2024-09-13 | 腾讯科技(北京)有限公司 | 推送展示信息的方法和装置 |
CN110471721B (zh) * | 2018-05-10 | 2024-06-18 | 北京京东尚科信息技术有限公司 | 页面展示方法及系统、电子设备和存储介质 |
CN109324862B (zh) * | 2018-10-09 | 2021-04-27 | 创新先进技术有限公司 | App展示方法及装置 |
CN110046928A (zh) * | 2019-03-06 | 2019-07-23 | 北京三快在线科技有限公司 | 确定标签的方法、装置、电子设备及可读存储介质 |
CN110111186A (zh) * | 2019-05-10 | 2019-08-09 | 拉扎斯网络科技(上海)有限公司 | 信息处理方法、装置、电子设备及计算机可读存储介质 |
CN111144974B (zh) * | 2019-12-04 | 2022-03-08 | 北京三快在线科技有限公司 | 一种信息展示方法及装置 |
-
2019
- 2019-12-04 CN CN201911230136.0A patent/CN111144974B/zh active Active
-
2020
- 2020-12-01 WO PCT/CN2020/133075 patent/WO2021109981A1/zh active Application Filing
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105205071A (zh) * | 2014-06-24 | 2015-12-30 | 阿里巴巴集团控股有限公司 | 一种数据表展示的方法和系统 |
CN106027614A (zh) * | 2016-05-09 | 2016-10-12 | 百度在线网络技术(北京)有限公司 | 信息推送的方法、装置和系统 |
WO2019174395A1 (zh) * | 2018-03-13 | 2019-09-19 | 阿里巴巴集团控股有限公司 | 一种信息推荐的方法、装置及设备 |
CN109460513A (zh) * | 2018-10-31 | 2019-03-12 | 北京字节跳动网络技术有限公司 | 用于生成点击率预测模型的方法和装置 |
CN109949096A (zh) * | 2019-03-21 | 2019-06-28 | 深圳乐信软件技术有限公司 | 一种优惠券展示方法、装置、设备及存储介质 |
CN109981787A (zh) * | 2019-04-03 | 2019-07-05 | 北京字节跳动网络技术有限公司 | 用于展示信息的方法和装置 |
CN110458646A (zh) * | 2019-07-05 | 2019-11-15 | 深圳壹账通智能科技有限公司 | 页面展示方法、装置、计算机设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111144974A (zh) | 2020-05-12 |
WO2021109981A1 (zh) | 2021-06-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111144974B (zh) | 一种信息展示方法及装置 | |
US10261669B2 (en) | Publishing electronic documents utilizing navigation information | |
CN109300059B (zh) | 菜品推荐方法及装置 | |
CN113688313A (zh) | 一种预测模型的训练方法、信息推送的方法及装置 | |
US9619519B1 (en) | Determining user interest from non-explicit cues | |
CN112966186A (zh) | 一种模型训练和信息推荐的方法及装置 | |
WO2023020160A1 (zh) | 一种推荐方法、训练方法、装置、设备及推荐系统 | |
CN111191132B (zh) | 一种信息推荐方法、装置及电子设备 | |
CN113343085B (zh) | 一种信息推荐方法、装置、存储介质及电子设备 | |
CN113641894A (zh) | 一种信息推荐的方法及装置 | |
CN114331602A (zh) | 一种基于迁移学习的模型训练方法、信息推荐方法及装置 | |
CN113205189B (zh) | 训练预测模型的方法、预测方法及装置 | |
CN118134603A (zh) | 商品推荐方法及装置 | |
CN112966577B (zh) | 一种模型训练以及信息提供的方法及装置 | |
CN113010809A (zh) | 一种信息推荐的方法及装置 | |
CN111046304A (zh) | 数据搜索方法及装置 | |
CN113554448A (zh) | 一种用户流失预测方法、装置及电子设备 | |
CN116956204A (zh) | 多任务模型的网络结构确定方法、数据预测方法及装置 | |
US11768867B2 (en) | Systems and methods for generating interactable elements in text strings relating to media assets | |
CN114119139A (zh) | 一种信息推荐方法、装置、存储介质及电子设备 | |
CN114331511A (zh) | 一种信息推荐的方法及装置 | |
CN113343132A (zh) | 一种模型训练的方法、信息展示的方法及装置 | |
CN114997907A (zh) | 一种预测模型的训练方法、信息推荐的方法及装置 | |
CN114116813A (zh) | 一种信息推荐的方法及推荐装置 | |
CN113344590A (zh) | 一种模型训练以及投诉率预估的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |