CN113435523A - 预测内容点击率的方法、装置、电子设备以及存储介质 - Google Patents
预测内容点击率的方法、装置、电子设备以及存储介质 Download PDFInfo
- Publication number
- CN113435523A CN113435523A CN202110740520.6A CN202110740520A CN113435523A CN 113435523 A CN113435523 A CN 113435523A CN 202110740520 A CN202110740520 A CN 202110740520A CN 113435523 A CN113435523 A CN 113435523A
- Authority
- CN
- China
- Prior art keywords
- feature
- information
- user
- discretization
- target content
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0242—Determining effectiveness of advertisements
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Evolutionary Computation (AREA)
- Databases & Information Systems (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Business, Economics & Management (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Mathematical Analysis (AREA)
- Molecular Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Biophysics (AREA)
- Finance (AREA)
- Biomedical Technology (AREA)
- Strategic Management (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Computational Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Game Theory and Decision Science (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Probability & Statistics with Applications (AREA)
- Economics (AREA)
Abstract
本公开提供了预测内容点击率的方法、装置、电子设备以及存储介质,涉及人工智能领域,尤其涉及智能搜索领域。具体实现方案为:将目标内容和用于确定目标内容的用户信息输入表征模型,得到用于表征用户信息的第一局部特征聚合向量,和用于表征目标内容的第二局部特征聚合向量;根据第一局部特征聚合向量和第二局部特征聚合向量,分别确定用于表征用户信息的第一离散化特征和用于表征目标内容的第二离散化特征;以及将第一离散化特征和第二离散化特征输入点击率预测模型,得到与用户信息相对应的用户针对目标内容的点击率预测值。
Description
技术领域
本公开涉及人工智能技术领域,尤其涉及智能搜索领域。具体地,本公开涉及一种预测内容点击率的方法、装置、电子设备以及存储介质。
背景技术
随着计算机技术的不断进步,人类信息交互形式不断进化。从声音、文字、图片到视频,形式越来越生动、高效,但也越来越庞大、复杂。其中,图文、视频等多模态内容近来已经成为普遍的交互形式。在CTR(Click-Through-Rate,点击通过率)模型中引入深入的多模态表征,在搜索、推荐、广告等领域都有着广泛应用,也一直是业界研究的热点。
发明内容
本公开提供了一种预测内容点击率的方法、装置、电子设备以及存储介质。
根据本公开的一方面,提供了一种预测内容点击率的方法,包括:将目标内容和用于确定所述目标内容的用户信息输入表征模型,得到用于表征所述用户信息的第一局部特征聚合向量,和用于表征所述目标内容的第二局部特征聚合向量;根据所述第一局部特征聚合向量和所述第二局部特征聚合向量,分别确定用于表征所述用户信息的第一离散化特征和用于表征所述目标内容的第二离散化特征;以及将所述第一离散化特征和所述第二离散化特征输入点击率预测模型,得到与所述用户信息相对应的用户针对所述目标内容的点击率预测值。
根据本公开的另一方面,提供了一种预测内容点击率的装置,包括:表征模块,用于将目标内容和用于确定所述目标内容的用户信息输入表征模型,得到用于表征所述用户信息的第一局部特征聚合向量,和用于表征所述目标内容的第二局部特征聚合向量;第一确定模块,用于根据所述第一局部特征聚合向量和所述第二局部特征聚合向量,分别确定用于表征所述用户信息的第一离散化特征和用于表征所述目标内容的第二离散化特征;以及第一预测模块,用于将所述第一离散化特征和所述第二离散化特征输入点击率预测模型,得到与所述用户信息相对应的用户针对所述目标内容的点击率预测值。
根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上所述的方法。
根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行如上所述的方法。
根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现如上所述的方法。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1示意性示出了根据本公开实施例的可以应用预测内容点击率的方法及装置的示例性系统架构;
图2示意性示出了根据本公开实施例的预测内容点击率的方法的流程图;
图3示意性示出了根据本公开实施例的预测内容点击率的方法的模型架构图;
图4示意性示出了根据本公开实施例的预测内容点击率的装置的框图;以及
图5示出了可以用来实施本公开的实施例的示例电子设备的示意性框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
CTR中引入了深入的内容表征的方法。对于文本内容,可以进行分词。对于视觉内容,一种处理方式在于接入CNN(Convolutional Neural Network,卷积神经网络)等表征网络进行端到端训练,另一种处理方式在于引入视觉内容的深度学习特征,主要常用的是视觉分类特征,深度学习模型会对图片打一个分类标签。
发明人在实现本公开构思的过程中发现,在CTR中接入CNN的方案,由于视觉内容大,CNN模型结构复杂,CTR训练样本极多,很难连同端到端训练,经常需要固定CNN的多数层,或者只采用少数基层CNN,来保障性能落地,但这样对内容表征的效果会打折扣。
发明人在实现本公开构思的过程中还发现,在CTR中引入视觉标签特征,如视觉内容分类特征,表征较简单,粒度较粗。很多视觉内容有很多实体,信息丰富,只采用视觉内容分类标签做特征会损失很多视觉信息。
应注意,在本公开的技术方案中,所涉及的用户个人信息的获取,存储和应用等,均符合相关法律法规的规定,采取了必要保密措施,且不违背公序良俗。
图1示意性示出了根据本公开实施例的可以应用预测内容点击率的方法及装置的示例性系统架构。
需要注意的是,图1所示仅为可以应用本公开实施例的系统架构的示例,以帮助本领域技术人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。例如,在另一实施例中,可以应用预测内容点击率的方法及装置的示例性系统架构可以包括终端设备,但终端设备可以无需与服务器进行交互,即可实现本公开实施例提供的预测内容点击率的方法及装置。
如图1所示,根据该实施例的系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线和/或无线通信链路等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如知识阅读类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端和/或社交平台软件等(仅为示例)。
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对用户利用终端设备101、102、103所浏览的内容提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的用户请求等数据进行分析等处理,并将处理结果(例如根据用户请求获取或生成的网页、信息、或数据等)反馈给终端设备。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务(″Virtual PrivateServer″,或简称″VPS″)中,存在的管理难度大,业务扩展性弱的缺陷。服务器也可以为分布式系统的服务器,或者是结合了区块链的服务器。
需要说明的是,本公开实施例所提供的预测内容点击率的方法一般可以由终端设备101、102、或103执行。相应地,本公开实施例所提供的预测内容点击率的装置也可以设置于终端设备101、102、或103中。
或者,本公开实施例所提供的预测内容点击率的方法一般也可以由服务器105执行。相应地,本公开实施例所提供的预测内容点击率的装置一般可以设置于服务器105中。本公开实施例所提供的预测内容点击率的方法也可以由不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群执行。相应地,本公开实施例所提供的预测内容点击率的装置也可以设置于不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群中。
例如,在需要预测用户对内容的点击率时,终端设备101、102、103可以获取目标内容和用于确定该目标内容的用户信息,然后将获取的目标内容和用户信息发送给包含表征模型和点击率预测模型等的服务器105,由服务器105中的表征模型对目标内容和用户信息进行分析,得到用于表征用户信息的第一局部特征聚合向量,和用于表征目标内容的第二局部特征聚合向量;根据第一局部特征聚合向量和第二局部特征聚合向量,分别确定用于表征用户信息的第一离散化特征和用于表征目标内容的第二离散化特征;以及将第一离散化特征和第二离散化特征输入点击率预测模型,得到与用户信息相对应的用户针对目标内容的点击率预测值。或者由能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群对目标内容和用户信息进行分析,并最终实现预测与用户信息相对应的用户针对目标内容的点击率。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
图2示意性示出了根据本公开实施例的预测内容点击率的方法的流程图。
如图2所示,该方法包括操作S210~S230。
在操作S210,将目标内容和用于确定目标内容的用户信息输入表征模型,得到用于表征用户信息的第一局部特征聚合向量,和用于表征目标内容的第二局部特征聚合向量。
在操作S220,根据第一局部特征聚合向量和第二局部特征聚合向量,分别确定用于表征用户信息的第一离散化特征和用于表征目标内容的第二离散化特征。
在操作S230,将第一离散化特征和第二离散化特征输入点击率预测模型,得到与用户信息相对应的用户针对目标内容的点击率预测值。
根据本公开的实施例,目标内容可以包括文本、图片、音频、视频等各种多媒体信息资源其中至少之一。用于确定目标内容的用户信息可以包括用户本身的属性信息、用户的输入、点击、查询等产生的关联信息等其中至少之一。
根据本公开的实施例,表征模型用于对用户信息和目标内容的特征进行更精细的表征。
例如,用户信息为用户账号,则利用表征模型对用户信息进行处理后得到的第一局部特征聚合向量除了可以表征用户账号信息之外,例如还可以表征该账号下的用户的其他各类属性信息,如地域信息等。例如,用户信息为用户通过搜索框查询“鲜花”这一操作信息,则第一局部特征聚合向量除了可以表征鲜花这一信息之外,例如还可以表征搜索“鲜花”的账号的属性信息、搜索“鲜花”的时间信息等其中至少之一。例如,目标内容为与打篮球相关的视频,则利用表征模型对目标内容进行处理后得到的第二局部特征聚合向量除了可以表征篮球这一信息之外,还可以表征打篮球的场景,如NBA、校园等,以及球场中的参赛人员信息、背景介绍信息、参赛国家信息、比分信息等其中至少之一。
根据本公开的实施例,第一离散化特征和第二离散化特征由第一局部特征聚合向量和第二局部特征聚合向量转换得到,可用于进一步表征用户信息和目标内容的语义特征。
根据本公开的实施例,可以根据离散化特征(如离散化id)训练得到点击率预测模型,如CTR模型。因此,点击率预测模型可以通过对包含有较为丰富的语义信息的第一离散化特征和第二离散化特征进行处理,得到与用户信息相对应的用户针对目标内容的点击率。
通过本公开的上述实施例,由于引入表征模型挖掘内容的局部特征聚合向量,能够为点击率预估模型提供更精细化的内容信息,丰富了其表达含义,可有效提高点击率预估模型的预估准确率。
下面结合具体实施例,详细描述根据本公开实施例的预测内容点击率的方法。
根据本公开的实施例,上述将目标内容和用于确定目标内容的用户信息输入表征模型,得到用于表征用户信息的第一局部特征聚合向量,和用于表征目标内容的第二局部特征聚合向量包括:对目标内容和用户信息分别进行编码,得到第一编码向量和第二编码向量。对第一编码向量和第二编码向量分别进行局部特征聚合处理,得到第一局部特征聚合向量和第二局部特征聚合向量。
根据本公开的实施例,表征模型例如包括编码模块和VLAD(局部特征聚合描述符)模块。
根据本公开的实施例,编码模块可以包括多种不同的编码单元(encoder)。例如,编码单元可以为适用于对文本信息进行编码的编码单元,可以用于对文本内容和用户信息进行编码,得到分别用于表征文本内容或用户信息的第一编码向量和第二编码向量。例如,编码单元还可以为适用于对图片信息进行编码的编码单元,可以对图片内容进行编码,得到用于表征图片内容的第一编码向量。例如,编码单元还可以为适用于对声音信息进行编码的编码单元,可以对音频内容进行编码,得到用于表征音频内容的第一编码向量。例如,通过结合适用于对图片信息和声音信息进行编码的编码单元,还可以对视频内容进行编码,得到用于表征视频内容的第一编码向量。
根据本公开的实施例,VLAD模块可以对编码向量进行局部特征聚合处理,得到局部特征聚合向量。例如,VLAD模块可以对第一编码向量进行局部特征聚合处理,得到第一局部特征聚合向量。VLAD模块也可以对第二编码向量进行局部特征聚合处理,得到第二局部特征聚合向量。
根据本公开的实施例,表征模型可以通过如下方式训练得到:首先,基于业务场景搜集训练数据集。例如,对于搜索视频广告,可以构建用户搜索query(问题)和点击的视频组成的数据对作为正样本,构建随机用户和随机视频,或是用户和该用户未点击的视频组成的数据对作为负样本,以此组成训练数据集。然后,对各模态使用相应encoder进行编码,并对编码信息使用VLAD获取表征向量,即上述局部特征聚合向量。之后,基于前述正样本、负样本,使用对比学习技术对表征模型进行训练。训练好的表征模型,其VLAD输出长度为cluster_size*embedding_size,其中,cluster_size为vlad使用的中心个数,embedding_size为中心的编码长度。
通过本公开的上述实施例,构建了基于VLAD对齐的多模态对比学习模型,可以依托对比学习,为多种模态的内容学习相同的语义表征空间,并对个模态的表征向量进行量化,构建CTR多值序列特征,从而实现更准确CTR建模方案。
根据本公开的实施例,上述根据第一局部特征聚合向量和第二局部特征聚合向量,分别确定用于表征用户信息的第一离散化特征和用于表征目标内容的第二离散化特征包括:利用聚类操作,将第一局部特征聚合向量映射为第一离散化特征,以及将第二局部特征聚合向量映射为第二离散化特征。
根据本公开的实施例,将第一局部特征聚合向量映射为第一离散化特征所采用的聚类操作,与将第二局部特征聚合向量映射为第二离散化特征所采用的聚类操作可以相同也可以不同。具体的聚类操作可以包括K-Means(K均值聚类)、DBSCAN(基于密度的聚类方法)等。
根据本公开的实施例,结合聚类操作,可以对VLAD输出结果的每个中心获取离散id。具体地,例如包括:统计VLAD结果各中心的embedding(表征向量,即上述第一局部特征聚合向量或第二局部特征聚合向量),建立聚类模型。根据聚类模型,将VLAD结果映射成cluster_size个聚类id,即第一离散化特征或第二离散化特征。至此,每个模态均可获取cluster_size个离散id,且这些id在相同的语义空间。
根据本公开的实施例,通过聚类操作,可以得到基于离散VLAD的特征。因为每个模态的内容都可以获取多个离散id,所以该特征可以直接作为CTR的多值离散特征,进而可以将离散化id特征接入CTR模型。
通过本公开的上述实施例,提供了一种将VLAD输出结果进行离散化的方法,基于更精细的VLAD特征,为后续接入CTR模型提供了操作基础,从而可实现更准确CTR预测效果。
根据本公开的实施例,上述预测内容点击率的方法还可以包括:将第一离散化特征和第二离散化特征进行组合,得到交叉组合特征。将交叉组合特征输入点击率预测模型,得到与用户信息相对应的用户针对目标内容的点击率预测值。
根据本公开的实施例,将第一离散化特征和第二离散化特征进行组合可以包括:从第一离散化特征中确定一个或多个第一目标特征,将第一目标特征与第二离散化特征的中的每个特征进行组合,构建得到交叉组合特征。从第二离散化特征中确定一个或多个第二目标特征,将第二目标特征与第一离散化特征的中的每个特征进行组合,构建得到交叉组合特征。确定独立于第一离散化特征和第二离散化特征的第三目标特征,将第三目标特征与第一离散化特征与第二离散化特征中的每一个特征进行组合,构建得到交叉组合特征。
根据本公开的实施例,例如,第一离散化特征与第二离散化特征初始表现为Featur1-1、Featur1-2、...、Featur1-n、Featur2-1、Featur2-2、...、Featur1-n等,可以将用户id作为一个目标特征,例如表示为User1。则将用户id和第一离散化特征与第二离散化特征中的每一个特征进行组合,构建得到的交叉组合特征例如可以表现为Featur1-1_User1、Featur1-2_User1、...、Featur1-n_User1、Featur2-1_User1、Featur2-2_User1、...、Featur1-n_User1等,其中n为正整数。
通过本公开的上述实施例,将第一离散化特征和第二离散化特征组合得到交叉组合特征,能够从更多个维度实现内容表征。尤其是通过对用户id与离散化特征进行组合,能够进一步刻画用户对内容的偏好。进一步提高了内容表征的精细度,提升了模型预测的准确性。
根据本公开的实施例,上述预测内容点击率的方法还可以包括:对第一离散化特征和第二离散化特征取交集,得到目标离散化特征。将目标离散化特征输入点击率预测模型,得到与用户信息相对应的用户针对目标内容的点击率预测值。
根据本公开的实施例,对第一离散化特征和第二离散化特征取交集例如表现提取第一离散化特征和第二离散化特征中相同的特征,该相同的特征例如形成上述目标离散化特征。例如,第一离散化特征中包括用于表征用户属性为汉族的离散化特征,第二离散化特征中包括用于表征目标内容中包含汉族或属于汉族的离散化特征,则可以将“汉族”这一特征提取出来,作为目标离散化特征。
通过本公开的上述实施例,通过提取共同的特征,可有效刻画用户和内容的匹配程度,进一步可得到较强的语义特征。通过将该较强的语义特征输入CTR模型,可进一步增加输入特征的丰富度,提升CTR预测结果的准确性。
根据本公开的实施例,上述预测内容点击率的方法还可以包括:确定目标离散化特征的目标数量。将目标数量输入点击率预测模型。
根据本公开的实施例,为了表示用户query与内容的匹配度,可以增加用户query和内容的上述多值离散特征的交集id的个数作为输入特征。即,第一离散化特征和第二离散化特征中相同特征的数量也可以作为CTR模型的输入。该数量越多,可以代表用户与内容的匹配度越高。
通过本公开的上述实施例,将第一离散化特征和第二离散化特征中相同特征的数量作为一个特征输入CTR模型,可以进一步增加输入特征的丰富度,提升模型的准确性。
需要说明的是,上述将多值离散特征、取交集得到目标离散化特征、目标离散化特征的目标数量作为CTR模型的输入特征仅是示例性实施例,但不限于此,CTR模型的输入特征还可以包括本领域已知的其他组合、构建方法,在此不做限定。
根据本公开的实施例,第一局部特征聚合向量用于表征用户信息中的第一特征信息和第二特征信息。第二局部特征聚合向量用于表征目标内容中的第三特征信息和第四特征信息。第一特征信息和第三特征信息均为与正样本相关的特征信息,第二特征信息和第四特征信息均为与负样本相关的特征信息。正样本为用户点击目标内容形成的样本。负样本为用户未点击目标内容、随机目标内容和随机用户信息其中至少之一形成的样本。
根据本公开的实施例,在根据用户搜索信息、用户信息和用户点击信息确定正样本之后,可以将该正样本中的所有特征信息确定为与正样本相关的特征信息。则对于表征模型处理后的用户信息或目标内容,可以确定其中的哪些特征为与正样本相关的特征,除此之外的其他特征可以为与负样本相关的特征。并基于此确定CTR模型的预测结果。
需要说明的是,用于表征用户信息的特征和用于表征目标内容的特征两者需结合方能共同确定一个正样本,其中任意一者的特征均不可独立确定一个正样本。而负样本可以由单独的用于表征用户信息的特征或用于表征目标内容的特征独立确定。
根据本公开的实施例,例如,存在一个用户点击了一个目标内容,用于表征该用户的用户信息的第一局部特征聚合向量包括Vladuser_1、Vladuser_2、Vladuser_3等,用于表征该目标内容的第二局部特征聚合向量包括Vladcontent_1、Vladcontent_2、Vladcontent_3等,则可以确定该些第一局部特征聚合向量中任意至少之一与该些第二局部特征聚合向量中任意至少之一的组合可构成一个正样本。如Vladuser_1和Vladcontent_3可构成一个正样本。在后续需要进行预测时,如果用于调整待预测用户信息的局部特征聚合向量中包括了Vladuser_1,同时用于表征待预测内容的局部特征聚合向量中包括了Vladcontent_3,则可以确定Vladuser_1为用于表征用户信息的第一特征信息,Vladcontent_3为用于表征目标内容的第三特征信息。如果用于调整待预测用户信息的局部特征聚合向量中包括了Vladuser_1,但是用于表征待预测内容的局部特征聚合向量中未包括Vladcontent_1、Vladcontent_2、Vladcontent_3其中任意之一,而是包含了与Vladuser_1、Vladuser_2、Vladuser_3等均无关的Vladcontent_A等特征,且该情况下并不存在用户点击目标内容的行为,则可以确定Vladuser_1为用于表征用户信息的第二特征信息,Vladcontent_A为用于表征目标内容的第四特征信息。
通过本公开的上述实施例,提供了一种局部特征聚合向量的有效应用场景,为本公开预测内容点击率的方法在实际场景的应用提供了可靠的基础。
根据本公开的实施例,用户信息包括用户操作信息和用户属性信息其中至少之一。目标内容包括文本内容、图片内容和视频内容其中至少之一。
通过本公开的上述实施例,提供了一种用户信息和目标内容的有效应用场景,为本公开预测内容点击率的方法在实际场景的应用进一步提供了可靠的基础。
图3示意性示出了根据本公开实施例的预测内容点击率的方法的模型架构图。
如图3所示,用于实现上述预测内容点击率的方法的模型包括表征模型310、聚类模型320和CTR模型330。表征模型310中包括编码模块311、312和VLAD模块313。
根据本公开的实施例,表征模型310用于将原始网络资源信息转换为局部特征聚合向量。在需要进行内容点击率的预测时,预测对象一般包括用户信息和目标内容。由于用户信息和目标内容可能以不同的模态存在,如用户信息为文本类信息,目标内容为视频类信息,即目标内容包括图片类信息和音频类信息。对于获取到的用户信息和目标内容,可以分别输入至合适的编码模块311、312中进行编码,相应的得到第一编码向量和第二编码向量。然后将得到的该第一编码向量和第二编码向量输入VLAD模块313进一步处理,以相应的得到第一局部特征聚合向量和第二局部特征聚合向量。
根据本公开的实施例,聚类模型320用于将局部特征聚合向量转换为离散化特征。例如,上述得到的第一局部特征聚合向量和第二局部特征聚合向量可进一步输入聚类模型进行处理,并相应的得到第一离散化特征和第二离散化特征。
根据本公开的实施例,CTR模型330用于实现点击率的预测。例如,可上述得到的第一离散化特征和第二离散化特征输入CTR模型进行预测,预测结例如为用户对目标内容的点击率。
需要说明的是,在预测目标内容的点击率时,输入编码模块311、312中的信息可以不仅限于用户信息和目标内容的输入方式。例如还可以包括:将文本模态的图片标题和RGB三色素模态的图片分别输入编码模块311、312,并结合后续的VLAD模块313、聚类模型320和CTR模型330,也可预测得到该图片被点击的概率。
通过本公开的上述实施例,提供了一种基于离散VLAD特征的CTR建模方案,通过挖掘VLAD量化特征,能够得到基于离散VLAD的对内容理解更加深入的CTR模型,从而给CTR模型带来了更多视觉内容信息,丰富了其表达含义,提高了CTR的准确性。同时,上述模型结构可以作为搜索、推荐、广告等领域的核心功能组件,集成到各种涉及视觉内容的搜索、推荐、广告平台中,为平台提供高效准确的CTR预估能力,帮助平台在进行视觉相关业务时获取更好的效果。
图4示意性示出了根据本公开实施例的预测内容点击率的装置的框图。
如图4所示,预测内容点击率的装置400包括表征模块410、确定模块420和第一预测模块430。
表征模块410,用于将目标内容和用于确定目标内容的用户信息输入表征模型,得到用于表征用户信息的第一局部特征聚合向量,和用于表征目标内容的第二局部特征聚合向量。
第一确定模块420,用于根据第一局部特征聚合向量和第二局部特征聚合向量,分别确定用于表征用户信息的第一离散化特征和用于表征目标内容的第二离散化特征。
第一预测模块430,用于将第一离散化特征和第二离散化特征输入点击率预测模型,得到与用户信息相对应的用户针对目标内容的点击率预测值。
根据本公开的实施例,表征模块包括编码单元和处理单元。
编码单元,用于对目标内容和用户信息分别进行编码,得到第一编码向量和第二编码向量。
处理单元,用于对第一编码向量和第二编码向量分别进行局部特征聚合处理,得到第一局部特征聚合向量和第二局部特征聚合向量。
根据本公开的实施例,第一确定模块包括映射单元。
映射单元,用于利用聚类操作,将第一局部特征聚合向量映射为第一离散化特征,以及将第二局部特征聚合向量映射为第二离散化特征。
根据本公开的实施例,预测内容点击率的装置还包括组合模块和第二预测模块。
组合模块,用于将第一离散化特征和第二离散化特征进行组合,得到交叉组合特征。
第二预测模块,用于将交叉组合特征输入点击率预测模型,得到与用户信息相对应的用户针对目标内容的点击率预测值。
根据本公开的实施例,预测内容点击率的装置还包括取交集模块和第三预测模块。
取交集模块,用于对第一离散化特征和第二离散化特征取交集,得到目标离散化特征。
第三预测模块,用于将目标离散化特征输入点击率预估模型,得到与用户信息相对应的用户针对目标内容的点击率预测值。
根据本公开的实施例,预测内容点击率的装置还包括第二确定模块和输入模块。
第二确定模块,用于确定目标离散化特征的目标数量。
输入模块,用于将目标数量输入点击率预测模型。
根据本公开的实施例,第一局部特征聚合向量用于表征用户信息中的第一特征信息和第二特征信息。其中,第一特征信息为与正样本相关的特征信息,第二特征信息为与负样本相关的特征信息。第二局部特征聚合向量用于表征目标内容中的第三特征信息和第四特征信息。其中,第三特征信息为与正样本相关的特征信息,第四特征信息为与负样本相关的特征信息。正样本为用户点击目标内容形成的样本。负样本为用户未点击目标内容、随机目标内容和随机用户信息其中至少之一形成的样本。
根据本公开的实施例,用户信息包括用户操作信息和用户属性信息其中至少之一,目标内容包括文本内容、图片内容和视频内容其中至少之一。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
根据本公开的实施例,一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行如上所述的方法。
根据本公开的实施例,一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行如上所述的方法。
根据本公开的实施例,一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现如上所述的方法。
图5示出了可以用来实施本公开的实施例的示例电子设备500的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图5所示,设备500包括计算单元501,其可以根据存储在只读存储器(ROM)502中的计算机程序或者从存储单元508加载到随机访问存储器(RAM)503中的计算机程序,来执行各种适当的动作和处理。在RAM 503中,还可存储设备500操作所需的各种程序和数据。计算单元501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
设备500中的多个部件连接至I/O接口505,包括:输入单元506,例如键盘、鼠标等;输出单元507,例如各种类型的显示器、扬声器等;存储单元508,例如磁盘、光盘等;以及通信单元509,例如网卡、调制解调器、无线通信收发机等。通信单元509允许设备500通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元501可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元501的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元501执行上文所描述的各个方法和处理,例如预测内容点击率的方法。例如,在一些实施例中,预测内容点击率的方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元508。在一些实施例中,计算机程序的部分或者全部可以经由ROM 502和/或通信单元509而被载入和/或安装到设备500上。当计算机程序加载到RAM 503并由计算单元501执行时,可以执行上文描述的预测内容点击率的方法的一个或多个步骤。备选地,在其他实施例中,计算单元501可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行预测内容点击率的方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以是分布式系统的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。
Claims (19)
1.一种预测内容点击率的方法,包括:
将目标内容和用于确定所述目标内容的用户信息输入表征模型,得到用于表征所述用户信息的第一局部特征聚合向量,和用于表征所述目标内容的第二局部特征聚合向量;
根据所述第一局部特征聚合向量和所述第二局部特征聚合向量,分别确定用于表征所述用户信息的第一离散化特征和用于表征所述目标内容的第二离散化特征;以及
将所述第一离散化特征和所述第二离散化特征输入点击率预测模型,得到与所述用户信息相对应的用户针对所述目标内容的点击率预测值。
2.根据权利要求1所述的方法,其中,所述将目标内容和用于确定所述目标内容的用户信息输入表征模型,得到用于表征所述用户信息的第一局部特征聚合向量,和用于表征所述目标内容的第二局部特征聚合向量包括:
对所述目标内容和所述用户信息分别进行编码,得到第一编码向量和第二编码向量;以及
对所述第一编码向量和所述第二编码向量分别进行局部特征聚合处理,得到所述第一局部特征聚合向量和所述第二局部特征聚合向量。
3.根据权利要求1所述的方法,其中,根据所述第一局部特征聚合向量和所述第二局部特征聚合向量,分别确定用于表征所述用户信息的第一离散化特征和用于表征所述目标内容的第二离散化特征包括:
利用聚类操作,将所述第一局部特征聚合向量映射为所述第一离散化特征,以及将所述第二局部特征聚合向量映射为所述第二离散化特征。
4.根据权利要求1所述的方法,还包括:
将所述第一离散化特征和所述第二离散化特征进行组合,得到交叉组合特征;以及
将所述交叉组合特征输入所述点击率预测模型,得到与所述用户信息相对应的用户针对所述目标内容的点击率预测值。
5.根据权利要求1所述的方法,还包括:
对所述第一离散化特征和所述第二离散化特征取交集,得到目标离散化特征;以及
将所述目标离散化特征输入所述点击率预测模型,得到与所述用户信息相对应的用户针对所述目标内容的点击率预测值。
6.根据权利要求5所述的方法,还包括:
确定所述目标离散化特征的目标数量;以及
将所述目标数量输入所述点击率预测模型。
7.根据权利要求1所述的方法,其中,
所述第一局部特征聚合向量用于表征所述用户信息中的第一特征信息和第二特征信息,其中,所述第一特征信息为与正样本相关的特征信息,所述第二特征信息为与负样本相关的特征信息;
所述第二局部特征聚合向量用于表征所述目标内容中的第三特征信息和第四特征信息,其中,所述第三特征信息为与所述正样本相关的特征信息,所述第四特征信息为与所述负样本相关的特征信息;
所述正样本为用户点击目标内容形成的样本;
所述负样本为用户未点击目标内容、随机目标内容和随机用户信息其中至少之一形成的样本。
8.根据权利要求1所述的方法,其中,所述用户信息包括用户操作信息和用户属性信息其中至少之一,所述目标内容包括文本内容、图片内容和视频内容其中至少之一。
9.一种预测内容点击率的装置,包括:
表征模块,用于将目标内容和用于确定所述目标内容的用户信息输入表征模型,得到用于表征所述用户信息的第一局部特征聚合向量,和用于表征所述目标内容的第二局部特征聚合向量;
第一确定模块,用于根据所述第一局部特征聚合向量和所述第二局部特征聚合向量,分别确定用于表征所述用户信息的第一离散化特征和用于表征所述目标内容的第二离散化特征;以及
第一预测模块,用于将所述第一离散化特征和所述第二离散化特征输入点击率预测模型,得到与所述用户信息相对应的用户针对所述目标内容的点击率预测值。
10.根据权利要求9所述的装置,其中,所述表征模块包括:
编码单元,用于对所述目标内容和所述用户信息分别进行编码,得到第一编码向量和第二编码向量;以及
处理单元,用于对所述第一编码向量和所述第二编码向量分别进行局部特征聚合处理,得到所述第一局部特征聚合向量和所述第二局部特征聚合向量。
11.根据权利要求9所述的装置,其中,所述第一确定模块包括:
映射单元,用于利用聚类操作,将所述第一局部特征聚合向量映射为所述第一离散化特征,以及将所述第二局部特征聚合向量映射为所述第二离散化特征。
12.根据权利要求9所述的装置,还包括:
组合模块,用于将所述第一离散化特征和所述第二离散化特征进行组合,得到交叉组合特征;以及
第二预测模块,用于将所述交叉组合特征输入所述点击率预测模型,得到与所述用户信息相对应的用户针对所述目标内容的点击率预测值。
13.根据权利要求9所述的装置,还包括:
取交集模块,用于对所述第一离散化特征和所述第二离散化特征取交集,得到目标离散化特征;以及
第三预测模块,用于将所述目标离散化特征输入所述点击率预估模型,得到与所述用户信息相对应的用户针对所述目标内容的点击率预测值。
14.根据权利要求9所述的装置,还包括:
第二确定模块,用于确定所述目标离散化特征的目标数量;以及
输入模块,用于将所述目标数量输入所述点击率预测模型。
15.根据权利要求9所述的装置,其中,
所述第一局部特征聚合向量用于表征所述用户信息中的第一特征信息和第二特征信息,其中,所述第一特征信息为与正样本相关的特征信息,所述第二特征信息为与负样本相关的特征信息;
所述第二局部特征聚合向量用于表征所述目标内容中的第三特征信息和第四特征信息,其中,所述第三特征信息为与所述正样本相关的特征信息,所述第四特征信息为与所述负样本相关的特征信息;
所述正样本为用户点击目标内容形成的样本;
所述负样本为用户未点击目标内容、随机目标内容和随机用户信息其中至少之一形成的样本。
16.根据权利要求9所述的装置,其中,所述用户信息包括用户操作信息和用户属性信息其中至少之一,所述目标内容包括文本内容、图片内容和视频内容其中至少之一。
17.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-8中任一项所述的方法。
18.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-8中任一项所述的方法。
19.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-8中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110740520.6A CN113435523B (zh) | 2021-06-29 | 2021-06-29 | 预测内容点击率的方法、装置、电子设备以及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110740520.6A CN113435523B (zh) | 2021-06-29 | 2021-06-29 | 预测内容点击率的方法、装置、电子设备以及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113435523A true CN113435523A (zh) | 2021-09-24 |
CN113435523B CN113435523B (zh) | 2023-09-26 |
Family
ID=77758285
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110740520.6A Active CN113435523B (zh) | 2021-06-29 | 2021-06-29 | 预测内容点击率的方法、装置、电子设备以及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113435523B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114387062A (zh) * | 2022-01-13 | 2022-04-22 | 北京自如信息科技有限公司 | 管家推荐模型的训练、管家推荐方法及电子设备 |
WO2023174075A1 (zh) * | 2022-03-17 | 2023-09-21 | 北京有竹居网络技术有限公司 | 内容检测模型的训练方法、内容检测方法及装置 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100082421A1 (en) * | 2008-09-30 | 2010-04-01 | Yahoo! Inc. | Click through rate prediction system and method |
CN103996088A (zh) * | 2014-06-10 | 2014-08-20 | 苏州工业职业技术学院 | 基于多维特征组合逻辑回归的广告点击率预测方法 |
CN105160548A (zh) * | 2015-08-20 | 2015-12-16 | 北京奇虎科技有限公司 | 对广告点击率进行预测的方法及装置 |
CN105787767A (zh) * | 2016-03-03 | 2016-07-20 | 上海珍岛信息技术有限公司 | 一种广告点击率预估模型获取方法与系统 |
CN106339510A (zh) * | 2016-10-28 | 2017-01-18 | 北京百度网讯科技有限公司 | 基于人工智能的点击预估方法及装置 |
CN107767174A (zh) * | 2017-10-19 | 2018-03-06 | 厦门美柚信息科技有限公司 | 一种广告点击率的预测方法及装置 |
CN108182472A (zh) * | 2018-01-30 | 2018-06-19 | 百度在线网络技术(北京)有限公司 | 用于生成信息的方法和装置 |
CN109460513A (zh) * | 2018-10-31 | 2019-03-12 | 北京字节跳动网络技术有限公司 | 用于生成点击率预测模型的方法和装置 |
CN109992710A (zh) * | 2019-02-13 | 2019-07-09 | 网易传媒科技(北京)有限公司 | 点击率预估方法、系统、介质和计算设备 |
CN111046294A (zh) * | 2019-12-27 | 2020-04-21 | 支付宝(杭州)信息技术有限公司 | 点击率预测方法、推荐方法、模型、装置及设备 |
CN111460290A (zh) * | 2020-03-27 | 2020-07-28 | 喜丈(上海)网络科技有限公司 | 信息的推荐方法、装置、设备和存储介质 |
CN111538912A (zh) * | 2020-07-07 | 2020-08-14 | 腾讯科技(深圳)有限公司 | 内容推荐方法、装置、设备及可读存储介质 |
-
2021
- 2021-06-29 CN CN202110740520.6A patent/CN113435523B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100082421A1 (en) * | 2008-09-30 | 2010-04-01 | Yahoo! Inc. | Click through rate prediction system and method |
CN103996088A (zh) * | 2014-06-10 | 2014-08-20 | 苏州工业职业技术学院 | 基于多维特征组合逻辑回归的广告点击率预测方法 |
CN105160548A (zh) * | 2015-08-20 | 2015-12-16 | 北京奇虎科技有限公司 | 对广告点击率进行预测的方法及装置 |
CN105787767A (zh) * | 2016-03-03 | 2016-07-20 | 上海珍岛信息技术有限公司 | 一种广告点击率预估模型获取方法与系统 |
CN106339510A (zh) * | 2016-10-28 | 2017-01-18 | 北京百度网讯科技有限公司 | 基于人工智能的点击预估方法及装置 |
CN107767174A (zh) * | 2017-10-19 | 2018-03-06 | 厦门美柚信息科技有限公司 | 一种广告点击率的预测方法及装置 |
CN108182472A (zh) * | 2018-01-30 | 2018-06-19 | 百度在线网络技术(北京)有限公司 | 用于生成信息的方法和装置 |
CN109460513A (zh) * | 2018-10-31 | 2019-03-12 | 北京字节跳动网络技术有限公司 | 用于生成点击率预测模型的方法和装置 |
CN109992710A (zh) * | 2019-02-13 | 2019-07-09 | 网易传媒科技(北京)有限公司 | 点击率预估方法、系统、介质和计算设备 |
CN111046294A (zh) * | 2019-12-27 | 2020-04-21 | 支付宝(杭州)信息技术有限公司 | 点击率预测方法、推荐方法、模型、装置及设备 |
CN111460290A (zh) * | 2020-03-27 | 2020-07-28 | 喜丈(上海)网络科技有限公司 | 信息的推荐方法、装置、设备和存储介质 |
CN111538912A (zh) * | 2020-07-07 | 2020-08-14 | 腾讯科技(深圳)有限公司 | 内容推荐方法、装置、设备及可读存储介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114387062A (zh) * | 2022-01-13 | 2022-04-22 | 北京自如信息科技有限公司 | 管家推荐模型的训练、管家推荐方法及电子设备 |
WO2023174075A1 (zh) * | 2022-03-17 | 2023-09-21 | 北京有竹居网络技术有限公司 | 内容检测模型的训练方法、内容检测方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN113435523B (zh) | 2023-09-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113159010B (zh) | 视频分类方法、装置、设备和存储介质 | |
CN114861889B (zh) | 深度学习模型的训练方法、目标对象检测方法和装置 | |
CN114549874A (zh) | 多目标图文匹配模型的训练方法、图文检索方法及装置 | |
CN113435523B (zh) | 预测内容点击率的方法、装置、电子设备以及存储介质 | |
US20240143684A1 (en) | Information presentation method and apparatus, and device and medium | |
CN115099239B (zh) | 一种资源识别方法、装置、设备以及存储介质 | |
CN113806588A (zh) | 搜索视频的方法和装置 | |
CN113360683A (zh) | 训练跨模态检索模型的方法以及跨模态检索方法和装置 | |
CN112528610A (zh) | 一种数据标注方法、装置、电子设备及存储介质 | |
CN115169489B (zh) | 数据检索方法、装置、设备以及存储介质 | |
JP7499946B2 (ja) | インテリジェント推奨用のソートモデルトレーニング方法及び装置、インテリジェント推奨方法及び装置、電子機器、記憶媒体、並びにコンピュータプログラム | |
CN116226533A (zh) | 基于关联性预测模型的新闻关联推荐方法、装置及介质 | |
CN112784600A (zh) | 信息排序方法、装置、电子设备和存储介质 | |
CN113806541A (zh) | 情感分类的方法和情感分类模型的训练方法、装置 | |
CN108009233B (zh) | 一种图像还原方法、装置、计算机设备及存储介质 | |
CN115392389B (zh) | 跨模态信息匹配、处理方法、装置、电子设备及存储介质 | |
CN115828915B (zh) | 实体消歧方法、装置、电子设备和存储介质 | |
CN114547448B (zh) | 数据处理、模型训练方法、装置、设备、存储介质及程序 | |
CN116911304B (zh) | 一种文本推荐方法及装置 | |
CN116628315B (zh) | 搜索方法、深度学习模型的训练方法、装置及电子设备 | |
CN116150428B (zh) | 视频标签获取方法、装置、电子设备及存储介质 | |
WO2023168997A1 (zh) | 一种跨模态搜索方法及相关设备 | |
CN115329897A (zh) | 特征提取模型训练方法、装置及电子设备 | |
CN113849666A (zh) | 一种数据处理、模型训练方法、装置、设备及存储介质 | |
CN116738993A (zh) | 信息识别模型的训练方法、信息识别方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |