CN111460290B - 信息的推荐方法、装置、设备和存储介质 - Google Patents

信息的推荐方法、装置、设备和存储介质 Download PDF

Info

Publication number
CN111460290B
CN111460290B CN202010228768.XA CN202010228768A CN111460290B CN 111460290 B CN111460290 B CN 111460290B CN 202010228768 A CN202010228768 A CN 202010228768A CN 111460290 B CN111460290 B CN 111460290B
Authority
CN
China
Prior art keywords
information
vector
user
data
characteristic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010228768.XA
Other languages
English (en)
Other versions
CN111460290A (zh
Inventor
金宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xizhang Shanghai Network Technology Co ltd
Original Assignee
Xizhang Shanghai Network Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xizhang Shanghai Network Technology Co ltd filed Critical Xizhang Shanghai Network Technology Co ltd
Priority to CN202010228768.XA priority Critical patent/CN111460290B/zh
Publication of CN111460290A publication Critical patent/CN111460290A/zh
Application granted granted Critical
Publication of CN111460290B publication Critical patent/CN111460290B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及一种信息的推荐方法、装置、设备和存储介质。该方法包括:获取当前用户的用户特征数据以及各个待推荐信息的信息特征数据;将所述用户特征数据以及各个信息特征数据输入至预设的点击率预测模型中,得到所述当前用户对各个待推荐信息的预估点击率,其中,所述点击率预测模型包括用于对所述用户特征数据进行特征交叉处理的用户特征全连接层,以及用于对所述信息特征数据进行特征交叉处理的信息特征全连接层;根据各个待推荐信息的预估点击率,向所述当前用户进行信息推荐。该方法使得基于该点击率预测模型预测的各个待推荐信息的点击率更准确,从而提高了推荐结果的准确性。

Description

信息的推荐方法、装置、设备和存储介质
技术领域
本申请涉及互联网领域,特别是涉及一种信息的推荐方法、装置、设备和存储介质。
背景技术
随着大数据技术的不断发展,通过大数据分析可以为用户更精准得推送信息。其中,信息可以为视频、音频、广告以及专辑等。传统技术中,计算机设备可以采集用户对信息的反馈情况,利用反馈情况为用户进行信息的个性化推荐。其中,反馈情况可以包括对信息感兴趣、信息内容质量高等正反馈信息,也可以包括对信息不感兴趣、信息内容质量差等负反馈信息。但是,传统技术推荐的结果的准确性较低。
发明内容
基于此,有必要针对传统方式推荐的结果的准确性较低的技术问题,提供一种信息的推荐方法、装置、设备和存储介质。
第一方面,本申请实施例提供一种信息的推荐方法,包括:
获取当前用户的用户特征数据以及各个待推荐信息的信息特征数据;
将所述用户特征数据以及各个信息特征数据输入至预设的点击率预测模型中,得到所述当前用户对各个待推荐信息的预估点击率,其中,所述点击率预测模型包括用于对所述用户特征数据进行特征交叉处理的用户特征全连接层,以及用于对所述信息特征数据进行特征交叉处理的信息特征全连接层;
根据各个待推荐信息的预估点击率,向所述当前用户进行信息推荐。
第二方面,本申请实施例提供一种信息的推荐装置,包括:
第一获取模块,用于获取当前用户的用户特征数据以及各个待推荐信息的信息特征数据;
预测模块,用于将所述用户特征数据以及各个信息特征数据输入至预设的点击率预测模型中,得到所述当前用户对各个待推荐信息的预估点击率,其中,所述点击率预测模型包括用于对所述用户特征数据进行特征交叉处理的用户特征全连接层,以及用于对所述信息特征数据进行特征交叉处理的信息特征全连接层;
推荐模块,用于根据各个待推荐信息的预估点击率,向所述当前用户进行信息推荐。
第三方面,本申请实施例提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现本申请实施例第一方面提供的信息的推荐方法。
第四方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现本申请实施例第一方面提供的信息的推荐方法。
本申请实施例提供的信息的推荐方法、装置、设备和存储介质,在获取到当前用户的用户特征数据以及各个待推荐信息的信息特征数据之后,计算机设备将所述用户特征数据以及各个信息特征数据输入至预设的点击率预测模型中,得到所述当前用户对各个待推荐信息的预估点击率,并根据各个待推荐信息的预估点击率,向所述当前用户进行信息推荐。由于上述点击率预测模型包括用于对用户特征数据进行特征交叉处理的用户特征全连接层,以及用于对信息特征数据进行特征交叉处理的信息特征全连接层,即通过该点击率预测模型预测当前用户对各个待推荐信息的点击率的过程中,该点击率预测模型能够单独对用户特征数据以及信息特征数据进行特征交叉处理,避免了直接将用户特征数据和信息特征数据作为整体特征数据进行特征交叉处理后带来的特征过拟合问题,使得基于该点击率预测模型预测的各个待推荐信息的点击率更准确,从而提高了推荐结果的准确性。
附图说明
图1为本申请实施例提供的信息的推荐方法的一种流程示意图;
图2为本申请实施例提供的信息的推荐方法的另一种流程示意图;
图3为本申请实施例提供的一种点击率预测模型的结构示意图;
图4为本申请实施例提供的信息的推荐方法的又一种流程示意图;
图5为本申请实施例提供的信息的推荐装置的结构示意图;
图6为本申请实施例提供的一种计算机设备的结构示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,通过下述实施例并结合附图,对本申请实施例中的技术方案进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。
需要说明的是,下述方法实施例的执行主体可以是信息的推荐装置,该装置可以通过软件、硬件或者软硬件结合的方式实现成为计算机设备的部分或者全部。可选的,计算机设备可以为个人计算机PC(personal computer)、移动终端、便携式设备等具有数据处理功能、且可以与外部设备或者用户交互的电子设备,当然,计算机设备也可以为服务器,本实施例对计算机设备的具体形式并不做限定。下述方法实施例以执行主体是计算机设备为例进行说明。
图1为本申请实施例提供的信息的推荐方法的一种流程示意图。本申请实施例涉及的是计算机设备如何预测当前用户对各个待推荐信息的点击率,并基于各个点击率进行信息推荐的具体过程。如图1所示,该方法可以包括:
S101、获取当前用户的用户特征数据以及各个待推荐信息的信息特征数据。
其中,当前用户为待推荐信息的用户。上述待推荐信息可以为待推荐视频、待推荐音频、待推荐专辑、待推荐广告以及待推荐物品等。上述用户特征数据可以为用户的长期兴趣、短期兴趣、性别以及年龄等特征数据。上述信息特征数据可以为信息的一级类别、二级类别以及信息的标签等特征数据,以信息为专辑为例,一级类别可以为有声书、历史、儿童等,二级类别可以为有声书-言情、有声书-玄幻、有声书-穿越等。信息的标签用于更为细致地反映信息类型的数据。
当需要对当前用户进行信息推荐时,可以从数据库中获取当前用户的用户特征数据,以及从数据库中随机或者按照预设选取规则选取多个信息作为待推荐信息,并从数据库中获取各个待推荐信息的信息特征数据。
在实际应用中,为了能够更精准地向当前用户进行信息推荐,可选的,计算机设备也可以参照下述过程获取各个待推荐信息:获取所述当前用户的历史反馈数据;从推荐信息库中选取与所述历史反馈数据相匹配的信息作为所述当前用户的各个待推荐信息。
具体的,历史反馈数据可以包括正反馈数据,也可以包括负反馈数据,计算机设备获取当前用户的正反馈数据以及负反馈数据,以正反馈数据以及负反馈数据作为选取待推荐信息的参考,比如,从推荐信息库中筛除与负反馈数据相近的信息,并选取与正反馈数据相近的信息作为待推荐信息。
S102、将所述用户特征数据以及各个信息特征数据输入至预设的点击率预测模型中,得到所述当前用户对各个待推荐信息的预估点击率。
其中,所述点击率预测模型包括用于对所述用户特征数据进行特征交叉处理的用户特征全连接层,以及用于对所述信息特征数据进行特征交叉处理的信息特征全连接层。同时,该用户特征全连接层和信息特征全连接层位于点击率预测模型中的输入层与整体全连接层之间。这样,该点击率预测模型可以包括输入层、局部全连接层(即用户特征全连接层和信息特征全连接层)、整体全连接层和输出层。当然,也可以包括多个整体全连接层。由此可见,当计算机设备将当前用户的用户特征数据以及各个待推荐信息的信息特征数据输入至点击率预测模型中,点击率预测模型中的用户特征全连接层可以单独对输入至点击率预测模型中的用户特征数据进行特征交叉处理,以提取用户特征数据内部的交叉特征;上述信息特征全连接层可以单独对输入至点击率预测模型中的信息特征数据进行特征交叉处理,以提取信息特征数据内部的交叉特征。再将特征交叉处理后的用户特征数据和特征交叉处理后的信息特征数据交由整体全连接层进行交叉特征的提取,从而得到各个待推荐信息的预估点击率。这样,可以避免通过整体全连接层直接提取用户特征数据和信息特征数据之间的交叉特征,从而形成不可解释的深层特征所带来的过拟合问题。
在实际应用中,为了便于点击率预测模型对特征数据的处理,在上述实施例的基础上,可选的,计算机设备需要对输入至点击率预测模型中的用户特征数据和信息特征数据进行编码处理。这样,上述S102的过程可以为:对所述用户特征数据进行独热编码处理,得到第一编码向量;针对每个信息特征数据,对所述信息类型数据进行独热编码处理以及对所述信息标签数据进行多热编码处理,得到第二编码向量;将所述第一编码向量和各个第二编码向量输入至预设的点击率预测模型中,得到所述当前用户对各个待推荐信息的预估点击率。
其中,信息特征数据包括信息类别数据和信息标签数据,信息类别数据和信息标签数据所使用的编码方式不同,针对每个信息特征数据,计算机设备对信息特征数据中的信息类型数据进行独热编码处理,并对信息特征数据中的信息标签数据进行多热编码处理,将独热编码处理的结果和多热编码处理的结果进行拼接,得到信息特征数据对应的第二编码向量。
S103、根据各个待推荐信息的预估点击率,向所述当前用户进行信息推荐。
其中,在得到各个待推荐信息的预估点击率之后,计算机设备可以将预估点击率大于预设阈值的待推荐信息推荐给当前用户。可选的,计算机设备还可以对各个待推荐信息的预估点击率进行排序,并根据排序后的各个待推荐信息,向所述当前用户进行信息推荐。例如,计算机设备可以将排序结果中位于前两位的待推荐信息推荐给当前用户。本实施例在此对如何基于各个预估点击率向当前用户进行信息推荐的方式不作具体限制,只要是基于各个预估点击率进行信息推荐的方式均属于本申请的保护范畴。
本申请实施例提供的信息的推荐方法,在获取到当前用户的用户特征数据以及各个待推荐信息的信息特征数据之后,计算机设备将所述用户特征数据以及各个信息特征数据输入至预设的点击率预测模型中,得到所述当前用户对各个待推荐信息的预估点击率,并根据各个待推荐信息的预估点击率,向所述当前用户进行信息推荐。由于上述点击率预测模型包括用于对所述用户特征数据进行特征交叉处理的用户特征全连接层,以及用于对所述信息特征数据进行特征交叉处理的信息特征全连接层,即通过该点击率预测模型预测当前用户对各个待推荐信息的点击率的过程中,该点击率预测模型能够单独对用户特征数据以及信息特征数据进行特征交叉处理,避免了直接将用户特征数据和信息特征数据作为整体特征数据进行特征交叉处理后带来的特征过拟合问题,使得基于该点击率预测模型预测的各个待推荐信息的点击率更准确,从而提高了推荐结果的准确性。
在实际应用中,为了进一步避免随意进行特征交叉所带来的过拟合问题,即为了进一步提高推荐结果的准确性,在上述实施例的基础上,可选的,该点击率预测模型还可以包括特征交叉层。该特征交叉层位于局部全连接层与整体全连接层之间,用于按照预设的特征交叉规则提取局部全连接层的处理结果之间的交叉特征。进一步的,参见图2,上述将所述第一编码向量和各个第二编码向量输入至预设的点击率预测模型中,得到所述当前用户对各个待推荐信息的预估点击率的过程可以为:
S201、将所述第一编码向量输入至所述用户特征全连接层,提取所述第一编码向量中的交叉特征,生成特征交叉处理后的第一用户向量。
S202、将各个第二编码向量输入至所述信息特征全连接层,提取各个第二编码向量中的交叉特征,生成各个特征交叉处理后的第一信息向量。
S203、针对每个第一信息向量,将所述第一用户向量和所述第一信息向量输入至所述特征交叉层,提取所述第一用户向量和所述第一信息向量之间的交叉特征,生成特征交叉处理后的混合向量。
其中,特征交叉层中预设了特征交叉规则,比如,指定第一用户向量和第一信息向量之间进行特征交叉的规则,该特征交叉规则可以为按照指定位置进行二者之间的特征交叉。计算机设备将第一用户向量和第一信息向量输入至特征交叉层中,按照预设的特征交叉规则提取第一用户向量和第一信息向量之间的交叉特征,并基于提取后的交叉特征生成混合向量。
可选的,特征交叉层可以包括乘积层和外积层,其中,乘积层用于对第一用户向量和第一信息向量进行乘积运算,以提取第一用户向量和第一信息向量之间对应元素位置上的交叉特征;外积层用于对第一用户向量和第一信息向量进行外积运算,以提取第一用户向量和第一信息向量之间所有元素位置上的交叉特征。
进一步的,上述S203中将所述第一用户向量和所述第一信息向量输入至所述特征交叉层,提取所述第一用户向量和所述第一信息向量之间的交叉特征,生成特征交叉处理后的混合向量的过程可以为:将所述第一用户向量和所述第一信息向量输入至所述特征交叉层中,分别进行乘积运算和外积运算,得到乘积后的第一特征交叉向量和外积后的第二特征交叉向量;对所述第一特征交叉向量和所述第二特征交叉向量进行拼接,将拼接后的第三特征交叉向量作为特征交叉处理后的混合向量。
其中,第一特征交叉向量用于表示第一用户向量和第二信息向量之间对应元素位置上的交叉特征,第二特征交叉向量用于表示第一用户向量和第二信息向量之间所有元素位置上的交叉特征。
S204、对各个混合向量进行全连接处理,得到所述当前用户对各个待推荐信息的预估点击率。
其中,计算机设备可以对各个混合向量进行多次全连接处理,全连接处理后的结果输入至输出层,并经过输出层的激活函数的激活处理后得到当前用户对各个待推荐信息的预估点击率。
在本实施例中,由于点击率预测模型还包括特征交叉层,计算机设备将局部全连接层处理后的结果输入至特征交叉层,通过预设的特征交叉规则对第一用户向量和第一信息向量之间进行特征交叉处理,避免通过整体全连接层直接提取第一用户向量和第一信息向量之间的交叉特征,导致产生过度的特征组合所带来的过拟合问题,从而进一步提高了预测的各个待推荐信息的点击率的准确性,从而进一步提高了推荐结果的准确性。
为了便于本领域技术人员的理解,参照如图3所示的点击率预测模型结构,具体介绍对当前用户进行信息推荐的过程,具体的:
如图3所示,点击率预测模型包括输入层、局部全连接层(用户特征全连接层和信息特征全连接层)、特征交叉层(乘积层和外积层)、第一整体全连接层、第二整体全连接层和输出层。计算机设备对获取到的当前用户的用户特征数据和各个待推荐信息的信息特征数据分别进行编码处理,得到第一编码向量和各个第二编码向量,将第一编码向量和各个第二编码向量输入至点击率预测模型中的输入层,并通过用户特征全连接层提取第一编码向量中的交叉特征,生成特征交叉处理后的第一用户向量,通过信息特征全连接层提取各个第二编码向量中的交叉特征,生成各个特征交叉处理后的第一信息向量。接着,计算机设备通过特征交叉层中的乘积层对第一用户向量和第一信息向量进行乘积运算,以提取第一用户向量和第一信息向量之间对应元素位置上的交叉特征,通过特征交叉层中的外积层对第一用户向量和第一信息向量进行外积运算,以提取第一用户向量和第一信息向量之间所有元素位置上的交叉特征。再接着,计算机设备将得到的乘积运算后的第一特征交叉向量和外积运算后的第二特征交叉向量进行拼接,并将拼接结果输入至第一整体全连接层、第二整体全连接层以及输出层中进行处理,从而得到当前用户对各个待推荐信息的预估点击率。
在一个实施例中,还提供了上述点击率预测模型的获取过程,可选的,如图4所示,在上述S101之前,该方法还可以包括:
S301、构建模型训练数据,其中,所述模型训练数据包括样本用户的用户特征数据、展示信息的信息特征数据以及所述展示信息的点击标签。
具体的,计算机设备获取展示日志和点击日志,并根据展示日志和点击日志生成初始样本数据。其中,每条初始样本数据包括样本用户的标识、展示信息的标识和用于表示样本用户是否点击展示信息的点击标签,如点击标签为1表明样本用户点击了展示信息,点击标签为0表明样本用户未点击展示信息。
接着,计算机设备根据初始样本数据,从数据库中提取特征数据。具体的,计算机设备从数据库中提取与样本用户的标识对应的样本用户特征数据,包括样本用户的年龄、性别、长期兴趣以及短期兴趣等特征数据,同时,从数据库中提取与展示信息的标识对应的样本信息特征数据,包括信息的一级类别、二级类别以及信息标签等特征数据。计算机设备将提取出的样本用户特征数据和样本信息特征数据,以及初始样本数据中对应的展示信息的点击标签作为模型训练数据。
S302、构建训练模型。
具体的,训练模型和点击率预测模型的模型结构相同。即训练模型也包括输入层、局部全连接层(用户特征全连接层和信息特征全连接层)、整体全连接层以及输出层。其中,该训练模型中的用户特征全连接层用于对样本用户特征数据进行特征交叉处理,以提取样本用户特征数据中的交叉特征,该训练模型中的信息特征全连接层用于对样本信息特征数据进行特征交叉处理,以提取样本信息特征数据中的交叉特征。可选的,训练模型还包括位于局部全连接层与整体全连接层之间的特征交叉层。
S303、对所述模型训练数据进行编码处理,得到编码处理后的模型训练数据。
其中,为了便于训练模型对模型训练数据的处理,计算机设备还需要对模型训练数据进行编码处理。具体的,样本信息特征数据包括样本信息类别数据以及样本信息标签数据,计算机设备对样本用户特征数据进行独热编码,对样本信息特征数据中的样本信息类别数据进行独热编码以及对样本信息标签数据进行多热编码,从而得到编码处理后的模型训练数据。
S304、根据所述编码处理后的模型训练数据对所述训练模型进行模型训练,得到所述点击率预测模型。
其中,计算机设备将编码处理后的样本用户特征数据和编码处理后的样本信息特征数据输入至训练模型中,得到样本用户对展示信息的预估点击率,并基于预估点击率与实际点击率(即展示信息的点击标签),计算损失函数的损失值。当损失值不满足预设条件时,调整训练模型中的各层参数的取值,并基于模型训练数据继续对训练模型进行训练,直至损失函数的损失值满足预设条件为止,此时,训练模型训练完毕,将训练好的训练模型作为点击率预测模型。
在本实施例中,由于在获取点击率预测模型的过程中,所构建的训练模型包括用于对样本用户特征数据进行特征交叉处理的用户特征全连接层,以及用于对样本信息特征数据进行特征交叉处理的信息特征全连接层,使得所训练得到的点击率预测模型能够单独对测试用户特征数据以及测试信息特征数据进行特征交叉处理,避免了直接将测试用户特征数据和测试信息特征数据作为整体特征数据进行特征交叉处理后带来的特征过拟合问题,使得基于该点击率预测模型预测的各个待推荐信息的点击率更准确,从而提高了推荐结果的准确性。
图5为本申请实施例提供的信息的推荐装置的结构示意图。如图5所示,该装置可以包括:第一获取模块10、预测模块11和推荐模块12。
具体的,第一获取模块10用于获取当前用户的用户特征数据以及各个待推荐信息的信息特征数据;
预测模块11用于将所述用户特征数据以及各个信息特征数据输入至预设的点击率预测模型中,得到所述当前用户对各个待推荐信息的预估点击率,其中,所述点击率预测模型包括用于对所述用户特征数据进行特征交叉处理的用户特征全连接层,以及用于对所述信息特征数据进行特征交叉处理的信息特征全连接层;
推荐模块12用于根据各个待推荐信息的预估点击率,向所述当前用户进行信息推荐。
本申请实施例提供的信息的推荐装置,在获取到当前用户的用户特征数据以及各个待推荐信息的信息特征数据之后,计算机设备将所述用户特征数据以及各个信息特征数据输入至预设的点击率预测模型中,得到所述当前用户对各个待推荐信息的预估点击率,并根据各个待推荐信息的预估点击率,向所述当前用户进行信息推荐。由于上述点击率预测模型包括用于对所述用户特征数据进行特征交叉处理的用户特征全连接层,以及用于对所述信息特征数据进行特征交叉处理的信息特征全连接层,即通过该点击率预测模型预测当前用户对各个待推荐信息的点击率的过程中,该点击率预测模型能够单独对用户特征数据以及信息特征数据进行特征交叉处理,避免了直接将用户特征数据和信息特征数据作为整体特征数据进行特征交叉处理后带来的特征过拟合问题,使得基于该点击率预测模型预测的各个待推荐信息的点击率更准确,从而提高了推荐结果的准确性。
在上述实施例的基础上,可选的,所述信息特征数据包括信息类别数据和信息标签数据,上述预测模块11包括:第一编码单元、第二编码单元和预测单元;
具体的,第一编码单元用于对所述用户特征数据进行独热编码处理,得到第一编码向量;
第二编码单元用于针对每个信息特征数据,对所述信息类型数据进行独热编码处理以及对所述信息标签数据进行多热编码处理,得到第二编码向量;
预测单元用于将所述第一编码向量和各个第二编码向量输入至预设的点击率预测模型中,得到所述当前用户对各个待推荐信息的预估点击率。
在上述实施例的基础上,可选的,所述点击率预测模型还包括特征交叉层,上述预测单元包括第一提取子单元、第二提取子单元、第三提取子单元和全连接处理子单元;
具体的,第一提取子单元用于将所述第一编码向量输入至所述用户特征全连接层,提取所述第一编码向量中的交叉特征,生成特征交叉处理后的第一用户向量;
第二提取子单元用于将各个第二编码向量输入至所述信息特征全连接层,提取各个第二编码向量中的交叉特征,生成各个特征交叉处理后的第一信息向量;
第三提取子单元用于针对每个第一信息向量,将所述第一用户向量和所述第一信息向量输入至所述特征交叉层,提取所述第一用户向量和所述第一信息向量之间的交叉特征,生成特征交叉处理后的混合向量;
全连接处理子单元用于对各个混合向量进行全连接处理,得到所述当前用户对各个待推荐信息的预估点击率。
在上述实施例的基础上,可选的,第三提取子单元具体用于将所述第一用户向量和所述第一信息向量输入至所述特征交叉层中,分别进行乘积运算和外积运算,得到乘积后的第一特征交叉向量和外积后的第二特征交叉向量;对所述第一特征交叉向量和所述第二特征交叉向量进行拼接,将拼接后的第三特征交叉向量作为特征交叉处理后的混合向量。
在上述实施例的基础上,可选的,该装置还包括第一构建模块、第二构建模块、编码处理模块和模型训练模块;
具体的,第一构建模块用于构建模型训练数据,其中,所述模型训练数据包括样本用户的用户特征数据、展示信息的信息特征数据以及所述展示信息的点击标签;
第二构建模块用于构建训练模型,其中,所述训练模型和所述点击率预测模型的模型结构相同;
编码处理模块用于对所述模型训练数据进行编码处理,得到编码处理后的模型训练数据;
模型训练模块用于根据所述编码处理后的模型训练数据对所述训练模型进行模型训练,得到所述点击率预测模型。
在上述实施例的基础上,可选的,推荐模块12具体用于对各个待推荐信息的预估点击率进行排序;根据排序后的各个待推荐信息,向所述当前用户进行信息推荐。
在上述实施例的基础上,可选的,该装置还包括第二获取模块;
具体的,第二获取模块用于获取所述当前用户的历史反馈数据;从推荐信息库中选取与所述历史反馈数据相匹配的信息作为所述当前用户的各个待推荐信息。
在一个实施例中,提供了一种计算机设备,其结构示意图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储信息的推荐过程中的数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种信息的推荐方法。
本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
获取当前用户的用户特征数据以及各个待推荐信息的信息特征数据;
将所述用户特征数据以及各个信息特征数据输入至预设的点击率预测模型中,得到所述当前用户对各个待推荐信息的预估点击率,其中,所述点击率预测模型包括用于对所述用户特征数据进行特征交叉处理的用户特征全连接层,以及用于对所述信息特征数据进行特征交叉处理的信息特征全连接层;
根据各个待推荐信息的预估点击率,向所述当前用户进行信息推荐。
在一个实施例中,所述信息特征数据包括信息类别数据和信息标签数据,处理器执行计算机程序时还实现以下步骤:对所述用户特征数据进行独热编码处理,得到第一编码向量;针对每个信息特征数据,对所述信息类型数据进行独热编码处理以及对所述信息标签数据进行多热编码处理,得到第二编码向量;将所述第一编码向量和各个第二编码向量输入至预设的点击率预测模型中,得到所述当前用户对各个待推荐信息的预估点击率。
在一个实施例中,所述点击率预测模型还包括特征交叉层,处理器执行计算机程序时还实现以下步骤:将所述第一编码向量输入至所述用户特征全连接层,提取所述第一编码向量中的交叉特征,生成特征交叉处理后的第一用户向量;将各个第二编码向量输入至所述信息特征全连接层,提取各个第二编码向量中的交叉特征,生成各个特征交叉处理后的第一信息向量;针对每个第一信息向量,将所述第一用户向量和所述第一信息向量输入至所述特征交叉层,提取所述第一用户向量和所述第一信息向量之间的交叉特征,生成特征交叉处理后的混合向量;对各个混合向量进行全连接处理,得到所述当前用户对各个待推荐信息的预估点击率。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:将所述第一用户向量和所述第一信息向量输入至所述特征交叉层中,分别进行乘积运算和外积运算,得到乘积后的第一特征交叉向量和外积后的第二特征交叉向量;对所述第一特征交叉向量和所述第二特征交叉向量进行拼接,将拼接后的第三特征交叉向量作为特征交叉处理后的混合向量。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:构建模型训练数据,其中,所述模型训练数据包括样本用户的用户特征数据、展示信息的信息特征数据以及所述展示信息的点击标签;构建训练模型,其中,所述训练模型和所述点击率预测模型的模型结构相同;对所述模型训练数据进行编码处理,得到编码处理后的模型训练数据;根据所述编码处理后的模型训练数据对所述训练模型进行模型训练,得到所述点击率预测模型。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:对各个待推荐信息的预估点击率进行排序;根据排序后的各个待推荐信息,向所述当前用户进行信息推荐。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取所述当前用户的历史反馈数据;从推荐信息库中选取与所述历史反馈数据相匹配的信息作为所述当前用户的各个待推荐信息。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取当前用户的用户特征数据以及各个待推荐信息的信息特征数据;
将所述用户特征数据以及各个信息特征数据输入至预设的点击率预测模型中,得到所述当前用户对各个待推荐信息的预估点击率,其中,所述点击率预测模型包括用于对所述用户特征数据进行特征交叉处理的用户特征全连接层,以及用于对所述信息特征数据进行特征交叉处理的信息特征全连接层;
根据各个待推荐信息的预估点击率,向所述当前用户进行信息推荐。
在一个实施例中,所述信息特征数据包括信息类别数据和信息标签数据,计算机程序被处理器执行时还实现以下步骤:对所述用户特征数据进行独热编码处理,得到第一编码向量;针对每个信息特征数据,对所述信息类型数据进行独热编码处理以及对所述信息标签数据进行多热编码处理,得到第二编码向量;将所述第一编码向量和各个第二编码向量输入至预设的点击率预测模型中,得到所述当前用户对各个待推荐信息的预估点击率。
在一个实施例中,所述点击率预测模型还包括特征交叉层,计算机程序被处理器执行时还实现以下步骤:将所述第一编码向量输入至所述用户特征全连接层,提取所述第一编码向量中的交叉特征,生成特征交叉处理后的第一用户向量;将各个第二编码向量输入至所述信息特征全连接层,提取各个第二编码向量中的交叉特征,生成各个特征交叉处理后的第一信息向量;针对每个第一信息向量,将所述第一用户向量和所述第一信息向量输入至所述特征交叉层,提取所述第一用户向量和所述第一信息向量之间的交叉特征,生成特征交叉处理后的混合向量;对各个混合向量进行全连接处理,得到所述当前用户对各个待推荐信息的预估点击率。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:将所述第一用户向量和所述第一信息向量输入至所述特征交叉层中,分别进行乘积运算和外积运算,得到乘积后的第一特征交叉向量和外积后的第二特征交叉向量;对所述第一特征交叉向量和所述第二特征交叉向量进行拼接,将拼接后的第三特征交叉向量作为特征交叉处理后的混合向量。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:构建模型训练数据,其中,所述模型训练数据包括样本用户的用户特征数据、展示信息的信息特征数据以及所述展示信息的点击标签;构建训练模型,其中,所述训练模型和所述点击率预测模型的模型结构相同;对所述模型训练数据进行编码处理,得到编码处理后的模型训练数据;根据所述编码处理后的模型训练数据对所述训练模型进行模型训练,得到所述点击率预测模型。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:对各个待推荐信息的预估点击率进行排序;根据排序后的各个待推荐信息,向所述当前用户进行信息推荐。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取所述当前用户的历史反馈数据;从推荐信息库中选取与所述历史反馈数据相匹配的信息作为所述当前用户的各个待推荐信息。
上述实施例中提供的信息的推荐装置、计算机设备以及存储介质可执行本申请任意实施例所提供的信息的推荐方法,具备执行该方法相应的功能模块和有益效果。未在上述实施例中详尽描述的技术细节,可参见本申请任意实施例所提供的信息的推荐方法。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (7)

1.一种信息的推荐方法,其特征在于,包括:
获取当前用户的用户特征数据以及各个待推荐信息的信息特征数据;
将所述用户特征数据以及各个信息特征数据输入至预设的点击率预测模型中,得到所述当前用户对各个待推荐信息的预估点击率,其中,所述点击率预测模型包括用于对所述用户特征数据进行特征交叉处理的用户特征全连接层,以及用于对所述信息特征数据进行特征交叉处理的信息特征全连接层;
根据各个待推荐信息的预估点击率,向所述当前用户进行信息推荐;
所述信息特征数据包括信息类别数据和信息标签数据,所述将所述用户特征数据以及各个信息特征数据输入至预设的点击率预测模型中,得到所述当前用户对各个待推荐信息的预估点击率,包括:
对所述用户特征数据进行独热编码处理,得到第一编码向量;
针对每个信息特征数据,对所述信息类型数据进行独热编码处理以及对所述信息标签数据进行多热编码处理,得到第二编码向量;
将所述第一编码向量和各个第二编码向量输入至预设的点击率预测模型中,得到所述当前用户对各个待推荐信息的预估点击率;
所述点击率预测模型还包括特征交叉层,所述将所述第一编码向量和各个第二编码向量输入至预设的点击率预测模型中,得到所述当前用户对各个待推荐信息的预估点击率,包括:
将所述第一编码向量输入至所述用户特征全连接层,提取所述第一编码向量中的交叉特征,生成特征交叉处理后的第一用户向量;
将各个第二编码向量输入至所述信息特征全连接层,提取各个第二编码向量中的交叉特征,生成各个特征交叉处理后的第一信息向量;
针对每个第一信息向量,将所述第一用户向量和所述第一信息向量输入至所述特征交叉层,提取所述第一用户向量和所述第一信息向量之间的交叉特征,生成特征交叉处理后的混合向量;
对各个混合向量进行全连接处理,得到所述当前用户对各个待推荐信息的预估点击率;
所述将所述第一用户向量和所述第一信息向量输入至所述特征交叉层,提取所述第一用户向量和所述第一信息向量之间的交叉特征,生成特征交叉处理后的混合向量,包括:
将所述第一用户向量和所述第一信息向量输入至所述特征交叉层中,分别进行乘积运算和外积运算,得到乘积后的第一特征交叉向量和外积后的第二特征交叉向量;
对所述第一特征交叉向量和所述第二特征交叉向量进行拼接,将拼接后的第三特征交叉向量作为特征交叉处理后的混合向量。
2.根据权利要求1所述的方法,其特征在于,在所述获取当前用户的用户特征数据以及各个待推荐信息的信息特征数据之前,所述方法还包括:
构建模型训练数据,其中,所述模型训练数据包括样本用户的用户特征数据、展示信息的信息特征数据以及所述展示信息的点击标签;
构建训练模型,其中,所述训练模型和所述点击率预测模型的模型结构相同;
对所述模型训练数据进行编码处理,得到编码处理后的模型训练数据;
根据所述编码处理后的模型训练数据对所述训练模型进行模型训练,得到所述点击率预测模型。
3.根据权利要求1所述的方法,其特征在于,所述根据各个待推荐信息的预估点击率,向所述当前用户进行信息推荐,包括:
对各个待推荐信息的预估点击率进行排序;
根据排序后的各个待推荐信息,向所述当前用户进行信息推荐。
4.根据权利要求1所述的方法,其特征在于,获取所述各个待推荐信息,包括:
获取所述当前用户的历史反馈数据;
从推荐信息库中选取与所述历史反馈数据相匹配的信息作为所述当前用户的各个待推荐信息。
5.一种信息的推荐装置,其特征在于,包括:
第一获取模块,用于获取当前用户的用户特征数据以及各个待推荐信息的信息特征数据;
预测模块,用于将所述用户特征数据以及各个信息特征数据输入至预设的点击率预测模型中,得到所述当前用户对各个待推荐信息的预估点击率,其中,所述点击率预测模型包括用于对所述用户特征数据进行特征交叉处理的用户特征全连接层,以及用于对所述信息特征数据进行特征交叉处理的信息特征全连接层;
所述信息特征数据包括信息类别数据和信息标签数据;
所述预测模块包括:第一编码单元、第二编码单元和预测单元;
第一编码单元,用于对所述用户特征数据进行独热编码处理,得到第一编码向量;
第二编码单元,用于针对每个信息特征数据,对所述信息类型数据进行独热编码处理以及对所述信息标签数据进行多热编码处理,得到第二编码向量;
预测单元,用于将所述第一编码向量和各个第二编码向量输入至预设的点击率预测模型中,得到所述当前用户对各个待推荐信息的预估点击率;
所述点击率预测模型还包括特征交叉层;
所述预测单元包括:第一提取子单元、第二提取子单元、第三提取子单元和全连接处理子单元;
第一提取子单元,用于将所述第一编码向量输入至所述用户特征全连接层,提取所述第一编码向量中的交叉特征,生成特征交叉处理后的第一用户向量;
第二提取子单元,用于将各个第二编码向量输入至所述信息特征全连接层,提取各个第二编码向量中的交叉特征,生成各个特征交叉处理后的第一信息向量;
第三提取子单元,用于针对每个第一信息向量,将所述第一用户向量和所述第一信息向量输入至所述特征交叉层,提取所述第一用户向量和所述第一信息向量之间的交叉特征,生成特征交叉处理后的混合向量;
全连接处理子单元,用于对各个混合向量进行全连接处理,得到所述当前用户对各个待推荐信息的预估点击率;
第三提取子单元,具体用于将所述第一用户向量和所述第一信息向量输入至所述特征交叉层中,分别进行乘积运算和外积运算,得到乘积后的第一特征交叉向量和外积后的第二特征交叉向量;对所述第一特征交叉向量和所述第二特征交叉向量进行拼接,将拼接后的第三特征交叉向量作为特征交叉处理后的混合向量;
推荐模块,用于根据各个待推荐信息的预估点击率,向所述当前用户进行信息推荐。
6.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至4中任一项所述方法的步骤。
7.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至4中任一项所述方法的步骤。
CN202010228768.XA 2020-03-27 2020-03-27 信息的推荐方法、装置、设备和存储介质 Active CN111460290B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010228768.XA CN111460290B (zh) 2020-03-27 2020-03-27 信息的推荐方法、装置、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010228768.XA CN111460290B (zh) 2020-03-27 2020-03-27 信息的推荐方法、装置、设备和存储介质

Publications (2)

Publication Number Publication Date
CN111460290A CN111460290A (zh) 2020-07-28
CN111460290B true CN111460290B (zh) 2023-06-02

Family

ID=71680206

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010228768.XA Active CN111460290B (zh) 2020-03-27 2020-03-27 信息的推荐方法、装置、设备和存储介质

Country Status (1)

Country Link
CN (1) CN111460290B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112084406B (zh) * 2020-09-07 2024-09-24 维沃移动通信有限公司 短信处理方法、装置、电子设备和存储介质
CN112256768B (zh) * 2020-11-04 2021-08-27 贝壳找房(北京)科技有限公司 模型离线训练评估方法、装置、介质和电子设备
CN112508638B (zh) * 2020-11-30 2023-06-20 上海哔哩哔哩科技有限公司 数据处理的方法、装置及计算机设备
CN113780548B (zh) * 2021-01-21 2024-09-24 北京沃东天骏信息技术有限公司 用于训练模型的方法、装置、设备以及存储介质
CN113435523B (zh) * 2021-06-29 2023-09-26 北京百度网讯科技有限公司 预测内容点击率的方法、装置、电子设备以及存储介质
CN113672803A (zh) * 2021-08-02 2021-11-19 杭州网易云音乐科技有限公司 推荐方法、装置、计算设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110039173A (zh) * 2010-10-22 2019-07-23 伊雷克托科学工业股份有限公司 用于光束抖动和刮削的镭射加工系统和方法
WO2019169977A1 (zh) * 2018-03-07 2019-09-12 阿里巴巴集团控股有限公司 一种信息转化率的预测、信息推荐方法和装置
CN110807693A (zh) * 2019-11-04 2020-02-18 上海喜马拉雅科技有限公司 专辑的推荐方法、装置、设备和存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110039173A (zh) * 2010-10-22 2019-07-23 伊雷克托科学工业股份有限公司 用于光束抖动和刮削的镭射加工系统和方法
WO2019169977A1 (zh) * 2018-03-07 2019-09-12 阿里巴巴集团控股有限公司 一种信息转化率的预测、信息推荐方法和装置
CN110807693A (zh) * 2019-11-04 2020-02-18 上海喜马拉雅科技有限公司 专辑的推荐方法、装置、设备和存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于特征工程的视频点击率预测算法;匡俊;唐卫红;陈雷慧;陈辉;曾炜;董启民;高明;;华东师范大学学报(自然科学版)(03);全文 *

Also Published As

Publication number Publication date
CN111460290A (zh) 2020-07-28

Similar Documents

Publication Publication Date Title
CN111460290B (zh) 信息的推荐方法、装置、设备和存储介质
CN111581229B (zh) Sql语句的生成方法、装置、计算机设备及存储介质
CN113157863B (zh) 问答数据处理方法、装置、计算机设备及存储介质
CN107291840B (zh) 一种用户属性预测模型构建方法和装置
CN111767394A (zh) 一种基于人工智能专家系统的摘要提取方法及装置
CN110598109A (zh) 一种信息推荐方法、装置、设备及存储介质
CN115757725A (zh) 问答处理方法、装置、计算机设备及存储介质
CN116308551A (zh) 基于数字金融ai平台的内容推荐方法及系统
CN113704509B (zh) 多媒体推荐方法、装置、电子设备及存储介质
JP2023554210A (ja) インテリジェント推奨用のソートモデルトレーニング方法及び装置、インテリジェント推奨方法及び装置、電子機器、記憶媒体、並びにコンピュータプログラム
CN111368192A (zh) 信息的推荐方法、装置、设备和存储介质
CN114817478A (zh) 基于文本的问答方法、装置、计算机设备及存储介质
CN110807693A (zh) 专辑的推荐方法、装置、设备和存储介质
CN110852103A (zh) 一种命名实体识别方法及装置
CN117216206A (zh) 会话处理方法、装置、电子设备及存储介质
CN116956183A (zh) 多媒体资源推荐方法、模型训练方法、装置及存储介质
CN108595395B (zh) 一种昵称的生成方法、装置及设备
CN116166858A (zh) 基于人工智能的信息推荐方法、装置、设备及存储介质
CN115017362A (zh) 数据处理方法、电子设备及存储介质
CN117033760A (zh) 一种对象推荐方法、装置、设备、存储介质及程序产品
CN115756821A (zh) 在线任务处理模型训练、任务处理方法及装置
CN111783453B (zh) 文本的情感信息处理方法及装置
CN114048392B (zh) 多媒体资源推送方法、装置、电子设备及存储介质
CN113672820B (zh) 特征提取网络的训练方法、信息推荐方法、装置及设备
CN117709299A (zh) 文本情感倾向识别方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant