CN112347361A - 推荐对象的方法、神经网络及其训练方法、设备和介质 - Google Patents

推荐对象的方法、神经网络及其训练方法、设备和介质 Download PDF

Info

Publication number
CN112347361A
CN112347361A CN202011280880.4A CN202011280880A CN112347361A CN 112347361 A CN112347361 A CN 112347361A CN 202011280880 A CN202011280880 A CN 202011280880A CN 112347361 A CN112347361 A CN 112347361A
Authority
CN
China
Prior art keywords
neural network
recommendation
recommended
sample
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011280880.4A
Other languages
English (en)
Other versions
CN112347361B (zh
Inventor
高畅
易冬琴
文豪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202011280880.4A priority Critical patent/CN112347361B/zh
Publication of CN112347361A publication Critical patent/CN112347361A/zh
Priority to KR1020210070758A priority patent/KR102502985B1/ko
Priority to JP2021100755A priority patent/JP7194233B2/ja
Priority to EP21180127.9A priority patent/EP4002216A1/en
Priority to US17/352,224 priority patent/US20210312290A1/en
Application granted granted Critical
Publication of CN112347361B publication Critical patent/CN112347361B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4668Learning process for intelligent management, e.g. learning user preferences for recommending movies for recommending content, e.g. movies
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4662Learning process for intelligent management, e.g. learning user preferences for recommending movies characterized by learning algorithms
    • H04N21/4666Learning process for intelligent management, e.g. learning user preferences for recommending movies characterized by learning algorithms using neural networks, e.g. processing the feedback provided by the user
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Primary Health Care (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开提供一种推荐对象的方法、神经网络及其训练方法、设备和介质,涉及人工智能技术领域,具体为内容推荐和深度学习技术领域。由计算机实现的利用神经网络向用户推荐对象的方法,其中,神经网络包括第一神经网络和第二神经网络,方法包括:将用户特征和待推荐对象的对象特征输入第一神经网络,获取第一神经网络输出的针对待推荐对象的第一推荐结果;确定需强化特征;将第一推荐结果和需强化特征输入第二神经网络,获取第二神经网络输出的针对待推荐对象的第二推荐结果;至少基于第二推荐结果,确定针对待推荐对象的最终推荐结果。

Description

推荐对象的方法、神经网络及其训练方法、设备和介质
技术领域
本公开涉及人工智能技术领域,具体为内容推荐和深度学习技术领域,特别涉及推荐对象的方法、神经网络及其训练方法、设备和介质。
背景技术
人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术,也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等领域;人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。人工智能被越来越广泛地应用在各个领域,例如对象推荐领域。
在此部分中描述的方法不一定是之前已经设想到或采用的方法。除非另有指明,否则不应假定此部分中描述的任何方法仅因其包括在此部分中就被认为是现有技术。类似地,除非另有指明,否则此部分中提及的问题不应认为在任何现有技术中已被公认。
发明内容
根据本公开的一方面,提供一种由计算机实现的利用神经网络向用户推荐对象的方法,其中,神经网络包括第一神经网络和第二神经网络,方法包括:将用户特征和待推荐对象的对象特征输入第一神经网络,获取第一神经网络输出的针对待推荐对象的第一推荐结果,其中,用户特征包括至少一个用户子特征,待推荐对象的对象特征包括至少一个推荐对象子特征;确定需强化特征,其中,需强化特征包括至少一个用户子特征和至少一个推荐对象子特征中的一个或多个;将第一推荐结果和需强化特征输入第二神经网络,获取第二神经网络输出的针对待推荐对象的第二推荐结果;至少基于第二推荐结果,确定针对待推荐对象的最终推荐结果。
根据本公开的另一方面,还提供一种由计算机实现的神经网络的训练方法,神经网络包括第一神经网络和第二神经网络,训练方法包括:训练完成第一神经网络;获取样本用户特征和样本对象的对象特征,并标注针对样本对象的真实推荐结果,其中,样本用户特征包括至少一个样本用户子特征,样本对象的对象特征包括至少一个样本对象子特征;确定需强化样本特征,其中,需强化样本特征包括至少一个样本用户子特征和至少一个样本对象子特征中的一个或多个;响应于样本用户特征和样本对象的对象特征输入第一神经网络,第一神经网络输出针对样本对象的第一预测推荐结果;响应于第一预测推荐结果和需强化样本特征输入第二神经网络,第二神经网络输出针对样本对象的第二预测推荐结果;至少基于真实推荐结果和第二预测推荐结果,确定损失值;基于损失值调整第二神经网络的参数。
根据本公开的另一方面,还提供一种由计算机实现的神经网络,神经网络被配置用于接收用户特征和待推荐对象的对象特征以预测针对待推荐对象的最终推荐结果,神经网络包括:第一神经网络,被配置用于响应于输入用户特征和待推荐对象的对象特征,输出针对待推荐对象的第一推荐结果,其中,用户特征包括至少一个用户子特征,待推荐对象的对象特征包括至少一个推荐对象子特征;确定单元,被配置用于确定需强化特征,其中,需强化特征包括至少一个用户子特征和至少一个推荐对象子特征中的一个或多个;第二神经网络,被配置用于响应于输入第一推荐结果和需强化特征,输出针对待推荐对象的第二推荐结果;以及输出单元,被配置用于至少基于第二推荐结果确定最终推荐结果。
根据本公开的另一方面,还提供一种计算设备,计算设备包括:处理器;以及存储程序的存储器,程序包括指令,指令在由处理器执行时使处理器执行上述的方法。
根据本公开的另一方面,还提供一种存储程序的计算机可读存储介质,程序包括指令,指令在由计算设备的处理器执行时,致使计算设备执行上述的方法。
本公开能够在利用神经网络向用户推荐对象的过程中,对影响推荐效果的重要特征进行强化,进而提升推荐结果的准确性。
附图说明
附图示例性地示出了实施例并且构成说明书的一部分,与说明书的文字描述一起用于讲解实施例的示例性实施方式。所示出的实施例仅出于例示的目的,并不限制权利要求的范围。在所有附图中,相同的附图标记指代类似但不一定相同的要素。
图1是示出根据示例性实施例的由计算机实现的利用神经网络向用户推荐对象的方法的流程图;
图2是示出根据示例性实施例的由计算机实现的神经网络的训练方法的流程图;
图3是示出根据示例性实施例的由计算机实现的神经网络的示意图;
图4是示出能够应用于示例性实施例的示例性计算设备的结构框图。
具体实施方式
在本公开中,除非另有说明,否则使用术语“第一”、“第二”等来描述各种要素不意图限定这些要素的位置关系、时序关系或重要性关系,这种术语只是用于将一个元件与另一元件区分开。在一些示例中,第一要素和第二要素可以指向该要素的同一实例,而在某些情况下,基于上下文的描述,它们也可以指代不同实例。
在本公开中对各种所述示例的描述中所使用的术语只是为了描述特定示例的目的,而并非旨在进行限制。除非上下文另外明确地表明,如果不特意限定要素的数量,则该要素可以是一个也可以是多个。此外,本公开中所使用的术语“和/或”涵盖所列出的项目中的任何一个以及全部可能的组合方式。
作为人工智能技术应用的一个方面,可以使计算机基于经过训练的神经网络来模拟人的思维过程,对不同用户进行有针对性的产品、内容、服务等对象的推荐。例如,在信息交互推荐场景中,可以为用户推荐其可能感兴趣的音频、视频、文本内容等;在商品购买推荐场景中,可以为用户推荐其可能感兴趣的商品;在婚恋或交友推荐场景中,可以为用户推荐其可能感兴趣的人物等。
相关技术中,为了判断是否为某一用户推荐某一待推荐对象,可以将该用户的用户特征和该待推荐对象的对象特征输入经过训练的神经网络中,并基于该神经网络输出的推荐结果,确定是否执行推荐。其中,推荐结果的确定是基于神经网络的独立处理过程。
因此,经过训练的神经网络可以被认为是一个能够模拟人的思维过程实现特定判断的黑盒子。通过在神经网络的输入端输入用于判断的相关信息,神经网络就可以在输出端输出用于实现该判断的对应结果。然而,在神经网络中从输入端到输出端的处理过程往往是非常复杂,难以解释的。
基于此,本公开提出一种由计算机实现的利用神经网络向用户推荐对象的方法、神经网络及其训练方法、计算设备和介质。该神经网络包括第一神经网络和第二神经网络向用户推荐对象,利用第一神经网络来对用户特征和待推荐对象的对象特征进行处理,以输出针对该待推荐对象的第一推荐结果,并且确定输入中需强化的特征,通过将第一神经网络所输出的第一推荐结果和需强化特征输入第二神经网络,至少根据第二神经网络输出的第二推荐结果确定针对待推荐对象的最终推荐结果。由此,能够使需强化特征在神经网络的处理过程中得到有效加强,提升神经网络推荐的准确性,同时通过提升需强化特征对推荐结果的影响,还能够实现推荐结果的可解释性。
以下将结合附图对本公开的由计算机实现的利用神经网络向用户推荐对象的方法进行进一步描述。
图1是示出根据本公开示例性实施例的由计算机实现的利用神经网络向用户推荐对象的方法的流程图,神经网络包括第一神经网络和第二神经网络。如图1所示,该方法包括:步骤S101、将用户特征和待推荐对象的对象特征输入第一神经网络,获取第一神经网络输出的针对待推荐对象的第一推荐结果,其中,用户特征包括至少一个用户子特征,待推荐对象的对象特征包括至少一个推荐对象子特征;步骤S102、确定需强化特征,其中,需强化特征包括至少一个用户子特征和至少一个推荐对象子特征中的一个或多个;步骤S103、将第一推荐结果和需强化特征输入第二神经网络,获取第二神经网络输出的针对待推荐对象的第二推荐结果;步骤S104、至少基于第二推荐结果,确定针对待推荐对象的最终推荐结果。由此,能够在利用神经网络向用户推荐对象的过程中,对需强化特征进行有效加强,提升需强化特征对推荐结果的影响,进而提升推荐的准确性和可解释性。
根据一些实施例,第一神经网络和第二神经网络中的一个或两个可以是全连接神经网络。具体地,可以将第一神经网络和第二神经网络中的其中之一设置为全连接神经网络,也可以将第一神经网络和第二神经网络都设置为全连接神经网络。由此,能够简化神经网络的结构,提升利用神经网络进行对象推荐的效率。
可以理解,本公开中的第一神经网络和第二神经网络并不局限于全连接神经网络,也可以采用其他网络类型,例如包括卷积神经网络,在此不作限定。
根据一些实施例,待推荐对象可以包括以下一种或多种类型的数据:文字、音频和视频。可以理解,待推荐对象的类型基于具体的推荐场景,不限于上述提及的类型,在此不作限定。
根据一些实施例,上述推荐对象的方法中的第一推荐结果、第二推荐结果和最终推荐结果可以包括表示针对待推荐对象的推荐程度的数值,例如推荐概率。在示例中,针对待推荐对象的推荐概率小于阈值(例如0.7、0.6或0.5),可以确定不推荐待推荐对象,而针对待推荐对象的推荐概率不小于阈值,可以确定推荐待推荐对象。
根据一些实施例,步骤S101中,可以确定用户特征中每一个用户子特征和待推荐对象的每一个推荐对象子特征的独热编码,例如,对于涉及性别的用户子特征,可以将“女”对应为独热编码[1,0,0],将“男”对应为独热编码[0,1,0],将性别“未知”对应为独热编码[0,0,1]。进一步可以通过第一嵌入层对所有子特征(包括所有用户子特征和所有推荐对象子特征)的独热编码进行降维,得到每一个子特征的嵌入词向量。例如,性别“女”对应的嵌入词向量可以为[0.2,0.5],性别“男”对应的嵌入词向量可以为[0.7,0.1],性别“未知”对应的嵌入词向量可以为[0.4,0.6]。在示例中,可以对所有子特征的嵌入词向量进行拼接以得到第一神经网络的输入。由此,能够便于后续神经网络的处理。
针对步骤S102,根据一些实施例,待推荐对象的对象特征可以包括推荐场景标识,需强化特征可以为基于推荐场景标识来确定。由此,能够基于不同推荐场景的应用需求,确定相应的需强化特征,从而能够对不同推荐场景下的需强化特征进行有效加强。
根据一些实施例,需强化特征可以仅包括一个或多个用户子特征,或者仅包括一个或多个推荐对象子特征,或者既包括一个或多个用户子特征又包括一个或多个推荐对象子特征。
根据一些实施例,需强化特征可以根据先验经验确定。例如,在本地新闻推荐场景中,为了能够使用户优先获取本地新闻,可将涉及地理位置的用户子特征确定为需强化特征;在体育比赛资讯推荐场景中,为了能够使用户优先获取最新的体育比赛资讯,可将涉及发布时间的待推荐对象的推荐对象子特征确定为需强化特征。
针对步骤S103,根据一些实施例,针对“第一推荐结果和需强化特征输入第二神经网络”,可以确定第一推荐结果的独热编码,以及需强化特征中所包括的每一个子特征(包括需强化特征中包括的所有用户子特征和所有推荐对象子特征)的独热编码。进一步可以通过第二嵌入层对第一推荐结果的独热编码进行降维,得到第一推荐结果的嵌入词向量。需强化特征中所包括的所有子特征可以直接利用上述步骤S101所确定的嵌入词向量。在示例中,可以对得到第一推荐结果和需强化特征分别对应的所有嵌入词向量进行拼接以得到第二神经网络的输入。其中,第二嵌入层与上述步骤S101中的第一嵌入层不同。
针对步骤S104,根据一些实施例,确定针对待推荐对象的最终推荐结果可以仅基于第二推荐结果来确定。在一个示例性实施例中,可以将第二推荐结确定为最终推荐结果。
根据另一些实施例,确定针对待推荐对象的最终推荐结果可以为基于第一推荐结果和第二推荐结果来确定。由此,能够结合第一神经网络和第二神经网络输出的推荐结果来确定最终推荐结果,提高最终推荐结果的准确性。
在一个示例性实施例中,最终推荐结果可以为第一推荐结果和第二推荐结果的加权和。特别地,最终推荐结果可以为第一推荐结果和第二推荐结果的平均值。
为了便于理解,现以婚恋或交友推荐场景为例,对上述由计算机实现的利用神经网络向用户推荐对象的方法进行说明。可以理解,本公开所提出的推荐对象的方法并不局限于婚恋或交友推荐场景,也可以适用于其他需要对象推荐场景,在此不作限定。
在一个具体实施例中,由计算机实现的利用神经网络向用户推荐对象的方法可包括:
将用户特征和待推荐对象的对象特征输入第一神经网络。其中,用户特征可以包括,例如,性别、年龄、学历、收入水平等多个用户子特征。待推荐对象可以是待推荐给用户的人物,待推荐对象的对象特征同样可以包括,例如,性别、年龄、学历、收入水平等多个推荐对象子特征。响应于上述用户特征和对象特征输入第一神经网络,获取第一神经网络输出的针对待推荐对象的第一推荐结果。具体地,第一推荐结果可以为一个数值,例如,0.7;
在婚恋或交友推荐场景中,基于婚恋或交友的推荐场景标识,可以确定涉及性别、年龄的用户子特征和涉及性别、年龄和收入水平的推荐对象子特征为需强化特征;
将第一推荐结果和需强化特征输入第二神经网络,获取第二神经网络输出的第二推荐结果,例如,0.8;
可以基于第二推荐结果确定针对待推荐对象的最终推荐结果,或者可以基于第一推荐结果和第二推荐结果的加权和确定针对待推荐对象的最终推荐结果。
根据预先设定的阈值,在最终推荐结果大于该阈值时,将该待推荐对象推荐给用户。例如,预先设定的阈值为0.5,以第一推荐结果0.7和第二推荐结果0.8的均值确定的针对待推荐对象的最终推荐结果为0.75。由于最终推荐结果0.75大于阈值0.5,因此将该待推荐对象推荐给用户。
图2是示出根据本公开示例性实施例的由计算机实现的神经网络的训练方法的流程图,神经网络包括第一神经网络和第二神经网络。如图2所示,训练方法可以包括:步骤S201、训练完成第一神经网络;步骤S202、获取样本用户特征和样本对象的对象特征,并标注针对样本对象的真实推荐结果,其中,样本用户特征包括至少一个样本用户子特征,样本对象的对象特征包括至少一个样本对象子特征;步骤S203、确定需强化样本特征,其中,需强化样本特征包括至少一个样本用户子特征和至少一个样本对象子特征中的一个或多个;步骤S204、响应于样本用户特征和样本对象的对象特征输入第一神经网络,第一神经网络输出针对样本对象的第一预测推荐结果;步骤S205、响应于第一预测推荐结果和需强化样本特征输入第二神经网络,第二神经网络输出针对样本对象的第二预测推荐结果;步骤S206、至少基于真实推荐结果和第二预测推荐结果,确定损失值;步骤S207、基于损失值调整第二神经网络的参数。由此,能够在神经网络的训练过程中,使神经网络能够对需强化特征进行强化学习,进而可以提升基于该神经网络的推荐准确性。
针对步骤S201,第一神经网络可以在第二神经网络训练开始之前,先完成训练。
根据一些实施例,第一神经网路的训练过程可以为:获取样本用户特征和样本对象的对象特征,并标注样本用户特征和样本对象的对象特征的真实推荐结果,其中,样本用户特征包括至少一个样本用户子特征,样本对象的对象特征包括至少一个样本对象子特征;响应于样本用户特征和样本对象的对象特征输入第一神经网络,第一神经网络输出针对样本对象的第一预测推荐结果;基于真实推荐结果和第一预测推荐结果,确定损失值;基于损失值调整第一神经网络的参数。
根据一些实施例,第一神经网络的训练过程中所使用的样本用户特征和样本对象的对象特征可以与第二神经网络的训练过程中所使用的样本用户特征和样本对象的对象特征相同。可以理解,第一神经网络的训练过程中所使用的样本用户特征和样本对象的对象特征也可以与第二神经网络的训练过程中所使用的样本用户特征和样本对象的对象特征不同,在此不作限定。
针对步骤S203,根据一些实施例,样本对象的对象特征可包括样本场景标识,需强化样本特征为基于样本场景标识来确定。
针对步骤S206,根据一些实施例,可以仅基于真实推荐结果和第二预测推荐结果,确定损失值。
针对步骤S206,根据另一些实施例,可以基于真实推荐结果、第一预测推荐结果和第二预测推荐结果,确定损失值。由此,能够结合第一神经网络和第二神经网络输出的预测推荐结果来对神经网络进行训练,提升神经网络的训练效果。
在一个示例性实施例中,可以基于真实推荐结果和第一预测推荐结果与第二预测推荐结果的加权和,确定损失值。特别地,可以基于真实推荐结果和第一预测推荐结果与第二预测推荐结果的均值,确定损失值。
根据本公开的另一方面,如图3所示,还提供一种由计算机实现的神经网络300,神经网络300被配置用于接收用户特征和待推荐对象的对象特征以预测针对待推荐对象的最终推荐结果,神经网络300包括:第一神经网络301,被配置用于响应于输入用户特征和待推荐对象的对象特征,输出针对待推荐对象的第一推荐结果,其中,用户特征包括至少一个用户子特征,待推荐对象的对象特征包括至少一个推荐对象子特征;确定单元302,被配置用于确定需强化特征,其中,需强化特征包括至少一个用户子特征和至少一个推荐对象子特征中的一个或多个;第二神经网络303,被配置用于响应于输入第一推荐结果和需强化特征,输出针对待推荐对象的第二推荐结果;以及输出单元304,被配置用于至少基于第二推荐结果确定最终推荐结果。
根据一些实施例,待推荐对象的对象特征可包括推荐场景标识,确定单元可被配置用于基于推荐场景标识来确定需强化特征。
根据一些实施例,输出单元可被配置用于基于第一推荐结果和第二推荐结果来确定针对待推荐对象的最终推荐结果。
根据一些实施例,输出单元还可以被配置用于将第一推荐结果和第二推荐结果的加权和确定为最终推荐结果。
根据一些实施例,第一神经网络和第二神经网络中的一个或两个是全连接神经网络。
根据一些实施例,待推荐对象可以为包括以下一种或多种类型的数据:文字、音频和视频。
根据本公开的另一方面,还提供一种计算设备,包括:处理器;以及存储程序的存储器,程序包括指令,指令在由处理器执行时使处理器执行上述的推荐对象的方法和训练方法中的一种或多种。
根据本公开的另一方面,还提供一种存储程序的计算机可读存储介质,程序包括指令,指令在由计算设备的处理器执行时,致使计算设备执行上述的推荐对象的方法和训练方法中的一种或多种。
参见图4所示,现将描述计算设备4000,其是可以应用于本公开的各方面的硬件设备的示例。计算设备4000可以是被配置为执行处理和/或计算的任何机器,可以是但不限于工作站、服务器、台式计算机、膝上型计算机、平板计算机、个人数字助理、机器人、智能电话、车载计算机或其任何组合。上述生成方法可以全部或至少部分地由计算设备4000或类似设备或系统实现。
软件要素(程序)可以位于工作存储器4014中,包括但不限于操作系统4016、一个或多个应用程序4018、驱动程序和/或其他数据和代码。用于执行上述方法和步骤的指令可以被包括在一个或多个应用程序4018中,并且上述推荐对象的方法和训练方法中的一种或多种可以通过由处理器4004读取和执行一个或多个应用程序4018的指令来实现。更具体地,上述推荐对象的方法中,步骤S101~步骤S104可以例如通过处理器4004执行具有步骤S101~步骤S104的指令的应用程序4018而实现。上述训练方法中,步骤S201~步骤S207可以例如通过处理器4004执行具有步骤S201~步骤S207的指令的应用程序4018而实现。此外,上述推荐对象的方法和训练方法中的一种或多种的其它步骤可以例如通过处理器4004执行具有执行相应步骤中的指令的应用程序4018而实现。软件要素(程序)的指令的可执行代码或源代码可以存储在非暂时性计算机可读存储介质(例如上述存储设备4010)中,并且在执行时可以被存入工作存储器4014中(可能被编译和/或安装)。软件要素(程序)的指令的可执行代码或源代码也可以从远程位置下载。
还应该理解,可以根据具体要求而进行各种变型。例如,也可以使用定制硬件,和/或可以用硬件、软件、固件、中间件、微代码,硬件描述语言或其任何组合来实现特定元件。例如,所公开的方法和设备中的一些或全部可以通过使用根据本公开的逻辑和算法,用汇编语言或硬件编程语言(诸如VERILOG,VHDL,C++)对硬件(例如,包括现场可编程门阵列(FPGA)和/或可编程逻辑阵列(PLA)的可编程逻辑电路)进行编程来实现。
还应该理解,前述方法可以通过服务器-客户端模式来实现。例如,客户端可以接收用户输入的数据并将数据发送到服务器。客户端也可以接收用户输入的数据,进行前述方法中的一部分处理,并将处理所得到的数据发送到服务器。服务器可以接收来自客户端的数据,并且执行前述方法或前述方法中的另一部分,并将执行结果返回给客户端。客户端可以从服务器接收到方法的执行结果,并例如可以通过输出设备呈现给用户。服务器可以为分布式系统的服务器,或者是结合了区块链的服务器。服务器也可以是云服务器,或者是带人工智能技术的智能云计算服务器或智能云主机。
还应该理解,计算设备4000的组件可以分布在网络上。例如,可以使用一个处理器执行一些处理,而同时可以由远离该一个处理器的另一个处理器执行其他处理。计算系统4000的其他组件也可以类似地分布。这样,计算设备4000可以被解释为在多个位置执行处理的分布式计算系统。
虽然已经参照附图描述了本公开的实施例或示例,但应理解,上述的方法、系统和设备仅仅是示例性的实施例或示例,本发明的范围并不由这些实施例或示例限制,而是仅由授权后的权利要求书及其等同范围来限定。实施例或示例中的各种要素可以被省略或者可由其等同要素替代。此外,可以通过不同于本公开中描述的次序来执行各步骤。进一步地,可以以各种方式组合实施例或示例中的各种要素。重要的是随着技术的演进,在此描述的很多要素可以由本公开之后出现的等同要素进行替换。

Claims (17)

1.一种由计算机实现的利用神经网络向用户推荐对象的方法,其中,所述神经网络包括第一神经网络和第二神经网络,所述方法包括:
将用户特征和待推荐对象的对象特征输入所述第一神经网络,获取所述第一神经网络输出的针对所述待推荐对象的第一推荐结果,其中,所述用户特征包括至少一个用户子特征,所述待推荐对象的对象特征包括至少一个推荐对象子特征;
确定需强化特征,其中,所述需强化特征包括所述至少一个用户子特征和所述至少一个推荐对象子特征中的一个或多个;
将所述第一推荐结果和所述需强化特征输入所述第二神经网络,获取所述第二神经网络输出的针对所述待推荐对象的第二推荐结果;
至少基于所述第二推荐结果,确定针对所述待推荐对象的最终推荐结果。
2.如权利要求1所述的方法,其中,所述待推荐对象的对象特征包括推荐场景标识,所述需强化特征为基于所述推荐场景标识来确定。
3.如权利要求1所述的方法,其中,所述针对所述待推荐对象的最终推荐结果为基于所述第一推荐结果和所述第二推荐结果来确定。
4.如权利要求3所述的方法,其中,所述针对所述待推荐对象的最终推荐结果为所述第一推荐结果和所述第二推荐结果的加权和。
5.如权利要求1所述的方法,其中,所述第一神经网络和所述第二神经网络中的一个或两个是全连接神经网络。
6.如权利要求1至5中任一项所述的方法,其中,所述待推荐对象为包括以下一种或多种类型的数据:文字、音频和视频。
7.一种由计算机实现的神经网络的训练方法,所述神经网络包括第一神经网络和第二神经网络,所述训练方法包括:
训练完成第一神经网络;
获取样本用户特征和样本对象的对象特征,并标注针对所述样本对象的真实推荐结果,其中,所述样本用户特征包括至少一个样本用户子特征,所述样本对象的对象特征包括至少一个样本对象子特征;
确定需强化样本特征,其中,所述需强化样本特征包括所述至少一个样本用户子特征和所述至少一个样本对象子特征中的一个或多个;
响应于所述样本用户特征和所述样本对象的对象特征输入所述第一神经网络,所述第一神经网络输出针对所述样本对象的第一预测推荐结果;
响应于所述第一预测推荐结果和所述需强化样本特征输入所述第二神经网络,所述第二神经网络输出针对所述样本对象的第二预测推荐结果;
至少基于所述真实推荐结果和所述第二预测推荐结果,确定损失值;
基于所述损失值调整所述第二神经网络的参数。
8.如权利要求7所述的训练方法,其中,所述样本对象的对象特征包括样本场景标识,所述需强化样本特征为基于所述样本场景标识来确定。
9.如权利要求7所述的训练方法,其中,所述确定损失值为基于所述真实推荐结果、所述第一预测推荐结果和所述第二预测推荐结果来确定。
10.一种由计算机实现的神经网络,所述神经网络被配置用于接收用户特征和待推荐对象的对象特征以预测针对所述待推荐对象的最终推荐结果,所述神经网络包括:
第一神经网络,被配置用于响应于输入用户特征和待推荐对象的对象特征,输出针对所述待推荐对象的第一推荐结果,其中,所述用户特征包括至少一个用户子特征,所述待推荐对象的对象特征包括至少一个推荐对象子特征;
确定单元,被配置用于确定需强化特征,其中,所述需强化特征包括所述至少一个用户子特征和所述至少一个推荐对象子特征中的一个或多个;
第二神经网络,被配置用于响应于输入所述第一推荐结果和需强化特征,输出针对所述待推荐对象的第二推荐结果;以及
输出单元,被配置用于至少基于所述第二推荐结果确定所述最终推荐结果。
11.如权利要求10所述的神经网络,其中,所述待推荐对象的对象特征包括推荐场景标识,所述确定单元被配置用于基于所述推荐场景标识来确定需强化特征。
12.如权利要求10所述的神经网络,其中,所述输出单元被配置用于基于所述第一推荐结果和所述第二推荐结果来确定针对所述待推荐对象的最终推荐结果。
13.如权利要求12所述的神经网络,其中,所述输出单元还被配置用于将所述第一推荐结果和所述第二推荐结果的加权和确定为所述最终推荐结果。
14.如权利要求10所述的神经网络,其中,所述第一神经网络和所述第二神经网络中的一个或两个是全连接神经网络。
15.如权利要求10至14中任一项所述的神经网络,其中,所述待推荐对象为包括以下一种或多种类型的数据:文字、音频和视频。
16.一种计算设备,所述计算设备包括:
处理器;以及
存储程序的存储器,所述程序包括指令,所述指令在由所述处理器执行时使所述处理器执行根据权利要求1-9中任一项所述的方法。
17.一种存储程序的计算机可读存储介质,所述程序包括指令,所述指令在由计算设备的处理器执行时,致使所述计算设备执行根据权利要求1-9中任一项所述的方法。
CN202011280880.4A 2020-11-16 2020-11-16 推荐对象的方法、神经网络及其训练方法、设备和介质 Active CN112347361B (zh)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CN202011280880.4A CN112347361B (zh) 2020-11-16 2020-11-16 推荐对象的方法、神经网络及其训练方法、设备和介质
KR1020210070758A KR102502985B1 (ko) 2020-11-16 2021-06-01 대상 추천 방법, 신경망 및 그 훈련 방법, 장치 및 매체
JP2021100755A JP7194233B2 (ja) 2020-11-16 2021-06-17 オブジェクト推薦方法、ニューラルネットワークおよびそのトレーニング方法、装置ならびに媒体
EP21180127.9A EP4002216A1 (en) 2020-11-16 2021-06-17 Method for recommending object, neural network, computer program product and computer-readable storage medium
US17/352,224 US20210312290A1 (en) 2020-11-16 2021-06-18 Method for recommending object, computing device and computer-readable storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011280880.4A CN112347361B (zh) 2020-11-16 2020-11-16 推荐对象的方法、神经网络及其训练方法、设备和介质

Publications (2)

Publication Number Publication Date
CN112347361A true CN112347361A (zh) 2021-02-09
CN112347361B CN112347361B (zh) 2024-03-01

Family

ID=74362884

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011280880.4A Active CN112347361B (zh) 2020-11-16 2020-11-16 推荐对象的方法、神经网络及其训练方法、设备和介质

Country Status (5)

Country Link
US (1) US20210312290A1 (zh)
EP (1) EP4002216A1 (zh)
JP (1) JP7194233B2 (zh)
KR (1) KR102502985B1 (zh)
CN (1) CN112347361B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113205183A (zh) * 2021-04-23 2021-08-03 北京达佳互联信息技术有限公司 物品推荐网络训练方法、装置、电子设备及存储介质
CN113378082A (zh) * 2021-07-05 2021-09-10 北京百度网讯科技有限公司 一种信息推荐方法、装置、电子设备以及存储介质
CN113420227A (zh) * 2021-07-21 2021-09-21 北京百度网讯科技有限公司 点击率预估模型的训练方法、预估点击率的方法、装置

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114925279A (zh) * 2022-06-07 2022-08-19 支付宝(杭州)信息技术有限公司 推荐模型训练方法、推荐方法以及装置

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005521144A (ja) * 2002-03-19 2005-07-14 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 複数の推薦スコアを用いる推薦システム
CN107885889A (zh) * 2017-12-13 2018-04-06 聚好看科技股份有限公司 搜索结果的反馈方法、展示方法及装置
US20180276734A1 (en) * 2016-07-12 2018-09-27 Tencent Technology (Shenzhen) Company Limited Information push method and apparatus, server, and storage medium
CN110378726A (zh) * 2019-07-02 2019-10-25 阿里巴巴集团控股有限公司 一种目标用户的推荐方法、系统以及电子设备
CN110428231A (zh) * 2019-08-06 2019-11-08 重庆仙桃前沿消费行为大数据有限公司 行政信息推荐方法、装置、设备及可读存储介质
CN110532372A (zh) * 2019-07-15 2019-12-03 电子科技大学 一种基于神经协同过滤挖掘深层特征的文本对象精准推送方法
CN110807150A (zh) * 2019-10-14 2020-02-18 腾讯科技(深圳)有限公司 信息处理方法及装置、电子设备和计算机可读存储介质
CN110838020A (zh) * 2019-09-16 2020-02-25 平安科技(深圳)有限公司 基于向量迁移的推荐方法、装置、计算机设备及存储介质
CN111523044A (zh) * 2020-07-06 2020-08-11 南京梦饷网络科技有限公司 用于推荐目标对象的方法、计算设备和计算机存储介质
CN111680213A (zh) * 2019-03-11 2020-09-18 阿里巴巴集团控股有限公司 信息推荐方法、数据处理方法及装置

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3544577B2 (ja) * 1995-03-30 2004-07-21 株式会社日立製作所 経路選択装置
JP2000298662A (ja) 1999-04-15 2000-10-24 Sharp Corp 自動情報検出装置
US7472097B1 (en) * 2005-03-23 2008-12-30 Kronos Talent Management Inc. Employee selection via multiple neural networks
KR102034668B1 (ko) * 2017-07-18 2019-11-08 한국과학기술원 이종 컨텐츠 추천 모델 제공 장치 및 방법
US10825219B2 (en) 2018-03-22 2020-11-03 Northeastern University Segmentation guided image generation with adversarial networks
KR102116264B1 (ko) * 2018-04-02 2020-06-05 카페24 주식회사 대표이미지 추천 방법 및 장치, 및 시스템
JP7079483B2 (ja) 2018-06-18 2022-06-02 国立研究開発法人産業技術総合研究所 情報処理方法、システム及びプログラム
US11615289B2 (en) 2018-06-28 2023-03-28 Oracle International Corporation Configuration price quote with enhanced approval control
KR102107055B1 (ko) 2018-12-26 2020-05-06 건국대학교 산학협력단 기계학습 기반의 스포츠 중계 영상 추천 방법 및 장치
CN111090993A (zh) 2019-12-30 2020-05-01 北京声智科技有限公司 属性对齐模型训练方法及装置
CN111414539B (zh) 2020-03-19 2023-09-01 清华大学 基于特征增强的推荐系统神经网络训练方法及装置

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005521144A (ja) * 2002-03-19 2005-07-14 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 複数の推薦スコアを用いる推薦システム
US20180276734A1 (en) * 2016-07-12 2018-09-27 Tencent Technology (Shenzhen) Company Limited Information push method and apparatus, server, and storage medium
CN107885889A (zh) * 2017-12-13 2018-04-06 聚好看科技股份有限公司 搜索结果的反馈方法、展示方法及装置
CN111680213A (zh) * 2019-03-11 2020-09-18 阿里巴巴集团控股有限公司 信息推荐方法、数据处理方法及装置
CN110378726A (zh) * 2019-07-02 2019-10-25 阿里巴巴集团控股有限公司 一种目标用户的推荐方法、系统以及电子设备
CN110532372A (zh) * 2019-07-15 2019-12-03 电子科技大学 一种基于神经协同过滤挖掘深层特征的文本对象精准推送方法
CN110428231A (zh) * 2019-08-06 2019-11-08 重庆仙桃前沿消费行为大数据有限公司 行政信息推荐方法、装置、设备及可读存储介质
CN110838020A (zh) * 2019-09-16 2020-02-25 平安科技(深圳)有限公司 基于向量迁移的推荐方法、装置、计算机设备及存储介质
CN110807150A (zh) * 2019-10-14 2020-02-18 腾讯科技(深圳)有限公司 信息处理方法及装置、电子设备和计算机可读存储介质
CN111523044A (zh) * 2020-07-06 2020-08-11 南京梦饷网络科技有限公司 用于推荐目标对象的方法、计算设备和计算机存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
胡旷达;代飞;: "一种基于神经网络模型的多检索词用户兴趣模型", 九江职业技术学院学报, no. 01 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113205183A (zh) * 2021-04-23 2021-08-03 北京达佳互联信息技术有限公司 物品推荐网络训练方法、装置、电子设备及存储介质
CN113205183B (zh) * 2021-04-23 2024-05-14 北京达佳互联信息技术有限公司 物品推荐网络训练方法、装置、电子设备及存储介质
CN113378082A (zh) * 2021-07-05 2021-09-10 北京百度网讯科技有限公司 一种信息推荐方法、装置、电子设备以及存储介质
CN113420227A (zh) * 2021-07-21 2021-09-21 北京百度网讯科技有限公司 点击率预估模型的训练方法、预估点击率的方法、装置
CN113420227B (zh) * 2021-07-21 2024-05-14 北京百度网讯科技有限公司 点击率预估模型的训练方法、预估点击率的方法、装置

Also Published As

Publication number Publication date
JP2021152941A (ja) 2021-09-30
CN112347361B (zh) 2024-03-01
KR102502985B1 (ko) 2023-02-23
JP7194233B2 (ja) 2022-12-21
KR20210074246A (ko) 2021-06-21
US20210312290A1 (en) 2021-10-07
EP4002216A1 (en) 2022-05-25

Similar Documents

Publication Publication Date Title
CN112347361B (zh) 推荐对象的方法、神经网络及其训练方法、设备和介质
CN111144937B (zh) 广告素材确定方法、装置、设备及存储介质
CN111966914B (zh) 基于人工智能的内容推荐方法、装置和计算机设备
CN112164391A (zh) 语句处理方法、装置、电子设备及存储介质
KR20190028235A (ko) 클래스 인식을 위한 뉴럴 네트워크 학습 방법 및 디바이스
CN113254785B (zh) 推荐模型训练方法、推荐方法和相关设备
CN113627447B (zh) 标签识别方法、装置、计算机设备、存储介质及程序产品
CN116664719B (zh) 一种图像重绘模型训练方法、图像重绘方法及装置
CN110377733B (zh) 一种基于文本的情绪识别方法、终端设备及介质
CN115223020B (zh) 图像处理方法、装置、设备、存储介质及计算机程序产品
KR102476679B1 (ko) 객체 탐지 장치 및 방법
CN113723070B (zh) 文本相似度模型训练方法、文本相似度检测方法及装置
CN114091594A (zh) 模型训练方法及装置、设备、存储介质
CN112819024A (zh) 模型处理方法、用户数据处理方法及装置、计算机设备
CN112667803A (zh) 一种文本情感分类方法及装置
CN112102015B (zh) 物品推荐方法、元网络处理方法、装置、存储介质和设备
US11727338B2 (en) Controlling submission of content
CN114898156B (zh) 基于跨模态语义表征学习和融合的图像分类方法及系统
CN115186085A (zh) 回复内容处理方法以及媒体内容互动内容的交互方法
CN115131600A (zh) 检测模型训练方法、检测方法、装置、设备及存储介质
CN112149426B (zh) 阅读任务处理方法及相关设备
CN111552827B (zh) 标注方法和装置、行为意愿预测模型训练方法和装置
CN112417260A (zh) 本地化推荐方法、装置及存储介质
CN116610783B (zh) 基于人工智能决策的服务优化方法及数字化在线页面系统
CN113609275B (zh) 信息处理方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant