CN110659962B - 一种商品信息输出方法及相关装置 - Google Patents

一种商品信息输出方法及相关装置 Download PDF

Info

Publication number
CN110659962B
CN110659962B CN201910893796.0A CN201910893796A CN110659962B CN 110659962 B CN110659962 B CN 110659962B CN 201910893796 A CN201910893796 A CN 201910893796A CN 110659962 B CN110659962 B CN 110659962B
Authority
CN
China
Prior art keywords
commodity
vector
embedded
interaction probability
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910893796.0A
Other languages
English (en)
Other versions
CN110659962A (zh
Inventor
赵朋朋
刘建
周晓方
崔志明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou University
Original Assignee
Suzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou University filed Critical Suzhou University
Priority to CN201910893796.0A priority Critical patent/CN110659962B/zh
Publication of CN110659962A publication Critical patent/CN110659962A/zh
Application granted granted Critical
Publication of CN110659962B publication Critical patent/CN110659962B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0641Shopping interfaces
    • G06Q30/0643Graphical representation of items or shoppers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种商品信息输出方法,通过在商品信息输出的过程中加入美学特征,考虑到被输出商品的多样性,从而缓解数据稀疏性问题,并且在第一商品和第二商品之间进行交叉迁移,整合来自不同领域中的用户偏好特征,使得推荐输出的参考要素增多,而不是只采用用户的历史数据进行推荐展示,提高商品推荐展示的准确性,以便向用户输出感兴趣的商品,提高用户的体验。本申请还公开了一种输出商品信息的计算机设备、计算机设备以及计算机可读存储介质,具有以上有益效果。

Description

一种商品信息输出方法及相关装置
技术领域
本申请涉及计算机技术领域,特别涉及一种商品信息输出方法、输出商品信息的计算机设备、计算机设备以及计算机可读存储介质。
背景技术
随着移动互联网技术的不断发展,网络中的信息量迅速增加。为了给用户提供更多的适合的信息和服务,需要通过推荐系统对用户在信息获取过程中的喜好程度进行预测,以便进行信息过滤。
目前,现有技术中一般通过用户的历史访问记录对用户进行相应商品的推荐,以便向用户推荐合适的商品。同样,也提高了被推荐商品和用户之间的交互概率。
但是,现有的商品展示推荐的过程,仅仅通过用户的历史访问记录进行推荐,可参考的数据太少,训练数据的稀疏性较高,往往推荐不到合适的商品,降低商品推荐展示的有效程度。
因此,如何提高商品推荐展示的有效程度是本领域技术人员关注的重点问题。
发明内容
本申请的目的是提供一种商品信息输出方法、输出商品信息的计算机设备、计算机设备以及计算机可读存储介质,通过在算法中加入商品的美学特征,计算出不同商品的交互概率,保持交互概率的精度和准确性,再根据交互概率对商品信息进行展示,提高用户的体验及满意程度。
为解决上述技术问题,本申请提供一种商品信息输出方法,应用于输出商品信息的计算机设备,所述方法包括:
采用预先训练的深度美学神经网络分别对第一商品的图像数据和第二商品的图像数据进行美学特征提取,得到第一美学特征向量和第二美学特征向量;
对所述第一商品和所述第二商品分别进行嵌入向量提取处理,得到第一嵌入向量和第二嵌入向量,将所述第一嵌入向量和所述第一美学特征向量拼接成第一输入向量,将所述第二嵌入向量和所述第二美学特征向量拼接成第二输入向量;
将所述第一输入向量和所述第二输入向量输入到交叉迁移网络进行处理,得到第一交互概率和第二交互概率;
根据所述第一交互概率和所述第二交互概率的比较结果对所述第一商品的信息和所述第二商品的信息进行输出。
可选的,对所述第一商品和所述第二商品分别进行嵌入向量提取处理,得到第一嵌入向量和第二嵌入向量,将所述第一嵌入向量和所述第一美学特征向量拼接成第一输入向量,将所述第二嵌入向量和所述第二美学特征向量拼接成第二输入向量,包括:
将所述第一商品的历史记录信息以及所述第二商品的历史记录信息分别映射到低维连续空间,得到第一商品嵌入矩阵以及第二商品嵌入矩阵,对所述用户信息进行处理得到用户嵌入矩阵;
根据所述第一商品嵌入矩阵和所述第二商品嵌入矩阵对所述用户嵌入矩阵进行处理,得到所述第一嵌入向量和所述第二嵌入向量;
将所述第一嵌入向量和所述第一美学特征向量拼接成第一输入向量;
将所述第二嵌入向量和所述第二美学特征向量拼接成第二输入向量。
可选的,将所述第一输入向量和所述第二输入向量输入到交叉迁移网络进行处理,得到第一交互概率和第二交互概率,包括:
采用稀疏法优化的关系矩阵,将所述第一输入向量的领域知识和所述第二输入向量的领域知识通过交叉迁移网络进行处理;
通过所述交叉迁移网络的输出层得到所述第一交互概率和所述第二交互概率。
可选的,通过所述交叉迁移网络的输出层得到所述第一交互概率和所述第二交互概率,包括:
采用softmax函数对所述交叉迁移网络的输出层的数据进行计算,得到所述第一交互概率和所述第二交互概率。
本申请还提供一种输出商品信息的计算机设备,包括:
美学特征提取模块,用于采用预先训练的深度美学神经网络分别对第一商品的图像数据和第二商品的图像数据进行美学特征提取,得到第一美学特征向量和第二美学特征向量;
特征融合模块,用于对所述第一商品和所述第二商品分别进行嵌入向量提取处理,得到第一嵌入向量和第二嵌入向量,将所述第一嵌入向量和所述第一美学特征向量拼接成第一输入向量,将所述第二嵌入向量和所述第二美学特征向量拼接成第二输入向量;
交互概率获取模块,用于将所述第一输入向量和所述第二输入向量输入到交叉迁移网络进行处理,得到第一交互概率和第二交互概率;
商品信息输出模块,用于根据所述第一交互概率和所述第二交互概率的比较结果对所述第一商品的信息和所述第二商品的信息进行输出。
可选的,所述特征融合模块,包括:
低维映射单元,用于将所述第一商品的历史记录信息以及所述第二商品的历史记录信息分别映射到低维连续空间,得到第一商品嵌入矩阵以及第二商品嵌入矩阵,对所述用户信息进行处理得到用户嵌入矩阵;
矩阵处理单元,用于根据所述第一商品嵌入矩阵和所述第二商品嵌入矩阵对所述用户嵌入矩阵进行处理,得到所述第一嵌入向量和所述第二嵌入向量;
第一输入向量获取单元,用于将所述第一嵌入向量和所述第一美学特征向量拼接成第一输入向量;
第二输入向量获取单元,用于将所述第二嵌入向量和所述第二美学特征向量拼接成第二输入向量。
可选的,所述交互概率获取模块,包括:
知识迁移单元,用于采用稀疏法优化的关系矩阵,将所述第一输入向量的领域知识和所述第二输入向量的领域知识通过交叉迁移网络进行处理;
概率输出单元,用于通过所述交叉迁移网络的输出层得到所述第一交互概率和所述第二交互概率。
可选的,所述概率输出单元,具体用于采用softmax函数对所述交叉迁移网络的输出层的数据进行计算,得到所述第一交互概率和所述第二交互概率。
本申请还提供一种计算机设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如上所述的商品信息输出方法的步骤。
本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的商品信息输出方法的步骤。
本申请所提供的一种商品信息输出方法,应用于输出商品信息的计算机设备,所述方法包括:采用预先训练的深度美学神经网络分别对第一商品的图像数据和第二商品的图像数据进行美学特征提取,得到第一美学特征向量和第二美学特征向量;对所述第一商品和所述第二商品分别进行嵌入向量提取处理,得到第一嵌入向量和第二嵌入向量,将所述第一嵌入向量和所述第一美学特征向量拼接成第一输入向量,将所述第二嵌入向量和所述第二美学特征向量拼接成第二输入向量;将所述第一输入向量和所述第二输入向量输入到交叉迁移网络进行处理,得到第一交互概率和第二交互概率;根据所述第一交互概率和所述第二交互概率的比较结果对所述第一商品的信息和所述第二商品的信息进行输出。
通过在商品展示的过程中加入美学特征,考虑到被输出商品的多样性,从而缓解数据稀疏性问题,并且在第一商品和第二商品之间进行交叉迁移,整合来自不同领域中的用户偏好特征,使得推荐输出的参考要素增多,而不是只采用用户的历史数据进行推荐展示,提高商品推荐展示的准确性和精度,以便向用户输出感兴趣的商品,提高用户的体验。
本申请还提供一种输出商品信息的计算机设备、计算机设备以及计算机可读存储介质,具有以上有益效果,在此不作赘述。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例所提供的一种商品信息输出方法的流程图;
图2为本申请实施例所提供的一种输出商品信息的计算机设备的结构示意图。
具体实施方式
本申请的核心是提供一种商品信息输出方法、输出商品信息的计算机设备、计算机设备以及计算机可读存储介质,通过在算法中加入商品的美学特征,计算出不同商品的交互概率,保持交互概率的精度和准确性,再根据交互概率对商品信息进行展示,提高用户的体验及满意程度。
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
现有技术中一般通过用户的历史访问记录对用户进行相应商品的推荐,以便向用户推荐合适的商品。同样,也提高了被推荐商品和用户之间的交互概率。但是,现有的商品展示推荐的过程,仅仅通过用户的历史访问记录进行推荐,可参考的数据太少,训练数据的稀疏性较高,往往推荐不到合适的商品,降低商品推荐展示的有效程度。
因此,本申请提供一种商品信息输出方法,通过在商品展示的过程中加入美学特征,考虑到被输出商品的多样性,从而缓解数据稀疏性问题,并且在第一商品和第二商品之间进行交叉迁移,整合来自不同领域中的用户偏好特征,使得推荐输出的参考要素增多,而不是只采用用户的历史数据进行推荐展示,提高商品推荐展示的准确性和精度,以便向用户输出感兴趣的商品,提高用户的体验。
请参考图1,图1为本申请实施例所提供的一种商品信息输出方法的流程图。
本实施例中,该方法可以包括:
S101,采用预先训练的深度美学神经网络分别对第一商品的图像数据和第二商品的图像数据进行美学特征提取,得到第一美学特征向量和第二美学特征向量;
本步骤旨在从每个商品的图像数据中提取出对应的美学特征,以便在后续采用网络进行识别时,可以参考每个商品的美学特征,以便提高商品推荐的精度和准确性,保持用户的体验。
本实施例中,主要是采用两个商品进行商品信息输出,其中,一个商品对应的识别网络的知识是丰富的,且数据不稀疏,另一个商品对应的识别网络的知识是不丰富的,且数据稀疏,只采用该网络进行识别无法达到较好的识别效果。采用知识丰富的识别网络与该识别网络进行交叉迁移,提高该识别网络的识别效率。因此,本实施例中同时对两个商品进行操作,分别是第一商品和第二商品。
S102,对第一商品和第二商品分别进行嵌入向量提取处理,得到第一嵌入向量和第二嵌入向量,将第一嵌入向量和第一美学特征向量拼接成第一输入向量,将第二嵌入向量和第二美学特征向量拼接成第二输入向量;
在S101的基础上,本步骤旨在对第一商品、第二商品以及用户的历史记录信息,进行嵌入向量提取处理,得到第一嵌入向量和第二嵌入向量。其中,第一嵌入向量包括第一用户嵌入向量和第一项目(商品)嵌入向量,第二嵌入向量包括第二用户嵌入向量和第二项目(商品)嵌入向量。最后将第一嵌入向量和第一美学特征向量拼接成第一输入向量,将第二嵌入向量和第二美学特征向量拼接成第二输入向量。就是将多个特征向量融合为一个特征向量,以便输入到学习网络中。
可选的,本步骤可以包括:
步骤一,将所述第一商品的历史记录信息以及所述第二商品的历史记录信息分别映射到低维连续空间,得到第一商品嵌入矩阵以及第二商品嵌入矩阵,对所述用户信息进行处理得到用户嵌入矩阵;
步骤二,根据第一商品嵌入矩阵和第二商品嵌入矩阵对用户嵌入矩阵进行处理,得到第一嵌入向量和第二嵌入向量;
步骤三,将第一嵌入向量和第一美学特征向量拼接成第一输入向量;
步骤四,将第二嵌入向量和第二美学特征向量拼接成第二输入向量。
S103,将第一输入向量和第二输入向量输入到交叉迁移网络进行处理,得到第一交互概率和第二交互概率;
在S102的基础上,本步骤旨在通过交叉迁移网络对第一输入向量和第二输入向量进行识别,得到第一交互概率和第二交互概率。
其中,迁移网络给定了源域(source domain)和源任务(source task)、目标域(target domain)和目标任务(target task),利用源域在解决任务中获得一些知识来提升目标任务的学习网络。也就是采用源域的知识补充目标域中的知识,以便目标域可以更好的对目标任务进行识别。
进一步的,交叉迁移网络就是源域的知识提升目标域的任务处理,目标域的知识同样可以提升源域的任务处理,即源域和目标域之间相互参考知识。
进一步的,本实施例中是采用关系矩阵控制源域与目标域之间的学习关系。为了达到更好的交叉迁移的学习效果,去除冗余的参数,本实施例中采用稀疏法优化该关系矩阵,以达到更好交叉学习的效果。
其中,交互概率是指用户与该商品发生交互的概率,当交互概率越大时,用户购买、使用、了解该商品的可能性就越大。将交互概率较大的商品输出至该用户的设备时,就越有可能促使该用户了解该商品,而不是输出用户不感兴趣的商品信息,提高用户体验。
可选的,本步骤可以包括:
步骤一,采用稀疏法优化的关系矩阵,将第一输入向量的领域知识和第二输入向量的领域知识通过交叉迁移网络进行处理;
步骤二,通过交叉迁移网络的输出层得到第一交互概率和第二交互概率。
可选的,该步骤二可以包括:
采用softmax函数对交叉迁移网络的输出层的数据进行计算,得到第一交互概率和第二交互概率。
S104,根据第一交互概率和第二交互概率的比较结果对第一商品的信息和第二商品的信息进行输出。
在S103的基础上,本步骤旨在根据第一交互概率和第二交互概率的比较结果对第一商品的信息和第二商品的信息进行输出。
其中,该比较结果包括第一交互概率大于第二交互概率、第一交互概率小于第二交互概率、第一交互概率等于第二交互概率。
进而将不同的商品的信息进行输出的方式可以是将交互概率较大的商品信息排在第一位输出,也可以是只输出交互概率大的商品信息,还可以是在预设时间段输出交互概率最大的商品信息,在其他时段输出交互概率小的商品信息。可见,本实施例中输出商品信息的方式并不唯一,在此不做具体限定。但是,均根据不同交互概率进行输出,将交互概率作为参数后,可以提高用户与该商品信息产生概率的可能性,避免输出用户不感兴趣的商品信息,提高用户体验。
综上,本实施例通过在商品展示的过程中加入美学特征,考虑到被输出商品的多样性,从而缓解数据稀疏性问题,并且在第一商品和第二商品之间进行交叉迁移,整合来自不同领域中的用户偏好特征,使得推荐输出的参考要素增多,而不是只采用用户的历史数据进行推荐展示,提高商品推荐展示的准确性和精度,以便向用户输出感兴趣的商品,提高用户的体验。
以下通过一个更具体的实施例,对本申请提供的一种商品信息输出方法进行说明。
首先,用T表示目标领域,用S表示源域。两个领域共享m个用户,用集合U={u1,u2,......,um}表示源域。源域中的项目用集合Is表示,nS表示数量。目标领域中的项目用集合IT表示,nT表示数量。用矩阵
Figure BDA0002209601000000081
表示源域中的用户-项目交互矩阵,矩阵中的数值为0或者1,若用户购买过项目记为1,否则为0。在目标领域中,
Figure BDA0002209601000000082
表示用户-项目交互矩阵。
本实施例中,采用的计算模型分为4部分,第一部分是美学特征提取层(AestheticFeature Extraction),利用美学网络来提取项目图片中的美学特征;第二部分是嵌入层(Embedding Layer),将user(用户)和item(项目)映射到连续的低维空间;第三部分是交叉迁移层(Cross Transfer Layer),采用双向交叉迁移网络来进行领域间的知识迁移;第四部分是输出层(Output Layer),为每个用户生成一个排序后的项目列表。
其中,美学特征提取层主要是利用预先训练的深度美学神经网络ILGNet从项目图像中提取美学特征。其中,ILGNet(I:Inception,L:Local,G:Global)是一种新颖的深度卷积神经网络,将初始模块引入图像美学分类,可以提取美学特征,从低级水平到高水平。该网络连接局部特征层到全局特征层形成1024维的美学特征向量。具体地,考虑第一和第二初始层,提取局部图像特征并考虑最后一个初始层,在经过两个最大池和一个均值池化之后提取全局图像特征。然后,我们连接前两个的输出初始层(每个维度为256维)和最后一个inception层(512维)形成1024维的整体美学特征向量。对于源域和目标领域中的每个项目都会得到对应的美学特征向量
Figure BDA0002209601000000097
Figure BDA0002209601000000098
其中,j和i分别表示源域和目标域项目的索引。
然后,嵌入层类似于自然语言处理中的离散词汇符号表示,原始的user和item的ID的表示能力有限。因此,第一步将user和item映射到两个低维连续空间中,分别记作
Figure BDA0002209601000000091
矩阵U表示用户嵌入矩阵user_embedding,矩阵VS和矩阵VT分别表示映射得到的源域和目标域的项目嵌入矩阵(item_embedding),K表示低维空间的维度。最后,对于目标领域中的每一个项目,将其用户嵌入向量xu、项目嵌入向量xi和美学特征向量
Figure BDA0002209601000000099
拼接得到一个新的特征表示向量xui
随后,采用交叉迁移层进行处理。其中,交叉迁移网络的核心就是采用关系矩阵H来进行领域间的知识迁移。目标领域可以获得源域的知识,反之亦然。对于单个领域,采用的是前馈神经网络,本实施例中采用2层。对于目标领域中,本领域中传递的知识信息用权重矩阵Wt l来控制,接受来自源域的知识信息用关系矩阵Hl来控制。相似的,在源域中,我们用权重矩阵Ws l和关系矩阵Hl来控制。其中,l表示前馈神经网络的层数。
具体公式表示如下:
Figure BDA0002209601000000092
Figure BDA0002209601000000093
其中σ是RELU(Rectified Linear Unit线性整流函数)激活函数,l+1层表示
Figure BDA0002209601000000094
接受两个信息流:一个是本领域(目标领域)的输入,由Wt l控制,另一个是来自源域的信息,由关系矩阵Hl控制。
Figure BDA0002209601000000095
可参考
Figure BDA0002209601000000096
可见,本实施例中是双向的知识迁移,从源域到目标域,从目标域到源域,可以使各个网络互相提升,提高效果。
很显然,关系矩阵Hl对于我们的方法至关重要。因为,该矩阵控制着源域的知识迁移,在交叉迁移的过程中只需要迁移对提高目标领域推荐准确性有用的知识信息,过滤掉冗余知识信息。因此,本实施例对关系矩阵Hl进行优化,具体采用稀疏方法——l1正则进行优化。具体的公式如下:
Figure BDA0002209601000000101
其中,hi,j是关系矩阵中的元素,λ为超参数,用于控制稀疏性,r*q表示关系矩阵的维度。
最后,交叉迁移层最后一层的输出为zui,最后采用softmax函数得到最终输出:
Figure BDA0002209601000000102
其中,h是参数。
Figure BDA0002209601000000103
的值表示用户u与项目i交互的可能性大小。
进一步的,可以采用多个优化方法对以上过程中的网络进行优化。其中可以采用的优化方法包括但不限于梯度上升算法、反向传播算法。
其中,梯度上升法是比较常用的优化算法。梯度上升法基于的思想是:找到某函数的最大值,最好的方法是沿着该函数的梯度方向探寻。如果梯度记为
Figure BDA0002209601000000104
则函数f(x,y)的梯度可表示为:
Figure BDA0002209601000000105
其中,该梯度意味着要沿x的方向移动
Figure BDA0002209601000000106
沿y的方向移动
Figure BDA0002209601000000107
其中,函数f(x,y)必须在待计算的点上有定义且可微。在每次迭代中,梯度上升算法都会沿梯度方向移动一步。其中,梯度算子总是指向函数值增长最快的方向。这里所说的是移动方向,而没有提及移动量大小。该量值称为步长,记作α。梯度上升的迭代公式可以表示为:
Figure BDA0002209601000000108
该公式将一直被迭代执行,直至达到某个停止条件为止。比如迭代次数达到某个指定值或算法达到某个可以允许的误差范围。
其中,反向传播算法,即BP算法,是在有导师指导下,适合于多层神经元网络的一种学习算法,它建立在梯度下降法的基础上。BP网络的输入输出关系实质上是一种映射关系:一个输入m输出的BP神经网络所完成的功能是从n维欧氏空间向m维欧氏空间中一有限域的连续映射,这一映射具有高度非线性。它的信息处理能力来源于简单非线性函数的多次复合,因此具有很强的函数复现能力。这是BP算法得以应用的基础。反向传播算法主要由两个环节(激励传播、权重更新)反复循环迭代,直到网络的对输入的响应达到预定的目标范围为止。
BP算法的学习过程由正向传播过程和反向传播过程组成。在正向传播过程中,输入信息通过输入层经隐含层,逐层处理并传向输出层。如果在输出层得不到期望的输出值,则取输出与期望的误差的平方和作为目标函数,转入反向传播,逐层求出目标函数对各神经元权值的偏导数,构成目标函数对权值向量的梯量,作为修改权值的依据,网络的学习在权值修改过程中完成。误差达到所期望值时,网络学习结束。
为了优化模型,得到最佳的模型参数,本实施例采用基于上述的梯度上升算法和反向传播方法来优化模型。同时,本实施例采用交叉熵作为目标函数:
Figure BDA0002209601000000111
R+是观察到的已经有交互记录的项目,R-是我们采样的负样本。该目标函数可以用概率解释并且是以下似然函数的负对数似然:
Figure BDA0002209601000000112
此外,本实施例采用了联合学习,以
Figure BDA0002209601000000113
为基础,在目标领域中的损失函数为
Figure BDA0002209601000000114
源域中的损失函数为
Figure BDA0002209601000000115
因此,最终的联合目标函数为:
Figure BDA0002209601000000116
其中,参数Θ=ΘT∪ΘS。通过上面的优化过程,可以求得模型参数Θ的最优解。
可见,本实施例通过在商品展示的过程中加入美学特征,考虑到被输出商品的多样性,并且在第一商品和第二商品之间进行交叉迁移,整合来自不同领域中的用户偏好特征,使得推荐输出的参考要素增多,而不是只采用用户的历史数据进行推荐展示,提高商品推荐展示的准确性和精度,以便向用户输出感兴趣的商品,提高用户的体验。
下面对本申请实施例提供的一种输出商品信息的计算机设备进行介绍,下文描述的一种输出商品信息的计算机设备与上文描述的一种商品信息输出方法可相互对应参照。
请参考图2,图2为本申请实施例所提供的一种输出商品信息的计算机设备的结构示意图。
本实施例中,该计算机设备可以包括:
美学特征提取模块100,用于采用预先训练的深度美学神经网络分别对第一商品的图像数据和第二商品的图像数据进行美学特征提取,得到第一美学特征向量和第二美学特征向量;
特征融合模块200,用于对第一商品和第二商品分别进行嵌入向量提取处理,得到第一嵌入向量和第二嵌入向量,将第一嵌入向量和第一美学特征向量拼接成第一输入向量,将第二嵌入向量和第二美学特征向量拼接成第二输入向量;
交互概率获取模块300,用于将第一输入向量和第二输入向量输入到交叉迁移网络进行处理,得到第一交互概率和第二交互概率;
商品信息输出模块400,用于根据第一交互概率和第二交互概率的比较结果对第一商品的信息和第二商品的信息进行输出。
可选的,该特征融合模块200,可以包括:
低维映射单元,用于将所述第一商品的历史记录信息以及所述第二商品的历史记录信息分别映射到低维连续空间,得到第一商品嵌入矩阵以及第二商品嵌入矩阵,对所述用户信息进行处理得到用户嵌入矩阵;
矩阵处理单元,用于根据第一商品嵌入矩阵和第二商品嵌入矩阵对用户嵌入矩阵进行处理,得到第一嵌入向量和第二嵌入向量;
第一输入向量获取单元,用于将第一嵌入向量和第一美学特征向量拼接成第一输入向量;
第二输入向量获取单元,用于将第二嵌入向量和第二美学特征向量拼接成第二输入向量。
可选的,该交互概率获取模块300,可以包括:
知识迁移单元,用于采用稀疏法优化的关系矩阵,将第一输入向量的领域知识和第二输入向量的领域知识通过交叉迁移网络进行处理;
概率输出单元,用于通过交叉迁移网络的输出层得到第一交互概率和第二交互概率。
可选的,该概率输出单元,具体用于采用softmax函数对交叉迁移网络的输出层的数据进行计算,得到第一交互概率和第二交互概率。
本申请实施例还提供一种计算机设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如以上实施例所述的商品信息输出方法的步骤。
本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如以上实施例所述的商品信息输出方法的步骤。
该计算机可读存储介质可以包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上对本申请所提供的一种商品信息输出方法、输出商品信息的计算机设备、计算机设备以及计算机可读存储介质进行了详细介绍。本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。

Claims (10)

1.一种商品信息输出方法,其特征在于,应用于输出商品信息的计算机设备,所述方法包括:
采用预先训练的深度美学神经网络分别对第一商品的图像数据和第二商品的图像数据进行美学特征提取,得到第一美学特征向量和第二美学特征向量;
对所述第一商品和所述第二商品分别进行嵌入向量提取处理,得到第一嵌入向量和第二嵌入向量,将所述第一嵌入向量和所述第一美学特征向量拼接成第一输入向量,将所述第二嵌入向量和所述第二美学特征向量拼接成第二输入向量;
将所述第一输入向量和所述第二输入向量输入到交叉迁移网络进行处理,得到第一交互概率和第二交互概率;
根据所述第一交互概率和所述第二交互概率的比较结果对所述第一商品的信息和所述第二商品的信息进行输出。
2.根据权利要求1所述的商品信息输出方法,其特征在于,对所述第一商品和所述第二商品分别进行嵌入向量提取处理,得到第一嵌入向量和第二嵌入向量,将所述第一嵌入向量和所述第一美学特征向量拼接成第一输入向量,将所述第二嵌入向量和所述第二美学特征向量拼接成第二输入向量,包括:
将所述第一商品的历史记录信息以及所述第二商品的历史记录信息分别映射到低维连续空间,得到第一商品嵌入矩阵以及第二商品嵌入矩阵,对用户信息进行处理得到用户嵌入矩阵;
根据所述第一商品嵌入矩阵和所述第二商品嵌入矩阵对所述用户嵌入矩阵进行处理,得到所述第一嵌入向量和所述第二嵌入向量;
将所述第一嵌入向量和所述第一美学特征向量拼接成第一输入向量;
将所述第二嵌入向量和所述第二美学特征向量拼接成第二输入向量。
3.根据权利要求1所述的商品信息输出方法,其特征在于,将所述第一输入向量和所述第二输入向量输入到交叉迁移网络进行处理,得到第一交互概率和第二交互概率,包括:
采用稀疏法优化的关系矩阵,将所述第一输入向量的领域知识和所述第二输入向量的领域知识通过交叉迁移网络进行处理;
通过所述交叉迁移网络的输出层得到所述第一交互概率和所述第二交互概率。
4.根据权利要求3所述的商品信息输出方法,其特征在于,通过所述交叉迁移网络的输出层得到所述第一交互概率和所述第二交互概率,包括:
采用softmax函数对所述交叉迁移网络的输出层的数据进行计算,得到所述第一交互概率和所述第二交互概率。
5.一种输出商品信息的计算机设备,其特征在于,包括:
美学特征提取模块,用于采用预先训练的深度美学神经网络分别对第一商品的图像数据和第二商品的图像数据进行美学特征提取,得到第一美学特征向量和第二美学特征向量;
特征融合模块,用于对所述第一商品和所述第二商品分别进行嵌入向量提取处理,得到第一嵌入向量和第二嵌入向量,将所述第一嵌入向量和所述第一美学特征向量拼接成第一输入向量,将所述第二嵌入向量和所述第二美学特征向量拼接成第二输入向量;
交互概率获取模块,用于将所述第一输入向量和所述第二输入向量输入到交叉迁移网络进行处理,得到第一交互概率和第二交互概率;
商品信息输出模块,用于根据所述第一交互概率和所述第二交互概率的比较结果对所述第一商品的信息和所述第二商品的信息进行输出。
6.根据权利要求5所述的计算机设备,其特征在于,所述特征融合模块,包括:
低维映射单元,用于将所述第一商品的历史记录信息以及所述第二商品的历史记录信息分别映射到低维连续空间,得到第一商品嵌入矩阵以及第二商品嵌入矩阵,对用户信息进行处理得到用户嵌入矩阵;
矩阵处理单元,用于根据所述第一商品嵌入矩阵和所述第二商品嵌入矩阵对所述用户嵌入矩阵进行处理,得到所述第一嵌入向量和所述第二嵌入向量;
第一输入向量获取单元,用于将所述第一嵌入向量和所述第一美学特征向量拼接成第一输入向量;
第二输入向量获取单元,用于将所述第二嵌入向量和所述第二美学特征向量拼接成第二输入向量。
7.根据权利要求5所述的计算机设备,其特征在于,所述交互概率获取模块,包括:
知识迁移单元,用于采用稀疏法优化的关系矩阵,将所述第一输入向量的领域知识和所述第二输入向量的领域知识通过交叉迁移网络进行处理;
概率输出单元,用于通过所述交叉迁移网络的输出层得到所述第一交互概率和所述第二交互概率。
8.根据权利要求7所述的计算机设备,其特征在于,所述概率输出单元,具体用于采用softmax函数对所述交叉迁移网络的输出层的数据进行计算,得到所述第一交互概率和所述第二交互概率。
9.一种计算机设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至4任一项所述的商品信息输出方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至4任一项所述的商品信息输出方法的步骤。
CN201910893796.0A 2019-09-20 2019-09-20 一种商品信息输出方法及相关装置 Active CN110659962B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910893796.0A CN110659962B (zh) 2019-09-20 2019-09-20 一种商品信息输出方法及相关装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910893796.0A CN110659962B (zh) 2019-09-20 2019-09-20 一种商品信息输出方法及相关装置

Publications (2)

Publication Number Publication Date
CN110659962A CN110659962A (zh) 2020-01-07
CN110659962B true CN110659962B (zh) 2022-03-15

Family

ID=69038264

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910893796.0A Active CN110659962B (zh) 2019-09-20 2019-09-20 一种商品信息输出方法及相关装置

Country Status (1)

Country Link
CN (1) CN110659962B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111553766B (zh) * 2020-04-28 2023-09-15 苏州市职业大学 商品推荐方法、装置、设备及介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110060121A (zh) * 2019-03-14 2019-07-26 五邑大学 基于特征排序的商品推荐方法、装置和存储介质
CN110119479A (zh) * 2019-05-16 2019-08-13 苏州大学 一种餐馆推荐方法、装置、设备及可读存储介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110060121A (zh) * 2019-03-14 2019-07-26 五邑大学 基于特征排序的商品推荐方法、装置和存储介质
CN110119479A (zh) * 2019-05-16 2019-08-13 苏州大学 一种餐馆推荐方法、装置、设备及可读存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Deep image aesthetics classification using inception modules and fine-tuning connected layer;Jin, Xin and Chi, Jingying and Peng, Siwei and Tian, Yulu等;《2016 8th International Conference on Wireless Communications & Signal Processing (WCSP)》;20161013;全文 *
ILGNet: inception modules with connected;Xin Jin, Le Wu, Xiaodong Li, Xiaokun Zhang, Jingying Chi等;《IET Computer Vision》;20180719;全文 *

Also Published As

Publication number Publication date
CN110659962A (zh) 2020-01-07

Similar Documents

Publication Publication Date Title
CN111079532B (zh) 一种基于文本自编码器的视频内容描述方法
CN109544306B (zh) 一种基于用户行为序列特征的跨领域推荐方法及装置
EP3371747B1 (en) Augmenting neural networks with external memory
CN111310063B (zh) 基于神经网络的记忆感知门控因子分解机物品推荐方法
WO2019056628A1 (zh) 关注点文案的生成
CN112418292B (zh) 一种图像质量评价的方法、装置、计算机设备及存储介质
CN110413888B (zh) 一种书籍推荐方法及装置
CN107545301B (zh) 页面展示方法及装置
US11645328B2 (en) 3D-aware image search
CN110321473B (zh) 基于多模态注意力的多样性偏好信息推送方法、系统、介质及设备
CN109447096B (zh) 一种基于机器学习的扫视路径预测方法和装置
CN112699215B (zh) 基于胶囊网络与交互注意力机制的评级预测方法及系统
CN110781401A (zh) 一种基于协同自回归流实现的Top-n项目推荐方法
CN110990555A (zh) 端到端检索式对话方法与系统及计算机设备
CN116049459A (zh) 跨模态互检索的方法、装置、服务器及存储介质
CN111651576A (zh) 一种基于迁移学习的多轮阅读理解方法
CN110502701B (zh) 引入注意力机制的好友推荐方法、系统和存储介质
Ahirwar Generative adversarial networks projects: Build next-generation generative models using TensorFlow and Keras
CN116264847A (zh) 用于生成机器学习多任务模型的系统和方法
CN110659962B (zh) 一种商品信息输出方法及相关装置
CN113779380A (zh) 跨域推荐、内容推荐方法、装置及设备
CN111010595B (zh) 一种新节目推荐的方法及装置
CN117251622A (zh) 对象推荐的方法、装置、计算机设备和存储介质
CN116503158A (zh) 基于数据驱动的企业破产风险预警方法、系统及装置
CN116340635A (zh) 物品推荐方法、模型训练方法、装置及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant