CN112905883A - 一种应用于推荐系统的信息处理方法及装置 - Google Patents
一种应用于推荐系统的信息处理方法及装置 Download PDFInfo
- Publication number
- CN112905883A CN112905883A CN202110180616.1A CN202110180616A CN112905883A CN 112905883 A CN112905883 A CN 112905883A CN 202110180616 A CN202110180616 A CN 202110180616A CN 112905883 A CN112905883 A CN 112905883A
- Authority
- CN
- China
- Prior art keywords
- commodity
- recommendation
- feature extraction
- feature
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 25
- 238000003672 processing method Methods 0.000 title claims abstract description 18
- 238000000605 extraction Methods 0.000 claims abstract description 138
- 239000013598 vector Substances 0.000 claims description 98
- 238000000034 method Methods 0.000 claims description 39
- 238000004364 calculation method Methods 0.000 claims description 24
- 238000013528 artificial neural network Methods 0.000 claims description 17
- 238000013507 mapping Methods 0.000 claims description 13
- 238000012545 processing Methods 0.000 claims description 12
- 238000006243 chemical reaction Methods 0.000 claims description 9
- 230000006835 compression Effects 0.000 claims description 9
- 238000007906 compression Methods 0.000 claims description 9
- 230000007246 mechanism Effects 0.000 claims description 6
- 239000000284 extract Substances 0.000 abstract description 7
- 239000000047 product Substances 0.000 description 24
- 230000006870 function Effects 0.000 description 14
- 230000008569 process Effects 0.000 description 9
- 239000011159 matrix material Substances 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 230000006399 behavior Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 235000019580 granularity Nutrition 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 235000014510 cooky Nutrition 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000003205 fragrance Substances 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 230000003313 weakening effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0282—Rating or review of business operators or products
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种应用于推荐系统的信息处理方法及装置。该方法,首先,获取推荐商品列表中每一商品的推荐特征信息,例如用户ID,商品ID,商品品牌等;之后,根据推荐特征信息、商品推荐评分模型得到每一商品的评分预测值,其中,所述商品推荐评分模型在对所述推荐特征信息进行的特征提取时,不仅会进行通道域上的特征提取,还会进行空间域上的特征提取,且在通道域上进行特征时采取多卷积核。如此,可以使特征提取更全面和更准确,并突出重要特征和弱化非重要特征,从而可以获得更准确的商品推荐评分,进而以更符合用户偏好和期望的顺序排列推荐商品,帮助用户更快地找到真正想要的商品。
Description
技术领域
本申请涉及计算机信息处理技术,尤其涉及一种应用于推荐系统的信息处理方法及装置。
背景技术
随着电子商务规模的不断扩大,在线上出售的商品数量和种类日益增长,用户往往要浏览大量的商品才能找到自己真正想买的商品,这无疑浪费了大量时间和精力,而给用户带来不良的线上购物体验。
在这种情况下,推荐系统应运而生。推荐系统是是根据用户的兴趣特点和购买行为,向用户推荐用户感兴趣的信息和商品的系统。
但因为可推荐的商品数量和种类还是很多,此时推荐商品的排序是否更接近用户的真实需求将直接决定用户的使用体验。
目前推荐系统的商品的排序系统在提取特征时,大多采用:1)压缩抽取网络(SENet)进行特征抽取,但该方案只考虑通道域的特征,没有考虑空间域的特征,准确度不高;2)使用卷积块的注意力模块(Convolutional Block Attention Module,CBAM)进行特征提取,虽然CBAM同时考虑了通道域和空间域,但通道域是使用固定思维卷积核,能提取到的特征有限,不能充分和全面地表达三维的语义特征。因此准确度不高。
因此如何提高特征提取的准确度,是推荐系统中的商品排序更加贴合用户的真实需求是推荐系统亟需解决的一个技术问题。
发明内容
本申请人发明人创造性地提供一种应用于推荐系统的信息处理方法及装置。
根据本申请实施例第一方面,提供一种应用于推荐系统的信息处理方法,该方法包括:获取推荐商品列表中每一商品的推荐特征信息;根据推荐特征信息、商品推荐评分模型得到每一商品的评分预测值,商品推荐评分模型对推荐特征信息进行的特征提取包括在通道域上的特征提取和在空间域上的特征提取,其中,通道域上的特征提取包括基于多卷积核卷积计算的特征提取;根据每一商品的评分预测值对推荐商品列表进行排序。
根据本申请一实施例,根据推荐特征信息、商品推荐评分模型得到每一商品的评分预测值,包括:对推荐特征信息进行压缩稀疏编码转换得到压缩后的特征编码信息;对压缩后的特征编码信息进行特征提取,将压缩后的特征编码信息映射成第一嵌入向量,其中,特征提取包括在通道域上的特征提取和在空间域上的特征提取,其中,通道域上的特征提取包括基于多卷积核卷积计算的特征提取;根据第一嵌入向量计算每一商品的评分预测值。
根据本申请一实施例,对压缩后的特征编码信息进行特征提取,将压缩后的特征编码信息映射成第一嵌入向量,包括:对特征编码信息进行第一次特征提取,将特征编码信息映射成第二嵌入向量;对第二嵌入向量中的全部向量或部分向量进行第二次特征提取得到第三嵌入向量,第二次特征提取包括在通道域上的特征提取和在空间域上的特征提取,其中,通道域上的特征提取包括基于多卷积核卷积计算的特征提取;对第二嵌入向量和第三嵌入向量进行合并得到第一嵌入向量。
根据本申请一实施例,在对第二嵌入向量和第三嵌入向量进行合并得到第一嵌入向量之前,该方法还包括:对第二嵌入向量和/或第三嵌入向量进行特征增强处理。
根据本申请一实施例,进行特征增强处理包括:与特征权重值向量进行内积和哈达玛济运算。
根据本申请一实施例,特征提取包括基于各个特征的注意力权重的特征提取,其中各个特征的注意力权重是通过商品推荐评分模型自学习得到的。
根据本申请一实施例,根据第一嵌入向量计算每一商品的评分预测值,包括:根据第一嵌入向量,使用全连接层和分类器层进行神经网络计算得到每一商品的评分预测值。
根据本申请一实施例,根据第一嵌入向量计算每一商品的评分预测值,包括:根据第一嵌入向量,使用基于多层神经网络和分类器层进行神经网络计算得到每一商品的评分预测值。
根据本申请一实施例,在根据第一嵌入向量计算每一商品的评分预测值之后,该方法还包括:根据预设的损失函数、每一商品的评分期待值和评分预测值计算得到损失函数的值;根据损失函数的值和反向传播机制进行参数优化。
根据本申请实施例第二方面,一种应用于推荐系统的信息处理装置,该装置包括:推荐特征信息获取模块,用于获取推荐商品列表中每一商品的推荐特征信息;商品推荐评分模块,用于根据推荐特征信息、商品推荐评分模型得到每一商品的评分预测值,商品推荐评分模型对推荐特征信息进行的特征提取包括在通道域上的特征提取和在空间域上的特征提取,其中,通道域上的特征提取包括基于多卷积核卷积计算的特征提取;商品列表排序模块,用于根据每一商品的评分预测值对推荐商品列表进行排序。
本申请实施例提供一种应用于推荐系统的信息处理方法及装置。该方法,首先,获取推荐商品列表中每一商品的推荐特征信息,例如用户ID,商品ID,商品品牌等;之后,根据推荐特征信息、商品推荐评分模型得到每一商品的评分预测值,其中,所述商品推荐评分模型在对所述推荐特征信息进行的特征提取时,不仅会进行通道域上的特征提取,还会进行空间域上的特征提取,且在通道域上进行特征时采取多卷积核。
在通道域上采用多卷积核进行特征提取,比起使用固定卷积核进行特征提取,可以得到从粗到细的多个粒度的特征,从而使提取到的特征更全面也更准确;而在空间遇上的特征提取,可针对某一范围的特征进行进一步提取和增强,从而加强重要特征和弱化非重要特征。
相应地,使用该商品推荐评分模型可以获得更准确的商品推荐评分,进而以更符合用户偏好和期望的顺序排列推荐商品,帮助用户更快地找到真正想要的商品。
需要理解的是,本申请的实施并不需要实现上面所述的全部有益效果,而是特定的技术方案可以实现特定的技术效果,并且本申请的其他实施方式还能够实现上面未提到的有益效果。
附图说明
通过参考附图阅读下文的详细描述,本申请示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本申请的若干实施方式,其中:
在附图中,相同或对应的标号表示相同或对应的部分。
图1为本申请应用于推荐系统的信息处理方法一实施例的实现流程示意图;
图2为本申请应用于推荐系统的信息处理方法另一实施例所使用的KCBAM示意图;
图3为本申请应用于推荐系统的信息处理方法另一实施例所使用的商品推荐评分模型示意图;
图4为本申请应用于推荐系统的信息处理装置一实施例的组成结构示意图。
具体实施方式
为使本申请的目的、特征、优点能够更加的明显和易懂,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而非全部实施例。基于本申请中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
图1示出了本申请应用于推荐系统的信息处理方法一实施例的实现流程。参考图1,本实施例提供一种应用于推荐系统的信息处理方法,该方法包括:操作110,获取推荐商品列表中每一商品的推荐特征信息;操作120,根据推荐特征信息、商品推荐评分模型得到每一商品的评分预测值,商品推荐评分模型对推荐特征信息进行的特征提取包括在通道域上的特征提取和在空间域上的特征提取,其中,通道域上的特征提取包括基于多卷积核卷积计算的特征提取;操作130,根据每一商品的评分预测值对推荐商品列表进行排序。
在操作110中,推荐商品列表是通过用户查询或根据用户历史行为生成的,本申请应用于推荐的信息处理方法主要应用于对已得到的推荐商品列表中的商品进行重新排序,使真正符合用户需求和偏好的商品排在前面,从而减少用户浏览商品的时间,更快地找到符合期望的商品。
推荐特征通常指决定商品是否会被选入推荐列表所依据的特征,主要包括用户特征(例如,年龄、性别和偏好等)、交互特征(例如,查询输入的关键字、某个时间段内的用户点击历史和用户访问时长等)和商品特征(例如,商品的品牌、颜色、尺寸、性能和价格等)。其中,用户特征和交互特征可以用来提供用户画像、了解用户的偏好和需求,而商品推荐列表正是根据用户画像、用户偏好和需求从成千上万的商品中检索到的可能符合特定条件的商品。
推荐特征信息可通过用户的画像、简介信息等获取;而交互特征信息则可以通过获取用户的操作和网络请求并生成Cookie等来获取;商品特征信息则可以从商品库中的商品属性等获取。
上述特征信息既是决定商品入选推荐商品列表的决定因素,也是决定其排序需要考量的重要因素。
在操作120中,商品推荐评分模型就是用来根据推荐特征信息判断商品符合用户期待符合程度的评价值,也就是用户会点击该商品的概率,并按照符合程度(点击概率)从高到低地顺序排列这些商品,从而使更符合用户期待的商品排在前面,从而帮助用户更快地找到真正想要的商品。
因此,商品推荐评分模型的预测结果越准确,用户真正想要的商品就会排得越靠前,用户花得时间也越短,用户体验也就越好。
而对于商品推荐评分模型预测结果的准确度来说,对推荐特征信息进行的特征提取尤为重要。由于特征提取是模型运算的数据基础,也是进一步调整和优化模型得依据,因此特征提取得越全面、越具有代表性,商品推荐评分模型预测结果也就越准确。
本申请实施例所使用的商品推荐评分模型在对推荐特征信息进行的特征提取时,包括在通道域(Spatial Domain)上的特征提取和在空间域(Channel Domain)上的特征提取。
其中,通道域上的特征提取主要指将空间域信息做对应的空间变换,提取出最为关键的信息。例如,对于图像识别来说,就是找出图片信息中需要被关注的区域,并通过旋转、缩放变换、去噪等功能,使该区域的重要信息能够通过变换而被提取出来;类似地,对于语义识别来说,就是找到一句话中需要被关注的字或词,并通过必要的转换和去噪,提取到语句中最为重要的语义信息。
通道域上的特征则表示推荐特征信息在不同卷积核上的分量,而在通道域上进行的特征提取,则相当于将推荐特征信息分解成多个通道上的分量,通道对于关键信息的贡献肯定是有多有少,因此可以通过给每个通道上的分量都增设一个权重,来代表该通道与关键信息的相关度则可以通过学习获得每个通道的权重,并通过权重突出对于关键信息更为重要的分量,从而强化重要特征弱化非重要特征。
在现有技术中,在通道域上进行特征提取时,通常采用固定的单卷积核,例如,3*3或5*5提取一遍就结束了。
对于图像来说,是否能准确地提取到图片中的重要信息,主要取决于卷积核的大小。因此,一旦根据图片的像素大小、清晰或模糊程度确定一个较为大小合适的卷积核,在通道域上提取一次即可满足大多数图像处理的需求。
但对于主要通过语义来进行预测的商品推荐系统来说,使用某个固定大小的卷积核,则很可能无法提取到一句话的全部语义。
对于语义特征提取来说,以某个大小卷积核对语义信息进行卷积的过程,类似于以固定的长度从句子中提取词语的过程。例如,对于句子“小香风风格裙子”来说,如果以一个字长来提取词语,则会提取到“小”、“香”、“风”、“格”、“裙”、“子”;如果以两个字长来提取词语,则会提取到“小香”、“香风”、“风风”、“风格”、“格裙”、“裙子”;如果以三个字长来提取词语,则会提取到“小香风”、“香风风”、“风风格”、“风格裙”、“格裙子”。
由此可见,不管是用哪个单一的字长来提取词汇,都可能会遗漏一些重要信息。相应地,在对语义进行分析的特征提取过程中,如果仅使用某一固定步长的卷积核,进行一次特征提取都很难会捕获所有重要信息。
为此,本申请实施例创造性地使用了多个卷积核进行卷积计算,如此,可以得到不同粒度的更多通道,也不会遗漏重要信息,进而使整个商品推荐评分模型的准确度更高。
之后,就可以通过操作140,根据所述每一商品的评分预测值对所述推荐商品列表进行排序,并返回给用户。如此,可以按照更符合用户偏好和期望的顺序排列推荐商品,使用户更快地找到真正想要的商品。
需要说明的是图1所示的实施例仅为本申请应用于推荐系统的信息处理方法最基本的一个基本实施例,实施者还可在其基础上进行进一步细化和扩展。
根据本申请一实施例,根据推荐特征信息、商品推荐评分模型得到每一商品的评分预测值,包括:对推荐特征信息进行压缩稀疏编码转换得到压缩后的特征编码信息;对压缩后的特征编码信息进行特征提取,将压缩后的特征编码信息映射成第一嵌入向量,其中,特征提取包括在通道域上的特征提取和在空间域上的特征提取,其中,通道域上的特征提取包括基于多卷积核卷积计算的特征提取;根据第一嵌入向量计算每一商品的评分预测值。
通常,机器学习模型需要的数据是数字型的,因为只有数字类型才能进行计算。因此,对于各种特殊的特征值,都需要对其进行相应的编码,也是量化的过程。
而对于商品推荐系统来说,由于商品项目总体非常大,而单个用户通常只与所有商品中一个非常小的子集进行交互。因此,如果在对推荐特征信息进行编码时,仅进行简单的编码(例如,One-Hot编码或Label Encoding编码)来表示用户(行)和行为(列)时,就会形成一个由许多零值组成的大型稀疏特征矩阵。而这种大型稀疏特征矩阵无疑会占用更多的内存空间,并使特征提取变得异常复杂,需要超强的计算能力。
因此,可以对大型稀疏特征矩阵进行进一步的压缩处理,例如,压缩稀疏行(CSR)处理,从而节省大量的内存并简化特征提取的复杂度。
在本实施例中,压缩稀疏编码转换指如果对所述推荐特征信息进行编码得到的是稀疏矩阵,则对该稀疏矩阵进行稀疏压缩处理的一种转换。
压缩稀疏编码转换可以分别通过两个步骤,即先对推荐特征信息进行编码,之后再对编码后形成的稀疏特征矩阵进行进一步的稀疏编码;也可以仅通过一个步骤,利用函数或模型来实现端到端的转换过程。
根据本申请一实施例,对压缩后的特征编码信息进行特征提取,将压缩后的特征编码信息映射成第一嵌入向量,包括:对特征编码信息进行第一次特征提取,将特征编码信息映射成第二嵌入向量;对第二嵌入向量中的全部向量或部分向量进行第二次特征提取得到第三嵌入向量,第二次特征提取包括在通道域上的特征提取和在空间域上的特征提取,其中,通道域上的特征提取包括基于多卷积核卷积计算的特征提取;对第二嵌入向量和第三嵌入向量进行合并得到第一嵌入向量。
在基于多卷积核卷积计算的特征提取往往更适合类别特征,例如,用户ID、用户性别、商品ID、商品型号等特征,而对于其他一些连续性的特征或难以分类的特征,例如,访问时长,商品价格等连续性特征,效果欠佳。
此时,既在通道域上进行特征提取又在空间域上的特征提取,并在通道域上的进行特征提取时使用基于多卷积核卷积计算的特征提取方式,可能无法完全取代原有的特征提取方式,或取代成本过高(将连续性特征转换成类别特征所产生的较高成本)时,可以不取代原有的特征提取方式,而是作为原有特征提取方式的一种补充,即使用原有特征提取方式进行第一次特征提取;然后,将既在通道域上进行特征提取又在空间域上的特征提取,并在通道域上的进行特征提取时使用基于多卷积核卷积计算的特征提取方式作为第二次特征提取。
如此,可充分结合第一次特征提取和第二次特征提取的各自优势得到更为充分和全面的特征。
根据本申请一实施例,在对第二嵌入向量和第三嵌入向量进行合并得到第一嵌入向量之前,该方法还包括:对第二嵌入向量和/或第三嵌入向量进行特征增强处理。
在描述或表征特定问题的时候,有些特征会更为重要,而有些特征则可以忽略不记。在完成初步的特征提取之后,可能只是获取了尽可能多的特征以防信息遗漏,但也可能存在因为提取到的特征过多而导致重要特征被淹没或无法突显,导致在后续的处理中难以捕获到重要特征,使图像或问题模糊化,从而使信息识别的难度陡增。
在本实施例中,进行特征增强处理就是要突显重要特征,弱化非重要特征,以便获取真正需要的重要信息或典型特征,迅速识别信息或进行分类。
具体地,可以通过根据重要性对特征赋值,或清除非重要特征的方式来实现。
根据本申请一实施例,进行特征增强处理包括:与特征权重值向量进行内积和哈达玛济运算。
依据每个特征对特定信息的重要性设定相应的权重值,并根据这些权重值及特征在向量中的位置,可以构建出一个特征权重值向量。使用该向量和特征向量进行内积或哈达玛济运算,就可以突显重要特征、弱化非重要特征,从而实现增强特征的目的。
根据本申请一实施例,特征提取包括基于各个特征的注意力权重的特征提取,其中各个特征的注意力权重是通过商品推荐评分模型自学习得到的。
在本实施例中,在进行特征提取时引入了注意力机制,并通过商品推荐评分模型的自学习过程动态学习到每一特征的权重,比起人为设定的特征权重,这一权重值经过大量数据的训练和验证后可更为准确和精进。
根据本申请一实施例,根据第一嵌入向量计算每一商品的评分预测值,包括:根据第一嵌入向量,使用全连接层和分类器层进行神经网络计算得到每一商品的评分预测值。
如果商品推荐评分模型使用的是浅层神经网络,则在得到第一嵌入向量之后,可以使用全连接层和分类器层(例如,softmax)进行分类和归纳得到每一商品的评分预测值。
根据本申请一实施例,根据第一嵌入向量计算每一商品的评分预测值,包括:根据第一嵌入向量,使用基于多层神经网络和分类器层进行神经网络计算得到每一商品的评分预测值。
如果商品推荐评分模型使用的是深度神经网络,则在得到第一嵌入向量之后,可以使用基于多层神经网络(例如DeepFM、Deep Cross Network等)和分类器层(例如,softmax)进行神经网络计算得到每一商品的评分预测值。
根据本申请一实施例,在根据第一嵌入向量计算每一商品的评分预测值之后,该方法还包括:根据预设的损失函数、每一商品的评分期待值和评分预测值计算得到损失函数的值;根据损失函数的值和反向传播机制进行参数优化。
如此,可使商品推荐评分模型更快收敛得到符合期待精度的模型,更快地投入到实际应用中。
以上实施例是对如何在图1所示的基本实施例的基础之上如何进行进一步细化和扩展的示例性说明,实施者还可根据具体的实施条件和需要,对上述实施例中的各种实施方式进行组合形成新的实施例,以实现更为理想的实施效果。
下面就结合图2至图3介绍本申请另一实施例应用于推荐系统的信息处理方法的具体实现。
如图2所示,在本申请的这一实施例中商品推荐评分模型是基于K个卷积核卷积块注意力模块(KCBAM)20来实现通道域上的特征提取和在空间域上的特征提取的。其中,卷积核卷积块注意力模块包括特征输入201、通道域K个卷积核注意力模块202、空间域注意力模块203和特征输出204。
与传统的CBAM不同,KCBAM在进行通道域上的特征提取时,使用了K个不同步长的卷积核(例如,3*1、5*1、7*1…等)对三维的推荐数据进行卷积计算来提取特征的。
此外,由于传统的CBAM四维数据主要应该在图像上,针对的是思维数据。而本申请是应用于推荐系统中的,接收到的数据没有有长和宽,主要是三维数据,因此,将所有conv2d操作转成conv1d(即:将卷积都转成一维的操作)。
图3示出了本申请这一实施例基于图2所示的KCBAM所构建的商品推荐评分模型。如图3所示,商品推荐评分模型包括:输入层301、嵌入层302、双线性交叉层303、组合层304和输出层305。其中,
输入层301,接收根据推荐特征信息提取的稀疏特征:稀疏特征1、稀疏特征2和稀疏特征3,对稀疏特征进行压缩编码得到压缩后的特征编码;
嵌入层302,包括原有嵌入模块3021和KCBAM嵌入模块3022。其中,将压缩后的特征编码输入到原有嵌入模块3021进行第一次特征提取映射为第二嵌入向量,然后将第二嵌入向量输入到KCAM,经过KCBM嵌入模块3022进行第二次特征提取映射为第三嵌入向量;
双线性交叉层303,使用第二嵌入向量或第三嵌入向量以及特征权重值向量进行哈达玛济运算对第二嵌入向量或第三嵌入向量进行特征加强,其中,特征权重值是基于注意力机制,利用特征组的压缩统计量来学习到的重要性权重;
组合层304,将第二嵌入向量和第三嵌入向量进行拼接操作,得到结果向,即第一嵌入向量。
输出层305:通过多层神经网络(Layer1,Layer2,……,LayerN)和softmax层对第一嵌入向量进行神经网络计算得到每一商品的评分预测值;
此外,该商品推荐评分模型通过预测结果与真实值来计算损失函数值,然后通过反向传播进行梯度更新,直到收敛。
本申请这一实施例根据所述推荐特征信息、如图3所示的商品推荐评分模型得到每一商品的评分预测值;然后,每一商品的评分预测值对所述推荐商品列表进行排序,使符合用户期望的商品排在更前面的位置,以缩短用户找到真正相要的商品所需的时间,提高用户体验。
本申请发明人使用公开数据集criteo上进行了大量的对比实验,结果如表1所示:
模型 | Loss | AUC |
DeepFM | 0.4513 | 79.96 |
FiBiNet | 0.4490 | 80.19 |
CBAM | 0.4481 | 80.54 |
KCBAM | 0.4438 | 80.94 |
表1
其中,使用参数为:embedding_dim=4Adam lr=1e-4batch_size=1024drop_out=0.5dnn_hidden=(128,128)。
需要说明的是,图2至图3所示的实施例也仅为本申请应用于推荐系统的信息处理方法的一个示例性说明,并非对本申请实施例的实施方式或应用场景的限定,实施者可根据具体实施需要和实施条件采用任何适用的实施方式应用于任何适用的应用场景中。
进一步地,本申请实施例还提供一种应用于推荐系统的信息处理装置,如图4所示,该装置40包括:推荐特征信息获取模块401,用于获取推荐商品列表中每一商品的推荐特征信息;商品推荐评分模块402,用于根据推荐特征信息、商品推荐评分模型得到每一商品的评分预测值,商品推荐评分模型对推荐特征信息进行的特征提取包括在通道域上的特征提取和在空间域上的特征提取,其中,通道域上的特征提取包括基于多卷积核卷积计算的特征提取;商品列表排序模块403,用于根据每一商品的评分预测值对推荐商品列表进行排序。
根据本申请一实施例,商品推荐评分模块402包括:特征编码子模块,用于对推荐特征信息进行压缩稀疏编码转换得到压缩后的特征编码信息;特征提取子模块,用于对压缩后的特征编码信息进行特征提取,将压缩后的特征编码信息映射成第一嵌入向量,其中,特征提取包括在通道域上的特征提取和在空间域上的特征提取,其中,通道域上的特征提取包括基于多卷积核卷积计算的特征提取;评分预测值子模块,用于根据第一嵌入向量计算每一商品的评分预测值。
根据本申请一实施例,特征提取子模块包括:第一特征提取单元,用于对特征编码信息进行第一次特征提取,将特征编码信息映射成第二嵌入向量;第二特征提取单元,用于对第二嵌入向量中的全部向量或部分向量进行第二次特征提取得到第三嵌入向量,第二次特征提取包括在通道域上的特征提取和在空间域上的特征提取,其中,通道域上的特征提取包括基于多卷积核卷积计算的特征提取;特征组合单元,用于对第二嵌入向量和第三嵌入向量进行合并得到第一嵌入向量。
根据本申请一实施例,特征提取子模块还包括特征增强单元,用于对第二嵌入向量和/或第三嵌入向量进行特征增强处理。
根据本申请一实施例,特征增强单元具体用于与特征权重值向量进行内积和哈达玛济运算。
根据本申请一实施例,特征提取子模块具体用于基于各个特征的注意力权重的特征提取,其中各个特征的注意力权重是通过商品推荐评分模型自学习得到的。
根据本申请一实施例,评分预测值子模块具体用于根据第一嵌入向量,使用全连接层和分类器层进行神经网络计算得到每一商品的评分预测值。
根据本申请一实施例,评分预测值子模块具体用于根据第一嵌入向量,使用基于多层神经网络和分类器层进行神经网络计算得到每一商品的评分预测值。
根据本申请一实施例,商品推荐评分模块402还包括:损失函数值计算子模块,用于根据预设的损失函数、每一商品的评分期待值和评分预测值计算得到损失函数的值;参数优化子模块,用于根据损失函数的值和反向传播机制进行参数优化。
根据本申请实施例第三方面,提供一种计算机存储介质,存储介质包括一组计算机可执行指令,当指令被执行时用于执行上述任一项应用于推荐系统的信息处理方法。
这里需要指出的是:以上针对应用于推荐系统的信息处理装置实施例的描述和以上针对计算机存储介质实施例的描述,与前述方法实施例的描述是类似的,具有同前述方法实施例相似的有益效果,因此不做赘述。对于本申请对应用于推荐系统的信息处理装置实施例的描述和对计算机存储介质实施例的描述尚未披露的技术细节,请参照本申请前述方法实施例的描述而理解,为节约篇幅,因此不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个装置,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本申请各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以利用硬件的形式实现,也可以利用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储介质、只读存储器(Read Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本申请上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本申请各个实施例方法的全部或部分。而前述的存储介质包括:移动存储介质、ROM、磁碟或者光盘等各种可以存储程序代码的介质。
以上,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种应用于推荐系统的信息处理方法,所述方法包括:
获取推荐商品列表中每一商品的推荐特征信息;
根据所述推荐特征信息、商品推荐评分模型得到每一商品的评分预测值,所述商品推荐评分模型对所述推荐特征信息进行的特征提取包括在通道域上的特征提取和在空间域上的特征提取,其中,所述通道域上的特征提取包括基于多卷积核卷积计算的特征提取;
根据所述每一商品的评分预测值对所述推荐商品列表进行排序。
2.根据权利要求1所述的方法,所述根据所述推荐特征信息、商品推荐评分模型得到每一商品的评分预测值,包括:
对所述推荐特征信息进行压缩稀疏编码转换得到压缩后的特征编码信息;
对所述压缩后的特征编码信息进行特征提取,将所述压缩后的特征编码信息映射成第一嵌入向量,其中,所述特征提取包括在通道域上的特征提取和在空间域上的特征提取,其中,所述通道域上的特征提取包括基于多卷积核卷积计算的特征提取;
根据所述第一嵌入向量计算每一商品的评分预测值。
3.根据权利要求2所述的方法,所述对所述压缩后的特征编码信息进行特征提取,将所述压缩后的特征编码信息映射成第一嵌入向量,包括:
对所述特征编码信息进行第一次特征提取,将所述特征编码信息映射成第二嵌入向量;
对所述第二嵌入向量中的全部向量或部分向量进行第二次特征提取得到第三嵌入向量,所述第二次特征提取包括在通道域上的特征提取和在空间域上的特征提取,其中,所述通道域上的特征提取包括基于多卷积核卷积计算的特征提取;
对所述第二嵌入向量和所述第三嵌入向量进行合并得到第一嵌入向量。
4.根据权利要求3所述的方法,在所述对所述第二嵌入向量和所述第三嵌入向量进行合并得到第一嵌入向量之前,所述方法还包括:
对所述第二嵌入向量和/或第三嵌入向量进行特征增强处理。
5.根据权利要求4所述的方法,所述进行特征增强处理包括:
与特征权重值向量进行内积和哈达玛济运算。
6.根据权利要求1至5任一项所述的方法,所述特征提取包括基于各个特征的注意力权重的特征提取,其中所述各个特征的注意力权重是通过商品推荐评分模型自学习得到的。
7.根据权利要求2所述的方法,所述根据所述第一嵌入向量计算每一商品的评分预测值,包括:
根据所述第一嵌入向量,使用全连接层和分类器层进行神经网络计算得到每一商品的评分预测值。
8.根据权利要求2所述的方法,所述根据所述第一嵌入向量计算每一商品的评分预测值,包括:
根据所述第一嵌入向量,使用基于多层神经网络和分类器层进行神经网络计算得到每一商品的评分预测值。
9.根据权利要求2所述的方法,在所述根据所述第一嵌入向量计算每一商品的评分预测值之后,所述方法还包括:
根据预设的损失函数、每一商品的评分期待值和所述评分预测值计算得到所述损失函数的值;
根据所述损失函数的值和反向传播机制进行参数优化。
10.一种应用于推荐系统的信息处理装置,所述装置包括:
推荐特征信息获取模块,用于获取推荐商品列表中每一商品的推荐特征信息;
商品推荐评分模块,用于根据所述推荐特征信息、商品推荐评分模型得到每一商品的评分预测值,所述商品推荐评分模型对所述推荐特征信息进行的特征提取包括在通道域上的特征提取和在空间域上的特征提取,其中,所述通道域上的特征提取包括基于多卷积核卷积计算的特征提取;
商品列表排序模块,用于根据所述每一商品的评分预测值对所述推荐商品列表进行排序。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110180616.1A CN112905883A (zh) | 2021-02-09 | 2021-02-09 | 一种应用于推荐系统的信息处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110180616.1A CN112905883A (zh) | 2021-02-09 | 2021-02-09 | 一种应用于推荐系统的信息处理方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112905883A true CN112905883A (zh) | 2021-06-04 |
Family
ID=76123319
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110180616.1A Pending CN112905883A (zh) | 2021-02-09 | 2021-02-09 | 一种应用于推荐系统的信息处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112905883A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114611009A (zh) * | 2022-05-10 | 2022-06-10 | 北京达佳互联信息技术有限公司 | 资源推荐方法、装置、电子设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140351079A1 (en) * | 2013-05-24 | 2014-11-27 | University College Dublin | Method for recommending a commodity |
CN111159564A (zh) * | 2019-12-31 | 2020-05-15 | 联想(北京)有限公司 | 信息推荐方法、装置、存储介质及计算机设备 |
CN111538907A (zh) * | 2020-06-05 | 2020-08-14 | 支付宝(杭州)信息技术有限公司 | 一种对象推荐方法、系统及装置 |
CN111598117A (zh) * | 2019-02-21 | 2020-08-28 | 成都通甲优博科技有限责任公司 | 图像识别方法及装置 |
CN111899292A (zh) * | 2020-06-15 | 2020-11-06 | 北京三快在线科技有限公司 | 文字识别方法、装置、电子设备及存储介质 |
-
2021
- 2021-02-09 CN CN202110180616.1A patent/CN112905883A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140351079A1 (en) * | 2013-05-24 | 2014-11-27 | University College Dublin | Method for recommending a commodity |
CN111598117A (zh) * | 2019-02-21 | 2020-08-28 | 成都通甲优博科技有限责任公司 | 图像识别方法及装置 |
CN111159564A (zh) * | 2019-12-31 | 2020-05-15 | 联想(北京)有限公司 | 信息推荐方法、装置、存储介质及计算机设备 |
CN111538907A (zh) * | 2020-06-05 | 2020-08-14 | 支付宝(杭州)信息技术有限公司 | 一种对象推荐方法、系统及装置 |
CN111899292A (zh) * | 2020-06-15 | 2020-11-06 | 北京三快在线科技有限公司 | 文字识别方法、装置、电子设备及存储介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114611009A (zh) * | 2022-05-10 | 2022-06-10 | 北京达佳互联信息技术有限公司 | 资源推荐方法、装置、电子设备及存储介质 |
CN114611009B (zh) * | 2022-05-10 | 2022-08-26 | 北京达佳互联信息技术有限公司 | 资源推荐方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7104244B2 (ja) | ユーザタグ生成方法並びにその、装置、コンピュータプログラム及びコンピュータ機器 | |
CN111538912B (zh) | 内容推荐方法、装置、设备及可读存储介质 | |
CN109101537B (zh) | 基于深度学习的多轮对话数据分类方法、装置和电子设备 | |
CN108763362B (zh) | 基于随机锚点对选择的局部模型加权融合Top-N电影推荐方法 | |
CN106919619B (zh) | 一种商品聚类方法、装置及电子设备 | |
CN110909182B (zh) | 多媒体资源搜索方法、装置、计算机设备及存储介质 | |
CN112364204B (zh) | 视频搜索方法、装置、计算机设备及存储介质 | |
KR20190070625A (ko) | 메타데이터를 이용한 아이템 추천 방법 및 장치 | |
CN111898031A (zh) | 一种获得用户画像的方法及装置 | |
CN105809478B (zh) | 一种广告标签的标注方法及系统 | |
CN111738807B (zh) | 用于推荐目标对象的方法、计算设备和计算机存储介质 | |
CN112749330A (zh) | 信息推送方法、装置、计算机设备和存储介质 | |
CN115147130A (zh) | 问题预测方法、设备、存储介质及程序产品 | |
CN112364184A (zh) | 多媒体数据的排序方法、装置、服务器及存储介质 | |
CN114861842A (zh) | 少样本目标检测方法、装置和电子设备 | |
CN112905883A (zh) | 一种应用于推荐系统的信息处理方法及装置 | |
CN117034963A (zh) | 模型训练方法、翻译方法、预估方法、推荐方法及装置 | |
CN115563982A (zh) | 广告文本优化方法及其装置、设备、介质、产品 | |
CN114330519A (zh) | 数据确定方法、装置、电子设备及存储介质 | |
CN113806622A (zh) | 推荐方法、装置及设备 | |
CN117786234B (zh) | 一种基于两阶段对比学习的多模态资源推荐方法 | |
CN110992079A (zh) | 一种基于时间序列填补的商品点击率预测方法 | |
CN112016582A (zh) | 菜品推荐方法及其装置 | |
CN112000888B (zh) | 信息推送方法、装置、服务器及存储介质 | |
PRASAD et al. | Product Price Prediction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |