CN116431933A - 产品推荐方法、装置、电子设备、存储介质及程序产品 - Google Patents
产品推荐方法、装置、电子设备、存储介质及程序产品 Download PDFInfo
- Publication number
- CN116431933A CN116431933A CN202310422911.2A CN202310422911A CN116431933A CN 116431933 A CN116431933 A CN 116431933A CN 202310422911 A CN202310422911 A CN 202310422911A CN 116431933 A CN116431933 A CN 116431933A
- Authority
- CN
- China
- Prior art keywords
- product
- new product
- content feature
- weight
- old
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 82
- 238000004590 computer program Methods 0.000 claims description 21
- 238000000605 extraction Methods 0.000 claims description 6
- 238000001914 filtration Methods 0.000 description 20
- 230000008569 process Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 10
- 230000015654 memory Effects 0.000 description 9
- 238000007781 pre-processing Methods 0.000 description 9
- 238000004891 communication Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 7
- 238000004422 calculation algorithm Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000003203 everyday effect Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000002354 daily effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
- G06F18/24143—Distances to neighbourhood prototypes, e.g. restricted Coulomb energy networks [RCEN]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本公开提供了一种产品推荐方法、装置、电子设备及存储介质,可以应用于金融领域或其他领域。该方法包括:提取新产品的至少一个第一内容特征;对第一内容特中的每一个赋予初始第一权重,并根据用户反馈更新第一内容特征的第一权重,用户反馈是基于第一时间段内的新产品的第一内容特征得到的;获取至少一个旧产品的第二内容特征;根据第一内容特征、更新后的第一权重、第二内容特征确定产品集合中的每两个产品之间的权重欧氏距离;根据权重欧氏距离确定新产品的邻居集,邻居集中包含至少一个旧产品;根据邻居集中的旧产品与新产品的权重欧氏距离以及邻居集中的旧产品的历史评分确定新产品的预测评分;根据预测评分确定向用户推荐的至少一种新产品。
Description
技术领域
本公开涉及大数据技术领域,更具体地涉及一种产品推荐方法、装置、电子设备、存储介质及程序产品。
背景技术
传统的推荐方案采用协同过滤方法,然而由于协同过滤依赖用户和产品的历史评分数据,而新用户或新产品缺少这些数据,因此协同过滤存在冷启动问题,会出现无法推荐或推荐效果差的现象。对此,现有技术中采用两个产品间的欧式距离作为聚类依据的方法解决冷启动问题,但是由于用户对不同内容特征的偏好程度不同,现有技术对产品的所有内容特征“一视同仁”计算出来的欧式距离,在新产品推荐的实际运用中,有时候不能正确反映两个产品相似程度,从而影响后面的层次聚类以及协同过滤推荐的最终结果,降低新项目(产品)的推荐质量。
发明内容
鉴于上述问题,本公开提供了一种产品推荐方法、装置、电子设备、可读存储介质及计算机程序产品,既可以摆脱传统协同过滤方法依赖产品历史评分的困境,还能够有效解决现有技术中产品推荐质量低的问题,实现贴合产品推荐的用户偏好的效果,达到精准推荐的目的。
根据本公开的第一个方面,提供了一种产品推荐方法,所述方法包括:提取新产品的至少一个第一内容特征;对所述至少一个第一内容特征中的每一个赋予初始第一权重,并根据用户反馈更新所述第一内容特征的第一权重,所述用户反馈是基于第一时间段内的新产品的第一内容特征反馈得到的;获取至少一个旧产品的第二内容特征;根据所述第一内容特征、更新后的第一权重、第二内容特征确定所述新产品和旧产品组成的产品集合中的每两个产品之间的权重欧氏距离;根据所述权重欧氏距离确定所述新产品的邻居集,所述邻居集中包含至少一个旧产品;根据所述邻居集中的旧产品与新产品的权重欧氏距离以及所述邻居集中的旧产品的历史评分确定所述新产品的预测评分;根据所述预测评分确定向用户推荐的至少一种新产品。
在本公开的一些示例性实施例中,提取新产品的至少一个第一内容特征后,对所述第一内容特征进行初始化预处理,其中,所述初始化预处理包括:针对含有数字的第一内容特征,提取数字并去除非数字内容;针对含有上限和下限的数字范围的第一内容特征,提取所述数字范围的中间值;以及针对不包含数字的第一内容特征,保持不变。
在本公开的一些示例性实施例中,所述新产品初次推荐时,每一个所述新产品包括的第一内容特征的初始第一权重为1。
在本公开的一些示例性实施例中,根据用户反馈更新所述第一内容特征的第一权重包括:根据在所述第一时间段内获取的与每一个所述第一内容特征相关联的所述用户反馈,更新第二时间段内的所述新产品的每一个所述第一内容特征的第一权重。
在本公开的一些示例性实施例中,根据所述第一内容特征、更新后的第一权重、第二内容特征确定所述新产品和旧产品组成的产品集合中的每两个产品之间的权重欧氏距离,包括:根据新产品的第一内容特征和旧产品的第二内容特征确定第一数值;根据所述第一权重以及所述第一数值,确定所述新产品和旧产品组成的产品集合中的每两个产品之间的权重欧式距离。
在本公开的一些示例性实施例中,当所述第一内容特征与所述第二内容特征为数字时,基于所述第一内容特征与所述第二内容特征包含的数字确定所述第一数值;当所述第一内容特征与所述第二内容特征为非数字时进行文本匹配,若文本相同,确定所述第一数值为0,若文本不同,确定所述第一数值为1。
在本公开的一些示例性实施例中,根据所述权重欧氏距离确定所述新产品的邻居集包括:步骤1,所述新产品和旧产品组成的产品集合中的每一个产品分别作为一个簇;步骤2,将所述簇中距离最近的两个簇进行合并;步骤3,重复所述步骤2,直至所述簇的个数等于预设阈值时结束合并簇,确定所述新产品所在的簇中的其他旧产品为所述新产品的邻居集。
在本公开的一些示例性实施例中,根据所述邻居集中的旧产品与所述新产品的权重欧氏距离以及所述邻居集中的旧产品的历史评分确定所述新产品的预测评分,包括:根据所述邻居集中的旧产品的历史评分以及与所述邻居集中的旧产品关联的所述新产品的权重欧式距离,确定第二数值;根据所述第二数值以及所述邻居集中的旧产品与所述新产品的权重欧式距离的总和,确定所述新产品的预测评分。
本公开实施例的第二方面,提供了一种产品推荐装置,所述装置包括:提取模块,配置为提取新产品的至少一个第一内容特征;更新模块,配置为对所述至少一个第一内容特征中的每一个赋予初始第一权重,并根据用户反馈更新所述第一内容特征的第一权重,所述用户反馈是基于第一时间段内的新产品的第一内容特征反馈得到的;获取模块,配置为获取至少一个旧产品的第二内容特征;第一确定模块,配置为根据所述第一内容特征、更新后的第一权重、第二内容特征确定所述新产品和旧产品组成的产品集合中的每两个产品之间的权重欧氏距离;第二确定模块,配置为根据所述权重欧氏距离确定所述新产品的邻居集,所述邻居集中包含至少一个旧产品;第三确定模块,配置为根据所述邻居集中的旧产品与新产品的权重欧氏距离以及所述邻居集中的旧产品的历史评分确定所述新产品的预测评分;第四确定模块,配置为根据所述预测评分确定向用户推荐的至少一种新产品。
在本公开的一些示例性实施例中,产品推荐装置还包括预处理模块,预处理模块被配置为:提取新产品的至少一个第一内容特征后,对所述第一内容特征进行初始化预处理,其中,所述初始化预处理包括:针对含有数字的第一内容特征,提取数字并去除非数字内容;针对含有上限和下限的数字范围的第一内容特征,提取所述数字范围的中间值;针对不包含数字的第一内容特征,保持不变。
在本公开的一些示例性实施例中,产品推荐装置还包括初始权重确定模块,初始权重模块被配置为:所述新产品初次推荐时,每一个所述新产品包括的第一内容特征的初始第一权重为1。
在本公开的一些示例性实施例中,更新模块还包括更新子模块,更新子模块被配置为:根据在所述第一时间段内获取的与每一个所述第一内容特征相关联的所述用户反馈,更新第二时间段内的所述新产品的每一个所述第一内容特征的第一权重。
在本公开的一些示例性实施例中,第一确定模块包括第一确定子模块,第一确定子模块被配置为:根据所述第一内容特征、更新后的第一权重、第二内容特征确定所述新产品和旧产品组成的产品集合中的每两个产品之间的权重欧氏距离,包括:根据新产品的第一内容特征和旧产品的第二内容特征确定第一数值;根据所述第一权重以及所述第一数值,确定所述新产品和旧产品组成的产品集合中的每两个产品之间的权重欧式距离。
在本公开的一些示例性实施例中,第一确定子模块还包括第一确定子单元,第一确定子单元被配置为:当所述第一内容特征与所述第二内容特征为数字时,基于所述第一内容特征与所述第二内容特征包含的数字确定所述第一数值;当所述第一内容特征与所述第二内容特征为非数字时进行文本匹配,若文本相同,确定所述第一数值为0,若文本不同,确定所述第一数值为1。
在本公开的一些示例性实施例中,第二确定模块包括第二确定子模块,第二确定子模块被配置为:步骤1,所述新产品和旧产品组成的产品集合中的每一个产品分别作为一个簇;步骤2,将所述簇中距离最近的两个簇进行合并;步骤3,重复所述步骤2,直至所述簇的个数等于预设阈值时结束合并簇,确定所述新产品所在的簇中的其他旧产品为所述新产品的邻居集。
在本公开的一些示例性实施例中,第三定模块包括第三确定子模块,第三确定子模块被配置为:根据所述邻居集中的旧产品的历史评分以及与所述邻居集中的旧产品关联的所述新产品的权重欧式距离,确定第二数值;根据所述第二数值以及所述邻居集中的旧产品与所述新产品的权重欧式距离的总和,确定所述新产品的预测评分。
本公开的第三方面提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储可执行指令,所述可执行指令在被所述处理器执行时,实现根据上文所述的方法。
本公开的第四方面提供了一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时,实现根据上文所述的方法。
本公开的第五方面提供了一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现根据上文所述的方法。
根据本公开的实施例,通过提取新产品的多个第一内容特征并对每个第一内容特征赋予初始第一权重,以及根据用户反馈动态更新每个第一内容特征的第一权重,可以趋于精确地获取用户对新产品的不同内容特征的偏好程度;基于新产品的第一内容特征和更新后的第一权重以及旧产品的第二内容特征计算每两个产品之间的权重欧氏距离,并且根据该权重欧氏距离确定新产品的邻居集中的旧产品,该邻居集中的旧产品与新产品的相似程度高,进而根据邻居集中的旧产品的历史评分和旧产品与新产品的权重欧氏距离预测新产品的评分,基于该预测评分对新产品进行推荐能够摆脱传统协同过滤依赖产品历史评分的困境,贴合用户偏好,达到精准营销的目的,从而提高用户满意度。
附图说明
通过以下参照附图对本公开实施例的描述,本公开的上述内容以及其他目的、特征和优点将更为清楚,在附图中:
图1示意性示出了可以应用本公开实施例的产品推荐方法的系统架构的示意图;
图2示意性示出了根据本公开实施例的产品推荐方法的流程图;
图3示意性示出了本公开实施例的产品推荐方法在初始化预处理的流程;
图4示意性示出了本公开实施例的产品推荐方法在对新产品进行初次推荐时的流程;
图5示意性示出了本公开实施例的产品推荐方法在操作S220中的流程;
图6示意性示出了本公开实施例的产品推荐方法在操作S240的流程图;
图7示意性示出了本公开实施例的产品推荐方法在操作S250的流程图;
图8示意性示出了本公开实施例的产品推荐方法在操作S260的流程图;
图9示意性示出了根据本公开实施例的产品推荐装置的结构框图;
图10示意性示出了根据本公开实施例的适于实现产品推荐方法的电子设备的方框图。
具体实施方式
以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。
在本公开的技术方案中,所涉及的用户个人信息的获取、存储和应用等,均符合相关法律法规的规定,采取了必要保密措施,且不违背公序良俗。
在本公开的技术方案中,所涉及的用户个人信息的获取、存储和应用等操作,均获得了用户的授权。
在本公开实施例中,术语“内容特征”例如可以是指某项产品所有对用户可见的关键元素,例如金融产品的内容特征可以为用户在购买理财产品时,可以看到的自营/代销、起购金额、风险评级、最短持有天数、业绩比较基准、币种等特征。
术语“协同过滤”例如可以是利用某兴趣相投、拥有共同经验之群体的喜好来推荐用户感兴趣的信息,个人通过合作的机制给予信息相当程度的回应(如评分)并记录下来以达到过滤的目的进而帮助别人筛选信息,回应不一定局限于特别感兴趣的,特别不感兴趣信息的纪录也相当重要。
在相关技术中,为解决“信息超载”问题,金融系统中各种产品推荐技术应运而生,有基于内容的推荐、基于协同过滤的推荐、混合推荐等技术。协同过滤是其中应用最广的推荐技术之一,但是协同过滤存在着冷启动问题,因为协同过滤依赖用户和产品的历史评分数据,而新用户或新产品缺少这些数据,会出现无法推荐或推荐效果差的现象,从而降低用户满意度,影响销售业绩。
例如现有的文献中公开了一种协同过滤算法冷启动问题的解决方法,其记载了利用项目(产品)的内容信息特征,结合凝聚式层次聚类算法,得到项目(产品)的归类结果,找到目标项目(产品)的邻居项目(产品),从而可以完成推荐。其主要解决传统的协同过滤推荐技术中新项目(产品)的冷启动问题,完成对新项目(产品)的推荐,提高算法的推荐精度和推荐质量。
在上述现有技术中,为解决新项目(产品)冷启动问题,利用了项目(产品)的内容特征计算两个产品间的欧式距离,作为后面层次聚类的依据,然而实际上在金融产品推荐的业务场景中,用户对不同内容特征的偏好程度并不相同。因此,现有技术对所有内容特征“一视同仁”计算欧式距离并根据该欧氏距离进行层次聚类的方法,在金融产品推荐的实际运用中,有时候不能正确反映两个产品相似程度,进而会影响后面的层次聚类以及协同过滤推荐的最终结果,降低新项目(产品)的推荐质量。
为了解决上述的问题,本公开提供了产品推荐方法、装置、电子设备、可读存储介质及计算机程序产品,可以获取用户对新产品的多个内容特征的偏好程度,并基于新旧产品的多个内容特征对应的权重欧式距离进行层次聚类、获取包含与新产品相似程度高的旧产品的邻居集、预测评分并进行动态推荐,推荐的新产品能够贴合用户偏好,从而提高了推荐质量和用户满意度。该产品推荐方法包括但不限于:提取新产品的至少一个第一内容特征;对至少一个第一内容特中的每一个第一内容特征赋予初始第一权重,并根据用户反馈更新第一内容特征的第一权重,用户反馈是基于第一时间段内的新产品的第一内容特征得到的;获取至少一个旧产品的第二内容特征;根据第一内容特征、更新后的第一权重、第二内容特征确定新产品和旧产品组成的产品集合中的每两个产品之间的权重欧氏距离;根据权重欧氏距离确定新产品的邻居集,邻居集中包含至少一个旧产品;根据邻居集中的旧产品与新产品的权重欧氏距离以及邻居集中的旧产品的历史评分确定新产品的预测评分;根据预测评分确定向用户推荐的至少一种新产品。
根据本公开的实施例,通过提取新产品的多个第一内容特征并对每个第一内容特征赋予初始第一权重,以及根据用户反馈动态更新每个第一内容特征的第一权重,可以趋于精确地获取用户对新产品的不同内容特征的偏好程度;基于新产品的第一内容特征和更新后的第一权重以及旧产品的第二内容特征计算每两个产品之间的权重欧氏距离,并且根据该权重欧氏距离确定新产品的邻居集中的旧产品,该邻居集中的旧产品与新产品的相似程度高,进而根据邻居集中的旧产品的历史评分和旧产品与新产品的权重欧氏距离预测新产品的评分,基于该预测评分对新产品进行推荐能够摆脱传统协同过滤依赖产品历史评分的困境,贴合用户偏好,达到精准营销的目的,从而提高用户满意度。
图1示意性示出了可以应用本公开实施例的产品推荐方法的系统架构的示意图。需要注意的是,图1所示仅为可以应用本公开实施例的系统架构的示例,以帮助本领域技术人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。需要说明的是,本公开实施例提供的产品推荐方法可用于大数据技术领域、金融领域在产品推荐的相关方面,也可用于除金融领域之外的任意领域,本公开实施例提供的产品推荐方法和装置对应用领域不做限定。
如图1所示,可以应用产品推荐方法的示例性系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如邮件客户端应用、文件处理类应用、购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
终端设备101、102、103可以是具有显示屏并且支持数据输入、文件发送、数据分析、数据处理、网页浏览等功能的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对用户利用终端设备101、102、103所获取的数据或浏览的网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的用户请求等数据进行分析等处理,并将处理结果(例如根据用户请求获取或生成的网页、信息、或数据等)反馈给终端设备。也可以是对用户发送的文件等进行分析或处理,并基于处理结果对终端设备进行控制等,例如限制终端设备的访问等。
需要说明的是,本公开实施例所提供的产品推荐方法一般可以由服务器105执行。相应地,本公开实施例所提供的产品推荐装置一般可以设置于服务器105中。本公开实施例所提供的产品推荐方法也可以由不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群执行。相应地,本公开实施例所提供的产品推荐装置也可以设置于不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
以下将通过图2至图8对公开实施例的产品推荐方法进行详细描述。
图2示意性示出了根据本公开实施例的产品推荐方法的流程图。
如图2所示,本公开过的产品推荐方法的流程200包括操作S210至操作S270。
在操作S210中,提取新产品的至少一个第一内容特征。
示例性地,新产品例如可以是金融产品推荐的业务场景下的金融产品或项目,第一内容特征可以是来自金融产品的所有对用户可见的关键元素。
例如,用户在购买理财产品时,可以看到的自营/代销、起购金额、风险评级、最短持有天数、业绩比较基准、币种等特征为用户使用的金融产品的第一内容特征。
图3示意性示出了本公开实施例的产品推荐方法在初始化预处理的流程。
如图3所示,在提取新产品的至少一个第一内容特征后,进行初始化预处理的流程300包括操作S310至操作S330。
在操作S310中,针对含有数字的第一内容特征,提取数字并去除非数字内容。
在操作S320中,针对含有上限和下限的数字范围的第一内容特征,提取数字范围的中间值。
在操作S330中,针对不包含数字的第一内容特征,保持不变。
根据本公开的实施例,通过初始化预处理,可以便于后续流程的操作。
在操作S220中,对所述至少一个第一内容特征中的每一个赋予初始第一权重,并根据用户反馈更新所述第一内容特征的第一权重,所述用户反馈是基于第一时间段内的新产品的第一内容特征反馈得到的。
图4示意性示出了本公开实施例的产品推荐方法在对新产品进行初次推荐时的流程S400。
在操作S400中,新产品初次推荐时,每一个新产品包括的第一内容特征的初始第一权重赋值为1。根据操作S400,通过在初次推荐时,设定各个第一内容特征的初始第一权重为1,可以防止因随机推荐而导致后续用户反馈失真,从而使后续的产品推荐更准确。
图5示意性示出了本公开实施例的产品推荐方法在操作S220中的具体流程。
示例性地,操作S220进一步包括操作S221,在操作S221中,根据在第一时间段内获取的与每一个第一内容特征相关联的用户反馈,更新第二时间段内的新产品的每一个第一内容特征的第一权重。
在本公开的一些示例性实施例中,用户反馈是用于对新产品的每一个第一内容特征从第一天至第N天汇总得到的偏好反馈计数,根据第一天至第N天收集到的用户反馈数据计算第N+1天的每一个第一内容特征的更新后的第一权重。具体公式如下:
其中,Wk是新产品的n个第一内容特征中第k个第一内容特征在第N+1天的更新后的第一权重,fk是第一天至第N天内用户对第k个第一内容特征的偏好反馈总数,n是新产品的第一内容特征的总数。
示例性地,新产品为银行理财产品,提取到下表1中的5个第一内容特征,当前两天用户对新产品的每个第一内容特征的偏好反馈计数如下表1所示时,则根据前两天内的用户反馈计算得到第3天的新产品的每一个第一内容特征的更新后的第一权重如下表2所示。
表1
表2
在本公开的一些示例性实施例中,在指定时间段内,当用户购买新产品之后,或者向用户推荐新产品但是用户选择拒绝时,向用户收集对于内容特征的偏好并记录反馈数据。
示例性地,推荐新产品给用户但是用户选择拒绝时,收集用户对新产品哪些内容特征不满意的反馈;用户购买新产品之后,收集用户对新产品哪些内容特征满意的反馈。具体记录方法如下:
新产品上线时,新产品的每一个第一内容特征的初始计数都是0,然后,无论收集到的是用户对某一个第一内容特征的满意反馈还是不满意反馈,都将该第一内容应特征的偏好反馈计数加1。在指定时间段内每天收集用户的偏好反馈并进行计数累加,第一天至第N天累加得到的偏好反馈计数将用于公式(1)计算得到第N+1天更新后的第一权重。
例如,通过下述步骤获取用户反馈:在推荐用户登录产品购买系统时,弹出新产品的广告以向用户推荐新产品,广告里面描述新产品的预处理前的多个第一内容特征。当用户拒绝广告时,提供下述表3供用户反馈对新产品的哪些第一内容特征不满意;类似地,用户购买了新产品之后,提供下表4格供用户反馈。
表3
不满意新产品哪一项(可多选) | 不满意该项的原因 | |
□ | 自营/代销 | |
□ | 起购金额 | |
□ | 风险评级 | |
□ | 最短持有天数 | |
□ | 业绩比较基准(收益率) |
表4
满意新产品哪一项(可多选) | 满意该项的原因 | |
□ | 自营/代销 | |
□ | 起购金额 | |
□ | 风险评级 | |
□ | 最短持有天数 | |
□ | 业绩比较基准(收益率) |
例如,如果用户不满意新产品的风险评级过高、持有天数太长、业绩基准(收益率)太低,则在上表3的方框中勾选风险评级、最短持有天数、业绩比较基准(收益率)这3个内容特征,则这3个内容特征的偏好反馈计数加1。类似地,如果用户满意该新产品起购金额低、业绩比较基准(收益率)高这2个内容特征,则在上表4的方框中勾选起购金额、业绩比较基准(收益率)这2个内容特征,则这2个特征的偏好反馈计数加1。
根据本公开的实施例,通过在新产品上线的短期内根据用户反馈(每天)动态调整新产品的每个第一内容特征对应的权重,能够趋于精确地获取用户对新产品的不同第一内容特征的偏好程度,为后续确定贴合用户偏好的产品推荐提供基础。
在操作S230中,获取至少一个旧产品的第二内容特征。
在本公开的一些示例性实施例中,获取旧产品的第二内容特征后,对获取的的第二内容特征进行初始化预处理,该初始化预处理与操作S210中对新产品的第一内容特征进行的初始化预处理相同。
示例性地,旧产品A和B,以及新产品C是银行理财产品,产品A、B、C中的每一个产品提取到表5中的5个内容特征,对产品A、B、C的每个内容特征进行初始化预处理:第1个内容特征不含数字因而保持不变;第2、3、4个内容特征包含数字因而直接取数字;第5个内容特征包含数字范围因而取范围中间值。由此得到对表5中的产品A、B、C的内容特征进行初始化预处理后的内容特征,详见表6所示。
表5
表6
根据本公开的实施例,通过对获取的新产品的第一内容特征和旧产品的第二内容特征进行初始化预处理,便于后续基于内容特征的计算。
在操作S240中,根据第一内容特征、更新后的第一权重、第二内容特征确定新产品和旧产品组成的产品集合中的每两个产品之间的权重欧氏距离。
图6示意性示出了本公开实施例的产品推荐方法在操作S240的流程图。
如图6所示,操作S240包括操作S241至操作S242。
在操作S241中,根据新产品的第一内容特征和旧产品的第二内容特征确定第一数值。
在操作S242中,根据第一权重以及第一数值,确定新产品和旧产品组成的产品集合中的每两个产品之间的权重欧式距离。
示例性地,根据下述公式(2)计算所有新产品和旧产品组成的产品集合中的每两个产品之间的权重欧氏距离:
在公式(2)中,d(i,j)是产品集合中的产品i和产品j之间的权重欧氏距离,ik是产品i的第k个内容特征,jk是产品j的第k个内容特征,ik-jk是根据新产品的第一内容特征和旧产品的第二内容特征确定的第一数值;Wk是根据前述公式(1)计算得到的当前时间段的第k个内容特征更新后的第一权重。
在本公开的实施例中,根据新产品的第一内容特征和旧产品的第二内容特征确定第一数值包括:当第一内容特征与第二内容特征为数字时,基于第一内容特征与第二内容特征包含的数字确定第一数值;当第一内容特征与第二内容特征为非数字时进行文本匹配,若文本相同,确定第一数值为0,若文本不同,确定第一数值为1。
示例性地,在第三天时,根据前述公式(1)计算得到第三天更新后的第一权重,进而根据上述公式(2)计算得到全部产品集合中的每两个产品之间的权重欧式距离,详见表7所示。
表7
A产品 | B产品 | C产品 | |
A产品 | 0 | 372.03 | 223.10 |
B产品 | 372.03 | 0 | 159.69 |
C产品 | 223.10 | 159.69 | 0 |
在操作S250中,根据权重欧氏距离确定新产品的邻居集。邻居集中包含至少一个旧产品。
在本公开的一些示例性实施例中,基于操作S240获得的产品之间的权重欧氏距离通过凝聚式层次聚类确定新产品的邻居集。
图7示意性示出了根据本公开实施例的产品推荐方法在操作S250中的流程图。
下面结合图7对操作S250的流程进行具体说明,如图7所示,根据权重欧氏距离确定新产品的邻居集包括操作S251至操作S254。
在操作S251中,将新产品和旧产品组成的产品集合中的每一个产品分别作为一个簇。
在操作S252中,将簇中距离最近的两个簇进行合并。
在本公开的一些示例性实施例中,两个簇Ci和Cj之间的距离计算采用最短距离法,即两个簇中距离最近的两个点(产品i和产品j)之间的权重欧式距离d(i,j)是两个簇之间的距离。具体计算公式如下:
在公式(4)中,dc(Ci,Cj)是簇Ci和Cj之间的距离。
在操作S253中,判断簇的个数是否等于预设阈值,当簇的个数等于预设阈值时执行操作S254,当簇的个数大于预设阈值时执行操作S252。
在操作S254中,结束合并簇,确定新产品所在的簇中的其他旧产品为新产品的邻居集。
示例性地,新产品和旧产品组成的产品集合包括{旧产品A,旧产品B,新产品C},簇的预设阈值设为1,进行下述步骤以确定新产品的邻居集:
初始每个产品为一个簇,则有{A产品}、{B产品}、{C产品}3个簇,根据上述公式(4)计算每个簇之间的距离,{A产品}簇和{B产品}簇之间的距离为372.03,{A产品}簇和{C产品}簇之间的距离为223.10,{B产品}簇和{C产品}簇之间的距离为159.69,{B产品}簇和{C产品}簇之间的距离最近进行合并,得到新簇{B产品,C产品}和{A产品}共2个簇。继续进行簇合并,得到{B产品,C产品,A产品}共1个簇的时候终止合并,则[B产品,A产品]是新产品C的邻居集。
同理,当簇的预设阈值为2时,最终得到{B产品,C产品}和{A产品}共2个簇,则[B产品]是新产品C的邻居集。
在本公开的一些示例性实施例中,簇的预设阈值可以根据经验预设为固定数值如2,也可以设置为初始簇数目的一定比例如10%。在本公开的其他可选的实施例中,簇的预设阈值可以根据实际的需求进行调整,从而满足不同场景的需求。
根据本公开的实施例,基于产品的多个内容特征确定的欧式距离来衡量新旧产品的相似度,再向上聚类找出邻居集,避免了传统协同过滤算法新产品因无历史评分从而无法计算相似度和无法寻找邻居的困境,一定程度上解决了推荐新金融产品时使用传统协同过滤算法的冷启动问题。
在操作S260中,根据邻居集中的旧产品与新产品的权重欧氏距离以及邻居集中的旧产品的历史评分确定新产品的预测评分。
图8示意性示出了本公开实施例的产品推荐方法在操作S260的流程图。
如图8所示,操作S260包括操作S261至操作S262。
在操作S261中,根据邻居集中的旧产品的历史评分以及与邻居集中的旧产品关联的新产品的权重欧式距离,确定第二数值。
在操作S262中,根据第二数值以及邻居集中的旧产品与新产品的权重欧式距离的总和,确定新产品的预测评分。
示例性地,根据下述公式(3)计算新产品的预测评分:
在公式(3)中,是新产品j的预测评分,Nj是新产品j的邻居集中的旧产品i的集合,ru,i是用户u对新产品j的邻居集中的旧产品i的历史评分,d(i,j)是根据前述公式(2)计算得到的产品i和产品j的权重欧式距离,d(i,j)和ru,i的乘积是根据邻居集中的旧产品的历史评分以及该旧产品和与该旧产品关联的新产品之间的权重欧式距离确定的第二数值。
示例性地,根据操作S250确定新产品C的邻居集为[旧产品B,旧产品A],用户对旧产品B、A的历史评分分别为80、90,在第三天时,根据操作S240得到BC、AC的权重欧式距离为159.69、223.10(见表7),然后根据前述公式(3)计算得到第三天对新产品C的预测评分((159.69×80+223.10×90))/(159.69+223.10)=85.82826092635649,并将计算结果取小数点后两位,得到新产品C的预测评分为85.83。
在操作S270中,根据预测评分确定向用户推荐的至少一种新产品。
在本公开的一些示例性实施例中,根据操作S210至S250确定每一个新产品的预测评分,并按照所有新产品的预测评分对新产品从高到低进行排序,选取该排序列表中的前M个新产品进行推荐,其中M为正整数,即推荐的新产品可以为一个,也可以为多个。
示例性地,在指定的较短时间段内(该较短时间段内尚不足以形成足够的用户对新产品的评分,但可以得到内容特征的用户偏好反馈),以十天为例,第一天按照新产品的每个第一内容特征的初始第一权重为1确定新产品的预测评分并进行产品推荐;第二天根据第一天用户反馈的对不同第一内容特征的偏好更新的第一权重,并根据更新后的权重确定新产品的预测评分并进行产品推荐;第三天根据第一天和第二天用户反馈的对不同第一内容特征的偏好更新的第一权重,并根据更新后的权重确定新产品的预测评分并进行产品推荐,依此类推,一直到第十天,期间第一权重每天动态调整,进而实现权重欧氏距离、邻居集、预测评分、用户推荐列表的动态更新,最终推荐结果趋向精准。
根据本公开的实施例,通过获取新产品的多个内容特征和旧产品的多个第二内容特征,以及根据用户反馈动态更新每个第一内容特征的第一权重,可以趋于精确地获取用户对新产品的不同第一内容特征的偏好程度,进而基于每个内容特征及更新后的第一权重确定产品间的权重欧氏距离,能够确定相似度高的产品。并且,根据相似度高的邻居集中的旧产品的历史评分和旧产品与新产品的权重欧氏距离预测新产品的评分,基于该预测评分对新产品进行推荐能够摆脱传统协同过滤依赖产品历史评分的困境,一定程度上解决了通过传统协同过滤算法推荐产品时的冷启动问题,达到贴合用户偏好、精准营销的目的,从而提高用户满意度。尤其对金融领域如银行业而言,通过在新产品上线的短期内根据用户反馈每天动态调整新产品的每个第一内容特征对应的权重,能够实现权重欧氏距离、邻居集、预测评分、用户推荐列表的动态更新,更加符合金融产品的应用场景需求,提高了推荐质量。
图9示意性示出了根据本公开实施例的产品推荐装置的结构框图。
如图9所示,本公开实施例的产品推荐装置500包括提取模块501、更新模块502、获取模块503、第一确定模块504、第二确定模块505、第三确定模块506、第四确定模块507。
提取模块501,配置为提取新产品的至少一个第一内容特征。在一实施例中,提取模块501可以用于执行前文描述的操作S210,在此不再赘述。
更新模块502,配置为对所述至少一个第一内容特中的每一个第一内容特征赋予初始第一权重,并根据用户反馈更新所述第一内容特征的第一权重,所述用户反馈是基于第一时间段内的新产品的第一内容特征得到的。在一实施例中,更新模块502可以用于执行前文描述的操作S220,在此不再赘述。
获取模块503,配置为获取至少一个旧产品的第二内容特征。在一实施例中,获取模块503可以用于执行前文描述的操作S230,在此不再赘述。
第一确定模块504,配置为根据所述第一内容特征、更新后的第一权重、第二内容特征确定所述新产品和旧产品组成的产品集合中的每两个产品之间的权重欧氏距离。在一实施例中,第一确定模块504可以用于执行前文描述的操作S240,在此不再赘述。
第二确定模块505,配置为根据所述权重欧氏距离确定所述新产品的邻居集,所述邻居集中包含至少一个旧产品。在一实施例中,第二确定模块505可以用于执行前文描述的操作S250,在此不再赘述。
第三确定模块506,配置为根据所述邻居集中的旧产品与所述新产品的权重欧氏距离以及所述邻居集中的旧产品的历史评分确定所述新产品的预测评分。在一实施例中,第三确定模块506可以用于执行前文描述的操作S260,在此不再赘述。
第四确定模块507,配置为根据所述预测评分确定向用户推荐的至少一种新产品。在一实施例中,第四确定模块507可以用于执行前文描述的操作S270,在此不再赘述。
在本公开的一些示例性实施例中,产品推荐装置还包括预处理模块,预处理模块被配置为:提取新产品的至少一个第一内容特征后,对所述第一内容特征进行初始化预处理,其中,所述初始化预处理包括:针对含有数字的第一内容特征,提取数字并去除非数字内容;针对含有上限和下限的数字范围的第一内容特征,提取所述数字范围的中间值;针对不包含数字的第一内容特征,保持不变。
在本公开的一些示例性实施例中,产品推荐装置还包括初始权重确定模块,初始权重模块被配置为:所述新产品初次推荐时,每一个所述新产品包括的第一内容特征的初始第一权重为1。
在本公开的一些示例性实施例中,更新模块还包括更新子模块,更新子模块被配置为:根据在所述第一时间段内获取的与每一个所述第一内容特征相关联的所述用户反馈,更新第二时间段内的所述新产品的每一个所述第一内容特征的第一权重。
在本公开的一些示例性实施例中,第一确定模块包括第一确定子模块,第一确定子模块被配置为:根据所述第一内容特征、更新后的第一权重、第二内容特征确定所述新产品和旧产品组成的产品集合中的每两个产品之间的权重欧氏距离,包括:根据新产品的第一内容特征和旧产品的第二内容特征确定第一数值;根据所述第一权重以及所述第一数值,确定所述新产品和旧产品组成的产品集合中的每两个产品之间的权重欧式距离。
在本公开的一些示例性实施例中,第一确定子模块还包括第一确定子单元,第一确定子单元被配置为:当所述第一内容特征与所述第二内容特征为数字时,基于所述第一内容特征与所述第二内容特征包含的数字确定所述第一数值;当所述第一内容特征与所述第二内容特征为非数字时进行文本匹配,若文本相同,确定所述第一数值为0,若文本不同,确定所述第一数值为1。
在本公开的一些示例性实施例中,第二确定模块包括第二确定子模块,第二确定子模块被配置为:步骤1,所述新产品和旧产品组成的产品集合中的每一个产品分别作为一个簇;步骤2,将所述簇中距离最近的两个簇进行合并;步骤3,重复所述步骤2,直至所述簇的个数等于预设阈值时结束合并簇,确定所述新产品所在的簇中的其他旧产品为所述新产品的邻居集。
在本公开的一些示例性实施例中,第三确定模块包括第三确定子模块,第三确定子模块被配置为:根据所述邻居集中的旧产品的历史评分以及与所述邻居集中的旧产品关联的所述新产品的权重欧式距离,确定第二数值;根据所述第二数值以及所述邻居集中的旧产品与所述新产品的权重欧式距离的总和,确定所述新产品的预测评分。
根据本公开的实施例,提取模块501、更新模块502、获取模块503、第一确定模块504、第二确定模块505、第三确定模块506、第四确定模块507中的任意多个模块可以合并在一个模块中实现,或者其中的任意一个模块可以被拆分成多个模块。或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合,并在一个模块中实现。根据本公开的实施例,提取模块501、更新模块502、获取模块503、第一确定模块504、第二确定模块505、第三确定模块506、第四确定模块507中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,提取模块501、更新模块502、获取模块503、第一确定模块504、第二确定模块505、第三确定模块506、第四确定模块507中的至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
图10示意性示出了根据本公开实施例的适于实现产品推荐方法的电子设备的方框图。图10示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图10所示,根据本公开实施例的电子设备600包括处理器601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。处理器601例如可以包括通用微处理器(例如CPU)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC))等等。处理器601还可以包括用于缓存用途的板载存储器。处理器601可以包括用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
在RAM 603中,存储有电子设备600操作所需的各种程序和数据。处理器601、ROM602以及RAM 603通过总线604彼此相连。处理器601通过执行ROM 602和/或RAM 603中的程序来执行根据本公开实施例的方法流程的各种操作。需要注意,所述程序也可以存储在除ROM 602和RAM 603以外的一个或多个存储器中。处理器601也可以通过执行存储在所述一个或多个存储器中的程序来执行根据本公开实施例的方法流程的各种操作。
根据本公开的实施例,电子设备600还可以包括输入/输出(I/O)接口605,输入/输出(I/O)接口605也连接至总线604。电子设备600还可以包括连接至I/O接口605的以下部件中的一项或多项:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备/装置/系统中所包含的;也可以是单独存在,而未装配入该设备/装置/系统中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本公开实施例的方法。
根据本公开的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质,例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。例如,根据本公开的实施例,计算机可读存储介质可以包括上文描述的ROM 602和/或RAM 603和/或ROM 602和RAM 603以外的一个或多个存储器。
本公开的实施例还包括一种计算机程序产品,其包括计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。当计算机程序产品在计算机系统中运行时,该程序代码用于使计算机系统实现本公开实施例所提供的方法。
在该计算机程序被处理器601执行时执行本公开实施例的系统/装置中限定的上述功能。根据本公开的实施例,上文描述的系统、装置、模块、单元等可以通过计算机程序模块来实现。
在一种实施例中,该计算机程序可以依托于光存储器件、磁存储器件等有形存储介质。在另一种实施例中,该计算机程序也可以在网络介质上以信号的形式进行传输、分发,并通过通信部分609被下载和安装,和/或从可拆卸介质611被安装。该计算机程序包含的程序代码可以用任何适当的网络介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被处理器601执行时,执行本公开实施例的系统中限定的上述功能。根据本公开的实施例,上文描述的系统、设备、装置、模块、单元等可以通过计算机程序模块来实现。
根据本公开的实施例,可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例提供的计算机程序的程序代码,具体地,可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。程序设计语言包括但不限于诸如Java,C++,python,“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合或/或结合,即使这样的组合或结合没有明确记载于本公开中。特别地,在不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。
以上对本公开的实施例进行了描述。但是,这些实施例仅仅是为了说明的目的,而并非为了限制本公开的范围。尽管在以上分别描述了各实施例,但是这并不意味着各个实施例中的措施不能有利地结合使用。本公开的范围由所附权利要求及其等同物限定。不脱离本公开的范围,本领域技术人员可以做出多种替代和修改,这些替代和修改都应落在本公开的范围之内。
Claims (12)
1.一种产品推荐方法,其中,包括:
提取新产品的至少一个第一内容特征;
对所述至少一个第一内容特征中的每一个赋予初始第一权重,并根据用户反馈更新所述第一内容特征的第一权重,所述用户反馈是基于第一时间段内的新产品的第一内容特征反馈得到的;
获取至少一个旧产品的第二内容特征;
根据所述第一内容特征、更新后的第一权重、第二内容特征确定所述新产品和旧产品组成的产品集合中的每两个产品之间的权重欧氏距离;
根据所述权重欧氏距离确定所述新产品的邻居集,所述邻居集中包含至少一个旧产品;
根据所述邻居集中的旧产品与新产品的权重欧氏距离以及所述邻居集中的旧产品的历史评分确定所述新产品的预测评分;
根据所述预测评分确定向用户推荐的至少一种新产品。
2.根据权利要求1所述的方法,其中,提取新产品的至少一个第一内容特征后,对所述第一内容特征进行初始化预处理,
其中,所述初始化预处理包括:
针对含有数字的第一内容特征,提取数字并去除非数字内容;
针对含有上限和下限的数字范围的第一内容特征,提取所述数字范围的中间值;以及
针对不包含数字的第一内容特征,保持不变。
3.根据权利要求1所述的方法,其中,所述新产品初次推荐时,每一个所述新产品包括的第一内容特征的初始第一权重为1。
4.根据权利要求1所述的方法,其中,
根据用户反馈更新所述第一内容特征的第一权重包括:
根据在所述第一时间段内获取的与每一个所述第一内容特征相关联的所述用户反馈,更新第二时间段内的所述新产品的每一个所述第一内容特征的第一权重。
5.根据权利要求1所述的方法,其中,
根据所述第一内容特征、更新后的第一权重、第二内容特征确定所述新产品和旧产品组成的产品集合中的每两个产品之间的权重欧氏距离,包括:
根据新产品的第一内容特征和旧产品的第二内容特征确定第一数值;
根据所述第一权重以及所述第一数值,确定所述新产品和旧产品组成的产品集合中的每两个产品之间的权重欧式距离。
6.根据权利要求5所述的方法,其中,
当所述第一内容特征与所述第二内容特征为数字时,基于所述第一内容特征与所述第二内容特征包含的数字确定所述第一数值;
当所述第一内容特征与所述第二内容特征为非数字时进行文本匹配,若文本相同,确定所述第一数值为0,若文本不同,确定所述第一数值为1。
7.根据权利要求1所述的方法,其中,根据所述权重欧氏距离确定所述新产品的邻居集包括:
步骤1,所述新产品和旧产品组成的产品集合中的每一个产品分别作为一个簇;
步骤2,将所述簇中距离最近的两个簇进行合并;
步骤3,重复所述步骤2,直至所述簇的个数等于预设阈值时结束合并簇,确定所述新产品所在的簇中的其他旧产品为所述新产品的邻居集。
8.根据权利要求1所述的方法,其中,
根据所述邻居集中的旧产品与新产品的权重欧氏距离以及所述邻居集中的旧产品的历史评分确定所述新产品的预测评分,包括:
根据所述邻居集中的旧产品的历史评分以及与所述邻居集中的旧产品关联的所述新产品的权重欧式距离,确定第二数值;
根据所述第二数值以及所述邻居集中的旧产品与所述新产品的权重欧式距离的总和,确定所述新产品的预测评分。
9.一种产品推荐装置,其中,所述装置包括:
提取模块,配置为提取新产品的至少一个第一内容特征;
更新模块,配置为对所述至少一个第一内容特征中的每一个赋予初始第一权重,并根据用户反馈更新所述第一内容特征的第一权重,所述用户反馈是基于第一时间段内的新产品的第一内容特征反馈得到的;
获取模块,配置为获取至少一个旧产品的第二内容特征;
第一确定模块,配置为根据所述第一内容特征、更新后的第一权重、第二内容特征确定所述新产品和旧产品组成的产品集合中的每两个产品之间的权重欧氏距离;
第二确定模块,配置为根据所述权重欧氏距离确定所述新产品的邻居集,所述邻居集中包含至少一个旧产品;
第三确定模块,配置为根据所述邻居集中的旧产品与新产品的权重欧氏距离以及所述邻居集中的旧产品的历史评分确定所述新产品的预测评分;
第四确定模块,配置为根据所述预测评分确定向用户推荐的至少一种新产品。
10.一种电子设备,包括:
一个或多个处理器;
存储装置,用于存储可执行指令,所述可执行指令在被所述处理器执行时,实现根据权利要求1至8中任一项所述的方法。
11.一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时,实现根据权利要求1至8中任一项所述的方法。
12.一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现根据权利要求1至8中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310422911.2A CN116431933A (zh) | 2023-04-19 | 2023-04-19 | 产品推荐方法、装置、电子设备、存储介质及程序产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310422911.2A CN116431933A (zh) | 2023-04-19 | 2023-04-19 | 产品推荐方法、装置、电子设备、存储介质及程序产品 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116431933A true CN116431933A (zh) | 2023-07-14 |
Family
ID=87082963
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310422911.2A Pending CN116431933A (zh) | 2023-04-19 | 2023-04-19 | 产品推荐方法、装置、电子设备、存储介质及程序产品 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116431933A (zh) |
-
2023
- 2023-04-19 CN CN202310422911.2A patent/CN116431933A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20080243531A1 (en) | System and method for predictive targeting in online advertising using life stage profiling | |
US20180108029A1 (en) | Detecting differing categorical features when comparing segments | |
US20210012363A1 (en) | Device, method and computer-readable medium for analyzing customer attribute information | |
CN111783039B (zh) | 风险确定方法、装置、计算机系统和存储介质 | |
CN109213936B (zh) | 商品搜索方法和装置 | |
WO2021169659A1 (zh) | 资源信息推送方法、装置、服务器及存储介质 | |
CN110717597A (zh) | 利用机器学习模型获取时序特征的方法和装置 | |
CN113516496A (zh) | 广告转化率预估模型构建方法、装置、设备及其介质 | |
JP6709775B2 (ja) | 算出装置、算出方法及び算出プログラム | |
CN111429161A (zh) | 特征提取方法、特征提取装置、存储介质及电子设备 | |
CN115545886A (zh) | 逾期风险识别方法、装置、设备及存储介质 | |
CN115983900A (zh) | 用户营销策略的构建方法、装置、设备、介质和程序产品 | |
CN111429214A (zh) | 一种基于交易数据的买卖双方匹配方法及装置 | |
CN117437020A (zh) | 商户风险判定方法、装置、电子设备和介质 | |
CN116862641A (zh) | 信贷产品推荐方法、装置、电子设备及存储介质 | |
CN116664306A (zh) | 风控规则的智能推荐方法、装置、电子设备及介质 | |
CN110889716A (zh) | 识别潜在注册用户的方法及装置 | |
CN116308641A (zh) | 产品推荐方法、训练方法、装置、电子设备和介质 | |
CN112948701B (zh) | 信息推荐装置、方法、设备及存储介质 | |
CN115827994A (zh) | 一种数据处理方法、装置、设备、存储介质 | |
CN116431933A (zh) | 产品推荐方法、装置、电子设备、存储介质及程序产品 | |
CN116109354A (zh) | 内容推荐方法、装置、设备、存储介质及计算机程序产品 | |
CN112200602A (zh) | 用于广告推荐的神经网络模型训练方法及装置 | |
CN116308615A (zh) | 产品推荐方法、装置、电子设备及存储介质 | |
CN116304325A (zh) | 应用软件的功能推荐方法、推荐装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |