CN111966900A - 基于局部敏感哈希的用户冷启动产品推荐方法及系统 - Google Patents

基于局部敏感哈希的用户冷启动产品推荐方法及系统 Download PDF

Info

Publication number
CN111966900A
CN111966900A CN202010824566.1A CN202010824566A CN111966900A CN 111966900 A CN111966900 A CN 111966900A CN 202010824566 A CN202010824566 A CN 202010824566A CN 111966900 A CN111966900 A CN 111966900A
Authority
CN
China
Prior art keywords
product
user
products
information
popular
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010824566.1A
Other languages
English (en)
Inventor
狄潇然
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bank of China Ltd
Original Assignee
Bank of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bank of China Ltd filed Critical Bank of China Ltd
Priority to CN202010824566.1A priority Critical patent/CN111966900A/zh
Publication of CN111966900A publication Critical patent/CN111966900A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/02Banking, e.g. interest calculation or account maintenance

Abstract

本发明提出了一种基于局部敏感哈希的用户冷启动产品推荐方法及系统,该方法包括:采集当前时间窗口内的产品操作数据,选取第一热门产品;获取产品自带信息,生成产品向量数据;根据产品向量数据,基于局部敏感哈希算法计算产品之间的相似度;建立产品大类与兴趣标签的关联关系;如果新用户的用户类型为游客模式用户,将第一热门产品作为首次曝光产品进行展示;如果为注册用户,获取选择的兴趣标签,获取第二热门产品,按照预设权重生成首次曝光产品进行展示;在新用户与首次曝光产品户发生交互行为时,根据产品之间的相似度查找交互相似产品,并将相似产品作为新的曝光产品进行展示,本发明能够生成个性化的用户冷启动结果,提高用户体验。

Description

基于局部敏感哈希的用户冷启动产品推荐方法及系统
技术领域
本发明涉及数据处理技术领域,尤指一种基于局部敏感哈希的用户冷启动产品推荐方法及系统。
背景技术
随着互联网的发展,跨境APP面临着严重的信息过载问题,推荐系统作为解决跨境场景下信息过载有效手段之一,可利用用户与跨境APP的交互记录为用户推荐其可能喜欢的物品。
在现有技术中,当新用户登录到银行系统中时,比较常用的推荐方式有两种:
1、随机推荐方式,当新用户进入银行系统中时,推荐算法在物品库中随机选择若干个物品推荐给用户;这种方式没有利用用户与银行系统的任何交互信息,推荐结果往往无法令用户满意。
2、筛选出与当前登录用户最相近的一批用户,并根据这批用户的偏好信息为登录用户进行推荐。由于“游客”类用户没有任何信息,难以计算相似用户的情况。此外,当用户量大量增加时,用户相似度的计算量迅速增加,耗费资源。
因此,由于新用户没有或者只有少量记录、信息,推荐系统很难为他们进行合理的推荐,严重影响用户首次使用跨境APP时的体验,增加客户流失的风险。
综上来看,亟需一种可以克服上述问题,改善用户冷启动登录体验的技术方案。
发明内容
为克服上述问题,本发明提出了一种基于局部敏感哈希的用户冷启动产品推荐方法及系统,该方法及系统利用局部敏感哈希算法得到产品之间的相似度,通过采集产品热度及用户感兴趣的标签给新用户推荐首次曝光产品,当用户与曝光产品发生交互时,通过计算好的产品相似度进行曝光产品的更新,该推荐处理的过程中采用的局部敏感哈希算法可以保证在较小计算量完成海量产品相似性的计算,通过相似度对曝光产品进行更新能够提高用户冷启动准确性,并且有效提高了游客模式用户的冷启动时的体验。
在本发明实施例的第一方面,提出了一种基于局部敏感哈希的用户冷启动产品推荐方法,该方法包括:
采集跨境APP当前时间窗口内的产品操作数据,根据所述产品操作数据选取第一热门产品;
获取产品自带信息,对所述产品自带信息进行整合,并将整合后的数据进行预处理,生成产品向量数据;
根据产品向量数据,基于局部敏感哈希算法计算产品之间的相似度;
记录用户首次登录跨境APP时自主选择的兴趣标签,建立产品大类与所述兴趣标签的关联关系;
当新用户登录跨境APP时,检测用户类型;
如果所述新用户的用户类型为游客模式用户,将所述第一热门产品作为首次曝光产品进行展示;
如果所述新用户的用户类型为注册用户,获取所述注册用户自主选择的兴趣标签,根据所述关联关系获取兴趣标签关联的产品大类中的第二热门产品,根据所述第一热门产品及所述第二热门产品,按照预设权重生成首次曝光产品进行展示;
在所述新用户与首次曝光产品户发生交互行为时,根据所述产品之间的相似度查找交互相似产品,并将所述相似产品作为新的曝光产品进行展示。
在本发明实施例的第二方面,提出了一种基于局部敏感哈希的用户冷启动产品推荐系统,该系统包括:
数据采集模块,用于采集跨境APP当前时间窗口内的产品操作数据,根据所述产品操作数据选取第一热门产品;
产品信息处理模块,用于获取产品自带信息,对所述产品自带信息进行整合,并将整合后的数据进行预处理,生成产品向量数据;
产品相似度计算模块,用于根据产品向量数据,基于局部敏感哈希算法计算产品之间的相似度;
标签关联模块,用于记录用户首次登录跨境APP时自主选择的兴趣标签,建立产品大类与所述兴趣标签的关联关系;
登录检测模块,用于当新用户登录跨境APP时,检测用户类型;
游客用户产品展示模块,用于在所述新用户的用户类型为游客模式用户的情况下,将所述第一热门产品作为首次曝光产品进行展示;
注册用户产品展示模块,用于在所述新用户的用户类型为注册用户的情况下,获取所述注册用户自主选择的兴趣标签,根据所述关联关系获取兴趣标签关联的产品大类中的第二热门产品,根据所述第一热门产品及所述第二热门产品,按照预设权重生成首次曝光产品进行展示;
曝光产品更新模块,用于在所述新用户与首次曝光产品户发生交互行为时,根据所述产品之间的相似度查找交互相似产品,并将所述相似产品作为新的曝光产品进行展示。
在本发明实施例的第三方面,提出了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现基于局部敏感哈希的用户冷启动产品推荐方法。
在本发明实施例的第四方面,提出了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现基于局部敏感哈希的用户冷启动产品推荐方法。
本发明提出的基于局部敏感哈希的用户冷启动产品推荐方法及系统可以利用用户与系统的交互信息,生成个性化的用户冷启动结果,提高新用户体验;并且为游客模式用户提供合适冷启动结果,使推荐内容更加全面;在产品推荐过程中,本发明采用基于敏感哈希计算产品相似度,减少计算量,降低成本,根据该些产品相似度计算结果,结合用户与推荐产品行为反馈,实时对推荐内容进行修正,提高用户冷启动结果的准确度。
附图说明
为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是本发明一实施例的基于局部敏感哈希的用户冷启动产品推荐方法的流程示意图。
图2是本发明一具体实施例的产品信息处理的详细流程示意图。
图3是本发明一具体实施例的新用户为注册用户时生成首次曝光产品的详细流程示意图。
图4是本发明一实施例的基于局部敏感哈希的用户冷启动产品推荐系统的架构示意图。
图5是本发明一具体实施例的产品信息处理模块的详细架构示意图。
图6是本发明一具体实施例的注册用户产品展示模块的详细架构示意图。
图7是本发明一实施例的计算机设备结构示意图。
具体实施方式
下面将参考若干示例性实施方式来描述本发明的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本发明,而并非以任何方式限制本发明的范围。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
本领域技术人员知道,本发明的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。
根据本发明的实施方式,提出了一种基于局部敏感哈希的用户冷启动产品推荐方法及系统。
在本发明实施例中,需要说明的术语有:
局部敏感哈希:LSH算法基于一个假设,如果两个文本在原有的数据空间是相似的,那么分别经过哈希函数转换以后的它们也具有很高的相似度。相反,如果它们本身是不相似的,那么经过转换后它们应仍不具有相似性。
用户冷启动:用户冷启动主要解决如何给新用户做个性化推荐的问题。当新用户到来时,没有他的行为数据,所以无法根据他的历史行为预测其兴趣,从而无法借此给他做个性化推荐。
下面参考本发明的若干代表性实施方式,详细阐释本发明的原理和精神。
图1是本发明一实施例的基于局部敏感哈希的用户冷启动产品推荐方法的流程示意图。如图1所示,该方法包括:
步骤S101,采集跨境APP当前时间窗口内的产品操作数据,根据所述产品操作数据选取第一热门产品;
步骤S102,获取产品自带信息,对所述产品自带信息进行整合,并将整合后的数据进行预处理,生成产品向量数据;
步骤S103,根据产品向量数据,基于局部敏感哈希算法计算产品之间的相似度;
步骤S104,记录用户首次登录跨境APP时自主选择的兴趣标签,建立产品大类与所述兴趣标签的关联关系;
步骤S105,当新用户登录跨境APP时,检测用户类型;
步骤S106,如果所述新用户的用户类型为游客模式用户,将所述第一热门产品作为首次曝光产品进行展示;
步骤S107,如果所述新用户的用户类型为注册用户,获取所述注册用户自主选择的兴趣标签,根据所述关联关系获取兴趣标签关联的产品大类中的第二热门产品,根据所述第一热门产品及所述第二热门产品,按照预设权重生成首次曝光产品进行展示;
步骤S108,在所述新用户与首次曝光产品户发生交互行为时,根据所述产品之间的相似度查找交互相似产品,并将所述相似产品作为新的曝光产品进行展示。
为了对上述基于局部敏感哈希的用户冷启动产品推荐方法进行更为清楚的解释,下面结合一个具体的实施例来对每一步骤进行详细说明。
步骤S101:
利用spark-streaming流式处理方法统计跨境APP当前时间窗口内的点击量及浏览量,选取浏览量及点击量最高的前N项产品(TOPN产品),得到第一热门产品。
统计的结果持久化到redis中,具体结构为:
最热产品(链表):key=TOPN,value=list1。
步骤S102:
参考图2,为本发明一具体实施例的产品信息处理的详细流程示意图。如图2所示,步骤S102包括:
步骤S1021,获取产品自带信息;其中,产品自带信息包括:产品自带的描述信息、属性信息、标签类信息及频道信息。
步骤S1022,利用spark计算引擎对所述产品自带信息进行整合;
步骤S1023,将整合后的数据进行清洗及加工,并进行切词,使用Word2Vec模型计算得到产品向量数据。
得到的产品向量数据持久化到redis中,具体结构为:
产品向量(hash表):key=vecOfItem,value={{ItemID1,vec1},{ItemID2,vec2},{ItemID3,vec3},{ItemID4,vec4},{ItemID5,vec5}}。
步骤S103:
基于局部敏感哈希算法及步骤S102基于Word2Vec算法得到的产品向量,计算产品之间的相似度;该过程可以解决当产品数量十分庞大时,产品两两相似度计算量大的问题,快速得到产品相似度。
步骤S104:
用户首次登录app时,需要自主选择感情趣的标签,记录该些兴趣标签;
根据业务经验确认每个产品大类与用户自定义标签的关联关系,举例而言,具体标签可以包括:留学国家、留学阶段、留学状态、留学时间、旅游预算、旅游目的地、旅游信息类型及旅游方式等。
步骤S105:
当新用户登录跨境APP时,检测用户类型;其中,用户类型可以包括游客模型用户及注册用户。
游客模式用户是系统为新用户提供的临时账号,这种用户通常并未进行注册,系统无法获取用户的身份信息等,用户可以利用该账号浏览页面信息,但是,在退出后并不会在后台保留历史记录等,如果用户需要进行产品的进一步操作(具体业务),则系统可以提示用户进行注册,否则无法为用户提供相应的服务。
步骤S106:
如果所述新用户的用户类型为游客模式用户,将步骤S101中得到的第一热门产品作为首次曝光产品进行展示。
步骤S107:
参考图3,为本发明一具体实施例的新用户为注册用户时生成首次曝光产品的详细流程示意图。如图3所示,具体过程为:
步骤S1071,如果所述新用户的用户类型为注册用户,获取所述注册用户自主选择的兴趣标签;
步骤S1072,根据所述关联关系,在兴趣标签关联的产品大类中,选取选取浏览量及点击量最高的前M项产品,得到第二热门产品;
步骤S1073,根据所述第一热门产品及所述第二热门产品,按照预设权重生成首次曝光产品进行展示,其中,所述第一热门产品及所述第二热门产品的预设权重为0.3:0.7,权重总和为1。
对于新用户,如果其用户类型为注册用户,首次推荐内容中会较高权重的推荐与其兴趣标签相关的产品,相较于游客模式用户的首次推荐内容会更加符合其兴趣。
步骤S108:
在新用户与首次曝光产品发生交互行为时,实时查找步骤S103得到的产品之间的相似度结果,由于基于局部敏感哈希算法相似度计算法效率很高,可以很快返回与用户发生交互行为产品最相似的M个产品,以此修订推荐结果。提高用户冷启动准确性,并且提高了游客类用户冷启动时的体验。
需要说明的是,尽管在上述实施例及附图中以特定顺序描述了本发明方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
在介绍了本发明示例性实施方式的方法之后,接下来,参考图4至图6对本发明示例性实施方式的基于局部敏感哈希的用户冷启动产品推荐系统进行介绍。
基于局部敏感哈希的用户冷启动产品推荐系统的实施可以参见上述方法的实施,重复之处不再赘述。以下所使用的术语“模块”或者“单元”,可以是实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
基于同一发明构思,本发明还提出了一种基于局部敏感哈希的用户冷启动产品推荐系统,如图4所示,该系统包括:
数据采集模块410,用于采集跨境APP当前时间窗口内的产品操作数据,根据所述产品操作数据选取第一热门产品;
产品信息处理模块420,用于获取产品自带信息,对所述产品自带信息进行整合,并将整合后的数据进行预处理,生成产品向量数据;
产品相似度计算模块430,用于根据产品向量数据,基于局部敏感哈希算法计算产品之间的相似度;
标签关联模块440,用于记录用户首次登录跨境APP时自主选择的兴趣标签,建立产品大类与所述兴趣标签的关联关系;
登录检测模块450,用于当新用户登录跨境APP时,检测用户类型;
游客用户产品展示模块460,用于在所述新用户的用户类型为游客模式用户的情况下,将所述第一热门产品作为首次曝光产品进行展示;
注册用户产品展示模块470,用于在所述新用户的用户类型为注册用户的情况下,获取所述注册用户自主选择的兴趣标签,根据所述关联关系获取兴趣标签关联的产品大类中的第二热门产品,根据所述第一热门产品及所述第二热门产品,按照预设权重生成首次曝光产品进行展示;
曝光产品更新模块480,用于在所述新用户与首次曝光产品户发生交互行为时,根据所述产品之间的相似度查找交互相似产品,并将所述相似产品作为新的曝光产品进行展示。
在一具体实施例中,所述数据采集模块410具体用于:
利用spark-streaming流式处理方法统计跨境APP当前时间窗口内的点击量及浏览量,选取浏览量及点击量最高的前N项产品,得到第一热门产品。
在一具体实施例中,参考图5,为本发明一具体实施例的产品信息处理模块的详细架构示意图。如图5所示,产品信息处理模块420包括:
产品信息采集单元421,用于获取产品自带信息;其中,所述产品自带信息包括:产品自带的描述信息、属性信息、标签类信息及频道信息。
产品信息整合单元422,用于利用spark计算引擎对所述产品自带信息进行整合;
产品向量计算单元423,用于将整合后的数据进行清洗及加工,并进行切词,使用Word2Vec模型计算得到产品向量数据。
在一具体实施例中,参考图6,为本发明一具体实施例的注册用户产品展示模块的详细架构示意图。如图6所示,注册用户产品展示模块470包括:
兴趣标签获取单元471,用于在所述新用户的用户类型为注册用户的情况下,获取所述注册用户自主选择的兴趣标签;
热门产品获取单元472,用于根据所述关联关系,在兴趣标签关联的产品大类中,选取选取浏览量及点击量最高的前M项产品,得到第二热门产品;
产品展示单元473,用于根据所述第一热门产品及所述第二热门产品,按照预设权重生成首次曝光产品进行展示。
其中,所述第一热门产品及所述第二热门产品的预设权重为0.3:0.7,权重总和为1。
应当注意,尽管在上文详细描述中提及了基于局部敏感哈希的用户冷启动产品推荐系统的若干模块,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多模块的特征和功能可以在一个模块中具体化。反之,上文描述的一个模块的特征和功能可以进一步划分为由多个模块来具体化。
基于前述发明构思,如图7所示,本发明还提出了一种计算机设备700,包括存储器710、处理器720及存储在存储器710上并可在处理器720上运行的计算机程序730,所述处理器720执行所述计算机程序730时实现前述基于局部敏感哈希的用户冷启动产品推荐方法。
基于前述发明构思,本发明提出了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现前述基于局部敏感哈希的用户冷启动产品推荐方法。
本发明提出的基于局部敏感哈希的用户冷启动产品推荐方法及系统可以利用用户与系统的交互信息,生成个性化的用户冷启动结果,提高新用户体验;并且为游客模式用户提供合适冷启动结果,使推荐内容更加全面;在产品推荐过程中,本发明采用基于敏感哈希计算产品相似度,减少计算量,降低成本,根据该些产品相似度计算结果,结合用户与推荐产品行为反馈,实时对推荐内容进行修正,提高用户冷启动结果的准确度。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (14)

1.一种基于局部敏感哈希的用户冷启动产品推荐方法,其特征在于,该方法包括:
采集跨境APP当前时间窗口内的产品操作数据,根据所述产品操作数据选取第一热门产品;
获取产品自带信息,对所述产品自带信息进行整合,并将整合后的数据进行预处理,生成产品向量数据;
根据产品向量数据,基于局部敏感哈希算法计算产品之间的相似度;
记录用户首次登录跨境APP时自主选择的兴趣标签,建立产品大类与所述兴趣标签的关联关系;
当新用户登录跨境APP时,检测用户类型;
如果所述新用户的用户类型为游客模式用户,将所述第一热门产品作为首次曝光产品进行展示;
如果所述新用户的用户类型为注册用户,获取所述注册用户自主选择的兴趣标签,根据所述关联关系获取兴趣标签关联的产品大类中的第二热门产品,根据所述第一热门产品及所述第二热门产品,按照预设权重生成首次曝光产品进行展示;
在所述新用户与首次曝光产品户发生交互行为时,根据所述产品之间的相似度查找交互相似产品,并将所述相似产品作为新的曝光产品进行展示。
2.根据权利要求1所述的基于局部敏感哈希的用户冷启动产品推荐方法,其特征在于,采集跨境APP当前时间窗口内的产品操作数据,根据所述产品操作数据选取第一热门产品,包括:
利用spark-streaming流式处理方法统计跨境APP当前时间窗口内的点击量及浏览量,选取浏览量及点击量最高的前N项产品,得到第一热门产品。
3.根据权利要求1所述的基于局部敏感哈希的用户冷启动产品推荐方法,其特征在于,所述产品自带信息包括:产品自带的描述信息、属性信息、标签类信息及频道信息。
4.根据权利要求1所述的基于局部敏感哈希的用户冷启动产品推荐方法,其特征在于,获取产品自带信息,对所述产品自带信息进行整合,并将整合后的数据进行预处理,生成产品向量数据,包括:
获取产品自带信息;
利用spark计算引擎对所述产品自带信息进行整合;
将整合后的数据进行清洗及加工,并进行切词,使用Word2Vec模型计算得到产品向量数据。
5.根据权利要求1所述的基于局部敏感哈希的用户冷启动产品推荐方法,其特征在于,如果所述新用户的用户类型为注册用户,获取所述注册用户自主选择的兴趣标签,根据所述关联关系获取兴趣标签关联的产品大类中的第二热门产品,根据所述第一热门产品及所述第二热门产品,按照预设权重生成首次曝光产品进行展示,包括:
在兴趣标签关联的产品大类中,选取选取浏览量及点击量最高的前M项产品,得到第二热门产品。
6.根据权利要求5所述的基于局部敏感哈希的用户冷启动产品推荐方法,其特征在于,所述第一热门产品及所述第二热门产品的预设权重为0.3:0.7,权重总和为1。
7.一种基于局部敏感哈希的用户冷启动产品推荐系统,其特征在于,该系统包括:
数据采集模块,用于采集跨境APP当前时间窗口内的产品操作数据,根据所述产品操作数据选取第一热门产品;
产品信息处理模块,用于获取产品自带信息,对所述产品自带信息进行整合,并将整合后的数据进行预处理,生成产品向量数据;
产品相似度计算模块,用于根据产品向量数据,基于局部敏感哈希算法计算产品之间的相似度;
标签关联模块,用于记录用户首次登录跨境APP时自主选择的兴趣标签,建立产品大类与所述兴趣标签的关联关系;
登录检测模块,用于当新用户登录跨境APP时,检测用户类型;
游客用户产品展示模块,用于在所述新用户的用户类型为游客模式用户的情况下,将所述第一热门产品作为首次曝光产品进行展示;
注册用户产品展示模块,用于在所述新用户的用户类型为注册用户的情况下,获取所述注册用户自主选择的兴趣标签,根据所述关联关系获取兴趣标签关联的产品大类中的第二热门产品,根据所述第一热门产品及所述第二热门产品,按照预设权重生成首次曝光产品进行展示;
曝光产品更新模块,用于在所述新用户与首次曝光产品户发生交互行为时,根据所述产品之间的相似度查找交互相似产品,并将所述相似产品作为新的曝光产品进行展示。
8.根据权利要求7所述的基于局部敏感哈希的用户冷启动产品推荐系统,其特征在于,所述数据采集模块具体用于:
利用spark-streaming流式处理方法统计跨境APP当前时间窗口内的点击量及浏览量,选取浏览量及点击量最高的前N项产品,得到第一热门产品。
9.根据权利要求7所述的基于局部敏感哈希的用户冷启动产品推荐系统,其特征在于,所述产品自带信息包括:产品自带的描述信息、属性信息、标签类信息及频道信息。
10.根据权利要求7所述的基于局部敏感哈希的用户冷启动产品推荐系统,其特征在于,所述产品信息处理模块,包括:
产品信息采集单元,用于获取产品自带信息;
产品信息整合单元,用于利用spark计算引擎对所述产品自带信息进行整合;
产品向量计算单元,用于将整合后的数据进行清洗及加工,并进行切词,使用Word2Vec模型计算得到产品向量数据。
11.根据权利要求7所述的基于局部敏感哈希的用户冷启动产品推荐系统,其特征在于,所述注册用户产品展示模块,包括:
兴趣标签获取单元,用于在所述新用户的用户类型为注册用户的情况下,获取所述注册用户自主选择的兴趣标签;
热门产品获取单元,用于根据所述关联关系,在兴趣标签关联的产品大类中,选取选取浏览量及点击量最高的前M项产品,得到第二热门产品;
产品展示单元,用于根据所述第一热门产品及所述第二热门产品,按照预设权重生成首次曝光产品进行展示。
12.根据权利要求11所述的基于局部敏感哈希的用户冷启动产品推荐系统,其特征在于,所述第一热门产品及所述第二热门产品的预设权重为0.3:0.7,权重总和为1。
13.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6任一所述方法。
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1至6任一所述方法。
CN202010824566.1A 2020-08-17 2020-08-17 基于局部敏感哈希的用户冷启动产品推荐方法及系统 Pending CN111966900A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010824566.1A CN111966900A (zh) 2020-08-17 2020-08-17 基于局部敏感哈希的用户冷启动产品推荐方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010824566.1A CN111966900A (zh) 2020-08-17 2020-08-17 基于局部敏感哈希的用户冷启动产品推荐方法及系统

Publications (1)

Publication Number Publication Date
CN111966900A true CN111966900A (zh) 2020-11-20

Family

ID=73388094

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010824566.1A Pending CN111966900A (zh) 2020-08-17 2020-08-17 基于局部敏感哈希的用户冷启动产品推荐方法及系统

Country Status (1)

Country Link
CN (1) CN111966900A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112596712A (zh) * 2020-12-28 2021-04-02 上海风秩科技有限公司 冷启动接口设计方法、系统、电子设备及存储介质
CN113065071A (zh) * 2021-04-30 2021-07-02 中国平安人寿保险股份有限公司 一种产品信息推荐方法及计算机设备
CN116089726A (zh) * 2023-03-06 2023-05-09 北京网智天元大数据科技有限公司 汉藏语多方言多模态的资源推荐方法和装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107341204A (zh) * 2017-06-22 2017-11-10 电子科技大学 一种融合物品标签信息的协同过滤推荐方法及系统
CN107451267A (zh) * 2017-08-01 2017-12-08 东北大学 一种基于Spark平台的分布式推荐方法
CN110135948A (zh) * 2019-05-09 2019-08-16 西北民族大学 一种面向电子商务平台商品的推荐系统及方法
CN110852852A (zh) * 2019-11-15 2020-02-28 成都航天科工大数据研究院有限公司 一种工业互联网产品推荐系统及方法
CN111061996A (zh) * 2019-12-09 2020-04-24 昆明理工大学 一种结合Word2vec词向量和LSH局部敏感哈希的推荐算法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107341204A (zh) * 2017-06-22 2017-11-10 电子科技大学 一种融合物品标签信息的协同过滤推荐方法及系统
CN107451267A (zh) * 2017-08-01 2017-12-08 东北大学 一种基于Spark平台的分布式推荐方法
CN110135948A (zh) * 2019-05-09 2019-08-16 西北民族大学 一种面向电子商务平台商品的推荐系统及方法
CN110852852A (zh) * 2019-11-15 2020-02-28 成都航天科工大数据研究院有限公司 一种工业互联网产品推荐系统及方法
CN111061996A (zh) * 2019-12-09 2020-04-24 昆明理工大学 一种结合Word2vec词向量和LSH局部敏感哈希的推荐算法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112596712A (zh) * 2020-12-28 2021-04-02 上海风秩科技有限公司 冷启动接口设计方法、系统、电子设备及存储介质
CN113065071A (zh) * 2021-04-30 2021-07-02 中国平安人寿保险股份有限公司 一种产品信息推荐方法及计算机设备
CN113065071B (zh) * 2021-04-30 2023-07-25 中国平安人寿保险股份有限公司 一种产品信息推荐方法及计算机设备
CN116089726A (zh) * 2023-03-06 2023-05-09 北京网智天元大数据科技有限公司 汉藏语多方言多模态的资源推荐方法和装置

Similar Documents

Publication Publication Date Title
Li et al. News recommendation via hypergraph learning: encapsulation of user behavior and news content
CN111966900A (zh) 基于局部敏感哈希的用户冷启动产品推荐方法及系统
US8301514B1 (en) System, method, and computer readable medium for providing recommendations based on purchase phrases
JP6293642B2 (ja) 推薦エンジンに基づく汎用グラフ、ルール及び空間構造
US10997184B2 (en) System and method for ranking search results
CN110413870B (zh) 商品推荐方法、装置及服务器
US20150052003A1 (en) Providing Personalized Item Recommendations Using Scalable Matrix Factorization With Randomness
JP4368336B2 (ja) カテゴリ設定支援方法及び装置
US9727906B1 (en) Generating item clusters based on aggregated search history data
JP2019537106A (ja) コンテンツ推薦及び表示
KR20190047656A (ko) 스마트 매치 자동 완성 시스템
Smyth et al. Compound critiques for conversational recommender systems
US11514498B2 (en) System and method for intelligent guided shopping
CN107807957A (zh) 实体库生成方法及装置
CN114936301B (zh) 智能家居建材数据的管理方法、装置、设备及存储介质
CN111737558A (zh) 一种资讯推荐方法、装置及计算机可读存储介质
CN114942971B (zh) 一种结构化数据的抽取方法及装置
CN106599047A (zh) 一种信息的推送方法及装置
US10474670B1 (en) Category predictions with browse node probabilities
US20160063594A1 (en) Data refining engine for high performance analysis system and method
CN107679186A (zh) 基于实体库进行实体搜索的方法及装置
CN110264277A (zh) 由计算设备执行的数据处理方法及装置、介质和计算设备
CN111680213A (zh) 信息推荐方法、数据处理方法及装置
US10417687B1 (en) Generating modified query to identify similar items in a data store
CN111143670A (zh) 一种信息确定方法及相关产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination