CN117635272A - 对象推荐方法、装置、电子设备及存储介质 - Google Patents

对象推荐方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN117635272A
CN117635272A CN202311694634.7A CN202311694634A CN117635272A CN 117635272 A CN117635272 A CN 117635272A CN 202311694634 A CN202311694634 A CN 202311694634A CN 117635272 A CN117635272 A CN 117635272A
Authority
CN
China
Prior art keywords
recommended
information
target
displayed
transaction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311694634.7A
Other languages
English (en)
Inventor
耿晓阳
王博实
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Agricultural Bank of China
Original Assignee
Agricultural Bank of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Agricultural Bank of China filed Critical Agricultural Bank of China
Priority to CN202311694634.7A priority Critical patent/CN117635272A/zh
Publication of CN117635272A publication Critical patent/CN117635272A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9014Indexing; Data structures therefor; Storage structures hash tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9035Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种对象推荐方法、装置、电子设备及存储介质。具体方案为:在检测到满足对象推荐的条件时,获取与目标用户相对应的关联信息,其中,关联信息包括已获取对象的产品序列;依据至少一个待推荐对象的对象信息与关联信息之间的空间距离,并依据空间距离从至少一个待推荐对象中确定至少一个待展示对象;依据多桶敏感哈希算法对至少一个待展示对象的对象信息进行处理,确定目标推荐对象并展示。本发明提高了信息处理的计算效率,达到了实时快速为目标用户进行推荐的效果,提升了用户体验。

Description

对象推荐方法、装置、电子设备及存储介质
技术领域
本发明涉及数据处理技术领域,尤其涉及一种对象推荐方法、装置、电子设备及存储介质。
背景技术
随着计算机技术的迅速发展和普及,越来越多的推荐对象可以利用推荐系统来展示。其中,推荐系统必须保证实时性,即在最短时间内对目标用户的需求进行及时反馈,从而使得目标用户可以基于反馈的目标推荐对象进行选择。
但是,在现有的推荐系统中,其底层是基于匹配排序的。若目标用户与推荐对象之间关系网络规模较大,则可能会导致计算量增大,从而影响推荐系统的性能和响应时间。
发明内容
本发明提供了一种对象推荐方法、装置、电子设备及存储介质,提高了信息处理的计算效率,达到了实时快速为目标用户进行推荐的效果,提升了用户体验。
根据本发明的一方面,提供了一种对象推荐方法,该方法包括:
在检测到满足对象推荐的条件时,获取与目标用户相对应的关联信息,其中,关联信息包括已获取对象的产品序列;
依据至少一个待推荐对象的对象信息与关联信息之间的空间距离,并依据空间距离从至少一个待推荐对象中确定至少一个待展示对象;
依据多桶敏感哈希算法对至少一个待展示对象的对象信息进行处理,确定目标推荐对象并展示。
根据本发明的另一方面,提供了一种对象推荐装置,该装置包括:
关联信息获取模块,用于在检测到满足对象推荐的条件时,获取与目标用户相对应的关联信息,其中,关联信息包括已获取对象的产品序列;
展示对象确定模块,用于依据至少一个待推荐对象的对象信息与关联信息之间的空间距离,并依据空间距离从至少一个待推荐对象中确定至少一个待展示对象;
推荐对象展示模块,用于依据多桶敏感哈希算法对至少一个待展示对象的对象信息进行处理,确定目标推荐对象并展示。
根据本发明的另一方面,提供了一种电子设备,该电子设备包括:
至少一个处理器;以及
与至少一个处理器通信连接的存储器;其中,
存储器存储有可被至少一个处理器执行的计算机程序,计算机程序被至少一个处理器执行,以使至少一个处理器能够执行本发明任一实施例的对象推荐方法。
根据本发明的另一方面,提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机指令,计算机指令用于使处理器执行时实现本发明任一实施例的对象推荐方法。
本发明实施例的技术方案,在检测到满足对象推荐的条件时,获取与目标用户相对应的关联信息,其中,关联信息包括已获取对象的产品序列;之后,依据至少一个待推荐对象的对象信息与关联信息之间的空间距离,并依据空间距离从至少一个待推荐对象中确定至少一个待展示对象;进一步的,依据多桶敏感哈希算法对至少一个待展示对象的对象信息进行处理,确定目标推荐对象并展示。解决了目标用户与推荐对象之间关系网络规模较大时导致的计算量增大以及响应时间较慢的问题,提高了信息处理的计算效率,达到了实时快速为目标用户进行推荐的效果,提升了用户体验。
应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种对象推荐方法的流程图;
图2是本发明实施例提供的一种对象推荐方法的流程示例图;
图3是本发明实施例提供的一种对象推荐装置的结构示意图;
图4是实现本发明实施例的对象推荐方法的电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例一
图1是本发明实施例提供的一种对象推荐方法的流程图,本实施例可适用于在满足对象推荐条件时,基于目标用户的关联信息确定目标推荐对象,从而对目标用户进行展示推荐的情况,该方法可以由对象推荐装置来执行,该对象推荐装置可以采用硬件和/或软件的形式实现,该对象推荐装置可配置于手机、计算机或者服务器等的电子设备中。如图1所示,该方法包括:
S110、在检测到满足对象推荐的条件时,获取与目标用户相对应的关联信息,其中,关联信息包括已获取对象的产品序列。
在本发明实施例中,对象推荐的条件可以是明确当前用户的身份信息,以及对当前用户是否实现了相应的触发操作等条件。在确定满足对象推荐条件时,此时,当前用户即为目标用户。关联信息可以是从相应数据库中获取的,目标用户以往购买过的产品信息。可选的,关联信息可以是基于至少一个产品信息对应的产品序列号组成的产品序列。其中,每个产品信息对应于一个产品序列号。上述,以往购买过的产品即为已获取对象。
具体的,在对目标用户进行推荐时,可以是由目标用户点击相应的按键实现触发操作,此时可以确定目标用户的身份信息等,同时检测目标用户是否满足对象推荐的条件。若满足对象推荐的条件,可以从相应的数据库中获取目标用户对应的关联信息,其中,关联信息中可以包括目标用户已获取对象对应的产品序列。
可选的,获取与目标用户相对应的关联信息,包括:获取预设时长内的多个交易数据;其中,交易数据包括用户标识、已获取对象标识、已获取对象的获取时间、获取金额以及流水号交易金额、交易时长以及交易流水号;依据预设筛选条件对多个交易数据整合处理,得到与每个交易用户所对应的产品序列;从多个产品序列中获取与目标用户相对应的产品序列,并将产品序列作为关联信息。
在本发明实施例中,预设时长可以是根据实际需求设定的时间范围,可选的,预设时长可以是一天、一周或是几个小时等,本实施例对此不做限制。交易数据可以是从数据库中获取的目标用户的交易流水信息。用户标识可以是用于唯一标识目标用户的标识符,例如,用户标识可以是用户id(Identity document,身份标识)。已获取对象标识可以是目标用户已经购买过的产品对应的标识符,例如,已获取对象标识可以是产品id。已获取对象的获取时间可以是购买某个产品时对应的购买时间。获取金额可以是购买某个产品时所花费的金额。若存在目标用户需求或是相应的业务需求时,获取金额可能会基于至少一个流水号交易金额进行支付。相应的,流水号交易金额可以是当前交易流水信息对应的流水号的目标用户交易的金额。需要说明的是,流水号交易金额小于等于获取金额。已获取对象对应于一个获取金额,但是可以对应于至少一个流水号交易金额。交易时长可以理解为目标用户从交易开始到交易结束的时间长度。交易流水号可以是当前交易流水信息对应的流水号。预设筛选条件可以是根据实际需求设置的,对交易数据进行筛选处理的条件。
具体的,可以根据实际需求设定时间范围,作为预设时长。之后,从相应数据库中获取预设时长内的多个交易数据。其中,交易数据可以包括用户标识、已获取对象标识、已获取对象的获取时间、获取金额以及流水号交易金额、交易时长以及交易流水号等数据。进一步的,可以根据预设筛选条件对交易数据进行筛选整合处理,从而获得交易数据中每个交易用户对应的产品序列。并且,从多个产品序列中选择目标用户对应的产品序列,并将该产品序列作为关联信息,以便后续对关联信息进行处理。
可选的,预设筛选条件包括下述至少一种:若隶属于同一用户标识的已获取对象的获取间隔时长小于第一预设时长、且每次交易金额小于预设交易金额阈值,则对已获取对象的交易数据合并;若隶属于同一用户标识的已获取对象相同,且获取间隔时长小于第一预设时长,则剔除重复的已获取对象的交易数据。
在本发明实施例中,第一预设时长可以是根据实际需求设置的,已获取对象的获取间隔对应的时间长度。预设交易金额数值可以理解为已获取对象对应的该笔交易流水信息对应的购买金额,例如,预设交易金额可以是一万元。
具体的,预设筛选条件可以是当两笔交易数据对应的已获取对象属于同一用户标识,且两笔交易数据中的获取时间的获取间隔时长小于第一预设时长,同时,每次交易数据对应的交易金额小于预设交易金额数值。则说明,这两笔交易数据可能是由同一目标用户购买的一个已获取对象,可能由于用户需求或是业务需求,将本应是一笔的交易数据分成多笔交易数据。即,将交易金额拆分支付,产生多个流水号交易金额。因而,可以将上述条件的交易数据进行合并,并且将多个流水号交易金额合并累加为一个交易金额,以作为一条交易数据。另外,预设筛选条件可以是隶属于同一用户标识的已获取对象相同,而且获取间隔时长小于第一预设时长,则可能是目标用户在获取间隔时长内购买了两个相同的已获取对象,但是上述情况可能是在一次推荐场景中产生的,因而可以剔除重复的已获取对象的交易数据。
S120、依据至少一个待推荐对象的对象信息与关联信息之间的空间距离,并依据空间距离从至少一个待推荐对象中确定至少一个待展示对象。
在本发明实施例中,待推荐对象可以是为目标用户进行推荐的产品,相应的,对象信息可以是该产品对应的相关信息。空间距离可以是对象信息对应的向量与关联信息对应的向量之间在相应空间中的相对距离。待展示对象可以是基于空间距离从至少一个待推荐对象中选择的对象。
具体的,将至少一个待推荐对象的对象信息进行处理,获得每个推荐对象的对象信息对应的向量。并且,将关联信息进行处理,获得相应的向量。之后,可以计算每个推荐对象的对象信息对应的向量与关联信息对应的向量之间的空间距离,根据空间距离从待推荐对象中选择出至少一个待展示对象。需要说明的是,当上述两个向量之间的空间距离越近时,说明相应的对象信息和关联信息越相似,可以选择空间距离较近的待推荐对象作为待展示对象。
可选的,在依据至少一个待推荐对象的对象信息与关联信息之间的空间距离之前,还包括:依据预先训练好的目标模型分别对候选池中的至少一个待推荐对象的对象信息进行处理,得到待推荐对象的第一特征向量;以及,基于目标模型对关联信息进行处理,得到关联信息的第二特征向量,以基于第一特征向量和第二特征向量之间的空间距离,确定至少一个待展示对象。
在本发明实施例中,目标模型可以是用于对对象信息和关联信息进行处理,以获得相应的向量的模型。可选的,目标模型可以是item2vec模型。候选池可以是用于储存多个待推荐对象的对象信息的集合或数据库。第一特征向量可以是利用目标模型处理获得的待推荐对象的特征向量,第二特征向量可以是目标模型对关联信息进行处理获得的特征向量。
具体的,根据预先训练好的目标模型对候选池中的每个待推荐对象的对象信息进行处理,获得每个推荐对象对应的特征向量,即为第一特征向量。并且,利用目标模型对关联信息,即产品序列进行处理,获得关联信息对应的第二特征向量。进一步的,对第一特征向量和第二特征向量之间的空间距离进行计算,从而基于获得的空间距离从待推荐对象中选择至少一个待展示对象。
可选的,还包括:周期性的获取多个交易数据,并依据交易数据对目标模型中的模型参数进行修正。
具体的,可以设置一定的周期,即时间间隔,以周期性的获取多个交易数据,基于多个交易数据对目标模型进行修正,以使得目标模型满足实际需求。相应的,在修正过程中,可以计算相应的损失值,基于损失值对目标模型的模型参数进行修正。其中,可以将损失函数收敛作为训练目标,比如训练误差是否小于预设误差,或误差变化是否趋于稳定,或者当前的迭代次数是否等于预设次数。若检测达到收敛条件,比如损失函数的训练误差小于预设误差,或者误差变化趋势趋于稳定,表明该目标模型训练完成,此时可以停止迭代训练。若检测到当前未达到收敛条件,可以进一步获取其他交易数据以对目标模型继续进行训练,直至损失函数的训练误差在预设范围之内。当损失函数的训练误差达到收敛时,即目标模型训练完成。
可选的,依据至少一个待推荐对象的对象信息与关联信息之间的空间距离,包括:分别确定第一特征向量与第二特征向量之间的空间距离;相应的,依据空间距离从至少一个待推荐对象中确定至少一个待展示对象,包括:依据空间距离从大到小的顺序选择预设数量的待推荐对象作为待展示对象。
在本发明实施例中,预设数量可以是根据实际需求或业务规则设置的待展示对象的数量。
具体的,分别计算每个推荐对象对应的第一特征向量与关联信息中,即产品序列中每个产品对应的第二特征向量之间的空间距离。从而对获得的空间距离进行排序,即以空间距离从大到小进行排序。可选的,也可以以空间距离的从小到大进行排序。基于空间距离排序的顺序,从中选择预设数量的空间距离最近,即空间距离最小的待推荐对象作为待展示对象。
S130、依据多桶敏感哈希算法对至少一个待展示对象的对象信息进行处理,确定目标推荐对象并展示。
在本发明实施例中,多桶局部敏感哈希算法是一种快速计算海量向量距离的算法,并且可以针对召回率进行多桶分布优化。目标推荐对象可以是从至少一个待展示对象中选择的推荐对象。
具体的,利用多桶敏感哈希算法对每个待展示对象的对象信息进行处理,即利用哈希函数计算每个待展示对象在相应哈希表中的哈希值,若哈希值相同,则说明待展示对象对应的第一特征向量之间的相似度较高,可以基于向量相似度进行排序,从中根据实际需求或业务规则选择目标推荐对象并将其展示在目标用户的终端设备中,其中,终端设备可以是手机、计算机等电子设备。
可选的,依据多桶敏感哈希算法对至少一个待展示对象的对象信息进行处理,确定目标推荐对象并展示,包括:对于各待展示对象,确定当前待展示对象在至少一个哈希表中的哈希值,以依据哈希值确定目标推荐对象。
在本发明实施例中,哈希值可以是通过哈希函数计算获得的固定大小的数字,哈希值可以用以唯一标识当前待展示对象的对象信息。其中,哈希函数是一种将对象信息映射为固定大小的数字(即哈希值)的算法。
具体的,可以先建立哈希结构,即需要构建一个或多个哈希表来存储待展示对象的哈希值。对于每个待展示对象,可以使用合适的哈希函数计算其在哈希表中的哈希值。并且对每个待展示对象的哈希值进行比对。其中,若待展示对象对应的第一特征向量距离很近,则表现为哈希值相同。相应的,可以从中选择哈希值相同的待展示对象。基于选择的待展示对象计算其向量相似度,即其对应的第一特征向量之间的空间距离。基于此,进行排序,以获得目标推荐对象。其中,计算向量相似度可以采用余弦相似度、欧氏距离等方法,根据具体情况选择适合的相似度度量方式,本实施例对此不做限制。
本实施例的技术方案,在检测到满足对象推荐的条件时,获取与目标用户相对应的关联信息,其中,关联信息包括已获取对象的产品序列;之后,依据至少一个待推荐对象的对象信息与关联信息之间的空间距离,并依据空间距离从至少一个待推荐对象中确定至少一个待展示对象;进一步的,依据多桶敏感哈希算法对至少一个待展示对象的对象信息进行处理,确定目标推荐对象并展示。解决了目标用户与推荐对象之间关系网络规模较大时导致的计算量增大以及响应时间较慢的问题,提高了信息处理的计算效率,达到了实时快速为目标用户进行推荐的效果,提升了用户体验。
实施例二
图2是本发明实施例提供的一种对象推荐方法的流程图,本实施例是在上述实施例的一个示例。其具体的实施方式可以参见本实施例技术方案。其中,与上述实施例相同或者相应的技术术语在此不再赘述。如图2所示,该方法包括:
S210、获取信息。
在本发明实施例中,获取信息对应于上述实施例所提及的S110。
具体的,可以获取用户在相应系统的历史交易行为信息,即上述实施例所提及的关联信息。其中,交易行为信息可以包含给定时间段内所有的客户id、产品id、订单号、购买时间、购买金额、退回时间、退回金额等交易流水信息。相应的,给定时间段即上述实施例所提及的预设时长。客户id、产品id、订单号、购买时间、购买金额分别对应于上述实施例所提及的用户标识、已获取对象标识、交易流水号、已获取对象的获取时间、获取金额。另外,用户即上述实施例所提及的目标用户。
之后,可以对上述交易行为信息进行进一步的加工,首先,可以交易行为信息中缺失的数据和超出常识认知的数据进行清洗。可选的,可以对缺失或者超过常识认知的购买时间、购买金额等交易行为信息的数据进行删除操作。其次,在上述处理后,可以对交易行为信息中存在退回时间和退回金额等退回信息对应的交易行为信息进行删除。需要说明的是,在用户购买当前产品后,则可以视为推荐成功,可以不用考虑退款情况对应的交易行为信息。之后,可以从交易行为信息中,按照时间顺序删除同一订单号的最相近时间的产品id,对应于上述实施例所提及若隶属于同一用户标识的已获取对象相同,且获取间隔时长小于第一预设时长,则剔除重复的已获取对象的交易数据。另外,对于同一用户购买时间相近,且购买金额不足门限值(如1万元)的行为进行合并,对应于上述实施例所提及的第一种预设筛选条件。进一步的,根据用户的购买时间生成每个用户的产品序列。经过上述处理后,可以形成一个可用的产品序列的列表,为后续item2vec向量化提供数据基础。对应于上述实施例所提及的依据预设筛选条件对多个交易数据整合处理,得到与每个交易用户所对应的产品序列。
示例性的,单个用户的产品序列如下表示:
User N,{FNCG-1000053,FNCG-1000076,FNCG-2100003}
其中,FNCG-1000053表示该产品的产品序列号。
S220、使用item2vec生成向量,压缩产品维度信息。
在本发明实施例中,Item2vec是一种深度学习模型,可以用于表示向量化。它使用循环神经网络(RNN)和自注意力机制来捕捉产品序列中的上下文信息并进行建模。
具体的,可以利用item2vec模型生成产品的Embedding向量,即可以利用上述获取的产品序列,以skip-gram训练模型,优化目标为当产品a出现的时候,其他产品与其在同一产品序列的概率。基于此,可以解决冷启动问题。由于仅对产品进行向量化,而对尚未购买过产品的新用户,虽然没有产品序列数据,但仍无需考虑这种冷启动问题,仅在其浏览时给出目标推荐对象即可。
其中,在进行召回筛选时,假设产品候选池共N个产品,则向量组的规模为N,向量维度一般设置为512维,通过计算与当前产品的向量空间距离最近的k个产品,则获得候选产品的数量为k个。对应于上述实施例所提及的S120。其中,当前产品为待推荐对象,候选产品对应于上述实施例所提及的待展示对象。
S230、进行向量相似度计算。
在本发明实施例中,向量相似度是通过计算向量之间的距离来衡量。距离越近,相似度越大。常见的向量距离计算方法包括欧氏距离、曼哈顿距离、切比雪夫距离和余弦相似度等。本实施例对应于上述实施例所提及的S130中的依据多桶敏感哈希算法对至少一个待展示对象的对象信息进行处理。
具体的,对于上述获得的k个候选产品可以采用多桶敏感哈希算法计算向量相似度。首先,可以选择合适的(n,m)参数,其中,n代表每个哈希表使用的基本哈希函数的数量,m代表哈希表的数量。上述参数是可以根据实际需求设定的。之后,根据选定的参数,建立m个桶的哈希表。每个哈希表的内部结构由n个独立抽取的基本哈希函数联合判断决定。即,当在哈希表中插入或查询一个候选产品时,需要使用上述n个基本哈希函数计算其在哈希表中的位置。进一步的,在建立哈希表结构后,将所有候选产品按照各哈希表的规则插入到相应的哈希桶中,同时计算每个候选产品在每个哈希表中的哈希值,并将其存储在对应的哈希桶内。当要检索或查询的候选产品为a时,则可以先基于候选产品a,即上述实施例所提及的待展示对象,确定相应的对应的对象信息。之后,基于候选产品a利用n个基本哈希函数计算其在每张哈希表中的哈希值。从而,根据获得的哈希值,从每张哈希表中取出相同哈希值的哈希桶内的所有候选产品。最后,基于取出的候选产品与候选产品a进行距离计算,以获得对应向量的空间距离,从而以空间距离的大小确定向量相似度。即,空间距离越大,向量相似度越高。并且,基于向量相似度进行排序。
通过上述方式,将对比排序的时间复杂度从O(N)优化为O(log2N)。多桶局部敏感哈希算法利用正式哈希冲突加速检索,实现对高维海量候选产品的对象信息的快速近似查找。
S240、面向用户推荐。
在本发明实施例中,面向用户推荐对应于上述实施例所提及的确定目标推荐对象并展示。
具体的,在利用向量相似度对候选产品进行排序后,可以根据实际需要选择向量相似度最高的几个候选产品作为目标产品,即上述实施例所提及的目标推荐对象,向用户进行展示。另外,也可以将向量相似度的排序与业务规则的排序进行结合,选择合适的候选产品作为目标产品,向用户进行展示。另外,在选择目标产品后,可以基于相应的接口服务,将目标产品显示在用户的终端设备上。其中,终端设备可以是手机、计算机等电子设备。
S250、模型实时采集评价与模型迭代。
在本发明实施例中,模型实时采集评价与模型迭代对应于上述实施例所提及的周期性的获取多个交易数据,并依据交易数据对目标模型中的模型参数进行修正。模型即上述实施例所提及的目标模型。
具体的,可以获取一定周期内的历史交易行为信息,即上述实施例所提及的交易数据。其中,该交易数据可以是在目标推荐对象展示在目标用户终端之后的交易数据。可选的,一定周期可以是一小时、一天、一周等。之后,可以进行业务目标的分析。其中,可以将上述交易数据按照时间顺序进行数据清洗,将不符合要求的交易数据过滤,将符合要求但信息不完整的交易数据按照一定常识或规则进行补全。进一步的,将数据清洗后的交易数据按照用户、时间顺序、推荐品类等维度进行去重,如有业务需要可以在去重的同时进行计数。其中,推荐品类可以是目标推荐对象对应的种类。之后,将去重的交易数据按照时间顺序进行汇总,获得对应的汇总值作为业务目标数据对比展示。其中,汇总值可以理解为目标推荐对象对应的数量。如果存在多个业务目标,且目标是级联的情况,支持以漏斗图的形式进行展示。例如,多个业务目标可以是推送至目标用户的目标推荐对象的数量,目标用户接收的目标推荐对象的数量,目标用户的获取目标推荐对象的数量等。上述业务目标为级联的情况,则可以将对应的业务目标以漏斗图的形式进行展示。基于此,可以利用相应的损失值对模型进行修正,以实现模型的迭代。
本实施例的技术方案,通过获取历史交易行为信息确定每个交易用户的产品序列,之后,基于产品序列使用item2vec生成向量,压缩产品维度信息。进一步的,对向量相似度进行计算,以实现对候选产品的向量相似度进行排序,从而根据排序确定向用户推荐的目标产品,并进行展示。之后,可以对模型进行实时采集评价以及对模型进行优化修正。解决了用户与推荐对象之间关系网络规模较大时导致的计算量增大以及响应时间较慢的问题,提高了信息处理的计算效率,达到了实时快速为用户进行推荐的效果,提升了用户体验,进一步的,还可以提升推荐的目标产品的点击率和购买率。
实施例三
图3是本发明实施例提供的一种对象推荐装置的结构示意图。如图3所示,该装置包括:关联信息获取模块310、展示对象确定模块320以及推荐对象展示模块330。
关联信息获取模块310,用于在检测到满足对象推荐的条件时,获取与目标用户相对应的关联信息,其中,关联信息包括已获取对象的产品序列;展示对象确定模块320,用于依据至少一个待推荐对象的对象信息与关联信息之间的空间距离,并依据空间距离从至少一个待推荐对象中确定至少一个待展示对象;推荐对象展示模块330,用于依据多桶敏感哈希算法对至少一个待展示对象的对象信息进行处理,确定目标推荐对象并展示。
本实施例的技术方案,在检测到满足对象推荐的条件时,获取与目标用户相对应的关联信息,其中,关联信息包括已获取对象的产品序列;之后,依据至少一个待推荐对象的对象信息与关联信息之间的空间距离,并依据空间距离从至少一个待推荐对象中确定至少一个待展示对象;进一步的,依据多桶敏感哈希算法对至少一个待展示对象的对象信息进行处理,确定目标推荐对象并展示。解决了目标用户与推荐对象之间关系网络规模较大时导致的计算量增大以及响应时间较慢的问题,提高了信息处理的计算效率,达到了实时快速为目标用户进行推荐的效果,提升了用户体验。
在上述实施例的基础上,可选的,关联信息获取模块,包括:交易数据获取单元,用于获取预设时长内的多个交易数据;其中,交易数据包括用户标识、已获取对象标识、已获取对象的获取时间、获取金额以及流水号交易金额、交易时长以及交易流水号;产品序列获取单元,用于依据预设筛选条件对多个交易数据整合处理,得到与每个交易用户所对应的产品序列;关联信息确定单元,用于从多个产品序列中获取与目标用户相对应的产品序列,并将产品序列作为关联信息。
可选的,在产品序列获取单元中,预设筛选条件包括下述至少一种:若隶属于同一用户标识的已获取对象的获取间隔时长小于第一预设时长、且每次交易金额小于预设交易金额阈值,则对已获取对象的交易数据合并;若隶属于同一用户标识的已获取对象相同,且获取间隔时长小于第一预设时长,则剔除重复的已获取对象的交易数据。
可选的,展示对象确定模块,包括:第一特征向量获取单元,用于依据预先训练好的目标模型分别对候选池中的至少一个待推荐对象的对象信息进行处理,得到待推荐对象的第一特征向量;以及,待展示对象确定单元,用于基于目标模型对关联信息进行处理,得到关联信息的第二特征向量,以基于第一特征向量和第二特征向量之间的空间距离,确定至少一个待展示对象。
可选的,展示对象确定模块,包括:空间距离确定单元,用于分别确定第一特征向量与第二特征向量之间的空间距离;相应的,展示对象确定模块,还包括:空间距离排序单元,用于依据空间距离从大到小的顺序选择预设数量的待推荐对象作为待展示对象。
可选的,推荐对象展示模块,用于对于各待展示对象,确定当前待展示对象在至少一个哈希表中的哈希值,以依据哈希值确定目标推荐对象。
可选的,该装置还包括:目标模型修正模块,用于周期性的获取多个交易数据,并依据交易数据对目标模型中的模型参数进行修正。
本发明实施例所提供的对象推荐装置可执行本发明任意实施例所提供的对象推荐方法,具备执行方法相应的功能模块和有益效果。
实施例四
图4是本发明实施例提供的一种电子设备的结构示意图。电子设备10旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。
如图4所示,电子设备10包括至少一个处理器11,以及与至少一个处理器11通信连接的存储器,如只读存储器(ROM)12、随机访问存储器(RAM)13等,其中,存储器存储有可被至少一个处理器执行的计算机程序,处理器11可以根据存储在只读存储器(ROM)12中的计算机程序或者从存储单元18加载到随机访问存储器(RAM)13中的计算机程序,来执行各种适当的动作和处理。在RAM 13中,还可存储电子设备10操作所需的各种程序和数据。处理器11、ROM 12以及RAM 13通过总线14彼此相连。输入/输出(I/O)接口15也连接至总线14。
电子设备10中的多个部件连接至I/O接口15,包括:输入单元16,例如键盘、鼠标等;输出单元17,例如各种类型的显示器、扬声器等;存储单元18,例如磁盘、光盘等;以及通信单元19,例如网卡、调制解调器、无线通信收发机等。通信单元19允许电子设备10通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
处理器11可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器11的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。处理器11执行上文所描述的各个方法和处理,例如对象推荐方法。
在一些实施例中,对象推荐方法可被实现为计算机程序,其被有形地包含于计算机可读存储介质,例如存储单元18。在一些实施例中,计算机程序的部分或者全部可以经由ROM 12和/或通信单元19而被载入和/或安装到电子设备10上。当计算机程序加载到RAM 13并由处理器11执行时,可以执行上文描述的对象推荐方法的一个或多个步骤。备选地,在其他实施例中,处理器11可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行对象推荐方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本发明的对象推荐方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
实施例五
本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机指令,计算机指令用于使处理器执行一种对象推荐方法,该方法包括:
在检测到满足对象推荐的条件时,获取与目标用户相对应的关联信息,其中,关联信息包括已获取对象的产品序列;依据至少一个待推荐对象的对象信息与关联信息之间的空间距离,并依据空间距离从至少一个待推荐对象中确定至少一个待展示对象;依据多桶敏感哈希算法对至少一个待展示对象的对象信息进行处理,确定目标推荐对象并展示。
在本发明的上下文中,计算机可读存储介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。备选地,计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在电子设备上实施此处描述的系统和技术,该电子设备具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、区块链网络和互联网。
计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务中,存在的管理难度大,业务扩展性弱的缺陷。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本发明的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

Claims (10)

1.一种对象推荐方法,其特征在于,包括:
在检测到满足对象推荐的条件时,获取与目标用户相对应的关联信息,其中,所述关联信息包括已获取对象的产品序列;
依据至少一个待推荐对象的对象信息与所述关联信息之间的空间距离,并依据所述空间距离从所述至少一个待推荐对象中确定至少一个待展示对象;
依据多桶敏感哈希算法对所述至少一个待展示对象的对象信息进行处理,确定目标推荐对象并展示。
2.根据权利要求1所述的方法,其特征在于,所述获取与目标用户相对应的关联信息,包括:
获取预设时长内的多个交易数据;其中,所述交易数据包括用户标识、已获取对象标识、已获取对象的获取时间、获取金额以及流水号交易金额、交易时长以及交易流水号;
依据预设筛选条件对所述多个交易数据整合处理,得到与每个交易用户所对应的产品序列;
从所述多个产品序列中获取与所述目标用户相对应的产品序列,并将所述产品序列作为所述关联信息。
3.根据权利要求2所述的方法,其特征在于,所述预设筛选条件包括下述至少一种:
若隶属于同一用户标识的已获取对象的获取间隔时长小于第一预设时长、且每次交易金额小于预设交易金额阈值,则对所述已获取对象的交易数据合并;
若隶属于同一用户标识的已获取对象相同,且获取间隔时长小于第一预设时长,则剔除重复的已获取对象的交易数据。
4.根据权利要求1所述的方法,其特征在于,在所述依据至少一个待推荐对象的对象信息与所述关联信息之间的空间距离之前,还包括:
依据预先训练好的目标模型分别对候选池中的至少一个待推荐对象的对象信息进行处理,得到所述待推荐对象的第一特征向量;以及,
基于所述目标模型对所述关联信息进行处理,得到所述关联信息的第二特征向量,以基于所述第一特征向量和所述第二特征向量之间的空间距离,确定所述至少一个待展示对象。
5.根据权利要求4所述的方法,其特征在于,所述依据至少一个待推荐对象的对象信息与所述关联信息之间的空间距离,包括:
分别确定所述第一特征向量与所述第二特征向量之间的空间距离;
相应的,所述依据所述空间距离从所述至少一个待推荐对象中确定至少一个待展示对象,包括:
依据所述空间距离从大到小的顺序选择预设数量的待推荐对象作为所述待展示对象。
6.根据权利要求1所述的方法,其特征在于,所述依据多桶敏感哈希算法对所述至少一个待展示对象的对象信息进行处理,确定目标推荐对象并展示,包括:
对于各待展示对象,确定当前待展示对象在至少一个哈希表中的哈希值,以依据所述哈希值确定所述目标推荐对象。
7.根据权利要求1所述的方法,其特征在于,还包括:
周期性的获取多个交易数据,并依据所述交易数据对目标模型中的模型参数进行修正。
8.一种对象推荐装置,其特征在于,包括:
关联信息获取模块,用于在检测到满足对象推荐的条件时,获取与目标用户相对应的关联信息,其中,所述关联信息包括已获取对象的产品序列;
展示对象确定模块,用于依据至少一个待推荐对象的对象信息与所述关联信息之间的空间距离,并依据所述空间距离从所述至少一个待推荐对象中确定至少一个待展示对象;
推荐对象展示模块,用于依据多桶敏感哈希算法对所述至少一个待展示对象的对象信息进行处理,确定目标推荐对象并展示。
9.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任一项所述的对象推荐方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-7中任一项所述的对象推荐方法。
CN202311694634.7A 2023-12-11 2023-12-11 对象推荐方法、装置、电子设备及存储介质 Pending CN117635272A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311694634.7A CN117635272A (zh) 2023-12-11 2023-12-11 对象推荐方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311694634.7A CN117635272A (zh) 2023-12-11 2023-12-11 对象推荐方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN117635272A true CN117635272A (zh) 2024-03-01

Family

ID=90021462

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311694634.7A Pending CN117635272A (zh) 2023-12-11 2023-12-11 对象推荐方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN117635272A (zh)

Similar Documents

Publication Publication Date Title
CN112463859B (zh) 基于大数据和业务分析的用户数据处理方法及服务器
CN107330709B (zh) 确定目标对象的方法及装置
CN116244619A (zh) 一种数据处理方法、装置、电子设备及存储介质
CN116228301A (zh) 一种目标用户的确定方法、装置、设备及介质
CN117635272A (zh) 对象推荐方法、装置、电子设备及存储介质
CN115907926A (zh) 商品的推荐方法、装置、电子设备及存储介质
CN114358879A (zh) 一种基于大数据的物价实时监测方法和系统
CN114186123A (zh) 用于热点事件的处理方法、装置、设备及存储介质
CN114241243B (zh) 图像分类模型的训练方法、装置、电子设备和存储介质
CN117541366B (zh) 一种中标概率的预测方法、装置、电子设备及存储介质
CN117150215B (zh) 一种考核结果确定方法、装置、电子设备及存储介质
CN117195104A (zh) 资源分类方法、装置、电子设备及存储介质
CN116089612A (zh) 分类模型的训练方法、画像生成方法、装置、介质及设备
CN118861681A (zh) 产品推荐模型的训练方法、产品推荐方法及装置
CN117670363A (zh) 一种预警方法、装置、设备及存储介质
CN117633331A (zh) 一种营销活动确定方法、装置以及电子设备
CN116662788A (zh) 一种车辆轨迹处理方法、装置、设备和存储介质
CN116308665A (zh) 产品推荐方法、装置、设备及介质
CN118152678A (zh) 一种物品展示方法、装置、电子设备及存储介质
CN115186181A (zh) 一种虚拟资产推荐方法、装置、电子设备及存储介质
CN117668363A (zh) 一种推荐方法、装置、设备及介质
CN117251732A (zh) 一种组合规则生成方法、装置、电子设备及存储介质
CN117608896A (zh) 交易数据处理方法、装置、电子设备及存储介质
CN117056436A (zh) 一种社区发现方法、装置、存储介质及电子设备
CN115170313A (zh) 交易风险的确定方法、装置和服务器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination