CN111274474A - 对象推荐方法、电子装置及计算机可读存储介质 - Google Patents

对象推荐方法、电子装置及计算机可读存储介质 Download PDF

Info

Publication number
CN111274474A
CN111274474A CN202010046350.7A CN202010046350A CN111274474A CN 111274474 A CN111274474 A CN 111274474A CN 202010046350 A CN202010046350 A CN 202010046350A CN 111274474 A CN111274474 A CN 111274474A
Authority
CN
China
Prior art keywords
user
object recommendation
data
recommendation list
preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010046350.7A
Other languages
English (en)
Inventor
乐志能
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202010046350.7A priority Critical patent/CN111274474A/zh
Priority to PCT/CN2020/093552 priority patent/WO2021143023A1/zh
Publication of CN111274474A publication Critical patent/CN111274474A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/602Providing cryptographic facilities or services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及数据处理,揭露了一种对象推荐方法,该方法包括:接收目标用户发出的携带用户身份标识的对象获取请求;根据所述用户身份标识获取目标用户的用户数据,生成目标用户的特征向量,对所述特征向量进行加密得到目标用户的加密特征数据;从第一预设存储路径中获取与所述加密特征数据对应的第一对象推荐列表;获取预先确定的调整系数列表,计算第一对象推荐列表中各对象的调整参数,根据调整参数对第一对象推荐列表中的各对象进行重新排序,得到第二对象推荐列表;将所述第二对象推荐列表作为目标对象列表推荐给所述目标用户。本发明还揭露了一种电子装置及计算机存储介质。利用本发明,可提高对象推荐的准确性及效率。

Description

对象推荐方法、电子装置及计算机可读存储介质
技术领域
本发明涉及互联网技术领域,尤其涉及一种对象推荐方法、电子装置及计算机可读存储介质。
背景技术
随着计算机技术的发展,用户在使用终端的过程中需从海量信息中找到自己喜欢或需要的对象,这样导致用户选择时,需要花费较多的时间去查找,且可能无法找到自己想要的对象。以微信小程序为例,微信小程序是一种不需要下载安装即可使用的应用,用户扫一扫或者搜一下即可打开应用,且用户不用关心是否安装太多应用的问题,是一种全新的连接用户与服务的方式,它可以在微信内被便捷地获取和传播,同时具有出色的使用体验。然而,目前大部分To C的公司都开发和用户相关的服务的小程序,使得小程序数量急速上升,同时小程序访问入口也逐步增加,造成了用户无法快速找到目标小程序的问题。
为了提高用户的使用体验,目前业内采用对象推荐方法自动向用户推荐对象。然而,已有的对象推荐方法大都是采集用户数据,调用模型文件实时预测推荐对象,由于用户数据量大,会占用大量内存,数据处理较慢,另外,需实时调用模型进行预测,极大的影响了对象推荐的效率。因此,如何快速准确地向用户推荐对象是一个亟需解决的问题。
发明内容
鉴于以上内容,本发明提供一种对象推荐方法、电子装置及计算机可读存储介质,其主要目的在于提高对象推荐的效率及准确性。
为实现上述目的,本发明提供一种对象推荐方法,该方法包括:
步骤S1,接收目标用户发出的对象获取请求,所述对象获取请求中包括用户身份标识;
步骤S2,根据所述用户身份标识从预设渠道获取目标用户的用户数据,根据所述用户数据生成目标用户的特征向量,采用预设加密算法对所述特征向量进行加密,得到目标用户的加密特征数据;
步骤S3,从第一预设存储路径中获取与所述加密特征数据对应的第一对象推荐列表;
步骤S4,获取预先确定的调整系数列表,基于所述第一对象推荐列表中的各对象初始参数及所述调整系数列表,计算所述第一对象推荐列表中各对象的调整参数,根据所述调整参数对第一对象推荐列表中的各对象进行重新排序,得到第二对象推荐列表;及
步骤S5,将所述第二对象推荐列表作为目标对象列表推荐给所述目标用户。
此外,为实现上述目的,本发明还提供一种电子装置,该装置包括:存储器、处理器,所述存储器中存储有可在所述处理器上运行的对象推荐程序,所述对象推荐程序被所述处理器执行时可实现如上所述对象推荐方法中的任意步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中包括对象推荐程序,所述对象推荐程序被处理器执行时,可实现如上所述对象推荐方法中的任意步骤。
本发明提出的对象推荐方法、电子装置及计算机可读存储介质,预先将不同加密数据与对象推荐列表的映射数据存储在ES中,在对象推荐过程中,通过对获取的用户数据对应的特征向量进行加密计算生成加密特征数据,然后根据加密特征数据查询与之对应的对象推荐列表,最后根据调整系数对对象推荐列表进行调整,得到调整后的对象推荐列表并反馈给用户,虽然加密算法是现有的且常用的,但一般加密算法应用在数据保护领域,其目的是为了保证数据的安全性,然在本发明中,通过加密计算,一方面减小了用户数据对应的特征向量的数据量,较少数据存储的压力,另一方面能减小网络请求的报文传输大小,提高后续查找的效率,进而提高对象推荐的效率,故其所达到的技术效果并非加密算法的常用效果;根据用户数据查询对应的对象推荐列表可提高对象推荐的准确性;通过预先确定并定期更新不同加密数据与对象推荐列表的映射关系,当接受到用户请求时,仅需实时计算用户特征数据的特征向量对应的加密特征数据,并根据加密特征数据查找对应的对象推荐列表,无需实时调用模型进行运算,可提高对象推荐的效率。
附图说明
图1为本发明对象推荐方法较佳实施例的流程图;
图2为本发明电子装置较佳实施例的示意图;
图3为图2中对象推荐程序较佳实施例的程序模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明提供一种对象推荐方法。该方法可以由一个装置执行,该装置可以由软件和/或硬件实现。
参照图1所示,为本发明对象推荐方法较佳实施例的流程图。
在本发明对象推荐方法一实施例中,该方法包括:步骤S1-步骤S5。
步骤S1,接收目标用户发出的对象获取请求,所述对象获取请求中包括用户身份标识。
在以下描述中,以电子装置为主体,对本发明的各实施例进行说明。
在本实施例中,电子装置接收到用户通过终端发出的对象获取请求后,电子装置可根据请求确定用户身份标识。
上述用户身份标识用于调取用户数据,包括用户登录的账号、用户ID、手机号、身份证号等的任意一种。
所述对象获取请求中还包括:对象入口标识。其中,对象入口标识用于了解用户的对象入口喜好,以对象为小程序为例,对象入口标识即为小程序入口标识,其包括:E1(通过搜索进入小程序)、E2(扫一扫进入小程序)、E3(下拉最近使用进入小程序)、E4(下拉收藏的小程序进入小程序)、E5(app内嵌小程序入口进入小程序)等。
步骤S2,根据所述用户身份标识从预设渠道获取目标用户的用户数据,根据所述用户数据生成目标用户的特征向量,采用预设加密算法对所述特征向量进行加密,得到目标用户的加密特征数据。
上述目标用户的用户数据包括:第一预设类型数据及第二预设类型数据。第一预设类型数据包括:性别、车房、婚、育、消费、年龄、经济、资讯、健康、游戏、社交等数据;第二预设类型数据包括:用户访问行为活跃度标签、用户在入口访问行为活跃度标签、用户在入口曝光标签等。
通过第一预设类型数据确定目标用户的用户历史标签,通过第二预设类型数据确定目标用户的入口历史偏好标签及用户忠诚度标签。
需要说明的是,在生成特征向量的过程中,特征向量中各维度的顺序是预先确定的。
在本实施例中,上述目标用户的特征向量为one-hot特征。
对于第一预设类型数据,以特征“已婚”为例,若用户数据为已婚,则该特征在特征向量中特征值为“1”,若用户为未婚,则“已婚”这一特征在特征向量中特征值为“0”。
对于第二预设类型数据,以“用户访问行为活跃度标签”这一特征为例,该特征通过以下步骤确定:
1)获取该目标用户在预设时间周期内(例如,15天内)的历史对象访问行为数据,确定目标用户的历史对象访问次数;
2)根据访问次数与活跃度标签的映射关系,确定目标用户的历史对象访问次数对应的活跃度标签。
用户访问行为活跃度标签包括:忠诚、活跃、普通、游离、沉默等。其中,访问次数与活跃度标签的映射关系是预先确定并保存好的。
以“用户在入口访问行为活跃度标签”这一特征为例,该特征通过以下步骤确定:
1)获取该目标用户在预设时间周期内(例如,15天内)的历史对象访问行为数据,确定所述目标用户访问过的历史入口;
2)将所述目标用户访问过的历史入口对应的特征值取为“1”,将除所述目标用户访问过的历史入口对应的特征值取为“0”。
假如有5个入口:E1、E2、E3、E4、E5,那就有一个包含所有入口的总体用户访问行为活跃度标签,还有各入口对应的用户访问行为活跃度标签同样。
对于入口曝光标签这一特征,例如,通过判断用户3天内是否看到过这个对象入口,有则特征值为“1”,无则特征值为“0”。
在本实施例中,上述预设加密算法为md5加密算法,上述加密特征数据为特征向量对应的md5值。在其他实施例中,也可以采用其他加密算法。对特征向量进行加密的目的在于:鉴于根据用户数据生成的特征向量很长,对特征向量进行加密可减少字符长度。
S3、从第一预设存储路径中获取与所述加密特征数据对应的第一对象推荐列表。
上述第一对象推荐列表包括:待推荐对象及各待推荐对象对应的参数。以小程序为例,小程序对应的参数可以为该小程序对应的预测点击率。
在本实施例中,步骤S3包括:
a1.从第一预设存储路径中获取预设的加密数据与对象推荐列表的映射数据;
a2.判断所述映射数据中是否存在与所述加密特征数据匹配的加密数据;
a3.若存在,则获取与所述加密特征数据匹配的加密数据对应的对象推荐列表作为所述加密特征数据对应的第一对象推荐列表;
a4.若不存在,则确定预设对象推荐列表作为所述加密特征数据对应的第一对象推荐列表。
在本实施例中,上述第一预设存储路径为ES(Elastic Search)。第一预设存储路径中存储有预先确定的不同加密数据与对象推荐列表的映射数据,例如,用户特征向量A对应的加密特征数据对应于对象推荐列表A,用户特征向量B对应的加密特征数据对应于对象推荐列表B,用户特征向量C对应的加密特征数据对应于对象推荐列表C,…。
通过预先将对象推荐列表及加密数据的映射数据存储在搜索引擎中,可提高对象推荐列表的查询效率,同时通过对用户特征向量进行md5加密,可减少ES的存储大小及网络请求的报文传输大小,提升查询效率。
需要说明的是,当第一预设存储路径中不存在与用户特向向量的加密特征数据对应的对象推荐列表时,默认预设对象推荐列表作为目标用户的加密特征数据对应的第一对象推荐列表,例如,预设对象推荐列表可以是预设时间周期内的热点对象推荐列表,也可以是第一预设存储路径中与目标用户的加密特征数据相似度最大者对应的对象推荐列表。
在本实施例中,所述加密数据与对象推荐列表的映射数据通过以下步骤确定:
b1.获取指定用户的用户数据并确定各指定用户的特征向量,将所述各指定用户的用户特征向量合并保存到第二预设存储路径中;
b2.从所述第二预设存储路径中分别读取所述各指定用户的特征向量并输入预先训练好的各预设对象对应的参数分析模型(例如,各小程序对应的点击率预测模型)中,分析得到所述各指定用户对于每个所述预设对象的参数(例如,各指定用户对不同小程序的点击率);
b3.按照用户粒度所述各指定用户对于每个所述预设对象的参数进行汇总,并按照参数从大到小的顺序对所述预设对象进行排序,分别得到所述各指定用户对应的对象推荐列表;
b4.采用分布式计算的方式,根据预设加密算法对所述第二预设存储路径中所述各指定用户的特征向量进行加密,得到所述各指定用户的特征向量对应的加密特征数据;
b5.基于所述各指定用户的特征向量对应的加密特征数据及所述各指定用户对应的对象推荐列表,生成所述加密数据与对象推荐列表的映射数据,并将所述映射数据保存至所述第一预设存储路径中。
其中,第二预设存储路径为HDFS(Hadoop分布式文件系统),通过将用户特征向量合并保存到HDFS,因为是分布式存储,方便数据量较大时,使用分布式计算,提高处理效率。
在本实施例中,为了提高对象参数分析的准确性,每一个对象对应各自的参数分析模型(例如,对象1对应的分析模型1(模型文件1),对象2对应的分析模型2(模型文件2),…,对象n对应的分析模型n(模型文件n)),参数分析模型包括但不仅限于回归模型,所述参数分析模型的训练步骤包括:
确定对象n对应的历史用户,获取历史用户的用户数据,计算得到用户特征向量,作为自变量X(x1,x2,…,xm),获取各历史用户在预设时间内(例如,最近十五天内)对应的该对象n的历史参数(点击率),作为因变量Y,得到样本数据(X,Y);
将样本数据划分为训练集及验证集,利用训练集的样本数据训练逻辑回归模型(Yn=ω1x12x2+…+ωmxm),确定模型中的参数(ω1、ω2、…、ωm);
利用验证集的样本数据对模型进行验证,当模型分析结果的误差率在预设范围内(例如,误差率小于5%)时,确定对象n对应的参数分析模型,保存参数分析模型n的模型文件n至预设存储路径。
进一步地,为了提高对象推荐列表的准确性:每隔预设时间(例如,一周,两周,一个月)对指定用户对应的对象推荐列表进行更新;每隔预设时间对模型文件进行更新;每隔预设时间更新映射数据中的指定用户的数量。
步骤S4,获取预先确定的调整系数列表,基于所述第一对象推荐列表中的各对象初始参数及所述调整系数列表,计算所述第一对象推荐列表中各对象的调整参数,根据所述调整参数对第一对象推荐列表中的各对象进行重新排序,得到第二对象推荐列表。
上述预先确定的调整系数列表中包括:各对象及对象对应的调整系数。以小程序为例,调整系数可以为小程序扶植系数,调整系数越高,扶植力度越大。可以理解的是,根据需求,每隔一定时间会对调整系数列表中的对象及对象对应的调整系数进行更新调整。
各对象的调整参数的计算公式为:
Sn=sn0n
其中,Sn表示第一对象推荐列表中对象n的调整参数,sn0表示第一对象推荐列表中对象n的初始参数,βn表示对象n对应的调整系数。
根据调整参数对第一对象推荐列表中的对象进行二次排序,得到第二对象推荐列表。
步骤S5,将所述第二对象推荐列表作为目标对象列表推荐给所述目标用户。
需要说明的是,第一对象推荐列表及第二对象推荐列表中对象数量可能比较多,为了便于用户选择,筛选出预设数量的排序靠前的(例如,前十)对象推荐给目标用户,并向目标用户展示。
上述实施例提出的对象推荐方法,预先将不同加密数据与对象推荐列表的映射数据存储在ES中,在对象推荐过程中,通过对获取的用户数据对应的特征向量进行加密计算生成加密特征数据,然后根据加密特征数据查询与之对应的对象推荐列表,最后根据调整系数对对象推荐列表进行调整,得到调整后的对象推荐列表并反馈给用户。虽然加密算法是现有的且常用的,但一般加密算法应用在数据保护领域,其目的是为了保证数据的安全性,然在本发明中,通过加密计算,一方面减小了用户数据对应的特征向量的数据量,较少数据存储的压力,另一方面能减小网络请求的报文传输大小,提高后续查找的效率,进而提高对象推荐的效率,故其所达到的技术效果并非加密算法的常用效果;本发明预先确定并定期更新不同加密数据与对象推荐列表的映射关系,当接受到用户请求时,仅需实时计算用户特征数据的特征向量对应的加密特征数据,并根据加密特征数据查找对应的对象推荐列表,无需实时调用模型进行运算,可提高推荐的效率。
本发明还提出一种电子装置。参照图2所示,为本发明电子装置较佳实施例的示意图。
在本实施例中,电子装置1可以是服务器、智能手机、平板电脑、便携计算机、桌上型计算机等具有数据处理功能的终端设备,所述服务器可以是机架式服务器、刀片式服务器、塔式服务器或机柜式服务器。
该电子装置1包括存储器11、处理器12及网络接口13。
其中,存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、磁性存储器、磁盘、光盘等。存储器11在一些实施例中可以是所述电子装置1的内部存储单元,例如该电子装置1的硬盘。存储器11在另一些实施例中也可以是所述电子装置1的外部存储设备,例如该电子装置1上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,存储器11还可以既包括该电子装置1的内部存储单元也包括外部存储设备。
存储器11不仅可以用于存储安装于该电子装置1的应用软件及各类数据,例如,对象推荐程序10等,还可以用于暂时地存储已经输出或者将要输出的数据。
处理器12在一些实施例中可以是一中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器或其他数据处理芯片,用于运行存储器11中存储的程序代码或处理数据,例如,对象推荐程序10等。
网络接口13可选的可以包括标准的有线接口、无线接口(如WI-FI接口),通常用于在该电子装置1与其他电子设备之间建立通信连接,例如,用户使用的客户终端(图中未标识)。电子装置1的组件11-13通过通信总线相互通信。
图2仅示出了具有组件11-13的电子装置1,本领域技术人员可以理解的是,图2示出的结构并不构成对电子装置1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
可选地,该电子装置1还可以包括用户接口,用户接口可以包括显示器(Display)、输入单元比如键盘(Keyboard),可选的用户接口还可以包括标准的有线接口、无线接口。
可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及有机发光二极管(Organic Light-Emitting Diode,OLED)触摸器等。其中,显示器也可以称为显示屏或显示单元,用于显示在电子装置1中处理的信息以及用于显示可视化的用户界面。
在图2所示的电子装置1实施例中,作为一种计算机存储介质的存储器11中存储对象推荐程序10的程序代码,处理器12执行对象推荐程序10的程序代码时,实现如下步骤:
接收步骤,接收目标用户发出的对象获取请求,所述对象获取请求中包括用户身份标识。
在本实施例中,电子装置接收到用户通过终端发出的对象获取请求后,电子装置可根据请求确定用户身份标识。
上述用户身份标识用于调取用户数据,包括用户登录的账号、用户ID、手机号、身份证号等的任意一种。
所述对象获取请求中还包括:对象入口标识。其中,对象入口标识用于了解用户的对象入口喜好,以对象为小程序为例,对象入口标识即为小程序入口标识,其包括:E1(通过搜索进入小程序)、E2(扫一扫进入小程序)、E3(下拉最近使用进入小程序)、E4(下拉收藏的小程序进入小程序)、E5(app内嵌小程序入口进入小程序)等。
计算步骤,根据所述用户身份标识从预设渠道获取目标用户的用户数据,根据所述用户数据生成目标用户的特征向量,采用预设加密算法对所述特征向量进行加密,得到目标用户的加密特征数据。
上述目标用户的用户数据包括:第一预设类型数据及第二预设类型数据。第一预设类型数据包括:性别、车房、婚、育、消费、年龄、经济、资讯、健康、游戏、社交等数据;第二预设类型数据包括:用户访问行为活跃度标签、用户在入口访问行为活跃度标签、用户在入口曝光标签等。
通过第一预设类型数据确定目标用户的用户历史标签,通过第二预设类型数据确定目标用户的入口历史偏好标签及用户忠诚度标签。
需要说明的是,在生成特征向量的过程中,特征向量中各维度的顺序是预先确定的。
在本实施例中,上述目标用户的特征向量为one-hot特征。
对于第一预设类型数据,以特征“已婚”为例,若用户数据为已婚,则该特征在特征向量中特征值为“1”,若用户为未婚,则“已婚”这一特征在特征向量中特征值为“0”。
对于第二预设类型数据,以“用户访问行为活跃度标签”这一特征为例,该特征通过以下步骤确定:
1)获取该目标用户在预设时间周期内(例如,15天内)的历史对象访问行为数据,确定目标用户的历史对象访问次数;
2)根据访问次数与活跃度标签的映射关系,确定目标用户的历史对象访问次数对应的活跃度标签。
用户访问行为活跃度标签包括:忠诚、活跃、普通、游离、沉默等。其中,访问次数与活跃度标签的映射关系是预先确定并保存好的。
以“用户在入口访问行为活跃度标签”这一特征为例,该特征通过以下步骤确定:
1)获取该目标用户在预设时间周期内(例如,15天内)的历史对象访问行为数据,确定所述目标用户访问过的历史入口;
2)将所述目标用户访问过的历史入口对应的特征值取为“1”,将除所述目标用户访问过的历史入口对应的特征值取为“0”。
假如有5个入口:E1、E2、E3、E4、E5,那就有一个包含所有入口的总体用户访问行为活跃度标签,还有各入口对应的用户访问行为活跃度标签同样。
对于入口曝光标签这一特征,例如,通过判断用户3天内是否看到过这个对象入口,有则特征值为“1”,无则特征值为“0”。
在本实施例中,上述预设加密算法为md5加密算法,上述加密特征数据为特征向量对应的md5值。在其他实施例中,也可以采用其他加密算法。对特征向量进行加密的目的在于:鉴于根据用户数据生成的特征向量很长,对特征向量进行加密可减少字符长度。
获取步骤,从第一预设存储路径中获取与所述加密特征数据对应的第一对象推荐列表。
上述第一对象推荐列表包括:待推荐对象及各待推荐对象对应的参数。以小程序为例,小程序对应的参数可以为该小程序对应的预测点击率。
在本实施例中,获取步骤包括:
a1.从第一预设存储路径中获取预设的加密数据与对象推荐列表的映射数据;
a2.判断所述映射数据中是否存在与所述加密特征数据匹配的加密数据;
a3.若存在,则获取与所述加密特征数据匹配的加密数据对应的对象推荐列表作为所述加密特征数据对应的第一对象推荐列表;
a4.若不存在,则确定预设对象推荐列表作为所述加密特征数据对应的第一对象推荐列表。
在本实施例中,上述第一预设存储路径为ES(Elastic Search)。第一预设存储路径中存储有预先确定的不同加密数据与对象推荐列表的映射数据,例如,用户特征向量A对应的加密特征数据对应于对象推荐列表A,用户特征向量B对应的加密特征数据对应于对象推荐列表B,用户特征向量C对应的加密特征数据对应于对象推荐列表C,…。
通过预先将对象推荐列表及加密数据的映射数据存储在搜索引擎中,可提高对象推荐列表的查询效率,同时通过对用户特征向量进行md5加密,可减少ES的存储大小及网络请求的报文传输大小,提升查询效率。
需要说明的是,当第一预设存储路径中不存在与用户特向向量的加密特征数据对应的对象推荐列表时,默认预设对象推荐列表作为目标用户的加密特征数据对应的第一对象推荐列表,例如,预设对象推荐列表可以是预设时间周期内的热点对象推荐列表,也可以是第一预设存储路径中与目标用户的加密特征数据相似度最大者对应的对象推荐列表。
在本实施例中,所述加密数据与对象推荐列表的映射数据通过以下步骤确定:
b1.获取指定用户的用户数据并确定各指定用户的特征向量,将所述各指定用户的用户特征向量合并保存到第二预设存储路径中;
b2.从所述第二预设存储路径中分别读取所述各指定用户的特征向量并输入预先训练好的各预设对象对应的参数分析模型(例如,各小程序对应的点击率预测模型)中,分析得到所述各指定用户对于每个所述预设对象的参数(例如,各指定用户对不同小程序的点击率);
b3.按照用户粒度所述各指定用户对于每个所述预设对象的参数进行汇总,并按照参数从大到小的顺序对所述预设对象进行排序,分别得到所述各指定用户对应的对象推荐列表;
b4.采用分布式计算的方式,根据预设加密算法对所述第二预设存储路径中所述各指定用户的特征向量进行加密,得到所述各指定用户的特征向量对应的加密特征数据;
b5.基于所述各指定用户的特征向量对应的加密特征数据及所述各指定用户对应的对象推荐列表,生成所述加密数据与对象推荐列表的映射数据,并将所述映射数据保存至所述第一预设存储路径中。
其中,第二预设存储路径为HDFS(Hadoop分布式文件系统),通过将用户特征向量合并保存到HDFS,因为是分布式存储,方便数据量较大时,使用分布式计算,提高处理效率。
在本实施例中,为了提高对象参数分析的准确性,每一个对象对应各自的参数分析模型(例如,对象1对应的分析模型1(模型文件1),对象2对应的分析模型2(模型文件2),…,对象n对应的分析模型n(模型文件n)),参数分析模型包括但不仅限于回归模型,所述参数分析模型的训练步骤包括:
确定对象n对应的历史用户,获取历史用户的用户数据,计算得到用户特征向量,作为自变量X(x1,x2,…,xm),获取各历史用户在预设时间内(例如,最近十五天内)对应的该对象n的历史参数(点击率),作为因变量Y,得到样本数据(X,Y);
将样本数据划分为训练集及验证集,利用训练集的样本数据训练逻辑回归模型(Yn=ω1x12x2+…+ωmxm),确定模型中的参数(ω1、ω2、…、ωm);
利用验证集的样本数据对模型进行验证,当模型分析结果的误差率在预设范围内(例如,误差率小于5%)时,确定对象n对应的参数分析模型,保存参数分析模型n的模型文件n至预设存储路径。
进一步地,为了提高对象推荐列表的准确性:每隔预设时间(例如,一周,两周,一个月)对指定用户对应的对象推荐列表进行更新;每隔预设时间对模型文件进行更新;每隔预设时间更新映射数据中的指定用户的数量。
调整步骤,获取预先确定的调整系数列表,基于所述第一对象推荐列表中的各对象初始参数及所述调整系数列表,计算所述第一对象推荐列表中各对象的调整参数,根据所述调整参数对第一对象推荐列表中的各对象进行重新排序,得到第二对象推荐列表;
上述预先确定的调整系数列表中包括:各对象及对象对应的调整系数。以小程序为例,调整系数可以为小程序扶植系数,调整系数越高,扶植力度越大。可以理解的是,根据需求,每隔一定时间会对调整系数列表中的对象及对象对应的调整系数进行更新调整。
各对象的调整参数的计算公式为:
Sn=sn0n
其中,Sn表示第一对象推荐列表中对象n的调整参数,sn0表示第一对象推荐列表中对象n的初始参数,βn表示对象n对应的调整系数。
根据调整参数对第一对象推荐列表中的对象进行二次排序,得到第二对象推荐列表。
推荐步骤,将所述第二对象推荐列表作为目标对象列表推荐给所述目标用户。
需要说明的是,第一对象推荐列表及第二对象推荐列表中对象数量可能比较多,为了便于用户选择,筛选出预设数量的排序靠前的(例如,前十)对象推荐给目标用户,并向目标用户展示。
需要说明的是,给用户推荐的对象可能是该用户使用过的,也可能是用户没有使用过的。
上述实施例提出的电子装置1,预先将不同加密数据与对象推荐列表的映射数据存储在ES中,在对象推荐过程中,通过对获取的用户数据对应的特征向量进行加密计算生成加密特征数据,然后根据加密特征数据查询与之对应的对象推荐列表,最后根据调整系数对对象推荐列表进行调整,得到调整后的对象推荐列表并反馈给用户。虽然加密算法是现有的且常用的,但一般加密算法应用在数据保护领域,其目的是为了保证数据的安全性,然在本发明中,通过加密计算,一方面减小了用户数据对应的特征向量的数据量,较少数据存储的压力,另一方面能减小网络请求的报文传输大小,提高后续查找的效率,进而提高对象推荐的效率,故其所达到的技术效果并非加密算法的常用效果;本发明预先确定并定期更新不同加密数据与对象推荐列表的映射关系,当接受到用户请求时,仅需实时计算用户特征数据的特征向量对应的加密特征数据,并根据加密特征数据查找对应的对象推荐列表,无需实时调用模型进行运算,可提高推荐的效率。
可选地,在其他的实施例中,对象推荐程序10还可以被分割为一个或者多个模块,一个或者多个模块被存储于存储器11中,并由一个或多个处理器12所执行,以完成本发明,本发明所称的模块是指能够完成特定功能的一系列计算机程序指令段。
例如,参照图3所示,为图2中对象推荐程序10的程序模块示意图。
在所述对象推荐程序10一实施例中,对象推荐程序10包括:模块110-150,其中:
接收模块110,接收目标用户发出的对象获取请求,所述对象获取请求中包括用户身份标识;
计算模块120,根据所述用户身份标识从预设渠道获取目标用户的用户数据,根据所述用户数据生成目标用户的特征向量,采用预设加密算法对所述特征向量进行加密,得到目标用户的加密特征数据;
获取模块130,从第一预设存储路径中获取与所述加密特征数据对应的第一对象推荐列表;
调整模块140,获取预先确定的调整系数列表,基于所述第一对象推荐列表中的各对象初始参数及所述调整系数列表,计算所述第一对象推荐列表中各对象的调整参数,根据所述调整参数对第一对象推荐列表中的各对象进行重新排序,得到第二对象推荐列表;及
推荐模块150,将所述第二对象推荐列表作为目标对象列表推荐给所述目标用户。
所述模块110-150所实现的功能或操作步骤均与上文类似,此处不再详述。
此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质中包括对象推荐程序10,所述对象推荐程序10被处理器执行时实现如下操作:
接收步骤,接收目标用户发出的对象获取请求,所述对象获取请求中包括用户身份标识;
计算步骤,根据所述用户身份标识从预设渠道获取目标用户的用户数据,根据所述用户数据生成目标用户的特征向量,采用预设加密算法对所述特征向量进行加密,得到目标用户的加密特征数据;
获取步骤,从第一预设存储路径中获取与所述加密特征数据对应的第一对象推荐列表;
调整步骤,获取预先确定的调整系数列表,基于所述第一对象推荐列表中的各对象初始参数及所述调整系数列表,计算所述第一对象推荐列表中各对象的调整参数,根据所述调整参数对第一对象推荐列表中的各对象进行重新排序,得到第二对象推荐列表;及
推荐步骤,将所述第二对象推荐列表作为目标对象列表推荐给所述目标用户。
本发明之计算机可读存储介质的具体实施方式与上述对象推荐方法的具体实施方式大致相同,在此不再赘述。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其它相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种对象推荐方法,应用于电子装置,其特征在于,该方法包括:
步骤S1,接收目标用户发出的对象获取请求,所述对象获取请求中包括用户身份标识;
步骤S2,根据所述用户身份标识从预设渠道获取目标用户的用户数据,根据所述用户数据生成目标用户的特征向量,采用预设加密算法对所述特征向量进行加密,得到目标用户的加密特征数据;
步骤S3,从第一预设存储路径中获取与所述加密特征数据对应的第一对象推荐列表;
步骤S4,获取预先确定的调整系数列表,基于所述第一对象推荐列表中的各对象初始参数及所述调整系数列表,计算所述第一对象推荐列表中各对象的调整参数,根据所述调整参数对第一对象推荐列表中的各对象进行重新排序,得到第二对象推荐列表;
步骤S5,将所述第二对象推荐列表作为目标对象列表推荐给所述目标用户。
2.根据权利要求1所述的对象推荐方法,其特征在于,所述步骤S3包括:
a1.从第一预设存储路径中获取预设的加密数据与对象推荐列表的映射数据;
a2.判断所述映射数据中是否存在与所述加密特征数据匹配的加密数据;
a3.若存在,则获取与所述加密特征数据匹配的加密数据对应的对象推荐列表作为所述加密特征数据对应的第一对象推荐列表;及
a4.若不存在,则确定预设对象推荐列表作为所述加密特征数据对应的第一对象推荐列表。
3.根据权利要求2所述的对象推荐方法,其特征在于,所述加密数据与对象推荐列表的映射数据通过以下步骤确定:
b1.获取指定用户的用户数据并确定各指定用户的特征向量,将所述各指定用户的用户特征向量合并保存到第二预设存储路径中;
b2.采用分布式计算的方式,从所述第二预设存储路径中分别读取所述各指定用户的特征向量并输入预先训练好的各预设对象对应的参数分析模型中,分析得到所述各指定用户对于每个所述预设对象的参数;
b3.按照用户粒度所述各指定用户对于每个所述预设对象的参数进行汇总,并按照参数从大到小的顺序对所述预设对象进行排序,分别得到所述各指定用户对应的对象推荐列表;
b4.采用分布式计算的方式,根据预设加密算法对所述第二预设存储路径中所述各指定用户的特征向量进行加密,得到所述各指定用户的特征向量对应的加密特征数据;及
b5.基于所述各指定用户的特征向量对应的加密特征数据及所述各指定用户对应的对象推荐列表,生成所述加密数据与对象推荐列表的映射数据,并将所述映射数据保存至所述第一预设存储路径中。
4.根据权利要求1至3中任意一项所述的对象推荐方法,其特征在于,所述目标用户的特征向量为one-hot特征。
5.根据权利要求1至3中任意一项所述的对象推荐方法,其特征在于,所述预设加密算法为md5加密算法。
6.根据权利要求1至3中任意一项所述的对象推荐方法,其特征在于,所述第一预设存储路径为Elastic Search。
7.根据权利要求6所述的对象推荐方法,其特征在于,所述第二预设存储路径为Hadoop分布式文件系统。
8.一种电子装置,其特征在于,该装置包括存储器及处理器,所述存储器中存储有可在所述处理器上运行的对象推荐程序,所述对象推荐程序被所述处理器执行时可实现如下步骤:
接收步骤,接收目标用户发出的对象获取请求,所述对象获取请求中包括用户身份标识;
计算步骤,根据所述用户身份标识从预设渠道获取目标用户的用户数据,根据所述用户数据生成目标用户的特征向量,采用预设加密算法对所述特征向量进行加密,得到目标用户的加密特征数据;
获取步骤,从第一预设存储路径中获取与所述加密特征数据对应的第一对象推荐列表;
调整步骤,获取预先确定的调整系数列表,基于所述第一对象推荐列表中的各对象初始参数及所述调整系数列表,计算所述第一对象推荐列表中各对象的调整参数,根据所述调整参数对第一对象推荐列表中的各对象进行重新排序,得到第二对象推荐列表;及
推荐步骤,将所述第二对象推荐列表作为目标对象列表推荐给所述目标用户。
9.根据权利要求8所述的电子装置,其特征在于,所述目标用户的特征向量为one-hot特征,所述预设加密算法为md5加密算法,所述第一预设存储路径为Elastic Search,所述第二预设存储路径为Hadoop分布式文件系统。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中包括对象推荐程序,所述对象推荐程序被处理器执行时,可实现如权利要求1至7中任意一项所述的对象推荐方法的步骤。
CN202010046350.7A 2020-01-16 2020-01-16 对象推荐方法、电子装置及计算机可读存储介质 Pending CN111274474A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202010046350.7A CN111274474A (zh) 2020-01-16 2020-01-16 对象推荐方法、电子装置及计算机可读存储介质
PCT/CN2020/093552 WO2021143023A1 (zh) 2020-01-16 2020-05-29 对象推荐方法、装置、电子设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010046350.7A CN111274474A (zh) 2020-01-16 2020-01-16 对象推荐方法、电子装置及计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN111274474A true CN111274474A (zh) 2020-06-12

Family

ID=71003223

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010046350.7A Pending CN111274474A (zh) 2020-01-16 2020-01-16 对象推荐方法、电子装置及计算机可读存储介质

Country Status (2)

Country Link
CN (1) CN111274474A (zh)
WO (1) WO2021143023A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112507216A (zh) * 2020-12-01 2021-03-16 北京奇艺世纪科技有限公司 一种数据对象推荐方法、装置、设备和存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100357901C (zh) * 2005-12-21 2007-12-26 华为技术有限公司 一种主设备和备份设备之间数据核查的方法
CN104750807A (zh) * 2015-03-25 2015-07-01 百度在线网络技术(北京)有限公司 一种应用推荐方法及装置
CN106326431A (zh) * 2016-08-25 2017-01-11 乐视控股(北京)有限公司 一种信息推荐方法和装置
CN108804670B (zh) * 2018-06-11 2023-03-31 腾讯科技(深圳)有限公司 数据推荐方法、装置、计算机设备和存储介质
US20190385470A1 (en) * 2018-06-19 2019-12-19 Chegg, Inc. Time-constrained personalized learning activities in online education platforms

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112507216A (zh) * 2020-12-01 2021-03-16 北京奇艺世纪科技有限公司 一种数据对象推荐方法、装置、设备和存储介质

Also Published As

Publication number Publication date
WO2021143023A1 (zh) 2021-07-22

Similar Documents

Publication Publication Date Title
CN110866181B (zh) 资源推荐的方法、装置及存储介质
WO2019169756A1 (zh) 产品推荐方法、装置及存储介质
CN107885796B (zh) 信息推荐方法及装置、设备
US10671684B2 (en) Method and apparatus for identifying demand
US20150051973A1 (en) Contextual-bandit approach to personalized news article recommendation
JP5341605B2 (ja) レコメンド情報生成装置およびレコメンド情報生成方法
JP5469331B2 (ja) レコメンド情報生成装置およびレコメンド情報生成方法
CN111552870A (zh) 对象推荐方法、电子装置及存储介质
US10162868B1 (en) Data mining system for assessing pairwise item similarity
CN110827112B (zh) 深度学习的商品推荐方法、装置、计算机设备及存储介质
CN109168047B (zh) 视频推荐方法、装置、服务器及存储介质
US20220067814A1 (en) Web application for service recommendations with machine learning
CN111400613A (zh) 物品推荐方法、装置、介质及计算机设备
CN105279569A (zh) 职业生涯路径导航
CN112104505B (zh) 应用推荐方法、装置、服务器和计算机可读存储介质
JP2011227721A (ja) 関心抽出装置、関心抽出方法、及び関心抽出プログラム
US11860880B2 (en) Systems for learning and using one or more sub-population features associated with individuals of one or more sub-populations of a gross population and related methods therefor
CN113343101A (zh) 一种对象排序方法及系统
US20140372207A1 (en) Profit index value generation system and profit index value generation method
CN109978594B (zh) 订单处理方法、装置及介质
CN111274474A (zh) 对象推荐方法、电子装置及计算机可读存储介质
US20180129664A1 (en) System and method to recommend a bundle of items based on item/user tagging and co-install graph
US10529002B2 (en) Classification of visitor intent and modification of website features based upon classified intent
CN114925275A (zh) 产品推荐方法、装置、计算机设备及存储介质
JP6167029B2 (ja) レコメンド情報生成装置およびレコメンド情報生成方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination