CN110659417A - 一种信息推送方法、系统、电子设备及存储介质 - Google Patents
一种信息推送方法、系统、电子设备及存储介质 Download PDFInfo
- Publication number
- CN110659417A CN110659417A CN201910866492.5A CN201910866492A CN110659417A CN 110659417 A CN110659417 A CN 110659417A CN 201910866492 A CN201910866492 A CN 201910866492A CN 110659417 A CN110659417 A CN 110659417A
- Authority
- CN
- China
- Prior art keywords
- information
- type
- group
- target time
- browsing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 239000013598 vector Substances 0.000 claims abstract description 9
- 230000000875 corresponding effect Effects 0.000 claims description 74
- 238000004590 computer program Methods 0.000 claims description 8
- 238000010606 normalization Methods 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 6
- 230000002596 correlated effect Effects 0.000 claims description 4
- 230000009286 beneficial effect Effects 0.000 abstract description 2
- 230000008569 process Effects 0.000 description 6
- 230000009471 action Effects 0.000 description 5
- 230000002159 abnormal effect Effects 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 1
- 238000000586 desensitisation Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
Abstract
本申请公开了一种信息推送方法,所述信息推送方法包括获取第一类型信息在多个目标时间段对应的历史浏览数据;根据特征标签对应的特征向量计算每一目标时间段内所有第二类型信息的欧氏距离;查询第一类型信息所在的第一群组,并根据第一群组的群组浏览数据确定每一目标时间段内第二类型信息的浏览比例;根据浏览比例确定每一目标时间段对应的时间权重系数;根据欧氏距离和时间权重系数确定所有第二类型信息之间的信息相似度,并根据信息相似度对第二类型信息执行推送操作。本申请能够提高信息推送的准确率。本申请还公开了一种信息推送系统、一种存储介质及一种电子设备,具有以上有益效果。
Description
技术领域
本申请涉及大数据技术领域,特别涉及一种信息推送方法、系统、一种存储介质及一种电子设备。
背景技术
各网站和应用程序纷纷推出用户专属的物品推荐清单,其中可以包括商品、视频和音乐、新闻等信息,为上述信息推送功能背后提供支撑的是一套推荐策略。
相关技术中,通过基于用户或物品的协同过滤算法实现用户或物品的相似度计算,进而基于相似度进行信息推送。但是,由于用户的浏览偏好并不完全相同,因此上述协同过滤算法的信息推荐的准确度较低。
因此,如何提高信息推送的准确率是本领域技术人员目前需要解决的技术问题。
发明内容
本申请的目的是提供一种信息推送方法、系统、一种存储介质及一种电子设备,能够提高信息推送的准确率。
为解决上述技术问题,本申请提供一种信息推送方法,该信息推送方法包括:
获取第一类型信息在多个目标时间段对应的历史浏览数据;其中,所述历史浏览数据包括第二类型信息的特征标签;
根据所述特征标签对应的特征向量计算每一所述目标时间段内所有第二类型信息的欧氏距离;
查询所述第一类型信息所在的第一群组,并根据所述第一群组的群组浏览数据确定每一所述目标时间段内所述第二类型信息的浏览比例;
根据所述浏览比例确定每一所述目标时间段对应的时间权重系数;
根据所述欧氏距离和所述时间权重系数确定所有所述第二类型信息之间的信息相似度,并根据所述信息相似度对所述第二类型信息执行推送操作。
可选的,所述查询所述第一类型信息所在的第一群组包括:
确定所述第一类型信息的信息标签,将所述信息标签对应的群组作为所述第一类型信息所在的所述第一群组;其中,所述第一群组中包括与所述第一类型信息的信息标签相同的其他信息。
可选的,所述根据所述第一群组的群组浏览数据确定每一所述目标时间段内所述第二类型信息的浏览比例,包括;
获取所述第一群组的群组浏览数据;其中,所述群组浏览数据包括所述第一类型信息和所有所述其他信息的浏览数据;
根据所述群组浏览数据确定每一所述目标时间段内所述第二类型信息的浏览比例。
可选的,当所述第一类型信息为用户ID时,所述第二类型信息为商品ID;当所述第一类型信息为所述商品ID时,所述第二类型信息为所述用户ID。
可选的,根据所述浏览比例确定每一所述目标时间段对应的时间权重系数包括:
根据所述目标时间段距离当前时刻的时间长度确定每一所述目标时间段对应的第一权重系数;其中,任意两个所述目标时间段之间没有交集,所述第一权重系数与时间差值负相关,所述时间差值为当前时刻与所述目标时间段的起始时刻的差值;
确定每一所述浏览比例对应的第二权重系数;
将所述第一权重系数和所述第二权重系数的乘积作为每一所述目标时间段对应的初始权重系数;
对所有所述目标时间段对应的初始权重系数执行归一化处理得到所述时间权重系数。
可选的,根据所述欧氏距离和所述时间权重系数确定所有所述第二类型信息之间的信息相似度,包括:
确定每一所述欧氏距离对应的第一相似度;
将同一所述目标时间段对应的第一相似度与时间权重系数相乘,得到所述第二类型信息在每一所述目标时间段的第二相似度;
将所有所述目标时间段的第二相似度相加得到所有所述第二类型信息之间的信息相似度。
可选的,根据所述信息相似度对所述第二类型信息执行推送操作包括:
判断所述信息相似度是否大于预设值;
若是,则将所述第二类型信息中包括的所有子信息设置为第二群组;
当检测到所述第二群组中的目标子信息被浏览时,将所述第二群组中除所述目标子信息之外的子信息推送至浏览所述目标子信息的终端设备。
本申请还提供了一种信息推送系统,该信息推送系统包括:
数据获取模块,用于获取第一类型信息在多个目标时间段对应的历史浏览数据;其中,所述历史浏览数据包括第二类型信息的特征标签;
比例确定模块,用于查询所述第一类型信息所在的第一群组,并根据所述第一群组的群组浏览数据确定每一所述目标时间段内所述第二类型信息的浏览比例;
权重确定模块,用于根据所述浏览比例确定每一所述目标时间段对应的时间权重系数;
欧氏距离计算模块,用于根据所述特征标签对应的特征向量计算每一所述目标时间段内所有第二类型信息的欧氏距离;
推送模块,用于根据所述欧氏距离和所述时间权重系数确定所有所述第二类型信息之间的信息相似度,并根据所述信息相似度对所述第二类型信息执行推送操作。
本申请还提供了一种存储介质,其上存储有计算机程序,所述计算机程序执行时实现上述信息推送方法执行的步骤。
本申请还提供了一种电子设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器调用所述存储器中的计算机程序时实现上述信息推送方法执行的步骤。
本申请提供了一种信息推送方法,包括获取第一类型信息在多个目标时间段对应的历史浏览数据;其中,所述历史浏览数据包括第二类型信息的特征标签;根据所述特征标签对应的特征向量计算每一所述目标时间段内所有第二类型信息的欧氏距离;查询所述第一类型信息所在的第一群组,并根据所述第一群组的群组浏览数据确定每一所述目标时间段内所述第二类型信息的浏览比例;根据所述浏览比例确定每一所述目标时间段对应的时间权重系数;根据所述欧氏距离和所述时间权重系数确定所有所述第二类型信息之间的信息相似度,并根据所述信息相似度对所述第二类型信息执行推送操作。
本申请在获取第一类型信息的历史浏览数据后,根据历史浏览数据中的特征标签计算第二类型信息的欧氏距离。本申请通过第一类型信息所在的第一群组对于第二类型信息的浏览比例确定相应的时间权重系数,基于欧氏距离和时间权重系数得到第二类型信息之间的信息相似度。第一群组可以包括具有相同浏览特性的信息,通过第一群组对于第二类型信息的浏览比例确定时间权重系数能够减少异常历史浏览数据对于信息推送的干扰,实现时间权重系数的动态调整,可以提高信息推送的准确率。本申请同时还提供了一种信息推送系统、一种存储介质和一种电子设备,具有上述有益效果,在此不再赘述。
附图说明
为了更清楚地说明本申请实施例,下面将对实施例中所需要使用的附图做简单的介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例所提供的一种信息推送方法的流程图;
图2为本申请实施例所提供的一种信息浏览比例的确定方法的流程图;
图3为本申请实施例所提供的一种信息相似度的确定方法的流程图;
图4为本申请实施例所提供的一种推送信息发送的方法的流程图;
图5为本申请实施例所提供的一种信息推送系统的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
下面请参见图1,图1为本申请实施例所提供的一种信息推送方法的流程图。
具体步骤可以包括:
S101:获取第一类型信息在多个目标时间段对应的历史浏览数据;
其中,本实施例为一种信息推送的方式,此处提到的信息推送可以为将被浏览信息推送给浏览动作的执行者,也可以为将浏览动作的执行者推送给被浏览信息。信息浏览这一过程中存在两类事物的双向互动,即浏览与被浏览,本实施例所提供的信息推送可以为将被浏览信息推送给浏览者,也可以将浏览者推送给浏览信息。需要说明的是,同一事物可能既是浏览者又是被浏览者,例如某直播平台的直播人员A在进行直播时,直播人员A相对于观众来说属于被浏览者;若直播人员A在直播时观看直播人员B的直播内容时,直播人员A相对于直播人员B来说属于浏览者,此时直播人员A既是浏览者又是被浏览者。
本步骤中提到的第一类型信息可以为浏览者,也可以为被浏览者。需要说明的是上述第一类型信息和第二类型信息构成一对浏览与被浏览的对应关系。相应的,当第一类型信息为浏览者时,历史浏览数据为第一类型信息浏览第二类型信息的历史记录;当第二类型信息为被浏览者时,历史浏览数据为第二类型信息浏览第一类型信息的历史记录。举例说明上述论述内容,当所述第一类型信息为用户ID时,所述第二类型信息为商品ID;当所述第一类型信息为所述商品ID时,所述第二类型信息为所述用户ID。当第一类型信息为用户A时,根据历史浏览数据可以确定用户A在本周内浏览了商品002、商品005和商品009;当第一类型信息为商品005时,根据历史浏览数据可以确定商品005在本周内分别被用户A、用户F和用户P浏览。
需要说明的是,本实施例中获取的历史浏览数据是按照目标时间段划分的,目标时间段可以为本实施例预先设置好的历史数据划分维度,例如可以将本周内作为第一目标时间段,将本月(不包括本周)作为第二目标时间段,将本季度(不包括本月)作为第三目标时间段,分别获取第一目标时间段、第二目标时间段和第三目标时间段对应的历史浏览数据。作为一种可行的实施方式,本实施例可以先获取第一类型信息所有的历史浏览数据,然后按照时间维度将历史浏览数据进行分割。例如可以以21天为划分粒度将历史浏览数据进行划分,得到第1~21天、第22~42天、第43~63天……等目标时间段对应的历史浏览数据。
进一步的,本实施例中历史浏览数据可以包括第二类型信息的特征标签。本实施例中可以预先为第二类型信息设置对应的特征标签,由于描述第二类型信息具有的特征。特征标签可以以文本的形式存在,每一特征标签可以存在其对应的特征向量。例如,当第二类型信息为智能手环的商品ID时,其特征标签可以为运动、电子产品和健康监测;当第二类型信息为用户ID时,其特征标签可以包括性别、职业信息和年龄阶层等。
S102:根据所述特征标签对应的特征向量计算每一所述目标时间段内所有第二类型信息的欧氏距离;
其中,根据上文里的论述可知本实施例可以为第二类型信息(用户或商品)标记具有语义的特征标签,计算物品或者用户的相似度就是通过标签计算的。欧氏距离即欧几里得距离,欧几里得距离为计算标签之间的相似度的方法,其过程首先是将特征标签转换成多维空间中的点,通过计算标签对应点之间的距离来衡量标签的相似度。具体的,距离越近,相似度越高。作为一种可行的实施方式,可以将特征标签转换成二维空间上的点或者三维空间上的点。欧几里得距离是指在n维空间中两个点(标签对应点)之间的距离,例如在二维空间中,点A(x1,y1)和点B(x2,y2)之间距离是
本实施例不限定历史浏览信息中第二类型信息的数量,本实施例中提到的欧氏距离可以为所有第二类型信息的欧氏距离的总和,也可以包括任意两个第二类型信息之间的欧氏距离。需要说明的是,本实施例按照目标时间段的维度进行欧氏距离的计算,得到的欧氏距离可以用于表示在对应的目标时间段的相似度。
S103:查询所述第一类型信息所在的第一群组,并根据所述第一群组的群组浏览数据确定每一所述目标时间段内所述第二类型信息的浏览比例;
其中,本实施例可以预先设置第一类型信息的特征标签,将标签相似度较大的其他信息与第二类型信息组成第一群组。例如,第一类型信息为商品篮球,其对应的特征标签为体育用具、球类和多人运动,商品篮球所在的第一群组中还可以包括足球、排球和曲棍球。例如,第一类型信息为用户A,其对应的特征标签为男性、学生和喜爱美食,用户A所在的第一群组中还可以包括其他喜爱美食的男性学生用户。
本步骤的目的在于确定第一类型信息所在的第一群组中对于第二类型信息的浏览比例。例如第一群组中包括用户A、用户B、用户C、用户D和用户E共五个用户,在本周内用户A、用户B和用户C都浏览了第二类型信息,所以本周内第二类型信息的浏览比例为0.6。例如第一群组中包括商品001、商品002、商品003、商品004、商品005和商品006共六种商品,在本周内商品001、商品002和商品003都被第二类型信息对应的用户浏览,所以本周内第二类型信息的浏览比例为0.5。
基于上述第一群组的构建规则,处于同一群组的事物具有相似的浏览偏好,通过统计浏览比例能够反映第一类型信息和第二类型信息浏览关系发生的普遍性,避免异常浏览数据的干扰。例如用户A在本周内浏览了商品001、商品002和商品003,但是第一群组中除了用户A之外的99个用户均未浏览商品001、商品002或商品003,此时可以判定浏览比例为0.01。基于浏览比例本实施例可以执行S104的相关操作,以便灵活调整时间权重系数。
S104:根据所述浏览比例确定每一所述目标时间段对应的时间权重系数;
其中,本实施例中引入第一类型信息所在第一群组的群组浏览数据,根据群组浏览数据确定浏览比例,进而根据浏览比例调整每一目标时间段对应的时间权重系数,当然浏览比例与时间权重系数为正相关关系。
作为一种可行的实施方式,确定时间权重系数的过程可以具体包括以下步骤:
步骤1、根据所述目标时间段距离当前时刻的时间长度确定每一所述目标时间段对应的第一权重系数;
其中,任意两个所述目标时间段之间没有交集,所述第一权重系数与时间差值负相关,所述时间差值为当前时刻与所述目标时间段的起始时刻的差值;
步骤2、确定每一所述浏览比例对应的第二权重系数;
步骤3、将所述第一权重系数和所述第二权重系数的乘积作为每一所述目标时间段对应的初始权重系数;
步骤4、对所有所述目标时间段对应的初始权重系数执行归一化处理得到所述时间权重系数。
上述过程为每一目标时间段设置默认值,即第一权重系数。将第一权重系数与第二权重系数的乘积作为每一所述目标时间段对应的初始权重系数,此处得到的初始权重系数为基于时间维度和浏览比例维度综合确定的权重系数,当时间维度不变时浏览比例越高初始权重系数越大,当浏览比例维度不变时间距当前时刻越近初始权重系数越大。进一步的,在得到初始权重系数之后,还可以对所有的初始权重系数执行归一化处理,以使所有初始权重系数的和为1。
S105:根据所述欧氏距离和所述时间权重系数确定所有所述第二类型信息之间的信息相似度,并根据所述信息相似度对所述第二类型信息执行推送操作。
其中,在得到欧氏距离和时间权重系数的基础上,本实施例可以将每一目标时间段对应的欧氏距离与时间权重系数的乘积相加得到总欧氏距离,进而根据总欧氏距离确定第二类型信息之间的信息相似度。可以根据信息相似度执行信息推送。
本实施例在获取第一类型信息的历史浏览数据后,根据历史浏览数据中的特征标签计算第二类型信息的欧氏距离。本实施例通过第一类型信息所在的第一群组对于第二类型信息的浏览比例确定相应的时间权重系数,基于欧氏距离和时间权重系数得到第二类型信息之间的信息相似度。第一群组可以包括具有相同浏览特性的信息,通过第一群组对于第二类型信息的浏览比例确定时间权重系数能够减少异常历史浏览数据对于信息推送的干扰,实现时间权重系数的动态调整,可以提高信息推送的准确率。此处提到的相似度指商品或者视频、音乐、新闻等推荐物品在特征标签意义上的相似程度。
第二类型信息可以拥有多个特征标签,物品之间的相似性是多个特征标签的对应点的欧几里得的距离之和。然而用户或者物品的相似度来源自用户历史操作数据,历史数据有限而且具有很强的时效性。本实施例提出的物品相似度的计算方法是解决历史数据对当前相似度计算干扰的问题,使推荐更具有时效性,减少对用户推荐很长时间之前推荐的物品。本实施例中的时间权值系数是根据同一分类中的用户或者某物品被浏览或者评论等操作统计得出。本实施例可以每隔固定时间进行统计,因此时间权值系数也是跟随动态变化的。
下面请参见图2,图2为本申请实施例所提供的一种信息浏览比例的确定方法的流程图,本实施例是对图1对应实施例中S103的进一步介绍,可以将本实施例与图1对应实施例相结合得到更为优选的实施方式,本实施例可以包括以下步骤:
S201:确定所述第一类型信息的信息标签,将所述信息标签对应的群组作为所述第一类型信息所在的所述第一群组;
其中,所述第一群组中包括与所述第一类型信息的信息标签相同的其他信息。
S202:获取所述第一群组的群组浏览数据;
其中,所述群组浏览数据包括所述第一类型信息和所有所述其他信息的浏览数据;
S203:根据所述群组浏览数据确定每一所述目标时间段内所述第二类型信息的浏览比例。
本实施例通过第一类型信息的信息标签确定第一类型信息所在的第一群组,第一群组中可以包括除第一类型信息之外的其他信息。获取第一群组的群组浏览数据时,可以按照S101中所描述的目标时间段对群组浏览数据进行分割,因此本实施例可以得到每一所述目标时间段内所述第二类型信息的浏览比例。
下面请参见图3,图3为本申请实施例所提供的一种信息相似度的确定方法的流程图,本实施例是对图1对应实施例中S105中确定信息相似度的进一步介绍,可以将本实施例与图1对应实施例相结合得到更为优选的实施方式,本实施例可以包括以下步骤:
S301:确定每一所述欧氏距离对应的第一相似度;
S302:将同一所述目标时间段对应的第一相似度与时间权重系数相乘,得到所述第二类型信息在每一所述目标时间段的第二相似度;
S303:将所有所述目标时间段的第二相似度相加得到所有所述第二类型信息之间的信息相似度。
其中,每一欧氏距离都可以有其对应的第一相似度,在本实施例中引入时间权重系数,将第一相似度与时间权重系数的乘积作为每一目标时间段的第二相似度。上述第二相似度是按照一个一个目标时间段分段计算的,本实施例将所有的第二相似度相加得到第二类型信息之间的信息相似度。当信息相似度大于预设值时,说明第二类型信息中所包括的信息具有较高的相似度,可以进行关联推送。
下面请参见图4,图4为本申请实施例所提供的一种推送信息发送的方法的流程图,本实施例是对图1对应实施例中S105中执行推送操作的进一步介绍,可以将本实施例与图1对应实施例相结合得到更为优选的实施方式,本实施例可以包括以下步骤:
S401:判断所述信息相似度是否大于预设值;若是,则进入S402;若否则结束流程;
S402:将所述第二类型信息中包括的所有子信息设置为第二群组;
S403:当检测到所述第二群组中的目标子信息被浏览时,将所述第二群组中除所述目标子信息之外的子信息推送至浏览所述目标子信息的终端设备。
其中,上述是实施例中提到的第二群组为第二类型信息中所包括的子信息的集合,第二群组中的子信息具有较高的相似度。若检测到所有子信息中存在目标信息被浏览,则将第二群组内除所述目标子信息之外的子信息推送至浏览所述目标子信息的终端设备。
作为一种可行的实施方式,可以将第二群组中未被第一群组中的用户浏览的信息进行推送。举例说明上述内容,第一群组包括用户A、用户B和用户C,第二群组包括子信息001、子信息002和子信息003,若用户A和用户B均浏览过子信息001、子信息002和子信息003,用户C仅浏览过子信息001,此时可以将子信息002和子信息003推送给用户C。
下面通过在实际应用中的实施例说明上述实施例描述的流程。
首先,可以对用户信息进行脱敏,隐藏用户的隐私信息,然后对物品的历史数据进行时间分类;其次,将物品的标签或者用户的标点转化为预期维度中的点,并根据场景赋予相应的坐标值;在根据赋予的时间维度分段并统计得出动态时间权重后,计算出表示用户或者物品的相似度的欧几里得距离,相似度高于设定相似度阈值的用户分为相同类,相似度高于设定相似度阈值的物品推荐给指定用户。
在计算用户或者物品相似度时,可以对用户的历史数据进行分类,将本周内历史物品A分类为(XA,YA),本周至本月内历史物品B分类为(XB,YB),本月至三月内的历史物品C分类为(XC,YC),可采用欧几里得距离计算公式计算每个分类中的物品的欧氏距离。
本实施例还可以计算总的欧几里得距离并为每个分类定义时间权重系数。时间权重系数通常可以以以下方式得到:基本前提是在相同时间段内,统计浏览某一物品的用户数量在同类用户中的比例或者相似物品被浏览次数在用户浏览物品总次数中的比例,并且对统计的比例进行归一化处理,分别为A、B、C三类分配权重分别为a,b,c,保证权重和为1。得到以下公式,为相似度引入时效性因素。如以下公式:D=aDA+bDB+cDc,D为总的欧几里得距离,DA为本周内物品的欧几里得距离,DB为本周至本月内物品的欧几里得距离,DC为本月至三月内物品的欧几里得距离。然后,本实施例可以根据加入动态时间权重计算得出的欧几里得距离作为相似度判断的标准,划分用户类和相似物品类。具体的,本实施例在使用欧几里得空间计算用户或者物品相似度时,加入动态时间权重,反映用户在不同时间段内的喜好,可以更加精确地计算出相似度,从而更加精确地划分用户分类和物品分类。历史数据在时间维度的分段可以根据不同的场景进行调整。
本实施例使得推荐系统增强实效性,强调用户或者物品的动态分类,可以更加精确地完成推荐工作。
请参见图5,图5为本申请实施例所提供的一种信息推送系统的结构示意图;
该系统可以包括:
数据获取模块100,用于获取第一类型信息在多个目标时间段对应的历史浏览数据;其中,所述历史浏览数据包括第二类型信息的特征标签;
比例确定模块200,用于查询所述第一类型信息所在的第一群组,并根据所述第一群组的群组浏览数据确定每一所述目标时间段内所述第二类型信息的浏览比例;
权重确定模块300,用于根据所述浏览比例确定每一所述目标时间段对应的时间权重系数;
欧氏距离计算模块400,用于根据所述特征标签对应的特征向量计算每一所述目标时间段内所有第二类型信息的欧氏距离;
推送模块500,用于根据所述欧氏距离和所述时间权重系数确定所有所述第二类型信息之间的信息相似度,并根据所述信息相似度对所述第二类型信息执行推送操作。
本实施例在获取第一类型信息的历史浏览数据后,根据历史浏览数据中的特征标签计算第二类型信息的欧氏距离。本实施例通过第一类型信息所在的第一群组对于第二类型信息的浏览比例确定相应的时间权重系数,基于欧氏距离和时间权重系数得到第二类型信息之间的信息相似度。第一群组可以包括具有相同浏览特性的信息,通过第一群组对于第二类型信息的浏览比例确定时间权重系数能够减少异常历史浏览数据对于信息推送的干扰,实现时间权重系数的动态调整,可以提高信息推送的准确率。
进一步的,所述比例确定模块200包括:
群组确定单元,用于确定所述第一类型信息的信息标签,将所述信息标签对应的群组作为所述第一类型信息所在的所述第一群组;其中,所述第一群组中包括与所述第一类型信息的信息标签相同的其他信息;
浏览比例确定单元,用于根据所述第一群组的群组浏览数据确定每一所述目标时间段内所述第二类型信息的浏览比例;
进一步的,所述浏览比例确定单元包括;
群组数据获取子单元,用于获取所述第一群组的群组浏览数据;其中,所述群组浏览数据包括所述第一类型信息和所有所述其他信息的浏览数据;
信息比例确定子单元,用于根据所述群组浏览数据确定每一所述目标时间段内所述第二类型信息的浏览比例。
进一步的,当所述第一类型信息为用户ID时,所述第二类型信息为商品ID;当所述第一类型信息为所述商品ID时,所述第二类型信息为所述用户ID。
进一步的,权重确定模块300包括:
第一权重确定单元,用于根据所述目标时间段距离当前时刻的时间长度确定每一所述目标时间段对应的第一权重系数;其中,任意两个所述目标时间段之间没有交集,所述第一权重系数与时间差值负相关,所述时间差值为当前时刻与所述目标时间段的起始时刻的差值;
第二权重确定单元,用于确定每一所述浏览比例对应的第二权重系数;
初始权重确定单元,用于将所述第一权重系数和所述第二权重系数的乘积作为每一所述目标时间段对应的初始权重系数;
归一化单元,用于对所有所述目标时间段对应的初始权重系数执行归一化处理得到所述时间权重系数。
进一步的,推送模块500包括:
第一相似度确定单元,用于确定每一所述欧氏距离对应的第一相似度;
第二相似度确定单元,用于将同一所述目标时间段对应的第一相似度与时间权重系数相乘,得到所述第二类型信息在每一所述目标时间段的第二相似度;
信息相似度确定单元,用于将所有所述目标时间段的第二相似度相加得到所有所述第二类型信息之间的信息相似度。
进一步的,推送模块500包括:
判断单元,用于判断所述信息相似度是否大于预设值;若是,则将所述第二类型信息中包括的所有子信息设置为第二群组;
信息发送单元,用于当检测到所述第二群组中的目标子信息被浏览时,将所述第二群组中除所述目标子信息之外的子信息推送至浏览所述目标子信息的终端设备。
由于系统部分的实施例与方法部分的实施例相互对应,因此系统部分的实施例请参见方法部分的实施例的描述,这里暂不赘述。
本申请还提供了一种存储介质,其上存有计算机程序,该计算机程序被执行时可以实现上述实施例所提供的步骤。该存储介质可以包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
本申请还提供了一种电子设备,可以包括存储器和处理器,所述存储器中存有计算机程序,所述处理器调用所述存储器中的计算机程序时,可以实现上述实施例所提供的步骤。当然所述电子设备还可以包括各种网络接口,电源等组件。
说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的状况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
Claims (10)
1.一种信息推送方法,其特征在于,包括:
获取第一类型信息在多个目标时间段对应的历史浏览数据;其中,所述历史浏览数据包括第二类型信息的特征标签;
根据所述特征标签对应的特征向量计算每一所述目标时间段内所有第二类型信息的欧氏距离;
查询所述第一类型信息所在的第一群组,并根据所述第一群组的群组浏览数据确定每一所述目标时间段内所述第二类型信息的浏览比例;
根据所述浏览比例确定每一所述目标时间段对应的时间权重系数;
根据所述欧氏距离和所述时间权重系数确定所有所述第二类型信息之间的信息相似度,并根据所述信息相似度对所述第二类型信息执行推送操作。
2.根据权利要求1所述信息推送方法,其特征在于,所述查询所述第一类型信息所在的第一群组包括:
确定所述第一类型信息的信息标签,将所述信息标签对应的群组作为所述第一类型信息所在的所述第一群组;其中,所述第一群组中包括与所述第一类型信息的信息标签相同的其他信息。
3.根据权利要求2所述信息推送方法,其特征在于,所述根据所述第一群组的群组浏览数据确定每一所述目标时间段内所述第二类型信息的浏览比例,包括;
获取所述第一群组的群组浏览数据;其中,所述群组浏览数据包括所述第一类型信息和所有所述其他信息的浏览数据;
根据所述群组浏览数据确定每一所述目标时间段内所述第二类型信息的浏览比例。
4.根据权利要求1所述信息推送方法,其特征在于,当所述第一类型信息为用户ID时,所述第二类型信息为商品ID;
当所述第一类型信息为所述商品ID时,所述第二类型信息为所述用户ID。
5.根据权利要求1所述信息推送方法,其特征在于,根据所述浏览比例确定每一所述目标时间段对应的时间权重系数包括:
根据所述目标时间段距离当前时刻的时间长度确定每一所述目标时间段对应的第一权重系数;其中,任意两个所述目标时间段之间没有交集,所述第一权重系数与时间差值负相关,所述时间差值为当前时刻与所述目标时间段的起始时刻的差值;
确定每一所述浏览比例对应的第二权重系数;
将所述第一权重系数和所述第二权重系数的乘积作为每一所述目标时间段对应的初始权重系数;
对所有所述目标时间段对应的初始权重系数执行归一化处理得到所述时间权重系数。
6.根据权利要求1所述信息推送方法,其特征在于,根据所述欧氏距离和所述时间权重系数确定所有所述第二类型信息之间的信息相似度,包括:
确定每一所述欧氏距离对应的第一相似度;
将同一所述目标时间段对应的第一相似度与时间权重系数相乘,得到所述第二类型信息在每一所述目标时间段的第二相似度;
将所有所述目标时间段的第二相似度相加得到所有所述第二类型信息之间的信息相似度。
7.根据权利要求1至6任一项所述信息推送方法,其特征在于,根据所述信息相似度对所述第二类型信息执行推送操作包括:
判断所述信息相似度是否大于预设值;
若是,则将所述第二类型信息中包括的所有子信息设置为第二群组;
当检测到所述第二群组中的目标子信息被浏览时,将所述第二群组中除所述目标子信息之外的子信息推送至浏览所述目标子信息的终端设备。
8.一种信息推送系统,其特征在于,包括:
数据获取模块,用于获取第一类型信息在多个目标时间段对应的历史浏览数据;其中,所述历史浏览数据包括第二类型信息的特征标签;
比例确定模块,用于查询所述第一类型信息所在的第一群组,并根据所述第一群组的群组浏览数据确定每一所述目标时间段内所述第二类型信息的浏览比例;
权重确定模块,用于根据所述浏览比例确定每一所述目标时间段对应的时间权重系数;
欧氏距离计算模块,用于根据所述特征标签对应的特征向量计算每一所述目标时间段内所有第二类型信息的欧氏距离;
推送模块,用于根据所述欧氏距离和所述时间权重系数确定所有所述第二类型信息之间的信息相似度,并根据所述信息相似度对所述第二类型信息执行推送操作。
9.一种电子设备,其特征在于,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器调用所述存储器中的计算机程序时实现如权利要求1至7任一项所述信息推送方法的步骤。
10.一种存储介质,其特征在于,所述存储介质中存储有计算机可执行指令,所述计算机可执行指令被处理器加载并执行时,实现如上权利要求1至7任一项所述信息推送方法的步骤。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910866492.5A CN110659417A (zh) | 2019-09-12 | 2019-09-12 | 一种信息推送方法、系统、电子设备及存储介质 |
PCT/CN2019/130025 WO2021047119A1 (zh) | 2019-09-12 | 2019-12-30 | 一种信息推送方法、系统、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910866492.5A CN110659417A (zh) | 2019-09-12 | 2019-09-12 | 一种信息推送方法、系统、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110659417A true CN110659417A (zh) | 2020-01-07 |
Family
ID=69037138
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910866492.5A Pending CN110659417A (zh) | 2019-09-12 | 2019-09-12 | 一种信息推送方法、系统、电子设备及存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN110659417A (zh) |
WO (1) | WO2021047119A1 (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111581452A (zh) * | 2020-03-26 | 2020-08-25 | 浙江口碑网络技术有限公司 | 推荐对象数据的获得方法、装置及电子设备 |
CN111954017A (zh) * | 2020-08-14 | 2020-11-17 | 北京达佳互联信息技术有限公司 | 直播间搜索方法、装置、服务器及存储介质 |
CN113609409A (zh) * | 2021-07-21 | 2021-11-05 | 深圳供电局有限公司 | 一种推荐浏览信息的方法及其系统、电子设备、存储介质 |
CN113901326A (zh) * | 2021-10-27 | 2022-01-07 | 海信集团控股股份有限公司 | 图书推荐方法、服务器及系统 |
CN116401460A (zh) * | 2023-04-23 | 2023-07-07 | 中航信移动科技有限公司 | 一种提高信息推送准确性的方法、存储介质及电子设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106228386A (zh) * | 2016-07-12 | 2016-12-14 | 腾讯科技(深圳)有限公司 | 一种信息推送方法及装置 |
CN107066476A (zh) * | 2016-12-13 | 2017-08-18 | 江苏途致信息科技有限公司 | 一种基于物品相似度的实时推荐方法 |
CN108334558A (zh) * | 2018-01-02 | 2018-07-27 | 南京师范大学 | 一种结合标签和时间因素的协同过滤推荐方法 |
JP2019113943A (ja) * | 2017-12-21 | 2019-07-11 | ヤフー株式会社 | 情報提供装置、情報提供方法、およびプログラム |
CN110020135A (zh) * | 2017-11-09 | 2019-07-16 | 阿里巴巴集团控股有限公司 | 一种需求确定方法、资源推荐方法和相关装置 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11170059B2 (en) * | 2016-03-30 | 2021-11-09 | International Business Machines Corporation | Personalized content selection for time-constrained sessions |
CN107277115A (zh) * | 2017-05-27 | 2017-10-20 | 深圳大学 | 一种内容推送方法及装置 |
CN109978534A (zh) * | 2017-12-25 | 2019-07-05 | 上海瀚决网络科技有限公司 | 社交平台的社交信息排序显示方法和虚拟货币分配方法 |
CN109325179B (zh) * | 2018-09-17 | 2020-12-04 | 青岛海信网络科技股份有限公司 | 一种内容推广的方法及装置 |
-
2019
- 2019-09-12 CN CN201910866492.5A patent/CN110659417A/zh active Pending
- 2019-12-30 WO PCT/CN2019/130025 patent/WO2021047119A1/zh active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106228386A (zh) * | 2016-07-12 | 2016-12-14 | 腾讯科技(深圳)有限公司 | 一种信息推送方法及装置 |
CN107066476A (zh) * | 2016-12-13 | 2017-08-18 | 江苏途致信息科技有限公司 | 一种基于物品相似度的实时推荐方法 |
CN110020135A (zh) * | 2017-11-09 | 2019-07-16 | 阿里巴巴集团控股有限公司 | 一种需求确定方法、资源推荐方法和相关装置 |
JP2019113943A (ja) * | 2017-12-21 | 2019-07-11 | ヤフー株式会社 | 情報提供装置、情報提供方法、およびプログラム |
CN108334558A (zh) * | 2018-01-02 | 2018-07-27 | 南京师范大学 | 一种结合标签和时间因素的协同过滤推荐方法 |
Non-Patent Citations (1)
Title |
---|
邹凌君等: "时间加权的混合推荐算法", 《计算机科学》 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111581452A (zh) * | 2020-03-26 | 2020-08-25 | 浙江口碑网络技术有限公司 | 推荐对象数据的获得方法、装置及电子设备 |
CN111581452B (zh) * | 2020-03-26 | 2023-10-17 | 浙江口碑网络技术有限公司 | 推荐对象数据的获得方法、装置及电子设备 |
CN111954017A (zh) * | 2020-08-14 | 2020-11-17 | 北京达佳互联信息技术有限公司 | 直播间搜索方法、装置、服务器及存储介质 |
CN113609409A (zh) * | 2021-07-21 | 2021-11-05 | 深圳供电局有限公司 | 一种推荐浏览信息的方法及其系统、电子设备、存储介质 |
CN113901326A (zh) * | 2021-10-27 | 2022-01-07 | 海信集团控股股份有限公司 | 图书推荐方法、服务器及系统 |
CN116401460A (zh) * | 2023-04-23 | 2023-07-07 | 中航信移动科技有限公司 | 一种提高信息推送准确性的方法、存储介质及电子设备 |
CN116401460B (zh) * | 2023-04-23 | 2024-04-05 | 中航信移动科技有限公司 | 一种提高信息推送准确性的方法、存储介质及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
WO2021047119A1 (zh) | 2021-03-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108121737B (zh) | 一种业务对象属性标识的生成方法、装置和系统 | |
CN110659417A (zh) | 一种信息推送方法、系统、电子设备及存储介质 | |
JP6356744B2 (ja) | ウェブサイト横断情報を表示する方法およびシステム | |
CN109688469B (zh) | 一种广告展示方法及展示装置 | |
US8655949B2 (en) | Correlated information recommendation | |
JP4524709B2 (ja) | 情報処理装置および方法、並びに、プログラム | |
JP5897019B2 (ja) | 候補製品のリンクリストを判定する方法および装置 | |
JP5581408B2 (ja) | 情報処理システム、情報処理装置、情報処理方法及びプログラム | |
CN111310038B (zh) | 信息推荐方法、装置、电子设备及计算机可读存储介质 | |
CN106504011A (zh) | 一种业务对象的展示方法和装置 | |
CN103886001A (zh) | 一种个性化商品推荐系统 | |
US20090144226A1 (en) | Information processing device and method, and program | |
CN105023178B (zh) | 一种基于本体的电子商务推荐方法 | |
US20180025364A1 (en) | Information processing apparatus, information processing method, and program | |
CN105718566A (zh) | 一种智能音乐推荐系统 | |
CN111915409B (zh) | 基于物品的物品推荐方法、装置、设备及存储介质 | |
CN103942193A (zh) | 一种信息推送的方法及装置 | |
US20190065611A1 (en) | Search method and apparatus | |
KR101596631B1 (ko) | 빅데이터 색인어를 이용한 상품 추천 방법 | |
CN115878903A (zh) | 基于大数据的信息智能推荐方法 | |
TW201734909A (zh) | 一種目標用戶的識別方法和裝置 | |
CN115496523A (zh) | 一种广告发布方法、计算机可读存储介质和电子设备 | |
CN107437182B (zh) | 资料分发方法及装置 | |
CN113220974A (zh) | 点击率预测模型训练、搜索召回方法、装置、设备及介质 | |
CN110020118B (zh) | 一种计算用户之间相似度的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200107 |
|
RJ01 | Rejection of invention patent application after publication |