CN105809465A - 一种信息处理方法及装置 - Google Patents
一种信息处理方法及装置 Download PDFInfo
- Publication number
- CN105809465A CN105809465A CN201410854140.5A CN201410854140A CN105809465A CN 105809465 A CN105809465 A CN 105809465A CN 201410854140 A CN201410854140 A CN 201410854140A CN 105809465 A CN105809465 A CN 105809465A
- Authority
- CN
- China
- Prior art keywords
- user
- time period
- output
- determining
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 20
- 238000003672 processing method Methods 0.000 title claims abstract description 12
- 238000000034 method Methods 0.000 claims abstract description 49
- 238000012545 processing Methods 0.000 claims description 33
- 238000013075 data extraction Methods 0.000 claims description 15
- 238000004458 analytical method Methods 0.000 claims description 13
- 239000013598 vector Substances 0.000 claims description 13
- 239000011159 matrix material Substances 0.000 claims description 4
- 238000012163 sequencing technique Methods 0.000 claims description 4
- 230000006399 behavior Effects 0.000 description 61
- 230000006870 function Effects 0.000 description 17
- 238000010586 diagram Methods 0.000 description 11
- 238000004590 computer program Methods 0.000 description 7
- 239000000284 extract Substances 0.000 description 6
- 238000013459 approach Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 230000000737 periodic effect Effects 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 238000000354 decomposition reaction Methods 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- BUGBHKTXTAQXES-UHFFFAOYSA-N Selenium Chemical compound [Se] BUGBHKTXTAQXES-UHFFFAOYSA-N 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- 230000003796 beauty Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 238000000556 factor analysis Methods 0.000 description 1
- 235000013312 flour Nutrition 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 235000019198 oils Nutrition 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 229910052711 selenium Inorganic materials 0.000 description 1
- 239000011669 selenium Substances 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种信息处理方法,包括:从用户行为数据库中提取预设统计周期内的用户行为数据;利用所述用户行为数据,确定每个对象被用户选中的时间周期;利用所述时间周期,确定每个对象当前时刻进行输出的时间周期的权重;确定输出各对象时,根据每个对象的时间周期、以及对应的权重,确定各对象当前时刻的输出概率;并根据各对象的输出概率输出各对象的相关信息。本发明同时还公开了一种信息处理装置。
Description
技术领域
本发明涉及通信中的业务支撑领域,尤其涉及一种信息处理方法及装置。
背景技术
近年来,随着电子商务的快速发展与不断普及,网络购物俨然成为了主流的消费方式。由于电子商务网站具有商品数量大、品种齐全、商品价格及质量优于线下模式、操作快捷方便等诸多特点而被广大的消费者所接受和使用。巨大的销售额度及经济利润使得电商企业采用多种多样的手段吸引更多的消费者,越来越多的企业试图利用数据挖掘技术,为消费者提供更能满足其潜在兴趣的商品,进而不断提升网站的服务质量。而推荐算法为上述需求提供了系统的解决方案。
目前,考虑时间的推荐方法主要包括:结合用户购买时间特征和结合购买商品序列(序列按照时间顺序进行排列)两种进行的推荐。其中,结合用户购买时间特征的推荐方法是在进行推荐的相似度计算时加入时间特征因素,使得购买时间在找寻相似商品时发挥影响。这种方法倾向于增加距离预测时刻较近的历史购买行为的影响,降低距离预测时刻时间久远的购买行为的影响。但这种方法没有考虑到商品购买的时间周期特性,可能在消费者已经买过某个商品后还给他推荐该商品,而那时消费者已经不需要那个商品了。
而基于时间序列的推荐方法,其主要思想是人们购买的商品遵循购买一定的时间顺序。依据权威消费者(购买一定商品数量的用户)的历史购买商品顺序为用户做推荐。在实际使用中,先将商品聚类以减少商品序列长度,然后结合商品被评价的时间找到所有用户在这些大类上的购买序列。由于每个人对商品的使用情况是存在很大差异的,比如购买的商品有的是一个人消费掉,有的是一家人。这种方法忽略了商品消耗掉的时间差异性,会漏掉一些商品的再次推荐。
发明内容
为解决现有存在的技术问题,本发明实施例提供一种信息处理方法及装置。
本发明实施例提供了一种信息处理方法,包括:
从用户行为数据库中提取预设统计周期内的用户行为数据;
利用所述用户行为数据,确定每个对象被用户选中的时间周期;
利用所述时间周期,确定每个对象当前时刻进行输出的时间周期的权重;
确定输出各对象时,根据每个对象的时间周期、以及对应的权重,确定各对象当前时刻的输出概率;并根据各对象的输出概率输出各对象的相关信息。
上述方案中,所述从用户行为数据库中提取预设统计周期内的用户行为数据之前,所述方法还包括:
提取用户的行为属性特征;
相应地,根据所述行为属性特征,从用户行为数据库中提取预设统计周期内对应的用户行为数据。
上述方案中,所述提取用户的行为属性特征,为:
在与所述用户交互过程中直接提取所述用户的行为属性特征;或者,
对所述用户的兴趣进行分析,根据分析结果提取所述用户的行为属性特征。
上述方案中,根据所述时间周期、及所述权重确定的输出概率在0至1之间,且为余弦函数;所述余弦函数的周期为所述时间周期。
上述方案中,根据公式: 确定所述权重;
其中,rij表示已知的对象j历史输出因素;rij表示已确定的对象j的输出因素;tpre表示预测的对象j被用户i选中时间;tlast表示对象j最后一次被用户i选中的时间;Tij表示对象j被用户i选中的时间周期;α表示权重;argmax表示寻找具有最大输出概率的参量
上述方案中,所述确定输出各对象,为:
根据各对象被用户选中的时间周期,确定输出各对象。
上述方案中,根据公式: 确定各对象当前时刻的输出概率;
其中,ui表示需要估计的用户i潜在特征向量,υj表示需要估计的对象j潜在特征向量,ui T表示ui的转置矩阵。
上述方案中,所述根据各对象的输出概率输出各对象,为:
将各对象的输出概率从高到低进行排序;
根据排序结果,向用户输出前k个对象的相关信息;k为大于零的整数。
本发明实施例还提供了一种信息处理装置,包括:数据提取模块、数据处理模块、触发服务提醒模块、对象输出处理模块以及输出模块;其中,
所述数据提取模块,用于从用户行为数据库中提取预设统计周期内的用户行为数据;
所述数据处理模块,用于利用所述用户行为数据,确定每个对象被用户选中的时间周期;并利用所述时间周期,确定每个对象当前时刻进行输出的时间周期的权重;
所述触发服务提醒模块,用于确定输出各对象时触发所述对象输出处理模块;
所述对象输出处理模块,用于收到所述触发服务提醒模块的触发后,根据每个对象的时间周期、以及对应的权重,确定各对象当前时刻的输出概率;
所述输出模块,用于根据各对象的输出概率输出各对象的相关信息。
上述方案中,所述装置还包括:属性特征分析模块,用于提取用户的行为属性特征;
相应地,所述数据提取模块,用于根据所述行为属性特征,从用户行为数据库中提取预设统计周期内对应的用户行为数据。
上述方案中,确定所述权重时,根据所述时间周期、及所述权重确定的输出概率在0至1之间,且为余弦函数;所述余弦函数的周期为所述时间周期。
本发明实施例提供的信息处理方法及装置,从用户行为数据库中提取预设统计周期内的用户行为数据;利用所述用户行为数据,确定每个对象被用户选中的时间周期;利用所述时间周期,确定每个对象当前时刻进行输出的时间周期的权重;确定输出各对象时,根据每个对象的时间周期、以及对应的权重,确定各对象当前时刻的输出概率;并根据各对象的输出概率输出各对象的相关信息,如此,能保证输出对象的准确性。
附图说明
在附图(其不一定是按比例绘制的)中,相似的附图标记可在不同的视图中描述相似的部件。具有不同字母后缀的相似附图标记可表示相似部件的不同示例。附图以示例而非限制的方式大体示出了本文中所讨论的各个实施例。
图1为本发明实施例一信息处理方法流程示意图;
图2为本发明实施例二信息处理装置结构示意图;
图3为本发明实施例三推荐系统架构示意图;
图4为本发明实施例三中购买商品随时间周期的变化曲线示意图;
图5为本发明实施例三中向用户输出商品推荐信息的主要流程示意图。
具体实施方式
下面结合附图及实施例对本发明再作进一步详细地描述。
在描述本发明实施例之前,先详细了解一下现有的推荐算法。
目前,推荐系统中所使用的推荐算法主要分为基于协同过滤推荐、基于内容推荐和混合方法推荐。其中,基于协同过滤推荐是指:通过分析用户历史的消费记录或利用其他相似用户的消费记录为用户推荐合适的商品。基于内容的推荐是利用商品自身所携带的文本内容,如:商品的名称、价格、介绍等信息为用户进行推荐。混合方法推荐是上述两种推荐方法的混合,此外还加入其它的有关处理步骤,包括各种启发式的处理方法等。
考虑时间的推荐方法主要包括:结合用户购买时间特征和基于时间序列两种推荐方法。其中,结合用户购买时间特征的推荐方法是在进行推荐的相似度计算时加入时间特征因素,使得购买时间在找寻相似商品时发挥影响。这种方法倾向于增加距离预测时刻较近的历史购买行为的影响,降低距离预测时刻时间久远的购买行为的影响。但这种方法没有考虑到商品购买的时间周期特性,可能在消费者已经买过某个商品后还给他推荐该商品,而那时消费者已经不需要那个商品了。
而基于时间序列的推荐方法,其主要思想是人们购买的商品遵循购买一定的时间顺序。依据权威消费者(购买一定商品数量的用户)的历史购买商品顺序为用户做推荐。在实际使用中,先将商品聚类以减少商品序列长度,然后结合商品被评价的时间找到所有用户在这些大类上的购买序列。由于每个人对商品的使用情况是存在很大差异的,比如购买的商品有的是一个人消费掉,有的是一家人。这种方法忽略了商品消耗掉的时间差异性,会漏掉一些商品的再次推荐。
从上面的描述中可以看出,结合用户购买时间特征的推荐方法,没有考虑消费者购买日常消耗商品的时间变化特征,而是根据两个购买记录发生的时间为相似度计算加权或者一个时间窗口内的权威用户购买的商品序列为消费者做商品推荐。这类方法在预测时只是简单的对时间因素作线性处理没有贴近消费者的真正需求,忽略了挖掘用户购买行为与时间有关的潜在变化规律。
而基于时间序列的推荐方法,只从消费者购买的商品的角度出发考虑了时间的对商品相似度的影响或者商品被购买的时间序列模式进行推荐,没有考虑一些商品的易耗性,忽略了一些急需品需要在恰当的时机向消费者推荐。
同时,通过分析消费者购物以及商品被购买的时间序列,发现不同消费者在购买商品时存在着一定的时间特征,特别是一些易耗品。这里,日常易耗品是指人们日常生活中经常需要用到的,在使用过程中逐渐消失的商品。这类商品既包括米、面、油等家庭必需品,也包括如口红、洗面奶等个人美容用品,还包括办公室里经常使用的打印纸、墨盒、硒鼓等,还有如手机话费等。通过对消费者的购物情况分析,发现消费者网上购买日常消耗商品时存在着周期性的购买规律,即消费者会根据自身使用这类商品的速度、以及商品的保质期等时间约束,总会隔一段时间就购买一次这类商品。
因此,如果能够结合这类商品的时间周期规律特点,适时地提醒用户及时购买这类商品,可以为用户的网络购物提供更便捷的服务。根据上述发现,本发明实施例结合时间因子,着重挖掘不同用户购买特定商品的时间规律性特点,将其结合到推荐模型中,提高个性化推荐服务的准确度与合理性。
基于此,在本发明的各种实施例中:从用户行为数据库中提取预设统计周期内的用户行为数据;利用所述用户行为数据,确定每个对象被用户选中的时间周期;利用所述时间周期,确定每个对象当前时刻进行输出的时间周期的权重;确定输出各对象时,根据每个对象的时间周期、以及对应的权重,确定各对象当前时刻的输出概率;并根据各对象的输出概率输出各对象的相关信息。
实施例一
本实施例信息处理方法,如图1所示,包括以下步骤:
步骤101:从用户行为数据库中提取预设统计周期内的用户行为数据;
这里,在执行本步骤之前,该方法还可以包括:
提取用户的行为属性特征;
相应地,根据所述行为属性特征,从用户行为数据库中提取预设统计周期内对应的用户行为数据。
其中,所述提取用户的行为属性特征,具体为:
在与所述用户交互过程中直接提取所述用户的行为属性特征;或者,
对所述用户的兴趣进行分析,根据分析结果提取所述用户的行为属性特征。
步骤102:利用所述用户行为数据,确定每个对象被用户选中的时间周期;
步骤103:利用所述时间周期,确定每个对象当前时刻进行输出的时间周期的权重;
这里,在确定所述权重时,要使根据所述时间周期、及所述权重确定的输出概率在0至1之间,且为余弦函数;所述余弦函数的周期为所述时间周期。
实际应用时,还可以结合根据除时间周期之外的其它因素所确定的输出因素,来确定所述时间周期。
其中,所述输出因素根据除时间周期之外的其它因素确定,可以结合当地的消费水平、所述用户的喜好因素等来确定,确定所述输出因素的具体实现不是本实施例的核心。
实际应用时,可以根据公式(1)确定所述权重:
其中,rij表示已知的对象j历史输出因素;rij表示已确定的对象j的输出因素;tpre表示预测的对象j被用户i选中时间;tlast表示对象j最后一次被用户i选中的时间;Tij表示对象j被用户i选中的时间周期;α表示权重;argmax表示寻找具有最大输出概率的参量
步骤104:确定输出各对象时,根据每个对象的时间周期、以及对应的权重,确定各对象当前时刻的输出概率;并根据各对象的输出概率输出各对象的相关信息。
这里,用户可以相关信息来决定是否选择对应的对象;实际应用时,所述相关信息的内容可以根据需要来确定。
所述确定输出各对象,具体为:
根据各对象被用户选中的时间周期,确定输出各对象。
具体地,可以根据公式(2)确定输出各对象:
其中,β可以根据经验进行设置,比如0.1等。
可以采用公式(3)确定各对象当前时刻的输出概率:
其中,ui表示需要估计的用户i潜在特征向量,υj表示需要估计的对象j潜在特征向量,tpre表示预测的对象j被用户i选中时间;tlast表示对象j最后一次被用户i选中的时间;Tij表示对象j被用户i选中的时间周期;α表示权重;ui T表示ui的转置矩阵。
所述根据各对象的输出概率输出各对象,具体可以为:
将各对象的输出概率从高到低进行排序;
根据排序结果,向用户输出前k个对象的相关信息;k为大于零的整数。
这里,k可以根据需要设置。
本实施例提供的信息处理方法,从用户行为数据库中提取预设统计周期内的用户行为数据;利用所述用户行为数据,确定每个对象被用户选中的时间周期;利用所述时间周期,确定每个对象当前时刻进行输出的时间周期的权重;确定输出各对象时,根据每个对象的时间周期、以及对应的权重,确定各对象当前时刻的输出概率;并根据各对象的输出概率输出各对象的相关信息,如此,能保证输出对象的准确性,提升用户体验。
实施例二
为实现实施例一的方法,本实施提供了一种信息处理装置,如图2所示,该装置包括:数据提取模块21、数据处理模块22、触发服务提醒模块23、对象输出处理模块24以及输出模块25;其中,
所述数据提取模块21,用于从用户行为数据库中提取预设统计周期内的用户行为数据;
所述数据处理模块22,用于利用所述用户行为数据,确定每个对象被用户选中的时间周期;并利用所述时间周期,确定每个对象当前时刻进行输出的时间周期的权重;
所述触发服务提醒模块23,用于确定输出各对象时触发所述对象输出处理模块24;
所述对象输出处理模块24,用于收到所述触发服务提醒模块23的触发后,根据每个对象的时间周期、以及对应的权重,确定各对象当前时刻的输出概率;
所述输出模块25,用于根据各对象的输出概率输出各对象的相关信息。
其中,该装置还可以包括:属性特征分析模块,用于提取用户的行为属性特征;
相应地,所述数据提取模块21,用于根据所述行为属性特征,从用户行为数据库中提取预设统计周期内对应的用户行为数据。
这里,所述属性特征分析模块,具体用于:在与所述用户交互过程中直接提取所述用户的行为属性特征;或者,
对所述用户的兴趣进行分析,根据分析结果提取所述用户的行为属性特征。
实际应用时,所述数据处理模块22确定所述权重时,要使根据所述时间周期、及所述权重确定的输出概率在0至1之间,且为余弦函数;所述余弦函数的周期为所述时间周期。
实际应用时,还可以结合根据除时间周期之外的其它因素所确定的输出因素,来确定所述时间周期。
其中,所述输出因素根据除时间周期之外的其它因素确定,可以结合当地的消费水平、所述用户的喜好因素等来确定,确定所述输出因素的具体实现不是本实施例的核心。
实际应用时,可以根据公式(1)确定所述权重:
其中,rij表示已知的对象j历史输出因素;rij表示已确定的对象j的输出因素;tpre表示预测的对象j的被用户i选中时间;tlast表示对象j最后一次被用户i选中的时间;Tij表示对象j被用户i选中的时间周期;α表示权重;argmax表示寻找具有最大输出概率的参量
所述触发服务提醒模块23,具体用于:根据各对象被用户选中的时间周期,确定输出各对象。
具体地,所述触发服务提醒模块23可以根据公式(2)确定输出各对象:
其中,β可以根据经验进行设置,比如0.1等。
所述对象输出处理模块24可以采用公式(3)确定各对象当前时刻的输出概率:
其中,ui表示需要估计的用户i潜在特征向量,υj是需要估计的对象i潜在特征向量,tpre表示预测的对象j被用户i选中时间;tlast表示对象j最后一次被用户i选中的时间;Tij表示对象j被用户i选中的时间周期;α表示权重;ui T表示ui的转置矩阵。
用户可以相关信息来决定是否选择对应的对象;实际应用时,所述相关信息的内容可以根据需要来确定。
所述输出模块25,具体用于:将各对象的输出概率从高到低进行排序;
根据排序结果,向用户输出前k个对象的相关信息;k为大于零的整数。
这里,k可以根据需要设置。
实际应用时,所述:数据提取模块21、数据处理模块22、触发服务提醒模块23、以及对象输出处理模块24可由信息处理装置中的中央处理器(CPU,CentralProcessingUnit)、微处理器(MCU,MicroControlUnit)、数字信号处理器(DSP,DigitalSignalProcessor)或可编程逻辑阵列(FPGA,Field-ProgrammableGateArray)实现;所述输出模块25可由信息处理装置中的收发机实现;所述属性特征分析模块可由信息处理装置中的CPU、MCU、DSP或FPGA结合收发机实现。
本实施例提供的信息处理装置,所述数据提取模块21从用户行为数据库中提取预设统计周期内的用户行为数据;所述数据处理模块22利用所述用户行为数据,确定每个对象被用户选中的时间周期;利用所述时间周期,确定每个对象当前时刻进行输出的时间周期的权重;所述触发服务提醒模块23确定输出各对象时,触发所述对象输出处理模块24根据每个对象的时间周期、以及对应的权重,确定各对象当前时刻的输出概率;所述输出模块25根据各对象的输出概率输出各对象的相关信息,如此,能保证输出对象的准确性,提升用户体验。
实施例三
本实施例在实施例一、二的基础上,以商品为例,描述如何向用户输出商品推荐信息。
本实施例的系统架构,如图3所示,主要由五个模块来组成:数据提取模块、数据处理模块、触发服务提醒模块、商品推荐模块和图形用户界面模块;各模块由一些组件来构成。下面分别讨论每个模块的具体功能。
1)数据提取模块(相当于实施例二中的数据提取模块)
数据提取模块主要是从用户行为数据库中提取预设统计周期内的用户行为数据,即提取用户购买商品的历史交易记录。每条历史交易记录包括:用户信息、商品信息和购买时间。实际应用时,系统将会以一定的格式来分析和组织这些数据,比如可扩展标记语言(XML,ExtensibleMarkupLanguage)格式等。
2)数据处理模块(相当于实施例二中的数据处理模块)
数据处理模块可以由两个子模块来构成:时间周期分析子模块和时间权重计算子模块。其中,
1.时间周期分析子模块
该子模块主要针对购买记录的信息做时间周期的分析,主要任务是抽取用户对每种商品的购买周期长度。
具体地,将用户在一段时间内购买的某种商品的交易记录进行统计,需要统计的是:
用户i第一次购买该种商品j的时间t1(以天为单位);
用户i最后一次购买该种商品j的时间t2;
用户i在这段时间内购买该种商品j的次数n。
由此,可以获得用户i购买商品j的周期为
实际应用时,系统会把每个用户对不同商品的购买周期记录起来,用于计算商品推荐权重。
2.时间权重计算子模块
该子模块的主要任务是将计算出的商品购买的时间周期以加权的形式反应到推荐模型中,即该子模块的主要任务是确定商品当前购买时刻的时间周期的权重。
具体地,本实施例中,采用余弦函数来刻画时间周期对用户购买商品的概率,即确定。假定现有的其它因素预测的用户i对商品j的评分为rij,则经过时间周期加权后,时间权重计算子模块最终预测的用户i对商品j的评分为:
本实施例中,tpre表示预测的用户i购买商品j的时间;tlast表示用户i最近一次购买商品j的时间,Tij表示计算出的商品j购买的时间周期;α表示时间周期加权的权重;而后面的加1和前面系数的是为了将这个购买概率限定在0到1之间。这里,所述其它因素可以是用户的喜好、当地的消费水平等等。
α的值越大,表示时间周期对推荐结果的影响越大,它的值越小,表示时间周期对推荐结果的影响越小。该权重的取值可采用回归模型学习取得,则系统需要不断地使用训练数据优化公式(1):
本实施例中,rij表示已知的用户i对商品j历史喜好程度的评分。
根据公式(5)可以得到如图4曲线所示的购买商品的时间周期规律;其中,。在图4中,横轴表示时间,纵轴表示商品被购买的概率,概率值随时间的推移呈现周期性变化,余弦函数的周期是Tij。进行推荐的时刻与最近一次购买时间的时间差距离图4中波峰位置越近说明该类商品被推荐给用户的可能性越大,那么该商品的预测评分越高;反之距离波峰位置越远,该类商品被推荐给用户的可能性越小,从时间周期上来讲可能是用户刚刚买过该类商品不久,暂时不需要该类商品了,该商品的预测评分应该越低。
采用时间周期的加权这种设计方式,一方面能很好地满足整合时间周期规律的基本思想,提升了在距离波峰较近时间段推荐时的评分,降低了距离波峰较远的时间段推荐时的评分;很好的区分了用户购买商品的时间需求。另一方面,这种设计也有很好地稳定性。能很好解决用户个别数据缺失问题。如果某个用户在购买该商品时偶尔一两次没有购买,系统不会因为缺少了这一两次的购物记录而对将来对该用户评分的准确性造成影响。
3)触发服务提醒模块(相当于实施例二中的触发服务提醒模块)
根据上述时间周期的分析,若触发服务提醒模块会触发基于时间周期的推荐提醒业务。其中,β是基于不同商品的经验值,比如0.1。如小于β则认为用户刚购买此商品不久,不需要该商品的推荐服务。
4)商品推荐模块(相当于实施例二中的对象输出处理模块)
这个模块的主要任务是建立推荐引擎、及对商品的评分预测和最后的推荐。
在推荐引擎建立阶段,即模型建立阶段,可以采用基于分解的推荐方法,在模型训练阶段,不断地最小化消费者的潜在特征向量和项目的潜在特征向量的点积与真实用户对项目评分的差的平方和。最小化的目标函数为:
其中,ui是需要估计的消费者潜在特征向量,υj是需要估计的商品潜在特征向量,rij是依据用户对商品历史喜好程度给出的分数。
评分预测的任务是根据建立的模型预测用户对商品的评分,预测阶段需要整合时间周期的加权。在基于分解的推荐方法中,可以采用公式(3)对要预测的目标商品评分进行预测:
本实施例中,ui,υj是系统在建立推荐引擎即模型建立阶段训练学习出的消费者和商品的潜在特征向量。
评分预测好之后,针对特定的用户对所有预测了评分的商品进行排序,得到商品的推荐列表。
5)图形用户界面模块(相当于实施例二中的输出模块)
这一模块的主要任务是将预测评分排在前面的k个商品推荐给用户。实际应用时,图形用户界面的设计要符合推荐系统的用户习惯,使用户容易理解且易于接受。
基于上面各模块的描述,本实施例向用户输出商品推荐信息的主要流程,如图5所示,可以包括以下步骤:
步骤501:用户登录购物网站触发服务需求;
步骤502:业务系统分析到用户行为触发了一个推荐需求,从而触发系统从用户行为数据库中提取预设统计周期内的用户购物历史数据;
这里,业务系统会运用自然语言处理方法提取用户的行为属性特征。其获取方式通常有两种:(1)系统以与用户进行交互直接获取,在与所述用户交互过程中直接提取用户的行为属性特征;2)系统对用户兴趣进行分析、挖掘来获取用户的行为属性特征。其中,所述用户的行为属性特征可以包含:爱好购买体育用品、爱好购买红色商品、通常在晚上购物、每次购物数量都在1件之上等。
并根据用户的行为属性特征,寻找出与属性相关的历史购买记录。
步骤503:用户购买行为时间分析;
具体地,先计算在某段时间内用户购买商品的时间周期。结合其它推荐因素的评分,进而分析出当前时间进行推荐的权重。
步骤504:权权重大于一定的阈值,系统会触发服务提醒流程;
步骤505:结合时间因素预测用户购买商品的评分;
步骤506:推荐合适的商品给用户。
这里,可以依据评分把商品列表中的k个商品依次推荐给用户。
如果没有触发服务提醒流程,k可以认为是0。
从上面的描述中可以看出,本实施例的方案是一种可以针对日常消耗商品的推荐问题设计出的基于挖掘用户使用习惯的推荐方法。该推荐方法考虑了用户使用不同商品的时间周期性特征,将时间信息以时间周期函数的形式加入到了因子分析模型中,这样,一方面可以通过周期性变化的预测减少通过时间序列分析进行不断更新给系统带来的过大负荷;另一方面,可以使得商品能够在恰当的时间范围内被推荐给用户,提升用户对商品的接受程度,让推荐更加准确。
另外,该方法可以适用于系统过滤推荐、基于内容推荐和混合方法推荐等推荐方法,且具有较好的稳定性。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。
Claims (11)
1.一种信息处理方法,其特征在于,所述方法包括:
从用户行为数据库中提取预设统计周期内的用户行为数据;
利用所述用户行为数据,确定每个对象被用户选中的时间周期;
利用所述时间周期,确定每个对象当前时刻进行输出的时间周期的权重;
确定输出各对象时,根据每个对象的时间周期、以及对应的权重,确定各对象当前时刻的输出概率;并根据各对象的输出概率输出各对象的相关信息。
2.根据权利要求1所述的方法,其特征在于,所述从用户行为数据库中提取预设统计周期内的用户行为数据之前,所述方法还包括:
提取用户的行为属性特征;
相应地,根据所述行为属性特征,从用户行为数据库中提取预设统计周期内对应的用户行为数据。
3.根据权利要求2所述的方法,其特征在于,所述提取用户的行为属性特征,为:
在与所述用户交互过程中直接提取所述用户的行为属性特征;或者,
对所述用户的兴趣进行分析,根据分析结果提取所述用户的行为属性特征。
4.根据权利要求1所述的方法,其特征在于,根据所述时间周期、及所述权重确定的输出概率在0至1之间,且为余弦函数;所述余弦函数的周期为所述时间周期。
5.根据权利要求4所述的方法,其特征在于,根据公式: 确定所述权重;
其中,rij表示已知的对象j历史输出因素;rij表示已确定的对象j的输出因素;tpre表示预测的对象j被用户i选中时间;tlast表示对象j最后一次被用户i选中的时间;Tij表示对象j被用户i选中的时间周期;α表示权重;argmax表示寻找具有最大输出概率的参量
6.根据权利要求5所述的方法,其特征在于,所述确定输出各对象,为:
根据各对象被用户选中的时间周期,确定输出各对象。
7.根据权利要求5所述的方法,其特征在于,根据公式: 确定各对象当前时刻的输出概率;
其中,ui表示需要估计的用户i潜在特征向量,uj表示需要估计的对象j潜在特征向量,ui T表示ui的转置矩阵。
8.根据权利要求1所述的方法,其特征在于,所述根据各对象的输出概率输出各对象,为:
将各对象的输出概率从高到低进行排序;
根据排序结果,向用户输出前k个对象的相关信息;k为大于零的整数。
9.一种信息处理装置,其特征在于,所述装置包括:数据提取模块、数据处理模块、触发服务提醒模块、对象输出处理模块以及输出模块;其中,
所述数据提取模块,用于从用户行为数据库中提取预设统计周期内的用户行为数据;
所述数据处理模块,用于利用所述用户行为数据,确定每个对象被用户选中的时间周期;并利用所述时间周期,确定每个对象当前时刻进行输出的时间周期的权重;
所述触发服务提醒模块,用于确定输出各对象时触发所述对象输出处理模块;
所述对象输出处理模块,用于收到所述触发服务提醒模块的触发后,根据每个对象的时间周期、以及对应的权重,确定各对象当前时刻的输出概率;
所述输出模块,用于根据各对象的输出概率输出各对象的相关信息。
10.根据权利要求9所述的装置,其特征在于,所述装置还包括:属性特征分析模块,用于提取用户的行为属性特征;
相应地,所述数据提取模块,用于根据所述行为属性特征,从用户行为数据库中提取预设统计周期内对应的用户行为数据。
11.根据权利要求9所述的装置,其特征在于,确定所述权重时,根据所述时间周期、及所述权重确定的输出概率在0至1之间,且为余弦函数;所述余弦函数的周期为所述时间周期。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410854140.5A CN105809465A (zh) | 2014-12-31 | 2014-12-31 | 一种信息处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410854140.5A CN105809465A (zh) | 2014-12-31 | 2014-12-31 | 一种信息处理方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105809465A true CN105809465A (zh) | 2016-07-27 |
Family
ID=56464876
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410854140.5A Pending CN105809465A (zh) | 2014-12-31 | 2014-12-31 | 一种信息处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105809465A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106339926A (zh) * | 2016-08-30 | 2017-01-18 | 五八同城信息技术有限公司 | 对象处理方法及装置 |
CN109002450A (zh) * | 2017-06-07 | 2018-12-14 | 北京京东尚科信息技术有限公司 | 信息处理方法、系统及电子设备 |
CN109284951A (zh) * | 2017-07-21 | 2019-01-29 | 阿里巴巴集团控股有限公司 | 地址信息处理方法及装置 |
CN110793168A (zh) * | 2018-08-01 | 2020-02-14 | 珠海格力电器股份有限公司 | 除湿机的配置参数确定方法及装置 |
CN112766995A (zh) * | 2019-10-21 | 2021-05-07 | 招商证券股份有限公司 | 物品推荐方法、装置、终端设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101814068A (zh) * | 2009-02-24 | 2010-08-25 | 日电(中国)有限公司 | 时序控制的基于评分预测的项目推荐方法和系统 |
CN102346894A (zh) * | 2010-08-03 | 2012-02-08 | 阿里巴巴集团控股有限公司 | 推荐信息的输出方法、系统及服务器 |
CN103116581A (zh) * | 2011-11-16 | 2013-05-22 | 阿里巴巴集团控股有限公司 | 一种电子信息的推荐方法以及装置 |
CN103325052A (zh) * | 2013-07-03 | 2013-09-25 | 姚明东 | 一种基于多维度用户消费倾向建模的商品推荐方法 |
-
2014
- 2014-12-31 CN CN201410854140.5A patent/CN105809465A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101814068A (zh) * | 2009-02-24 | 2010-08-25 | 日电(中国)有限公司 | 时序控制的基于评分预测的项目推荐方法和系统 |
CN102346894A (zh) * | 2010-08-03 | 2012-02-08 | 阿里巴巴集团控股有限公司 | 推荐信息的输出方法、系统及服务器 |
CN103116581A (zh) * | 2011-11-16 | 2013-05-22 | 阿里巴巴集团控股有限公司 | 一种电子信息的推荐方法以及装置 |
CN103325052A (zh) * | 2013-07-03 | 2013-09-25 | 姚明东 | 一种基于多维度用户消费倾向建模的商品推荐方法 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106339926A (zh) * | 2016-08-30 | 2017-01-18 | 五八同城信息技术有限公司 | 对象处理方法及装置 |
CN109002450A (zh) * | 2017-06-07 | 2018-12-14 | 北京京东尚科信息技术有限公司 | 信息处理方法、系统及电子设备 |
CN109284951A (zh) * | 2017-07-21 | 2019-01-29 | 阿里巴巴集团控股有限公司 | 地址信息处理方法及装置 |
CN110793168A (zh) * | 2018-08-01 | 2020-02-14 | 珠海格力电器股份有限公司 | 除湿机的配置参数确定方法及装置 |
CN112766995A (zh) * | 2019-10-21 | 2021-05-07 | 招商证券股份有限公司 | 物品推荐方法、装置、终端设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108629665B (zh) | 一种个性化商品推荐方法和系统 | |
CN110910199B (zh) | 项目信息的排序方法、装置、计算机设备及存储介质 | |
US10657575B2 (en) | Providing recommendations based on user-generated post-purchase content and navigation patterns | |
CN109189904A (zh) | 个性化搜索方法及系统 | |
US20190295124A1 (en) | Dynamic predictive similarity grouping based on vectorization of merchant data | |
CN112365283B (zh) | 一种优惠券发放方法、装置、终端设备及存储介质 | |
CN104462333A (zh) | 购物搜索推荐与告警方法和系统 | |
CN111400613A (zh) | 物品推荐方法、装置、介质及计算机设备 | |
WO2018237051A1 (en) | AUTOMATIC LEARNING FOR THE MARKETING OF BRANDED CONSUMPTION PRODUCTS | |
CN107077687A (zh) | 获得与消费者有关的数据、处理所述数据并提供以电子方式生成的消费者报价的输出 | |
CN112528153B (zh) | 内容推荐方法、装置、设备、存储介质以及程序产品 | |
CN109636430A (zh) | 对象识别方法及其系统 | |
CN105809465A (zh) | 一种信息处理方法及装置 | |
US20190370716A1 (en) | Intelligent diversification tool | |
CN114219169A (zh) | 颖幡供应链销售和库存预测算法模型和应用系统 | |
US20200098031A1 (en) | Product recommending apparatus and non-transitory computer readable medium | |
CN113327151B (zh) | 商品对象推荐方法、装置、计算机设备及存储介质 | |
US20230093756A1 (en) | Systems and methods for generating recommendations | |
CN113946754A (zh) | 基于用户画像的权益推荐方法、装置、设备及存储介质 | |
KR101639656B1 (ko) | 광고 제공 방법 및 서버 장치 | |
Agarwal et al. | Machine Learning and Natural Language Processing in Supply Chain Management: A Comprehensive Review and Future Research Directions. | |
CN111666413A (zh) | 基于评论者可信赖度回归预测的商品评论推荐方法 | |
Wahsheh et al. | E-Commerce Product Retrieval Using Knowledge from GPT-4 | |
CN118251677A (zh) | 用于对顺序机器学习模型去噪的系统、方法和计算机程序产品 | |
CN115456656A (zh) | 消费者购买意向预测方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20160727 |
|
RJ01 | Rejection of invention patent application after publication |