CN105809465A - 一种信息处理方法及装置 - Google Patents

一种信息处理方法及装置 Download PDF

Info

Publication number
CN105809465A
CN105809465A CN201410854140.5A CN201410854140A CN105809465A CN 105809465 A CN105809465 A CN 105809465A CN 201410854140 A CN201410854140 A CN 201410854140A CN 105809465 A CN105809465 A CN 105809465A
Authority
CN
China
Prior art keywords
user
output
time
time cycle
commodity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410854140.5A
Other languages
English (en)
Inventor
魏芳
黄毅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN201410854140.5A priority Critical patent/CN105809465A/zh
Publication of CN105809465A publication Critical patent/CN105809465A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种信息处理方法,包括:从用户行为数据库中提取预设统计周期内的用户行为数据;利用所述用户行为数据,确定每个对象被用户选中的时间周期;利用所述时间周期,确定每个对象当前时刻进行输出的时间周期的权重;确定输出各对象时,根据每个对象的时间周期、以及对应的权重,确定各对象当前时刻的输出概率;并根据各对象的输出概率输出各对象的相关信息。本发明同时还公开了一种信息处理装置。

Description

一种信息处理方法及装置
技术领域
本发明涉及通信中的业务支撑领域,尤其涉及一种信息处理方法及装置。
背景技术
近年来,随着电子商务的快速发展与不断普及,网络购物俨然成为了主流的消费方式。由于电子商务网站具有商品数量大、品种齐全、商品价格及质量优于线下模式、操作快捷方便等诸多特点而被广大的消费者所接受和使用。巨大的销售额度及经济利润使得电商企业采用多种多样的手段吸引更多的消费者,越来越多的企业试图利用数据挖掘技术,为消费者提供更能满足其潜在兴趣的商品,进而不断提升网站的服务质量。而推荐算法为上述需求提供了系统的解决方案。
目前,考虑时间的推荐方法主要包括:结合用户购买时间特征和结合购买商品序列(序列按照时间顺序进行排列)两种进行的推荐。其中,结合用户购买时间特征的推荐方法是在进行推荐的相似度计算时加入时间特征因素,使得购买时间在找寻相似商品时发挥影响。这种方法倾向于增加距离预测时刻较近的历史购买行为的影响,降低距离预测时刻时间久远的购买行为的影响。但这种方法没有考虑到商品购买的时间周期特性,可能在消费者已经买过某个商品后还给他推荐该商品,而那时消费者已经不需要那个商品了。
而基于时间序列的推荐方法,其主要思想是人们购买的商品遵循购买一定的时间顺序。依据权威消费者(购买一定商品数量的用户)的历史购买商品顺序为用户做推荐。在实际使用中,先将商品聚类以减少商品序列长度,然后结合商品被评价的时间找到所有用户在这些大类上的购买序列。由于每个人对商品的使用情况是存在很大差异的,比如购买的商品有的是一个人消费掉,有的是一家人。这种方法忽略了商品消耗掉的时间差异性,会漏掉一些商品的再次推荐。
发明内容
为解决现有存在的技术问题,本发明实施例提供一种信息处理方法及装置。
本发明实施例提供了一种信息处理方法,包括:
从用户行为数据库中提取预设统计周期内的用户行为数据;
利用所述用户行为数据,确定每个对象被用户选中的时间周期;
利用所述时间周期,确定每个对象当前时刻进行输出的时间周期的权重;
确定输出各对象时,根据每个对象的时间周期、以及对应的权重,确定各对象当前时刻的输出概率;并根据各对象的输出概率输出各对象的相关信息。
上述方案中,所述从用户行为数据库中提取预设统计周期内的用户行为数据之前,所述方法还包括:
提取用户的行为属性特征;
相应地,根据所述行为属性特征,从用户行为数据库中提取预设统计周期内对应的用户行为数据。
上述方案中,所述提取用户的行为属性特征,为:
在与所述用户交互过程中直接提取所述用户的行为属性特征;或者,
对所述用户的兴趣进行分析,根据分析结果提取所述用户的行为属性特征。
上述方案中,根据所述时间周期、及所述权重确定的输出概率在0至1之间,且为余弦函数;所述余弦函数的周期为所述时间周期。
上述方案中,根据公式: α ^ = arg max α ( r ij - { r ij ^ + α 2 { cos [ π 2 T ij ( t pre - t last ) ] + 1 } } ) 2 确定所述权重;
其中,rij表示已知的对象j历史输出因素;rij表示已确定的对象j的输出因素;tpre表示预测的对象j被用户i选中时间;tlast表示对象j最后一次被用户i选中的时间;Tij表示对象j被用户i选中的时间周期;α表示权重;argmax表示寻找具有最大输出概率的参量
上述方案中,所述确定输出各对象,为:
根据各对象被用户选中的时间周期,确定输出各对象。
上述方案中,根据公式: γ ^ ij = u i T v j + α 2 { cos [ π 2 T ij · ( t pre - t last ) ] + 1 } ; 确定各对象当前时刻的输出概率;
其中,ui表示需要估计的用户i潜在特征向量,υj表示需要估计的对象j潜在特征向量,ui T表示ui的转置矩阵。
上述方案中,所述根据各对象的输出概率输出各对象,为:
将各对象的输出概率从高到低进行排序;
根据排序结果,向用户输出前k个对象的相关信息;k为大于零的整数。
本发明实施例还提供了一种信息处理装置,包括:数据提取模块、数据处理模块、触发服务提醒模块、对象输出处理模块以及输出模块;其中,
所述数据提取模块,用于从用户行为数据库中提取预设统计周期内的用户行为数据;
所述数据处理模块,用于利用所述用户行为数据,确定每个对象被用户选中的时间周期;并利用所述时间周期,确定每个对象当前时刻进行输出的时间周期的权重;
所述触发服务提醒模块,用于确定输出各对象时触发所述对象输出处理模块;
所述对象输出处理模块,用于收到所述触发服务提醒模块的触发后,根据每个对象的时间周期、以及对应的权重,确定各对象当前时刻的输出概率;
所述输出模块,用于根据各对象的输出概率输出各对象的相关信息。
上述方案中,所述装置还包括:属性特征分析模块,用于提取用户的行为属性特征;
相应地,所述数据提取模块,用于根据所述行为属性特征,从用户行为数据库中提取预设统计周期内对应的用户行为数据。
上述方案中,确定所述权重时,根据所述时间周期、及所述权重确定的输出概率在0至1之间,且为余弦函数;所述余弦函数的周期为所述时间周期。
本发明实施例提供的信息处理方法及装置,从用户行为数据库中提取预设统计周期内的用户行为数据;利用所述用户行为数据,确定每个对象被用户选中的时间周期;利用所述时间周期,确定每个对象当前时刻进行输出的时间周期的权重;确定输出各对象时,根据每个对象的时间周期、以及对应的权重,确定各对象当前时刻的输出概率;并根据各对象的输出概率输出各对象的相关信息,如此,能保证输出对象的准确性。
附图说明
在附图(其不一定是按比例绘制的)中,相似的附图标记可在不同的视图中描述相似的部件。具有不同字母后缀的相似附图标记可表示相似部件的不同示例。附图以示例而非限制的方式大体示出了本文中所讨论的各个实施例。
图1为本发明实施例一信息处理方法流程示意图;
图2为本发明实施例二信息处理装置结构示意图;
图3为本发明实施例三推荐系统架构示意图;
图4为本发明实施例三中购买商品随时间周期的变化曲线示意图;
图5为本发明实施例三中向用户输出商品推荐信息的主要流程示意图。
具体实施方式
下面结合附图及实施例对本发明再作进一步详细地描述。
在描述本发明实施例之前,先详细了解一下现有的推荐算法。
目前,推荐系统中所使用的推荐算法主要分为基于协同过滤推荐、基于内容推荐和混合方法推荐。其中,基于协同过滤推荐是指:通过分析用户历史的消费记录或利用其他相似用户的消费记录为用户推荐合适的商品。基于内容的推荐是利用商品自身所携带的文本内容,如:商品的名称、价格、介绍等信息为用户进行推荐。混合方法推荐是上述两种推荐方法的混合,此外还加入其它的有关处理步骤,包括各种启发式的处理方法等。
考虑时间的推荐方法主要包括:结合用户购买时间特征和基于时间序列两种推荐方法。其中,结合用户购买时间特征的推荐方法是在进行推荐的相似度计算时加入时间特征因素,使得购买时间在找寻相似商品时发挥影响。这种方法倾向于增加距离预测时刻较近的历史购买行为的影响,降低距离预测时刻时间久远的购买行为的影响。但这种方法没有考虑到商品购买的时间周期特性,可能在消费者已经买过某个商品后还给他推荐该商品,而那时消费者已经不需要那个商品了。
而基于时间序列的推荐方法,其主要思想是人们购买的商品遵循购买一定的时间顺序。依据权威消费者(购买一定商品数量的用户)的历史购买商品顺序为用户做推荐。在实际使用中,先将商品聚类以减少商品序列长度,然后结合商品被评价的时间找到所有用户在这些大类上的购买序列。由于每个人对商品的使用情况是存在很大差异的,比如购买的商品有的是一个人消费掉,有的是一家人。这种方法忽略了商品消耗掉的时间差异性,会漏掉一些商品的再次推荐。
从上面的描述中可以看出,结合用户购买时间特征的推荐方法,没有考虑消费者购买日常消耗商品的时间变化特征,而是根据两个购买记录发生的时间为相似度计算加权或者一个时间窗口内的权威用户购买的商品序列为消费者做商品推荐。这类方法在预测时只是简单的对时间因素作线性处理没有贴近消费者的真正需求,忽略了挖掘用户购买行为与时间有关的潜在变化规律。
而基于时间序列的推荐方法,只从消费者购买的商品的角度出发考虑了时间的对商品相似度的影响或者商品被购买的时间序列模式进行推荐,没有考虑一些商品的易耗性,忽略了一些急需品需要在恰当的时机向消费者推荐。
同时,通过分析消费者购物以及商品被购买的时间序列,发现不同消费者在购买商品时存在着一定的时间特征,特别是一些易耗品。这里,日常易耗品是指人们日常生活中经常需要用到的,在使用过程中逐渐消失的商品。这类商品既包括米、面、油等家庭必需品,也包括如口红、洗面奶等个人美容用品,还包括办公室里经常使用的打印纸、墨盒、硒鼓等,还有如手机话费等。通过对消费者的购物情况分析,发现消费者网上购买日常消耗商品时存在着周期性的购买规律,即消费者会根据自身使用这类商品的速度、以及商品的保质期等时间约束,总会隔一段时间就购买一次这类商品。
因此,如果能够结合这类商品的时间周期规律特点,适时地提醒用户及时购买这类商品,可以为用户的网络购物提供更便捷的服务。根据上述发现,本发明实施例结合时间因子,着重挖掘不同用户购买特定商品的时间规律性特点,将其结合到推荐模型中,提高个性化推荐服务的准确度与合理性。
基于此,在本发明的各种实施例中:从用户行为数据库中提取预设统计周期内的用户行为数据;利用所述用户行为数据,确定每个对象被用户选中的时间周期;利用所述时间周期,确定每个对象当前时刻进行输出的时间周期的权重;确定输出各对象时,根据每个对象的时间周期、以及对应的权重,确定各对象当前时刻的输出概率;并根据各对象的输出概率输出各对象的相关信息。
实施例一
本实施例信息处理方法,如图1所示,包括以下步骤:
步骤101:从用户行为数据库中提取预设统计周期内的用户行为数据;
这里,在执行本步骤之前,该方法还可以包括:
提取用户的行为属性特征;
相应地,根据所述行为属性特征,从用户行为数据库中提取预设统计周期内对应的用户行为数据。
其中,所述提取用户的行为属性特征,具体为:
在与所述用户交互过程中直接提取所述用户的行为属性特征;或者,
对所述用户的兴趣进行分析,根据分析结果提取所述用户的行为属性特征。
步骤102:利用所述用户行为数据,确定每个对象被用户选中的时间周期;
步骤103:利用所述时间周期,确定每个对象当前时刻进行输出的时间周期的权重;
这里,在确定所述权重时,要使根据所述时间周期、及所述权重确定的输出概率在0至1之间,且为余弦函数;所述余弦函数的周期为所述时间周期。
实际应用时,还可以结合根据除时间周期之外的其它因素所确定的输出因素,来确定所述时间周期。
其中,所述输出因素根据除时间周期之外的其它因素确定,可以结合当地的消费水平、所述用户的喜好因素等来确定,确定所述输出因素的具体实现不是本实施例的核心。
实际应用时,可以根据公式(1)确定所述权重:
α ^ = arg max α ( r ij - { r ij ^ + α 2 { cos [ π 2 T ij ( t pre - t last ) ] + 1 } } ) 2 - - - ( 1 )
其中,rij表示已知的对象j历史输出因素;rij表示已确定的对象j的输出因素;tpre表示预测的对象j被用户i选中时间;tlast表示对象j最后一次被用户i选中的时间;Tij表示对象j被用户i选中的时间周期;α表示权重;argmax表示寻找具有最大输出概率的参量
步骤104:确定输出各对象时,根据每个对象的时间周期、以及对应的权重,确定各对象当前时刻的输出概率;并根据各对象的输出概率输出各对象的相关信息。
这里,用户可以相关信息来决定是否选择对应的对象;实际应用时,所述相关信息的内容可以根据需要来确定。
所述确定输出各对象,具体为:
根据各对象被用户选中的时间周期,确定输出各对象。
具体地,可以根据公式(2)确定输出各对象:
cos [ π 2 T ij · ( T pre - T last ) ] ≥ β - - - ( 2 )
其中,β可以根据经验进行设置,比如0.1等。
可以采用公式(3)确定各对象当前时刻的输出概率:
γ ^ ij = u i T v j + α 2 { cos [ π 2 T ij · ( t pre - t last ) ] + 1 } - - - ( 3 )
其中,ui表示需要估计的用户i潜在特征向量,υj表示需要估计的对象j潜在特征向量,tpre表示预测的对象j被用户i选中时间;tlast表示对象j最后一次被用户i选中的时间;Tij表示对象j被用户i选中的时间周期;α表示权重;ui T表示ui的转置矩阵。
所述根据各对象的输出概率输出各对象,具体可以为:
将各对象的输出概率从高到低进行排序;
根据排序结果,向用户输出前k个对象的相关信息;k为大于零的整数。
这里,k可以根据需要设置。
本实施例提供的信息处理方法,从用户行为数据库中提取预设统计周期内的用户行为数据;利用所述用户行为数据,确定每个对象被用户选中的时间周期;利用所述时间周期,确定每个对象当前时刻进行输出的时间周期的权重;确定输出各对象时,根据每个对象的时间周期、以及对应的权重,确定各对象当前时刻的输出概率;并根据各对象的输出概率输出各对象的相关信息,如此,能保证输出对象的准确性,提升用户体验。
实施例二
为实现实施例一的方法,本实施提供了一种信息处理装置,如图2所示,该装置包括:数据提取模块21、数据处理模块22、触发服务提醒模块23、对象输出处理模块24以及输出模块25;其中,
所述数据提取模块21,用于从用户行为数据库中提取预设统计周期内的用户行为数据;
所述数据处理模块22,用于利用所述用户行为数据,确定每个对象被用户选中的时间周期;并利用所述时间周期,确定每个对象当前时刻进行输出的时间周期的权重;
所述触发服务提醒模块23,用于确定输出各对象时触发所述对象输出处理模块24;
所述对象输出处理模块24,用于收到所述触发服务提醒模块23的触发后,根据每个对象的时间周期、以及对应的权重,确定各对象当前时刻的输出概率;
所述输出模块25,用于根据各对象的输出概率输出各对象的相关信息。
其中,该装置还可以包括:属性特征分析模块,用于提取用户的行为属性特征;
相应地,所述数据提取模块21,用于根据所述行为属性特征,从用户行为数据库中提取预设统计周期内对应的用户行为数据。
这里,所述属性特征分析模块,具体用于:在与所述用户交互过程中直接提取所述用户的行为属性特征;或者,
对所述用户的兴趣进行分析,根据分析结果提取所述用户的行为属性特征。
实际应用时,所述数据处理模块22确定所述权重时,要使根据所述时间周期、及所述权重确定的输出概率在0至1之间,且为余弦函数;所述余弦函数的周期为所述时间周期。
实际应用时,还可以结合根据除时间周期之外的其它因素所确定的输出因素,来确定所述时间周期。
其中,所述输出因素根据除时间周期之外的其它因素确定,可以结合当地的消费水平、所述用户的喜好因素等来确定,确定所述输出因素的具体实现不是本实施例的核心。
实际应用时,可以根据公式(1)确定所述权重:
α ^ = arg max α ( r ij - { r ij ^ + α 2 { cos [ π 2 T ij ( t pre - t last ) ] + 1 } } ) 2 - - - ( 1 )
其中,rij表示已知的对象j历史输出因素;rij表示已确定的对象j的输出因素;tpre表示预测的对象j的被用户i选中时间;tlast表示对象j最后一次被用户i选中的时间;Tij表示对象j被用户i选中的时间周期;α表示权重;argmax表示寻找具有最大输出概率的参量
所述触发服务提醒模块23,具体用于:根据各对象被用户选中的时间周期,确定输出各对象。
具体地,所述触发服务提醒模块23可以根据公式(2)确定输出各对象:
cos [ π 2 T ij · ( T pre - T last ) ] ≥ β - - - ( 2 )
其中,β可以根据经验进行设置,比如0.1等。
所述对象输出处理模块24可以采用公式(3)确定各对象当前时刻的输出概率:
γ ^ ij = u i T v j + α 2 { cos [ π 2 T ij · ( t pre - t last ) ] + 1 } - - - ( 3 )
其中,ui表示需要估计的用户i潜在特征向量,υj是需要估计的对象i潜在特征向量,tpre表示预测的对象j被用户i选中时间;tlast表示对象j最后一次被用户i选中的时间;Tij表示对象j被用户i选中的时间周期;α表示权重;ui T表示ui的转置矩阵。
用户可以相关信息来决定是否选择对应的对象;实际应用时,所述相关信息的内容可以根据需要来确定。
所述输出模块25,具体用于:将各对象的输出概率从高到低进行排序;
根据排序结果,向用户输出前k个对象的相关信息;k为大于零的整数。
这里,k可以根据需要设置。
实际应用时,所述:数据提取模块21、数据处理模块22、触发服务提醒模块23、以及对象输出处理模块24可由信息处理装置中的中央处理器(CPU,CentralProcessingUnit)、微处理器(MCU,MicroControlUnit)、数字信号处理器(DSP,DigitalSignalProcessor)或可编程逻辑阵列(FPGA,Field-ProgrammableGateArray)实现;所述输出模块25可由信息处理装置中的收发机实现;所述属性特征分析模块可由信息处理装置中的CPU、MCU、DSP或FPGA结合收发机实现。
本实施例提供的信息处理装置,所述数据提取模块21从用户行为数据库中提取预设统计周期内的用户行为数据;所述数据处理模块22利用所述用户行为数据,确定每个对象被用户选中的时间周期;利用所述时间周期,确定每个对象当前时刻进行输出的时间周期的权重;所述触发服务提醒模块23确定输出各对象时,触发所述对象输出处理模块24根据每个对象的时间周期、以及对应的权重,确定各对象当前时刻的输出概率;所述输出模块25根据各对象的输出概率输出各对象的相关信息,如此,能保证输出对象的准确性,提升用户体验。
实施例三
本实施例在实施例一、二的基础上,以商品为例,描述如何向用户输出商品推荐信息。
本实施例的系统架构,如图3所示,主要由五个模块来组成:数据提取模块、数据处理模块、触发服务提醒模块、商品推荐模块和图形用户界面模块;各模块由一些组件来构成。下面分别讨论每个模块的具体功能。
1)数据提取模块(相当于实施例二中的数据提取模块)
数据提取模块主要是从用户行为数据库中提取预设统计周期内的用户行为数据,即提取用户购买商品的历史交易记录。每条历史交易记录包括:用户信息、商品信息和购买时间。实际应用时,系统将会以一定的格式来分析和组织这些数据,比如可扩展标记语言(XML,ExtensibleMarkupLanguage)格式等。
2)数据处理模块(相当于实施例二中的数据处理模块)
数据处理模块可以由两个子模块来构成:时间周期分析子模块和时间权重计算子模块。其中,
1.时间周期分析子模块
该子模块主要针对购买记录的信息做时间周期的分析,主要任务是抽取用户对每种商品的购买周期长度。
具体地,将用户在一段时间内购买的某种商品的交易记录进行统计,需要统计的是:
用户i第一次购买该种商品j的时间t1(以天为单位);
用户i最后一次购买该种商品j的时间t2
用户i在这段时间内购买该种商品j的次数n。
由此,可以获得用户i购买商品j的周期为
T ij = t 2 - t 1 n - 1 - - - ( 4 )
实际应用时,系统会把每个用户对不同商品的购买周期记录起来,用于计算商品推荐权重。
2.时间权重计算子模块
该子模块的主要任务是将计算出的商品购买的时间周期以加权的形式反应到推荐模型中,即该子模块的主要任务是确定商品当前购买时刻的时间周期的权重。
具体地,本实施例中,采用余弦函数来刻画时间周期对用户购买商品的概率,即确定。假定现有的其它因素预测的用户i对商品j的评分为rij,则经过时间周期加权后,时间权重计算子模块最终预测的用户i对商品j的评分为:
r ij ^ + α 2 { cos [ π 2 T ij ( t pre - t last ) ] + 1 } - - - ( 5 )
本实施例中,tpre表示预测的用户i购买商品j的时间;tlast表示用户i最近一次购买商品j的时间,Tij表示计算出的商品j购买的时间周期;α表示时间周期加权的权重;而后面的加1和前面系数的是为了将这个购买概率限定在0到1之间。这里,所述其它因素可以是用户的喜好、当地的消费水平等等。
α的值越大,表示时间周期对推荐结果的影响越大,它的值越小,表示时间周期对推荐结果的影响越小。该权重的取值可采用回归模型学习取得,则系统需要不断地使用训练数据优化公式(1):
α ^ = arg max α ( r ij - { r ij ^ + α 2 { cos [ π 2 T ij ( t pre - t last ) ] + 1 } } ) 2 - - - ( 1 )
本实施例中,rij表示已知的用户i对商品j历史喜好程度的评分。
根据公式(5)可以得到如图4曲线所示的购买商品的时间周期规律;其中,。在图4中,横轴表示时间,纵轴表示商品被购买的概率,概率值随时间的推移呈现周期性变化,余弦函数的周期是Tij。进行推荐的时刻与最近一次购买时间的时间差距离图4中波峰位置越近说明该类商品被推荐给用户的可能性越大,那么该商品的预测评分越高;反之距离波峰位置越远,该类商品被推荐给用户的可能性越小,从时间周期上来讲可能是用户刚刚买过该类商品不久,暂时不需要该类商品了,该商品的预测评分应该越低。
采用时间周期的加权这种设计方式,一方面能很好地满足整合时间周期规律的基本思想,提升了在距离波峰较近时间段推荐时的评分,降低了距离波峰较远的时间段推荐时的评分;很好的区分了用户购买商品的时间需求。另一方面,这种设计也有很好地稳定性。能很好解决用户个别数据缺失问题。如果某个用户在购买该商品时偶尔一两次没有购买,系统不会因为缺少了这一两次的购物记录而对将来对该用户评分的准确性造成影响。
3)触发服务提醒模块(相当于实施例二中的触发服务提醒模块)
根据上述时间周期的分析,若触发服务提醒模块会触发基于时间周期的推荐提醒业务。其中,β是基于不同商品的经验值,比如0.1。如小于β则认为用户刚购买此商品不久,不需要该商品的推荐服务。
4)商品推荐模块(相当于实施例二中的对象输出处理模块)
这个模块的主要任务是建立推荐引擎、及对商品的评分预测和最后的推荐。
在推荐引擎建立阶段,即模型建立阶段,可以采用基于分解的推荐方法,在模型训练阶段,不断地最小化消费者的潜在特征向量和项目的潜在特征向量的点积与真实用户对项目评分的差的平方和。最小化的目标函数为:
E = Σ i Σ j ( r ij - u i T υ j ) 2 - - - ( 6 )
其中,ui是需要估计的消费者潜在特征向量,υj是需要估计的商品潜在特征向量,rij是依据用户对商品历史喜好程度给出的分数。
评分预测的任务是根据建立的模型预测用户对商品的评分,预测阶段需要整合时间周期的加权。在基于分解的推荐方法中,可以采用公式(3)对要预测的目标商品评分进行预测:
γ ^ ij = u i T v j + α 2 { cos [ π 2 T ij · ( t pre - t last ) ] + 1 } - - - ( 3 )
本实施例中,ui,υj是系统在建立推荐引擎即模型建立阶段训练学习出的消费者和商品的潜在特征向量。
评分预测好之后,针对特定的用户对所有预测了评分的商品进行排序,得到商品的推荐列表。
5)图形用户界面模块(相当于实施例二中的输出模块)
这一模块的主要任务是将预测评分排在前面的k个商品推荐给用户。实际应用时,图形用户界面的设计要符合推荐系统的用户习惯,使用户容易理解且易于接受。
基于上面各模块的描述,本实施例向用户输出商品推荐信息的主要流程,如图5所示,可以包括以下步骤:
步骤501:用户登录购物网站触发服务需求;
步骤502:业务系统分析到用户行为触发了一个推荐需求,从而触发系统从用户行为数据库中提取预设统计周期内的用户购物历史数据;
这里,业务系统会运用自然语言处理方法提取用户的行为属性特征。其获取方式通常有两种:(1)系统以与用户进行交互直接获取,在与所述用户交互过程中直接提取用户的行为属性特征;2)系统对用户兴趣进行分析、挖掘来获取用户的行为属性特征。其中,所述用户的行为属性特征可以包含:爱好购买体育用品、爱好购买红色商品、通常在晚上购物、每次购物数量都在1件之上等。
并根据用户的行为属性特征,寻找出与属性相关的历史购买记录。
步骤503:用户购买行为时间分析;
具体地,先计算在某段时间内用户购买商品的时间周期。结合其它推荐因素的评分,进而分析出当前时间进行推荐的权重。
步骤504:权权重大于一定的阈值,系统会触发服务提醒流程;
步骤505:结合时间因素预测用户购买商品的评分;
步骤506:推荐合适的商品给用户。
这里,可以依据评分把商品列表中的k个商品依次推荐给用户。
如果没有触发服务提醒流程,k可以认为是0。
从上面的描述中可以看出,本实施例的方案是一种可以针对日常消耗商品的推荐问题设计出的基于挖掘用户使用习惯的推荐方法。该推荐方法考虑了用户使用不同商品的时间周期性特征,将时间信息以时间周期函数的形式加入到了因子分析模型中,这样,一方面可以通过周期性变化的预测减少通过时间序列分析进行不断更新给系统带来的过大负荷;另一方面,可以使得商品能够在恰当的时间范围内被推荐给用户,提升用户对商品的接受程度,让推荐更加准确。
另外,该方法可以适用于系统过滤推荐、基于内容推荐和混合方法推荐等推荐方法,且具有较好的稳定性。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。

Claims (11)

1.一种信息处理方法,其特征在于,所述方法包括:
从用户行为数据库中提取预设统计周期内的用户行为数据;
利用所述用户行为数据,确定每个对象被用户选中的时间周期;
利用所述时间周期,确定每个对象当前时刻进行输出的时间周期的权重;
确定输出各对象时,根据每个对象的时间周期、以及对应的权重,确定各对象当前时刻的输出概率;并根据各对象的输出概率输出各对象的相关信息。
2.根据权利要求1所述的方法,其特征在于,所述从用户行为数据库中提取预设统计周期内的用户行为数据之前,所述方法还包括:
提取用户的行为属性特征;
相应地,根据所述行为属性特征,从用户行为数据库中提取预设统计周期内对应的用户行为数据。
3.根据权利要求2所述的方法,其特征在于,所述提取用户的行为属性特征,为:
在与所述用户交互过程中直接提取所述用户的行为属性特征;或者,
对所述用户的兴趣进行分析,根据分析结果提取所述用户的行为属性特征。
4.根据权利要求1所述的方法,其特征在于,根据所述时间周期、及所述权重确定的输出概率在0至1之间,且为余弦函数;所述余弦函数的周期为所述时间周期。
5.根据权利要求4所述的方法,其特征在于,根据公式: α ^ = arg ma x α ( r ij - { r ij ^ + α 2 [ cos [ π 2 T ij ( t pre - t last ) ] + 1 } } ) 2 确定所述权重;
其中,rij表示已知的对象j历史输出因素;rij表示已确定的对象j的输出因素;tpre表示预测的对象j被用户i选中时间;tlast表示对象j最后一次被用户i选中的时间;Tij表示对象j被用户i选中的时间周期;α表示权重;argmax表示寻找具有最大输出概率的参量
6.根据权利要求5所述的方法,其特征在于,所述确定输出各对象,为:
根据各对象被用户选中的时间周期,确定输出各对象。
7.根据权利要求5所述的方法,其特征在于,根据公式: γ ^ ij = u i T v j + α 2 { cos [ π 2 T ij · ( t pre - t last ) ] + 1 } ; 确定各对象当前时刻的输出概率;
其中,ui表示需要估计的用户i潜在特征向量,uj表示需要估计的对象j潜在特征向量,ui T表示ui的转置矩阵。
8.根据权利要求1所述的方法,其特征在于,所述根据各对象的输出概率输出各对象,为:
将各对象的输出概率从高到低进行排序;
根据排序结果,向用户输出前k个对象的相关信息;k为大于零的整数。
9.一种信息处理装置,其特征在于,所述装置包括:数据提取模块、数据处理模块、触发服务提醒模块、对象输出处理模块以及输出模块;其中,
所述数据提取模块,用于从用户行为数据库中提取预设统计周期内的用户行为数据;
所述数据处理模块,用于利用所述用户行为数据,确定每个对象被用户选中的时间周期;并利用所述时间周期,确定每个对象当前时刻进行输出的时间周期的权重;
所述触发服务提醒模块,用于确定输出各对象时触发所述对象输出处理模块;
所述对象输出处理模块,用于收到所述触发服务提醒模块的触发后,根据每个对象的时间周期、以及对应的权重,确定各对象当前时刻的输出概率;
所述输出模块,用于根据各对象的输出概率输出各对象的相关信息。
10.根据权利要求9所述的装置,其特征在于,所述装置还包括:属性特征分析模块,用于提取用户的行为属性特征;
相应地,所述数据提取模块,用于根据所述行为属性特征,从用户行为数据库中提取预设统计周期内对应的用户行为数据。
11.根据权利要求9所述的装置,其特征在于,确定所述权重时,根据所述时间周期、及所述权重确定的输出概率在0至1之间,且为余弦函数;所述余弦函数的周期为所述时间周期。
CN201410854140.5A 2014-12-31 2014-12-31 一种信息处理方法及装置 Pending CN105809465A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410854140.5A CN105809465A (zh) 2014-12-31 2014-12-31 一种信息处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410854140.5A CN105809465A (zh) 2014-12-31 2014-12-31 一种信息处理方法及装置

Publications (1)

Publication Number Publication Date
CN105809465A true CN105809465A (zh) 2016-07-27

Family

ID=56464876

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410854140.5A Pending CN105809465A (zh) 2014-12-31 2014-12-31 一种信息处理方法及装置

Country Status (1)

Country Link
CN (1) CN105809465A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106339926A (zh) * 2016-08-30 2017-01-18 五八同城信息技术有限公司 对象处理方法及装置
CN109002450A (zh) * 2017-06-07 2018-12-14 北京京东尚科信息技术有限公司 信息处理方法、系统及电子设备
CN109284951A (zh) * 2017-07-21 2019-01-29 阿里巴巴集团控股有限公司 地址信息处理方法及装置
CN110793168A (zh) * 2018-08-01 2020-02-14 珠海格力电器股份有限公司 除湿机的配置参数确定方法及装置
CN112766995A (zh) * 2019-10-21 2021-05-07 招商证券股份有限公司 物品推荐方法、装置、终端设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101814068A (zh) * 2009-02-24 2010-08-25 日电(中国)有限公司 时序控制的基于评分预测的项目推荐方法和系统
CN102346894A (zh) * 2010-08-03 2012-02-08 阿里巴巴集团控股有限公司 推荐信息的输出方法、系统及服务器
CN103116581A (zh) * 2011-11-16 2013-05-22 阿里巴巴集团控股有限公司 一种电子信息的推荐方法以及装置
CN103325052A (zh) * 2013-07-03 2013-09-25 姚明东 一种基于多维度用户消费倾向建模的商品推荐方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101814068A (zh) * 2009-02-24 2010-08-25 日电(中国)有限公司 时序控制的基于评分预测的项目推荐方法和系统
CN102346894A (zh) * 2010-08-03 2012-02-08 阿里巴巴集团控股有限公司 推荐信息的输出方法、系统及服务器
CN103116581A (zh) * 2011-11-16 2013-05-22 阿里巴巴集团控股有限公司 一种电子信息的推荐方法以及装置
CN103325052A (zh) * 2013-07-03 2013-09-25 姚明东 一种基于多维度用户消费倾向建模的商品推荐方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106339926A (zh) * 2016-08-30 2017-01-18 五八同城信息技术有限公司 对象处理方法及装置
CN109002450A (zh) * 2017-06-07 2018-12-14 北京京东尚科信息技术有限公司 信息处理方法、系统及电子设备
CN109284951A (zh) * 2017-07-21 2019-01-29 阿里巴巴集团控股有限公司 地址信息处理方法及装置
CN110793168A (zh) * 2018-08-01 2020-02-14 珠海格力电器股份有限公司 除湿机的配置参数确定方法及装置
CN112766995A (zh) * 2019-10-21 2021-05-07 招商证券股份有限公司 物品推荐方法、装置、终端设备及存储介质

Similar Documents

Publication Publication Date Title
CN102279851B (zh) 一种智能导航方法、装置和系统
CN104391849B (zh) 融入时间上下文信息的协同过滤推荐方法
CN102033883B (zh) 一种提高网站数据传输速度的方法、装置及系统
CN105574216A (zh) 基于概率模型和用户行为分析的个性化推荐方法、系统
CN105718184A (zh) 一种数据处理方法和装置
CN104679771A (zh) 一种个性化数据搜索方法和装置
CN106327227A (zh) 一种信息推荐系统及信息推荐方法
Das et al. Design and analysis of a closed-loop supply chain in presence of promotional offer
CN105809465A (zh) 一种信息处理方法及装置
CN105426528A (zh) 一种商品数据的检索排序方法及系统
Jiang et al. Pricing strategy in a dual-channel and remanufacturing supply chain system
CN102193936A (zh) 一种数据分类的方法及装置
KR101963817B1 (ko) 키워드 검색량 기반 예측 정보 생성 장치 및 방법
CN104077693A (zh) 商品对比方法、服务器、客户端及电子商务系统
CN104281956A (zh) 基于时间信息的适应用户兴趣变化的动态推荐方法
CN102760124A (zh) 一种推荐数据的推送方法及系统
CN102262653B (zh) 一种基于用户动机倾向性的标签推荐方法及系统
Yang A partial backlogging production-inventory lot-size model for deteriorating items with time-varying production and demand rate over a finite time horizon
CN102339448B (zh) 团购平台信息处理方法及装置
CN107392718A (zh) 商品推荐方法
CN103177129A (zh) 互联网实时信息推荐预测系统
CN104331817A (zh) 电子商务推荐模型的用户特征提取方法及系统
CN103309869A (zh) 数据对象的展示关键词推荐方法及系统
CN112150227A (zh) 商品推荐方法、系统、设备及介质
CN112528153A (zh) 内容推荐方法、装置、设备、存储介质以及程序产品

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20160727

RJ01 Rejection of invention patent application after publication