发明内容
本申请的主要目的为提供一种基于用户历史行为的信息推荐方法、装置、介质及设备,旨在解决现有技术中的基于用户历史行为的信息推荐智能度较低,难以切中不同用户的兴趣点的技术问题。
为了实现上述发明目的,本申请提出一种基于用户历史行为的信息推荐方法,所述方法包括:
获取用户的历史行为信息中的若干条历史浏览信息,在所述历史浏览信息中识别若干个关键词,并将所述关键词作为用户的感兴趣词;
过滤若干个所述感兴趣词中的无关词语,并将过滤后的所述感兴趣词组合形成感兴趣词集合,其中,一所述感兴趣词集合对应一用户的历史行为信息;
获取并根据所述感兴趣词在各个所述历史浏览信息中分别出现的次数,计算所述感兴趣词集合中的各个所述感兴趣词对应的感兴趣值;
获取若干条待推荐信息,其中,一所述待推荐信息包含所述感兴趣词集合中的至少一感兴趣词;
根据每一所述待推荐信息中的感兴趣词的个数和每一所述待推荐信息中的感兴趣词的感兴趣值分别计算每一所述待推荐信息的感兴趣参数;其中,所述待推荐信息中的感兴趣参数与所述待推荐信息中的感兴趣词的感兴趣值为正相关;
根据每一所述待推荐信息的感兴趣参数对所述待推荐信息进行排序以形成推荐序列,根据所述推荐序列向用户推荐所述待推荐信息。
进一步的,所述获取并根据所述感兴趣词在各个所述历史浏览信息中分别出现的次数,计算所述感兴趣词集合中的各个所述感兴趣词对应的感兴趣值的步骤,包括:
识别各个所述历史浏览信息的浏览时间和浏览时长,以及用户对所述历史浏览的关注度操作信息;
根据各个所述历史浏览信息的浏览时间、浏览时长和关注度操作信息计算各个所述历史浏览信息的感兴趣权重;
根据所述感兴趣词在各个所述历史浏览信息中分别出现的次数和各个所述历史浏览信息的感兴趣权重,计算所述感兴趣词的浏览参数;
根据所述浏览参数得到所述感兴趣词对应的感兴趣值。
进一步的,所述获取并根据所述感兴趣词在各个所述历史浏览信息中分别出现的次数,计算所述感兴趣词集合中的各个所述感兴趣词对应的感兴趣值的步骤,包括:
识别各个所述历史浏览信息的浏览时间和浏览时长,以及用户对所述历史浏览的关注度操作信息;
根据各个所述历史浏览信息的浏览时间、浏览时长和关注度操作信息计算各个所述历史浏览信息的感兴趣权重;
根据所述感兴趣词在各个所述历史浏览信息中分别出现的次数和各个所述历史浏览信息的感兴趣权重,计算所述感兴趣词的浏览参数;
根据所述感兴趣词的搜索时间计算所述感兴趣词的搜索参数;其中,所述感兴趣词的搜索时间与当前时间的差值越小,所述感兴趣词的搜索参数越大;
选取所述浏览参数和搜索参数中的最大值作为所述感兴趣词的感兴趣值。
进一步的,所述根据所述感兴趣参数对所述待推荐信息进行排序以形成推荐序列,根据所述推荐序列向用户推荐所述待推荐信息之后,还包括如下步骤:
接收到用户对所述推荐序列的浏览指令后,减小所述推荐序列中用户已浏览的信息对应的感兴趣参数,并根据减小后的所述感兴趣参数对所述推荐序列中用户已浏览的信息进行重新排序,以形成新的推荐序列;根据所述新的推荐序列向用户推荐所述待推荐信息。
进一步的,所述获取用户的历史行为信息中的历史浏览信息,识别所述历史浏览信息中的若干个关键词,并将所述关键词作为用户的感兴趣词的步骤,包括:
获取所述历史浏览信息的标题;
在所述标题中获取所述关键词,将所述关键词作为所述感兴趣词。
本申请还提出了一种基于用户历史行为的信息推荐装置,包括:
感兴趣词获取模块,用于获取用户的历史行为信息中的若干条历史浏览信息,在所述历史浏览信息中识别若干个关键词,并将所述关键词作为用户的感兴趣词
感兴趣词集合生成模块,用于过滤若干个所述感兴趣词中的无关词语,并将过滤后的所述感兴趣词组合形成感兴趣词集合,其中,一所述感兴趣词集合对应一用户的历史行为信息;
感兴趣值计算模块,用于获取并根据所述感兴趣词在各个所述历史浏览信息中分别出现的次数,计算所述感兴趣词集合中的各个所述感兴趣词对应的感兴趣值;
待推荐信息获取模块,用于获取若干条待推荐信息,其中,一所述待推荐信息包含所述感兴趣词集合中的至少一感兴趣词;
感兴趣参数计算模块,用于获根据每一所述待推荐信息中的感兴趣词的个数和每一所述待推荐信息中的感兴趣词的感兴趣值分别计算每一所述待推荐信息的感兴趣参数;其中,所述待推荐信息中的感兴趣参数与所述待推荐信息中的感兴趣词的感兴趣值为正相关;
信息推荐模块,用于根据每一所述待推荐信息的感兴趣参数对所述待推荐信息进行排序以形成推荐序列,根据所述推荐序列向用户推荐所述待推荐信息。
进一步地,所述感兴趣参数计算模块还用于:
识别所述历史行为信息中的各个所述历史浏览信息的浏览时间和浏览时长,以及用户对所述历史浏览的关注度操作信息;
根据各个所述历史浏览信息的浏览时间、浏览时长和关注度操作信息计算各个所述历史浏览信息的感兴趣权重;
根据所述感兴趣词在各个所述历史浏览信息中分别出现的次数和各个所述历史浏览信息的感兴趣权重,计算所述感兴趣词的浏览参数;
根据所述浏览参数得到所述感兴趣词对应的感兴趣值。
进一步地,所述感兴趣参数计算模块还用于:
识别各个所述历史浏览信息的浏览时间和浏览时长,以及用户对所述历史浏览的关注度操作信息;
根据各个所述历史浏览信息的浏览时间、浏览时长和关注度操作信息计算各个所述历史浏览信息的感兴趣权重;
根据所述感兴趣词在各个所述历史浏览信息中分别出现的次数和各个所述历史浏览信息的感兴趣权重,计算所述感兴趣词的浏览参数;
根据所述感兴趣词的搜索时间计算所述感兴趣词的搜索参数;其中,所述感兴趣词的搜索时间与当前时间的差值越小,所述感兴趣词的搜索参数越大;
选取所述浏览参数和搜索参数中的最大值作为所述感兴趣词的感兴趣值。
本申请还提出了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。
本申请还提出了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。
本申请的基于用户历史行为的信息推荐方法、装置、介质及设备,在用户的历史浏览信息中的识别关键词,能够生成针对不同用户的感兴趣词,通过过滤感兴趣词中的无关词语,从而在剔除无关词语的干扰项后获得用户真正感兴趣的词语,提高了对用户需求识别的精确度;通过计算各个感兴趣词对应的感兴趣值,形成不同用户的感兴趣词集合,从而作为针对不同用户进行信息推荐的参考基础,提高了信息推荐的针对性和有效性;根据感兴趣词集合中该感兴趣词对应的感兴趣值计算用户对不同待推荐信息的感兴趣参数,从而化零为整地得到用户对整个待推荐信息的感兴趣情况,提高了对用户感兴趣的信息的判断的准确度;通过按照感兴趣参数对待推荐信息排序得到推荐序列,并向用户推荐该推荐序列,确保了用户在信息浏览过程中能够优先看到感兴趣度最高的信息,减少了用户的信息查找时间,从而提高了用户获取有效内容的效率。从而提高了对用户感兴趣的信息识别的准确度,并由此提高了信息推荐的智能度和准确性。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
参照图1,本申请实施例中提供一种为了实现上述发明目的,本申请提出一种基于用户历史行为的信息推荐方法,所述方法包括:
S1:获取用户的历史行为信息中的若干条历史浏览信息,在所述历史浏览信息中识别若干个关键词,并将所述关键词作为用户的感兴趣词;
S2:过滤若干个所述感兴趣词中的无关词语,并将过滤后的所述感兴趣词组合形成感兴趣词集合,其中,一所述感兴趣词集合对应一用户的历史行为信息;
S3:获取并根据所述感兴趣词在各个所述历史浏览信息中分别出现的次数,计算所述感兴趣词集合中的各个所述感兴趣词对应的感兴趣值;
S4:获取若干条待推荐信息,其中,一所述待推荐信息包含所述感兴趣词集合中的至少一感兴趣词;
S5:根据每一所述待推荐信息中的感兴趣词的个数和每一所述待推荐信息中的感兴趣词的感兴趣值分别计算每一所述待推荐信息的感兴趣参数;其中,所述待推荐信息中的感兴趣参数与所述待推荐信息中的感兴趣词的感兴趣值为正相关;
S6:根据每一所述待推荐信息的感兴趣参数对所述待推荐信息进行排序以形成推荐序列,根据所述推荐序列向用户推荐所述待推荐信息。
本实施例在用户的历史浏览信息中的识别关键词,能够生成针对不同用户的感兴趣词,通过过滤感兴趣词中的无关词语,从而在剔除无关词语的干扰项后获得用户真正感兴趣的词语,提高了对用户需求识别的精确度;通过计算各个感兴趣词对应的感兴趣值,形成不同用户的感兴趣词集合,从而作为针对不同用户进行信息推荐的参考基础,提高了信息推荐的针对性和有效性;根据感兴趣词集合中该感兴趣词对应的感兴趣值计算用户对不同待推荐信息的感兴趣参数,从而化零为整地得到用户对整个待推荐信息的感兴趣情况,提高了对用户感兴趣的信息的判断的准确度;通过按照感兴趣参数对待推荐信息排序得到推荐序列,并向用户推荐该推荐序列,确保了用户在信息浏览过程中能够优先看到感兴趣度最高的信息,减少了用户的信息查找时间,从而提高了用户获取有效内容的效率。从而提高了对用户感兴趣的信息识别的准确度,并由此提高了信息推荐的智能度和准确性。
对于步骤S1,上述用户可以为企业用户或者个人用户,上述的信息可以为文字文档、图文文档、网页新闻等政策信息、技术信息等。用户的历史行为信息包括浏览的历史信息、浏览时长、浏览时间等。
根据用户的历史行为信息生成用户的感兴趣词的方式可以为根据用户的搜索记录生成的,也可以是用户主动订阅的,还可以是在用户阅读的信息中反复出现的词语;获取在用户阅读的信息中反复出现的词语的方式可以为:对用户浏览时长最长的文章中不同关键词出现的次数,按照出现次数由高到低的顺序选取前n个关键词作为感兴趣词;还可以为:选取用户在距今一周内浏览的文章,识别一周内浏览的文章中不同关键词出现的次数,按照出现次数由高到低的顺序选取前n个关键词作为感兴趣词;即,只要获取用户关注度较高的词语即可,在此不再一一赘述。
当获取到用户的感兴趣词后,针对不同的用户分别形成感兴趣词集合,提高了信息推荐的针对性。
对于步骤S2,在各种信息中,往往会存在一些词语出现频率较大,但在文章等信息中没有对信息的含义区分起到实际意义,例如“政策”、“项目”、“企业”、“工程”、“目前”等。具体来说,预设无关词库,将文章中出现频率较大但内容区分度较低的词语放入该无关词集合中,而后在感兴趣词集合中筛选无关词语并将其过滤,从而避免了常用的描述词、语气词等无关词语出现频率过多而产生干扰,在本发明中,可以预先生成包括特定词语的无关词集合,上述特定词语可以为出现的频率高于设定的频率值且内容区分度小于预设的区分度值的词语,在本发明中,当某一词语同时出现在感兴趣词集合和无关词集合时,将其在感兴趣词集合中删除,从而在剔除无关词语的干扰项后获得用户真正感兴趣的词语,提高了对用户需求识别的精确度。
对于步骤S3,形成感兴趣词集合后,对感兴趣词集合中每一感兴趣词进行感兴趣值计算,具体来说,可以对用户历史行为信息中,浏览次数越高的历史浏览信息中的感兴趣词赋予越高的感兴趣值,从而使感兴趣词集合中的每一感兴趣词均有映射的感兴趣值,从而能够根据用户对不同词语的感兴趣值的大小主动且精确地获取用户的关注方向和兴趣点。
对于步骤S4,待推荐信息可以为文字文档、图文文档、网页新闻等。识别含有感兴趣词的文字文档、图文文档、网页新闻等作为符合用户期望的待推荐信息,再计算不同待推荐信息中出现不同感兴趣词的个数,并根据感兴趣词集合中各个该感兴趣词对应的感兴趣值得到用户对不同的待推荐信息的感兴趣参数,从而提高了对用户感兴趣的信息的判断的精确度。
对于步骤S5:在计算每一待推荐信息的感兴趣参数时,通常会出现一个待推荐信息存在多个感兴趣参数的情况,此时可通过下式计算感兴趣参数:
F=h(a1)*√N1+h(a2)*√N2+h(a3)*√N3+h(a4)*√N4+...+h(an)*√Nn
式中,F表示感兴趣参数,h(an)表示第n个感兴趣词的感兴趣值,Nn表示第n个感兴趣词在当前信息中出现的次数,从而实现多维、全面地计算信息的感兴趣参数,在感兴趣参数中体现不同感兴趣词对该待推荐信息的影响。
对于步骤S6,由于感兴趣参数反映的是用户对信息的感兴趣程度,而感兴趣参数的值越大,可认为用户对该信息的感兴趣程度越高,因此,按照每一待推荐信息的感兴趣参数对各个待推荐信息排序得到推荐序列,并根据推荐序列向用户推荐上述若干待推荐信息,能够确保了用户在信息浏览过程中能够优先看到感兴趣度最高的信息,提高了信息推荐的智能度。并且,在实际生活中,在到达一定搜索时长或浏览时长后,用户的注意力和精神状态通常会随搜索时长或浏览时长的继续增加而下降,因此,将用户感兴趣程度高的信息排在推荐序列的前排,能够使用户在注意力较为集中的时候获取到自身感兴趣程序较高的信息,提高了用户的信息获取效率。
在一个实施例中,所述获取并根据所述感兴趣词在各个所述历史浏览信息中分别出现的次数,计算所述感兴趣词集合中的各个所述感兴趣词对应的感兴趣值的步骤,包括:
S311:识别各个所述历史浏览信息的浏览时间和浏览时长,以及用户对所述历史浏览的关注度操作信息;
S312:根据各个所述历史浏览信息的浏览时间、浏览时长和关注度操作信息计算各个所述历史浏览信息的感兴趣权重;
S313:根据所述感兴趣词在各个所述历史浏览信息中分别出现的次数和各个所述历史浏览信息的感兴趣权重,计算所述感兴趣词的浏览参数;
S314:根据所述浏览参数得到所述感兴趣词对应的感兴趣值。
本实施例根据通过历史行为信息中的历史浏览信息浏览时间和浏览时长,以及用户对所述历史浏览的关注度操作信息得到用户对不同历史浏览信息的感兴趣权重,通过感兴趣权重反映用户对不同历史浏览信息的感兴趣度,进而得到浏览参数和对各个感兴趣词的感兴趣值,提高了计算的准确度。
对于步骤S311,上述关注度操作信息包括高关注度操作和低关注度操作,,高关注度操作包括收藏、点赞、评论、复制等,低关注度操作包括点“踩”、点“不感兴趣”等操作。
对于步骤S312,根据各个所述历史浏览信息的浏览时间、浏览时长和关注度操作信息计算各个所述历史浏览信息的感兴趣权重可以采用下式表示:
T=T’/(√M+1);
式中,T表示该历史浏览信息的感兴趣权重,T’表示该历史浏览信息的用户关注度参数,M为浏览时间至今的天数;其中,当浏览时长大于300s时则T’=300;当用户对不同信息的浏览时长波动较小且在300s上下波动时,表示浏览时长难以准确反应用户的感兴趣程度,则设定浏览时长不大于300s时,T’按照比例衰减,例如,当浏览时长大于150s时则T’=150,当浏览时长不大于50s时则T’=0;当用户对不同信息的浏览时长波动较大时,表示浏览时长能够准确地反应用户的感兴趣程度,设定当浏览时长不大于300s时则T’=0;当该信息被用户进行了高关注度操作时,增加该信息的感兴趣权重;在具体的实施中,高关注度操作的优先级大于浏览时长和浏览时间,当用户对该历史浏览信息进行了高关注度操作时,按照T’=600对用户主动进行的关注操作进行加权,进一步提高计算的准确度。
对于步骤S313,根据所述感兴趣词在不同历史浏览信息中分别出现的次数和各个所述历史浏览信息的感兴趣权重,计算所述感兴趣词的浏览参数可以用下式表示:
f(a)=√(N1*T1)+√(N2*T2)+...+√(Nn*Tn)
式中,f(a)表示感兴趣词a的浏览参数,Nn表示感兴趣词a在第n个历史浏览信息中出现的次数,Tn表示第n个历史浏览信息的感兴趣权重。
对于步骤S314,可以将所述浏览参数作为所述感兴趣词对应的感兴趣值。
在步骤S314之后,当识别到用户进行上述低关注度操作时,将该历史浏览信息剔除出计算基准中,例如,当n个历史浏览信息中,第2个历史浏览信息被用户进行了低关注度操作此时感兴趣词a的浏览参数f(a)由下式:
f(a)=√(N1*T1)+√(N2*T2)+√(N3*T3)+...+√(Nn*Tn)
更改为下式:
f(a)=√(N1*T1)+√(N3*T3)+...+√(Nn*Tn)
即,当出现多个历史浏览信息均被用户进行了低关注度操作,则以此类推地在感兴趣词a的浏览参数f(a)的计算式中删除,式中,f(a)表示感兴趣词a的浏览参数,Nn表示感兴趣词a在第n个历史浏览信息中出现的次数,Tn表示第n个历史浏览信息的感兴趣权重。由于在实际浏览行为中,有可能会出现用户点进某一信息浏览之后才发现该信息不是自己需要的信息,而通过识别用户的低关注度操作可以对此类信息进行剔除,从而提高感兴趣词对应的浏览参数计算的准确性,进而提高信息推荐的准确性。
在一个实施例中,所述计算所述感兴趣词集合中的各个所述感兴趣词对应的感兴趣值的步骤,包括:
S321:识别各个所述历史浏览信息的浏览时间和浏览时长,以及用户对所述历史浏览的关注度操作信息;
S322:根据各个所述历史浏览信息的浏览时间、浏览时长和关注度操作信息计算各个所述历史浏览信息的感兴趣权重;
S323:根据所述感兴趣词在各个所述历史浏览信息中分别出现的次数和各个所述历史浏览信息的感兴趣权重,计算所述感兴趣词的浏览参数;
S324:根据所述感兴趣词的搜索时间计算所述感兴趣词的搜索参数;其中,所述感兴趣词的搜索时间与当前时间的差值越小,所述感兴趣词的搜索参数越大;
S325:选取所述浏览参数和搜索参数中的最大值作为所述感兴趣词的感兴趣值。
本实施例通过根据感兴趣词的搜索时间计算用户的搜索参数,使得搜索参数能够反映用户感兴趣对象的时效性,采用浏览参数和搜索参数中的二者的最大值作为感兴趣值的方式能够全面反应用户的感兴趣程度,进而提高信息推荐的准确性。
对于步骤S321,上述关注度操作信息包括高关注度操作和低关注度操作,,高关注度操作包括收藏、点赞、评论、复制等,低关注度操作包括点“踩”、点“不感兴趣”等操作。
对于步骤S322,根据各个所述历史浏览信息的浏览时间、浏览时长和关注度操作信息计算各个所述历史浏览信息的感兴趣权重可以采用下式表示:
T=T’/(√M+1);
式中,T表示该历史浏览信息的感兴趣权重,T’表示该历史浏览信息的用户关注度参数,M为浏览时间至今的天数;其中,当浏览时长大于300s时则T’=300;当用户对不同信息的浏览时长波动较小且在300s上下波动时,表示浏览时长难以准确反应用户的感兴趣程度,则设定浏览时长不大于300s时,T’按照比例衰减,例如,当浏览时长大于150s时则T’=150,当浏览时长不大于50s时则T’=0;当用户对不同信息的浏览时长波动较大时,表示浏览时长能够准确地反应用户的感兴趣程度,设定当浏览时长不大于300s时则T’=0;当该信息被用户进行了高关注度操作时,增加该信息的感兴趣权重;在具体的实施中,高关注度操作的优先级大于浏览时长和浏览时间,当用户对该历史浏览信息进行了高关注度操作时,按照T’=600对用户主动进行的关注操作进行加权,进一步提高计算的准确度。
对于步骤S323,根据所述感兴趣词在不同历史浏览信息中分别出现的次数和各个所述历史浏览信息的感兴趣权重,计算所述感兴趣词的浏览参数可以用下式表示:
f(a)=√(N1*T1)+√(N2*T2)+...+√(Nn*Tn)
式中,f(a)表示感兴趣词a的浏览参数,Nn表示感兴趣词a在第n个历史浏览信息中出现的次数,Tn表示第n个历史浏览信息的感兴趣权重。
在步骤S224之后,当识别到用户进行上述低关注度操作时,将该历史浏览信息剔除出计算基准中,例如,当n个历史浏览信息中,第2个历史浏览信息被用户进行了低关注度操作此时感兴趣词a的浏览参数f(a)由下式:
f(a)=√(N1*T1)+√(N2*T2)+√(N3*T3)+...+√(Nn*Tn)
更改为下式:
f(a)=√(N1*T1)+√(N3*T3)+...+√(Nn*Tn)
即,当出现多个历史浏览信息均被用户进行了低关注度操作,则以此类推地在感兴趣词a的浏览参数f(a)的计算式中删除,式中,f(a)表示感兴趣词a的浏览参数,Nn表示感兴趣词a在第n个历史浏览信息中出现的次数,Tn表示第n个历史浏览信息的感兴趣权重。由于在实际浏览行为中,有可能会出现用户点进某一信息浏览之后才发现该信息不是自己需要的信息,而通过识别用户的低关注度操作可以对此类信息进行剔除,从而提高感兴趣词对应的浏览参数计算的准确性,进而提高信息推荐的准确性。
对于步骤S324,本发明根据所述感兴趣词的搜索时间计算所述感兴趣词的搜索参数可以通过下式表示:
g(a)=(30-D)*(30-D)
式中,g(a)表示感兴趣词的搜索参数,D表示关键词的搜索时间距今的天数,即若该感兴趣词的搜索时间为今天,则D=0,若该感兴趣词的搜索时间为昨天,则D=1,从而提高计算的时效性。
具体地,可以根据设定的更新时间对感兴趣词和感兴趣值进行更新,例如设定每日更新一次;除此之外还可以实时响应用户的搜索请求,即当用户搜索遇某个关键词则即时将搜索词列入感兴趣词并计算其感兴趣值。
对于步骤S325,本发明的感兴趣值即h(a)=max(f(a),g(a)),选取浏览参数和搜索参数中更大的值作为该感兴趣词的感兴趣值,能够避免仅通过浏览记录和搜索记录片面地反应感兴趣程度,例如,用户对词语a感兴趣时,若该用户浏览的大部分信息中频繁出现词语a,则用户的信息获取需求已经被满足,不需要额外搜索该词语a,若该用户浏览的大部分信息中不存在词语a,则用户需要自行搜索以满意自身的信息获取需求,因此,采用浏览参数和搜索参数中的二者的最大值作为感兴趣值的方式能够全面反应用户的感兴趣程度。
在一个实施例中,所述根据所述感兴趣参数对所述待推荐信息进行排序以形成推荐序列,根据所述推荐序列向用户推荐所述待推荐信息,还包括如下步骤:
S7:接收到用户对所述推荐序列的浏览指令后,减小所述推荐序列中用户已浏览的信息对应的感兴趣参数,并根据减小后的所述感兴趣参数对所述推荐序列中用户已浏览的信息进行重新排序,以形成新的推荐序列;根据所述新的推荐序列向用户推荐所述待推荐信息。
本实施例通过基于不同文章对于用户而言的感兴趣度对不同的文章进行排序,按照该顺序向用户进行推荐,确保了用户优先看到感兴趣度最高的文章,减少了查找时间,并对用户的文章的兴趣分数按照新的参数进行重新排序,避免了已浏览的文章干扰用户浏览其它感兴趣度较高的文章,从而提高了用户查看感兴趣文章的效率。
对于步骤S7,当用户浏览某一信息后,对该信息的感兴趣参数降权后重新排序,上述的降权可以是乘以相应的百分比,例如,当客户第一次浏览该文章后,将改文章的感兴趣参数乘以50%,得到一次降权的感兴趣参数,若用户在浏览过程中再次点进该文章浏览,则可以在一次降权的感兴趣参数上再次乘以50%,得到二次降权的感兴趣参数,并对按照二次降权的感兴趣参数对该感兴趣词重新排序,以避免同一篇文章反复出现在用户的浏览视野中。
在一个实施例中,所述获取用户的历史行为信息中的历史浏览信息,识别所述历史浏览信息中的若干个关键词,并将所述关键词作为用户的感兴趣词的步骤,包括:
S11:获取所述历史浏览信息的标题;
S12:在所述标题中获取所述关键词,将所述关键词作为所述感兴趣词。
本实施例将标题中的关键词作为感兴趣词,能够准确地体现用户浏览行为表现出的真实感兴趣度,提高信息推荐的智能度。
对于步骤S12,由于在企业等用户浏览网页信息时,第一时间接收到的信息往往是网页链接或文档的标题,若该用户点进某一标题下的文档进行浏览,则说明该标题对该用户的吸引力极大,因此可认为该标题中存在用户感兴趣程度极高的关键词,将该标题中的关键词作为感兴趣词,更加贴合用户的真实体验。
具体地,可以根据语义在所述标题中获取所述关键词,例如,建立参考词库,在标题中识别与参考词库中的参考词语语义相近的词,并将其作为关键词;上述参考词语可以是预先设置的具有一定实际意义的词语,例如“5G”,“中小型企业”,“产业扶持”等。
参照图2,本申请还提出了一种基于用户历史行为的信息推荐装置,包括:
感兴趣词获取模块100,用于获取用户的历史行为信息中的若干条历史浏览信息,在所述历史浏览信息中识别若干个关键词,并将所述关键词作为用户的感兴趣词
感兴趣词集合生成模块200,用于过滤若干个所述感兴趣词中的无关词语,并将过滤后的所述感兴趣词组合形成感兴趣词集合,其中,一所述感兴趣词集合对应一用户的历史行为信息;
感兴趣值计算模块300,用于获取并根据所述感兴趣词在各个所述历史浏览信息中分别出现的次数,计算所述感兴趣词集合中的各个所述感兴趣词对应的感兴趣值;
待推荐信息获取模块400,用于获取若干条待推荐信息,其中,一所述待推荐信息包含所述感兴趣词集合中的至少一感兴趣词;
感兴趣参数计算模块500,用于根据每一所述待推荐信息中的感兴趣词的个数和每一所述待推荐信息中的感兴趣词的感兴趣值分别计算每一所述待推荐信息的感兴趣参数;其中,所述待推荐信息中的感兴趣参数与所述待推荐信息中的感兴趣词的感兴趣值为正相关;
信息推荐模块600,用于根据每一所述待推荐信息的感兴趣参数对所述待推荐信息进行排序以形成推荐序列,根据所述推荐序列向用户推荐所述待推荐信息。
本实施例在用户的历史浏览信息中的识别关键词,能够生成针对不同用户的感兴趣词,通过过滤感兴趣词中的无关词语,从而在剔除无关词语的干扰项后获得用户真正感兴趣的词语,提高了对用户需求识别的精确度;通过计算各个感兴趣词对应的感兴趣值,形成不同用户的感兴趣词集合,从而作为针对不同用户进行信息推荐的参考基础,提高了信息推荐的针对性和有效性;根据感兴趣词集合中该感兴趣词对应的感兴趣值计算用户对不同待推荐信息的感兴趣参数,从而化零为整地得到用户对整个待推荐信息的感兴趣情况,提高了对用户感兴趣的信息的判断的准确度;通过按照感兴趣参数对待推荐信息排序得到推荐序列,并向用户推荐该推荐序列,确保了用户在信息浏览过程中能够优先看到感兴趣度最高的信息,减少了用户的信息查找时间,从而提高了用户获取有效内容的效率。从而提高了对用户感兴趣的信息识别的准确度,并由此提高了信息推荐的智能度和准确性。
在一个实施例中,感兴趣值计算模块300具体用于:
识别各个所述历史浏览信息的浏览时间和浏览时长,以及用户对所述历史浏览的关注度操作信息;
根据各个所述历史浏览信息的浏览时间、浏览时长和关注度操作信息计算各个所述历史浏览信息的感兴趣权重;
根据所述感兴趣词在各个所述历史浏览信息中分别出现的次数和各个所述历史浏览信息的感兴趣权重,计算所述感兴趣词的浏览参数;
根据所述浏览参数得到所述感兴趣词对应的感兴趣值。
在一个实施例中,感兴趣值计算模块300具体用于:
识别各个所述历史浏览信息的浏览时间和浏览时长,以及用户对所述历史浏览的关注度操作信息;
根据各个所述历史浏览信息的浏览时间、浏览时长和关注度操作信息计算各个所述历史浏览信息的感兴趣权重;
根据所述感兴趣词在各个所述历史浏览信息中分别出现的次数和各个所述历史浏览信息的感兴趣权重,计算所述感兴趣词的浏览参数;
根据所述感兴趣词的搜索时间计算所述感兴趣词的搜索参数;其中,所述感兴趣词的搜索时间与当前时间的差值越小,所述感兴趣词的搜索参数越大;
选取所述浏览参数和搜索参数中的最大值作为所述感兴趣词的感兴趣值。
在一个实施例中,还包括重新排序模块700;
重新排序模块700,用于接收到用户对所述推荐序列的浏览指令后,减小所述推荐序列中用户已浏览的信息对应的感兴趣参数,并根据减小后的所述感兴趣参数对所述推荐序列中用户已浏览的信息进行重新排序,以形成新的推荐序列;根据所述新的推荐序列向用户推荐所述待推荐信息。
在一个实施例中,感兴趣词集合生成模块100具体用于:
识别所述历史行为信息中的历史浏览信息,以及各个所述历史浏览信息的标题;
获取所述标题中的关键词,将所述标题中的关键词作为所述感兴趣词。
参照图3,本申请实施例中还提供一种计算机设备,该计算机设备可以是服务器,其内部结构可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于储存基于用户历史行为的信息推荐方法等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于用户历史行为的信息推荐方法。所述基于用户历史行为的信息推荐方法,包括:获取用户的历史行为信息中的若干条历史浏览信息,在所述历史浏览信息中识别若干个关键词,并将所述关键词作为用户的感兴趣词;过滤若干个所述感兴趣词中的无关词语,并将过滤后的所述感兴趣词组合形成感兴趣词集合,其中,一所述感兴趣词集合对应一用户的历史行为信息;获取并根据所述感兴趣词在各个所述历史浏览信息中分别出现的次数,计算所述感兴趣词集合中的各个所述感兴趣词对应的感兴趣值;获取若干条待推荐信息,其中,一所述待推荐信息包含所述感兴趣词集合中的至少一感兴趣词;根据每一所述待推荐信息中的感兴趣词的个数和每一所述待推荐信息中的感兴趣词的感兴趣值分别计算每一所述待推荐信息的感兴趣参数;其中,所述待推荐信息中的感兴趣参数与所述待推荐信息中的感兴趣词的感兴趣值为正相关;根据每一所述待推荐信息的感兴趣参数对所述待推荐信息进行排序以形成推荐序列,根据所述推荐序列向用户推荐所述待推荐信息。
本申请一实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现一种基于用户历史行为的信息推荐方法,包括步骤:获取用户的历史行为信息中的若干条历史浏览信息,在所述历史浏览信息中识别若干个关键词,并将所述关键词作为用户的感兴趣词;过滤若干个所述感兴趣词中的无关词语,并将过滤后的所述感兴趣词组合形成感兴趣词集合,其中,一所述感兴趣词集合对应一用户的历史行为信息;获取并根据所述感兴趣词在各个所述历史浏览信息中分别出现的次数,计算所述感兴趣词集合中的各个所述感兴趣词对应的感兴趣值;获取若干条待推荐信息,其中,一所述待推荐信息包含所述感兴趣词集合中的至少一感兴趣词;根据每一所述待推荐信息中的感兴趣词的个数和每一所述待推荐信息中的感兴趣词的感兴趣值分别计算每一所述待推荐信息的感兴趣参数;其中,所述待推荐信息中的感兴趣参数与所述待推荐信息中的感兴趣词的感兴趣值为正相关;根据每一所述待推荐信息的感兴趣参数对所述待推荐信息进行排序以形成推荐序列,根据所述推荐序列向用户推荐所述待推荐信息。
上述执行的基于用户历史行为的信息推荐方法,本实施例通过在用户的历史浏览信息中的识别关键词,能够生成针对不同用户的感兴趣词,通过过滤感兴趣词中的无关词语,从而在剔除无关词语的干扰项后获得用户真正感兴趣的词语,提高了对用户需求识别的精确度;通过计算各个感兴趣词对应的感兴趣值,形成不同用户的感兴趣词集合,从而作为针对不同用户进行信息推荐的参考基础,提高了信息推荐的针对性和有效性;根据感兴趣词集合中该感兴趣词对应的感兴趣值计算用户对不同待推荐信息的感兴趣参数,从而化零为整地得到用户对整个待推荐信息的感兴趣情况,提高了对用户感兴趣的信息的判断的准确度;通过按照感兴趣参数对待推荐信息排序得到推荐序列,并向用户推荐该推荐序列,确保了用户在信息浏览过程中能够优先看到感兴趣度最高的信息,减少了用户的信息查找时间,从而提高了用户获取有效内容的效率。从而提高了对用户感兴趣的信息识别的准确度,并由此提高了信息推荐的智能度和准确性。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
以上所述仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。