CN104111925A - 项目推荐方法和装置 - Google Patents

项目推荐方法和装置 Download PDF

Info

Publication number
CN104111925A
CN104111925A CN201310133004.2A CN201310133004A CN104111925A CN 104111925 A CN104111925 A CN 104111925A CN 201310133004 A CN201310133004 A CN 201310133004A CN 104111925 A CN104111925 A CN 104111925A
Authority
CN
China
Prior art keywords
project
scoring
feature vector
vector
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310133004.2A
Other languages
English (en)
Other versions
CN104111925B (zh
Inventor
魏芳
胡可云
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN201310133004.2A priority Critical patent/CN104111925B/zh
Publication of CN104111925A publication Critical patent/CN104111925A/zh
Application granted granted Critical
Publication of CN104111925B publication Critical patent/CN104111925B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3347Query execution using vector based model

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种项目推荐方法,包括:获取项目的文本信息和评分信息;根据所述项目的文本信息,确定基于所述项目的主题的语义特征向量;将所述项目的评分确定为所述项目的历史特征向量,根据所述历史特征向量和所述语义特征向量,确定所述项目的特征向量,并根据所述特征向量确定所述项目中对应于用户的待评分项目的预测评分;将预测评分最高的预设数量的待评分项目确定为向所述用户推荐的项目。本发明还公开了一种项目推荐装置。采用本发明的技术方案,能够准确地确定项目之间的相似度,提高对待评分项目的预测评分精度,并能将新生成的时效要求高的项目及时推荐给用户。

Description

项目推荐方法和装置
技术领域
本发明涉及项目推荐技术,尤其涉及一种项目推荐方法和装置。
背景技术
随着互联网技术的发展与普及,互联网成为获取信息的重要途径,推荐装置能够从互联网海量数据信息中获取满足用户需求的项目以推荐给用户,因而日益成为技术焦点,这里的项目是指向用户推荐的对象,例如图书、新闻和应用软件等。现有推荐装置通常使用基于协同过滤推荐、基于内容推荐和基于知识推荐结合的方案进行项目推荐,主要存在以下问题:
基于协同过滤的推荐装置利用待评分项目与用户已使用的历史项目的相似度以及用户对已使用历史项目的评分,预测用户对待评分项目的评分,将评分高的项目推荐给用户,其中推荐装置利用项目的文本信息抽取关键词来计算相似度,一方面为了保持原有文本信息中所蕴含的语义信息,抽取关键词的维度比较高,导致不同待评分项目与用户历史项目的之间的相似度相近;另一方面,推荐装置直接利用抽取的关键词计算相似度,因此只能依靠不同项目出现的相同的关键词来表明项目之间的相似关系,无法识别不同项目中相同关键词的近义词或同义词,造成项目之间的相似度计算不准确的问题导致不同待评分项目与用户历史项目的之间的相似度相近,无法对待评分项目进行差异化评分;
现有推荐装置对时效要求高的项目与时效要求不高的项目的处理相同,从而无法将新生成的时效要求高的项目及时推荐给用户,甚至会推荐过时的或淘汰的项目。
发明内容
有鉴于此,本发明的主要目的在于提供一种项目推荐方法和装置,能够准确地确定待评分项目与历史项目的相似度,提高对待评分项目的预测评分精度,并能将新生成的时效要求高的项目及时推荐给用户。
为达到上述目的,本发明的技术方案是这样实现的:
本发明提供了一种项目推荐方法,所述方法包括:
获取项目的文本信息和评分信息;
根据所述项目的文本信息,确定基于所述项目的主题的语义特征向量;
将所述项目的评分确定为所述项目的历史特征向量,根据所述历史特征向量和所述语义特征向量,确定所述项目的特征向量,并根据所述特征向量确定所述项目中对应于用户的待评分项目的预测评分;
将预测评分最高的预设数量的待评分项目确定为向所述用户推荐的项目。
优选的,所述根据项目的文本信息,确定基于所述项目的主题的语义特征向量,包括:
根据所述项目的文本d,确定预设的K个主题在文本d上的分布θd为(θd1,θd2...θdK),并将所述预设的K个主题在文本d上的分布θd确定为所述项目的语义特征向量。
优选的,所述根据所述项目的评分对应的历史特征向量、以及所述语义特征向量,确定所述项目的特征向量,包括:
将所述项目的评分确定为所述项目的历史特征向量V,根据所述历史特征向量和所述语义特征向量θd,确定所述项目的特征向量F为(V,θd)。
优选的,所述方法还包括:
根据给予所述项目评分的用户使用所述项目的平均时长Tv、所述项目的生成时间Tg和所述项目的更新时间Tu,确定所述项目的时间特征向量T为(Tv,Tg,Tu);相应的,所述确定所述项目的特征向量,包括:根据所述历史特征向量V、所述语义特征向量θd和所述时间特征向量T,确定所述项目的特征向量F为(V,θd,T)。
优选的,所述根据所述确定的特征向量确定用户对所述项目中对应所述用户的待评分项目的预测评分,包括:
根据所述确定的特征向量F,确定所述项目中项目i与项目j的相似度sim(i,j),根据所述确定的相似度sim(i,j)确定用户u对所述项目中对应用户u的待评分项目i的预测评分ru,i其中,S为所述项目的集合,k为项目集合S中的任一个项目,γ为预设权值,t为当前时间,tu,k为项目k的生成时间,simi,k为项目i与项目k的相似度,ru,k为用户u对项目k的评分。
本发明还提供了一种项目推荐装置,所述推荐装置包括:第一获取单元、第二确定单元、第三确定单元和第四确定单元;其中,
所述第一获取单元,用于获取项目的文本信息和评分信息;
所述第二确定单元,用于根据所述项目的文本信息,确定基于所述项目的主题的语义特征向量;
所述第三确定单元,用于将所述项目的评分确定为所述项目的历史特征向量,根据所述历史特征向量和所述语义特征向量,确定所述项目的特征向量;
所述第四确定单元,用于根据所述特征向量确定所述项目中对应于用户的待评分项目的预测评分;将预测评分最高的预设数量的待评分项目确定为向所述用户推荐的项目。
优选的,所述第二确定单元,还用于根据所述项目的文本d,确定预设的K个主题在文本d上的分布θd为(θd1,θd2...θdK),并将所述预设的K个主题在文本d上的分布θd确定为所述项目的语义特征向量。
优选的,所述第三确定单元,还用于将所述项目的评分确定为所述项目的历史特征向量V,根据所述历史特征向量和所述语义特征向量θd,确定所述项目的特征向量F为(V,θd)。
优选的,所述推荐装置还包括:
第五确定单元,用于根据给予所述项目评分的用户使用所述项目的平均时长Tv、所述项目的生成时间Tg和所述项目的更新时间Tu,确定所述项目的时间特征向量T为(Tv,Tg,Tu);相应的,所述确定所述项目的特征向量,包括:根据所述历史特征向量V、所述语义特征向量θd和所述时间特征向量T,确定所述项目的特征向量F为(V,θd,T);
所述第三确定单元,还用于根据所述历史特征向量V、所述语义特征向量θd和所述时间特征向量T,确定所述项目的特征向量F为(V,θd,T)。
优选的,所述第四确定单元,还用于根据所述确定的特征向量F,确定所述项目中项目i与项目j的相似度sim(i,j),根据所述确定的相似度sim(i,j)确定用户u对所述项目中对应用户u的待评分项目i的预测评分ru,i其中,S为所述项目的集合,k为项目集合S中的任一个项目,γ为预设权值,t为当前时间,tu,k为项目k的生成时间,simi,k为项目i与项目k的相似度,ru,k为用户u对项目k的评分。
本发明所提供的技术方案中,在项目的特征向量中加入基于所述项目的主题的语义特征向量,提高了描述项目相似度的精度,避免了根据直接从项目的文本中提取关键词确定项目的相似度时,无法对项目文本与提取的关键词中的同义词或近义词进行识别处理,导致确定的项目的相似度不准确的问题;进一步的,在对待评分项目进行评分预测时,预测评分公式中代入针对项目生成时间的约束因子能够及时地将实效性要求高的项目推荐给用户,避免将过时的或淘汰的项目推荐给用户。
附图说明
图1为本发明推荐方法的实现流程示意图;
图2为本发明推荐装置的组成结构示意图;
图3为本发明一实施例中使用潜在狄利克雷分配(LDA,Latent DirichletAllocation)模型确定语义特征向量的实现流程示意图;
图4a为主题在文本描述内容中所占的比例的示意图;
图4b为字典空间在文本的主题上的分布示意图;
图5为本发明一实施例中推荐装置进行项目推荐的处理流程示意图。
具体实施方式
下面结合附图及具体实施例对本发明做进一步详细的说明。
图1为本发明推荐方法的实现流程示意图,如图1所示,所述方法包括:
步骤101:获取项目的文本信息和评分信息;
步骤102:根据所述项目的文本信息,确定基于所述项目的主题的语义特征向量;
优选的,所述根据所述项目的文本信息,确定基于所述项目的主题的语义特征向量,包括:
根据所述项目的文本d,确定预设K个主题在文本d上的分布θd为(θd1,θd2...θdK),并将所述预设K个主题在文本d上的分布θd确定为所述项目的语义特征向量。
其中,确定所述语义特征向量的方式包括但不限于:主成分分析(PCA,Principal Component Analysis)、主题模型(Topic Model)。
下面以使用LDA模型的方式为例,阐述确定所述语义特征向量的具体过程,图3为本发明一实施例中使用LDA模型确定语义特征向量的实现流程示意图,如图3所示,LDA模型的输入为:项目的文本集合D={d1,d2...d|D|};LDA模型的输出为:预设K个主题在文本集合D中每个文本d上的多项式分布θd,以及字典空间在K个主题中每个主题z上的多项式分布Φz
图3中LDA模型的各项参数含义为:
α:LDA模型分布参数,该参数决定LDA模型的稀疏性,利用该参数确定K个主题在文本集合D上的多项式分布θd,例如,该参数可预设先前经验值0.1;
β:LDA模型分布参数,该参数决定LDA模型的稀疏性,利用该参数确定字典空间在主题z上的多项式分布Φz,例如,该参数可预设先前经验值0.1;
θd:主题在文本d上的分布,如一篇关于“政策对经济的影响”的文本,文本中一部分内容在陈述政治问题,一部分内容在陈述经济问题,另一部分内容在陈述个人观点,因此该文本主要由上述三种主题所组成,与该文本对应的θd是一个三维向量,满足0<θd每一维的向量小于1、且θd每一维的向量值的和为1,表示相应主题在文本描述内容中所占的比例,具体如图4a所示,横坐标表示不同的主题,纵坐标表示每个主题在该文本中所占的比例。
Φz:字典空间在文本d的主题z上的分布,该参数的维数为文本集合D中所有不重复词语的数量,满足0<Φz每一维的向量小于1,每一维向量表示一个单词w能够表达该主题信息的程度。如图4b所示,对于描述政治的主题,单词“领导”、“政策”表达该政治主题的程度分别为0.003和0.001,其中Φz每一维的向量用“单词,概率值”二元组的形式表示,概率值从大到小排序,每个主题下概率大的单词相对概率小的单词更能表达所属主题的含义。
z:单词w所属主题的标签,对于文本d中的每一个单词w对应一个主题的标签z,例如图4b中单词“领导”和“政策”所属的主题的标签为“政治”;
w:文本d中的单词,图3中该参数以阴影标识,标识该参数在LDA模型的参数估计时是已知值;
Nd:文本d中单词的数量。
步骤102中,将利用LDA模型输出的θd=(θd1,θd2...θdK)确定为所述项目的语义特征向量,该特征向量的维度为预设主题数量K,相对于以从文本中抽取单词作为所述项目的语义特征向量维度低,便于后续处理。
步骤103:将所述项目的评分确定为所述项目的历史特征向量,根据所述历史特征向量和所述语义特征向量,确定所述项目的特征向量,并根据所述特征向量确定所述项目中对应于用户的待评分项目的预测评分;
优选的,所述将所述项目的评分确定为所述项目的历史特征向量,根据所述历史特征向量和所述语义特征向量,确定所述项目的特征向量,包括:将所述项目的评分确定为所述项目的历史特征向量V,根据所述历史特征向量和所述语义特征向量θd,确定所述项目的特征向量F为(V,θd)。
优选的,所述方法还包括:根据所述项目被给予评分的用户使用的平均时长Tv、所述项目的生成时间Tg和所述项目的更新时间Tu,确定所述项目的时间特征向量T为(Tv,Tg,Tu);相应的,所述确定所述项目的特征向量,包括:根据所述历史特征向量V、所述语义特征向量θd和所述时间特征向量T,确定所述项目的特征向量F为(V,θd,T)。
其中,所述项目的平均时长Tv为对所述项目进行评分的用户使用所述项目的时长的平均值,用户使用该项目的时长可以通过记录其在线时间或者让用户填写调查等方式获得,所述项目的生成时间Tg为所述项目生成的时间,所述项目的更新时间Tu指截止到当前(获取历史项目的时间信息时),所述历史项目最后一次进行更新的时间,所述Tv、Tg、Tu是以所述项目的数量和所述进行评分的用户数量为维度的向量。
其中,由于更新和淘汰频率高的待评分项目只在生成或更新后的一段时间内为用户关注和接受,后续的时间内则通常被用户拒绝关注和接受,通过在待评分项目的特征向量中加入时间特征向量,加入了待评分项目的时间信息,可以针对待评分项目的时间信息进行处理,以保证时效要求高的待评分项目的时效性。
优选的,所述根据所述确定的特征向量确定用户对所述项目中对应所述用户的待评分项目的预测评分,包括:
根据所述确定的特征向量F,确定所述项目中项目i与项目j的相似度sim(i,j),根据所述确定的相似度sim(i,j)确定用户u对所述项目中对应用户u的待评分项目i的预测评分ru,i其中,S为所述项目的集合,k为项目集合S中的任一个项目,γ为预设权值,t为当前时间,tu,k(向量Tg中与用户u和项目k对应的元素)为项目k的生成时间,simi,k为项目i与项目k的相似度,ru,k为用户u对项目k的评分。
其中,当所述语义特征向量根据LDA模型确定时,所述预设权值γ可以采用LDA模型参数α。
其中,通过所述预测评分公式,可以根据用户u对项目集合S中的任一个已经进行评分的项目k的评分ru,k,以及所述已经评分项目k与待评分项目i的相似度simi,k确定用户u对项目i的评分ru,i,由于所述相似度simi,k基于项目i与项目k的历史特征信息(对应向量V)、语义特征信息(对应向量θd)和时间特征信息(对应向量T),因此能够准确表达项目k与项目i的相似度;并且,所述预测评分公式中还代入项目k与项目i的生成时间的差值,能够准确表达时效性高的项目之间的相似度。
其中,所述相似度的确定方式包括但不限于:使用余弦度量的确定方式、使用皮尔逊相关系数度量的确定方式;例如,使用余弦度量的方式确定相似度其中,Fik为项目i的特征向量Fi的第k维,Fjk为项目j的特征向量Fj的第k维,Fik为项目i的特征向量Fi的维数,Fj与Fi的维数为预设主题数量K。
步骤104:将预测评分最高的预设数量的待评分项目确定为向所述用户推荐的项目。
图2为本发明推荐装置的组成结构示意图,如图2所示,所述推荐装置包括:第一获取单元21、第二确定单元22、第三确定单元23和第四确定单元24;其中,
所述第一获取单元21,用于获取项目的文本信息和评分信息;
所述第二确定单元22,用于根据所述项目的文本信息,确定基于所述项目的主题的语义特征向量;
所述第三确定单元23,用于将所述项目的评分确定为所述项目的历史特征向量,根据所述历史特征向量和所述语义特征向量,确定所述项目的特征向量;
所述第四确定单元24,用于根据所述特征向量确定所述项目中对应于用户的待评分项目的预测评分;将预测评分最高的预设数量的待评分项目确定为向所述用户推荐的项目。
优选的,所述第二确定单元22,还用于根据所述项目的文本d,确定预设的K个主题在文本d上的分布θd为(θd1,θd2...θdK),并将所述预设的K个主题在文本d上的分布θd确定为所述项目的语义特征向量。
优选的,所述第三确定单元23,还用于将所述项目的评分确定为所述项目的历史特征向量V,根据所述历史特征向量和所述语义特征向量θd,确定所述项目的特征向量F为(V,θd)。
优选的,所述推荐装置还包括:
第五确定单元25,用于根据给予所述项目评分的用户使用所述项目的平均时长Tv、所述项目的生成时间Tg和所述项目的更新时间Tu,确定所述项目的时间特征向量T为(Tv,Tg,Tu);相应的,所述确定所述项目的特征向量,包括:根据所述历史特征向量V、所述语义特征向量θd和所述时间特征向量T,确定所述项目的特征向量F为(V,θd,T);
所述第三确定单元23,还用于根据所述历史特征向量V、所述语义特征向量θd和所述时间特征向量T,确定所述项目的特征向量F为(V,θd,T)。
优选的,所述第四确定单元24,还用于根据所述确定的特征向量F,确定所述项目中项目i与项目j的相似度sim(i,j),根据所述确定的相似度sim(i,j)确定用户u对所述项目中对应用户u的待评分项目i的预测评分ru,i其中,S为所述项目的集合,k为项目集合S中的任一个项目,γ为预设权值,t为当前时间,tu,k为项目k的生成时间,simi,k为项目i与项目k的相似度,ru,k为用户u对项目k的评分。
需要说明的是,本发明实施例中项目推荐装置的模块也可以位于不同的网元中,使用网络传输协议进行数据交互,以达到项目推荐的目的。
实施例
本实施例以向用户推荐手机应用程序为例,对本发明做进一步说明。
图5为本发明一实施例中的推荐装置进行项目推荐的处理流程示意图,包括以下步骤:
(1)数据获取:获取手机应用程序的评分信息和文本信息、评分用户访问手机应用程序的时长以及手机应用程序的生成时间、更新时间。
(2)数据处理:根据数据获取阶段获得的数据,形成手机应用程序的特征向量F为(V,θd,T),其中,时间特征向量v根据用户对手机应用程序的评分确定;语义特征向量θd根据LDA模型,确定预设的K个主题在每个手机应用程序的评价文本d上的分布(θd1,θd2...θdK)确定;时间特征向量T根据手机应用程序被给予评分的用户使用的平均时长Tv、所述手机应用程序的生成时间Tg和所述手机应用程序的更新时间Tu确定。
(3)数据分析:使用余弦度量的方式确定手机应用程序i与手机应用程序j的相似度sim(i,j)为其中,Fik为手机应用程序i的特征向量Fi的第k维,Fjk为手机应用程序j的特征向量Fj的第k维,Fik为手机应用程序i的特征向量Fi的维数,Fj与Fi的维数为预设主题数量K。
(4)预测评分:根据所述确定的相似度sim(i,j)、以及待评分手机应用程序与已评分手机应用程序生成时间的差值,确定用户u对所述手机应用程序中对应用户u的待评分手机应用程序i的预测评分ru,i其中,S为所述手机应用程序的集合,k为手机应用程序集合S中的任一个手机应用程序,α为LDA模型参数,t为当前时间,tu,k为向量Tg中与用户u和手机应用程序k对应的元素,为手机应用程序k的生成时间,simi,k为手机应用程序i与手机应用程序k的相似度,ru,k为用户对手机应用程序k的评分。
(5)项目推荐:根据用户u对待评分手机应用程序的预测评分进行排序,选取出预设数量的预测评分最高待评分手机应用程序,作为候选的手机应用程序的推荐给用户u。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。

Claims (10)

1.一种项目推荐方法,其特征在于,所述方法包括:
获取项目的文本信息和评分信息;
根据所述项目的文本信息,确定基于所述项目的主题的语义特征向量;
将所述项目的评分确定为所述项目的历史特征向量,根据所述历史特征向量和所述语义特征向量,确定所述项目的特征向量,并根据所述特征向量确定所述项目中对应于用户的待评分项目的预测评分;
将预测评分最高的预设数量的待评分项目确定为向所述用户推荐的项目。
2.根据权利要求1所述的方法,其特征在于,所述根据项目的文本信息,确定基于所述项目的主题的语义特征向量,包括:
根据所述项目的文本d,确定预设的K个主题在文本d上的分布θd为(θd1,θd2...θdK),并将所述预设的K个主题在文本d上的分布θd确定为所述项目的语义特征向量。
3.根据权利要求1所述的方法,其特征在于,所述根据所述项目的评分对应的历史特征向量、以及所述语义特征向量,确定所述项目的特征向量,包括:
将所述项目的评分确定为所述项目的历史特征向量V,根据所述历史特征向量和所述语义特征向量θd,确定所述项目的特征向量F为(V,θd)。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据给予所述项目评分的用户使用所述项目的平均时长Tv、所述项目的生成时间Tg和所述项目的更新时间Tu,确定所述项目的时间特征向量T为(Tv,Tg,Tu);相应的,所述确定所述项目的特征向量,包括:根据所述历史特征向量V、所述语义特征向量θd和所述时间特征向量T,确定所述项目的特征向量F为(V,θd,T)。
5.根据权利要求1、2、3或4所述的方法,其特征在于,所述根据所述确定的特征向量确定用户对所述项目中对应所述用户的待评分项目的预测评分,包括:
根据所述确定的特征向量F,确定所述项目中项目i与项目j的相似度sim(i,j),根据所述确定的相似度sim(i,j)确定用户u对所述项目中对应用户u的待评分项目i的预测评分r,ui其中,S为所述项目的集合,k为项目集合S中的任一个项目,γ为预设权值,t为当前时间,tu,k为项目k的生成时间,simi,k为项目i与项目k的相似度,ru,k为用户u对项目k的评分。
6.一种项目推荐装置,其特征在于,所述推荐装置包括:第一获取单元、第二确定单元、第三确定单元和第四确定单元;其中,
所述第一获取单元,用于获取项目的文本信息和评分信息;
所述第二确定单元,用于根据所述项目的文本信息,确定基于所述项目的主题的语义特征向量;
所述第三确定单元,用于将所述项目的评分确定为所述项目的历史特征向量,根据所述历史特征向量和所述语义特征向量,确定所述项目的特征向量;
所述第四确定单元,用于根据所述特征向量确定所述项目中对应于用户的待评分项目的预测评分;将预测评分最高的预设数量的待评分项目确定为向所述用户推荐的项目。
7.根据权利要求6所述的推荐装置,其特征在于,
所述第二确定单元,还用于根据所述项目的文本d,确定预设的K个主题在文本d上的分布θd为(θd1,θd2...θdK),并将所述预设的K个主题在文本d上的分布θd确定为所述项目的语义特征向量。
8.根据权利要求6所述的推荐装置,其特征在于,
所述第三确定单元,还用于将所述项目的评分确定为所述项目的历史特征向量V,根据所述历史特征向量和所述语义特征向量θd,确定所述项目的特征向量F为(V,θd)。
9.根据权利要求6所述的推荐装置,其特征在于,所述推荐装置还包括:
第五确定单元,用于根据给予所述项目评分的用户使用所述项目的平均时长Tv、所述项目的生成时间Tg和所述项目的更新时间Tu,确定所述项目的时间特征向量T为(Tv,Tg,Tu);相应的,所述确定所述项目的特征向量,包括:根据所述历史特征向量V、所述语义特征向量θd和所述时间特征向量T,确定所述项目的特征向量F为(V,θd,T);
所述第三确定单元,还用于根据所述历史特征向量V、所述语义特征向量θd和所述时间特征向量T,确定所述项目的特征向量F为(V,θd,T)。
10.根据权利要求6、7、8或9所述的推荐装置,其特征在于,
所述第四确定单元,还用于根据所述确定的特征向量F,确定所述项目中项目i与项目j的相似度sim(i,j),根据所述确定的相似度sim(i,j)确定用户u对所述项目中对应用户u的待评分项目i的预测评分ru,i其中,S为所述项目的集合,k为项目集合S中的任一个项目,γ为预设权值,t为当前时间,tu,k为项目k的生成时间,simi,k为项目i与项目k的相似度,ru,k为用户u对项目k的评分。
CN201310133004.2A 2013-04-16 2013-04-16 项目推荐方法和装置 Active CN104111925B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310133004.2A CN104111925B (zh) 2013-04-16 2013-04-16 项目推荐方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310133004.2A CN104111925B (zh) 2013-04-16 2013-04-16 项目推荐方法和装置

Publications (2)

Publication Number Publication Date
CN104111925A true CN104111925A (zh) 2014-10-22
CN104111925B CN104111925B (zh) 2017-11-03

Family

ID=51708720

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310133004.2A Active CN104111925B (zh) 2013-04-16 2013-04-16 项目推荐方法和装置

Country Status (1)

Country Link
CN (1) CN104111925B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104715399A (zh) * 2015-04-09 2015-06-17 苏州大学 一种评分预测方法与系统
CN105653840A (zh) * 2015-12-21 2016-06-08 青岛中科慧康科技有限公司 基于词句分布表示的相似病例推荐系统及相应的方法
CN106294859A (zh) * 2016-08-22 2017-01-04 南京邮电大学盐城大数据研究院有限公司 一种基于属性耦合矩阵分解的项目推荐方法
CN109492092A (zh) * 2018-09-29 2019-03-19 北明智通(北京)科技有限公司 基于lda主题模型的文献分类方法和系统
CN109902222A (zh) * 2018-11-30 2019-06-18 华为技术有限公司 一种推荐方法及装置
CN110019763A (zh) * 2017-12-27 2019-07-16 北京京东尚科信息技术有限公司 文本过滤方法、系统、设备及计算机可读存储介质
CN110163476A (zh) * 2019-04-15 2019-08-23 重庆金融资产交易所有限责任公司 项目智能推荐方法、电子装置及存储介质
CN112199939A (zh) * 2020-11-12 2021-01-08 深圳供电局有限公司 一种评审专家智能推荐方法和存储介质
CN113688314A (zh) * 2021-08-13 2021-11-23 今彩慧健康科技(苏州)有限公司 一种理疗门店推荐方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120124050A1 (en) * 2010-11-16 2012-05-17 Electronics And Telecommunications Research Institute System and method for hs code recommendation
CN102929928A (zh) * 2012-09-21 2013-02-13 北京格致璞科技有限公司 基于多维相似度的个性化新闻推荐方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120124050A1 (en) * 2010-11-16 2012-05-17 Electronics And Telecommunications Research Institute System and method for hs code recommendation
CN102929928A (zh) * 2012-09-21 2013-02-13 北京格致璞科技有限公司 基于多维相似度的个性化新闻推荐方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ZHI-SHENG CHEN.ETC: "A Kernel Framework for Content-Based Artist Recommendation System in Music", 《IEEE TRANSACTIONS ON MULTIMEDIA》 *
高建煌: "个性化推荐系统技术与应用", 《中国优秀硕士学位论文全文数据库》 *

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104715399A (zh) * 2015-04-09 2015-06-17 苏州大学 一种评分预测方法与系统
CN104715399B (zh) * 2015-04-09 2018-03-02 苏州大学 一种评分预测方法与系统
CN105653840A (zh) * 2015-12-21 2016-06-08 青岛中科慧康科技有限公司 基于词句分布表示的相似病例推荐系统及相应的方法
CN106294859A (zh) * 2016-08-22 2017-01-04 南京邮电大学盐城大数据研究院有限公司 一种基于属性耦合矩阵分解的项目推荐方法
CN110019763A (zh) * 2017-12-27 2019-07-16 北京京东尚科信息技术有限公司 文本过滤方法、系统、设备及计算机可读存储介质
CN110019763B (zh) * 2017-12-27 2022-04-12 北京京东尚科信息技术有限公司 文本过滤方法、系统、设备及计算机可读存储介质
CN109492092A (zh) * 2018-09-29 2019-03-19 北明智通(北京)科技有限公司 基于lda主题模型的文献分类方法和系统
CN109492092B (zh) * 2018-09-29 2020-07-17 北京智通云联科技有限公司 基于lda主题模型的文献分类方法和系统
CN109902222A (zh) * 2018-11-30 2019-06-18 华为技术有限公司 一种推荐方法及装置
US11586941B2 (en) 2018-11-30 2023-02-21 Huawei Technologies Co., Ltd. Recommendation method and apparatus
CN110163476A (zh) * 2019-04-15 2019-08-23 重庆金融资产交易所有限责任公司 项目智能推荐方法、电子装置及存储介质
CN112199939A (zh) * 2020-11-12 2021-01-08 深圳供电局有限公司 一种评审专家智能推荐方法和存储介质
CN112199939B (zh) * 2020-11-12 2024-02-20 深圳供电局有限公司 一种评审专家智能推荐方法和存储介质
CN113688314A (zh) * 2021-08-13 2021-11-23 今彩慧健康科技(苏州)有限公司 一种理疗门店推荐方法及装置
CN113688314B (zh) * 2021-08-13 2024-03-19 今彩慧健康科技(苏州)有限公司 一种理疗门店推荐方法及装置

Also Published As

Publication number Publication date
CN104111925B (zh) 2017-11-03

Similar Documents

Publication Publication Date Title
US20230281230A1 (en) Automatically assessing structured data for decision making
CN104111925A (zh) 项目推荐方法和装置
US9292877B2 (en) Methods and systems for generating concept-based hash tags
CN104239331B (zh) 一种用于实现评论搜索引擎排序的方法和装置
CN110059255B (zh) 一种浏览器导航方法、装置及介质
CN108334489B (zh) 文本核心词识别方法和装置
Tran et al. Hashtag recommendation approach based on content and user characteristics
CN104636371A (zh) 信息推荐方法及设备
CN103577549A (zh) 一种基于微博标签的人群画像系统和方法
CN103838756A (zh) 一种确定推送信息的方法及装置
CN108334588B (zh) 一种用户标签构建方法及装置
CN103577452A (zh) 用于丰富网站内容的方法和装置、网站服务器
CN109284367B (zh) 用于处理文本的方法和装置
KR101450453B1 (ko) 컨텐츠 추천 방법 및 장치
CN112948575B (zh) 文本数据处理方法、装置和计算机可读存储介质
CN113792212A (zh) 多媒体资源推荐方法、装置、设备以及存储介质
CN112328889A (zh) 推荐搜索词确定方法、装置、可读介质及电子设备
CN111078997A (zh) 一种资讯推荐方法及装置
Ma et al. Content Feature Extraction-based Hybrid Recommendation for Mobile Application Services.
KR101542417B1 (ko) 사용자 선호도 학습 방법 및 장치
CN106570003B (zh) 数据推送方法及装置
CN114036921A (zh) 一种政策信息匹配方法和装置
CN114880498B (zh) 事件信息展示方法及装置、设备和介质
CN113378015B (zh) 搜索方法、装置、电子设备、存储介质和程序产品
CN115564534A (zh) 文案处理方法、装置、电子设备、存储介质及程序产品

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant