CN104376010B - 用户推荐方法和装置 - Google Patents

用户推荐方法和装置 Download PDF

Info

Publication number
CN104376010B
CN104376010B CN201310354181.3A CN201310354181A CN104376010B CN 104376010 B CN104376010 B CN 104376010B CN 201310354181 A CN201310354181 A CN 201310354181A CN 104376010 B CN104376010 B CN 104376010B
Authority
CN
China
Prior art keywords
user
label
interest
tag
score corresponding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310354181.3A
Other languages
English (en)
Other versions
CN104376010A (zh
Inventor
程刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201310354181.3A priority Critical patent/CN104376010B/zh
Priority to PCT/CN2014/084402 priority patent/WO2015021937A1/zh
Publication of CN104376010A publication Critical patent/CN104376010A/zh
Application granted granted Critical
Publication of CN104376010B publication Critical patent/CN104376010B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种用户推荐方法,所述方法包括:读取用户的兴趣标签和所述兴趣标签对应的分值;读取用户的擅长标签和所述擅长标签对应的分值;根据所述兴趣标签对应的分值和所述擅长标签对应的分值生成两个用户之间的匹配度;根据所述匹配度选取待推荐用户进行推荐。该用户推荐方法能够减少冗余信息的推送,节省网络资源。此外,还提供了一种用户推荐装置。

Description

用户推荐方法和装置
技术领域
本发明涉及网络技术领域,特别是涉及一种用户推荐方法和装置。
背景技术
传统的用户推荐方法通常采用基于好友关系的推荐方式,比如,若两个用户有共同的好友或共同关注了某些人,则可将其中一个用户推荐给另一个用户。
然而,发明人发现现有技术中至少存在以下技术问题:
基于好友关系的推荐方式虽然可以有效拓展用户的社交关系,但是仅依赖用户的好友关系或者关注人的话,推荐给用户的人往往不符合用户所需,从而造成用户推荐的盲目性,这样,必然会造成大量冗余信息的推送,从而浪费了网络资源。
发明内容
基于此,有必要针对上述技术问题,提供一种能减少冗余信息推送,从而节省网络资源的用户推荐方法和装置。
一种用户推荐方法,所述方法包括:
读取用户的兴趣标签和所述兴趣标签对应的分值;
读取用户的擅长标签和所述擅长标签对应的分值;
根据所述兴趣标签对应的分值和所述擅长标签对应的分值生成两个用户之间的匹配度;
根据所述匹配度选取待推荐用户进行推荐。
一种用户推荐装置,所述装置包括:
兴趣标签读取模块,用于读取用户的兴趣标签和所述兴趣标签对应的分值;
擅长标签读取模块,用于读取用户的擅长标签和所述擅长标签对应的分值;
第一匹配度生成模块,用于根据所述兴趣标签对应的分值和所述擅长标签对应的分值生成两个用户之间的匹配度;
用户推荐模块,用于根据所述匹配度选取待推荐用户进行推荐。
上述用户推荐方法和装置,由于兴趣标签表示了用户感兴趣的领域或词汇,而擅长标签表示了用户擅长的领域或词汇,通过兴趣标签对应的分值和擅长标签对应的分值来生成两个用户之间的匹配度,从而将两个用户的兴趣和擅长进行相互匹配,根据匹配度选取待推荐用户进行推荐,推荐给用户的人很可能是用户对其感兴趣的内容比较擅长的,或者对其擅长的内容比较感兴趣的,从而使得推荐给用户的人更能满足用户所需,避免了用户推荐的盲目性,从而减少了冗余信息的推送,节省了网络资源。
附图说明
图1为一个实施例中用户推荐方法的流程示意图;
图2为一个实施例中挖掘用户的兴趣标签的流程示意图;
图3为另一个实施例中挖掘用户的兴趣标签的流程示意图;
图4为一个实施例中根据专业相关数据挖掘用户的擅长标签的流程示意图;
图5为另一个实施例中根据专业相关数据挖掘用户的擅长标签的流程示意图;
图6为一个实施例中根据专业相关数据和个人信息挖掘用户的擅长标签的流程示意图;
图7为图6所示实施例提供的挖掘用户的擅长类别的流程示意图;
图8为一个实施例中生成两个用户之间的匹配度的流程示意图;
图9为另一个实施例中生成两个用户之间的匹配度的流程示意图;
图10为一个实施例中用户推荐装置的结构框图;
图11为另一个实施例中用户推荐装置的结构框图;
图12为一个实施例中兴趣标签挖掘模块的结构框图;
图13为另一个实施例中兴趣标签挖掘模块的结构框图;
图14为再一个实施例中用户推荐装置的结构框图;
图15为一个实施例中第一擅长标签挖掘模块的结构框图;
图16为另一个实施例中第一擅长标签挖掘模块的结构框图;
图17为又一个实施例中用户推荐装置的结构框图;
图18为一个实施例中第二擅长标签挖掘模块的结构框图;
图19为另一个实施例中第二擅长标签挖掘模块的结构框图;
图20为一个实施例中匹配度生成模块的结构框图;
图21为另一个实施例中匹配度生成模块的结构框图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,在一个实施例中,提供了一种用户推荐方法,该方法以应用在各种服务器中进行举例说明,包括:
步骤102,读取用户的兴趣标签和兴趣标签对应的分值。
服务器预先存储了与用户标识对应的兴趣标签和兴趣标签对应的分值,其中兴趣标签包括标签词和标签词所属类别,用以表征用户感兴趣的内容。如兴趣标签可以是“外科疾病”,表示用户对外科疾病的内容感兴趣,兴趣标签也可以是“军事”,表示用户对军事类别的内容感兴趣,等。而兴趣标签对应的分值表示用户对标签的相关内容感兴趣的程度。
步骤104,读取用户的擅长标签和擅长标签对应的分值。
服务器预先存储了与用户标识对应的擅长标签和擅长标签对应的分值,其中擅长标签包括标签词和标签词所属类别,用以表征用户擅长的内容。如擅长标签可以是“法律”,表示用户对法律类别的内容比较擅长,等。而擅长标签对应的分值则表示用户对该标签的相关内容擅长的程度。
本实施例中,用户的兴趣标签可预先从用户大量的线上行为数据挖掘出来,而兴趣标签对应的分值则可通过对用户的线上行为数据中的文档进行处理得到。用户的擅长标签可预先从用户大量的专业相关数据中挖掘出来,而擅长标签对应的分值则可通过对用户的专业相关数据中的文档进行处理得到。得到每个用户的兴趣标签、兴趣标签对应的分值、擅长标签和擅长标签对应的分值后,可存储在服务器中,以便在推荐用户的时候读取出来进行处理。
步骤106,根据兴趣标签对应的分值和擅长标签对应的分值生成两个用户之间的匹配度。
具体的,两个用户之间的匹配度表示了其中一个用户的兴趣标签与另一个用户的擅长标签匹配、以及该用户的擅长标签与另一个用户的兴趣标签匹配的程度。对于两个用户,可将其中一个用户的兴趣标签匹配另一个用户的擅长标签,得到该用户的兴趣标签和另一个用户的擅长标签的相似度,以及将该用户的擅长标签匹配另一个用户的兴趣标签,得到该用户的擅长标签和另一个用户的兴趣标签的相似度,然后结合兴趣标签对应的分值和擅长标签对应的分值从而生成得到两个用户之间的匹配度。
步骤108,根据匹配度选取待推荐用户进行推荐。
本实施例中,对于服务器中的每个用户,都可以生成该用户与服务器中的其他用户之间的匹配度。这样,在确定该用户的推荐列表时,可选取匹配度最高的预设数量的待推荐用户进行推荐。例如,可选取与该用户的匹配度最高的前100个待推荐用户进行推荐。进一步的,可获取选取的待推荐用户的个人信息,包括用户所在SNS社区的昵称、头像等信息,将这些信息通过网络发送至用户所在终端。
本实施例中,通过兴趣标签对应的分值和擅长标签对应的分值来生成两个用户之间的匹配度,从而将两个用户的兴趣和擅长进行相互匹配,根据匹配度选取待推荐用户进行推荐,推荐给用户的人很可能是用户对其感兴趣的内容比较擅长的,或者对其擅长的内容比较感兴趣的,从而使得推荐给用户的人更能满足用户所需,避免了用户推荐的盲目性,从而减少了冗余信息的推送,节省了网络资源。
在一个实施例中,用户推荐方法还包括:收集用户的线上行为数据,根据用户的线上行为数据挖掘用户的兴趣标签。
用户的线上行为数据为用户使用各种网络应用所形成的数据,包括但不限于用户在搜索网站中的搜索关键词、用户在微博上发布的微博、用户在SNS社区中发表的日志、评论等、用户的群聊天记录、用户在问答社区的提问或回答和用户在论坛上发表的帖子或回复,等等。对于每个用户,可从不同的业务服务器中获取到与该用户标识对应的线上行为数据,进而根据线上行为数据挖掘出该用户的兴趣标签,并对应用户标识进行存储。
进一步的,在一个实施例中,如图2所示,根据线上行为数据挖掘用户的兴趣标签,包括:
步骤202,对线上行为数据中的文档进行分词。
本实施例中,可提取出用户的线上行为数据中的文档,然后采用传统的分词方法对文档中的内容进行分割,并去除掉一些常见的副词、动词和名词,如“你”、“我”、“的”、“得”等,得到多个标签词。
步骤204,计算分词后得到的标签词对应的分值为标签词的词频与用户的所有标签词的词频总和的比率。
步骤204中,统计分词后得到的标签词的词频,即该标签词出现的频率,按照如下公式计算每个标签词对应的分值:
Figure BDA00003667301000051
其中,Ins(x)表示标签词x对应的分值,pv(x)表示标签词x的词频,pv(all)表示该用户的所有标签词的词频总和。
步骤206,根据标签词对应的分值选取标签词作为用户的兴趣标签。
具体的,可根据标签词对应的分值选取分值最大的预设数量的标签词作为用户的兴趣标签。比如,选取分值最大的10个标签词作为用户的兴趣标签。
在另一个实施例中,如图3所示,根据线上行为数据挖掘用户的兴趣标签,包括:
步骤302,对线上行为数据中的文档进行分词。
步骤304,对分词后得到的标签词进行归类。
具体的,可人工对分词后得到的标签词进行归类,也可按照传统的机器学习的方法对标签词进行归类。比如,标签词所属类别包括:科技、教育、军事、医学等。
步骤306,计算分词后得到的标签词对应的分值为标签词的词频与用户的所有标签词的词频总和的比率。
步骤308,根据标签词对应的分值计算标签词所属类别对应的分值。
本实施例中,可获取用户在每个类别下的标签词和标签词的分值,则用户在每个类别对应的分值为该类别下的标签词的分值的总和。例如,标签词所属类别包括A、B和C三个类别,在A类别下的标签词和对应的分值包括{tagA1:3分}、{tagA2:2分}和{tagA3:3分},在B类别下的标签词和对应的分值包括:{tagB1:2分}和{tagB2:1分},在C类别下的标签词和对应的分值包括{tagC1:3分},则该用户的A类别对应的分值为6分,B类别对应的分值为4分,C类别对应的分值为3分。
步骤310,根据标签词所属类别对应的分值选取类别作为用户的兴趣类别。
具体的,可选取标签词所属类别对应的分值最大的预设数量的类别作为用户的兴趣类别,比如,选取分值最大的2个类别作为用户的兴趣类别。本实施例中,还可根据标签词对应的分值选取标签词作为用户的兴趣标签,比如选取分值最大的8个标签词作为用户的兴趣标签。本实施例中,每个用户的兴趣标签包括用户感兴趣的类别和标签词,使得后续在生成匹配度时,除了可根据标签词对应的分值进行计算外,还可根据类别对应的分值进行计算。
在一个实施例中,用户推荐方法还包括:收集用户的专业相关数据,根据专业相关数据挖掘用户的擅长标签。
用户的专业相关数据,是指用户使用各种网络应用产生的与专业相关的数据,包括问答社区数据、专业论坛数据中的至少一种,其中问答社区数据是指用户在问答社区的提问和问答等,专业论坛数据是指用户在一些专业论坛发表的帖子和回帖等。进一步的,可从与专业相关的业务服务器中获取到与用户标识对应的专业相关数据,进而根据专业相关数据挖掘出每个用户的擅长标签,并对应用户标识进行存储。
进一步的,在一个实施例中,根据专业相关数据挖掘用户擅长标签,包括:
步骤402,对专业相关数据中的文档进行分词。
如上所述,可提取出用户的专业相关数据中的文档,然后采用传统的分词方法对文档中的内容进行分割,并去除掉一些常见的副词、动词和名词,如“你”、“我”、“的”、“得”等,得到多个标签词。
步骤404,计算分词后得到的标签词对应的分值为标签词的词频与用户的所有标签词的词频总和的比率。
步骤404中,统计分词后得到的标签词的词频,即该标签词出现的频率,按照如下公式计算每个标签词对应的分值:
Figure BDA00003667301000071
其中,Expert(x)表示标签词x对应的分值,ev(x)表示标签词x的词频,ev(all)表示该用户的所有标签词的词频总和。
步骤406,根据标签词对应的分值选取标签词作为用户的擅长标签。
具体的,可根据标签词对应的分值选取分值最大的预设数量的标签词作为用户的擅长标签。比如,选取分值最大的10个标签词作为用户的擅长标签。
在另一个实施例中,如图5所示,根据专业相关数据挖掘用户的擅长标签,包括:
步骤502,对专业相关数据中的文档进行分词。
步骤504,对分词后得到的标签词进行归类。
具体的,可人工对分词后得到的标签词进行归类,也可按照传统的机器学习的方法对标签词进行归类。比如,标签词所属类别包括:科技、教育、军事、医学等。
步骤506,计算分词后得到的标签词对应的分值为标签词的词频与用户的所有标签词的词频总和的比率。
步骤508,根据标签词对应的分值计算标签词所属类别对应的分值。
本实施例中,可获取用户在每个类别下的标签词和标签词的分值,则用户在每个类别对应的分值为该类别下的标签词的分值的总和。
步骤510,根据标签词所属类别对应的分值选取类别作为用户的擅长标签。
具体的,可选取标签词所属类别对应的分值最大的预设数量的类别作为用户的擅长类别,比如,选取分值最大的2个类别作为用户的擅长类别。本实施例中,还可根据标签词对应的分值选取标签词作为用户的擅长标签,比如选取分值最大的8个标签词作为用户的擅长标签。本实施例中,每个用户的擅长标签包括用户擅长的类别和标签词,使得后续在生成匹配度时,除了可根据标签词对应的分值进行计算外,还可根据类别对应的分值进行计算。
在另一个实施例中,还提供了另一种挖掘用户的擅长标签的方式,具体的,用户推荐方法还包括:收集用户的专业相关数据和个人信息,根据专业相关数据和个人信息挖掘用户的擅长标签。
如上所述,专业相关数据包括问答社区数据、专业论坛数据中的至少一种。用户的个人信息包括但不限于用户的教育、工作、年龄和职业等信息。具体的,可从不同的业务服务器中获取到与用户标识对应的个人信息,这些个人信息可以是用户登录网络应用所填写的个人信息,也可以是用户所在群组中的个人信息等。
进一步的,在一个实施例中,如图6所示,根据专业相关数据和个人信息挖掘用户的擅长标签,包括:
步骤602,对专业相关数据中的文档进行分词。
步骤604,计算分词后得到的标签词对应的词频概率为标签词的词频与用户的所有标签词的词频总和的比率。
关于分词和计算标签词的词频概率的过程如上所述,在此则不再赘述。
步骤606,根据个人信息获取对应的标签词,以及根据个人信息计算获取到的标签词对应的置信度。
具体的,预先可设置与一些专业相关的词汇对应的标签词,则可根据用户的个人信息中与专业相关的词汇获取到对应的标签词。例如,用户的职业为“律师”,则获取到与“律师”对应的标签词为“法律”,又例如,用户所在群组为“XX律师事务所”,则获取到对应到标签词为“法律”。进一步的,预先可设置置信度函数,其取值为0~1,可根据个人信息中与专业相关的词汇的来源来确定对应的标签词所对应的置信度函数的取值。如,若用户的职业为用户填写的,则该职业所对应的标签词的置信度为1,若用户所在群组中一共有10个成员,其中8个成员的职业都为“律师”,则该用户的标签词“法律”的置信度的取值为0.8。
步骤608,根据标签词对应的词频概率和置信度进行拟合,得到标签词对应的分值。
具体的,可按照如下公式计算标签词对应的分值:
Fin_expert(x)=γ*Expert(x)+λ*Profession(x)
其中,Fin_expert(x)表示标签词x对应的分值,Expert(x)表示标签词x的词频概率,Profession(x)表示标签词x的置信度,γ和λ为常数,且γ+λ=1。优选的,γ可取值为0.7,λ可取值为0.3。
步骤610,根据标签词对应的分值选取标签词作为用户的擅长标签。
计算出每个标签次对应的分值后,可选取分值最大的预设数量的标签词作为用户的擅长标签。本实施例中,根据用户的专业相关数据和个人信息来挖掘用户的擅长标签,所挖掘出的擅长标签更能体现用户所擅长的内容,因此更具有准确性。
进一步的,在一个实施例中,在图6所示实施例的基础上,根据专业相关数据和个人信息挖掘用户的擅长标签,还包括:
步骤702,根据分词后得到的标签进行归类。
步骤704,根据标签词对应的分值计算标签词所属类别对应的分值。
步骤706,根据标签词所属类别对应的分值选取类别作为用户的擅长类别。
本实施例中,根据用户的专业相关数据和个人信息挖掘出的擅长标签除了包含擅长的标签词外还包含擅长类别,后续则可根据擅长的标签词对应的分值和擅长类别来计算两个用户之间的匹配度,使得推荐给用户的人更符合用户所需,进一步减少了冗余信息的推送,节省了网络资源。
在一个实施例中,如图8所示,根据兴趣标签对应的分值和擅长标签对应的分值生成两个用户之间的匹配度,包括:
步骤802,将第一用户的兴趣标签匹配第二用户的擅长标签,获取第一用户的兴趣标签与第二用户的擅长标签的第一相似度。
具体的,当用第一用户的兴趣标签去匹配第二用户的擅长标签时,可采用机器学习的方式来得到第一用户的兴趣标签与第二用户的擅长标签之间的第一相似度,例如,可在海量用户的线上行为数据中统计兴趣标签和擅长标签共同出现的次数来计算得到第一用户的兴趣标签与第二用户的擅长标签之间的第一相似度。在一个实施例中,也可判断第一用户的兴趣标签和第二用户的擅长标签是否相同,若相同,则第一相似度取值为1,若不相同,则第一相似度取值为0。
步骤804,将第一用户的擅长标签匹配第二用户的兴趣标签,获取第一用户的擅长标签与第二用户的兴趣标签的第二相似度。
具体的,当用第一用户的擅长标签去匹配第二用户的兴趣标签时,也可采用机器学习的方式来得到第二相似度。在一个实施例中,也可判断第一用户的擅长标签和第二用户的兴趣标签是否相同,若相同,则第二相似度取值为1,若不相同,则第二相似度取值为0。
步骤806,根据第一用户的兴趣标签对应的分值、第二用户的擅长标签对应的分值、第一用户的擅长标签对应的分值、第二用户的兴趣标签对应的分值、第一相似度和第二相似度计算第一用户和第二用户之间的匹配度。
本实施例中,兴趣标签为表示兴趣的标签词,擅长标签为表示擅长的标签词。在一个实施例中,当用第一用户的兴趣标签去匹配第二用户的擅长标签时,则将第一用户的兴趣标签对应的分值、第二用户的擅长标签对应的分值和第一相似度相乘;当用第一用户的擅长标签去匹配第二用户的兴趣标签时,则将第一用户的擅长标签对应的分值、第二用户的兴趣标签对应的分值和第二相似度相乘;最后将所有得到的乘值相加,即为第一用户和第二用户之间的匹配度。
进一步的,在一个实施例中,在步骤806中,可按照如下公式计算第一用户和第二用户之间的匹配度:
Figure BDA00003667301000101
其中,match_score(a,b)为第一用户a与第二用户b之间的匹配度,n为第一用户a的标签个数,m为第二用户b的标签个数,α和β为常数。优选的,α和β相等,取值都为0.5。
当将第一用户a的兴趣标签匹配第二用户b的擅长标签时,match(x,y)为第一相似度,wx为第一用户a的兴趣标签对应的分值,wy为第二用户b的擅长标签对应的分值;当将第一用户a的擅长标签匹配第二用户b的兴趣标签时,match(x,y)为第二相似度,wx为第一用户a的擅长标签的对应的分值,wy为第二用户b的兴趣标签对应的分值。
在一个优选的实施例中,match(x,y)取值可为1或0,即:当第一用户的兴趣标签和第二用户的擅长标签相同,或者第一用户的擅长标签和第二用户的兴趣标签相同时,则取值为1,否则取值为0。这样,可以简化运算,提高处理效率。
在另一个实施例中,还可采用兴趣类别和擅长类别来计算两个用户之间的匹配度。本实施例中,兴趣标签包括兴趣类别,擅长标签包括擅长类别;根据兴趣标签对应的分值和擅长标签对应的分值生成两个用户之间的匹配度,则包括:根据兴趣类别对应的分值和擅长类别对应的分值生成两个用户之间的匹配度。
具体的,在一个实施例中,如图9所示,根据兴趣类别对应的分值和擅长类别对应的分值生成两个用户之间的匹配度,包括:
步骤902,将第一用户的兴趣标签匹配第二用户的擅长标签,获取第一用户的兴趣标签与第二用户的擅长标签的第一相似度。
步骤904,将第一用户的擅长标签匹配第二用户的兴趣标签,获取第一用户的擅长标签与第二用户的兴趣标签的第二相似度。
步骤906,根据第一用户的兴趣类别对应的分值、第二用户的擅长标类别对应的分值、第一用户的擅长类别对应的分值、第二用户的兴趣类别对应的分值、第一相似度和第二相似度计算第一用户和第二用户之间的匹配度。
在一个实施例中,当用第一用户的兴趣标签去匹配第二用户的擅长标签时,则将第一用户的兴趣类别对应的分值、第二用户的擅长类别对应的分值和第一相似度相乘;当用第一用户的擅长标签去匹配第二用户的兴趣标签时,则将第一用户的擅长类别对应的分值、第二用户的兴趣类别对应的分值和第二相似度相乘;最后将所有得到的乘值相加,即为第一用户和第二用户之间的匹配度。
进一步的,在一个实施例中,步骤906中,可按照如下公式计算所述第一用户和第二用户之间的匹配度:
Figure BDA00003667301000121
其中,match_score(a,b)为第一用户a与第二用户b之间的匹配度,n为第一用户a的类别个数,m为第二用户b的类别个数,α和β为常数;
当将第一用户a的兴趣标签匹配第二用户b的擅长标签时,match(x,y)为所述第一相似度,wx为第一用户a的兴趣类别对应的分值,wy为第二用户b的擅长类别对应的分值;
当将第一用户a的擅长标签匹配第二用户b的兴趣标签时,match(x,y)为所述第二相似度,wx为第一用户a的擅长类别的对应的分值,wy为第二用户b的兴趣类别对应的分值。
在一个优选的实施例中,match(x,y)取值可为1或0,即:当第一用户的兴趣标签和第二用户的擅长标签相同,或者第一用户的擅长标签和第二用户的兴趣标签相同时,则取值为1,否则取值为0。这样,可以简化运算,提高处理效率。
本实施例中,还可采用兴趣类别对应的分值和擅长类别对应的分值来参与计算两个用户之间的匹配度。进一步的,还可结合采用标签词参与计算得到的匹配度和采用类别参与计算的匹配度来得到两个用户之间的综合匹配度,最终根据两个用户之间的总和匹配度来选取匹配度最高的预设数量的用户进行推荐。如,对于一个用户集合B={b1,b2,b3,…,bn}和用户a进行匹配,得到用户集合B中每个用户与用户a之间的匹配度,最后选取其中匹配度最高的100个用户推荐给用户a。本实施例中,结合类别和标签词来参与计算,能够提高推荐的准确度,这种将兴趣和擅长交叉匹配的方式能够避免用户推荐的盲目性,从而减少冗余信息的推送,节省了网络资源。
如图10所示,在一个实施例中,还提供了一种用户推荐装置,包括:
兴趣标签读取模块1002,用于读取用户的兴趣标签和兴趣标签对应的分值。
擅长标签读取模块1004,用于读取用户的擅长标签和擅长标签对应的分值。
匹配度生成模块1006,用于根据兴趣标签对应的分值和擅长标签对应的分值生成两个用户之间的匹配度。
用户推荐模块1008,用于根据匹配度选取待推荐用户进行推荐。
在另一个实施例中,如图11所示,在图10所示实施例的基础上,用户推荐装置还包括:
兴趣标签挖掘模块1001,用于收集用户的线上行为数据,根据线上行为数据挖掘用户的兴趣标签。
进一步的,在一个实施例中,如图12所示,兴趣标签挖掘模块1001包括:
第一分词模块1001a,用于对线上行为数据中的文档进行分词。
第一分值计算模块1001b,用于计算分词后得到的标签词对应的分值为标签词的词频与用户的所有标签词的词频的比率。
兴趣标签选取模块1001c,用于根据标签词对应的分值选取标签词作为用户的兴趣标签。
在另一个实施例中,如图13所示,在图12所示实施例的基础上,兴趣标签挖掘模块1001还包括:
第一归类模块1001d,用于对分词后得到的标签词进行归类。
第一类别分值计算模块1001e,用于根据标签词对应的分值计算标签词所属类别对应的分值。
兴趣类别选取模块1001f,用于根据标签词所属类别对应的分值选取类别作为用户的兴趣类别。
如图14所示,在另一个实施例中,用户推荐装置还包括:
第一擅长标签挖掘模块1003,用于收集用户的专业相关数据,根据专业相关数据挖掘用户的擅长标签。
进一步的,在一个实施例中,如图15所示,第一擅长标签挖掘模块1003包括:
第二分词模块1003a,用于对专业相关数据中的文档进行分词。
第二分值计算模块1003b,用于计算分词后得到的标签词对应的分值为标签词的词频与用户的所有标签词的词频的比率。
第一擅长标签选取模块1003c,用于根据标签词对应的分值选取标签词作为用户的擅长标签。
在另一个实施例中,在图16所示,在图15所示实施例的基础上,第一擅长标签挖掘模块1003还包括:
第二归类模块1003d,用于对分词后得到的标签进行归类。
第二类别分值计算模块1003e,用于根据标签词对应的分值计算标签词所属类别对应的分值。
第一擅长类别选取模块1003f,用于根据标签词所述类别对应的分值选取类别作为用户的擅长类别。
在一个实施例中,如图17所示,用户推荐装置还包括:
第二擅长标签挖掘模块1005,用于收集用户的专业相关数据和个人信息,根据专业相关数据和个人信息挖掘用户的擅长标签。
进一步的,在一个实施例中,如图18所示,第二擅长标签挖掘模块1005包括:
第三分词模块1005a,用于对专业相关数据中的文档进行分词。
词频概率计算模块1005b,用于计算分词得到的标签词对应的词频概率为标签词的词频与用户的所有标签词的词频的比率。
置信度计算模块1005c,用于根据个人信息获取对应的标签词,以及根据个人信息计算获取的标签词所对应的置信度。
第三分值计算模块1005d,用于对标签词对应的词频概率和置信度进行拟合,得到标签词对应的分值。
第二擅长标签选取模块1005e,用于根据标签词对应的分值选取标签词作为用户的擅长标签。
在另一个实施例中,如图19所示,在图18所示实施例的基础上,第二擅长标签挖掘模块1005还包括:
第三归类模块1005f,用于对分词后得到的标签进行归类。
第三类别分值计算模块1005g,用于根据标签词对应的分值计算标签词所属类别对应的分值。
第二擅长类别选取模块1005h,用于根据标签词所述类别对应的分值选取类别作为用户的擅长类别。
具体的,在一个实施例中,如图20所示,匹配度生成模块1006包括:
第一匹配模块1006a,用于将第一用户的兴趣标签匹配第二用户的擅长标签,获取第一用户的兴趣标签与第二用户的擅长标签的第一相似度;以及用于将第一用户的擅长标签匹配第二用户的兴趣标签,获取第一用户的擅长标签与第二用户的兴趣标签的第二相似度。
第一匹配度计算模块1006b,用于根据第一用户的兴趣标签对应的分值、第二用户的擅长标签对应的分值、第一用户的擅长标签对应的分值、第二用户的兴趣标签对应的分值、第一相似度和第二相似度计算第一用户和第二用户之间的匹配度。
进一步的,在一个实施例中,第一匹配度计算模块1006b用于按照如下公式计算所述第一用户和第二用户之间的匹配度:
Figure BDA00003667301000151
其中,match_score(a,b)为第一用户a与第二用户b之间的匹配度,n为第一用户a的标签个数,m为第二用户b的标签个数,α和β为常数;
当将第一用户a的兴趣标签匹配第二用户b的擅长标签时,match(x,y)为所述第一相似度,wx为第一用户a的兴趣标签对应的分值,wy为第二用户b的擅长标签对应的分值;
当将第一用户a的擅长标签匹配第二用户b的兴趣标签时,match(x,y)为所述第二相似度,wx为第一用户a的擅长标签的对应的分值,wy为第二用户b的兴趣标签对应的分值。
在另一个实施例中,兴趣标签包括兴趣类别,擅长标签包括擅长类别;匹配度生成模块1006还用于根据兴趣类别对应的分值和擅长类别对应的分值生成两个用户之间的匹配度。
进一步的,如图21所示,匹配度生成模块1006包括:
第二匹配模块1006c,用于将第一用户的兴趣标签匹配第二用户的擅长标签,获取第一用户的兴趣标签与第二用户的擅长标签的第一相似度;以及用于将第一用户的擅长标签匹配第二用户的兴趣标签,获取第一用户的擅长标签与第二用户的兴趣标签的第二相似度。
第二匹配度计算模块1006d,用于根据第一用户的兴趣类别对应的分值、第二用户的擅长类别对应的分值、第一用户的擅长类别对应的分值、第二用户的兴趣类别对应的分值、第一相似度和第二相似度计算第一用户和第二用户之间的匹配度。
进一步的,在一个实施例中,第二匹配度计算模块1006d用于按照如下公式计算所述第一用户和第二用户之间的匹配度:
Figure BDA00003667301000161
其中,match_score(a,b)为第一用户a与第二用户b之间的匹配度,n为第一用户a的类别个数,m为第二用户b的类别个数,α和β为常数;
当将第一用户a的兴趣标签匹配第二用户b的擅长标签时,match(x,y)为所述第一相似度,wx为第一用户a的兴趣类别对应的分值,wy为第二用户b的擅长类别对应的分值;
当将第一用户a的擅长标签匹配第二用户b的兴趣标签时,match(x,y)为所述第二相似度,wx为第一用户a的擅长类别的对应的分值,wy为第二用户b的兴趣类别对应的分值。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (32)

1.一种用户推荐方法,所述方法包括:
读取用户的兴趣标签和所述兴趣标签对应的分值,所述兴趣标签表征用户感兴趣的内容,所述兴趣标签对应的分值表示用户对所述兴趣标签对应的内容的感兴趣程度;
读取用户的擅长标签和所述擅长标签对应的分值,所述擅长标签表征用户擅长的内容,所述擅长标签对应的分值表示用户对所述擅长标签对应的内容的擅长程度;
将第一用户的兴趣标签匹配第二用户的擅长标签,获取所述第一用户的兴趣标签与所述第二用户的擅长标签的第一相似度;
将第一用户的擅长标签匹配第二用户的兴趣标签,获取所述第一用户的擅长标签与第二用户的兴趣标签的第二相似度;
根据所述第一用户的兴趣标签对应的分值、第二用户的擅长标签对应的分值、第一用户的擅长标签对应的分值、第二用户的兴趣标签对应的分值、所述第一相似度和第二相似度计算第一用户和第二用户之间的匹配度;
根据所述匹配度选取待推荐用户,将所述待推荐用户的信息,推送给用户的终端。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
收集用户的线上行为数据,根据所述线上行为数据挖掘用户的兴趣标签。
3.根据权利要求2所述的方法,其特征在于,所述根据所述线上行为数据挖掘用户的兴趣标签,包括:
对所述线上行为数据中的文档进行分词;
计算分词后得到的标签词对应的分值为标签词的词频与用户的所有标签词的词频总和的比率;
根据所述标签词对应的分值选取标签词作为用户的兴趣标签。
4.根据权利要求3所述的方法,其特征在于,所述根据所述线上行为数据挖掘用户的兴趣标签,还包括:
对所述分词后得到的标签词进行归类;
根据所述标签词对应的分值计算标签词所属类别对应的分值;
根据所述标签词所属类别对应的分值选取类别作为用户的兴趣类别。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
收集用户的专业相关数据,根据所述专业相关数据挖掘用户的擅长标签;
所述专业相关数据包括问答社区数据、专业论坛数据中的至少一种。
6.根据权利要求5所述的方法,其特征在于,所述根据所述专业相关数据挖掘用户的擅长标签,包括:
对所述专业相关数据中的文档进行分词;
计算分词后得到的标签词对应的分值为标签词的词频与用户的所有标签词的词频总和的比率;
根据所述标签词对应的分值选取标签词作为用户的擅长标签。
7.根据权利要求6所述的方法,其特征在于,所述根据所述专业相关数据挖掘用户的擅长标签,还包括:
对所述分词后得到的标签进行归类;
根据所述标签词对应的分值计算标签词所属类别对应的分值;
根据所述标签词所属类别对应的分值选取类别作为用户的擅长类别。
8.根据权利要求1所述的方法,其特征在于,所述方法还包括:
收集用户的专业相关数据和个人信息,根据所述专业相关数据和个人信息挖掘用户的擅长标签;
所述专业相关数据包括问答社区数据、专业论坛数据中的至少一种。
9.根据权利要求8所述的方法,其特征在于,所述根据所述专业相关数据和个人信息挖掘用户的擅长标签,包括:
对所述专业相关数据中的文档进行分词;
计算分词得到的标签词对应的词频概率为所述标签词的词频与用户的所有标签词的词频总和的比率;
根据所述个人信息获取对应的标签词,以及根据所述个人信息计算获取的标签词所对应的置信度;
对标签词对应的词频概率和置信度进行拟合,得到所述标签词对应的分值;
根据所述标签词对应的分值选取标签词作为用户的擅长标签。
10.根据权利要求9所述的方法,其特征在于,所述根据所述专业相关数据和个人信息挖掘用户的擅长标签,还包括:
对所述分词后得到的标签进行归类;
根据所述标签词对应的分值计算标签词所属类别对应的分值;
根据所述标签词所属类别对应的分值选取类别作为用户的擅长类别。
11.根据权利要求1所述的方法,其特征在于,所述根据所述第一用户的兴趣标签对应的分值、第二用户的擅长标签对应的分值、第一用户的擅长标签对应的分值、第二用户的兴趣标签对应的分值、所述第一相似度和第二相似度计算第一用户和第二用户之间的匹配度包括:
当用第一用户的兴趣标签去匹配第二用户的擅长标签时,则将第一用户的兴趣标签对应的分值、第二用户的擅长标签对应的分值和第一相似度相乘;
当用第一用户的擅长标签去匹配第二用户的兴趣标签时,则将第一用户的擅长标签对应的分值、第二用户的兴趣标签对应的分值和第二相似度相乘;
将所得到的乘值相加,作为第一用户和第二用户之间的匹配度。
12.根据权利要求11所述的方法,其特征在于,按照如下公式计算所述第一用户和第二用户之间的匹配度:
Figure 654802DEST_PATH_IMAGE001
其中,
Figure 521126DEST_PATH_IMAGE002
为第一用户a与第二用户b之间的匹配度,n为第一用户a的标签 个数,m为第二用户b的标签个数,α和β为常数;
当将第一用户a的兴趣标签匹配第二用户b的擅长标签时,
Figure 515627DEST_PATH_IMAGE003
为所述第一相似 度,wx为第一用户a的兴趣标签对应的分值,wy为第二用户b的擅长标签对应的分值;
当将第一用户a的擅长标签匹配第二用户b的兴趣标签时,
Figure 366079DEST_PATH_IMAGE004
为所述第二相似 度,wx为第一用户a的擅长标签的对应的分值,wy为第二用户b的兴趣标签对应的分值。
13.根据权利要求1所述的方法,其特征在于,所述兴趣标签包括兴趣类别,所述擅长标签包括擅长类别。
14.根据权利要求13所述的方法,其特征在于,所述根据所述第一用户的兴趣标签对应的分值、第二用户的擅长标签对应的分值、第一用户的擅长标签对应的分值、第二用户的兴趣标签对应的分值、所述第一相似度和第二相似度计算第一用户和第二用户之间的匹配度包括:
根据所述第一用户的兴趣类别对应的分值、第二用户的擅长类别对应的分值、第一用户的擅长类别对应的分值、第二用户的兴趣类别对应的分值、所述第一相似度和第二相似度计算第一用户和第二用户之间的匹配度。
15.根据权利要求14所述的方法,其特征在于,按照如下公式计算所述第一用户和第二用户之间的匹配度:
Figure 129635DEST_PATH_IMAGE005
其中,
Figure 166861DEST_PATH_IMAGE002
为第一用户a与第二用户b之间的匹配度,n为第一用户a的类别 个数,m为第二用户b的类别个数,α和β为常数;
当将第一用户a的兴趣标签匹配第二用户b的擅长标签时,
Figure 648658DEST_PATH_IMAGE003
为所述第一相似 度,wx为第一用户a的兴趣类别对应的分值,wy为第二用户b的擅长类别对应的分值;
当将第一用户a的擅长标签匹配第二用户b的兴趣标签时,
Figure 796743DEST_PATH_IMAGE003
为所述第二相似 度,wx为第一用户a的擅长类别的对应的分值,wy为第二用户b的兴趣类别对应的分值。
16.一种用户推荐装置,其特征在于,所述装置包括:
兴趣标签读取模块,用于读取用户的兴趣标签和所述兴趣标签对应的分值,所述兴趣标签表征用户感兴趣的内容,所述兴趣标签对应的分值表示用户对所述兴趣标签对应的内容的感兴趣程度;
擅长标签读取模块,用于读取用户的擅长标签和所述擅长标签对应的分值,所述擅长标签表征用户擅长的内容,所述擅长标签对应的分值表示用户对所述擅长标签对应的内容的擅长程度;
匹配度生成模块,用于将第一用户的兴趣标签匹配第二用户的擅长标签,获取所述第一用户的兴趣标签与所述第二用户的擅长标签的第一相似度;将第一用户的擅长标签匹配第二用户的兴趣标签,获取所述第一用户的擅长标签与第二用户的兴趣标签的第二相似度;根据所述第一用户的兴趣标签对应的分值、第二用户的擅长标签对应的分值、第一用户的擅长标签对应的分值、第二用户的兴趣标签对应的分值、所述第一相似度和第二相似度计算第一用户和第二用户之间的匹配度;
用户推荐模块,用于根据所述匹配度选取待推荐用户,将所述待推荐用户的信息推送给用户的终端。
17.根据权利要求16所述的装置,其特征在于,所述装置还包括:
兴趣标签挖掘模块,用于收集用户的线上行为数据,根据所述线上行为数据挖掘用户的兴趣标签。
18.根据权利要求17所述的装置,其特征在于,所述兴趣标签挖掘模块包括:
第一分词模块,用于对所述线上行为数据中的文档进行分词;
第一分值计算模块,用于计算分词后得到的标签词对应的分值为标签词的词频与用户的所有标签词的词频的比率;
兴趣标签选取模块,用于根据所述标签词对应的分值选取标签词作为用户的兴趣标签。
19.根据权利要求18所述的装置,其特征在于,所述兴趣标签挖掘模块还包括:
第一归类模块,用于对所述分词后得到的标签词进行归类;
第一类别分值计算模块,用于根据所述标签词对应的分值计算标签词所属类别对应的分值;
兴趣类别选取模块,用于根据所述标签词所属类别对应的分值选取类别作为用户的兴趣类别。
20.根据权利要求16所述的装置,其特征在于,所述装置还包括:
第一擅长标签挖掘模块,用于收集用户的专业相关数据,根据所述专业相关数据挖掘用户的擅长标签;
所述专业相关数据包括问答社区数据、专业论坛数据中的至少一种。
21.根据权利要求20所述的装置,其特征在于,所述第一擅长标签挖掘模块包括:
第二分词模块,用于对所述专业相关数据中的文档进行分词;
第二分值计算模块,用于计算分词后得到的标签词对应的分值为标签词的词频与用户的所有标签词的词频的比率;
第一擅长标签选取模块,用于根据所述标签词对应的分值选取标签词作为用户的擅长标签。
22.根据权利要求21所述的装置,其特征在于,所述第一擅长标签挖掘模块还包括:
第二归类模块,用于对所述分词后得到的标签进行归类;
第二类别分值计算模块,用于根据所述标签词对应的分值计算标签词所属类别对应的分值;
第一擅长类别选取模块,用于根据所述标签词所述类别对应的分值选取类别作为用户的擅长类别。
23.根据权利要求16所述的装置,其特征在于,所述装置还包括:
第二擅长标签挖掘模块,用于收集用户的专业相关数据和个人信息,根据所述专业相关数据和个人信息挖掘用户的擅长标签;
所述专业相关数据包括问答社区数据、专业论坛数据中的至少一种。
24.根据权利要求23所述的装置,其特征在于,所述第二擅长标签挖掘模块包括:
第三分词模块,用于对所述专业相关数据中的文档进行分词;
词频概率计算模块,用于计算分词得到的标签词对应的词频概率为所述标签词的词频与用户的所有标签词的词频的比率;
置信度计算模块,用于根据所述个人信息获取对应的标签词,以及根据所述个人信息计算获取的标签词所对应的置信度;
第三分值计算模块,用于对标签词对应的词频概率和置信度进行拟合,得到所述标签词对应的分值;
第二擅长标签选取模块,用于根据所述标签词对应的分值选取标签词作为用户的擅长标签。
25.根据权利要求24所述的装置,其特征在于,所述第二擅长标签挖掘模块还包括:
第三归类模块,用于对所述分词后得到的标签进行归类;
第三类别分值计算模块,用于根据所述标签词对应的分值计算标签词所属类别对应的分值;
第二擅长类别选取模块,用于根据所述标签词所述类别对应的分值选取类别作为用户的擅长类别。
26.根据权利要求16所述的装置,其特征在于,所述根据所述第一用户的兴趣标签对应的分值、第二用户的擅长标签对应的分值、第一用户的擅长标签对应的分值、第二用户的兴趣标签对应的分值、所述第一相似度和第二相似度计算第一用户和第二用户之间的匹配度包括:
当用第一用户的兴趣标签去匹配第二用户的擅长标签时,则将第一用户的兴趣标签对应的分值、第二用户的擅长标签对应的分值和第一相似度相乘;
当用第一用户的擅长标签去匹配第二用户的兴趣标签时,则将第一用户的擅长标签对应的分值、第二用户的兴趣标签对应的分值和第二相似度相乘;
将所得到的乘值相加,作为第一用户和第二用户之间的匹配度。
27.根据权利要求26所述的装置,其特征在于,按照如下公式计算所述第一用户和第二用户之间的匹配度:
Figure 431118DEST_PATH_IMAGE006
其中,
Figure 639245DEST_PATH_IMAGE002
为第一用户a与第二用户b之间的匹配度,n为第一用户a的标签 个数,m为第二用户b的标签个数,α和β为常数;
当将第一用户a的兴趣标签匹配第二用户b的擅长标签时,
Figure 608338DEST_PATH_IMAGE003
为所述第一相 似度,wx为第一用户a的兴趣标签对应的分值,wy为第二用户b的擅长标签对应的分值;
当将第一用户a的擅长标签匹配第二用户b的兴趣标签时,
Figure 294534DEST_PATH_IMAGE003
为所述第二相似 度,wx为第一用户a的擅长标签的对应的分值,wy为第二用户b的兴趣标签对应的分值。
28.根据权利要求16所述的装置,其特征在于,所述兴趣标签包括兴趣类别,所述擅长标签包括擅长类别。
29.根据权利要求28所述的装置,其特征在于,所述根据所述第一用户的兴趣标签对应的分值、第二用户的擅长标签对应的分值、第一用户的擅长标签对应的分值、第二用户的兴趣标签对应的分值、所述第一相似度和第二相似度计算第一用户和第二用户之间的匹配度包括:
根据所述第一用户的兴趣类别对应的分值、第二用户的擅长类别对应的分值、第一用户的擅长类别对应的分值、第二用户的兴趣类别对应的分值、所述第一相似度和第二相似度计算第一用户和第二用户之间的匹配度。
30.根据权利要求29所述的装置,其特征在于,按照如下公式计算所述第一用户和第二用户之间的匹配度:
Figure 298263DEST_PATH_IMAGE007
其中,
Figure 677291DEST_PATH_IMAGE002
为第一用户a与第二用户b之间的匹配度,n为第一用户a的类别 个数,m为第二用户b的类别个数,α和β为常数;
当将第一用户a的兴趣标签匹配第二用户b的擅长标签时,
Figure 117369DEST_PATH_IMAGE003
为所述第一相似 度,wx为第一用户a的兴趣类别对应的分值,wy为第二用户b的擅长类别对应的分值;
当将第一用户a的擅长标签匹配第二用户b的兴趣标签时,
Figure 872835DEST_PATH_IMAGE003
为所述第二相似 度,wx为第一用户a的擅长类别的对应的分值,wy为第二用户b的兴趣类别对应的分值。
31.一种计算机可读存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行权利要求1至15中任一项权利要求所述用户推荐方法的步骤。
32.一种计算机设备,其特征在于,包括存储介质和处理器,所述存储介质中存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行权利要求1至15中任一项权利要求所述用户推荐方法的步骤。
CN201310354181.3A 2013-08-14 2013-08-14 用户推荐方法和装置 Active CN104376010B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201310354181.3A CN104376010B (zh) 2013-08-14 2013-08-14 用户推荐方法和装置
PCT/CN2014/084402 WO2015021937A1 (zh) 2013-08-14 2014-08-14 用户推荐方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310354181.3A CN104376010B (zh) 2013-08-14 2013-08-14 用户推荐方法和装置

Publications (2)

Publication Number Publication Date
CN104376010A CN104376010A (zh) 2015-02-25
CN104376010B true CN104376010B (zh) 2021-12-14

Family

ID=52468072

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310354181.3A Active CN104376010B (zh) 2013-08-14 2013-08-14 用户推荐方法和装置

Country Status (2)

Country Link
CN (1) CN104376010B (zh)
WO (1) WO2015021937A1 (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105138572B (zh) * 2015-07-27 2019-12-10 百度在线网络技术(北京)有限公司 获取用户标签的关联度权值的方法和装置
CN106874314B (zh) * 2015-12-14 2020-12-04 腾讯科技(深圳)有限公司 信息推荐的方法和装置
CN105869056A (zh) * 2016-03-31 2016-08-17 比美特医护在线(北京)科技有限公司 信息处理方法和装置
CN107562836B (zh) * 2017-06-07 2020-10-30 北京航空航天大学 基于主题模型和机器学习的回答者推荐方法
CN108153824B (zh) * 2017-12-06 2020-04-24 阿里巴巴集团控股有限公司 目标用户群体的确定方法及装置
CN108122169A (zh) * 2018-01-03 2018-06-05 深圳市创享网络科技有限公司 一种基于加速度传感器建立友好社交关系的方法
CN110969535A (zh) * 2018-09-30 2020-04-07 武汉斗鱼网络科技有限公司 一种用户之间匹配的方法、设备、系统和介质
CN110322281B (zh) * 2019-06-06 2023-10-27 创新先进技术有限公司 相似用户的挖掘方法及装置
CN110414778A (zh) * 2019-06-17 2019-11-05 中国平安财产保险股份有限公司 案件派工方法和装置
CN111209474B (zh) * 2019-12-27 2023-04-28 广东德诚科教有限公司 在线课程的推荐方法、装置、计算机设备和存储介质
CN111737537B (zh) * 2020-07-21 2020-11-27 杭州欧若数网科技有限公司 基于图数据库的poi推荐方法、设备及介质
CN112015987B (zh) * 2020-08-28 2022-10-04 青岛格兰德信用管理咨询有限公司 一种基于企业标签的潜在客户推荐系统及推荐方法
CN112948705A (zh) * 2020-12-30 2021-06-11 广州博士信息技术研究院有限公司 一种基于政策大数据的智能匹配方法、装置及介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102479202A (zh) * 2010-11-26 2012-05-30 卓望数码技术(深圳)有限公司 一种基于领域专家的推荐系统
CN102855241A (zh) * 2011-06-28 2013-01-02 上海迈辉信息技术有限公司 一种多指标专家推荐系统及其实现方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100530185C (zh) * 2006-10-27 2009-08-19 北京搜神网络技术有限责任公司 基于网络行为的个性化推荐方法和系统
JP2008288767A (ja) * 2007-05-16 2008-11-27 Sony Corp 情報処理装置および方法、並びにプログラム
CN101330432A (zh) * 2007-06-18 2008-12-24 阿里巴巴集团控股有限公司 一种实现在线问答的系统和方法
CN101833725A (zh) * 2010-04-15 2010-09-15 刘洪利 一种用户身份匹配比对方法,以及身份匹配系统
US20120095793A1 (en) * 2010-10-18 2012-04-19 Panorama Software Inc. Business intelligence exception analysis by cause and effect
CN102915309B (zh) * 2011-08-03 2016-05-11 腾讯科技(深圳)有限公司 即时通信工具中好友关系链匹配方法和设备
JP5915989B2 (ja) * 2011-11-17 2016-05-11 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 情報提供装置
CN103218355B (zh) * 2012-01-18 2016-08-31 腾讯科技(深圳)有限公司 一种为用户生成标签的方法和装置
CN103106285B (zh) * 2013-03-04 2017-02-08 中国信息安全测评中心 一种基于信息安全专业社交网络平台的推荐算法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102479202A (zh) * 2010-11-26 2012-05-30 卓望数码技术(深圳)有限公司 一种基于领域专家的推荐系统
CN102855241A (zh) * 2011-06-28 2013-01-02 上海迈辉信息技术有限公司 一种多指标专家推荐系统及其实现方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Web社区管理研究综述;何镝 等;《计算机科学与探索》;20110215;第97-98页 *

Also Published As

Publication number Publication date
CN104376010A (zh) 2015-02-25
WO2015021937A1 (zh) 2015-02-19

Similar Documents

Publication Publication Date Title
CN104376010B (zh) 用户推荐方法和装置
Bhutani et al. Fake news detection using sentiment analysis
Arbia Spatial econometrics
CN106649818B (zh) 应用搜索意图的识别方法、装置、应用搜索方法和服务器
CN108304526B (zh) 一种数据处理方法、装置及服务器
CN107346336B (zh) 基于人工智能的信息处理方法和装置
US10127522B2 (en) Automatic profiling of social media users
US20130159277A1 (en) Target based indexing of micro-blog content
CN107193974B (zh) 基于人工智能的地域性信息确定方法和装置
CN112307351A (zh) 用户行为的模型训练、推荐方法、装置和设备
US11640420B2 (en) System and method for automatic summarization of content with event based analysis
CN109992781B (zh) 文本特征的处理方法、装置和存储介质
WO2014048479A1 (en) A system and method for the automatic creation or augmentation of an electronically rendered publication document
CN113392179A (zh) 文本标注方法及装置、电子设备、存储介质
Mughaid et al. A smart geo-location job recommender system based on social media posts
Qiu et al. Late fusion with triplet margin objective for multimodal ideology prediction and analysis
Das A multimodal approach to sarcasm detection on social media
Pentland et al. Does accuracy matter? Methodological considerations when using automated speech-to-text for social science research
Xu et al. A collaborative filtering framework based on variational autoencoders and generative adversarial networks
CN109062900B (zh) 一种朋友圈生成方法及装置
CN113011919A (zh) 识别兴趣对象的方法及装置、推荐方法、介质、电子设备
Hoberg Supply chain and big data
Gao Spatial Scientometrics
Abbasi et al. Identifying influentials in social networks
Khater et al. Personalized microblogs corpus recommendation based on dynamic users interests

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant