CN106874314B - 信息推荐的方法和装置 - Google Patents

信息推荐的方法和装置 Download PDF

Info

Publication number
CN106874314B
CN106874314B CN201510929002.3A CN201510929002A CN106874314B CN 106874314 B CN106874314 B CN 106874314B CN 201510929002 A CN201510929002 A CN 201510929002A CN 106874314 B CN106874314 B CN 106874314B
Authority
CN
China
Prior art keywords
information
user
recommended
activity
tags
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510929002.3A
Other languages
English (en)
Other versions
CN106874314A (zh
Inventor
程刚
任鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201510929002.3A priority Critical patent/CN106874314B/zh
Publication of CN106874314A publication Critical patent/CN106874314A/zh
Application granted granted Critical
Publication of CN106874314B publication Critical patent/CN106874314B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Abstract

本发明涉及一种信息推荐的方法,包括:获取用户的用户兴趣标签及各个用户兴趣标签的活跃度;解析待推荐信息,得到所述待推荐信息对应的信息标签及各个信息标签的活跃度;根据所述信息标签与所述用户兴趣标签的匹配度、所述用户兴趣标签的活跃度、信息标签的活跃度计算所述待推荐信息与所述用户的匹配分数;根据所述匹配分数推荐所述待推荐信息,能提高信息推荐的有效性,此外,还提供了一种信息推荐的装置。

Description

信息推荐的方法和装置
技术领域
本发明涉及计算机技术领域,特别是涉及一种信息推荐的方法和装置。
背景技术
随着计算机技术的发展,人们越来越多的通过网络应用进行交流和获取各种信息,如通过微博浏览新闻、通过社交应用获取朋友信息等。
为了便于用户的查看,网络应用可以主动地向用户推荐信息,如向用户推荐其他用户或运营方等发布、分享的信息,包括但不限于新闻、段子、文章、视频链接地址等。现有的信息推荐的方法往往通过信息的发布时间或随机推荐信息,导致推荐的信息往往不是用户关注的,推荐的有效性很低。
发明内容
基于此,有必要针对上述技术问题,提供一种信息推荐的方法和装置,能提高信息推荐的有效性。
一种信息推荐的方法,所述方法包括:
获取用户的用户兴趣标签及各个用户兴趣标签的活跃度;
解析待推荐信息,得到所述待推荐信息对应的信息标签及各个信息标签的活跃度;
根据所述信息标签与所述用户兴趣标签的匹配度、所述用户兴趣标签的活跃度、信息标签的活跃度计算所述待推荐信息与所述用户的匹配分数;
根据所述匹配分数推荐所述待推荐信息。
一种信息推荐的装置,所述装置包括:
用户兴趣标签获取模块,用于获取用户的用户兴趣标签及各个用户兴趣标签的活跃度;
待推荐信息解析模块,用于解析待推荐信息,得到所述待推荐信息对应的信息标签及各个信息标签的活跃度;
匹配分数计算模块,用于根据所述信息标签与所述用户兴趣标签的匹配度、所述用户兴趣标签的活跃度、信息标签的活跃度计算所述待推荐信息与所述用户的匹配分数;
推荐模块,用于根据所述匹配分数推荐所述待推荐信息。
上述信息推荐的方法和装置,通过获取用户的用户兴趣标签及各个用户兴趣标签的活跃度,解析待推荐信息,得到待推荐信息对应的信息标签及各个信息标签的活跃度,根据信息标签与用户兴趣标签的匹配度、用户兴趣标签的活跃度、信息标签的活跃度计算待推荐信息与所述用户的匹配分数,根据匹配分数推荐待推荐信息,匹配分数的计算综合考虑了信息标签与用户兴趣标签的匹配度、用户兴趣标签的活跃度、信息标签的活跃度使得信息的推荐更符合用户的兴趣,推荐的更精准,提高了信息推荐的有效性。
附图说明
图1为一个实施例中信息推荐的方法的应用环境图;
图2为一个实施例中图1中服务器的内部结构图;
图3为一个实施例中信息推荐的方法的流程图;
图4为一个实施例中解析行为文本的流程图;
图5为一个实施例中得到用户兴趣标签及活跃度的流程图;
图6为一个实施例中得到信息标签及活跃度的流程图;
图7为一个实施例中计算匹配分数的流程图;
图8为一个实施例中推荐信息的流程图;
图9为一个实施例中信息推荐的装置的结构框图;
图10为另一个实施例中信息推荐的装置的结构框图;
图11为一个实施例中用户的行为文本解析模块的结构框图;
图12为一个实施例中待推荐信息解析模块的结构框图;
图13为一个实施例中匹配分数计算模块的结构框图;
图14为一个实施例中推荐模块的结构框图。
具体实施方式
图1为一个实施例中信息推荐的方法运行的应用环境图。如图1所示,该应用环境包括终端110、服务器120,其中终端110和服务器120通过网络进行通信。
终端110可为智能手机、平板电脑、笔记本电脑、台式计算机等,但并不局限于此。终端110通过网络向服务器120发送信息发布请求和信息查看请求,服务器120可以响应终端110发送的请求,服务器120可以主动向终端110推荐信息。
在一个实施例中,图1中的服务器120的内部结构如图2所示,该服务器120包括通过系统总线连接的处理器、存储介质、内存和网络接口。其中,该服务器120的存储介质存储有操作系统、数据库和信息推荐的装置,数据库用于存储数据,如用户的行为文本,信息推荐的装置用于实现一种适用于服务器120的信息推荐的方法。该服务器120的处理器用于提供计算和控制能力,支撑整个服务器120的运行。该服务器120的内存为存储介质中的信息推荐的装置的运行提供环境。该服务器120的网络接口用于与外部的终端110通过网络连接通信,比如向终端110推荐信息等。
如图3所示,在一个实施例中,提供了一种信息推荐的方法,以应用于上述应用环境中的服务器来举例说明,包括如下步骤:
步骤S210,获取用户的用户兴趣标签及各个用户兴趣标签的活跃度。
具体的,用户兴趣标签反映了用户感兴趣的内容,是通过解析用户的行为数据挖掘得到的,用户的行为数据包括:用户分享及阅读的行为数据,包括文字信息、图片信息、视频信息等,如用户发布的分享信息、用户转发的分享信息、用户点击阅读的分享信息。用户兴趣标签可由用户自行设置,可提供预设的候选兴趣标签供用户选择,预设的候选兴趣标签可根据网络应用的类别和待推荐信息的内容自行设置,如网络应用的类别为社交类,待推荐信息为用户资料,则可提供社交类候选兴趣标签,如性别、爱好、地区等,通过预设的候选兴趣标签能提高兴趣标签的针对性和有效性。用户兴趣标签也可由用户的行为数据产生的行为文本中提取得到,如统计用户分享的文本中出现率高的词语作为用户兴趣标签,如将行为文本与预设类别匹配度最高的类别作为信息标签。用户兴趣标签的活跃度反映了用户兴趣的大小,对于从用户行为数据中提取的用户兴趣标签,可根据提取的用户兴趣标签在用户行为数据对应的行为文本中出现的频率大小计算。对于用户自定义的兴趣标签,可通过用户的行为数据与自定义的兴趣标签的匹配度,增加或减少自定义的兴趣标签的活跃度,如设定用户自定义的兴趣标签初始活跃度相同,随着时间的推移,如果用户分享的文档与其中一个用户兴趣标签匹配,则将此用户兴趣标签的活跃度加1。用户兴趣标签的数量可以为1个或多个。
步骤S220,解析待推荐信息,得到待推荐信息对应的信息标签及各个信息标签的活跃度。
具体的,待推荐信息是指在由用户或运营方等发布、分享的数据,包括文字信息、图片信息、视频信息等,如新闻、段子、文章、感想等。待推荐信息对应的信息标签可由运营方自行设定,设定的信息标签可与供用户选择设定的候选用户兴趣标签一致,从而便于后续的标签匹配。待推荐信息对应的信息标签可由待推荐信息对应的信息文本中提取得到,如统计待推荐信息对应的信息文本中出现率高的词语作为信息标签,如将待推荐信息与预设类别匹配度最高的类别作为信息标签。信息标签的活跃度反映了信息内容与信息标签的匹配程度,活跃度越大,说明此信息标签越能代表信息的内容。对于从待推荐信息对应的信息文本中提取的信息标签,可根据提取的信息标签在信息文本中出现的频率大小计算。对于运营方自定义的信息标签,可通过用户的反馈行为,增加或减少自定义的信息标签的活跃度,如自定义的信息标签初始活跃度相同,将给用户推荐的信息的各个信息标签展示给用户以接收用户对各个信息标签的反馈行为信息,包括正反馈和负反馈,如果是正反馈,则将此信息标签的活跃度加1,如果是负反馈,则将此信息标签的活跃度减1。待推荐信息对应的信息标签的数量可以为一个或多个。
步骤S230,根据信息标签与用户兴趣标签的匹配度、用户兴趣标签的活跃度、信息标签的活跃度计算待推荐信息与所述用户的匹配分数。
具体的,信息标签与用户兴趣标签的匹配度,可根据需要自定义,如信息标签与用户兴趣标签完全相同,则匹配度为1,信息标签与用户兴趣标签不相同,但是它们同属于同一主题,则匹配度为小于1的第一预设值,信息标签与用户兴趣标签不相同,但是它们同属于同一类别,则匹配度为小于1的第二预设值,其中主题为比类别精细的词,如类别为球类,主题可为篮球。用户兴趣标签的活跃度、信息标签的活跃度为步骤S230中对应的值,可为归一化后的值,便于计算匹配分数。匹配分数的计算公式可根据需要自定义,如将匹配度、用户兴趣标签的活跃度、信息标签的活跃度直接相乘等。当用户兴趣标签的数量、待推荐信息对应的信息标签的数量为多个时,可分别计算各个用户兴趣标签与各个信息标签的匹配分数,然后累加得到总的匹配分数。
步骤S240,根据匹配分数推荐待推荐信息。
具体的,可设定分数阈值,当待推荐信息与用户的匹配分数超过分数阈值时,则将待推荐信息推荐给用户。当待推荐信息有多个时,可根据匹配分数的从大到小的顺序,对各个待推荐信息排序,将排序靠前的预设数目的待推荐信息推荐给用户。还可根据匹配分数的大小为待推荐信息分配不同的显示参数,显示参数决定了待推荐信息的显示形态,包括显示位置、显示大小,动态显示或静态显示,显示模糊度等,如匹配分数超高,则显示位置越靠前,显示越清晰,匹配分数高的待推荐信息可设定动画效果等。
本实施例中,通过获取用户的用户兴趣标签及各个用户兴趣标签的活跃度,解析待推荐信息,得到待推荐信息对应的信息标签及各个信息标签的活跃度,根据信息标签与用户兴趣标签的匹配度、用户兴趣标签的活跃度、信息标签的活跃度计算待推荐信息与所述用户的匹配分数,根据匹配分数推荐待推荐信息,匹配分数的计算综合考虑了信息标签与用户兴趣标签的匹配度、用户兴趣标签的活跃度、信息标签的活跃度使得信息的推荐更符合用户的兴趣,推荐的更精准,提高了信息推荐的有效性。
在一个实施例中,如图4所示,在步骤S210之前,还包括:
步骤S310,获取用户的行为数据对应的行为文本。
具体的,可根据用户的行为数据的类别获取对应的行为文本,如用户的行为数据为文字类,则行为文本为行为数据本身,如文章、新闻等。如用户的行为数据为图像类,则行为数据对应的行为文本可为对图像的描述类文字,如照片说明,还可对图像进行识别而得到图像对应的行为文本,如为人像图像,则对应的行为文本为人类、人脸、人手等,根据图像的内容确定。如用户的行为数据为视频,则对应的行为文本可为视频的描述性文字,如果视频存在对应的音频,还可为台词对应的文字等。如用户的行为数据为音频,则可为音频的描述性文字,或音频对应的词语等。
步骤S320,解析行为文本,得到用户的用户兴趣标签及各个用户兴趣标签的活跃度。
具体的,可统计行为文本中出现频率高的词语作为用户的用户兴趣标签,也可获取出现频率高的词语所属的类别作为用户兴趣标签,用户兴趣标签的个数可根据需要自定义,还可自定义用户兴趣标签的候选集,当出现频率高的词语为候选集中的近似词时,将候选集中的词语作为用户兴趣标签,通过候选集可使用户兴趣标签的确定更统一。用户兴趣标签的活跃度可通过出现的频率计算,出现的频率高,则活跃度高。由于用户的兴趣一般会随时时间的变化而变化,但在一定时间内变化不会太大,所以用户兴趣标签可在预设时间段到达时更新,如一个月更新一次,用于更新用户兴趣标签的行为文本,也是近期产生的行为文本,与用户兴趣标签更新时的时间相对应。
在一个实施例中,如图5所示,步骤S320包括:
步骤S321,对行为文本进行分词。
具体的,将行为文本进行分词后就得到了各个词语。
步骤S322,根据各个分词出现的频率计算各个分词的活跃度。
具体的,统计各个分词出现的次数,并将各个分词出现的次数相加得到总的分词次数,将各个分词出现的次数除于总次数,得到各个分词的活跃度。如通过公式
Figure BDA0000877697700000061
计算得到分词x的活跃度Ins(x),其中pv(x)为分词x在行为文本中出现的次数,pv(all)为行为文本中所有分词出现的总次数。
步骤S323,根据各个分词的活跃度筛选得到作为用户的用户兴趣标签的分词及其对应的活跃度。
具体的,可自定义筛选规则得到用户兴趣标签,如将活跃度大于预设阈值的分词作为用户兴趣标签,或将活跃度按从大到小的顺序排序,排序位置靠前的预设数目个活跃度对应的分词作为用户兴趣标签。通过各个分词出现的频率大小筛选得到用户兴趣标签简单方便。
在一个实施例中,如图6所示,步骤S220包括:
步骤S221,获取待推荐信息,对待推荐信息对应的信息文本进行分词。
具体的,可根据待推荐信息的类别获取对应的信息文本,如待推荐信息为文字类,则信息文本为待推荐信息本身,如文章、新闻等。如待推荐信息为图像类,则待推荐信息对应的信息文本可为对图像的描述类文字,如照片说明,还可对图像进行识别而得到图像对应的文本,如为人像图像,则对应的信息文本为人类、人脸、人手等,根据图像的内容确定。如待推荐信息为视频,则对应的信息文本可为视频的描述性文字,如果视频存在对应的音频,还可为台词对应的文字等。如待推荐信息为音频,则可为音频的描述性文字,或音频对应的词语等。得到待推荐信息对应的信息文本后,对其进行分词得到各个词语。
步骤S222,根据各个分词出现的频率计算各个分词的活跃度。
具体的,统计各个分词出现的次数,并将各个分词出现的次数相加得到总的分词次数,将各个分词出现的次数除于总次数,得到各个分词的活跃度。如通过公式
Figure BDA0000877697700000071
计算得到待推荐信息分词y的活跃度Expert(y),其中ev(y)为分词x在信息文本中出现的次数,ev(all)为信息文本中所有分词出现的总次数。
步骤S223,根据各个分词的活跃度筛选得到作为信息标签的分词及其对应的活跃度。
具体的,可自定义筛选规则得到信息标签,如将活跃度大于预设阈值的分词作为信息标签,或将活跃度按从大到小的顺序排序,排序位置靠前的预设数目个活跃度对应的分词作为信息标签。通过各个分词出现的频率大小筛选得到信息标签简单方便。
在一个实施例中,如图7所示,步骤S230包括:
步骤S231,判断信息标签与用户兴趣标签是否相同,如果相同,则为匹配。
具体的,本实施例中只有完全相同的信息标签与用户兴趣标签才算匹配,采用match(x,y)表示信息标签与用户兴趣标签的匹配度,如果匹配,则match(x,y)为1,否则match(x,y)为0。
步骤S232,筛选出匹配的有效信息标签与有效用户兴趣标签。
具体的,假设有多条待推荐信息如信息B、信息C、信息D,每条信息可能有多个信息标签,如信息B的信息标签组成集合b={b1,b2,b3,....bn},用户兴趣标签也可能有多个,如用户兴趣标签组成集合a={a1,a2,a3,....an},找出集合a和集合b中相同的标签,组成匹配的集合对,如a1和b2相同,则{a1,b2}为匹配的有效信息标签与有效用户兴趣标签,并获取它们分别对应的活跃度Ins(a1)和Expert(b2)。
步骤S233,根据匹配的有效信息标签的活跃度与有效用户兴趣标签的活跃度计算得到待推荐信息与用户的匹配分数。
具体的,可根据匹配的有效信息标签的活跃度与有效用户兴趣标签的活跃度自定 义公式计算得到匹配分数,在一个实施例中,待推荐信息B与用户A的匹配分数为
Figure BDA0000877697700000081
其中n为用户A的兴趣标签 的总个数,m为待推荐信息B的信息标签的总个数,如果ai和bj相同,则match(ai,bj)=1,否 则match(ai,bj)=0,其中Ins(ai)表示用户兴趣标签ai的活跃度,Expert(bj)表示信息标签bj 的活跃度,α、β为大于0的常数,且α+β=1。
在一个实施例中,如图8所示,步骤S240包括:
步骤S241,获取待推荐信息的发布时间和当前推荐时间。
具体的,待推荐信息的发布时间是指待推荐信息的产生时间,如新闻可以是新闻发生时间,待推荐信息如果是用户分享的文章,则为用户将文章分享出来的时间。当前推荐时间是指当前向用户推荐信息的时间。
步骤S242,根据发布时间、当前推荐时间和匹配分数得到推荐分数,根据推荐分数推荐待推荐信息。
具体的,根据发布时间、当前推荐时间得到时间分数,其中发布时间距离当前推荐时间越远得到的时间分数越小,可自定义时间分数的公式,在一个实施例中时间分数Time(x)=1440-minute(x)当minute(x)>1440时,Time(x)=0,minute(x)为当前推荐时间与待推荐信息发布时间的时间差,以分钟为单位。推荐分数Fin_score(x)=γ*match_score(x)+λ*time(x),其中match_score(x)为待推荐信息与用户的匹配分数,γ和λ为常数,且γ+λ=1。在计算时,可筛选出匹配分数高的待推荐信息计算最终的推荐分数,加快待推荐信息的推荐速度。最后根据推荐分数推荐待推荐信息,如将推荐分数大于预设阈值的待推荐信息推荐给用户,如将待推荐信息按照大小排序,推荐排在前面的待推荐信息。并根据推荐分数的大小设置推荐显示参数。一般信息的价值随着发布时间的推移减小,比如太长时间以前的信息可能信息内容已经过期了,不实用,最终的推荐分数考虑了时间,进一步加强了信息推荐的有效性。
在一个实施例中,如图9所示,提供了一种信息推荐的装置,包括:
用户兴趣标签获取模块310,用于获取用户的用户兴趣标签及各个用户兴趣标签的活跃度。
待推荐信息解析模块320,用于解析待推荐信息,得到待推荐信息对应的信息标签及各个信息标签的活跃度。
匹配分数计算模块330,用于根据信息标签与用户兴趣标签的匹配度、用户兴趣标签的活跃度、信息标签的活跃度计算待推荐信息与用户的匹配分数。
推荐模块340,用于根据匹配分数推荐待推荐信息。
在一个实施例中,如图10所示,装置还包括:
用户的行为文本解析模块350,用于获取用户的行为数据对应的行为文本,解析行为文本,得到用户的用户兴趣标签及各个用户兴趣标签的活跃度。
在一个实施例中,如图11所示,用户的行为文本解析模块350包括:
第一分词单元351,用于对行为文本进行分词。
第一活跃度计算单元352,用于根据各个分词出现的频率计算各个分词的活跃度。
第一筛选单元353,用于根据各个分词的活跃度筛选得到作为用户的用户兴趣标签的分词及其对应的活跃度。
在一个实施例中,如图12所示,待推荐信息解析模块320包括:
第二分词单元321,用于获取待推荐信息,对待推荐信息对应的信息文本进行分词。
第二活跃度计算单元322,用于根据各个分词出现的频率计算各个分词的活跃度。
第二筛选单元323,用于根据各个分词的活跃度筛选得到作为信息标签的分词及其对应的活跃度。
在一个实施例中,如图13所示,匹配分数计算模块330包括:
匹配处理单元331,用于判断信息标签与用户兴趣标签是否相同,如果相同,则为匹配,筛选出匹配的有效信息标签与有效用户兴趣标签。
计算单元332,用于根据匹配的有效信息标签的活跃度与有效用户兴趣标签的活跃度计算得到待推荐信息与用户的匹配分数。
在一个实施例中,如图14所示,推荐模块340包括:
时间获取单元341,用于获取待推荐信息的发布时间和当前推荐时间。
推荐单元342,用于根据发布时间、当前推荐时间和匹配分数得到推荐分数,根据推荐分数推荐待推荐信息。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述程序可存储于一计算机可读取存储介质中,如本发明实施例中,该程序可存储于计算机系统的存储介质中,并被该计算机系统中的至少一个处理器执行,以实现包括如上述各方法的实施例的流程。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (14)

1.一种信息推荐的方法,所述方法包括:
获取第一用户的用户兴趣标签及各个用户兴趣标签的活跃度,所述用户兴趣标签的活跃度随着与用户兴趣标签相匹配的用户行为数据的增加而增加;
解析待推荐信息,得到所述待推荐信息对应的信息标签及各个信息标签的活跃度,所述待推荐信息是由第二用户或运营方发布的信息,所述待推荐信息对应的信息标签为运营方自定义的信息标签,所述信息标签的活跃度是根据第一用户对信息标签的反馈行为信息确定;
根据所述信息标签与所述用户兴趣标签的匹配度、所述用户兴趣标签的活跃度、信息标签的活跃度计算所述待推荐信息与所述第一用户的匹配分数;
根据所述匹配分数推荐所述待推荐信息,根据所述匹配分数确定所述待推荐信息的显示参数。
2.根据权利要求1所述的方法,其特征在于,所述获取第一用户的用户兴趣标签及各个用户兴趣标签的活跃度的步骤之前,还包括:
获取所述第一用户的行为数据对应的行为文本;
解析所述行为文本,得到所述第一用户的用户兴趣标签及各个用户兴趣标签的活跃度。
3.根据权利要求2所述的方法,其特征在于,所述解析所述行为文本,得到所述第一用户的用户兴趣标签及各个用户兴趣标签的活跃度的步骤包括:
对所述行为文本进行分词;
根据各个分词出现的频率计算各个分词的活跃度;
根据各个分词的活跃度筛选得到作为所述第一用户的用户兴趣标签的分词及其对应的活跃度。
4.根据权利要求1所述的方法,其特征在于,所述解析待推荐信息,得到所述待推荐信息对应的信息标签及各个信息标签的活跃度的步骤包括:
获取待推荐信息,对所述待推荐信息对应的信息文本进行分词;
根据各个分词出现的频率计算各个分词的活跃度;
根据各个分词的活跃度筛选得到作为信息标签的分词及其对应的活跃度。
5.根据权利要求1所述的方法,其特征在于,所述根据所述信息标签与所述用户兴趣标签的匹配度、所述用户兴趣标签的活跃度、信息标签的活跃度计算所述待推荐信息与所述第一用户的匹配分数的步骤包括:
判断所述信息标签与用户兴趣标签是否相同,如果相同,则为匹配;
筛选出匹配的有效信息标签与有效用户兴趣标签;
根据所述匹配的有效信息标签的活跃度与有效用户兴趣标签的活跃度计算得到待推荐信息与所述第一用户的匹配分数。
6.根据权利要求1所述的方法,其特征在于,所述根据所述匹配分数推荐所述待推荐信息的步骤包括:
获取所述待推荐信息的发布时间和当前推荐时间;
根据所述发布时间、当前推荐时间和匹配分数得到推荐分数;
根据所述推荐分数推荐所述待推荐信息。
7.一种信息推荐的装置,其特征在于,所述装置包括:
用户兴趣标签获取模块,用于获取第一用户的用户兴趣标签及各个用户兴趣标签的活跃度,所述用户兴趣标签的活跃度随着与用户兴趣标签相匹配的用户行为数据的增加而增加;
待推荐信息解析模块,用于解析待推荐信息,得到所述待推荐信息对应的信息标签及各个信息标签的活跃度,所述待推荐信息是由第二用户或运营方发布的信息,所述待推荐信息对应的信息标签为运营方自定义的信息标签,所述信息标签的活跃度是根据第一用户对信息标签的反馈行为信息确定;
匹配分数计算模块,用于根据所述信息标签与所述用户兴趣标签的匹配度、所述用户兴趣标签的活跃度、信息标签的活跃度计算所述待推荐信息与所述第一用户的匹配分数;
推荐模块,用于根据所述匹配分数推荐所述待推荐信息,根据所述匹配分数确定所述待推荐信息的显示参数。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
用户的行为文本解析模块,用于获取所述第一用户的行为数据对应的行为文本,解析所述行为文本,得到所述第一用户的用户兴趣标签及各个用户兴趣标签的活跃度。
9.根据权利要求8所述的装置,其特征在于,所述用户的行为文本解析模块包括:
第一分词单元,用于对所述行为文本进行分词;
第一活跃度计算单元,用于根据各个分词出现的频率计算各个分词的活跃度;
第一筛选单元,用于根据各个分词的活跃度筛选得到作为所述第一用户的用户兴趣标签的分词及其对应的活跃度。
10.根据权利要求7所述的装置,其特征在于,所述待推荐信息解析模块包括:
第二分词单元,用于获取待推荐信息,对所述待推荐信息对应的信息文本进行分词;
第二活跃度计算单元,用于根据各个分词出现的频率计算各个分词的活跃度;
第二筛选单元,用于根据各个分词的活跃度筛选得到作为信息标签的分词及其对应的活跃度。
11.根据权利要求7所述的装置,其特征在于,所述匹配分数计算模块包括:
匹配处理单元,用于判断所述信息标签与用户兴趣标签是否相同,如果相同,则为匹配,筛选出匹配的有效信息标签与有效用户兴趣标签;
计算单元,用于根据所述匹配的有效信息标签的活跃度与有效用户兴趣标签的活跃度计算得到待推荐信息与所述第一用户的匹配分数。
12.根据权利要求7所述的装置,其特征在于,所述推荐模块包括:
时间获取单元,用于获取所述待推荐信息的发布时间和当前推荐时间;
推荐单元,用于根据所述发布时间、当前推荐时间和匹配分数得到推荐分数,根据所述推荐分数推荐所述待推荐信息。
13.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。
14.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
CN201510929002.3A 2015-12-14 2015-12-14 信息推荐的方法和装置 Active CN106874314B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510929002.3A CN106874314B (zh) 2015-12-14 2015-12-14 信息推荐的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510929002.3A CN106874314B (zh) 2015-12-14 2015-12-14 信息推荐的方法和装置

Publications (2)

Publication Number Publication Date
CN106874314A CN106874314A (zh) 2017-06-20
CN106874314B true CN106874314B (zh) 2020-12-04

Family

ID=59238391

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510929002.3A Active CN106874314B (zh) 2015-12-14 2015-12-14 信息推荐的方法和装置

Country Status (1)

Country Link
CN (1) CN106874314B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109446206A (zh) * 2017-08-29 2019-03-08 合肥美的智能科技有限公司 用户饮食数据更新方法及更新系统
CN108737256A (zh) * 2018-06-13 2018-11-02 佛山市澄澜点寸科技有限公司 一种用于接收分享消息的处理方法及处理装置
CN111047342B (zh) * 2018-10-15 2023-05-23 北京字节跳动网络技术有限公司 一种投放目标的确定方法、装置、电子设备及可读介质
CN109460545B (zh) * 2018-10-26 2023-05-30 上海连尚网络科技有限公司 一种基于文本内容的用户匹配方法及其终端、服务器
CN109446427A (zh) * 2018-11-02 2019-03-08 北京奇艺世纪科技有限公司 一种信息推荐方法及装置
CN110297987A (zh) * 2019-07-02 2019-10-01 武汉斗鱼网络科技有限公司 一种帖子推荐方法、装置、设备和存储介质
CN110598100B (zh) * 2019-09-04 2021-06-11 腾讯科技(深圳)有限公司 一种热词推荐方法、装置、设备及存储介质
CN112464075B (zh) * 2019-09-06 2023-11-03 百度在线网络技术(北京)有限公司 智能音箱的应用推荐方法、装置及电子设备
CN111859160B (zh) * 2020-08-07 2023-06-16 成都理工大学 一种基于图神经网络会话序列推荐方法及系统
CN113382272B (zh) 2021-05-31 2022-08-26 北京达佳互联信息技术有限公司 数据播放方法、装置、电子设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101122909A (zh) * 2006-08-10 2008-02-13 株式会社日立制作所 文本信息检索装置以及文本信息检索方法
CN101546341A (zh) * 2008-03-28 2009-09-30 株式会社东芝 信息推荐装置和信息推荐方法
CN103729360A (zh) * 2012-10-12 2014-04-16 腾讯科技(深圳)有限公司 一种兴趣标签推荐方法及系统
CN103810192A (zh) * 2012-11-09 2014-05-21 腾讯科技(深圳)有限公司 一种用户的兴趣推荐方法和装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9558185B2 (en) * 2012-01-10 2017-01-31 Ut-Battelle Llc Method and system to discover and recommend interesting documents
CN102867016A (zh) * 2012-07-18 2013-01-09 北京开心人信息技术有限公司 一种基于标签的社交网络用户兴趣挖掘方法与装置
CN104376010B (zh) * 2013-08-14 2021-12-14 腾讯科技(深圳)有限公司 用户推荐方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101122909A (zh) * 2006-08-10 2008-02-13 株式会社日立制作所 文本信息检索装置以及文本信息检索方法
CN101546341A (zh) * 2008-03-28 2009-09-30 株式会社东芝 信息推荐装置和信息推荐方法
CN103729360A (zh) * 2012-10-12 2014-04-16 腾讯科技(深圳)有限公司 一种兴趣标签推荐方法及系统
CN103810192A (zh) * 2012-11-09 2014-05-21 腾讯科技(深圳)有限公司 一种用户的兴趣推荐方法和装置

Also Published As

Publication number Publication date
CN106874314A (zh) 2017-06-20

Similar Documents

Publication Publication Date Title
CN106874314B (zh) 信息推荐的方法和装置
CN107291780B (zh) 一种用户评论信息展示方法和装置
US10423648B2 (en) Method, system, and computer readable medium for interest tag recommendation
CN109325179B (zh) 一种内容推广的方法及装置
CN110325986B (zh) 文章处理方法、装置、服务器及存储介质
US20220405607A1 (en) Method for obtaining user portrait and related apparatus
US10977448B2 (en) Determining personality profiles based on online social speech
CN111212303B (zh) 视频推荐方法、服务器和计算机可读存储介质
US10685070B2 (en) Dynamic creative optimization for effectively delivering content
CN109165975B (zh) 标签推荐方法、装置、计算机设备及存储介质
US8838435B2 (en) Communication processing
CN108959323B (zh) 视频分类方法和装置
CN108959329B (zh) 一种文本分类方法、装置、介质及设备
CN112818224B (zh) 信息推荐方法、装置、电子设备及可读存储介质
CN113688310A (zh) 一种内容推荐方法、装置、设备及存储介质
CN111597446B (zh) 基于人工智能的内容推送方法、装置、服务器和存储介质
CN107656918A (zh) 获取目标用户的方法及装置
CN112989824A (zh) 信息推送方法及装置、电子设备及存储介质
CN113343024B (zh) 对象推荐方法、装置、电子设备及存储介质
WO2021081914A1 (zh) 推送对象确定方法、装置、终端设备及存储介质
CN108810577B (zh) 一种用户画像的构建方法、装置及电子设备
JP6960838B2 (ja) 情報提供装置、情報提供方法、およびプログラム
CN113365138B (zh) 内容展示方法、装置、电子设备、存储介质
CN113704623A (zh) 一种数据推荐方法、装置、设备及存储介质
CN113902526A (zh) 基于人工智能的产品推荐方法、装置和计算机设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant