CN106033415B - 文本内容推荐方法及装置 - Google Patents
文本内容推荐方法及装置 Download PDFInfo
- Publication number
- CN106033415B CN106033415B CN201510102993.8A CN201510102993A CN106033415B CN 106033415 B CN106033415 B CN 106033415B CN 201510102993 A CN201510102993 A CN 201510102993A CN 106033415 B CN106033415 B CN 106033415B
- Authority
- CN
- China
- Prior art keywords
- content
- user
- value
- text content
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明实施例公开了一种文本内容推荐方法,包括:获取用户标识,获取所述用户标识对应的用户属性标签值;获取文本内容,提取所述文本内容的内容属性标签值;遍历所述内容属性标签值,对于所述遍历到的内容属性标签值,获取内容属性标签值的总体浏览率、与各个用户属性标签值对应的用户浏览比例和用户推荐比例,生成所述遍历到的内容属性标签值的标签热度值;通过计算所述文本内容对应的各个内容属性标签值的标签热度值的平均值生成所述文本内容相对于所述用户标识的内容热度值,根据所述内容热度值选择文本内容,将选择的文本内容的链接下发给所述与用户标识对应的终端。本发明还公开了一种文本内容推荐装置。采用本发明,可提高推荐的准确性。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种文本内容推荐方法及装置。
背景技术
在传统技术中的新闻、资讯类、购物助手等应用通常需要将新闻、资讯、打折消息等文本类型的数据内容推送给终端,从而方便用户及时获取最新的新闻资讯或商业资讯。但是,服务器上存储的新闻资讯或商业资讯的数量较多,需要选择合适的咨询推荐给用户。
传统技术中,为了将较重要或者用户可能更加关注的新闻资讯或商业资讯推荐给用户,通常采用热度统计的方法,即统计某条新闻资讯被推荐给用户的次数N1以及该条新闻资讯被用户接手后浏览的次数N2(由于资讯推荐给用户后,用户可能仅接收,但不打开相应的链接浏览资讯的详细内容,因此N1和N2可以不同),然后根据N1和N2的绝对数量或相对数量排序后确定该条资讯的热度,然后将热度高的资讯推荐给用户。
然而,上述传统技术中的内容推荐方法根据N1和N2统计出的资讯的热度为资讯的总体热度,并不能根据用户的身份,所属的群体,个人喜好等因素向某个特定用户推荐该用户最感兴趣的内容,而仅能推荐所有用户在统计结果下可能最感兴趣的内容,因此,推荐的内容与用户个体的适配度不高,导致内容推荐的准确度不高。
发明内容
基于此,为了提高文本内容推荐给用户的准确度,使其更加符合某个用户的浏览喜好,还提供了一种文本内容推荐方法。
一种文本内容推荐方法,包括:
获取用户标识,获取所述用户标识对应的用户属性标签值;
获取文本内容,提取所述文本内容的内容属性标签值;
遍历所述内容属性标签值,对于所述遍历到的内容属性标签值,获取包含该内容属性标签值的文本内容被浏览的总体浏览率、获取浏览过包含该内容属性标签值的文本内容的用户中与各个用户属性标签值对应的用户浏览比例;获取被推荐过包含该内容属性标签值的文本内容的用户中与各个用户属性标签值对应的用户推荐比例,根据所述总体浏览率、与各个用户属性标签值对应的用户浏览比例和用户推荐比例生成所述遍历到的内容属性标签值的标签热度值;
通过计算所述文本内容对应的各个内容属性标签值的标签热度值的平均值生成所述文本内容相对于所述用户标识的内容热度值,根据所述内容热度值选择文本内容,将选择的文本内容的链接下发给所述与用户标识对应的终端。
此外,为了提高文本内容推荐给用户的准确度,使其更加符合某个用户的浏览喜好,还提供了一种文本内容推荐装置。
一种文本内容推荐装置,包括:
用户属性获取模块,用于获取用户标识,获取所述用户标识对应的用户属性标签值;
内容标签获取模块,用于获取文本内容,提取所述文本内容的内容属性标签值;
标签热度值生成模块,用于遍历所述内容属性标签值,对于所述遍历到的内容属性标签值,获取包含该内容属性标签值的文本内容被浏览的总体浏览率、获取浏览过包含该内容属性标签值的文本内容的用户中与各个用户属性标签值对应的用户浏览比例;获取被推荐过包含该内容属性标签值的文本内容的用户中与各个用户属性标签值对应的用户推荐比例,根据所述总体浏览率、与各个用户属性标签值对应的用户浏览比例和用户推荐比例生成所述遍历到的内容属性标签值的标签热度值;
文本内容下发模块,用于通过计算所述文本内容对应的各个内容属性标签值的标签热度值的平均值生成所述文本内容相对于所述用户标识的内容热度值,根据所述内容热度值选择文本内容,将选择的文本内容的链接下发给所述与用户标识对应的终端。
实施本发明实施例,将具有如下有益效果:
首先,由于求得的内容热度值与用户标识对应的用户属性标签值一一相关,因此使得选择的文本内容均为与用户的兴趣爱好或操作习惯相关的内容,从而提高了推荐的准确度。
其次,上述计算标签热度值的方式参考的是历史推荐数据,因此在统计学上使得推荐结果更加符合用户的浏览习惯。
再次,在计算标签热度值时,采用的是相乘的方式,也就是说,若在该服务器的运行时动态添加了用户属性标签值或更改了用户属性标签值(例如,用户修改注册信息),服务器上运行的计算机本身并不需要进行改动,由于是相乘的关系,只需要将与更新的用户属性标签值对应的用户浏览比例与用户推荐比例添加到乘法因子中即可得到更新的标签热度值,从而得到更新的内容热度值,因此,上述方式的扩展性较好。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
其中:
图1为一个实施例中一种文本内容推荐方法的流程图;
图2为一个实施例中计算内容属性标签值的标签热度值的过程的流程图;
图3为一个实施例中一种文本内容推荐装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为解决上述资讯类应用的服务器向用户推荐的内容与用户个体的适配度不高,导致内容推荐的准确度较低的技术问题,在一个实施例中,特提出了一种文本内容推荐方法,该方法的执行可依赖于计算机程序,该计算机程序可以是资讯类应用(例如推荐新闻资讯的报刊应用、杂志应用等)、社交网络类应用(例如推荐话题帖子的论坛,微博等应用)、电商类应用(例如推荐打折消息活动消息的团购应用、网上商城应用)等可向用户终端推送文本类型的数据内容的应用的服务器程序。该计算机程序可运行于冯诺依曼体系的计算机系统之上。该计算机系统则可以是运行上述应用的服务器程序的服务器设备。
具体的,在本实施例中,文本内容推荐方法如图1所示,包括:
步骤S102:获取用户标识,获取所述用户标识对应的用户属性标签值。
在本实施例中,用户需要先在资讯类应用上使用账号登录,登录之后该应用的服务器上即存储了与该账号对应的会话(session),该用户登录的账号即为用户标识。该资讯类应用的服务器上可以同时存储有多个会话,服务器在进行内容推荐时,可遍历会话,获取各个会话对应的各个用户账号,然后对每个用户账号分别进行内容推荐,也就是说,为每个用户账号推荐的文本内容可能不同,且与用户账号相关。
在上例中,用户标识对应的用户属性标签即为登录的用户账号的用户资料或用户操作记录中的属性值。例如,若用户在注册用户账号时,在注册信息的性别、年龄、星座、住址、兴趣爱好等栏目中填写了相应的“男”、“31岁”、“金牛”、“深圳”、“体育”、“电影”、“旅游”等资料内容,则该填写的内容即为该用户账号的用户属性标签值。
另外,也可通过分词对用户资料进行分词得到用户属性标签值。例如,若用户填写的自我介绍的内容中为一段文字,则可通过对该段文字进行分词,将分词得到的名词作为该用户账号的用户属性标签值。
还可根据用户操作记录提取用户属性标签,例如,服务器可统计用户的常用登录地、经常浏览的板块(在资讯类应用中通常包含多个板块,例如财经板块、娱乐板块等,若用户经常浏览的板块为财经板块,则相应的用户属性标签值即为“财经”)等,并将其作为用户属性标签值。
在另一个实施例中,服务器上运行的计算机程序为服务推广类或广告类的应用的服务器程序,用户标识可仅为用户的邮箱、手机号或即时通信应用账号,用户不需要先在服务器上登录,而由服务器直接通过预设的邮箱列表或手机号列表提取用户标识。相应的用户属性标签值可以是为用户标识预设的属性值,也可以是根据用户标识自身的属性确定的属性值。例如,根据手机号可以提取到归属地以及号码段的用户属性标签值,根据邮箱可以提取邮箱服务提供商域名的用户属性标签值。若预先设置有与归属地对应的属性值,则可将该属性值添加到用户属性标签值中进行扩展。
步骤S104:获取文本内容,提取文本内容的内容属性标签值。
服务器上存储的文本内容有多个,服务器在向某个用户标识对应的终端(在该终端上登录的)在后续的步骤中,服务器可遍历或部分遍历服务器上存储的文本内容,计算遍历到的文本内容与前述获取的内容热度值,然后根据文本内容的内容热度值的大小选择是否推荐。
也就是说,对于某个特定的用户标识,在服务器上存储的多条待推荐的文本内容中选择推荐时,可先计算每条文本内容相对于该用户标识的内容热度值。在计算该相对的内容热度值时,需要先由文本内容中提取内容属性标签值。
文本内容的内容属性标签值可以有多个,可以是在生成该文本内容时预设的属性值,也可以是根据该文本内容本身的内容得到。例如,在一个微博的应用场景中,文本内容即为用户发布的微博的文本内容,用户可在发送微博时为该条微博添加话题标签,该话题标签即为文本内容的内容属性标签值。
在一个实施例中,也可对文本内容进行分词得到分词词组,将分词词组作为文本内容的内容属性标签值。
如上例中,若某用户发表的微博内容为“我喜欢的篮球明星是科比”,则通过分词可以得到分词词组“喜欢”、“篮球”、“明星”、“科比”,该分词词组即可作为该微博的内容属性标签值。
可选的,对文本内容进行分词得到分词词组的步骤之后还可获取所述分词词组的近义词或同义词,将其添加到分词词组中进行扩展。
如上例中,若某用户发表的微博内容为“我喜欢吃番茄”,则通过分词可以得到分词词组“喜欢”、“番茄”,通过查找预设的同义词或近义词库可查找到与“番茄”对应的同义词“西红柿”,则可将该微博的内容属性标签值扩展为“喜欢”、“番茄”、“西红柿”。
可选的,对文本内容进行分词得到分词词组的步骤之后还可获取预设的词条分类信息,在所述词条分类信息中查找与所述分词词组对应的类型词条,将所述类型词条添加到所述分词词组中进行扩展。
如上例中,若某用户发表的微博内容为“21岁的时候我们都在玩些什么”,则通过分词可以得到分词词组“21岁”、“玩”,而预设的词条分类信息中,“21岁”属于“90后”的类型词条,则可将该微博的内容属性标签值扩展为“21岁”、“玩”、“90后”。
步骤S106:遍历所述内容属性标签值,对于所述遍历到的内容属性标签值,获取包含该内容属性标签值的文本内容被浏览的总体浏览率、获取浏览过包含该内容属性标签值的文本内容的用户中与各个用户属性标签值对应的用户浏览比例;获取被推荐过包含该内容属性标签值的文本内容的用户中与各个用户属性标签值对应的用户推荐比例,根据所述总体浏览率、与各个用户属性标签值对应的用户浏览比例和用户推荐比例生成所述遍历到的内容属性标签值的标签热度值。
如前例中,若提取到某条文本内容的内容属性标签值为:tag1、tag2、tag3…tagi…tagN,则:
对于某个遍历到的内容属性标签值tagi,包含tagi的文本内容被浏览的总体浏览率即为包含tagi的文本内容被浏览的次数与推荐下发给用户终端的次数的比值,可根据公式:
ctr(tagi)=N1/N2
得到tagi的总体浏览率ctr(tagi)。其中,N1为包含tagi的文本内容被浏览的次数,N2为包含tagi的文本内容被下发给用户终端的次数。也就是说,某条包含tagi的文本内容被下发给用户之后,则在统计N2时累加1,若该用户点击了该文本内容进行了浏览,则在统计N1时累加1。
而对于该遍历到的内容属性标签值tagi,浏览过包含该内容属性标签值tagi的文本内容的用户中与各个用户属性标签值对应的用户浏览比例即为:浏览过包含该内容属性标签值tagi的文本内容的用户的数目中,包含各个用户属性标签值的用户数各自占的比例。
例如,若前述将要向其进行内容推荐的用户标识对应的用户属性标签值为:property1,property2….PropertyJ…PropertyN,则对于某个用户属性标签值PropertyJ,其对应的用户浏览比例即可根据公式:
P(propertyj|tagi)=Si,j/Si
得到。其中,P(propertyj|tagi)即为浏览过包含内容属性标签值tagi的文本内容的用户中与用户属性标签值PropertyJ对应的用户浏览比例,Si即为浏览过包含内容属性标签值tagi的文本内容的用户的数目,Si,j为Si中其包含的用户属性标签值包括PropertyJ的用户数目。
对于该遍历到的内容属性标签值tagi,被推荐过包含该内容属性标签值的文本内容的用户中与各个用户属性标签值对应的用户推荐比例即为:被推荐过该包含该内容属性标签值tagi的文本内容的用户的数目中,包含各个用户属性标签值的用户数各自占的比例。
例如,则对于提取的用户标识的某个用户属性标签值PropertyJ,其对应的用户推荐比例即可根据公式:
K(propertyj|tagi)=Ti,j/Ti
得到。其中,K(propertyj|tagi)即为被推荐过包含内容属性标签值tagi的文本内容的用户中与用户属性标签值PropertyJ对应的用户推荐比例,Ti即为被推荐过包含内容属性标签值tagi的文本内容的用户的数目,Ti,j为Ti中其包含的用户属性标签值包括PropertyJ的用户数目。
例如,若遍历到的内容属性标签值为“90后”,则若根据历史统计,包含“90后”的文本内容被推荐给用户的次数为10000次(同一个用户可能被推荐多次),而被用户点击文本内容的链接浏览实际内容的次数只有2000次,则ctr(“90后”)的值为2000/10000=0.2。
若将要向其推荐文本内容的用户标识的用户属性标签值包括“体育”、“电影”,且浏览过包含“90后”的文本内容的用户数目为1000人,其中,该1000个用户中有200个用户的用户属性标签值中包括“体育”,有300个用户的用户属性标签值中包括“电影”,则P(“体育”|“90后”)的值即为200/1000=0.2,P(“电影”|“90后”)的值即为300/1000=0.3。
相应的,若被推荐过包含“90后”的文本内容的用户数目为3000人,其中,该3000个用户中有600个用户的用户属性标签值中包括“体育”,有1200个用户的用户属性标签值中包括“电影”,则K(“体育”|“90后”)的值即为600/3000=0.2,P(“电影”|“90后”)的值即为1200/3000=0.4。
而在本实施例中,可采用乘积的方式根据所述总体浏览率、与各个用户属性标签值对应的用户浏览比例和用户推荐比例生成所述遍历到的内容属性标签值的标签热度值,如图2所示,具体为:
步骤S202,计算与各个用户属性标签值对应的用户浏览比例的第一乘积。
步骤S204,计算与各个用户属性标签值对应的用户推荐比例的第二乘积。
步骤S206,将所述第一乘积与所述第二乘积的比值与所述总体浏览率相乘得到所述遍历到的内容属性标签值的标签热度值。
如上例中,可根据公式:
得到tagi相对于前述用户标识的标签热度值H(tagi),其中,P(propertyj|tagi)为浏览过包含内容属性标签值tagi的文本内容的用户中与用户属性标签值PropertyJ对应的用户浏览比例,K(propertyj|tagi)为被推荐过包含内容属性标签值tagi的文本内容的用户中与用户属性标签值PropertyJ对应的用户推荐比例,ctr(tagi)为tagi的总体浏览率。
步骤S108:通过计算所述文本内容对应的各个内容属性标签值的标签热度值的平均值生成所述文本内容相对于用户标识的内容热度值,根据该内容热度值选择文本内容,将选择的文本内容的链接下发给所述用户标识对应的终端。
如前所述,若文本内容的内容属性标签值为tag1、tag2…tagi…tagN,则该文本内容相对于前述用户标识的内容热度值即为H(tag1)、H(tag2)..H(tagi)的平均值。在本实施例中,计算所述文本内容对应的各个内容属性标签值的标签热度值的几何平均值,将该几何平均值作为该文本内容相对于该用户标识的内容热度值。具体可表示为:
其中,score即为该文本内容相对于用户标识的内容热度值,N为该文本内容的内容属性标签值的总个数。
使用上述方式计算的文本内容相对于用户标识的内容热度值,首先,由于求得的内容热度值与用户标识对应的用户属性标签值一一相关,因此使得选择的文本内容均为与用户的兴趣爱好或操作习惯相关的内容,从而提高了推荐的准确度。其次,上述计算标签热度值的方式参考的是历史推荐数据,因此在统计学上使得推荐结果更加符合用户的浏览习惯。再次,在计算标签热度值时,采用的是相乘的方式,也就是说,若在该服务器的运行时动态添加了用户属性标签值或更改了用户属性标签值(例如,用户修改注册信息),服务器上运行的计算机本身并不需要进行改动,由于是相乘的关系,只需要将与更新的用户属性标签值对应的用户浏览比例与用户推荐比例添加到乘法因子中即可得到更新的标签热度值,从而得到更新的内容热度值,因此,上述方式的扩展性较好。
在其他实施例中,也可通过求和的方式根据所述总体浏览率、与各个用户属性标签值对应的用户浏览比例和用户推荐比例生成所述遍历到的内容属性标签值的标签热度值。即将与各个用户属性标签值对应的用户浏览比例的和减去将与各个用户属性标签值对应的用户推荐比例的和然后再加上总体浏览率得到遍历到的内容属性标签值的标签热度值。而在该实施例中,则可,计算文本内容对应的各个内容属性标签值的标签热度值的算数平均值,将该算数平均值作为该文本内容相对于该用户标识的内容热度值。
在本实施例中,对于服务器上存储的多条待推荐的文本内容,在求得了各条文本内容相对于选择的用户标识的内容热度值score之后,即可根据score的大小选择相对于选择的用户标识的score值较高的文本内容,将其链接或者摘要发送给该用户标识对应的终端。用户终端接收到该链接或摘要之后,可在提示栏或通知栏通知用户,若用户对于该链接或摘要感兴趣,点击了该链接或摘要信息进行浏览,则该点击操作产生的访问请求再次上传至服务器,服务器即可对文本内容中的各个内容属性标签值对应的浏览与被推荐的统计值进行更新,从而方便下一次推荐操作。
根据score值进行推荐的方式可以有多种,例如,可在文本内容相对于用户标识的内容热度值大于热度阈值时,将文本内容下发给用户标识对应的终端。
由于服务器上存储的文本内容的数量较大,若对每一个用户进行推荐时,均计算每条文本内容相对于该用户的内容热度值,则计算量较大,耗费的计算资源较多。而若仅在判断内容热度值是否大于热度阈值之后则选择推荐,可减少大量较多的计算量。
再例如,可根据内容热度值对文本内容进行排序得到文本内容的排名,在所述排名高于排名阈值时,将该排名的文本内容下发给所述用户标识对应的终端。使用排名的方式则可将与用户标识最相关的文本内容优先推荐给该用户,从而使得推荐的准确度大大提高。
在一个实施例中,为解决上述资讯类应用的服务器向用户推荐的内容与用户个体的适配度不高,导致内容推荐的准确度较低的技术问题,特提出了一种与前述文本内容推荐方法对应的文本内容推荐装置,如图3所示,包括:用户属性获取模块102、内容标签获取模块104、标签热度值生成模块106以及文本内容下发模块108,其中:
用户属性获取模块102,用于获取用户标识,获取所述用户标识对应的用户属性标签值。
内容标签获取模块104,用于获取文本内容,提取所述文本内容的内容属性标签值。
标签热度值生成模块106,用于遍历所述内容属性标签值,对于所述遍历到的内容属性标签值,获取包含该内容属性标签值的文本内容被浏览的总体浏览率、获取浏览过包含该内容属性标签值的文本内容的用户中与各个用户属性标签值对应的用户浏览比例;获取被推荐过包含该内容属性标签值的文本内容的用户中与各个用户属性标签值对应的用户推荐比例,根据所述总体浏览率、与各个用户属性标签值对应的用户浏览比例和用户推荐比例生成所述遍历到的内容属性标签值的标签热度值。
文本内容下发模块108,用于通过计算所述文本内容对应的各个内容属性标签值的标签热度值的平均值生成所述文本内容相对于所述用户标识的内容热度值,根据所述内容热度值选择文本内容,将选择的文本内容的链接下发给所述与用户标识对应的终端。
在本实施例中,标签热度值生成模块106还用于计算与各个用户属性标签值对应的用户浏览比例的第一乘积;计算与各个用户属性标签值对应的用户推荐比例的第二乘积;将所述第一乘积与所述第二乘积的比值与所述总体浏览率相乘得到所述遍历到的内容属性标签值的标签热度值。
在本实施例中,文本内容下发模块108还用于计算所述文本内容对应的各个内容属性标签值的标签热度值的几何平均值,将该几何平均值作为该文本内容相对于所述用户标识的内容热度值。
在本实施例中,内容标签获取模块104还用于对所述文本内容进行分词得到分词词组,将所述分词词组作为所述文本内容的内容属性标签值。
在本实施例中,内容标签获取模块104还用于获取所述分词词组的近义词或同义词,将其添加到所述分词词组中进行扩展。
在本实施例中,内容标签获取模块104还用于获取预设的词条分类信息,在所述词条分类信息中查找与所述分词词组对应的类型词条,将所述类型词条添加到所述分词词组中进行扩展。
在本实施例中,文本内容下发模块108还用于在所述文本内容的内容热度值大于热度阈值时,选择该文本内容。
在本实施例中,文本内容下发模块108还用于根据内容热度值对文本内容进行排序得到文本内容的排名,在所述排名高于排名阈值时,选择该排名的文本内容。
综上所述,实施本发明实施例,将具有如下有益效果:
首先,由于求得的内容热度值与用户标识对应的用户属性标签值一一相关,因此使得选择的文本内容均为与用户的兴趣爱好或操作习惯相关的内容,从而提高了推荐的准确度。
其次,上述计算标签热度值的方式参考的是历史推荐数据,因此在统计学上使得推荐结果更加符合用户的浏览习惯。
再次,在计算标签热度值时,采用的是相乘的方式,也就是说,若在该服务器的运行时动态添加了用户属性标签值或更改了用户属性标签值(例如,用户修改注册信息),服务器上运行的计算机本身并不需要进行改动,由于是相乘的关系,只需要将与更新的用户属性标签值对应的用户浏览比例与用户推荐比例添加到乘法因子中即可得到更新的标签热度值,从而得到更新的内容热度值,因此,上述方式的扩展性较好。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。
Claims (12)
1.一种文本内容推荐方法,包括:
获取用户标识,获取所述用户标识对应的用户属性标签值;
获取文本内容,提取所述文本内容的内容属性标签值;具体包括:对所述文本内容进行分词得到分词词组,获取所述分词词组的近义词或同义词,将所述近义词或所述同义词添加到所述分词词组中进行扩展,将扩展后的分词词组作为所述文本内容的内容属性标签值;
遍历所述提取到的内容属性标签值,对于所述遍历到的内容属性标签值,获取包含该内容属性标签值的文本内容被浏览的总体浏览率;
根据浏览过包含该内容属性标签值的文本内容的用户,确定与所述用户标识所标识的用户对应的各个用户属性标签值下的用户浏览比例;其中,每个用户属性标签值对应的用户浏览比例为:浏览过包含该内容属性标签值的文本内容的用户中包含该用户属性标签值的用户的数目与所述浏览过包含该内容属性标签值的文本内容的用户的数目之间的比值;
根据被推荐过包含该内容属性标签值的文本内容的用户,确定与所述用户标识所标识的用户对应的各个用户属性标签值下的用户推荐比例;其中,每个用户属性标签值对应的用户推荐比例为:被推荐过包含该内容属性标签值的文本内容的用户中包含该用户属性标签值的用户的数目与所述被推荐过包含该内容属性标签值的文本内容的用户的数目之间的比值;
根据所述总体浏览率、各个用户属性标签值下的用户浏览比例和用户推荐比例生成所述遍历到的内容属性标签值的标签热度值;
通过计算所述文本内容对应的各个内容属性标签值的标签热度值的平均值,生成所述文本内容相对于所述用户标识的内容热度值;
根据所述内容热度值选择文本内容,将选择的文本内容的链接下发给与所述用户标识对应的终端。
2.根据权利要求1所述的文本内容推荐方法,其特征在于,所述根据所述总体浏览率、各个用户属性标签值下的用户浏览比例和用户推荐比例生成所述遍历到的内容属性标签值的标签热度值的步骤为:
计算各个用户属性标签值下的用户浏览比例的第一乘积;
计算各个用户属性标签值下的用户推荐比例的第二乘积;
计算所述第一乘积与所述第二乘积的比值,计算所述比值与所述总体浏览率的第三乘积,将所述第三乘积作为所述遍历到的内容属性标签值的标签热度值。
3.根据权利要求1或2所述的文本内容推荐方法,其特征在于,通过计算所述文本内容对应的各个内容属性标签值的标签热度值的平均值生成所述文本内容的内容热度值的步骤为:
计算所述文本内容对应的各个内容属性标签值的标签热度值的几何平均值,将该几何平均值作为该文本内容相对于所述用户标识的内容热度值。
4.根据权利要求1所述的文本内容推荐方法,其特征在于,所述对所述文本内容进行分词得到分词词组的步骤之后还包括:
获取预设的词条分类信息,在所述词条分类信息中查找与所述分词词组对应的类型词条,将所述类型词条添加到所述分词词组中进行扩展。
5.根据权利要求1所述的文本内容推荐方法,其特征在于,所述根据内容热度值选择文本内容的步骤包括:
在所述文本内容的内容热度值大于热度阈值时,选择该文本内容。
6.根据权利要求1所述的文本内容推荐方法,其特征在于,所述根据内容热度值选择文本内容的步骤包括:
根据内容热度值对文本内容进行排序得到文本内容的排名,在所述排名高于排名阈值时,选择该排名的文本内容。
7.一种文本内容推荐装置,包括:
用户属性获取模块,用于获取用户标识,获取所述用户标识对应的用户属性标签值;
内容标签获取模块,用于获取文本内容,提取所述文本内容的内容属性标签值;所述内容标签获取模块,具体用于对所述文本内容进行分词得到分词词组,获取所述分词词组的近义词或同义词,将所述近义词或所述同义词添加到所述分词词组中进行扩展,将扩展后的分词词组作为所述文本内容的内容属性标签值;
标签热度值生成模块,用于遍历所述提取到的内容属性标签值,对于所述遍历到的内容属性标签值,获取包含该内容属性标签值的文本内容被浏览的总体浏览率;根据浏览过包含该内容属性标签值的文本内容的用户,确定与所述用户标识所标识的用户对应的各个用户属性标签值下的用户浏览比例;根据被推荐过包含该内容属性标签值的文本内容的用户,确定与所述用户标识所标识的用户对应的各个用户属性标签值下的用户推荐比例;根据所述总体浏览率、与各个用户属性标签值下的用户浏览比例和用户推荐比例生成所述遍历到的内容属性标签值的标签热度值;其中,每个用户属性标签值对应的用户浏览比例为:浏览过包含该内容属性标签值的文本内容的用户中包含该用户属性标签值的用户的数目与所述浏览过包含该内容属性标签值的文本内容的用户的数目之间的比值;每个用户属性标签值对应的用户推荐比例为:被推荐过包含该内容属性标签值的文本内容的用户中包含该用户属性标签值的用户的数目与所述被推荐过包含该内容属性标签值的文本内容的用户的数目之间的比值;
文本内容下发模块,用于通过计算所述文本内容对应的各个内容属性标签值的标签热度值的平均值,生成所述文本内容相对于所述用户标识的内容热度值;根据所述内容热度值选择文本内容,将选择的文本内容的链接下发给与所述用户标识对应的终端。
8.根据权利要求7所述的文本内容推荐装置,其特征在于,所述标签热度值生成模块还用于计算各个用户属性标签值下的用户浏览比例的第一乘积;计算各个用户属性标签值下的用户推荐比例的第二乘积;计算所述第一乘积与所述第二乘积的比值,计算所述比值与所述总体浏览率相乘的第三乘积,将所述第三乘积作为所述遍历到的内容属性标签值的标签热度值。
9.根据权利要求7或8所述的文本内容推荐装置,其特征在于,所述文本内容下发模块,还用于计算所述文本内容对应的各个内容属性标签值的标签热度值的几何平均值,将该几何平均值作为该文本内容相对于所述用户标识的内容热度值。
10.根据权利要求7所述的文本内容推荐装置,其特征在于,所述内容标签获取模块还用于获取预设的词条分类信息,在所述词条分类信息中查找与所述分词词组对应的类型词条,将所述类型词条添加到所述分词词组中进行扩展。
11.根据权利要求7所述的文本内容推荐装置,其特征在于,所述文本内容下发模块,还用于在所述文本内容的内容热度值大于热度阈值时,选择该文本内容。
12.根据权利要求7所述的文本内容推荐装置,其特征在于,所述文本内容下发模块,还用于根据内容热度值对文本内容进行排序得到文本内容的排名,在所述排名高于排名阈值时,选择该排名的文本内容。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510102993.8A CN106033415B (zh) | 2015-03-09 | 2015-03-09 | 文本内容推荐方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510102993.8A CN106033415B (zh) | 2015-03-09 | 2015-03-09 | 文本内容推荐方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106033415A CN106033415A (zh) | 2016-10-19 |
CN106033415B true CN106033415B (zh) | 2020-07-03 |
Family
ID=57150557
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510102993.8A Active CN106033415B (zh) | 2015-03-09 | 2015-03-09 | 文本内容推荐方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106033415B (zh) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106708802A (zh) * | 2016-12-20 | 2017-05-24 | 西南石油大学 | 一种信息推荐的方法及系统 |
CN107038224B (zh) * | 2017-03-29 | 2022-09-30 | 腾讯科技(深圳)有限公司 | 数据处理方法及数据处理装置 |
CN107665442B (zh) * | 2017-05-10 | 2020-03-27 | 平安科技(深圳)有限公司 | 获取目标用户的方法及装置 |
CN108133011B (zh) * | 2017-12-22 | 2022-05-24 | 新奥(中国)燃气投资有限公司 | 一种资讯推送方法及装置 |
CN108268619B (zh) * | 2018-01-08 | 2020-06-30 | 阿里巴巴集团控股有限公司 | 内容推荐方法及装置 |
CN109740048B (zh) * | 2018-12-12 | 2020-12-22 | 中国联合网络通信集团有限公司 | 一种课程推荐方法及装置 |
CN109960756B (zh) * | 2019-03-19 | 2021-04-09 | 国家计算机网络与信息安全管理中心 | 新闻事件信息归纳方法 |
CN110502299B (zh) * | 2019-08-12 | 2021-05-14 | 南京大众书网图书文化有限公司 | 一种用于提供小说信息的方法与设备 |
CN111523041B (zh) * | 2020-04-30 | 2023-03-24 | 掌阅科技股份有限公司 | 热度数据的推荐方法、计算设备及计算机存储介质 |
WO2021227632A1 (en) * | 2020-05-15 | 2021-11-18 | Guangdong Oppo Mobile Telecommunications Corp., Ltd. | System and method for auto-recommending at least one intelligent text to a user |
CN111680219B (zh) * | 2020-06-09 | 2023-10-20 | 深圳市雅阅科技有限公司 | 内容推荐方法、装置、设备及可读存储介质 |
CN112395421B (zh) * | 2021-01-21 | 2021-05-11 | 平安科技(深圳)有限公司 | 课程标签的生成方法、装置、计算机设备及介质 |
CN113010739B (zh) * | 2021-03-18 | 2024-01-26 | 北京奇艺世纪科技有限公司 | 一种视频标签审核方法、装置及电子设备 |
CN114866603B (zh) * | 2022-04-19 | 2024-05-03 | 北京安锐卓越信息技术股份有限公司 | 信息推送方法、装置、电子设备及存储介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104331476A (zh) * | 2014-11-04 | 2015-02-04 | 周艳 | 内容交易领域的实时内容推荐方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014170438A (ja) * | 2013-03-05 | 2014-09-18 | Yahoo Japan Corp | 情報処理装置及び方法 |
CN104268290B (zh) * | 2014-10-22 | 2017-08-08 | 武汉科技大学 | 一种基于用户聚类的推荐方法 |
-
2015
- 2015-03-09 CN CN201510102993.8A patent/CN106033415B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104331476A (zh) * | 2014-11-04 | 2015-02-04 | 周艳 | 内容交易领域的实时内容推荐方法 |
Also Published As
Publication number | Publication date |
---|---|
CN106033415A (zh) | 2016-10-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106033415B (zh) | 文本内容推荐方法及装置 | |
US11494457B1 (en) | Selecting a template for a content item | |
CN107172151B (zh) | 用于推送信息的方法和装置 | |
CN109819284B (zh) | 一种短视频推荐方法、装置、计算机设备及存储介质 | |
CN111178970B (zh) | 广告投放的方法及装置、电子设备和计算机可读存储介质 | |
US20180144367A1 (en) | Method and system for creating user based summaries for content distribution | |
US8447643B2 (en) | System and method for collecting and distributing reviews and ratings | |
CN103886090B (zh) | 基于用户喜好的内容推荐方法及装置 | |
US8676875B1 (en) | Social media measurement | |
US11836778B2 (en) | Product and content association | |
US20150193821A1 (en) | Information processing apparatus, information processing method, and information processing program | |
US10019419B2 (en) | Method, server, browser, and system for recommending text information | |
CN103778260A (zh) | 一种个性化微博信息推荐系统和方法 | |
CA2929573A1 (en) | Hashtags and content presentation | |
US10055741B2 (en) | Method and apparatus of matching an object to be displayed | |
US9390168B1 (en) | Customer keyword-based item recommendations | |
US20180060427A1 (en) | Navigating a Taxonomy Using Search Queries | |
US8812734B2 (en) | Network feed content | |
CN107291755A (zh) | 一种终端推送方法及装置 | |
CN108470289B (zh) | 基于电商购物平台的虚拟物品发放方法及设备 | |
CN111597454A (zh) | 一种账号推荐方法及装置 | |
CN111782912B (zh) | 词推荐方法、装置、服务器和介质 | |
WO2015042482A1 (en) | Social content distribution network | |
Wang et al. | Discovering implicit concepts in popular TV programs from social media |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20221114 Address after: 1402, Floor 14, Block A, Haina Baichuan Headquarters Building, No. 6, Baoxing Road, Haibin Community, Xin'an Street, Bao'an District, Shenzhen, Guangdong 518133 Patentee after: Shenzhen Yayue Technology Co.,Ltd. Address before: 518057 5-10 building, Fiyta building, Gaoxin Nan Road, Nanshan District hi tech Zone, Shenzhen, Guangdong Patentee before: Shenzhen Tencent Computer System Co.,Ltd. |