CN110598100A - 一种热词推荐方法、装置、设备及存储介质 - Google Patents

一种热词推荐方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN110598100A
CN110598100A CN201910833206.5A CN201910833206A CN110598100A CN 110598100 A CN110598100 A CN 110598100A CN 201910833206 A CN201910833206 A CN 201910833206A CN 110598100 A CN110598100 A CN 110598100A
Authority
CN
China
Prior art keywords
information
user
hot word
elements
hotword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910833206.5A
Other languages
English (en)
Other versions
CN110598100B (zh
Inventor
卓达城
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Yayue Technology Co ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201910833206.5A priority Critical patent/CN110598100B/zh
Publication of CN110598100A publication Critical patent/CN110598100A/zh
Application granted granted Critical
Publication of CN110598100B publication Critical patent/CN110598100B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及互联网技术领域,具体是一种热词推荐方法、装置、设备及存储介质,所述方法包括:捕捉热词推荐控件产生的热词推荐指令;响应于所述热词推荐指令,获取目标用户对应的用户画像;根据所述用户画像在热词词库中提取目标热词集,所述目标热词集中的元素的综合推荐指数符合预设的综合推荐指数判据,所述元素的综合推荐指数与元素的用户相关度和元素的全网热度均正相关;所述元素的用户相关度根据所述用户画像确定;显示所述目标热词集中的目标热词。本发明的热词推荐方法能够增加推荐的热词与所述目标用户的相关度,实现个性化推荐的“千人千面”,提升用户体验。

Description

一种热词推荐方法、装置、设备及存储介质
技术领域
本发明涉及互联网技术领域,特别涉及一种热词推荐方法、装置、设备及存储介质。
背景技术
随着移动互联网技术的不断发展,用户对于互联网信息的需求也越来越高,搜索引擎成为用户获取互联网信息的重要工具,用户可以随时随地方便快捷地通过搜索引擎获取到自己想要了解的信息。搜索词条是当今社会热门新闻事件以及领域知识的高度概括,是了解新闻事物、探索知识的主要入口,已经成为用户的一种知识资源,使得用户可以利用更加碎片化的时间去了解想要了解的信息。
用户在使用互联网进行搜索时,进入搜索页面,页面通常会在搜索输入栏下方展示一些热词供用户选择。这些热词即热门的搜索词,通常是用户搜索时输入最多的词语,一般是一段时间内的各界大事或流行的话题。热词推荐可以使用户更快更方便的了解最近一段时间内的热点信息。
现有的热词推荐方法主要包括两种,一是基于用户的历史搜索记录,获取与所述历史搜索记录相关的热词进行推荐,这种向用户推荐热词的方法比较简单,但是会有一些搜索结果质量不高或者热度不高的热词被推荐,导致用户体验不佳;二是根据全网公开的信息,计算热词的热度并进行排序,将热度排序靠前的热词推荐给用户,这种向用户推荐热词的方法向每个用户推荐的热词都相同,可能使得推荐的热词并非用户感兴趣的内容,导致推荐效果较差。
发明内容
针对现有技术的上述问题,本发明的目的在于提供一种热词推荐方法、装置、设备及存储介质,能够提高推荐的热词与用户的相关度,提升用户体验。
为了解决上述问题,本发明提供一种热词推荐方法,包括:
捕捉热词推荐控件产生的热词推荐指令;
响应于所述热词推荐指令,获取目标用户对应的用户画像;
根据所述用户画像在热词词库中提取目标热词集,所述目标热词集中的元素的综合推荐指数符合预设的综合推荐指数判据,所述元素的综合推荐指数与元素的用户相关度和元素的全网热度均正相关;所述元素的用户相关度根据所述用户画像确定;
显示所述目标热词集中的目标热词。
本发明另一方面提供一种热词推荐装置,包括:
推荐指令捕捉模块,用于捕捉热词推荐控件产生的热词推荐指令;
用户画像获取模块,用于响应于所述热词推荐指令,获取目标用户对应的用户画像;
目标热词集提取模块,用于根据所述用户画像在热词词库中提取目标热词集,所述目标热词集中的元素的综合推荐指数符合预设的综合推荐指数判据,所述元素的综合推荐指数与元素的用户相关度和元素的全网热度均正相关;所述元素的用户相关度根据所述用户画像确定;
显示模块,用于显示所述目标热词集中的目标热词。
本发明另一方面提供一种电子设备,所述电子设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上述的热词推荐方法。
本发明另一方面提供一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如上述的热词推荐方法。
由于上述技术方案,本发明具有以下有益效果:
本发明的热词推荐方法、装置、设备及存储介质,通过将热词词库中的元素的词语标签与目标用户的用户标签进行匹配确定所述元素与目标用户的用户相关度,然后对所述用户相关度以及元素的全网热度进行加权求和得到所述元素的综合推荐指数,并根据所述综合推荐指数确定推荐给所述目标用户的目标热词集。本发明在确定目标热词的过程中结合了用户的特性,增加了所述目标热词与用户的相关度,不仅实现了个性化推荐的“千人千面”,还能够提高推荐结果的准确性,使得推荐的热词更加符合用户的兴趣点,进而带来点击率上的明显提升。
附图说明
为了更清楚地说明本发明的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1是本发明一个实施例提供的实施环境示意图;
图2是本发明一个实施例提供的区块链系统的结构示意图;
图3是本发明一个实施例提供的区块结构示意图;
图4是本发明一个实施例提供的热词推荐方法的流程图;
图5是本发明另一个实施例提供的热词推荐方法的流程图;
图6是本发明另一个实施例提供的热词推荐方法的流程图;
图7A和图7B是本发明一个实施例涉及的用户界面示意图;
图8是本发明另一个实施例提供的热词推荐方法的流程图;
图9是本发明另一个实施例提供的热词推荐方法的流程图;
图10是本发明另一个实施例提供的热词推荐方法的流程图;
图11是本发明一个实施例提供的热词推荐装置的结构示意图;
图12是本发明一个实施例提供的电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或模块的过程、方法、装置、产品或设备不必限于清楚地列出的那些步骤或模块,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或模块。
请参考说明书附图1,其示出了本发明一个实施例提供的热词推荐方法的实施环境示意图,如图1所示,该实施环境可以至少包括客户端110和服务器120。
所述客户端110可以包括智能手机、平板电脑、电子书阅读器、膝上型便携计算机和台式计算机等实体设备,也可以包括运行于实体设备中的软体,例如服务商提供给用户的网页页面,以及这些服务商提供给用户的应用。所述客户端110具体可以为具有热词推荐功能的应用程序,可以包括新闻类应用程序、视频播放类应用程序和即时通讯类应用程序等。
所述服务器120可以根据用户画像从热词词库中提取目标热词集,并发送至所述客户端110,所述服务器120可以通过无线或者有线网络与所述客户端110建立通信连接。
所述服务器120可以包括一个独立运行的服务器,或者分布式服务器,或者由多个服务器组成的服务器集群。所述分布式服务器具体可以为区块链(Block Chain)结构,所述区块链结构中的任意一个节点都可以执行或参与执行所述热词推荐方法。
在一个优选的实施例中,所述热词词库也可以存储于区块链系统之中。结合参考说明书附图2,图2是本发明一个实施例提供的区块链系统的一个可选的结构示意图,多个节点之间形成组成的点对点(P2P,Peer To Peer)网络,P2P协议是一个运行在传输控制协议(TCP,Transmission Control Protocol)之上的应用层协议。在分布式系统中,任何机器如服务器、终端都可以加入而成为节点,节点包括硬件层、中间层、操作系统层和应用层。
参见图2示出的区块链系统中各节点的功能,涉及的功能包括:
1)路由,节点具有的基本功能,用于支持节点之间的通信。
节点除具有路由功能外,还可以具有以下功能:
2)应用,用于部署在区块链中,根据实际业务需求而实现特定业务,记录实现功能相关的数据形成记录数据,在记录数据中携带数字签名以表示任务数据的来源,将记录数据发送到区块链系统中的其他节点,供其他节点在验证记录数据来源以及完整性成功时,将记录数据添加到临时区块中。
3)区块链,包括一系列按照产生的先后时间顺序相互接续的区块(Block),新区块一旦加入到区块链中就不会再被移除,区块中记录了区块链系统中节点提交的记录数据。
结合参考说明书附图3,图3是本发明一个实施例提供的区块结构(BlockStructure)的一个可选的示意图,每个区块中包括本区块存储交易记录的哈希值(本区块的哈希值)、以及前一区块的哈希值,各区块通过哈希值连接形成区块链。另外,区块中还可以包括有区块生成时的时间戳等信息。区块链本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了相关的信息,用于验证其信息的有效性(防伪)和生成下一个区块。
请参考说明书附图4,其示出了本发明一个实施例提供的热词推荐方法的流程,所述热词推荐方法可以应用于本发明实施例提供的热词推荐装置,所述热词推荐装置可以配置于电子设备中。
需要说明的是,本说明书提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的系统或产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境)。如图4所示,所述方法可以包括以下步骤:
S410:捕捉热词推荐控件产生的热词推荐指令。
本发明实施例中,可以通过捕捉用户对所述热词推荐控件的点击操作来捕捉热词推荐控件产生的热词推荐指令。实际应用中,还可以通过其他方式来捕捉热词推荐控件产生的热词推荐指令,例如捕捉用户针对所述热词推荐控件的语音指令等,本发明实施例对此不做限制。
S420:响应于所述热词推荐指令,获取目标用户对应的用户画像。
本发明实施例中,所述目标用户对应的用户画像可以用来表示目标用户的特性,可以根据用户的个人信息、历史点击信息以及社交关系进行确定。所述用户画像可以包括至少一个用户标签,所述用户标签可以为预先设置的标签库中的标签,所述标签库中的不同标签可以属于不同的标签类型,所述标签类型可以包括用户属性类标签和信息内容类标签,所述用户属性类标签可以包括用户性别、用户年龄段、用户所在地域和用户职业等标签,例如“80后”、“律师”等等,所述信息内容类标签可以包括信息类型、信息所属领域和信息来源等标签,例如“视频”、“天气”等等。每个所述信息的词语集中的元素可以匹配到至少一个标签库中的标签。
S430:根据所述用户画像在热词词库中提取目标热词集,所述目标热词集中的元素的综合推荐指数符合预设的综合推荐指数判据,所述元素的综合推荐指数与元素的用户相关度和元素的全网热度均正相关;所述元素的用户相关度根据所述用户画像确定。
本发明实施例中,所述热词词库中的元素可以包括由时下很多人关注的事件抽象出来的词语或者短语(也称为热点事件,热榜等),所述热词词库可以包括根据全网信息确定的多个元素。在热词词库中提取所述目标用户的目标热词集的过程中,不仅考虑热词词库中的元素的全网热度,而且考虑元素与所述目标用户的用户相关度,可以确定与目标用户感兴趣的信息相关联的热词进行推荐。
在一个可能的的实施例中,如图5所示,所述根据所述用户画像在热词词库中提取目标热词集可以包括:
S510:根据所述用户画像确定所述热词词库中的元素的用户相关度。
在一个可能的实施例中,如图6所示,所述用户画像包括至少一个用户标签,所述根据所述用户画像确定所述热词词库中的元素的用户相关度可以包括:
S511:获取所述热词词库中的元素的词语标签以及所述词语标签的标签得分。
本发明实施例中,所述元素的词语标签可以体现与所述元素相关联的信息的内容,所述用户标签可以体现所述目标用户常常关注的信息的内容(即用户的兴趣点),通过所述元素的词语标签与所述目标用户的用户标签进行匹配可以确定与所述目标用户关注的信息相关联的元素。
S512:获取所述用户标签的标签得分。
本发明实施例中,所述用户标签的标签得分也可以根据用户的个人信息、历史点击信息以及社交关系进行确定。在一个示例中,如果用户为互联网行业从业者,则可以为所述用户添加标签“互联网”,并为所述标签“互联网”设置初始得分;如果所述用户点击具有标签“四大名著”的文章后,可以为所述用户添加标签“四大名著”并将所述标签的得分计为第一分数。当用户再次点击具有标签“四大名著”或者“互联网”的文章后将所述标签的得分增加第一分数,用户每点击一次则标签得分增加第一分数,例如可以设置为用户每点击一次则标签得分增加1。另外,当与用户具有预设关联关系的用户(例如用户的好友)点击具有标签“四大名著”或者“互联网”的文章后将所述标签的得分增加第二分数,同样地,与用户具有预设关联关系的用户每点击一次则标签得分增加第二分数,例如可以设置为好友每点击一次则标签得分增加0.1。
S513:根据所述词语标签的标签得分和所述用户标签的标签得分确定所述热词词库中的元素的用户相关度。
本发明实施例中,可以根据所述词语标签的标签得分确定第一得分向量,根据所述用户标签的标签得分确定第二得分向量,可以通过计算所述第一得分向量与所述第二得分向量之间的欧氏距离或者卡方距离等来确定所述热词与所述目标用户的用户相关度。具体地,所述第一得分向量与所述第二得分向量之间的距离越小,所述热词与所述目标用户的用户相关度越高。
示例性地,假设元素A的词语标签包括T1,T2、T3、T4和T5,所述词语标签的标签得分分别为100,80,30,20,50,所述目标用户的用户标签包括T1,T2、T3,T6,所述用户标签的标签得分分别为100,80,60,10,则可以确定第一得分向量为(100,80,30,20,50,0),确定第二得分向量为(100,80,60,0,0,10),然后可以根据所述第一得分向量和所述第二得分向量来确定所述元素A与所述目标用户的用户相关度。
S520:获取所述热词词库中的元素的全网热度。
本发明实施例中,所述全网热度可以体现所述热词词库中的元素的当前热度信息,全网热度越高表示所述元素的被关注度越高。
S530:获取所述用户相关度的相关权重和所述全网热度的热度权重。
本发明实施例中,所述相关权重和所述热度权重可以根据实际应用的需求进行设置,或者根据不同用户的历史点击信息确定,如果所述用户更倾向于点击与自身相关的信息或者一直关注的信息,则可以将所述相关权重设置为较大值,如果所述用户更倾向于点击热度较高的信息,则可以将所述热度权重设置为较大值。
S540:根据所述用户相关度、所述相关权重、所述全网热度和所述热度权重确定所述热词词库中的元素的综合推荐指数。
本发明实施例中,可以对所述用户相关度和所述全网热度进行加权求和得到所述元素的综合推荐指数。
S550:提取所述综合推荐指数符合预设的综合推荐指数判据的元素,生成所述目标热词集。
本发明实施例中,可以根据所述综合推荐指数对所述热词词库中的元素进行排序,选取第三预设数量的排序靠前的元素组成所述目标用户的目标热词集。例如,可以选取排序前5的元素组成目标热词集。另外,还可以提取所述综合推荐指数大于预设阈值的元素组成所述目标用户的目标热词集。
S440:显示所述目标热词集中的目标热词。
本发明实施例中,当获取到所述目标热词集后,可以将所述目标热词集中的目标热词在指定的用户界面进行显示,所述用户界面可以包括用于显示所述目标热词的显示区域,用户点击所述目标热词即可获取与所述热词相关的信息。
结合参考说明书附图7A和7B,其示例性示出了本发明实施例涉及的用户界面示意图,所述用户界面71包括用于获取搜索信息的操作控件72,在获取到对应于所述操作控件72的触发信号后,显示搜索界面73,所述搜索界面73包括用于显示目标热词的显示区域74,用户点击所述显示区域74显示的热词即可获取与所述热词相关的信息。
本发明实施例中,由于不同的用户可能具有不同的用户标签和/或不同的标签得分,因此利用本发明实施例的热词推荐方法确定的向不同目标用户推荐的目标热词可能不完全相同。在一个示例中,如图7A所示,假设用户A的用户标签包括“学生”和“天气”等标签,则根据本发明实施例的热词推荐方法确定的目标热词集可以包括“高考”、“今年首个台风”、“XXX案重启”、“你们家热成啥颜色了”和“日全食”等目标热词;如图7B所示,假设用户B的用户标签包括“80后”和“律师”等标签,则根据本发明实施例的热词推荐方法确定的目标热词集可以包括“XXX案重启”、“今年首个台风”、“高考”、“XXX遭泼水”和“脱发人群超2.5亿”等目标热词。
在一个可能的的实施例中,所述热词推荐方法还可以包括确定热词词库,如图8所示,所述确定热词词库可以包括以下步骤:
S810:获取信息集以及所述信息集中的信息的相关文本和热度分数。
本发明实施例中,所述信息集可以包括全网的文章、视频、音频等信息,所述信息的相关文本可以包括文章的标题、内容和引用等信息,以及所述视频和音频的标题和引用等信息,所述热度分数可以体现所述信息的当前热度,可以根据所述信息的阅读量和转发量等信息确定。
S820:针对所述信息集中的每个信息,从所述信息的相关文本中提取所述信息的热词集,根据所述信息的热度分数确定所述信息的热词集中的元素的热度分数。
本发明实施例中,所述信息的热词集可以包括通过所述信息抽象出来的词语或者短语,所述热词集中的元素可以体现信息的主要内容、所属领域等内容。
在一个可能的实施例中,如图9所示,所述针对所述信息集中的每个信息,从所述信息的相关文本中提取所述信息的热词集,根据所述信息的热度分数确定所述信息的热词集中的元素的热度分数可以包括:
S821:针对所述信息集中的每个信息,对所述信息的相关文本进行分词操作,得到所述信息的词语集。
本发明实施例中,可以采用字符匹配、理解法或统计法等分词方法对所述信息的相关文本进行分词操作,获取所述信息的词语集,本发明实施例对此不做限制。
S822:在所述词语集中提取频数满足第一预设条件的元素,生成所述信息的热词集。
本发明实施例中,可以统计所述词语集中的元素出现的频数,选取出现频数最高的第一预设数量的元素组成所述信息的热词集,例如,可以选取5个出现频数最高的元素组成所述信息的热词集。
S823:根据所述信息的热度分数和所述热词集中的元素的频数确定所述热词集中的元素的热度分数。
本发明实施例中,可以将所述信息的热度分数根据元素出现的频数按比例分配给所述热词集中的元素,得到所述元素的热度分数。在一个示例中,如果所述信息的热度分数为100,所述信息的热词集包括元素A,B,C,D,E,所述元素A,B,C,D,E的频数分别为6,5,3,3,3,则按比例分配给所述热词集中的元素A,B,C,D,E的热度分数分别为30,25,15,15,15。
S824:将所述词语集中的各个元素与标签库中的标签进行匹配。
本发明实施例中,可以通过所述词语集中的元素与标签库中的标签的语义特征进行匹配,例如,当所述元素与某个标签的语义相同或者相似时,则判定匹配成功,当所述元素为某个标签的上位概念或者下位概念时,则判定匹配成功。所述信息的词语集中的元素可以匹配到至少一个标签库中的标签。
S825:获取匹配成功的标签,生成所述热词集中的元素的信息标签。
本发明实施例中,可以将与所述词语集中的各个元素匹配成功的标签作为所述热词集中的各个元素的信息标签。例如,假设所述信息的词语集包括元素A,B,C,D,E,F,G,H,利用上述元素与标签库中的标签匹配,只有元素C匹配到标签T1、元素G匹配到标签T2,且所述信息的热词集包括元素A,B,C,D,E,则将元素A,B,C,D,E的信息标签均设置为T1和T2两个标签。
S830:根据所述信息集中的信息的热词集以及所述热词集中的元素的热度分数确定热词词库。
在一个可能的实施例中,如图10所示,所述根据所述信息集中的信息的热词集以及所述热词集中的元素的热度分数确定热词词库可以包括:
S831:合并所述信息集中的信息的热词集,生成全网热词集。
本发明实施例中,可以将所有信息分词后得到的热词集进行合并,得到全网热词集。其中,如果有多个信息的热词集中存在相同的元素,则可以只保留其中一个。例如,所述信息集中包括3个信息,信息1的热词集包括元素A,B,C,D,E,信息2的热词集包括元素A,B,C,F,G,信息3的热词集包括元素C,F,G,H,N,则所述全网热词集可以包括元素A,B,C,D,E,F,G,H,N。
S832:累计所述全网热词集中的元素的各个热度分数,得到所述元素的全网热度。
本发明实施例中,由于所述全网热词集中的元素可能会属于多个信息的热词集,所述元素在每个热词集中对应一个热度分数,则所述全网热词集中的元素可能会对应多个热度分数。如果所述全网热词集中的元素对应多个热度分数,则可以将所述多个热度分数之和作为所述元素的全网热度。例如,元素A在信息1中的热度分数为30,在信息2中的热度分数为15,则所述元素A的全网热度为45。
S833:在所述全网热词集中提取全网热度满足第二预设条件的元素,生成热词词库。
本发明实施例中,可以根据所述元素的热度分数对所述全网热词集中的元素进行排序,选取第二预设数量的全网热度排序靠前的元素组成热词词库。例如可以选取排序前10000的元素组成热词词库。
S834:合并所述热词词库中的元素的各个信息标签,得到所述元素的词语标签。
本发明实施例中,由于所述热词词库中的元素可能会属于多个信息的热词集,所述元素在每个热词集中对应一个信息标签,则所述全网热词集中的元素可能会对应多个信息标签。如果所述热词词库中的元素有多个信息标签,则可以将所述多个信息标签的并集作为所述元素的词语标签。其中,如果有多个信息标签中存在相同的标签,则可以只保留其中一个标签。例如,元素A在信息1中的信息标签包括T1,T2和T3,在信息2中的信息标签包括T1,T4和T5,则所述元素A的词语标签可以包括T1,T2、T3、T4和T5。
S835:统计所述词语标签中的每个标签出现的频数,得到所述元素的词语标签的标签得分。
本发明实施例中,由于所述全网热词集中的元素可能会对应多个信息标签,而每个所述信息标签可以包括多个标签,所述多个信息标签中可能会出现重复的标签,则可以将所述词语标签中的每个标签出现的频数作为所述元素的词语标签的标签得分。例如,热词词库根据具有10000个信息的信息集确定,所述信息集中有200个信息的热词集包括热词词库中的元素A,则所述元素A的词语标签为元素A在这200个信息中的信息标签的并集。假设所述元素A的词语标签包括T1,T2、T3、T4和T5,其中所述标签T1在100个信息的信息标签中均出现,则所述标签T1的得分可以设置为100,所述标签T2在80个信息的信息标签中均出现,则所述标签T2的得分可以设置为80。
需要说明的是,在另一个可能的实施例中,当客户端获取到目标用户的用户画像后,可以将所述热词推荐指令以及所述用户画像发送给服务器,由所述服务器执行步骤S430的流程,在热词词库中提取目标热词集,并返回至所述客户端,相关细节可以参考图5和图6所示的方法实施例。相应地,所述确定热词词库的流程也可以由服务器执行,相关细节可以参考图8至图10所示的方法实施例。
综上所述,本发明的热词推荐方法通过将热词词库中的元素的词语标签与目标用户的用户标签进行匹配确定所述元素与目标用户的用户相关度,然后对所述用户相关度以及元素的全网热度进行加权求和得到所述元素的综合推荐指数,并根据所述综合推荐指数确定推荐给所述目标用户的目标热词集。本发明在确定目标热词的过程中结合了用户的特性,增加了所述目标热词与用户的相关度,不仅实现了个性化推荐的“千人千面”,还能够提高推荐结果的准确性,使得推荐的热词更加符合用户的兴趣点,进而带来点击率上的明显提升。
请参考说明书附图11,其示出了本发明一个实施例提供的热词推荐装置1100的结构示意图,所述装置1100可以包括:
推荐指令捕捉模块1110,用于捕捉热词推荐控件产生的热词推荐指令;
用户画像获取模块1120,用于响应于所述热词推荐指令,获取目标用户对应的用户画像;
目标热词集提取模块1130,用于根据所述用户画像在热词词库中提取目标热词集,所述目标热词集中的元素的综合推荐指数符合预设的综合推荐指数判据,所述元素的综合推荐指数与元素的用户相关度和元素的全网热度均正相关;所述元素的用户相关度根据所述用户画像确定;
显示模块1140,用于显示所述目标热词集中的目标热词。
在一个可能的实施例中,所述目标热词集提取模块1130可以包括:
第一确定单元,用于根据所述用户画像确定所述热词词库中的元素的用户相关度;
第一获取单元,用于获取所述热词词库中的元素的全网热度;
第二获取单元,用于获取所述用户相关度的相关权重和所述全网热度的热度权重;
第二确定单元,用于根据所述用户相关度、所述相关权重、所述全网热度和所述热度权重确定所述热词词库中的元素的综合推荐指数;
提取单元,用于提取所述综合推荐指数符合预设的综合推荐指数判据的元素,生成所述目标热词集。
在一个可能的实施例中,所述装置1100还可以包括热词词库确定模块1150,所述热词词库确定模块1150可以包括:
第三获取单元,用于获取信息集以及所述信息集中的信息的相关文本和热度分数;
第三确定单元,用于针对所述信息集中的每个信息,从所述信息的相关文本中提取所述信息的热词集,根据所述信息的热度分数确定所述信息的热词集中的元素的热度分数;
第四确定单元,用于根据所述信息集中的信息的热词集以及所述热词集中的元素的热度分数确定热词词库。
需要说明的是,上述实施例提供的装置,在实现其功能时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。
本发明一个实施例还提供了一种电子设备,所述电子设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上述方法实施例所提供的热词推荐方法。
存储器可用于存储软件程序以及模块,处理器通过运行存储在存储器的软件程序以及模块,从而执行各种功能应用以及热词推荐。存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、功能所需的应用程序等;存储数据区可存储根据所述设备的使用所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器还可以包括存储器控制器,以提供处理器对存储器的访问。
在一个具体的实施例中,如图12所示,其示出了本发明一个实施例提供的运行一种热词推荐方法的电子设备的结构示意图。如图12所示,所述设备1200可以包括一个或一个以上计算机可读存储介质的存储器1210、一个或者一个以上处理核心的处理器1220、输入单元1230、显示单元1240、射频(Radio Frequency,RF)电路1250、无线保真(wirelessfidelity,WiFi)模块1260以及电源1270等部件。本领域技术人员可以理解,图12中示出的设备结构并不构成对设备1200的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
所述存储器1210可用于存储软件程序以及模块,所述处理器1220通过运行或执行存储在所述存储器1210的软件程序以及模块,以及调用存储在存储器1210内的数据,从而执行各种功能应用以及数据处理。所述存储器1210可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据所述设备的使用所创建的数据等。此外,存储器1210可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器1210还可以包括存储器控制器,以提供处理器1220对存储器1210的访问。
所述处理器1220是设备1200的控制中心,利用各种接口和线路连接整个设备的各个部分,通过运行或执行存储在存储器1210内的软件程序和/或模块,以及调用存储在存储器1210内的数据,执行设备1200的各种功能和处理数据,从而对设备1200进行整体监控。所述处理器1220可以是中央处理器,还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述输入单元1230可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。具体地,输入单元1230可包括图像输入设备1231以及其他输入设备1232。图像输入设备1231可以是摄像头,也可以是光电扫描设备。除了图像输入设备1231,输入单元1230还可以包括其他输入设备1232。具体地,其他输入设备1232可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
所述显示单元1240可用于显示由用户输入的信息或提供给用户的信息以及设备的各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。显示单元1240可包括显示面板1241,可选的,可以采用液晶显示器(Liquid CrystalDisplay,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板1241。
所述RF电路1250可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,交由一个或者一个以上处理器1220处理;另外,将涉及上行的数据发送给基站。通常,RF电路1250包括但不限于天线、至少一个放大器、调谐器、一个或多个振荡器、用户身份模块(SIM)卡、收发信机、耦合器、低噪声放大器(LowNoiseAmplifier,LNA)、双工器等。此外,RF电路1250还可以通过无线通信与网络和其他设备通信。所述无线通信可以使用任一通信标准或协议,包括但不限于全球移动通讯系统(Global System of Mobilecommunication,GSM)、通用分组无线服务(General Packet Radio Service,GPRS)、码分多址(Code Division MultipleAccess,CDMA)、宽带码分多址(Wideband Code DivisionMultipleAccess,WCDMA)、长期演进(Long Term Evolution,LTE)、电子邮件、短消息服务(Short Messaging Service,SMS)等。
WiFi属于短距离无线传输技术,设备1200通过WiFi模块1260可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图12示出了WiFi模块1260,但是可以理解的是,其并不属于设备1200的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
所述设备1200还包括给各个部件供电的电源1270(比如电池),优选的,电源可以通过电源管理系统与处理器1220逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源1270还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
需要说明的是,尽管未示出,所述设备1200还可以包括蓝牙模块等,在此不再赘述。
本发明一个实施例还提供了一种计算机可读存储介质,所述存储介质可设置于服务器之中以保存用于实现一种热词推荐方法相关的至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集可由服务器的处理器加载并执行以实现如上述方法实施例中所提供的热词推荐方法的各个步骤。
可选地,在本发明实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。且上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、终端和服务器实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种热词推荐方法,其特征在于,包括:
捕捉热词推荐控件产生的热词推荐指令;
响应于所述热词推荐指令,获取目标用户对应的用户画像;
根据所述用户画像在热词词库中提取目标热词集,所述目标热词集中的元素的综合推荐指数符合预设的综合推荐指数判据,所述元素的综合推荐指数与元素的用户相关度和元素的全网热度均正相关;所述元素的用户相关度根据所述用户画像确定;
显示所述目标热词集中的目标热词。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括确定热词词库,所述确定热词词库包括:
获取信息集以及所述信息集中的信息的相关文本和热度分数;
针对所述信息集中的每个信息,从所述信息的相关文本中提取所述信息的热词集,根据所述信息的热度分数确定所述信息的热词集中的元素的热度分数;
根据所述信息集中的信息的热词集以及所述热词集中的元素的热度分数确定热词词库。
3.根据权利要求2所述的方法,其特征在于,所述针对所述信息集中的每个信息,从所述信息的相关文本中提取所述信息的热词集,根据所述信息的热度分数确定所述信息的热词集中的元素的热度分数包括:
针对所述信息集中的每个信息,对所述信息的相关文本进行分词操作,得到所述信息的词语集;
在所述词语集中提取频数满足第一预设条件的元素,生成所述信息的热词集;
根据所述信息的热度分数和所述热词集中的元素的频数确定所述热词集中的元素的热度分数;
将所述词语集中的各个元素与标签库中的标签进行匹配;
获取匹配成功的标签,生成所述热词集中的元素的信息标签。
4.根据权利要求2或3所述的方法,其特征在于,所述根据所述信息集中的信息的热词集以及所述热词集中的元素的热度分数确定热词词库包括:
合并所述信息集中的信息的热词集,生成全网热词集;
累计所述全网热词集中的元素的各个热度分数,得到所述元素的全网热度;
在所述全网热词集中提取全网热度满足第二预设条件的元素,生成热词词库;
合并所述热词词库中的元素的各个信息标签,得到所述元素的词语标签;
统计所述词语标签中的每个标签出现的频数,得到所述元素的词语标签的标签得分。
5.根据权利要求1或2所述的方法,其特征在于,所述热词词库存储于区块链系统中。
6.根据权利要求1或2所述的方法,其特征在于,所述根据所述用户画像在热词词库中提取目标热词集包括:
根据所述用户画像确定所述热词词库中的元素的用户相关度;
获取所述热词词库中的元素的全网热度;
获取所述用户相关度的相关权重和所述全网热度的热度权重;
根据所述用户相关度、所述相关权重、所述全网热度和所述热度权重确定所述热词词库中的元素的综合推荐指数;
提取所述综合推荐指数符合预设的综合推荐指数判据的元素,生成所述目标热词集。
7.根据权利要求6所述的方法,其特征在于,所述用户画像包括至少一个用户标签,所述根据所述用户画像确定所述热词词库中的元素的用户相关度包括:
获取所述热词词库中的元素的词语标签以及所述词语标签的标签得分;
获取所述用户标签的标签得分;
根据所述词语标签的标签得分和所述用户标签的标签得分确定所述热词词库中的元素的用户相关度。
8.一种热词推荐装置,其特征在于,包括:
推荐指令捕捉模块,用于捕捉热词推荐控件产生的热词推荐指令;
用户画像获取模块,用于响应于所述热词推荐指令,获取目标用户对应的用户画像;
目标热词集提取模块,用于根据所述用户画像在热词词库中提取目标热词集,所述目标热词集中的元素的综合推荐指数符合预设的综合推荐指数判据,所述元素的综合推荐指数与元素的用户相关度和元素的全网热度均正相关;所述元素的用户相关度根据所述用户画像确定;
显示模块,用于显示所述目标热词集中的目标热词。
9.一种电子设备,其特征在于,所述电子设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如权利要求1-7任意一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如权利要求1-7任意一项所述的方法。
CN201910833206.5A 2019-09-04 2019-09-04 一种热词推荐方法、装置、设备及存储介质 Active CN110598100B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910833206.5A CN110598100B (zh) 2019-09-04 2019-09-04 一种热词推荐方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910833206.5A CN110598100B (zh) 2019-09-04 2019-09-04 一种热词推荐方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN110598100A true CN110598100A (zh) 2019-12-20
CN110598100B CN110598100B (zh) 2021-06-11

Family

ID=68857532

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910833206.5A Active CN110598100B (zh) 2019-09-04 2019-09-04 一种热词推荐方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN110598100B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111368025A (zh) * 2020-02-24 2020-07-03 百度在线网络技术(北京)有限公司 智能语音设备的热词推荐方法、设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104102681A (zh) * 2013-04-15 2014-10-15 腾讯科技(深圳)有限公司 一种微博关键事件获取方法和装置
CN105574176A (zh) * 2015-12-21 2016-05-11 北京奇虎科技有限公司 结合多数据源的热词推荐方法和装置
CN106874314A (zh) * 2015-12-14 2017-06-20 腾讯科技(深圳)有限公司 信息推荐的方法和装置
CN107784092A (zh) * 2017-10-11 2018-03-09 深圳市金立通信设备有限公司 一种推荐热词的方法、服务器及计算机可读介质
CN109271574A (zh) * 2018-08-28 2019-01-25 麒麟合盛网络技术股份有限公司 一种热词推荐方法及装置
WO2019041285A1 (zh) * 2017-08-31 2019-03-07 深圳市云中飞网络科技有限公司 联想词推荐方法、移动终端以及计算机可读存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104102681A (zh) * 2013-04-15 2014-10-15 腾讯科技(深圳)有限公司 一种微博关键事件获取方法和装置
CN106874314A (zh) * 2015-12-14 2017-06-20 腾讯科技(深圳)有限公司 信息推荐的方法和装置
CN105574176A (zh) * 2015-12-21 2016-05-11 北京奇虎科技有限公司 结合多数据源的热词推荐方法和装置
WO2019041285A1 (zh) * 2017-08-31 2019-03-07 深圳市云中飞网络科技有限公司 联想词推荐方法、移动终端以及计算机可读存储介质
CN107784092A (zh) * 2017-10-11 2018-03-09 深圳市金立通信设备有限公司 一种推荐热词的方法、服务器及计算机可读介质
CN109271574A (zh) * 2018-08-28 2019-01-25 麒麟合盛网络技术股份有限公司 一种热词推荐方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
刘冰月 等: ""大数据环境下微博舆情预测模型方法研究"", 《科技创新导报》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111368025A (zh) * 2020-02-24 2020-07-03 百度在线网络技术(北京)有限公司 智能语音设备的热词推荐方法、设备及存储介质
CN111368025B (zh) * 2020-02-24 2023-12-22 百度在线网络技术(北京)有限公司 智能语音设备的热词推荐方法、设备及存储介质

Also Published As

Publication number Publication date
CN110598100B (zh) 2021-06-11

Similar Documents

Publication Publication Date Title
CN107172151B (zh) 用于推送信息的方法和装置
US8380697B2 (en) Search and retrieval methods and systems of short messages utilizing messaging context and keyword frequency
CN110601956B (zh) 一种内容聚合方法、装置、计算机设备和存储介质
CN103997507B (zh) 一种信息的推送方法及装置
US20130085745A1 (en) Semantic-based approach for identifying topics in a corpus of text-based items
EP2506522B1 (en) Method and device for pushing data
CN105808649B (zh) 一种搜索结果排序方法及其设备
KR20160055930A (ko) 연속적인 소셜 커뮤니케이션에 사용되는 콘텐츠를 능동적으로 구성하기 위한 시스템 및 방법
CN103109273B (zh) 用于管理数据的方法和装置
US20190205381A1 (en) Analyzing language units for opinions
CN108304422B (zh) 一种媒体搜索词推送方法和装置
CN107634897B (zh) 群推荐方法和装置
CN102750375A (zh) 一种基于随机游走的服务和标签推荐方法
KR101559719B1 (ko) 효과적인 마케팅을 도출하는 자동학습 시스템 및 방법
WO2019085856A1 (zh) 文本资源的推送方法、装置、存储介质及处理器
US20160239533A1 (en) Identity workflow that utilizes multiple storage engines to support various lifecycles
US20180150525A1 (en) Methods and Systems for Prioritizing Entities in Search Results
US9268861B2 (en) Method and system for recommending relevant web content to second screen application users
EP3482308B1 (en) Contextual information for a displayed resource that includes an image
US11176209B2 (en) Dynamically augmenting query to search for content not previously known to the user
CN110297967B (zh) 兴趣点确定方法、装置、设备及计算机可读存储介质
US9824149B2 (en) Opportunistically solving search use cases
CN110598100B (zh) 一种热词推荐方法、装置、设备及存储介质
US20130159435A1 (en) Method and System for Processing User Contact Information
CN105117438A (zh) 一种信息处理方法及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20221124

Address after: 1402, Floor 14, Block A, Haina Baichuan Headquarters Building, No. 6, Baoxing Road, Haibin Community, Xin'an Street, Bao'an District, Shenzhen, Guangdong 518100

Patentee after: Shenzhen Yayue Technology Co.,Ltd.

Address before: 518057 Tencent Building, No. 1 High-tech Zone, Nanshan District, Shenzhen City, Guangdong Province, 35 floors

Patentee before: TENCENT TECHNOLOGY (SHENZHEN) Co.,Ltd.