CN107944033B - 关联话题推荐方法和装置 - Google Patents

关联话题推荐方法和装置 Download PDF

Info

Publication number
CN107944033B
CN107944033B CN201711329275.XA CN201711329275A CN107944033B CN 107944033 B CN107944033 B CN 107944033B CN 201711329275 A CN201711329275 A CN 201711329275A CN 107944033 B CN107944033 B CN 107944033B
Authority
CN
China
Prior art keywords
topic
user
topics
recommendation
article
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711329275.XA
Other languages
English (en)
Other versions
CN107944033A (zh
Inventor
林泽南
卢佳俊
王希蒙
张晓寒
梁海金
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201711329275.XA priority Critical patent/CN107944033B/zh
Publication of CN107944033A publication Critical patent/CN107944033A/zh
Application granted granted Critical
Publication of CN107944033B publication Critical patent/CN107944033B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种关联话题推荐方法和装置,其中,方法包括:获取与用户当前阅读的文章对应的关联话题推荐请求,其中,请求包括:用户偏好信息、文章类型,以及从文章提取的基础话题集合;根据用户偏好信息和文章类型对基础话题集合进行筛选获取候选话题集合;根据预先建立的话题关联索引信息获取与候选话题集合对应的关联话题集合,并根据预设的排序特征计算关联话题集合中每个关联话题的推荐分数;根据推荐分数和预设阈值对关联话题集合进行筛选获取文章的扩展话题集合,并展示给用户。由此,该方法根据用户当前阅读的信息推荐扩展话题,提供关联话题的拓展浏览,针对用户的兴趣提供个性化的信息服务,提高推送能力的灵活性。

Description

关联话题推荐方法和装置
技术领域
本发明涉及信息推送技术领域,尤其涉及一种关联话题推荐方法和装置。
背景技术
随着通信技术的发展,越来越多的网络平台使用信息流推荐技术向用户提供个性化的网络信息服务,在用户通过终端设备浏览信息的同时,把与浏览信息相关的话题推送给用户,为用户提供不搜即得的信息浏览体验。
相关技术中,信息流推荐产品提取用户正在浏览的信息中包含的话题,把话题提炼后的关键词展示在浏览界面上供用户选择,这种方式只能推送当前信息中包含的话题,无法拓展其他关联的话题,推送的话题具有重复性和局限性。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的第一个目的在于提出一种关联话题的推荐方法。该方法根据用户当前阅读的信息推荐扩展话题,提供关联话题的拓展浏览,针对用户的兴趣提供个性化的信息服务,提高推送能力的灵活性。
本发明第二个目的在于提出一种关联话题的推荐装置。
为了实现上述目的,本发明第一方面实施例提出了一种关联话题的推荐方法,包括以下步骤:
获取与用户当前阅读的文章对应的关联话题推荐请求,其中,请求包括:用户偏好信息、文章类型,以及从文章提取的基础话题集合;
根据用户偏好信息和文章类型对基础话题集合进行筛选获取候选话题集合;
根据预先建立的话题关联索引信息获取与候选话题集合对应的关联话题集合,并根据预设的排序特征计算关联话题集合中每个关联话题的推荐分数;
根据推荐分数和预设阈值对关联话题集合进行筛选获取文章的扩展话题集合,并展示给用户。
本发明实施例的关联话题推荐方法,首先获取与用户当前阅读的文章对应的关联话题推荐请求,根据用户偏好信息和文章类型获取用户可能感兴趣的候选话题集合。然后根据预先建立的话题关联索引信息获取与候选话题集合对应的关联话题集合,并根据预设的排序特征计算关联话题集合中每个关联话题的推荐分数。最后根据推荐分数和预设阈值对关联话题集合进行筛选获取文章的扩展话题集合,并展示给用户。由此,该方法根据用户当前阅读的信息推荐扩展话题,提供关联话题的拓展浏览,针对用户的兴趣提供个性化的信息服务,提高信息流的分发能力。
另外,根据本发明上述实施例的关联话题推荐方法,还可以具有如下附加的技术特征:
在本发明一个实施例中,预设的排序特征,包括:关联话题与候选话题之间的关联权值、基础话题的权重、用户偏好与关联话题的相关度、以及文章类型与关联话题的相关度中的一种或者多种特征。
在本发明一个实施例中,根据推荐分数和预设阈值对关联话题集合进行筛选获取文章的扩展话题集合之后,还包括:按照话题类型对扩展话题集合进行多样性排序。
在本发明一个实施例中,上述关联话题的推荐方法,还包括:采集用户行为进行分析挖掘不同属性的话题集合;对不同属性的话题集合挖掘话题关联关系;按照预设的质量过滤策略对话题关联关系进行过滤筛选,并根据预设的存储格式对筛选结果进行存储,建立话题关联索引信息。
在本发明一个实施例中,对不同属性的话题集合挖掘话题关联关系,包括:
根据预设的多种挖掘方式对不同属性的话题集合进行话题挖掘生成多组话题关系;按照预设的融合策略对多组话题关系进行整合处理生成话题关联关系。
为达上述目的,本发明第二方面实施例提出了一种关联话题推荐装置,包括:
第一获取模块,用于获取与用户当前阅读的文章对应的关联话题推荐请求;
第一筛选模块,用于根据用户偏好信息和文章类型对基础话题集合进行筛选获取候选话题集合;
第二获取模块,用于根据预先建立的话题关联索引信息获取与候选话题集合对应的关联话题集合,并根据预设的排序特征计算所联话题集合中每个关联话题的推荐分数;
第二筛选模块,用于根据推荐分数和预设阈值对关联话题集合进行筛选获取文章的扩展话题集合,并展示给用户;
另外,根据本发明上述实施例的关联话题推荐装置还可以具有如下附加的技术特征:
可选的,还包括:
采集模块,用于采集用户行为进行分析挖掘不同属性的话题集合;
挖掘模块,用于对不同属性的话题集合挖掘话题关联关系;
在本发明一个实施例中,所述挖掘模块,用于根据预设的多种挖掘方式对所述不同属性的话题集合进行话题挖掘生成多组话题关系,并且按照预设的融合策略对所述多组话题关系进行整合处理生成所述话题关联关系。
建立模块,用于按照预设的质量过滤策略对话题关联关系进行过滤筛选,并根据预设的存储格式对筛选结果进行存储,建立话题关联索引信息。
为了实现上述目的,本发明还提出一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行所述计算机程序时,实现上述关联话题的推荐方法。
为了实现上述目的,本发明还提出一种计算机程序产品,当计算机程序产品中的指令由处理器执行时,执行上述关联话题的推荐方法。
为了实现上述目的,本发明还提出一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述关联话题的推荐方法。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明一个实施例的关联话题推荐方法的流程图;
图2为本发明另一个实施例的关联话题推荐方法的流程图;
图3为本发明一个实施例的关联话题推荐装置的结构示意图;以及
图4为本发明另一个实施例的关联话题推荐装置的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
下面参考附图描述本发明实施例的关联话题推荐方法和装置。
其中,本发明实施例中用户可以通过终端设备阅读文章,其中,终端设备可以是个人电脑、手机、电子书阅读器等装载了信息流推荐多种应用的硬件设备。
图1是根据本发明一个实施例的关联话题推荐方法的流程图,如图1所示,该关联话题推荐方法可包括:
步骤101,获取与用户当前阅读的文章对应的关联话题推荐请求,其中,请求包括:用户偏好信息、文章的类型,以及从文章提取的基础话题集合。
具体的,生活中用户通过终端设备上的多种应用阅读感兴趣的文章,其中上述应用为向用户提供信息服务的信息流推荐产品,比如,包含信息流广告功能的社交软件或者各种资讯流服务平台等。用户可以在多种应用上搜索自己感兴趣的文章或是选择阅读多种应用推荐的话题。当用户在应用上阅读文章时,应用客户端通过向后台发起关联话题推荐请求,进而向用户推荐更多感兴趣的话题。
可以理解,为了使推荐的文章更符合用户的兴趣,需要了解用户已表达的感兴趣的话题的相关参数,进而解析参数推荐相应的关联话题。因此,发送请求包括用户偏好信息、文章的类型,以及从文章提取的基础话题集合。
为了更加清楚的描述推荐请求中包含的参数,下面以用户阅读一篇新闻报道为例,进行详细说明。
作为一种示例,当用户使用终端设备上的多种应用浏览新闻时,在推荐的各类型新闻中选择阅读一篇属于科技类新闻的“国之重器,中国天眼竣工”的文章。应用客户端检测用户当前阅读的新闻,提取新闻中的户偏好信息、文章的类型,以及基础话题集合。
需要说明的是,用户偏好信息是用户更感兴趣、更愿意深入了解的话题,它可以从用户当前阅读的文章中提取获得,也可以从服务器数据库中预先存储的用户偏好数据中获得;文章的类型指生活、财经、娱乐、体育、军事、科技等同一领域内相同属性的话题;基础话题是用户当前阅读的文章中包含的所有话题。
本示例中,应用客户端首先提取新闻内容中包含的话题作为基础话题,基础话题包含新闻中涉及到的各个领域的话题。比如,在“中国天眼”简介的内容中提取出“射电望远镜”、“世界之最”、“天文学”、“外星信号”等话题,在描述“天眼”建造过程的内容中提取出了“中科院天文台”、“FAST工程”、“索网结构”等话题,在描述“天眼”战略成果的内容中提取出了“科技进步奖”、“领先世界”、“国家领导人”等话题。基础话题中包含用户感兴趣的话题,也包含用户无意继续了解的话题。
进一步的,应用客户端解析提取出的基础话题中各个话题所属的领域,选取出现次数最多的话题的领域并且参照新闻的标题,判断文章的类型。本示例中,由于多次出现与科技成果相关的话题并且参考“中国天眼”的新闻标题,判定当前阅读的文章属于科技类型。
可以理解,用户当前阅读的文章的类型是用户希望了解的文章类型,从而可以提取科技型文章为用户可能感兴趣的话题,同时,应用客户端通过服务器端的数据库连接访问服务器端的数据,根据用户的过往浏览记录查找出用户经常浏览“蛟龙号”、“引力波”等文章从而把与科学成果相关的话题作为用户偏好信息。
进而,关联话题推荐服务的接收端接收请求,获取关联话题推荐请求中的参数便于下一步的处理。其中,根据实际应用中架构的不同,接收端可以采用不同的实现方式接收请求,比如,接收端可以是一种关联话题推荐服务的服务器,服务器把接收到的请求中的参数存储到数据库中,同时多种应用也可以连接访问服务器的数据实现交互处理。
由此,应用端发送推荐基础话题中与科技型话题相关联的请求至服务器,服务器端接收请求,获取请求中包含的基础话题、科技型的文章以及偏好科学成果等参数。
步骤102,根据用户偏好信息和文章类型对基础话题集合进行筛选获取候选话题集合。
可以理解,为了使推荐的关联话题更能引起用户的兴趣,推荐的话题应当与用户已表达的兴趣信息相关联。因此需要根据用户的偏好信息和文章类型在基础话题中筛选出用户感兴趣的话题。继续参照用户阅读“中国天眼”新闻的示例,根据用户对科技成果和科技型的文章感兴趣的信息,筛选出“射电望远镜”、“中科院”、“科技进步奖”等话题作为候选话题,把“国家领导人”、“外星信号”等与科技成果无关的话题过滤。由此,确保候选话题集合中的话题都属于用户感兴趣的与科技成果相关的话题。
步骤103,根据预先建立的话题关联索引信息获取与候选话题集合对应的关联话题集合,并根据预设的排序特征计算关联话题集合中每个关联话题的推荐分数;
其中,话题关联索引信息是存储各个话题间关系,便于寻找同类话题的存储结构,它可以是列表索引、树索引、位图索引等常用的索引结构。当输入候选话题集合时,判断候选话题集合属于的类型,通过预先建立的话题间的关系快速找到同一属性的关联话题,其中,话题间的关系包括因果、包含、相似等具有互相贯连、彼此联系的关系。由此,通过索引信息筛选出与候选话题相关联的话题。作为一种示例,输入上述实施例中的“中国天眼”等话题后,通过索引结构中的相似关系找到其他与射电望远镜领域相关的话题,比如“美国阿雷西博350米望远镜”、“德国波恩射电望远镜”等话题推荐给用户,或者,通过承接关系推荐“霍金警告不要回答外星信号”等话题给用户。
进一步的,为了在获取的众多关联话题中,把原话题关联度更高的话题推荐给用户需要用到排序特征。其中,排序特征是计算筛选出的关联话题与候选话题关联度的参数,根据排序特征计算关联话题集合中每个关联话题的推荐分数,把推荐分数较高的话题推荐给用户,从而使用户获得更感兴趣的话题。为了更加精确的计算推荐分数,排序特征可以包含若干个体现关联话题与候选话题关联度的参数。
作为一种示例,排序特征包含:关联话题与候选话题之间的关联权值、基础话题的权重、用户偏好与关联话题的相关度、以及文章类型与关联话题的相关度中的一种或者多种特征。
需要说明的是,关联话题与候选话题之间的关联权值表示关联话题与候选话题关联等级的高低,比如,当候选话题为“国之重器,中国天眼竣工”时,通过索引信息找到“墨子号量子卫星成功发射”和“美国科学家发现引力波”两条与科技成果相关的新闻,而由于墨子号量子卫星是国内的科技成果,与“中国天眼”的关联权值更高,所以在计算两个话题的推荐分数时关于“墨子号”的话题的推荐分数大于“引力波”的推荐分数。
另一方面,用户偏好与关联话题的相关度表示用户的偏好信息与关联话题属于同一领域,同一属性的程度。同样参照上述示例,当候选话题为“中国天眼”射电望远镜时,通过索引信息中的包含关系,筛选到的关联话题可能为包含射电望远镜的天文望远镜一类的话题,比如“家用天文望远镜走进更多家庭”等其他领域的话题。因此,在计算推荐分数时,此类话题由于与用户偏好的相关度较低,而不被推荐给用户。
需要注意的是,计算推荐分数还需要考量基础话题的权重、以及文章类型与关联话题的相关度等影响推荐分数排序的特征。
步骤104,根据推荐分数和预设阈值对关联话题集合进行筛选获取文章的扩展话题集合,并展示给用户。
其中,预设阈值是向用户推荐的扩展话题集合需要达到的最低推荐分数。按照推荐分数的高低把关联话题进行排序,把推荐分数高于预设阈值的关联话题作为用户当前阅读的话题的扩展话题推荐给用户。
需要说明的是,推荐给用户的扩展话题可以以各种方式展示给用户。作为一种示例,可以对扩展话题集合进行多样性排序。比如,可以按照推荐分数的高低,以从上至下的顺序把扩展话题进行排序,便于用户选择推荐分数最高、关联性最强的话题。或者,把属于同一类型的扩展话题排列在一起,便于用户深入了解同一类型内相关的话题,比如,当扩展话题为科技进步类的话题时,可以把扩展话题划分为军事类型、生物类型、航天类型等各领域内的科技进步话题。对扩展话题排序的方法可以由终端设备设定,也可以由用户根据需要选择,在此不做限制。
综上所述,本发明实施例的关联话题推荐方法,首先获取与用户当前阅读的文章对应的关联话题推荐请求,根据用户偏好信息和文章类型获取用户可能感兴趣的候选话题集合。然后根据预先建立的话题关联索引信息获取与候选话题集合对应的关联话题集合,并根据预设的排序特征计算关联话题集合中每个关联话题的推荐分数。最后根据推荐分数和预设阈值对关联话题集合进行筛选获取文章的扩展话题集合,并展示给用户。由此,该方法根据用户当前阅读的信息向用户推荐扩展话题,提供关联话题的拓展浏览,针对用户的兴趣提供个性化的信息服务,提高推送能力的灵活性,激发用户的阅读兴趣。
基于以上实施例,为了推荐与用户偏好信息关联度更高的话题,需要在执行推荐服务前完善索引信息。图2是根据本发明另一个实施例的关联话题推荐方法的流程图,如图2所示,该关联话题推荐方法可包括:
步骤201,采集用户行为进行分析挖掘不同属性的话题集合。
具体的,用户行为可以是搜索词条、浏览新闻、下载文档等表达感兴趣话题的行为,通过记录用户的各种行为采集用户感兴趣的话题。在采集到的话题集合上分析话题的属性,划分话题的类型和所属领域,同时解决同名不同义的话题歧义问题,把相同属性的话题归纳到一起,最终挖掘出不同属性的话题集合。
步骤202,对不同属性的话题集合挖掘话题关联关系。
在获得上述不同属性的话题集合后,建立话题间的索引信息还需要话题间的关联关系,因此,需要对不同属性的话题集合进行挖掘从而生成多组话题关系,从而在多组话题关系的基础上整理融合的得到不同属性话题间的关联关系。其中,根据实际情况的不同可以根据预设的不同的方式挖掘多组话题间关系。
作为一种可能实现的方式,可以通过结构化和非结构化的解析方式。其中,结构化的解析方式是指同一属性的话题解释另一属性的话题时呈现的因果、递进等结构化的关系,比如上述示例中因为“中国天眼”的超强灵敏度可以接受137亿光年以外的宇宙信号甚至存在危险性的外星信号所以霍金提醒中国不要回答接收到的信号。
另一方面,非结构化的解析方式是通过语义分析等无结构化的方式解析某一话题时在解释的文字段落中提取出关联的话题。比如,在解析某一电影的话题时在背景介绍中提取出关于某一演员的话题,从而建立两者间的关系。
作为另一种可能的实现方式,可以通过已有的知识图谱,查找话题间的关系。其中,知识图谱是显示话题发展进程与结构关系的一系列各种不同的图形,比如树状图、网状图等。知识图谱采用可视化技术描述话题资源及其载体,挖掘、分析、构建、绘制和显示话题及它们之间的相互联系。利用网络中已经搭建完整的知识图谱,可以快速找到不同话题间的关系。
进一步的,通过不同方式挖掘到的不同属性话题间的关系是杂乱且繁多的,不同挖掘方式挖掘出的相同话题间的关系可能是重复的,或者不同属性间若干个话题用同一种挖掘方式其相互关系存在矛盾。因此,按照预设的融合策略对多组话题关系进行整合处理生成话题关联关系。具体的,融合策略可以包括对关联关系数据格式化或构建融合模型对各个来源的权值进行拟合。
步骤203,按照预设的质量过滤策略对话题关联关系进行过滤筛选,并根据预设的存储格式对筛选结果进行存储,建立话题关联索引信息。
需要说明的是,通过各种挖掘方式得到的关联关系的质量并不相同,可能会出现挖掘出的关联关系在现今情况下已经不适用,或者某些关联关系较为牵强,存在的条件苛刻等现象。对关联关系的质量进行过滤,把低质量的关联关系过滤有助于推荐与用户感兴趣的话题关联性更大的话题。基于融合权值或是某一领域内的相关规则,把低质量的关联关系过滤掉,把高质量的话题间的关联关系存储起来,通过大量的话题间的关联关系建立索引信息,从而在输入用户感兴趣的话题时快速准确的寻找到与其关联的话题。
综上所述,本发明实施例的关联话题推荐方法,采集用户行为进行分析挖掘不同属性的话题集合;对不同属性的话题集合挖掘话题关联关系;按照预设的质量过滤策略对话题关联关系进行过滤筛选,并根据预设的存储格式对筛选结果进行存储,建立话题关联索引信息。该方法通过挖掘积累的大量用户数据加深对索引信息的刻画并完善索引信息的结构,提高向用户推荐的关联话题的质量和精准度,保证了用户对推荐话题的满意度。
为了实现上述实施例,本申请还提出了一种关联话题推荐装置,图3是根据本发明一个实施例的关联话题推荐装置的结构示意图,如图3所示,该用户拍照装置包括第一获取模块100、第一筛选模块200、第二获取模块300和第二筛选模块400。
其中,第一获取模块100,用于获取与用户当前阅读的文章对应的关联话题推荐请求。
第一筛选模块200,用于根据所述用户偏好信息和文章类型对所述基础话题集合进行筛选获取候选话题集合。
第二获取模块300,用于根据预先建立的话题关联索引信息获取与候选话题集合对应的关联话题集合,并根据预设的排序特征计算关联话题集合中每个关联话题的推荐分数。
第二筛选模块400,用于根据推荐分数和预设阈值对关联话题集合进行筛选获取所述文章的扩展话题集合,并展示给用户。
需要说明的是,前述对方法实施例的描述,也适用于本发明实施例的装置,其实现原理类似,在此不再赘述。
上述关联话题推荐装置中各个模块的划分仅用于举例说明,在其他实施例中,可将关联话题推荐装置按照需要划分为不同的模块,以完成上述关联话题推荐装置的全部或部分功能。
综上所述,本发明实施例的关联话题推荐装置,首先获取与用户当前阅读的文章对应的关联话题推荐请求,根据用户偏好信息和文章类型获取用户可能感兴趣的候选话题集合。然后根据预先建立的话题关联索引信息获取与候选话题集合对应的关联话题集合,并根据预设的排序特征计算关联话题集合中每个关联话题的推荐分数。最后根据推荐分数和预设阈值对关联话题集合进行筛选获取文章的扩展话题集合,并展示给用户。由此,该装置根据用户当前阅读的信息向用户推荐扩展话题,提供关联话题的拓展浏览,针对用户的兴趣提供个性化的信息服务,提高推送能力的灵活性,激发用户的阅读兴趣。
图4是根据本发明另一个实施例的关联话题推荐装置的结构示意图,如图4所示,在如图3所示的基础上,该用户拍照装置包括采集模块500、挖掘模块600和建立模块700,其中挖掘模块600还包括生成单元610和融合单元620。
其中,采集模块500,用于采集用户行为进行分析挖掘不同属性的话题集合。
挖掘模块600,用于对不同属性的话题集合挖掘话题关联关系。具体的,生成单元610,用于根据预设的多种挖掘方式对不同属性的话题集合进行话题挖掘生成多组话题关系;融合单元620,用于按照预设的融合策略对多组话题关系进行整合处理生成话题关联关系。
建立模块700,用于按照预设的质量过滤策略对话题关联关系进行过滤筛选,并根据预设的存储格式对筛选结果进行存储,建立话题关联索引信息。
需要说明的是,前述对方法实施例的描述,也适用于本发明实施例的装置,其实现原理类似,在此不再赘述。
上述关联话题推荐装置中各个模块的划分仅用于举例说明,在其他实施例中,可将关联话题推荐装置按照需要划分为不同的模块,以完成上述关联话题推荐装置的全部或部分功能。
综上所述,本发明实施例的关联话题推荐装置,采集用户行为进行分析挖掘不同属性的话题集合;对不同属性的话题集合挖掘话题关联关系;按照预设的质量过滤策略对话题关联关系进行过滤筛选,并根据预设的存储格式对筛选结果进行存储,建立话题关联索引信息。该装置通过挖掘积累的大量用户数据加深对索引信息的刻画并完善索引信息的结构,提高向用户推荐的关联话题的质量和精准度,保证了用户对推荐话题的满意度。
在本说明书的描述中,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
在本发明中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系,除非另有明确的限定。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
在本发明中,除非另有明确的规定和限定,第一特征在第二特征“上”或“下”可以是第一和第二特征直接接触,或第一和第二特征通过中间媒介间接接触。而且,第一特征在第二特征“之上”、“上方”和“上面”可是第一特征在第二特征正上方或斜上方,或仅仅表示第一特征水平高度高于第二特征。第一特征在第二特征“之下”、“下方”和“下面”可以是第一特征在第二特征正下方或斜下方,或仅仅表示第一特征水平高度小于第二特征。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (9)

1.一种关联话题推荐方法,其特征在于,包括以下步骤:
获取与用户当前阅读的文章对应的关联话题推荐请求,其中,所述请求包括:用户偏好信息、所述文章的文章类型,以及从所述文章提取的基础话题集合;
根据所述用户偏好信息和所述文章类型对所述基础话题集合进行筛选获取候选话题集合;
根据预先建立的话题关联索引信息获取与所述候选话题集合对应的关联话题集合,并根据预设的排序特征计算所述关联话题集合中每个关联话题的推荐分数;
根据所述推荐分数和预设阈值对所述关联话题集合进行筛选获取所述文章的扩展话题集合,并展示给所述用户。
2.如权利要求1所述的方法,其特征在于,所述预设的排序特征,包括:
关联话题与候选话题之间的关联权值、基础话题的权重、用户偏好与关联话题的相关度、以及文章类型与关联话题的相关度中的一种或者多种特征。
3.如权利要求1所述的方法,其特征在于,在所述根据所述推荐分数和预设阈值对所述关联话题集合进行筛选获取所述文章的扩展话题集合之后,还包括:
按照话题类型对所述扩展话题集合进行多样性排序。
4.如权利要求1-3任一所述的方法,其特征在于,还包括:
采集用户行为进行分析挖掘不同属性的话题集合;
对所述不同属性的话题集合挖掘话题关联关系;
按照预设的质量过滤策略对所述话题关联关系进行过滤筛选,并根据预设的存储格式对筛选结果进行存储,建立所述话题关联索引信息。
5.如权利要求4所述的方法,其特征在于,对所述不同属性的话题集合挖掘话题关联关系,包括:
根据预设的多种挖掘方式对所述不同属性的话题集合进行话题挖掘生成多组话题关系;
按照预设的融合策略对所述多组话题关系进行整合处理生成所述话题关联关系。
6.一种关联话题推荐装置,其特征在于,包括:
第一获取模块,用于获取与用户当前阅读的文章对应的关联话题推荐请求,其中,所述请求包括:用户偏好信息、所述文章的文章类型,以及从所述文章提取的基础话题集合;
第一筛选模块,用于根据所述用户偏好信息和所述文章类型对所述基础话题集合进行筛选获取候选话题集合;
第二获取模块,用于根据预先建立的话题关联索引信息获取与所述候选话题集合对应的关联话题集合,并根据预设的排序特征计算所述关联话题集合中每个关联话题的推荐分数;
第二筛选模块,用于根据所述推荐分数和预设阈值对所述关联话题集合进行筛选获取所述文章的扩展话题集合,并展示给所述用户。
7.如权利要求6所述的关联话题推荐装置,其特征在于,还包括:
采集模块,用于采集用户行为进行分析挖掘不同属性的话题集合;
挖掘模块,用于对所述不同属性的话题集合挖掘话题关联关系;
建立模块,用于按照预设的质量过滤策略对所述话题关联关系进行过滤筛选,并根据预设的存储格式对筛选结果进行存储,建立所述话题关联索引信息。
8.一种计算机设备,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如权利要求1-5中任一项所述的关联话题推荐方法。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1-5中任一项所述的关联话题推荐方法。
CN201711329275.XA 2017-12-13 2017-12-13 关联话题推荐方法和装置 Active CN107944033B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711329275.XA CN107944033B (zh) 2017-12-13 2017-12-13 关联话题推荐方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711329275.XA CN107944033B (zh) 2017-12-13 2017-12-13 关联话题推荐方法和装置

Publications (2)

Publication Number Publication Date
CN107944033A CN107944033A (zh) 2018-04-20
CN107944033B true CN107944033B (zh) 2022-02-18

Family

ID=61942988

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711329275.XA Active CN107944033B (zh) 2017-12-13 2017-12-13 关联话题推荐方法和装置

Country Status (1)

Country Link
CN (1) CN107944033B (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108846028A (zh) * 2018-05-24 2018-11-20 网易传媒科技(北京)有限公司 文章投放方法、介质、装置和计算设备
CN109325223B (zh) * 2018-07-24 2023-08-25 阿里巴巴(中国)有限公司 文章推荐方法、装置及电子设备
CN110162691B (zh) * 2018-11-15 2023-05-23 腾讯科技(深圳)有限公司 在线内容服务中的话题推荐、运营方法、装置和机器设备
CN110209958B (zh) * 2019-05-31 2022-03-15 Oppo广东移动通信有限公司 专题制作方法、装置、终端及存储介质
CN110413875B (zh) * 2019-06-26 2024-06-07 腾讯科技(深圳)有限公司 一种文本信息推送的方法以及相关装置
CN110516147A (zh) * 2019-07-22 2019-11-29 平安科技(深圳)有限公司 页面数据生成方法、装置、计算机设备及存储介质
CN110601956B (zh) * 2019-09-06 2021-09-28 腾讯科技(深圳)有限公司 一种内容聚合方法、装置、计算机设备和存储介质
CN110929172B (zh) * 2019-11-27 2022-11-18 中科曙光国际信息产业有限公司 信息选择方法、装置、电子设备及可读存储介质
CN111291258A (zh) * 2020-01-20 2020-06-16 北京无限光场科技有限公司 搜索热词的推荐方法、装置、电子设备及可读介质
CN111368063B (zh) * 2020-03-06 2023-03-17 腾讯科技(深圳)有限公司 一种基于机器学习的信息推送方法以及相关装置
WO2021195922A1 (zh) 2020-03-31 2021-10-07 浙江核新同花顺网络信息股份有限公司 一种当前页面信息刷新方法和系统
CN111538911B (zh) * 2020-06-28 2024-01-23 中国银行股份有限公司 一种信息推送方法及装置
CN113139049A (zh) * 2021-04-21 2021-07-20 北京明略昭辉科技有限公司 关联文档推荐方法、装置、计算机设备和存储介质
CN113569143B (zh) * 2021-07-20 2024-02-27 上海明略人工智能(集团)有限公司 推荐结果的生成方法、装置、电子设备和计算机可读介质
CN114860919A (zh) * 2022-05-26 2022-08-05 北京字节跳动网络技术有限公司 一种话题推荐方法、装置、计算机设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103329151A (zh) * 2010-12-01 2013-09-25 谷歌公司 基于话题聚类的推荐
CN104133820A (zh) * 2013-05-06 2014-11-05 腾讯科技(深圳)有限公司 内容推荐方法及内容推荐装置
CN105574142A (zh) * 2015-12-15 2016-05-11 北京奇虎科技有限公司 一种向用户推荐内容的方法及系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2634020A1 (en) * 2008-05-30 2009-11-30 Biao Wang System and method for multi-level online learning
US20130073545A1 (en) * 2011-09-15 2013-03-21 Yahoo! Inc. Method and system for providing recommended content for user generated content on an article

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103329151A (zh) * 2010-12-01 2013-09-25 谷歌公司 基于话题聚类的推荐
CN104133820A (zh) * 2013-05-06 2014-11-05 腾讯科技(深圳)有限公司 内容推荐方法及内容推荐装置
CN105574142A (zh) * 2015-12-15 2016-05-11 北京奇虎科技有限公司 一种向用户推荐内容的方法及系统

Also Published As

Publication number Publication date
CN107944033A (zh) 2018-04-20

Similar Documents

Publication Publication Date Title
CN107944033B (zh) 关联话题推荐方法和装置
US10262045B2 (en) Application representation for application editions
US10180967B2 (en) Performing application searches
CN103324645B (zh) 一种网页推荐方法和装置
CN104462573B (zh) 一种视频搜索结果展示方法及装置
TWI636416B (zh) 內容個人化之多相排序方法和系統
CN102822815B (zh) 用于利用浏览器历史进行动作建议的方法和系统
US9864803B2 (en) Method and system for multimodal clue based personalized app function recommendation
CN103279513B (zh) 产生内容标签的方法、提供多媒体内容信息的方法及装置
TWI533246B (zh) 使用者未知興趣之探索方法與系統
CN107562939B (zh) 垂直领域新闻推荐方法、装置及可读储存介质
CN103942712A (zh) 基于产品相似度的电子商务推荐系统及其方法
CN103577478B (zh) 网页推送方法及系统
CN103412881B (zh) 提供搜索结果的方法及系统
CN105718184A (zh) 一种数据处理方法和装置
US20150205580A1 (en) Method and System for Sorting Online Videos of a Search
KR101354721B1 (ko) 검색 시스템 및 검색 서비스 방법
KR20100113593A (ko) 레코멘데이션 정보 평가 장치 및 레코멘데이션 정보 평가 방법
CN102663064A (zh) 一种收藏夹数据的处理方法及装置
CN102163228A (zh) 用于确定资源候选项的排序结果的方法、装置及设备
CN109753601A (zh) 推荐信息点击率确定方法、装置及电子设备
CN105373600A (zh) 视频播单排序方法及装置
CN104503988A (zh) 搜索方法及装置
US8943101B2 (en) Keyword acquiring device, content providing system, keyword acquiring method, a computer-readable recording medium and content providing method
CN108205545B (zh) 一种为用户提供推荐信息的方法与设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant