CN108920649B - 一种信息推荐方法、装置、设备和介质 - Google Patents

一种信息推荐方法、装置、设备和介质 Download PDF

Info

Publication number
CN108920649B
CN108920649B CN201810714428.0A CN201810714428A CN108920649B CN 108920649 B CN108920649 B CN 108920649B CN 201810714428 A CN201810714428 A CN 201810714428A CN 108920649 B CN108920649 B CN 108920649B
Authority
CN
China
Prior art keywords
information
user
processed
entity
entities
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810714428.0A
Other languages
English (en)
Other versions
CN108920649A (zh
Inventor
纪友升
王文敏
徐威
凌光
周超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201810714428.0A priority Critical patent/CN108920649B/zh
Publication of CN108920649A publication Critical patent/CN108920649A/zh
Application granted granted Critical
Publication of CN108920649B publication Critical patent/CN108920649B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例公开了一种信息推荐方法、装置、设备和介质,涉及信息处理技术。该方法包括:从用户的人机交互对话中提取用户关注的实体;根据用户关注的实体以及所述实体的属性为用户建立用户兴趣模型;根据用户兴趣模型对待推荐信息进行排序,并将经过排序后的待推荐信息推荐给用户。本发明实施例提供的一种信息推荐方法、装置、设备和介质,实现了在无屏幕环境下,对推荐内容进行排序调优。

Description

一种信息推荐方法、装置、设备和介质
技术领域
本发明实施例涉及信息处理技术,尤其涉及一种信息推荐方法、装置、设备和介质。
背景技术
目前在市场上,搭载语音对话交互系统的智能硬件设备越来越多。而这样的智能硬件设备很多都是无屏幕的,仅通过语音进行交互。并且交互内容涉及范围也越来越多样化。
目前业界绝大部分新闻资讯推荐系统均是基于有屏幕界面的环境下,根据用户基于屏幕点击的相应内容,判断用户喜好,根据用户喜好向用户推荐感兴趣的资讯。
然而,在无屏幕环境下,推荐内容完全通过语音进行播报。用户无法对相应内容产生点击等行为数据。因此也就无法利用用户的点击行为,对播报内容进行排序调优后的推荐。
发明内容
本发明实施例提供一种信息推荐方法、装置、设备和介质,以实现在无屏幕环境下,对推荐内容进行排序调优。
第一方面,本发明实施例提供了一种信息推荐方法,该方法包括:
从用户的人机交互对话中提取用户关注的实体;
根据用户关注的实体以及所述实体的属性为用户建立用户兴趣模型;
根据用户兴趣模型对待推荐信息进行排序,并将经过排序后的待推荐信息推荐给用户。
第二方面,本发明实施例还提供了一种信息推荐装置,该装置包括:
实体提取模块,用于从用户的人机交互对话中提取用户关注的实体;
模型建立模块,用于根据用户关注的实体以及所述实体的属性为用户建立用户兴趣模型;
信息推荐模块,用于根据用户兴趣模型对待推荐信息进行排序,并将经过排序后的待推荐信息推荐给用户。
第三方面,本发明实施例还提供了一种设备,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明实施例中任一所述的信息推荐方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例中任一所述的信息推荐方法。
本发明实施例通过根据人机对话中用户关注的实体,为用户建立用户兴趣模型。根据用户兴趣模型对待推荐信息进行推荐前的排序。从而实现对待推荐信息的排序调优,根据用户兴趣对用户进行信息推荐。进而提高用户对推荐信息的接收效率和用户体验。
附图说明
图1为本发明实施例一提供的一种信息推荐方法的流程图;
图2是本发明实施例二提供的一种信息推荐方法的流程图;
图3是本发明实施例三提供的一种信息推荐方法的流程图;
图4是本发明实施例四提供的一种信息推荐方法的流程图;
图5是本发明实施例五提供的一种信息推荐装置的结构示意图;
图6为本发明实施例六提供的一种设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一提供的一种信息推荐方法的流程图。本实施例可适用于基于人机交互对话为用户推荐感兴趣信息的情况。该方法可以由一种信息推荐装置来执行,该装置可以由软件和/或硬件方式实现。典型的,该装置没有触摸显示屏。参见图1,本实施例提供的一种信息推荐方法包括:
S110、从用户的人机交互对话中提取用户关注的实体。
其中,实体就是自然语言中具有基本语意特征的文字片段。用户输入的文字、文章的内容、歌曲名称等都可以认为是由实体组成的。
人机交互对话可以是通过按键的输入实现的对话。典型地,在没有触摸显示屏的情况下,人机交互对话是通过语音交互实现的对话。
用户关注的实体可以从通过按键输入的文本中提取,也可以从对人机交互的语音进行识别得到的识别文本中提取。
通常在文本提取领域,从自然语言指令中提取出文本实体通常基于模板匹配实现。采用模板匹配的方式提取自然语言指令中的文本实体时,智能设备将获取到的自然语言指令与大量预设模板进行匹配,并根据匹配到的预设模板从自然语言指令中提取相应的文本实体。比如,智能设备获取到的自然语言指令为“我想听歌手A的歌曲B”,并查找到匹配的预设模板“我想听[歌手]的[歌曲]”,从而根据该模板提取到文本实体“歌手A”和“歌曲B”。
为了解决开发人员需要预先设置大量的模板,导致在进行模板匹配时需要花费大量时间的问题,根据本发明实施例提供了一种文本实体提取方法,该方法包括:
确定目标文本中包含的候选文本实体;
对候选文本实体进行组合,生成目标文本对应的候选分词组合,各个候选分词组合中包含的候选文本实体不同;
计算各个候选分词组合对应的组合概率,组合概率指目标文本采用候选分词组合时语法成立的概率;
将组合概率最高的候选分词组合确定为目标文本对应的目标分词组合;
根据目标分词组合从目标文本中提取文本实体。
示例性的,当目标文本所属的目标领域为音乐领域时,服务器确定出的候选文本实体包括歌手A、歌手a和歌曲B。其中,歌手A和歌手a对应的实体类型为歌手名,歌曲B对应的实体类型为歌曲名。
对上述候选实体进行组合生成5种候选分词组合,这5种候选分词组合分别为:(歌手A)、(歌手a)、(歌曲B)、(歌手A,歌曲B)和(歌手a,歌曲B)。
根据组合概率,将候选分词组合歌手A和歌曲B确定为目标分词组合。根据目标分词组合从目标文本提取实体歌手A和歌曲B。
上述实体提取方法,通过获取目标文本中包含的候选文本实体,并对候选文本实体进行组合,生成目标文本对应的候选分词组合,从而根据各个候选分词组合对应的组合概率确定目标文本对应的目标分词组合,最终根据该目标分词组合从目标文本中提取文本实体。相较于基于预设模板进行文本实体提取,上述实体提取方法对实体的提取不依赖预设模板。缩短了前期配置所耗费时间。同时,相较于模板匹配,采用概率计算的方式确定目标分词组合的速度更快,能够避免因未查找到匹配的模板而导致文本实体提取失败的问题。
S120、根据用户关注的实体以及所述实体的属性为用户建立用户兴趣模型。
常用的几种用户兴趣建模方法为:关键词列表表示法,即用户的兴趣模型是由个或者多个用户感兴趣的关键词所构成的关键词序列来表示;基于布尔模型的表示方法;基于向量空间模型的表示方法,即用关键词和关键词的权重的向量来表示用户兴趣模型;基于本体的用户模型表示方法。
具体地,建立用户兴趣模型的方法可以是基于向量空间模型的表示方法采用基于用户关注的实体表述用户的兴趣模型。通过统计用户关注的实体在对话中的使用次数,得到表达用户兴趣的实体集合,并依据统计信息为每个实体赋予权值。
为准确地确定出用户的兴趣,根据用户关注的实体以及所述实体的属性为用户建立用户兴趣模型包括:
基于用户关注的实体的属性,对实体进行聚类;
将每个类别下实体共有的属性作为该类别对应的兴趣;
根据对每个类别下实体的数量,对各类别对应的兴趣设置权重;
根据每个实体在用户的人机交互对话中出现的次数,对各类别下实体设置权重;
根据各类别对应兴趣和兴趣的权重,以及各类别下实体和实体的权重构造用户兴趣模型。
S130、根据用户兴趣模型对待推荐信息进行排序,并将经过排序后的待推荐信息推荐给用户。
具体地,对待推荐信息进行分析,确定待推荐信息所属类别;确定该类别在用户兴趣模型中对应兴趣的权重;根据每条待推荐信息的权重,对至少两条待推荐信息进行排序。将经过排序后的至少两条待推荐信息以语音播报的形式或其他形式,推荐给用户。
本发明实施例的技术方案,通过根据人机对话中用户关注的实体,为用户建立用户兴趣模型。根据用户兴趣模型对待推荐信息进行推荐前的排序。从而实现对待推荐信息的排序调优,根据用户兴趣对用户进行信息推荐。进而提高用户对推荐信息的接收效率和用户体验。
为进一步提高用户的接收效率。在根据用户兴趣模型对待推荐信息进行排序时,还要结合考虑待推荐信息的时效性、内容质量和文章热度中的至少一种。从而使用户接收的推荐信息不仅是用户感兴趣的,还应该是高质量、时效性较近和较热门中的至少一种的推荐信息。
为解决在无屏幕纯语音环境下,按照传统的所有资讯内容混合播报导致的,用户容易产生混乱感觉的问题。再将待推荐信息推荐给用户之前,对待推荐信息进行分组。可选的,可以基于待推荐信息的内容、时效性、内容质量和热度中的至少一种进行分组。
典型地,基于待推荐信息的内容对待推荐信息分组。
实施例二
图2是本发明实施例二提供的一种信息推荐方法的流程图。本实施例是在上述实施例的基础上提出的一种可选方案。参见图2,本实施例提供的信息推荐方法包括:
S210、从用户的人机交互对话中提取用户关注的实体。
S220、从所述实体中确定待消歧实体。
其中,待消歧实体是存在多义或同音的实体。
例如,多义的苹果实体可以是指水果中的苹果,也可以是指手机品牌。同音实体包括富裕和赋予。
S230、依据待消歧实体上下文和知识库中候选实体的相似度确定待消歧实体的目标实体。
其中,待消歧实体上下文是待推荐信息中待消歧实体所在位置的上文和下文。具体上文或下文可以是几个字,也可是一句话等,本实施例对此并不进行任何限制。知识库可以是各类百科知识库,如维基百科知识库;
具体地,依据待消歧实体上下文和知识库中候选实体的相似度确定待消歧实体的目标实体包括:
从知识库中获取待消歧实体的候选实体集合;
分别对待消歧实体上下文和候选实体集合中的候选实体构造语义向量;
基于语义向量,确定待消歧实体上下文和知识库中候选实体的相似度;
取相似度最大的候选实体作为待消歧实体的目标实体。
S240、根据目标实体以及所述目标实体的属性为用户建立用户兴趣模型。
S250、根据用户兴趣模型对待推荐信息进行排序,并将经过排序后的待推荐信息推荐给用户。
本发明实施例的技术方案,通过识别实体中的待消歧实体,结合待消歧实体的上下文语义,确定目标实体。从而实现对多义或同音实体的消歧。基于消歧后的实体进行用户兴趣模型的建立,可以提高用户兴趣模型的构建准确率。
实施例三
图3是本发明实施例三提供的一种信息推荐方法的流程图。本实施例是在上述实施例的基础上提出的一种可选方案。参见图3,本实施例提供的信息推荐方法包括:
S310、从用户的人机交互对话中提取用户关注的实体。
S320、根据用户关注的实体以及所述实体的属性为用户建立用户兴趣模型。
S330、从包括至少两个待推荐信息的序列中确定待处理信息。
S340、若待处理信息与已处理信息的相似度大于设定相似度阈值,则删除所述待处理信息或将所述待处理信息排在所述序列的后面,并将所述待处理信息标记为已处理信息。
具体地,对待处理信息与已处理信息相似度的判断包括:
提取待处理信息的特征;
将待处理信息的特征与已处理信息特征集合中的至少一条已处理信息的特征进行相似度比较;
根据比较结果判断待处理信息与已处理信息的相似度是否大于设定相似度阈值。
其中,待处理信息的特征可以是内容特征、时效性、内容质量和热度中的至少一种。已处理信息特征集合包括至少一条已处理信息的特征。
内容特征是描述待处理信息内容的特征,可以是待处理信息包含的关键字。
进一步地,在根据比较结果判断待处理信息与已处理信息的相似度是否大于设定相似度阈值之后,还包括:
若待处理信息的特征与已处理信息特征集合中已处理信息的特征的相似度均不大于设定相似度阈值,则保留所述待处理信息或将所述待处理信息排在待推荐信息序列的前列;
将所述待处理信息的特征加入已处理信息特征集合,并将所述待处理信息标记为已处理信息。
S350、根据用户兴趣模型,对待推荐信息序列中的待推荐信息的排列顺序进行调整,并将经过排序调整后的待推荐信息序列推荐给用户。
其中,待推荐信息序列是包括至少两个待推荐信息的序列。
本实施例对S330和S340的执行步骤不做限定,典型地S330和S340可以先于S320或S310执行。
本发明实施例的技术方案,通过将包括重复内容的待推荐信息删除或排在待推荐信息序列的后面,从而降低重复信息的推荐,或减少用户对包括重复内容的待推荐信息的接收。
实施例四
图4是本发明实施例四提供的一种信息推荐方法的流程图。本实施例是在上述实施例的基础上以待推荐信息是新闻资讯文章,信息推荐装置是无触摸显示屏的装置为例提出的一种可选方案。参见图4,本实施例提供的信息推荐方法包括:
针对用户与系统进行的对话进行分析,抽取出用户在对话过程中比较关注的实体,从而根据抽取的实体为用户建立用户兴趣模型。根据生成的用户兴趣模型可以了解用户可能更喜欢什么样的实体以及感兴趣的新闻资讯。
依据各新闻资讯文章组和用户兴趣模型,按照用户感兴趣的程度对待播放的新闻资讯文章组及该组中具体的文章进行排序,并推荐给用户进行收听。
为提高新闻资讯播报逻辑的清晰度,在对不同新闻资讯文章组播报之间,用播报具体的话术介绍接下来要播报的新闻资讯文章组的内容。使得用户清楚地知道接下来要播报什么内容。
具体地,上述步骤在线实现。新闻资讯文章组的确定离线实现。新闻资讯文章组的确定包括:
提取待播放的新闻资讯文章的特征,其中所述特征包括时效性、内容质量、文章热度和文章内实体中的至少一种。
其中,时效性即为文章发布时间是否比较新。内容质量主要通过分析文章文本内容进行质量评估。文章热度可根据文章在相关资讯网站阅读量进行评估。文章内实体可通过自然语言处理方法提取出文章主要涉及的实体,例如英超新闻领域下的球员、球队、教练等实体。
利用提取的待播放的新闻资讯文章的特征进行融合排序。
具体地,可以根据多种特征,确定每篇待播放的新闻资讯文章的分值。该分值将作为对该新闻资讯文章进行排序的依据。此处主要使用的排序算法为波达计数法。
典型地,对待播放的新闻资讯文章的分值确定公式可以为:分值=a*时效性得分+b*文章内容质量得分+c*文章热度得分+d*文章内实体得分。
其中,a、b、c和d为各特征的权重,具体可以根据实际需要确定。*表示乘以。
为解决在数据库中新闻资讯文章数量较多,可能存在多篇文章同时对同一事件进行报道且内容基本相同的重复性问题。从包括至少两个待播报新闻资讯文章的序列中确定待处理新闻资讯文章。
若待处理新闻资讯文章与已处理新闻资讯文章的相似度大于设定相似度阈值,则降低所述待处理新闻资讯文章的分值。该过程可以利用次模函数实现。
依据新闻资讯文章降低后的分值对所述新闻资讯文章进行排序,以将内容重复(也即高相似度)的新闻资讯文章排在待播报新闻资讯文章序列的后面。通过这个策略,极大的降低了新闻的重复率。
对待播报的新闻资讯文章进行分组,生成至少一个新闻资讯文章组。
其中,组内的新闻资讯文章的排序,将依据利用新闻资讯文章的多种特征确定的新闻资讯文章的分值和对包括重复内容的新闻资讯文章降低的分值进行排序。分组间的排序可以依据组内新闻资讯文章的热度进行排序。
例如,将英超新闻领域中讲诉球队『曼联』的相关新闻分到同一组里。这样实际新闻资讯文章播报的时候可以根据分组进行播报,使得新闻交互推荐播报逻辑更加清晰。
本发明实施例的技术方案,通过基于用户和系统的对话建立用户兴趣模型,根据用户兴趣模型对待播报的新闻资讯文章进行播报前的排序,从而实现无需用户点击行为数据对待播报的新闻资讯文章进行排序调优,实现新闻资讯文章的个性化推荐,提升用户接受度。
利用新闻资讯文章的多种特征对待播报的新闻资讯文章进行融合排序,实现将用户感兴趣、时效较近、内容质量较高和热度较高的新闻资讯文章推荐给用户。
对包括重复内容的新闻资讯文章进行去重打压处理,降低重复率。同时以分组形式进行推荐,解决在无屏幕纯语音环境下,按照传统的所有资讯内容混合播报导致的,用户容易产生混乱感觉的问题。
综上本实施例建立了一套在无屏幕场景下新闻交互推荐的有效机制。
需要说明的是,经过本实施例的技术教导,本领域技术人员有动机将上述实施例中描述的任一种实施方式进行方案的组合,以实现对待推荐信息的排序和推荐。
实施例五
图5是本发明实施例五提供的一种信息推荐装置的结构示意图。参见图5,本实施例提供的信息推荐装置包括:实体提取模块10、模型建立模块20和信息推荐模块30.
其中,实体提取模块10,用于从用户的人机交互对话中提取用户关注的实体;
模型建立模块20,用于根据用户关注的实体以及所述实体的属性为用户建立用户兴趣模型;
信息推荐模块30,用于根据用户兴趣模型对待推荐信息进行排序,并将经过排序后的待推荐信息推荐给用户。
本发明实施例的技术方案,通过根据人机对话中用户关注的实体,为用户建立用户兴趣模型。根据用户兴趣模型对待推荐信息进行推荐前的排序。从而实现对待推荐信息的排序调优,根据用户兴趣对用户进行信息推荐。进而提高用户对推荐信息的接收效率和用户体验。
进一步地,模型建立模块包括:消歧实体确定单元、目标实体确定单元和模型建立单元。
其中,消歧实体确定单元,用于从所述实体中确定待消歧实体;
目标实体确定单元,用于依据待消歧实体上下文和知识库中候选实体的相似度确定待消歧实体的目标实体;
模型建立单元,用于根据目标实体以及所述目标实体的属性为用户建立用户兴趣模型。
进一步地,所述信息推荐装置,还包括:待处理信息确定模块和去重模块。
其中,待处理信息确定模块,用于在根据用户兴趣模型对待推荐信息进行排序之前,从包括至少两个待推荐信息的序列中确定待处理信息;
去重模块,用于若待处理信息与已处理信息的相似度大于设定相似度阈值,则删除所述待处理信息或将所述待处理信息排在所述序列的后面,并将所述待处理信息标记为已处理信息。
进一步地,去重模块包括:特征提取单元、相似度比较单元和结果判断单元。
其中,特征提取单元,用于提取待处理信息的特征;
相似度比较单元,用于将待处理信息的特征与已处理信息特征集合中的至少一条已处理信息的特征进行相似度比较;
结果判断单元,用于根据比较结果判断待处理信息与已处理信息的相似度是否大于设定相似度阈值。
实施例六
图6为本发明实施例六提供的一种设备的结构示意图。图6示出了适于用来实现本发明实施方式的示例性设备12的框图。图6显示的设备12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图6所示,设备12以通用计算设备的形式表现。设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图6未显示,通常称为“硬盘驱动器”)。尽管图6中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器等)通信,还可与一个或者多个使得用户能与该设备12交互的设备通信,和/或与使得该设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与设备12的其它模块通信。应当明白,尽管图中未示出,可以结合设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的信息推荐方法。
实施例七
本发明实施例七还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例中任一所述的信息推荐方法。
该方法包括:从用户的人机交互对话中提取用户关注的实体;
根据用户关注的实体以及所述实体的属性为用户建立用户兴趣模型;
根据用户兴趣模型对待推荐信息进行排序,并将经过排序后的待推荐信息推荐给用户。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (10)

1.一种信息推荐方法,其特征在于,包括:
从用户的人机交互对话中提取用户关注的实体;
根据用户关注的实体以及所述实体的属性为用户建立用户兴趣模型;
根据用户兴趣模型,并结合考虑待推荐信息的时效性、内容质量和文章热度中的至少一种,对待推荐信息进行排序,并将经过排序后的待推荐信息推荐给用户;
其中,所述根据用户关注的实体以及所述实体的属性为用户建立用户兴趣模型,包括:
基于所述实体的属性,对实体进行聚类;
将每个类别下实体共有的属性作为该类别对应兴趣;
根据对所述每个类别下实体的数量,对每个类别对应兴趣设置权重;
根据实体在所述用户的人机交互对话中出现的频率,对每个类别下实体设置权重;
根据所述每个类别对应兴趣和所述每个类别对应兴趣的权重,以及每个类别下实体和每个类别下实体权重构造用户兴趣模型。
2.根据权利要求1所述的方法,其特征在于,根据用户关注的实体以及所述实体的属性为用户建立用户兴趣模型包括:
从所述实体中确定待消歧实体;
依据待消歧实体上下文和知识库中候选实体的相似度确定待消歧实体的目标实体;
根据目标实体以及所述目标实体的属性为用户建立用户兴趣模型。
3.根据权利要求1所述的方法,其特征在于,在根据用户兴趣模型对待推荐信息进行排序之前,还包括:
从包括至少两个待推荐信息的序列中确定待处理信息;
若待处理信息与已处理信息的相似度大于设定相似度阈值,则删除所述待处理信息或将所述待处理信息排在所述序列的后面,并将所述待处理信息标记为已处理信息。
4.根据权利要求3所述的方法,其特征在于,对待处理信息与已处理信息相似度的判断包括:
提取待处理信息的特征;
将待处理信息的特征与已处理信息特征集合中的至少一条已处理信息的特征进行相似度比较;
根据比较结果判断待处理信息与已处理信息的相似度是否大于设定相似度阈值。
5.一种信息推荐装置,其特征在于,包括:
实体提取模块,用于从用户的人机交互对话中提取用户关注的实体;
模型建立模块,用于根据用户关注的实体以及所述实体的属性为用户建立用户兴趣模型;
信息推荐模块,用于根据用户兴趣模型,并结合考虑待推荐信息的时效性、内容质量和文章热度中的至少一种,对待推荐信息进行排序,并将经过排序后的待推荐信息推荐给用户;
其中,所述模型建立模块具体用于:
基于所述实体的属性,对实体进行聚类;
将每个类别下实体共有的属性作为该类别对应兴趣;
根据对所述每个类别下实体的数量,对每个类别对应兴趣设置权重;
根据实体在所述用户的人机交互对话中出现的频率,对每个类别下实体设置权重;
根据所述每个类别对应兴趣和所述每个类别对应兴趣的权重,以及每个类别下实体和每个类别下实体权重构造用户兴趣模型。
6.根据权利要求5所述的装置,其特征在于,模型建立模块包括:
消歧实体确定单元,用于从所述实体中确定待消歧实体;
目标实体确定单元,用于依据待消歧实体上下文和知识库中候选实体的相似度确定待消歧实体的目标实体;
模型建立单元,用于根据目标实体以及所述目标实体的属性为用户建立用户兴趣模型。
7.根据权利要求5所述的装置,其特征在于,还包括:
待处理信息确定模块,用于在根据用户兴趣模型对待推荐信息进行排序之前,从包括至少两个待推荐信息的序列中确定待处理信息;
去重模块,用于若待处理信息与已处理信息的相似度大于设定相似度阈值,则删除所述待处理信息或将所述待处理信息排在所述序列的后面,并将所述待处理信息标记为已处理信息。
8.根据权利要求7所述的装置,其特征在于,去重模块包括:
特征提取单元,用于提取待处理信息的特征;
相似度比较单元,用于将待处理信息的特征与已处理信息特征集合中的至少一条已处理信息的特征进行相似度比较;
结果判断单元,用于根据比较结果判断待处理信息与已处理信息的相似度是否大于设定相似度阈值。
9.一种设备,其特征在于,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-4中任一所述的信息推荐方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-4中任一所述的信息推荐方法。
CN201810714428.0A 2018-06-29 2018-06-29 一种信息推荐方法、装置、设备和介质 Active CN108920649B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810714428.0A CN108920649B (zh) 2018-06-29 2018-06-29 一种信息推荐方法、装置、设备和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810714428.0A CN108920649B (zh) 2018-06-29 2018-06-29 一种信息推荐方法、装置、设备和介质

Publications (2)

Publication Number Publication Date
CN108920649A CN108920649A (zh) 2018-11-30
CN108920649B true CN108920649B (zh) 2021-09-17

Family

ID=64423994

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810714428.0A Active CN108920649B (zh) 2018-06-29 2018-06-29 一种信息推荐方法、装置、设备和介质

Country Status (1)

Country Link
CN (1) CN108920649B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110032625B (zh) * 2019-03-28 2023-01-13 腾讯科技(上海)有限公司 一种人机对话方法及装置
CN110287338B (zh) * 2019-06-21 2022-04-29 北京百度网讯科技有限公司 行业热点确定方法、装置、设备和介质
CN110688476A (zh) * 2019-09-23 2020-01-14 腾讯科技(北京)有限公司 一种基于人工智能的文本推荐方法及装置
CN112784142A (zh) * 2019-10-24 2021-05-11 北京搜狗科技发展有限公司 一种信息推荐方法及装置
CN112199557A (zh) * 2020-10-15 2021-01-08 北京如易堂科技有限公司 一种发明内容推荐工具、电子设备及计算机可存储介质
CN112579896A (zh) * 2020-12-16 2021-03-30 中国平安人寿保险股份有限公司 一种信息推荐方法、装置、电子设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105243143A (zh) * 2015-10-14 2016-01-13 湖南大学 基于即时语音内容检测的推荐方法及系统
CN106326413A (zh) * 2016-08-23 2017-01-11 达而观信息科技(上海)有限公司 一种个性化视频推荐系统及方法
CN107180078A (zh) * 2017-04-21 2017-09-19 河海大学 一种基于用户兴趣学习的垂直搜索方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006064877A1 (ja) * 2004-12-17 2006-06-22 Matsushita Electric Industrial Co., Ltd. コンテンツ推薦装置
CN104572734B (zh) * 2013-10-23 2019-04-30 腾讯科技(深圳)有限公司 问题推荐方法、装置及系统
CN103870538B (zh) * 2014-01-28 2017-02-15 百度在线网络技术(北京)有限公司 针对用户进行个性化推荐的方法、用户建模设备及系统
CN104836720B (zh) * 2014-02-12 2022-02-25 北京三星通信技术研究有限公司 交互式通信中进行信息推荐的方法及装置
CN103886090B (zh) * 2014-03-31 2018-01-02 北京搜狗科技发展有限公司 基于用户喜好的内容推荐方法及装置
CN104166668B (zh) * 2014-06-09 2018-02-23 南京邮电大学 基于folfm模型的新闻推荐系统及方法
CN105608118B (zh) * 2015-12-15 2018-12-18 成都陌云科技有限公司 基于用户交互信息的结果推送方法
CN106407425A (zh) * 2016-09-27 2017-02-15 北京百度网讯科技有限公司 基于人工智能的推送信息的方法和装置
CN107832433B (zh) * 2017-11-15 2020-08-11 北京百度网讯科技有限公司 基于对话交互的信息推荐方法、装置、服务器和存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105243143A (zh) * 2015-10-14 2016-01-13 湖南大学 基于即时语音内容检测的推荐方法及系统
CN106326413A (zh) * 2016-08-23 2017-01-11 达而观信息科技(上海)有限公司 一种个性化视频推荐系统及方法
CN107180078A (zh) * 2017-04-21 2017-09-19 河海大学 一种基于用户兴趣学习的垂直搜索方法

Also Published As

Publication number Publication date
CN108920649A (zh) 2018-11-30

Similar Documents

Publication Publication Date Title
CN108920649B (zh) 一种信息推荐方法、装置、设备和介质
US11164568B2 (en) Speech recognition method and apparatus, and storage medium
CN106897428B (zh) 文本分类特征提取方法、文本分类方法及装置
US11302337B2 (en) Voiceprint recognition method and apparatus
TWI732271B (zh) 人機對話方法、裝置、電子設備及電腦可讀媒體
CN107832286B (zh) 智能交互方法、设备及存储介质
CN107818781B (zh) 智能交互方法、设备及存储介质
AU2017408800B2 (en) Method and system of mining information, electronic device and readable storable medium
CN111625635A (zh) 问答处理、语言模型的训练方法、装置、设备及存储介质
CN110457672B (zh) 关键词确定方法、装置、电子设备及存储介质
US20130060769A1 (en) System and method for identifying social media interactions
EP3933657A1 (en) Conference minutes generation method and apparatus, electronic device, and computer-readable storage medium
CN105956053B (zh) 一种基于网络信息的搜索方法及装置
WO2018045646A1 (zh) 基于人工智能的人机交互方法和装置
CN103425710A (zh) 一种基于主题的搜索方法和装置
CN111783468A (zh) 文本处理方法、装置、设备和介质
CN111460221A (zh) 评论信息处理方法、装置及电子设备
US11397852B2 (en) News interaction method, apparatus, device and computer storage medium
US11954097B2 (en) Intelligent knowledge-learning and question-answering
CN111767393A (zh) 一种文本核心内容提取方法及装置
WO2020052061A1 (zh) 用于处理信息的方法和装置
CN111651578A (zh) 人机对话方法、装置及设备
US20220365956A1 (en) Method and apparatus for generating patent summary information, and electronic device and medium
CN106663123B (zh) 以评论为中心的新闻阅读器
CN111984774A (zh) 搜索方法、装置、设备以及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant