CN104503978A - 一种相关实体推荐方法和系统 - Google Patents
一种相关实体推荐方法和系统 Download PDFInfo
- Publication number
- CN104503978A CN104503978A CN201410696289.5A CN201410696289A CN104503978A CN 104503978 A CN104503978 A CN 104503978A CN 201410696289 A CN201410696289 A CN 201410696289A CN 104503978 A CN104503978 A CN 104503978A
- Authority
- CN
- China
- Prior art keywords
- incidence relation
- entity
- related entities
- statement
- recommendation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种相关实体推荐方法和系统。所述方法包括:接收用户输入的查询语句,提取出所述查询语句中包含的实体名称;获得所述实体名称所对应实体的相关实体、以及所述实体名称所对应实体与所述相关实体的关联关系;根据所述关联关系生成对所述相关实体的推荐理由;将所述相关实体和所述推荐理由进行展现。本发明解决了现有技术中展现的一些推荐实体的推荐理由仅与推荐实体本身相关,与用户搜索查询语句中的实体无关联的问题,实现了为用户展现的推荐实体的推荐理由与用户输入搜索查询语句具有关联,引起用户对推荐实体的兴趣,进而达到引导用户进行再次搜索的效果。
Description
技术领域
本发明实施例涉及互联网技术领域,尤其涉及一种相关实体推荐方法和系统。
背景技术
目前为了引导用户进行再次搜索,在用户输入搜索查询查询语句后,搜索引擎除了将搜索到的与该查询语句相关的网页链接展现给用户外,还会查询该语句包含的实体的相关实体,并将该相关实体作为推荐实体也展现给用户,同时将相应的推荐理由也进行展现,比如将推荐实体显示在网页链接的右侧,将推荐理由显示在相应推荐实体的下方,以引起用户兴趣并针对该推荐实体进行搜索。
现有技术中展现的一些推荐实体的推荐理由仅与推荐实体本身相关,与查询语句并无关联,如图1所示,用户输入搜索查询语句“爷们儿”,网页链接的右侧给出推荐的相关实体(第一排的四个),对于每个推荐的相关实体,都给出了推荐相关实体的推荐理由,但是都是针对推荐实体本身而言,跟查询语句中实体“爷们儿”无联系,用户根据推荐理由不明白为什么推荐这些实体。又如图2所示,用户输入搜索查询语句“爷们儿”,网页链接的右侧给出推荐的相关实体,其中前4个给出了推荐相关实体的推荐理由,也都是针对推荐实体本身而言,跟查询语句中实体“爷们儿”无联系。这就使得用户很可能不会对推荐实体有兴趣,不能达到引导用户进行再次搜索的目的。
发明内容
本发明提供一种相关实体推荐方法和系统,以实现为用户展现的推荐实体的推荐理由与用户输入搜索查询语句具有关联,引起用户对推荐实体的兴趣,进而达到引导用户进行再次搜索的效果。
第一方面,本发明实施例提供了一种相关实体推荐方法,包括:
接收用户输入的查询语句,提取出所述查询语句中包含的实体名称;
获得所述实体名称所对应实体的相关实体、以及所述实体名称所对应实体与所述相关实体的关联关系;
根据所述关联关系生成对所述相关实体的推荐理由;
将所述相关实体和所述推荐理由进行展现。
第二方面,本发明实施例还提供了一种相关实体推荐系统,包括:
实体名称提取模块,用于接收用户输入的查询语句,提取出所述查询语句中包含的实体名称;
相关实体及关联关系获取模块,用于获得所述实体名称所对应实体的相关实体、以及所述实体名称所对应实体与所述相关实体的关联关系;
推荐理由生成模块,用于根据所述关联关系生成对所述相关实体的推荐理由;
推荐理由展现模块,用于将所述相关实体和所述推荐理由进行展现。
本发明通过提取出所述查询语句中包含的实体名称;获得所述实体名称所对应实体的相关实体、以及所述实体名称所对应实体与所述相关实体的关联关系;根据所述实体名称所对应实体与所述相关实体的关联关系生成对所述相关实体的推荐理由,并将所述相关实体和所述推荐理由进行展现,解决了现有技术中展现的一些推荐实体的推荐理由仅与推荐实体本身相关,与用户搜索查询语句中的实体无关联的问题,实现了为用户展现的推荐实体的推荐理由与用户输入搜索查询语句具有关联,引起用户对推荐实体的兴趣,进而达到引导用户进行再次搜索的效果。
附图说明
图1为现有技术中一种相关实体推荐结果展现示意图;
图2为现有技术中另一种相关实体推荐结果展现示意图;
图3为本发明实施例一提供的一种相关实体推荐方法的流程图;
图4为本发明实施例二提供的一种相关实体推荐方法的流程图;
图5是本发明实施例二提供的一种将各关联关系按照时间和重要度进行排序的示意图;
图6为本发明实施例二提供的一种相关实体推荐结果展现示意图;
图7为本发明实施例四提供的一种相关实体推荐结果展现示意图;
图8为本发明实施例四提供的语料库中的语句=“在大坯山下颜良被关公突然袭击快马奔到面前一刀杀死的”,经过语法语义分析后,得到的句法结构示意图;
图9为本发明实施例四提供的对语句=“在大坯山下颜良被关公突然袭击快马奔到面前一刀杀死的”句法结构进行相关实体对挖掘示意图;
图10为本发明实施例五提供的一种相关实体推荐方法的流程图;
图11为本发明实施例六提供的一种相关实体推荐系统的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图3为本发明实施例一提供的一种相关实体推荐方法的流程图,本实施例可适用于各种搜索引擎,用于引导用户搜索,引起用户的相关兴趣进行再次搜索。本实施例的方法可以由相关实体推荐装置来执行,该装置可通过软件的方式实现,并一般可集成于搜索引擎客户端(例如,百度搜索、360搜索等)所在的终端设备(例如,台式机或者笔记本等)中,或作为搜索引擎客户端的子程序。本实施例的方法具体包括如下操作:
110、接收用户输入的查询语句,提取出所述查询语句中包含的实体名称;
用户向搜索引擎提交查询语句,搜索引擎一般在接受到用户查询语句后,要做一些处理。所述处理就是提取出所述查询语句中包含的实体名称。其中用户输入的查询语句可以是一个词语也可以是一个句子,该操作能够识别并提取出用户输入查询语句中所包含的实体名称,例如采用分词技术获得所述查询语句中包含的各实体名称,需要注意的是本发明对获得所述查询语句中包含的实体名称的方式不作限制。
120、获得所述实体名称所对应实体的相关实体、以及所述实体名称所对应实体与所述相关实体的关联关系;
根据上述操作获得的查询语句中包含的实体名称,查询所述实体名称所对应实体的相关实体、以及所述实体名称所对应实体与所述相关实体的关联关系。所述相关实体以及关联关系需要预先挖掘,从挖掘出的相关实体以及关联关系中获取述实体名称所对应实体的相关实体、以及所述实体名称所对应实体与所述相关实体的关联关系。
130、根据所述关联关系生成对所述相关实体的推荐理由;
根据上述获得的所述实体名称所对应实体与所述相关实体的关联关系对所有获得的与所述实体名称所对应的相关实体分别生成推荐理由。所述推荐理由描述了推荐的相关实体与用户搜索查询语句中的实体名称对应的实体之间的关联关系。
140、将所述相关实体和所述推荐理由进行展现。
将上述获得的与用户输入的搜索查询语句中包含的实体名称所对应实体的相关实体,以及根据所述实体名称所对应实体与所述相关实体的关联关系生成的对所述相关实体的推荐理由,在用户的搜索结果中进行展示。例如,可以将推荐的相关实体显示在搜索网页的右侧,将推荐理由显示在相应推荐的相关实体的下方。当然,本技术领域的相关技术人员也可以根据应用场景需要,选择其他的展现形式,本实施例对展现形式并不做限制。
本实施例的技术方案,通过提取出所述查询语句中包含的实体名称;获得所述实体名称所对应实体的相关实体、以及所述实体名称所对应实体与所述相关实体的关联关系;根据所述实体名称所对应实体与所述相关实体的关联关系生成对所述相关实体的推荐理由,并将所述相关实体和所述推荐理由进行展现,解决了现有技术中展现的一些推荐实体的推荐理由仅与推荐实体本身相关,与用户搜索查询语句中的实体无关联的问题,实现了为用户展现的推荐实体的推荐理由与用户输入搜索查询语句具有关联,引起用户对推荐实体的兴趣,进而达到引导用户进行再次搜索的效果。
在上述技术方案的基础上,优选地,所述获得所述实体名称所对应实体的相关实体、以及所述实体名称所对应实体与所述相关实体的关联关系,具体包括:根据预先利用语料库中的语句挖掘出的相关实体对,查询所述实体名称所对应实体的相关实体、以及所述实体名称所对应实体与所述相关实体的关联关系。
其中所述语料库可以是索引数据库,还可以是用户行为数据库。通过对语料库中的语句进行基本的词法、句法分析,给出句子的句法结构,然后基于此结构进行实体关系挖掘,确定相关实体对,所述相关实体对包括相关实体和关联关系。根据上述获取的查询语句中的实体名称,从预先利用语料库中的语句挖掘出的相关实体对中查找所对应实体的相关实体,以及所述实体名称所对应实体与所述相关实体的关联关系。
进一步地,根据预先利用语料库中的语句挖掘出的相关实体对,具体包括:对语料库中的语句进行语法语义分析,得到所述语句的句法结构;根据所述语句的句法结构,获得所述语句中具有关联关系的实体,将该具有关联关系的实体以及所述关联关系作为相关实体对进行保存。
这部分工作涉及:分词模块、实体识别模块、词性标注模块和依存分析模块。其中,分词模块是其他模块对语句作进一步分析的基础,将一个语句切分成一个一个单独的词,利用各种匹配方法将语句重新组合成词序列,例如可以是基于字符串匹配的分词,或者基于统计模型的分词等;实体识别模块用于识别出待处理语句中描述确切对象的词语;词性标注模块,用于将词语进行词性分类,可以将句子中具体词的组合关系抽象成词类之间的组合关系,进而更容易得到句法结构的规律;依存分析模块用于将语句分析成一颗依存句法树,描述出各个词语之间的依存关系,也即指出了词语之间在句法上的搭配关系。同时为了提升基础模块的准确率,在调用词法和句法前,先进行语料预处理。语料预处理的作用,一是去除杂乱无章的语句,二是进行指代消解。
进一步地,所述根据所述语句的句法结构,获得所述语句中具有关联关系的实体,将该具有关联关系的实体以及所述关联关系作为相关实体对进行保存,包括:
提取所述语句的句法结构中的子结构;
对提取到的子结构进行语句类型识别;
根据语句类型识别结果,对提取到的子结构进行合并后对合并得到的子结构进行合理性验证,或者对提取到的子结构进行合理性验证;
将验证通过的子结构作为相关实体对进行保存。
挖掘过程是一个自上而下的处理过程,首先根据句法结构,将句法结构中的所有子结构进行提取。然后对提取到的子结构进行语句类型识别,例如识别所述子结构是正常语句还是被字句或逆序结构等,当所述子结构为正常语句结构时,不做处理,直接保存;当所述子结构是被字句或逆序结构等时,调整所述子结构为正常语句结构后保存。如果得到的子结构中含有无意义的连接节点(由于句子语法需求,一些虚词用来协助构建整个句子),那么需要先对得到的子结构进行合并。然后对合并后得到的子结构或者不需要进行合并的子结构再进行最后的合理性验证,将高质量结果作为最终的挖掘结果。例如通过语料来源网站的质量(新闻网站质量高于贴吧等论坛网站)、网站数量等确定语料语句的可靠性,将可靠性低的来源语料语句舍弃。
在上述实施例的基础上,通过对语料库中的语句进行语法语义分析获取句法结构,并根据获取的句法结构挖掘相关实体对,得到所述用户查询语句中的实体名称所对应实体的相关实体,以实现为用户查询结果推荐相关性高的相关实体。
实施例二
图4为本发明实施例二提供的一种相关实体推荐方法的流程图。本实施例以上述各实施例为基础进行优化。如图4所示,该方法具体包括如下操作:
210、接收用户输入的查询语句,提取出所述查询语句中包含的实体名称;
220、获得所述实体名称所对应实体的相关实体、以及所述实体名称所对应实体与所述相关实体的关联关系;
230、将获得的所述关联关系按照时间和/或重要度进行排序;
两个实体随着时间维度上的推移,它们之间会发生很多关联关系,譬如一对曾经是夫妻的两个人,他们之间会经过“相识”、“相恋”、“结婚”、“离婚”等多个关联关系。重要度即关联关系本身的重要度,例如两个人传出绯闻关系的重要度要高于两个人共同出席一个活动关系的重要度。本实施例提供3种排序方案,可以是只按照时间对获得的所述相关实体与所述实体名称所对应实体的各关联关系排序,可以是只按照重要度对获得的所述相关实体与所述实体名称所对应实体的各关联关系排序,还可以是按照时间和重要度对获得的所述相关实体与所述实体名称所对应实体的各关联关系排序。示例性地,如图5所示,对“李亚鹏”和“王菲”两个实体之间的关联关系按照时间和重要度进行排序。其中,两个人之间的普通事件,已经在时间轴上去除。
240、根据排序结果选取至少一种关联关系,根据选取的关联关系生成对所述相关实体的推荐理由;
由于两个实体之间只能展示一个推荐理由,需要从多个关联关系中选择一个关联关系用于生成二者之间的推荐理由,该推荐理由需要具有吸引性,以吸引用户兴趣,使其进行再次搜索。
250、将所述相关实体和所述推荐理由进行展现。
如图6所示,针对用户输入的“爷们儿”,对现有技术图1中第一排的推荐相关实体的推荐理由进行更改。通过对所获得的所述相关实体与所述实体名称所对应实体的各关联关系的重要度进行排序后,根据排序结果选取关联关系“饰演”,根据所选取的关联关系生成对所述相关实体的推荐理由。如图6所示,推荐相关实体“宋佳”,推荐理由=饰演第三任妻子陈丽;推荐相关实体“朱锐”,推荐理由=饰演第二任妻子马添;推荐相关实体“左小青”,推荐理由=饰演初恋女友许婷,推荐相关实体“张嘉译”,推荐理由=饰演男主角李国生。通过推荐理由,用户可以很清楚的了解到该电视剧“爷们儿”中的主要角色,以及基本的人物关系。同时,还可以带动搜索流量,如通过推荐理由,用户了解到各个主角,对每一个主角的个人介绍或者曾经主演的影视剧比较感兴趣,可以再一次进行相关人物的检索。
本实施例的技术方案,通过将获得的所述相关实体与所述实体名称所对应实体的各关联关系按照时间和/或重要度进行排序,根据排序结果选取至少一种关联关系,根据选取的关联关系生成对所述相关实体的推荐理由,并将所述相关实体和根据排序结果选取的所述推荐理由进行展现,实现了为用户展现的推荐实体的推荐理由与用户输入搜索查询语句具有关联,引起用户对推荐实体的兴趣,进而达到引导用户进行再次搜索的效果。
在上述实施例的基础上,优选地,根据排序结果选取最近时间和/或重要度最高的至少一种关联关系,根据选取的关联关系生成对所述相关实体的推荐理由;将所述相关实体和根据排序结果选取的所述推荐理由进行展现。
由于一般具有吸引性的推荐理由都是由两个实体间重要度高且最近发生的关联关系生成的,因此选取最近时间和/或重要度最高的至少一种关联关系生成对所述相关实体的推荐理由,更加吸引用户的兴趣以及引导用户进行再次搜索。
实施例三
本发明实施例三提供了的一种关联关系重要度的确定方法。
关联关系包括动态关系和静态关系。每种关联关系的重要度按照如下方法确定:
根据预先设定的关系类型与重要度的映射关系,确定当前关联关系的类型所对应的重要度。
首先,预先设定关联关系的类型,并定义了关联关系的类型的重要度顺序,即预先设定了关系类型与重要度的映射关系。例如人物间动态关系的重要度顺序定义为:a“爱恨强情感”关系类,如“相恋”、“结婚”、“憎恨”等;b“伤害惩罚”关系类,如“赐死”、“枪杀”、“炮轰”等;c“艺术创作”关系类,如“扮演”、“打造”、“主持”等;d“比赛/战争类”关系类,如“不敌”、“逆转”、“偷袭”等;e“称呼/模仿”关系类,如“被誉为”、“长得像”等;f“其他普通”关系类,如“拜师”、“道歉”、“陪同”等;其中重要度的强弱顺序为a>b>c>d>e>f。人物间静态关系的重要度顺序定义为:g“亲属/师徒”类关系,如“妻子”、“死党”等;h“校友/队友”类关系,如“前辈”、“搭档”等;i“同一属性”类关系,如同为大陆女演员等;其中重要度的强弱顺序为g>h>i。
本发明实施例通过为相关实体推荐方法提供关联关系重要度的确定方法,以将获得的所述相关实体与所述实体名称所对应实体的各关联关系按照重要度进行排序;根据排序结果选取至少一种关联关系,并根据选取的关联关系生成对所述相关实体的推荐理由,提高了所述生成的相关实体的推荐理由与用户输入搜索查询语句的关联性,能够更加吸引用户的兴趣以及引导用户进行再次搜索。
实施例四
本实施例以上述各实施例为基础进行优化。优选地,所述根据选取的关联关系生成对所述相关实体的推荐理由,具体包括:
根据预先针对该选取的关联关系的类型设定的元素构成框架,确定该选取的关联关系所需要补充的元素,并在获得所需要补充的元素后对该选取的关联关系进行元素补充,以生成具有完整性的推荐理由。
根据关联关系生成推荐理由,除了应具有吸引力外,还需要所述生成的推荐理由具有完整性,即推荐理由较完整的表达了用户输入的搜索查询语句中的实体与所推荐的相关实体之间的关系,从而避免推荐理由引起歧义或者由于时效性导致推荐理由不成立的情况发生。为了保证推荐理由具有完整性,对每一类关联关系都预先设定了元素构成框架,以确定该选取的关联关系所需要补充的元素。
例如,对于结婚/离婚类关系,该类关系的元素构成框架为(实体1,实体2,发生时间),该元素构成框架可以防止时效性问题。当使用该元素构成框架,对选取的关联关系进行发生时间的补充之后,当两人离婚时,因为有发生时间的存在,所以推荐理由也是成立的。
对于比赛/战争类关系,该类关系的元素构成框架为(实体1,实体2,发生时间|具体比赛或战争名称|发生地点),其中“|”表示或,即补充发生时间、具体比赛或战争名称、发生地点三个元素中的一个即可。如关联关系为“李娜战胜小威廉姆斯”,该关系为比赛/战争类关系,根据预先设定的元素构成框架,需要补充的是元素“发生时间”或“具体比赛或战争名称”或“发生地点”,因此需要挖掘出哪一年、或哪一场比赛或者在哪个城市。
具体地对于这些元素构成框架中需要补充的元素的挖掘可以从挖掘所述选取的关联关系时保存的语素信息(比如时间、地点、原因、结果等状语)中获得所需要补充的元素;和/或,从挖掘所述选取的关联关系时使用的语句中获得所需要补充的元素。若仍挖掘不到,则不使用该关联关系生成推荐理由。
如图7所示,用户输入“颜良”,该方法推荐的相关实体为“关羽”,生成的所述相关实体“关羽”的推荐理由为“在大坯山一刀杀死颜良”,所述推荐的相关实体和推荐理由的具体获得过程如下所述:
用户输入搜索查询语句“颜良”,该方法提取出查询语句中的实体名称为“颜良”;
对语料库中的语句“在大坯山下颜良被关公突然袭击快马奔到面前一刀杀死的”经过语法语义分析后,得到的句法结构如图8所示。
根据得到的句法结构,进行相关实体对挖掘,提取语句句法结构中的子结构,如图9所示,子结构1的根节点为“杀死”,对应的子节点为“大坯山”、“颜良”、“关公”、“一刀”、等;子结构2的根节点为“奔到”,对应的子节点为“快马”、“面前”等;对提取到的子结构进行语句类型识别,发现子结构1为被字句,子结构2为正常语句。由于子结构是一个被字句,则真正主语是“被”字后面的实体(即依存关系上为依存于“被”的子节点)“关公”,“颜良”为“杀死”的宾语,调整句子结构保存;子结构2为正常语句则直接保存结果;由于两个子结构表示动作前后关系,不进行合并;例如从其他语句中还挖掘到“刘备杀死颜良”,通过挖掘到语料的网站质量(新闻网站质量高于贴吧等论坛网站)、网站数目(如挖掘到“关公杀死颜良”的数量远大于“刘备杀死颜良”的数量)等确定语句的可信性;最后,将验证通过的子结构作为相关实体对进行保存。
查询到用户输入“颜良”所对应的相关实体为“关羽”,以及“颜良”与所“关羽”的关联关系为“关公杀死颜良”;根据该类关系的元素构成框架,进行元素补充,在保存的相关实体对中挖掘已经保存的语素信息中获得所需要补充的元素,例如事件发生的时间、地点、原因、结果等状语。最终根据获得的关联关系“关公杀死颜良”以及元素补充,得到推荐的相关实体“关羽”相应的推荐理由为“在大坯山一刀杀死颜良”。
本发明实施例通过根据预先针对该选取的关联关系的类型设定的元素构成框架,确定该选取的关联关系所需要补充的元素,并在获得所需要补充的元素后对该选取的关联关系进行元素补充,以生成具有完整性的推荐理由,较完整的表达了用户输入的搜索查询语句中的实体与所推荐的相关实体之间的关系,从而避免推荐理由引起歧义或者由于时效性导致推荐理由不成立的情况发生,提高了为用户展现的推荐实体的推荐理由与用户输入搜索查询语句具有的关联性。
实施例五
图10为本发明实施例五提供的一种相关实体推荐方法的流程图,本实施例以上述实施例为基础进行优化。如图10所示,该方法具体包括如下操作:
510、接收用户输入的查询语句,提取出所述查询语句中包含的实体名称;
520、获得所述实体名称所对应实体的相关实体、以及所述实体名称所对应实体与所述相关实体的关联关系;
530、将获得的所述关联关系按照时间和/或重要度进行排序;
540、若所述实体名称所对应实体和/或所述相关实体为多义词,则将各关联关系中不符合需求的关联关系过滤掉;
550、根据排序结果选取至少一种关联关系,根据选取的关联关系生成对所述相关实体的推荐理由;
560、将所述相关实体和所述推荐理由进行展现。
如图1所示,为用户输入的搜索查询语句“爷们儿”推荐的相关实体是“宋佳”。如果通过挖掘语料库语句“宋佳喜欢较爷们儿的男人”,我们挖掘到了查询语句中的实体“爷们儿”和推荐的相关实体“宋佳”以及他们间的关联关系“喜欢”,通过上下文显然这里通过语料库语句挖掘出的“爷们儿”指的并不是用户搜索查询语句中所表达的含义,如果使用该关联关系“喜欢”进行推荐理由生成,则推荐理由是错误的。因此,若所述实体名称所对应实体和/或所述相关实体为多义词,则将各关联关系中不符合需求的关联关系过滤掉。
又例如,运动员李娜所在上下文更多的是网球、温网、澳网、美网等,歌手李娜上下文更多的是歌曲、青年大奖赛等,可通过上下文确定当前所述实体的含义,以确定所述实体名称所对应实体和/或所述相关实体。
本发明实施例通过在所述实体名称所对应实体和/或所述相关实体为多义词时,则将各关联关系中不符合需求的关联关系过滤掉,提高了为用户展现的推荐实体的推荐理由与用户输入搜索查询语句具有的关联性以及准确率。
实施例六
图11为本发明实施例六提供的一种相关实体推荐系统的结构示意图,该系统包括:
实体名称提取模块610,用于接收用户输入的查询语句,提取出所述查询语句中包含的实体名称;
相关实体及关联关系获取模块620,用于获得所述实体名称所对应实体的相关实体、以及所述实体名称所对应实体与所述相关实体的关联关系;
推荐理由生成模块630,用于根据所述关联关系生成对所述相关实体的推荐理由;
推荐理由展现模块640,用于将所述相关实体和所述推荐理由进行展现。
本发明实施例提供的相关实体推荐系统通过提取出所述查询语句中包含的实体名称;获得所述实体名称所对应实体的相关实体、以及所述实体名称所对应实体与所述相关实体的关联关系;根据所述实体名称所对应实体与所述相关实体的关联关系生成对所述相关实体的推荐理由,并将所述相关实体和所述推荐理由进行展现,解决了现有技术中展现的一些推荐实体的推荐理由仅与推荐实体本身相关,与用户搜索查询语句中的实体无关联的问题,实现了为用户展现的推荐实体的推荐理由与用户输入搜索查询语句具有关联,引起用户对推荐实体的兴趣,进而达到引导用户进行再次搜索的效果。
在上述实施例基础上,所述相关实体及关联关系获取模块,包括:相关实体对挖掘模块,用于预先利用语料库中的语句挖掘出的相关实体对;实体及关系查询模块,用于根据所述相关实体对查询所述实体名称所对应实体的相关实体、以及所述实体名称所对应实体与所述相关实体的关联关系。
进一步地,所述相关实体对挖掘模块,具体包括:
语法语义分析单元,用于对语料库中的语句进行语法语义分析,得到所述语句的句法结构;
相关实体对保存单元,用于根据所述语句的句法结构,获得所述语句中具有关联关系的实体,将该具有关联关系的实体以及所述关联关系作为相关实体对进行保存。
进一步地,所述相关实体对保存单元,具体包括:
子结构提取子单元,用于提取所述语句的句法结构中的子结构;
语句类型识别子单元,用于对提取到的子结构进行语句类型识别;
合理性验证子单元,用于根据语句类型识别结果,对提取到的子结构进行合并后对合并得到的子结构进行合理性验证,或者对提取到的子结构进行合理性验证;
相关实体对保存子单元,用于将验证通过的子结构作为相关实体对进行保存。
在上述实施例基础上,所述推荐理由生成模块,具体包括:
关联关系排序单元,用于将获得的所述相关实体与所述实体名称所对应实体的各关联关系按照时间和/或重要度进行排序;
关联关系选取单元,用于根据排序结果选取至少一种关联关系;
推荐理由生成单元,用于根据选取的关联关系生成对所述相关实体的推荐理由。
进一步地,所述关联关系选取单元,具体用于:根据排序结果选取最近时间和/或重要度最高的至少一种关联关系。
进一步地,所述关联关系包括动态事件关系和静态关系;
每种关联关系的重要度按照如下方法确定:
根据预先设定的关系类型与重要度的映射关系,确定当前关联关系的类型所对应的重要度。
在上述实施例基础上,所述推荐理由生成单元,具体用于:
根据预先针对该选取的关联关系的类型设定的元素构成框架,确定该选取的关联关系所需要补充的元素,并在获得所需要补充的元素后对该选取的关联关系进行元素补充,以生成具有完整性的推荐理由。
在上述实施例基础上,所述推荐理由生成模块,还包括:
过滤单元,用于当所述实体名称所对应实体和/或所述相关实体为多义词时,将各关联关系中不符合需求的关联关系过滤掉。
本发明实施例所提供的相关实体推荐系统可用于执行本发明任意实施例提供的相关实体推荐方法,具备相应的功能模块,实现相同的有益效果。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (18)
1.一种相关实体推荐方法,其特征在于,包括:
接收用户输入的查询语句,提取出所述查询语句中包含的实体名称;
获得所述实体名称所对应实体的相关实体、以及所述实体名称所对应实体与所述相关实体的关联关系;
根据所述关联关系生成对所述相关实体的推荐理由;
将所述相关实体和所述推荐理由进行展现。
2.根据权利要求1所述的方法,其特征在于,所述获得所述实体名称所对应实体的相关实体、以及所述实体名称所对应实体与所述相关实体的关联关系,具体包括:
根据预先利用语料库中的语句挖掘出的相关实体对,查询所述实体名称所对应实体的相关实体、以及所述实体名称所对应实体与所述相关实体的关联关系。
3.根据权利要求2所述的方法,其特征在于,所述利用语料库中的语句挖掘相关实体对,具体包括:
对语料库中的语句进行语法语义分析,得到所述语句的句法结构;
根据所述语句的句法结构,获得所述语句中具有关联关系的实体,将该具有关联关系的实体以及所述关联关系作为相关实体对进行保存。
4.根据权利要求3所述的方法,其特征在于,所述根据所述语句的句法结构,获得所述语句中具有直接关联关系的实体,将该具有直接关联关系的实体以及所述直接关联关系作为相关实体对进行保存,具体包括:
提取所述语句的句法结构中的子结构;
对提取到的子结构进行语句类型识别;
根据语句类型识别结果,对提取到的子结构进行合并后对合并得到的子结构进行合理性验证,或者对提取到的子结构进行合理性验证;
将验证通过的子结构作为相关实体对进行保存。
5.根据权利要求1-4中任一所述的方法,其特征在于,根据所述关联关系生成对所述相关实体的推荐理由,具体包括:
将获得的所述相关实体与所述实体名称所对应实体的各关联关系按照时间和/或重要度进行排序;
根据排序结果选取至少一种关联关系,根据选取的关联关系生成对所述相关实体的推荐理由。
6.根据权利要求5所述的方法,其特征在于,所述根据排序结果选取至少一种关联关系,具体包括:
根据排序结果选取最近时间和/或重要度最高的至少一种关联关系。
7.根据权利要求6所述的方法,其特征在于,所述关联关系包括动态事件关系和静态关系;
每种关联关系的重要度按照如下方法确定:
根据预先设定的关系类型与重要度的映射关系,确定当前关联关系的类型所对应的重要度。
8.根据权利要求5所述的方法,其特征在于,所述根据选取的关联关系生成对所述相关实体的推荐理由,具体包括:
根据预先针对该选取的关联关系的类型设定的元素构成框架,确定该选取的关联关系所需要补充的元素,并在获得所需要补充的元素后对该选取的关联关系进行元素补充,以生成具有完整性的推荐理由。
9.根据权利要求5所述的方法,其特征在于,在将所述各关联关系按照时间和/或重要度进行排序之后、根据排序结果选取至少一种关联关系之前,还包括:
若所述实体名称所对应实体和/或所述相关实体为多义词,则将各关联关系中不符合需求的关联关系过滤掉。
10.一种相关实体推荐系统,其特征在于,包括:
实体名称提取模块,用于接收用户输入的查询语句,提取出所述查询语句中包含的实体名称;
相关实体及关联关系获取模块,用于获得所述实体名称所对应实体的相关实体、以及所述实体名称所对应实体与所述相关实体的关联关系;
推荐理由生成模块,用于根据所述关联关系生成对所述相关实体的推荐理由;
推荐理由展现模块,用于将所述相关实体和所述推荐理由进行展现。
11.根据权利要求10所述的系统,其特征在于,所述相关实体及关联关系获取模块,包括:
相关实体对挖掘模块,用于预先利用语料库中的语句挖掘出相关实体对;
实体及关系查询模块,用于根据所述相关实体对查询所述实体名称所对应实体的相关实体、以及所述实体名称所对应实体与所述相关实体的关联关系。
12.根据权利要求11所述的系统,其特征在于,所述相关实体对挖掘模块,具体包括:
语法语义分析单元,用于对语料库中的语句进行语法语义分析,得到所述语句的句法结构;
相关实体对保存单元,用于根据所述语句的句法结构,获得所述语句中具有关联关系的实体,将该具有关联关系的实体以及所述关联关系作为相关实体对进行保存。
13.根据权利要求12所述的系统,其特征在于,所述相关实体对保存单元,具体包括:
子结构提取子单元,用于提取所述语句的句法结构中的子结构;
语句类型识别子单元,用于对提取到的子结构进行语句类型识别;
合理性验证子单元,用于根据语句类型识别结果,对提取到的子结构进行合并后对合并得到的子结构进行合理性验证,或者对提取到的子结构进行合理性验证;
相关实体对保存子单元,用于将验证通过的子结构作为相关实体对进行保存。
14.根据权利要求10-13中任一所述的系统,其特征在于,所述推荐理由生成模块,具体包括:
关联关系排序单元,用于将获得的所述相关实体与所述实体名称所对应实体的各关联关系按照时间和/或重要度进行排序;
关联关系选取单元,用于根据排序结果选取至少一种关联关系;
推荐理由生成单元,用于根据选取的关联关系生成对所述相关实体的推荐理由。
15.根据权利要求14所述的系统,其特征在于,所述关联关系选取单元,具体用于:
根据排序结果选取最近时间和/或重要度最高的至少一种关联关系。
16.根据权利要求15所述的系统,其特征在于,所述关联关系包括动态事件关系和静态关系;
每种关联关系的重要度按照如下方法确定:
根据预先设定的关系类型与重要度的映射关系,确定当前关联关系的类型所对应的重要度。
17.根据权利要求14所述的系统,其特征在于,所述推荐理由生成单元,具体用于:
根据预先针对该选取的关联关系的类型设定的元素构成框架,确定该选取的关联关系所需要补充的元素,并在获得所需要补充的元素后对该选取的关联关系进行元素补充,以生成具有完整性的推荐理由。
18.根据权利要求14所述的系统,其特征在于,所述推荐理由生成模块,还包括:
过滤单元,用于当所述实体名称所对应实体和/或所述相关实体为多义词时,将各关联关系中不符合需求的关联关系过滤掉。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410696289.5A CN104503978B (zh) | 2014-11-26 | 2014-11-26 | 一种相关实体推荐方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410696289.5A CN104503978B (zh) | 2014-11-26 | 2014-11-26 | 一种相关实体推荐方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104503978A true CN104503978A (zh) | 2015-04-08 |
CN104503978B CN104503978B (zh) | 2018-02-13 |
Family
ID=52945376
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410696289.5A Active CN104503978B (zh) | 2014-11-26 | 2014-11-26 | 一种相关实体推荐方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104503978B (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105095433A (zh) * | 2015-07-22 | 2015-11-25 | 百度在线网络技术(北京)有限公司 | 实体推荐方法及装置 |
CN105868255A (zh) * | 2015-12-25 | 2016-08-17 | 乐视网信息技术(北京)股份有限公司 | 查询推荐方法及装置 |
CN106168947A (zh) * | 2016-07-01 | 2016-11-30 | 北京奇虎科技有限公司 | 一种相关实体挖掘方法和系统 |
CN106326486A (zh) * | 2016-09-05 | 2017-01-11 | 北京百度网讯科技有限公司 | 基于人工智能的推送信息的方法和装置 |
CN106547887A (zh) * | 2016-10-27 | 2017-03-29 | 北京百度网讯科技有限公司 | 基于人工智能的搜索推荐方法和装置 |
CN106649750A (zh) * | 2016-12-26 | 2017-05-10 | 北京奇虎科技有限公司 | 针对多义项词条的搜索方法及装置 |
WO2017096883A1 (zh) * | 2015-12-09 | 2017-06-15 | 乐视控股(北京)有限公司 | 一种视频推荐方法和系统 |
CN107220865A (zh) * | 2017-04-11 | 2017-09-29 | 北京小度信息科技有限公司 | 对象推荐方法及装置 |
CN109165297A (zh) * | 2018-08-10 | 2019-01-08 | 新华智云科技有限公司 | 一种通用实体链接装置及方法 |
CN109886823A (zh) * | 2019-02-25 | 2019-06-14 | 北京奇艺世纪科技有限公司 | 一种社交圈的推荐方法及装置 |
CN110196947A (zh) * | 2019-05-31 | 2019-09-03 | 三角兽(北京)科技有限公司 | 推荐信息确定的方法、装置、电子设备及存储介质 |
CN111813828A (zh) * | 2020-06-30 | 2020-10-23 | 北京百度网讯科技有限公司 | 一种实体关系挖掘方法、装置、电子设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060074870A1 (en) * | 2004-09-30 | 2006-04-06 | Microsoft Corporation | Query graphs |
CN101140588A (zh) * | 2007-10-10 | 2008-03-12 | 华为技术有限公司 | 一种关联关系搜索结果的排序方法及装置 |
CN102708100A (zh) * | 2011-03-28 | 2012-10-03 | 北京百度网讯科技有限公司 | 挖掘相关实体词的关系关键词的方法和装置及其应用 |
-
2014
- 2014-11-26 CN CN201410696289.5A patent/CN104503978B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060074870A1 (en) * | 2004-09-30 | 2006-04-06 | Microsoft Corporation | Query graphs |
CN101140588A (zh) * | 2007-10-10 | 2008-03-12 | 华为技术有限公司 | 一种关联关系搜索结果的排序方法及装置 |
CN102708100A (zh) * | 2011-03-28 | 2012-10-03 | 北京百度网讯科技有限公司 | 挖掘相关实体词的关系关键词的方法和装置及其应用 |
Non-Patent Citations (1)
Title |
---|
寇月: ""Deep Web实体搜索的关键技术研究"", 《中国博士学位论文全文数据库信息利技辑》 * |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105095433B (zh) * | 2015-07-22 | 2019-07-05 | 百度在线网络技术(北京)有限公司 | 实体推荐方法及装置 |
CN105095433A (zh) * | 2015-07-22 | 2015-11-25 | 百度在线网络技术(北京)有限公司 | 实体推荐方法及装置 |
WO2017096883A1 (zh) * | 2015-12-09 | 2017-06-15 | 乐视控股(北京)有限公司 | 一种视频推荐方法和系统 |
CN105868255A (zh) * | 2015-12-25 | 2016-08-17 | 乐视网信息技术(北京)股份有限公司 | 查询推荐方法及装置 |
CN106168947A (zh) * | 2016-07-01 | 2016-11-30 | 北京奇虎科技有限公司 | 一种相关实体挖掘方法和系统 |
CN106326486A (zh) * | 2016-09-05 | 2017-01-11 | 北京百度网讯科技有限公司 | 基于人工智能的推送信息的方法和装置 |
CN106326486B (zh) * | 2016-09-05 | 2019-10-15 | 北京百度网讯科技有限公司 | 基于人工智能的推送信息的方法和装置 |
CN106547887A (zh) * | 2016-10-27 | 2017-03-29 | 北京百度网讯科技有限公司 | 基于人工智能的搜索推荐方法和装置 |
CN106547887B (zh) * | 2016-10-27 | 2020-04-07 | 北京百度网讯科技有限公司 | 基于人工智能的搜索推荐方法和装置 |
CN106649750A (zh) * | 2016-12-26 | 2017-05-10 | 北京奇虎科技有限公司 | 针对多义项词条的搜索方法及装置 |
CN106649750B (zh) * | 2016-12-26 | 2021-02-05 | 三六零科技集团有限公司 | 针对多义项词条的搜索方法及装置 |
CN107220865A (zh) * | 2017-04-11 | 2017-09-29 | 北京小度信息科技有限公司 | 对象推荐方法及装置 |
CN109165297A (zh) * | 2018-08-10 | 2019-01-08 | 新华智云科技有限公司 | 一种通用实体链接装置及方法 |
CN109886823A (zh) * | 2019-02-25 | 2019-06-14 | 北京奇艺世纪科技有限公司 | 一种社交圈的推荐方法及装置 |
CN110196947A (zh) * | 2019-05-31 | 2019-09-03 | 三角兽(北京)科技有限公司 | 推荐信息确定的方法、装置、电子设备及存储介质 |
CN111813828A (zh) * | 2020-06-30 | 2020-10-23 | 北京百度网讯科技有限公司 | 一种实体关系挖掘方法、装置、电子设备及存储介质 |
CN111813828B (zh) * | 2020-06-30 | 2024-02-27 | 北京百度网讯科技有限公司 | 一种实体关系挖掘方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN104503978B (zh) | 2018-02-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104503978A (zh) | 一种相关实体推荐方法和系统 | |
CN104484339B (zh) | 一种相关实体推荐方法和系统 | |
US11086883B2 (en) | Systems and methods for suggesting content to a writer based on contents of a document | |
KR101895249B1 (ko) | 지능 문답 구현 방법, 시스템 및 저장 매체 | |
Gattani et al. | Entity extraction, linking, classification, and tagging for social media: a wikipedia-based approach | |
Zhou et al. | An unsupervised framework of exploring events on twitter: Filtering, extraction and categorization | |
AU2017355420B2 (en) | Systems and methods for event detection and clustering | |
US9679558B2 (en) | Language modeling for conversational understanding domains using semantic web resources | |
JP6170023B2 (ja) | コンテンツ推薦装置、コンテンツ推薦方法及びコンテンツ推薦プログラム | |
US20090240674A1 (en) | Search Engine Optimization | |
CN111241282A (zh) | 文本主题生成方法、装置及电子设备 | |
US10482142B2 (en) | Information processing device, information processing method, and program | |
CN111581990A (zh) | 跨境交易撮合匹配方法及装置 | |
Jin et al. | MySpace video recommendation with map-reduce on qizmt | |
Qundus et al. | AI supported topic modeling using KNIME-workflows | |
Mahdi et al. | Job descriptions keyword extraction using attention based deep learning models with bert | |
Priyatam et al. | Seed selection for domain-specific search | |
CN104615705A (zh) | 网页质量检测方法及装置 | |
CN106168947A (zh) | 一种相关实体挖掘方法和系统 | |
Wasim et al. | Extracting and modeling user interests based on social media | |
CA2821164A1 (en) | System and method for analysing social network data | |
Kwak et al. | Interactive Story Maker: Tagged Video Retrieval System for Video Re-creation Service | |
Naik et al. | Tweet analytics and tweet summarization using graph mining | |
Kiomourtzis et al. | NOMAD: Linguistic Resources and Tools Aimed at Policy Formulation and Validation. | |
Jose et al. | A semantic graph based approach on interest extraction from user generated texts in social media |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |