CN107169010A - 一种推荐搜索关键词的确定方法及装置 - Google Patents

一种推荐搜索关键词的确定方法及装置 Download PDF

Info

Publication number
CN107169010A
CN107169010A CN201710209048.7A CN201710209048A CN107169010A CN 107169010 A CN107169010 A CN 107169010A CN 201710209048 A CN201710209048 A CN 201710209048A CN 107169010 A CN107169010 A CN 107169010A
Authority
CN
China
Prior art keywords
entity
determined
search
relation
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710209048.7A
Other languages
English (en)
Inventor
毋安安
帅伟良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing QIYI Century Science and Technology Co Ltd
Original Assignee
Beijing QIYI Century Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing QIYI Century Science and Technology Co Ltd filed Critical Beijing QIYI Century Science and Technology Co Ltd
Priority to CN201710209048.7A priority Critical patent/CN107169010A/zh
Publication of CN107169010A publication Critical patent/CN107169010A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3322Query formulation using system suggestions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例公开了一种推荐搜索关键词的确定方法及装置,所述方法包括:获得用户输入的目标搜索词;判断所述目标搜索词是否为实体;如果是,根据预先构建的表征实体间关系的知识图谱,确定与所述目标搜索词存在关系的实体;根据所确定出的实体,确定与所述目标搜索词对应的第一推荐搜索关键词。利用本发明实施例,提高了所给出的推荐搜索关键词与用户所输入关键词的信息关联性。

Description

一种推荐搜索关键词的确定方法及装置
技术领域
本发明涉及搜索技术领域,特别涉及一种推荐搜索关键词的确定方法及装置。
背景技术
在当今信息时代,互联网获得了快速发展,并为人们的生产生活提供了诸多便利,人们也越来越多利用互联网获取相应的服务。
目前,在用户使用搜索服务时,搜索结果页面会显示搜索结果,还会根据用户输入的搜索词,在搜索结果页面上给出“您还可以搜”的推荐搜索关键词。以视频网站为例,现有的推荐搜索关键词确定方法是在该用户的搜索日志中,对该用户session(会话)下的query(查询)行为,以及对同一个doc(document,文档)的点击query行为,进行挖掘得到的。
然而,现有的确定方法是基于用户的历史行为获取到的,并没有考虑当搜索词是自然语言中广泛存在的命名实体(简称“实体”,是指客观存在并可相互区别的事物)时,该搜索词与某些实体之间的重要关系,忽略了与该搜索词存在重要关系的那些实体,导致所给出的推荐搜索关键词与用户所输入关键词的信息关联性不高。例如,当搜索实体为“李晨”时,目前的“您还可以搜”的推荐搜索关键词并没有与“李晨”存在相当重要关系的实体“范冰冰”,而是基于用户历史行为所给出的推荐搜索关键词,这样导致所给出的推荐搜索关键词与用户所输入关键词的信息关联性不高,用户的搜索体验度也不高。
发明内容
本发明实施例的目的在于提供一种推荐搜索关键词的确定方法及装置,以提高所给出的推荐搜索关键词与用户所输入关键词的信息关联性。
为达到上述目的,本发明实施例公开了一种推荐搜索关键词的确定方法,方法包括:
获得用户输入的目标搜索词;
判断所述目标搜索词是否为实体;
如果是,根据预先构建的表征实体间关系的知识图谱,确定与所述目标搜索词存在关系的实体;
根据所确定出的实体,确定与所述目标搜索词对应的第一推荐搜索关键词。
可选地,预先构建表征实体间关系的知识图谱,包括:
根据数据库包含的不同类型实体和目标关系数据,构建表征实体间关系的知识图谱,其中,所述目标关系数据为所述数据库包含的实体间的关系数据,和/或,爬取的实体间的关系数据。
可选地,所述根据所确定出的实体,确定与所述目标搜索词对应的第一推荐搜索关键词的步骤,包括:
从所确定出的实体中选取符合预设推荐条件的实体;
将所选取出的实体确定为与所述目标搜索词对应的第一推荐搜索关键词。
可选地,所述从所确定出的实体中选取符合预设推荐条件的实体的步骤,包括:
计算所确定出的实体与所述目标搜索词所存在关系对应的相关性权重值;
从所确定出的实体中选取符合预设权重条件的实体,其中,所述预设权重条件为:所对应相关性权重值大于预设权重阈值。
可选地,所述从所确定出的实体中选取符合预设推荐条件的实体的步骤,包括:
统计所确定出的实体在预设时间段内的网络搜索值;其中,所述网络搜索值为:网络搜索热度或网络搜索频率;
从所确定出的实体中选取符合预设搜索值条件的实体,其中,所述预设搜索值条件为:所对应网络搜索值高于预设搜索值阈值。
可选地,所述实体为:
专辑实体、人物实体、影视剧实体或影视剧角色实体。
可选地,所述方法还包括:
在判断所述目标搜索词为实体的情况下,利用所述用户的历史搜索日志,确定所述目标搜索词对应的第二推荐搜索关键词。
为达到上述目的,本发明实施例公开了一种推荐搜索关键词的确定装置,装置包括:
获得模块,用于获得用户输入的目标搜索词;
判断模块,用于判断所述目标搜索词是否为实体;
第一确定模块,用于在判断所述目标搜索词为实体的情况下,根据预先构建的表征实体间关系的知识图谱,确定与所述目标搜索词存在关系的实体;
第二确定模块,用于根据所确定出的实体,确定与所述目标搜索词对应的第一推荐搜索关键词。
可选地,所述第一确定模块,具体用于:
根据数据库包含的不同类型实体和目标关系数据,构建表征实体间关系的知识图谱,其中,所述目标关系数据为所述数据库包含的实体间的关系数据,和/或,爬取的实体间的关系数据。
可选地,所述第二确定模块,包括:
选取单元,用于从所确定出的实体中选取符合预设推荐条件的实体;
确定单元,用于将所选取出的实体确定为与所述目标搜索词对应的第一推荐搜索关键词。
可选地,所述选取单元,具体用于:
计算所确定出的实体与所述目标搜索词所存在关系对应的相关性权重值;
从所确定出的实体中选取符合预设权重条件的实体,其中,所述预设权重条件为:所对应相关性权重值大于预设权重阈值。
可选地,所述选取单元,具体用于:
统计所确定出的实体在预设时间段内的网络搜索值;其中,所述网络搜索值为:网络搜索热度或网络搜索频率;
从所确定出的实体中选取符合预设搜索值条件的实体,其中,所述预设搜索值条件为:所对应网络搜索值高于预设搜索值阈值。
可选地,所述实体为:
专辑实体、人物实体、影视剧实体或影视剧角色实体。
可选地,所述装置还包括:
第三确定模块,用于在判断所述目标搜索词为实体的情况下,利用所述用户的历史搜索日志,确定所述目标搜索词对应的第二推荐搜索关键词。
由上述的技术方案可见,本发明实施例提供了一种推荐搜索关键词的确定方法及装置,获得用户输入的目标搜索词;判断所述目标搜索词是否为实体;如果是,根据预先构建的表征实体间关系的知识图谱,确定与所述目标搜索词存在关系的实体;根据所确定出的实体,确定与所述目标搜索词对应的第一推荐搜索关键词。
可见,在目标搜索词为实体时,通过知识图谱,确定与目标搜索词存在关系的实体,在根据所确定出的实体,确定第一推荐搜索关键词。而由于知识图谱表征有实体间的关系,因此,本方案在确定推荐搜索关键词时考虑了实体间的关系,这样,通过本方案提高了所给出的推荐搜索关键词与用户所输入关键词的信息关联性,并提高了用户的搜索体验度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的推荐搜索关键词的确定方法的一种流程示意图;
图2为本发明实施例提供的推荐搜索关键词的确定方法的另一种流程示意图;
图3为本发明实施例提供的推荐搜索关键词的确定装置的一种结构示意图;
图4为本发明实施例提供的推荐搜索关键词的确定装置的另一种结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面首先对本发明实施例提供的一种推荐搜索关键词的确定方法进行详细说明。
需要说明的是,本发明实施例所提供的一种推荐搜索关键词的确定方法可以应用于电子设备,其中,该电子设备可以为终端设备,如智能手机、平板电脑、台式电脑等等。
并且,实现本发明实施例所提供的一种推荐搜索关键词的确定方法的功能软件可以为具有搜索功能的程序软件中的插件,举例而言,该具有搜索功能的程序软件可以为浏览器、即时通讯类的客户端、网购类的客户端、娱乐类的客户端等等。
参见图1,图1为本发明实施例提供的推荐搜索关键词的确定方法的一种流程示意图,可以包括如下步骤:
S101,获得用户输入的目标搜索词;
示例性的,用户在网页的搜索框中输入一个目标搜索词“李晨”,从而就获得了该用户输入的目标搜索词“李晨”。
可以理解的是,目标搜索词的输入形式可以为文本输入,也可以语音输入,等等,这都是合理的。
S102,判断所述目标搜索词是否为实体;如果是,执行S103;
其中,在获得用户输入的目标搜索词后,可以判断目标搜索词是否为实体,并根据不同的判断结果,执行不同的步骤。具体的,在判断出该目标搜索词为实体时,可以执行S103;当判断出该目标搜索词不为实体时,可以利用所述用户的历史搜索日志,确定所述目标搜索词对应的推荐搜索关键词,其中,可以采用现有技术来实现:利用所述用户的历史搜索日志,确定所述目标搜索词对应的推荐搜索关键词。
具体的,所述实体可以为:专辑实体、人物实体、影视剧实体或影视剧角色实体。例如,实体可以为爸爸去哪儿(专辑实体)、李晨(人物实体)、琅琊榜(影视剧实体)或梅长苏(影视剧角色实体)。
需要强调的是,可以预先设定若干实体,在获得目标搜索词后,可以将目标搜索词与预先设定的若干实体进行匹配,根据匹配结果判定该目标搜索词是否为实体。
并且,可以理解的是,上述所给出的实体的具体类型仅仅作为示例,并不应该构成对本发明实施例的限定。
S103,根据预先构建的表征实体间关系的知识图谱,确定与所述目标搜索词存在关系的实体;
具体的,预先构建表征实体间关系的知识图谱,可以根据数据库包含的不同类型实体和目标关系数据,构建表征实体间关系的知识图谱,其中,所述目标关系数据为所述数据库包含的实体间的关系数据,和/或,爬取的实体间的关系数据。也就是,可以根据数据库包含的不同类型实体和实体间的关系数据,来构建表征实体间关系的知识图谱;也可以根据数据库包含的不同类型实体和实体间的关系数据,以及爬取的实体间的关系数据,来构建表征实体间关系的知识图谱;也可以根据数据库包含的不同类型实体,以及爬取的实体间的关系数据,来构建表征实体间关系的知识图谱。需要强调的是,无论知识图谱构建过程所利用的关系数据是数据库包含的关系数据,还是爬取的关系数据,所利用的关系数据至少涵盖:该数据库包含的不同类型实体对应的关系数据。
示例性的,可以根据数据库包含的专辑、视频等数据信息,以及从网站爬取的人物间关系数据、专辑间关系数据、影视剧间关系数据、影视剧角色间关系数据、人物与专辑间的关系数据、人物与影视剧间的关系数据和人物与影视剧角色间的关系数据等等,构建表征实体间关系的知识图谱。其中,构建表征实体间关系的知识图谱,为现有技术,本发明实施例对其不进行赘述。
示例性的,目标搜索词为实体A,在表征实体间关系的知识图谱中,查找到与实体A存在关系的实体为B、C、D、E、F和G,则可以将实体B、C、D、E、F和G确定为与目标搜索词即实体A存在关系的实体。
S104,根据所确定出的实体,确定与所述目标搜索词对应的第一推荐搜索关键词。
其中,在确定出与所述目标搜索词存在关系的实体后,在一种具体实现方式中,可以将所确定出的所有实体,确定为与所述目标搜索词对应的第一推荐搜索关键词。
需要说明的是,由于与目标搜索词存在关系的实体的数量可能比较多,而考虑到推荐搜索关键词显示区域的有限性,以及,数量过多而给用户带来的不便性等问题,可以对所确定出的实体进行筛选。基于该种处理思想,在另一种具体实现方式中,根据所确定出的实体,确定与所述目标搜索词对应的第一推荐搜索关键词,可以包括:从所确定出的实体中选取符合预设推荐条件的实体,将所选取出的实体确定为与所述目标搜索词对应的第一推荐搜索关键词。
可选地,在第一种实现方式中,从所确定出的实体中选取符合预设推荐条件的实体,可以包括:计算所确定出的实体与所述目标搜索词所存在关系对应的相关性权重值,从所确定出的实体中选取符合预设权重条件的实体,其中,所述预设权重条件为:所对应相关性权重值大于预设权重阈值。其中,在实际应用中,计算所确定出的实体与所述目标搜索词所存在关系对应的相关性权重值,为现有技术,本发明实施例在此不对其进行赘述。
示例性的,所确定出的实体为实体B、C、D、E、F和G,选取符合预设推荐条件的实体,可以首先计算出所确定出的实体B、C、D、E、F和G与目标搜索词A所存在关系对应的相关性权重值分别为b、c、d、e、f和g,其中,实体B、C和D所对应的相关性权重值b、c和d均大于预设权重阈值h。然后,从所确定出的实体中选取符合预设权重条件的实体,其中,所述预设权重条件为:所对应相关性权重值大于预设权重阈值,即选取符合预设权重条件的实体B、C和D,作为符合预设推荐条件的实体。进而,将所选取的符合预设推荐条件的实体B、C和D,确定为与目标搜索词对应的第一推荐搜索关键词。
示例性的,目标搜索词为实体“范冰冰”,与“范冰冰”存在关系的实体为男友“李晨”、好友“冯小刚”、好友“章子怡”、搭档“张馨予”、搭档“黄晓明”、绯闻男友“李治廷”。其中,“李晨”与“范冰冰”所存在的关系“男友”对应的相关性权重值为2.445,“冯小刚”与“范冰冰”所存在的关系“好友”对应的相关性权重值为2.209,“章子怡”与“范冰冰”所存在的关系“好友”对应的相关性权重值为2.1,“张馨予”与“范冰冰”所存在的关系“搭档”对应的相关性权重值为1.842,“黄晓明”与“范冰冰”所存在的关系“搭档”对应的相关性权重值为2.021,“李治廷”与“范冰冰”所存在的关系“绯闻男友”对应的相关性权重值为1.311。预设权重阈值设为2.0,则大于预设权重阈值的相关性权重值2.445、2.209、2.1和2.021,所对应的实体分别为“李晨”、“冯小刚”、“章子怡”和“黄晓明”,从而选取实体“李晨”、“冯小刚”、“章子怡”和“黄晓明”,作为符合预设推荐条件的实体。进而,将所选取的符合预设推荐条件的实体“李晨”、“冯小刚”、“章子怡”和“黄晓明”,确定为与目标搜索词对应的第一推荐搜索关键词。
可以理解的是,该知识图谱中不但可以记录有实体间的关系,而且可以记录关系对应的相关性权重;当然,知识图谱中可以仅仅记录实体间的关系,进而,在计算相关性权重值时,可以根据知识图谱中的关系所对应的属性值来计算,例如:知识图谱中通过连线来体现两个实体存在关系与否,而通过连线的长度来体现关系紧密度,两个实体间的连线越短表示关系越紧密,这样,在计算相关权重值时,可以根据实体间的连线的长度来计算相关性权重值。
可选地,在第二种实现方式中,从所确定出的实体中选取符合预设推荐条件的实体,可以包括:统计所确定出的实体在预设时间段内的网络搜索值;其中,所述网络搜索值为:网络搜索热度或网络搜索频率;从所确定出的实体中选取符合预设搜索值条件的实体,其中,所述预设搜索值条件为:所对应网络搜索值高于预设搜索值阈值。
示例性的,所确定出的与目标搜索词A存在关系的实体为实体B、C、D、E、F和G,从中选取符合预设推荐条件的实体,可以首先统计所确定出的实体B、C、D、E、F和G在预设时间段内的网络搜索值分别为l、m、n、o、p和q,其中,高于预设搜索值阈值i的网络搜索值为o、p和q,预设时间段为一周,网络搜索值为网络搜索热度或网络搜索频率。然后,从所确定出的实体中选取符合预设搜索值条件的实体,其中,所述预设搜索值条件为:所对应网络搜索值高于预设搜索值阈值,即选取符合预设搜索值条件的实体E、F和G,作为符合预设推荐条件的实体。进而,将所选取的符合预设推荐条件的实体E、F和G,确定为与目标搜索词对应的第一推荐搜索关键词。
示例性的,目标搜索词为实体“王宝强”,与“王宝强”存在关系的实体为前妻“马蓉”、原经纪人“宋喆”、好友“陈思诚”、搭档“邓超”和影视剧“士兵突击”。其中,“马蓉”在一周时间内的网络搜索值为5,“宋喆”在一周时间内的网络搜索值为4.1,“陈思诚”在一周时间内的网络搜索值为3,“邓超”在一周时间内的网络搜索值为2,“士兵突击”在一周时间内的网络搜索值为2。预设权重阈值设为4,则高于预设搜索值阈值的网络搜索值5和4,所对应的实体分别为“马蓉”和“宋喆”,从而选取实体“马蓉”和“宋喆”,作为符合预设推荐条件的实体。进而,将所选取的符合预设推荐条件的实体“马蓉”和“宋喆”,确定为与目标搜索词对应的第一推荐搜索关键词。另外,在确定与所述目标搜索词对应的第一推荐搜索关键词后,可以将所确定出的第一推荐搜索关键词进行输出。
可见,在目标搜索词为实体时,通过知识图谱,确定与目标搜索词存在关系的实体,在根据所确定出的实体,确定第一推荐搜索关键词。而由于知识图谱表征有实体间的关系,因此,本方案在确定推荐搜索关键词时考虑了实体间的关系,这样,通过本方案提高了所给出的推荐搜索关键词与用户所输入关键词的信息关联性,并提高了用户的搜索体验度。
参见图2,图2为本发明实施例提供的推荐搜索关键词的确定方法的另一种流程示意图,本发明图2所示实施例在本发明图1所示实施例的基础上,增加步骤S105:在判断所述目标搜索词为实体的情况下,利用所述用户的历史搜索日志,确定所述目标搜索词对应的第二推荐搜索关键词。
具体的,利用所述用户的历史搜索日志,确定所述目标搜索词对应的第二推荐搜索关键词,为现有技术,本发明实施例在此不对其进行赘述。
另外,在确定与所述目标搜索词对应的第二推荐搜索关键词后,可以将所确定出的第二推荐搜索关键词进行输出。可见,在目标搜索词为实体时,通过知识图谱,确定与目标搜索词存在关系的实体,在根据所确定出的实体,确定第一推荐搜索关键词。而由于知识图谱表征有实体间的关系,因此,本方案在确定推荐搜索关键词时考虑了实体间的关系,这样,通过本方案提高了所给出的推荐搜索关键词与用户所输入关键词的信息关联性,并提高了用户的搜索体验度。进一步地,还可以利用用户的历史搜索日志,确定第二推荐搜索关键词,提高推荐搜索关键词的丰富度。
相应于上述方法实施例,本发明实施例还提供了一种推荐搜索关键词的确定装置。
参见图3,图3为本发明实施例提供的推荐搜索关键词的确定装置的一种结构示意图,与图1所示的流程相对应,该确定装置可以包括:获得模块301、判断模块302、第一确定模块303和第二确定模块304。
获得模块301,用于获得用户输入的目标搜索词;
判断模块302,用于判断所述目标搜索词是否为实体;
第一确定模块303,用于在判断所述目标搜索词为实体的情况下,根据预先构建的表征实体间关系的知识图谱,确定与所述目标搜索词存在关系的实体;
第二确定模块304,用于根据所确定出的实体,确定与所述目标搜索词对应的第一推荐搜索关键词。
具体的,所述第一确定模块303,具体可以用于:
根据数据库包含的不同类型实体和目标关系数据,构建表征实体间关系的知识图谱,其中,所述目标关系数据为所述数据库包含的实体间的关系数据,和/或,爬取的实体间的关系数据。
具体的,所述第二确定模块304,可以包括:选取单元、确定单元(图中未示出);
选取单元,用于从所确定出的实体中选取符合预设推荐条件的实体;
确定单元,用于将所选取出的实体确定为与所述目标搜索词对应的第一推荐搜索关键词。
具体的,所述选取单元,具体可以用于:
计算所确定出的实体与所述目标搜索词所存在关系对应的相关性权重值;
从所确定出的实体中选取符合预设权重条件的实体,其中,所述预设权重条件为:所对应相关性权重值大于预设权重阈值。
具体的,所述选取单元,具体可以用于:
统计所确定出的实体在预设时间段内的网络搜索值;其中,所述网络搜索值为:网络搜索热度或网络搜索频率;
从所确定出的实体中选取符合预设搜索值条件的实体,其中,所述预设搜索值条件为:所对应网络搜索值高于预设搜索值阈值。
具体的,所述实体可以为:
专辑实体、人物实体、影视剧实体或影视剧角色实体。
可见,在目标搜索词为实体时,通过知识图谱,确定与目标搜索词存在关系的实体,在根据所确定出的实体,确定第一推荐搜索关键词。而由于知识图谱表征有实体间的关系,因此,本方案在确定推荐搜索关键词时考虑了实体间的关系,这样,通过本方案提高了所给出的推荐搜索关键词与用户所输入关键词的信息关联性,并提高了用户的搜索体验度。
参见图4,图4为本发明实施例提供的推荐搜索关键词的确定装置的另一种结构示意图,与图2所示的流程相对应,本发明图4所示实施例在本发明图3所示实施例的基础上,增加第三确定模块305,用于在判断所述目标搜索词为实体的情况下,利用所述用户的历史搜索日志,确定所述目标搜索词对应的第二推荐搜索关键词。
可见,在目标搜索词为实体时,通过知识图谱,确定与目标搜索词存在关系的实体,在根据所确定出的实体,确定第一推荐搜索关键词。而由于知识图谱表征有实体间的关系,因此,本方案在确定推荐搜索关键词时考虑了实体间的关系,这样,通过本方案提高了所给出的推荐搜索关键词与用户所输入关键词的信息关联性,并提高了用户的搜索体验度。进一步地,还可以利用用户的历史搜索日志,确定第二推荐搜索关键词,提高推荐搜索关键词的丰富度。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本领域普通技术人员可以理解实现上述方法实施方式中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以存储于计算机可读取存储介质中,这里所称得的存储介质,如:ROM/RAM、磁碟、光盘等。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (14)

1.一种推荐搜索关键词的确定方法,其特征在于,所述方法包括:
获得用户输入的目标搜索词;
判断所述目标搜索词是否为实体;
如果是,根据预先构建的表征实体间关系的知识图谱,确定与所述目标搜索词存在关系的实体;
根据所确定出的实体,确定与所述目标搜索词对应的第一推荐搜索关键词。
2.根据权利要求1所述的方法,其特征在于,预先构建表征实体间关系的知识图谱,包括:
根据数据库包含的不同类型实体和目标关系数据,构建表征实体间关系的知识图谱,其中,所述目标关系数据为所述数据库包含的实体间的关系数据,和/或,爬取的实体间的关系数据。
3.根据权利要求1所述的方法,其特征在于,所述根据所确定出的实体,确定与所述目标搜索词对应的第一推荐搜索关键词的步骤,包括:
从所确定出的实体中选取符合预设推荐条件的实体;
将所选取出的实体确定为与所述目标搜索词对应的第一推荐搜索关键词。
4.根据权利要求3所述的方法,其特征在于,所述从所确定出的实体中选取符合预设推荐条件的实体的步骤,包括:
计算所确定出的实体与所述目标搜索词所存在关系对应的相关性权重值;
从所确定出的实体中选取符合预设权重条件的实体,其中,所述预设权重条件为:所对应相关性权重值大于预设权重阈值。
5.根据权利要求3所述的方法,其特征在于,所述从所确定出的实体中选取符合预设推荐条件的实体的步骤,包括:
统计所确定出的实体在预设时间段内的网络搜索值;其中,所述网络搜索值为:网络搜索热度或网络搜索频率;
从所确定出的实体中选取符合预设搜索值条件的实体,其中,所述预设搜索值条件为:所对应网络搜索值高于预设搜索值阈值。
6.根据权利要求1所述的方法,其特征在于,所述实体为:
专辑实体、人物实体、影视剧实体或影视剧角色实体。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在判断所述目标搜索词为实体的情况下,利用所述用户的历史搜索日志,确定所述目标搜索词对应的第二推荐搜索关键词。
8.一种推荐搜索关键词的确定装置,其特征在于,所述装置包括:
获得模块,用于获得用户输入的目标搜索词;
判断模块,用于判断所述目标搜索词是否为实体;
第一确定模块,用于在判断所述目标搜索词为实体的情况下,根据预先构建的表征实体间关系的知识图谱,确定与所述目标搜索词存在关系的实体;
第二确定模块,用于根据所确定出的实体,确定与所述目标搜索词对应的第一推荐搜索关键词。
9.根据权利要求8所述的装置,其特征在于,所述第一确定模块,具体用于:
根据数据库包含的不同类型实体和目标关系数据,构建表征实体间关系的知识图谱,其中,所述目标关系数据为所述数据库包含的实体间的关系数据,和/或,爬取的实体间的关系数据。
10.根据权利要求8所述的装置,其特征在于,所述第二确定模块,包括:
选取单元,用于从所确定出的实体中选取符合预设推荐条件的实体;
确定单元,用于将所选取出的实体确定为与所述目标搜索词对应的第一推荐搜索关键词。
11.根据权利要求10所述的装置,其特征在于,所述选取单元,具体用于:
计算所确定出的实体与所述目标搜索词所存在关系对应的相关性权重值;
从所确定出的实体中选取符合预设权重条件的实体,其中,所述预设权重条件为:所对应相关性权重值大于预设权重阈值。
12.根据权利要求10所述的装置,其特征在于,所述选取单元,具体用于:
统计所确定出的实体在预设时间段内的网络搜索值;其中,所述网络搜索值为:网络搜索热度或网络搜索频率;
从所确定出的实体中选取符合预设搜索值条件的实体,其中,所述预设搜索值条件为:所对应网络搜索值高于预设搜索值阈值。
13.根据权利要求8所述的装置,其特征在于,所述实体为:
专辑实体、人物实体、影视剧实体或影视剧角色实体。
14.根据权利要求8所述的装置,其特征在于,所述装置还包括:
第三确定模块,用于在判断所述目标搜索词为实体的情况下,利用所述用户的历史搜索日志,确定所述目标搜索词对应的第二推荐搜索关键词。
CN201710209048.7A 2017-03-31 2017-03-31 一种推荐搜索关键词的确定方法及装置 Pending CN107169010A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710209048.7A CN107169010A (zh) 2017-03-31 2017-03-31 一种推荐搜索关键词的确定方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710209048.7A CN107169010A (zh) 2017-03-31 2017-03-31 一种推荐搜索关键词的确定方法及装置

Publications (1)

Publication Number Publication Date
CN107169010A true CN107169010A (zh) 2017-09-15

Family

ID=59849158

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710209048.7A Pending CN107169010A (zh) 2017-03-31 2017-03-31 一种推荐搜索关键词的确定方法及装置

Country Status (1)

Country Link
CN (1) CN107169010A (zh)

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107679039A (zh) * 2017-10-17 2018-02-09 北京百度网讯科技有限公司 用于确定语句意图的方法和装置
CN107958039A (zh) * 2017-11-21 2018-04-24 北京百度网讯科技有限公司 一种检索词纠错方法、装置及服务器
CN108763332A (zh) * 2018-05-10 2018-11-06 北京奇艺世纪科技有限公司 一种搜索提示词的生成方法和装置
CN108932317A (zh) * 2018-06-22 2018-12-04 赛飞特工程技术集团有限公司 基于知识图谱技术的安全环保行业知识搜索系统及方法
CN109189938A (zh) * 2018-08-31 2019-01-11 北京字节跳动网络技术有限公司 用于更新知识图谱的方法和装置
CN109241341A (zh) * 2018-05-09 2019-01-18 上海大学 一种基于知识图谱的影视择优推荐系统和方法
CN109271556A (zh) * 2018-08-31 2019-01-25 北京字节跳动网络技术有限公司 用于输出信息的方法和装置
CN109508390A (zh) * 2018-12-28 2019-03-22 北京金山安全软件有限公司 基于知识图谱的输入预测方法、装置和电子设备
CN109508391A (zh) * 2018-12-28 2019-03-22 北京金山安全软件有限公司 基于知识图谱的输入预测方法、装置和电子设备
CN109656385A (zh) * 2018-12-28 2019-04-19 北京金山安全软件有限公司 基于知识图谱的输入预测方法、装置和电子设备
CN109857872A (zh) * 2019-02-18 2019-06-07 浪潮软件集团有限公司 基于知识图谱的信息推荐方法和装置
CN109948073A (zh) * 2017-09-25 2019-06-28 腾讯科技(深圳)有限公司 内容检索方法、终端、服务器、电子设备及存储介质
CN109977142A (zh) * 2019-02-20 2019-07-05 北京明略软件系统有限公司 一种智能输入方法、系统、终端和存储介质
CN110209827A (zh) * 2018-02-07 2019-09-06 腾讯科技(深圳)有限公司 搜索方法、装置、计算机可读存储介质和计算机设备
CN110413751A (zh) * 2019-07-18 2019-11-05 腾讯科技(深圳)有限公司 药品搜索方法、装置、终端设备以及存储介质
CN110472018A (zh) * 2019-08-22 2019-11-19 子长科技(北京)有限公司 基于深度学习的信息处理方法、装置及计算机存储介质
CN110472019A (zh) * 2019-08-22 2019-11-19 北京明略软件系统有限公司 舆情搜索方法及装置
CN110750627A (zh) * 2018-07-19 2020-02-04 上海谦问万答吧云计算科技有限公司 一种素材的检索方法、装置、电子设备及存储介质
CN111414512A (zh) * 2020-03-02 2020-07-14 北京声智科技有限公司 一种基于语音搜索的资源推荐方法、装置及电子设备
CN112818222A (zh) * 2021-01-26 2021-05-18 吾征智能技术(北京)有限公司 一种基于知识图谱的个性化饮食推荐方法及系统
CN108829854B (zh) * 2018-06-21 2021-08-31 北京百度网讯科技有限公司 用于生成文章的方法、装置、设备和计算机可读存储介质
CN113505262A (zh) * 2021-08-17 2021-10-15 深圳华声医疗技术股份有限公司 超声图像搜索方法、装置、超声设备及存储介质
CN113836289A (zh) * 2021-08-16 2021-12-24 北京邮电大学 一种实体演进规律推荐方法及装置
CN114141384A (zh) * 2022-01-30 2022-03-04 北京欧应信息技术有限公司 用于检索医学数据的方法、设备和介质
WO2022088731A1 (zh) * 2020-11-02 2022-05-05 北京搜狗科技发展有限公司 一种数据处理方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104199875A (zh) * 2014-08-20 2014-12-10 百度在线网络技术(北京)有限公司 一种搜索推荐方法及装置
CN104598556A (zh) * 2015-01-04 2015-05-06 百度在线网络技术(北京)有限公司 搜索方法及装置
CN105095433A (zh) * 2015-07-22 2015-11-25 百度在线网络技术(北京)有限公司 实体推荐方法及装置
CN105653706A (zh) * 2015-12-31 2016-06-08 北京理工大学 一种基于文献内容知识图谱的多层引文推荐方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104199875A (zh) * 2014-08-20 2014-12-10 百度在线网络技术(北京)有限公司 一种搜索推荐方法及装置
CN104598556A (zh) * 2015-01-04 2015-05-06 百度在线网络技术(北京)有限公司 搜索方法及装置
CN105095433A (zh) * 2015-07-22 2015-11-25 百度在线网络技术(北京)有限公司 实体推荐方法及装置
CN105653706A (zh) * 2015-12-31 2016-06-08 北京理工大学 一种基于文献内容知识图谱的多层引文推荐方法

Cited By (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109948073A (zh) * 2017-09-25 2019-06-28 腾讯科技(深圳)有限公司 内容检索方法、终端、服务器、电子设备及存储介质
CN107679039B (zh) * 2017-10-17 2020-12-29 北京百度网讯科技有限公司 用于确定语句意图的方法和装置
CN107679039A (zh) * 2017-10-17 2018-02-09 北京百度网讯科技有限公司 用于确定语句意图的方法和装置
CN107958039A (zh) * 2017-11-21 2018-04-24 北京百度网讯科技有限公司 一种检索词纠错方法、装置及服务器
CN110209827A (zh) * 2018-02-07 2019-09-06 腾讯科技(深圳)有限公司 搜索方法、装置、计算机可读存储介质和计算机设备
CN110209827B (zh) * 2018-02-07 2023-09-19 腾讯科技(深圳)有限公司 搜索方法、装置、计算机可读存储介质和计算机设备
CN109241341A (zh) * 2018-05-09 2019-01-18 上海大学 一种基于知识图谱的影视择优推荐系统和方法
CN108763332A (zh) * 2018-05-10 2018-11-06 北京奇艺世纪科技有限公司 一种搜索提示词的生成方法和装置
CN108829854B (zh) * 2018-06-21 2021-08-31 北京百度网讯科技有限公司 用于生成文章的方法、装置、设备和计算机可读存储介质
CN108932317A (zh) * 2018-06-22 2018-12-04 赛飞特工程技术集团有限公司 基于知识图谱技术的安全环保行业知识搜索系统及方法
CN110750627A (zh) * 2018-07-19 2020-02-04 上海谦问万答吧云计算科技有限公司 一种素材的检索方法、装置、电子设备及存储介质
CN109271556B (zh) * 2018-08-31 2021-06-01 北京字节跳动网络技术有限公司 用于输出信息的方法和装置
CN109271556A (zh) * 2018-08-31 2019-01-25 北京字节跳动网络技术有限公司 用于输出信息的方法和装置
CN109189938A (zh) * 2018-08-31 2019-01-11 北京字节跳动网络技术有限公司 用于更新知识图谱的方法和装置
CN109508390A (zh) * 2018-12-28 2019-03-22 北京金山安全软件有限公司 基于知识图谱的输入预测方法、装置和电子设备
CN109508391B (zh) * 2018-12-28 2022-04-08 北京金山安全软件有限公司 基于知识图谱的输入预测方法、装置和电子设备
CN109656385A (zh) * 2018-12-28 2019-04-19 北京金山安全软件有限公司 基于知识图谱的输入预测方法、装置和电子设备
CN109508391A (zh) * 2018-12-28 2019-03-22 北京金山安全软件有限公司 基于知识图谱的输入预测方法、装置和电子设备
CN109857872A (zh) * 2019-02-18 2019-06-07 浪潮软件集团有限公司 基于知识图谱的信息推荐方法和装置
CN109977142A (zh) * 2019-02-20 2019-07-05 北京明略软件系统有限公司 一种智能输入方法、系统、终端和存储介质
CN110413751A (zh) * 2019-07-18 2019-11-05 腾讯科技(深圳)有限公司 药品搜索方法、装置、终端设备以及存储介质
CN110413751B (zh) * 2019-07-18 2023-11-07 腾讯科技(深圳)有限公司 药品搜索方法、装置、终端设备以及存储介质
CN110472019A (zh) * 2019-08-22 2019-11-19 北京明略软件系统有限公司 舆情搜索方法及装置
CN110472018A (zh) * 2019-08-22 2019-11-19 子长科技(北京)有限公司 基于深度学习的信息处理方法、装置及计算机存储介质
CN111414512A (zh) * 2020-03-02 2020-07-14 北京声智科技有限公司 一种基于语音搜索的资源推荐方法、装置及电子设备
WO2022088731A1 (zh) * 2020-11-02 2022-05-05 北京搜狗科技发展有限公司 一种数据处理方法及装置
CN112818222A (zh) * 2021-01-26 2021-05-18 吾征智能技术(北京)有限公司 一种基于知识图谱的个性化饮食推荐方法及系统
CN112818222B (zh) * 2021-01-26 2024-02-23 吾征智能技术(北京)有限公司 一种基于知识图谱的个性化饮食推荐方法及系统
CN113836289A (zh) * 2021-08-16 2021-12-24 北京邮电大学 一种实体演进规律推荐方法及装置
CN113505262A (zh) * 2021-08-17 2021-10-15 深圳华声医疗技术股份有限公司 超声图像搜索方法、装置、超声设备及存储介质
CN114141384A (zh) * 2022-01-30 2022-03-04 北京欧应信息技术有限公司 用于检索医学数据的方法、设备和介质

Similar Documents

Publication Publication Date Title
CN107169010A (zh) 一种推荐搜索关键词的确定方法及装置
US11861507B2 (en) Deriving semantic relationships based on empirical organization of content by users
CN105488233A (zh) 阅读信息推荐方法和系统
US20080270549A1 (en) Extracting link spam using random walks and spam seeds
CN108268617A (zh) 用户意图确定方法及装置
US20150347543A1 (en) Federated search
US11061893B2 (en) Multi-domain query completion
CN103607496A (zh) 一种推断手机用户兴趣爱好的方法、装置及手机终端
CN104503988B (zh) 搜索方法及装置
CN107704560A (zh) 一种信息推荐的方法、装置及设备
CN103678302B (zh) 一种文档结构化组织方法及装置
CN106407362A (zh) 一种关键词信息检索的方法及装置
CN105389330A (zh) 一种跨社区开源资源匹配关联方法
CN103262079B (zh) 检索装置及检索方法
CN110502680A (zh) 一种中标公告相关字段的抽取方法及装置
Zeng et al. A Personalized Dense Retrieval Framework for Unified Information Access
Wasim et al. Extracting and modeling user interests based on social media
WO2017074498A1 (en) System and method for returning prioritized content
Zhang et al. Personalized book recommender system based on Chinese library classification
Djuana et al. Personalization in tag ontology learning for recommendation making
Goyal et al. Concept based query recommendation
Pongnumkul et al. Random walk-based recommendation with restart using social information and bayesian transition matrices
CN113901056A (zh) 接口推荐方法、装置及电子设备
CN108959579A (zh) 一种获取用户和文档个性化特征的系统
Zhou et al. From popularity to personality—a heuristic music recommendation method for niche market

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170915