CN106649750B - 针对多义项词条的搜索方法及装置 - Google Patents

针对多义项词条的搜索方法及装置 Download PDF

Info

Publication number
CN106649750B
CN106649750B CN201611219174.2A CN201611219174A CN106649750B CN 106649750 B CN106649750 B CN 106649750B CN 201611219174 A CN201611219174 A CN 201611219174A CN 106649750 B CN106649750 B CN 106649750B
Authority
CN
China
Prior art keywords
search
meaning
term
similarity
term entry
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201611219174.2A
Other languages
English (en)
Other versions
CN106649750A (zh
Inventor
王智广
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
3600 Technology Group Co ltd
Original Assignee
3600 Technology Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 3600 Technology Group Co Ltd filed Critical 3600 Technology Group Co Ltd
Priority to CN201611219174.2A priority Critical patent/CN106649750B/zh
Publication of CN106649750A publication Critical patent/CN106649750A/zh
Application granted granted Critical
Publication of CN106649750B publication Critical patent/CN106649750B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种针对多义项词条的搜索方法及装置。所述方法包括:接收到以多义项词条作为搜索关键词进行搜索的搜索请求;根据所述搜索请求进行搜索,获得所述多义项词条对应的搜索结果;获取所述多义项词条对应的搜索推荐数据,并将所述搜索推荐数据与所述多义项词条的各不同含义分别进行匹配,得到所述搜索推荐数据与所述各不同含义之间的相似度;根据所述相似度确定所述多义项词条在本次搜索中的主义项;从所述搜索结果中筛选出与所述主义项对应的子搜索结果,并将与所述主义项对应的子搜索结果显示在搜索结果页面。该技术方案使得搜索引擎能够为用户提供多义项词条在本次搜索中的主义项对应的子搜索结果项,提高用户对搜索引擎的使用体验。

Description

针对多义项词条的搜索方法及装置
技术领域
本发明涉及互联网技术领域,特别是涉及一种针对多义项词条的搜索方法及装置。
背景技术
百科词条中存在许多具有多种不同含义的词条,这种词条可称之为多义项词条。例如,词条“刘晓华”具有多种不同的含义,其中最知名的就是大家熟知的香港男演员、歌手,但该词条还存在其他的含义,如XX大学一个教授的姓名也是“刘晓华”,另外还有一本书的名称也叫“刘晓华”,等等。因此,词条“刘晓华”至少具有歌手演员、XX大学教授、书籍这三个含义,词条“刘晓华”是一个多义项词条。
用户在百科或其他搜索引擎中搜索上述类型的多义项词条时,应该向用户提供哪个含义的多义项词条是个问题。仍以上述的多义项词条“刘晓华”为例,假设用户想要搜索名称为“刘晓华”的书籍,如果搜索引擎向用户提供的是歌手演员“刘晓华”对应的搜索结果,就会导致用户无法获取到想要查看的内容,或者需要在大量搜索结果中手动查找名称为“刘晓华”的书籍对应的搜索结果,从而浪费用户大量的时间和精力,使用搜索引擎的体验度也较低。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的针对多义项词条的搜索方法及装置。
依据本发明的一个方面,提供了一种针对多义项词条的搜索方法,包括:
接收到以多义项词条作为搜索关键词进行搜索的搜索请求,所述多义项词条指具有多种不同含义的同一词条;
根据所述搜索请求进行搜索,获得所述多义项词条对应的搜索结果,所述搜索结果包括基于所述多义项词条的各不同含义搜索时分别对应的子搜索结果;
获取所述多义项词条对应的搜索推荐数据,并将所述搜索推荐数据与所述多义项词条的各不同含义分别进行匹配,得到所述搜索推荐数据与所述各不同含义之间的相似度;
根据所述相似度确定所述多义项词条在本次搜索中的主义项;
从所述搜索结果中筛选出与所述主义项对应的子搜索结果,并将与所述主义项对应的子搜索结果显示在搜索结果页面。
可选地,所述搜索推荐数据包括以下至少一项:
历史搜索数据;
热点搜索数据。
可选地,获取所述多义项词条对应的搜索推荐数据,包括:
获取对所述多义项词条进行搜索时搜索框的下拉列表中的相关搜索数据;
将所述下拉列表中的相关搜索数据确定为所述多义项词条对应的搜索推荐数据。
可选地,将所述搜索推荐数据与所述多义项词条的各不同含义分别进行匹配,得到所述搜索推荐数据与所述各不同含义之间的相似度,包括:
获取所述搜索推荐数据中除所述多义项词条之外的多元素所组成的元素集合;
分别计算所述元素集合和所述各含义之间的相似度;
确定所述元素集合和所述各含义之间的相似度为所述搜索推荐数据与所述各含义之间的相似度。
可选地,分别计算所述元素集合和所述各含义之间的相似度,包括:
统计所述各含义对应的子搜索结果中包含所述多元素的数目;
根据所述数目计算所述元素集合和所述各含义之间的相似度,其中,所述相似度与所述子搜索结果中包含所述多元素的数目成正比。
可选地,根据所述相似度确定所述多义项词条在本次搜索中的主义项,包括:
选择与所述搜索推荐数据之间相似度最高的含义;
将具备该含义的多义项词条确定为所述多义项词条在本次搜索中的主义项。
可选地,根据所述相似度确定所述多义项词条在本次搜索中的主义项,包括:
统计针对所述多义项词条进行搜索的各历史搜索结果对应的访问率;
结合所述相似度以及所述访问率确定所述多义项词条在本次搜索中的主义项。
可选地,结合所述相似度以及所述访问率确定所述多义项词条在本次搜索中的主义项,包括:
根据所述相似度确定所述多义项词条的至少两个备选含义;
筛选出所述访问率最高的历史搜索结果;
确定所述访问率最高的历史搜索结果与各备选含义之间的匹配度;
选择所述匹配度最高值对应的备选含义,并确定具备该备选含义的多义项词条为所述多义项词条在本次搜索中的主义项。
依据本发明的另一个方面,提供了一种针对多义项词条的搜索装置,包括:
接收模块,适于接收到以多义项词条作为搜索关键词进行搜索的搜索请求,所述多义项词条指具有多种不同含义的同一词条;
搜索模块,适于根据所述搜索请求进行搜索,获得所述多义项词条对应的搜索结果,所述搜索结果包括基于所述多义项词条的各不同含义搜索时分别对应的子搜索结果;
匹配模块,适于获取所述多义项词条对应的搜索推荐数据,并将所述搜索推荐数据与所述多义项词条的各不同含义分别进行匹配,得到所述搜索推荐数据与所述各不同含义之间的相似度;
确定模块,适于根据所述相似度确定所述多义项词条在本次搜索中的主义项;
显示模块,适于从所述搜索结果中筛选出与所述主义项对应的子搜索结果,并将与所述主义项对应的子搜索结果显示在搜索结果页面。
可选地,所述搜索推荐数据包括以下至少一项:
历史搜索数据;
热点搜索数据。
可选地,所述匹配模块还适于:
获取对所述多义项词条进行搜索时搜索框的下拉列表中的相关搜索数据;
将所述下拉列表中的相关搜索数据确定为所述多义项词条对应的搜索推荐数据。
可选地,所述匹配模块还适于:
获取所述搜索推荐数据中除所述多义项词条之外的多元素所组成的元素集合;
分别计算所述元素集合和所述各含义之间的相似度;
确定所述元素集合和所述各含义之间的相似度为所述搜索推荐数据与所述各含义之间的相似度。
可选地,所述匹配模块还适于:
统计所述各含义对应的子搜索结果中包含所述多元素的数目;
根据所述数目计算所述元素集合和所述各含义之间的相似度,其中,所述相似度与所述子搜索结果中包含所述多元素的数目成正比。
可选地,所述确定模块还适于:
选择与所述搜索推荐数据之间相似度最高的含义;
将具备该含义的多义项词条确定为所述多义项词条在本次搜索中的主义项。
可选地,所述确定模块还适于:
统计针对所述多义项词条进行搜索的各历史搜索结果对应的访问率;
结合所述相似度以及所述访问率确定所述多义项词条在本次搜索中的主义项。
可选地,所述确定模块还适于:
根据所述相似度确定所述多义项词条的至少两个备选含义;
筛选出所述访问率最高的历史搜索结果;
确定所述访问率最高的历史搜索结果与各备选含义之间的匹配度;
选择所述匹配度最高值对应的备选含义,并确定具备该备选含义的多义项词条为所述多义项词条在本次搜索中的主义项。
采用本发明实施例提供的技术方案,能够在接收到以多义项词条为搜索关键词的搜索请求时,获取多义项词条对应的搜索推荐数据,并将搜索推荐数据与多义项词条的不同含义分别进行匹配,以得到搜索推荐数据与各不同含义之间的相似度,进而根据该相似度确定多义项词条在本次搜索中的主义项,使得在对多义项词条进行搜索时能够准确确定出其主义项,排除主义项之外的其他含义,避免因同一词条具有多个不同含义时无法准确进行搜索的情况。并且,该技术方案还能够从与多义项词条对应的搜索结果中筛选出与其主义项对应的子搜索结果,并将筛选出的子搜索结果显示在搜索结果页面,使得搜索引擎能够为用户提供多义项词条在本次搜索中的主义项对应的子搜索结果项,而并非提供多义项词条在多个不同含义下的所有搜索结果,因此无需用户在所有搜索结果中查找对自己有用的搜索结果,从而为用户节省大量时间。也并非提供多义项词条在除主义项之外的其他含义下的搜索结果,因此避免了为用户提供错误搜索结果的情况,提高用户对搜索引擎的使用体验。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
根据下文结合附图对本发明具体实施例的详细描述,本领域技术人员将会更加明了本发明的上述以及其他目的、优点和特征。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1是根据本发明一个实施例的一种针对多义项词条的搜索方法的示意性流程图;
图2是根据本发明一具体实施例的一种针对多义项词条的搜索方法的示意性流程图;
图3是根据本发明一个实施例的一种针对多义项词条的搜索装置的示意性框图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
图1是根据本发明一个实施例的一种针对多义项词条的搜索方法的示意性流程图。如图1所示,该方法一般性地可包括以下步骤S101-S105:
步骤S101,接收到以多义项词条作为搜索关键词进行搜索的搜索请求,多义项词条指具有多种不同含义的同一词条。
步骤S102,根据搜索请求进行搜索,获得多义项词条对应的搜索结果,搜索结果包括基于多义项词条的各不同含义搜索时分别对应的子搜索结果。
步骤S103,获取多义项词条对应的搜索推荐数据,并将搜索推荐数据与多义项词条的各不同含义分别进行匹配,得到搜索推荐数据与各不同含义之间的相似度。
步骤S104,根据相似度确定多义项词条在本次搜索中的主义项。
步骤S105,从搜索结果中筛选出与主义项对应的子搜索结果,并将与主义项对应的子搜索结果显示在搜索结果页面。
采用本发明实施例提供的技术方案,能够在接收到以多义项词条为搜索关键词的搜索请求时,获取多义项词条对应的搜索推荐数据,并将搜索推荐数据与多义项词条的不同含义分别进行匹配,以得到搜索推荐数据与各不同含义之间的相似度,进而根据该相似度确定多义项词条在本次搜索中的主义项,使得在对多义项词条进行搜索时能够准确确定出其主义项,排除主义项之外的其他含义,避免因同一词条具有多个不同含义时无法准确进行搜索的情况。并且,该技术方案还能够从与多义项词条对应的搜索结果中筛选出与其主义项对应的子搜索结果,并将筛选出的子搜索结果显示在搜索结果页面,使得搜索引擎能够为用户提供多义项词条在本次搜索中的主义项对应的子搜索结果项,而并非提供多义项词条在多个不同含义下的所有搜索结果,因此无需用户在所有搜索结果中查找对自己有用的搜索结果,从而为用户节省大量时间。也并非提供多义项词条在除主义项之外的其他含义下的搜索结果,因此避免了为用户提供错误搜索结果的情况,提高用户对搜索引擎的使用体验。
以下针对上述步骤S101-S105进行详细说明。
首先执行步骤S101,即接收到以多义项词条作为搜索关键词进行搜索的搜索请求,多义项词条指具有多种不同含义的同一词条。例如,对于词条“云端”包括至少两种含义,其中一种含义是大自然中的云端,即云上、云中,另一种含义则是互联网中的网云端,例如云端服务器。由于词条“云端”具有至少两种不同含义,因此词条“云端”为多义项词条。再例如,对于词条“刘晓华”包括至少三种含义,其中一种含义是我们所熟识的香港男演员/歌手,另一种含义是某大学一个教授,再一种含义则是一本书。由于词条“刘晓华”具有至少三种不同含义,因此词条“刘晓华”为多义项词条。
然后执行步骤S102,即根据搜索请求进行搜索,获得多义项词条对应的搜索结果,该搜索结果包括基于多义项词条的各不同含义搜索时分别对应的子搜索结果。例如,以多义项词条“刘晓华”为搜索关键词进行搜索之后,获得与多义项词条“刘晓华”对应的搜索结果,其中包括与香港男演员/歌手“刘晓华”相关的搜索结果A、与某大学教授“刘晓华”相关的搜索结果B以及与书《刘晓华》相关的搜索结果C。其中,搜索结果A、搜索结果B以及搜索结果C均为与多义项词条“刘晓华”对应的搜索结果的子搜索结果。
在获取到搜索结果之后,继续执行步骤S103,即获取多义项词条对应的搜索推荐数据,并将搜索推荐数据与多义项词条的各不同含义分别进行匹配,得到搜索推荐数据与各不同含义之间的相似度。其中,搜索推荐数据包括历史搜索数据和/或热点搜索数据。
在搜索框内输入关键词条后,通常会在搜索框的下拉列表中显示历史搜索数据和/或热点搜索数据。因此,在一个实施例中,可通过如下步骤获取多义项词条对应的搜索推荐数据:首先,获取对多义项词条进行搜索时搜索框的下拉列表中的相关搜索数据;其次,将下拉列表中的相关搜索数据确定为多义项词条对应的搜索推荐数据。例如,在搜索框内输入多义项词条“云端”时,搜索引擎就会通过搜索框的下拉列表为用户提供多个相关搜索数据,包括“云端学习”、“云端软件平台”、“云端备份”、“云端网盘”、“云端登录”、“云端下载”以及“云端的月亮”。那么,这些相关搜索数据即为多义项词条“云端”对应的搜索推荐数据。
获取到多义项词条对应的搜索推荐数据之后,可通过以下步骤确定搜索推荐数据与多义项词条的各不同含义之间的相似度:
步骤一、获取搜索推荐数据中除多义项词条之外的多元素所组成的元素集合。以多义项词条“云端”为例,由于多义项词条“云端”对应的搜索推荐数据包括“云端学习”、“云端软件平台”、“云端备份”、“云端网盘”、“云端登录”、“云端下载”以及“云端的月亮”,因此筛除多义项词条“云端”后,可确定出由多元素组成的元素集合包括“学习、软件平台、备份、网盘、登录、下载、月亮”。
步骤二、分别计算元素集合和各含义之间的相似度。具体地,在计算元素集合和各含义之间的相似度时,可首先统计各含义对应的子搜索结果中包含多元素的数目,然后根据该数目计算元素集合和各含义之间的相似度,其中,相似度与子搜索结果中包含多元素的数目成正比。即,子搜索结果中包含多元素的数目越多,该子搜索结果对应的含义与元素集合的相似度就越高;反之,子搜索结果中包含多元素的数目越少,该子搜索结果对应的含义与元素集合的相似度就越低。
步骤三、确定元素集合和各含义之间的相似度为搜索推荐数据与各含义之间的相似度。
在确定出搜索推荐数据与多义项词条的各不同含义之间的相似度之后,继续执行步骤S104,即根据相似度确定多义项词条在本次搜索中的主义项。该步骤中,根据相似度确定多义项词条在本次搜索中的主义项的方法有多种,以下详细说明几种最为有效方便的方法。
在一个实施例中,可通过以下步骤确定多义项词条在本次搜索中的主义项:首先,选择与搜索推荐数据之间相似度最高的含义;其次,将具备该含义的多义项词条确定为多义项词条在本次搜索中的主义项。例如,多义项词条“云端”包括“大自然中的云端”和“互联网中的网云端”两种含义,假设多义项词条“云端”对应的搜索推荐数据与含义“大自然中的云端”的相似度为20%,与含义“互联网中的网云端”的相似度为80%,由于与搜索推荐数据之间相似度最高的含义为“互联网中的网云端”,因此具备含义“互联网中的网云端”的多义项词条“云端”为本次搜索的主义项。
在一个实施例中,还可通过以下步骤确定多义项词条在本次搜索中的主义项:首先,统计针对多义项词条进行搜索的各历史搜索结果对应的访问率;其次,结合相似度以及访问率确定多义项词条在本次搜索中的主义项。具体地,结合相似度以及访问率确定多义项词条在本次搜索中的主义项的步骤可包括以下步骤:首先,根据相似度确定多义项词条的至少两个备选含义;其次,筛选出访问率最高的历史搜索结果,并确定访问率最高的历史搜索结果与各备选含义之间的匹配度;再次,选择匹配度最高值对应的备选含义,并确定具备该备选含义的多义项词条为多义项词条在本次搜索中的主义项。本实施例提供的这种确定主义项的方法可适用于与搜索推荐数据之间相似度最高的含义包括多个的情况。
例如,多义项词条“刘晓华”包括“香港男演员/歌手”、“大学教授”以及“书名”三个含义,假设多义项词条“刘晓华”对应的搜索推荐数据与含义“香港男演员/歌手”之间的相似度为60%,与含义“大学教授”之间的相似度也为60%,与含义“书名”之间的相似度为20%,由于相似度最高的含义包括两个,因此这种情况下仅根据相似度无法准确确定多义项词条“刘晓华”在本次搜索中的主义项。首先确定含义“香港男演员/歌手”与含义“大学教授”为备选含义,然后筛选出针对多义项词条“刘晓华”进行搜索的历史搜索结果中访问率最高的历史搜索结果,假设访问率最高的历史搜索结果为“刘晓华演唱会”,显然,历史搜索结果“刘晓华演唱会”与含义“香港男演员/歌手”之间的匹配度较高,因此可确定具备含义“香港男演员/歌手”的多义项词条“刘晓华”为本次搜索的主义项。
确定多义项词条在本次搜索中的主义项之后,继续执行步骤S105,即从搜索结果中筛选出与主义项对应的子搜索结果,并将与主义项对应的子搜索结果显示在搜索结果页面。即,搜索结果页面不再是显示与多义项词条相关的所有搜索结果,而是仅显示与主义相对应的子搜索结果,或者将与主义项相对应的子搜索结果显示在所有搜索结果的前面,而其他子搜索结果则显示在与主义项相对应的子搜索结果之后。
以下通过一具体实施例来说明本发明提供的针对多义项词条的搜索方法。
图2是根据本发明一具体实施例的一种针对多义项词条的搜索方法的示意性流程图。本实施例中,以多义项词条“云端”进行详细说明。如图2所示,该方法可包括以下步骤S201-S207:
步骤S201,接收到以多义项词条作为搜索关键词进行搜索的搜索请求。
例如,以多义项词条“云端”作为搜索关键词进行搜索,多义项词条“云端”包括“大自然中的云端”和“互联网中的网云端”两种含义。
步骤S202,根据搜索请求进行搜索,获得多义项词条对应的搜索结果,该搜索结果包括基于多义项词条的各不同含义搜索时分别对应的子搜索结果。
例如,在与多义项词条“云端”对应的搜索结果中,包括与含义“大自然中的云端”相对应的子搜索结果A以及与含义“互联网中的网云端”相对应的子搜索结果B。
步骤S203,获取对多义项词条进行搜索时搜索框的下拉列表中的相关搜索数据,并确定该相关搜索数据为搜索推荐数据。
例如,在搜索框内输入多义项词条“云端”时,搜索引擎就会通过搜索框的下拉列表为用户提供多个相关搜索数据,包括“云端学习”、“云端软件平台”、“云端备份”、“云端网盘”、“云端登录”、“云端下载”以及“云端的月亮”。那么,这些相关搜索数据即为多义项词条“云端”对应的搜索推荐数据。
步骤S204,获取搜索推荐数据中除多义项词条之外的多元素所组成的元素集合。
例如,由于多义项词条“云端”对应的搜索推荐数据包括“云端学习”、“云端软件平台”、“云端备份”、“云端网盘”、“云端登录”、“云端下载”以及“云端的月亮”,因此筛除多义项词条“云端”后,可确定出由多元素组成的元素集合包括“学习、软件平台、备份、网盘、登录、下载、月亮”。
步骤S205,分别计算元素集合和各含义之间的相似度,并确定该相似度为搜索推荐数据与各含义之间的相似度。
在计算元素集合和各含义之间的相似度时,可首先统计各含义对应的子搜索结果中包含元素集合中的多元素的数目,然后根据该数目计算元素集合和各含义之间的相似度,其中,相似度与子搜索结果中包含多元素的数目成正比。即,子搜索结果中包含多元素的数目越多,该子搜索结果对应的含义与元素集合的相似度就越高;反之,子搜索结果中包含多元素的数目越少,该子搜索结果对应的含义与元素集合的相似度就越低。具体地,可通过计算各子搜索结果中包含多元素的数目在总数目中的比例来计算元素集合和各含义之间的相似度。例如,假设含义“大自然中的云端”对应的子搜索结果A中包含多元素的数目为N1,含义“互联网中的网云端”对应的子搜索结果B中包含多元素的数目为N2,其中,N1<N2。N1/(N1+N2)即为搜索推荐数据与含义“大自然中的云端”之间的相似度,N2/(N1+N2)即为搜索推荐数据与含义“互联网中的网云端”之间的相似度。
步骤S206,选择与搜索推荐数据之间相似度最高的含义,并将具备该含义的多义项词条确定为多义项词条在本次搜索中的主义项。
例如,N1/(N1+N2)即为搜索推荐数据与含义“大自然中的云端”之间的相似度,N2/(N1+N2)即为搜索推荐数据与含义“互联网中的网云端”之间的相似度。由于N1<N2,因此N1/(N1+N2)<N2/(N1+N2),因此与搜索推荐数据之间相似度最高的含义为“互联网中的网云端”,具备含义“互联网中的网云端”的多义项词条“云端”为本次搜索的主义项。
步骤S207,从搜索结果中筛选出与主义项对应的子搜索结果,并将与主义项对应的子搜索结果显示在搜索结果页面。
例如,由于具备含义“互联网中的网云端”的多义项词条“云端”为本次搜索的主义项,且含义“互联网中的网云端”对应的子搜索结果为子搜索结果B,因此从搜索结果中筛选出子搜索结果B,并将子搜索结果B显示在搜索结果页面。在具体实施例中,可在搜索结果页面上仅显示子搜索结果B,而不显示子搜索结果A;也可将子搜索结果B显示在搜索结果页面的最前位置,而将子搜索结果A显示在子搜索结果B之后,例如,搜索结果页面的前10页显示子搜索结果B,从第11页开始再显示子搜索结果A。
由上述具体实施例可知,采用本发明提供的针对多义项词条的搜索方法,在针对多义项词条进行搜索时,搜索结果页面上不再是提供多义项词条在多个不同含义下的所有搜索结果,也不再是提供多义项词条在除主义项之外的其他含义下的搜索结果,而是优先为用户提供多义项词条在本次搜索中的主义项对应的子搜索结果项,因此无需用户在所有搜索结果中查找对自己有用的搜索结果,从而为用户节省大量时间,且避免了为用户提供错误搜索结果的情况,提高用户对搜索引擎的使用体验。
图3是根据本发明一个实施例的一种针对多义项词条的搜索装置的示意性框图。如图3所示,该装置包括:
接收模块310,适于接收到以多义项词条作为搜索关键词进行搜索的搜索请求,多义项词条指具有多种不同含义的同一词条;
搜索模块320,与接收模块310相耦合,适于根据搜索请求进行搜索,获得多义项词条对应的搜索结果,搜索结果包括基于多义项词条的各不同含义搜索时分别对应的子搜索结果;
匹配模块330,与搜索模块320相耦合,适于获取多义项词条对应的搜索推荐数据,并将搜索推荐数据与多义项词条的各不同含义分别进行匹配,得到搜索推荐数据与各不同含义之间的相似度;
确定模块340,与匹配模块330相耦合,适于根据相似度确定多义项词条在本次搜索中的主义项;
显示模块350,与确定模块340相耦合,适于从搜索结果中筛选出与主义项对应的子搜索结果,并将与主义项对应的子搜索结果显示在搜索结果页面。
在一个实施例中,搜索推荐数据包括以下至少一项:
历史搜索数据;
热点搜索数据。
可选地,匹配模块还适于:
获取对多义项词条进行搜索时搜索框的下拉列表中的相关搜索数据;
将下拉列表中的相关搜索数据确定为多义项词条对应的搜索推荐数据。
在一个实施例中,匹配模块330还适于:
获取搜索推荐数据中除多义项词条之外的多元素所组成的元素集合;
分别计算元素集合和各含义之间的相似度;
确定元素集合和各含义之间的相似度为搜索推荐数据与各含义之间的相似度。
在一个实施例中,匹配模块330还适于:
统计各含义对应的子搜索结果中包含多元素的数目;
根据数目计算元素集合和各含义之间的相似度,其中,相似度与子搜索结果中包含多元素的数目成正比。
在一个实施例中,确定模块340还适于:
选择与搜索推荐数据之间相似度最高的含义;
将具备该含义的多义项词条确定为多义项词条在本次搜索中的主义项。
在一个实施例中,确定模块340还适于:
统计针对多义项词条进行搜索的各历史搜索结果对应的访问率;
结合相似度以及访问率确定多义项词条在本次搜索中的主义项。
在一个实施例中,确定模块340还适于:
根据相似度确定多义项词条的至少两个备选含义;
筛选出访问率最高的历史搜索结果;
确定访问率最高的历史搜索结果与各备选含义之间的匹配度;
选择匹配度最高值对应的备选含义,并确定具备该备选含义的多义项词条为多义项词条在本次搜索中的主义项。
采用本发明实施例提供的装置,能够在接收到以多义项词条为搜索关键词的搜索请求时,获取多义项词条对应的搜索推荐数据,并将搜索推荐数据与多义项词条的不同含义分别进行匹配,以得到搜索推荐数据与各不同含义之间的相似度,进而根据该相似度确定多义项词条在本次搜索中的主义项,使得在对多义项词条进行搜索时能够准确确定出其主义项,排除主义项之外的其他含义,避免因同一词条具有多个不同含义时无法准确进行搜索的情况。并且,该技术方案还能够从与多义项词条对应的搜索结果中筛选出与其主义项对应的子搜索结果,并将筛选出的子搜索结果显示在搜索结果页面,使得搜索引擎能够为用户提供多义项词条在本次搜索中的主义项对应的子搜索结果项,而并非提供多义项词条在多个不同含义下的所有搜索结果,因此无需用户在所有搜索结果中查找对自己有用的搜索结果,从而为用户节省大量时间。也并非提供多义项词条在除主义项之外的其他含义下的搜索结果,因此避免了为用户提供错误搜索结果的情况,提高用户对搜索引擎的使用体验。
本领域的技术人员应可理解,图3中的针对多义项词条的搜索装置能够用来实现前文所述的针对多义项词条的搜索方案,其中的细节描述应与前文方法部分描述类似,为避免繁琐,此处不另赘述。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的针对多义项词条的搜索装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
至此,本领域技术人员应认识到,虽然本文已详尽示出和描述了本发明的多个示例性实施例,但是,在不脱离本发明精神和范围的情况下,仍可根据本发明公开的内容直接确定或推导出符合本发明原理的许多其他变型或修改。因此,本发明的范围应被理解和认定为覆盖了所有这些其他变型或修改。

Claims (12)

1.一种针对多义项词条的搜索方法,包括:
接收到以多义项词条作为搜索关键词进行搜索的搜索请求,所述多义项词条指具有多种不同含义的同一词条;
根据所述搜索请求进行搜索,获得所述多义项词条对应的搜索结果,所述搜索结果包括基于所述多义项词条的各不同含义搜索时分别对应的子搜索结果;
获取所述多义项词条对应的搜索推荐数据,并将所述搜索推荐数据与所述多义项词条的各不同含义分别进行匹配,得到所述搜索推荐数据与所述各不同含义之间的相似度;
根据所述相似度确定所述多义项词条在本次搜索中的主义项;
从所述搜索结果中筛选出与所述主义项对应的子搜索结果,并将与所述主义项对应的子搜索结果显示在搜索结果页面;
其中,将所述搜索推荐数据与所述多义项词条的各不同含义分别进行匹配,得到所述搜索推荐数据与所述各不同含义之间的相似度,包括:
获取所述搜索推荐数据中除所述多义项词条之外的多元素所组成的元素
集合;
分别计算所述元素集合和各含义之间的相似度;
确定所述元素集合和所述各含义之间的相似度为所述搜索推荐数据与所述各含义之间的相似度;
其中,分别计算所述元素集合和所述各含义之间的相似度,包括:
统计所述各含义对应的子搜索结果中包含所述多元素的数目;
根据所述数目计算所述元素集合和所述各含义之间的相似度,其中,所述相似度与所述子搜索结果中包含所述多元素的数目成正比。
2.根据权利要求1所述的方法,其中,所述搜索推荐数据包括以下至少一项:
历史搜索数据;
热点搜索数据。
3.根据权利要求1所述的方法,其中,获取所述多义项词条对应的搜索推荐数据,包括:
获取对所述多义项词条进行搜索时搜索框的下拉列表中的相关搜索数据;
将所述下拉列表中的相关搜索数据确定为所述多义项词条对应的搜索推荐数据。
4.根据权利要求1-3中任一项所述的方法,其中,根据所述相似度确定所述多义项词条在本次搜索中的主义项,包括:
选择与所述搜索推荐数据之间相似度最高的含义;
将具备该含义的多义项词条确定为所述多义项词条在本次搜索中的主义项。
5.根据权利要求1-3中任一项所述的方法,其中,根据所述相似度确定所述多义项词条在本次搜索中的主义项,包括:
统计针对所述多义项词条进行搜索的各历史搜索结果对应的访问率;
结合所述相似度以及所述访问率确定所述多义项词条在本次搜索中的主义项。
6.根据权利要求5所述的方法,其中,结合所述相似度以及所述访问率确定所述多义项词条在本次搜索中的主义项,包括:
根据所述相似度确定所述多义项词条的至少两个备选含义;
筛选出所述访问率最高的历史搜索结果;
确定所述访问率最高的历史搜索结果与各备选含义之间的匹配度;
选择所述匹配度最高值对应的备选含义,并确定具备该备选含义的多义项词条为所述多义项词条在本次搜索中的主义项。
7.一种针对多义项词条的搜索装置,包括:
接收模块,适于接收到以多义项词条作为搜索关键词进行搜索的搜索请求,所述多义项词条指具有多种不同含义的同一词条;
搜索模块,适于根据所述搜索请求进行搜索,获得所述多义项词条对应的搜索结果,所述搜索结果包括基于所述多义项词条的各不同含义搜索时分别对应的子搜索结果;
匹配模块,适于获取所述多义项词条对应的搜索推荐数据,并将所述搜索推荐数据与所述多义项词条的各不同含义分别进行匹配,得到所述搜索推荐数据与所述各不同含义之间的相似度;
确定模块,适于根据所述相似度确定所述多义项词条在本次搜索中的主义项;
显示模块,适于从所述搜索结果中筛选出与所述主义项对应的子搜索结果,并将与所述主义项对应的子搜索结果显示在搜索结果页面;
其中,所述匹配模块还适于:
获取所述搜索推荐数据中除所述多义项词条之外的多元素所组成的元素集合;
分别计算所述元素集合和各含义之间的相似度;
确定所述元素集合和所述各含义之间的相似度为所述搜索推荐数据与所述各含义之间的相似度;
其中,所述匹配模块还适于:
统计所述各含义对应的子搜索结果中包含所述多元素的数目;
根据所述数目计算所述元素集合和所述各含义之间的相似度,其中,所述相似度与所述子搜索结果中包含所述多元素的数目成正比。
8.根据权利要求7所述的装置,其中,所述搜索推荐数据包括以下至少一项:
历史搜索数据;
热点搜索数据。
9.根据权利要求7所述的装置,其中,所述匹配模块还适于:
获取对所述多义项词条进行搜索时搜索框的下拉列表中的相关搜索数据;
将所述下拉列表中的相关搜索数据确定为所述多义项词条对应的搜索推荐数据。
10.根据权利要求7-9中任一项所述的装置,其中,所述确定模块还适于:
选择与所述搜索推荐数据之间相似度最高的含义;
将具备该含义的多义项词条确定为所述多义项词条在本次搜索中的主义项。
11.根据权利要求7-9中任一项所述的装置,其中,所述确定模块还适于:
统计针对所述多义项词条进行搜索的各历史搜索结果对应的访问率;
结合所述相似度以及所述访问率确定所述多义项词条在本次搜索中的主义项。
12.根据权利要求11所述的装置,其中,所述确定模块还适于:
根据所述相似度确定所述多义项词条的至少两个备选含义;
筛选出所述访问率最高的历史搜索结果;
确定所述访问率最高的历史搜索结果与各备选含义之间的匹配度;
选择所述匹配度最高值对应的备选含义,并确定具备该备选含义的多义项词条为所述多义项词条在本次搜索中的主义项。
CN201611219174.2A 2016-12-26 2016-12-26 针对多义项词条的搜索方法及装置 Active CN106649750B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611219174.2A CN106649750B (zh) 2016-12-26 2016-12-26 针对多义项词条的搜索方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611219174.2A CN106649750B (zh) 2016-12-26 2016-12-26 针对多义项词条的搜索方法及装置

Publications (2)

Publication Number Publication Date
CN106649750A CN106649750A (zh) 2017-05-10
CN106649750B true CN106649750B (zh) 2021-02-05

Family

ID=58828153

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611219174.2A Active CN106649750B (zh) 2016-12-26 2016-12-26 针对多义项词条的搜索方法及装置

Country Status (1)

Country Link
CN (1) CN106649750B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111241844B (zh) * 2018-11-29 2024-08-23 北京搜狗科技发展有限公司 一种信息推荐方法及装置
CN110795534A (zh) * 2019-10-28 2020-02-14 维沃移动通信有限公司 信息搜索方法及移动终端
CN113486253B (zh) * 2021-07-30 2024-03-19 抖音视界有限公司 搜索结果展示方法、装置、设备和介质

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101140588A (zh) * 2007-10-10 2008-03-12 华为技术有限公司 一种关联关系搜索结果的排序方法及装置
CN102521263A (zh) * 2011-11-21 2012-06-27 北京百度网讯科技有限公司 主题词条获取方法及其装置
CN103235802A (zh) * 2013-04-16 2013-08-07 武汉理工大学 用户复杂需求获取方法与系统
CN103365924A (zh) * 2012-04-09 2013-10-23 北京大学 一种搜索信息的方法、装置和终端
CN103593410A (zh) * 2013-10-22 2014-02-19 上海交通大学 通过替换概念性词语进行搜索推荐系统
CN103902681A (zh) * 2014-03-21 2014-07-02 百度在线网络技术(北京)有限公司 搜索推荐方法和装置
CN104503978A (zh) * 2014-11-26 2015-04-08 百度在线网络技术(北京)有限公司 一种相关实体推荐方法和系统
CN104765811A (zh) * 2015-04-02 2015-07-08 北京奇虎科技有限公司 实现搜索提示的装置、系统及方法
CN104899305A (zh) * 2015-06-12 2015-09-09 百度在线网络技术(北京)有限公司 移动搜索的推荐方法和装置
CN104933100A (zh) * 2015-05-28 2015-09-23 北京奇艺世纪科技有限公司 关键词推荐方法和装置
CN105224554A (zh) * 2014-06-11 2016-01-06 阿里巴巴集团控股有限公司 推荐搜索词进行搜索的方法、系统、服务器和智能终端
CN105824833A (zh) * 2015-01-07 2016-08-03 苏宁云商集团股份有限公司 基于用户行为反馈的关键词推荐方法和系统

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101140588A (zh) * 2007-10-10 2008-03-12 华为技术有限公司 一种关联关系搜索结果的排序方法及装置
CN102521263A (zh) * 2011-11-21 2012-06-27 北京百度网讯科技有限公司 主题词条获取方法及其装置
CN103365924A (zh) * 2012-04-09 2013-10-23 北京大学 一种搜索信息的方法、装置和终端
CN103235802A (zh) * 2013-04-16 2013-08-07 武汉理工大学 用户复杂需求获取方法与系统
CN103593410A (zh) * 2013-10-22 2014-02-19 上海交通大学 通过替换概念性词语进行搜索推荐系统
CN103902681A (zh) * 2014-03-21 2014-07-02 百度在线网络技术(北京)有限公司 搜索推荐方法和装置
CN105224554A (zh) * 2014-06-11 2016-01-06 阿里巴巴集团控股有限公司 推荐搜索词进行搜索的方法、系统、服务器和智能终端
CN104503978A (zh) * 2014-11-26 2015-04-08 百度在线网络技术(北京)有限公司 一种相关实体推荐方法和系统
CN105824833A (zh) * 2015-01-07 2016-08-03 苏宁云商集团股份有限公司 基于用户行为反馈的关键词推荐方法和系统
CN104765811A (zh) * 2015-04-02 2015-07-08 北京奇虎科技有限公司 实现搜索提示的装置、系统及方法
CN104933100A (zh) * 2015-05-28 2015-09-23 北京奇艺世纪科技有限公司 关键词推荐方法和装置
CN104899305A (zh) * 2015-06-12 2015-09-09 百度在线网络技术(北京)有限公司 移动搜索的推荐方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于语义分析的信息检索技术的研究;朱福勇;《中国优秀硕士学位论文全文数据库信息科技辑》;20130315;第I138-1727页 *

Also Published As

Publication number Publication date
CN106649750A (zh) 2017-05-10

Similar Documents

Publication Publication Date Title
KR101934449B1 (ko) 검색 쿼리에 응답하여 콘텐츠에 매칭될 이미지에 대해 동적 랭킹을 진행하기 위한 방법 및 시스템
CN106980700B (zh) 在浏览器侧进行网络搜索的方法与浏览器
CN105095440B (zh) 一种搜索推荐方法及装置
WO2015070673A1 (zh) 浏览器侧进行网络搜索的方法与浏览器
CN103412881B (zh) 提供搜索结果的方法及系统
JP2017220203A (ja) 類似性スコアに基づきコンテンツアイテムと画像とのマッチングを評価する方法、およびシステム
JP2017157192A (ja) キーワードに基づいて画像とコンテンツアイテムをマッチングする方法
US8392429B1 (en) Informational book query
US20150294018A1 (en) Method and apparatus for recommending keywords
JP5616444B2 (ja) 文書インデックス化およびデータクエリングのための方法およびシステム
CN104537065A (zh) 一种搜索结果的推送方法及系统
JP6363682B2 (ja) 画像とコンテンツのメタデータに基づいてコンテンツとマッチングする画像を選択する方法
US10275472B2 (en) Method for categorizing images to be associated with content items based on keywords of search queries
CN107463592B (zh) 用于将内容项目与图像匹配的方法、设备和数据处理系统
CN106649750B (zh) 针对多义项词条的搜索方法及装置
US20170357712A1 (en) Method and system for searching and identifying content items in response to a search query using a matched keyword whitelist
CN104008180A (zh) 结构化数据与图片的关联方法与关联装置
CN103186666A (zh) 基于收藏进行搜索的方法、装置与设备
CN104699837A (zh) 网页配图选取方法、装置及服务器
CN116595241A (zh) 新媒体信息展示方法、装置、电子设备及计算机可读介质
CN103744970B (zh) 一种确定图片的主题词的方法及装置
CN110990701B (zh) 书籍搜索方法、计算设备及计算机存储介质
CN103678601A (zh) 一种范文检索请求的处理方法和装置
WO2016101727A1 (zh) 基于问答的搜索结果调整方法和装置
CN103995895B (zh) 一种基于图片的识图方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20201215

Address after: No.9-3-401, No.39, Gaoxin 6th Road, Binhai science and Technology Park, Binhai New Area, Tianjin

Applicant after: 3600 Technology Group Co.,Ltd.

Address before: 100088 room 112, block D, 28 new street, new street, Xicheng District, Beijing (Desheng Park)

Applicant before: BEIJING QIHOO TECHNOLOGY Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Search method and device for polysemy entries

Effective date of registration: 20211223

Granted publication date: 20210205

Pledgee: China Merchants Bank Co.,Ltd. Tianjin Branch

Pledgor: 3600 Technology Group Co.,Ltd.

Registration number: Y2021980016228

PE01 Entry into force of the registration of the contract for pledge of patent right
PC01 Cancellation of the registration of the contract for pledge of patent right

Date of cancellation: 20221021

Granted publication date: 20210205

Pledgee: China Merchants Bank Co.,Ltd. Tianjin Branch

Pledgor: 3600 Technology Group Co.,Ltd.

Registration number: Y2021980016228

PC01 Cancellation of the registration of the contract for pledge of patent right