CN104503988A - 搜索方法及装置 - Google Patents
搜索方法及装置 Download PDFInfo
- Publication number
- CN104503988A CN104503988A CN201410725281.7A CN201410725281A CN104503988A CN 104503988 A CN104503988 A CN 104503988A CN 201410725281 A CN201410725281 A CN 201410725281A CN 104503988 A CN104503988 A CN 104503988A
- Authority
- CN
- China
- Prior art keywords
- search
- search results
- type
- resource
- described search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种搜索方法及装置。本发明实施例通过获得所接收的搜索关键词所属的搜索类型,进而利用所述搜索类型所对应的成分分析模型,对所述搜索关键词进行识别处理,以获得搜索成分词,使得能够根据所述搜索成分词,获得搜索结果并输出,由于不再完全依赖搜索关键词执行搜索操作,而是结合搜索关键词所属的搜索类型所对应的成分分析模型,执行搜索操作,使得搜索结果能够基本满足用户的搜索意图,因此,能够避免现有技术中由于用户通过应用反复浏览搜索结果页或者反复进行搜索而导致的增加应用与搜索引擎之间的数据交互的问题,从而降低了搜索引擎的处理负担。
Description
【技术领域】
本发明涉及搜索技术,尤其涉及一种搜索方法及装置。
【背景技术】
搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供搜索服务,将用户搜索相关的信息展示给用户的系统。据国家统计局的报道,中国网民人数已经超过了4亿,这个数据意味着中国已经超过美国成为世界上第一大网民国,且中国的网站总数量已经超过了200万。因此,如何利用搜索服务最大限度满足用户需求,对于互联网企业而言,始终是一个重要的课题。用户在搜索引擎对应应用中的搜索框中,输入搜索关键词,由应用将搜索关键词,发送给搜索引擎。搜索引擎则根据搜索关键词,在数据库中进行搜索,以获得与搜索关键词匹配的网页或文档,以作为搜索结果,并返回给应用进行输出。
然而,由于完全依赖搜索关键词执行搜索操作所获得的搜索结果,可能会无法满足用户真正的搜索意图,例如,搜索某一种类型或几种类型的资源等,使得用户需要通过应用反复浏览搜索结果页或者反复进行搜索,才能够获得满足搜索意图的搜索结果,这样,会增加应用与搜索引擎之间的数据交互,从而导致了搜索引擎的处理负担的增加。
【发明内容】
本发明的多个方面提供一种搜索方法及装置,用以降低搜索引擎的处理负担。
本发明的一方面,提供一种搜索方法,包括:
接收搜索关键词;
获得所述搜索关键词所属的搜索类型;
利用所述搜索类型所对应的成分分析模型,对所述搜索关键词进行识别处理,以获得搜索成分词;
根据所述搜索成分词,获得搜索结果;
输出所述搜索结果。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述输出所述搜索结果,包括:
以结构化形式,输出所述搜索结果。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述获得所述搜索关键词所属的搜索类型,包括:
获得所述搜索关键词在预先设置的M个指定类型中每个指定类型下的需求强度,M为大于或等于2的整数;
根据所述搜索关键词在预先设置的M个指定类型下的需求强度,将N个指定类型,确定为所述搜索关键词所属的搜索类型,N为大于或等于1,且小于或等于M的整数。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据所述搜索成分词,获得搜索结果,包括:
根据所述搜索类型,获得展现参数;
根据所述搜索成分词中所包括的主题词的属性信息,获得所述展现参数的参数值,以作为所述搜索结果。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据所述搜索成分词,获得搜索结果之后,还包括:
根据所述搜索成分词中所包括的属性词,获得所述搜索结果所对应的至少一个资源,以作为附加结果;
输出所述附加结果。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据所述搜索成分词中所包括的属性词,获得所述搜索结果所对应的至少一个资源,以作为附加结果之后,所述输出所述搜索结果之前,还包括:
从所述至少一个资源中,选择一个资源,以作为所述搜索结果所对应的目标展现资源;
将所述目标展现资源的操作标识,插入所述搜索结果,所述操作标识所对应的页面元素被点击时,触发对所述目标展现资源进行所述操作标识所对应的操作。
本发明的另一方面,提供一种搜索装置,包括:
接收单元,用于接收搜索关键词;
获得单元,用于获得所述搜索关键词所属的搜索类型;
识别单元,用于利用所述搜索类型所对应的成分分析模型,对所述搜索关键词进行识别处理,以获得搜索成分词;
搜索单元,用于根据所述搜索成分词,获得搜索结果;
输出单元,用于输出所述搜索结果。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述输出单元,具体用于
以结构化形式,输出所述搜索结果。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述获得单元,具体用于
获得所述搜索关键词在预先设置的M个指定类型中每个指定类型下的需求强度,M为大于或等于2的整数;以及
根据所述搜索关键词在预先设置的M个指定类型下的需求强度,将N个指定类型,确定为所述搜索关键词所属的搜索类型,N为大于或等于1,且小于或等于M的整数。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述搜索单元,具体用于
根据所述搜索类型,获得展现参数;以及
根据所述搜索成分词中所包括的主题词的属性信息,获得所述展现参数的参数值,以作为所述搜索结果。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述搜索单元,还用于
根据所述搜索成分词中所包括的属性词,获得所述搜索结果所对应的至少一个资源,以作为附加结果;以及
输出所述附加结果。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述搜索单元,还用于
从所述至少一个资源中,选择一个资源,以作为所述搜索结果所对应的目标展现资源;以及
将所述目标展现资源的操作标识,插入所述搜索结果,所述操作标识所对应的页面元素被点击时,触发对所述目标展现资源进行所述操作标识所对应的操作。
由上述技术方案可知,本发明实施例通过获得所接收的搜索关键词所属的搜索类型,进而利用所述搜索类型所对应的成分分析模型,对所述搜索关键词进行识别处理,以获得搜索成分词,使得能够根据所述搜索成分词,获得搜索结果并输出,由于不再完全依赖搜索关键词执行搜索操作,而是结合搜索关键词所属的搜索类型所对应的成分分析模型,执行搜索操作,使得搜索结果能够基本满足用户的搜索意图,因此,能够避免现有技术中由于用户通过应用反复浏览搜索结果页或者反复进行搜索而导致的增加应用与搜索引擎之间的数据交互的问题,从而降低了搜索引擎的处理负担。
另外,采用本发明提供的技术方案,由于不再完全依赖搜索关键词执行搜索操作,而是结合搜索关键词所属的搜索类型所对应的成分分析模型,执行搜索操作,使得搜索结果能够基本满足用户的搜索意图,因此,能够有效提高搜索结果的有效性。
另外,采用本发明提供的技术方案,由于不再完全依赖搜索关键词执行搜索操作,而是结合搜索关键词所属的搜索类型所对应的成分分析模型,执行搜索操作,使得搜索结果能够基本满足用户的搜索意图,因此,能够有效提高搜索的效率。
另外,采用本发明提供的技术方案,通过以结构化形式,输出所述搜索结果,能够使得搜索结果的展现效果具有重点突出且内容清晰的特点,从而有效地提升了用户体验。
【附图说明】
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一实施例提供的搜索方法的流程示意图;
图2A为图1对应的实施例中搜索结果的展现示意图;
图2B为图1对应的实施例中搜索结果的展现示意图;
图3为图1对应的实施例中搜索结果和附加结果的展现示意图;
图4为本发明另一实施例提供的搜索装置的结构示意图。
【具体实施方式】
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的全部其他实施例,都属于本发明保护的范围。
需要说明的是,本发明实施例中所涉及的终端可以包括但不限于手机、个人数字助理(Personal Digital Assistant,PDA)、无线手持装置、无线上网本、个人电脑、便携电脑、MP3播放器、MP4播放器等。
另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
图1为本发明一实施例提供的搜索方法的流程示意图,如图1所示。
101、接收搜索关键词。
102、获得所述搜索关键词所属的搜索类型。
103、利用所述搜索类型所对应的成分分析模型,对所述搜索关键词进行识别处理,以获得搜索成分词。
104、根据所述搜索成分词,获得搜索结果。
105、输出所述搜索结果。
需要说明的是,101~105的执行主体可以为位于本地终端中的应用,或者还可以为位于网络侧服务器中的搜索引擎,或者还可以一部分为位于本地终端中的应用,一部分为位于网络侧服务器中的搜索引擎,本实施例对此不进行特别限定。
可以理解的是,所述应用可以是安装在终端上的本地程序(nativeApp),或者还可以是终端上的浏览器的一个网页程序(webApp),只要能够实现信息搜索,以提供搜索结果的客观存在形式都可以,本实施例对此不进行限定。
这样,通过获得所接收的搜索关键词所属的搜索类型,进而利用所述搜索类型所对应的成分分析模型,对所述搜索关键词进行识别处理,以获得搜索成分词,使得能够根据所述搜索成分词,获得搜索结果并输出,由于不再完全依赖搜索关键词执行搜索操作,而是结合搜索关键词所属的搜索类型所对应的成分分析模型,执行搜索操作,使得搜索结果能够基本满足用户的搜索意图,因此,能够避免现有技术中由于用户通过应用反复浏览搜索结果页或者反复进行搜索而导致的增加应用与搜索引擎之间的数据交互的问题,从而降低了搜索引擎的处理负担。
可选地,在本实施例的一个可能的实现方式中,在102中,具体可以获得所述搜索关键词在预先设置的M个指定类型中每个指定类型下的需求强度,M为大于或等于2的整数,进而则可以根据所述搜索关键词在预先设置的M个指定类型下的需求强度,将N个指定类型,确定为所述搜索关键词所属的搜索类型,N为大于或等于1,且小于或等于M的整数。
其中,所述指定类型,可以包括但不限于影视类型、小说类型、音乐类型、软件类型、知识类型、人物类型等大类,或者还可以包括但不限于娱乐人物类型、体育人物类型等大类下的小类,本实施例对此不进行特别限定。
在一个具体的实现过程中,具体可以采用预先构建的一分类器,以输出所述搜索关键词在预先设置的M个指定类型中每个指定类型下的需求强度。这种需求强度,还可以看成是搜索关键词的一个类型分布。
具体地,可以利用监督方法,构建关于M个指定类型的分类器。例如,具体可以确定指定类型的数量和每个指定类型的定义,收集训练数据,利用训练数据,构建关于M个指定类型的搜索关键词分类器。这种方法,精度高,但召回率低。
这样,可以采用利用监督方法所构建的关于M个指定类型的分类器,生成搜索关键词的类型分布即所述搜索关键词在预先设置的M个指定类型下的需求强度。
具体地,可以利用非监督方法,构建关于M个指定类型的类型模型。例如,具体可以将历史搜索关键词和所述历史搜索关键词所对应的查询结果中的类型信息组合成一个片段,对该片段进行分词处理,以生成训练数据。利用训练数据,训练类型模型。然后,对类型模型进行优化操作,例如,基于语义的删除操作、基于语义的去重操作等,以获得关于M个指定类型的类型模型。这种方法,精度稍低,但召回率高。
这样,可以采用利用非监督方法所构建的关于M个指定类型的类型模型,生成搜索关键词的类型分布即所述搜索关键词在预先设置的M个指定类型下的需求强度。例如,将搜索关键词,以及该搜索关键词所对应的历史搜索结果中的类型信息,将搜索关键词和该搜索关键词所对应的历史搜索结果中的类型信息组合成一个片段,对该片段进行分词处理,以生成分词结果,进而利用该类型模型,生成搜索关键词的类型分布。
可以理解的是,具体还可以对利用监督方法所构建的关于M个指定类型的分类器,以及利用非监督方法所构建的关于M个指定类型的类型模型,进行整合处理,以获得一个更加可靠的关于M个指定类型的模型。
可以理解的是,具体还可以对上述两种方法所生成的搜索关键词的类型分布进行整合,以获得更加可靠的搜索关键词的类型分布。
在一个具体的实现过程中,具体可以按照从大到小的顺序,对所述搜索关键词在预先设置的M个指定类型下的需求强度进行排序,将排在前N位的需求强度所对应的指定类型,确定为所述搜索关键词所属的搜索类型。
可选地,在本实施例的一个可能的实现方式中,在103中,所述搜索类型所对应的成分分析模型中,可以包括若干个结构模板,每个结构模板中可以包括但不限于下列结构成分:
主题词;或者
主题词和属性词。
所述主题词,为本次搜索的中心词,例如,鹿鼎记、李娜等。
所述属性词,为用于描述本次搜索的中心词的描述词,例如,在线、观看、下载等需求词,或者,再例如,章节或集数等详情词。
具体地,具体可以将所述搜索关键词,在所述搜索类型所对应的成分分析模型中进行结构模板的匹配,其匹配的原则可以采用现有技术中的多种策略,例如,最长匹配策略等,本实施例对此不进行特别限定。根据所匹配到的结构模板中所包括的结构成分,确定所述搜索关键词的对应内容,以获得搜索成分词。
需要说明的是,每个搜索类型所对应成分分析模型,其所包括的结构模板可以相同,或者也可以不同,本实施例对此不进行特别限定。
例如,影视类型所对应的成分分析模型中,可以包括但不限于如下结构模板:
[主题词]
[需求词][主题词]
[主题词][描述词]
[需求词][主题词][描述词]
[主题词][集数]
....
或者,再例如,小说类型所对应的成分分析模型中,可以包括但不限于如下结构模板:
[主题词]
[需求词][主题词]
[主题词][描述词]
[需求词][主题词][描述词]
[主题词][章节]
....
或者,再例如,音乐类型所对应的成分分析模型中,可以包括但不限于如下结构模板:
[主题词]
[需求词][主题词]
[主题词][描述词]
[需求词][主题词][描述词]
[主题词][歌手名]
[主题词][专辑名]
....
可选地,在本实施例的一个可能的实现方式中,在104中,具体可以根据所述搜索类型,获得展现参数,进而则可以根据所述搜索成分词中所包括的主题词的属性信息,获得所述展现参数的参数值,以作为所述搜索结果。
具体地,针对不同的搜索类型下的资源,可以具有不同的展现参数。
例如,若搜索类型为娱乐人物,则所获得的展现参数可以为照片、热度、职业、国籍、星座和代表作等属性参数。
或者,再例如,若搜索类型为电影,则所获得的展现参数可以为宣传海报、语言类型、片长、主演、导演、地区、年代、类型和简介等。
或者,再例如,若搜索类型为电视剧,则所获得的展现参数可以为宣传海报、语言类型、主演、导演、地区、年代、类型和简介等。
或者,再例如,若搜索类型为综艺,则所获得的展现参数可以为节目图片、期数、地区、类型、电视台和简介等。
在一个具体的实现过程中,具体可以根据所述主题词的属性信息,并利用知识图谱,或利用网页爬虫所采集的网页集合,获得所述每个主题词所对应的所述展现参数的参数值,以作为所述搜索结果。
其中,知识图谱,本质上是一种语义网络,是用于描述真实世界中存在的各种实体或概念。知识图谱可以被看作是一张巨大的图,图中的节点,代表实体(entity)或者概念(concept),而图中的连接节点的边,代表实体或概念之间的各种语义关系。
具体地,在知识图谱中,每个实体或概念可以用一个全局唯一确定的ID来标识,称为它们的标识符(Identifier)。每个实体或概念可以对应一个类型,例如,某个人所属的类型是人物(Person),或者,再例如,某部电影所属的类型是电影(Movie),或者,再例如,某部电视剧所属的类型是电视剧(Play)等。所有的类型都有自己的基类型,即最基础的类型是事物(Thing)。每个实体或概念还可以进一步用属性-值对(Attribute-Value Pair,AVP)用来刻画实体或概念的内在特性,例如,名称属性等。
知识图谱的详细描述可以参见现有技术中的相关内容,此处不再赘述。
可选地,在本实施例的一个可能的实现方式中,在105中,具体可以以结构化形式,输出所述搜索结果,以实现搜索结果的展现。如图2A所示,在图2A中所示的展现区域21中,输出搜索结果。
可以理解的是,一般来说,用于展现搜索结果的展现区域21有限,在一屏之内无法完整显示全部的搜索结果,则可以将所述搜索结果中的一部分内容,进行折叠展现处理,或者还可以进一步在所述展现页面中设置一滚动条22,如图2B所示,以使得用户拖动滚动条,以配合显示区域进行滚动显示,本实施例对此不进行特别限定。
另外,每个搜索结果的具体展现形式可以以文字、图片、声音、动画等多媒体形式,本实施例对此不进行特别限定。
可选地,在本实施例的一个可能的实现方式中,在104之后,还可以进一步根据所述搜索成分词中所包括的属性词,获得所述搜索结果所对应的至少一个资源,以作为附加结果,进而则可以输出所述附加结果。
例如,具体可以在一个搜索资源库中,进行搜索,以获得所述搜索结果所对应的至少一个资源。具体地,具体可以预先在互联网中,利用网页爬虫技术,采集若干个网页,从而将这些网页加入所述搜索资源库中,以供进行搜索操作。
或者,再例如,具体还可以在一个优质资源库中,进行搜索,以获得所述搜索结果所对应的至少一个资源。具体地,具体可以预先在互联网中,进行优质资源的挖掘。例如,根据资源中所包括的内容的作者或上传者,以及该资源所在的网站等,确定资源是否为优质资源,将所确定的优质资源加入所述优质资源库,以作为进行搜索的数据库,以供进行搜索操作。
或者,再例如,具体还可以在一个指定类型资源库中,进行搜索,以获得所述搜索结果所对应的至少一个资源。具体地,具体可以预先在互联网中,进行指定类型的资源的挖掘。例如,根据资源的相关信息,确定资源所属指定类型,将所属指定类型相同的资源加入到同一个指定类型资源库中,并将资源的相关信息以预先定义的数据存储格式进行结构化存储,例如,可扩展标记语言(eXtensible Markup Language,XML)等,以形成一个结构化资源库中,以作为进行搜索的数据库,以供进行搜索操作。
可以理解的是,所输出的附加结果,并不是用户所最终访问的资源,而是资源的文档摘要,这些文档摘要与实际的文档或网页相链接。其中,文档摘要通常可以包括页面的标题、页面的统一资源定位符(Uniform ResourceLocator,URL)、真实页面和页面快照的链接和页面摘要等。
所谓的资源即网络资源,可以理解为互联网中的一切资源,是利用计算机系统通过通信设备传播和网络软件管理的信息资源。
具体地,所述资源可以为包括文本、图片等资源的网页,或者还可以为包括可播放音频的网页,或者还可以为包括可播放视频的网页,等等,本实施例对此不进行特别限定。如图3所示,在图3中所示的展现区域32中,输出附加结果。
可选地,在本实施例的一个可能的实现方式中,在根据所述搜索成分词中所包括的属性词,获得所述搜索结果所对应的至少一个资源,以作为附加结果之后,以及在所述输出所述搜索结果之前,具体可以从所述至少一个资源中,选择一个资源,以作为所述搜索结果所对应的目标展现资源,将所述目标展现资源的操作标识,插入所述搜索结果,所述操作标识所对应的页面元素被点击时,触发对所述目标展现资源进行所述操作标识所对应的操作。
其中,所述操作标识所对应的页面元素可以为用于播放资源中所包括的视频或音频的按钮,例如,播放按钮等,或者还可以为用于下载资源中所包括的视频或音频的按钮,例如,下载按钮等,等等,本实施例对此不进行特别限定。仍然如图3所示,在展现区域31中所输出的搜索结果中,插入了一操作标识所对应的页面元素33。
本实施例中,通过获得所接收的搜索关键词所属的搜索类型,进而利用所述搜索类型所对应的成分分析模型,对所述搜索关键词进行识别处理,以获得搜索成分词,使得能够根据所述搜索成分词,获得搜索结果并输出,由于不再完全依赖搜索关键词执行搜索操作,而是结合搜索关键词所属的搜索类型所对应的成分分析模型,执行搜索操作,使得搜索结果能够基本满足用户的搜索意图,因此,能够避免现有技术中由于用户通过应用反复浏览搜索结果页或者反复进行搜索而导致的增加应用与搜索引擎之间的数据交互的问题,从而降低了搜索引擎的处理负担。
另外,采用本发明提供的技术方案,由于不再完全依赖搜索关键词执行搜索操作,而是结合搜索关键词所属的搜索类型所对应的成分分析模型,执行搜索操作,使得搜索结果能够基本满足用户的搜索意图,因此,能够有效提高搜索结果的有效性。
另外,采用本发明提供的技术方案,由于不再完全依赖搜索关键词执行搜索操作,而是结合搜索关键词所属的搜索类型所对应的成分分析模型,执行搜索操作,使得搜索结果能够基本满足用户的搜索意图,因此,能够有效提高搜索的效率。
另外,采用本发明提供的技术方案,通过以结构化形式,输出所述搜索结果,能够使得搜索结果的展现效果具有重点突出且内容清晰的特点,从而有效地提升了用户体验。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
图4为本发明另一实施例提供的搜索装置的结构示意图,如图4所示。本实施例的搜索装置可以包括接收单元41、获得单元42、识别单元43、搜索单元44和输出单元45。其中,接收单元41,用于接收搜索关键词;获得单元42,用于获得所述搜索关键词所属的搜索类型;识别单元43,用于利用所述搜索类型所对应的成分分析模型,对所述搜索关键词进行识别处理,以获得搜索成分词;搜索单元44,用于根据所述搜索成分词,获得搜索结果;输出单元45,用于输出所述搜索结果。
需要说明的是,本实施例所提供的搜索装置可以为位于本地终端中的应用,或者还可以为位于网络侧服务器中的搜索引擎,或者还可以一部分为位于本地终端中的应用,一部分为位于网络侧服务器中的搜索引擎,本实施例对此不进行特别限定。
可以理解的是,所述应用可以是安装在终端上的本地程序(nativeApp),或者还可以是终端上的浏览器的一个网页程序(webApp),只要能够实现信息搜索,以提供搜索结果的客观存在形式都可以,本实施例对此不进行限定。
可选地,在本实施例的一个可能的实现方式中,所述输出单元45,具体可以用于以结构化形式,输出所述搜索结果。
可选地,在本实施例的一个可能的实现方式中,所述获得单元42,具体可以用于获得所述搜索关键词在预先设置的M个指定类型中每个指定类型下的需求强度,M为大于或等于2的整数;以及根据所述搜索关键词在预先设置的M个指定类型下的需求强度,将N个指定类型,确定为所述搜索关键词所属的搜索类型,N为大于或等于1,且小于或等于M的整数。
可选地,在本实施例的一个可能的实现方式中,所述搜索单元44,具体可以用于根据所述搜索类型,获得展现参数;以及根据所述搜索成分词中所包括的主题词的属性信息,获得所述展现参数的参数值,以作为所述搜索结果。
可选地,在本实施例的一个可能的实现方式中,所述搜索单元44,还可以进一步用于根据所述搜索成分词中所包括的属性词,获得所述搜索结果所对应的至少一个资源,以作为附加结果;以及输出所述附加结果。
可选地,在本实施例的一个可能的实现方式中,所述搜索单元44,还可以进一步用于从所述至少一个资源中,选择一个资源,以作为所述搜索结果所对应的目标展现资源;以及将所述目标展现资源的操作标识,插入所述搜索结果,所述操作标识所对应的页面元素被点击时,触发对所述目标展现资源进行所述操作标识所对应的操作。
需要说明的是,图1对应的实施例中方法,可以由本实施例提供的搜索装置实现。详细描述可以参见图1对应的实施例中的相关内容,此处不再赘述。
本实施例中,通过获得单元获得接收单元所接收的搜索关键词所属的搜索类型,进而又识别单元利用所述搜索类型所对应的成分分析模型,对所述搜索关键词进行识别处理,以获得搜索成分词,使得搜索单元能够根据所述搜索成分词,获得搜索结果并由输出单元输出,由于不再完全依赖搜索关键词执行搜索操作,而是结合搜索关键词所属的搜索类型所对应的成分分析模型,执行搜索操作,使得搜索结果能够基本满足用户的搜索意图,因此,能够避免现有技术中由于用户通过应用反复浏览搜索结果页或者反复进行搜索而导致的增加应用与搜索引擎之间的数据交互的问题,从而降低了搜索引擎的处理负担。
另外,采用本发明提供的技术方案,由于不再完全依赖搜索关键词执行搜索操作,而是结合搜索关键词所属的搜索类型所对应的成分分析模型,执行搜索操作,使得搜索结果能够基本满足用户的搜索意图,因此,能够有效提高搜索结果的有效性。
另外,采用本发明提供的技术方案,由于不再完全依赖搜索关键词执行搜索操作,而是结合搜索关键词所属的搜索类型所对应的成分分析模型,执行搜索操作,使得搜索结果能够基本满足用户的搜索意图,因此,能够有效提高搜索的效率。
另外,采用本发明提供的技术方案,通过以结构化形式,输出所述搜索结果,能够使得搜索结果的展现效果具有重点突出且内容清晰的特点,从而有效地提升了用户体验。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (12)
1.一种搜索方法,其特征在于,包括:
接收搜索关键词;
获得所述搜索关键词所属的搜索类型;
利用所述搜索类型所对应的成分分析模型,对所述搜索关键词进行识别处理,以获得搜索成分词;
根据所述搜索成分词,获得搜索结果;
输出所述搜索结果。
2.根据权利要求1所述的方法,其特征在于,所述输出所述搜索结果,包括:
以结构化形式,输出所述搜索结果。
3.根据权利要求1所述的方法,其特征在于,所述获得所述搜索关键词所属的搜索类型,包括:
获得所述搜索关键词在预先设置的M个指定类型中每个指定类型下的需求强度,M为大于或等于2的整数;
根据所述搜索关键词在预先设置的M个指定类型下的需求强度,将N个指定类型,确定为所述搜索关键词所属的搜索类型,N为大于或等于1,且小于或等于M的整数。
4.根据权利要求1所述的方法,其特征在于,所述根据所述搜索成分词,获得搜索结果,包括:
根据所述搜索类型,获得展现参数;
根据所述搜索成分词中所包括的主题词的属性信息,获得所述展现参数的参数值,以作为所述搜索结果。
5.根据权利要求1~4任一权利要求所述的方法,其特征在于,所述根据所述搜索成分词,获得搜索结果之后,还包括:
根据所述搜索成分词中所包括的属性词,获得所述搜索结果所对应的至少一个资源,以作为附加结果;
输出所述附加结果。
6.根据权利要求5所述的方法,其特征在于,所述根据所述搜索成分词中所包括的属性词,获得所述搜索结果所对应的至少一个资源,以作为附加结果之后,所述输出所述搜索结果之前,还包括:
从所述至少一个资源中,选择一个资源,以作为所述搜索结果所对应的目标展现资源;
将所述目标展现资源的操作标识,插入所述搜索结果,所述操作标识所对应的页面元素被点击时,触发对所述目标展现资源进行所述操作标识所对应的操作。
7.一种搜索装置,其特征在于,包括:
接收单元,用于接收搜索关键词;
获得单元,用于获得所述搜索关键词所属的搜索类型;
识别单元,用于利用所述搜索类型所对应的成分分析模型,对所述搜索关键词进行识别处理,以获得搜索成分词;
搜索单元,用于根据所述搜索成分词,获得搜索结果;
输出单元,用于输出所述搜索结果。
8.根据权利要求7所述的装置,其特征在于,所述输出单元,具体用于
以结构化形式,输出所述搜索结果。
9.根据权利要求7所述的装置,其特征在于,所述获得单元,具体用于
获得所述搜索关键词在预先设置的M个指定类型中每个指定类型下的需求强度,M为大于或等于2的整数;以及
根据所述搜索关键词在预先设置的M个指定类型下的需求强度,将N个指定类型,确定为所述搜索关键词所属的搜索类型,N为大于或等于1,且小于或等于M的整数。
10.根据权利要求7所述的装置,其特征在于,所述搜索单元,具体用于
根据所述搜索类型,获得展现参数;以及
根据所述搜索成分词中所包括的主题词的属性信息,获得所述展现参数的参数值,以作为所述搜索结果。
11.根据权利要求7~10任一权利要求所述的装置,其特征在于,所述搜索单元,还用于
根据所述搜索成分词中所包括的属性词,获得所述搜索结果所对应的至少一个资源,以作为附加结果;以及
输出所述附加结果。
12.根据权利要求11所述的装置,其特征在于,所述搜索单元,还用于
从所述至少一个资源中,选择一个资源,以作为所述搜索结果所对应的目标展现资源;以及
将所述目标展现资源的操作标识,插入所述搜索结果,所述操作标识所对应的页面元素被点击时,触发对所述目标展现资源进行所述操作标识所对应的操作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410725281.7A CN104503988B (zh) | 2014-12-03 | 2014-12-03 | 搜索方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410725281.7A CN104503988B (zh) | 2014-12-03 | 2014-12-03 | 搜索方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104503988A true CN104503988A (zh) | 2015-04-08 |
CN104503988B CN104503988B (zh) | 2018-10-16 |
Family
ID=52945386
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410725281.7A Active CN104503988B (zh) | 2014-12-03 | 2014-12-03 | 搜索方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104503988B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104899285A (zh) * | 2015-06-04 | 2015-09-09 | 百度在线网络技术(北京)有限公司 | 搜索结果展示方法和装置 |
CN104951536A (zh) * | 2015-06-18 | 2015-09-30 | 百度在线网络技术(北京)有限公司 | 搜索方法及装置 |
CN104978429A (zh) * | 2015-07-10 | 2015-10-14 | 无锡天脉聚源传媒科技有限公司 | 一种搜索方法和装置 |
CN105550369A (zh) * | 2016-01-26 | 2016-05-04 | 上海晶赞科技发展有限公司 | 一种搜索目标商品集的方法及装置 |
CN106372191A (zh) * | 2016-08-31 | 2017-02-01 | 广东华邦云计算股份有限公司 | 一种数据搜索方法和装置 |
CN109344336A (zh) * | 2018-12-25 | 2019-02-15 | 北京时光荏苒科技有限公司 | 搜索方法、搜索集生成方法、装置、介质、终端及服务器 |
CN110852094A (zh) * | 2018-08-01 | 2020-02-28 | 北京京东尚科信息技术有限公司 | 检索目标的方法、装置及计算机可读存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6076086A (en) * | 1997-03-17 | 2000-06-13 | Fuji Xerox Co., Ltd. | Associate document retrieving apparatus and storage medium for storing associate document retrieving program |
CN101079784A (zh) * | 2006-05-24 | 2007-11-28 | 腾讯科技(深圳)有限公司 | 互联网资源的搜索方法及其搜索系统 |
CN101437039A (zh) * | 2007-11-15 | 2009-05-20 | 华为技术有限公司 | 一种移动搜索的方法、系统和设备 |
CN103077176A (zh) * | 2012-01-13 | 2013-05-01 | 北京飞漫软件技术有限公司 | 一种在浏览器中按关键词类型进行快捷搜索的方法 |
CN103514299A (zh) * | 2013-10-18 | 2014-01-15 | 北京奇虎科技有限公司 | 信息搜索方法和装置 |
CN103544176A (zh) * | 2012-07-13 | 2014-01-29 | 百度在线网络技术(北京)有限公司 | 用于生成多个页面所对应的页面结构模板的方法和设备 |
CN104077415A (zh) * | 2014-07-16 | 2014-10-01 | 百度在线网络技术(北京)有限公司 | 搜索方法及装置 |
-
2014
- 2014-12-03 CN CN201410725281.7A patent/CN104503988B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6076086A (en) * | 1997-03-17 | 2000-06-13 | Fuji Xerox Co., Ltd. | Associate document retrieving apparatus and storage medium for storing associate document retrieving program |
CN101079784A (zh) * | 2006-05-24 | 2007-11-28 | 腾讯科技(深圳)有限公司 | 互联网资源的搜索方法及其搜索系统 |
CN101437039A (zh) * | 2007-11-15 | 2009-05-20 | 华为技术有限公司 | 一种移动搜索的方法、系统和设备 |
CN103077176A (zh) * | 2012-01-13 | 2013-05-01 | 北京飞漫软件技术有限公司 | 一种在浏览器中按关键词类型进行快捷搜索的方法 |
CN103544176A (zh) * | 2012-07-13 | 2014-01-29 | 百度在线网络技术(北京)有限公司 | 用于生成多个页面所对应的页面结构模板的方法和设备 |
CN103514299A (zh) * | 2013-10-18 | 2014-01-15 | 北京奇虎科技有限公司 | 信息搜索方法和装置 |
CN104077415A (zh) * | 2014-07-16 | 2014-10-01 | 百度在线网络技术(北京)有限公司 | 搜索方法及装置 |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104899285A (zh) * | 2015-06-04 | 2015-09-09 | 百度在线网络技术(北京)有限公司 | 搜索结果展示方法和装置 |
CN104899285B (zh) * | 2015-06-04 | 2018-09-25 | 百度在线网络技术(北京)有限公司 | 搜索结果展示方法和装置 |
CN104951536A (zh) * | 2015-06-18 | 2015-09-30 | 百度在线网络技术(北京)有限公司 | 搜索方法及装置 |
CN104978429A (zh) * | 2015-07-10 | 2015-10-14 | 无锡天脉聚源传媒科技有限公司 | 一种搜索方法和装置 |
CN105550369A (zh) * | 2016-01-26 | 2016-05-04 | 上海晶赞科技发展有限公司 | 一种搜索目标商品集的方法及装置 |
CN105550369B (zh) * | 2016-01-26 | 2019-06-07 | 上海晶赞科技发展有限公司 | 一种搜索目标商品集的方法及装置 |
CN106372191A (zh) * | 2016-08-31 | 2017-02-01 | 广东华邦云计算股份有限公司 | 一种数据搜索方法和装置 |
CN110852094A (zh) * | 2018-08-01 | 2020-02-28 | 北京京东尚科信息技术有限公司 | 检索目标的方法、装置及计算机可读存储介质 |
CN110852094B (zh) * | 2018-08-01 | 2023-11-03 | 北京京东尚科信息技术有限公司 | 检索目标的方法、装置及计算机可读存储介质 |
CN109344336A (zh) * | 2018-12-25 | 2019-02-15 | 北京时光荏苒科技有限公司 | 搜索方法、搜索集生成方法、装置、介质、终端及服务器 |
Also Published As
Publication number | Publication date |
---|---|
CN104503988B (zh) | 2018-10-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10140368B2 (en) | Method and apparatus for generating a recommendation page | |
CN102708174B (zh) | 一种浏览器中的富媒体信息的展示方法和装置 | |
CN104598556A (zh) | 搜索方法及装置 | |
US8312022B2 (en) | Search engine optimization | |
CN104503988A (zh) | 搜索方法及装置 | |
KR101475126B1 (ko) | 검색 결과 페이지에 인터랙티브 요소를 포함하는 시스템 및 그 방법 | |
CN101876981B (zh) | 一种构建知识库的方法及装置 | |
CN103886017B (zh) | 一种用于在搜索结果中提供相关子链接的方法和装置 | |
CN103455524B (zh) | 展现和获取词条信息的方法和装置 | |
CN102346778B (zh) | 一种用于提供搜索结果的方法与设备 | |
CN102682082B (zh) | 基于内容结构特征的网络Flash搜索系统及搜索方法 | |
CN101984420B (zh) | 一种基于拆词处理进行图片搜索的方法与设备 | |
CN106354861A (zh) | 电影标签自动标引方法及自动标引系统 | |
CN103136228A (zh) | 一种图片搜索方法以及图片搜索装置 | |
CN104077415A (zh) | 搜索方法及装置 | |
CN102184185A (zh) | 一种用于多媒体资源搜索的方法与设备 | |
CN102043833A (zh) | 一种基于查询词进行搜索的方法和搜索装置 | |
CN102169501A (zh) | 基于搜索结果对应文档的类型信息生成摘要的方法与设备 | |
CN104090923B (zh) | 一种浏览器中的富媒体信息的展示方法和装置 | |
CN106227873A (zh) | 搜索方法及装置 | |
CN108959580A (zh) | 一种标签数据的优化方法及系统 | |
CN104090757A (zh) | 针对浏览器的富媒体信息展示方法 | |
CN103678325A (zh) | 一种用于提供与初始页面相对应的浏览页面的方法和设备 | |
CN105916032A (zh) | 视频推荐的方法及视频推荐的终端设备 | |
CN103745380A (zh) | 一种广告投放方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |