CN105843849B - 搜索方法及装置 - Google Patents

搜索方法及装置 Download PDF

Info

Publication number
CN105843849B
CN105843849B CN201610147611.8A CN201610147611A CN105843849B CN 105843849 B CN105843849 B CN 105843849B CN 201610147611 A CN201610147611 A CN 201610147611A CN 105843849 B CN105843849 B CN 105843849B
Authority
CN
China
Prior art keywords
semantic
minor structure
keyword
search
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610147611.8A
Other languages
English (en)
Other versions
CN105843849A (zh
Inventor
王丽杰
刘占一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201610147611.8A priority Critical patent/CN105843849B/zh
Publication of CN105843849A publication Critical patent/CN105843849A/zh
Application granted granted Critical
Publication of CN105843849B publication Critical patent/CN105843849B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种搜索方法及装置。本发明实施例通过对所获取的搜索关键词进行语义分析处理,以获得至少一个语义子结构,进而根据所述至少一个语义子结构,获得主干关键词,使得能够利用所述主干关键词,执行搜索操作,由于不再完全依赖搜索关键词执行搜索操作,而是利用基于搜索关键词所提取的主干关键词执行搜索操作,使得搜索结果基本满足用户的真正意图,因此,能够避免现有技术中由于用户通过应用反复进行搜索而导致的增加应用与搜索引擎之间的数据交互的问题,从而降低了搜索引擎的处理负担。

Description

搜索方法及装置
【技术领域】
本发明涉及互联网技术,尤其涉及一种搜索方法及装置。
【背景技术】
搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供搜索服务,将用户搜索相关的信息展示给用户的系统。据国家统计局的报道,中国网民人数已经超过了4亿,这个数据意味着中国已经超过美国成为世界上第一大网民国,且中国的网站总数量已经超过了200万。因此,如何利用搜索服务最大限度满足用户需求,对于互联网企业而言,始终是一个重要的课题。用户可以将搜索关键词提供给相关应用,由应用将搜索关键词,发送给搜索引擎。搜索引擎则根据搜索关键词,在数据库中进行搜索,以获得与搜索关键词匹配的搜索结果,并返回给应用进行输出。
然而,由于用户的表达方式需要借助自然语言,而每个用户的措词都会有较大差异,使得用户所提供的搜索关键词可能会存在语法不严格和语序颠倒等情况,完全依赖搜索关键词执行搜索操作,可能会使得搜索结果无法满足用户的真正意图,使得用户需要通过应用反复进行搜索,这样,会增加应用与搜索引擎之间的数据交互,从而导致了搜索引擎的处理负担的增加。
【发明内容】
本发明的多个方面提供一种搜索方法及装置,用以降低搜索引擎的处理负担。
本发明的一方面,提供一种搜索方法,包括:
获取搜索关键词;
对所述搜索关键词进行语义分析处理,以获得至少一个语义子结构;
根据所述至少一个语义子结构,获得主干关键词;
利用所述主干关键词,执行搜索操作。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述对所述搜索关键词进行语义分析处理,以获得至少一个语义子结构,包括:
利用语义分析技术,对所述搜索关键词进行语义分析处理;
对经过语义分析处理之后的搜索关键词进行内容提取,以获得所述至少一个语义子结构。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述对所述搜索关键词进行语义分析处理,以获得至少一个语义子结构,还包括:
对所获得的所述至少一个语义子结构进行合并处理,以获得合并之后的所述至少一个语义子结构。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据所述至少一个语义子结构,获得主干关键词,包括:
根据所述至少一个语义子结构中两两语义子结构中相同的词,以及该词在对应的语义子结构中的结构成分,获得两两语义子结构之间的层级关系;
根据所述两两语义子结构之间的层级关系,建立所述搜索关键词的层级结构;
根据所述至少一个语义子结构的层级结构,获得所述主干关键词。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据所述至少一个语义子结构的层级结构,获得所述主干关键词,包括:
根据所述至少一个语义子结构的层级结构中每个语义子结构的层级信息,对所述每个语义子结构中的词进行保留处理或者删除处理,以获得保留词;所述每个语义子结构的层级信息包括所述每个语义子结构的层级关系、所述每个语义子结构的结构类型和所述每个语义子结构中词的结构成分中的至少一项;
根据所述保留词,获得所述主干关键词。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据所述保留词,获得所述主干关键词,包括:
根据指定结构,对所述保留词的顺序进行调整;
对所述保留词进行归一化处理,以获得所述主干关键词。
本发明的另一方面,提供一种搜索装置,包括:
获取单元,用于获取搜索关键词;
语义单元,用于对所述搜索关键词进行语义分析处理,以获得至少一个语义子结构;
提取单元,用于根据所述至少一个语义子结构,获得主干关键词;
搜索单元,用于利用所述主干关键词,执行搜索操作。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述语义单元,具体用于
利用语义分析技术,对所述搜索关键词进行语义分析处理;以及
对经过语义分析处理之后的搜索关键词进行内容提取,以获得所述至少一个语义子结构。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述语义单元,还用于
对所获得的所述至少一个语义子结构进行合并处理,以获得合并之后的所述至少一个语义子结构。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述提取单元,具体用于
根据所述至少一个语义子结构中两两语义子结构中相同的词,以及该词在对应的语义子结构中的结构成分,获得两两语义子结构之间的层级关系;
根据所述两两语义子结构之间的层级关系,建立所述搜索关键词的层级结构;以及
根据所述至少一个语义子结构的层级结构,获得所述主干关键词。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述提取单元,具体用于
根据所述至少一个语义子结构的层级结构中每个语义子结构的层级信息,对所述每个语义子结构中的词进行保留处理或者删除处理,以获得保留词;所述每个语义子结构的层级信息包括所述每个语义子结构的层级关系、所述每个语义子结构的结构类型和所述每个语义子结构中词的结构成分中的至少一项;以及
根据所述保留词,获得所述主干关键词。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述提取单元,具体用于
根据指定结构,对所述保留词的顺序进行调整;以及
对所述保留词进行归一化处理,以获得所述主干关键词。
由上述技术方案可知,本发明实施例通过对所获取的搜索关键词进行语义分析处理,以获得至少一个语义子结构,进而根据所述至少一个语义子结构,获得主干关键词,使得能够利用所述主干关键词,执行搜索操作,由于不再完全依赖搜索关键词执行搜索操作,而是利用基于搜索关键词所提取的主干关键词执行搜索操作,使得搜索结果基本满足用户的真正意图,因此,能够避免现有技术中由于用户通过应用反复进行搜索而导致的增加应用与搜索引擎之间的数据交互的问题,从而降低了搜索引擎的处理负担。
另外,采用本发明所提供的技术方案,由于不再完全依赖搜索关键词执行搜索操作,而是利用基于搜索关键词所提取的主干关键词执行搜索操作,使得搜索结果基本满足用户的真正意图,从而提高了搜索结果的有效性。
另外,采用本发明所提供的技术方案,由于不再完全依赖搜索关键词执行搜索操作,而是利用基于搜索关键词所提取的主干关键词执行搜索操作,使得搜索结果基本满足用户的真正意图,从而提高了搜索的效率。
另外,采用本发明所提供的技术方案,能够有效地提高用户的体验。
【附图说明】
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一实施例提供的搜索方法的流程示意图;
图2为本发明另一实施例提供的搜索装置的结构示意图。
【具体实施方式】
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的全部其他实施例,都属于本发明保护的范围。
需要说明的是,本发明实施例中所涉及的终端可以包括但不限于手机、个人数字助理(Personal Digital Assistant,PDA)、无线手持设备、平板电脑(Tablet Computer)、个人电脑(Personal Computer,PC)、MP3播放器、MP4播放器、可穿戴设备(例如,智能眼镜、智能手表、智能手环等)等。
另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
图1为本发明一实施例提供的搜索方法的流程示意图,如图1所示。
101、获取搜索关键词。
102、对所述搜索关键词进行语义分析处理,以获得至少一个语义子结构。
103、根据所述至少一个语义子结构,获得主干关键词。
104、利用所述主干关键词,执行搜索操作。
需要说明的是,101~104的执行主体的部分或全部可以为位于本地终端的应用,或者还可以为设置在位于本地终端的应用中的插件或软件开发工具包(SoftwareDevelopment Kit,SDK)等功能单元,或者还可以为位于网络侧服务器中的搜索引擎,或者还可以为位于网络侧的分布式系统,本实施例对此不进行特别限定。
可以理解的是,所述应用可以是安装在终端上的本地程序(nativeApp),或者还可以是终端上的浏览器的一个网页程序(webApp),本实施例对此不进行特别限定。
这样,通过对所获取的搜索关键词进行语义分析处理,以获得至少一个语义子结构,进而根据所述至少一个语义子结构,获得主干关键词,使得能够利用所述主干关键词,执行搜索操作,由于不再完全依赖搜索关键词执行搜索操作,而是利用基于搜索关键词所提取的主干关键词执行搜索操作,使得搜索结果基本满足用户的真正意图,因此,能够避免现有技术中由于用户通过应用反复进行搜索而导致的增加应用与搜索引擎之间的数据交互的问题,从而降低了搜索引擎的处理负担。
可选地,在本实施例的一个可能的实现方式中,在101中,具体可以采集用户所提供的所述搜索关键词。具体来说,具体可以通过用户所触发的搜索命令实现。具体可以采用但不限于下述几种方式触发搜索命令:
方式一:
用户可以在当前应用所展现的页面上所输入所述搜索关键词,然后,通过点击该页面上的搜索按钮例如,百度一下,以触发搜索命令,该搜索命令中包含所述搜索关键词。其中,用户输入所述搜索关键词的顺序可以为任意顺序。这样,在接收到该搜索命令之后,则可以解析出其中所包含的所述搜索关键词。
方式二:
采用异步加载技术例如,Ajax异步加载或Jsonp异步加载等,实时获取用户在当前应用所展现的页面上所输入的输入内容,为了与搜索关键词进行区分,此时的输入内容可以称为是输入关键词。其中,用户输入所述搜索关键词的顺序可以为任意顺序。具体地,具体可以提供Ajax接口或Jsonp接口等接口,这些接口可以使用Java、超级文本预处理(Hypertext Preprocessor,PHP)语言等语言进行编写,其具体的调用可以使用Jquery,或者原生的JavaScript等语言进行编写。
方式三:用户可以通过长按当前应用所展现的页面上的语音搜索按钮,说出想要输入的语音内容,然后,松开语音搜索按钮,以触发搜索命令,该搜索命令中包含根据所说出的语音内容转换的文本形式的搜索关键词。这样,在接收到该搜索命令之后,则可以解析出其中所包含的所述搜索关键词。
方式四:用户可以通过点击当前应用所展现的页面上的语音搜索按钮,说出想要输入的语音内容,待结束说出语音内容一段时间例如,2秒钟之后,则触发搜索命令,该搜索命令中包含根据所说出的语音内容转换的文本形式的搜索关键词。这样,在接收到该搜索命令之后,则可以解析出其中所包含的所述搜索关键词。
在获取到所述输入关键词之后,则可以执行后续操作即102~104。
可选地,在本实施例的一个可能的实现方式中,在102中,具体可以利用语义分析技术,对所述搜索关键词进行语义分析处理,进而,则可以对经过语义分析处理之后的搜索关键词进行内容提取,以获得所述至少一个语义子结构。
所谓的语义分析处理,是指将一个句子分解成一些小的组成部分(如词、短语等),并获得这些部分之间的关系。本发明中,可以采用现有技术中的语义分析技术,对所获取的搜索关键词进行语义分析处理,其处理结果可以作为103和104的执行基础。
在该实现方式中,在获得所述至少一个语义子结构之后,还可以进一步对所获得的所述至少一个语义子结构进行合并处理,以获得合并之后的所述至少一个语义子结构。具体来说,由于句子语法的需求,会借助一些虚词来协助构建整个句子,因此,可以跨越部分语义子结构中无意义的词,对所获得的所述至少一个语义子结构进行合并处理。
以搜索关键词“帮查一下配国语的韩剧继承者们”为例,对经过语义分析处理之后,所获得的三个语义子结构即“查→继承者”、“配←国语”、以及“配→继承者们”,进行合并处理,获得一个语义子结构即“继承者们→配←国语”。除了“继承者们→配←国语”这个语义子结构之外,还获得了其他两个语义子结构即“查→继承者们”、以及“韩剧→继承者们”。
可选地,在本实施例的一个可能的实现方式中,在103中,具体可以根据所述至少一个语义子结构中两两语义子结构中相同的词,以及该词在对应的语义子结构中的结构成分,获得两两语义子结构之间的层级关系。进而,则可以根据所述两两语义子结构之间的层级关系,建立所述搜索关键词的层级结构。然后,再根据所述至少一个语义子结构的层级结构,获得所述主干关键词。一般来说,每个语义子结构都可以由三个结构成分组成,即两个实体结构成分,一个关系结构成分。
仍然以搜索关键词“帮查一下配国语的韩剧继承者们”为例,其经过语义分析处理之后,获得如下三个语义子结构,即“继承者们→配←国语”、“查→继承者们”、以及“韩剧→继承者们”。
其中,
语义子结构“查→继承者们”中,“继承者们”为一个实体结构成分,另一个实体结构成分为省略的内容即“搜索引擎”,“查”为两个实体之间的关系结构成分;
语义子结构“继承者们→配←国语”中,“继承者们”为一个实体结构成分,“国语”为另一个实体结构成分,“配”为两个实体之间的关系结构成分;
语义子结构“韩剧→继承者们”中,“韩剧”为一个实体结构成分,“继承者们”为另一个实体结构成分,这两个实体之间的关系结构成分是上下位关系。
针对语义子结构“查→继承者们”与语义子结构“继承者们→配←国语”来说,相同的词为“继承者们”,而在语义子结构“查→继承者们”中,“继承者们”是宾语位置,其父亲节点是“查”,在语义子结构“继承者们→配←国语”中,“继承者们”是核心词即整个结构的最上层父亲节点,所以,语义子结构“查→继承者们”应该为父亲结构,语义子结构“继承者们→配←国语”则是孩子结构;
针对语义子结构“查→继承者们”与语义子结构“韩剧→继承者们”来说,相同的词为“继承者们”,而在语义子结构“查→继承者们”中,“继承者们”是宾语位置,其父亲节点是“查”,在语义子结构“韩剧→继承者们”中,“韩剧”是“继承者们”的上位概念,所以,语义子结构“查→继承者们”应该为父亲结构,语义子结构“韩剧→继承者们”则是孩子结构;
至此,获得两两语义子结构之间的层级关系,即语义子结构“查→继承者们”为父亲结构,语义子结构“继承者们→配←国语”和语义子结构“韩剧→继承者们”为孩子结构,这些层级关系共同组成了搜索关键词的结构图谱。
在一个具体的实现过程中,具体可以根据所述至少一个语义子结构的层级结构中每个语义子结构的层级信息,对所述每个语义子结构中的词进行保留处理或者删除处理,以获得保留词;所述每个语义子结构的层级信息包括所述每个语义子结构的层级关系、所述每个语义子结构的结构类型和所述每个语义子结构中词的结构成分中的至少一项。然后,则可以根据所述保留词,获得所述主干关键词。
具体来说,在获得保留词之后,具体可以根据指定结构例如,实体A→关系→实体B等,对所述保留词的顺序进行调整,进而,对所述保留词进行归一化处理,以获得所述主干关键词。
仍然以搜索关键词“帮查一下配国语的韩剧继承者们”为例,其经过语义分析处理之后,获得如下三个语义子结构,即“继承者们→配←国语”、“查→继承者们”、以及“韩剧→继承者们”,进而,获得两两语义子结构之间的层级关系,即语义子结构“查→继承者们”为父亲结构,语义子结构“继承者们→配←国语”和语义子结构“韩剧→继承者们”为孩子结构,这些层级关系共同组成了搜索关键词的结构图谱。
针对父亲结构“查→继承者们”,关系结构成分和宾语位置的实体结构成分都是重要的,需要保留,但这里的关系结构成分是口语化词条,可以进行删除处理;
针对孩子结构“韩剧→继承者们”,判断出“韩剧”是“继承者们”的上位词,同时“继承者们”是单义项数据,因此,这里“韩剧”为非重要词,仅需保留“继承者们”。
针对孩子结构“继承者们→配←国语”,关系结构成分、主语位置的实体结构成分和宾语位置的实体结构成分都是重要的,需要保留。
最终,保留词则为“配国语继承者们”。
在获得保留词“配国语继承者们”之后,接着,则可以根据指定结构即实体A→关系→实体B等,对保留词“配国语继承者们”的顺序进行调整,得到“继承者们配国语”。然后,对调整顺序之后的保留词“继承者们配国语”中的“配国语”进行归一化处理,获得“国语版”这个归一化结果,以获得主干关键词“继承者们国语版”。
本实施例中,通过对所获取的搜索关键词进行语义分析处理,以获得至少一个语义子结构,进而根据所述至少一个语义子结构,获得主干关键词,使得能够利用所述主干关键词,执行搜索操作,由于不再完全依赖搜索关键词执行搜索操作,而是利用基于搜索关键词所提取的主干关键词执行搜索操作,使得搜索结果基本满足用户的真正意图,因此,能够避免现有技术中由于用户通过应用反复进行搜索而导致的增加应用与搜索引擎之间的数据交互的问题,从而降低了搜索引擎的处理负担。
另外,采用本发明所提供的技术方案,由于不再完全依赖搜索关键词执行搜索操作,而是利用基于搜索关键词所提取的主干关键词执行搜索操作,使得搜索结果基本满足用户的真正意图,从而提高了搜索结果的有效性。
另外,采用本发明所提供的技术方案,由于不再完全依赖搜索关键词执行搜索操作,而是利用基于搜索关键词所提取的主干关键词执行搜索操作,使得搜索结果基本满足用户的真正意图,从而提高了搜索的效率。
另外,采用本发明所提供的技术方案,能够有效地提高用户的体验。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
图2为本发明另一实施例提供的搜索装置的结构示意图,如图2所示。本实施例的搜索装置可以包括获取单元21、语义单元22、提取单元23和搜索单元24。其中,获取单元21,用于获取搜索关键词;语义单元22,用于对所述搜索关键词进行语义分析处理,以获得至少一个语义子结构;提取单元23,用于根据所述至少一个语义子结构,获得主干关键词;搜索单元24,用于利用所述主干关键词,执行搜索操作。
需要说明的是,本实施例所提供的搜索装置的部分或全部可以为位于本地终端的应用,或者还可以为设置在位于本地终端的应用中的插件或软件开发工具包(SoftwareDevelopment Kit,SDK)等功能单元,或者还可以为位于网络侧服务器中的搜索引擎,或者还可以为位于网络侧的分布式系统,本实施例对此不进行特别限定。
可以理解的是,所述应用可以是安装在终端上的本地程序(nativeApp),或者还可以是终端上的浏览器的一个网页程序(webApp),本实施例对此不进行特别限定。
可选地,在本实施例的一个可能的实现方式中,所述语义单元22,具体可以用于利用语义分析技术,对所述搜索关键词进行语义分析处理;以及对经过语义分析处理之后的搜索关键词进行内容提取,以获得所述至少一个语义子结构。
进一步可选地,所述语义单元22,还可以进一步用于对所获得的所述至少一个语义子结构进行合并处理,以获得合并之后的所述至少一个语义子结构。
可选地,在本实施例的一个可能的实现方式中,所述提取单元23,具体可以用于根据所述至少一个语义子结构中两两语义子结构中相同的词,以及该词在对应的语义子结构中的结构成分,获得两两语义子结构之间的层级关系;根据所述两两语义子结构之间的层级关系,建立所述搜索关键词的层级结构;以及根据所述至少一个语义子结构的层级结构,获得所述主干关键词。
在一个具体的实现过程中,所述提取单元23,具体可以用于根据所述至少一个语义子结构的层级结构中每个语义子结构的层级信息,对所述每个语义子结构中的词进行保留处理或者删除处理,以获得保留词;所述每个语义子结构的层级信息包括所述每个语义子结构的层级关系、所述每个语义子结构的结构类型和所述每个语义子结构中词的结构成分中的至少一项;以及根据所述保留词,获得所述主干关键词。
具体来说,所述提取单元23,具体可以用于根据指定结构,对所述保留词的顺序进行调整;以及对所述保留词进行归一化处理,以获得所述主干关键词。
需要说明的是,图1对应的实施例中方法,可以由本实施例提供的搜索装置实现。详细描述可以参见图1对应的实施例中的相关内容,此处不再赘述。
本实施例中,通过语义单元对获取单元所获取的搜索关键词进行语义分析处理,以获得至少一个语义子结构,进而由提取单元根据所述至少一个语义子结构,获得主干关键词,使得搜索单元能够利用所述主干关键词,执行搜索操作,由于不再完全依赖搜索关键词执行搜索操作,而是利用基于搜索关键词所提取的主干关键词执行搜索操作,使得搜索结果基本满足用户的真正意图,因此,能够避免现有技术中由于用户通过应用反复进行搜索而导致的增加应用与搜索引擎之间的数据交互的问题,从而降低了搜索引擎的处理负担。
另外,采用本发明所提供的技术方案,由于不再完全依赖搜索关键词执行搜索操作,而是利用基于搜索关键词所提取的主干关键词执行搜索操作,使得搜索结果基本满足用户的真正意图,从而提高了搜索结果的有效性。
另外,采用本发明所提供的技术方案,由于不再完全依赖搜索关键词执行搜索操作,而是利用基于搜索关键词所提取的主干关键词执行搜索操作,使得搜索结果基本满足用户的真正意图,从而提高了搜索的效率。
另外,采用本发明所提供的技术方案,能够有效地提高用户的体验。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机装置(可以是个人计算机,服务器,或者网络装置等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种搜索方法,其特征在于,包括:
获取搜索关键词;
对所述搜索关键词进行语义分析处理,以获得至少一个语义子结构;其中,每个所述语义子结构包括两个以上结构成分;
根据所述至少一个语义子结构的层级结构,获得主干关键词;
利用所述主干关键词,执行搜索操作;其中,
所述根据所述至少一个语义子结构的层级结构,获得所述主干关键词,包括:
根据所述至少一个语义子结构的层级结构中每个语义子结构的层级信息,对所述每个语义子结构中的词进行保留处理或者删除处理,以获得保留词;所述每个语义子结构的层级信息包括所述每个语义子结构的层级关系、所述每个语义子结构的结构类型和所述每个语义子结构中词的结构成分中的至少一项;
根据所述保留词,获得所述主干关键词。
2.根据权利要求1所述的方法,其特征在于,所述对所述搜索关键词进行语义分析处理,以获得至少一个语义子结构,包括:
利用语义分析技术,对所述搜索关键词进行语义分析处理;
对经过语义分析处理之后的搜索关键词进行内容提取,以获得所述至少一个语义子结构。
3.根据权利要求2所述的方法,其特征在于,所述对所述搜索关键词进行语义分析处理,以获得至少一个语义子结构,还包括:
对所获得的所述至少一个语义子结构进行合并处理,以获得合并之后的所述至少一个语义子结构。
4.根据权利要求1~3任一权利要求所述的方法,其特征在于,所述根据所述至少一个语义子结构的层级结构,获得主干关键词之前,还包括:
根据所述至少一个语义子结构中两两语义子结构中相同的词,以及该词在对应的语义子结构中的结构成分,获得两两语义子结构之间的层级关系;
根据所述两两语义子结构之间的层级关系,建立所述搜索关键词的层级结构。
5.根据权利要求1所述的方法,其特征在于,所述根据所述保留词,获得所述主干关键词,包括:
根据指定结构,对所述保留词的顺序进行调整;
对所述保留词进行归一化处理,以获得所述主干关键词。
6.一种搜索装置,其特征在于,包括:
获取单元,用于获取搜索关键词;
语义单元,用于对所述搜索关键词进行语义分析处理,以获得至少一个语义子结构;其中,每个所述语义子结构包括两个以上结构成分;
提取单元,用于根据所述至少一个语义子结构的层级结构,获得主干关键词;
搜索单元,用于利用所述主干关键词,执行搜索操作;其中,
所述提取单元,具体用于
根据所述至少一个语义子结构的层级结构中每个语义子结构的层级信息,对所述每个语义子结构中的词进行保留处理或者删除处理,以获得保留词;所述每个语义子结构的层级信息包括所述每个语义子结构的层级关系、所述每个语义子结构的结构类型和所述每个语义子结构中词的结构成分中的至少一项;以及
根据所述保留词,获得所述主干关键词。
7.根据权利要求6所述的装置,其特征在于,所述语义单元,具体用于利用语义分析技术,对所述搜索关键词进行语义分析处理;以及
对经过语义分析处理之后的搜索关键词进行内容提取,以获得所述至少一个语义子结构。
8.根据权利要求7所述的装置,其特征在于,所述语义单元,还用于对所获得的所述至少一个语义子结构进行合并处理,以获得合并之后的所述至少一个语义子结构。
9.根据权利要求6~8任一权利要求所述的装置,其特征在于,所述提取单元,还用于
根据所述至少一个语义子结构中两两语义子结构中相同的词,以及该词在对应的语义子结构中的结构成分,获得两两语义子结构之间的层级关系;
根据所述两两语义子结构之间的层级关系,建立所述搜索关键词的层级。
10.根据权利要求6所述的装置,其特征在于,所述提取单元,具体用于根据指定结构,对所述保留词的顺序进行调整;以及
对所述保留词进行归一化处理,以获得所述主干关键词。
CN201610147611.8A 2016-03-15 2016-03-15 搜索方法及装置 Active CN105843849B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610147611.8A CN105843849B (zh) 2016-03-15 2016-03-15 搜索方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610147611.8A CN105843849B (zh) 2016-03-15 2016-03-15 搜索方法及装置

Publications (2)

Publication Number Publication Date
CN105843849A CN105843849A (zh) 2016-08-10
CN105843849B true CN105843849B (zh) 2019-11-26

Family

ID=56588214

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610147611.8A Active CN105843849B (zh) 2016-03-15 2016-03-15 搜索方法及装置

Country Status (1)

Country Link
CN (1) CN105843849B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107357830B (zh) * 2017-06-19 2020-07-28 北京百度网讯科技有限公司 基于人工智能的检索语句语义片段获取方法、装置及终端
CN110442686B (zh) * 2018-05-03 2023-05-26 阿里巴巴集团控股有限公司 信息确定、关联对构建与会话回复方法、系统及设备
CN113486253B (zh) * 2021-07-30 2024-03-19 抖音视界有限公司 搜索结果展示方法、装置、设备和介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102467518A (zh) * 2010-11-05 2012-05-23 百度在线网络技术(北京)有限公司 一种用于在推广关键词中设置必要语义成分的方法和设备
CN102880645A (zh) * 2012-08-24 2013-01-16 上海云叟网络科技有限公司 语义化的智能搜索方法
CN103049495A (zh) * 2012-12-07 2013-04-17 百度在线网络技术(北京)有限公司 用于提供与查询序列相对应的搜索建议的方法、装置与设备
CN103092979A (zh) * 2013-01-31 2013-05-08 中国科学院对地观测与数字地球科学中心 遥感数据检索自然语言的处理方法及装置
CN104252533A (zh) * 2014-09-12 2014-12-31 百度在线网络技术(北京)有限公司 搜索方法和搜索装置
CN104933028A (zh) * 2015-06-23 2015-09-23 百度在线网络技术(北京)有限公司 信息推送方法和装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4654776B2 (ja) * 2005-06-03 2011-03-23 富士ゼロックス株式会社 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102467518A (zh) * 2010-11-05 2012-05-23 百度在线网络技术(北京)有限公司 一种用于在推广关键词中设置必要语义成分的方法和设备
CN102880645A (zh) * 2012-08-24 2013-01-16 上海云叟网络科技有限公司 语义化的智能搜索方法
CN103049495A (zh) * 2012-12-07 2013-04-17 百度在线网络技术(北京)有限公司 用于提供与查询序列相对应的搜索建议的方法、装置与设备
CN103092979A (zh) * 2013-01-31 2013-05-08 中国科学院对地观测与数字地球科学中心 遥感数据检索自然语言的处理方法及装置
CN104252533A (zh) * 2014-09-12 2014-12-31 百度在线网络技术(北京)有限公司 搜索方法和搜索装置
CN104933028A (zh) * 2015-06-23 2015-09-23 百度在线网络技术(北京)有限公司 信息推送方法和装置

Also Published As

Publication number Publication date
CN105843849A (zh) 2016-08-10

Similar Documents

Publication Publication Date Title
US11436296B2 (en) Method of and system for inferring user intent in search input in a conversational interaction system
CN104915340B (zh) 自然语言问答方法及装置
KR102288249B1 (ko) 정보 처리 방법, 단말기, 및 컴퓨터 저장 매체
CN106407178B (zh) 一种会话摘要生成方法、装置、服务器设备以及终端设备
CN107480162A (zh) 基于人工智能的搜索方法、装置、设备及计算机可读存储介质
CN107704453A (zh) 一种文字语义分析方法、文字语义分析终端及存储介质
CN105653673B (zh) 信息搜索方法及装置
KR101353521B1 (ko) 키워드 추출 방법 및 시스템, 그리고 대화 보조 장치
CN105930527B (zh) 搜索方法及装置
Zamanirad et al. Programming bots by synthesizing natural language expressions into API invocations
CN105843849B (zh) 搜索方法及装置
CN107368548A (zh) 智能政务服务交互方法和系统
CN109063166A (zh) 一种语音查询方法及装置、用户设备
CN106021413A (zh) 基于主题模型的自展式特征选择方法及系统
CN109002498B (zh) 人机对话方法、装置、设备及存储介质
Walker et al. Graphwoz: Dialogue management with conversational knowledge graphs
Gupta et al. Search bot: Search intention based filtering using decision tree based technique
CN106503056B (zh) 基于人工智能的搜索结果摘要的生成方法及装置
CN105975610A (zh) 场景识别方法及装置
Mundlamuri et al. Chatbot integration with google dialogflow environment for conversational intervention
CN102207963A (zh) 一种云计算视窗平台的搜索后即时智能导航技术方法
CN113792129B (zh) 一种智能会话方法、装置、计算机设备及介质
Hao et al. A Medical Dialogue System Based on DIET and Knowledge Graph
CN106126561A (zh) 搜索结果摘要的生成方法及装置
CN106250370B (zh) 一种获取近义词的方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant