WO2017201904A1 - 搜索方法、装置、设备及非易失性计算机存储介质 - Google Patents

搜索方法、装置、设备及非易失性计算机存储介质 Download PDF

Info

Publication number
WO2017201904A1
WO2017201904A1 PCT/CN2016/096653 CN2016096653W WO2017201904A1 WO 2017201904 A1 WO2017201904 A1 WO 2017201904A1 CN 2016096653 W CN2016096653 W CN 2016096653W WO 2017201904 A1 WO2017201904 A1 WO 2017201904A1
Authority
WO
WIPO (PCT)
Prior art keywords
search
search keyword
potential
obtaining
keyword
Prior art date
Application number
PCT/CN2016/096653
Other languages
English (en)
French (fr)
Inventor
何伯磊
张伟萌
李兴建
马艳军
Original Assignee
百度在线网络技术(北京)有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 百度在线网络技术(北京)有限公司 filed Critical 百度在线网络技术(北京)有限公司
Priority to US16/304,624 priority Critical patent/US20190303364A1/en
Publication of WO2017201904A1 publication Critical patent/WO2017201904A1/zh

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • G06F16/287Visualization; Browsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Definitions

  • the present invention relates to Internet technologies, and in particular, to a search method, apparatus, device, and non-volatile computer storage medium.
  • a search engine refers to a system that collects information from the Internet according to a certain strategy, uses a specific computer program, organizes and processes the information, provides a search service for the user, and displays the user search related information to the user.
  • the search keyword is diabetes
  • the demand may be some content related to diabetes diet, and not other. Contains content such as diabetes.
  • aspects of the present invention provide a search method, apparatus, device, and non-volatile computer storage medium for meeting related needs of a user in a search process.
  • a search method comprising:
  • the search results clustered under the potential demand are output.
  • the method further includes:
  • any possible implementation manner further provide an implementation manner, where the potential requirement for obtaining the search keyword includes:
  • the potential demand of the search keyword is obtained.
  • any possible implementation manner further provide an implementation manner, where the potential demand of the search keyword is obtained according to the search keyword and the correspondence between the specified search keyword and the potential requirement Previously, it also included:
  • any possible implementation manner further provide an implementation manner, where the potential requirement for obtaining the search keyword includes:
  • a potential demand to which the search result belongs is obtained as a potential demand of the search keyword.
  • the search results clustered under the potential demand are output.
  • a search device comprising:
  • a processing unit configured to obtain a search result according to the search keyword
  • a clustering unit configured to cluster the search result to a potential demand of the search keyword
  • An output unit configured to output search results clustered under the potential demand.
  • the potential demand of the search keyword is obtained.
  • the clustering unit is specifically used for
  • a potential demand to which the search result belongs is obtained as a potential demand of the search keyword.
  • the search results clustered under the potential demand are output.
  • an apparatus comprising:
  • One or more processors are One or more processors;
  • One or more programs the one or more programs being stored in the memory, when executed by the one or more processors:
  • the search results clustered under the potential demand are output.
  • a nonvolatile computer storage medium storing one or more programs when the one or more programs are executed by a device causes The device:
  • the search results clustered under the potential demand are output.
  • the embodiment of the present invention obtains the search result according to the obtained search keyword, and then clusters the search result to the potential demand of the search keyword, so that the potential demand can be output.
  • the search result clustered below because considering that the user may have a certain aspect or several aspects, the search result corresponding to the search keyword is clustered to one or several potentials of the search keyword. Under the demand, it is easy for the user to obtain a kind of content clustered under a certain potential demand, which can effectively meet the relevant requirements of the user in the search process.
  • the technical solution provided by the present invention can effectively improve the user experience.
  • FIG. 1 is a schematic flowchart of a search method according to an embodiment of the present invention
  • FIG. 2 is a schematic structural diagram of a search apparatus according to another embodiment of the present invention.
  • the terminals involved in the embodiments of the present invention may include, but are not limited to, a mobile phone, a personal digital assistant (PDA), a wireless handheld device, a tablet computer, and a personal computer (Personal Computer, PC). ), MP3 player, MP4 player, wearable device (for example, smart glasses, smart watches, smart bracelets, etc.).
  • PDA personal digital assistant
  • PC Personal Computer
  • FIG. 1 is a schematic flowchart of a search method according to an embodiment of the present invention, as shown in FIG. 1 .
  • execution entities of 101 to 104 may be applications located in the local terminal, or may be plug-ins or software development kits (SDKs) installed in applications located in the local terminal.
  • the functional unit may be a search engine located in the network side server, or may be a distributed system located on the network side, which is not specifically limited in this embodiment.
  • the application may be a local application (nativeApp) installed on the terminal, or may be a web application (webApp) of the browser on the terminal, which is not specifically limited in this embodiment.
  • the search keyword provided by the user may be specifically collected. Specifically, it can be implemented by a search command triggered by the user. Specifically, the search command may be triggered by using, but not limited to, the following methods:
  • the user can input the search keyword on the page displayed by the current application, and then trigger a search command by clicking a search button on the page, for example, Baidu.
  • the search keyword is included in the command.
  • the order in which the user inputs the search keyword may be in any order.
  • the search keyword contained therein can be parsed.
  • asynchronous loading technology for example, Ajax asynchronous loading or Jsonp asynchronous loading, etc.
  • real-time acquisition of input content input by the user on the page displayed by the current application in order to distinguish from the search keyword, the input content at this time may be referred to as input.
  • the order in which the user inputs the search keyword may be in any order.
  • an interface such as an Ajax interface or a Jsonp interface may be provided.
  • the interfaces may be written in a language such as Java or a Hypertext Preprocessor (PHP) language, and the specific call may be in a language such as Jquery or native JavaScript. Write it.
  • PGP Hypertext Preprocessor
  • Mode 3 The user can press the voice search button on the page displayed by the current application to say the voice content that he wants to input, and then release the voice search button to trigger a search command, which is included in the search command.
  • the search keyword contained therein can be parsed.
  • Method 4 The user can speak the voice content to be input by clicking the voice search button on the page displayed by the current application, and the voice content is to be ended for a period of time, for example, after 2 seconds, the search command is triggered, the search is triggered.
  • the command contains a search keyword in the form of text converted according to the spoken content.
  • the search keyword contained therein can be parsed.
  • search result corresponding to the search keyword is obtained by using an existing search method.
  • search method refers to related content in the prior art, and details are not described herein.
  • the potential requirement of the search keyword may be further obtained.
  • the potential requirement of the search keyword may be obtained according to the search keyword and the correspondence between the specified search keyword and the potential requirement.
  • the search keyword is matched with the specified search keyword. If the matching is successful, the potential demand corresponding to the matched specified search keyword may be queried in the corresponding relationship between the specified search keyword and the potential demand. As a potential requirement for the search keyword.
  • offline mining can meet the demand mining of popular search keywords.
  • the user history behavior data related to the specified search keyword may be acquired, and further, the historical requirement of the specified search keyword may be obtained according to the user historical behavior data. Then, according to the historical requirement, the potential demand corresponding to the specified search keyword may be obtained, and the corresponding relationship between the specified search keyword and the potential requirement may be established.
  • the Session segment is a logical meaning, which represents a user's behavior intention in a certain period of time. From the perspective of the user's browsing behavior, the Session segment can be specifically stipulated as a continuous retrieval behavior with semantically the same association.
  • LAT Lexical Answer Type
  • Another method is a part-of-speech template matching method. For example, a word template combination of a search keyword "noun + stop word + noun" is specified, and a suffix noun can be used as a demand word, that is, a historical requirement of the specified search keyword. .
  • the historical demand corresponding to the specified search keyword may be aggregated to obtain the historical requirement of the aggregation.
  • the "treatment method” and the “treatment plan” may be aggregated.
  • the first method is a synonym judgment method that judges whether two historical needs are the same demand expression method through a synonym table
  • the second method is the correlation calculation method. We can judge whether the expression is the same under the same demand by calculating the degree of correlation between the two demand words.
  • the third method is a statistical method based on the annotation data.
  • the specific requirement of this method is to label a batch of already aggregated data, and then cluster by model clustering.
  • the historical requirements of these aggregates are normalized to obtain normalized aggregated requirements, historical requirements that have not been aggregated, and normalized
  • the aggregated demand is the potential demand corresponding to the specified keyword.
  • the historical demand for the specified search keyword is obtained.
  • the correspondence between the specified search keyword and the potential demand may be further established.
  • the correspondence may be specifically stored in a storage device of the terminal.
  • the storage device of the terminal may be a slow storage device, specifically a hard disk of the computer system, or may be a non-operating memory of the mobile phone, that is, physical memory, for example, a read-only memory (ROM) and
  • ROM read-only memory
  • the memory card or the like is not particularly limited in this embodiment.
  • the storage device of the terminal may also be a fast storage device, which may be a memory of the computer system, or may be a running memory of the mobile phone, that is, a system memory, such as a random access memory (RAM).
  • a fast storage device which may be a memory of the computer system, or may be a running memory of the mobile phone, that is, a system memory, such as a random access memory (RAM).
  • RAM random access memory
  • the potential requirement to which the search result belongs may be obtained according to the search result as a potential requirement of the search keyword.
  • online mining can solve the demand mining of medium and long cold search keywords.
  • the search requirement to which the search result belongs may be obtained according to the search result, and further, the potential demand of the search keyword may be obtained according to the search requirement.
  • LAT Lexical Answer Type
  • pages can be Web pages based on HyperText Markup Language (HTML), ie HTML pages, or can be based on Web pages written in the HTML and Java languages, that is, Java Server Pages (JSPs), or web pages that can also be written in other programming languages are not specifically limited in this embodiment.
  • HTML HyperText Markup Language
  • JSPs Java Server Pages
  • the page may include a display block defined by one or more page tags, such as HyperText Markup Language (HTML) tags, JSP tags, etc., called page elements, for example, text, pictures, super
  • page tags such as HyperText Markup Language (HTML) tags, JSP tags, etc.
  • page elements for example, text, pictures, super
  • HTML HyperText Markup Language
  • JSP tags JSP tags
  • page elements for example, text, pictures, super
  • the link, the button, the edit box, the drop-down box, and the like are not particularly limited in this embodiment.
  • the search demand corresponding to the search result may be aggregated to obtain an aggregated search requirement.
  • the “treatment method” and the “treatment plan” may be aggregated to obtain The result of the polymerization of "therapeutic methods". Specifically, three methods can be specifically used for the polymerization process.
  • the first method is a synonym judgment method for judging whether two search requirements are expression methods of the same requirement through a synonym table
  • the second method is the correlation calculation method. We can judge whether the expression is the same under the same demand by calculating the degree of correlation between the two demand words.
  • the third method is a statistical method based on the annotation data.
  • the specific requirement of this method is to label a batch of already aggregated data, and then cluster by model clustering.
  • Another method which is a non-LAT method, is to search for the result of the case where the result is empty for the previous method.
  • the advantage of this approach is that this advantage lies in the fact that we abstract the representation of the user from the content side, reducing the user's own induction process, helping users improve search efficiency.
  • One of the methods is the serial number labeling method, which first extracts the serial number labels in the page corresponding to the search result, and then calculates the correlation between the content of the serial number labels (for example, short sentences, etc.) and the Title of the page. If the correlation is greater than or equal to a preset threshold, indicating that the content is a subtitle of the page, then the content may be used as a search requirement for the search result.
  • the serial number labeling method which first extracts the serial number labels in the page corresponding to the search result, and then calculates the correlation between the content of the serial number labels (for example, short sentences, etc.) and the Title of the page. If the correlation is greater than or equal to a preset threshold, indicating that the content is a subtitle of the page, then the content may be used as a search requirement for the search result.
  • the second method is the topic segmentation method.
  • a single page does not contain subtitle information, at this time, it depends on the topic segmentation technique. Its purpose is to summarize the paragraphs in the page, and then perform theme extraction. Then, the topic extracted by each paragraph is used as a search requirement for the search result.
  • the search demand corresponding to the search result may be aggregated to obtain an aggregated search requirement.
  • the “treatment method” and the “treatment plan” may be aggregated to obtain The result of the polymerization of "therapeutic methods". Specifically, three methods can be specifically used for the polymerization process.
  • the first method is a synonym judgment method for judging whether two search requirements are expression methods of the same requirement through a synonym table
  • the second method is the correlation calculation method. We can judge whether the expression is the same under the same demand by calculating the degree of correlation between the two demand words.
  • the third method is a statistical method based on the annotation data.
  • the specific requirement of this method is to label a batch of already aggregated data, and then cluster by model clustering.
  • the search requirements of these aggregates are normalized to obtain normalized aggregate requirements, search requirements that are not aggregated, and normalized aggregate requirements as search keywords. Potential demand.
  • the search result clustered by the potential requirement may be output in a specified area in the search result page.
  • the search results clustered under the two potential demands corresponding to the search keyword are respectively output.
  • other search results can be output in order according to the existing rules.
  • the indication information may be further outputted to output the potential result while the search result clustered under the potential requirement is output.
  • the search result is obtained according to the acquired search keyword, and then the search result is clustered under the potential requirement of the search keyword, so that the clustered by the potential demand can be output.
  • Search results because considering that the user may have a certain aspect or several aspects, the search results corresponding to the search keyword are clustered to one or several potential requirements of the search keyword, which can make Users can easily obtain a type of content clustered under a certain potential demand, which can effectively meet the relevant needs of users in the search process.
  • the technical solution provided by the present invention can effectively improve the user experience.
  • FIG. 2 is a schematic structural diagram of a search apparatus according to another embodiment of the present invention, as shown in FIG. 2 .
  • the search device of the present embodiment may include an acquisition unit 21, a processing unit 22, a clustering unit 23, and an output unit 24.
  • the obtaining unit 21 is configured to acquire a search keyword
  • the processing unit 22 is configured to obtain a search result according to the search keyword
  • the clustering unit 23 is configured to cluster the search result to the search key.
  • the output unit 24 is configured to output the search result clustered under the potential demand.
  • part or all of the search apparatus provided in this embodiment may be an application located in a local terminal, or may be a plug-in or a software development kit (SDK) installed in an application located in the local terminal.
  • the functional unit may be a search engine located in the network side server, or may be a distributed system located on the network side, which is not specifically limited in this embodiment.
  • the application may be a local application (nativeApp) installed on the terminal, or may be a web application (webApp) of the browser on the terminal, which is not specifically limited in this embodiment.
  • the clustering unit 23 may also be used to obtain a potential requirement of the search keyword.
  • the clustering unit 23 may be specifically configured to obtain a potential requirement of the search keyword according to the search keyword and a correspondence between a specified search keyword and a potential requirement.
  • the clustering unit 23 may be further configured to acquire user historical behavior data related to the specified search keyword; and obtain historical requirements of the specified search keyword according to the user historical behavior data; The historical requirement, obtaining a potential demand corresponding to the specified search keyword; and establishing a correspondence between the specified search keyword and a potential requirement.
  • the clustering unit 23 may be specifically configured to obtain, according to the search result, a potential requirement to which the search result belongs, as a potential requirement of the search keyword.
  • the clustering unit 23 may be specifically configured to obtain, according to the search result, a search requirement to which the search result belongs; and obtain a potential requirement of the search keyword according to the search requirement.
  • the output unit 24 may be specifically configured to output the search result clustered by the potential requirement in a specified area in the search result page.
  • the processing unit obtains, according to the search keyword acquired by the acquiring unit, Search results, and then the clustering unit clusters the search results under the potential demand of the search keywords, so that the output unit can output the search results clustered under the potential demand, considering that the user may There will be a certain aspect or several aspects of the requirement. Therefore, clustering the search results corresponding to the search keyword into one or several potential requirements of the search keyword can make the user easily obtain the cluster in a certain A type of content under potential demand can effectively meet the relevant needs of users in the search process.
  • the technical solution provided by the present invention can effectively improve the user experience.
  • the disclosed system, apparatus, and method may be implemented in other manners.
  • the device embodiments described above are merely illustrative.
  • the division of the unit is only a logical function division.
  • multiple units or components may be combined. Or it can be integrated into another system, or some features can be ignored or not executed.
  • the mutual coupling or direct coupling or communication connection shown or discussed may be an indirect coupling or communication connection through some interface, device or unit, and may be in an electrical, mechanical or other form.
  • the units described as separate components may or may not be physically separated, and the components displayed as units may or may not be physical units, that is, may be located in one place, or may be distributed to multiple network units. Some or all of the units may be selected according to actual needs to achieve the purpose of the solution of the embodiment.
  • each functional unit in various embodiments of the present invention may be integrated into one processing order In the meta element, each unit may exist physically separately, or two or more units may be integrated into one unit.
  • the above integrated unit can be implemented in the form of hardware or in the form of hardware plus software functional units.
  • the above-described integrated unit implemented in the form of a software functional unit can be stored in a computer readable storage medium.
  • the above software functional unit is stored in a storage medium and includes instructions for causing a computer device (which may be a personal computer, a server, or a network device, etc.) or a processor to perform the methods of the various embodiments of the present invention. Part of the steps.
  • the foregoing storage medium includes: a U disk, a mobile hard disk, a read-only memory (ROM), a random access memory (RAM), a magnetic disk, or an optical disk, and the like, which can store program codes. .

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种搜索方法、装置、设备及非易失性计算机存储介质。本发明实施例通过根据所获取的搜索关键词,获得搜索结果,进而将所述搜索结果,聚类到所述搜索关键词的潜在需求下,使得能够输出所述潜在需求下所聚类的搜索结果,由于考虑到用户可能会具有某一个方面或者几个方面的需求,因此,将搜索关键词所对应的搜索结果,聚类到该搜索关键词的一个或几个潜在需求下,能够使得用户很容易获得聚类在某个潜在需求下的一类内容,能够有效满足用户在搜索过程中出现的相关需求。

Description

搜索方法、装置、设备及非易失性计算机存储介质
本申请要求了申请日为2016年05月24日,申请号为201610348789.9发明名称为“搜索方法及装置”的中国专利申请的优先权。
技术领域
本发明涉及互联网技术,特别涉及一种搜索方法、装置、设备及非易失性计算机存储介质。
背景技术
搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供搜索服务,将用户搜索相关的信息展示给用户的系统。据国家统计局的报道,中国网民人数已经超过了4亿,这个数据意味着中国已经超过美国成为世界上第一大网民国,且中国的网站总数量已经超过了200万。因此,如何利用搜索服务最大限度满足用户需求,对于互联网企业而言,始终是一个重要的课题。用户在使用简单的搜索关键词(query)进行搜索时,可能会具有某一个方面或者几个方面的需求例如,搜索关键词为糖尿病,其需求可能是糖尿病的饮食相关的一些内容,而不是其他包含糖尿病的内容等。
因此,亟需提供一种搜索方法,满足用户在搜索过程中出现的相关需求。
发明内容
本发明的多个方面提供一种搜索方法、装置、设备及非易失性计算机存储介质,用以满足用户在搜索过程中出现的相关需求。
本发明的一方面,提供一种搜索方法,包括:
获取搜索关键词;
根据所述搜索关键词,获得搜索结果;
将所述搜索结果,聚类到所述搜索关键词的潜在需求下;
输出所述潜在需求下所聚类的搜索结果。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述将所述搜索结果,聚类到所述搜索关键词的潜在需求下之前,还包括:
获得所述搜索关键词的潜在需求。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述获得所述搜索关键词的潜在需求,包括:
根据所述搜索关键词,以及指定搜索关键词与潜在需求的对应关系,获得所述搜索关键词的潜在需求。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据所述搜索关键词,以及指定搜索关键词与潜在需求的对应关系,获得所述搜索关键词的潜在需求之前,还包括:
获取所述指定搜索关键词相关的用户历史行为数据;
根据所述用户历史行为数据,获得所述指定搜索关键词的历史需求;
根据所述历史需求,获得所述指定搜索关键词所对应的潜在需求;
建立所述指定搜索关键词与潜在需求的对应关系。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述获得所述搜索关键词的潜在需求,包括:
根据所述搜索结果,获得所述搜索结果所属的潜在需求,以作为所述搜索关键词的潜在需求。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据所述搜索结果,获得所述搜索结果所属的潜在需求,以作为所述搜索关键词的潜在需求,包括:
根据所述搜索结果,获得所述搜索结果所属的搜索需求;
根据所述搜索需求,获得所述搜索关键词的潜在需求。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述输出所述潜在需求下所聚类的搜索结果,包括:
在搜索结果页中的指定区域,输出所述潜在需求下所聚类的搜索结果。
本发明的另一方面,提供一种搜索装置,包括:
获取单元,用于获取搜索关键词;
处理单元,用于根据所述搜索关键词,获得搜索结果;
聚类单元,用于将所述搜索结果,聚类到所述搜索关键词的潜在需求下;
输出单元,用于输出所述潜在需求下所聚类的搜索结果。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述聚类单元,还用于
获得所述搜索关键词的潜在需求。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述聚类单元,具体用于
根据所述搜索关键词,以及指定搜索关键词与潜在需求的对应关系,获得所述搜索关键词的潜在需求。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述聚类单元,还用于
获取所述指定搜索关键词相关的用户历史行为数据;
根据所述用户历史行为数据,获得所述指定搜索关键词的历史需求;
根据所述历史需求,获得所述指定搜索关键词所对应的潜在需求;以及
建立所述指定搜索关键词与潜在需求的对应关系。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式, 所述聚类单元,具体用于
根据所述搜索结果,获得所述搜索结果所属的潜在需求,以作为所述搜索关键词的潜在需求。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述聚类单元,具体用于
根据所述搜索结果,获得所述搜索结果所属的搜索需求;以及
根据所述搜索需求,获得所述搜索关键词的潜在需求。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述输出单元,具体用于
在搜索结果页中的指定区域,输出所述潜在需求下所聚类的搜索结果。
本发明的另一方面,提供一种设备,包括:
一个或者多个处理器;
存储器;
一个或者多个程序,所述一个或者多个程序存储在所述存储器中,当被所述一个或者多个处理器执行时:
获取搜索关键词;
根据所述搜索关键词,获得搜索结果;
将所述搜索结果,聚类到所述搜索关键词的潜在需求下;
输出所述潜在需求下所聚类的搜索结果。
本发明的另一方面,提供一种非易失性计算机存储介质,所述非易失性计算机存储介质存储有一个或者多个程序,当所述一个或者多个程序被一个设备执行时,使得所述设备:
获取搜索关键词;
根据所述搜索关键词,获得搜索结果;
将所述搜索结果,聚类到所述搜索关键词的潜在需求下;
输出所述潜在需求下所聚类的搜索结果。
由上述技术方案可知,本发明实施例通过根据所获取的搜索关键词,获得搜索结果,进而将所述搜索结果,聚类到所述搜索关键词的潜在需求下,使得能够输出所述潜在需求下所聚类的搜索结果,由于考虑到用户可能会具有某一个方面或者几个方面的需求,因此,将搜索关键词所对应的搜索结果,聚类到该搜索关键词的一个或几个潜在需求下,能够使得用户很容易获得聚类在某个潜在需求下的一类内容,能够有效满足用户在搜索过程中出现的相关需求。
另外,采用本发明所提供的技术方案,能够有效地提高用户的体验。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲, 在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一实施例提供的搜索方法的流程示意图;
图2为本发明另一实施例提供的搜索装置的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的全部其他实施例,都属于本发明保护的范围。
需要说明的是,本发明实施例中所涉及的终端可以包括但不限于手机、个人数字助理(Personal Digital Assistant,PDA)、无线手持设备、平板电脑(Tablet Computer)、个人电脑(Personal Computer,PC)、MP3播放器、MP4播放器、可穿戴设备(例如,智能眼镜、智能手表、智能手环等)等。
另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
图1为本发明一实施例提供的搜索方法的流程示意图,如图1所示。
101、获取搜索关键词。
102、根据所述搜索关键词,获得搜索结果。
103、将所述搜索结果,聚类到所述搜索关键词的潜在需求下。
104、输出所述潜在需求下所聚类的搜索结果。
需要说明的是,101~104的执行主体的部分或全部可以为位于本地终端的应用,或者还可以为设置在位于本地终端的应用中的插件或软件开发工具包(Software Development Kit,SDK)等功能单元,或者还可以为位于网络侧服务器中的搜索引擎,或者还可以为位于网络侧的分布式系统,本实施例对此不进行特别限定。
可以理解的是,所述应用可以是安装在终端上的本地程序(nativeApp),或者还可以是终端上的浏览器的一个网页程序(webApp),本实施例对此不进行特别限定。
这样,通过根据所获取的搜索关键词,获得搜索结果,进而将所述搜索结果,聚类到所述搜索关键词的潜在需求下,使得能够输出所述潜在需求下所聚类的搜索结果,由于考虑到用户可能会具有某一个方面或者几个方面的需求,因此,将搜索关键词所对应的搜索结果,聚类到该搜索关键词的一个或几个潜在需求下,能够使得用户很容易获得聚类在某个潜在需求下的一类内容,能够有效满足用户在搜索过程中出现的相关需求。
可选地,在本实施例的一个可能的实现方式中,在101中,具体可以采集用户所提供的所述搜索关键词。具体来说,具体可以通过用户所触发的搜索命令实现。具体可以采用但不限于下述几种方式触发搜索命令:
方式一:
用户可以在当前应用所展现的页面上所输入所述搜索关键词,然后,通过点击该页面上的搜索按钮例如,百度一下,以触发搜索命令,该搜 索命令中包含所述搜索关键词。其中,用户输入所述搜索关键词的顺序可以为任意顺序。这样,在接收到该搜索命令之后,则可以解析出其中所包含的所述搜索关键词。
方式二:
采用异步加载技术例如,Ajax异步加载或Jsonp异步加载等,实时获取用户在当前应用所展现的页面上所输入的输入内容,为了与搜索关键词进行区分,此时的输入内容可以称为是输入关键词。其中,用户输入所述搜索关键词的顺序可以为任意顺序。具体地,具体可以提供Ajax接口或Jsonp接口等接口,这些接口可以使用Java、超级文本预处理(Hypertext Preprocessor,PHP)语言等语言进行编写,其具体的调用可以使用Jquery,或者原生的JavaScript等语言进行编写。
方式三:用户可以通过长按当前应用所展现的页面上的语音搜索按钮,说出想要输入的语音内容,然后,松开语音搜索按钮,以触发搜索命令,该搜索命令中包含根据所说出的语音内容转换的文本形式的搜索关键词。这样,在接收到该搜索命令之后,则可以解析出其中所包含的所述搜索关键词。
方式四:用户可以通过点击当前应用所展现的页面上的语音搜索按钮,说出想要输入的语音内容,待结束说出语音内容一段时间例如,2秒钟之后,则触发搜索命令,该搜索命令中包含根据所说出的语音内容转换的文本形式的搜索关键词。这样,在接收到该搜索命令之后,则可以解析出其中所包含的所述搜索关键词。
在获取到所述输入关键词之后,则可以执行后续操作即102~104。
可选地,在本实施例的一个可能的实现方式中,在102中,具体可 以采用现有的搜索方法,获得与所述搜索关键词,对应的搜索结果。详细描述可以参见现有技术中的相关内容,此处不在赘述。
可选地,在本实施例的一个可能的实现方式中,在103之前,还可以进一步获得所述搜索关键词的潜在需求。
在一个具体的实现过程中,具体可以根据所述搜索关键词,以及指定搜索关键词与潜在需求的对应关系,获得所述搜索关键词的潜在需求。首先,利用所述搜索关键词与指定搜索关键词进行匹配,如果匹配成功,则可以在指定搜索关键词与潜在需求的对应关系中,查询所匹配的指定搜索关键词所对应的潜在需求,以作为所述搜索关键词的潜在需求。
具体来说,在该实现过程之前,还需要进一步的预先建立所述指定搜索关键词与潜在需求的对应关系。这种方法中,离线的挖掘,能满足热门搜索关键词的需求挖掘。
具体地,具体可以获取所述指定搜索关键词相关的用户历史行为数据,进而,则可以根据所述用户历史行为数据,获得所述指定搜索关键词的历史需求。然后,可以根据所述历史需求,获得所述指定搜索关键词所对应的潜在需求,并建立所述指定搜索关键词与潜在需求的对应关系。
这里,指定搜索关键词相关的用户历史行为数据的采集,可以依赖于用户的用户意图(Session)段数据。其中,Session段是一个逻辑意义,它代表一个用户在某段时间内的一个行为意图,从用户的浏览行为来看,Session段具体可以规约成在语义上具有相同关联的连续检索行为。
首先,需要从Session段数据中,挖掘出用户的需求变化,其次, 还需要根据统一资源定位符(Uniform Resource Locator,URL)的点击信息,获得搜索关键词的变化。这样,就能够获得一个搜索关键词下,大部份的需求变化所产出的指定搜索关键词。
接着,可以利用两种方法,获得指定搜索关键词的历史需求。
一种方法,是词汇回答类型(Lexical Answer Type,LAT)方法,例如,指定搜索关键词“糖尿病的诊疗方法”对应的LAT是“治疗方法”,即为该指定搜索关键词的历史需求。
另一种方法,是词性模板搭配方法,例如,指定搜索关键词“名词+停用词+名词”这样的词性模板搭配,可以将后缀名词作为需求词,即为该指定搜索关键词的历史需求。
在获得指定搜索关键词的历史需求之后,则可以对指定搜索关键词所对应的历史需求,进行聚合处理,以获得聚合的历史需求,例如,可以将“治疗方法”和“治疗方案”进行聚合处理,以获得“治疗方法”这一聚合结果。具体地,具体可以采用三种方法,进行聚合处理。
第一种方法,是同义词判断方法,通过同义词表,判断两个历史需求是否是同一个需求的表达方法;
第二种方法,是相关性计算方法,我们可以通过计算两个需求词在词面上的相关程度来判断是否是同一个需求下的表达方式;
第三种方法,是基于统计的方法,依赖于标注数据,这种方法的具体要求是先标注一批已经聚合好的数据,然后,通过模型聚类的方法进行聚类。
在获得聚合的历史需求之后,对这些聚合的历史需求进行归一化处理,以获得归一化的聚合需求,将没有经过聚合的历史需求,以及归一 化的聚合需求,作为该指定关键词所对应的潜在需求。
这样,就获取到了指定搜索关键词的历史需求。基于所获得的指定搜索关键词的历史需求,可以进一步建立所述指定搜索关键词与潜在需求的对应关系。具体来说,具体可以将该对应关系,存储到终端的存储设备中。
例如,所述终端的存储设备可以为慢速存储设备,具体可以为计算机系统的硬盘,或者还可以为手机的非运行内存即物理内存,例如,只读存储器(Read-Only Memory,ROM)和内存卡等,本实施例对此不进行特别限定。
或者,再例如,所述终端的存储设备还可以为快速存储设备,具体可以为计算机系统的内存,或者还可以为手机的运行内存即系统内存,例如,随机存储器(Random Access Memory,RAM)等,本实施例对此不进行特别限定。
在另一个具体的实现过程中,具体可以根据所述搜索结果,获得所述搜索结果所属的潜在需求,以作为所述搜索关键词的潜在需求。这种方法中,在线的挖掘,能够解决中长冷搜索关键词的需求挖掘。
具体来说,具体可以根据所述搜索结果,获得所述搜索结果所属的搜索需求,进而,则可以根据所述搜索需求,获得所述搜索关键词的潜在需求。
对于一个搜索结果来说,可以采用两种方法,获得其所属的搜索需求。
一种方法,是词汇回答类型(Lexical Answer Type,LAT)方法。
具体来说,首先,可以对搜索结果所对应的页面的标题(Title), 进行LAT分析,然后,对页面的Title,进行问题类型分析。将上述两次分析的结果,综合计算一个该搜索结果的搜索需求。所谓的页面,有时也可以称为万维网(World Wide Web,Web)页面,可以是基于超文本标记语言(HyperText Markup Language,HTML)编写的网页(Web Page),即HTML页面,或者还可以是基于HTML和Java语言编写的网页,即Java服务器页面(Java Server Page,JSP),或者还可以为其他编程语言编写的网页,本实施例对此不进行特别限定。
具体地,页面可以包括由一个或者多个页面标签例如,超文本标记语言(HyperText Markup Language,HTML)标签、JSP标签等,定义的显示区块,称为页面元素,例如,文本、图片、超链接、按钮、编辑框、下拉框等,本实施例对此不进行特别限定。
在获得搜索结果的搜索需求之后,则可以对搜索结果所对应的搜索需求,进行聚合处理,以获得聚合的搜索需求,例如,可以将“治疗方法”和“治疗方案”进行聚合处理,以获得“治疗方法”这一聚合结果。具体地,具体可以采用三种方法,进行聚合处理。
第一种方法,是同义词判断方法,通过同义词表,判断两个搜索需求是否是同一个需求的表达方法;
第二种方法,是相关性计算方法,我们可以通过计算两个需求词在词面上的相关程度来判断是否是同一个需求下的表达方式;
第三种方法,是基于统计的方法,依赖于标注数据,这种方法的具体要求是先标注一批已经聚合好的数据,然后,通过模型聚类的方法进行聚类。
在获得聚合的搜索需求之后,对这些聚合的搜索需求进行归一化处 理,以获得归一化的聚合需求,将没有经过聚合的搜索需求,以及归一化的聚合需求,作为搜索关键词的潜在需求。
另一种方法,是非LAT方法,针对上一种方法,获得结果为空的情况的搜索结果。这种方法的优势在于,这样的优势在于我们从内容端抽象的表征的用户的需求,减少了用户自己的归纳的过程,帮助用户提高了搜索效率。
具体来说,可以采用两种方法,获得这种情况下的搜索结果的搜索需求。
方法之一,是序号标签法,首先对搜索结果所对应的页面中的序号标签进行抽取,然后,计算这些序号标签后的内容(例如,短句等)与页面的Title之间的相关性,如果相关性大于或等于预先设置的阈值,说明该内容是页面的子标题,那么,则可以将该内容,作为该搜索结果的一个搜索需求。
方法之二,是主题切分法,单页面中不含有子标题信息时,此时,就需要依赖于主题切分技术,它的目的在于将页面中的段落进行归纳,然后,进行主题抽取,然后,将每个段落所抽取出的主题,作为该搜索结果的一个搜索需求。
在获得搜索结果的搜索需求之后,则可以对搜索结果所对应的搜索需求,进行聚合处理,以获得聚合的搜索需求,例如,可以将“治疗方法”和“治疗方案”进行聚合处理,以获得“治疗方法”这一聚合结果。具体地,具体可以采用三种方法,进行聚合处理。
第一种方法,是同义词判断方法,通过同义词表,判断两个搜索需求是否是同一个需求的表达方法;
第二种方法,是相关性计算方法,我们可以通过计算两个需求词在词面上的相关程度来判断是否是同一个需求下的表达方式;
第三种方法,是基于统计的方法,依赖于标注数据,这种方法的具体要求是先标注一批已经聚合好的数据,然后,通过模型聚类的方法进行聚类。
在获得聚合的搜索需求之后,对这些聚合的搜索需求进行归一化处理,以获得归一化的聚合需求,将没有经过聚合的搜索需求,以及归一化的聚合需求,作为搜索关键词的潜在需求。
可选地,在本实施例的一个可能的实现方式中,在104中,具体可以在搜索结果页中的指定区域,输出所述潜在需求下所聚类的搜索结果。例如,在搜索结果页的最上方,分别输出搜索关键词所对应的两个潜在需求下所聚类的搜索结果。在搜索结果页中除了指定区域之外的其他区域,可以按照现有的规则,依次输出其他的搜索结果。
进一步地,为了使得搜索结果具有更加清晰的可读性,在输出所述潜在需求下所聚类的搜索结果的同时,还可以进一步输出指示信息,以指示所述潜在需求。
本实施例中,通过根据所获取的搜索关键词,获得搜索结果,进而将所述搜索结果,聚类到所述搜索关键词的潜在需求下,使得能够输出所述潜在需求下所聚类的搜索结果,由于考虑到用户可能会具有某一个方面或者几个方面的需求,因此,将搜索关键词所对应的搜索结果,聚类到该搜索关键词的一个或几个潜在需求下,能够使得用户很容易获得聚类在某个潜在需求下的一类内容,能够有效满足用户在搜索过程中出现的相关需求。
另外,采用本发明所提供的技术方案,能够有效地提高用户的体验。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
图2为本发明另一实施例提供的搜索装置的结构示意图,如图2所示。本实施例的搜索装置可以包括获取单元21、处理单元22、聚类单元23和输出单元24。其中,获取单元21,用于获取搜索关键词;处理单元22,用于根据所述搜索关键词,获得搜索结果;聚类单元23,用于将所述搜索结果,聚类到所述搜索关键词的潜在需求下;输出单元24,用于输出所述潜在需求下所聚类的搜索结果。
需要说明的是,本实施例所提供的搜索装置的部分或全部可以为位于本地终端的应用,或者还可以为设置在位于本地终端的应用中的插件或软件开发工具包(Software Development Kit,SDK)等功能单元,或者还可以为位于网络侧服务器中的搜索引擎,或者还可以为位于网络侧的分布式系统,本实施例对此不进行特别限定。
可以理解的是,所述应用可以是安装在终端上的本地程序(nativeApp),或者还可以是终端上的浏览器的一个网页程序(webApp),本实施例对此不进行特别限定。
可选地,在本实施例的一个可能的实现方式中,所述聚类单元23,还可以用于获得所述搜索关键词的潜在需求。
在一个具体的实现过程中,所述聚类单元23,具体可以用于根据所述搜索关键词,以及指定搜索关键词与潜在需求的对应关系,获得所述搜索关键词的潜在需求。
具体来说,所述聚类单元23,还可以进一步用于获取所述指定搜索关键词相关的用户历史行为数据;根据所述用户历史行为数据,获得所述指定搜索关键词的历史需求;根据所述历史需求,获得所述指定搜索关键词所对应的潜在需求;以及建立所述指定搜索关键词与潜在需求的对应关系。
在另一个具体的实现过程中,所述聚类单元23,具体可以用于根据所述搜索结果,获得所述搜索结果所属的潜在需求,以作为所述搜索关键词的潜在需求。
具体来说,所述聚类单元23,具体可以用于根据所述搜索结果,获得所述搜索结果所属的搜索需求;以及根据所述搜索需求,获得所述搜索关键词的潜在需求。
可选地,在本实施例的一个可能的实现方式中,所述输出单元24,具体可以用于在搜索结果页中的指定区域,输出所述潜在需求下所聚类的搜索结果。
需要说明的是,图1对应的实施例中方法,可以由本实施例提供的搜索装置实现。详细描述可以参见图1对应的实施例中的相关内容,此处不再赘述。
本实施例中,通过处理单元根据获取单元所获取的搜索关键词,获 得搜索结果,进而由聚类单元将所述搜索结果,聚类到所述搜索关键词的潜在需求下,使得输出单元能够输出所述潜在需求下所聚类的搜索结果,由于考虑到用户可能会具有某一个方面或者几个方面的需求,因此,将搜索关键词所对应的搜索结果,聚类到该搜索关键词的一个或几个潜在需求下,能够使得用户很容易获得聚类在某个潜在需求下的一类内容,能够有效满足用户在搜索过程中出现的相关需求。
另外,采用本发明所提供的技术方案,能够有效地提高用户的体验。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单 元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机装置(可以是个人计算机,服务器,或者网络装置等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (16)

  1. 一种搜索方法,其特征在于,包括:
    获取搜索关键词;
    根据所述搜索关键词,获得搜索结果;
    将所述搜索结果,聚类到所述搜索关键词的潜在需求下;
    输出所述潜在需求下所聚类的搜索结果。
  2. 根据权利要求1所述的方法,其特征在于,所述将所述搜索结果,聚类到所述搜索关键词的潜在需求下之前,还包括:
    获得所述搜索关键词的潜在需求。
  3. 根据权利要求2所述的方法,其特征在于,所述获得所述搜索关键词的潜在需求,包括:
    根据所述搜索关键词,以及指定搜索关键词与潜在需求的对应关系,获得所述搜索关键词的潜在需求。
  4. 根据权利要求3所述的方法,其特征在于,所述根据所述搜索关键词,以及指定搜索关键词与潜在需求的对应关系,获得所述搜索关键词的潜在需求之前,还包括:
    获取所述指定搜索关键词相关的用户历史行为数据;
    根据所述用户历史行为数据,获得所述指定搜索关键词的历史需求;
    根据所述历史需求,获得所述指定搜索关键词所对应的潜在需求;
    建立所述指定搜索关键词与潜在需求的对应关系。
  5. 根据权利要求2所述的方法,其特征在于,所述获得所述搜索关键词的潜在需求,包括:
    根据所述搜索结果,获得所述搜索结果所属的潜在需求,以作为所 述搜索关键词的潜在需求。
  6. 根据权利要求5所述的方法,其特征在于,所述根据所述搜索结果,获得所述搜索结果所属的潜在需求,以作为所述搜索关键词的潜在需求,包括:
    根据所述搜索结果,获得所述搜索结果所属的搜索需求;
    根据所述搜索需求,获得所述搜索关键词的潜在需求。
  7. 根据权利要求1~6任一权利要求所述的方法,其特征在于,所述输出所述潜在需求下所聚类的搜索结果,包括:
    在搜索结果页中的指定区域,输出所述潜在需求下所聚类的搜索结果。
  8. 一种搜索装置,其特征在于,包括:
    获取单元,用于获取搜索关键词;
    处理单元,用于根据所述搜索关键词,获得搜索结果;
    聚类单元,用于将所述搜索结果,聚类到所述搜索关键词的潜在需求下;
    输出单元,用于输出所述潜在需求下所聚类的搜索结果。
  9. 根据权利要求8所述的装置,其特征在于,所述聚类单元,还用于
    获得所述搜索关键词的潜在需求。
  10. 根据权利要求9所述的装置,其特征在于,所述聚类单元,具体用于
    根据所述搜索关键词,以及指定搜索关键词与潜在需求的对应关系,获得所述搜索关键词的潜在需求。
  11. 根据权利要求10所述的装置,其特征在于,所述聚类单元,还用于
    获取所述指定搜索关键词相关的用户历史行为数据;
    根据所述用户历史行为数据,获得所述指定搜索关键词的历史需求;
    根据所述历史需求,获得所述指定搜索关键词所对应的潜在需求;以及
    建立所述指定搜索关键词与潜在需求的对应关系。
  12. 根据权利要求9所述的装置,其特征在于,所述聚类单元,具体用于
    根据所述搜索结果,获得所述搜索结果所属的潜在需求,以作为所述搜索关键词的潜在需求。
  13. 根据权利要求12所述的装置,其特征在于,所述聚类单元,具体用于
    根据所述搜索结果,获得所述搜索结果所属的搜索需求;以及
    根据所述搜索需求,获得所述搜索关键词的潜在需求。
  14. 根据权利要求8~13任一权利要求所述的装置,其特征在于,所述输出单元,具体用于
    在搜索结果页中的指定区域,输出所述潜在需求下所聚类的搜索结果。
  15. 一种设备,包括:
    一个或者多个处理器;
    存储器;
    一个或者多个程序,所述一个或者多个程序存储在所述存储器中, 当被所述一个或者多个处理器执行时:
    获取搜索关键词;
    根据所述搜索关键词,获得搜索结果;
    将所述搜索结果,聚类到所述搜索关键词的潜在需求下;
    输出所述潜在需求下所聚类的搜索结果。
  16. 一种非易失性计算机存储介质,所述非易失性计算机存储介质存储有一个或者多个程序,当所述一个或者多个程序被一个设备执行时,使得所述设备:
    获取搜索关键词;
    根据所述搜索关键词,获得搜索结果;
    将所述搜索结果,聚类到所述搜索关键词的潜在需求下;
    输出所述潜在需求下所聚类的搜索结果。
PCT/CN2016/096653 2016-05-24 2016-08-25 搜索方法、装置、设备及非易失性计算机存储介质 WO2017201904A1 (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US16/304,624 US20190303364A1 (en) 2016-05-24 2016-08-25 Searching method and apparatus, device and non-volatile computer storage medium

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201610348789.9 2016-05-24
CN201610348789.9A CN106021516A (zh) 2016-05-24 2016-05-24 搜索方法及装置

Publications (1)

Publication Number Publication Date
WO2017201904A1 true WO2017201904A1 (zh) 2017-11-30

Family

ID=57094029

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2016/096653 WO2017201904A1 (zh) 2016-05-24 2016-08-25 搜索方法、装置、设备及非易失性计算机存储介质

Country Status (3)

Country Link
US (1) US20190303364A1 (zh)
CN (1) CN106021516A (zh)
WO (1) WO2017201904A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10949613B2 (en) 2019-01-11 2021-03-16 International Business Machines Corporation Dynamic natural language processing
US10909180B2 (en) 2019-01-11 2021-02-02 International Business Machines Corporation Dynamic query processing and document retrieval

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101334784A (zh) * 2008-07-30 2008-12-31 施章祖 计算机辅助报告与知识库产生的方法
CN101996215A (zh) * 2009-08-27 2011-03-30 阿里巴巴集团控股有限公司 一种应用于电子商务网站的信息匹配方法和系统
CN102103595A (zh) * 2009-12-16 2011-06-22 吴桂荣 一种基于搜索引擎的群体智能系统
CN102184230A (zh) * 2011-05-11 2011-09-14 北京百度网讯科技有限公司 一种搜索结果的展示方法及装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7617176B2 (en) * 2004-07-13 2009-11-10 Microsoft Corporation Query-based snippet clustering for search result grouping
US7630972B2 (en) * 2007-01-05 2009-12-08 Yahoo! Inc. Clustered search processing
CN102722498B (zh) * 2011-03-31 2015-06-03 北京百度网讯科技有限公司 搜索引擎及其实现方法
CN103294814A (zh) * 2013-06-07 2013-09-11 百度在线网络技术(北京)有限公司 搜索结果推荐方法、系统和搜索引擎
CN103294815B (zh) * 2013-06-08 2017-06-06 北京邮电大学 基于关键字分类并有多种呈现方式的搜索引擎装置与方法
CN103399883B (zh) * 2013-07-19 2017-02-08 百度在线网络技术(北京)有限公司 根据用户兴趣点/关注点进行个性化推荐的方法和系统
CN103914554A (zh) * 2014-04-14 2014-07-09 百度在线网络技术(北京)有限公司 搜索推荐方法和装置
CN105095311B (zh) * 2014-05-22 2019-07-09 阿里巴巴集团控股有限公司 推广信息的处理方法、装置及系统
CN105159898B (zh) * 2014-06-12 2019-11-26 北京搜狗科技发展有限公司 一种搜索的方法和装置
US10089580B2 (en) * 2014-08-11 2018-10-02 Microsoft Technology Licensing, Llc Generating and using a knowledge-enhanced model

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101334784A (zh) * 2008-07-30 2008-12-31 施章祖 计算机辅助报告与知识库产生的方法
CN101996215A (zh) * 2009-08-27 2011-03-30 阿里巴巴集团控股有限公司 一种应用于电子商务网站的信息匹配方法和系统
CN102103595A (zh) * 2009-12-16 2011-06-22 吴桂荣 一种基于搜索引擎的群体智能系统
CN102184230A (zh) * 2011-05-11 2011-09-14 北京百度网讯科技有限公司 一种搜索结果的展示方法及装置

Also Published As

Publication number Publication date
CN106021516A (zh) 2016-10-12
US20190303364A1 (en) 2019-10-03

Similar Documents

Publication Publication Date Title
WO2018192491A1 (zh) 信息推送方法和装置
WO2018205389A1 (zh) 语音识别方法、系统、电子装置及介质
WO2016206210A1 (zh) 信息推送方法和装置
US20180365258A1 (en) Artificial intelligence-based searching method and apparatus, device and computer-readable storage medium
US10515147B2 (en) Using statistical language models for contextual lookup
WO2018149115A1 (zh) 用于提供搜索结果的方法和装置
CN110597952A (zh) 信息处理方法、服务器及计算机存储介质
WO2017206376A1 (zh) 搜索方法、装置及非易失性计算机存储介质
CN110377908B (zh) 语义理解方法、装置、设备及可读存储介质
US10083004B2 (en) Using voice-based web navigation to conserve cellular data
WO2016138767A1 (zh) 一种用于提供推荐信息的方法与设备
CN112989208B (zh) 一种信息推荐方法、装置、电子设备及存储介质
CN110427453B (zh) 数据的相似度计算方法、装置、计算机设备及存储介质
WO2021257178A1 (en) Provide knowledge answers for knowledge-intention queries
WO2021114634A1 (zh) 文本标注方法、设备及存储介质
US20220365956A1 (en) Method and apparatus for generating patent summary information, and electronic device and medium
CN106663123B (zh) 以评论为中心的新闻阅读器
CN110245357B (zh) 主实体识别方法和装置
WO2017201904A1 (zh) 搜索方法、装置、设备及非易失性计算机存储介质
RU2632126C1 (ru) Способ и система предоставления контекстуальной информации
US20230112385A1 (en) Method of obtaining event information, electronic device, and storage medium
US20130230248A1 (en) Ensuring validity of the bookmark reference in a collaborative bookmarking system
RU2711123C2 (ru) Способ и система компьютерной обработки одной или нескольких цитат в цифровых текстах для определения их автора
WO2019231635A1 (en) Method and apparatus for generating digest for broadcasting
CN115878768A (zh) 基于nlp的车险业务回话线索推荐方法及其相关设备

Legal Events

Date Code Title Description
NENP Non-entry into the national phase

Ref country code: DE

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 16902890

Country of ref document: EP

Kind code of ref document: A1

122 Ep: pct application non-entry in european phase

Ref document number: 16902890

Country of ref document: EP

Kind code of ref document: A1