JP2016115294A - Information retrieval method and device - Google Patents

Information retrieval method and device Download PDF

Info

Publication number
JP2016115294A
JP2016115294A JP2014255754A JP2014255754A JP2016115294A JP 2016115294 A JP2016115294 A JP 2016115294A JP 2014255754 A JP2014255754 A JP 2014255754A JP 2014255754 A JP2014255754 A JP 2014255754A JP 2016115294 A JP2016115294 A JP 2016115294A
Authority
JP
Japan
Prior art keywords
sentence
information
query
obtaining
present disclosure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014255754A
Other languages
Japanese (ja)
Other versions
JP6051366B2 (en
Inventor
ティンティン リ
Tingting Li
ティンティン リ
ウエイ ワン
Wei Wang
ウエイ ワン
シキ チャオ
Shiqi Zhao
シキ チャオ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to JP2014255754A priority Critical patent/JP6051366B2/en
Publication of JP2016115294A publication Critical patent/JP2016115294A/en
Application granted granted Critical
Publication of JP6051366B2 publication Critical patent/JP6051366B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

PROBLEM TO BE SOLVED: To provide an information retrieval method and an information retrieval device.SOLUTION: An information retrieval method includes: receiving a first query and acquiring a guidance sentence of intention explanation in accordance with the first query; receiving a second query updated in accordance with the guidance sentence of intention explanation and acquiring a retrieval result in accordance with the second query; replying a retrieval result to a client.SELECTED DRAWING: Figure 1

Description

本開示の実施形態は、一般的には、コンピュータネットワークの技術分野に関し、特に、情報検索方法及び情報検索デバイスに関する。   Embodiments of the present disclosure generally relate to the technical field of computer networks, and more particularly, to an information search method and an information search device.

コンピュータ技術の発展に伴い、インターネットアプリケーションはますます普及したので、ユーザは、検索エンジンを介して必要とするインターネットリソースを取得することができるようになった。現在、関連する検索方法では、ユーザはまずクエリを入力し、検索エンジンはクエリに関連付けられる検索結果を取得し、クライアントに検索結果を返答し、ユーザは最終的に返答される検索結果から必要なリソースを取得する。   With the development of computer technology, Internet applications have become more and more popular, allowing users to obtain the required Internet resources through search engines. Currently, with related search methods, the user first enters a query, the search engine retrieves the search results associated with the query, returns the search results to the client, and the user is required from the finally returned search results. Get a resource.

しかし、上記の検索方法によると、ユーザによって入力されるクエリが不明確又は不完全な語句であることが原因で、検索エンジンによって正確な回答が提供されない。同じリソースが提供されるとしても、ユーザがクエリの属する分野に精通していない場合、ユーザが検索を実行するためにクエリを何度も変更することが必要になり、このため、検索コストが飛躍的に高くなっても、取得される検索結果では、まだユーザの要求を満たすことができない。   However, according to the above search method, an accurate answer is not provided by the search engine because the query input by the user is an unclear or incomplete phrase. Even if the same resources are provided, if the user is not familiar with the domain to which the query belongs, the user will need to modify the query many times in order to perform the search, thus increasing the search cost. Even if the cost is high, the obtained search results still cannot satisfy the user's request.

本開示の実施形態は、少なくともある程度は、従来技術に存在する問題の少なくとも一つを解決しようとすることにある。   The embodiments of the present disclosure are intended to solve, at least in part, at least one of the problems existing in the prior art.

ゆえに、本開示の第1の目的は、ユーザの検索意図をガイドして明瞭にし、ユーザの検索意図を識別するためにサーチエンジンの精度を改善し、ユーザの要求を満たし、そして、ユーザ体験を改善することができる情報検索方法を提供することである。   Therefore, the first object of the present disclosure is to guide and clarify the user's search intention, improve the accuracy of the search engine to identify the user's search intention, satisfy the user's requirements, and enhance the user experience. It is to provide an information retrieval method that can be improved.

本開示の第2の目的は、情報検索デバイスを提供することである。   A second object of the present disclosure is to provide an information search device.

上記目的を達成するために、本開示の第1の側面の実施形態は、情報検索方法を提供する。本開示の実施形態に従った情報検索方法は、第1のクエリを受け、かつ、前記第1のクエリに従って意図説明のガイダンス文を取得し、前記意図説明のガイダンス文に従って更新される第2のクエリを受け、かつ、前記第2のクエリに従って検索結果を取得し、前記検索結果をクライアントに返答することを含む。   In order to achieve the above object, an embodiment of the first aspect of the present disclosure provides an information search method. The information search method according to the embodiment of the present disclosure receives a first query, acquires a guidance sentence for an intention explanation according to the first query, and is updated according to the guidance sentence for the intention explanation. Receiving a query, obtaining a search result according to the second query, and returning the search result to the client.

本開示の実施形態に従った情報検索方法によれば、検索エンジンによって提供される意図説明のガイダンス文が取得され、第1のクエリが意図説明のガイダンス文に従って更新され、ユーザの検索意図が明確にされた検索結果が第2のクエリなどの更新されるクエリに従って提供される。したがって、ユーザの検索意図を識別するための検索エンジンの精度が向上し、かつ、ユーザの要求が満たされ、こうして、ユーザ体験は改善される。   According to the information search method according to the embodiment of the present disclosure, the guidance sentence of the intention explanation provided by the search engine is acquired, the first query is updated according to the guidance sentence of the intention explanation, and the search intention of the user is clear. Search results are provided according to an updated query, such as a second query. Thus, the accuracy of the search engine for identifying the user's search intention is improved and the user's requirements are met, thus improving the user experience.

本開示の第2の側面の実施形態は、情報検索デバイスを提供する。本開示の実施形態に係る情報検索デバイスは、第1のクエリを受け、かつ、前記第1のクエリに従って意図説明のガイダンス文を取得するように構成される第1の取得モジュールと、前記意図説明のガイダンス文に従って更新される第2のクエリを受け、かつ、前記第2のクエリに従って検索結果を取得するように構成される第2の取得モジュールと、前記検索結果を返答するように構成される返答モジュールと、を備える。   An embodiment of the second aspect of the present disclosure provides an information retrieval device. An information search device according to an embodiment of the present disclosure receives a first query and is configured to acquire a guidance sentence of an intention description according to the first query; and the intention description A second acquisition module configured to receive the second query updated according to the guidance sentence and to acquire the search result according to the second query, and to respond the search result A response module.

本開示の実施形態に従った情報検索デバイスによれば、検索エンジンによって提供される意図説明のガイダンス文が取得され、第1のクエリが意図説明のガイダンス文に従って更新され、ユーザの検索意図が明確にされた検索結果が第2のクエリなどの更新されるクエリに従って提供される。したがって、ユーザの検索意図を識別するための検索エンジンの精度が向上し、かつ、ユーザの要求が満たされ、こうして、ユーザ体験は改善される。   According to the information search device according to the embodiment of the present disclosure, the guidance sentence of the intention explanation provided by the search engine is acquired, the first query is updated according to the guidance sentence of the intention explanation, and the search intention of the user is clear. Search results are provided according to an updated query, such as a second query. Thus, the accuracy of the search engine for identifying the user's search intention is improved and the user's requirements are met, thus improving the user experience.

本開示の第3の観点の実施形態は、コンピュータ可読記憶媒体を提供する。このコンピュータ可読記憶媒体は、コンピュータ上で実行される、本開示の第1の観点の実施形態に従った情報検索方法を実行するためのコンピュータプログラムを含む。   An embodiment of the third aspect of the present disclosure provides a computer readable storage medium. The computer-readable storage medium includes a computer program for executing an information retrieval method according to an embodiment of the first aspect of the present disclosure, which is executed on a computer.

本開示の実施形態のさらなる側面及び利点は、以下の説明において部分的に与えられることによって部分的に明らかになるであろうし、又は、本開示の実施例から知ることができるであろう。   Further aspects and advantages of the embodiments of the present disclosure will become apparent in part by being given in part in the following description, or may be learned from the examples of the present disclosure.

本開示の実施形態に従った情報検索方法を示すフローチャートである。5 is a flowchart illustrating an information search method according to an embodiment of the present disclosure. 本開示の実施形態に従った情報検索方法における文ライブラリの構築を示すフローチャートである。5 is a flowchart showing the construction of a sentence library in the information search method according to the embodiment of the present disclosure. 本開示の実施形態に従った情報検索方法における第1のクエリに従って意図説明のガイダンス文の取得を示すフローチャートである。It is a flowchart which shows acquisition of the guidance sentence of intention description according to the 1st query in the information search method according to the embodiment of the present disclosure. 本開示の実施形態に従った情報検索方法を示すフローチャートである。5 is a flowchart illustrating an information search method according to an embodiment of the present disclosure. 本開示の実施形態に従った情報検索方法におけるコミュニティベースのQ&Aリソースに基づく対話型文のペアの取得効果を示す模式図である。It is a schematic diagram which shows the acquisition effect of the interactive sentence pair based on the community-based Q & A resource in the information search method according to the embodiment of the present disclosure. 本開示の実施形態に従った情報検索方法における意図説明のガイダンス文の取得効果を示す模式図である。It is a schematic diagram which shows the acquisition effect of the guidance sentence of the intention description in the information search method according to embodiment of this indication. 本開示の実施形態に従った情報検索方法における意図説明のガイダンス文に従って更新される第2のクエリに従った検索結果の取得効果を示す模式図である。It is a schematic diagram which shows the acquisition effect of the search result according to the 2nd query updated according to the guidance sentence of the intention description in the information search method according to embodiment of this indication. 本開示の実施形態に従った情報検索デバイスを示すブロック図である。1 is a block diagram illustrating an information retrieval device according to an embodiment of the present disclosure. FIG.

本開示の実施形態の種々の側面及び利点は、添付の図面を参照する以下の説明から、明らかとなり、また、より容易に理解されるであろう。   Various aspects and advantages of embodiments of the present disclosure will become apparent and more readily appreciated from the following description, with reference to the accompanying drawings.

本開示の実施形態は、例示として、詳細に言及されるであろう。本開示の実施形態は、同一又は類似の要素及び同一又は類似の機能を有する要素には、説明全体を通じて同じ参照符号が付されて図面に示されるであろう。図面に従って本明細書に記載された実施形態は、本開示を限定しない実例かつ説明である。   Embodiments of the present disclosure will be described in detail by way of example. In the embodiments of the present disclosure, elements having the same or similar functions and elements having the same or similar functions will be denoted by the same reference numerals throughout the description. The embodiments described herein according to the drawings are illustrative and non-limiting examples of the disclosure.

図1は、本開示の実施形態に従った情報検索方法を示すフローチャートである。図1に示すように、この情報検索方法は、以下のステップを含む。   FIG. 1 is a flowchart illustrating an information search method according to an embodiment of the present disclosure. As shown in FIG. 1, this information retrieval method includes the following steps.

ステップS101では、第1のクエリが受けられ、かつ、第1のクエリに従って意図説明のガイダンス文が取得される。   In step S101, the first query is received, and the guidance sentence for the intention explanation is acquired according to the first query.

本開示のいくつかの実施形態では、第1のクエリは、用語や文を含むことできる。文ライブラリは、検索エンジンが意図説明のガイダンス文を取得すべく文ライブラリを検索できるように、意図説明のガイダンス文が第1のクエリに従って取得される前に、確立されているとよい。いくつかの実施形態では、文ライブラリが事前に確立されている場合に、文ライブラリを確立するステップを回避してもよい。   In some embodiments of the present disclosure, the first query can include terms and sentences. The sentence library may be established before the intent explanation guidance text is obtained according to the first query so that the search engine can search the sentence library to obtain the intent explanation guidance text. In some embodiments, the step of establishing a sentence library may be avoided if the sentence library is pre-established.

ステップS102では、意図説明のガイダンス文に従って更新される第2のクエリが受けられ、かつ、第2のクエリに従って検索結果が取得される。   In step S102, the second query updated according to the guidance text of the intention explanation is received, and the search result is acquired according to the second query.

本開示のいくつかの実施形態では、検索エンジンは、意図説明のガイダンス文に従って更新される第2のクエリを取得し、かつ、第2のクエリに従って検索結果を取得してもよい。例えば、検索エンジンがクライアントを通じてユーザに意図説明のガイダンス文を表示し、ユーザが検索エンジンによって提供される入力ボックスに更新されるクエリ(例えば、第2のクエリ)を入力し、その後に、検索エンジンが更新されるクエリに従って検索し、かつ、検索結果を取得してもよい。   In some embodiments of the present disclosure, the search engine may obtain a second query that is updated according to the intent description guidance text, and obtain a search result according to the second query. For example, the search engine displays the intent explanation guidance text to the user through the client, and the user enters the updated query (eg, the second query) in the input box provided by the search engine, and then the search engine May be searched according to a query that is updated, and a search result may be obtained.

ステップS103では、検索結果が、クライアントに返答される。   In step S103, the search result is returned to the client.

本開示のいくつかの実施形態では、検索結果を取得した後、検索エンジンは、クライアントに検索結果を返答することによって、ユーザに検索結果を表示することができる。ユーザは、表示された検索結果に基づいて必要とするリソースを取得することができる。   In some embodiments of the present disclosure, after obtaining the search results, the search engine can display the search results to the user by returning the search results to the client. The user can acquire necessary resources based on the displayed search results.

上述したように、情報検索方法は、さらに文ライブラリを確立することを含む。本開示のいくつかの実施形態では、図2に示すように、文ライブラリの確立に、以下のステップを含む。   As described above, the information retrieval method further includes establishing a sentence library. In some embodiments of the present disclosure, as shown in FIG. 2, establishing a sentence library includes the following steps:

ステップS201では、第1の文は、第1の情報に従って取得される。   In step S201, the first sentence is acquired according to the first information.

本開示のいくつかの実施形態では、検索エンジンは、第1の情報を分割して、かつ、その第1の情報が予め設定された特徴量に従って予め設定されたタイプの文に属するかどうかを検出してもよい。第1の情報が予め設定されたタイプの文に属する場合、第1の情報に従って第1の文を取得してもよい。本開示のいくつかの実施形態では、第1の情報がコミュニティユーザのナレッジ交換プラットフォームにおける文を含み、予め設定されたタイプの文が様々な質問を含み、予め設定された特徴量が疑問詞辞書又は質問文の特徴量を含むことができる。   In some embodiments of the present disclosure, the search engine divides the first information and determines whether the first information belongs to a sentence of a preset type according to a preset feature amount. It may be detected. When the first information belongs to a preset type of sentence, the first sentence may be acquired according to the first information. In some embodiments of the present disclosure, the first information includes a sentence in the community user's knowledge exchange platform, the preset type of sentence includes various questions, and the preset feature quantity is an interrogative dictionary. Or the feature-value of a question sentence can be included.

ステップS202では、第2の文は、第1の情報に関連する第2の情報に従って取得される。   In step S202, the second sentence is acquired according to the second information related to the first information.

本開示のいくつかの実施形態では、検索エンジンは、第2の情報を分割して、かつ、その第2の情報が予め設定された特徴量に従って予め設定されたタイプの文に属するかどうかを検出してもよい。第2の情報が予め設定されたタイプの文に属する場合には、第1の情報に関連する第2の情報に従って第2の文を取得してもよい。   In some embodiments of the present disclosure, the search engine divides the second information and determines whether the second information belongs to a predetermined type of sentence according to a predetermined feature amount. It may be detected. When the second information belongs to a preset type of sentence, the second sentence may be acquired according to the second information related to the first information.

ステップS203では、文ライブラリ内の少なくとも一つの文のペアが、第1の文と第2の文とに従って確立される。   In step S203, at least one sentence pair in the sentence library is established according to the first sentence and the second sentence.

本開示のいくつかの実施形態では、検索エンジンは、第1及び第2の文を取得した後、文ライブラリを確立又は拡張するために、第1及び第2の文に従って少なくとも一つの文のペアを確立し、かつ、文ライブラリに文のペアを記憶してもよい。   In some embodiments of the present disclosure, the search engine, after obtaining the first and second sentences, at least one sentence pair according to the first and second sentences to establish or expand a sentence library. And a sentence pair may be stored in the sentence library.

本開示のいくつかの実施形態では、検索エンジンは、コミュニティユーザのナレッジ交換プラットフォームにおいてリソースを検索してもよい。そのリソースは、ユーザによって提供される複数の質問(第1の情報)と、これらの質問に対する他のユーザから提供される回答(第2の情報)とが含まれる。質問と回答との両方が予め設定されたタイプの文に属すると判断された後、検索エンジンは、少なくとも一つの質問(第1の文)とこれに対応する回答(第2の文)とからなる文のペアを取得してもよい。こうして、文ライブラリが構築される。例えば、あるユーザが「バイドゥノウズ」に、「赤ちゃんが38.5℃の発熱がある場合は何をしたらよいですか」という質問をし、他のユーザが「それは、赤ちゃんが何歳であるかによります」との答えを提供する。検索エンジンは、この質問とこの回答からなる文のペアを取得してもよいし、文ライブラリに文のペアを記憶してもよい。こうして、文ライブラリが確立又は拡張される。   In some embodiments of the present disclosure, the search engine may search for resources in the community user's knowledge exchange platform. The resource includes a plurality of questions (first information) provided by the user and answers (second information) provided by other users to these questions. After it is determined that both the question and the answer belong to a preset type of sentence, the search engine determines from at least one question (first sentence) and the corresponding answer (second sentence). A sentence pair may be acquired. Thus, a sentence library is constructed. For example, one user asks Baidu Knows what to do if the baby has a fever of 38.5 ° C and another user asks, “It depends on how old the baby is. ". The search engine may acquire a sentence pair including the question and the answer, or may store the sentence pair in a sentence library. Thus, a sentence library is established or expanded.

本開示のいくつかの実施形態では、検索エンジンは、文ライブラリに少なくとも一つの文のペアを確立した後、文ライブラリ内の文のペアをフィルタリングしてもよい。本開示のいくつかの実施形態では、文ライブラリ内の第2の文は、予め設定されたフィルタリングルールに従ってフィルタリングされる。例えば、第1の文「10月1日に旅行するのに面白い場所」と、第2の文「10月1日で面白い場所はどこ」は意味が類似し、かつ、同一の質問に属するので、フィルタリングされるべきである。   In some embodiments of the present disclosure, the search engine may filter the sentence pairs in the sentence library after establishing at least one sentence pair in the sentence library. In some embodiments of the present disclosure, the second sentence in the sentence library is filtered according to preset filtering rules. For example, the first sentence “A place that is interesting to travel on October 1” and the second sentence “Where is an interesting place on October 1” have similar meanings and belong to the same question. Should be filtered.

本開示のいくつかの実施形態では、ユーザは、文ライブラリを確立した後、検索エンジンによって提供される入力ボックス内に第1のクエリを入力してもよい。それから、検索エンジンは、第1のクエリに従って文ライブラリを検索して、そして、意図説明のガイダンス文を取得してもよい。本開示のいくつかの実施形態では、図3に示すように、第1のクエリに従って意図説明のガイダンス文を取得することは、以下のステップを含む。   In some embodiments of the present disclosure, a user may enter a first query in an input box provided by a search engine after establishing a sentence library. Then, the search engine may search the sentence library according to the first query and obtain a guidance sentence for the intention explanation. In some embodiments of the present disclosure, as shown in FIG. 3, obtaining the intent explanation guidance text according to the first query includes the following steps.

ステップS301では、第1のクエリの特徴量情報が取得され、かつ、その特徴量情報に従って特徴量情報に関連する第1の文が取得される。   In step S301, the feature amount information of the first query is acquired, and a first sentence related to the feature amount information is acquired according to the feature amount information.

本開示のいくつかの実施形態では、検索エンジンは、まず、第1のクエリの特徴量情報を取得し、文ライブラリ内のすべての第1の文の特徴量情報に従って生成される逆索引を検索し、そして、逆索引に従って特徴量情報にマッチングさせ、こうして、特徴量情報に関連する第1の文を取得してもよい。   In some embodiments of the present disclosure, the search engine first obtains feature information of the first query, and searches the reverse index generated according to the feature information of all the first sentences in the sentence library. Then, the feature amount information may be matched according to the reverse index, and thus the first sentence related to the feature amount information may be obtained.

本開示のいくつかの実施形態では、検索エンジンは、第1の文と第1のクエリとの間の意味類似性が最初に予め設定された閾値よりも大きい場合に、第1の文を取得してもよい。本開示のいくつかの実施形態では、第1の文と第1のクエリとの間の意味類似性が最初に予め設定された閾値よりも小さい場合に、第1の文をフィルタリングしてもよい。すなわち、第1の文は、第1のクエリとは無関係である。   In some embodiments of the present disclosure, the search engine retrieves the first sentence when the semantic similarity between the first sentence and the first query is greater than a preset threshold initially. May be. In some embodiments of the present disclosure, the first sentence may be filtered if the semantic similarity between the first sentence and the first query is initially less than a preset threshold. . That is, the first sentence is unrelated to the first query.

ステップS302では、文ライブラリが第1の文に従って検索され、第1の文に対応する第2の文が取得される。   In step S302, the sentence library is searched according to the first sentence, and the second sentence corresponding to the first sentence is acquired.

本開示のいくつかの実施形態では、検索エンジンは、第1の文を取得した後に、その第1の文に従って文ライブラリを検索し、第1の文に対応する第2の文を取得してもよい。本開示のいくつかの実施形態では、第1の文は、複数の第2の文に対応させてもよく、したがって、第1の文に対応する第2の文を、文ライブラリを検索することによって取得してもよい。   In some embodiments of the present disclosure, after obtaining a first sentence, the search engine searches a sentence library according to the first sentence, and obtains a second sentence corresponding to the first sentence. Also good. In some embodiments of the present disclosure, the first sentence may correspond to a plurality of second sentences, and thus searching the sentence library for the second sentence corresponding to the first sentence. May be obtained by

本開示のいくつかの実施形態では、第1のクエリが第2の文の予め設定されたタイプのキーワードを含まない場合に、第2の文が取得される。本開示のいくつかの実施形態では、第1のクエリが疑問詞「何(what)」のような第2の文の予め設定されたタイプのキーワードを含む場合に、第2の文はフィルタリングされる。   In some embodiments of the present disclosure, the second sentence is obtained when the first query does not include a preset type keyword of the second sentence. In some embodiments of the present disclosure, the second sentence is filtered if the first query includes a preset type keyword of the second sentence, such as the interrogative word “what”. The

本開示のいくつかの実施形態では、第1のクエリと第2の文との間の意味類似性が第2の予め設定された閾値よりも小さい場合に、第2の文が取得される。本開示のいくつかの実施形態では、第2の文は、第1のクエリと第2の文との間の意味類似性が第2の予め設定された閾値よりも大きい場合、すなわち、第1のクエリ及び第2の文が、同じタイプの文に属している場合には、フィルタリングされる。   In some embodiments of the present disclosure, the second sentence is obtained when the semantic similarity between the first query and the second sentence is less than a second preset threshold. In some embodiments of the present disclosure, the second sentence is when the semantic similarity between the first query and the second sentence is greater than a second preset threshold, ie, the first If the query and the second sentence belong to the same type of sentence, they are filtered.

ステップS303では、意図説明のガイダンス文が、第2の文に従って取得される。   In step S303, a guidance sentence for intent explanation is acquired according to the second sentence.

本開示のいくつかの実施形態では、複数の第2の文が第1の情報に関連する第2の情報に従って取得され、検索エンジンは、第1の文に対応する第2の文を取得した後、第2の文をシーケンス化し、かつ、クラスタ化してもよい。   In some embodiments of the present disclosure, a plurality of second sentences are obtained according to second information related to the first information, and the search engine has obtained a second sentence corresponding to the first sentence. Later, the second sentence may be sequenced and clustered.

本開示のいくつかの実施形態では、第2の文は数式1に基づいてシーケンス化される。
ここで、Qbは第2の文を表し(これに応じて、Qbsは複数のQbを表す)、Pはi番目の木の投票値を表し、Nは木の数を表す。
数式1は、Qb(すなわち、第2の文)のスコアを計算するためのランダムフォレストのモデル式である。Qbsはスコアに従ってシーケンス化されてもよい。その後、検索エンジンは、意味類似性に従って第2の文をクラスタ化する。
In some embodiments of the present disclosure, the second sentence is sequenced based on Equation 1.
Here, Qb represents a second sentence (accordingly, Qbs represents the plurality of Qb), P i represents the voting value of the i-th tree, N is the representative of the number of trees.
Formula 1 is a random forest model formula for calculating the score of Qb (ie, the second sentence). Qbs may be sequenced according to the score. The search engine then clusters the second sentence according to semantic similarity.

本開示のいくつかの実施形態では、検索エンジンは、クラスタ化された第2の文(すなわち、種類)を取得するために、同一又は類似の意味を有する第2の文をクラスタ化する。例えば、「赤ちゃんは何歳ですか」という文と「何歳の赤ちゃん」という他の文とは、同じような意味であるので、クラスタ化してもよい。本開示のいくつかの実施形態では、クラスタリングは、K平均法クラスタリングアルゴリズム(ハードクラスタリングアルゴリズム)と階層的クラスタリングアルゴリズムとの少なくとも一つによって、実行することができる。   In some embodiments of the present disclosure, the search engine clusters second sentences having the same or similar meaning to obtain a clustered second sentence (ie, type). For example, the sentence “How old is a baby” and the other sentence “How old is a baby” have the same meaning and may be clustered. In some embodiments of the present disclosure, clustering may be performed by at least one of a K-means clustering algorithm (hard clustering algorithm) and a hierarchical clustering algorithm.

その後、いくつかのクラスタ化された第2の文を取得してもよく、検索エンジンは、意図説明のガイダンス文を取得するためにクラスタ化された第2の文をシーケンス化する。   Thereafter, a number of clustered second sentences may be obtained, and the search engine sequences the clustered second sentences to obtain an intent description guidance sentence.

本開示のいくつかの実施形態では、クラスタ化された第2の文(すなわち、種類)のスコアを、数式2に従って計算してもよい。
ここで、cは種類を表し、|c|は種類におけるQbの数を表し、λは種類の確率評価の重み値を表す(0<λ<1)。本開示のいくつかの実施形態では、クラスタ化された第2の文(すなわち、種類)のスコアが計算された後、クラスタ化された第2の文(すなわち、種類)が、スコアに従ってシーケンス化され、最も高いスコアが得られた3つの意図説明のガイダンス文が取得され、ユーザに表示するためにクライアントに返答され、それによって、ユーザが意図説明のガイダンス文に従って第1のクエリを更新することが可能になる。本実施形態では、3つの意図説明のガイダンス文は、単なる例示として提供されたものである。本開示のいくつかの実施形態では、一つ以上の意図説明のガイダンス文を、本開示を特に限定することなく、取得してもよい。
In some embodiments of the present disclosure, the score of the clustered second sentence (ie, type) may be calculated according to Equation 2.
Here, c represents a type, | c | represents the number of Qb in the type, and λ represents a weight value for probability evaluation of the type (0 <λ <1). In some embodiments of the present disclosure, after the score of the clustered second sentence (ie, type) is calculated, the clustered second sentence (ie, type) is sequenced according to the score. The intent guidance sentence with the highest score is obtained and returned to the client for display to the user, whereby the user updates the first query according to the intent explanation guidance sentence Is possible. In the present embodiment, the three intention explanation guidance texts are provided as examples only. In some embodiments of the present disclosure, one or more intent guidance text may be obtained without particularly limiting the present disclosure.

本開示の実施形態に従った情報検索方法によれば、意図説明のガイダンス文が検索エンジンによって提供され、第1のクエリが意図説明のガイダンス文に従って更新され、検索結果が第2のクエリのような更新されるクエリに従って提供されるので、その結果、ユーザの検索意図は明確になる。さらに、ユーザの検索意図を識別するための検索エンジンの精度が向上し、ユーザの要求が満たされ、こうして、ユーザ体験は改善される。   According to the information search method according to the embodiment of the present disclosure, the guidance sentence for the intention explanation is provided by the search engine, the first query is updated according to the guidance sentence for the intention explanation, and the search result is like the second query. As a result, the search intention of the user becomes clear. In addition, the accuracy of the search engine for identifying the user's search intent is improved and the user's requirements are met, thus improving the user experience.

図4は、本開示の実施形態に従った情報検索方法を示すフローチャートである。この情報検索方法は、以下のステップを含む。   FIG. 4 is a flowchart illustrating an information search method according to an embodiment of the present disclosure. This information retrieval method includes the following steps.

ステップS401では、対話式質問ライブラリが確立される。   In step S401, an interactive question library is established.

本開示のいくつかの実施形態では、検索エンジンは、コミュニティベースのQ&Aリソースの中から質問を検索することで、対話式質問ライブラリを確立してもよい。コミュニティベースのQ&Aリソースは、「バイドゥノウズ(Baidu Knows)」、「サーチアスク(Search Ask)」、「シナアイアスク(Sina iAsk)」等の様々なナレッジ交換プラットフォームを含むことができる。コミュニティベースのQ&Aリソースは、同じ質問について複数の相互作用をしてもよい。本開示のいくつかの実施形態では、ユーザによって尋ねられる質問はQaと称し、質問Qaに対して他のユーザによって提供される回答はQbと称する。例えば、図5に示すように、ユーザAが「赤ちゃんが38.5℃の発熱がある場合の対処方法」という質問Qaをし、ユーザBが「それは赤ちゃんが何歳かによる」という答えQbを提供する。「赤ちゃんが38.5℃の発熱がある場合の対処方法」の質問Qaと「それは赤ちゃんが何歳かによる」の答えQbとは、対話式文のペアを形成することができる。   In some embodiments of the present disclosure, the search engine may establish an interactive question library by searching for questions among community-based Q & A resources. Community-based Q & A resources can include various knowledge exchange platforms such as “Baidu Knows”, “Search Ask”, “Sina iAsk”, etc. Community-based Q & A resources may interact multiple times for the same question. In some embodiments of the present disclosure, questions asked by users are referred to as Qa, and answers provided by other users to question Qa are referred to as Qb. For example, as shown in FIG. 5, the user A asks the question Qa “How to handle when the baby has a fever of 38.5 ° C.”, and the user B gives the answer Qb “It depends on how old the baby is” provide. The question Qa of “how to handle when the baby has a fever of 38.5 ° C.” and the answer Qb of “it depends on how old the baby is” can form a pair of interactive sentences.

本開示のいくつかの実施形態では、検索エンジンは、それぞれ複数のQa及びQbからなる対話式文のペアを取得することにより、対話式文ライブラリを確立してもよい。   In some embodiments of the present disclosure, the search engine may establish an interactive sentence library by obtaining interactive sentence pairs each consisting of a plurality of Qa and Qb.

本開示のいくつかの実施形態では、図5に示すように、一つの質問に関する完全なダイアログ(文のペア等)は、主として、質問記述フィールド、質問補足フィールド、および回答フィールドに含まれる。質問記述フィールドには、ユーザに尋ねられる、一般的に、簡潔で短い、主要な質問点が含まれる。質問補足フィールドには、ユーザに尋ねられる質問を補足し、さらに記述するために、ユーザによって提供される追加情報が含まれる。回答フィールドには、他のユーザによって提供される、この質問に対する回答が含まれる。   In some embodiments of the present disclosure, as shown in FIG. 5, a complete dialog (such as a sentence pair) for a single question is primarily contained in a question description field, a question supplement field, and an answer field. The question description field contains the main question points, generally brief and short, that are asked by the user. The question supplement field includes additional information provided by the user to supplement and further describe the question asked by the user. The answer field contains answers to this question provided by other users.

本開示のいくつかの実施形態では、検索エンジンは、それぞれ、質問記述フィールドと回答フィールドとを分けて、かつ、質問記述フィールドと回答フィールドとにおける文が質問辞書と質問特徴量とに従って疑問形の質問であるかどうかを検出してもよい。文が疑問形の質問であると判断されるならば、質問記述フィールドにおける文Qaと回答フィールドにおける文QbとからなるQa−Qbの対話式文のペアが取得される。   In some embodiments of the present disclosure, the search engine separates the question description field and the answer field, respectively, and sentences in the question description field and the answer field are interrogated according to the question dictionary and the question feature. You may detect whether it is a question. If the sentence is determined to be a question-type question, a Qa-Qb interactive sentence pair consisting of sentence Qa in the question description field and sentence Qb in the answer field is obtained.

コミュニティベースのQ&Aリソースにおける質問及び回答の語句が自由であるため、文のペアは、対話式文のペアの妥当性を保証するためにフィルタリングされる必要がある。本開示のいくつかの実施形態では、Qa−Qbの対話式文のペアをフィルタリングルールに従ってフィルタリングしてもよい。本開示のいくつかの実施形態では、フィルタリングルールは、Qbのコアとなる点が質問補足フィールドにあること、QbとQaとの間の意味類似性が非常に大きいこと、疑問文が「どのように(how)」及び「何に(what to)」などの記述的な疑問詞と不適切な語句とがQbに含まれること、を含む。表1に示すように、Qaは第1列に示され、Qbは第2列に示され、Qa−Qb対話式文のペアをフィルタリングする理由は第3列に示されている。   Because question and answer phrases in community-based Q & A resources are free, sentence pairs need to be filtered to ensure the validity of interactive sentence pairs. In some embodiments of the present disclosure, Qa-Qb interactive sentence pairs may be filtered according to filtering rules. In some embodiments of the present disclosure, the filtering rules indicate that the core point of Qb is in the question supplement field, the semantic similarity between Qb and Qa is very large, Qb includes descriptive interrogatives such as “how” and “what to” and inappropriate words. As shown in Table 1, Qa is shown in the first column, Qb is shown in the second column, and the reason for filtering the Qa-Qb interactive sentence pair is shown in the third column.

本開示のいくつかの実施形態では、対話式質問ライブラリは、Qa−Qbの対話式文のペアがフィルタリングされた後に、フィルタリングされた対話式文のペアに従って確立される。   In some embodiments of the present disclosure, the interactive question library is established according to the filtered interactive sentence pair after the Qa-Qb interactive sentence pair is filtered.

ステップS402では、意図説明のガイダンス文が最初のクエリに従って提供される。   In step S402, an intention explanation guidance sentence is provided according to the initial query.

本開示のいくつかの実施形態では、対応する意図説明のガイダンス文は、第1のクエリなどのユーザによるクエリ入力に従ってユーザに提供される。   In some embodiments of the present disclosure, the corresponding intent description guidance text is provided to the user according to a query input by the user, such as the first query.

本開示のいくつかの実施形態では、対話式質問ライブラリを確立した後、検索エンジンは、ユーザによるクエリQの入力に従って対話式質問ライブラリを検索し、クエリQに関連するQa−Qbの対話式文のペアを取得し、QbとQとの間の関連性を確保するために機械学習モデルに従ってQbsをシーケンス化し、いくつかの種類を取得するためにクラスタリングアルゴリズムに従ってQbsをクラスタ化し、そして、これらの種類をシーケンス化する。こうして、意図説明のガイダンス文を取得する。   In some embodiments of the present disclosure, after establishing the interactive question library, the search engine searches the interactive question library according to the input of the query Q by the user and Qa-Qb interactive statements associated with the query Q. To pair, Qbs is sequenced according to a machine learning model to ensure the association between Qb and Q, Qbs is clustered according to a clustering algorithm to obtain several types, and these Sequence types. In this way, the guidance sentence for the intention explanation is acquired.

本開示のいくつかの実施形態では、対話式質問ライブラリの逆索引がQaに従って確立され、逆索引がクエリQに従って検索され、そして、クエリQに関連するQa−Qbの対話式文のペアが取得される。次に、Qa−Qbの対話式文のペアが検索ルールに従ってフィルタリングされる。本開示のいくつかの実施形態では、QaとQとの間の意味類似性が予め設定された閾値よりも小さい場合、すなわち、QaとQとの間の関連性が大きくない場合に、Qa−Qbの対話式文のペアがフィルタリングされる。本開示のいくつかの実施形態では、QとQbとの疑問詞が同じである場合は、Qa−Qbの対話式文のペアがフィルタリングされる。本開示のいくつかの実施形態では、QとQbとの間の意味類似性が非常に大きい場合、すなわち、QとQbとが同じ質問に属している場合に、Qa−Qbの対話式文のペアがフィルタリングされる。   In some embodiments of the present disclosure, the reverse index of the interactive question library is established according to Qa, the reverse index is searched according to query Q, and the Qa-Qb interactive sentence pair associated with query Q is obtained. Is done. The Qa-Qb interactive sentence pairs are then filtered according to the search rules. In some embodiments of the present disclosure, if the semantic similarity between Qa and Q is less than a preset threshold, i.e., if the association between Qa and Q is not large, Qa- Qb interactive sentence pairs are filtered. In some embodiments of the present disclosure, Qa-Qb interactive sentence pairs are filtered if the Q and Qb interrogators are the same. In some embodiments of the present disclosure, if the semantic similarity between Q and Qb is very large, that is, if Q and Qb belong to the same question, Pairs are filtered.

本開示のいくつかの実施形態では、検索エンジンは、Qに関連するQa−Qbの対話式文のペアを取得した後、Qbsをシーケンス化する。本開示のいくつかの実施形態では、検索エンジンは、ナレッジベース「Q−Qa−Qb−コミュニティベースのQ&Aリソースのその他の情報」からの特徴量を取得し、その特徴量に従ってQbsをシーケンス化する。その特徴量は、QaとQとの間の意味類似性、QbとQとの間の意味類似性、リソースでの相互作用におけるQbとQaとの間の距離、QbとQとの間の相対性、Qbの文字数に対するQaの文字数の割合、及び、全てのQbsの中で一つのQbが発生する平均確率のうち、少なくとも一つを含んでもよい。   In some embodiments of the present disclosure, the search engine sequences Qbs after obtaining a Qa-Qb interactive sentence pair associated with Q. In some embodiments of the present disclosure, the search engine obtains feature quantities from the knowledge base “Q-Qa-Qb-other information on community-based Q & A resources” and sequences the Qbs according to the feature quantities. . The feature amount includes the semantic similarity between Qa and Q, the semantic similarity between Qb and Q, the distance between Qb and Qa in the interaction in resources, and the relative between Qb and Q May include at least one of the characteristics, the ratio of the number of characters of Qa to the number of characters of Qb, and the average probability that one Qb will occur among all Qbs.

本開示のいくつかの実施形態では、検索エンジンは、数式1で表される機械学習ランダムフォレストモデルを用いることによって、Qbsのスコアを計算する。
ここで、Pはi番目の木の投票値を表し、Nは木の数を表し、フォレスト内の各木は、Qbに対してイエス(1)又はノー(0)を投票してもよい。
In some embodiments of the present disclosure, the search engine calculates the score of Qbs by using the machine learning random forest model represented by Equation 1.
Here, P i represents the voting value of the i-th tree, N represents represents the number of trees, each tree in the forest can be voted yes (1) or no (0) to the Qb .

本開示のいくつかの実施形態では、検索エンジンは、Qbsのスコアに従ってQbsをシーケンス化してもよい。そして、検索エンジンは、クラスタリングアルゴリズムによるQbsの意味類似性に従って、同じ意味を有するQbs(例えば、「赤ちゃんは何歳ですか」、「何歳の赤ちゃん」の場合)をクラスタ化してもよい。クラスタリングアルゴリズムは、K平均法クラスタリングアルゴリズムと階層的クラスタリングアルゴリズムとの少なくとも一つを含むとよい。Qbsをクラスタ化した後、クラスタ化された種類のスコアは、数式2に従って算出することができる。
ここで、cは種類を表し、|c|は種類におけるQbの数を表し、λは種類の確率評価の重み値を表す(0<λ<1)。次に、クラスタ化された種類は、スコアに従ってシーケンス化してもよい。本開示のいくつかの実施形態では、最大のスコアを有する3種類(すなわち、3つの意図説明のガイダンス文)のなかで最適なQbsが取得される。本実施形態では、3つの意図説明のガイダンス文は、単なる例示として提供されたものである。本開示のいくつかの実施形態では、一つ以上の意図説明のガイダンス文を、本開示を特に限定することなく、取得してもよい。
In some embodiments of the present disclosure, the search engine may sequence the Qbs according to the Qbs score. Then, the search engine may cluster Qbs having the same meaning (for example, “how old is a baby”, “how old is a baby”) according to the semantic similarity of Qbs by the clustering algorithm. The clustering algorithm may include at least one of a K-means clustering algorithm and a hierarchical clustering algorithm. After clustering Qbs, the clustered types of scores can be calculated according to Equation 2.
Here, c represents a type, | c | represents the number of Qb in the type, and λ represents a weight value for probability evaluation of the type (0 <λ <1). The clustered types may then be sequenced according to the score. In some embodiments of the present disclosure, the optimal Qbs is obtained among the three types having the maximum score (ie, guidance texts of three intention explanations). In the present embodiment, the three intention explanation guidance texts are provided as examples only. In some embodiments of the present disclosure, one or more intent guidance text may be obtained without particularly limiting the present disclosure.

ステップS403では、意図説明のガイダンス文に従って更新される第2のクエリが取得され、かつ、第2のクエリに従って検索結果が取得される。   In step S403, the second query updated according to the guidance text of the intention explanation is acquired, and the search result is acquired according to the second query.

本開示のいくつかの実施形態では、意図説明のガイダンス文を取得した後、検索エンジンは、意図説明のガイダンス文に従って第2のクエリを取得するために第1のクエリを更新し、かつ、第2のクエリに従って検索結果を取得してもよい。本開示のいくつかの実施形態では、検索エンジンがクライアントを通じてユーザに意図説明のガイダンス文を表示し、クライアントが検索エンジンの入力ボックスの意図説明のガイダンス文に従って更新される第2のクエリを入力し、その後に、検索エンジンが第2のクエリに従って検索し、かつ、検索結果を取得してもよい。   In some embodiments of the present disclosure, after obtaining the intent description guidance text, the search engine updates the first query to obtain the second query according to the intent explanation guidance text, and the first The search result may be acquired according to the query 2. In some embodiments of the present disclosure, a search engine displays an intent description guidance text to a user through a client, and the client enters a second query that is updated according to the intent description guidance text in the search engine input box. Thereafter, the search engine may perform a search according to the second query and obtain a search result.

ステップS404では、検索結果が、クライアントに返答される。   In step S404, the search result is returned to the client.

本開示のいくつかの実施形態では、検索結果を取得した後、検索エンジンは、クライアントに検索結果を返答することによって、検索結果をユーザに表示してもよい。ユーザは、表示される検索結果に従ってユーザが必要とするリソースを取得してもよい。   In some embodiments of the present disclosure, after obtaining the search results, the search engine may display the search results to the user by returning the search results to the client. The user may acquire resources required by the user according to the displayed search result.

図6(a)は意図説明のガイダンス文の取得効果を示し、図6(b)は意図説明のガイダンス文に従って更新される第2のクエリに基づく検索結果の取得効果を示している。本開示のいくつかの実施形態では、図6(a)及び図6(b)に示すように、ユーザはクエリ「出国ビザ」を入力することで、検索エンジンによって提供される「あなたどの国に行くのですか」及び「あなたがビザを希望する理由は、旅行のためですか、留学するためですか、又は、その他ですか」を含む意図説明のガイダンス文を取得する。その後、ユーザは、更新されたクエリ「イギリスへの旅行のためのビザ」を入力しかつ検索する。このように、検索エンジンによって返答される検索結果は、ユーザの要求を十分に満たすであろう。   FIG. 6A shows the effect of acquiring the intention explanation guidance text, and FIG. 6B shows the search result acquisition effect based on the second query updated according to the intention explanation guidance text. In some embodiments of the present disclosure, as shown in FIG. 6 (a) and FIG. 6 (b), the user enters the query “Exit Visa” to provide “you to which country” provided by the search engine. Get a guidance statement that includes "Would you like to go" and "Why do you want a visa for travel, study abroad, or others?" The user then enters and searches for the updated query “visa for travel to the UK”. Thus, the search results returned by the search engine will fully satisfy the user's request.

本開示の実施形態に従った情報検索方法によれば、意図説明のガイダンス文が検索エンジンによって提供され、第1のクエリが意図説明のガイダンス文に従って更新され、検索結果が第2のクエリのような更新されたクエリに従って提供され、その結果、ユーザの検索意図は明確になる。さらに、ユーザの検索意図を識別するための検索エンジンの精度が向上し、ユーザの要求が満たされ、こうして、ユーザ体験は改善される。   According to the information search method according to the embodiment of the present disclosure, the guidance sentence for the intention explanation is provided by the search engine, the first query is updated according to the guidance sentence for the intention explanation, and the search result is like the second query. Provided according to the updated query, so that the user's search intention is clear. In addition, the accuracy of the search engine for identifying the user's search intent is improved and the user's requirements are met, thus improving the user experience.

本開示の別の側面の実施形態は、さらに、情報検索デバイスを提供する。   An embodiment of another aspect of the present disclosure further provides an information retrieval device.

図7は、本開示の実施形態に従った情報検索デバイスのブロック図である。図7に示すように、情報検索デバイスは、第1の取得モジュール100と第2の取得モジュール200と返答モジュール300と確立モジュール400とを含む。本開示のいくつかの実施形態では、第1の取得モジュール100は、第1の取得ユニット110と第2の取得ユニット120と第3の取得ユニット130とを含む。本開示のいくつかの実施形態では、第3の取得ユニット130は、クラスタリングサブユニット131と取得サブユニット132とを含む。本開示のいくつかの実施形態では、確立モジュール400は、第1の取得ユニット410と第2の取得ユニット420と確立ユニット430とフィルタリングユニット440とを含む。   FIG. 7 is a block diagram of an information retrieval device according to an embodiment of the present disclosure. As shown in FIG. 7, the information search device includes a first acquisition module 100, a second acquisition module 200, a response module 300, and an establishment module 400. In some embodiments of the present disclosure, the first acquisition module 100 includes a first acquisition unit 110, a second acquisition unit 120, and a third acquisition unit 130. In some embodiments of the present disclosure, the third acquisition unit 130 includes a clustering subunit 131 and an acquisition subunit 132. In some embodiments of the present disclosure, the establishment module 400 includes a first acquisition unit 410, a second acquisition unit 420, an establishment unit 430, and a filtering unit 440.

本開示のいくつかの実施形態では、第1の取得モジュール100は、第1のクエリを受け、かつ、第1のクエリに従って意図説明のガイダンス文を取得するように構成されている。第1のクエリは、用語や文を含んでいてもよい。   In some embodiments of the present disclosure, the first acquisition module 100 is configured to receive a first query and acquire a guidance sentence for an intention description according to the first query. The first query may include terms and sentences.

本開示のいくつかの実施形態では、第1の取得モジュール100は、第1の取得ユニット110と第2の取得ユニット120と第3の取得ユニット130とを含む。   In some embodiments of the present disclosure, the first acquisition module 100 includes a first acquisition unit 110, a second acquisition unit 120, and a third acquisition unit 130.

本開示のいくつかの実施形態では、第1の取得ユニット110は、第1のクエリの特徴量情報を取得し、その特徴量情報に従ってその特徴量情報に関連する第1の文を取得するように構成されている。   In some embodiments of the present disclosure, the first obtaining unit 110 obtains the feature amount information of the first query, and obtains a first sentence related to the feature amount information according to the feature amount information. It is configured.

本開示のいくつかの実施形態では、第1の取得ユニット110は、第1のクエリの特徴量情報を取得し、文ライブラリ内のすべての第1の文の特徴量情報に従って生成される逆索引を検索し、逆索引に従って特徴量情報のマッチングを実行し、これにより、特徴量情報に関連する第1の文が取得される。   In some embodiments of the present disclosure, the first obtaining unit 110 obtains feature information of the first query, and an inverted index generated according to the feature information of all the first sentences in the sentence library. And the feature amount information matching is executed according to the reverse index, whereby the first sentence related to the feature amount information is acquired.

本開示のいくつかの実施形態では、第1の取得ユニット110は、第1の文と第1のクエリとの間の意味類似性が最初に予め設定された閾値よりも大きい場合に、第1の文を取得する。本開示のいくつかの実施形態では、第1の文と第1のクエリとの間の意味類似性が最初に予め設定した閾値よりも小さい場合に、第1の文がフィルタリングされる。すなわち、第1の文は、第1のクエリとは無関係である。   In some embodiments of the present disclosure, the first acquisition unit 110 may select the first if the semantic similarity between the first sentence and the first query is initially greater than a preset threshold. Get the statement. In some embodiments of the present disclosure, the first sentence is filtered if the semantic similarity between the first sentence and the first query is less than a preset threshold initially. That is, the first sentence is unrelated to the first query.

本開示のいくつかの実施形態では、第2の取得ユニット120は、第1の文に従って文ライブラリを検索し、第1の文に対応する第2の文を取得するように構成されている。   In some embodiments of the present disclosure, the second obtaining unit 120 is configured to search the sentence library according to the first sentence and obtain a second sentence corresponding to the first sentence.

本開示のいくつかの実施形態では、第1の取得ユニット110が第1の文を取得した後に、第2の取得ユニット120は、第1の文に従って文ライブラリを検索し、第1の文に対応する第2の文を取得する。特徴量情報に関連する第1の文は、複数の第2の文に対応させてもよく、したがって、第2の取得ユニット120は、文ライブラリを検索することによって、第1の文に対応する第2の文を取得してもよい。   In some embodiments of the present disclosure, after the first acquisition unit 110 acquires the first sentence, the second acquisition unit 120 searches the sentence library according to the first sentence and Get the corresponding second sentence. The first sentence related to the feature amount information may correspond to a plurality of second sentences. Therefore, the second acquisition unit 120 corresponds to the first sentence by searching the sentence library. You may acquire a 2nd sentence.

本開示のいくつかの実施形態では、第2の取得ユニット120は、第1のクエリが第2の文の予め設定されたタイプのキーワードを含まない場合は、第2の文を取得する。本開示のいくつかの実施形態では、第2の文は、第1のクエリが疑問詞「何を(what)」のような第2の文の予め設定されたタイプのキーワードを含む場合は、フィルタリングされる。   In some embodiments of the present disclosure, the second acquisition unit 120 acquires the second sentence if the first query does not include a preset type keyword of the second sentence. In some embodiments of the present disclosure, the second sentence, if the first query includes a preset type keyword of the second sentence, such as the interrogative “what”, Filtered.

本開示のいくつかの実施形態では、第2の取得ユニット120は、第1のクエリと第2の文との間の意味類似性が第2の予め設定された閾値よりも小さい場合に、第2の文を取得する。本開示のいくつかの実施形態では、第2の文は、第1のクエリと第2の文との間の意味類似性が第2の予め設定された閾値よりも大きい場合、すなわち、第1のクエリ及び第2の文が同じタイプの文に属している場合に、フィルタリングされる。   In some embodiments of the present disclosure, the second acquisition unit 120 may determine whether the second similarity unit 120 has a semantic similarity between the first query and the second sentence that is less than a second preset threshold. Get the second sentence. In some embodiments of the present disclosure, the second sentence is when the semantic similarity between the first query and the second sentence is greater than a second preset threshold, ie, the first If the query and the second sentence belong to the same type of sentence, they are filtered.

本開示のいくつかの実施形態では、第3の取得ユニット130は、第2の文に従って意図説明のガイダンス文を取得するように構成されている。第3の取得ユニット130は、クラスタ化されたサブユニット131と取得サブユニット132とを含んでいてもよい。いくつかの実施形態では、第2の取得ユニット120は、第1の文に従って文ライブラリを検索し、かつ、第1の文に対応する複数の第2の文を取得するように構成されている。クラスタリングサブユニット131は、クラスタ化された第2の文を取得するために、第2の文をシーケンス化し、クラスタ化するように構成されている。   In some embodiments of the present disclosure, the third obtaining unit 130 is configured to obtain the intent explanation guidance sentence according to the second sentence. The third acquisition unit 130 may include clustered subunits 131 and acquisition subunits 132. In some embodiments, the second obtaining unit 120 is configured to search the sentence library according to the first sentence and obtain a plurality of second sentences corresponding to the first sentence. . The clustering subunit 131 is configured to sequence and cluster the second sentence to obtain a clustered second sentence.

本開示のいくつかの実施形態では、クラスタ化されたサブユニット131は、数式1に従って、第2の文をシーケンス化する。
ここで、Qbは第2の文を表し、Pはi番目の木の投票値を表し、Nは木の数を表す。
数式1は、Qbs(すなわち、第2の文)のスコアを計算するためのランダムフォレストモデル式である。次に、クラスタ化されたサブユニット131は、意味類似度に従って第2の文をクラスタ化する。例えば、「赤ちゃんは何歳ですか」という文と「何歳の赤ちゃん」という他の文とは、同じような意味であるので、クラスタ化してもよい。本開示のいくつかの実施形態では、クラスタリングは、K平均法クラスタリングアルゴリズム(ハードクラスタリングアルゴリズム)と階層的クラスタリングアルゴリズムとの少なくとも一つによって、実行されてもよい。
In some embodiments of the present disclosure, the clustered subunit 131 sequences the second sentence according to Equation 1.
Here, Qb represents the second sentence, P i represents the vote value of the i-th tree, and N represents the number of trees.
Formula 1 is a random forest model formula for calculating the score of Qbs (ie, the second sentence). Next, the clustered subunit 131 clusters the second sentence according to the semantic similarity. For example, the sentence “How old is a baby” and the other sentence “How old is a baby” have the same meaning and may be clustered. In some embodiments of the present disclosure, clustering may be performed by at least one of a K-means clustering algorithm (hard clustering algorithm) and a hierarchical clustering algorithm.

本開示のいくつかの実施形態では、取得サブユニット132は、クラスタ化された第2の文をシーケンス化し、かつ、意図説明のガイダンス文を取得するように構成されている。   In some embodiments of the present disclosure, the acquisition subunit 132 is configured to sequence the clustered second sentence and to obtain the intent description guidance sentence.

本開示のいくつかの実施形態では、取得サブユニット132は、数式2に従ってクラスタ化された第2の文(すなわち種類)のスコアを計算してもよい。
ここで、cは種類を表し、|c|は種類におけるQbの数を表し、λは種類の確率評価の重み値を表す(0<λ<1)。本開示のいくつかの実施形態では、クラスタ化された第2の文(すなわち、種類)のスコアが計算された後、クラスタ化された第2の文(すなわち、種類)がスコアに従ってシーケンス化され、最も高いスコアが得られた3つの意図説明のガイダンス文が取得され、ユーザに表示するためにクライアントに返答され、その結果、ユーザが意図説明のガイダンス文に従って第1のクエリを更新することが可能になる。本実施形態では、3つの意図説明のガイダンス文は、単なる例示として提供されたものである。本開示のいくつかの実施形態では、一つ以上の意図説明のガイダンス文を、本開示を特に限定することなく、取得してもよい。
In some embodiments of the present disclosure, the acquisition subunit 132 may calculate the score of the second sentence (ie, type) clustered according to Equation 2.
Here, c represents a type, | c | represents the number of Qb in the type, and λ represents a weight value for probability evaluation of the type (0 <λ <1). In some embodiments of the present disclosure, after the score of the clustered second sentence (ie, type) is calculated, the clustered second sentence (ie, type) is sequenced according to the score. The three intent explanation guidance sentences with the highest scores are obtained and returned to the client for display to the user, so that the user updates the first query according to the intent explanation guidance sentences. It becomes possible. In the present embodiment, the three intention explanation guidance texts are provided as examples only. In some embodiments of the present disclosure, one or more intent guidance text may be obtained without particularly limiting the present disclosure.

本開示のいくつかの実施形態では、第2の取得モジュール200は、意図説明のガイダンス文に従って更新される第2のクエリを取得し、その第2のクエリに従って検索結果を取得するように構成されている。   In some embodiments of the present disclosure, the second acquisition module 200 is configured to acquire a second query that is updated according to the intent description guidance text, and to acquire search results according to the second query. ing.

本開示のいくつかの実施形態では、第2の取得モジュール200は、意図説明のガイダンス文に従って更新される第2のクエリを取得し、その第2のクエリ従って検索結果を取得するようにしてもよい。例えば、検索エンジンがクライアントを通じてユーザに意図説明のガイダンス文を表示し、ユーザが検索エンジンが提供する入力ボックスに改正したクエリ(例えば、第2のクエリ)を入力し、その後に、検索エンジンが更新されるクエリに従って検索を行い、かつ、検索結果を取得してもよい。   In some embodiments of the present disclosure, the second obtaining module 200 may obtain a second query that is updated according to the intent explanation guidance text, and obtain the search result according to the second query. Good. For example, the search engine displays a guidance sentence for the intention explanation to the user through the client, and the user inputs the revised query (for example, the second query) in the input box provided by the search engine, and then the search engine updates. The search may be performed according to the query to be obtained, and the search result may be acquired.

本開示のいくつかの実施形態では、返答モジュール300は、クライアントに検索結果を返答するように構成されている。   In some embodiments of the present disclosure, the response module 300 is configured to return search results to the client.

本開示のいくつかの実施形態では、第2の取得モジュール200が検索結果を取得した後、返答モジュール300がクライアントに検索結果を返答し、ユーザに検索結果を表示してもよい。ユーザは、検索結果に基づき必要とするリソースを取得してもよい。   In some embodiments of the present disclosure, after the second acquisition module 200 acquires the search results, the response module 300 may return the search results to the client and display the search results to the user. The user may acquire necessary resources based on the search result.

本開示のいくつかの実施形態では、確立モジュール400は、文ライブラリを確立するように構成されている。   In some embodiments of the present disclosure, the establishment module 400 is configured to establish a sentence library.

本開示のいくつかの実施形態では、意図説明のガイダンス文が取得される前に、確立モジュール400は、文ライブラリを確立してもよく、検索エンジンは意図説明のガイダンス文を取得するために文ライブラリを検索することができる。本開示のいくつかの実施形態では、文ライブラリは、事前に確立されてもよく、したがって、文ライブラリを確立するステップを回避することもできる。   In some embodiments of the present disclosure, the establishment module 400 may establish a sentence library before the intent explanation guidance text is obtained, and the search engine may use the sentence to obtain the intent explanation guidance text. You can search the library. In some embodiments of the present disclosure, a sentence library may be pre-established, and thus the step of establishing a sentence library may be avoided.

本開示のいくつかの実施形態では、確立モジュール400は、第1の取得ユニット410と第2の取得ユニット420と確立ユニット430とフィルタリングユニット440とを含む。   In some embodiments of the present disclosure, the establishment module 400 includes a first acquisition unit 410, a second acquisition unit 420, an establishment unit 430, and a filtering unit 440.

本開示のいくつかの実施形態では、第1の取得ユニット410は、第1の情報に従って、第1の文を取得するように構成されている。   In some embodiments of the present disclosure, the first acquisition unit 410 is configured to acquire the first sentence according to the first information.

本開示のいくつかの実施形態では、第1の取得ユニット410は、第1の情報を分割して、かつ、その第1の情報が予め設定された特徴量に従って予め設定されたタイプの文に属するかどうかを検出してもよい。第1の情報が予め設定されたタイプの文に属する場合、第1の取得ユニット410は、第1の情報に従って第1の文を取得する。本開示のいくつかの実施形態では、第1の情報がコミュニティユーザのナレッジ交換プラットフォームにおける文を含み、予め設定されたタイプの文が疑問文の質問、肯定文、修辞的な質問などの様々な文を含み、予め設定された特徴量が疑問詞の辞書又は質問文の特徴量を含むことができる。   In some embodiments of the present disclosure, the first acquisition unit 410 divides the first information, and the first information is converted into a sentence of a preset type according to a preset feature amount. Whether it belongs or not may be detected. When the first information belongs to a preset type of sentence, the first acquisition unit 410 acquires the first sentence according to the first information. In some embodiments of the present disclosure, the first information includes sentences in the community user's knowledge exchange platform, and the preset types of sentences include various questions such as question questions, affirmative sentences, rhetorical questions, etc. It is possible to include a sentence, and a preset feature amount may include a question dictionary or a feature amount of a question sentence.

本開示のいくつかの実施形態では、第2の取得ユニット420は、第1の情報に関連する第2の情報に従って第2の文を取得するように構成されている。   In some embodiments of the present disclosure, the second obtaining unit 420 is configured to obtain the second sentence according to second information related to the first information.

本開示のいくつかの実施形態では、第2の取得ユニット420は、第2の情報を分割して、かつ、その第2の情報が予め設定された特徴量に従って予め設定されたタイプの文に属するかどうかを検出してもよい。第2の情報が予め設定されたタイプの文に属している場合、第2の取得ユニット420は、第1の情報に関連する第2の情報に従って第2の文を取得してもよい。   In some embodiments of the present disclosure, the second acquisition unit 420 divides the second information, and the second information is converted into a sentence of a preset type according to a preset feature amount. Whether it belongs or not may be detected. If the second information belongs to a preset type of sentence, the second acquisition unit 420 may acquire the second sentence according to the second information related to the first information.

本開示のいくつかの実施形態では、確立ユニット430は、第1の文と第2の文とに従って文ライブラリ内の少なくとも一つの文のペアを確立するように構成されている。   In some embodiments of the present disclosure, the establishment unit 430 is configured to establish at least one sentence pair in the sentence library according to the first sentence and the second sentence.

本開示のいくつかの実施形態では、確立ユニット430は、第1及び第2の文が得られた後、文ライブラリを確立又は拡張するために、第1及び第2の文に従って少なくとも一つの文のペアを確立し、かつ、文ライブラリに文のペアを記憶してもよい。   In some embodiments of the present disclosure, the establishing unit 430 may determine that at least one sentence according to the first and second sentences to establish or extend a sentence library after the first and second sentences are obtained. And a sentence pair may be stored in the sentence library.

本開示のいくつかの実施形態では、検索エンジンは、コミュニティユーザのナレッジ交換プラットフォームにおいてリソースを検索してもよい。そのリソースは、ユーザによって提供される複数の質問(第1の情報)と、これらの質問に対する他のユーザから提供される回答(第2の情報)とが含まれる。質問と回答との両方が予め設定されたタイプの文に属すと判断された後、確立ユニット430は、少なくとも一つの質問(第1の文)とこれに対応する回答(第2の文)とからなる文のペアを取得してもよい。こうして文ライブラリが構築される。例えば、あるユーザが「バイドゥノウズ」に「赤ちゃんが38.5℃の発熱がある場合は何をしたらよいですか」という質問をし、他のユーザが「それは赤ちゃんが何歳かによります」との答えを提供する。確立ユニット430は、この質問とこの回答とからなる文のペアを取得し、文ライブラリにこの文のペアを記憶してもよい。こうして、文ライブラリが確立又は拡張する。   In some embodiments of the present disclosure, the search engine may search for resources in the community user's knowledge exchange platform. The resource includes a plurality of questions (first information) provided by the user and answers (second information) provided by other users to these questions. After determining that both the question and the answer belong to a preset type of sentence, the establishing unit 430 determines that at least one question (first sentence) and a corresponding answer (second sentence) A sentence pair consisting of may be acquired. A sentence library is thus constructed. For example, one user asks Baidu Knows what to do if the baby has a fever of 38.5 degrees Celsius, and another user says, “It depends on how old the baby is.” I will provide a. The establishment unit 430 may obtain a sentence pair consisting of this question and this answer, and store the sentence pair in the sentence library. Thus, the sentence library is established or expanded.

本開示のいくつかの実施形態では、フィルタリングユニット440は、文ライブラリ内の文のペアをフィルタリングするように構成されている。   In some embodiments of the present disclosure, the filtering unit 440 is configured to filter sentence pairs in a sentence library.

本開示のいくつかの実施形態では、フィルタリングユニット440は、確立ユニット430が文ライブラリ内に少なくとも一つの文のペアを確立した後に、文ライブラリ内の文のペアをフィルタリングすることができる。本開示のいくつかの実施形態では、フィルタリングユニット440は、予め設定されたフィルタリングルールに従って文ライブラリ内の第2の文をフィルタリングする。例えば、第1の文「10月1日に旅行するのに面白い場所」と、第2の文「10月1日で面白い場所はどこ」は意味が類似し、かつ、同一の質問に属しているので、フィルタリングされるべきである。   In some embodiments of the present disclosure, the filtering unit 440 may filter the sentence pairs in the sentence library after the establishment unit 430 has established at least one sentence pair in the sentence library. In some embodiments of the present disclosure, the filtering unit 440 filters the second sentence in the sentence library according to preset filtering rules. For example, the first sentence “A place that is interesting to travel on October 1” and the second sentence “Where is an interesting place on October 1” have similar meanings and belong to the same question. Should be filtered.

本開示の実施形態に係る情報検索デバイスによれば、検索エンジンによって提供される意図説明のガイダンス文が取得され、第1のクエリが意図説明のガイダンス文に従って更新され、検索結果が第2のクエリのような更新されるクエリに従って提供されるので、その結果、ユーザの検索意図が明確になる。さらに、ユーザの検索意図を識別するための検索エンジンの精度が向上し、ユーザの要求が満たされ、そして、ユーザ体験は改善される。   According to the information search device according to the embodiment of the present disclosure, the guidance sentence of the intention explanation provided by the search engine is acquired, the first query is updated according to the guidance sentence of the intention explanation, and the search result is the second query. As a result, the search intention of the user becomes clear. Furthermore, the accuracy of the search engine for identifying the user's search intention is improved, the user's requirements are met, and the user experience is improved.

本開示の第3の側面の実施形態は、コンピュータ可読記憶媒体を提供する。コンピュータ可読記憶媒体は、コンピュータ上で実行される、本開示の第1の側面の実施形態に従って情報検索方法を実行するためのコンピュータプログラムを含む。   An embodiment of the third aspect of the present disclosure provides a computer readable storage medium. The computer readable storage medium includes a computer program for executing the information retrieval method according to the embodiment of the first aspect of the present disclosure, which is executed on a computer.

本明細書においてフローチャートで記載され又は如何なる他の方法で記載された如何なる手順又は方法も、特定の論理関数又は手順を実現する実行可能なコードを記憶するための一つ以上のモジュール、部分又は部品を含むと理解されたい。さらに、本開示の有利な実施形態には、実行の順序が図示され又は説明されているものとは異なる他の実装が含まれ、関連する機能に従って実質的に同時又は逆の順番での実行機能が含まれている。このことは、本開示の実施形態が属する当業者によって理解されるべきである。   One or more modules, portions or components for storing executable code that implements a particular logic function or procedure as described in any flowchart or in any other manner herein. Should be understood to include Furthermore, advantageous embodiments of the present disclosure include other implementations whose execution order is different from that shown or described, and that the execution functions in substantially simultaneous or reverse order according to the related functions. It is included. This should be understood by one skilled in the art to which embodiments of the present disclosure belong.

本明細書に他の手法で記載され又はフローチャートに示されている論理及び/又はステップ、例えば、論理機能を実現するための実行可能な命令の特定のシーケンステーブルは、具体的には、命令実行システム、デバイス又は装置(コンピュータに基づくシステム、プロセッサを含むシステム、又は、命令実行システム、デバイス、装置からの命令を取得可能で命令を実行する他のシステムなど)によって用いられ、又は、命令実行システム、デバイス及び装置と組み合わせて用いられる、如何なるコンピュータ可読媒体で達成することができる。その仕様としては、「コンピュータ可読媒体」は、命令実行システム、デバイス又は装置によって、又は、これらとの組み合わせによって用いられる、記憶プログラム、通信プログラム、伝搬プログラム、又は、転送プログラムを含むことに適した如何なるデバイスとしてもよい。コンピュータ可読媒体のより具体的な例としては、こそれらに限定されるものではないが、1本以上のワイヤを有する電気接続(電子デバイス)、ポータブルコンピュータの筐体(磁気デバイス)、ランダム・アクセス・メモリ(RAM)、読み出し専用メモリ(ROM)、消去可能プログラマブル読み出し専用メモリ(EPROM又はフラッシュメモリ)、光ファイバデバイス及びポータブルコンパクトディスク読み出し専用メモリ(CDROM)が挙げられる。加えて、コンピュータ可読媒体は、ペーパーであってもよいし、又は、その上にプログラムを印刷可能な他の適切な媒体であってもよい。なぜなら、例えば、ペーパー又は他の適切な媒体は、電気的な手法でプログラムを取得することが必要なとき、他の適切な方法で光学的にスキャンし、次に、編集し、復号化し、又は処理することができ、それから、そのプログラムは、コンピュータメモリに記憶することができるからである。   The specific sequence table of executable instructions to implement the logic and / or steps described elsewhere herein or shown in the flowcharts, eg, logic functions, is specifically instruction execution. System, device or apparatus (computer based system, system including processor, or instruction execution system, device, other system capable of obtaining instructions from device, executing instructions, etc.) or instruction execution system Any computer-readable medium used in combination with the device and apparatus. As its specification, “computer readable medium” is suitable to include a storage program, a communication program, a propagation program, or a transfer program used by an instruction execution system, device or apparatus, or in combination with these. Any device may be used. More specific examples of computer readable media include, but are not limited to, electrical connections (electronic devices) having one or more wires, portable computer enclosures (magnetic devices), random access. Memory (RAM), read only memory (ROM), erasable programmable read only memory (EPROM or flash memory), fiber optic devices and portable compact disk read only memory (CDROM). In addition, the computer readable medium may be paper or other suitable medium on which the program can be printed. Because, for example, paper or other suitable media is optically scanned in other suitable ways when it is necessary to obtain the program in an electrical manner and then edited, decoded, or Because it can be processed and the program can then be stored in computer memory.

本開示の各部分は、ハードウェア、ソフトウェア、ファームウェア、又はそれらの組み合わせによって実現することができると理解される。上記実施形態では、複数のステップ又は方法は、メモリに記憶されたソフトウェア又はファームウェアによって実現してもよく、適切な命令実行システムによって実行してもよい。例えば、ハードウェアによって実現する場合、別の実施形態においても同様であるが、これらのステップ又は方法は、データ信号の論理関数を実現するための論理ゲート回路を有する分散論理回路、適切な組み合わせ論理ゲート回路を有する特定用途向け集積回路、プログラマブルゲートアレイ(PGA)、フィールドプログラマブルゲートアレイ(FPGA)等の本技術分野における公知技術の一つ又は組み合わせによって実現してもよい。   It is understood that each part of the present disclosure can be realized by hardware, software, firmware, or a combination thereof. In the above embodiments, the steps or methods may be implemented by software or firmware stored in a memory, and may be executed by a suitable instruction execution system. For example, when implemented by hardware, the same is true in other embodiments, but these steps or methods may be implemented in a distributed logic circuit having a logic gate circuit for implementing a logic function of a data signal, suitable combinational logic. It may be realized by one or a combination of known techniques in this technical field such as an application specific integrated circuit having a gate circuit, a programmable gate array (PGA), and a field programmable gate array (FPGA).

当業者は、本開示の上述の例示の実施方法のステップの全部又は一部がプログラムによって関連するハードウェアに命じることによって達成され得ることを理解すべきであろう。そのプログラムは、コンピュータ可読記憶媒体に記憶されてもよく、そして、コンピュータ上で実行される本開示の方法の実施形態のステップの一つ又は組み合わせを含む。   Those skilled in the art will understand that all or part of the above-described exemplary implementation methods of the present disclosure may be achieved by commanding the associated hardware by a program. The program may be stored on a computer readable storage medium and includes one or a combination of steps of the disclosed method embodiments executed on a computer.

加えて、本開示の実施形態の各機能セルは処理モジュールに統合されてもよく、又は、これらのセルは別個の物理的な存在であってもよく、又は、二種以上のセルは処理モジュールに統合されてもよい。統合モジュールは、ハードウェアの形式で、又は、ソフトウェア機能モジュールの形式で実現されてもよい。統合モジュールが、ソフトウェア機能モジュールの形式で実現され、かつ、スタンドアロン製品として販売又は使用されている場合は、その統合モジュールは、コンピュータ可読記憶媒体に記憶されてもよい。   In addition, each functional cell of embodiments of the present disclosure may be integrated into a processing module, or these cells may be separate physical entities, or two or more cells may be processing modules. May be integrated. The integration module may be realized in the form of hardware or in the form of a software function module. If the integration module is implemented in the form of a software function module and sold or used as a stand-alone product, the integration module may be stored on a computer readable storage medium.

上記記憶媒体は、読み出し専用メモリ、磁気ディスク、CD等であってもよい。   The storage medium may be a read-only memory, a magnetic disk, a CD, or the like.

「実施形態」、「いくつかの実施形態」、「例」、「具体例」又は「いくつかの例」についての本明細書を通しての言及は、実施形態又は例に関連して記載された特定の特徴、構造、材料又は特性が本開示の少なくとも一つの実施形態又は例に含まれていることを意味する。本明細書を通して登場する言い回しは、必ずしも本開示の同じ実施形態又は例を指しているわけではない。さらに、特定の特徴、構造、材料又は特性は、一つ以上の実施形態又は例における如何なる適切な手法で組み合わせられてもよい。   References throughout this specification to “embodiments”, “some embodiments”, “examples”, “examples” or “some examples” are specific statements made in connection with the embodiments or examples. Is included in at least one embodiment or example of the present disclosure. Statements appearing throughout this specification are not necessarily referring to the same embodiment or example of the present disclosure. Furthermore, the particular features, structures, materials, or characteristics may be combined in any suitable manner in one or more embodiments or examples.

説明的な実施形態が示されかつ記載されたが、当業者であれば、上記実施形態が本開示を限定するとは解釈することはできず、かつ、変更、代替、および修正が本開示の趣旨、原理、範囲から逸脱することなく、実施形態において行うことができると認識されるであろう。


While illustrative embodiments have been shown and described, those of ordinary skill in the art will not be able to interpret the above embodiments as limiting the present disclosure, and alterations, alternatives, and modifications are the intent of the present disclosure. It will be appreciated that this can be done in embodiments without departing from the principles and scope.


Claims (15)

第1のクエリを受け、かつ、前記第1のクエリに従って意図説明のガイダンス文を取得することと、
前記意図説明のガイダンス文に従って更新される第2のクエリを受け、かつ、前記第2のクエリに従って検索結果を取得することと、
前記検索結果をクライアントに返答することと、
を備える情報検索方法。
Receiving a first query and obtaining a guidance sentence of an intention explanation according to the first query;
Receiving a second query updated in accordance with the intent description guidance text and obtaining a search result in accordance with the second query;
Returning the search results to the client;
An information search method comprising:
さらに、前記第1のクエリに従って前記意図説明のガイダンス文を取得する前に文ライブラリを確立することを備え、
前記文ライブラリの確立では、特に、
第1の情報に従って第1の文を取得することと、
前記第1の情報に関連する第2の情報に従って第2の文を取得することと、
前記第1の文と前記第2の文とに従って前記文ライブラリに少なくとも一つの文のペアを確立することと、
を備える請求項1に記載の情報検索方法。
Further comprising establishing a sentence library prior to obtaining the intent explanation guidance sentence according to the first query,
In establishing the sentence library, in particular,
Obtaining a first sentence according to the first information;
Obtaining a second sentence according to second information related to the first information;
Establishing at least one sentence pair in the sentence library according to the first sentence and the second sentence;
The information search method according to claim 1, further comprising:
さらに、前記文ライブラリ内の前記文のペアをフィルタリングすることを備え、
前記文ライブラリ内の前記文のペアをフィルタリングすることは、特に、
予め設定されたフィルタリングルールに従って前記文ライブラリ内の前記第2の文をフィルタリングすること、
を備える請求項2に記載の情報検索方法。
Further comprising filtering the sentence pairs in the sentence library;
Filtering the sentence pairs in the sentence library, in particular,
Filtering the second sentence in the sentence library according to preset filtering rules;
The information search method according to claim 2, further comprising:
前記第1のクエリに従って意図説明のガイダンス文を取得することは、
前記第1のクエリの特徴量情報を取得し、かつ、前記特徴量情報に従って前記特徴量情報に関連する第1の文を取得することと、
前記第1の文に従って前記文ライブラリを検索し、かつ、前記第1の文に対応する第2の文を取得することと、
前記第2の文に従って前記意図説明のガイダンス文を取得することと、
を備え、及び/又は、
前記第1の情報に関連する第2の情報に従って第2の文を取得することは、
前記第1の情報に関連する前記第2の情報に従って複数の第2の文を取得すること、
を備え、かつ、
前記第2の文に従って前記意図説明のガイダンス文を取得することは、特に、
クラスタ化された第2の文を取得するために、前記第2の文をシーケンス化し、かつ、クラスタ化することと、
前記意図説明のガイダンス文を取得するために、前記クラスタ化された第2の文をシーケンス化することと、
を備える請求項2又は3に記載の情報検索方法。
Obtaining a guidance sentence for an intention explanation according to the first query includes:
Obtaining feature quantity information of the first query, and obtaining a first sentence related to the feature quantity information according to the feature quantity information;
Searching the sentence library according to the first sentence and obtaining a second sentence corresponding to the first sentence;
Obtaining a guidance sentence for the intention explanation according to the second sentence;
And / or
Obtaining a second sentence according to second information related to the first information,
Obtaining a plurality of second sentences according to the second information related to the first information;
And having
Obtaining the intent explanation guidance sentence according to the second sentence, in particular,
Sequencing and clustering the second sentence to obtain a clustered second sentence;
Sequencing the clustered second sentence to obtain the intent description guidance sentence;
The information search method according to claim 2 or 3.
第1の情報に従って第1の文を取得することは、
前記第1の情報を分割することと、
前記第1の情報が予め設定された言語モデルに従って予め設定されたタイプの文に属するかどうかを検出することと、
前記第1の情報が予め設定されたタイプの文に属すると判断された場合に、前記第1の情報に従って前記第1の文を取得することと、
を備え、及び/又は、
前記第1の情報に関連する第2の情報に従って第2の文を取得することは、
前記第2の情報を分割することと、
前記第2の情報が予め設定された特徴量に従って予め設定されたタイプの文に属するかどうかを検出することと、
前記第2の情報が予め設定されたタイプの文に属すると判断される場合に、前記第2の情報に従って前記第2の文を取得することと、
を備える請求項2乃至4のいずれか1項に記載の情報検索方法。
Acquiring the first sentence according to the first information is
Dividing the first information;
Detecting whether the first information belongs to a preset type of sentence according to a preset language model;
Obtaining the first sentence in accordance with the first information when it is determined that the first information belongs to a preset type of sentence;
And / or
Obtaining a second sentence according to second information related to the first information,
Dividing the second information;
Detecting whether the second information belongs to a sentence of a preset type according to a preset feature amount;
When the second information is determined to belong to a preset type of sentence, obtaining the second sentence according to the second information;
The information search method according to any one of claims 2 to 4, further comprising:
クラスタ化された第2の文を取得するために前記第2の文をシーケンス化し、かつ、クラスタ化することは、
Qbが前記第2の文を表し、Pがi番目の木の投票値を表し、Nが木の数を表す場合、
に従って前記第2の文をシーケンス化し、かつ、意味類似度に従って前記第2の文をクラスタ化すること、
を備える請求項4又は5に記載の情報検索方法。
Sequencing and clustering the second sentence to obtain a clustered second sentence comprises:
If Qb represents the second sentence, P i represents the vote value of the i th tree, and N represents the number of trees,
Sequencing the second sentence according to and clustering the second sentence according to semantic similarity,
The information search method according to claim 4 or 5.
前記特徴量情報に従って前記特徴量情報に関連する第1の文を取得することは、
前記第1の文と前記第1のクエリとの間の意味類似性が第1の予め設定された閾値よりも大きいと判断される場合に前記第1の文を取得することを備え、又は、
前記第1の文に対応する第2の文を取得することは、
前記第1のクエリが前記第2の文の予め設定されたタイプのキーワードを含まないと判断される場合に前記第2の文を取得することを備え、又は、
前記第1のクエリと前記第2の文との間の意味類似性が第2の予め設定された閾値よりも小さいと判断する場合に前記第2の文を取得することを備える、
請求項4から6のいずれか1項に記載の情報検索方法。
Acquiring a first sentence related to the feature amount information according to the feature amount information,
Obtaining the first sentence when it is determined that the semantic similarity between the first sentence and the first query is greater than a first preset threshold, or
Obtaining a second sentence corresponding to the first sentence;
Obtaining the second sentence when it is determined that the first query does not include a preset type keyword of the second sentence, or
Obtaining the second sentence when determining that the semantic similarity between the first query and the second sentence is less than a second preset threshold,
The information search method according to any one of claims 4 to 6.
第1のクエリを受け、かつ、前記第1のクエリに従って意図説明のガイダンス文を取得するように構成される第1の取得モジュールと、
前記意図説明のガイダンス文に従って更新される第2のクエリを受け、かつ、前記第2のクエリに従って検索結果を取得するように構成される第2の取得モジュールと、
前記検索結果を返答するように構成される返答モジュールと、
を備える情報検索デバイス。
A first obtaining module configured to receive a first query and obtain a guidance sentence of an intention explanation according to the first query;
A second acquisition module configured to receive a second query updated according to the intent explanation guidance text and to acquire a search result according to the second query;
A reply module configured to reply the search results;
An information retrieval device comprising:
さらに、文ライブラリを確立するように構成される確立モジュールを備え、
特に、前記確立モジュールは、
第1の情報に従って第1の文を取得するように構成される第1の取得ユニットと、
前記第1の情報に関連する第2の情報に従って第2の文を取得するように構成される第2の取得ユニットと、
前記第1の文と前記第2の文とに従って前記文ライブラリにおいて少なくとも一つの文のペアを確立するように構成されている確立ユニットと、
を備える請求項8に記載の情報検索デバイス。
In addition, an establishment module configured to establish a sentence library is provided,
In particular, the establishment module comprises:
A first acquisition unit configured to acquire a first sentence according to first information;
A second acquisition unit configured to acquire a second sentence according to second information related to the first information;
An establishing unit configured to establish at least one sentence pair in the sentence library according to the first sentence and the second sentence;
The information search device according to claim 8.
前記確立モジュールは、
さらに、前記文ライブラリ内の前記文のペアをフィルタリングするように構成されるフィルタリングユニットを備え、
特に、前記フィルタリングユニットは、予め設定されたフィルタリングルールに従って前記文ライブラリ内の前記第2の文をフィルタリングするように構成される請求項9に記載の情報検索デバイス。
The establishment module is
A filtering unit configured to filter the sentence pairs in the sentence library;
In particular, the filtering unit is configured to filter the second sentence in the sentence library according to preset filtering rules.
前記第1の取得モジュールは、
前記第1のクエリの特徴量情報を取得し、かつ、前記特徴量情報に従って前記特徴量情報に関連する第1の文を取得するように構成される第1の取得ユニットと、
前記第1の文に従って前記文ライブラリを検索し、かつ、前記第1の文に対応する第2の文を取得するように構成される第2の取得ユニットと、
前記第2の文に従って前記意図説明のガイダンス文を取得するように構成される第3の取得ユニットと、
を備え、及び/又は
前記第2の取得ユニットは、前記第1の情報に関連する第2の情報に従って複数の第2の文を取得するように構成されており、
前記第3の取得ユニットは、
クラスタ化された第2の文を取得するために、前記第2の文をシーケンス化し、かつ、クラスタ化するように構成されるクラスタリングサブユニットと、
前記意図説明のガイダンス文を取得するために、前記クラスタ化された第2の文をシーケンス化するように構成される取得サブユニットと、
を備える請求項9又は10に記載の情報検索デバイス。
The first acquisition module is
A first acquisition unit configured to acquire feature amount information of the first query and to acquire a first sentence related to the feature amount information according to the feature amount information;
A second acquisition unit configured to search the sentence library according to the first sentence and to obtain a second sentence corresponding to the first sentence;
A third acquisition unit configured to acquire a guidance sentence of the intention explanation according to the second sentence;
And / or the second acquisition unit is configured to acquire a plurality of second sentences according to second information related to the first information,
The third acquisition unit is
A clustering subunit configured to sequence and cluster the second sentence to obtain a clustered second sentence;
An acquisition subunit configured to sequence the clustered second sentence to obtain the intent description guidance sentence;
The information search device according to claim 9 or 10.
前記第1の取得ユニットは、前記第1の情報を分割し、前記第1の情報が予め設定された言語モデルに従って予め設定されたタイプの文に属すかどうかを検出し、かつ、前記第1の情報が前記予め設定されたタイプの文に属すと判断される場合に前記第1の情報に従って前記第1の文を取得するように構成され、及び/又は
前記第2の取得ユニットは、前記第2の情報を分割し、前記第2の情報が予め設定された特徴量に従って予め設定されたタイプの文に属すかどうかを検出し、かつ、前記第2の情報が予め設定されたタイプの文に属すると判断される場合に前記第2の情報に従って前記第2の文を取得するように構成される、
請求項9から11のいずれか1項に記載の情報検索デバイス。
The first acquisition unit divides the first information, detects whether the first information belongs to a sentence of a preset type according to a preset language model, and the first information unit Is configured to acquire the first sentence according to the first information when it is determined that the information belongs to the preset type of sentence, and / or the second acquisition unit includes the Dividing the second information, detecting whether the second information belongs to a sentence of a preset type according to a preset feature amount, and the second information is of a preset type Configured to obtain the second sentence according to the second information when determined to belong to a sentence;
The information search device according to any one of claims 9 to 11.
前記クラスタリングサブユニットは、Qbが前記第2の文を表し、Pがi番目の木の投票値を表し、Nが木の数を表す場合、
に従って前記第2の文をシーケンス化し、かつ、意味類似度に従って前記第2の文をクラスタ化するように構成される、
請求項11又は12に記載の情報検索デバイス。
The clustering subunit includes: Qb represents the second sentence, P i represents the vote value of the i-th tree, and N represents the number of trees.
Configured to sequence the second sentence according to and cluster the second sentence according to semantic similarity,
The information search device according to claim 11 or 12.
前記第1の取得ユニットは、前記第1の文と前記第1のクエリとの間の意味類似性が最初に予め設定した閾値よりも大きいと判断される場合に、前記第1の文を取得するように構成され、又は、
前記第2の取得ユニットは、前記第1のクエリが前記第2の文の予め設定されたタイプのキーワードを含まないと判断される場合に、前記第2の文を取得するように構成され、又は、
前記第2の取得ユニットは、前記第1のクエリと前記第2の文との間の意味類似性が第2の予め設定された閾値よりも小さいと判断される場合に、前記第2の文を取得するように構成される、請求項11から13のいずれか1項に記載の情報検索デバイス。
The first acquisition unit acquires the first sentence when it is determined that the semantic similarity between the first sentence and the first query is initially greater than a preset threshold. Configured to, or
The second acquisition unit is configured to acquire the second sentence when it is determined that the first query does not include a preset type keyword of the second sentence; Or
The second acquisition unit determines the second sentence when the semantic similarity between the first query and the second sentence is determined to be smaller than a second preset threshold. 14. An information retrieval device according to any one of claims 11 to 13, configured to obtain
第1のクエリを受け、かつ、前記第1のクエリに従って意図説明のガイダンス文を取得するステップと、
前記意図説明のガイダンス文に従って更新される第2のクエリを受け、かつ、前記第2のクエリに従って検索結果を取得するステップと、
前記検索結果をクライアントに返答するステップ
と、をコンピュータ上で実行する、コンピュータプログラムを備える、コンピュータ可読記憶媒体。

Receiving a first query and obtaining a guidance sentence of an intention explanation according to the first query;
Receiving a second query updated in accordance with the intent explanation guidance text and obtaining a search result in accordance with the second query;
A computer-readable storage medium comprising a computer program for executing on the computer the step of returning the search result to the client.

JP2014255754A 2014-12-18 2014-12-18 Information retrieval method and device Active JP6051366B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014255754A JP6051366B2 (en) 2014-12-18 2014-12-18 Information retrieval method and device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014255754A JP6051366B2 (en) 2014-12-18 2014-12-18 Information retrieval method and device

Publications (2)

Publication Number Publication Date
JP2016115294A true JP2016115294A (en) 2016-06-23
JP6051366B2 JP6051366B2 (en) 2016-12-27

Family

ID=56142074

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014255754A Active JP6051366B2 (en) 2014-12-18 2014-12-18 Information retrieval method and device

Country Status (1)

Country Link
JP (1) JP6051366B2 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111625706A (en) * 2020-05-22 2020-09-04 北京百度网讯科技有限公司 Information retrieval method, device, equipment and storage medium
CN112632234A (en) * 2019-10-09 2021-04-09 科沃斯商用机器人有限公司 Human-computer interaction method and device, intelligent robot and storage medium
CN116501960A (en) * 2023-04-18 2023-07-28 百度在线网络技术(北京)有限公司 Content retrieval method, device, equipment and medium

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006107520A (en) * 2005-10-11 2006-04-20 Okwave:Kk Terminal, program and q&a system
JP2012068985A (en) * 2010-09-24 2012-04-05 Yahoo Japan Corp Question-answer retrieval apparatus and method thereof
WO2013010262A1 (en) * 2011-07-19 2013-01-24 Suleman Kaheer Method and system of classification in a natural language user interface
JP2013143066A (en) * 2012-01-12 2013-07-22 Kddi Corp Question and answer program, server and method which use large amount of comment texts
US20130288219A1 (en) * 2012-04-30 2013-10-31 International Business Machines Corporation Providing Intelligent Inquiries In Question Answer Systems
WO2014022345A2 (en) * 2012-07-31 2014-02-06 Veveo, Inc. Disambiguating user intent in conversational interaction system for large corpus information retrieval
JP2014092822A (en) * 2012-10-31 2014-05-19 International Business Maschines Corporation Method and device for supporting update of node graph data
JP2014112316A (en) * 2012-12-05 2014-06-19 Kddi Corp Question answering program using large amounts of comment sentences, server and method

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006107520A (en) * 2005-10-11 2006-04-20 Okwave:Kk Terminal, program and q&a system
JP2012068985A (en) * 2010-09-24 2012-04-05 Yahoo Japan Corp Question-answer retrieval apparatus and method thereof
WO2013010262A1 (en) * 2011-07-19 2013-01-24 Suleman Kaheer Method and system of classification in a natural language user interface
JP2013143066A (en) * 2012-01-12 2013-07-22 Kddi Corp Question and answer program, server and method which use large amount of comment texts
US20130288219A1 (en) * 2012-04-30 2013-10-31 International Business Machines Corporation Providing Intelligent Inquiries In Question Answer Systems
WO2014022345A2 (en) * 2012-07-31 2014-02-06 Veveo, Inc. Disambiguating user intent in conversational interaction system for large corpus information retrieval
JP2014092822A (en) * 2012-10-31 2014-05-19 International Business Maschines Corporation Method and device for supporting update of node graph data
JP2014112316A (en) * 2012-12-05 2014-06-19 Kddi Corp Question answering program using large amounts of comment sentences, server and method

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
DEEPA PARANJPE: "Clustering Semantically Similar and Related Questions", [ONLINE], JPN6016033514, 2007, ISSN: 0003392464 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112632234A (en) * 2019-10-09 2021-04-09 科沃斯商用机器人有限公司 Human-computer interaction method and device, intelligent robot and storage medium
CN111625706A (en) * 2020-05-22 2020-09-04 北京百度网讯科技有限公司 Information retrieval method, device, equipment and storage medium
CN111625706B (en) * 2020-05-22 2023-05-30 北京百度网讯科技有限公司 Information retrieval method, device, equipment and storage medium
CN116501960A (en) * 2023-04-18 2023-07-28 百度在线网络技术(北京)有限公司 Content retrieval method, device, equipment and medium
CN116501960B (en) * 2023-04-18 2024-03-15 百度在线网络技术(北京)有限公司 Content retrieval method, device, equipment and medium

Also Published As

Publication number Publication date
JP6051366B2 (en) 2016-12-27

Similar Documents

Publication Publication Date Title
US20210027788A1 (en) Conversation interaction method, apparatus and computer readable storage medium
EP2930626A1 (en) Information searching method and device
US20190146985A1 (en) Natural language question answering method and apparatus
KR102094934B1 (en) Natural Language Question-Answering System and method
US9483459B1 (en) Natural language correction for speech input
CN108052547A (en) Natural language question-answering method and system based on question sentence and knowledge graph structural analysis
CN106776564B (en) Semantic recognition method and system based on knowledge graph
US10838951B2 (en) Query interpretation disambiguation
WO2021139229A1 (en) Text rhetorical sentence generation method, apparatus and device, and readable storage medium
KR20180041200A (en) Information processing method and apparatus
US20140351228A1 (en) Dialog system, redundant message removal method and redundant message removal program
JP2017511922A (en) Method, system, and storage medium for realizing smart question answer
KR20170046611A (en) Question sentence generation device and computer program
US9104750B1 (en) Using concepts as contexts for query term substitutions
CN101131706A (en) Query amending method and system thereof
CN111382255A (en) Method, apparatus, device and medium for question and answer processing
CN111090727A (en) Language conversion processing method and device and dialect voice interaction system
JP2020123131A (en) Dialog system, dialog method, program, and storage medium
CN103605781A (en) Implicit expression chapter relationship type inference method and system
JP6051366B2 (en) Information retrieval method and device
CN112559709A (en) Knowledge graph-based question and answer method, device, terminal and storage medium
CN104021202A (en) Device and method for processing entries of knowledge sharing platform
CN111611793B (en) Data processing method, device, equipment and storage medium
CN113190692A (en) Self-adaptive retrieval method, system and device for knowledge graph
JP6942759B2 (en) Information processing equipment, programs and information processing methods

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160527

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160905

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160927

R150 Certificate of patent or registration of utility model

Ref document number: 6051366

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250