JP2013200862A - Method and device for diversifying query results - Google Patents

Method and device for diversifying query results Download PDF

Info

Publication number
JP2013200862A
JP2013200862A JP2012276584A JP2012276584A JP2013200862A JP 2013200862 A JP2013200862 A JP 2013200862A JP 2012276584 A JP2012276584 A JP 2012276584A JP 2012276584 A JP2012276584 A JP 2012276584A JP 2013200862 A JP2013200862 A JP 2013200862A
Authority
JP
Japan
Prior art keywords
query
subgraph
keyword
query result
results
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012276584A
Other languages
Japanese (ja)
Other versions
JP5486667B2 (en
Inventor
Jianqiang Li
ジェンチャン リー
shun cheng Liu
シュンチェン リュウ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC China Co Ltd
Original Assignee
NEC China Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC China Co Ltd filed Critical NEC China Co Ltd
Publication of JP2013200862A publication Critical patent/JP2013200862A/en
Application granted granted Critical
Publication of JP5486667B2 publication Critical patent/JP5486667B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a method and device for diversifying query results.SOLUTION: In the method for diversifying the query result, a combination set of related keywords is constructed by extracting the related keywords from domain ontology for respective query keywords of a query, a query result set is acquired by performing search by the combination of the respective related keywords in the combination set of the related keywords, the corresponding number of query results are extracted from the respective query result sets to construct a final query result set, and the constructed final query result set is ranked to acquire diversified query results.

Description

本発明は情報検索技術に関し、特にクエリ結果を多様化するための方法および装置に関する。   The present invention relates to an information search technique, and more particularly, to a method and apparatus for diversifying query results.

従来の情報検索技術では、例えばサーチ結果をクラスタ化または分類する、平均分散分析などによって結果をランク付けし直すなど、検索された文書を後処理またはランク付けし直すことによって一般的に多様化が行われる。   Traditional information retrieval techniques typically diversify by post-processing or re-ranking retrieved documents, such as clustering or classifying search results, re-ranking results by means of mean variance analysis, etc. Done.

情報検索技術の発展と共に、サーチ結果の多様化および情報検索のクエリの曖昧性除去におけるユーザの要求はますます高まっている。特に、サーチ結果の多様化とは、ユーザによるクエリキーワード入力にはいくつかの解釈がある可能性があり、取得されたクエリ結果は、これらの異なる解釈をカバーする結果でなければならないことを意味する。サーチ結果の多様化の目的は、サーチ結果の関連性および新規性のバランスをとることによってユーザが満足しないリスクを可能な限り低下させることである。クエリの曖昧性除去は、ユーザの入力キーワードに基づいて可能性があるすべてのクエリの意図を識別し、より正確な方法で意図を表すことに重点を置いている。   With the development of information retrieval technology, user demands for diversification of search results and disambiguation of information retrieval queries are increasing. In particular, diversification of search results means that there may be several interpretations of query keyword input by the user, and the retrieved query results must cover these different interpretations. To do. The purpose of search result diversification is to reduce as much as possible the risk that users are not satisfied by balancing the relevance and novelty of search results. Query disambiguation focuses on identifying all possible query intents based on user input keywords and expressing the intent in a more accurate manner.

クエリの曖昧性除去は、サーチの多様化をサポートする新しい方法として働き、これによって特に結果のスケールが大きい時は、計算コストが効率的に節約され結果がよりわかりやすくなり得る。多様化されたサーチは、従来技術では一般的にクエリログにおいて統計分析(または機械学習など)を使用することによって実行される。   Query disambiguation serves as a new way to support search diversification, which can effectively save computational costs and make the results more understandable, especially when the results are large in scale. Diversified searches are typically performed in the prior art by using statistical analysis (or machine learning, etc.) in the query log.

具体的にはクエリ結果を多様化するための既存の方法は、図1に示されるようなクエリ間の変換の形を採用しており、以下を含む。   Specifically, an existing method for diversifying query results adopts a form of conversion between queries as shown in FIG. 1 and includes the following.

ステップS101は、クエリログの大きいサンプルの分析を行うことによって、所与のクエリQについてk個の関連するクエリR(Q)を生成することである。   Step S101 is to generate k related queries R (Q) for a given query Q by analyzing a large sample of query logs.

ステップS102は、クエリ結果の各組からn/(k+1)個(nはユーザ文書の数を表す)の結果を抽出することによって、最初のDOCリストを取得することである。そして   Step S102 is to obtain an initial DOC list by extracting n / (k + 1) (n represents the number of user documents) results from each set of query results. And

ステップS103は、最初のDOCリストを関連性フィードバック手法でランク付けし直すことである。   Step S103 is to re-rank the first DOC list with the relevance feedback technique.

図2に示されるようなクエリ結果を多様化するための対応する装置は、   A corresponding device for diversifying query results as shown in FIG.

ユーザのクエリキーワードを格納するように構成されたクエリユニット201と、   A query unit 201 configured to store user query keywords;

ユーザのクエリログを格納するように構成されたクエリログメモリユニット202と、   A query log memory unit 202 configured to store user query logs;

ユーザのクエリキーワードおよびクエリログに従ってターゲットクエリに関連するクエリキーワードを決定するように構成されたクエリ曖昧性除去ユニット203と、   A query disambiguation unit 203 configured to determine query keywords related to the target query according to the user's query keywords and query log;

ターゲットクエリに関連するクエリキーワードを格納するように構成されたサブクエリメモリユニット204と、   A subquery memory unit 204 configured to store query keywords associated with the target query;

サーチされた文書を格納するように構成された文書メモリユニット205と、   A document memory unit 205 configured to store the searched documents;

サブクエリのキーワードを使用して、文書メモリユニット205内の文書をサーチするように構成されたキーワードサーチユニット206と、   A keyword search unit 206 configured to search for documents in the document memory unit 205 using the subquery keywords;

各サブクエリによるサーチのクエリ結果を格納するように構成されたサブクエリ結果メモリユニット207と、   A subquery result memory unit 207 configured to store query results of a search by each subquery;

それぞれのクエリ結果を結合するように構成されたクエリ結果結合ユニット208と、   A query result combining unit 208 configured to combine the respective query results;

結合されたクエリ結果を格納するように構成されたクエリ結果メモリユニット209と、   A query result memory unit 209 configured to store the combined query results;

結合されたクエリ結果をランク付けするように構成されたクエリ結果ランク付けユニット210と、   A query result ranking unit 210 configured to rank the combined query results;

ターゲットクエリの最終的な多様化されたクエリ結果を格納するように構成された多様化済みランクリストメモリユニット211とを含む。   A diversified rank list memory unit 211 configured to store a final diversified query result of the target query.

具体的には、例えばクエリキーワード「ウィンドウ」およびターゲットクエリq=(ウィンドウ)が与えられると、クエリキーワードおよびクエリログに従ってサブクエリのキーワードが「ウィンドウXP」、「ハウスウィンドウ」、……として取得され、次いでqの1組のサブクエリは、R(q)={(q,q,ウィンドウXP),(q,q,ハウスウィンドウ),……}となり、ターゲットクエリqによるサーチ、および1組のサブクエリR(q)におけるそれぞれのサブクエリによるサーチは、1組の文書リストS(q)={(q,文書リスト1),(q,文書リスト2),(q,文書リスト3),……}を形成する文書リストをそれぞれ取得し、qの新しい1組のクエリ結果RF(q)を形成するためにn/(k+1)文書が各文書リストから選択される。ここでnは結果のスケールを表すあらかじめ定められた値であり、kはサブクエリの数を表し、RF(q)における文書は文書とユーザの関心との間のマッチ度に基づいてランク付けされ、それによってユーザクエリの多様化されたクエリ結果が取得される。 Specifically, for example, given a query keyword “window” and a target query q = (window), sub-query keywords are acquired as “window XP”, “house window”,. A set of sub-queries for q is R (q) = {(q 1 , q, window XP), (q 2 , q, house window),...}, a search by the target query q, and a set of sub-queries A search by each subquery in R (q) is performed by one set of document list S (q) = {(q, document list 1), (q 1 , document list 2), (q 2 , document list 3),. ...} are obtained respectively, and n / (k + 1) to form a new set of query results RF (q) for q. Document is selected from each of the document list. Where n is a predetermined value representing the scale of the results, k represents the number of subqueries, the documents in RF (q) are ranked based on the degree of match between the document and the user's interest, Thereby, a diversified query result of the user query is acquired.

クエリ結果を多様化する上記の方法からわかるように、1組のサブクエリは、従来技術ではクエリログに基づいて決定されるが、本発明の発明者が識別しているのは、その時点ではユーザの本当のクエリの意図を正確に表すことができない可能性があるユーザ入力クエリキーワードに基づいてクエリログが生成され、さらに企業サーチまたは他のサーチ状況においてもクエリログを使用することができない、またはクエリログのサイズがクエリの曖昧性除去をサポートするのに十分ではない可能性があるので、クエリログは信頼できないデータソースである可能性があり、従って正確ではない多様化されたクエリ結果が生成されるということである。   As can be seen from the above method of diversifying query results, a set of sub-queries is determined on the basis of the query log in the prior art, but the inventor of the present invention has now identified that user's Query logs are generated based on user input query keywords that may not accurately represent the intent of the true query, and cannot be used in company search or other search situations, or the size of the query log The query log may be an unreliable data source, and therefore produces diversified query results that are not accurate, because it may not be sufficient to support query disambiguation is there.

本発明の実施例は、正確な多様化されたクエリ結果を取得するために、クエリ結果を多様化する方法および装置を提供する。   Embodiments of the present invention provide a method and apparatus for diversifying query results to obtain accurate diversified query results.

本発明の好ましい態様によるクエリ結果を多様化するための方法は、
それぞれのクエリキーワードについて領域オントロジから関連キーワードを抽出することによって、関連キーワードの組み合わせセットを構築するステップと、
関連キーワードの組み合わせセットにおけるそれぞれの関連キーワードの組み合わせでサーチして、クエリ結果セットを取得するステップと、
それぞれのクエリ結果セットから対応する数のクエリ結果を抽出することによって、最終的なクエリ結果セットを構築するステップと、
構築された最終的なクエリ結果セットをランク付けして、多様化されたクエリ結果を取得するステップとを含む。
A method for diversifying query results according to a preferred aspect of the present invention comprises:
Building a set of related keyword combinations by extracting related keywords from the domain ontology for each query keyword;
Searching for each related keyword combination in the related keyword combination set to obtain a query result set;
Constructing a final query result set by extracting a corresponding number of query results from each query result set;
Ranking the constructed final query result set to obtain diversified query results.

本発明の好ましい態様によるクエリ結果を多様化するための装置は、
それぞれのクエリキーワードについて領域オントロジから関連キーワードを抽出することによって、関連キーワードの組み合わせセットを構築するように構成された関連キーワード組み合わせセット構築ユニットと、
関連キーワードの組み合わせセットにおけるそれぞれの関連キーワードの組み合わせでサーチして、クエリ結果セットを取得するように構成されたクエリユニットと、
それぞれのクエリ結果セットから対応する数のクエリ結果を抽出することによって、最終的なクエリ結果セットを構築するように構成された最終クエリ結果セット構築ユニットと、
構築された最終的なクエリ結果セットをランク付けして、多様化されたクエリ結果を取得するように構成されたランク付けユニットとを含む。
An apparatus for diversifying query results according to a preferred aspect of the present invention comprises:
A related keyword combination set building unit configured to build a set of related keyword combinations by extracting related keywords from the domain ontology for each query keyword;
A query unit configured to search for each related keyword combination in the related keyword combination set to obtain a query result set;
A final query result set construction unit configured to construct a final query result set by extracting a corresponding number of query results from each query result set;
A ranking unit configured to rank the constructed final query result set to obtain diversified query results.

本発明のクエリ結果を多様化するための方法および装置によれば、領域オントロジにおいて所与のキーワードクエリについて1組の関連キーワードの組み合わせが決定され、これらの関連キーワードの組み合わせによって拡張されたクエリセットが構築され、それによって信頼できないクエリログから拡張されたクエリセットが決定されることが回避され、従って多様化されたクエリ結果がより正確になる。   According to the method and apparatus for diversifying query results of the present invention, a set of related keywords is determined for a given keyword query in a domain ontology, and the query set expanded by the combination of these related keywords. Is constructed, thereby avoiding an extended query set being determined from untrusted query logs, and thus diversified query results are more accurate.

従来技術におけるクエリ結果を多様化するための方法のフローチャートである。3 is a flowchart of a method for diversifying query results in the prior art. 従来技術におけるクエリ結果を多様化するための装置の概略構造図である。FIG. 6 is a schematic structural diagram of an apparatus for diversifying query results in the prior art. 本発明の一実施例によるクエリ結果を多様化するための方法のフローチャートである。4 is a flowchart of a method for diversifying query results according to an embodiment of the present invention. 本発明の一実施例による最小サブグラフを取得するための方法のフローチャートである。4 is a flowchart of a method for obtaining a minimum subgraph according to an embodiment of the present invention. 本発明の一実施例による1組のクエリ結果を決定するための方法のフローチャートである。4 is a flowchart of a method for determining a set of query results according to one embodiment of the present invention. 本発明の一実施例によるクエリ結果を取得するための方法のフローチャートである。4 is a flowchart of a method for obtaining a query result according to an embodiment of the present invention; 本発明の一実施例によるランク付け方法のフローチャートである。4 is a flowchart of a ranking method according to an embodiment of the present invention. 本発明の一実施例による類似性によるランク付けの方法のフローチャートである。3 is a flowchart of a method of ranking by similarity according to an embodiment of the present invention; 本発明の一実施例によるクエリ結果を多様化するための装置の概略構造図である。FIG. 3 is a schematic structural diagram of an apparatus for diversifying query results according to an embodiment of the present invention.

本発明の実施例は、クエリ結果を多様化するための方法および装置を提供しており、領域オントロジにおいて所与のキーワードクエリについて1組の関連キーワードの組み合わせが決定され、これらの関連キーワードの組み合わせによって拡張されたクエリセットが構築され、それによって信頼できないクエリログから拡張されたクエリセットが決定されることが回避され、従って多様化されたクエリ結果がより正確になる。   Embodiments of the present invention provide a method and apparatus for diversifying query results, wherein a set of related keywords is determined for a given keyword query in a domain ontology, and the combination of these related keywords. Is used to build an expanded query set, thereby avoiding determining an expanded query set from untrusted query logs, thus making diversified query results more accurate.

図3に示されるように、本発明の一実施例によるクエリ結果を多様化するための方法は、以下を含む。   As shown in FIG. 3, a method for diversifying query results according to one embodiment of the present invention includes:

ステップS301は、それぞれのクエリキーワードについて領域オントロジから関連キーワードを抽出することによって、関連キーワードの組み合わせセットを構築することである。   Step S301 is to construct a combination set of related keywords by extracting the related keywords from the region ontology for each query keyword.

ステップS302は、関連キーワードの組み合わせセットにおけるそれぞれの関連キーワードの組み合わせでサーチして、クエリ結果セットを取得することである。   Step S302 is to perform a search with each combination of related keywords in the combination set of related keywords to obtain a query result set.

ステップS303は、それぞれのクエリ結果セットから対応する数のクエリ結果を抽出することによって、最終的なクエリ結果セットを構築することである。   Step S303 is to construct a final query result set by extracting a corresponding number of query results from each query result set.

ステップS304は、構築された最終的なクエリ結果セットをランク付けして、多様化されたクエリ結果を取得することである。   Step S304 is to rank the constructed final query result set to obtain diversified query results.

各関連キーワードは領域オントロジから抽出され、従って関連キーワードの選択がより正確になる。さらに、関連キーワードの組み合わせに基づいてクエリグラフを構築することで所与のクエリを解釈することによって、解釈がユーザの本当の意図により近くなり、それによって多様化されたクエリ結果がより正確になる。領域オントロジは概念間の関係と共に1組の概念として領域知識を表す。   Each related keyword is extracted from the region ontology, thus making the selection of related keywords more accurate. In addition, by interpreting a given query by building a query graph based on a combination of related keywords, the interpretation is closer to the user's real intentions, thereby diversifying query results more accurately . Domain ontology represents domain knowledge as a set of concepts along with relationships between concepts.

具体的には、ステップS301で最初に、所与のクエリのキーワード毎にそのキーワードの関連キーワードが領域オントロジから抽出され、次いで関連キーワードの組み合わせセットが関連キーワードから構築される。構築された関連キーワードの組み合わせセットは、S(Q)={(c,c,…,c)|c∈C&&c∈C&&…c∈C}であり、ここでCは、所与のクエリにおけるm個のキーワードの中のi番目のキーワードの関連キーワードセットである。 Specifically, in step S301, for each keyword of a given query, a keyword related keyword is extracted from the region ontology, and then a combination set of related keywords is constructed from the related keywords. The combination set of related keywords constructed is S (Q) = {(c 1 , c 2 ,..., C m ) | c 1 ∈C 1 && c 2 ∈C 2 && ... c m ∈C m } Here, C i is a related keyword set of the i-th keyword among the m keywords in the given query.

所与のクエリキーワードの関連キーワードを抽出する時、クエリキーワードとオントロジ概念との間で単語マッチングを行うことができ、次いで取得されたマッチするオントロジ概念が関連キーワードとして設定される。当業者は当然、他の方法によって領域オントロジから関連キーワードを抽出することができる。   When extracting a related keyword of a given query keyword, word matching can be performed between the query keyword and the ontology concept, and then the acquired matching ontology concept is set as the related keyword. Of course, those skilled in the art can extract related keywords from the region ontology by other methods.

クエリ結果をより正確にするために関連キーワードの組み合わせをさらにフィルタに通すことができ、それによってユーザの意図により近いものが取得される。   Related keyword combinations can be further filtered to make the query results more accurate, thereby getting closer to the user's intention.

具体的にはステップS301において、領域オントロジに従って所与のクエリについて関連キーワードの組み合わせセットを構築した後、   Specifically, in step S301, after building a related keyword combination set for a given query according to the region ontology,

関連キーワードの組み合わせセットにおける関連キーワードの組み合わせ毎に、組み合わせ内のすべてのキーワードを連結する最小サブグラフが領域オントロジから抽出される。ここで最小サブグラフは、領域オントロジにおけるそれぞれのキーワードを連結するサブグラフの中の最小数のエッジを有し、最も近い方法ですべての関連キーワードを連結するサブグラフである。   For each combination of related keywords in the combination set of related keywords, a minimum subgraph connecting all the keywords in the combination is extracted from the region ontology. Here, the minimum subgraph is a subgraph that has the minimum number of edges in the subgraph connecting each keyword in the region ontology and connects all related keywords in the closest way.

図4に示されるように、関連キーワードの組み合わせにおける5つのキーワードが与えられると、抽出されたサブグラフは5つのキーワードすべてを連結し、最小数のエッジを有する。   As shown in FIG. 4, given five keywords in a related keyword combination, the extracted subgraph connects all five keywords and has a minimum number of edges.

この時、図5に示されるように関連キーワードの組み合わせセットにおけるそれぞれの関連キーワードの組み合わせでサーチして、クエリ結果セットを取得するステップS302は特に以下を含む。   At this time, as shown in FIG. 5, step S302 for obtaining a query result set by searching for each combination of related keywords in the combination set of related keywords includes the following.

ステップS501は最小サブグラフ毎に、最小サブグラフにおけるキーワードおよび他のノードから成るサブクエリを決定することである。   Step S501 is to determine, for each minimum subgraph, a subquery including a keyword and other nodes in the minimum subgraph.

ステップS502は、各サブクエリにおけるキーワードおよび他のノードでサーチして、最小サブグラフの数と同じ数のサブクエリ結果セットを取得する。そして   In step S502, a search is performed with keywords and other nodes in each subquery, and the same number of subquery result sets as the number of minimum subgraphs are obtained. And

ステップS503は、クエリ結果セットをそれぞれのサブクエリ結果セットから成るセットとして決定することである。   Step S503 is to determine the query result set as a set composed of the respective subquery result sets.

例えばユーザはm個のキーワード、Q={k,……,k}を含むクエリを入力し、任意のキーワードkについて1組の関連キーワード、C={ci1,ci2,……,cini}を領域オントロジから抽出することができ、niは、kについての関連キーワードの数を示し、またkに対する各関連キーワードの関連度の値、R={ri1,ri2,……、rini}を領域オントロジに基づいて計算することができる。合計で

Figure 2013200862
であり、ユーザの入力クエリについて関連キーワードの組み合わせ、S(Q)={(c1,c2,…,cm)|c1∈C1&&c2∈C2&&…cm∈Cm}を決定することができる。 For example, a user inputs a query including m keywords, Q = {k 1 ,..., K m }, and a set of related keywords for an arbitrary keyword k i , C i = {c i1 , c i2,. ..., it is possible to extract the c ini} from the region ontology, ni represents the number of relevant keywords for k i, also relevance values for each related keyword for k i, R i = {r i1, r i 2 ,..., r ini } can be calculated based on the region ontology. In total
Figure 2013200862
And a combination of related keywords for the user's input query, S (Q) = {(c1, c2,..., Cm) | c1εC1 && c2εC2 && ... cmεCm} can be determined.

関連キーワードの組み合わせ毎に領域オントロジから最小のクエリセマンティックグラフを決定することができ、最小のクエリセマンティックグラフは組み合わせの中のそれぞれのキーワードを含み、各キーワードがクエリセマンティックグラフのノードであり、最小のクエリセマンティックグラフは結合されるそれぞれのキーワードについての他のノードも含み得る。最小のクエリセマンティックグラフは、所与のユーザクエリのサブクエリとして表すこともでき、それぞれのキーワードを連結するサブグラフの中の最小数のエッジを有するサブグラフである。   For each combination of related keywords, the smallest query semantic graph can be determined from the region ontology, where the smallest query semantic graph contains each keyword in the combination, each keyword is a node of the query semantic graph, and the smallest The query semantic graph may also include other nodes for each keyword that is combined. A minimal query semantic graph, which can also be expressed as a subquery of a given user query, is a subgraph having the smallest number of edges in the subgraph connecting the respective keywords.

関連キーワードの組み合わせにおいて、あるキーワードをランダムに選択し、選択されたキーワードをトラバースが始まる最初のノードとして設定し、領域オントロジにおいてキーワードを別のノードに連結する各パスをトラバースし、それぞれのキーワードを連結する最小サブグラフが決定されるまでターゲットノードへの最短のパスを最小サブグラフにおけるパスとして選択することによって、最小サブグラフを取得することができる。ここで同じパス長を有するパスが2つある場合、そのうちの一方をランダムに選択することができる。ここでのターゲットノードは、関連キーワードの組み合わせにおけるキーワードを指す。   In a combination of related keywords, select a keyword randomly, set the selected keyword as the first node where traversal begins, traverse each path that connects the keyword to another node in the region ontology, A minimum subgraph can be obtained by selecting the shortest path to the target node as the path in the minimum subgraph until the minimum subgraph to be connected is determined. Here, when there are two paths having the same path length, one of them can be selected at random. The target node here indicates a keyword in a combination of related keywords.

ステップS303において、それぞれのクエリ結果セットから対応する数のクエリ結果を抽出することにより、最終的なクエリ結果セットを構築する方法は2つある。第1の方法は、各サブクエリ結果セットからあらかじめ設定された数のクエリ結果を抽出することである。第2の方法は、所与のクエリに対するサブクエリの関連性に従って、各サブクエリ結果セットから対応する数のクエリ結果を抽出することであり、それによってサブクエリが所与のクエリに関連すればするほど、サブクエリ結果セットからより多くの結果が選択され、最終的なクエリ結果セットに追加されることになる。   In step S303, there are two methods for constructing a final query result set by extracting a corresponding number of query results from each query result set. The first method is to extract a preset number of query results from each subquery result set. The second method is to extract a corresponding number of query results from each subquery result set according to the relevance of the subquery for a given query, so that the more the subquery is related to a given query, More results will be selected from the subquery result set and added to the final query result set.

具体的には図6に示されるように、所与のクエリに対する各サブクエリの関連性に従って、特に以下の通り各サブクエリ結果セットから対応する数のクエリ結果を取得することができる。   Specifically, as shown in FIG. 6, according to the relevance of each subquery to a given query, a corresponding number of query results can be obtained from each subquery result set, particularly as follows.

ステップS601は、各最小サブグラフのサブグラフ重みを

Figure 2013200862
として決定することであり、式中mはクエリキーワードの数を表し、riはクエリキーワードに対するクエリキーワードについて領域オントロジから抽出された関連キーワードのマッチ値を表し、|E|はサブグラフにおけるエッジの数を表す。 Step S601 calculates the subgraph weight of each minimum subgraph.
Figure 2013200862
Where m represents the number of query keywords, ri represents the match value of the related keyword extracted from the region ontology for the query keyword for the query keyword, and | E | represents the number of edges in the subgraph. Represent.

ステップS602は、最小サブグラフのサブグラフ重みに従って各最小サブグラフに対応するサブクエリ結果セットから対応する数のクエリ結果を抽出することである。   Step S602 is to extract a corresponding number of query results from the subquery result set corresponding to each minimum subgraph according to the subgraph weight of the minimum subgraph.

ステップS602では、対応する数のクエリ結果は、最小サブグラフのサブグラフ重みに従って、特に以下の通り各最小サブグラフに対応するサブクエリ結果セットから取得することができる。   In step S602, a corresponding number of query results can be obtained from the subquery result set corresponding to each minimum subgraph, particularly as follows, according to the subgraph weights of the minimum subgraph.

最小サブグラフに対応するサブクエリ結果セットから抽出されたクエリ結果は、上位k*a個の結果であり、ここでaはすべての最小サブグラフのサブグラフ重みの合計に対する現在の最小サブグラフのサブグラフ重みの比率を表し、kは最終的なクエリ結果セットのスケールを表すあらかじめ定められた値であり、k*aはkとaとの積未満の最大の整数を表す。   The query results extracted from the subquery result set corresponding to the smallest subgraph are the top k * a results, where a is the ratio of the subgraph weight of the current smallest subgraph to the sum of the subgraph weights of all smallest subgraphs. Where k is a predetermined value representing the scale of the final query result set, and k * a represents the largest integer less than the product of k and a.

さらに本発明の一実施例は、ユーザがより便利にそのクエリの意図に近いクエリ結果を見ることができるようにクエリ結果にランク付けする方法を提供し、この時、図7に示されるように、構築された最終的なクエリ結果セットをランク付けして多様化されたクエリ結果を取得するステップS304は、以下を含む。   Furthermore, one embodiment of the present invention provides a method for ranking query results so that the user can more conveniently view query results that are closer to the intent of the query, as shown in FIG. Step S304 of ranking the constructed final query result set to obtain diversified query results includes:

ステップS701は、最終的なクエリ結果セットにおけるクエリ結果毎に、対応する最小サブグラフに対するクエリ結果の関連度の値を決定することである。   Step S701 is to determine the value of the relevance of the query result for the corresponding minimum subgraph for each query result in the final query result set.

ステップS702は、最終的なクエリ結果セットにおけるクエリ結果毎に、対応する最小サブグラフに対するクエリ結果の関連度の値、および最小サブグラフのサブグラフ重みに従ってクエリ結果の重みを決定することである。そして   Step S702 is to determine the weight of the query result according to the relevance value of the query result for the corresponding minimum subgraph and the subgraph weight of the minimum subgraph for each query result in the final query result set. And

ステップS703は、クエリ結果の重みによって最終的なクエリ結果セットにおけるクエリ結果をランク付けして、多様化されたクエリ結果を取得することである。   Step S703 is to obtain the diversified query results by ranking the query results in the final query result set according to the query result weights.

具体的にはステップS702で、クエリ結果の重みを、特に以下の通り対応する最小サブグラフに対するクエリ結果の関連度の値と、最小サブグラフのサブグラフ重みに従って決定することができる。   Specifically, in step S702, the weight of the query result can be determined according to the relevance value of the query result with respect to the corresponding minimum subgraph and the subgraph weight of the minimum subgraph as follows.

クエリ結果の重みは、対応する最小サブグラフに対するクエリ結果の関連度の値と最小サブグラフのサブグラフ重みとの積として決定される。   The query result weight is determined as the product of the relevance value of the query result for the corresponding minimum subgraph and the subgraph weight of the minimum subgraph.

さらにステップS703で、クエリ結果の重みに従って取得されたクエリ結果を直接ランク付けすることにより、またはさらにクエリ結果の間の類似性を考慮に入れることにより、取得されたクエリ結果をクエリ結果の重みに従ってランク付けすることができ、この時、図8に示されるようにステップS703は特に以下を含む。   Further, in step S703, by directly ranking the query results obtained according to the query result weights, or further taking into account the similarity between the query results, the obtained query results are made according to the query result weights. At this time, as shown in FIG. 8, step S703 specifically includes the following:

ステップS801は、最も高い重みを有するクエリ結果を第1位にランク付けされたクエリ結果として決定し、各2つのクエリ結果の間の類似性を決定することである。   Step S801 is to determine the query result having the highest weight as the query result ranked first, and to determine the similarity between each two query results.

ステップS802は、ランク付けすべき各クエリ結果の類似性の重みを

Figure 2013200862
として決定することであり、式中sはクエリ結果の重みを表し、dは現在のクエリ結果を表し、Dはすでにランク付けされている1組のクエリ結果を表し、類似性(d,d´)はdとd´との間の類似性を表す。そして Step S802 calculates the similarity weight of each query result to be ranked.
Figure 2013200862
Where s represents the weight of the query result, d represents the current query result, D represents the set of query results that are already ranked, and the similarity (d, d ′ ) Represents the similarity between d and d '. And

ステップS803は、第1位にランク付けされたクエリ結果を除くクエリ結果を類似性の重みによって繰り返してランク付けすることである。   Step S803 is to repeatedly rank the query results excluding the query result ranked first by the similarity weight.

本発明の一実施例によるクエリ結果を多様化するための方法を示す具体的な例について、以下で説明する。   A specific example illustrating a method for diversifying query results according to an embodiment of the present invention is described below.

ユーザのクエリキーワードが「牡丹」および「北京」である場合、C(「牡丹」)={(「牡丹花」,0.5),(「牡丹TV」,0.2),(「牡丹江」,0.2),…}およびC(「北京」)={(「北京市」,0.8)(「北京の腕時計」,0.07),(「北京故事」,0.05),…}を領域オントロジから決定することができ、ここで(「牡丹花」,0.5)は、「牡丹」に対する「牡丹」の関連キーワード「牡丹花」のマッチ値を表す。   When the user's query keyword is “peony” and “Beijing”, C (“peony”) = {(“peony flower”, 0.5), (“peony TV”, 0.2), (“peony river” , 0.2), ...} and C ("Beijing") = {("Beijing City", 0.8) ("Beijing Watch", 0.07), ("Beijing Events", 0.05), ...} can be determined from the region ontology, where ("peony flower", 0.5) represents the match value of the related keyword "peony flower" of "peony" with respect to "peony".

それぞれの関連キーワードの組み合わせが決定された後、それぞれのキーワードを連結するサブグラフが取得され、例えば1組の最小サブグラフはS(グラフ)={(g1,牡丹花,北京市,0.65),(g2,牡丹TV,北京市,0.5),(g3,牡丹花,李勤勤,北京故事,0.138),…}であり、容易に導き出すことができるように、サブグラフg1は0.65のサブグラフ重みを有し、g2は0.5のサブグラフ重みを有し、g3は0.138のサブグラフ重みを有する。   After the combination of each related keyword is determined, a subgraph connecting each keyword is acquired. For example, one set of minimum subgraphs is S (graph) = {(g1, peony flower, Beijing, 0.65), (G2, peony TV, Beijing, 0.5), (g3, peony flower, li commuter, beijing affair, 0.138), ...}, and the subgraph g1 is 0.65 so that it can be easily derived. G2 has a subgraph weight of 0.5 and g3 has a subgraph weight of 0.138.

それぞれのサブグラフにおけるキーワードおよび他のノードによるサーチによって、サブクエリ結果のそれぞれの組、例えばここでは、サブクエリ結果の組における文書毎に、結果(g1)={(doc1,ωg=0.65,ωr=0.9),(doc2,ωg=0.65,ωr=0.7),…}、結果(g2)={(doc3,ωg=0.5,ωr=0.8),(doc4,ωg=0.5,ωr=0.6)…}…が得られ、wgはそれに対する最小サブグラフのサブグラフ重みを表し、wrは最小サブグラフに対する文書の関連度を表し、サブクエリ結果の各組における文書はwrによってランク付けされる。   For each set of subquery results, eg, here for each document in the set of subquery results, by searching with keywords and other nodes in each subgraph, the result (g1) = {(doc1, ωg = 0.65, ωr = 0.9), (doc2, ωg = 0.65, ωr = 0.7),...}, Result (g2) = {(doc3, ωg = 0.5, ωr = 0.8), (doc4, ωg = 0.5, ωr = 0.6)..., Wg represents the subgraph weight of the smallest subgraph, wr represents the relevance of the document to the smallest subgraph, and the document in each set of subquery results is ranked by wr.

最小サブグラフに対応するサブクエリ結果セットから取得されたクエリ結果は、サブグラフに最も関連する上位3*a個のクエリ結果であり、例えば上位

Figure 2013200862
個の文書が結果(g1)から選択され、最終的なクエリ結果セットRF(q)に追加され、上位
Figure 2013200862
個の文書が結果(g2)から選択され、最終的なクエリ結果セットRF(q)に追加される。ここで3は、RF(q)の予想されるスケールを意味する。 The query results obtained from the subquery result set corresponding to the smallest subgraph are the top 3 * a query results most relevant to the subgraph, eg, top
Figure 2013200862
Documents are selected from the results (g1) and added to the final query result set RF (q)
Figure 2013200862
Documents are selected from the results (g2) and added to the final query result set RF (q). Here, 3 means the expected scale of RF (q).

RF(q)が{(doc1,0.65,0.9),(doc2,0.65,0.7),(doc3,0.5,0.8)}である場合、   When RF (q) is {(doc1, 0.65, 0.9), (doc2, 0.65, 0.7), (doc3, 0.5, 0.8)},

取得されたクエリ結果は、クエリ結果の重みによって直接ランク付けすることができ、3つの文書の重みはそれぞれs1=0.65×0.9、s2=0.65×0.7、s3=0.5×0.8であるので、ランク付けされたクエリ結果は、RF(q)={doc1,doc2,doc3}である。   The obtained query results can be directly ranked by the weight of the query results, and the weights of the three documents are s1 = 0.65 × 0.9, s2 = 0.65 × 0.7, and s3 = 0, respectively. Since it is .5 × 0.8, the ranked query result is RF (q) = {doc1, doc2, doc3}.

あるいは取得されたクエリ結果は、さらに類似性を使用してランク付けすることができ、この時、類似性(doc1,doc2)=0.5、類似性(doc1,doc3)=0.1、および類似性(doc2,doc3)=0.2である場合、ランク付けされたクエリ結果は、RF(q)={doc1,doc3,doc2}である。   Alternatively, the retrieved query results can be further ranked using similarity, where similarity (doc1, doc2) = 0.5, similarity (doc1, doc3) = 0.1, and If similarity (doc2, doc3) = 0.2, the ranked query result is RF (q) = {doc1, doc3, doc2}.

本発明の一実施例は、対応してクエリ結果を多様化するための装置をさらに提供し、図9に示されるように装置は以下を含む。   One embodiment of the present invention further provides an apparatus for correspondingly diversifying query results, as shown in FIG. 9, the apparatus includes:

所与のクエリのそれぞれのクエリキーワードについて領域オントロジから関連キーワードを抽出することによって、関連キーワードの組み合わせセットを構築するように構成された関連キーワード組み合わせセット構築ユニット901と、   A related keyword combination set construction unit 901 configured to construct a related keyword combination set by extracting related keywords from the region ontology for each query keyword of a given query;

関連キーワードの組み合わせセットにおけるそれぞれの関連キーワードの組み合わせでサーチして、クエリ結果セットを取得するように構成されたクエリユニット902と、   A query unit 902 configured to search with each related keyword combination in the related keyword combination set to obtain a query result set;

それぞれのクエリ結果セットから対応する数のクエリ結果を抽出することによって、最終的なクエリ結果セットを構築するように構成された最終クエリ結果セット構築ユニット903と、   A final query result set construction unit 903 configured to construct a final query result set by extracting a corresponding number of query results from each query result set;

構築された最終的なクエリ結果セットをランク付けして、多様化されたクエリ結果を取得するように構成されたランク付けユニット904とを含む。   A ranking unit 904 configured to rank the constructed final query result set to obtain diversified query results.

特に、関連キーワード組み合わせセット構築ユニット901は、   In particular, the related keyword combination set construction unit 901

所与のクエリのクエリキーワード毎に、領域オントロジからキーワードの関連キーワードを抽出し、   For each query keyword of a given query, extract keyword related keywords from the domain ontology,

それぞれの関連キーワードに基づいて、関連キーワードの組み合わせセットを構築するように構成される。   A related keyword combination set is constructed based on each related keyword.

それぞれの関連キーワードに基づいて、関連キーワードの組み合わせセットを構築する関連キーワード組み合わせセット構築ユニット901は、特に以下を含む。   The related keyword combination set construction unit 901 that constructs a combination set of related keywords based on each related keyword includes in particular:

関連キーワードの組み合わせセットは、S(Q)={(c,c,…,c)|c∈C&&c∈C&&…c∈C}として構築され、ここでCは、所与のクエリにおけるm個のキーワードの中のi番目のキーワードの関連キーワードセットである。 The related keyword combination set is constructed as S (Q) = {(c 1 , c 2 ,..., C m ) | c 1 ∈ C 1 && c 2 ∈ C 2 &&... C m ∈ C m }, where C i is a related keyword set of the i-th keyword among m keywords in a given query.

特に、関連キーワード組み合わせセット構築ユニット901は、さらに   In particular, the related keyword combination set construction unit 901 further includes

所与のクエリのクエリキーワード毎に、領域オントロジからキーワードの関連キーワードを抽出した後、   For each query keyword in a given query, after extracting the keyword related keywords from the domain ontology,

領域オントロジにおける所与のクエリのキーワードセットの関連キーワードの組み合わせセットを構築した後、   After building a related keyword combination set for a given query keyword set in a domain ontology,

関連キーワードの組み合わせセットにおける関連キーワードの組み合わせ毎に、関連キーワードの組み合わせ内のそれぞれのキーワードを連結する最小サブグラフを領域オントロジから抽出するように構成されており、ここでは、最小サブグラフは、領域オントロジにおけるそれぞれのキーワードを連結するサブグラフの中の最小数のエッジを有するサブグラフである。   For each combination of related keywords in the combination set of related keywords, a minimum subgraph connecting the keywords in the combination of related keywords is extracted from the region ontology. Here, the minimum subgraph is defined in the region ontology. It is a subgraph having the minimum number of edges in the subgraph connecting each keyword.

クエリユニット902は特に、   Query unit 902 specifically includes

最小サブグラフ毎に、最小サブグラフにおけるキーワードおよび他のノードから成るサブクエリを決定し、   For each minimal subgraph, determine a subquery consisting of keywords and other nodes in the minimal subgraph,

各サブクエリにおけるキーワードおよび他のノードでサーチして、最小サブグラフの数と同じ数のサブクエリ結果セットを取得し、   Search by keyword and other nodes in each subquery to get as many subquery result sets as the number of minimum subgraphs,

クエリ結果セットをそれぞれのサブクエリ結果セットから成るセットとして決定するように構成される。   A query result set is configured to be determined as a set of respective subquery result sets.

最終クエリ結果セット構築ユニット903は特に、   The final query result set construction unit 903 specifically

所与のクエリに対する各サブクエリの関連性に従って、各サブクエリ結果セットから対応する数のクエリ結果を抽出し、   Extract a corresponding number of query results from each subquery result set according to the relevance of each subquery to a given query,

それぞれのサブクエリ結果セットから取得されたクエリ結果を結合するように構成される。   Configured to combine query results obtained from respective subquery result sets.

さらに、最終クエリ結果セット構築ユニット903は特に、   Furthermore, the final query result set construction unit 903 specifically

各最小サブグラフのサブグラフ重みを

Figure 2013200862
として決定し、式中mはクエリキーワードの数を表し、riはクエリキーワードに対するクエリキーワードについて領域オントロジから抽出された関連キーワードのマッチ値を表し、|E|はサブグラフにおけるエッジの数を表し、 Subgraph weight for each minimum subgraph
Figure 2013200862
Where m represents the number of query keywords, ri represents the match value of the related keyword extracted from the region ontology for the query keyword for the query keyword, | E | represents the number of edges in the subgraph,

最小サブグラフのサブグラフ重みに従って、各最小サブグラフに対応するサブクエリ結果セットから対応する数のクエリ結果を抽出し、   Extract a corresponding number of query results from the subquery result set corresponding to each minimum subgraph according to the subgraph weight of the minimum subgraph,

それぞれのサブクエリ結果セットから取得されたクエリ結果を結合するように構成される。   Configured to combine query results obtained from respective subquery result sets.

具体的には、最小サブグラフのサブグラフ重みに従って、各最小サブグラフに対応するサブクエリ結果セットから対応する数のクエリ結果を抽出する最終クエリ結果セット構築ユニット903は、特に以下を含む。   Specifically, the final query result set construction unit 903 that extracts a corresponding number of query results from the subquery result set corresponding to each minimum subgraph according to the subgraph weights of the minimum subgraph includes in particular:

最小サブグラフに対応するサブクエリ結果セットから抽出されたクエリ結果は、最小サブグラフに最も関連する上位k*a個のクエリ結果であり、ここでaはすべての最小サブグラフのサブグラフ重みの合計に対する現在の最小サブグラフのサブグラフ重みの比率を表し、kは最終的なクエリ結果セットのスケールを表すあらかじめ定められた値であり、k*aはkとaとの積未満の最大の整数を表す。   The query results extracted from the subquery result set corresponding to the smallest subgraph are the top k * a query results most relevant to the smallest subgraph, where a is the current minimum for the sum of the subgraph weights of all the smallest subgraphs. It represents the ratio of the subgraph weight of the subgraph, k is a predetermined value representing the scale of the final query result set, and k * a represents the largest integer less than the product of k and a.

ランク付けユニット904は特に、   In particular, the ranking unit 904

最終的なクエリ結果セットにおけるクエリ結果毎に、対応する最小サブグラフに対するクエリ結果の関連度の値を決定し、   For each query result in the final query result set, determine the relevance value of the query result for the corresponding smallest subgraph,

最終的なクエリ結果セットにおけるクエリ結果毎に、対応する最小サブグラフに対するクエリ結果の関連度の値、および最小サブグラフのサブグラフ重みに従ってクエリ結果の重みを決定し、   For each query result in the final query result set, determine the query result weight according to the relevance value of the query result for the corresponding minimum subgraph and the subgraph weight of the minimum subgraph,

クエリ結果の重みによって最終的なクエリ結果セットにおけるクエリ結果をランク付けして、多様化されたクエリ結果を取得するように構成される。   A query result weight is configured to rank the query results in the final query result set to obtain a diversified query result.

クエリ結果の重みを、対応する最小サブグラフに対するクエリ結果の関連度の値、および最小サブグラフのサブグラフ重みに従って決定するランク付けユニット904は、特に以下を含む。   The ranking unit 904 that determines the weight of the query result according to the value of the relevance of the query result for the corresponding minimum subgraph and the subgraph weight of the minimum subgraph includes in particular:

クエリ結果の重みは、対応する最小サブグラフに対するクエリ結果の関連度の値と最小サブグラフのサブグラフ重みとの積として決定される。   The query result weight is determined as the product of the relevance value of the query result for the corresponding minimum subgraph and the subgraph weight of the minimum subgraph.

クエリ結果の重みによって取得されたクエリ結果をランク付けするランク付けユニット904は、特に以下を含む。   The ranking unit 904 for ranking the query results obtained by the query result weights includes in particular:

クエリ結果は、クエリ結果の重みに従って直接ランク付けされる。または   The query results are directly ranked according to the query result weights. Or

最も高い重みを有するクエリ結果は、第1位にランク付けされたクエリ結果として決定され、各2つのクエリ結果の間の類似性が決定され、ランク付けされる各クエリ結果の類似性の重みは、

Figure 2013200862
として決定される。式中sはクエリ結果の重みを表し、dは現在のクエリ結果を表し、Dはすでにランク付けされている1組のクエリ結果を表し、類似性(d,d´)はdとd´との間の類似性を表し、第1位にランク付けされたクエリ結果を除くクエリ結果が類似性の重みによって繰り返してランク付けされる。 The query result with the highest weight is determined as the query result ranked first, the similarity between each two query results is determined, and the similarity weight of each ranked query result is ,
Figure 2013200862
As determined. Where s represents the weight of the query result, d represents the current query result, D represents a set of already ranked query results, and the similarity (d, d ′) is d and d ′. The query results excluding the query result ranked first are repeatedly ranked according to the similarity weight.

本発明の実施例は、クエリ結果を多様化するための方法および装置を提供し、所与のクエリの1組のキーワードの1組の関連キーワードの組み合わせが領域オントロジにおいて決定され、これらの関連キーワードの組み合わせによって拡張されたクエリセットが構築され、それによって、信頼できないクエリログから拡張されたクエリセットが決定されることが回避され、従って多様化されたクエリ結果がより正確になる。   Embodiments of the present invention provide a method and apparatus for diversifying query results, wherein a set of related keywords for a set of keywords for a given query is determined in a region ontology, and these related keywords An expanded query set is constructed by the combination, thereby avoiding determining an expanded query set from untrusted query logs, thus making diversified query results more accurate.

本発明の実施例を、方法、システム、またはコンピュータプログラム製品として具体化することができることを、当業者であれば理解されたい。従って本発明は、すべてハードウェアの実施例、すべてソフトウェアの実施例、またはソフトウェアとハードウェアとの組み合わせの実施例の形で具体化することができる。さらに、本発明は、コンピュータ使用可能プログラムコードが含まれる1つまたは複数のコンピュータ使用可能記憶媒体(ディスクメモリ、CD−ROM、光メモリなどを含むが、これに限定されるものではない)において具体化されるコンピュータプログラム製品の形で具体化することができる。   Those skilled in the art will appreciate that the embodiments of the invention may be embodied as a method, system, or computer program product. Accordingly, the present invention may be embodied in the form of an entirely hardware embodiment, an all software embodiment, or an embodiment of a combination of software and hardware. Furthermore, the present invention is embodied in one or more computer-usable storage media (including but not limited to disk memory, CD-ROM, optical memory, etc.) that contain computer-usable program code. Can be embodied in the form of a computer program product.

本発明について、本発明の実施例による方法、デバイス(システム)、およびコンピュータプログラム製品のフローチャート/ブロック図で説明してきた。フローチャート/ブロック図のそれぞれのフロー/ブロック、ならびにフローチャート/ブロック図のフロー/ブロックの組み合わせをコンピュータプログラム命令で具体化することができることを理解されたい。これらのコンピュータプログラム命令は、コンピュータ、または他のプログラム可能なデータ処理装置のプロセッサ上で実行される命令がフローチャートのフロー/ブロック図のブロックで指定されている機能を実行するための手段を構築できるマシンを生産するために、汎用コンピュータ、専用コンピュータ、埋込み型プロセッサ、または別のプログラム可能なデータ処理装置のプロセッサ上にロードすることができる。   The present invention has been described in flowcharts / block diagrams of methods, devices (systems) and computer program products according to embodiments of the invention. It should be understood that each flow / block of the flowchart / block diagram, and combinations of flowcharts / block diagrams, may be embodied in computer program instructions. These computer program instructions can build a means for instructions executed on the processor of a computer or other programmable data processing device to perform the functions specified in the flowchart / block diagram blocks of the flowchart. To produce the machine, it can be loaded onto a general purpose computer, a dedicated computer, an embedded processor, or another programmable data processing device processor.

これらのコンピュータプログラム命令は、コンピュータまたは他のプログラム可能なデータ処理装置に特定の方法で動作するよう指示することができるコンピュータ可読メモリに格納することもできる。これによってコンピュータ可読メモリに格納された命令が、フローチャートのフロー/ブロック図のブロックで指定されている機能を実行する命令手段を含む製品を作成できるようになる。   These computer program instructions may also be stored in a computer readable memory that may instruct a computer or other programmable data processing device to operate in a particular manner. This allows the instructions stored in the computer readable memory to create a product that includes instruction means for performing the functions specified in the flowchart / block diagram blocks.

これらのコンピュータプログラム命令は、一連の操作ステップがコンピュータまたは他のプログラム可能なデータ処理装置上で実行され、コンピュータまたは他のプログラム可能なデバイス上で実行される命令が、フローチャートのフロー/ブロック図のブロックで指定されている機能を実行するためのステップを提供するようなコンピュータ実施プロセスを作成するために、コンピュータまたは他のプログラム可能なデータ処理装置上にロードすることもできる。   These computer program instructions are executed in a sequence of operational steps on a computer or other programmable data processing device, and the instructions executed on the computer or other programmable device are represented in the flowchart / block diagram of the flowchart. It can also be loaded onto a computer or other programmable data processing device to create a computer-implemented process that provides steps for performing the functions specified in the block.

本発明の好ましい実施例について説明してきたが、基礎をなす発明の概念から恩恵を受ける当業者は、これらの実施例に追加の変更および変形を行うことができる。従って添付の特許請求の範囲は、好ましい実施例および本発明の範囲に含まれるすべての変更および変形を含むものと解釈されるものとする。   Although preferred embodiments of the present invention have been described, those skilled in the art who benefit from the underlying inventive concepts can make additional changes and modifications to these embodiments. Accordingly, the appended claims are to be construed to include the preferred embodiments and all modifications and variations that fall within the scope of the invention.

当業者は、本発明の意図および範囲から逸脱することなく、本発明に様々な変更および変形を行うことができることは明らかである。従って変更および変形が本発明およびその同等物に添付される特許請求の範囲に含まれる限り、本発明はこれらの変更および変形も含むものとする。   It will be apparent to those skilled in the art that various modifications and variations can be made to the present invention without departing from the spirit and scope of the invention. Accordingly, it is intended that the present invention include those modifications and variations as long as the modifications and variations are included in the scope of the claims appended hereto and their equivalents.

さらに、上記実施形態の一部又は全部は、以下の付記のようにも記載されうるが、これに限定されない。   Further, a part or all of the above-described embodiment can be described as in the following supplementary notes, but is not limited thereto.

(付記1)
クエリ結果を多様化するための方法であって、
所与のクエリの各クエリキーワードについて領域オントロジから関連キーワードを抽出することによって、関連キーワードの組み合わせセットを構築するステップと、
関連キーワードの組み合わせセットにおけるそれぞれの関連キーワードの組み合わせでサーチして、クエリ結果セットを取得するステップと、
それぞれのクエリ結果セットから対応する数のクエリ結果を抽出することによって、最終的なクエリ結果セットを構築するステップと、
構築された最終的なクエリ結果セットをランク付けして、多様化されたクエリ結果を取得するステップと
を含むことを特徴とするクエリ結果を多様化するための方法。
(Appendix 1)
A method for diversifying query results,
Building a set of related keywords by extracting the related keywords from the domain ontology for each query keyword of a given query;
Searching for each related keyword combination in the related keyword combination set to obtain a query result set;
Constructing a final query result set by extracting a corresponding number of query results from each query result set;
Ranking the constructed final query result set to obtain a diversified query result; and a method for diversifying the query results.

(付記2)
所与のクエリの各クエリキーワードについて領域オントロジから関連キーワードを抽出することによって、関連キーワードの組み合わせセットを構築する前記ステップが、
所与のクエリのクエリキーワード毎に、前記領域オントロジからキーワードの関連キーワードを抽出するステップと、
前記関連キーワードに基づいて、関連キーワードの組み合わせセットを構築するステップを含む
ことを特徴とする付記1に記載のクエリ結果を多様化するための方法。
(Appendix 2)
The step of constructing a set of related keywords by extracting related keywords from the domain ontology for each query keyword of a given query comprises:
For each query keyword of a given query, extracting a keyword related keyword from the region ontology;
The method for diversifying query results according to claim 1, further comprising the step of constructing a set of related keyword combinations based on the related keywords.

(付記3)
前記関連キーワードに基づいて、関連キーワードの組み合わせセットを構築する前記ステップが、
関連キーワードの組み合わせセットを、S(Q)={(c,c,…,c)|c∈C&&c∈C&&…c∈C}として構築する
ここでCは、所与のクエリにおけるm個のキーワードの中のi番目のキーワードの関連キーワードセットである
ことを特徴とする付記2に記載のクエリ結果を多様化するための方法。
(Appendix 3)
The step of constructing a combination set of related keywords based on the related keywords comprises:
Build a set of related keywords as S (Q) = {(c 1 , c 2 ,..., C m ) | c 1 ∈ C 1 && c 2 ∈ C 2 &&... C m ∈ C m } where C The method for diversifying the query result according to appendix 2, wherein i is a related keyword set of an i-th keyword among m keywords in a given query.

(付記4)
各クエリキーワードについて領域オントロジから関連キーワードを抽出することによって、関連キーワードの組み合わせセットを構築した後に、
関連キーワードの組み合わせセットにおける関連キーワードの組み合わせ毎に、組み合わせ内のすべてのキーワードを連結する最小サブグラフを領域オントロジから抽出するステップを含み、
関連キーワードの組み合わせセットにおけるそれぞれの関連キーワードの組み合わせでサーチして、クエリ結果セットを取得する前記ステップは、
最小サブグラフ毎に、最小サブグラフにおけるキーワードおよび他のノードから成るサブクエリを決定するステップと、
各サブクエリにおけるキーワードおよび他のノードでサーチして、最小サブグラフの数と同じ数のサブクエリ結果セットを取得するステップと、
クエリ結果セットをそれぞれのサブクエリ結果セットから成るセットとして決定するステップとを含み、
前記最小サブグラフは、領域オントロジにおけるそれぞれのキーワードを連結するサブグラフの中の最小数のエッジを有し、最も近い方法ですべての関連キーワードを連結するサブグラフである
ことを特徴とする付記1に記載のクエリ結果を多様化するための方法。
(Appendix 4)
After building a set of related keywords by extracting related keywords from the domain ontology for each query keyword,
For each related keyword combination in the related keyword combination set, the step of extracting from the region ontology a minimum subgraph connecting all the keywords in the combination,
Searching for each related keyword combination in the related keyword combination set to obtain a query result set comprises:
For each minimum subgraph, determining a subquery consisting of keywords and other nodes in the minimum subgraph;
Searching on keywords and other nodes in each subquery to obtain the same number of subquery result sets as the number of minimum subgraphs;
Determining a query result set as a set of respective subquery result sets;
The minimum subgraph is a subgraph that has a minimum number of edges in a subgraph connecting each keyword in a region ontology, and connects all related keywords in the closest way. A method for diversifying query results.

(付記5)
それぞれのクエリ結果セットから対応する数のクエリ結果を抽出することにより、最終的なクエリ結果セットを構築する前記ステップが、
所与のクエリに対する各サブクエリの関連性に従って、各サブクエリ結果セットから対応する数のクエリ結果を抽出するステップと、
各サブクエリ結果セットから取得したクエリ結果を結合するステップとを含む
ことを特徴とする付記4に記載のクエリ結果を多様化するための方法。
(Appendix 5)
Said step of constructing a final query result set by extracting a corresponding number of query results from each query result set;
Extracting a corresponding number of query results from each subquery result set according to the relevance of each subquery to a given query;
The method for diversifying the query results according to claim 4, further comprising the step of combining query results obtained from each subquery result set.

(付記6)
所与のクエリに対する各サブクエリの関連性に従って、各サブクエリ結果セットから対応する数のクエリ結果を抽出する前記ステップが、
各最小サブグラフのサブグラフ重みを

Figure 2013200862
mはクエリキーワードの数を表し、riはクエリキーワードに対するクエリキーワードについて領域オントロジから抽出された関連キーワードのマッチ値を表し、|E|はサブグラフにおけるエッジの数を表す
として決定するステップと、
最小サブグラフのサブグラフ重みに従って、各最小サブグラフに対応するサブクエリ結果セットから対応する数のクエリ結果を抽出するステップとを含む
ことを特徴とする付記5に記載のクエリ結果を多様化するための方法。 (Appendix 6)
Said step of extracting a corresponding number of query results from each subquery result set according to the relevance of each subquery to a given query;
Subgraph weight for each minimum subgraph
Figure 2013200862
m represents the number of query keywords, ri represents the match value of the related keyword extracted from the region ontology for the query keyword for the query keyword, and | E | is determined to represent the number of edges in the subgraph;
The method for diversifying query results according to appendix 5, comprising: extracting a corresponding number of query results from a subquery result set corresponding to each minimum subgraph according to the subgraph weight of the minimum subgraph.

(付記7)
最小サブグラフのサブグラフ重みに従って、各最小サブグラフに対応するサブクエリ結果セットから対応する数のクエリ結果を抽出する前記ステップにおいて、
最小サブグラフに対応するサブクエリ結果セットから抽出されたクエリ結果は、最小サブグラフに最も関連する上位k*a個のクエリ結果であり、ここで、aはすべての最小サブグラフのサブグラフ重みの合計に対する現在の最小サブグラフのサブグラフ重みの比率を表し、kは最終的なクエリ結果セットのスケールを表すあらかじめ定められた値であり、k*aはkとaとの積未満の最大の整数を表す
ことを特徴とする付記5に記載のクエリ結果を多様化するための方法。
(Appendix 7)
Extracting the corresponding number of query results from the subquery result set corresponding to each minimum subgraph according to the subgraph weight of the minimum subgraph,
The query results extracted from the subquery result set corresponding to the smallest subgraph are the top k * a query results most relevant to the smallest subgraph, where a is the current relative to the sum of the subgraph weights of all the smallest subgraphs. Represents the ratio of subgraph weights of the smallest subgraph, k is a predetermined value representing the scale of the final query result set, and k * a represents the largest integer less than the product of k and a. A method for diversifying the query result according to appendix 5.

(付記8)
構築された最終的なクエリ結果セットをランク付けして、多様化されたクエリ結果を取得する前記ステップが、
最終的なクエリ結果セットにおけるクエリ結果毎に、対応する最小サブグラフに対するクエリ結果の関連度の値を決定するステップと、
最終的なクエリ結果セットにおけるクエリ結果毎に、対応する最小サブグラフに対するクエリ結果の関連度の値、および最小サブグラフのサブグラフ重みに従ってクエリ結果の重みを決定するステップと、
クエリ結果の重みによって最終的なクエリ結果セットにおけるクエリ結果をランク付けして、多様化されたクエリ結果を取得するステップとを含む
ことを特徴とする付記4に記載のクエリ結果を多様化するための方法。
(Appendix 8)
The step of ranking the constructed final query result set to obtain diversified query results comprises:
For each query result in the final query result set, determining a relevance value of the query result for the corresponding minimum subgraph;
Determining, for each query result in the final query result set, a query result weight according to the relevance value of the query result for the corresponding minimum subgraph and the subgraph weight of the minimum subgraph;
Ranking the query results in the final query result set according to the weights of the query results, and obtaining the diversified query results, to diversify the query results as described in appendix 4 the method of.

(付記9)
最終的なクエリ結果セットにおけるクエリ結果毎に、対応する最小サブグラフに対するクエリ結果の関連度の値、および最小サブグラフのサブグラフ重みに従ってクエリ結果の重みを決定する前記ステップが、
クエリ結果の重みを、対応する最小サブグラフに対するクエリ結果の関連度の値と最小サブグラフのサブグラフ重みとの積として決定する
ことを特徴とする付記8に記載のクエリ結果を多様化するための方法。
(Appendix 9)
For each query result in the final query result set, said step of determining the query result weight according to the relevance value of the query result for the corresponding minimum subgraph and the subgraph weight of the minimum subgraph,
9. The method for diversifying a query result according to appendix 8, wherein the weight of the query result is determined as a product of a relevance value of the query result for the corresponding minimum subgraph and a subgraph weight of the minimum subgraph.

(付記10)
構築された最終的なクエリ結果セットをランク付けして、多様化されたクエリ結果を取得する前記ステップが、
クエリ結果を、クエリ結果の重みに従って直接ランク付けするか、あるいは
最も高い重みを有するクエリ結果を、第1位にランク付けされたクエリ結果として決定し、各2つのクエリ結果の間の類似性を決定し、ランク付けされる各クエリ結果の類似性の重みを、

Figure 2013200862
ここで、sはクエリ結果の重みを表し、dは現在のクエリ結果を表し、Dはすでにランク付けされている1組のクエリ結果を表し、類似性(d,d´)はdとd´との間の類似性を表す
として決定し、第1位にランク付けされたクエリ結果を除くクエリ結果を類似性の重みによって繰り返してランク付けする
ことを特徴とする付記8に記載のクエリ結果を多様化するための方法。 (Appendix 10)
The step of ranking the constructed final query result set to obtain diversified query results comprises:
Either rank the query results directly according to the weight of the query results, or determine the query result with the highest weight as the query result ranked first, and determine the similarity between each two query results Determine and rank the similarity weight of each query result,
Figure 2013200862
Where s represents the weight of the query result, d represents the current query result, D represents a set of already ranked query results, and similarity (d, d ′) is d and d ′. The query result according to appendix 8, characterized in that the query result excluding the query result ranked first is ranked repeatedly by the similarity weight. A way to diversify.

(付記11)
クエリ結果を多様化するための装置であって、
それぞれのクエリキーワードについて領域オントロジから関連キーワードを抽出することによって、関連キーワードの組み合わせセットを構築するように構成された関連キーワード組み合わせセット構築ユニットと、
関連キーワードの組み合わせセットにおけるそれぞれの関連キーワードの組み合わせでサーチして、クエリ結果セットを取得するように構成されたクエリユニットと、
それぞれのクエリ結果セットから対応する数のクエリ結果を抽出することによって、最終的なクエリ結果セットを構築するように構成された最終クエリ結果セット構築ユニットと、
構築された最終的なクエリ結果セットをランク付けして、多様化されたクエリ結果を取得するように構成されたランク付けユニットと
を備えることを特徴とするクエリ結果を多様化するための装置。
(Appendix 11)
A device for diversifying query results,
A related keyword combination set building unit configured to build a set of related keyword combinations by extracting related keywords from the domain ontology for each query keyword;
A query unit configured to search for each related keyword combination in the related keyword combination set to obtain a query result set;
A final query result set construction unit configured to construct a final query result set by extracting a corresponding number of query results from each query result set;
An apparatus for diversifying query results, comprising: a ranking unit configured to rank the constructed final query result set to obtain diversified query results.

(付記12)
前記関連キーワード組み合わせセット構築ユニットが、
所与のクエリのクエリキーワード毎に、前記領域オントロジからキーワードの関連キーワードを抽出し、
前記関連キーワードに基づいて、関連キーワードの組み合わせセットを構築するように構成される
ことを特徴とする付記11に記載のクエリ結果を多様化するための装置。
(Appendix 12)
The related keyword combination set construction unit is
For each query keyword of a given query, extract keyword related keywords from the region ontology,
The apparatus for diversifying query results according to appendix 11, wherein the apparatus is configured to construct a combination set of related keywords based on the related keywords.

(付記13)
前記関連キーワードに基づいて、関連キーワードの組み合わせセットを構築する前記関連キーワード組み合わせセット構築ユニットが、
関連キーワードの組み合わせセットを、S(Q)={(c,c,…,c)|c∈C&&c∈C&&…c∈C}として構築するように構成され、
ここでCは、所与のクエリにおけるm個のキーワードの中のi番目のキーワードの関連キーワードセットである
ことを特徴とする付記12に記載のクエリ結果を多様化するための装置。
(Appendix 13)
The related keyword combination set construction unit that constructs a combination set of related keywords based on the related keywords,
A related keyword combination set is constructed such that S (Q) = {(c 1 , c 2 ,..., C m ) | c 1 ∈C 1 && c 2 ∈C 2 &&... C m ∈C m } And
Here C i, the apparatus for diversifying the query results according to Note 12, which is a related keyword set of the i-th keyword in the m keywords in a given query.

(付記14)
前記関連キーワード組み合わせセット構築ユニットが、
各クエリキーワードについて領域オントロジから関連キーワードを抽出することによって、関連キーワードの組み合わせセットを構築した後に、
関連キーワードの組み合わせセットにおける関連キーワードの組み合わせ毎に、組み合わせ内のすべてのキーワードを連結する最小サブグラフを領域オントロジから抽出するように構成され、
前記クエリユニットが、
最小サブグラフ毎に、最小サブグラフにおけるキーワードおよび他のノードから成るサブクエリを決定し、
各サブクエリにおけるキーワードおよび他のノードでサーチして、最小サブグラフの数と同じ数のサブクエリ結果セットを取得し、
クエリ結果セットをそれぞれのサブクエリ結果セットから成るセットとして決定するように構成され、
前記最小サブグラフは、領域オントロジにおけるそれぞれのキーワードを連結するサブグラフの中の最小数のエッジを有し、最も近い方法ですべての関連キーワードを連結するサブグラフである
ことを特徴とする付記11に記載のクエリ結果を多様化するための装置。
(Appendix 14)
The related keyword combination set construction unit is
After building a set of related keywords by extracting related keywords from the domain ontology for each query keyword,
For each related keyword combination in the related keyword combination set, it is configured to extract from the region ontology the smallest subgraph connecting all the keywords in the combination,
The query unit is
For each minimal subgraph, determine a subquery consisting of keywords and other nodes in the minimal subgraph,
Search by keyword and other nodes in each subquery to get as many subquery result sets as the number of minimum subgraphs,
Configured to determine the query result set as a set of each subquery result set,
The supplementary note 11, wherein the minimum subgraph is a subgraph having a minimum number of edges in a subgraph connecting each keyword in a region ontology, and connecting all related keywords in a closest manner. A device for diversifying query results.

(付記15)
前記最終クエリ結果セット構築ユニットが、
所与のクエリに対する各サブクエリの関連性に従って、各サブクエリ結果セットから対応する数のクエリ結果を抽出し、
各サブクエリ結果セットから取得したクエリ結果を結合するように構成される
ことを特徴とする付記14に記載のクエリ結果を多様化するための装置。
(Appendix 15)
The final query result set construction unit is
Extract a corresponding number of query results from each subquery result set according to the relevance of each subquery to a given query,
The apparatus for diversifying the query results according to appendix 14, wherein the query results obtained from the respective subquery result sets are combined.

(付記16)
前記最終クエリ結果セット構築ユニットが、
各最小サブグラフのサブグラフ重みを

Figure 2013200862
mはクエリキーワードの数を表し、riはクエリキーワードに対するクエリキーワードについて領域オントロジから抽出された関連キーワードのマッチ値を表し、|E|はサブグラフにおけるエッジの数を表す
として決定し、
最小サブグラフのサブグラフ重みに従って、各最小サブグラフに対応するサブクエリ結果セットから対応する数のクエリ結果を抽出し、
各サブクエリ結果セットから取得したクエリ結果を結合するように構成される
ことを特徴とする付記15に記載のクエリ結果を多様化するための装置。 (Appendix 16)
The final query result set construction unit is
Subgraph weight for each minimum subgraph
Figure 2013200862
m represents the number of query keywords, ri represents the match value of the related keyword extracted from the region ontology for the query keyword for the query keyword, and | E | represents the number of edges in the subgraph,
Extract a corresponding number of query results from the subquery result set corresponding to each minimum subgraph according to the subgraph weight of the minimum subgraph,
The apparatus for diversifying query results according to appendix 15, characterized in that it is configured to combine query results obtained from each subquery result set.

(付記17)
最小サブグラフのサブグラフ重みに従って、各最小サブグラフに対応するサブクエリ結果セットから対応する数のクエリ結果を抽出する前記最終クエリ結果セット構築ユニットにおいて、
最小サブグラフに対応するサブクエリ結果セットから抽出されたクエリ結果は、最小サブグラフに最も関連する上位k*a個のクエリ結果であり、ここで、aはすべての最小サブグラフのサブグラフ重みの合計に対する現在の最小サブグラフのサブグラフ重みの比率を表し、kは最終的なクエリ結果セットのスケールを表すあらかじめ定められた値であり、k*aはkとaとの積未満の最大の整数を表す
ことを特徴とする付記16に記載のクエリ結果を多様化するための装置。
(Appendix 17)
In the final query result set construction unit for extracting a corresponding number of query results from the subquery result set corresponding to each minimum subgraph according to the subgraph weight of the minimum subgraph,
The query results extracted from the subquery result set corresponding to the smallest subgraph are the top k * a query results most relevant to the smallest subgraph, where a is the current relative to the sum of the subgraph weights of all the smallest subgraphs. Represents the ratio of subgraph weights of the smallest subgraph, k is a predetermined value representing the scale of the final query result set, and k * a represents the largest integer less than the product of k and a. An apparatus for diversifying the query results according to attachment 16.

(付記18)
前記ランク付けユニットが、
最終的なクエリ結果セットにおけるクエリ結果毎に、対応する最小サブグラフに対するクエリ結果の関連度の値を決定し、
最終的なクエリ結果セットにおけるクエリ結果毎に、対応する最小サブグラフに対するクエリ結果の関連度の値、および最小サブグラフのサブグラフ重みに従ってクエリ結果の重みを決定し、
クエリ結果の重みによって最終的なクエリ結果セットにおけるクエリ結果をランク付けして、多様化されたクエリ結果を取得するように構成される
ことを特徴とする付記14に記載のクエリ結果を多様化するための装置。
(Appendix 18)
The ranking unit is
For each query result in the final query result set, determine the relevance value of the query result for the corresponding smallest subgraph,
For each query result in the final query result set, determine the query result weight according to the relevance value of the query result for the corresponding minimum subgraph and the subgraph weight of the minimum subgraph,
The query result according to appendix 14, wherein the query result is configured to rank the query result in the final query result set according to the weight of the query result to obtain a diversified query result. Equipment for.

(付記19)
最終的なクエリ結果セットにおけるクエリ結果毎に、対応する最小サブグラフに対するクエリ結果の関連度の値、および最小サブグラフのサブグラフ重みに従ってクエリ結果の重みを決定する前記ランク付けユニットが、
クエリ結果の重みを、対応する最小サブグラフに対するクエリ結果の関連度の値と最小サブグラフのサブグラフ重みとの積として決定するように構成される
ことを特徴とする付記18に記載のクエリ結果を多様化するための装置。
(Appendix 19)
For each query result in the final query result set, the ranking unit that determines the query result weight according to the relevance value of the query result to the corresponding minimum subgraph and the subgraph weight of the minimum subgraph,
The query result according to appendix 18, wherein the query result weight is determined to be determined as a product of the value of the relevance of the query result for the corresponding minimum subgraph and the subgraph weight of the minimum subgraph. Device to do.

(付記20)
クエリ結果の重みによって最終的なクエリ結果セットにおけるクエリ結果をランク付けする前記ランク付けユニットが、
クエリ結果を、クエリ結果の重みに従って直接ランク付けするか、あるいは
最も高い重みを有するクエリ結果を、第1位にランク付けされたクエリ結果として決定し、各2つのクエリ結果の間の類似性を決定し、ランク付けされる各クエリ結果の類似性の重みを、

Figure 2013200862
ここで、sはクエリ結果の重みを表し、dは現在のクエリ結果を表し、Dはすでにランク付けされている1組のクエリ結果を表し、類似性(d,d´)はdとd´との間の類似性を表す
として決定し、第1位にランク付けされたクエリ結果を除くクエリ結果を類似性の重みによって繰り返してランク付けするように構成される
ことを特徴とする付記18に記載のクエリ結果を多様化するための装置。 (Appendix 20)
The ranking unit that ranks query results in the final query result set by query result weights,
Either rank the query results directly according to the weight of the query results, or determine the query result with the highest weight as the query result ranked first, and determine the similarity between each two query results Determine and rank the similarity weight of each query result,
Figure 2013200862
Where s represents the weight of the query result, d represents the current query result, D represents a set of already ranked query results, and similarity (d, d ′) is d and d ′. The supplementary note 18 is characterized in that it is configured so that the query results excluding the query result ranked first are repeatedly ranked according to the similarity weight. Device for diversifying the described query results.

201:クエリユニット
202:クエリログメモリユニット
203:クエリ曖昧性除去ユニット
204:サブクエリメモリユニット
205:文書メモリユニット
206:キーワードサーチユニット
207:サブクエリ結果メモリユニット
208:クエリ結果結合ユニット
209:クエリ結果メモリユニット
210:クエリ結果ランク付けユニット
211:多様化済みランクリストメモリユニット
901:関連キーワード組み合わせセット構築ユニット
902:クエリユニット
903:最終クエリ結果セット構築ユニット
904:ランク付けユニット
201: Query unit 202: Query log memory unit 203: Query disambiguation unit 204: Subquery memory unit 205: Document memory unit 206: Keyword search unit 207: Subquery result memory unit 208: Query result combination unit 209: Query result memory unit 210 : Query result ranking unit 211: Diversified rank list memory unit 901: Related keyword combination set construction unit 902: Query unit 903: Final query result set construction unit 904: Ranking unit

Claims (10)

クエリ結果を多様化するための方法であって、
所与のクエリの各クエリキーワードについて領域オントロジから関連キーワードを抽出することによって、関連キーワードの組み合わせセットを構築するステップと、
関連キーワードの組み合わせセットにおけるそれぞれの関連キーワードの組み合わせでサーチして、クエリ結果セットを取得するステップと、
それぞれのクエリ結果セットから対応する数のクエリ結果を抽出することによって、最終的なクエリ結果セットを構築するステップと、
構築された最終的なクエリ結果セットをランク付けして、多様化されたクエリ結果を取得するステップと
を含むことを特徴とするクエリ結果を多様化するための方法。
A method for diversifying query results,
Building a set of related keywords by extracting the related keywords from the domain ontology for each query keyword of a given query;
Searching for each related keyword combination in the related keyword combination set to obtain a query result set;
Constructing a final query result set by extracting a corresponding number of query results from each query result set;
Ranking the constructed final query result set to obtain a diversified query result; and a method for diversifying the query results.
所与のクエリの各クエリキーワードについて領域オントロジから関連キーワードを抽出することによって、関連キーワードの組み合わせセットを構築する前記ステップが、
所与のクエリのクエリキーワード毎に、前記領域オントロジからキーワードの関連キーワードを抽出するステップと、
前記関連キーワードに基づいて、関連キーワードの組み合わせセットを構築するステップを含む
ことを特徴とする請求項1に記載のクエリ結果を多様化するための方法。
The step of constructing a set of related keywords by extracting related keywords from the domain ontology for each query keyword of a given query comprises:
For each query keyword of a given query, extracting a keyword related keyword from the region ontology;
The method for diversifying query results according to claim 1, comprising building a set of related keyword combinations based on the related keywords.
前記関連キーワードに基づいて、関連キーワードの組み合わせセットを構築する前記ステップが、
関連キーワードの組み合わせセットを、S(Q)={(c,c,…,c)|c∈C&&c∈C&&…c∈C}として構築する
ここでCは、所与のクエリにおけるm個のキーワードの中のi番目のキーワードの関連キーワードセットである
ことを特徴とする請求項2に記載のクエリ結果を多様化するための方法。
The step of constructing a combination set of related keywords based on the related keywords comprises:
Build a set of related keywords as S (Q) = {(c 1 , c 2 ,..., C m ) | c 1 ∈ C 1 && c 2 ∈ C 2 &&... C m ∈ C m } where C The method for diversifying query results according to claim 2, wherein i is a related keyword set of an i-th keyword among m keywords in a given query.
各クエリキーワードについて領域オントロジから関連キーワードを抽出することによって、関連キーワードの組み合わせセットを構築した後に、
関連キーワードの組み合わせセットにおける関連キーワードの組み合わせ毎に、組み合わせ内のすべてのキーワードを連結する最小サブグラフを領域オントロジから抽出するステップを含み、
関連キーワードの組み合わせセットにおけるそれぞれの関連キーワードの組み合わせでサーチして、クエリ結果セットを取得する前記ステップは、
最小サブグラフ毎に、最小サブグラフにおけるキーワードおよび他のノードから成るサブクエリを決定するステップと、
各サブクエリにおけるキーワードおよび他のノードでサーチして、最小サブグラフの数と同じ数のサブクエリ結果セットを取得するステップと、
クエリ結果セットをそれぞれのサブクエリ結果セットから成るセットとして決定するステップとを含み、
前記最小サブグラフは、領域オントロジにおけるそれぞれのキーワードを連結するサブグラフの中の最小数のエッジを有し、最も近い方法ですべての関連キーワードを連結するサブグラフである
ことを特徴とする請求項1に記載のクエリ結果を多様化するための方法。
After building a set of related keywords by extracting related keywords from the domain ontology for each query keyword,
For each related keyword combination in the related keyword combination set, the step of extracting from the region ontology a minimum subgraph connecting all the keywords in the combination,
Searching for each related keyword combination in the related keyword combination set to obtain a query result set comprises:
For each minimum subgraph, determining a subquery consisting of keywords and other nodes in the minimum subgraph;
Searching on keywords and other nodes in each subquery to obtain the same number of subquery result sets as the number of minimum subgraphs;
Determining a query result set as a set of respective subquery result sets;
The minimum subgraph is a subgraph that has a minimum number of edges in a subgraph connecting each keyword in a region ontology and connects all related keywords in the closest way. To diversify query results for.
それぞれのクエリ結果セットから対応する数のクエリ結果を抽出することにより、最終的なクエリ結果セットを構築する前記ステップが、
所与のクエリに対する各サブクエリの関連性に従って、各サブクエリ結果セットから対応する数のクエリ結果を抽出するステップと、
各サブクエリ結果セットから取得したクエリ結果を結合するステップとを含む
ことを特徴とする請求項4に記載のクエリ結果を多様化するための方法。
Said step of constructing a final query result set by extracting a corresponding number of query results from each query result set;
Extracting a corresponding number of query results from each subquery result set according to the relevance of each subquery to a given query;
Combining the query results obtained from each subquery result set. The method for diversifying query results according to claim 4.
所与のクエリに対する各サブクエリの関連性に従って、各サブクエリ結果セットから対応する数のクエリ結果を抽出する前記ステップが、
各最小サブグラフのサブグラフ重みを
Figure 2013200862
mはクエリキーワードの数を表し、riはクエリキーワードに対するクエリキーワードについて領域オントロジから抽出された関連キーワードのマッチ値を表し、|E|はサブグラフにおけるエッジの数を表す
として決定するステップと、
最小サブグラフのサブグラフ重みに従って、各最小サブグラフに対応するサブクエリ結果セットから対応する数のクエリ結果を抽出するステップとを含む
ことを特徴とする請求項5に記載のクエリ結果を多様化するための方法。
Said step of extracting a corresponding number of query results from each subquery result set according to the relevance of each subquery to a given query;
Subgraph weight for each minimum subgraph
Figure 2013200862
m represents the number of query keywords, ri represents the match value of the related keyword extracted from the region ontology for the query keyword for the query keyword, and | E | is determined to represent the number of edges in the subgraph;
Extracting the corresponding number of query results from the subquery result set corresponding to each minimum subgraph according to the subgraph weights of the minimum subgraphs. 6. A method for diversifying query results according to claim 5 comprising: .
最小サブグラフのサブグラフ重みに従って、各最小サブグラフに対応するサブクエリ結果セットから対応する数のクエリ結果を抽出する前記ステップにおいて、
最小サブグラフに対応するサブクエリ結果セットから抽出されたクエリ結果は、最小サブグラフに最も関連する上位k*a個のクエリ結果であり、ここで、aはすべての最小サブグラフのサブグラフ重みの合計に対する現在の最小サブグラフのサブグラフ重みの比率を表し、kは最終的なクエリ結果セットのスケールを表すあらかじめ定められた値であり、k*aはkとaとの積未満の最大の整数を表す
ことを特徴とする請求項5に記載のクエリ結果を多様化するための方法。
Extracting the corresponding number of query results from the subquery result set corresponding to each minimum subgraph according to the subgraph weight of the minimum subgraph,
The query results extracted from the subquery result set corresponding to the smallest subgraph are the top k * a query results most relevant to the smallest subgraph, where a is the current relative to the sum of the subgraph weights of all the smallest subgraphs. Represents the ratio of subgraph weights of the smallest subgraph, k is a predetermined value representing the scale of the final query result set, and k * a represents the largest integer less than the product of k and a. The method for diversifying the query results according to claim 5.
構築された最終的なクエリ結果セットをランク付けして、多様化されたクエリ結果を取得する前記ステップが、
最終的なクエリ結果セットにおけるクエリ結果毎に、対応する最小サブグラフに対するクエリ結果の関連度の値を決定するステップと、
最終的なクエリ結果セットにおけるクエリ結果毎に、対応する最小サブグラフに対するクエリ結果の関連度の値、および最小サブグラフのサブグラフ重みに従ってクエリ結果の重みを決定するステップと、
クエリ結果の重みによって最終的なクエリ結果セットにおけるクエリ結果をランク付けして、多様化されたクエリ結果を取得するステップとを含む
ことを特徴とする請求項4に記載のクエリ結果を多様化するための方法。
The step of ranking the constructed final query result set to obtain diversified query results comprises:
For each query result in the final query result set, determining a relevance value of the query result for the corresponding minimum subgraph;
Determining, for each query result in the final query result set, a query result weight according to the relevance value of the query result for the corresponding minimum subgraph and the subgraph weight of the minimum subgraph;
5. Diversifying the query results according to claim 4, comprising ranking query results in the final query result set according to the weights of the query results to obtain diversified query results. Way for.
最終的なクエリ結果セットにおけるクエリ結果毎に、対応する最小サブグラフに対するクエリ結果の関連度の値、および最小サブグラフのサブグラフ重みに従ってクエリ結果の重みを決定する前記ステップが、
クエリ結果の重みを、対応する最小サブグラフに対するクエリ結果の関連度の値と最小サブグラフのサブグラフ重みとの積として決定する
ことを特徴とする請求項8に記載のクエリ結果を多様化するための方法。
For each query result in the final query result set, said step of determining the query result weight according to the relevance value of the query result for the corresponding minimum subgraph and the subgraph weight of the minimum subgraph,
9. The method for diversifying a query result according to claim 8, wherein the weight of the query result is determined as a product of the relevance value of the query result for the corresponding minimum subgraph and the subgraph weight of the minimum subgraph. .
クエリ結果を多様化するための装置であって、
それぞれのクエリキーワードについて領域オントロジから関連キーワードを抽出することによって、関連キーワードの組み合わせセットを構築するように構成された関連キーワード組み合わせセット構築ユニットと、
関連キーワードの組み合わせセットにおけるそれぞれの関連キーワードの組み合わせでサーチして、クエリ結果セットを取得するように構成されたクエリユニットと、
それぞれのクエリ結果セットから対応する数のクエリ結果を抽出することによって、最終的なクエリ結果セットを構築するように構成された最終クエリ結果セット構築ユニットと、
構築された最終的なクエリ結果セットをランク付けして、多様化されたクエリ結果を取得するように構成されたランク付けユニットと
を備えることを特徴とするクエリ結果を多様化するための装置。
A device for diversifying query results,
A related keyword combination set building unit configured to build a set of related keyword combinations by extracting related keywords from the domain ontology for each query keyword;
A query unit configured to search for each related keyword combination in the related keyword combination set to obtain a query result set;
A final query result set construction unit configured to construct a final query result set by extracting a corresponding number of query results from each query result set;
An apparatus for diversifying query results, comprising: a ranking unit configured to rank the constructed final query result set to obtain diversified query results.
JP2012276584A 2012-03-23 2012-12-19 Method and apparatus for diversifying query results Active JP5486667B2 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201210080590.4A CN103324644B (en) 2012-03-23 2012-03-23 A kind of Query Result variation method and device
CN201210080590.4 2012-03-23

Publications (2)

Publication Number Publication Date
JP2013200862A true JP2013200862A (en) 2013-10-03
JP5486667B2 JP5486667B2 (en) 2014-05-07

Family

ID=49193391

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012276584A Active JP5486667B2 (en) 2012-03-23 2012-12-19 Method and apparatus for diversifying query results

Country Status (2)

Country Link
JP (1) JP5486667B2 (en)
CN (1) CN103324644B (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105653661A (en) * 2015-12-29 2016-06-08 云南电网有限责任公司电力科学研究院 Search result re-ranking method and device
US10474704B2 (en) 2016-06-27 2019-11-12 International Business Machines Corporation Recommending documents sets based on a similar set of correlated features
CN107220341A (en) * 2017-05-26 2017-09-29 北京中电普华信息技术有限公司 A kind of log analysis method and Log Analysis System
CN107688620B (en) * 2017-08-11 2020-01-24 武汉大学 Top-k query-oriented method for instantly diversifying query results

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003108597A (en) * 2001-09-27 2003-04-11 Toshiba Corp Information retrieving system, information retrieving method and information retrieving program
WO2010001455A1 (en) * 2008-06-30 2010-01-07 富士通株式会社 Retrieving device and method
JP2010033197A (en) * 2008-07-25 2010-02-12 Internatl Business Mach Corp <Ibm> Search device using disclosed search engine, search method, and search program
JP2010205265A (en) * 2009-03-05 2010-09-16 Nhn Corp Content retrieval system and method using ontology
JP2010277332A (en) * 2009-05-28 2010-12-09 Nippon Telegr & Teleph Corp <Ntt> Method, device and program for generating common query graph pattern

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9817902B2 (en) * 2006-10-27 2017-11-14 Netseer Acquisition, Inc. Methods and apparatus for matching relevant content to user intention
CN100573531C (en) * 2008-07-04 2009-12-23 华中科技大学 A kind of document retrieval method based on association analysis
CN101751422A (en) * 2008-12-08 2010-06-23 北京摩软科技有限公司 Method, mobile terminal and server for carrying out intelligent search at mobile terminal
CN101840438B (en) * 2010-05-25 2012-03-28 刘宏 Retrieval system oriented to meta keywords of source document
CN102081668B (en) * 2011-01-24 2012-07-25 熊晶 Information retrieval optimizing method based on domain ontology

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003108597A (en) * 2001-09-27 2003-04-11 Toshiba Corp Information retrieving system, information retrieving method and information retrieving program
WO2010001455A1 (en) * 2008-06-30 2010-01-07 富士通株式会社 Retrieving device and method
JP2010033197A (en) * 2008-07-25 2010-02-12 Internatl Business Mach Corp <Ibm> Search device using disclosed search engine, search method, and search program
JP2010205265A (en) * 2009-03-05 2010-09-16 Nhn Corp Content retrieval system and method using ontology
JP2010277332A (en) * 2009-05-28 2010-12-09 Nippon Telegr & Teleph Corp <Ntt> Method, device and program for generating common query graph pattern

Also Published As

Publication number Publication date
CN103324644A (en) 2013-09-25
CN103324644B (en) 2016-05-11
JP5486667B2 (en) 2014-05-07

Similar Documents

Publication Publication Date Title
KR102354716B1 (en) Context-sensitive search using a deep learning model
KR101932618B1 (en) Method and system for evaluating and ranking images with content based on similarity scores in response to a search query
KR101827764B1 (en) Visual semantic complex network and method for forming the network
US10853344B2 (en) Understanding tables for search
US9201931B2 (en) Method for obtaining search suggestions from fuzzy score matching and population frequencies
US9547690B2 (en) Query rewriting using session information
KR20170136964A (en) Method and system for dynamically rankings images to be matched with content in response to a search query
WO2011097053A2 (en) Generating and presenting lateral concepts
JP2016212838A (en) Discovery information system, method, and computer program
WO2018176913A1 (en) Search method and apparatus, and non-temporary computer-readable storage medium
JP5486667B2 (en) Method and apparatus for diversifying query results
Zubiaga et al. Content-based clustering for tag cloud visualization
US20200004876A1 (en) Systems and methods for contextual ranking of search results
Liu et al. Lexicon modeling for query understanding
JP5497105B2 (en) Document retrieval apparatus and method
JP5362807B2 (en) Document ranking method and apparatus
Ma et al. Web API discovery using semantic similarity and hungarian algorithm
Liu et al. A Chinese question answering system based on web search
Krishnan et al. Select, link and rank: Diversified query expansion and entity ranking using wikipedia
Feng et al. A system for region search and exploration
Kaabachi et al. A Topological Data Analysis of Navigation Paths within Digital Libraries
Wang et al. Optimization of Query Expansion Source in Formal Concept Analysis.
JP5647090B2 (en) Query recommendation apparatus, method, and program
Tantanasiriwong et al. A comparative study of key phrase extraction for cross-domain document collections
Sheth et al. Ontology Based Semantic Web Information Retrieval Enhancing Search Significance

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130918

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20131106

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131204

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140128

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140221

R150 Certificate of patent or registration of utility model

Ref document number: 5486667

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250