JP5486667B2 - クエリ結果を多様化するための方法および装置 - Google Patents

クエリ結果を多様化するための方法および装置 Download PDF

Info

Publication number
JP5486667B2
JP5486667B2 JP2012276584A JP2012276584A JP5486667B2 JP 5486667 B2 JP5486667 B2 JP 5486667B2 JP 2012276584 A JP2012276584 A JP 2012276584A JP 2012276584 A JP2012276584 A JP 2012276584A JP 5486667 B2 JP5486667 B2 JP 5486667B2
Authority
JP
Grant status
Grant
Patent type
Prior art keywords
query
subgraph
set
results
minimum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012276584A
Other languages
English (en)
Other versions
JP2013200862A (ja )
Inventor
ジェンチャン リー
シュンチェン リュウ
Original Assignee
エヌイーシー(チャイナ)カンパニー, リミテッドNEC(China)Co.,Ltd.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Grant date

Links

Images

Description

本発明は情報検索技術に関し、特にクエリ結果を多様化するための方法および装置に関する。

従来の情報検索技術では、例えばサーチ結果をクラスタ化または分類する、平均分散分析などによって結果をランク付けし直すなど、検索された文書を後処理またはランク付けし直すことによって一般的に多様化が行われる。

情報検索技術の発展と共に、サーチ結果の多様化および情報検索のクエリの曖昧性除去におけるユーザの要求はますます高まっている。特に、サーチ結果の多様化とは、ユーザによるクエリキーワード入力にはいくつかの解釈がある可能性があり、取得されたクエリ結果は、これらの異なる解釈をカバーする結果でなければならないことを意味する。サーチ結果の多様化の目的は、サーチ結果の関連性および新規性のバランスをとることによってユーザが満足しないリスクを可能な限り低下させることである。クエリの曖昧性除去は、ユーザの入力キーワードに基づいて可能性があるすべてのクエリの意図を識別し、より正確な方法で意図を表すことに重点を置いている。

クエリの曖昧性除去は、サーチの多様化をサポートする新しい方法として働き、これによって特に結果のスケールが大きい時は、計算コストが効率的に節約され結果がよりわかりやすくなり得る。多様化されたサーチは、従来技術では一般的にクエリログにおいて統計分析(または機械学習など)を使用することによって実行される。

具体的にはクエリ結果を多様化するための既存の方法は、図1に示されるようなクエリ間の変換の形を採用しており、以下を含む。

ステップS101は、クエリログの大きいサンプルの分析を行うことによって、所与のクエリQについてk個の関連するクエリR(Q)を生成することである。

ステップS102は、クエリ結果の各組からn/(k+1)個(nはユーザ文書の数を表す)の結果を抽出することによって、最初のDOCリストを取得することである。そして

ステップS103は、最初のDOCリストを関連性フィードバック手法でランク付けし直すことである。

図2に示されるようなクエリ結果を多様化するための対応する装置は、

ユーザのクエリキーワードを格納するように構成されたクエリユニット201と、

ユーザのクエリログを格納するように構成されたクエリログメモリユニット202と、

ユーザのクエリキーワードおよびクエリログに従ってターゲットクエリに関連するクエリキーワードを決定するように構成されたクエリ曖昧性除去ユニット203と、

ターゲットクエリに関連するクエリキーワードを格納するように構成されたサブクエリメモリユニット204と、

サーチされた文書を格納するように構成された文書メモリユニット205と、

サブクエリのキーワードを使用して、文書メモリユニット205内の文書をサーチするように構成されたキーワードサーチユニット206と、

各サブクエリによるサーチのクエリ結果を格納するように構成されたサブクエリ結果メモリユニット207と、

それぞれのクエリ結果を結合するように構成されたクエリ結果結合ユニット208と、

結合されたクエリ結果を格納するように構成されたクエリ結果メモリユニット209と、

結合されたクエリ結果をランク付けするように構成されたクエリ結果ランク付けユニット210と、

ターゲットクエリの最終的な多様化されたクエリ結果を格納するように構成された多様化済みランクリストメモリユニット211とを含む。

具体的には、例えばクエリキーワード「ウィンドウ」およびターゲットクエリq=(ウィンドウ)が与えられると、クエリキーワードおよびクエリログに従ってサブクエリのキーワードが「ウィンドウXP」、「ハウスウィンドウ」、……として取得され、次いでqの1組のサブクエリは、R(q)={(q,q,ウィンドウXP),(q,q,ハウスウィンドウ),……}となり、ターゲットクエリqによるサーチ、および1組のサブクエリR(q)におけるそれぞれのサブクエリによるサーチは、1組の文書リストS(q)={(q,文書リスト1),(q,文書リスト2),(q,文書リスト3),……}を形成する文書リストをそれぞれ取得し、qの新しい1組のクエリ結果RF(q)を形成するためにn/(k+1)文書が各文書リストから選択される。ここでnは結果のスケールを表すあらかじめ定められた値であり、kはサブクエリの数を表し、RF(q)における文書は文書とユーザの関心との間のマッチ度に基づいてランク付けされ、それによってユーザクエリの多様化されたクエリ結果が取得される。

クエリ結果を多様化する上記の方法からわかるように、1組のサブクエリは、従来技術ではクエリログに基づいて決定されるが、本発明の発明者が識別しているのは、その時点ではユーザの本当のクエリの意図を正確に表すことができない可能性があるユーザ入力クエリキーワードに基づいてクエリログが生成され、さらに企業サーチまたは他のサーチ状況においてもクエリログを使用することができない、またはクエリログのサイズがクエリの曖昧性除去をサポートするのに十分ではない可能性があるので、クエリログは信頼できないデータソースである可能性があり、従って正確ではない多様化されたクエリ結果が生成されるということである。

本発明の実施例は、正確な多様化されたクエリ結果を取得するために、クエリ結果を多様化する方法および装置を提供する。

本発明の好ましい態様によるクエリ結果を多様化するための方法は、
コンピュータが、所与のクエリの各クエリキーワードについて領域オントロジから関連キーワードを抽出することによって、関連キーワードの組み合わせセットを構築するステップと、
前記コンピュータが、関連キーワードの組み合わせセットにおけるそれぞれの関連キーワードの組み合わせでサーチして、クエリ結果セットを取得するステップと、
前記コンピュータが、それぞれのクエリ結果セットから対応する数のクエリ結果を抽出することによって、最終的なクエリ結果セットを構築するステップと、
前記コンピュータが、構築された最終的なクエリ結果セットをランク付けして、多様化されたクエリ結果を取得するステップと
前記コンピュータが、各クエリキーワードについて領域オントロジから関連キーワードを抽出することによって、関連キーワードの組み合わせセットを構築した後に、
関連キーワードの組み合わせセットにおける関連キーワードの組み合わせ毎に、組み合わせ内のすべてのキーワードを連結する最小サブグラフを領域オントロジから抽出するステップと、
を備え、
関連キーワードの組み合わせセットにおけるそれぞれの関連キーワードの組み合わせでサーチして、クエリ結果セットを取得する前記ステップは、
最小サブグラフ毎に、最小サブグラフにおけるキーワードおよび他のノードから成るサブクエリを決定するステップと、
各サブクエリにおけるキーワードおよび他のノードでサーチして、最小サブグラフの数と同じ数のサブクエリ結果セットを取得するステップと、
クエリ結果セットをそれぞれのサブクエリ結果セットから成るセットとして決定するステップとを含み、
前記最小サブグラフは、領域オントロジにおけるそれぞれのキーワードを連結するサブグラフの中の最小数のエッジを有し、最も近い方法ですべての関連キーワードを連結するサブグラフである、
ことを特徴とする

本発明の好ましい態様によるクエリ結果を多様化するための装置は、
れぞれのクエリキーワードについて領域オントロジから関連キーワードを抽出することによって、関連キーワードの組み合わせセットを構築するように構成された関連キーワード組み合わせセット構築ユニットと、
連キーワードの組み合わせセットにおけるそれぞれの関連キーワードの組み合わせでサーチして、クエリ結果セットを取得するように構成されたクエリユニットと、
れぞれのクエリ結果セットから対応する数のクエリ結果を抽出することによって、最終的なクエリ結果セットを構築するように構成された最終クエリ結果セット構築ユニットと、
築された最終的なクエリ結果セットをランク付けして、多様化されたクエリ結果を取得するように構成されたランク付けユニットと
各クエリキーワードについて領域オントロジから関連キーワードを抽出することによって、関連キーワードの組み合わせセットを構築した後に、関連キーワードの組み合わせセットにおける関連キーワードの組み合わせ毎に、組み合わせ内のすべてのキーワードを連結する最小サブグラフを領域オントロジから抽出する抽出ユニットと、
を備え、
前記クエリユニットは、
最小サブグラフ毎に、最小サブグラフにおけるキーワードおよび他のノードから成るサブクエリを決定し、
各サブクエリにおけるキーワードおよび他のノードでサーチして、最小サブグラフの数と同じ数のサブクエリ結果セットを取得し、
クエリ結果セットをそれぞれのサブクエリ結果セットから成るセットとして決定し、
前記最小サブグラフは、領域オントロジにおけるそれぞれのキーワードを連結するサブグラフの中の最小数のエッジを有し、最も近い方法ですべての関連キーワードを連結するサブグラフである、
ことを特徴とする

本発明のクエリ結果を多様化するための方法および装置によれば、領域オントロジにおいて所与のキーワードクエリについて1組の関連キーワードの組み合わせが決定され、これらの関連キーワードの組み合わせによって拡張されたクエリセットが構築され、それによって信頼できないクエリログから拡張されたクエリセットが決定されることが回避され、従って多様化されたクエリ結果がより正確になる。

従来技術におけるクエリ結果を多様化するための方法のフローチャートである。 従来技術におけるクエリ結果を多様化するための装置の概略構造図である。 本発明の一実施例によるクエリ結果を多様化するための方法のフローチャートである。 本発明の一実施例による最小サブグラフを取得するための方法のフローチャートである。 本発明の一実施例による1組のクエリ結果を決定するための方法のフローチャートである。 本発明の一実施例によるクエリ結果を取得するための方法のフローチャートである。 本発明の一実施例によるランク付け方法のフローチャートである。 本発明の一実施例による類似性によるランク付けの方法のフローチャートである。 本発明の一実施例によるクエリ結果を多様化するための装置の概略構造図である。

本発明の実施例は、クエリ結果を多様化するための方法および装置を提供しており、領域オントロジにおいて所与のキーワードクエリについて1組の関連キーワードの組み合わせが決定され、これらの関連キーワードの組み合わせによって拡張されたクエリセットが構築され、それによって信頼できないクエリログから拡張されたクエリセットが決定されることが回避され、従って多様化されたクエリ結果がより正確になる。

図3に示されるように、本発明の一実施例によるクエリ結果を多様化するための方法は、以下を含む。

ステップS301は、それぞれのクエリキーワードについて領域オントロジから関連キーワードを抽出することによって、関連キーワードの組み合わせセットを構築することである。

ステップS302は、関連キーワードの組み合わせセットにおけるそれぞれの関連キーワードの組み合わせでサーチして、クエリ結果セットを取得することである。

ステップS303は、それぞれのクエリ結果セットから対応する数のクエリ結果を抽出することによって、最終的なクエリ結果セットを構築することである。

ステップS304は、構築された最終的なクエリ結果セットをランク付けして、多様化されたクエリ結果を取得することである。

各関連キーワードは領域オントロジから抽出され、従って関連キーワードの選択がより正確になる。さらに、関連キーワードの組み合わせに基づいてクエリグラフを構築することで所与のクエリを解釈することによって、解釈がユーザの本当の意図により近くなり、それによって多様化されたクエリ結果がより正確になる。領域オントロジは概念間の関係と共に1組の概念として領域知識を表す。

具体的には、ステップS301で最初に、所与のクエリのキーワード毎にそのキーワードの関連キーワードが領域オントロジから抽出され、次いで関連キーワードの組み合わせセットが関連キーワードから構築される。構築された関連キーワードの組み合わせセットは、S(Q)={(c,c,…,c)|c∈C&&c∈C&&…c∈C}であり、ここでCは、所与のクエリにおけるm個のキーワードの中のi番目のキーワードの関連キーワードセットである。

所与のクエリキーワードの関連キーワードを抽出する時、クエリキーワードとオントロジ概念との間で単語マッチングを行うことができ、次いで取得されたマッチするオントロジ概念が関連キーワードとして設定される。当業者は当然、他の方法によって領域オントロジから関連キーワードを抽出することができる。

クエリ結果をより正確にするために関連キーワードの組み合わせをさらにフィルタに通すことができ、それによってユーザの意図により近いものが取得される。

具体的にはステップS301において、領域オントロジに従って所与のクエリについて関連キーワードの組み合わせセットを構築した後、

関連キーワードの組み合わせセットにおける関連キーワードの組み合わせ毎に、組み合わせ内のすべてのキーワードを連結する最小サブグラフが領域オントロジから抽出される。ここで最小サブグラフは、領域オントロジにおけるそれぞれのキーワードを連結するサブグラフの中の最小数のエッジを有し、最も近い方法ですべての関連キーワードを連結するサブグラフである。

図4に示されるように、関連キーワードの組み合わせにおける5つのキーワードが与えられると、抽出されたサブグラフは5つのキーワードすべてを連結し、最小数のエッジを有する。

この時、図5に示されるように関連キーワードの組み合わせセットにおけるそれぞれの関連キーワードの組み合わせでサーチして、クエリ結果セットを取得するステップS302は特に以下を含む。

ステップS501は最小サブグラフ毎に、最小サブグラフにおけるキーワードおよび他のノードから成るサブクエリを決定することである。

ステップS502は、各サブクエリにおけるキーワードおよび他のノードでサーチして、最小サブグラフの数と同じ数のサブクエリ結果セットを取得する。そして

ステップS503は、クエリ結果セットをそれぞれのサブクエリ結果セットから成るセットとして決定することである。

例えばユーザはm個のキーワード、Q={k,……,k}を含むクエリを入力し、任意のキーワードkについて1組の関連キーワード、C={ci1,ci2,……,cini}を領域オントロジから抽出することができ、niは、kについての関連キーワードの数を示し、またkに対する各関連キーワードの関連度の値、R={ri1,ri2,……、rini}を領域オントロジに基づいて計算することができる。合計で
であり、ユーザの入力クエリについて関連キーワードの組み合わせ、S(Q)={(c1,c2,…,cm)|c1∈C1&&c2∈C2&&…cm∈Cm}を決定することができる。

関連キーワードの組み合わせ毎に領域オントロジから最小のクエリセマンティックグラフを決定することができ、最小のクエリセマンティックグラフは組み合わせの中のそれぞれのキーワードを含み、各キーワードがクエリセマンティックグラフのノードであり、最小のクエリセマンティックグラフは結合されるそれぞれのキーワードについての他のノードも含み得る。最小のクエリセマンティックグラフは、所与のユーザクエリのサブクエリとして表すこともでき、それぞれのキーワードを連結するサブグラフの中の最小数のエッジを有するサブグラフである。

関連キーワードの組み合わせにおいて、あるキーワードをランダムに選択し、選択されたキーワードをトラバースが始まる最初のノードとして設定し、領域オントロジにおいてキーワードを別のノードに連結する各パスをトラバースし、それぞれのキーワードを連結する最小サブグラフが決定されるまでターゲットノードへの最短のパスを最小サブグラフにおけるパスとして選択することによって、最小サブグラフを取得することができる。ここで同じパス長を有するパスが2つある場合、そのうちの一方をランダムに選択することができる。ここでのターゲットノードは、関連キーワードの組み合わせにおけるキーワードを指す。

ステップS303において、それぞれのクエリ結果セットから対応する数のクエリ結果を抽出することにより、最終的なクエリ結果セットを構築する方法は2つある。第1の方法は、各サブクエリ結果セットからあらかじめ設定された数のクエリ結果を抽出することである。第2の方法は、所与のクエリに対するサブクエリの関連性に従って、各サブクエリ結果セットから対応する数のクエリ結果を抽出することであり、それによってサブクエリが所与のクエリに関連すればするほど、サブクエリ結果セットからより多くの結果が選択され、最終的なクエリ結果セットに追加されることになる。

具体的には図6に示されるように、所与のクエリに対する各サブクエリの関連性に従って、特に以下の通り各サブクエリ結果セットから対応する数のクエリ結果を取得することができる。

ステップS601は、各最小サブグラフのサブグラフ重みを
として決定することであり、式中mはクエリキーワードの数を表し、riはクエリキーワードに対するクエリキーワードについて領域オントロジから抽出された関連キーワードのマッチ値を表し、|E|はサブグラフにおけるエッジの数を表す。

ステップS602は、最小サブグラフのサブグラフ重みに従って各最小サブグラフに対応するサブクエリ結果セットから対応する数のクエリ結果を抽出することである。

ステップS602では、対応する数のクエリ結果は、最小サブグラフのサブグラフ重みに従って、特に以下の通り各最小サブグラフに対応するサブクエリ結果セットから取得することができる。

最小サブグラフに対応するサブクエリ結果セットから抽出されたクエリ結果は、上位k*a個の結果であり、ここでaはすべての最小サブグラフのサブグラフ重みの合計に対する現在の最小サブグラフのサブグラフ重みの比率を表し、kは最終的なクエリ結果セットのスケールを表すあらかじめ定められた値であり、k*aはkとaとの積未満の最大の整数を表す。

さらに本発明の一実施例は、ユーザがより便利にそのクエリの意図に近いクエリ結果を見ることができるようにクエリ結果にランク付けする方法を提供し、この時、図7に示されるように、構築された最終的なクエリ結果セットをランク付けして多様化されたクエリ結果を取得するステップS304は、以下を含む。

ステップS701は、最終的なクエリ結果セットにおけるクエリ結果毎に、対応する最小サブグラフに対するクエリ結果の関連度の値を決定することである。

ステップS702は、最終的なクエリ結果セットにおけるクエリ結果毎に、対応する最小サブグラフに対するクエリ結果の関連度の値、および最小サブグラフのサブグラフ重みに従ってクエリ結果の重みを決定することである。そして

ステップS703は、クエリ結果の重みによって最終的なクエリ結果セットにおけるクエリ結果をランク付けして、多様化されたクエリ結果を取得することである。

具体的にはステップS702で、クエリ結果の重みを、特に以下の通り対応する最小サブグラフに対するクエリ結果の関連度の値と、最小サブグラフのサブグラフ重みに従って決定することができる。

クエリ結果の重みは、対応する最小サブグラフに対するクエリ結果の関連度の値と最小サブグラフのサブグラフ重みとの積として決定される。

さらにステップS703で、クエリ結果の重みに従って取得されたクエリ結果を直接ランク付けすることにより、またはさらにクエリ結果の間の類似性を考慮に入れることにより、取得されたクエリ結果をクエリ結果の重みに従ってランク付けすることができ、この時、図8に示されるようにステップS703は特に以下を含む。

ステップS801は、最も高い重みを有するクエリ結果を第1位にランク付けされたクエリ結果として決定し、各2つのクエリ結果の間の類似性を決定することである。

ステップS802は、ランク付けすべき各クエリ結果の類似性の重みを
として決定することであり、式中sはクエリ結果の重みを表し、dは現在のクエリ結果を表し、Dはすでにランク付けされている1組のクエリ結果を表し、類似性(d,d´)はdとd´との間の類似性を表す。そして

ステップS803は、第1位にランク付けされたクエリ結果を除くクエリ結果を類似性の重みによって繰り返してランク付けすることである。

本発明の一実施例によるクエリ結果を多様化するための方法を示す具体的な例について、以下で説明する。

ユーザのクエリキーワードが「牡丹」および「北京」である場合、C(「牡丹」)={(「牡丹花」,0.5),(「牡丹TV」,0.2),(「牡丹江」,0.2),…}およびC(「北京」)={(「北京市」,0.8)(「北京の腕時計」,0.07),(「北京故事」,0.05),…}を領域オントロジから決定することができ、ここで(「牡丹花」,0.5)は、「牡丹」に対する「牡丹」の関連キーワード「牡丹花」のマッチ値を表す。

それぞれの関連キーワードの組み合わせが決定された後、それぞれのキーワードを連結するサブグラフが取得され、例えば1組の最小サブグラフはS(グラフ)={(g1,牡丹花,北京市,0.65),(g2,牡丹TV,北京市,0.5),(g3,牡丹花,李勤勤,北京故事,0.138),…}であり、容易に導き出すことができるように、サブグラフg1は0.65のサブグラフ重みを有し、g2は0.5のサブグラフ重みを有し、g3は0.138のサブグラフ重みを有する。

それぞれのサブグラフにおけるキーワードおよび他のノードによるサーチによって、サブクエリ結果のそれぞれの組、例えばここでは、サブクエリ結果の組における文書毎に、結果(g1)={(doc1,ωg=0.65,ωr=0.9),(doc2,ωg=0.65,ωr=0.7),…}、結果(g2)={(doc3,ωg=0.5,ωr=0.8),(doc4,ωg=0.5,ωr=0.6)…}…が得られ、wgはそれに対する最小サブグラフのサブグラフ重みを表し、wrは最小サブグラフに対する文書の関連度を表し、サブクエリ結果の各組における文書はwrによってランク付けされる。

最小サブグラフに対応するサブクエリ結果セットから取得されたクエリ結果は、サブグラフに最も関連する上位3*a個のクエリ結果であり、例えば上位
個の文書が結果(g1)から選択され、最終的なクエリ結果セットRF(q)に追加され、上位
個の文書が結果(g2)から選択され、最終的なクエリ結果セットRF(q)に追加される。ここで3は、RF(q)の予想されるスケールを意味する。

RF(q)が{(doc1,0.65,0.9),(doc2,0.65,0.7),(doc3,0.5,0.8)}である場合、

取得されたクエリ結果は、クエリ結果の重みによって直接ランク付けすることができ、3つの文書の重みはそれぞれs1=0.65×0.9、s2=0.65×0.7、s3=0.5×0.8であるので、ランク付けされたクエリ結果は、RF(q)={doc1,doc2,doc3}である。

あるいは取得されたクエリ結果は、さらに類似性を使用してランク付けすることができ、この時、類似性(doc1,doc2)=0.5、類似性(doc1,doc3)=0.1、および類似性(doc2,doc3)=0.2である場合、ランク付けされたクエリ結果は、RF(q)={doc1,doc3,doc2}である。

本発明の一実施例は、対応してクエリ結果を多様化するための装置をさらに提供し、図9に示されるように装置は以下を含む。

所与のクエリのそれぞれのクエリキーワードについて領域オントロジから関連キーワードを抽出することによって、関連キーワードの組み合わせセットを構築するように構成された関連キーワード組み合わせセット構築ユニット901と、

関連キーワードの組み合わせセットにおけるそれぞれの関連キーワードの組み合わせでサーチして、クエリ結果セットを取得するように構成されたクエリユニット902と、

それぞれのクエリ結果セットから対応する数のクエリ結果を抽出することによって、最終的なクエリ結果セットを構築するように構成された最終クエリ結果セット構築ユニット903と、

構築された最終的なクエリ結果セットをランク付けして、多様化されたクエリ結果を取得するように構成されたランク付けユニット904とを含む。

特に、関連キーワード組み合わせセット構築ユニット901は、

所与のクエリのクエリキーワード毎に、領域オントロジからキーワードの関連キーワードを抽出し、

それぞれの関連キーワードに基づいて、関連キーワードの組み合わせセットを構築するように構成される。

それぞれの関連キーワードに基づいて、関連キーワードの組み合わせセットを構築する関連キーワード組み合わせセット構築ユニット901は、特に以下を含む。

関連キーワードの組み合わせセットは、S(Q)={(c,c,…,c)|c∈C&&c∈C&&…c∈C}として構築され、ここでCは、所与のクエリにおけるm個のキーワードの中のi番目のキーワードの関連キーワードセットである。

特に、関連キーワード組み合わせセット構築ユニット901は、さらに

所与のクエリのクエリキーワード毎に、領域オントロジからキーワードの関連キーワードを抽出した後、

領域オントロジにおける所与のクエリのキーワードセットの関連キーワードの組み合わせセットを構築した後、

関連キーワードの組み合わせセットにおける関連キーワードの組み合わせ毎に、関連キーワードの組み合わせ内のそれぞれのキーワードを連結する最小サブグラフを領域オントロジから抽出するように構成されており、ここでは、最小サブグラフは、領域オントロジにおけるそれぞれのキーワードを連結するサブグラフの中の最小数のエッジを有するサブグラフである。

クエリユニット902は特に、

最小サブグラフ毎に、最小サブグラフにおけるキーワードおよび他のノードから成るサブクエリを決定し、

各サブクエリにおけるキーワードおよび他のノードでサーチして、最小サブグラフの数と同じ数のサブクエリ結果セットを取得し、

クエリ結果セットをそれぞれのサブクエリ結果セットから成るセットとして決定するように構成される。

最終クエリ結果セット構築ユニット903は特に、

所与のクエリに対する各サブクエリの関連性に従って、各サブクエリ結果セットから対応する数のクエリ結果を抽出し、

それぞれのサブクエリ結果セットから取得されたクエリ結果を結合するように構成される。

さらに、最終クエリ結果セット構築ユニット903は特に、

各最小サブグラフのサブグラフ重みを
として決定し、式中mはクエリキーワードの数を表し、riはクエリキーワードに対するクエリキーワードについて領域オントロジから抽出された関連キーワードのマッチ値を表し、|E|はサブグラフにおけるエッジの数を表し、

最小サブグラフのサブグラフ重みに従って、各最小サブグラフに対応するサブクエリ結果セットから対応する数のクエリ結果を抽出し、

それぞれのサブクエリ結果セットから取得されたクエリ結果を結合するように構成される。

具体的には、最小サブグラフのサブグラフ重みに従って、各最小サブグラフに対応するサブクエリ結果セットから対応する数のクエリ結果を抽出する最終クエリ結果セット構築ユニット903は、特に以下を含む。

最小サブグラフに対応するサブクエリ結果セットから抽出されたクエリ結果は、最小サブグラフに最も関連する上位k*a個のクエリ結果であり、ここでaはすべての最小サブグラフのサブグラフ重みの合計に対する現在の最小サブグラフのサブグラフ重みの比率を表し、kは最終的なクエリ結果セットのスケールを表すあらかじめ定められた値であり、k*aはkとaとの積未満の最大の整数を表す。

ランク付けユニット904は特に、

最終的なクエリ結果セットにおけるクエリ結果毎に、対応する最小サブグラフに対するクエリ結果の関連度の値を決定し、

最終的なクエリ結果セットにおけるクエリ結果毎に、対応する最小サブグラフに対するクエリ結果の関連度の値、および最小サブグラフのサブグラフ重みに従ってクエリ結果の重みを決定し、

クエリ結果の重みによって最終的なクエリ結果セットにおけるクエリ結果をランク付けして、多様化されたクエリ結果を取得するように構成される。

クエリ結果の重みを、対応する最小サブグラフに対するクエリ結果の関連度の値、および最小サブグラフのサブグラフ重みに従って決定するランク付けユニット904は、特に以下を含む。

クエリ結果の重みは、対応する最小サブグラフに対するクエリ結果の関連度の値と最小サブグラフのサブグラフ重みとの積として決定される。

クエリ結果の重みによって取得されたクエリ結果をランク付けするランク付けユニット904は、特に以下を含む。

クエリ結果は、クエリ結果の重みに従って直接ランク付けされる。または

最も高い重みを有するクエリ結果は、第1位にランク付けされたクエリ結果として決定され、各2つのクエリ結果の間の類似性が決定され、ランク付けされる各クエリ結果の類似性の重みは、
として決定される。式中sはクエリ結果の重みを表し、dは現在のクエリ結果を表し、Dはすでにランク付けされている1組のクエリ結果を表し、類似性(d,d´)はdとd´との間の類似性を表し、第1位にランク付けされたクエリ結果を除くクエリ結果が類似性の重みによって繰り返してランク付けされる。

本発明の実施例は、クエリ結果を多様化するための方法および装置を提供し、所与のクエリの1組のキーワードの1組の関連キーワードの組み合わせが領域オントロジにおいて決定され、これらの関連キーワードの組み合わせによって拡張されたクエリセットが構築され、それによって、信頼できないクエリログから拡張されたクエリセットが決定されることが回避され、従って多様化されたクエリ結果がより正確になる。

本発明の実施例を、方法、システム、またはコンピュータプログラム製品として具体化することができることを、当業者であれば理解されたい。従って本発明は、すべてハードウェアの実施例、すべてソフトウェアの実施例、またはソフトウェアとハードウェアとの組み合わせの実施例の形で具体化することができる。さらに、本発明は、コンピュータ使用可能プログラムコードが含まれる1つまたは複数のコンピュータ使用可能記憶媒体(ディスクメモリ、CD−ROM、光メモリなどを含むが、これに限定されるものではない)において具体化されるコンピュータプログラム製品の形で具体化することができる。

本発明について、本発明の実施例による方法、デバイス(システム)、およびコンピュータプログラム製品のフローチャート/ブロック図で説明してきた。フローチャート/ブロック図のそれぞれのフロー/ブロック、ならびにフローチャート/ブロック図のフロー/ブロックの組み合わせをコンピュータプログラム命令で具体化することができることを理解されたい。これらのコンピュータプログラム命令は、コンピュータ、または他のプログラム可能なデータ処理装置のプロセッサ上で実行される命令がフローチャートのフロー/ブロック図のブロックで指定されている機能を実行するための手段を構築できるマシンを生産するために、汎用コンピュータ、専用コンピュータ、埋込み型プロセッサ、または別のプログラム可能なデータ処理装置のプロセッサ上にロードすることができる。

これらのコンピュータプログラム命令は、コンピュータまたは他のプログラム可能なデータ処理装置に特定の方法で動作するよう指示することができるコンピュータ可読メモリに格納することもできる。これによってコンピュータ可読メモリに格納された命令が、フローチャートのフロー/ブロック図のブロックで指定されている機能を実行する命令手段を含む製品を作成できるようになる。

これらのコンピュータプログラム命令は、一連の操作ステップがコンピュータまたは他のプログラム可能なデータ処理装置上で実行され、コンピュータまたは他のプログラム可能なデバイス上で実行される命令が、フローチャートのフロー/ブロック図のブロックで指定されている機能を実行するためのステップを提供するようなコンピュータ実施プロセスを作成するために、コンピュータまたは他のプログラム可能なデータ処理装置上にロードすることもできる。

本発明の好ましい実施例について説明してきたが、基礎をなす発明の概念から恩恵を受ける当業者は、これらの実施例に追加の変更および変形を行うことができる。従って添付の特許請求の範囲は、好ましい実施例および本発明の範囲に含まれるすべての変更および変形を含むものと解釈されるものとする。

当業者は、本発明の意図および範囲から逸脱することなく、本発明に様々な変更および変形を行うことができることは明らかである。従って変更および変形が本発明およびその同等物に添付される特許請求の範囲に含まれる限り、本発明はこれらの変更および変形も含むものとする。

さらに、上記実施形態の一部又は全部は、以下の付記のようにも記載されうるが、これに限定されない。

(付記1)
クエリ結果を多様化するための方法であって、
所与のクエリの各クエリキーワードについて領域オントロジから関連キーワードを抽出することによって、関連キーワードの組み合わせセットを構築するステップと、
関連キーワードの組み合わせセットにおけるそれぞれの関連キーワードの組み合わせでサーチして、クエリ結果セットを取得するステップと、
それぞれのクエリ結果セットから対応する数のクエリ結果を抽出することによって、最終的なクエリ結果セットを構築するステップと、
構築された最終的なクエリ結果セットをランク付けして、多様化されたクエリ結果を取得するステップと
を含むことを特徴とするクエリ結果を多様化するための方法。

(付記2)
所与のクエリの各クエリキーワードについて領域オントロジから関連キーワードを抽出することによって、関連キーワードの組み合わせセットを構築する前記ステップが、
所与のクエリのクエリキーワード毎に、前記領域オントロジからキーワードの関連キーワードを抽出するステップと、
前記関連キーワードに基づいて、関連キーワードの組み合わせセットを構築するステップを含む
ことを特徴とする付記1に記載のクエリ結果を多様化するための方法。

(付記3)
前記関連キーワードに基づいて、関連キーワードの組み合わせセットを構築する前記ステップが、
関連キーワードの組み合わせセットを、S(Q)={(c,c,…,c)|c∈C&&c∈C&&…c∈C}として構築する
ここでCは、所与のクエリにおけるm個のキーワードの中のi番目のキーワードの関連キーワードセットである
ことを特徴とする付記2に記載のクエリ結果を多様化するための方法。

(付記4)
各クエリキーワードについて領域オントロジから関連キーワードを抽出することによって、関連キーワードの組み合わせセットを構築した後に、
関連キーワードの組み合わせセットにおける関連キーワードの組み合わせ毎に、組み合わせ内のすべてのキーワードを連結する最小サブグラフを領域オントロジから抽出するステップを含み、
関連キーワードの組み合わせセットにおけるそれぞれの関連キーワードの組み合わせでサーチして、クエリ結果セットを取得する前記ステップは、
最小サブグラフ毎に、最小サブグラフにおけるキーワードおよび他のノードから成るサブクエリを決定するステップと、
各サブクエリにおけるキーワードおよび他のノードでサーチして、最小サブグラフの数と同じ数のサブクエリ結果セットを取得するステップと、
クエリ結果セットをそれぞれのサブクエリ結果セットから成るセットとして決定するステップとを含み、
前記最小サブグラフは、領域オントロジにおけるそれぞれのキーワードを連結するサブグラフの中の最小数のエッジを有し、最も近い方法ですべての関連キーワードを連結するサブグラフである
ことを特徴とする付記1に記載のクエリ結果を多様化するための方法。

(付記5)
それぞれのクエリ結果セットから対応する数のクエリ結果を抽出することにより、最終的なクエリ結果セットを構築する前記ステップが、
所与のクエリに対する各サブクエリの関連性に従って、各サブクエリ結果セットから対応する数のクエリ結果を抽出するステップと、
各サブクエリ結果セットから取得したクエリ結果を結合するステップとを含む
ことを特徴とする付記4に記載のクエリ結果を多様化するための方法。

(付記6)
所与のクエリに対する各サブクエリの関連性に従って、各サブクエリ結果セットから対応する数のクエリ結果を抽出する前記ステップが、
各最小サブグラフのサブグラフ重みを
mはクエリキーワードの数を表し、riはクエリキーワードに対するクエリキーワードについて領域オントロジから抽出された関連キーワードのマッチ値を表し、|E|はサブグラフにおけるエッジの数を表す
として決定するステップと、
最小サブグラフのサブグラフ重みに従って、各最小サブグラフに対応するサブクエリ結果セットから対応する数のクエリ結果を抽出するステップとを含む
ことを特徴とする付記5に記載のクエリ結果を多様化するための方法。

(付記7)
最小サブグラフのサブグラフ重みに従って、各最小サブグラフに対応するサブクエリ結果セットから対応する数のクエリ結果を抽出する前記ステップにおいて、
最小サブグラフに対応するサブクエリ結果セットから抽出されたクエリ結果は、最小サブグラフに最も関連する上位k*a個のクエリ結果であり、ここで、aはすべての最小サブグラフのサブグラフ重みの合計に対する現在の最小サブグラフのサブグラフ重みの比率を表し、kは最終的なクエリ結果セットのスケールを表すあらかじめ定められた値であり、k*aはkとaとの積未満の最大の整数を表す
ことを特徴とする付記5に記載のクエリ結果を多様化するための方法。

(付記8)
構築された最終的なクエリ結果セットをランク付けして、多様化されたクエリ結果を取得する前記ステップが、
最終的なクエリ結果セットにおけるクエリ結果毎に、対応する最小サブグラフに対するクエリ結果の関連度の値を決定するステップと、
最終的なクエリ結果セットにおけるクエリ結果毎に、対応する最小サブグラフに対するクエリ結果の関連度の値、および最小サブグラフのサブグラフ重みに従ってクエリ結果の重みを決定するステップと、
クエリ結果の重みによって最終的なクエリ結果セットにおけるクエリ結果をランク付けして、多様化されたクエリ結果を取得するステップとを含む
ことを特徴とする付記4に記載のクエリ結果を多様化するための方法。

(付記9)
最終的なクエリ結果セットにおけるクエリ結果毎に、対応する最小サブグラフに対するクエリ結果の関連度の値、および最小サブグラフのサブグラフ重みに従ってクエリ結果の重みを決定する前記ステップが、
クエリ結果の重みを、対応する最小サブグラフに対するクエリ結果の関連度の値と最小サブグラフのサブグラフ重みとの積として決定する
ことを特徴とする付記8に記載のクエリ結果を多様化するための方法。

(付記10)
構築された最終的なクエリ結果セットをランク付けして、多様化されたクエリ結果を取得する前記ステップが、
クエリ結果を、クエリ結果の重みに従って直接ランク付けするか、あるいは
最も高い重みを有するクエリ結果を、第1位にランク付けされたクエリ結果として決定し、各2つのクエリ結果の間の類似性を決定し、ランク付けされる各クエリ結果の類似性の重みを、
ここで、sはクエリ結果の重みを表し、dは現在のクエリ結果を表し、Dはすでにランク付けされている1組のクエリ結果を表し、類似性(d,d´)はdとd´との間の類似性を表す
として決定し、第1位にランク付けされたクエリ結果を除くクエリ結果を類似性の重みによって繰り返してランク付けする
ことを特徴とする付記8に記載のクエリ結果を多様化するための方法。

(付記11)
クエリ結果を多様化するための装置であって、
それぞれのクエリキーワードについて領域オントロジから関連キーワードを抽出することによって、関連キーワードの組み合わせセットを構築するように構成された関連キーワード組み合わせセット構築ユニットと、
関連キーワードの組み合わせセットにおけるそれぞれの関連キーワードの組み合わせでサーチして、クエリ結果セットを取得するように構成されたクエリユニットと、
それぞれのクエリ結果セットから対応する数のクエリ結果を抽出することによって、最終的なクエリ結果セットを構築するように構成された最終クエリ結果セット構築ユニットと、
構築された最終的なクエリ結果セットをランク付けして、多様化されたクエリ結果を取得するように構成されたランク付けユニットと
を備えることを特徴とするクエリ結果を多様化するための装置。

(付記12)
前記関連キーワード組み合わせセット構築ユニットが、
所与のクエリのクエリキーワード毎に、前記領域オントロジからキーワードの関連キーワードを抽出し、
前記関連キーワードに基づいて、関連キーワードの組み合わせセットを構築するように構成される
ことを特徴とする付記11に記載のクエリ結果を多様化するための装置。

(付記13)
前記関連キーワードに基づいて、関連キーワードの組み合わせセットを構築する前記関連キーワード組み合わせセット構築ユニットが、
関連キーワードの組み合わせセットを、S(Q)={(c,c,…,c)|c∈C&&c∈C&&…c∈C}として構築するように構成され、
ここでCは、所与のクエリにおけるm個のキーワードの中のi番目のキーワードの関連キーワードセットである
ことを特徴とする付記12に記載のクエリ結果を多様化するための装置。

(付記14)
前記関連キーワード組み合わせセット構築ユニットが、
各クエリキーワードについて領域オントロジから関連キーワードを抽出することによって、関連キーワードの組み合わせセットを構築した後に、
関連キーワードの組み合わせセットにおける関連キーワードの組み合わせ毎に、組み合わせ内のすべてのキーワードを連結する最小サブグラフを領域オントロジから抽出するように構成され、
前記クエリユニットが、
最小サブグラフ毎に、最小サブグラフにおけるキーワードおよび他のノードから成るサブクエリを決定し、
各サブクエリにおけるキーワードおよび他のノードでサーチして、最小サブグラフの数と同じ数のサブクエリ結果セットを取得し、
クエリ結果セットをそれぞれのサブクエリ結果セットから成るセットとして決定するように構成され、
前記最小サブグラフは、領域オントロジにおけるそれぞれのキーワードを連結するサブグラフの中の最小数のエッジを有し、最も近い方法ですべての関連キーワードを連結するサブグラフである
ことを特徴とする付記11に記載のクエリ結果を多様化するための装置。

(付記15)
前記最終クエリ結果セット構築ユニットが、
所与のクエリに対する各サブクエリの関連性に従って、各サブクエリ結果セットから対応する数のクエリ結果を抽出し、
各サブクエリ結果セットから取得したクエリ結果を結合するように構成される
ことを特徴とする付記14に記載のクエリ結果を多様化するための装置。

(付記16)
前記最終クエリ結果セット構築ユニットが、
各最小サブグラフのサブグラフ重みを
mはクエリキーワードの数を表し、riはクエリキーワードに対するクエリキーワードについて領域オントロジから抽出された関連キーワードのマッチ値を表し、|E|はサブグラフにおけるエッジの数を表す
として決定し、
最小サブグラフのサブグラフ重みに従って、各最小サブグラフに対応するサブクエリ結果セットから対応する数のクエリ結果を抽出し、
各サブクエリ結果セットから取得したクエリ結果を結合するように構成される
ことを特徴とする付記15に記載のクエリ結果を多様化するための装置。

(付記17)
最小サブグラフのサブグラフ重みに従って、各最小サブグラフに対応するサブクエリ結果セットから対応する数のクエリ結果を抽出する前記最終クエリ結果セット構築ユニットにおいて、
最小サブグラフに対応するサブクエリ結果セットから抽出されたクエリ結果は、最小サブグラフに最も関連する上位k*a個のクエリ結果であり、ここで、aはすべての最小サブグラフのサブグラフ重みの合計に対する現在の最小サブグラフのサブグラフ重みの比率を表し、kは最終的なクエリ結果セットのスケールを表すあらかじめ定められた値であり、k*aはkとaとの積未満の最大の整数を表す
ことを特徴とする付記16に記載のクエリ結果を多様化するための装置。

(付記18)
前記ランク付けユニットが、
最終的なクエリ結果セットにおけるクエリ結果毎に、対応する最小サブグラフに対するクエリ結果の関連度の値を決定し、
最終的なクエリ結果セットにおけるクエリ結果毎に、対応する最小サブグラフに対するクエリ結果の関連度の値、および最小サブグラフのサブグラフ重みに従ってクエリ結果の重みを決定し、
クエリ結果の重みによって最終的なクエリ結果セットにおけるクエリ結果をランク付けして、多様化されたクエリ結果を取得するように構成される
ことを特徴とする付記14に記載のクエリ結果を多様化するための装置。

(付記19)
最終的なクエリ結果セットにおけるクエリ結果毎に、対応する最小サブグラフに対するクエリ結果の関連度の値、および最小サブグラフのサブグラフ重みに従ってクエリ結果の重みを決定する前記ランク付けユニットが、
クエリ結果の重みを、対応する最小サブグラフに対するクエリ結果の関連度の値と最小サブグラフのサブグラフ重みとの積として決定するように構成される
ことを特徴とする付記18に記載のクエリ結果を多様化するための装置。

(付記20)
クエリ結果の重みによって最終的なクエリ結果セットにおけるクエリ結果をランク付けする前記ランク付けユニットが、
クエリ結果を、クエリ結果の重みに従って直接ランク付けするか、あるいは
最も高い重みを有するクエリ結果を、第1位にランク付けされたクエリ結果として決定し、各2つのクエリ結果の間の類似性を決定し、ランク付けされる各クエリ結果の類似性の重みを、
ここで、sはクエリ結果の重みを表し、dは現在のクエリ結果を表し、Dはすでにランク付けされている1組のクエリ結果を表し、類似性(d,d´)はdとd´との間の類似性を表す
として決定し、第1位にランク付けされたクエリ結果を除くクエリ結果を類似性の重みによって繰り返してランク付けするように構成される
ことを特徴とする付記18に記載のクエリ結果を多様化するための装置。

201:クエリユニット
202:クエリログメモリユニット
203:クエリ曖昧性除去ユニット
204:サブクエリメモリユニット
205:文書メモリユニット
206:キーワードサーチユニット
207:サブクエリ結果メモリユニット
208:クエリ結果結合ユニット
209:クエリ結果メモリユニット
210:クエリ結果ランク付けユニット
211:多様化済みランクリストメモリユニット
901:関連キーワード組み合わせセット構築ユニット
902:クエリユニット
903:最終クエリ結果セット構築ユニット
904:ランク付けユニット

Claims (9)

  1. クエリ結果を多様化するための方法であって、
    コンピュータが、所与のクエリの各クエリキーワードについて領域オントロジから関連キーワードを抽出することによって、関連キーワードの組み合わせセットを構築するステップと、
    前記コンピュータが、関連キーワードの組み合わせセットにおけるそれぞれの関連キーワードの組み合わせでサーチして、クエリ結果セットを取得するステップと、
    前記コンピュータが、それぞれのクエリ結果セットから対応する数のクエリ結果を抽出することによって、最終的なクエリ結果セットを構築するステップと、
    前記コンピュータが、構築された最終的なクエリ結果セットをランク付けして、多様化されたクエリ結果を取得するステップと
    前記コンピュータが、各クエリキーワードについて領域オントロジから関連キーワードを抽出することによって、関連キーワードの組み合わせセットを構築した後に、
    関連キーワードの組み合わせセットにおける関連キーワードの組み合わせ毎に、組み合わせ内のすべてのキーワードを連結する最小サブグラフを領域オントロジから抽出するステップと、
    を備え、
    関連キーワードの組み合わせセットにおけるそれぞれの関連キーワードの組み合わせでサーチして、クエリ結果セットを取得する前記ステップは、
    最小サブグラフ毎に、最小サブグラフにおけるキーワードおよび他のノードから成るサブクエリを決定するステップと、
    各サブクエリにおけるキーワードおよび他のノードでサーチして、最小サブグラフの数と同じ数のサブクエリ結果セットを取得するステップと、
    クエリ結果セットをそれぞれのサブクエリ結果セットから成るセットとして決定するステップとを含み、
    前記最小サブグラフは、領域オントロジにおけるそれぞれのキーワードを連結するサブグラフの中の最小数のエッジを有し、最も近い方法ですべての関連キーワードを連結するサブグラフである、
    とを特徴とするクエリ結果を多様化するための方法。
  2. 所与のクエリの各クエリキーワードについて領域オントロジから関連キーワードを抽出することによって、関連キーワードの組み合わせセットを構築する前記ステップが、
    所与のクエリのクエリキーワード毎に、前記領域オントロジからキーワードの関連キーワードを抽出するステップと、
    前記関連キーワードに基づいて、関連キーワードの組み合わせセットを構築するステップを含む
    ことを特徴とする請求項1に記載のクエリ結果を多様化するための方法。
  3. 前記関連キーワードに基づいて、関連キーワードの組み合わせセットを構築する前記ステップが、
    関連キーワードの組み合わせセットを、S(Q)={(c,c,…,c)|c∈C&&c∈C&&…c∈C}として構築する
    ここでCは、所与のクエリにおけるm個のキーワードの中のi番目のキーワードの関連キーワードセットである
    ことを特徴とする請求項2に記載のクエリ結果を多様化するための方法。
  4. それぞれのクエリ結果セットから対応する数のクエリ結果を抽出することにより、最終的なクエリ結果セットを構築する前記ステップが、
    所与のクエリに対する各サブクエリの関連性に従って、各サブクエリ結果セットから対応する数のクエリ結果を抽出するステップと、
    各サブクエリ結果セットから取得したクエリ結果を結合するステップとを含む
    ことを特徴とする請求項に記載のクエリ結果を多様化するための方法。
  5. 所与のクエリに対する各サブクエリの関連性に従って、各サブクエリ結果セットから対応する数のクエリ結果を抽出する前記ステップが、
    各最小サブグラフのサブグラフ重みを
    mはクエリキーワードの数を表し、riはクエリキーワードに対するクエリキーワードについて領域オントロジから抽出された関連キーワードのマッチ値を表し、|E|はサブグラフにおけるエッジの数を表す
    として決定するステップと、
    最小サブグラフのサブグラフ重みに従って、各最小サブグラフに対応するサブクエリ結
    果セットから対応する数のクエリ結果を抽出するステップとを含む
    ことを特徴とする請求項に記載のクエリ結果を多様化するための方法。
  6. 最小サブグラフのサブグラフ重みに従って、各最小サブグラフに対応するサブクエリ結果セットから対応する数のクエリ結果を抽出する前記ステップにおいて、
    最小サブグラフに対応するサブクエリ結果セットから抽出されたクエリ結果は、最小サブグラフに最も関連する上位k*a個のクエリ結果であり、ここで、aはすべての最小サブグラフのサブグラフ重みの合計に対する現在の最小サブグラフのサブグラフ重みの比率を表し、kは最終的なクエリ結果セットのスケールを表すあらかじめ定められた値であり、k*aはkとaとの積未満の最大の整数を表す
    ことを特徴とする請求項に記載のクエリ結果を多様化するための方法。
  7. 構築された最終的なクエリ結果セットをランク付けして、多様化されたクエリ結果を取得する前記ステップが、
    最終的なクエリ結果セットにおけるクエリ結果毎に、対応する最小サブグラフに対するクエリ結果の関連度の値を決定するステップと、
    最終的なクエリ結果セットにおけるクエリ結果毎に、対応する最小サブグラフに対するクエリ結果の関連度の値、および最小サブグラフのサブグラフ重みに従ってクエリ結果の重みを決定するステップと、
    クエリ結果の重みによって最終的なクエリ結果セットにおけるクエリ結果をランク付けして、多様化されたクエリ結果を取得するステップとを含む
    ことを特徴とする請求項に記載のクエリ結果を多様化するための方法。
  8. 最終的なクエリ結果セットにおけるクエリ結果毎に、対応する最小サブグラフに対する
    クエリ結果の関連度の値、および最小サブグラフのサブグラフ重みに従ってクエリ結果の
    重みを決定する前記ステップが、
    クエリ結果の重みを、対応する最小サブグラフに対するクエリ結果の関連度の値と最小
    サブグラフのサブグラフ重みとの積として決定する
    ことを特徴とする請求項に記載のクエリ結果を多様化するための方法。
  9. クエリ結果を多様化するための装置であって、
    それぞれのクエリキーワードについて領域オントロジから関連キーワードを抽出することによって、関連キーワードの組み合わせセットを構築するように構成された関連キーワード組み合わせセット構築ユニットと、
    関連キーワードの組み合わせセットにおけるそれぞれの関連キーワードの組み合わせでサーチして、クエリ結果セットを取得するように構成されたクエリユニットと、
    それぞれのクエリ結果セットから対応する数のクエリ結果を抽出することによって、最終的なクエリ結果セットを構築するように構成された最終クエリ結果セット構築ユニットと、
    構築された最終的なクエリ結果セットをランク付けして、多様化されたクエリ結果を取得するように構成されたランク付けユニットと
    各クエリキーワードについて領域オントロジから関連キーワードを抽出することによって、関連キーワードの組み合わせセットを構築した後に、関連キーワードの組み合わせセットにおける関連キーワードの組み合わせ毎に、組み合わせ内のすべてのキーワードを連結する最小サブグラフを領域オントロジから抽出する抽出ユニットと、
    を備え
    前記クエリユニットは、
    最小サブグラフ毎に、最小サブグラフにおけるキーワードおよび他のノードから成るサブクエリを決定し、
    各サブクエリにおけるキーワードおよび他のノードでサーチして、最小サブグラフの数と同じ数のサブクエリ結果セットを取得し、
    クエリ結果セットをそれぞれのサブクエリ結果セットから成るセットとして決定し、
    前記最小サブグラフは、領域オントロジにおけるそれぞれのキーワードを連結するサブグラフの中の最小数のエッジを有し、最も近い方法ですべての関連キーワードを連結するサブグラフである、
    とを特徴とするクエリ結果を多様化するための装置。
JP2012276584A 2012-03-23 2012-12-19 クエリ結果を多様化するための方法および装置 Active JP5486667B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201210080590.4 2012-03-23
CN 201210080590 CN103324644B (zh) 2012-03-23 2012-03-23 一种查询结果多样化方法及装置

Publications (2)

Publication Number Publication Date
JP2013200862A true JP2013200862A (ja) 2013-10-03
JP5486667B2 true JP5486667B2 (ja) 2014-05-07

Family

ID=49193391

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012276584A Active JP5486667B2 (ja) 2012-03-23 2012-12-19 クエリ結果を多様化するための方法および装置

Country Status (2)

Country Link
JP (1) JP5486667B2 (ja)
CN (1) CN103324644B (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105653661A (zh) * 2015-12-29 2016-06-08 云南电网有限责任公司电力科学研究院 一种检索结果重排方法及装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003108597A (ja) * 2001-09-27 2003-04-11 Toshiba Corp 情報検索システム、情報検索方法及び情報検索プログラム
US9817902B2 (en) * 2006-10-27 2017-11-14 Netseer Acquisition, Inc. Methods and apparatus for matching relevant content to user intention
WO2010001455A1 (ja) * 2008-06-30 2010-01-07 富士通株式会社 検索装置及び方法
CN100573531C (zh) * 2008-07-04 2009-12-23 华中科技大学 一种基于关联分析的文献检索方法
JP5116593B2 (ja) * 2008-07-25 2013-01-09 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Maschines Corporation 公開された検索エンジンを用いた検索装置、検索方法及び検索プログラム
CN101751422A (zh) * 2008-12-08 2010-06-23 北京摩软科技有限公司 一种移动终端智能搜索的方法、移动终端和服务器
KR101048546B1 (ko) * 2009-03-05 2011-07-11 엔에이치엔(주) 온톨로지를 이용한 컨텐츠 검색 시스템 및 방법
JP5210970B2 (ja) * 2009-05-28 2013-06-12 日本電信電話株式会社 共通クエリグラフパターン生成方法、共通クエリグラフパターン生成装置及び共通クエリグラフパターン生成プログラム
CN101840438B (zh) * 2010-05-25 2012-03-28 刘宏 面向源文献元关键词的检索系统
CN102081668B (zh) * 2011-01-24 2012-07-25 徐建良 基于领域本体的信息检索优化方法

Also Published As

Publication number Publication date Type
JP2013200862A (ja) 2013-10-03 application
CN103324644A (zh) 2013-09-25 application
CN103324644B (zh) 2016-05-11 grant

Similar Documents

Publication Publication Date Title
Cao et al. Context-aware query classification
US7818315B2 (en) Re-ranking search results based on query log
US20140344230A1 (en) Methods and systems for node and link identification
US20120278341A1 (en) Document analysis and association system and method
Platzer et al. Web service clustering using multidimensional angles as proximity measures
Chen et al. Collabseer: a search engine for collaboration discovery
US20130226846A1 (en) System and Method for Universal Translating From Natural Language Questions to Structured Queries
US20080040342A1 (en) Data processing apparatus and methods
Song et al. Overview of the NTCIR-9 INTENT Task.
CN101847161A (zh) 搜索网页的方法和建立数据库的方法
US20080215565A1 (en) Searching heterogeneous interrelated entities
Giunchiglia et al. A large dataset for the evaluation of ontology matching
Curtiss et al. Unicorn: A system for searching the social graph
US20110251984A1 (en) Web-scale entity relationship extraction
Ollivier et al. Finding related pages using Green measures: An illustration with Wikipedia
US8761512B1 (en) Query by image
Halpin et al. Evaluating ad-hoc object retrieval.
Zanghi et al. Clustering based on random graph model embedding vertex features
JP2009238007A (ja) 情報検索装置及びプログラム
JP2001188802A (ja) 情報検索装置及び情報検索方法
US20110196851A1 (en) Generating and presenting lateral concepts
KR20110019131A (ko) 소셜 관계를 이용한 정보 검색 장치 및 방법
Mayr et al. Reducing semantic complexity in distributed digital libraries: Treatment of term vagueness and document re-ranking
Hassan Awadallah et al. Supporting complex search tasks
Damljanovic et al. Linked data-based concept recommendation: Comparison of different methods in open innovation scenario

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130918

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20131106

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131204

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140128

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140221

R150 Certificate of patent or registration of utility model

Ref document number: 5486667

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250