JP6534454B2 - 情報検索方法及び情報検索装置並びに情報検索システム - Google Patents
情報検索方法及び情報検索装置並びに情報検索システム Download PDFInfo
- Publication number
- JP6534454B2 JP6534454B2 JP2017565011A JP2017565011A JP6534454B2 JP 6534454 B2 JP6534454 B2 JP 6534454B2 JP 2017565011 A JP2017565011 A JP 2017565011A JP 2017565011 A JP2017565011 A JP 2017565011A JP 6534454 B2 JP6534454 B2 JP 6534454B2
- Authority
- JP
- Japan
- Prior art keywords
- search
- keyword
- unit
- search keyword
- document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9538—Presentation of query results
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
文書等の検索処理において有用な情報を効率的に得る技術として、例えば、特許文献1または特許文献2に記載される技術が知られている。
特許文献1には、ウェブ検索装置であって、検索キーワード毎の重要度を、その出現順に応じて決定し、予め設定されたウェブページに対する操作(アクション)内容に対応する加算ポイントを乗算し、評価点の高い順にリスト化し、当該検索結果のリストをネットワーク経由にて利用者端末へ送信する構成が開示されている。
また、特許文献2には、検索クエリを介して入力される検索キーワード群に対し、予め各検索キーワードに重要度を割り当て、上記各検索キーワードが検索結果の文書中の単語に対する類似度に基づき寄与度を設定し、検索結果と共に当該寄与度を画面上に表示する構成が開示されている。
また、特許文献2では、寄与度の設定はシステム側にて自動設定されものであり、また、検索結果表示後の寄与度の修正はユーザにより実行可能であるものの、「この検索キーワードがあったことで、この文書は検索された。仮に、この検索キーワードが無ければ、他の検索キーワードによってこの文書が検索されることは無かった」というような、検索キーワードの有無が検索結果に与える影響を、検索実施者(ユーザ)が直接的に認識することができない。
そこで、本発明は、検索実施者(ユーザ)より入力された検索キーワードの有無が検索結果に及ぼす影響度を、検索実施者(ユーザ)に容易に把握可能とし得る情報検索方法及び情報検索装置並びに情報検索システムを提供する。
また、本発明の情報検索方法は、少なくとも、入力部と、検索実行部と、検索キーワード影響度演算部と、表示部と、を有する情報検索装置の情報検索方法であって、前記入力部より複数の検索キーワードの入力を受け付けるキーワード入力受付工程と、前記検索実行部が、文書データ及び/又は画像データを含む複数のドキュメントを格納する文書データベースから、前記受け付けられた複数の検索キーワードに基づき検索結果として複数のドキュメントを抽出する検索工程と、前記検索キーワード影響度演算部が、前記受け付けられた検索キーワードの有無が前記検索結果に及ぼす影響度を、検索キーワード毎に求める検索キーワード影響度演算工程と、前記検索結果と共に前記検索キーワード毎の影響度を表示部の画面上に表示する表示工程と、を有し、前記検索工程は、前記検索実行部が、前記複数の検索キーワードのうち、特定の検索キーワードを除いた他の複数の検索キーワードに基づき検索結果として複数のドキュメントを抽出し、前記検索キーワード影響度演算工程は、前記検索キーワード影響度演算部が、前記特定の検索キーワードを除いた他の複数の検索キーワードに基づく検索結果に含まれる複数のドキュメントと、前記受け付けられた複数の検索キーワードに基づく検索結果に含まれる複数のドキュメントとの差分により、前記特定の検索キーワードの有無が検索結果に及ぼす影響度を求めることを特徴とする。
また、本発明の情報検索システムは、複数のユーザ端末装置とネットワークを介して接続される情報検索装置を有する情報検索システムであって、前記情報検索装置は、前記ネットワークを介して前記ユーザ端末装置より入力される複数の検索キーワードを受け付けるキーワード入力受付部と、文書データ及び/又は画像データを含む複数のドキュメントを格納する文書データベースから、前記受け付けられた複数の検索キーワードに基づき検索結果として複数のドキュメントを抽出する検索実行部と、前記受け付けられた検索キーワードの有無が前記検索結果に及ぼす影響度を、検索キーワード毎に求める検索キーワード影響度演算部と、を備え、前記検索結果と共に前記検索キーワード毎の影響度を、前記ネットワークを介して前記ユーザ端末装置へ送信し、前記検索実行部は、前記複数の検索キーワードのうち、特定の検索キーワードを除いた他の複数の検索キーワードに基づき検索結果として複数のドキュメントを抽出し、検索キーワード影響度演算部は、前記特定の検索キーワードを除いた他の複数の検索キーワードに基づく検索結果に含まれる複数のドキュメントと、前記受け付けられた複数の検索キーワードに基づく検索結果に含まれる複数のドキュメントとの差分により、前記特定の検索キーワードの有無が検索結果に及ぼす影響度を求めることを特徴とする。
上記した以外の課題、構成及び効果は、以下の実施形態の説明により明らかにされる。
また、本明明細書において、上記各種データを含む「情報」を、「ドキュメント」と総称する場合もある。
以下、図面を用いて本発明の実施例について説明する。
先ず、検索実施者(ユーザ)により、入力部3を介して複数の検索キーワード{k(1),k(2),・・・,k(n)}(n:自然数)が入力されると、情報検索部2を構成する検索キーワード入力受付部21が、検索キーワードK={k(1),k(2),・・・,k(n)}を受け付ける(ステップS101)。
ステップS103では、検索実行部22は、検索エンジンのランキングに基づき、検索結果R0の各ドキュメント、すなわち、上述のr(1),r(2),・・・,r(m)にランキングに応じた点数を設定する。これにより、検索結果R0の各ドキュメントに設定された点数は、P={p(1),p(2),・・・,p(m)}となる。なお、点数設定の方法については後述する。
ここで、例えば、n>2であれば、ステップS108では、検索キーワード影響度演算部23は、iがnに達していないと判定しステップS105へ戻る。ステップS105では、検索実行部22は、ステップS101にて最初に受け付けられた(入力された)複数の検索キーワード群{k(1),k(2),・・・,k(n)}から、特定の検索キーワード、ここでは、i=2が設定されていることから、k(2)を除いた検索キーワード群{k(1),k(3),・・・,k(n)}で再度検索を実行し、その検索結果R2得る。ステップS106では、検索キーワード影響度演算部23は、検索実施者(ユーザ)が入力した全ての検索キーワードK(検索キーワード群{k(1),k(2),・・・,k(n)})を用いて検索した検索結果R0(ステップS102)と、特定の検索キーワードk(2)を除いて検索した検索結果R2(ステップS105)との差分のドキュメントを抽出し、それにステップS102にて設定された対応する点数p(j)を積算し、除外した検索キーワードk(2)の影響度E2を算出する。
先ず、ステップS201では、検索実施者(ユーザ)により、入力部3を介してn個の検索キーワードW[1]、W[2]、W[3]、・・・、W[n](検索キーワードセット)が入力されると、情報検索部2を構成する検索キーワード入力受付部21(図1)が、検索キーワードセットKeywordSetAllを受け付ける。
なお、検索実行部22は、上述の既知の検索エンジンを用いた検索方法を実行すると共に、既知の手法により検索結果のランキングを得るものとする。また、ステップS202では、ResultSetAllとして検索結果の全てを取得することに代えて、検索結果のうち、ランキングが上位のm個を取得する構成としても良い。
KeywordSetAll={W[1]、W[2]、W[3]、・・・、W[n]}
ResultSetAll={R[1]、R[2]、R[3]、・・・、R[m]}
ScoreSet={S[1]、S[2]、S[3]、・・・、S[m]}、
ST=Σ(S[i]:i=1〜m)
続いて、検索実行部22は、初期値としてi=1を設定し(ステップS204)、検索キーワードセットKeywordSetAllから検索キーワードW(i)を除いた検索キーワード群としてKeywordSet[i]を定義する(ステップS205)。ここではでi=1が設定されていることから、検索キーワード群としてKeywordSet[1]が得られる。
ステップS206では、検索実行部22は、内部バス27を介して文書データベース25へアクセスし、ステップS205にて得られた検索キーワード群KeywordSet[i]を用いて、文書データベース25を再検索し、検索結果セットResultSet[i]を取得する。なお、ここではi=1が設定されていることから、検索キーワード群KeywordSet[1]を用いて検索結果セットResultSet[1]が得られる。
ステップS209では、検索キーワード影響度演算部23は、検索結果セットResultSetAllであるR[j]に含まれるドキュメントうち、ステップS206にて得られた検索キーワード群KeywordSet[i]による検索結果セットResultSet[i]に含まれるドキュメントに一致するものがあるか否かを判定する。すなわち、ResultSetAllであるR[j]に含まれResultSet[i]に含まれないドキュメントがある場合には、ステップS210へ進み、当該ドキュメントに対しその点数S[j](上述のステップS203で設定されたドキュメント毎の点数)を積算し、ステップS211へ進む。一方、ResultSetAllであるR[j]に含まれResultSet[i]に含まれないドキュメントが存在しない場合には、ステップS211へ進む。
ステップS215では、検索キーワード影響度演算部23は、検索キーワードW[i]の影響度Eiとして、Sum[i]/STを算出し、内部バス27を介して検索結果表示制御部24へ転送する。ここで、STは上述の通り、ST=Σ(S[i]:i=1〜m)である。検索結果表示制御部24は、検索キーワードW[i]と共に検索キーワードW[i]の影響度Ei(i=1,2,・・・,n)であるSum[i]/STを、表示部4の画面上に表示する。
特に、図示しないが、検索キーワード影響度演算部23は、ステップS215にて、内部バス27を介して記憶部26へアクセスし、検索キーワードW[i]、検索キーワードW[i]の影響度EiであるSum[i]/ST及び検索結果のドキュメントを、図2に示したように、「キーワード」、「影響度」及び「影響を受けた項目(ドキュメント)」の各欄に格納する。
そして、検索キーワード影響度演算部23により上述のステップS215にて得られた、Keyword−1の影響度E1であるSum[1]/STが40%、Keyword−2の影響度E2であるSum[2]/STが30%、Keyword−3の影響度E3であるSum[3]/STが70%、及びKeyword−4の影響度E4であるSum[4]/STが5%である。図5に示す表示状態において、検索実施者(ユーザ)がマウス等の入力部3を用いてカーソルを、検索キーワード表示領域44中のKeyword−1上に位置付けクリックすると、検索キーワードKeyword−1により影響を受けた項目(ドキュメント)がハイライト表示される。すなわち、第3表示領域43中の、「Document Title2 bbbbbb.xls」及び「Document Title5 eeeeee.txt」の2つのドキュメントが、他のドキュメントと識別可能にハイライト表示46される。ここで、検索実施者(ユーザ)は、仮に、ハイライト表示46されたドキュメントである「Document Title2 bbbbbb.xls」及び「Document Title5 eeeeee.txt」のうち、少なくともいずれか一方が意図しないドキュメント、すなわち、本来、検索結果として取得すべきドキュメントと異なる場合には、検索キーワード入力欄である第1表示領域41に入力されたKeyword−1を変更する必要があることを、画面上で容易に判断することが可能となる。
以上の通り、本実施例によれば、検索実施者(ユーザ)より入力された検索キーワードの有無が検索結果に及ぼす影響度を、検索実施者(ユーザ)に容易に把握させることが可能となる。
また、本実施例によれば、検索実施者(ユーザ)が、第2表示領域42中の検索キーワード影響度表示領域45に表示される検索キーワード影響度、及び/又は、第3表示領域43にハイライト表示46等、他のドキュメントと識別可能に表示された検索結果を見て、例えば、検索結果に全く満足しなければ影響度の大きい検索キーワードを変更し、或いは、ハイライト表示46されたドキュメントが不必要であれば、そのドキュメントが検索された要因となった検索キーワードの変更等を即座に行い得る情報検索装置及び情報検索方法を実現することができる。
ステップS305では、検索実行部22は、内部バス27を介して文書データベース25へアクセスし、ステップS205にて得られた検索キーワード群KeywordSet[i]を用いて、文書データベース25を再検索し、検索結果セットResultSet[i]を取得する。なお、ここではi=1が設定されていることから、検索キーワード群KeywordSet[1]を用いて検索結果セットResultSet[1]が得られる。
ステップS308では、検索キーワード寄与度演算部29は、検索結果セットResultSetAllであるR[j]に含まれるドキュメントうち、ステップS304にて得られた検索キーワード群KeywordSet[i]による検索結果セットResultSet[i]に含まれるドキュメントに一致するものがあるか否かを判定する。すなわち、ResultSetAllであるR[j]に含まれResultSet[i]に含まれないドキュメントがある場合には、ステップS309へ進み、当該ドキュメントに対しその重み付け後の点数(WeightedScore)であるC[j](上述のステップS302で設定されたドキュメント毎の有用性に基づき重み付け後の点数)を積算し、ステップS310へ進む。一方、ResultSetAllであるR[j]に含まれResultSet[i]に含まれないドキュメントが存在しない場合には、ステップS310へ進む。
ステップS314では、検索キーワード寄与度演算部29は、検索キーワードW[i]の寄与度として、Sum[i]/STを算出し、内部バス27を介して検索結果表示制御部24へ転送する。ここで、STは上述の通り、ST=Σ(S[i]:i=1〜m)である。検索結果表示制御部24は、検索キーワードW[i]と共に検索キーワードW[i]の寄与度であるSum[i]/STを、表示部4の画面上に表示する。
特に、図示しないが、検索キーワード寄与度演算部29は、ステップS314にて、内部バス27を介して記憶部26へアクセスし、検索キーワードW[i]、検索キーワードW[i]の寄与度であるSum[i]/ST及び検索結果のドキュメントを、図7に示したように、「キーワード」、「影響度」、「寄与度」及び「影響を受けた項目(ドキュメント)」の各欄に格納する。
図9に示すように、表示画面40は、検索実施者(ユーザ)により検索キーワードが入力される検索キーワード入力欄としての第1表示領域41、検索キーワード毎に検索キーワード影響度を表示する第2表示領域42、及び入力された検索キーワードによる検索結果を表示する第3表示領域43から構成される。検索キーワード入力欄としての第1表示領域41に隣接し、「実行」ボタン47が表示画面40上に配されており、検索実施者(ユーザ)によりマウス等の入力部3を用いてカーソルが「実行」ボタン47上に位置付けられクリックされると、情報検索部2aは、実施例1と同様に、上述の図4に示したステップS201〜ステップS215の処理を実行する。第2表示領域42は、検索キーワード表示領域44及び検索キーワード影響度表示領域45から構成され、検索キーワード影響度表示領域45は、検索キーワード影響度を数値と共に棒グラフ状に表示する。なお、検索キーワード影響度表示領域45に表示される検索キーワードの影響度は、棒グラフ状に限らず、他の表示形態であっても良く、検索実施者(ユーザ)に視認可能な表示形態であればいずれの表示形態としても良い。
また、図9に示す表示画面例では、検索キーワードとして、4つのキーワード、Keyword−1、Keyword−2、Keyword−3、及びKeyword−4が、検索キーワード入力欄としての第1表示領域41に入力され、その検索結果であるResultSetAllに含まれるドキュメントが第3表示領域43にリスト表示された状態を示している。検索実施者(ユーザ)は、第3表示領域43の右端に表示されるクロールバーを下方へスクロールすることで、検索結果であるResultSetAllに含まれる全てのドキュメントを確認することができる。第3表示領域43にリスト表示されたResultSetAllに含まれる各ドキュメントの左側には、検索実施者(ユーザ)による「有用」または「不要」を選択指定可能とする有用性選択指定ボタン48を有する。検索実施者(ユーザ)は、第3表示領域43にリスト表示された検索結果であるResultSetAllに含まれる全てのドキュメントに対し、検索実施者(ユーザ)の意図に合致するものか否かを容易に判断でき、マウス等の入力部3を用いて所望のドキュメントの有用性選択指定ボタン48の「有用」または「不要」の位置にカーソルを移動させクリックすることで、有用性の評価入力を行うことができる。
また、本実施例によれば、検索キーワード寄与度演算部29により求められた寄与度が、予め格納される閾値以下である場合、当該検索キーワードが、検索キーワードセットKeywordSetAllから自動的に除外されるため、検索実施者(ユーザ)による検索結果セット内のドキュメントを確認する時間を短縮でき、作業性の向上を図ることが可能となる。
更にまた、本実施例によれば、情報検索部が学習機能を有することにより、検索実施者(ユーザ)の作業効率を向上することができる。
(カテゴリ分類法)
検索実行部22は、文書データベース25内に格納される全てのドキュメントについて、ある任意の2つのドキュメント(ドキュメントAとドキュメントB)間の距離を求める。ドキュメントA及びドキュメントB間の距離は以下に示す方法で算出する。
先ず、文書データベース25に格納されているドキュメントの有効語の個数をNとし、有効語群を(W1,W2,W3,・・・,WN)とする。
続いて、ドキュメントAに出現するW1からWNの有効語の個数をカウントし、ドキュメントAの特徴ベクトル(W1A,W2A,W3A,・・・,WNA)を生成する。
ここで例えば、W1AはドキュメントAに出現する有効語W1の個数である。
同様に、ドキュメントBに出現するW1からWNの有効語の個数をカウントし、ドキュメントBの特徴ベクトル(W1B,W2B,W3B,・・・,WNB)を生成する。
このとき、ドキュメントAとドキュメントBとの距離DABは、以下の式(1)となる。
一方、あるドキュメントについて、上述の式(1)に示すドキュメント間の距離DABが所定の閾値以下の他のドキュメントが無ければ、そのドキュメントについてはグルーピングしない。
ステップS403では、検索実行部22は、検索結果セットResultSetAllに含まれる各ドキュメントが属するカテゴリを調べ、そのカテゴリの有用性の評価に基づき点数セントの重み付けを行う。具体的には、各カテゴリに属するドキュメントに対し付される重み付け後の点数セットWeightedScoreSet ={C[1]、C[2]、C[3]、・・・、C[m]}を得る。
特に、図示しないが、検索キーワード寄与度演算部29は、ステップS314にて、内部バス27を介して記憶部26へアクセスし、検索キーワードW[i]、検索キーワードW[i]の寄与度であるSum[i]/ST及び検索結果のドキュメントを、図7に示したように、「キーワード」、「影響度」、「寄与度」及び「影響を受けた項目(ドキュメント)」の各欄に格納する。
図13に示すように、展開後の「Document Title 1」の右側には、アンダーバーが付された「類似ドキュメントを折り畳む」が表示されており、検索実施者(ユーザ)がマウス等の入力部3によりカーソルを、このアンダーバーが付された「類似ドキュメントを折り畳む」へ移動しクリックすることで、再び、図12に示す表示形態に遷移する。
続いてステップS502では、検索キーワード関連語導出部32は、内部バス27を介して関連語データベース30へアクセスし、検索キーワードセットKeywordSetAllに含まれる各キーワードに対し、検索したい情報のカテゴリにマッチした関連語を、関連語データベース30から検索し抽出する。
続いて、ステップS504では、検索キーワード編集部33は、更新された検索キーワードセットKeywordSetAllを、内部バス27を介して検索実行部22へ転送する。検索実行部22は、内部バス27を介して文書データベース25へアクセスし、更新された検索キーワードセットKeywordSetAllにより検索を再実行し、検索結果を、検索結果表示制御部24を介して表示部4へ表示する。
図17に示すように、ステップS601では、検索キーワード関連語導出部32は、内部バス27を介して文書データベース25へアクセスし、文書データベース25に格納される文書(ドキュメント)から、その中で使用されている全ての語句を抽出する。
ステップS603では、検索キーワード関連語導出部32は、更に、各語句が属するカテゴリを関連語データベースに登録する。なお、ここでのカテゴリ分類は、例えば、ある語句を検索キーワードとして検索した結果である検索結果セットに含まれる複数のドキュメントに対し、上述の実施例3にて説明した式(1)を用いてグルーピングすることにより行われる。なお、必ずしもこれに限られず、手作業にてカテゴリを登録しても良い。
これに対し「語句」が“Word−3”の「カテゴリ」は“Category−4,Category−5”であり、「語句」が“Word−4”の「カテゴリ」は“Category−5,Category−6”であり、検索実施者(ユーザ)が選択指定したカテゴリ“Category−1”、“Category−5”、及び“Category−6”とマッチしている。そこで、検索キーワード関連語導出部32は、“Word−1”の「関連語」として、“Word−3”と“Word−4”を選択する。
これら、通信I/F34、検索実行部22、検索キーワード影響度演算部23、記憶部26、及び文書データベース25は、内部バス27にて相互にアクセス可能に接続されている。
検索実行部22は、上述の実施例1にて説明したように、図4に示すステップS201〜ステップS206を実行し、検索キーワード影響度演算部23は、図4に示すステップS207〜ステップS215を実行する。検索キーワード影響度演算部23は、検索キーワードW[i]の影響度Eiとして、Sum[i]/STを算出し、内部バス27及び通信I/F34を介して、ユーザ端末装置5aへ送信する。ユーザ端末装置5aの表示画面上には、実施例1で説明した図5に示す表示内容が表示される。
Claims (12)
- 複数の検索キーワードの入力を受け付けるキーワード入力受付部と、
文書データ及び/又は画像データを含む複数のドキュメントを格納する文書データベースから、受け付けられた前記複数の検索キーワードに基づき検索結果として複数のドキュメントを抽出する検索実行部と、
前記受け付けられた検索キーワードの有無が前記検索結果に及ぼす影響度を、検索キーワード毎に求める検索キーワード影響度演算部と、
前記検索結果と共に前記検索キーワード毎の影響度を画面上に表示する表示部と、
を備え、
前記検索実行部は、前記複数の検索キーワードのうち、特定の検索キーワードを除いた他の複数の検索キーワードに基づき検索結果として複数のドキュメントを抽出し、
前記検索キーワード影響度演算部は、前記特定の検索キーワードを除いた他の複数の検索キーワードに基づく検索結果に含まれる複数のドキュメントと、前記受け付けられた複数の検索キーワードに基づく検索結果に含まれる複数のドキュメントとの差分により、前記特定の検索キーワードの有無が検索結果に及ぼす影響度を求めることを特徴とする情報検索装置。 - 請求項1に記載の情報検索装置において、
前記表示部に表示される検索結果に含まれる複数のドキュメントに対する有用性の入力を受け付ける検索結果有効性入力受付部と、
受け付けられた各ドキュメントに対する有用性に基づき、前記各ドキュメントに付す点数を設定し、前記点数に基づき各検索キーワードの前記検索結果に対する寄与度を求める検索キーワード寄与度演算部と、を備え、
前記検索結果及び前記影響度と共に各検索キーワードの前記検索結果に対する寄与度を、前記表示部の画面上に表示することを特徴とする情報検索装置。 - 請求項2に記載の情報検索装置において、
前記検索実行部は、前記検索結果に含まれる複数のドキュメントを、各ドキュメント間の類似度に基づきカテゴリ分類し、
前記検索結果有効性入力受付部は、前記表示部に表示される各カテゴリに対する有用性の入力を受け付けることを特徴とする情報検索装置。 - 請求項3に記載の情報検索装置において、
前記表示部の表示画面は、
前記複数の検索キーワードが入力される第1表示領域と、
検索キーワード毎に、前記影響度又は寄与度を表示する第2表示領域と、
前記検索結果に含まれる複数のドキュメントを表示する第3表示領域と、を備えることを特徴とする情報検索装置。 - 請求項4に記載の情報検索装置において、
予め検索キーワード毎に、前記文書データベースを検索した検索結果のドキュメント中に頻出する語句を関連語として、カテゴリに対応付けて格納する関連語データベースと、
検索したい情報のカテゴリを受け付ける関連語カテゴリ入力受付部と、
前記関連語データベースにアクセスし、前記検索したい情報のカテゴリにマッチする関連語を抽出する検索キーワード関連語導出部と、
前記検索キーワード関連語導出部により抽出された関連語を前記表示部に表示し、当該表示された関連語に対する指定入力に応じて、前記第1表示領域に表示される検索キーワードを編集する検索キーワード編集部と、を備えることを特徴とする情報検索装置。 - 少なくとも、入力部と、検索実行部と、検索キーワード影響度演算部と、表示部と、を有する情報検索装置の情報検索方法であって、
前記入力部より複数の検索キーワードの入力を受け付けるキーワード入力受付工程と、
前記検索実行部が、文書データ及び/又は画像データを含む複数のドキュメントを格納する文書データベースから、受け付けられた前記複数の検索キーワードに基づき検索結果として複数のドキュメントを抽出する検索工程と、
前記検索キーワード影響度演算部が、前記受け付けられた検索キーワードの有無が前記検索結果に及ぼす影響度を、検索キーワード毎に求める検索キーワード影響度演算工程と、
前記検索結果と共に前記検索キーワード毎の影響度を表示部の画面上に表示する表示工程と、を有し、
前記検索工程は、前記検索実行部が、前記複数の検索キーワードのうち、特定の検索キーワードを除いた他の複数の検索キーワードに基づき検索結果として複数のドキュメントを抽出し、
前記検索キーワード影響度演算工程は、前記検索キーワード影響度演算部が、前記特定の検索キーワードを除いた他の複数の検索キーワードに基づく検索結果に含まれる複数のドキュメントと、前記受け付けられた複数の検索キーワードに基づく検索結果に含まれる複数のドキュメントとの差分により、前記特定の検索キーワードの有無が検索結果に及ぼす影響度を求めることを特徴とする情報検索方法。 - 請求項6に記載の情報検索方法において、
検索結果有効性入力受付部が、前記表示部に表示される検索結果に含まれる複数のドキュメントに対する有用性の入力を受け付ける検索結果有効性入力受付工程と、
検索キーワード寄与度演算部が、受け付けられた各ドキュメントに対する有用性に基づき、前記各ドキュメントに付す点数を設定し、前記点数に基づき各検索キーワードの前記検索結果に対する寄与度を求める検索キーワード寄与度演算工程と、を有し、
前記表示工程は、前記検索結果及び前記影響度と共に各検索キーワードの前記検索結果に対する寄与度を、前記表示部の画面上に表示することを特徴とする情報検索方法。 - 請求項7に記載の情報検索方法において、
前記検索工程は、前記検索実行部が、前記検索結果に含まれる複数のドキュメントを、各ドキュメント間の類似度に基づきカテゴリ分類し、
前記検索結果有効性入力受付工程は、前記検索結果有効性入力受付部が、前記表示部に表示される各カテゴリに対する有用性の入力を受け付けることを特徴とする情報検索方法。 - 請求項8に記載の情報検索方法において、
前記表示部の表示画面は、第1表示領域と、第2表示領域と、第3表示領域とを備え、
前記表示工程は、入力される複数の検索キーワードを前記第1表示領域に表示し、検索キーワード毎に前記影響度又は寄与度を前記第2表示領域に表示すると共に、前記検索結果に含まれる複数のドキュメントを前記第3表示領域に表示することを特徴とする情報検索方法。 - 請求項9に記載の情報検索方法において、
関連語カテゴリ入力受付部が、検索したい情報のカテゴリを受け付ける関連語カテゴリ入力受付工程と、
検索キーワード関連語導出部が、予め検索キーワード毎に、前記文書データベースを検索した検索結果のドキュメント中に頻出する語句を関連語として、カテゴリに対応付けて格納する関連語データベースにアクセスし、前記検索したい情報のカテゴリにマッチする関連語を抽出する検索キーワード関連語導出工程と、
検索キーワード編集部が、前記検索キーワード関連語導出工程により抽出された関連語を前記表示部に表示し、当該表示された関連語に対する指定入力に応じて、前記第1表示領域に表示される検索キーワードを編集する検索キーワード編集工程と、を有することを特徴とする情報検索方法。 - 複数のユーザ端末装置とネットワークを介して接続される情報検索装置を有する情報検索システムであって、
前記情報検索装置は、
前記ネットワークを介して前記ユーザ端末装置より入力される複数の検索キーワードを受け付けるキーワード入力受付部と、
文書データ及び/又は画像データを含む複数のドキュメントを格納する文書データベースから、受け付けられた前記複数の検索キーワードに基づき検索結果として複数のドキュメントを抽出する検索実行部と、
前記受け付けられた検索キーワードの有無が前記検索結果に及ぼす影響度を、検索キーワード毎に求める検索キーワード影響度演算部と、を備え、
前記検索結果と共に検索キーワード毎の影響度を、前記ネットワークを介して前記ユーザ端末装置へ送信し、
前記検索実行部は、前記複数の検索キーワードのうち、特定の検索キーワードを除いた他の複数の検索キーワードに基づき検索結果として複数のドキュメントを抽出し、
検索キーワード影響度演算部は、前記特定の検索キーワードを除いた他の複数の検索キーワードに基づく検索結果に含まれる複数のドキュメントと、前記受け付けられた複数の検索キーワードに基づく検索結果に含まれる複数のドキュメントとの差分により、前記特定の検索キーワードの有無が検索結果に及ぼす影響度を求めることを特徴とする情報検索システム。 - 請求項11に記載の情報検索システムにおいて、
前記情報検索装置は、
前記ユーザ端末装置の表示部に表示される検索結果に含まれる複数のドキュメントに対する有用性の入力を、前記ネットワークを介して受け付ける検索結果有効性入力受付部と、
受け付けられた各ドキュメントに対する有用性に基づき、前記各ドキュメントに付す点数を設定し、前記点数に基づき各検索キーワードの前記検索結果に対する寄与度を求める検索キーワード寄与度演算部と、を備え、
前記検索結果及び前記影響度と共に各検索キーワードの前記検索結果に対する寄与度を、前記ネットワークを介して前記ユーザ端末装置へ送信することを特徴とする情報検索システム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2016/053139 WO2017134760A1 (ja) | 2016-02-03 | 2016-02-03 | 情報検索方法及び情報検索装置並びに情報検索システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2017134760A1 JPWO2017134760A1 (ja) | 2018-08-02 |
JP6534454B2 true JP6534454B2 (ja) | 2019-06-26 |
Family
ID=59500740
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017565011A Active JP6534454B2 (ja) | 2016-02-03 | 2016-02-03 | 情報検索方法及び情報検索装置並びに情報検索システム |
Country Status (3)
Country | Link |
---|---|
EP (1) | EP3413210A4 (ja) |
JP (1) | JP6534454B2 (ja) |
WO (1) | WO2017134760A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113918804A (zh) * | 2020-07-08 | 2022-01-11 | 上海会麦信息科技有限公司 | 商品信息检索系统及方法 |
KR20240028020A (ko) * | 2022-08-24 | 2024-03-05 | 쿠팡 주식회사 | 주문을 처리하는 방법 및 그 장치 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3578651B2 (ja) * | 1998-12-04 | 2004-10-20 | 株式会社リコー | 文書検索システム、文書検索方法およびその方法を実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2004280661A (ja) * | 2003-03-18 | 2004-10-07 | Fujitsu Ltd | 検索方法及びプログラム |
JP5911492B2 (ja) * | 2011-08-05 | 2016-04-27 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 情報検索システム、方法、及びプログラム |
JP6248444B2 (ja) * | 2013-07-19 | 2017-12-20 | 富士通株式会社 | 情報処理プログラム、装置、及び方法 |
-
2016
- 2016-02-03 EP EP16889250.3A patent/EP3413210A4/en not_active Ceased
- 2016-02-03 JP JP2017565011A patent/JP6534454B2/ja active Active
- 2016-02-03 WO PCT/JP2016/053139 patent/WO2017134760A1/ja unknown
Also Published As
Publication number | Publication date |
---|---|
WO2017134760A1 (ja) | 2017-08-10 |
JPWO2017134760A1 (ja) | 2018-08-02 |
EP3413210A1 (en) | 2018-12-12 |
EP3413210A4 (en) | 2019-06-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CA2702651C (en) | System and method for searching for documents | |
US7475074B2 (en) | Web search system and method thereof | |
JP4746439B2 (ja) | 文書検索サーバおよび文書検索方法 | |
EP3311309A1 (en) | Methods and systems for object recognition | |
KR20070047304A (ko) | 지명된 url 엔트리 | |
JP2004220215A (ja) | 計算機を利用した業務誘導支援システムおよび業務誘導支援方法 | |
JP5185402B2 (ja) | 文書検索装置、文書検索方法、及び文書検索プログラム | |
JP2004341753A (ja) | 検索支援装置、検索支援方法、およびプログラム | |
JP4973503B2 (ja) | ファイル検索プログラム、方法及び装置 | |
JP6534454B2 (ja) | 情報検索方法及び情報検索装置並びに情報検索システム | |
JP2007034772A (ja) | Webサイト検索結果の最適表示システム及びその装置及びその方法及びそのプログラム | |
JP5579140B2 (ja) | 文書検索装置及び方法及びプログラム | |
JP4699909B2 (ja) | キーワード対応関係分析装置及び分析方法 | |
JP6287192B2 (ja) | 情報処理装置、情報処理方法、プログラム | |
JP5127553B2 (ja) | 情報処理装置、情報処理方法、プログラム及び記録媒体 | |
KR20110094562A (ko) | 관련어가 표시되는 관계도를 이용한 효과적인 인터넷 검색 방법 | |
JP5002631B2 (ja) | 単語情報収集装置、単語情報収集方法および単語情報収集プログラム | |
JP6707410B2 (ja) | 文献検索装置、文献検索方法およびコンピュータプログラム | |
US20080021875A1 (en) | Method and apparatus for performing a tone-based search | |
JP5505207B2 (ja) | 情報検索装置、情報検索方法及び情報検索プログラム | |
JP2004133510A (ja) | 技術文献検索システム | |
JP2013156876A (ja) | 推薦クエリ抽出装置及び方法及びプログラム | |
JP2005316881A (ja) | 図面検索のためのプログラム、図面検索装置及び図面検索結果表示方法 | |
JP2009003731A (ja) | 特許検索システム | |
JP2007122258A (ja) | データ検索装置、データ検索プログラム又はデータ検索方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180413 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190319 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190424 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190514 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190528 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6534454 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |