JP6534454B2 - 情報検索方法及び情報検索装置並びに情報検索システム - Google Patents

情報検索方法及び情報検索装置並びに情報検索システム Download PDF

Info

Publication number
JP6534454B2
JP6534454B2 JP2017565011A JP2017565011A JP6534454B2 JP 6534454 B2 JP6534454 B2 JP 6534454B2 JP 2017565011 A JP2017565011 A JP 2017565011A JP 2017565011 A JP2017565011 A JP 2017565011A JP 6534454 B2 JP6534454 B2 JP 6534454B2
Authority
JP
Japan
Prior art keywords
search
keyword
unit
search keyword
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017565011A
Other languages
English (en)
Other versions
JPWO2017134760A1 (ja
Inventor
孝志 横張
孝志 横張
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Publication of JPWO2017134760A1 publication Critical patent/JPWO2017134760A1/ja
Application granted granted Critical
Publication of JP6534454B2 publication Critical patent/JP6534454B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、計算機上で複数の検索キーワードを入力して文書等を検索する情報処理の分野における情報検索方法及び情報検索装置に係り、特に、入力された検索キーワードの有無が検索結果に及ぼす影響を検索キーワード毎に評価し、検索実施者(ユーザ)に検索キーワードの妥当性を示唆することで、適切な検索キーワードによる文書等の再検索を行い得る情報検索方法及び情報検索装置並びに情報検索システムに関する。
情報収集等を目的とした文書検索において、有用な情報が検索されるまで検索キーワードを変更して繰り返し検索を行っているが、適切な検索キーワードを設定できない場合、情報取得に多大な時間が掛るか、或いは情報取得に失敗する可能性がある。一般的な検索手順としては、検索ツールに検索キーワードを入力して検索結果を表示し、上位20件程度を見て適当な文書が見つからなければ、検索キーワードを変えて検索し直すことが多く、最初から適切な検索キーワードを入力できれば業務効率が向上する。逆に、検索結果にノイズを混入する要因となる不適切な検索キーワードは、適切な検索キーワードに変更すべきである。
文書等の検索処理において有用な情報を効率的に得る技術として、例えば、特許文献1または特許文献2に記載される技術が知られている。
特許文献1には、ウェブ検索装置であって、検索キーワード毎の重要度を、その出現順に応じて決定し、予め設定されたウェブページに対する操作(アクション)内容に対応する加算ポイントを乗算し、評価点の高い順にリスト化し、当該検索結果のリストをネットワーク経由にて利用者端末へ送信する構成が開示されている。
また、特許文献2には、検索クエリを介して入力される検索キーワード群に対し、予め各検索キーワードに重要度を割り当て、上記各検索キーワードが検索結果の文書中の単語に対する類似度に基づき寄与度を設定し、検索結果と共に当該寄与度を画面上に表示する構成が開示されている。
特開2014−75064号公報 特開2007−219722号公報
しかしながら、特許文献1では、出現順及びウェブページへの操作に応じて、検索キーワードによる検索結果をリスト表示する際の表示順を決定しているに過ぎず、「この検索キーワードがあったことで、この文書は検索された。仮に、この検索キーワードが無ければ、他の検索キーワードによってこの文書が検索されることは無かった」というような、検索キーワードの有無が検索結果に与える影響を、検索実施者(ユーザ)が直接的に認識することができない。
また、特許文献2では、寄与度の設定はシステム側にて自動設定されものであり、また、検索結果表示後の寄与度の修正はユーザにより実行可能であるものの、「この検索キーワードがあったことで、この文書は検索された。仮に、この検索キーワードが無ければ、他の検索キーワードによってこの文書が検索されることは無かった」というような、検索キーワードの有無が検索結果に与える影響を、検索実施者(ユーザ)が直接的に認識することができない。
そこで、本発明は、検索実施者(ユーザ)より入力された検索キーワードの有無が検索結果に及ぼす影響度を、検索実施者(ユーザ)に容易に把握可能とし得る情報検索方法及び情報検索装置並びに情報検索システムを提供する。
上記課題を解決するため、本発明の情報検索装置は、複数の検索キーワードの入力を受け付けるキーワード入力受付部と、文書データ及び/又は画像データを含む複数のドキュメントを格納する文書データベースから、前記受け付けられた複数の検索キーワードに基づき検索結果として複数のドキュメントを抽出する検索実行部と、前記受け付けられた検索キーワードの有無が前記検索結果に及ぼす影響度を、検索キーワード毎に求める検索キーワード影響度演算部と、前記検索結果と共に前記検索キーワード毎の影響度を画面上に表示する表示部と、を備え、前記検索実行部は、前記複数の検索キーワードのうち、特定の検索キーワードを除いた他の複数の検索キーワードに基づき検索結果として複数のドキュメントを抽出し、前記検索キーワード影響度演算部は、前記特定の検索キーワードを除いた他の複数の検索キーワードに基づく検索結果に含まれる複数のドキュメントと、前記受け付けられた複数の検索キーワードに基づく検索結果に含まれる複数のドキュメントとの差分により、前記特定の検索キーワードの有無が検索結果に及ぼす影響度を求めることを特徴とする。
また、本発明の情報検索方法は、少なくとも、入力部と、検索実行部と、検索キーワード影響度演算部と、表示部と、を有する情報検索装置の情報検索方法であって、前記入力部より複数の検索キーワードの入力を受け付けるキーワード入力受付工程と、前記検索実行部が、文書データ及び/又は画像データを含む複数のドキュメントを格納する文書データベースから、前記受け付けられた複数の検索キーワードに基づき検索結果として複数のドキュメントを抽出する検索工程と、前記検索キーワード影響度演算部が、前記受け付けられた検索キーワードの有無が前記検索結果に及ぼす影響度を、検索キーワード毎に求める検索キーワード影響度演算工程と、前記検索結果と共に前記検索キーワード毎の影響度を表示部の画面上に表示する表示工程と、を有し、前記検索工程は、前記検索実行部が、前記複数の検索キーワードのうち、特定の検索キーワードを除いた他の複数の検索キーワードに基づき検索結果として複数のドキュメントを抽出し、前記検索キーワード影響度演算工程は、前記検索キーワード影響度演算部が、前記特定の検索キーワードを除いた他の複数の検索キーワードに基づく検索結果に含まれる複数のドキュメントと、前記受け付けられた複数の検索キーワードに基づく検索結果に含まれる複数のドキュメントとの差分により、前記特定の検索キーワードの有無が検索結果に及ぼす影響度を求めることを特徴とする。
また、本発明の情報検索システムは、複数のユーザ端末装置とネットワークを介して接続される情報検索装置を有する情報検索システムであって、前記情報検索装置は、前記ネットワークを介して前記ユーザ端末装置より入力される複数の検索キーワードを受け付けるキーワード入力受付部と、文書データ及び/又は画像データを含む複数のドキュメントを格納する文書データベースから、前記受け付けられた複数の検索キーワードに基づき検索結果として複数のドキュメントを抽出する検索実行部と、前記受け付けられた検索キーワードの有無が前記検索結果に及ぼす影響度を、検索キーワード毎に求める検索キーワード影響度演算部と、を備え、前記検索結果と共に前記検索キーワード毎の影響度を、前記ネットワークを介して前記ユーザ端末装置へ送信し、前記検索実行部は、前記複数の検索キーワードのうち、特定の検索キーワードを除いた他の複数の検索キーワードに基づき検索結果として複数のドキュメントを抽出し、検索キーワード影響度演算部は、前記特定の検索キーワードを除いた他の複数の検索キーワードに基づく検索結果に含まれる複数のドキュメントと、前記受け付けられた複数の検索キーワードに基づく検索結果に含まれる複数のドキュメントとの差分により、前記特定の検索キーワードの有無が検索結果に及ぼす影響度を求めることを特徴とする。
本発明によれば、検索実施者(ユーザ)より入力された検索キーワードの有無が検索結果に及ぼす影響度を、検索実施者(ユーザ)に容易に把握可能とし得る情報検索方法及び情報検索装置並びに情報検索システムを提供することができる。
上記した以外の課題、構成及び効果は、以下の実施形態の説明により明らかにされる。
本発明の一実施例に係る実施例1の情報検索装置の外観図及び機能ブロック図である。 図1に示す記憶部に格納されるデータ構造の説明図である。 図1に示す情報検索装置の概略処理フロー図である。 図1に示す情報検索部による検索キーワードの影響度を算出するための処理フロー図である。 図1に示す表示部の表示画面例を示す図である。 本発明の他の実施例に係る実施例2の情報検索装置の外観図及び機能ブロック図である。 図6に示す記憶部に格納されるデータ構造の説明図である。 図6に示す情報検索部による検索キーワードの寄与度を算出するための処理フロー図である。 図6に示す表示部の表示画面例であって、検索結果の有用性の入力画面の一例である。 図6に示す表示部の表示画面例であって、検索キーワードの寄与度を表示する画面例である。 本発明の他の実施例に係る実施例3の情報検索装置による検索キーワードの寄与度を算出するための処理フロー図である。 実施例3の表示部の表示画面例である。 実施例3の表示部の他の表示画面例である。 本発明の他の実施例に係る実施例4の情報検索装置の外観図及び機能ブロック図である。 図14に示す情報検索部による検索キーワードを編集する処理フロー図である。 図14に示す表示部の表示画面例であって、関連語カテゴリを選択する入力画面の一例である。 図14に示す関連語データベースを構築する処理フロー図である。 図14に示す関連語データベースのデータ構造の説明図である。 図14に示す表示部の表示画面例であって、検索キーワードを編集する画面例である。 本発明の他の実施例に係る実施例5の情報検索システムの全体概略構成図である。 図20に示す情報検索装置の機能ブロック図である。
本明細書において、検索対象である「情報」とは、例えば、文書データ、website、CADデータ、カメラにより撮像された静止画像、及び動画カメラにより撮像された動画映像を含むものとする。例えば、静止画像の場合、GPS装置付きカメラ等により撮像されメモリにjpg形式等にて格納される画像データには、4つ以上の衛星により距離が測定(測距データ)され、当該画像データが取得された位置情報が付加される。また、一般的に画面上に表示されるフォルダ内の画像データ(サムネイル表示、アイコン表示等含む)は、マウスのポインタ或いはカーソルを位置付け右クリックすることでプロパティーが表示され、当該画像データの説明等がテキスト入力されている。すなわち、上述の各種データには、例え当該データが画像データである場合であっても、当該画像データにテキストデータが付加されることが一般的であり、検索キーワードによりこれら各種データを検索することが可能となっている。
また、本明明細書において、上記各種データを含む「情報」を、「ドキュメント」と総称する場合もある。
以下、図面を用いて本発明の実施例について説明する。
図1は、本発明の一実施例に係る実施例1の情報検索装置の外観図及び機能ブロック図である。図1に示すように、情報検索装置1は、キーボードまたはマウス等の入力部3、LCDまたは有機ELディスプレイ等の表示部4、及び情報検索部2から構成される。情報検索部2は、検索実施者(ユーザ)により入力部3を介して入力される検索キーワードを受け付ける検索キーワード入力受付部21、上述のように文書データまたは画像データ等のドキュメントを格納する文書データベース25、入力された検索キーワードに基づき例えば既知の検索エンジンにより文書データベース25内に格納されるドキュメントを検索する検索実行部22、入力された検索キーワードが検索実行部22により得られた検索結果に及ぼす影響度を求める検索キーワード影響度演算部23、検索キーワード影響度演算部23により得られた影響度を、キーワード毎に対応付けて影響を受けたドキュメントと共に格納する記憶部26、及び少なくとも検索結果等を表示部4の表示画面上に表示するよう制御する検索結果表示制御部24を備える。なお、本実施例では、文書データベース25を、情報検索装置1の情報検索部2内に備える構成を一例として説明するが、これに限られるものではない。例えば、文書データベース25を外部記憶装置として、情報検索装置1に接続する構成としても良い。
これら、検索キーワード入力受付部21、検索実行部22、検索キーワード影響度演算部23、検索結果表示制御部24、記憶部26、及び文書データベース25は、内部バス27にて相互にアクセス可能に接続されている。ここで、検索実行部22、検索キーワード影響度演算部23、及び検索結果表示制御部24は、例えば、図示しない各種プログラムを格納するROM、演算過程または処理過程のデータを一時的に格納するRAM等の記憶装置と、CPU等のプロセッサにて実現される。プロセッサは、ROMに格納される各種プログラムを読み出し、読み出されたプログラムを実行する。
図2は、図1に示す記憶部26に格納されるデータ構造の説明図である。図2に示すように、記憶部26は、「キーワード」毎に、「影響度」及び「影響を受けた項目(ドキュメント)」を対応付けて格納している。例えば、「キーワード」が“Keyword−1”では、「影響度」が“40%”であり、“Keyword−1”により影響を受けた項目(ドキュメント)は、“bbbbbb.xls”及び“eeeeee.txt”である。また、「キーワード」が“Keyword−2”では、「影響度」が“30%”であり、“Keyword−2”により影響を受けた項目(ドキュメント)は、“aaaaaa.doc”及び“ffffff.jpg”である。「キーワード」が“Keyword−3”では、「影響度」が“70%”であり、“Keyword−3”により影響を受けた項目(ドキュメント)は、“cccccc.pdf”、“dddddd.html”、“gggggg.xls”、及び“hhhhhh.txt”である。これら、記憶部26に「キーワード」毎に「影響度」と対応付けて格納される「影響を受けた項目(ドキュメント)」は、文書データベース25に格納される対応するドキュメントとノードがはられており、記憶部26と文書データベース25は、所謂、リレーショナルデータベースを構築している。
ここで、「影響度」とは、検索実施者(ユーザ)により、入力部3及び検索キーワード入力受付部21を介して取り込まれた検索キーワードに基づき、検索実行部22が内部バス27を介して文書データベース25へアクセスし、文書データベース25内に格納されるドキュメントを検索または抽出する際に、当該入力された検索キーワードが検索結果にどれだけ影響を与えているかを示す指標である。換言すれば、例えば、「この検索キーワードがあったことで、この文書は検索された。仮に、この検索キーワードが無ければ、他の検索キーワードによってこの文書が検索されることは無かった」というような、検索キーワードの有無が検索結果に与える影響の度合を示すものであり、検索結果が検索実施者(ユーザ)の意図と異なる場合も含むものである。すなわち、検索結果が、検索実施者(ユーザ)の意図に合致するものであるか否かを問わない。なお、「影響度」の算出については、後述する。
以下に、情報検索装置1の処理の概略について説明する。ここでは、複数の検索キーワードを入力してドキュメントを検索する際に、入力された検索キーワードの有無が検索結果に及ぼす影響を検索キーワード毎に評価し、検索実施者(ユーザ)に検索キーワードの妥当性を示唆する形態を一例として説明する。図3は、図1に示す情報検索装置1の概略処理フロー図である。
先ず、検索実施者(ユーザ)により、入力部3を介して複数の検索キーワード{k(1),k(2),・・・,k(n)}(n:自然数)が入力されると、情報検索部2を構成する検索キーワード入力受付部21が、検索キーワードK={k(1),k(2),・・・,k(n)}を受け付ける(ステップS101)。
ステップS102では、検索キーワード入力受付部21は、受け付けた複数の検索キーワードKを、内部バス27を介して検索実行部22へ転送する。検索実行部22は、既知の任意の検索エンジンを用いて内部バス27を介して文書データベース25にアクセスし、検索を実行する。そして、検索実行部22は、検索結果として、R={r(1),r(2),・・・,r(m)}(m:自然数)を取得する。
ステップS103では、検索実行部22は、検索エンジンのランキングに基づき、検索結果Rの各ドキュメント、すなわち、上述のr(1),r(2),・・・,r(m)にランキングに応じた点数を設定する。これにより、検索結果Rの各ドキュメントに設定された点数は、P={p(1),p(2),・・・,p(m)}となる。なお、点数設定の方法については後述する。
続いて、検索実行部22は初期値として、i=1を設定し(ステップS104)、検索キーワードK={k(1),k(2),・・・,k(n)}からk(i)を除いたキーワードで検索を実行し、検索結果Ri(i:1〜n)を取得する(ステップS105)。すなわち、ステップS105では、検索実行部22は、ステップS101にて最初に受け付けられた(入力された)複数の検索キーワード群{k(1),k(2),・・・,k(n)}から、特定の検索キーワード、ここでは、i=1が設定されていることから、k(1)を除いた検索キーワード群{k(2),・・・,k(n)}で再度検索を実行し、その検索結果Rを得る。
ステップS106では、検索キーワード影響度演算部23は、検索実施者(ユーザ)が入力した全ての検索キーワードK(検索キーワード群{k(1),k(2),・・・,k(n)})を用いて検索した検索結果R(ステップS102)と、特定の検索キーワードk(i)を除いて検索した検索結果R(ステップS105)との差分のドキュメントを抽出し、それにステップS102にて設定された対応する点数p(j)を積算し、除外した検索キーワードk(i)の影響度Eを算出する。なお、ここでは、i=1が設定されていることから、検索結果Rと、特定の検索キーワードk(1)を除いて検索した検索結果Rとの差分のドキュメントが抽出され、除外した検索キーワードk(1)の影響度Eが得られる。
ステップS107では、検索キーワード影響度演算部23は、iにi+1を設定する(iを1だけインクリメントする)。続いて、検索キーワード影響度演算部23は、iがnに達したか否かを判定し(ステップS108)、iがnに達していない場合はステップS105へ戻り、検索実行部22がステップS105の処理を、検索キーワード影響度演算部23がステップS106〜ステップS108までの処理を繰り返し実行する。ステップS108にて、iがnに達した場合はステップS109へ進む。
ここで、例えば、n>2であれば、ステップS108では、検索キーワード影響度演算部23は、iがnに達していないと判定しステップS105へ戻る。ステップS105では、検索実行部22は、ステップS101にて最初に受け付けられた(入力された)複数の検索キーワード群{k(1),k(2),・・・,k(n)}から、特定の検索キーワード、ここでは、i=2が設定されていることから、k(2)を除いた検索キーワード群{k(1),k(3),・・・,k(n)}で再度検索を実行し、その検索結果R得る。ステップS106では、検索キーワード影響度演算部23は、検索実施者(ユーザ)が入力した全ての検索キーワードK(検索キーワード群{k(1),k(2),・・・,k(n)})を用いて検索した検索結果R(ステップS102)と、特定の検索キーワードk(2)を除いて検索した検索結果R(ステップS105)との差分のドキュメントを抽出し、それにステップS102にて設定された対応する点数p(j)を積算し、除外した検索キーワードk(2)の影響度Eを算出する。
ステップS109では、検索キーワード影響度演算部23は、検索キーワードk(i)及び検索キーワードk(i)の影響度Eを、内部バス27を介して検索結果表示制御部24へ転送する。検索結果表示制御部24は、検索キーワードk(i)と共に検索キーワードk(i)の影響度E(i=1,2,・・・,n)を、表示部4の画面上に表示する。
特に、図示しないが、検索キーワード影響度演算部23は、ステップS109にて、内部バス27を介して記憶部26へアクセスし、検索キーワードk(i)、検索キーワードk(i)の影響度E、及び検索結果のドキュメントを、図2に示したように、「キーワード」、「影響度」及び「影響を受けた項目(ドキュメント)」の各欄に格納する。なお、これに代えて、検索キーワード影響度演算部23が、ステップS106を実行する度に、逐次、内部バス27を介して記憶部26へアクセスし、検索キーワードk(i)、検索キーワードk(i)の影響度E、及び検索結果のドキュメントを、記憶部26の「キーワード」、「影響度」及び「影響を受けた項目(ドキュメント)」の各欄に格納する構成としても良い。
なお、本実施例では、検索キーワード影響度演算部23がステップS106〜ステップS108までの処理を実行する構成としたが、これに限られるものではない。例えば、検索キーワード影響度演算部23がステップS106のみを実行し、ステップS107及びステップS108を検索実行部22が実行するよう構成しても良い。
次に、検索キーワードの影響度の算出についてより詳細に説明する。図4は、図1に示す情報検索装置1を構成する情報検索部2による検索キーワードの影響度を算出するための処理フロー図である。以下では、複数の検索キーワードを入力して検索する際の検索キーワード群を「検索キーワードセット」と称することとし、また便宜上、その別名をKeywordSetAllとする。なお、図4では、入力部3を介して検索実施者(ユーザ)により入力されるn個の検索キーワードをW[1]、W[2]、W[3]、・・・、W[n](n:自然数)とする。
先ず、ステップS201では、検索実施者(ユーザ)により、入力部3を介してn個の検索キーワードW[1]、W[2]、W[3]、・・・、W[n](検索キーワードセット)が入力されると、情報検索部2を構成する検索キーワード入力受付部21(図1)が、検索キーワードセットKeywordSetAllを受け付ける。
ステップS202では、検索キーワード入力受付部21は、受け付けた検索キーワードセットKeywordSetAllを、内部バス27を介して検索実行部22へ転送する。検索実行部22(図1)は、既知の任意の検索エンジンを用いて内部バス27を介して文書データベース25にアクセスし、検索キーワードセットKeywordSetAllに基づき検索実行し、検索結果を取得する。以下では、検索結果の集合を「検索結果セット」と称することとし、その別名をResultSetAllとする。また、検索されたm個のドキュメントをR[1]、R[2]、R[3]、・・・、R[m](m:自然数)とする。
なお、検索実行部22は、上述の既知の検索エンジンを用いた検索方法を実行すると共に、既知の手法により検索結果のランキングを得るものとする。また、ステップS202では、ResultSetAllとして検索結果の全てを取得することに代えて、検索結果のうち、ランキングが上位のm個を取得する構成としても良い。
次に、ステップS203では、検索実行部22は、検索結果セットResultSetAllに含まれる各ドキュメントに対する点数付けを行う。検索結果の上位が高配点になるように点数付けする。例えば、mを100としたとき、ランキングの最上位を100点とし、次から順次1ずつ減じて、ランキングの最下位を1点とする。また、これに代えて、例えばランキングの各順位に非線形に重み付けを行っても良い。但し、この場合において、点数は正数とする。以下では、各ドキュメントに対し付する点数を「点数セット」と称することとし、その別名をScoreSetとする。m個のドキュメントに対する点数をScoreSet=S[1]、S[2]、S[3]、・・・、S[m]とする。また、S[1]〜S[m]の合計をSTとする。ここまでで定義した変数をまとめると以下の通りである。
KeywordSetAll={W[1]、W[2]、W[3]、・・・、W[n]}
ResultSetAll={R[1]、R[2]、R[3]、・・・、R[m]}
ScoreSet={S[1]、S[2]、S[3]、・・・、S[m]}、
ST=Σ(S[i]:i=1〜m)
続いて、検索実行部22は、初期値としてi=1を設定し(ステップS204)、検索キーワードセットKeywordSetAllから検索キーワードW(i)を除いた検索キーワード群としてKeywordSet[i]を定義する(ステップS205)。ここではでi=1が設定されていることから、検索キーワード群としてKeywordSet[1]が得られる。
ステップS206では、検索実行部22は、内部バス27を介して文書データベース25へアクセスし、ステップS205にて得られた検索キーワード群KeywordSet[i]を用いて、文書データベース25を再検索し、検索結果セットResultSet[i]を取得する。なお、ここではi=1が設定されていることから、検索キーワード群KeywordSet[1]を用いて検索結果セットResultSet[1]が得られる。
ステップS207では、検索キーワード影響度演算部23は、積算値の初期化を行うため、積算値Sum[i]に初期値として「0」を設定し、j=1を設定する(ステップS208)。
ステップS209では、検索キーワード影響度演算部23は、検索結果セットResultSetAllであるR[j]に含まれるドキュメントうち、ステップS206にて得られた検索キーワード群KeywordSet[i]による検索結果セットResultSet[i]に含まれるドキュメントに一致するものがあるか否かを判定する。すなわち、ResultSetAllであるR[j]に含まれResultSet[i]に含まれないドキュメントがある場合には、ステップS210へ進み、当該ドキュメントに対しその点数S[j](上述のステップS203で設定されたドキュメント毎の点数)を積算し、ステップS211へ進む。一方、ResultSetAllであるR[j]に含まれResultSet[i]に含まれないドキュメントが存在しない場合には、ステップS211へ進む。
ステップS211では、検索キーワード影響度演算部23は、jにj+1を設定する(jを1だけインクリメントする)。続いて、検索キーワード影響度演算部23は、jがmに達したか否かを判定し(ステップS212)、jがmに達していない場合はステップS209へ戻り、ステップS209〜ステップS212までの処理を繰り返し実行する。ステップS212にて、jがmに達した場合はステップS213へ進む。
ステップS213では、検索キーワード影響度演算部23は、iにi+1を設定する(iを1だけインクリメントする)。続いて、検索キーワード影響度演算部23は、iがnに達したか否かを判定し(ステップS214)、iがnに達していない場合はステップS205へ戻り、検索実行部22がステップS205及びステップS206の処理を、検索キーワード影響度演算部23がステップS207〜ステップS214までの処理を繰り返し実行する。ステップS214にて、iがnに達した場合はステップS215へ進む。
ステップS215では、検索キーワード影響度演算部23は、検索キーワードW[i]の影響度Eとして、Sum[i]/STを算出し、内部バス27を介して検索結果表示制御部24へ転送する。ここで、STは上述の通り、ST=Σ(S[i]:i=1〜m)である。検索結果表示制御部24は、検索キーワードW[i]と共に検索キーワードW[i]の影響度E(i=1,2,・・・,n)であるSum[i]/STを、表示部4の画面上に表示する。
特に、図示しないが、検索キーワード影響度演算部23は、ステップS215にて、内部バス27を介して記憶部26へアクセスし、検索キーワードW[i]、検索キーワードW[i]の影響度EであるSum[i]/ST及び検索結果のドキュメントを、図2に示したように、「キーワード」、「影響度」及び「影響を受けた項目(ドキュメント)」の各欄に格納する。
上述のステップS209におけるドキュメントを比較する処理、すなわち、検索結果セットResultSetAllであるR[j]に含まれるドキュメントと、ステップS206にて得られた検索キーワード群KeywordSet[i]による検索結果セットResultSet[i]に含まれるドキュメントとの比較は、例えば、ドキュメントのタイトルや作成日付、作成者、ドキュメントサイズ等の情報に基づき、それぞれのドキュメントにハッシュ値を付与しておいてデータ比較処理を高速化しても良い。
なお、ステップS215において、積算値Sum[i]をST=Σ(S[i]:i=1〜m)で割った値を影響度E(i=1,2,・・・,n)として、表示部4の画面上に表示する構成としたが、これに代えて、積算値Sum[i]を配列に格納しておき、影響度E(i=1,2,・・・,n)の合計ΣEが100%になるように正規化し、その後表示部4の画面上に表示する構成としても良い。
図5は、図1に示す表示部4表示画面例を示す図である。図5に示すように、表示画面40は、検索実施者(ユーザ)により検索キーワードが入力される検索キーワード入力欄としての第1表示領域41、検索キーワード毎に検索キーワード影響度を表示する第2表示領域42、及び入力された検索キーワードによる検索結果を表示する第3表示領域43から構成される。検索キーワード入力欄としての第1表示領域41に隣接し、「実行」ボタン47が表示画面40上に配されており、検索実施者(ユーザ)によりマウス等の入力部3を用いてカーソルが「実行」ボタン47上に位置付けられクリックされると、情報検索部2は、上述の図4に示したステップS201〜ステップS215の処理を実行する。第2表示領域42は、検索キーワード表示領域44及び検索キーワード影響度表示領域45から構成され、検索キーワード影響度表示領域45は、検索キーワード影響度を数値と共に棒グラフ状に表示する。なお、検索キーワード影響度表示領域45に表示される検索キーワードの影響度は、棒グラフ状に限らず、他の表示形態であっても良く、検索実施者(ユーザ)に視認可能な表示形態であればいずれの表示形態としても良い。
また、図5に示す表示画面例では、検索キーワードとして、4つのキーワード、Keyword−1、Keyword−2、Keyword−3、及びKeyword−4が、検索キーワード入力欄としての第1表示領域41に入力され、その検索結果であるResultSetAllに含まれるドキュメントが第3表示領域43にリスト表示された状態を示している。検索実施者(ユーザ)は、第3表示領域43の右端に表示されるクロールバーを下方へスクロールすることで、検索結果であるResultSetAllに含まれる全てのドキュメントを確認することができる。
検索キーワードKeyword−1は、図4のステップS201に示したW「1」に対応し、検索キーワードKeyword−2はW[2]、検索キーワードKeyword−3はW[3]、検索キーワードKeyword−4はW[4]にそれぞれ対応する。
そして、検索キーワード影響度演算部23により上述のステップS215にて得られた、Keyword−1の影響度EであるSum[1]/STが40%、Keyword−2の影響度EであるSum[2]/STが30%、Keyword−3の影響度EであるSum[3]/STが70%、及びKeyword−4の影響度EであるSum[4]/STが5%である。図5に示す表示状態において、検索実施者(ユーザ)がマウス等の入力部3を用いてカーソルを、検索キーワード表示領域44中のKeyword−1上に位置付けクリックすると、検索キーワードKeyword−1により影響を受けた項目(ドキュメント)がハイライト表示される。すなわち、第3表示領域43中の、「Document Title2 bbbbbb.xls」及び「Document Title5 eeeeee.txt」の2つのドキュメントが、他のドキュメントと識別可能にハイライト表示46される。ここで、検索実施者(ユーザ)は、仮に、ハイライト表示46されたドキュメントである「Document Title2 bbbbbb.xls」及び「Document Title5 eeeeee.txt」のうち、少なくともいずれか一方が意図しないドキュメント、すなわち、本来、検索結果として取得すべきドキュメントと異なる場合には、検索キーワード入力欄である第1表示領域41に入力されたKeyword−1を変更する必要があることを、画面上で容易に判断することが可能となる。
なお、本実施例では、検索実施者(ユーザ)により、検索キーワード表示領域44中のKeyword−1を選択指定することで、検索キーワードKeyword−1により影響を受けた項目(ドキュメント)をハイライト表示する構成としたが、必ずしもこれに限られるものではない。選択指定された検索キーワードにより影響を受けた項目(ドキュメント)をブリンク表示或は強調表示する等、他のドキュメントと識別可能な表示形態であればいずれの構成としても良い。
また、検索実施者(ユーザ)は、第2表示領域42中の検索キーワード影響度表示領域45に表示される検索キーワード影響度、及び/又は、第3表示領域43にハイライト表示46等、他のドキュメントと識別可能に表示された検索結果を見て、例えば、検索結果に全く満足しなければ影響度の大きい検索キーワードを変更し、或いは、ハイライト表示46されたドキュメントが不必要であれば、そのドキュメントが検索された要因となった検索キーワードの変更等をすることができる。
以上の通り、本実施例によれば、検索実施者(ユーザ)より入力された検索キーワードの有無が検索結果に及ぼす影響度を、検索実施者(ユーザ)に容易に把握させることが可能となる。
また、本実施例によれば、検索実施者(ユーザ)が、第2表示領域42中の検索キーワード影響度表示領域45に表示される検索キーワード影響度、及び/又は、第3表示領域43にハイライト表示46等、他のドキュメントと識別可能に表示された検索結果を見て、例えば、検索結果に全く満足しなければ影響度の大きい検索キーワードを変更し、或いは、ハイライト表示46されたドキュメントが不必要であれば、そのドキュメントが検索された要因となった検索キーワードの変更等を即座に行い得る情報検索装置及び情報検索方法を実現することができる。
図6は、本発明の他の実施例に係る実施例2の情報検索装置の外観図及び機能ブロック図である。本実施例では、上述の実施例1に示した情報検索装置を構成する情報検索部に、更に検索結果有効性入力受付部及び検索キーワード寄与度演算部を設けた点が実施例1と異なる。実施例1と同様の構成要素に同一の符号を付し、以下では、実施例1と重複する説明を省略する。
図6に示すように、本実施例の情報検索装置1を構成する情報検索部2aは、キーボードまたはマウス等の入力部3、LCDまたは有機ELディスプレイ等の表示部4、及び情報検索部2aから構成される。情報検索部2aは、検索実施者(ユーザ)により入力部3を介して入力される検索キーワードを受け付ける検索キーワード入力受付部21、上述のように文書データまたは画像データ等のドキュメントを格納する文書データベース25、入力された検索キーワードに基づき例えば既知の検索エンジンにより文書データベース25内に格納されるドキュメントを検索する検索実行部22、入力された検索キーワードが検索実行部22により得られた検索結果に及ぼす影響度を求める検索キーワード影響度演算部23、検索実施者(ユーザ)により入力部3を介して入力される検索結果に対する有効性を受け付ける検索結果有効性入力受付部28、入力された検索キーワードの検索結果に対する寄与度を求める検索キーワード寄与度演算部29、検索キーワード影響度演算部23により得られた影響度と検索キーワード寄与度演算部29により得られた寄与度を、キーワード毎に対応付けて影響を受けたドキュメントと共に格納する記憶部26、及び少なくとも検索結果等を表示部4の表示画面上に表示するよう制御する検索結果表示制御部24を備える。なお、本実施例では、文書データベース25を、情報検索装置1の情報検索部2内に備える構成を一例として説明するが、これに限られるものではない。例えば、文書データベース25を外部記憶装置として、情報検索装置1に接続する構成としても良い。
これら、検索キーワード入力受付部21、検索結果有効性入力受付部28、検索実行部22、検索キーワード影響度演算部23、検索キーワード寄与度演算部29、検索結果表示制御部24、記憶部26、及び文書データベース25は、内部バス27にて相互にアクセス可能に接続されている。ここで、検索実行部22、検索キーワード影響度演算部23、検索キーワード寄与度演算部29、及び検索結果表示制御部24は、例えば、図示しない各種プログラムを格納するROM、演算過程または処理過程のデータを一時的に格納するRAM等の記憶装置と、CPU等のプロセッサにて実現される。プロセッサは、ROMに格納される各種プログラムを読み出し、読み出されたプログラムを実行する。
図7は、図6に示す記憶部に格納されるデータ構造の説明図である。図7に示すように、記憶部26は、「キーワード」毎に、「影響度」、「寄与度」、及び「影響を受けた項目(ドキュメント)」を対応付けて格納している。例えば、「キーワード」が“Keyword−1”では、「影響度」が“40%”であり、「寄与度」が“−30%”であり、“Keyword−1”により影響を受けた項目(ドキュメント)は、“bbbbbb.xls”及び“eeeeee.txt”である。また、「キーワード」が“Keyword−2”では、「影響度」が“30%”であり、「寄与度」が“80%”であり、“Keyword−2”により影響を受けた項目(ドキュメント)は、“aaaaaa.doc”及び“ffffff.jpg”である。「キーワード」が“Keyword−3”では、「影響度」が“70%”であり、「寄与度」が“40%”であり、“Keyword−3”により影響を受けた項目(ドキュメント)は、“cccccc.pdf”、“dddddd.html”、“gggggg.xls”、及び“hhhhhh.txt”である。これら、記憶部26に「キーワード」毎に「影響度」及び「寄与度」と対応付けて格納される「影響を受けた項目(ドキュメント)」は、文書データベース25に格納される対応するドキュメントとノードがはられており、記憶部26と文書データベース25は、所謂、リレーショナルデータベースを構築している。
ここで、「影響度」については、上述の実施例1と同様である。これに対し、「寄与度」とは、検索実行部22による検索結果が正規の値に近いか否か、すなわち、当該入力された検索キーワードが検索結果に貢献しているか否かの指標である。換言すれば、「寄与度」とは、検索結果が、検索実施者(ユーザ)の意図に合致する度合いを示す指標である。なお、「寄与度」の算出については後述する。
以下に、情報検索装置1を構成する情報検索部2aの処理フローについて説明する。なお、情報検索部2aによる検索キーワードの影響度の算出については、上述の実施例1にて説明した図4に示すステップS201〜ステップS215と同様であるため説明を省略し、以下では、情報検索部2aによる検索キーワードの寄与度の算出について詳細に説明する。図8は、図6に示す情報検索部2aによる検索キーワードの寄与度を算出するための処理フロー図である。
先ず、ステップS301では、検索キーワードを用いた検索実行部22による検索結果セットに含まれる各ドキュメントに対し、検索実施者(ユーザ)により入力部3を介して有用性に関する評価が入力されると、情報検索部2aを構成する検索結果有効性入力受付部28(図6)が、上記検索結果セットに含まれる各ドキュメントに対する有用性の評価入力を受付ける。ここで、検索実施者(ユーザ)による有用性の評価入力を可能とする表示部4に表示される有効性評価入力画面については後述する。
ステップS302では、検索実行部22は、検索結果セットResultSetAllに含まれるm個のドキュメント、R[1]、R[2]、R[3]、・・・、R[m](m:自然数)に対する有用性に基づき点数セットの重み付けを行う。具体的には、検索結果セットResultSetAllに含まれるm個の各ドキュメントに対し付される点数セットScoreSet={S[1]、S[2]、S[3]、・・・、S[m]}に対し、「有用」と評価されたドキュメントの点数を加算し、逆に「不要」と評価されたドキュメントの点数を減算し、その結果として、WeightedScoreSet ={C[1]、C[2]、C[3]、・・・、C[m]}を得る。例えば、例えば、ドキュメントR[1]が「有用」と判断されればC[1]←S[1]×2とし、ドキュメントR[2]が「不要」と判断されればC[2]→0―S[2](正負反転)とする。有用/不要が指定されなかったドキュメントについてはC[i]とS[i]の値を同じにする。すなわち、「有用」と判断されたドキュメントの点数をより高く、「不要」と判断されたドキュメントの点数をより低く重み付けするものである。
続いて、検索実行部22は、初期値としてi=1を設定し(ステップS303)、検索キーワードセットKeywordSetAllから検索キーワードW(i)を除いた検索キーワード群としてKeywordSet[i]を定義する(ステップS304)。ここではでi=1が設定されていることから、検索キーワード群としてKeywordSet[1]が得られる。
ステップS305では、検索実行部22は、内部バス27を介して文書データベース25へアクセスし、ステップS205にて得られた検索キーワード群KeywordSet[i]を用いて、文書データベース25を再検索し、検索結果セットResultSet[i]を取得する。なお、ここではi=1が設定されていることから、検索キーワード群KeywordSet[1]を用いて検索結果セットResultSet[1]が得られる。
ステップS306では、検索キーワード寄与度演算部29は、積算値の初期化を行うため、積算値Sum[i]に初期値として「0」を設定し、j=1を設定する(ステップS307)。
ステップS308では、検索キーワード寄与度演算部29は、検索結果セットResultSetAllであるR[j]に含まれるドキュメントうち、ステップS304にて得られた検索キーワード群KeywordSet[i]による検索結果セットResultSet[i]に含まれるドキュメントに一致するものがあるか否かを判定する。すなわち、ResultSetAllであるR[j]に含まれResultSet[i]に含まれないドキュメントがある場合には、ステップS309へ進み、当該ドキュメントに対しその重み付け後の点数(WeightedScore)であるC[j](上述のステップS302で設定されたドキュメント毎の有用性に基づき重み付け後の点数)を積算し、ステップS310へ進む。一方、ResultSetAllであるR[j]に含まれResultSet[i]に含まれないドキュメントが存在しない場合には、ステップS310へ進む。
ステップS310では、検索キーワード寄与度演算部29は、jにj+1を設定する(jを1だけインクリメントする)。続いて、検索キーワード寄与度演算部29は、jがmに達したか否かを判定し(ステップS311)、jがmに達していない場合はステップS308へ戻り、ステップS308〜ステップS311までの処理を繰り返し実行する。ステップS311にて、jがmに達した場合はステップS312へ進む。
ステップS312では、検索キーワード寄与度演算部29は、iにi+1を設定する(iを1だけインクリメントする)。続いて、検索キーワード寄与度演算部29は、iがnに達したか否かを判定し(ステップS313)、iがnに達していない場合はステップS304へ戻り、検索実行部22がステップS304及びステップS305の処理を、検索キーワード寄与度演算部29がステップS306〜ステップS313までの処理を繰り返し実行する。ステップS313にて、iがnに達した場合はステップS314へ進む。
ステップS314では、検索キーワード寄与度演算部29は、検索キーワードW[i]の寄与度として、Sum[i]/STを算出し、内部バス27を介して検索結果表示制御部24へ転送する。ここで、STは上述の通り、ST=Σ(S[i]:i=1〜m)である。検索結果表示制御部24は、検索キーワードW[i]と共に検索キーワードW[i]の寄与度であるSum[i]/STを、表示部4の画面上に表示する。
特に、図示しないが、検索キーワード寄与度演算部29は、ステップS314にて、内部バス27を介して記憶部26へアクセスし、検索キーワードW[i]、検索キーワードW[i]の寄与度であるSum[i]/ST及び検索結果のドキュメントを、図7に示したように、「キーワード」、「影響度」、「寄与度」及び「影響を受けた項目(ドキュメント)」の各欄に格納する。
上述のステップS308におけるドキュメントを比較する処理、すなわち、検索結果セットResultSetAllであるR[j]に含まれるドキュメントと、ステップS305にて得られた検索キーワード群KeywordSet[i]による検索結果セットResultSet[i]に含まれるドキュメントとの比較は、例えば、ドキュメントのタイトルや作成日付、作成者、ドキュメントサイズ等の情報に基づき、それぞれのドキュメントにハッシュ値を付与しておいてデータ比較処理を高速化しても良い。
図9は、図6に示す表示部4の表示画面例であって、検索結果の有用性の入力画面の一例であり、図10は、図6に示す表示部4の表示画面例であって、検索キーワードの寄与度を表示する画面例である。
図9に示すように、表示画面40は、検索実施者(ユーザ)により検索キーワードが入力される検索キーワード入力欄としての第1表示領域41、検索キーワード毎に検索キーワード影響度を表示する第2表示領域42、及び入力された検索キーワードによる検索結果を表示する第3表示領域43から構成される。検索キーワード入力欄としての第1表示領域41に隣接し、「実行」ボタン47が表示画面40上に配されており、検索実施者(ユーザ)によりマウス等の入力部3を用いてカーソルが「実行」ボタン47上に位置付けられクリックされると、情報検索部2aは、実施例1と同様に、上述の図4に示したステップS201〜ステップS215の処理を実行する。第2表示領域42は、検索キーワード表示領域44及び検索キーワード影響度表示領域45から構成され、検索キーワード影響度表示領域45は、検索キーワード影響度を数値と共に棒グラフ状に表示する。なお、検索キーワード影響度表示領域45に表示される検索キーワードの影響度は、棒グラフ状に限らず、他の表示形態であっても良く、検索実施者(ユーザ)に視認可能な表示形態であればいずれの表示形態としても良い。
第2表示領域42の上部には、「寄与度計算」実行ボタン49が配されており、検索実施者(ユーザ)によりマウス等の入力部3を用いてカーソルが「寄与度計算」実行ボタン49上に位置付けられクリックされると、情報検索部2aは、上述の図8に示したステップS301〜ステップS314を実行する。
また、図9に示す表示画面例では、検索キーワードとして、4つのキーワード、Keyword−1、Keyword−2、Keyword−3、及びKeyword−4が、検索キーワード入力欄としての第1表示領域41に入力され、その検索結果であるResultSetAllに含まれるドキュメントが第3表示領域43にリスト表示された状態を示している。検索実施者(ユーザ)は、第3表示領域43の右端に表示されるクロールバーを下方へスクロールすることで、検索結果であるResultSetAllに含まれる全てのドキュメントを確認することができる。第3表示領域43にリスト表示されたResultSetAllに含まれる各ドキュメントの左側には、検索実施者(ユーザ)による「有用」または「不要」を選択指定可能とする有用性選択指定ボタン48を有する。検索実施者(ユーザ)は、第3表示領域43にリスト表示された検索結果であるResultSetAllに含まれる全てのドキュメントに対し、検索実施者(ユーザ)の意図に合致するものか否かを容易に判断でき、マウス等の入力部3を用いて所望のドキュメントの有用性選択指定ボタン48の「有用」または「不要」の位置にカーソルを移動させクリックすることで、有用性の評価入力を行うことができる。
図10に示す状態は、検索実施者(ユーザ)により、第3表示領域43にリスト表示された索結果であるResultSetAllに含まれる全てのドキュメントのうち、「Document Title 1 aaaaaa.doc」に対し有用性選択指定ボタン48の「有用」が指定され、「Document Title 2 bbbbbb.xls」及び「Document Title 5 eeeeee.txt」に対し有用性選択指定ボタン48の「不要」が指定され、その他の「Document Title 3 cccccc.pdf」、「Document Title 4 dddddd.html」、及び「Document Title 6 ffffff.jpg」に対し、有用/不要の何れも指定されていない状態を示している。そして、この状態において、図9に示す「寄与度計算」実行ボタン49が検索実施者(ユーザ)によりマウス等の入力部3を用いてクリックされると、上述の検索結果有効性入力受付部28は、図8に示すステップS301を実行し、ステップS302〜ステップS305までを検索実行部22が実行し、ステップS306〜ステップS314までを検索キーワード寄与度演算部29が実行する。
図10に示すように、検索キーワード寄与度演算部29により、検索キーワード毎に寄与度が求められると、図9に示した表示状態、すなわち、検索キーワード表示領域44及び検索キーワード影響度表示領域45から構成される第2表示領域42は、検索キーワード表示領域44及び検索キーワード寄与度表示領域50よりなる表示状態に切り替わる。具体的には、検索キーワードKeyword−2は、検索キーワード寄与度が80%、検索キーワードKeyword−3は、検索キーワード寄与度が40%、検索キーワードKeyword−4は、検索キーワード寄与度が10%、及び検索キーワードKeyword−1は、検索キーワード寄与度が−30%として、棒グラフと共に検索キーワード寄与度表示領域50に表示される。なお、図10に示す例では、第2表示領域42中の検索キーワード寄与度表示領域50に、寄与度の数値と共に棒グラフ状にて表示する構成としたがこれに限られるものではない。検索キーワード寄与度表示領域50に表示される寄与度は、他の表示形態であっても良く、検索実施者(ユーザ)に視認可能な表示形態であればいずれの形態としても良い。
また、本実施例では、ある検索キーワードW[i]に対して、検索結果セットResultSetAllには含まれるが、検索キーワードW[i]を除いた検索キーワードセット群KeywordSet[i]による検索結果セットResultSet[i]には含まれないドキュメント、すなわち、検索キーワードW[i]が主要因となって検索されたドキュメントが検索実施者(ユーザ)によって多数「不要」と判断された場合には寄与度は負数になる場合があり、このような検索キーワードW[i]は削除或いは変更すべきであるため、図10に示す検索キーワード寄与度表示領域50に定量的に表示される寄与度により、検索実施者(ユーザ)は容易に判断することが可能となる。
なお、本実施例では、情報検索部2aを構成する検索キーワード寄与度演算部29が検索キーワード毎に検索結果に対する寄与度を求める構成としたが、必ずしもこれに限られるものではない。例えば、予め寄与度に対する閾値を記憶部26の所定の記憶領域に格納しておき、検索キーワード寄与度演算部29が、図8に示したステップS314の実行にえられた、検索キーワードW[i]の寄与度であるSum[i]/STと閾値を比較し、当該寄与度が閾値以下である場合には、検索キーワードW[i]を検索キーワードセットKeywordSetAllから自動的に除外する構成としても良い。
また、本実施例の情報検索部2aが学習機能を有する構成としても良い。この場合、図10にて説明したように、第3表示領域43に表示される検索キーワードに影響を受け、また、検索キーワード毎の寄与度の算出に用いられる、各ドキュメントに対する「有用」または「不要」の指定入力受付状況を、ユーザIDに紐付けて、検索キーワードと対応付けて格納することで学習用データベースを構成する。「不要」とされた、又は「不要」属性が付加されたドキュメントを、次回以降の情報検索時(検索キーワードによる文書データベース25に格納されるドキュメントの検索時)において、検索キーワード寄与度演算部29または検索実行部22が内部バス27を介して上記学習用データベースを参照し、対応する検索キーワードが入力された場合であっても、当該ドキュメント(ドキュメント名)を第3表示領域43に非表示とする。具体的には、図10に示す例では、ドキュメント「Document Title 2 bbbbbb.xls」及び「Document Title 5 eeeeee.txt」に影響を与える検索キーワードはKeyword−1であり、次回以降の情報検索時において検索キーワード入力欄である第1表示領域41に、仮に、Keyword−1が入力された場合であっても、第3表示領域43にドキュメント「Document Title 2 bbbbbb.xls」及び「Document Title 5 eeeeee.txt」が表示されることはない。なお、上述の学習機能は、検索実施者(ユーザ)により有効化又は無効化の選択指定が可能な構成とすることが望ましい。これにより、検索実施者(ユーザ)の作業効率がさらに向上できる。また、上記学習用データベースは、情報検索部2a内の文書データベース25の所定の記憶領域或いは記憶部26の所定の記憶領域に格納しても良く、または、情報検索部2aによりアクセス可能な外部記憶装置にて実現しても良い。
以上の通り、本実施例によれば、実施例1の効果に加え、表示画面上に定量的に検索キーワードの寄与度が表示されることから、検索実施者(ユーザ)は当該検索キーワードの削除または変更を容易に判断することが可能となる。
また、本実施例によれば、検索キーワード寄与度演算部29により求められた寄与度が、予め格納される閾値以下である場合、当該検索キーワードが、検索キーワードセットKeywordSetAllから自動的に除外されるため、検索実施者(ユーザ)による検索結果セット内のドキュメントを確認する時間を短縮でき、作業性の向上を図ることが可能となる。
更にまた、本実施例によれば、情報検索部が学習機能を有することにより、検索実施者(ユーザ)の作業効率を向上することができる。
図11は、本発明の他の実施例に係る実施例3の情報検索装置による検索キーワードの寄与度を算出するための処理フロー図である。本実施例では、上述の実施例2に示した情報検索装置を構成する情報検索部が、入力された検索キーワードに検索結果セットに含まれる複数のドキュメントを複数のカテゴリに分類する機能を備える点が実施例2と異なる。本実施例の情報検索装置を構成する情報検索部は、実施例2において説明した図6に示す情報検索部2aと同一である。実施例2と同様の構成要素に同一の符号を付し、以下では、実施例2と重複する説明を省略する。
上述の実施例2においては、図9及び図10に示したように、検索実施者(ユーザ)にる「有用」または「不要」を選択指定可能とする有用性選択指定ボタン48を有し、検索結果であるResultSetAllに含まれる全てのドキュメントを表示する第3表示領域43の構成では、検索結果であるResultSetAllに含まれるドキュメント数が多い場合、検索実施者(ユーザ)による有用性選択指定ボタン48により各ドキュメントに「有用」または「不要」を指定入力する手間がかかる。換言すれば、「有用」または「不要」の指定入力に多くの時間を要することとなる。そこで、本実施例では、情報検索装置1を構成する情報検索部2a(図6)が、検索結果であるResultSetAllに含まれる全てのドキュメントを、複数のカテゴリに分類し、カテゴリ毎(カテゴリ単位)に有用性選択指定ボタン48により各ドキュメントに「有用」または「不要」を指定入力する構成としている。
以下に、情報検索部2aの処理フローについて説明する。なお、情報検索部2aによる検索キーワードの影響度の算出については、上述の実施例1で説明した図4に示すステップS201〜ステップS215と同様であるため説明を省略する。図11に示すように、ステップS401では、検索実行部22は、検索キーワードセットKeywordSetAllによる検索結果セットResultSetAll={R[1],R[2],R[3],・・・,R[m]}(m:自然数)を、複数のカテゴリに分類する。
ここで、複数のカテゴリに分類する方法について説明する。検索実行部22は、例えば、以下に示すカテゴリ分類法を実行する。
(カテゴリ分類法)
検索実行部22は、文書データベース25内に格納される全てのドキュメントについて、ある任意の2つのドキュメント(ドキュメントAとドキュメントB)間の距離を求める。ドキュメントA及びドキュメントB間の距離は以下に示す方法で算出する。
先ず、文書データベース25に格納されているドキュメントの有効語の個数をNとし、有効語群を(W,W,W,・・・,W)とする。
続いて、ドキュメントAに出現するWからWの有効語の個数をカウントし、ドキュメントAの特徴ベクトル(W1A,W2A,W3A,・・・,WNA)を生成する。
ここで例えば、W1AはドキュメントAに出現する有効語Wの個数である。
同様に、ドキュメントBに出現するWからWの有効語の個数をカウントし、ドキュメントBの特徴ベクトル(W1B,W2B,W3B,・・・,WNB)を生成する。
このとき、ドキュメントAとドキュメントBとの距離DABは、以下の式(1)となる。
Figure 0006534454
ドキュメント間の距離DABが小さければ、これら2つのドキュメントA及びドキュメントBが類似していることを示すため、上述の式(1)に示すドキュメント間の距離DABが所定の閾値以下のドキュメントを抽出してグルーピングする。この処理を、検索結果のランキングが上位のドキュメントから順次行う(既にグルーピングされているドキュメントについては除く)。
一方、あるドキュメントについて、上述の式(1)に示すドキュメント間の距離DABが所定の閾値以下の他のドキュメントが無ければ、そのドキュメントについてはグルーピングしない。
図11に戻り、ステップS402では、検索実行部22は、ステップS401にて分類した各カテゴリに対し、検索実施者(ユーザ)により入力部3を介して有用性に関する評価が入力されると、情報検索部2aを構成する検索結果有効性入力受付部28(図6)が、前記検索結果セットに含まれる各ドキュメントに対する有用性の評価入力を受付ける。
ステップS403では、検索実行部22は、検索結果セットResultSetAllに含まれる各ドキュメントが属するカテゴリを調べ、そのカテゴリの有用性の評価に基づき点数セントの重み付けを行う。具体的には、各カテゴリに属するドキュメントに対し付される重み付け後の点数セットWeightedScoreSet ={C[1]、C[2]、C[3]、・・・、C[m]}を得る。
続いて、検索実行部22は、上述の実施例2にて説明した図8に示すステップS303〜ステップS305を実行し、検索キーワード寄与度演算部29は、同様に図8に示すステップS306〜ステップS314までの処理を実行し、検索キーワードW[i]の寄与度として、Sum[i]/STを算出し、内部バス27を介して検索結果表示制御部24へ転送する。ここで、STは上述の通り、ST=Σ(S[i]:i=1〜m)である。検索結果表示制御部24は、検索キーワードW[i]と共に検索キーワードW[i]の寄与度であるSum[i]/STを、表示部4の画面上に表示する。
特に、図示しないが、検索キーワード寄与度演算部29は、ステップS314にて、内部バス27を介して記憶部26へアクセスし、検索キーワードW[i]、検索キーワードW[i]の寄与度であるSum[i]/ST及び検索結果のドキュメントを、図7に示したように、「キーワード」、「影響度」、「寄与度」及び「影響を受けた項目(ドキュメント)」の各欄に格納する。
図12及び図13は、表示部4の表示画面例である。図12に示すように、表示画面40の第3表示領域には、検索結果セットResultSetAllに含まれるドキュメントがカテゴリ分類され(グルーピングされ)、それぞれグルーピングされたドキュメントのうち、代表のドキュメントが表示されている。例えば、グルーピングされた一のカテゴリに属する「Document Title 1 aaaaaa.doc」が最上位に表示され、その左側に検索実施者(ユーザ)による「有用」または「不要」を選択指定可能とする有用性選択指定ボタン48が設けられている。また、「Document Title 1」の右側には、アンダーバーが付された「類似ドキュメントを展開する」が表示されている。同様に、その直下に「Document Title 5 eeeeee.txt」が表示され、更に、その直下に「Document Title 18 rrrrrr.doc」が表示される。その他の表示形態は、実施例2において説明した図9に示す表示形態と同様である。このように、本実施例では、検索結果セットResultSetAllに含まれる複数のドキュメントを、複数のカテゴリに分類し、各カテゴリを代表する一のドキュメントのみが、第3表示領域43に表示されることから、グルーピングされたカテゴリ単位で、検索実施者(ユーザ)は、有用性選択指定ボタン48により「有用」または「不要」を指定入力でき、有用性の評価入力に要する時間が短縮化され、作業性を向上することが可能となる。
なお、図12に示す画面表示状態において、最上位に表示される「Document Title 1 aaaaaa.doc」の右側に表示されるアンダーバーが付された「類似ドキュメントを展開する」に、検索実施者(ユーザ)がマウス等の入力部3によりカーソルを移動しクリックすると、表示画面40は、図13に示す表示形態に遷移する。すなわち、図13に示すように、「Document Title 1 aaaaaa.doc」と同一のカテゴリにグルーピングされた、4つのドキュメント、「Document Title 2 bbbbbb.xls」、「Document Title 3 cccccc.pdf」、「Document Title 4 dddddd.html」、及び「Document Title 6 ffffff.jpg」が展開され第3表示領域43内に表示される。これにより、検索実施者(ユーザ)は、ドキュメント「Document Title 1 aaaaaa.doc」と同一のカテゴリにグルーピングされた類似ドキュメントを容易に確認することができる。
図13に示すように、展開後の「Document Title 1」の右側には、アンダーバーが付された「類似ドキュメントを折り畳む」が表示されており、検索実施者(ユーザ)がマウス等の入力部3によりカーソルを、このアンダーバーが付された「類似ドキュメントを折り畳む」へ移動しクリックすることで、再び、図12に示す表示形態に遷移する。
以上の通り、検索結果セットの全てのドキュメント毎に個々に有用性を指定入力できる実施例2の表示画面の構成と比較し、カテゴリ毎に有用性を指定入力し得る本実施例によれば、検索キーワード寄与度演算部29により算出される寄与度に誤差が含まれる可能性が生じるものの、検索実施者(ユーザ)による有用性の評価入力数を大幅に減じることができ、有用性の評価入力に要する時間が短縮化され、作業性を向上することが可能となる。
図14は、本発明の他の実施例に係る実施例4の情報検索装置の外観図及び機能ブロック図である。本実施例では、上述の実施例2に示した情報検索装置を構成する情報検索部に、更に、関連語データベース、関連語カテゴリ指定入力受付部、検索キーワード関連語導出部、及び検索キーワード編集部を設けた点が実施例2と異なる。実施例2と同様の構成要素に同一符号を付し、以下では実施例2と重複する説明を省略する。
図14に示すように、本実施例の情報検索装置1を構成する情報検索部2bは、キーボードまたはマウス等の入力部3、LCDまたは有機ELディスプレイ等の表示部4、及び情報検索部2aから構成される。情報検索部2bは、検索実施者(ユーザ)により入力部3を介して入力される検索キーワードを受け付ける検索キーワード入力受付部21、上述のように文書データまたは画像データ等のドキュメントを格納する文書データベース25、入力された検索キーワードに基づき例えば既知の検索エンジンにより文書データベース25内に格納されるドキュメントを検索する検索実行部22、入力された検索キーワードが検索実行部22により得られた検索結果に及ぼす影響度を求める検索キーワード影響度演算部23、検索実施者(ユーザ)により入力部3を介して入力される検索結果に対する有効性を受け付ける検索結果有効性入力受付部28、入力された検索キーワードの検索結果に対する寄与度を求める検索キーワード寄与度演算部29、関連語データベース30、検索実施者(ユーザ)により入力部3を介して指定入力される関連語を受け付ける関連語指定入力受付部31、検索キーワード関連語導出部32、検索キーワード編集部33、検索キーワード影響度演算部23により得られた影響度と検索キーワード寄与度演算部29により得られた寄与度を、キーワード毎に対応付けて影響を受けたドキュメントと共に格納する記憶部26、及び少なくとも検索結果等を表示部4の表示画面上に表示するよう制御する検索結果表示制御部24を備える。なお、本実施例では、文書データベース25及び関連語データベース30を、情報検索装置1の情報検索部2b内に備える構成を一例として説明するが、これに限られるものではない。例えば、文書データベース25及び関連語データベース30を外部記憶装置として、情報検索装置1に接続する構成としても良い。
これら、検索キーワード入力受付部21、検索結果有効性入力受付部28、関連語指定入力受付部31、検索実行部22、検索キーワード影響度演算部23、検索キーワード寄与度演算部29、検索キーワード関連語導出部32、検索キーワード編集部33、検索結果表示制御部24、記憶部26、文書データベース25、及び関連語データベース30は、内部バス27にて相互にアクセス可能に接続されている。ここで、検索実行部22、検索キーワード影響度演算部23、検索キーワード寄与度演算部29、検索キーワード関連語導出部32、検索キーワード編集部33、及び検索結果表示制御部24は、例えば、図示しない各種プログラムを格納するROM、演算過程または処理過程のデータを一時的に格納するRAM等の記憶装置と、CPU等のプロセッサにて実現される。プロセッサは、ROMに格納される各種プログラムを読み出し、読み出されたプログラムを実行する。
図15は、図14に示す情報検索部2bによる検索キーワードを編集する処理フロー図である。なお、情報検索部2bによる検索キーワードの影響度の算出については、上述の実施例1にて説明した図4に示すステップS201〜ステップS215と同様であり、また、情報検索部2bによる検索キーワードの寄与度の算出については、上述の実施例2にて説明した図8に示すステップS301〜ステップS314と同様であるため、説明を省略する。
図15に示すように、ステップS501では、検索実施者(ユーザ)により入力部3を介して検索したい情報のカテゴリが入力されると、情報検索部2bを構成する関連語カテゴリ指定入力受付部31(図14)が、上記検索実施者(ユーザ)により入力されたカテゴリを受け付ける。ここで、検索実施者(ユーザ)による検索したい情報のカテゴリの入力を可能とする表示部4に表示される表示画面については後述する。
続いてステップS502では、検索キーワード関連語導出部32は、内部バス27を介して関連語データベース30へアクセスし、検索キーワードセットKeywordSetAllに含まれる各キーワードに対し、検索したい情報のカテゴリにマッチした関連語を、関連語データベース30から検索し抽出する。
ステップS503では、検索キーワード編集部33は、ステップS502にて得られた関連語を表示部4へ検索結果表示制御部24を介して表示する。すなわち、検索キーワード編集部33は、検索実施者(ユーザ)に対し、検索キーワードの指定変更入力(編集)を受け付ける入力画面を表示部4に表示する。ここで、検索キーワードの指定変更入力(編集)には、「関連語への置き換え」、「検索キーワードの追加」、及び「検索キーワードの削除」が含まれる。
続いて、ステップS504では、検索キーワード編集部33は、更新された検索キーワードセットKeywordSetAllを、内部バス27を介して検索実行部22へ転送する。検索実行部22は、内部バス27を介して文書データベース25へアクセスし、更新された検索キーワードセットKeywordSetAllにより検索を再実行し、検索結果を、検索結果表示制御部24を介して表示部4へ表示する。
図16は、図14に示す表示部4の表示画面例であって、関連語カテゴリを選択する入力画面の一例である。図16に示すように、表示画面40は、実施例1にて説明した図5に示す表示画面構成に対し、更に、検索実施者(ユーザ)により検索したい情報のカテゴリが入力されるカテゴリ選択指定入力欄としての第4表示領域51を有する。その他の第1表示領域41、第2表示領域42、及び第3表示領域43は、図5と同様である。図16に示す例では、第4表示領域51において、「Category−1」、「Category−5」、及び「Category−6」が選択指定された状態を示している。
ここで関連語データベース30について図17及び図18を用いて以下に説明する。図17は、図14に示す関連語データベース30を構築する処理フロー図である。
図17に示すように、ステップS601では、検索キーワード関連語導出部32は、内部バス27を介して文書データベース25へアクセスし、文書データベース25に格納される文書(ドキュメント)から、その中で使用されている全ての語句を抽出する。
ステップS602では、検索キーワード関連語導出部32は、ステップS601にて抽出した各語句を検索キーワードとして、文書データベース25を検索した結果の文書中に頻出する語句を「関連語」として、関連語データベース30に登録する。
ステップS603では、検索キーワード関連語導出部32は、更に、各語句が属するカテゴリを関連語データベースに登録する。なお、ここでのカテゴリ分類は、例えば、ある語句を検索キーワードとして検索した結果である検索結果セットに含まれる複数のドキュメントに対し、上述の実施例3にて説明した式(1)を用いてグルーピングすることにより行われる。なお、必ずしもこれに限られず、手作業にてカテゴリを登録しても良い。
図18に、図14に示す関連語データベース30のデータ構造の説明図を示す。図18に示すように、関連語データベース30は、各「語句」毎に、「関連語」及び「カテゴリ」を対応付けて格納している。例えば、「語句」が“Word−1”では、「関連語」が“Word−2,Word−3,Word−4”であり、「カテゴリ」は“Category−1,Category−2”である。また、「語句」が“Word−2”では、「関連語」が“Word−1,Word−3,Word−5”であり、「カテゴリ」は“Category−2,Category−3”である。「語句」が“Word−3”では、「関連語」が“Word−1,Word−2,Word−6”であり、「カテゴリ」は“Category−4,Category−5”である。「語句」が“Word−4”では、「関連語」が“Word−1,Word−5,Word−6”であり、「カテゴリ」は“Category−5,Category−6”である。
図16に示すように、検索実施者(ユーザ)が関連語カテゴリとして、例えば、表示画面40中の第4表示領域51に示すように、“Category−1”、“Category−5”、及び“Category−6”を選択指定したとする。この場合、検索キーワード関連語導出部32は、内部バス27を介して関連語データベース30へアクセスする。このとき、図18に示すように、関連語データベース30では、「語句」が“Word−1”の「関連語」は“Word−2,Word−3,Word−4”であり、改めて「語句」が“Word−2”の「カテゴリ」を調べると“Category−2,Category−3”となっている。これは検索実施者(ユーザ)が選択指定したカテゴリ“Category−1”、“Category−5”、及び“Category−6”とはマッチしない。
これに対し「語句」が“Word−3”の「カテゴリ」は“Category−4,Category−5”であり、「語句」が“Word−4”の「カテゴリ」は“Category−5,Category−6”であり、検索実施者(ユーザ)が選択指定したカテゴリ“Category−1”、“Category−5”、及び“Category−6”とマッチしている。そこで、検索キーワード関連語導出部32は、“Word−1”の「関連語」として、“Word−3”と“Word−4”を選択する。
図19は、図14に示す表示部4の表示画面例であって、検索キーワードを編集する画面例である。図19に示すように、検索キーワード入力欄である第1表示領域41へ、検索実施者(ユーザ)によりマウス等の入力部3によりマウスポインタ(白抜き矢印で示す)が移動され、“Keyword−4”に位置すると、検索キーワード編集メニュー52がポップアップ表示される。これは、上述の図15におけるステップS503の処理に相当する。図19に示す例では、検索キーワード編集メニュー52は、関連語選択53、キーワード追加54、及びキーワード削除55の編集項目を有し、そのうち、関連語選択53の編集項目が選択され、表示される4つの関連語、「RelatedWord−1」、「RelatedWord−2」、「RelatedWord−3」及び「RelatedWord−4」の中から「RelatedWord−2」が選択された状態を示している。この状態で、「置換/追加」ボタン56により「置換」への指示入力を受け付けると、「RelatedWord−2」が第1表示領域41に入力される。すなわち、第1表示領域41中の“Keyword−4”が関連語である“RelatedWord−2”に置き換わる。
本実施例によれば、実施例1〜実施例3の効果に加え、関連語のカテゴリを検索実施者(ユーザ)が予め選択指定することにより、不要な関連語が検索キーワード編集メニュー52中に提示されず、検索結果に含まれるノイズを低減でき、より迅速に有用な情報を検索結果として得ることが可能となる。
図20は、本発明の他の実施例に係る実施例5の情報検索システムの全体概略構成図である。図20に示すように、情報検索システム10は、情報検索装置1a、複数のユーザ端末装置5a〜5c、及びこれらを接続するネットワーク6から構成される。情報検索装置1aは、例えば、サーバにて実現され、ユーザ端末装置5a〜5cは、例えば、モバイルコンピュータ、デスクトップコンピュータ、スマートフォン、及びタブレット等により実現される。
ユーザ端末装置5a〜5cには、予めネットワーク6を介して、情報検索装置1aから検索キーワードを入力するための入力画面、検索キーワードの影響度及び検索キーワードにより抽出された各種ドキュメントを表示する画面、及び表示画面上で、複数の検索キーワードのうち、所望の検索キーワードを選択指定することで、検索結果のドキュメントを表示する領域中に表示される複数のドキュメントのうち、選択指定された検索キーワードにより影響が与えられるドキュメントのみを、例えば、ハイライト表示する等、他の表示されるドキュメントと識別可能に表示する表示制御用プログラムが予めダウンロードされインストールされている。これにより、ユーザ端末装置5a〜5cは、任意の検索キーワードの入力及び当該検索キーワードによる検索結果並びに、検索キーワードの影響度の表示を、自身の表示部に表示することができる状態とされている。
図21は、図20に示す情報検索装置の機能ブロック図である。実施例1〜実施例4と同一の構成要素に同一の符号を付している。図21に示すように、情報検索装置1aを構成する情報検索部2cは、通信I/F34、検索実行部22、検索キーワード影響度演算部23、文書データまたは画像データ等のドキュメントを格納する文書データベース25、及び記憶部26を備える。なお、本実施例では、文書データベース25を、情報検索装置1aの情報検索部2c内に備える構成を一例として説明するが、これに限られるものではない。例えば、文書データベース25を外部記憶装置として、情報検索装置1aに接続する構成としても良い。
これら、通信I/F34、検索実行部22、検索キーワード影響度演算部23、記憶部26、及び文書データベース25は、内部バス27にて相互にアクセス可能に接続されている。
例えば、ユーザ端末装置5a〜5cのうち、ユーザ端末装置5aより、ネットワーク6を介して検索キーワードセットW[1]、W[2]、W[3]、・・・、W[n](検索キーワードセット)が通信I/F34に受信されると、通信I/F34は、内部バス27を介して検索実行部22へ受信した検索キーワードセットKeywordSetAllを転送する。
検索実行部22は、上述の実施例1にて説明したように、図4に示すステップS201〜ステップS206を実行し、検索キーワード影響度演算部23は、図4に示すステップS207〜ステップS215を実行する。検索キーワード影響度演算部23は、検索キーワードW[i]の影響度Eとして、Sum[i]/STを算出し、内部バス27及び通信I/F34を介して、ユーザ端末装置5aへ送信する。ユーザ端末装置5aの表示画面上には、実施例1で説明した図5に示す表示内容が表示される。
なお、本実施例では、情報検索部2cの構成を、実施例1に示した情報検索部2と類似する構成としたが、これに代えて、図6に示した情報検索部2aと類似する構成、すなわち、情報検索部2cが、通信I/F34、検索実行部22、検索キーワード影響度演算部23、文書データまたは画像データ等のドキュメントを格納する文書データベース25、及び記憶部26に加え、更に、検索キーワード寄与度演算部29を有する構成としても良い。また、情報検索部2cが、図14に示した関連語データベース30、検索キーワード関連語導出部、及び検索キーワード編集部33を更に備える構成としても良い。
本実施例によれば、複数のユーザ端末装置が情報検索装置を共有することができ、上述の実施例1〜実施例4による効果を達成できる。
なお、本発明は上記した実施例に限定されるものではなく、様々な変形例が含まれる。例えば、上記した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。
1,1a・・・情報検索装置,2,2a,2b,2c・・・情報検索部,3,3a・・・入力部,4,4a・・・表示部,5a,5b,5c・・・ユーザ端末装置,6・・・ネットワーク,10・・・情報検索システム,21・・・検索キーワード入力受付部,22・・・検索実行部,23・・・検索キーワード影響度演算部,24・・・検索結果表示制御部,25・・・文書データベース,26・・・記憶部,27・・・内部バス,28・・・検索結果有効性入力受付部,29・・・検索キーワード寄与度演算部,30・・・関連語データベース,31・・・関連語カテゴリ指定入力受付部,32・・・検索キーワード関連語導出部,33・・・検索キーワード編集部,34・・・通信I/F,40・・・表示画面,41・・・第1表示領域(検索キーワード入力欄),42・・・第2表示領域,43・・・第3表示領域(検索結果表示領域),44・・・検索キーワード表示領域,45・・・検索キーワード影響度表示領域,46・・・ハイライト表示例,47・・・実行ボタン,48・・・有用性選択指定ボタン,49・・・寄与度計算実行ボタン,50・・・検索キーワード寄与度表示領域,51・・・第4表示領域(カテゴリ選択指定入力欄),52・・・検索キーワード編集メニュー,53・・・関連語一覧,54・・・検索キーワード追加,55・・・検索キーワード削除,56・・・置換/追加ボタン

Claims (12)

  1. 複数の検索キーワードの入力を受け付けるキーワード入力受付部と、
    文書データ及び/又は画像データを含む複数のドキュメントを格納する文書データベースから、受け付けられた前記複数の検索キーワードに基づき検索結果として複数のドキュメントを抽出する検索実行部と、
    前記受け付けられた検索キーワードの有無が前記検索結果に及ぼす影響度を、検索キーワード毎に求める検索キーワード影響度演算部と、
    前記検索結果と共に前記検索キーワード毎の影響度を画面上に表示する表示部と、
    を備え
    前記検索実行部は、前記複数の検索キーワードのうち、特定の検索キーワードを除いた他の複数の検索キーワードに基づき検索結果として複数のドキュメントを抽出し、
    前記検索キーワード影響度演算部は、前記特定の検索キーワードを除いた他の複数の検索キーワードに基づく検索結果に含まれる複数のドキュメントと、前記受け付けられた複数の検索キーワードに基づく検索結果に含まれる複数のドキュメントとの差分により、前記特定の検索キーワードの有無が検索結果に及ぼす影響度を求めることを特徴とする情報検索装置。
  2. 請求項1に記載の情報検索装置において、
    前記表示部に表示される検索結果に含まれる複数のドキュメントに対する有用性の入力を受け付ける検索結果有効性入力受付部と、
    受け付けられた各ドキュメントに対する有用性に基づき、前記各ドキュメントに付す点数を設定し、前記点数に基づき各検索キーワードの前記検索結果に対する寄与度を求める検索キーワード寄与度演算部と、を備え、
    前記検索結果及び前記影響度と共に各検索キーワードの前記検索結果に対する寄与度を、前記表示部の画面上に表示することを特徴とする情報検索装置。
  3. 請求項2に記載の情報検索装置において、
    前記検索実行部は、前記検索結果に含まれる複数のドキュメントを、各ドキュメント間の類似度に基づきカテゴリ分類し、
    前記検索結果有効性入力受付部は、前記表示部に表示される各カテゴリに対する有用性の入力を受け付けることを特徴とする情報検索装置。
  4. 請求項3に記載の情報検索装置において、
    前記表示部の表示画面は、
    前記複数の検索キーワードが入力される第1表示領域と、
    検索キーワード毎に、前記影響度又は寄与度を表示する第2表示領域と、
    前記検索結果に含まれる複数のドキュメントを表示する第3表示領域と、を備えることを特徴とする情報検索装置。
  5. 請求項4に記載の情報検索装置において、
    予め検索キーワード毎に、前記文書データベースを検索した検索結果のドキュメント中に頻出する語句を関連語として、カテゴリに対応付けて格納する関連語データベースと、
    検索したい情報のカテゴリを受け付ける関連語カテゴリ入力受付部と、
    前記関連語データベースにアクセスし、前記検索したい情報のカテゴリにマッチする関連語を抽出する検索キーワード関連語導出部と、
    前記検索キーワード関連語導出部により抽出された関連語を前記表示部に表示し、当該表示された関連語に対する指定入力に応じて、前記第1表示領域に表示される検索キーワードを編集する検索キーワード編集部と、を備えることを特徴とする情報検索装置。
  6. 少なくとも、入力部と、検索実行部と、検索キーワード影響度演算部と、表示部と、を有する情報検索装置の情報検索方法であって、
    前記入力部より複数の検索キーワードの入力を受け付けるキーワード入力受付工程と、
    前記検索実行部が、文書データ及び/又は画像データを含む複数のドキュメントを格納する文書データベースから、受け付けられた前記複数の検索キーワードに基づき検索結果として複数のドキュメントを抽出する検索工程と、
    前記検索キーワード影響度演算部が、前記受け付けられた検索キーワードの有無が前記検索結果に及ぼす影響度を、検索キーワード毎に求める検索キーワード影響度演算工程と、
    前記検索結果と共に前記検索キーワード毎の影響度を表示部の画面上に表示する表示工程と、を有し、
    前記検索工程は、前記検索実行部が、前記複数の検索キーワードのうち、特定の検索キーワードを除いた他の複数の検索キーワードに基づき検索結果として複数のドキュメントを抽出し、
    前記検索キーワード影響度演算工程は、前記検索キーワード影響度演算部が、前記特定の検索キーワードを除いた他の複数の検索キーワードに基づく検索結果に含まれる複数のドキュメントと、前記受け付けられた複数の検索キーワードに基づく検索結果に含まれる複数のドキュメントとの差分により、前記特定の検索キーワードの有無が検索結果に及ぼす影響度を求めることを特徴とする情報検索方法
  7. 請求項6に記載の情報検索方法において、
    検索結果有効性入力受付部が、前記表示部に表示される検索結果に含まれる複数のドキュメントに対する有用性の入力を受け付ける検索結果有効性入力受付工程と、
    検索キーワード寄与度演算部が、受け付けられた各ドキュメントに対する有用性に基づき、前記各ドキュメントに付す点数を設定し、前記点数に基づき各検索キーワードの前記検索結果に対する寄与度を求める検索キーワード寄与度演算工程と、を有し、
    前記表示工程は、前記検索結果及び前記影響度と共に各検索キーワードの前記検索結果に対する寄与度を、前記表示部の画面上に表示することを特徴とする情報検索方法。
  8. 請求項7に記載の情報検索方法において、
    前記検索工程は、前記検索実行部が、前記検索結果に含まれる複数のドキュメントを、各ドキュメント間の類似度に基づきカテゴリ分類し、
    前記検索結果有効性入力受付工程は、前記検索結果有効性入力受付部が、前記表示部に表示される各カテゴリに対する有用性の入力を受け付けることを特徴とする情報検索方法。
  9. 請求項8に記載の情報検索方法において、
    前記表示部の表示画面は、第1表示領域と、第2表示領域と、第3表示領域とを備え、
    前記表示工程は、入力される複数の検索キーワードを前記第1表示領域に表示し、検索キーワード毎に前記影響度又は寄与度を前記第2表示領域に表示すると共に、前記検索結果に含まれる複数のドキュメントを前記第3表示領域に表示することを特徴とする情報検索方法。
  10. 請求項9に記載の情報検索方法において、
    関連語カテゴリ入力受付部が、検索したい情報のカテゴリを受け付ける関連語カテゴリ入力受付工程と、
    検索キーワード関連語導出部が、予め検索キーワード毎に、前記文書データベースを検索した検索結果のドキュメント中に頻出する語句を関連語として、カテゴリに対応付けて格納する関連語データベースにアクセスし、前記検索したい情報のカテゴリにマッチする関連語を抽出する検索キーワード関連語導出工程と、
    検索キーワード編集部が、前記検索キーワード関連語導出工程により抽出された関連語を前記表示部に表示し、当該表示された関連語に対する指定入力に応じて、前記第1表示領域に表示される検索キーワードを編集する検索キーワード編集工程と、を有することを特徴とする情報検索方法。
  11. 複数のユーザ端末装置とネットワークを介して接続される情報検索装置を有する情報検索システムであって、
    前記情報検索装置は、
    前記ネットワークを介して前記ユーザ端末装置より入力される複数の検索キーワードを受け付けるキーワード入力受付部と、
    文書データ及び/又は画像データを含む複数のドキュメントを格納する文書データベースから、受け付けられた前記複数の検索キーワードに基づき検索結果として複数のドキュメントを抽出する検索実行部と、
    前記受け付けられた検索キーワードの有無が前記検索結果に及ぼす影響度を、検索キーワード毎に求める検索キーワード影響度演算部と、を備え、
    前記検索結果と共に検索キーワード毎の影響度を、前記ネットワークを介して前記ユーザ端末装置へ送信し、
    前記検索実行部は、前記複数の検索キーワードのうち、特定の検索キーワードを除いた他の複数の検索キーワードに基づき検索結果として複数のドキュメントを抽出し、
    検索キーワード影響度演算部は、前記特定の検索キーワードを除いた他の複数の検索キーワードに基づく検索結果に含まれる複数のドキュメントと、前記受け付けられた複数の検索キーワードに基づく検索結果に含まれる複数のドキュメントとの差分により、前記特定の検索キーワードの有無が検索結果に及ぼす影響度を求めることを特徴とする情報検索システム
  12. 請求項11に記載の情報検索システムにおいて、
    前記情報検索装置は、
    前記ユーザ端末装置の表示部に表示される検索結果に含まれる複数のドキュメントに対する有用性の入力を、前記ネットワークを介して受け付ける検索結果有効性入力受付部と、
    受け付けられた各ドキュメントに対する有用性に基づき、前記各ドキュメントに付す点数を設定し、前記点数に基づき各検索キーワードの前記検索結果に対する寄与度を求める検索キーワード寄与度演算部と、を備え、
    前記検索結果及び前記影響度と共に各検索キーワードの前記検索結果に対する寄与度を、前記ネットワークを介して前記ユーザ端末装置へ送信することを特徴とする情報検索システム
JP2017565011A 2016-02-03 2016-02-03 情報検索方法及び情報検索装置並びに情報検索システム Active JP6534454B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2016/053139 WO2017134760A1 (ja) 2016-02-03 2016-02-03 情報検索方法及び情報検索装置並びに情報検索システム

Publications (2)

Publication Number Publication Date
JPWO2017134760A1 JPWO2017134760A1 (ja) 2018-08-02
JP6534454B2 true JP6534454B2 (ja) 2019-06-26

Family

ID=59500740

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017565011A Active JP6534454B2 (ja) 2016-02-03 2016-02-03 情報検索方法及び情報検索装置並びに情報検索システム

Country Status (3)

Country Link
EP (1) EP3413210A4 (ja)
JP (1) JP6534454B2 (ja)
WO (1) WO2017134760A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113918804A (zh) * 2020-07-08 2022-01-11 上海会麦信息科技有限公司 商品信息检索系统及方法
KR20240028020A (ko) * 2022-08-24 2024-03-05 쿠팡 주식회사 주문을 처리하는 방법 및 그 장치

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3578651B2 (ja) * 1998-12-04 2004-10-20 株式会社リコー 文書検索システム、文書検索方法およびその方法を実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2004280661A (ja) * 2003-03-18 2004-10-07 Fujitsu Ltd 検索方法及びプログラム
JP5911492B2 (ja) * 2011-08-05 2016-04-27 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 情報検索システム、方法、及びプログラム
JP6248444B2 (ja) * 2013-07-19 2017-12-20 富士通株式会社 情報処理プログラム、装置、及び方法

Also Published As

Publication number Publication date
WO2017134760A1 (ja) 2017-08-10
JPWO2017134760A1 (ja) 2018-08-02
EP3413210A1 (en) 2018-12-12
EP3413210A4 (en) 2019-06-19

Similar Documents

Publication Publication Date Title
CA2702651C (en) System and method for searching for documents
US7475074B2 (en) Web search system and method thereof
JP4746439B2 (ja) 文書検索サーバおよび文書検索方法
EP3311309A1 (en) Methods and systems for object recognition
KR20070047304A (ko) 지명된 url 엔트리
JP2004220215A (ja) 計算機を利用した業務誘導支援システムおよび業務誘導支援方法
JP5185402B2 (ja) 文書検索装置、文書検索方法、及び文書検索プログラム
JP2004341753A (ja) 検索支援装置、検索支援方法、およびプログラム
JP4973503B2 (ja) ファイル検索プログラム、方法及び装置
JP6534454B2 (ja) 情報検索方法及び情報検索装置並びに情報検索システム
JP2007034772A (ja) Webサイト検索結果の最適表示システム及びその装置及びその方法及びそのプログラム
JP5579140B2 (ja) 文書検索装置及び方法及びプログラム
JP4699909B2 (ja) キーワード対応関係分析装置及び分析方法
JP6287192B2 (ja) 情報処理装置、情報処理方法、プログラム
JP5127553B2 (ja) 情報処理装置、情報処理方法、プログラム及び記録媒体
KR20110094562A (ko) 관련어가 표시되는 관계도를 이용한 효과적인 인터넷 검색 방법
JP5002631B2 (ja) 単語情報収集装置、単語情報収集方法および単語情報収集プログラム
JP6707410B2 (ja) 文献検索装置、文献検索方法およびコンピュータプログラム
US20080021875A1 (en) Method and apparatus for performing a tone-based search
JP5505207B2 (ja) 情報検索装置、情報検索方法及び情報検索プログラム
JP2004133510A (ja) 技術文献検索システム
JP2013156876A (ja) 推薦クエリ抽出装置及び方法及びプログラム
JP2005316881A (ja) 図面検索のためのプログラム、図面検索装置及び図面検索結果表示方法
JP2009003731A (ja) 特許検索システム
JP2007122258A (ja) データ検索装置、データ検索プログラム又はデータ検索方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180413

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190319

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190424

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190514

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190528

R150 Certificate of patent or registration of utility model

Ref document number: 6534454

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150