JP2007310663A - 情報検索支援システム、情報検索支援方法および情報検索支援プログラム - Google Patents

情報検索支援システム、情報検索支援方法および情報検索支援プログラム Download PDF

Info

Publication number
JP2007310663A
JP2007310663A JP2006139174A JP2006139174A JP2007310663A JP 2007310663 A JP2007310663 A JP 2007310663A JP 2006139174 A JP2006139174 A JP 2006139174A JP 2006139174 A JP2006139174 A JP 2006139174A JP 2007310663 A JP2007310663 A JP 2007310663A
Authority
JP
Japan
Prior art keywords
keyword
search
keywords
ranking
target data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006139174A
Other languages
English (en)
Other versions
JP4631795B2 (ja
Inventor
Izumi Nagisa
泉 渚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2006139174A priority Critical patent/JP4631795B2/ja
Publication of JP2007310663A publication Critical patent/JP2007310663A/ja
Application granted granted Critical
Publication of JP4631795B2 publication Critical patent/JP4631795B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】ユーザが入力した検索キーワードと関連性の高いキーワードのみを提示してユーザの検索を支援する。
【解決手段】関連キーワード抽出手段10は、各事例データから関連するキーワードの組を関連キーワードとして抽出し、関連キーワードテーブル80に記憶させる。事例データ検索手段50は、検索キーワードを含む事例データを事例データベース70から検索し、検索結果をキーワード別共起判定手段201に送る。履歴管理手段203は、入力された検索キーワードを記憶する。キーワード別共起判定手段201は、検索結果である事例データから抽出された関連キーワードを参照し、履歴管理手段203に記憶されている検索キーワードと対になっているキーワードを絞り込みキーワードとする。キーワード提示手段30は、絞り込みキーワードをユーザに提示する。
【選択図】図1

Description

本発明は、検索キーワードの候補となる絞り込みキーワードを提示して適切な検索結果が得られることを支援する情報検索支援システム、情報検索支援方法、情報検索支援プログラム、情報検索支援システムに適用される関連キーワード抽出装置、情報検索支援装置、関連キーワード抽出プログラムに関する。
近年、大量の電子化されたデータがデータベースへ蓄積されており、その中からユーザが所望の情報を見つけるための情報検索技術が重要になっている。しかし、ユーザにとって所望の情報を見つけるための適切な検索キーワードを設定することは困難な作業である。例えば、キーワードを入力しても検索結果が多すぎたりする場合や、逆に検索結果が絞り込まれすぎて必要な情報が見つけられなかったりする場合がある。
この課題を解決するための技術が、例えば特許文献1に記載されている。特許文献1では、キーワード検索の結果得られた対象文書に対して、対象文書全体における各単語の統計情報(具体的には、対象文書全体に対する単語ごとの出現頻度や出現文書数)と、文書毎に出現する単語とその統計情報(具体的には、文書内に出現する各単語の文書内の出現頻度)を使って検索キーワードに対する関連キーワードを自動抽出する技術が提案されている。また、特許文献1には、単語を重要度順に整列する技術も記載されている。
また、特許文献2には、文書データの形態素解析を行い、文書に含まれる単語あるいは文節を抽出し、抽出された単語あるいは文節に基づいて係り受け解析を行い、形態素解析の結果および係り受け解析の結果に基づいて意味解析を行い、意味解析の結果に基づいて関連キーワードを抽出する技術が記載されている。
特開平11−25108号公報(段落0026−0043) 特開2003−58529号公報(段落0017−0025)
しかし、特許文献1に記載された技術では、文書毎に出現する単語が1つの文書内のどこにあっても、文書毎に出現する単語を同様に扱っている。そのため、単語が文書内で離れた位置に存在する等してほとんど関連のない場合でも、関連キーワードとして抽出されるという問題がある。
例えば、ある文書が、「AをやるとBになり、CをやるとDになり、EをやるとFになる。」という文のような時系列に起こった現象を並べた記述を含んでいたり、「AがBになった。CがDになった。EがFになった。」という文のような複数の事象を並列に記した記述を含んでいる場合を考える。このようなデータに対して特許文献1に記載された技術を適用すると、例えば、「A」という検索キーワードに対して、「B」,「C」,「D」,「E」,「F」は、いずれも同様の出現頻度として扱われてしまう。しかし、実際には、2つのキーワード「A」および「B」の関連性は高く、「B」は関連キーワードとして適切であるが、「A」と「F」の関連性は低く、「F」は関連キーワードとしては適切ではない。
そこで、本発明は、ユーザが入力した検索キーワードと関連性の高いキーワードのみを提示してユーザの検索を支援する情報検索支援システム、情報検索支援方法、情報検索支援プログラム、および情報検索支援システムに適用される関連キーワード抽出装置、情報検索支援装置、関連キーワード抽出プログラムを提供することを目的とする。
本発明による情報検索支援システムは、自然文で記述されたデータである検索対象データを記憶するデータベースと、各検索対象データ毎に、所定の関係を有する対になるキーワードの組を関連キーワードとして抽出する関連キーワード抽出手段と、データベースに記憶された検索対象データの中から、ユーザに入力された検索キーワードを含む検索対象データを検索するデータ検索手段と、データ検索手段によって検索された検索対象データから抽出された関連キーワードを参照して、当該関連キーワードに含まれるキーワードが、検索キーワードと共起しているか否かを判定する共起判定手段と、検索キーワードと共起していると判定された各キーワードの順位付けを行うキーワードランキング手段とを備え、共起判定手段が、データ検索手段によって検索された検索対象データから抽出された関連キーワードに含まれているキーワードが、ユーザに入力された検索キーワードと対になっているときに、関連キーワードに含まれている前記キーワードが検索キーワードと共起していると判定することを特徴とする。
そのような構成によれば、関連キーワード抽出手段が、各検索対象データ毎に、所定の関係を有する対になるキーワードの組を関連キーワードとして抽出し、共起判定手段が、データ検索手段によって検索された検索対象データから抽出された関連キーワードに含まれているキーワードが、ユーザに入力された検索キーワードと対になっているときに、関連キーワードに含まれている前記キーワードが検索キーワードと共起していると判定するので、ユーザが入力した検索キーワードと関連性の高いキーワードのみを提示することができる。
ユーザによって入力された検索キーワードを、入力された順序が判別可能となるように記憶する履歴管理手段を備え、共起判定手段が、関連キーワードに含まれるキーワードが、履歴管理手段に記憶された検索キーワードと共起しているか否かを判定する構成であってもよい。
キーワードランキング手段が、五十音順にキーワードの順位付けを行う構成であってもよい。
キーワードランキング手段が、データ検索手段によって検索された検索対象データのうち、検索キーワードと共起していると判定されたキーワードを含んでいる検索対象データの数を、検索キーワードと共起していると判定されたキーワード毎に集計し、集計した検索対象データの数に応じてキーワードの順位付けを行う構成であってもよい。
そのような構成によれば、例えば、ユーザに入力された検索キーワードとの間で、多くの検索対象データにおいて共起関係が発生しているキーワードを上位に提示することが可能となる。
キーワードランキング手段が、履歴管理手段に検索キーワードとして記憶されている数に応じて、検索キーワードと共起していると判定された各キーワードの順位付けを行う構成であってもよい。
そのような構成によれば、例えば、ユーザに入力された検索キーワードに関連し、かつ様々なユーザによく利用されたキーワードを上位に提示することが可能となる。
外部のシステムで蓄積された外部ログに含まれるキーワードの前記外部ログにおける出現回数を記憶する外部ログ管理手段を備え、キーワードランキング手段は、前記出現回数に応じて、検索キーワードと共起していると判定された各キーワードの順位付けを行う構成であってもよい。
そのような構成によれば、例えば、ユーザに入力された検索キーワードに関連し、かつ特定の分野でよく利用されるキーワードを上位に提示することが可能となる。
外部のシステムで蓄積された外部ログに含まれるキーワードの前記外部ログにおける出現回数を記憶する外部ログ管理手段を備え、キーワードランキング手段が、データ検索手段によって検索された検索対象データのうち、検索キーワードと共起していると判定されたキーワードを含んでいる検索対象データの数を、検索キーワードと共起していると判定されたキーワード毎に集計し、集計した検索対象データの数に応じてキーワードの順位付けを行ったときの順位付け結果、履歴管理手段に検索キーワードとして記憶されている数に応じて、検索キーワードと共起していると判定された各キーワードの順位付けを行ったときの順位付け結果、および前記出現回数に応じて、検索キーワードと共起していると判定された各キーワードの順位付けを行ったときの順位付け結果のうちの2つまたは3つの順位付け結果に基づいて、検索キーワードと共起していると判定された各キーワードの順位付けを行う構成であってもよい。
そのような構成によれば、例えば、ユーザに入力された検索キーワードに関連し、検索キーワードとの間で、多くの検索対象データにおいて共起関係が発生していたり、様々なユーザによく利用されていたり、特定の分野でよく利用されていたりするキーワードを上位に提示することが可能となる。
関連キーワード抽出手段が、係り受け関係にある2つの文字列の一方から得たキーワードと、他方の文字列から得たキーワードとの組を関連キーワードとして抽出する構成であってもよい。
そのような構成によれば、検索対象データにおいて、ユーザに入力された検索キーワードとの間で係り受け関係のあったキーワードを提示することが可能となる。従って、例えば、「AがBになった。CがDになった。EがFになった。」という記述を含む検索対象データが存在して、「A」が検索キーワードとして用いられた場合に、「A」と係り受け関係にあった「B」を提示することが可能となる。また、例えば、「何が」「どうした」のかという関連性に基づいて、ユーザに入力された検索キーワード「何が」に対して、「どうした」というキーワードのみを提示することが可能になる。
関連キーワード抽出手段が、句読点で区切られる文字列の中から得られる2つのキーワードの組を関連キーワードとして抽出する構成であってもよい。
関連キーワード抽出手段が、検索対象データに含まれるキーワード同士の距離が閾値以内である2つのキーワードの組を関連キーワードとして抽出する構成であってもよい。
関連キーワード抽出手段が、2つのキーワードの一方が所定の意味グループのキーワードであり、他方が別の所定の意味グループのキーワードであるときに、前記2つのキーワードの組を関連キーワードとして抽出し、共起判定手段が、データ検索手段によって検索された検索対象データから抽出された関連キーワードに含まれているキーワードが、ユーザに入力された検索キーワードと対になっているときに、関連キーワードに含まれている前記キーワードが検索キーワードと共起していると判定するとともに、関連キーワードに含まれているキーワードが、検索キーワードと同じ意味グループのキーワードであるときに、関連キーワードに含まれている前記キーワードが検索キーワードと共起していると判定する構成であってもよい。
また、本発明による情報検索支援装置は、自然文で記述されたデータである検索対象データにおける所定の関係を有する対になるキーワードの組を関連キーワードとして記憶する関連キーワードテーブルを参照可能な情報検索支援装置であって、データベースに記憶された検索対象データの中から、ユーザに入力された検索キーワードを含む検索対象データを検索するデータ検索手段と、データ検索手段によって検索された検索対象データから抽出された関連キーワードを参照して、当該関連キーワードに含まれるキーワードが、検索キーワードと共起しているか否かを判定する共起判定手段と、検索キーワードと共起していると判定された各キーワードの順位付けを行うキーワードランキング手段とを備え、共起判定手段が、データ検索手段によって検索された検索対象データから抽出された関連キーワードに含まれているキーワードが、ユーザに入力された検索キーワードと対になっているときに、関連キーワードに含まれている前記キーワードが検索キーワードと共起していると判定することを特徴とする。
ユーザによって入力された検索キーワードを、入力された順序が判別可能となるように記憶する履歴管理手段を備え、共起判定手段は、関連キーワードに含まれるキーワードが、履歴管理手段に記憶された検索キーワードと共起しているか否かを判定する構成であってもよい。
キーワードランキング手段が、五十音順にキーワードの順位付けを行う構成であってもよい。
キーワードランキング手段が、データ検索手段によって検索された検索対象データのうち、検索キーワードと共起していると判定されたキーワードを含んでいる検索対象データの数を、検索キーワードと共起していると判定されたキーワード毎に集計し、集計した検索対象データの数に応じてキーワードの順位付けを行う構成であってもよい。
キーワードランキング手段が、履歴管理手段に検索キーワードとして記憶されている数に応じて、検索キーワードと共起していると判定された各キーワードの順位付けを行う構成であってもよい。
外部のシステムで蓄積された外部ログに含まれるキーワードの前記外部ログにおける出現回数を記憶する外部ログ管理手段を備え、キーワードランキング手段が、前記出現回数に応じて、検索キーワードと共起していると判定された各キーワードの順位付けを行う構成であってもよい。
外部のシステムで蓄積された外部ログに含まれるキーワードの前記外部ログにおける出現回数を記憶する外部ログ管理手段を備え、キーワードランキング手段が、データ検索手段によって検索された検索対象データのうち、検索キーワードと共起していると判定されたキーワードを含んでいる検索対象データの数を、検索キーワードと共起していると判定されたキーワード毎に集計し、集計した検索対象データの数に応じてキーワードの順位付けを行ったときの順位付け結果、履歴管理手段に検索キーワードとして記憶されている数に応じて、検索キーワードと共起していると判定された各キーワードの順位付けを行ったときの順位付け結果、および前記出現回数に応じて、検索キーワードと共起していると判定された各キーワードの順位付けを行ったときの順位付け結果のうちの2つまたは3つの順位付け結果に基づいて、検索キーワードと共起していると判定された各キーワードの順位付けを行う構成であってもよい。
共起判定手段が、データ検索手段によって検索された検索対象データから抽出された関連キーワードに含まれているキーワードが、ユーザに入力された検索キーワードと対になっているときに、関連キーワードに含まれている前記キーワードが検索キーワードと共起していると判定するとともに、関連キーワードに含まれているキーワードが、検索キーワードと同じ意味グループのキーワードであるときに、関連キーワードに含まれている前記キーワードが検索キーワードと共起していると判定する構成であってもよい。
また、本発明による関連キーワード抽出装置は、自然文で記述されたデータである検索対象データを記憶するデータベースと、各検索対象データ毎に、所定の関係を有する対になるキーワードの組を関連キーワードとして抽出する関連キーワード抽出手段とを備えたことを特徴とする。
関連キーワード抽出手段が、係り受け関係にある2つの文字列の一方から得たキーワードと、他方の文字列から得たキーワードとの組を関連キーワードとして抽出する構成であってもよい。
関連キーワード抽出手段が、句読点で区切られる文字列の中から得られる2つのキーワードの組を関連キーワードとして抽出する構成であってもよい。
関連キーワード抽出手段が、検索対象データに含まれるキーワード同士の距離が閾値以内である2つのキーワードの組を関連キーワードとして抽出する構成であってもよい。
関連キーワード抽出手段が、2つのキーワードの一方が所定の意味グループのキーワードであり、他方が別の所定の意味グループのキーワードであるときに、前記2つのキーワードの組を関連キーワードとして抽出する構成であってもよい。
また、本発明による情報検索支援方法は、関連キーワード抽出手段が、自然文で記述された各検索対象データ毎に、所定の関係を有する対になるキーワードの組を関連キーワードとして抽出し、データ検索手段が、検索対象データの中から、ユーザに入力された検索キーワードを含む検索対象データを検索し、共起判定手段が、データ検索手段によって検索された検索対象データから抽出された関連キーワードに含まれているキーワードが、ユーザに入力された検索キーワードと対になっているときに、関連キーワードに含まれている前記キーワードが検索キーワードと共起していると判定し、キーワードランキング手段が、検索キーワードと共起していると判定された各キーワードの順位付けを行うことを特徴とする。
履歴管理手段が、ユーザによって入力された検索キーワードを、入力された順序が判別可能となるように記憶し、共起判定手段が、関連キーワードに含まれるキーワードが、履歴管理手段に記憶された検索キーワードと共起しているか否かを判定する方法であってもよい。
キーワードランキング手段が、五十音順にキーワードの順位付けを行う方法であってもよい。
キーワードランキング手段が、データ検索手段によって検索された検索対象データのうち、検索キーワードと共起していると判定されたキーワードを含んでいる検索対象データの数を、検索キーワードと共起していると判定されたキーワード毎に集計し、集計した検索対象データの数に応じてキーワードの順位付けを行う方法であってもよい。
キーワードランキング手段が、履歴管理手段に検索キーワードとして記憶されている数に応じて、検索キーワードと共起していると判定された各キーワードの順位付けを行う方法であってもよい。
外部ログ管理手段が、外部のシステムで蓄積された外部ログに含まれるキーワードの前記外部ログにおける出現回数を記憶し、キーワードランキング手段が、前記出現回数に応じて、検索キーワードと共起していると判定された各キーワードの順位付けを行う方法であってもよい。
外部ログ管理手段が、外部のシステムで蓄積された外部ログに含まれるキーワードの前記外部ログにおける出現回数を記憶し、キーワードランキング手段が、データ検索手段によって検索された検索対象データのうち、検索キーワードと共起していると判定されたキーワードを含んでいる検索対象データの数を、検索キーワードと共起していると判定されたキーワード毎に集計し、集計した検索対象データの数に応じてキーワードの順位付けを行ったときの順位付け結果、履歴管理手段に検索キーワードとして記憶されている数に応じて、検索キーワードと共起していると判定された各キーワードの順位付けを行ったときの順位付け結果、および前記出現回数に応じて、検索キーワードと共起していると判定された各キーワードの順位付けを行ったときの順位付け結果のうちの2つまたは3つの順位付け結果に基づいて、検索キーワードと共起していると判定された各キーワードの順位付けを行う方法であってもよい。
関連キーワード抽出手段が、係り受け関係にある2つの文字列の一方から得たキーワードと、他方の文字列から得たキーワードとの組を関連キーワードとして抽出する方法であってもよい。
関連キーワード抽出手段が、句読点で区切られる文字列の中から得られる2つのキーワードの組を関連キーワードとして抽出する方法であってもよい。
関連キーワード抽出手段が、検索対象データに含まれるキーワード同士の距離が閾値以内である2つのキーワードの組を関連キーワードとして抽出する方法であってもよい。
関連キーワード抽出手段が、2つのキーワードの一方が所定の意味グループのキーワードであり、他方が別の所定の意味グループのキーワードであるときに、前記2つのキーワードの組を関連キーワードとして抽出し、共起判定手段が、データ検索手段によって検索された検索対象データから抽出された関連キーワードに含まれているキーワードが、ユーザに入力された検索キーワードと対になっているときに、関連キーワードに含まれている前記キーワードが検索キーワードと共起していると判定するとともに、関連キーワードに含まれているキーワードが、検索キーワードと同じ意味グループのキーワードであるときに、関連キーワードに含まれている前記キーワードが検索キーワードと共起していると判定する方法であってもよい。
また、本発明による情報検索支援プログラムは、自然文で記述されたデータである検索対象データを記憶するデータベースを備えたコンピュータに、各検索対象データ毎に、所定の関係を有する対になるキーワードの組を関連キーワードとして抽出する関連キーワード抽出処理、データベースに記憶された検索対象データの中から、ユーザに入力された検索キーワードを含む検索対象データを検索するデータ検索処理、データ検索処理で検索された検索対象データから抽出された関連キーワードを参照して、当該関連キーワードに含まれるキーワードが、検索キーワードと共起しているか否かを判定する共起判定処理、
検索キーワードと共起していると判定された各キーワードの順位付けを行うキーワードランキング処理を実行させ、共起判定処理では、データ検索処理で検索された検索対象データから抽出された関連キーワードに含まれているキーワードが、ユーザに入力された検索キーワードと対になっているときに、関連キーワードに含まれている前記キーワードが検索キーワードと共起していると判定させることを特徴とする。
コンピュータに、ユーザによって入力された検索キーワードを、入力された順序が判別可能となるように記憶する履歴管理処理を実行させ、共起判定処理では、関連キーワードに含まれるキーワードが、履歴管理処理で記憶された検索キーワードと共起しているか否かを判定させるプログラムであってもよい。
コンピュータに、キーワードランキング処理で、五十音順にキーワードの順位付けを行わせるプログラムであってもよい。
コンピュータに、キーワードランキング処理で、データ検索処理で検索された検索対象データのうち、検索キーワードと共起していると判定されたキーワードを含んでいる検索対象データの数を、検索キーワードと共起していると判定されたキーワード毎に集計し、集計した検索対象データの数に応じてキーワードの順位付けを行わせるプログラムであってもよい。
コンピュータに、キーワードランキング処理で、履歴管理処理で検索キーワードとして記憶されている数に応じて、検索キーワードと共起していると判定された各キーワードの順位付けを行わせるプログラムであってもよい。
コンピュータに、外部のシステムで蓄積された外部ログに含まれるキーワードの前記外部ログにおける出現回数を記憶する外部ログ管理処理を実行させ、キーワードランキング処理で、前記出現回数に応じて、検索キーワードと共起していると判定された各キーワードの順位付けを行わせるプログラムであってもよい。
コンピュータに、外部のシステムで蓄積された外部ログに含まれるキーワードの前記外部ログにおける出現回数を記憶する外部ログ管理処理を実行させ、キーワードランキング処理では、データ検索処理で検索された検索対象データのうち、検索キーワードと共起していると判定されたキーワードを含んでいる検索対象データの数を、検索キーワードと共起していると判定されたキーワード毎に集計し、集計した検索対象データの数に応じてキーワードの順位付けを行ったときの順位付け結果、履歴管理処理で検索キーワードとして記憶されている数に応じて、検索キーワードと共起していると判定された各キーワードの順位付けを行ったときの順位付け結果、および前記出現回数に応じて、検索キーワードと共起していると判定された各キーワードの順位付けを行ったときの順位付け結果のうちの2つまたは3つの順位付け結果に基づいて、検索キーワードと共起していると判定された各キーワードの順位付けを行わせるプログラムであってもよい。
コンピュータに、関連キーワード抽出処理で、係り受け関係にある2つの文字列の一方から得たキーワードと、他方の文字列から得たキーワードとの組を関連キーワードとして抽出させるプログラムであってもよい。
コンピュータに、関連キーワード抽出処理で、句読点で区切られる文字列の中から得られる2つのキーワードの組を関連キーワードとして抽出させるプログラムであってもよい。
コンピュータに、関連キーワード抽出処理で、検索対象データに含まれるキーワード同士の距離が閾値以内である2つのキーワードの組を関連キーワードとして抽出させるプログラムであってもよい。
コンピュータに、関連キーワード抽出処理で、2つのキーワードの一方が所定の意味グループのキーワードであり、他方が別の所定の意味グループのキーワードであるときに、前記2つのキーワードの組を関連キーワードとして抽出させ、共起判定処理では、データ検索処理で検索された検索対象データから抽出された関連キーワードに含まれているキーワードが、ユーザに入力された検索キーワードと対になっているときに、関連キーワードに含まれている前記キーワードが検索キーワードと共起していると判定させるとともに、関連キーワードに含まれているキーワードが、検索キーワードと同じ意味グループのキーワードであるときに、関連キーワードに含まれている前記キーワードが検索キーワードと共起していると判定させるプログラムであってもよい。
また、本発明による情報検索支援プログラムは、自然文で記述されたデータである検索対象データにおける所定の関係を有する対になるキーワードの組を関連キーワードとして記憶する関連キーワードテーブルを参照可能なコンピュータに搭載される情報検索支援プログラムであって、前記コンピュータに、データベースに記憶された検索対象データの中から、ユーザに入力された検索キーワードを含む検索対象データを検索するデータ検索処理、データ検索処理で検索された検索対象データから抽出された関連キーワードを参照して、当該関連キーワードに含まれるキーワードが、検索キーワードと共起しているか否かを判定する共起判定処理、検索キーワードと共起していると判定された各キーワードの順位付けを行うキーワードランキング処理を実行させ、共起判定処理では、データ検索処理で検索された検索対象データから抽出された関連キーワードに含まれているキーワードが、ユーザに入力された検索キーワードと対になっているときに、関連キーワードに含まれている前記キーワードが検索キーワードと共起していると判定させることを特徴とする。
また、本発明による関連キーワード抽出プログラムは、自然文で記述されたデータである検索対象データを記憶するデータベースを備えたコンピュータに搭載される関連キーワード抽出プログラムであって、前記コンピュータに、各検索対象データ毎に、所定の関係を有する対になるキーワードの組を関連キーワードとして抽出する関連キーワード抽出処理を実行させることを特徴とする。
本発明によれば、関連キーワード抽出手段が、各検索対象データ毎に、所定の関係を有する対になるキーワードの組を関連キーワードとして抽出し、共起判定手段が、データ検索手段によって検索された検索対象データから抽出された関連キーワードに含まれているキーワードが、ユーザに入力された検索キーワードと対になっているときに、関連キーワードに含まれているそのキーワードが検索キーワードと共起していると判定するので、ユーザが入力した検索キーワードと関連性の高いキーワードのみを提示することができる。
以下、本発明の実施の形態を図面を参照して説明する。
実施の形態1.
図1は、本発明の第1の実施の形態による情報検索支援システムの構成例を示すブロック図である。本発明の情報検索支援システムは、事例データベース70と、関連キーワード抽出手段10と、関連キーワードテーブル80と、キーワード選択入力手段40と、事例データ検索手段50と、事例データ提示手段60と、キーワード生成手段20と、キーワード提示手段30とを備える。
事例データベース70は、検索対象となるデータを記憶するデータベースである。事例データベース70が記憶するデータは、自然文で記述されたデータであり、例えば、コールセンタにおいて顧客から伝えられた事例(受付事例)や製品の障害事例等が検索対象データとして事例データベース70に記憶される。なお、自然文とは、自然言語で記述された文である。ここでは、コールセンタにおける受付事例や製品の障害事例を例示したが、事例データベース70に記憶される検索対象となるデータは、他のデータであってもよい。以下の説明では、検索対象となるデータが、コールセンタにおける受付事例や製品の障害事例である場合を例に説明し、検索対象となるデータを事例データ(あるいは、単に事例)と記す。
関連キーワード抽出手段10は、事例データベース70に記憶されている各事例データを解析し、各事例データに含まれている関連するキーワード(関連キーワード)を抽出する。関連キーワード抽出手段10は、関連するキーワードとして、互いに関連する2つのキーワードを対にして抽出する。そして、関連キーワード抽出手段10は、個々の事例データから抽出した関連するキーワードを関連キーワードテーブル80に登録する。すなわち、関連するキーワードを関連キーワードテーブル80に記憶させる。
関連キーワードテーブル80は、関連キーワード抽出手段10によって抽出された関連するキーワードを登録する記憶装置である。
キーワード選択入力手段40は、事例データを検索するための検索キーワードが入力される入力手段である。キーワード選択入力手段40は、例えば、キーボードやマウス等の入力装置によって実現される。キーワード選択入力手段40には、ユーザが決定したり選択したりした検索キーワードがユーザによって入力される。キーワード選択入力手段40による検索キーワードの入力態様は、例えば、キーボードをキーワード選択入力手段40として検索キーワードが入力される態様であってもよいし、ディスプレイ装置に表示される複数の検索キーワードの候補の中からマウスなどで検索キーワードが選択、決定され、その決定された検索キーワードを入力キーワードとする態様であってもよい。
事例データ検索手段50は、キーワード選択入力手段40に入力された検索キーワードを含む事例データを、事例データベース70が記憶している各事例データの中から検索する。
事例データ提示手段60は、事例データ検索手段50による検索結果、すなわち、事例データ検索手段50が検索した事例データをユーザに提示(例えば、表示や印刷等の態様で出力)する。
キーワード生成手段20は、キーワード選択入力手段40に入力された検索キーワードと、検索結果である各事例データとを用いて、検索キーワードの候補である絞り込みキーワードを生成する。
キーワード提示手段30は、キーワード生成手段20によって生成された絞り込みキーワードをユーザに提示(例えば、表示や印刷等の態様で出力)する。事例データ提示手段60およびキーワード提示手段30は、ディスプレイ装置や印刷装置等の出力装置によって実現される。事例データ提示手段60およびキーワード提示手段30は、共通の出力装置(例えば、共通のディスプレイ装置)であってもよい。また、事例データ提示手段60およびキーワード提示手段30は、ディスプレイ装置等の出力装置を備えた情報処理装置であってもよい。
ユーザが1つの検索キーワードを入力して事例データを検索した場合、キーワード生成手段20が絞り込みキーワードを生成し、キーワード提示手段30は生成された絞り込みキーワードを表示する。ユーザは自身が入力した検索キーワードによる検索結果に所望の事例データが含まれていない場合、キーワード生成手段20に生成された絞り込みキーワードを用いて検索を続行すればよい。この操作を繰り返すことにより、ユーザの望む事例データが検索されやすくなる。
また、キーワード生成手段20は、履歴管理手段203と、キーワード別共起判定手段201と、キーワードランキング手段202とを備える。
履歴管理手段203は、ユーザの検索履歴を管理する。具体的には、履歴管理手段203は、ユーザによってキーワード選択入力手段40に入力された検索キーワードを、入力された順序が判別可能となるように記憶する。例えば、履歴管理手段203は、キーワード選択入力手段40に入力された検索キーワードを入力された順番に記憶する。なお、このような記憶の態様は例示であり、履歴管理手段203は、入力された順序が判別可能となるように記憶するのであれば、他の態様で検索キーワードを記憶してもよい。例えば、キーワード選択入力手段40に入力された検索キーワードと、その検索キーワードが入力された順番を示す番号とを対応付けて記憶してもよい。
キーワード別共起判定手段201は、関連キーワード抽出手段10が事例データベース70に記憶されている各事例データから抽出した関連キーワードのうち、事例データ検索手段50によって検索された事例データから抽出されていた関連キーワードを参照する。そして、キーワード別共起判定手段201は、検索された事例データに対応する関連キーワードに属する各キーワード毎に、そのキーワードが、履歴管理手段203に記憶されている検索キーワードと共起しているか否かを判定する。このとき、キーワード別共起判定手段201は、履歴管理手段203に記憶されている検索キーワードと対になっているキーワードであれば、そのキーワードは、検索キーワードと共起しているキーワードであると判定する。キーワード別共起判定手段201は、履歴管理手段203に記憶されている検索キーワードと共起しているキーワードを、絞り込みキーワード(検索キーワードの候補)とすることによって、絞り込みキーワードを生成する。なお、キーワード別共起判定手段201が生成する絞り込みキーワードは1つとは限らない。履歴管理手段203に記憶されている検索キーワードと共起しているキーワードが複数存在するならば、キーワード別共起判定手段201によって生成される絞り込みキーワードは複数となる。キーワード別共起判定手段201は、履歴管理手段203に記憶されている検索キーワードと共起していると判定されたキーワードを、絞り込みキーワードとしてキーワードランキング手段202に送信する。
キーワードランキング手段202は、キーワード別共起判定手段201によって生成された絞り込みキーワード(すなわち、履歴管理手段203に記憶されている検索キーワードと共起していると判定されたキーワード)の順位付けを行う。
次に、動作について説明する。
図2は、第1の実施の形態の情報検索支援システムの動作を示すフローチャートである。まず、関連キーワード抽出手段10は、事例データベース70に記憶されている各事例データを解析し、各事例データに含まれている関連するキーワードを抽出し、個々の事例データから抽出した関連するキーワードを関連キーワードテーブル80に登録する(ステップS201)。ステップS201において、関連キーワード抽出手段10が行う解析処理とは、例えば、後述の図3(a)に示す処理である。また、ステップS201の処理は、ユーザによって入力される検索キーワードによる検索を実行する以前に、前処理として行う。すなわち、前処理としてステップS201の処理が完了してから、後述のステップS202以降の処理が行われる。
また、互いに関連するキーワードの抽出態様は、種々考えられるが、ここでは、事例データ内で係り受け関係が成立しているキーワード同士を、互いに関連するキーワードとして抽出する場合を例にして説明する。
図3は、関連キーワード抽出手段10の動作を示す説明図であり、図3(a)は、関連キーワード抽出手段10による関連キーワード抽出処理を示すフローチャートである。図3(a)に示すように、関連キーワード抽出手段10は、自然文で書かれた事例データに対して係り受け解析を行い、係り受けの発生している2つの文字列を、1つの文字列グループとする(ステップS301)。関連キーワード抽出手段10は、1つの文字列グループとした文字列を単語に分割する(ステップS302)。関連キーワード抽出手段10は、1つの文字列グループとした2つの文字列について、例えば形態素解析を行うことによって、文字列を単語に分割する。続いて、関連キーワード抽出手段10は、分割した単語の中らから不要な単語(不要な品詞)を除外する(ステップS303)。ステップS303では、少なくとも助詞、助動詞、接続詞を不要な単語として除外し、名詞、形容詞および動詞は必ず残すようにして、不要な品詞を除外する。副詞に関しては、名詞、形容詞および動詞とともに残してもよいし、あるいは、不要な品詞として除外してもよい。関連キーワード抽出手段10は、1つの文字列グループとした2つの係り受け関係にある文字列を分割して得た単語であって、ステップS303で除外せずに残した単語同士を、関連するキーワードとして抽出する(ステップS304)。ステップS304では、係り受け関係にある文字列の一方から得た単語と、他方から得た単語とを対にして関連キーワードとする。
例えば、図3(c)に示す事例データ31のように、「ドラム付近で紙が詰まって、用紙を取り除いてもすぐまた詰まる。」という障害の現象が記載された事例データから関連キーワードを抽出する場合を例に説明する。関連キーワード抽出手段10は、図3(c)に示す事例データ31における係り受けを判断し、係り受けの発生している2つの文字列を、1つの文字列グループとする(ステップS301)。本例では、図3(b)に示すように、文字列「ドラム付近で」と文字列「詰まって」を1つの文字列グループにする。同様に、文字列「紙が」と文字列「詰まって」を1つの文字列グループにする。また、同様に、文字列「用紙を」と文字列「取り除いても」を1つの文字列グループにする。事例データ31において係り受け関係が成立している他の文字列同士に関しても同様に1つの文字列グループとする。図3(b)は、図3(c)に示す事例データ31から生成される文字列グループを示す。図3(b)において実線の楕円は、文字列を示す。また、1つの文字列から他の文字列に延びる矢印は、その2つの文字列の間で係り受けが成立していることを示している。また、破線の楕円は文字列グループを表し、1つの破線の楕円は、係り受けが成立している2つの文字列を囲んでいる。
ステップS301の次に、関連キーワード抽出手段10は、各文字列グループに属する文字列を形態素解析し、文字列を形態素(単語)に分割する(ステップS302)。例えば、「ドラム付近で詰まって」という文字列グループ(文字列「ドラム付近で」と文字列「詰まって」からなる文字列グループ)に関しては、文字列「ドラム付近で」を、「ドラム」「付近」「で」という形態素に分割し、文字列「詰まって」を「詰まる」「て」という形態素に分割する。続いて、関連キーワード抽出手段10は、分割された単語のうち「で」や「て」のような助詞などの不要な単語(不要な品詞)を除外する(ステップS303)。そして、関連キーワード抽出手段10は、文字列「ドラム付近で」から抽出したキーワード「ドラム」と、文字列「詰まって」から抽出したキーワード「詰まる」を関連キーワードとして抽出する。すなわち、「ドラム」および「詰まる」を対にして関連キーワードとして抽出する。同様に、関連キーワード抽出手段10は、文字列「ドラム付近で」から抽出したキーワード「付近」と、文字列「詰まって」から抽出したキーワード「詰まる」を関連キーワードとして抽出する。すなわち、「付近」および「詰まる」を対にして関連キーワードとして抽出する。
関連キーワード抽出手段10は、全ての文字列グループに同様にステップS302〜S304の処理を行う。図3(c)に示す事例データ31に対して上記のステップS301〜S304の処理を行った場合、図3(c)に示す関連キーワード32が抽出される。なお、図3(c)に示すKW1は、係り受け関係にある文字列のうち修飾する側の文字列から得られた単語(キーワード)であることを示している。図3(c)に示すKW2は、係り受け関係にある文字列のうち修飾される側の文字列から得られた単語(キーワード)であることを示している。
ステップS201(図2参照。)では、関連キーワード抽出手段10は、図3(a)に例示する処理を実行することによって関連キーワードを事例データ毎に抽出する。
図3では、係り受け関係を利用して関連キーワードを抽出する場合を示したが、他の態様で関連キーワードを抽出してもよい。
例えば、関連キーワード抽出手段10は、句読点で区切られる文字列(読点に挟まれる文字列、あるいは読点および句点に挟まれる文字列)を1つの文字列グループとして関連キーワードを抽出してもよい。この場合、関連キーワード抽出手段10は、句読点で区切られる文字列をそれぞれ1つの文字列グループとする。そして、関連キーワード抽出手段10は、各文字列グループに属する文字列(句読点で区切られる文字列)を、例えば形態素解析を行うことによって、単語に分割し、不要な単語(不要な品詞。少なくとも、助詞、助動詞および接続詞。)を除外する。そして、1つ文字列グループに属する文字列を分割して、除外されずに残った単語から2つの単語の組み合わせを生成し、生成されたそれぞれの組み合わせに属する2つの単語を関連キーワードとしてもよい。このような処理を事例データ毎に行って、事例データ毎に関連キーワードを抽出してもよい。
また、例えば、個々の単語と、その個々の単語からの距離が閾値範囲内である単語との組み合わせを関連キーワードとして抽出してもよい。この場合、関連キーワード抽出手段10は、例えば形態素解析を行うことによって事例データを単語に分割し、不要な単語(不要な品詞。少なくとも、助詞、助動詞および接続詞。)を除外する。そして、関連キーワード抽出手段10は、除外されずに残った個々の単語毎に、その個々の単語からの距離が閾値範囲内である単語を取り出し、単語の組み合わせを生成する。関連キーワード抽出手段10は、生成されたそれぞれの組み合わせに属する2つの単語を関連キーワードとしてもよい。なお、単語からの距離とは、ある単語のいくつ隣になっているかを示す値である。例えば、ある単語からの距離が1以内である単語とは、そのある単語の1つ隣の単語のことである。このような処理を事例データ毎に行って、事例データ毎に関連キーワードを抽出してもよい。このような態様では、例えば、除外されずに残った単語に基づいて、隣り合う単語同士を関連キーワードとして抽出すること等ができる。
関連キーワード抽出手段10は、抽出した関連キーワードのデータ(例えば、図3(c)に例示する関連キーワード32)を関連キーワードテーブル80に登録する(ステップS201)。関連キーワード抽出手段10は、関連キーワードを関連キーワードテーブル80に登録するときに、どの事例データから抽出された関連キーワードであるのかを識別できるように関連キーワードを登録する。例えば、各事例データに識別情報を割り当てておき、関連キーワードを関連キーワードテーブル80に登録するときに、その関連キーワードの抽出元となった事例データの識別情報とともに登録してもよい。
事例データ毎に関連キーワードを抽出して、関連キーワードテーブル80に登録することによって、前処理であるステップS201が完了する。
続いて、ユーザがキーワードを使って事例データを検索するときの情報検索支援システムの動作を、図2を参照して説明する。
キーワード選択入力手段40に、ユーザによって検索キーワードが入力される(ステップS202)。キーワード選択入力手段40は、入力された検索キーワードを、事例データ検索手段50と履歴管理手段203とに送信する。
事例データ検索手段50は、キーワード選択入力手段40に入力された検索キーワードを使って、事例データベース70から事例データを検索する。すなわち、事例データ検索手段50は、キーワード選択入力手段40に入力された検索キーワードを含む事例データを、事例データベース70が記憶している各事例データの中から検索する。そして、事例データ検索手段50は、検索結果(検索した事例データ)をキーワード別共起判定手段201へ送信する(ステップS203)。さらに、事例データ検索手段50は、検索結果を事例データ提示手段60送信し、事例データ提示手段60は、検索結果をユーザへ提示する(ステップS204)。
履歴管理手段203は、ユーザが入力した検索キーワードを管理する(ステップS205)。具体的には、履歴管理手段203は、ユーザによってキーワード選択入力手段40に入力された検索キーワードを、入力された順序が判別可能となるように記憶する。ここでは、キーワード選択入力手段40に検索キーワードが入力され、キーワード選択入力手段40がその検索キーワードを履歴管理手段203に出力した場合、キーワード選択入力手段40が履歴管理手段203に出力した順に、検索キーワードを記憶するものとして説明する。すなわち、キーワード選択入力手段40に入力された順番に検索キーワードを記憶するものとして説明する。既に説明したように、キーワード選択入力手段40に入力された検索キーワードと、その検索キーワードが入力された順番を示す番号とを対応付けて記憶してもよい。図4は、履歴管理手段203に記憶された検索キーワードの例を示す説明図である。図4では、ユーザによて検索キーワード「印刷」、「詰まる」、「紙」が順に入力され、その順番に各検索キーワードが履歴管理手段203に記憶されている例を示している。
ユーザは、ステップS204で、事例データ提示手段60によって提示された検索結果の中にユーザの所望の事例データが含まれていれば、その事例データを参照し検索を終える。しかし、提示された検索結果に含まれる事例データの数が多すぎたりして、ユーザが検索結果の中に所望の事例データを見つけられない場合等がある。所望の事例データが見つけられなかった場合、ユーザは、キーワード生成手段20によって生成された絞り込みキーワードを使って、さらに検索を続ける。なお、キーワード生成手段20によって生成された絞り込みキーワードは、後述のステップS209で提示される。
キーワード生成手段20が絞り込みキーワードを生成して、その絞り込みキーワードをユーザに提示するまでの動作(図2に示すステップS206〜S209)の動作について説明する。
キーワード別共起判定手段201には、事例データ検索手段50による検索結果である事例データが、事例データ検索手段50から送られる(ステップS203)。キーワード別共起判定手段201は、関連キーワードテーブル80に記憶されている各事例データ毎の関連キーワードのうち、検索結果である事例データから抽出された関連キーワードを参照する(ステップS206)。すなわち、キーワード別共起判定手段201は、検索結果である事例データから抽出された関連キーワードを調べる(ステップS206)。
そして、キーワード別共起判定手段201は、検索された事例データに対応する関連キーワードに属する各キーワード毎に、そのキーワードが、履歴管理手段203に記憶されている検索キーワードと共起しているか否かを判定する(ステップS207)。このとき、キーワード別共起判定手段201は、履歴管理手段203に記憶されている検索キーワードと対になっているキーワードであれば、そのキーワードは、検索キーワードと共起しているキーワードであると判定する。そして、履歴管理手段203に記憶されている検索キーワードと共起していると判定されたキーワードを、絞り込みキーワード(検索キーワードの候補)としてキーワードランキング手段202に送信する。
ステップS206,S207の動作の具体例を図5を参照して説明する。ユーザからキーワード選択入力手段40に検索キーワード「印刷」が入力され、履歴管理手段203は、検索キーワード45(図5参照。本例では「印刷」。)を記憶しているものとする。また、ステップS204では、事例データ検索手段50が、検索キーワード「印刷」を含む事例データを、事例データベース70に記憶されている全事例データ40(図5参照。)の中から検索し、図5に示す「事例1」、「事例2」および「事例3」を含む検索結果をキーワード別共起判定手段201に出力しているものとする。また、前処理であるステップS201によって、事例1から抽出された関連キーワード42、事例2から抽出された関連キーワード43、および事例3から抽出された関連キーワード44が、関連キーワードテーブル80に記憶されたものとする。この場合、ステップS206で、キーワード別共起判定手段201は、検索結果41に含まれる「事例1」、「事例2」および「事例3」から抽出済みであって関連キーワードテーブル80に記憶されている関連キーワード42,43,44を参照する。すなわち、検索結果41に含まれる事例データから抽出されていた関連キーワードを調べる。
次にステップS207で、キーワード別共起判定手段201は、検索結果41に含まれる「事例1」、「事例2」および「事例3」に対応する各関連キーワード42,43,44に含まれる各キーワード毎に、そのキーワードが、履歴管理手段203に記憶されている検索キーワード45(「印刷」)と共起しているか否かを判定する。図5に例示する関連キーワード42,43,44では、「印刷」を含む関連キーワードの組を太枠で囲んで示している。図5に例示する関連キーワード42,43,44に含まれるキーワードは、「印刷」、「紙」、「トナー」、「汚れる」、「詰まる」、「交換」、「異常」、「ずれる」等がある。キーワード別共起判定手段201は、これらの各キーワードについて、検索キーワード45(「印刷」)と共起しているか否かを判定し、判定結果46(図5参照。)を導く。図5に示す判定結果46では、履歴管理手段203に記憶されている検索キーワード45と共起している場合を「1」で示し、共起していない場合を「0」で示している。「印刷」と対になるキーワードは、「汚れる」、「詰まる」、「異常」、「ずれる」である(図5に示す関連キーワード42,43,44における太枠で囲んだ範囲を参照。)。従って、「汚れる」、「詰まる」、「異常」、「ずれる」を、絞り込みキーワードとしてキーワードランキング手段202に送信する。なお、関連キーワードに含まれる「印刷」は、検索キーワード45と同一であるので、共起しているか否かの判定の対象外とする。
キーワードランキング手段202は、キーワード別共起判定手段201から送られた絞り込みキーワードの順位付けを行う(ステップS208)。順位付の基準は、例えば、五十音順であるが、他の基準で順位付を行ってもよい。続いて、キーワード提示手段30は、表示件数範囲内の絞り込みキーワードを、ステップS208で定められた順位に従って表示する(ステップS209)。
図6は、事例データ検索手段50による検索結果、およびキーワード別共起判定手段201に生成されキーワードランキング手段202に順位付けされた絞り込みキーワードを表示する表示画面の例を示す説明図である。図6に示す例では、「汚れる」、「詰まる」、「異常」、「ずれる」がキーワードランキング手段202によって五十音順に順位付けされた場合を示している。すなわち、キーワードの先頭語を対象として、あ行の先頭(「あ」)を最も順位を高くし、わ行の最後尾語(「を」)を最も順位を低くする。ただし、濁音および半濁音を、非濁音とみなす。なお、図6では、ステップS204で提示される検索結果と、ステップS209で提示される絞り込みキーワードとを同一画面内に表示する場合を示している。
ユーザが検索結果の中に所望の事例データを見つけられなかった場合、ユーザは、図6に例示する画面に表示された絞り込みキーワード(すなわち検索キーワードの候補)を用いて、検索操作を続ければよい。
以下、ステップS209で提示される絞り込みキーワードを用いて、さらに検索を進める場合について説明する。この場合、ステップS202以降の動作を行う。ステップS202〜S206の動作は、既に説明した動作と同様である。ここでは、ユーザが、図6に示される絞り込みキーワードのうち、「詰まる」を検索キーワードとして選択した場合を例にして説明する。図7は、絞り込みキーワードを用いてさらに検索を進める場合の動作を示す説明図である。
絞り込みキーワードのうち「詰まる」が選択され、検索キーワードとしてキーワード選択入力手段40に入力される(ステップS202)。キーワード選択入力手段40は、この検索キーワードを、事例データ検索手段50と履歴管理手段203とに送信する。事例データ検索手段50は、キーワード選択入力手段40に入力された検索キーワード「詰まる」を含む事例データを検索し、検索結果(本例では、図7に示す事例1、事例2および事例3とする。)をキーワード別共起判定手段201に送信し(ステップS203)、また、その検索結果を事例データ提示手段60送信し、事例データ提示手段60は、検索結果をユーザへ提示する(ステップS204)。履歴管理手段203は、キーワード選択入力手段40から送られた検索キーワード「詰まる」を、入力された順序が判別可能となるように記憶する。このとき、履歴管理手段203は、図7に示す検索キーワード220を記憶する(ステップS205)。すなわち、最初に入力された検索キーワード「印刷」と、二番目に入力された検索キーワード「詰まる」とを、入力順が判別可能となるように記憶する。
続くステップS206では、キーワード別共起判定手段201は、検索結果に含まれる「事例1」、「事例2」および「事例3」(図7参照。)から既に抽出されていて関連キーワードテーブル80に記憶されている関連キーワード42,43,44を参照する。
次にステップS207で、キーワード別共起判定手段201は、「事例1」、「事例2」および「事例3」に対応する各関連キーワード42,43,44に含まれる各キーワード毎に、そのキーワードが、履歴管理手段203に記憶されている各検索キーワード(図7に示す例では「印刷」、「詰まる」)と共起しているか否かを判定する。図7に例示する関連キーワード42,43,44では、「印刷」を含む関連キーワードの組を太枠で囲んで示している。図7に例示する関連キーワード42,43,44に含まれるキーワードは、「印刷」、「紙」、「トナー」、「汚れる」、「詰まる」、「交換」、「異常」、「ずれる」等がある。キーワード別共起判定手段201は、これらの各キーワードについて、履歴管理手段203の1番目に登録されている「印刷」と共起しているか否かを判定し、図7に示す判定結果46を導く。ただし、各関連キーワード(本例では、関連キーワード42,43,44)に含まれる各キーワードのうち、履歴管理手段203に登録されていて判定に用いている検索キーワードと一致するキーワードは、共起しているか否かの判定の対象外とする。図7では、履歴管理手段203に記憶されている検索キーワードと共起している場合を「1」で示し、共起していない場合を「0」で示している。「印刷」と対になるキーワードは、「汚れる」、「詰まる」、「異常」、「ずれる」である(図7に示す関連キーワード42,43,44における太枠で囲んだ範囲を参照。)。従って、1番目に登録されている「印刷」と共起しているか否かの判定結果として、図7に示す判定結果46が導かれる。なお、関連キーワード42,43,44に含まれるキーワードのうち「印刷」は、判定している検索キーワードと一致するので、共起しているか否かの判定の対象外とする。
同様に、キーワード別共起判定手段201は、関連キーワード42,43,44に含まれるキーワード毎に、そのキーワードが、履歴管理手段203の2番目に登録されている「詰まる」と共起しているか否かを判定する。このとき、関連キーワード42,43,44に含まれるキーワードのうち「詰まる」は、判定している検索キーワードと一致するので、共起しているか否かの判定の対象外とする。キーワード別共起判定手段201は、この判定により、図7に示す判定結果221を得る。すなわち、「詰まる」と共起しているキーワードとして「紙」と「印刷」を得る。キーワード別共起判定手段201は、履歴管理手段203に記憶されているいずれかの検索キーワードと共起していれば、検索キーワードとの共起関係があると判定し、検索キーワードと共起しているか否かの判定結果として、判定結果222を得る。ただし、履歴管理手段203に登録されている個々の検索キーワード毎に共起しているキーワードの判定を行うときには、その検索キーワードと同一のキーワードは、共起しているか否かの判定の対象外とされる。従って、判定結果222では、ユーザに入力された検索キーワード「印刷」および「詰まる」は、検索キーワードと共起しているか否かの判定の対象外とされる。
キーワード別共起判定手段201は、検索キーワードと共起していると判定したキーワードを、絞り込みキーワードとしてキーワードランキング手段202に送信する。図7に例示する判定結果222が得られた場合、キーワード別共起判定手段201は、「紙」、「汚れる」、「異常」、「ずれる」の4つの絞り込みキーワードを送信する。
キーワードランキング手段202は、キーワード別共起判定手段201から送信された絞り込みキーワードの順位付けを行い(ステップS208)、キーワード提示手段30は、その順位に従って、絞り込みキーワードを表示する(ステップS209)。図8は、事例データ検索手段50による検索結果、およびキーワード別共起判定手段201に生成されキーワードランキング手段202に順位付けされた絞り込みキーワードを表示する表示画面の例を示す説明図である。図8に示す例では、「紙」、「汚れる」、「異常」、「ずれる」の4つのキーワードを五十音順に順位付けた場合の例を示している。
図8では、図7に例示する判定結果222を導いてから表示される表示画面の例を示したが、検索キーワード毎に各キーワードが共起しているか否かを判定する度に、絞り込みキーワードを表示してもよい。図9は、検索キーワード毎に各キーワードが共起しているか否かを判定する度に絞り込みキーワードを表示する場合の表示画面の例を示す説明図である。すなわち、図9に例示する表示画面では、まず、図7に例示する判定結果46が導出された後、絞り込みキーワード91を表示する。この場合、キーワード別共起判定手段201は、判定結果46を導出したときに、共起していると判定されたキーワードのうち、履歴管理手段203に登録されていない各キーワード(本例では、「異常」、「ずれる」、「汚れる」)をキーワードランキング手段202に送信する。キーワードランキング手段202は、キーワード別共起判定手段201から送信された絞り込みキーワードの順位付けを行い、キーワード提示手段30は、その順位に従って、絞り込みキーワード91(図9参照。)を表示する。次に、図7に例示する判定結果221が導出された後、絞り込みキーワード92を表示する。この場合、キーワード別共起判定手段201は、判定結果221を導出したときに、共起していると判定されたキーワードのうち、履歴管理手段203に登録されていない各キーワード(本例では「紙」)をキーワードランキング手段202に送信する。キーワードランキング手段202は、キーワード別共起判定手段201から送信された絞り込みキーワードの順位付けを行い、キーワード提示手段30は、その順位に従って、絞り込みキーワード92(図9参照。)を表示する。
以上のように、本実施の形態によれば、検索対象データに対して、ユーザが入力したキーワードと関連性の高いキーワード(絞り込みキーワード)が提示され、ユーザの情報検索を支援することができる。例えば、ユーザが「印刷」というキーワードで検索した際に、印刷が、「異常」なのか、「ずれる」のか、「詰まる」のか、「汚れる」のかという、印刷がどうしたのかという関連性のある絞り込みキーワードを使って、事例データの絞り込みが可能になる。このとき、「交換」という紙やトナーがどうしたのかというキーワード(印刷に関連性のないキーワード)は表示されないため、ユーザは、検索に用いる検索キーワードを選択しやすい。
本実施の形態において、検索対象とするコンテンツは、受付事例データや障害事例データに限らず、論文や書籍等の文字情報コンテンツであればどのような種類であっても適用可能である。
実施の形態2.
図10は、本発明の第2の実施の形態による情報検索支援システムの構成例を示すブロック図である。第1の実施の形態と同様の構成要素については、図1と同一の符号を付し、説明を省略する。ただし、第2の実施の形態では、キーワードランキング手段202の動作が第1の実施の形態と異なる。
第2の実施の形態では、キーワードランキング手段202は、ステップS208において、直近のステップS204で検索された事例データを事例データ検索手段に問い合わせて、直近の検索結果(検索された事例データ)を得る。そして、キーワードランキング手段202は、キーワード別共起判定手段201から送られた絞り込みキーワードが、直近のステップS204で検索された事例データのうちいくつの事例に含まれているかを計算する。このとき、キーワードランキング手段202は、キーワード別共起判定手段201から送られた絞り込みキーワード毎に、絞り込みキーワードが含まれている事例数を集計する。なお、1つの事例データに1つの絞り込みキーワードが何回登場しているかは問題にしない。すなわち、ある事例データに絞り込みキーワードが1回だけ登場していても複数回登場していても、「事例数1件分」として集計する。キーワードランキング手段202は、多くの事例データに含まれている順に絞り込みキーワードを順位付ける。
図5および図11を参照して具体例を示す。図11は、絞り込みキーワードを含む事例数の集計結果および絞り込みキーワードの順位付け結果の具体例を示す説明図である。図5に示す判定結果46が導かれた場合、キーワード別共起判定手段201からキーワードランキング手段202に送信される絞り込みキーワードは、「汚れる」、「詰まる」、「異常」および「ずれる」である。「汚れる」は事例1だけに含まれているため(図5参照。)、キーワードランキング手段202は、「汚れる」について事例数1件と集計する。「詰まる」は、事例1、事例2および事例3に含まれているため(図5参照。)、キーワードランキング手段202は、「詰まる」について事例数3件と集計する。「異常」は、事例2および事例3に含まれているため、キーワードランキング手段202は、「異常」について事例数2件と集計する。「ずれる」は、事例3だけに含まれているため、キーワードランキング手段202は、「ずれる」について事例数1件と集計する。この結果、キーワードランキング手段202は、各絞り込みキーワードを含む事例数の集計結果として、図11(a)に示す集計結果を得る。そして、キーワードランキング手段202は、多くの事例データに含まれている順に絞り込みキーワードを順位付け、図11(b)に示す順位付け結果を得る。すなわち、「詰まる」、「異常」、「汚れる」、「ずれる」の順に順位を付ける。
キーワードランキング手段202は、絞り込みキーワードと絞り込みキーワードの順位付け結果をキーワード提示手段30に送信して、キーワード提示手段30が例えば図12のように表示する(ステップS209)。図12は、事例データ検索手段50による検索結果、およびキーワード別共起判定手段201に生成されキーワードランキング手段202に順位付けされた絞り込みキーワードを表示する表示画面の例を示す説明図である。本例では、図12に示すように、「詰まる」、「異常」、「汚れる」、「ずれる」の順に絞り込みキーワードが表示される。また、図12に示すように、絞り込みキーワードが含まれている事例数とともに絞り込みキーワードを表示してもよい。
本実施の形態によれば、ユーザの入力した検索キーワードとの間で、多くの事例データで共起関係が発生しており、検索キーワードとの関連性が強い絞り込みキーワードを、順位の高い絞り込みキーワードとして(優先的に提示すべき絞り込みキーワードとして)ユーザに提示できる。
また、上記の例では、多くの事例データに含まれている順に絞り込みキーワードを順位付ける場合を説明したが、キーワードランキング手段202は、集計結果の数の少ない順に絞り込みキーワードを順位付けてもよい。また、集計結果の数を用いた計算を行い、その計算結果に基づいてキーワードを順位付けてもよい。
実施の形態3.
図13は、本発明の第3の実施の形態による情報検索支援システムの構成例を示すブロック図である。第1の実施の形態と同様の構成要素については、図1と同一の符号を付し、説明を省略する。ただし、第3の実施の形態では、キーワードランキング手段202および履歴管理手段203の動作が第1の実施の形態と異なる。
図14は、本実施の形態において履歴管理手段203が記憶する情報の例を示す説明図である。本実施の形態において、履歴管理手段203は、例えば、図14(a)に示すように、時刻と、ユーザを識別するユーザIDと、ユーザIDによって特定されるユーザから入力された検索キーワードとを対応付けて記憶する。なお、個々ののユーザから入力された検索キーワードは、そのユーザによって入力された順序が判別可能となるように記憶される。そして、履歴管理手段203は、図14(b)に示すように、記憶している全ての種類のキーワード毎に、キーワードの利用回数(キーワードが検索キーワードとしてキーワード選択入力手段40に入力された回数)を集計し、記憶する。
図14(a)に例示する時刻は、例えば、アプリケーション(情報検索支援システム)の立ち上げ時刻であってもよいし、あるいは、個々のユーザが情報検索支援システムにログインした時刻であってもよい。あるいは、個々のユーザがキーワード選択入力手段40に第1番目の検索キーワードを入力した時刻であってもよい。
第3の実施の形態では、キーワードランキング手段202は、ユーザに利用された頻度の高いキーワード(検索キーワードとして入力された頻度の高いキーワード)の順に、絞り込みキーワードを順位付ける。例えば、キーワードランキング手段202は、各絞り込みキーワードが過去に検索キーワードして利用された回数を、履歴管理手段203に問い合わせ、その利用回数が多い順に絞り込みキーワードを順位付ける。
図5および図15を参照して具体例を示す。図15は、第3の実施の形態における絞り込みキーワードの順位付け結果の具体例を示す説明図である。図5に示す判定結果46が導かれた場合、キーワード別共起判定手段201からキーワードランキング手段202に送信される絞り込みキーワードは、「汚れる」、「詰まる」、「異常」および「ずれる」である。キーワードランキング手段202は、これら4つのキーワードが検索キーワードとして利用された回数を履歴管理手段203に問い合わせる。履歴管理手段203は、キーワードランキング手段202からの問い合わせに応じて、各キーワードの利用回数をキーワードランキング手段202に通知する。例えば、図14(b)に示す利用回数の集計結果を記憶している場合、キーワードランキング手段202からの問い合わせに応じて、「汚れる」、「詰まる」、「異常」および「ずれる」の利用回数をそれぞれキーワードランキング手段202に通知する。キーワードランキング手段202は通知された利用回数が多い順に、絞り込みキーワードを順位付け、図15に例示するような順位付け結果を導く。
その後、キーワードランキング手段202は、絞り込みキーワードと絞り込みキーワードの順位付け結果をキーワード提示手段30に送信して、キーワード提示手段30は、定められた順番に絞り込みキーワードを表示する(ステップS209)。
本実施の形態によれば、様々なユーザに検索キーワードとしてよく利用されたことのある絞り込みキーワードを、順位の高い絞り込みキーワードとして(優先的に提示すべき絞り込みキーワードとして)ユーザに提示できる。
なお、履歴管理手段203は、記憶しているキーワードの利用回数の修正をユーザID毎に行ってもよい。そして、キーワードランキング手段202からの問い合わせに応じて、特定のユーザのキーワードの利用回数を通知してもよい。例えば、現在、情報検索支援システムにログインして検索操作を行っているユーザのキーワードの利用回数を通知してもよい。あるいは、別のユーザによるキーワードの利用回数を通知してもよい。
また、履歴管理手段203は、キーワードランキング手段202からの問い合わせがあったときに、その問い合わせ時刻から所定時間前までの時刻に対応して記憶されているキーワード毎に、キーワードの利用回数を集計して、記憶し、問い合わせに応じて、その集計によって導出された利用回数を通知してもよい。
また、上記の例では、利用回数が多い順に絞り込みキーワードを順位付ける場合を説明したが、キーワードランキング手段202は、利用回数の少ない順に絞り込みキーワードを順位付けてもよい。また、利用回数を用いた計算を行い、その計算結果に基づいてキーワードを順位付けてもよい。
実施の形態4.
図16は、本発明の第4の実施の形態による情報検索支援システムの構成例を示すブロック図である。第1の実施の形態と同様の構成要素については、図1と同一の符号を付し、説明を省略する。ただし、第4の実施の形態の情報検索支援システムは、第1の実施の形態における構成要素の他に、外部ログ管理手段204を備える。また、キーワードランキング手段202の動作が第1の実施の形態と異なる。
外部ログ管理手段204は、本発明の情報検索支援システムとは別のシステム(図示せず。)で蓄積された外部ログに記述されているキーワード毎に、キーワードの出現回数(外部ログに出現している回数)を集計した値を記憶する。図17(a)は、外部ログに記述されている全キーワード毎のキーワードの出現回数の集計値の例を示す説明図である。外部ログ管理手段204は、図17(a)に例示するようにキーワード毎の出現回数を記憶する。
外部ログ管理手段204は、別のシステムで蓄積された外部ログに記述されている全キーワード毎のキーワードの出現回数を集計した値を、本発明の情報検索支援システムの管理者によって入力され、入力された集計値を記憶してもよい。あるいは、外部ログ管理手段204は、別のシステムで蓄積された外部ログを本発明の情報検索支援システムの管理者によって入力され、その外部ログを参照して、外部ログに記述されている全キーワード毎のキーワードの出現回数を集計し、集計した結果を記憶してもよい。また、外部ログ管理手段204は、通信ネットワークを介して別のシステムに外部ログを要求し、外部ログを別のシステムから受信してもよい。そして、受信した外部ログを参照して、外部ログに記述されている全キーワード毎のキーワードの出現回数を集計し、集計した結果を記憶してもよい。
外部ログの例として、例えば、別のコールセンタや受付センタで使われていた検索ログ等が挙げられる。
第4の実施の形態では、キーワードランキング手段202は、外部ログにおける出現頻度の高い順に、絞り込みキーワードを順位付ける。キーワードランキング手段202は、外部ログ管理手段204に記憶された各キーワードの出現回数を参照することによって、絞り込みキーワードと同一のキーワードに対応する出現回数を参照する。そして、外部ログ管理手段204に記憶されている出現回数が多い順に、絞り込みキーワードを順位付ける。
図5、図16および図17を参照して具体例を示す。外部ログ管理手段204が図17(a)に例示する各キーワードの出現回数を記憶しているものとする。図5に示す判定結果46が導かれた場合、キーワード別共起判定手段201からキーワードランキング手段202に送信される絞り込みキーワードは、「汚れる」、「詰まる」、「異常」および「ずれる」である。キーワードランキング手段202は、これら4つの絞り込みキーワードと同一のキーワードに対応する出現回数を参照する。「汚れる」、「詰まる」、「異常」および「ずれる」の各キーワードに対応するそれぞれの出現回数は、187回、101回、49回、0回である(図17(a)参照。)。キーワードランキング手段202は、この出現回数の値の大きい順に、絞り込みキーワードを順位付ける。図17(b)は、本実施の形態における絞り込みキーワードの順位付け結果の具体例を示す説明図である。本例では、キーワードランキング手段202は、図17(b)に示すように、「ずれる」、「異常」、「汚れる」、「詰まる」の順に絞り込みキーワードを順位付ける。
その後、キーワードランキング手段202は、絞り込みキーワードと絞り込みキーワードの順位付け結果をキーワード提示手段30に送信して、キーワード提示手段30は、定められた順番に絞り込みキーワードを表示する(ステップS209)。
本実施の形態によれば、特定の分野でよく利用された順番に、絞り込みキーワードをユーザに提示することができる。例えば、外部ログとして、コールセンタや受付センタで使われていた検索ログを用いた場合、コールセンタや受付センタなどの特定分野でよく使われるキーワードを優先的にユーザに提示することができる。
また、上記の例では、外部ログ管理手段204に記憶されている出現回数が多い順に絞り込みキーワードを順位付ける場合を説明したが、外部ログ管理手段204に記憶されている出現回数が少ない順に絞り込みキーワードを順位付けてもよい。また、出現回数を用いた計算を行い、その計算結果に基づいてキーワードを順位付けてもよい。
実施の形態5.
図18は、本発明の第5の実施の形態による情報検索支援システムの構成例を示すブロック図である。第4の実施の形態と同様の構成要素については、図16と同一の符号を付し、説明を省略する。ただし、第5の実施の形態では、キーワードランキング手段202の動作が第4の実施の形態と異なる。
第5の実施の形態では、キーワードランキング手段202は、複数の順位付けの態様を組み合わせて、絞り込みキーワードの順位付けを行う。例えば、第2の実施の形態で示したキーワードを含む事例数に基づく順位付けと、第3の実施の形態で示した履歴管理手段203に記憶された利用回数に基づく順位付けと、第4の実施の形態で示した外部ログでの出現回数に基づく順位付けとを組み合わせて、絞り込みキーワードの順位付けを行う。ここでは、上記の3種類の順位付けを組み合わせる場合を例に説明するが、2種類の順位付けを組み合わせてもよい。例えば、第2の実施の形態で示したキーワードを含む事例数に基づく順位付けと、第3の実施の形態で示した履歴管理手段203に記憶された利用回数に基づく順位付けとを組み合わせて、絞り込みキーワードの順位付けを行ってもよい。あるいは、第2の実施の形態で示したキーワードを含む事例数に基づく順位付けと、第4の実施の形態で示した外部ログでの出現回数に基づく順位付けとを組み合わせて、絞り込みキーワードの順位付けを行ってもよい。あるいは、第3の実施の形態で示した履歴管理手段203に記憶された利用回数に基づく順位付けと、第4の実施の形態で示した外部ログでの出現回数に基づく順位付けとを組み合わせて、絞り込みキーワードの順位付けを行ってもよい。
複数の順位付けの態様を組み合わせて絞り込みキーワードの順位付けを行う場合、キーワードランキング手段202は、それぞれの順位付けの態様において、順位付けられた各絞り込みキーワードに対してスコアを算出しておく。スコアは、順位に応じた値になるように算出する。例えば、順位が高い絞り込みキーワードほどスコアが高くなるようにスコアを算出する。そして、キーワードランキング手段202は、各順位付けの態様におけるスコアを用いて絞り込みキーワード毎に評価値を算出し、評価値によって絞り込みキーワードの順位付けを決定する。評価値は、例えば、各順位付け態様におけるスコアの和として算出する。
以下の説明では、第2の実施の形態で示したキーワードを含む事例数に基づく順位付けと、第3の実施の形態で示した履歴管理手段203に記憶された利用回数に基づく順位付けと、第4の実施の形態で示した外部ログでの出現回数に基づく順位付けとを組み合わせて、絞り込みキーワードの順位付けを行う場合を例にして説明する。
以下、スコアや評価値を算出して絞り込みキーワードを順位付ける例を示す。図19は、各絞り込み態様において算出された各絞り込みキーワードのスコアの例を示す説明図である。ここでは、キーワード共起判定手段201からキーワードランキング手段202に絞り込みキーワードとしてKW1〜KW11が送信されたとする。
キーワードランキング手段202は、第2の実施の形態と同様に、ステップS208において、直近のステップS204で検索された事例データを事例データ検索手段に問い合わせて、直近の検索結果(検索された事例データ)を得る。そして、キーワードランキング手段202は、キーワード別共起判定手段201から送られた絞り込みキーワードが、直近のステップS204で検索された事例データのうちいくつの事例に含まれているかを計算する。そして、キーワードランキング手段202は、多くの事例データに含まれている順に絞り込みキーワードを順位付ける。そして、個々の絞り込みキーワード毎に計算した絞り込みキーワードが含まれている事例数の和で、個々の絞り込みキーワードが含まれている事例数を除算した値をスコアとして算出する。図19(a)に示す例では、個々の絞り込みキーワード毎に計算した絞り込みキーワードが含まれている事例数の和は、1494となる。KW1が含まれている事例数は319である。従って、キーワードランキング手段202は、KW1のスコアを0.214(=319/1494)と算出する。キーワードランキング手段202は、KW2〜KW11についても同様にスコアを求める。このようにして求められたスコアは、図19(a)に示すようになる。
また、キーワードランキング手段202は、第3の実施の形態と同様に、各絞り込みキーワードが過去に検索キーワードして利用された回数を、履歴管理手段203に問い合わせ、その利用回数が多い順に絞り込みキーワードを順位付ける。この場合、履歴管理手段203は、第3の実施の形態と同様の情報を記憶する。例えば、履歴管理手段203は、図14に例示する情報を記憶する。キーワードランキング手段202は、個々のキーワードの利用回数の和で、個々のキーワードの利用回数を除算した値をスコアとして算出する。図19(b)に示す例では、個々のキーワードの利用回数の和165である。KW1の利用回数は35であるので、キーワードランキング手段202は、KW1のスコアを0.212(=35/165)と算出する。キーワードランキング手段202は、KW2〜KW11についても同様にスコアを求める。このようにして求められたスコアは、図19(b)に示すようになる。
さらに、キーワードランキング手段202は、第4の実施の形態と同様に、外部ログ管理手段204に記憶された各キーワードの出現回数を参照することによって、絞り込みキーワードと同一のキーワードに対応する出現回数を参照する。そして、外部ログ管理手段204に記憶されている出現回数が多い順に、絞り込みキーワードを順位付ける。そして、各絞り込みキーワードの外部ログでの出現数の和で、個々の絞り込みキーワードの出現数を除算した値をスコアとして算出する。図19(b)に示す例では、各絞り込みキーワードの外部ログでの出現数の和は、468である。また、外部ログでのKW1の出現数は101である。従って、キーワードランキング手段202は、KW1のスコアを0.216(=101/468)と算出する。キーワードランキング手段202は、KW2〜KW11についても同様にスコアを求める。このようにして求められたスコアは、図19(c)に示すようになる。
キーワードランキング手段202は、各絞り込みキーワード毎に、3種類のスコアの総和を算出し、その値を評価値とする。例えば、絞り込みキーワードKW1の評価値は、上記の0.214、0.212、0.216の和として算出する。他の絞り込みキーワードKW2〜KW11に関しても同様に評価値を算出する。そして、評価値の高い順に絞り込みキーワードを順位付ける。図20は、このように決定した絞り込みキーワードの順位の例を示す説明図である。
その後、キーワードランキング手段202は、絞り込みキーワードと絞り込みキーワードの順位付け結果をキーワード提示手段30に送信して、キーワード提示手段30は、定められた順番に絞り込みキーワードを表示する(ステップS209)。
本実施の形態によれば、ユーザの入力した検索キーワードとの間で、多くの事例データで共起関係が発生していたり、様々なユーザに検索キーワードとしてよく利用されていたり、特定の分野でよく利用されているキーワードを、順位の高い絞り込みキーワードとして(優先的に提示すべき絞り込みキーワードとして)ユーザに提示できる。
なお、キーワードを含む事例数に基づく順位付けでは、事例数の多い順に順位付けしても、少ない順に順位付けしてもよい。また、事例数を用いた計算を行い、その計算結果に基づいてキーワードを順位付けてもよい。履歴管理手段203に記憶された利用回数に基づく順位付けでは、利用回数の多い順に順位付けしても、少ない順に順位付けしてもよい。また、利用回数を用いた計算を行い、その計算結果に基づいてキーワードを順位付けてもよい。外部ログでの出現回数に基づく順位付けでは、出現回数の多い順に順位付けしても、少ない順に順位付けしてもよい。また、出現回数を用いた計算を行い、その計算結果に基づいてキーワードを順位付けてもよい。
実施の形態6.
第6の実施の形態の情報検索支援システムの構成は、第1の実施の形態の構成(図1参照。)と同様である。また、第6の実施の形態の情報検索支援システムの動作も、図2に示すフローチャートで表される。ただし、関連キーワード抽出手段10とキーワード別共起判定手段201の動作が、実施の形態1と異なる。
また、本実施の形態では、情報検索支援システムは、意味グループを記憶する。「意味グループ」とは、特定の事項に関連するキーワードの集合である。例えば、「異常箇所」という事項に関連する「ドラム」、「紙」、「用紙」、「印刷」、「給紙」、「印字」、「カセット」、「トナー」等の集合が1つの意味グループとなる。また、例えば、「症状」という事項に関連する「詰まる」、「取り除く」、「ずれる」、「消える」、「薄い」、「止まる」、「汚れる」等の集合が1つの意味グループとなる。各意味グループは、どのような事項に関するグループであるのかという情報と、その意味グループに属するキーワードの集合とが対応づえけられて記憶される。意味グループは、関連キーワード抽出手段10によって参照される。意味グループは、予め、例えば、事例データベース70か、あるいは事例データベース70以外の記憶装置(図示せず。)に登録されている。各意味グループは、予め人手で、特定の事項に関連するキーワード(例えば、「異常箇所」に関連するキーワードや「症状」に関するキーワード)を辞書化することによって作成し、その意味グループを事例データベース70(あるいは、他の記憶装置)に登録しておけばよい。関連キーワード抽出手段10は、事例データから一対のキーワードを抽出したときに、その一方が予め定められた所定の意味グループに属し、他方が予め定められた別の所定の意味グループに属している場合に、その一対のキーワードを関連するキーワードとして関連キーワードテーブル80に記憶させる。
以下、図1および図2を参照して、本実施の形態の情報検索支援システムの動作について説明する。関連キーワード抽出手段10は、事例データベース70に蓄積されている各事例データを解析し、各事例データに含まれている関連するキーワードを抽出し、個々の事例データから抽出した関連するキーワードを関連キーワードテーブル80に登録する(ステップS201)。
ステップS201において、関連キーワード抽出手段10が行う解析処理は、図21に示すフローチャートで示される。図21に示すステップS301〜S303の処理は、図3(a)に示すステップS301〜S303と同様である。関連キーワード抽出手段10は、自然文で書かれた事例データに対して係り受け解析を行い、係り受けの発生している2つの文字列を、1つの文字列グループとする(ステップS301)。関連キーワード抽出手段10は、1つの文字列グループとした2つの文字列について、例えば形態素解析を行うことによって、文字列を単語に分割する(ステップS302)。続いて、関連キーワード抽出手段10は、分割した単語の中らから不要な単語(不要な品詞)を除外する(ステップS303)。ステップS303では、少なくとも助詞、助動詞、接続詞を除外する。
次に、関連キーワード抽出手段10は、文字列グループ内で、係り受けのある各文字列から分割した単語のうち、除外されずに残った単語(以下、抽出キーワードと記す。)の組み合わせを抽出する(ステップS1704)。ただし、1つの組み合わせを構成する抽出キーワードは2つとする。すなわち、2つの抽出キーワードを組み合わせて、1つの組み合わせとする。関連キーワード抽出手段10は、係り受け関係にある文字列のうち修飾する側の文字列から得られた抽出キーワードと、係り受け関係にある文字列のうち修飾される側の文字列から得られた抽出キーワードとを組み合わせて、1つの組み合わせとする。ステップS1704において、抽出される抽出キーワードの組み合わせは、1つに限定されるわけではなく、複数の組み合わせが抽出されてもよい。
次に、関連キーワード抽出手段10は、ステップS1704で抽出した各組み合わせを構成している抽出キーワードが、どの意味グループに属しているのかを判定する(ステップS1705)。このとき、関連キーワード抽出手段10は、事例データベース70(あるいは他の記憶装置でもよい。)に登録されている意味グループを参照して、各抽出キーワードがどの意味グループに属しているのかを判定すればよい。
そして、関連キーワード抽出手段10は、ステップS1704で抽出した抽出キーワードの各組み合わせの中から、一方の抽出キーワードが予め定められた所定の意味グループに属し、他方の抽出キーワードが予め定められた別の所定の意味グループに属している組み合わせを選択する。関連キーワード抽出手段10は、選択した組み合わせを構成している対になっている抽出キーワードを関連キーワードとして関連キーワードテーブル80に記憶させる(ステップS1706)。
関連キーワード抽出手段10は、上述のような処理を事例データ毎に行って、事例データ毎に関連キーワードを抽出する。
図22は、第6の実施の形態における関連キーワード抽出の具体例を示す説明図である。図22に示すように、意味グループ180として、「異常箇所」に関連する意味グループおよび「症状」に関連する意味グループが登録されているものとする。そして、関連キーワード抽出手段10がステップS1704の処理において、図22に示す抽出キーワードの各組み合わせ32を抽出しているものとする。図22に示す各組み合わせ32において、抽出キーワードKW1は、係り受け関係にある文字列のうち修飾する側の文字列から得られた抽出キーワードであり、抽出キーワードKW2は、係り受け関係にある文字列のうち修飾される側の文字列から得られた抽出キーワードである。本例では、係り受け関係にある文字列のうち修飾する側の文字列から得られた抽出キーワードが「異常箇所」に関連する意味グループに属し、係り受け関係にある文字列のうち修飾される側の文字列から得られた抽出キーワードが「症状」に関連する意味グループに属している場合、その2つの抽出キーワードが互いに関連するキーワードであるものとする。例えば、修飾する側の文字列から得られた抽出キーワード「ドラム」は、「異常箇所」に関連する意味グループに属し、修飾される側の文字列から得られた抽出キーワード「詰まる」は、「症状」に関連する意味グループに属している。従って、関連キーワード抽出手段10は、「ドラム」および「詰まる」を関連キーワード181として関連キーワードテーブル80に記憶させる。関連キーワード抽出手段10は、同様に、「紙」および「詰まる」の組み合わせや、「用紙」および「取り除く」の組み合わせも関連キーワード181として関連キーワードテーブル80に記憶させる。このとき、関連キーワード抽出手段10は、対になるキーワードがどの意味グループに属するのかを識別できるように関連キーワードを関連キーワードテーブル80に記憶させる。例えば、2つの意味グループに分けて関連キーワードを関連キーワードテーブル80に記憶させる。図22では、関連キーワードである「ドラム」および「詰まる」を関連キーワードテーブル80に記憶させるときに、「ドラム」は「異常箇所」のグループに属するキーワードとして記憶させ、「詰まる」は「症状」に関連するキーワードとして記憶させている。「紙」および「詰まる」の組み合わせや、「用紙」および「取り除く」の組み合わせについても同様である。
また、図22に示す各組み合わせ32のうち、例えば、「詰まる」および「取り除く」の組み合わせについては、修飾する側の文字列から得られた抽出キーワード「詰まる」が「異常箇所」に関連する意味グループに属していない。従って、関連キーワード抽出手段10は、「詰まる」および「取り除く」の組み合わせを関連キーワードとせず、関連キーワードテーブル80に記憶させない。「すぐ」および「詰まる」等の組み合わせについても同様である。
また、特開2006−65366号公報の段落[0032]に記載されているように、キーワード抽出の際に、キーワードの後ろ近傍に出現する助詞によってキーワードの主題らしさを計算し、主題らしいと判定されるキーワードを所定の事項に関連するグループのキーワードとし、そのキーワードと係り受け関係にあるキーワードを他の所定の事項に関連するグループに属するキーワードとして、その2つのキーワードを関連キーワードとして関連キーワードテーブル80に記憶させてもよい。例えば、主題らしいと判定されるキーワードを「異常箇所」に関連するグループのキーワードとし、そのキーワードと係り受け関係にあるキーワードを「症状」に関連するグループのキーワードとして、その2つのキーワードを関連キーワードとして関連キーワードテーブル80に記憶させてもよい。
図21では、係り受け関係を利用して関連キーワードを抽出する場合を示したが、他の態様で関連キーワードを抽出してもよい。
例えば、関連キーワード抽出手段10は、句読点で区切られる文字列(読点に挟まれる文字列、あるいは読点および句点に挟まれる文字列)を1つの文字列グループとして関連キーワードを抽出してもよい。この場合、関連キーワード抽出手段10は、句読点で区切られる文字列をそれぞれ1つの文字列グループとする。そして、関連キーワード抽出手段10は、各文字列グループに属する文字列(句読点で区切られる文字列)を、例えば形態素解析を行うことによって、単語に分割し、不要な単語(不要な品詞。少なくとも、助詞、助動詞および接続詞。)を除外する。そして、除外されずに残った単語を抽出キーワードとする。関連キーワード抽出手段10は、抽出キーワードを用いて、2つの抽出キーワードの組み合わせを生成する。このとき生成される組み合わせの数は1つに限定されない。関連キーワード抽出手段10は、生成した組み合わせの中から、一方の抽出キーワードが予め定められた所定の意味グループに属し、他方の抽出キーワードが予め定められた別の所定の意味グループに属している組み合わせを選択する。関連キーワード抽出手段10は、選択した組み合わせを構成している対になっている抽出キーワードを関連キーワードとして関連キーワードテーブル80に記憶させる。このような処理を事例データ毎に行って、事例データ毎に関連キーワードを抽出してもよい。
また、例えば、個々の単語と、その個々の単語からの距離が閾値範囲内である単語との組み合わせを関連キーワードとして抽出してもよい。この場合、関連キーワード抽出手段10は、例えば形態素解析を行うことによって事例データを単語に分割し、不要な単語(不要な品詞。少なくとも、助詞、助動詞および接続詞。)を除外する。そして、除外されずに残った単語を抽出キーワードとする。そして、関連キーワード抽出手段10は、抽出キーワード毎に、その個々の抽出キーワードからの距離が閾値範囲内である抽出キーワードを取り出し、2つの抽出キーワードからなる抽出キーワードの組み合わせを生成する。関連キーワード抽出手段10は、生成した組み合わせの中から、一方の抽出キーワードが予め定められた所定の意味グループに属し、他方の抽出キーワードが予め定められた別の所定の意味グループに属している組み合わせを選択する。関連キーワード抽出手段10は、選択した組み合わせを構成している対になっている抽出キーワードを関連キーワードとして関連キーワードテーブル80に記憶させる。このような処理を事例データ毎に行って、事例データ毎に関連キーワードを抽出してもよい。
第1の実施の形態と同様に、関連キーワード抽出手段10は、関連キーワードを関連キーワードテーブル80に登録するときに、どの事例データから抽出された関連キーワードであるのかを識別できるように関連キーワードを登録する。
事例データ毎に関連キーワードを抽出して、関連キーワードテーブル80に登録することによって、前処理であるステップS201が完了する。
続いて、ユーザがキーワードを使って事例データを検索するときの情報検索支援システムの動作を説明する。ステップS202〜S205(図2参照。)の動作は、第1の実施の形態と同様であるので説明を省略する。
ステップS203において、キーワード別共起判定手段201には、事例データ検索手段50による検索結果である事例データが、事例データ検索手段50から送られる。キーワード別共起判定手段201は、関連キーワードテーブル80に記憶されている各事例データ毎の関連キーワードのうち、検索結果である事例データから抽出された関連キーワードを参照する(ステップS206)。すなわち、キーワード別共起判定手段201は、検索結果である事例データから抽出された関連キーワードを調べる(ステップS206)。
そして、キーワード別共起判定手段201は、検索された事例データに対応する関連キーワードに属する各キーワード毎に、そのキーワードが、履歴管理手段203に記憶されている検索キーワードと共起しているか否かを判定する(ステップS207)。第6の実施の形態では、キーワード別共起判定手段201は、履歴管理手段203に記憶されている検索キーワードと対になっているキーワードであれば、そのキーワードは、検索キーワードと共起しているキーワードであると判定する。この点は、第1の実施の形態と同様である。さらに本実施の形態では、関連キーワードに属する各キーワードのうち、履歴管理手段203に記憶されている検索キーワードと同じ意味グループに属しているキーワードも、履歴管理手段203に記憶されている検索キーワードと共起しているキーワードであると判定する。すなわち、キーワード別共起判定手段201は、履歴管理手段203に記憶されている検索キーワードがどの意味グループに属しているかを判定し、関連キーワードに属する各キーワードのうち、その意味グループに属しているキーワードは、全て共起していると判定する。なお、関連キーワード抽出手段10は、対になるキーワードがどの意味グループに属するのかを識別できるように関連キーワードを関連キーワードテーブル80に記憶させる。例えば、2つの意味グループに分けて関連キーワードを関連キーワードテーブル80に記憶させる。従って、キーワード別共起判定手段201は、関連キーワードテーブル80を参照することによって、各キーワードがどの意味グループに属しているのかを判断することができる。
キーワード別共起判定手段201は、履歴管理手段203に記憶されている検索キーワードと共起していると判定されたキーワードを、絞り込みキーワード(検索キーワードの候補)としてキーワードランキング手段202に送信する。
図23は、第6の実施の形態における共起関係の有無の判定の具体例を示す説明図である。ユーザからキーワード選択入力手段40に検索キーワード「印刷」が入力され、履歴管理手段203は、検索キーワード195(図23参照。本例では「印刷」。)を記憶しているものとする。また、また、ステップS204では、事例データ検索手段50が、検索キーワード「印刷」を含む事例データを、事例データベース70に記憶されている全事例データ190(図23参照。)の中から検索し、図23に示す「事例1」、「事例2」および「事例3」を含む検索結果をキーワード別共起判定手段201に出力しているものとする。また、前処理であるステップS201によって、事例1から抽出された関連キーワード192、事例2から抽出された関連キーワード193、および事例3から抽出された関連キーワード194が、関連キーワードテーブル80に記憶されたものとする。また、関連キーワード192,193,194は、2つの意味グループ(本例では「異常箇所」の意味グループおよび「症状」の意味グループ)に分けて記憶されているものとする。ステップS206で、キーワード別共起判定手段201は、検索結果191に含まれる「事例1」、「事例2」および「事例3」から抽出済みであって関連キーワードテーブル80に記憶されている関連キーワード192,193,194を参照する。すなわち、検索結果191に含まれる事例データから抽出されていた関連キーワードを調べる。
ステップS207では、キーワード別共起判定手段201は、履歴管理手段203に記憶されている検索キーワード195の意味グループを判定する。本例では、検索キーワード195と同一のキーワード「印刷」が、「異常箇所」の意味グループとして関連キーワードテーブル80に登録されているので、キーワード別共起判定手段201は、検索キーワード195の意味グループが、「異常箇所」の意味グループであると判定する。次に、キーワード別共起判定手段201は、関連キーワード192,193,194に属する各キーワードのうち、履歴管理手段203に記憶されている検索キーワード195と同一の意味グループに属するキーワードは全て、履歴管理手段203に記憶されている検索キーワード195と共起していると判定する。本例では、「印刷」と同じ意味グループに属する「紙」、「トナー」は、「印刷」と共起していると判定される。また、キーワード別共起判定手段201は、関連キーワード192,193,194に属するキーワードのうち、履歴管理手段203に記憶されている検索キーワードと対になっているキーワードがあれば、そのキーワードは、検索キーワードと共起しているキーワードであると判定する。この点は、第1の実施の形態と同様であり、本例では、「汚れる」、「詰まる」、「異常」、「ずれる」が、「印刷」と共起していると判定する(図23に示す関連キーワード192,193,194における太枠で囲んだ範囲を参照。)。
キーワード別共起判定手段201は、履歴管理手段203に記憶されている検索キーワード195と、関連キーワードとの共起の有無の判定を行い、判定結果197を導く。図23に示す例では、各意味グループ毎に意味グループを分けて、判定結果を示している。図23に示す判定結果195では、履歴管理手段203に記憶されている検索キーワード45と共起している場合を「1」で示し、共起していない場合を「0」で示している。
キーワード別共起判定手段201は、履歴管理手段203に記憶されている検索キーワードと共起していると判定されたキーワードを、絞り込みキーワードとしてキーワードランキング手段202に送信する。図23に示す判定結果197が得られた場合、キーワード別共起判定手段201は、「異常箇所」の意味グループに属する「紙」、「トナー」、および「症状」のグループに属する「汚れる」、「詰まる」、「異常」、「ずれる」をキーワードランキング手段202に送信する。
キーワードランキング手段202は、送信された絞り込みキーワードを第1の実施の形態と同様に順位付けする(ステップS208)。例えば、五十音順に順位付けする。このとき、キーワードランキング手段202は、絞り込みキーワードの順位付を意味グループ毎に行ってもよい。続いて、キーワード提示手段30は、表示件数範囲内の絞り込みキーワードを、ステップS208で定められた順位に従って表示する(ステップS209)。キーワード提示手段30は、意味グループ毎に分けて、絞り込みキーワードを表示してもよい。例えば、「異常箇所」の意味グループに属する「紙」、「トナー」と、「症状」のグループに属する「汚れる」、「詰まる」、「異常」、「ずれる」とをそれぞれ分けて、ステップS208で定められた順番で、「異常箇所」の意味グループの絞り込みキーワードと、「症状」のグループの絞り込みキーワードを表示してもよい。
また、キーワードランキング手段202による順位付けは、第2の実施の形態、第3の実施の形態、第4の実施の形態、あるいは第5の実施の形態と同様に行ってもよい。以下、一例として、キーワードランキング手段202が、第2の実施の形態と同様に、事例検索手段50に問い合わせを行い、送信されたキーワードがいくつの事例に含まれているかを計算し、事例数を使って順位付けする場合の例を示す。
キーワードランキング手段202は、キーワード別共起判定手段201から送信された絞り込みキーワード毎に事例数を集計する。ここでは、意味グループ毎に絞り込みキーワードの事例数を集計するものとする。図24は、各意味グループにおける絞り込みキーワードを含む事例の数の集計結果の例を示す説明図である。図24(a)に示すように、「異常箇所」の意味グループに属する絞り込みキーワード「紙」、「トナー」を含む事例の数は、それぞれ2,1であったとする。また、図24(b)に示すように、「症状」の意味グループに属する「詰まる」、「異常」、「汚れる」、「ずれる」を含む事例の数は、それぞれ3,2,1,1であったとする。キーワードランキング手段202は、各意味グループ毎に、集計した事例数の多い順に絞り込みキーワードの順位付を行う。「異常箇所」の意味グループでは、「紙」、「トナー」の順に順位付を行う。また、「症状」の意味グループでは、「詰まる」、「異常」、「汚れる」、「ずれる」の順に順位付を行う。
キーワードランキング手段202は、キーワードとキーワードのランキング結果をキーワード提示手段30に送信して、キーワード提示手段30が例えば図25のように絞り込みキーワードを表示する。図25は、第6の実施の形態における絞り込みキーワードの表示例を示す説明図である。本例のように、事例数に基づいて順位付が行われた場合、図25に示すように、絞り込みキーワードが含まれている事例数とともに絞り込みキーワードを表示してもよい。
本実施の形態によれば、履歴管理手段203に記憶されている検索キーワードと対になっているキーワードであれば、そのキーワードは、検索キーワードと共起しているキーワードであると判定する。従って、入力された検索キーワードに対して、関連のあるキーワードを絞り込みキーワードとして表示することができる。例えば、「異常箇所」の意味グループの検索キーワードに対して、関連のある「症状」の意味グループのキーワードを絞り込みキーワードとして提示したり、逆に「症状」の意味グループの検索キーワードに対して、関連のある「異常箇所」の意味グループのキーワードを絞り込みキーワードとして提示することができる。このように、ユーザが入力した検索キーワードと意味的に関連性の高いキーワードを選択的に提示することができる。また、履歴管理手段203に記憶されている検索キーワードと同じ意味グループに属しているキーワードも、履歴管理手段203に記憶されている検索キーワードと共起しているキーワードであると判定する。従って、同一の意味グループに属するキーワードも絞り込みキーワードとして提示することができ、検索キーワードと同種のトピックに関するキーワードを絞り込みキーワードとして提示することができる。例えば、ユーザは、一度異常箇所に関するキーワードを選択した後に、続けて、別の異常箇所に関するキーワードを選択することができるため、複数の異常箇所が存在している場合にでも簡単に事例を検索することができる。
上記の各実施の形態において、関連キーワード抽出手段10、キーワード生成手段20および事例データ検索手段50は、例えば、プログラムに従って動作するCPUによって実現される。
また、情報検索支援システムは、各構成要素を含む1台の装置として実現されていてもよい。この場合、その情報検索支援システムは、例えば、CPUに関連キーワード抽出手段10、キーワード生成手段20および事例データ検索手段50としての動作を実行させる情報検索支援プログラムを搭載する。
あるいは、関連キーワード抽出手段10をバックエンドとする構成であってもよい。例えば、キーワード生成手段20、事例データ検索手段50、キーワード提示手段30、キーワード選択入力手段40、および事例データ提示手段60を含む情報検索支援装置を備え、バックエンドとして、事例データベース70、関連キーワード抽出手段10、および関連キーワードテーブル80を含む関連キーワード抽出装置とを備えた構成であってもよい。この場合、情報検索支援装置は、例えば、CPUにキーワード生成手段20および事例データ検索手段50としての動作を実行させる情報検索支援プログラムを搭載すればよい。そして、バックエンドとなる関連キーワード抽出装置は、例えば、CPUに関連キーワード抽出手段10としての動作を実行させる関連キーワード抽出プログラムを搭載すればよい。
上記の各実施の形態において、データベースは、事例データベース70によって実現される。データ検索手段は、事例データ検索手段50によって実現される。共起判定手段は、キーワード別共起判定手段201によって実現される。キーワードランキング手段は、キーワードランキング手段202によって実現される。履歴管理手段は、履歴管理手段203によって実現される。外部ログ管理手段は、外部ログ管理手段204によって実現される。事例データは、検索対象データに相当する。
本発明によれば、製品の障害事例や受付事例や苦情対応などの各種事例が蓄積されているコールセンタやカスタマーセンタにおける事例検索(ナレッジ検索)の支援という用途等に適用できる。
本発明の第1の実施の形態による情報検索支援システムの構成例を示すブロック図である。 第1の実施の形態の情報検索支援システムの動作を示すフローチャートである。 図3は、関連キーワード抽出手段の動作を示す説明図である。 履歴管理手段に記憶された検索キーワードの例を示す説明図である。 ステップS306,S307の動作の具体例を示す説明図である。 事例データ検索手段による検索結果、およびキーワード別共起判定手段に生成されキーワードランキング手段に順位付けされた絞り込みキーワードを表示する表示画面の例を示す説明図である。 絞り込みキーワードを用いてさらに検索を進める場合の動作を示す説明図である。 事例データ検索手段による検索結果、およびキーワード別共起判定手段に生成されキーワードランキング手段に順位付けされた絞り込みキーワードを表示する表示画面の例を示す説明図である。 検索キーワード毎に各キーワードが共起しているか否かを判定する度に絞り込みキーワードを表示する場合の表示画面の例を示す説明図である。 本発明の第2の実施の形態による情報検索支援システムの構成例を示すブロック図である。 絞り込みキーワードを含む事例数の集計結果および絞り込みキーワードの順位付け結果の具体例を示す説明図である。 事例データ検索手段による検索結果、およびキーワード別共起判定手段に生成されキーワードランキング手段に順位付けされた絞り込みキーワードを表示する表示画面の例を示す説明図である。 本発明の第3の実施の形態による情報検索支援システムの構成例を示すブロック図である。 本実施の形態において履歴管理手段が記憶する情報の例を示す説明図である。 第3の実施の形態における絞り込みキーワードの順位付け結果の具体例を示す説明図である。 本発明の第4の実施の形態による情報検索支援システムの構成例を示すブロック図である。 外部ログに記述されている全キーワード毎のキーワードの出現回数の集計値の例および、絞り込みキーワードの順位付け結果の具体例を示す説明図である。 本発明の第5の実施の形態による情報検索支援システムの構成例を示すブロック図である。 各絞り込み態様において算出された各絞り込みキーワードのスコアの例を示す説明図である。 絞り込みキーワードの順位の例を示す説明図である。 関連キーワード抽出手段が行う解析処理の例を示す説明図である。 第6の実施の形態における関連キーワード抽出の具体例を示す説明図である。 第6の実施の形態における共起関係の有無の判定の具体例を示す説明図である。 各意味グループにおける絞り込みキーワードを含む事例の数の集計結果の例を示す説明図である。 第6の実施の形態における絞り込みキーワードの表示例を示す説明図である。
符号の説明
10 関連キーワード抽出手段
20 キーワード生成手段
30 キーワード提示手段
40 キーワード選択入力手段
50 事例データ検索手段
60 事例データ提示手段
70 事例データベース
80 関連キーワードテーブル
201 キーワード別共起判定手段
202 キーワードランキング手段
203 履歴管理手段

Claims (48)

  1. 自然文で記述されたデータである検索対象データを記憶するデータベースと、
    各検索対象データ毎に、所定の関係を有する対になるキーワードの組を関連キーワードとして抽出する関連キーワード抽出手段と、
    データベースに記憶された検索対象データの中から、ユーザに入力された検索キーワードを含む検索対象データを検索するデータ検索手段と、
    データ検索手段によって検索された検索対象データから抽出された関連キーワードを参照して、当該関連キーワードに含まれるキーワードが、検索キーワードと共起しているか否かを判定する共起判定手段と、
    検索キーワードと共起していると判定された各キーワードの順位付けを行うキーワードランキング手段とを備え、
    共起判定手段は、データ検索手段によって検索された検索対象データから抽出された関連キーワードに含まれているキーワードが、ユーザに入力された検索キーワードと対になっているときに、関連キーワードに含まれている前記キーワードが検索キーワードと共起していると判定する
    ことを特徴とする情報検索支援システム。
  2. ユーザによって入力された検索キーワードを、入力された順序が判別可能となるように記憶する履歴管理手段を備え、
    共起判定手段は、関連キーワードに含まれるキーワードが、履歴管理手段に記憶された検索キーワードと共起しているか否かを判定する
    請求項1に記載の情報検索支援システム。
  3. キーワードランキング手段は、五十音順にキーワードの順位付けを行う
    請求項1または請求項2に記載の情報検索支援システム。
  4. キーワードランキング手段は、データ検索手段によって検索された検索対象データのうち、検索キーワードと共起していると判定されたキーワードを含んでいる検索対象データの数を、検索キーワードと共起していると判定されたキーワード毎に集計し、集計した検索対象データの数に応じてキーワードの順位付けを行う
    請求項1または請求項2に記載の情報検索支援システム。
  5. キーワードランキング手段は、履歴管理手段に検索キーワードとして記憶されている数に応じて、検索キーワードと共起していると判定された各キーワードの順位付けを行う
    請求項2に記載の情報検索支援システム。
  6. 外部のシステムで蓄積された外部ログに含まれるキーワードの前記外部ログにおける出現回数を記憶する外部ログ管理手段を備え、
    キーワードランキング手段は、前記出現回数に応じて、検索キーワードと共起していると判定された各キーワードの順位付けを行う
    請求項1または請求項2に記載の情報検索支援システム。
  7. 外部のシステムで蓄積された外部ログに含まれるキーワードの前記外部ログにおける出現回数を記憶する外部ログ管理手段を備え、
    キーワードランキング手段は、
    データ検索手段によって検索された検索対象データのうち、検索キーワードと共起していると判定されたキーワードを含んでいる検索対象データの数を、検索キーワードと共起していると判定されたキーワード毎に集計し、集計した検索対象データの数に応じてキーワードの順位付けを行ったときの順位付け結果、
    履歴管理手段に検索キーワードとして記憶されている数に応じて、検索キーワードと共起していると判定された各キーワードの順位付けを行ったときの順位付け結果、および
    前記出現回数に応じて、検索キーワードと共起していると判定された各キーワードの順位付けを行ったときの順位付け結果のうちの2つまたは3つの順位付け結果に基づいて、検索キーワードと共起していると判定された各キーワードの順位付けを行う
    請求項2に記載の情報検索支援システム。
  8. 関連キーワード抽出手段は、係り受け関係にある2つの文字列の一方から得たキーワードと、他方の文字列から得たキーワードとの組を関連キーワードとして抽出する
    請求項1から請求項7のうちのいずれか1項に記載の情報検索支援システム。
  9. 関連キーワード抽出手段は、句読点で区切られる文字列の中から得られる2つのキーワードの組を関連キーワードとして抽出する
    請求項1から請求項7のうちのいずれか1項に記載の情報検索システム。
  10. 関連キーワード抽出手段は、検索対象データに含まれるキーワード同士の距離が閾値以内である2つのキーワードの組を関連キーワードとして抽出する
    請求項1から請求項7のうちのいずれか1項に記載の情報検索システム。
  11. 関連キーワード抽出手段は、2つのキーワードの一方が所定の意味グループのキーワードであり、他方が別の所定の意味グループのキーワードであるときに、前記2つのキーワードの組を関連キーワードとして抽出し、
    共起判定手段は、データ検索手段によって検索された検索対象データから抽出された関連キーワードに含まれているキーワードが、ユーザに入力された検索キーワードと対になっているときに、関連キーワードに含まれている前記キーワードが検索キーワードと共起していると判定するとともに、関連キーワードに含まれているキーワードが、検索キーワードと同じ意味グループのキーワードであるときに、関連キーワードに含まれている前記キーワードが検索キーワードと共起していると判定する
    請求項1から請求項10のうちのいずれか1項に記載の情報検索支援システム。
  12. 自然文で記述されたデータである検索対象データにおける所定の関係を有する対になるキーワードの組を関連キーワードとして記憶する関連キーワードテーブルを参照可能な情報検索支援装置であって、
    データベースに記憶された検索対象データの中から、ユーザに入力された検索キーワードを含む検索対象データを検索するデータ検索手段と、
    データ検索手段によって検索された検索対象データから抽出された関連キーワードを参照して、当該関連キーワードに含まれるキーワードが、検索キーワードと共起しているか否かを判定する共起判定手段と、
    検索キーワードと共起していると判定された各キーワードの順位付けを行うキーワードランキング手段とを備え、
    共起判定手段は、データ検索手段によって検索された検索対象データから抽出された関連キーワードに含まれているキーワードが、ユーザに入力された検索キーワードと対になっているときに、関連キーワードに含まれている前記キーワードが検索キーワードと共起していると判定する
    ことを特徴とする情報検索支援装置。
  13. ユーザによって入力された検索キーワードを、入力された順序が判別可能となるように記憶する履歴管理手段を備え、
    共起判定手段は、関連キーワードに含まれるキーワードが、履歴管理手段に記憶された検索キーワードと共起しているか否かを判定する
    請求項12に記載の情報検索支援装置。
  14. キーワードランキング手段は、五十音順にキーワードの順位付けを行う
    請求項12または請求項13に記載の情報検索支援装置。
  15. キーワードランキング手段は、データ検索手段によって検索された検索対象データのうち、検索キーワードと共起していると判定されたキーワードを含んでいる検索対象データの数を、検索キーワードと共起していると判定されたキーワード毎に集計し、集計した検索対象データに応じてキーワードの順位付けを行う
    請求項12または請求項13に記載の情報検索支援装置。
  16. キーワードランキング手段は、履歴管理手段に検索キーワードとして記憶されている数に応じて、検索キーワードと共起していると判定された各キーワードの順位付けを行う
    請求項13に記載の情報検索支援装置。
  17. 外部のシステムで蓄積された外部ログに含まれるキーワードの前記外部ログにおける出現回数を記憶する外部ログ管理手段を備え、
    キーワードランキング手段は、前記出現回数に応じて、検索キーワードと共起していると判定された各キーワードの順位付けを行う
    請求項12または請求項13に記載の情報検索支援装置。
  18. 外部のシステムで蓄積された外部ログに含まれるキーワードの前記外部ログにおける出現回数を記憶する外部ログ管理手段を備え、
    キーワードランキング手段は、
    データ検索手段によって検索された検索対象データのうち、検索キーワードと共起していると判定されたキーワードを含んでいる検索対象データの数を、検索キーワードと共起していると判定されたキーワード毎に集計し、集計した検索対象データの数に応じてキーワードの順位付けを行ったときの順位付け結果、
    履歴管理手段に検索キーワードとして記憶されている数に応じて、検索キーワードと共起していると判定された各キーワードの順位付けを行ったときの順位付け結果、および
    前記出現回数に応じて、検索キーワードと共起していると判定された各キーワードの順位付けを行ったときの順位付け結果のうちの2つまたは3つの順位付け結果に基づいて、検索キーワードと共起していると判定された各キーワードの順位付けを行う
    請求項13に記載の情報検索支援装置。
  19. 共起判定手段は、データ検索手段によって検索された検索対象データから抽出された関連キーワードに含まれているキーワードが、ユーザに入力された検索キーワードと対になっているときに、関連キーワードに含まれている前記キーワードが検索キーワードと共起していると判定するとともに、関連キーワードに含まれているキーワードが、検索キーワードと同じ意味グループのキーワードであるときに、関連キーワードに含まれている前記キーワードが検索キーワードと共起していると判定する
    請求項12から請求項18のうちのいずれか1項に記載の情報検索支援システム。
  20. 自然文で記述されたデータである検索対象データを記憶するデータベースと、
    各検索対象データ毎に、所定の関係を有する対になるキーワードの組を関連キーワードとして抽出する関連キーワード抽出手段とを備えた
    ことを特徴とする関連キーワード抽出装置。
  21. 関連キーワード抽出手段は、係り受け関係にある2つの文字列の一方から得たキーワードと、他方の文字列から得たキーワードとの組を関連キーワードとして抽出する
    請求項20に記載の関連キーワード抽出装置。
  22. 関連キーワード抽出手段は、句読点で区切られる文字列の中から得られる2つのキーワードの組を関連キーワードとして抽出する
    請求項20に記載の関連キーワード抽出装置。
  23. 関連キーワード抽出手段は、検索対象データに含まれるキーワード同士の距離が閾値以内である2つのキーワードの組を関連キーワードとして抽出する
    請求項20に記載の関連キーワード抽出装置。
  24. 関連キーワード抽出手段は、2つのキーワードの一方が所定の意味グループのキーワードであり、他方が別の所定の意味グループのキーワードであるときに、前記2つのキーワードの組を関連キーワードとして抽出する
    請求項20から請求項23のうちのいずれか1項に記載の関連キーワード抽出装置。
  25. 関連キーワード抽出手段が、自然文で記述された各検索対象データ毎に、所定の関係を有する対になるキーワードの組を関連キーワードとして抽出し、
    データ検索手段が、検索対象データの中から、ユーザに入力された検索キーワードを含む検索対象データを検索し、
    共起判定手段が、データ検索手段によって検索された検索対象データから抽出された関連キーワードに含まれているキーワードが、ユーザに入力された検索キーワードと対になっているときに、関連キーワードに含まれている前記キーワードが検索キーワードと共起していると判定し、
    キーワードランキング手段が、検索キーワードと共起していると判定された各キーワードの順位付けを行う
    ことを特徴とする情報検索支援方法。
  26. 履歴管理手段が、ユーザによって入力された検索キーワードを、入力された順序が判別可能となるように記憶し、
    共起判定手段が、関連キーワードに含まれるキーワードが、履歴管理手段に記憶された検索キーワードと共起しているか否かを判定する
    請求項25に記載の情報検索支援方法。
  27. キーワードランキング手段が、五十音順にキーワードの順位付けを行う
    請求項25または請求項26に記載の情報検索支援方法。
  28. キーワードランキング手段が、データ検索手段によって検索された検索対象データのうち、検索キーワードと共起していると判定されたキーワードを含んでいる検索対象データの数を、検索キーワードと共起していると判定されたキーワード毎に集計し、集計した検索対象データの数に応じてキーワードの順位付けを行う
    請求項25または請求項26に記載の情報検索支援方法。
  29. キーワードランキング手段が、履歴管理手段に検索キーワードとして記憶されている数に応じて、検索キーワードと共起していると判定された各キーワードの順位付けを行う
    請求項26に記載の情報検索支援方法。
  30. 外部ログ管理手段が、外部のシステムで蓄積された外部ログに含まれるキーワードの前記外部ログにおける出現回数を記憶し、
    キーワードランキング手段が、前記出現回数に応じて、検索キーワードと共起していると判定された各キーワードの順位付けを行う
    請求項25または請求項26に記載の情報検索支援方法。
  31. 外部ログ管理手段が、外部のシステムで蓄積された外部ログに含まれるキーワードの前記外部ログにおける出現回数を記憶し、
    キーワードランキング手段が、
    データ検索手段によって検索された検索対象データのうち、検索キーワードと共起していると判定されたキーワードを含んでいる検索対象データの数を、検索キーワードと共起していると判定されたキーワード毎に集計し、集計した検索対象データの数に応じてキーワードの順位付けを行ったときの順位付け結果、
    履歴管理手段に検索キーワードとして記憶されている数に応じて、検索キーワードと共起していると判定された各キーワードの順位付けを行ったときの順位付け結果、および
    前記出現回数に応じて、検索キーワードと共起していると判定された各キーワードの順位付けを行ったときの順位付け結果のうちの2つまたは3つの順位付け結果に基づいて、検索キーワードと共起していると判定された各キーワードの順位付けを行う
    請求項26に記載の情報検索支援方法。
  32. 関連キーワード抽出手段が、係り受け関係にある2つの文字列の一方から得たキーワードと、他方の文字列から得たキーワードとの組を関連キーワードとして抽出する
    請求項25から請求項31のうちのいずれか1項に記載の情報検索支援方法。
  33. 関連キーワード抽出手段は、句読点で区切られる文字列の中から得られる2つのキーワードの組を関連キーワードとして抽出する
    請求項25から請求項31のうちのいずれか1項に記載の情報検索支援方法。
  34. 関連キーワード抽出手段は、検索対象データに含まれるキーワード同士の距離が閾値以内である2つのキーワードの組を関連キーワードとして抽出する
    請求項25から請求項31のうちのいずれか1項に記載の情報検索支援方法。
  35. 関連キーワード抽出手段が、2つのキーワードの一方が所定の意味グループのキーワードであり、他方が別の所定の意味グループのキーワードであるときに、前記2つのキーワードの組を関連キーワードとして抽出し、
    共起判定手段が、データ検索手段によって検索された検索対象データから抽出された関連キーワードに含まれているキーワードが、ユーザに入力された検索キーワードと対になっているときに、関連キーワードに含まれている前記キーワードが検索キーワードと共起していると判定するとともに、関連キーワードに含まれているキーワードが、検索キーワードと同じ意味グループのキーワードであるときに、関連キーワードに含まれている前記キーワードが検索キーワードと共起していると判定する
    請求項25から請求項34のうちのいずれか1項に記載の情報検索支援方法。
  36. 自然文で記述されたデータである検索対象データを記憶するデータベースを備えたコンピュータに、
    各検索対象データ毎に、所定の関係を有する対になるキーワードの組を関連キーワードとして抽出する関連キーワード抽出処理、
    データベースに記憶された検索対象データの中から、ユーザに入力された検索キーワードを含む検索対象データを検索するデータ検索処理、
    データ検索処理で検索された検索対象データから抽出された関連キーワードを参照して、当該関連キーワードに含まれるキーワードが、検索キーワードと共起しているか否かを判定する共起判定処理、
    検索キーワードと共起していると判定された各キーワードの順位付けを行うキーワードランキング処理を実行させ、
    共起判定処理では、データ検索処理で検索された検索対象データから抽出された関連キーワードに含まれているキーワードが、ユーザに入力された検索キーワードと対になっているときに、関連キーワードに含まれている前記キーワードが検索キーワードと共起していると判定させる
    ための情報検索支援プログラム。
  37. コンピュータに、
    ユーザによって入力された検索キーワードを、入力された順序が判別可能となるように記憶する履歴管理処理を実行させ、
    共起判定処理では、関連キーワードに含まれるキーワードが、履歴管理処理で記憶された検索キーワードと共起しているか否かを判定させる
    請求項36に記載の情報検索支援プログラム。
  38. コンピュータに、
    キーワードランキング処理で、五十音順にキーワードの順位付けを行わせる
    請求項36または請求項37に記載の情報検索支援プログラム。
  39. コンピュータに、
    キーワードランキング処理で、データ検索処理で検索された検索対象データのうち、検索キーワードと共起していると判定されたキーワードを含んでいる検索対象データの数を、検索キーワードと共起していると判定されたキーワード毎に集計し、集計した検索対象データの数に応じてキーワードの順位付けを行わせる
    請求項36または請求項37に記載の情報検索支援プログラム。
  40. コンピュータに、
    キーワードランキング処理で、履歴管理処理で検索キーワードとして記憶されている数に応じて、検索キーワードと共起していると判定された各キーワードの順位付けを行わせる
    請求項37に記載の情報検索支援プログラム。
  41. コンピュータに、
    外部のシステムで蓄積された外部ログに含まれるキーワードの前記外部ログにおける出現回数を記憶する外部ログ管理処理を実行させ、
    キーワードランキング処理で、前記出現回数に応じて、検索キーワードと共起していると判定された各キーワードの順位付けを行わせる
    請求項36または請求項37に記載の情報検索支援プログラム。
  42. コンピュータに、
    外部のシステムで蓄積された外部ログに含まれるキーワードの前記外部ログにおける出現回数を記憶する外部ログ管理処理を実行させ、
    キーワードランキング処理では、
    データ検索処理で検索された検索対象データのうち、検索キーワードと共起していると判定されたキーワードを含んでいる検索対象データの数を、検索キーワードと共起していると判定されたキーワード毎に集計し、集計した検索対象データの数に応じてキーワードの順位付けを行ったときの順位付け結果、
    履歴管理処理で検索キーワードとして記憶されている数に応じて、検索キーワードと共起していると判定された各キーワードの順位付けを行ったときの順位付け結果、および
    前記出現回数に応じて、検索キーワードと共起していると判定された各キーワードの順位付けを行ったときの順位付け結果のうちの2つまたは3つの順位付け結果に基づいて、検索キーワードと共起していると判定された各キーワードの順位付けを行わせる
    請求項37に記載の情報検索支援プログラム。
  43. コンピュータに、
    関連キーワード抽出処理で、係り受け関係にある2つの文字列の一方から得たキーワードと、他方の文字列から得たキーワードとの組を関連キーワードとして抽出させる
    請求項36から請求項37のうちのいずれか1項に記載の情報検索支援プログラム。
  44. コンピュータに、
    関連キーワード抽出処理で、句読点で区切られる文字列の中から得られる2つのキーワードの組を関連キーワードとして抽出させる
    請求項36から請求項37のうちのいずれか1項に記載の情報検索支援プログラム。
  45. コンピュータに、
    関連キーワード抽出処理で、検索対象データに含まれるキーワード同士の距離が閾値以内である2つのキーワードの組を関連キーワードとして抽出させる
    請求項36から請求項37のうちのいずれか1項に記載の情報検索支援プログラム。
  46. コンピュータに、
    関連キーワード抽出処理で、2つのキーワードの一方が所定の意味グループのキーワードであり、他方が別の所定の意味グループのキーワードであるときに、前記2つのキーワードの組を関連キーワードとして抽出させ、
    共起判定処理では、データ検索処理で検索された検索対象データから抽出された関連キーワードに含まれているキーワードが、ユーザに入力された検索キーワードと対になっているときに、関連キーワードに含まれている前記キーワードが検索キーワードと共起していると判定させるとともに、関連キーワードに含まれているキーワードが、検索キーワードと同じ意味グループのキーワードであるときに、関連キーワードに含まれている前記キーワードが検索キーワードと共起していると判定させる
    請求項36から請求項45のうちのいずれか1項に記載の情報検索支援プログラム。
  47. 自然文で記述されたデータである検索対象データにおける所定の関係を有する対になるキーワードの組を関連キーワードとして記憶する関連キーワードテーブルを参照可能なコンピュータに搭載される情報検索支援プログラムであって、
    前記コンピュータに、
    データベースに記憶された検索対象データの中から、ユーザに入力された検索キーワードを含む検索対象データを検索するデータ検索処理、
    データ検索処理で検索された検索対象データから抽出された関連キーワードを参照して、当該関連キーワードに含まれるキーワードが、検索キーワードと共起しているか否かを判定する共起判定処理、
    検索キーワードと共起していると判定された各キーワードの順位付けを行うキーワードランキング処理を実行させ、
    共起判定処理では、データ検索処理で検索された検索対象データから抽出された関連キーワードに含まれているキーワードが、ユーザに入力された検索キーワードと対になっているときに、関連キーワードに含まれている前記キーワードが検索キーワードと共起していると判定させる
    ための情報検索支援プログラム。
  48. 自然文で記述されたデータである検索対象データを記憶するデータベースを備えたコンピュータに搭載される関連キーワード抽出プログラムであって、
    前記コンピュータに、
    各検索対象データ毎に、所定の関係を有する対になるキーワードの組を関連キーワードとして抽出する関連キーワード抽出処理
    を実行させるための関連キーワード抽出プログラム。
JP2006139174A 2006-05-18 2006-05-18 情報検索支援システム、情報検索支援方法および情報検索支援プログラム Expired - Fee Related JP4631795B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006139174A JP4631795B2 (ja) 2006-05-18 2006-05-18 情報検索支援システム、情報検索支援方法および情報検索支援プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006139174A JP4631795B2 (ja) 2006-05-18 2006-05-18 情報検索支援システム、情報検索支援方法および情報検索支援プログラム

Publications (2)

Publication Number Publication Date
JP2007310663A true JP2007310663A (ja) 2007-11-29
JP4631795B2 JP4631795B2 (ja) 2011-02-16

Family

ID=38843451

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006139174A Expired - Fee Related JP4631795B2 (ja) 2006-05-18 2006-05-18 情報検索支援システム、情報検索支援方法および情報検索支援プログラム

Country Status (1)

Country Link
JP (1) JP4631795B2 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012108792A (ja) * 2010-11-18 2012-06-07 Yahoo Japan Corp パニック需要検出装置及びパニック需要検出方法
JP2013242621A (ja) * 2012-05-17 2013-12-05 Nippon Telegr & Teleph Corp <Ntt> 文書検索用関連語発見装置及び方法及びプログラム
JP2014099062A (ja) * 2012-11-14 2014-05-29 Nippon Telegr & Teleph Corp <Ntt> 情報検索装置、情報検索方法、及びプログラム
JP2016532173A (ja) * 2013-09-29 2016-10-13 ペキン ユニバーシティ ファウンダー グループ カンパニー,リミティド 意味情報、キーワード拡張及びそれに関するキーワード検索の方法及びシステム
JP2019066979A (ja) * 2017-09-29 2019-04-25 キヤノンマーケティングジャパン株式会社 検索装置、その制御方法、及びプログラム、並びに、検索システム、その制御方法、及びプログラム
CN112131374A (zh) * 2020-08-25 2020-12-25 北京达佳互联信息技术有限公司 文本的识别方法、装置和服务器
JP7434125B2 (ja) 2020-09-16 2024-02-20 株式会社東芝 文書検索装置、文書検索方法、及びプログラム
JP7485940B2 (ja) 2020-08-27 2024-05-17 富士通株式会社 検索制御プログラム、検索制御方法及び検索制御装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004133564A (ja) * 2002-10-09 2004-04-30 Fujitsu Ltd 文書検索装置
JP2004280661A (ja) * 2003-03-18 2004-10-07 Fujitsu Ltd 検索方法及びプログラム
JP2005031950A (ja) * 2003-07-11 2005-02-03 Canon Inc 情報検索装置、情報検索方法およびプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004133564A (ja) * 2002-10-09 2004-04-30 Fujitsu Ltd 文書検索装置
JP2004280661A (ja) * 2003-03-18 2004-10-07 Fujitsu Ltd 検索方法及びプログラム
JP2005031950A (ja) * 2003-07-11 2005-02-03 Canon Inc 情報検索装置、情報検索方法およびプログラム

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012108792A (ja) * 2010-11-18 2012-06-07 Yahoo Japan Corp パニック需要検出装置及びパニック需要検出方法
JP2013242621A (ja) * 2012-05-17 2013-12-05 Nippon Telegr & Teleph Corp <Ntt> 文書検索用関連語発見装置及び方法及びプログラム
JP2014099062A (ja) * 2012-11-14 2014-05-29 Nippon Telegr & Teleph Corp <Ntt> 情報検索装置、情報検索方法、及びプログラム
JP2016532173A (ja) * 2013-09-29 2016-10-13 ペキン ユニバーシティ ファウンダー グループ カンパニー,リミティド 意味情報、キーワード拡張及びそれに関するキーワード検索の方法及びシステム
US10268758B2 (en) 2013-09-29 2019-04-23 Peking University Founder Group Co. Ltd. Method and system of acquiring semantic information, keyword expansion and keyword search thereof
JP2019066979A (ja) * 2017-09-29 2019-04-25 キヤノンマーケティングジャパン株式会社 検索装置、その制御方法、及びプログラム、並びに、検索システム、その制御方法、及びプログラム
CN112131374A (zh) * 2020-08-25 2020-12-25 北京达佳互联信息技术有限公司 文本的识别方法、装置和服务器
CN112131374B (zh) * 2020-08-25 2023-12-19 北京达佳互联信息技术有限公司 文本的识别方法、装置和服务器
JP7485940B2 (ja) 2020-08-27 2024-05-17 富士通株式会社 検索制御プログラム、検索制御方法及び検索制御装置
JP7434125B2 (ja) 2020-09-16 2024-02-20 株式会社東芝 文書検索装置、文書検索方法、及びプログラム

Also Published As

Publication number Publication date
JP4631795B2 (ja) 2011-02-16

Similar Documents

Publication Publication Date Title
US9697249B1 (en) Estimating confidence for query revision models
Chinsha et al. A syntactic approach for aspect based opinion mining
JP5241828B2 (ja) 辞書の単語及び熟語の判定
AU2005330021B2 (en) Integration of multiple query revision models
US9449081B2 (en) Identification of semantic relationships within reported speech
JP5399682B2 (ja) 問題解決(トラブルシューティング)コンテクストにおけるリアルタイム照会提案(クエリサジェスチョン)方法及びシステム
US8346795B2 (en) System and method for guiding entity-based searching
JP4631795B2 (ja) 情報検索支援システム、情報検索支援方法および情報検索支援プログラム
KR101524889B1 (ko) 간접 화법 내에서의 시맨틱 관계의 식별
US20060230005A1 (en) Empirical validation of suggested alternative queries
JP2018538603A (ja) 検索クエリ間におけるクエリパターンおよび関連する総統計の特定
JP6529133B2 (ja) 複数地域でのトピックの評価を分析する装置、プログラム及び方法
JP2007072646A (ja) 検索装置、検索方法およびプログラム
CN110032622B (zh) 关键词确定方法、装置、设备及计算机可读存储介质
JP2008152522A (ja) データマイニングシステム、データマイニング方法及びデータ検索システム
JP6108212B2 (ja) 同義語抽出システム、方法およびプログラム
JP4969209B2 (ja) 検索システム
JP4114927B2 (ja) 文書検索システム、質問応答システム、文書検索方法
US20100153365A1 (en) Phrase identification using break points
JP2009086903A (ja) 検索サービス装置
JP2010266971A (ja) 端末装置
JP6549441B2 (ja) 入力支援装置、プログラムおよび入力支援方法
Razmara et al. Concordia University at the TREC 2007 QA Track.
Ghorai An Information Retrieval System for FIRE 2016 Microblog Track.
JP2017117109A (ja) 情報処理装置、情報処理システム、情報検索方法、及びプログラム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100302

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100419

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100518

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100805

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20100826

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101019

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101101

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131126

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees