JP2004054619A - 文書検索システム、文書検索方法、および、文書検索プログラム - Google Patents

文書検索システム、文書検索方法、および、文書検索プログラム Download PDF

Info

Publication number
JP2004054619A
JP2004054619A JP2002211496A JP2002211496A JP2004054619A JP 2004054619 A JP2004054619 A JP 2004054619A JP 2002211496 A JP2002211496 A JP 2002211496A JP 2002211496 A JP2002211496 A JP 2002211496A JP 2004054619 A JP2004054619 A JP 2004054619A
Authority
JP
Japan
Prior art keywords
homepage
search
keyword
network
certain value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002211496A
Other languages
English (en)
Inventor
Takeshi Nagahama
長濱 剛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Solution Innovators Ltd
Original Assignee
NEC Solution Innovators Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Solution Innovators Ltd filed Critical NEC Solution Innovators Ltd
Priority to JP2002211496A priority Critical patent/JP2004054619A/ja
Publication of JP2004054619A publication Critical patent/JP2004054619A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】キーワード、文章を入力し、絞り込みキーワードにより効率的に目的のホームページを検索する。
【解決手段】ユーザ端末10は、ネットワーク30を介し文書検索装置20の検索用ホームページを受信し、表示し、ユーザに指定されたキーワード、文章を含む検索用ホームページをネットワーク30を介し文書検索装置20に送信する。文書検索装置20は、ユーザに指定されたキーワード、文章に基づいてキーワードを生成し、対象ホームページを検索し、キーワードが含まれるホームページをすべて抽出し、それに含まれるキーワードごとの出現頻度を算出し、出現頻度が一定値以下のキーワードを絞り込みキーワードとして含む検索結果ホームページを生成し、ユーザ端末10に送信する。ユーザ端末10は、検索結果ホームページを表示し、査定された絞り込みキーワードにより再度検索を行う。
【選択図】   図1

Description

【0001】
【発明の属する技術分野】
本発明は、文書検索システム、文書検索方法、および、文書検索プログラムに関し、特に、キーワードの出現頻度を利用する文書検索システム、文書検索方法、および、文書検索プログラムに関する。
【0002】
【従来の技術】
コンピュータの普及に伴い、初心者が増えサポートに多大なる労力が必要となってきた。そのため、サポート用にホームページを整備しても、「何がわからないのかわからない」「検索すべきキーワードがわからない」といったジレンマや、「キーワード間違い」などの問題から以前からある自由文検索だけでは問題解決にあたっての、効果的な検索が出来ずに回答がかかれているホームページまでたどり着けない人が多数いることがわかってきた。
【0003】
また、「特開平10−320402号公報」記載の技術は、「文書データベースから特定の文書を検索するための検索式を作成する装置であって、前記文書データベースにおける指定文書群から形態素解析によって複数のキーワードを抽出するとともに抽出した個々のキーワードが文書中に含まれるか否かを表す判別情報、当該文書が必要文書か不要文書かを表す指定情報または非指定文書であることを表す情報を各文書の識別情報と共に集合させた文書集合を生成するキーワード抽出部と、抽出した個々のキーワードが出現する文書数、出現しない文書数、及び前記指定文書数と全文書数との相対関係に基づくキーワードの重要度関数を設定し、当該関数値が例えば最大となる単一のキーワードを検索キーワードとして決定するとともに、決定した検索キーワードを用いて一つの文書集合を複数の文書集合に分割する文書集合分割部と、前記文書集合の分割の際に用いた検索キーワードを論理式で結合して前記検索式を作成する検索式作成部と」から構成されてる。
【0004】
【発明が解決しようとする課題】
上述した「特開平10−320402号公報」記載の技術の問題点は、検索候補の絞り込みが効率的でないことである。
【0005】
その理由は、キーワードの出現頻度を利用しているが、ユーザに対して絞り込んだ複数のキーワードから適当なキーワードを選択するようになっていないからである。
【0006】
本発明の目的は、出現頻度の低い複数のキーワードをユーザに提示し、その中からユーザが選択したキーワードに基づいて絞り込み検索を効率的に実施することである。
【0007】
【課題を解決するための手段】
本発明の第1の文書検索システムは、ネットワークを介し検索用ホームページ表示要求を受信すると、検索用ホームページを送信し、文章が入力された検索用ホームページを受信すると、文章を形態素解析し、キーワードを生成し、キーワードに基づいて対象ホームページを検索し、キーワードが存在するホームページを特定し、特定したホームページを形態素解析しキーワードを抽出し、出現頻度が一定値以下のキーワードを含み選択させる検索結果ホームページを生成し、前記ネットワークを介して送信する文書検索装置を有することを特徴とする。
【0008】
本発明の第2の文書検索システムは、ネットワークを介し検索用ホームページ表示要求を受信すると、検索用ホームページを送信し、文章が入力された検索用ホームページを受信すると、文章を形態素解析し、第1キーワードを生成し、第1キーワードに基づいて対象ホームページを検索し、キーワードが存在するホームページを特定し、特定したホームページを形態素解析しキーワードを抽出し、出現頻度が一定値以下のキーワードを含み選択させる検索結果ホームページを生成し、前記ネットワークを介して送信し、選択された出現頻度が一定値以下のキーワードを含む検索結果ホームページを前記ネットワークを介し受信すると、前記第1キーワード、および、選択された出現頻度が一定値以下のキーワードの論理積に基づいて対象ホームページを検索し、キーワードが存在するホームページを特定し、特定したホームページを形態素解析しキーワードを抽出し、出現頻度が一定値以下のキーワードを含み選択させる検索結果ホームページを生成し、前記ネットワークを介して送信する文書検索装置を有することを特徴とする。
【0009】
本発明の第3の文書検索システムは、ネットワークを介し検索用ホームページ表示要求を送信し、前記ネットワークを介し検索用ホームページを受信すると、検索用ホームページを表示し、文章の入力を受け付け、文章が入力された検索用ホームページを前記ネットワークを介し送信し、前記ネットワークを介し出現頻度が一定値以下のキーワードを含み選択させる検索結果ホームページを受信し、出現頻度が一定値以下のキーワードの選択を受け付け、選択された出現頻度が一定値以下のキーワードを含む検索結果ホームページを前記ネットワークを介し送信する1以上のユーザ端末を有することを特徴とする。
【0010】
本発明の第4の文書検索システムは、ネットワークを介し検索用ホームページ表示要求を受信すると、検索用ホームページを送信し、文章が入力された検索用ホームページを受信すると、文章を形態素解析し、第1キーワードを生成し、第1キーワードに基づいて対象ホームページを検索し、キーワードが存在するホームページを特定し、特定したホームページを形態素解析しキーワードを抽出し、出現頻度が一定値以下のキーワードを含み選択させる検索結果ホームページを生成し、前記ネットワークを介して送信し、選択された出現頻度が一定値以下のキーワードを含む検索結果ホームページを前記ネットワークを介し受信すると、前記第1キーワード、および、選択された出現頻度が一定値以下のキーワードの論理積に基づいて対象ホームページを検索し、キーワードが存在するホームページを特定し、特定したホームページを形態素解析しキーワードを抽出し、出現頻度が一定値以下のキーワードを含み選択させる検索結果ホームページを生成し、前記ネットワークを介して送信する文書検索装置と、前記文書検索装置から前記ネットワークを介し検索用ホームページ表示要求を送信し、前記文書検索装置から前記ネットワークを介し検索用ホームページを受信すると、検索用ホームページを表示し、文章の入力を受け付け、文章が入力された検索用ホームページを前記ネットワークを介し送信し、前記ネットワークを介し出現頻度が一定値以下のキーワードを含み選択させる検索結果ホームページを受信し、出現頻度が一定値以下のキーワードの選択を受け付け、選択された出現頻度が一定値以下のキーワードを含む検索結果ホームページを前記ネットワークを介し送信する1以上のユーザ端末とを有することを特徴とする。
【0011】
本発明の第1の文書検索方法は、ネットワークを介し検索用ホームページ表示要求を受信すると、検索用ホームページを送信し、文章が入力された検索用ホームページを受信すると、文章を形態素解析し、キーワードを生成し、キーワードに基づいて対象ホームページを検索し、キーワードが存在するホームページを特定し、特定したホームページを形態素解析しキーワードを抽出し、出現頻度が一定値以下のキーワードを含み選択させる検索結果ホームページを生成し、前記ネットワークを介して送信する文書検索手順を含むことを特徴とする。
【0012】
本発明の第2の文書検索方法は、ネットワークを介し検索用ホームページ表示要求を受信すると、検索用ホームページを送信し、文章が入力された検索用ホームページを受信すると、文章を形態素解析し、第1キーワードを生成し、第1キーワードに基づいて対象ホームページを検索し、キーワードが存在するホームページを特定し、特定したホームページを形態素解析しキーワードを抽出し、出現頻度が一定値以下のキーワードを含み選択させる検索結果ホームページを生成し、前記ネットワークを介して送信し、選択された出現頻度が一定値以下のキーワードを含む検索結果ホームページを前記ネットワークを介し受信すると、前記第1キーワード、および、選択された出現頻度が一定値以下のキーワードの論理積に基づいて対象ホームページを検索し、キーワードが存在するホームページを特定し、特定したホームページを形態素解析しキーワードを抽出し、出現頻度が一定値以下のキーワードを含み選択させる検索結果ホームページを生成し、前記ネットワークを介して送信する文書検索手順を含むことを特徴とする。
【0013】
本発明の第3の文書検索方法は、ネットワークを介し検索用ホームページ表示要求を送信し、前記ネットワークを介し検索用ホームページを受信すると、検索用ホームページを表示し、文章の入力を受け付け、文章が入力された検索用ホームページを前記ネットワークを介し送信し、前記ネットワークを介し出現頻度が一定値以下のキーワードを含み選択させる検索結果ホームページを受信し、出現頻度が一定値以下のキーワードの選択を受け付け、選択された出現頻度が一定値以下のキーワードを含む検索結果ホームページを前記ネットワークを介し送信する1以上のユーザ端末手順を含むことを特徴とする。
【0014】
本発明の第4の文書検索方法は、ネットワークを介し検索用ホームページ表示要求を受信すると、検索用ホームページを送信し、文章が入力された検索用ホームページを受信すると、文章を形態素解析し、第1キーワードを生成し、第1キーワードに基づいて対象ホームページを検索し、キーワードが存在するホームページを特定し、特定したホームページを形態素解析しキーワードを抽出し、出現頻度が一定値以下のキーワードを含み選択させる検索結果ホームページを生成し、前記ネットワークを介して送信し、選択された出現頻度が一定値以下のキーワードを含む検索結果ホームページを前記ネットワークを介し受信すると、前記第1キーワード、および、選択された出現頻度が一定値以下のキーワードの論理積に基づいて対象ホームページを検索し、キーワードが存在するホームページを特定し、特定したホームページを形態素解析しキーワードを抽出し、出現頻度が一定値以下のキーワードを含み選択させる検索結果ホームページを生成し、前記ネットワークを介して送信する文書検索手順と、前記文書検索手順から前記ネットワークを介し検索用ホームページ表示要求を送信し、前記文書検索手順から前記ネットワークを介し検索用ホームページを受信すると、検索用ホームページを表示し、文章の入力を受け付け、文章が入力された検索用ホームページを前記ネットワークを介し送信し、前記ネットワークを介し出現頻度が一定値以下のキーワードを含み選択させる検索結果ホームページを受信し、出現頻度が一定値以下のキーワードの選択を受け付け、選択された出現頻度が一定値以下のキーワードを含む検索結果ホームページを前記ネットワークを介し送信する1以上のユーザ端末手順とを含むことを特徴とする。
【0015】
本発明の第1の文書検索プログラムは、ネットワークを介し検索用ホームページ表示要求を受信すると、検索用ホームページを送信し、文章が入力された検索用ホームページを受信すると、文章を形態素解析し、キーワードを生成し、キーワードに基づいて対象ホームページを検索し、キーワードが存在するホームページを特定し、特定したホームページを形態素解析しキーワードを抽出し、出現頻度が一定値以下のキーワードを含み選択させる検索結果ホームページを生成し、前記ネットワークを介して送信する文書検索手順をコンピュータに実行させることを特徴とする。
【0016】
本発明の第2の文書検索プログラムは、ネットワークを介し検索用ホームページ表示要求を受信すると、検索用ホームページを送信し、文章が入力された検索用ホームページを受信すると、文章を形態素解析し、第1キーワードを生成し、第1キーワードに基づいて対象ホームページを検索し、キーワードが存在するホームページを特定し、特定したホームページを形態素解析しキーワードを抽出し、出現頻度が一定値以下のキーワードを含み選択させる検索結果ホームページを生成し、前記ネットワークを介して送信し、選択された出現頻度が一定値以下のキーワードを含む検索結果ホームページを前記ネットワークを介し受信すると、前記第1キーワード、および、選択された出現頻度が一定値以下のキーワードの論理積に基づいて対象ホームページを検索し、キーワードが存在するホームページを特定し、特定したホームページを形態素解析しキーワードを抽出し、出現頻度が一定値以下のキーワードを含み選択させる検索結果ホームページを生成し、前記ネットワークを介して送信する文書検索手順をコンピュータに実行させることを特徴とする。
【0017】
本発明の第3の文書検索プログラムは、ネットワークを介し検索用ホームページ表示要求を送信し、前記ネットワークを介し検索用ホームページを受信すると、検索用ホームページを表示し、文章の入力を受け付け、文章が入力された検索用ホームページを前記ネットワークを介し送信し、前記ネットワークを介し出現頻度が一定値以下のキーワードを含み選択させる検索結果ホームページを受信し、出現頻度が一定値以下のキーワードの選択を受け付け、選択された出現頻度が一定値以下のキーワードを含む検索結果ホームページを前記ネットワークを介し送信する1以上のユーザ端末手順をコンピュータに実行させることを特徴とする。
【0018】
本発明の第4の文書検索プログラムは、ネットワークを介し検索用ホームページ表示要求を受信すると、検索用ホームページを送信し、文章が入力された検索用ホームページを受信すると、文章を形態素解析し、第1キーワードを生成し、第1キーワードに基づいて対象ホームページを検索し、キーワードが存在するホームページを特定し、特定したホームページを形態素解析しキーワードを抽出し、出現頻度が一定値以下のキーワードを含み選択させる検索結果ホームページを生成し、前記ネットワークを介して送信し、選択された出現頻度が一定値以下のキーワードを含む検索結果ホームページを前記ネットワークを介し受信すると、前記第1キーワード、および、選択された出現頻度が一定値以下のキーワードの論理積に基づいて対象ホームページを検索し、キーワードが存在するホームページを特定し、特定したホームページを形態素解析しキーワードを抽出し、出現頻度が一定値以下のキーワードを含み選択させる検索結果ホームページを生成し、前記ネットワークを介して送信する文書検索手順と、前記文書検索手順から前記ネットワークを介し検索用ホームページ表示要求を送信し、前記文書検索手順から前記ネットワークを介し検索用ホームページを受信すると、検索用ホームページを表示し、文章の入力を受け付け、文章が入力された検索用ホームページを前記ネットワークを介し送信し、前記ネットワークを介し出現頻度が一定値以下のキーワードを含み選択させる検索結果ホームページを受信し、出現頻度が一定値以下のキーワードの選択を受け付け、選択された出現頻度が一定値以下のキーワードを含む検索結果ホームページを前記ネットワークを介し送信する1以上のユーザ端末手順とをコンピュータに実行させることを特徴とする。
【0019】
【発明の実施の形態】
次に、本発明の第1の実施の形態について図面を参照して詳細に説明する。
【0020】
図1は、本発明の第1の実施の形態の構成を示すブロック図である。
【0021】
図1を参照すると、本発明の第1の実施の形態は、コンピュータで構成される1以上のユーザ端末10と、コンピュータで構成される文書検索装置20と、ユーザ端末10、および文書検索装置20を接続するインターネット等のネットワーク30とから構成される。
【0022】
図2は、文書検索装置20の構成を示すブロック図である。
【0023】
図2を参照すると、文書検索装置20は、ネットワーク30を介してユーザ端末10と通信する機能を持つ通信部210と、文書検索装置20の制御を実施する制御部211と、文の形態素解析を実施する形態素解析部212と、キーワードを検出するキーワード生成部213と、インデックス部215、データ部216を検査クスする検索部214と、インデックス部215と、データ部216と、キーワードの出現頻度を算出する頻度算出部217とから構成される。
【0024】
データ部216は、記憶装置等で構成され、検索対象のホームページ(HTML型式)のファイルを格納し、インデックス部215は、キーワードと、そのキーワードを含むホームページのファイル名との対であるインデックスデータを含む。検索対象のホームページは、事前にデータ部216に格納され、また、インデックスデータも、事前に作成されインデックス部215に格納される。
【0025】
次に、本発明の第1の実施の形態の動作について図面を参照して詳細に説明する。
【0026】
図3は、本発明の第1の実施の形態の動作を示すフローチャートである。
【0027】
図4は、本発明の第1の実施の形態の動作を示すフローチャートである。
【0028】
図5は、検索用ホームページの内容を示す説明図である。
【0029】
図6は、検索結果ホームページの内容を示す説明図である。
【0030】
図7は、絞り込みされた検索結果ホームページの内容を示す説明図である。
【0031】
図8は、検索されたホームページの内容を示す説明図である。
【0032】
図3を参照すると、ユーザ端末10が、ユーザの指示により、ブラウザを起動し、URLを指定して、検索用ホームページ表示要求を受け取ると、ユーザ端末10は、ネットワーク30を介し文書検索装置20に検索用ホームページ表示要求を送信する(図3ステップA1)。
【0033】
文書検索装置20の通信部210は、ネットワーク30を介しユーザ端末10から検索用ホームページ表示要求を受信すると(図3ステップB1)、制御部211に検索用ホームページ表示要求を転送する。制御部211は、検索用ホームページ表示要求を受け取ると、データ部216から検索用ホームページを読み出し通信部210に転送する。通信部210は、検索用ホームページを受け取るとネットワーク30を介し要求元のユーザ端末10に送信する(図3ステップB2)。
【0034】
ユーザ端末10は、ネットワーク30を介し文書検索装置20から検索用ホームページを受信すると(図3ステップA2)、検索用ホームページをディスプレイ等に表示する(図3ステップA3)。図5を参照すると、検索用ホームページは、質問を文章、またはキーワードで文書入力欄に入力する型式となっている。ユーザが、たとえば、キーワード「インターネット」(簡単のためにキーワードとする)と入力すると、ユーザ端末10は、キーワード「インターネット」を含む検索用ホームページをネットワーク30を介し文書検索装置20に送信する(図3ステップA4)。
【0035】
文書検索装置20の通信部210は、ネットワーク30を介しユーザ端末10からキーワード「インターネット」を含む検索用ホームページを受信すると(図3ステップB3)、制御部211にキーワード「インターネット」を含む検索用ホームページを転送する。制御部211は、キーワード「インターネット」を含む検索用ホームページを受け取ると、ユーザ端末10のネットワークアドレス等からユーザ識別子を生成し、キーワード「インターネット」とともに形態素解析部212に転送する。形態素解析部212は、キーワード「インターネット」を受け取ると、キーワード「インターネット」を形態素解析し、名詞「インターネット」、ユーザ識別子をキーワード生成部213に転送する。文章であれば、複数の形態素、ユーザ識別子を転送する。
【0036】
キーワード生成部213は、形態素、ユーザ識別子を受け取ると、文節を作成し、それらをキーワードとして生成し、内部に保存する(図4ステップB4)。たとえば、名詞「インターネット」を受け取ると、「インターネット」をキーワードとする。ユーザ識別子を内部に保存し、キーワード「インターネット」を決定し、検索部214に転送する。
【0037】
検索部214は、キーワード「インターネット」を受け取ると、インデックス部215を検索し、キーワード「インターネット」を含むホームページのファイルを特定する(図3ステップB7)。次に、検索部214は、特定したホームページのファイルすべてをデータ部216から抽出し、形態素解析部212に転送する。また、キーワード「インターネット」を含む文章部分を抽出し、保持する。
【0038】
形態素解析部212は、ホームページのファイルを受け取ると、形態素解析を実施し(図3ステップB8)、ファイル名、形態素をキーワード生成部213に転送する。キーワード生成部213は、ファイル名、形態素を受け取ると、文節を作成し、それらをキーワードとして生成する(図3ステップB9)。次に、キーワード生成部213は、キーワード、そのキーワードを含むホームページのファイルのファイル名との対を頻度算出部217へ転送する。
【0039】
頻度算出部217は、キーワード、そのキーワードを含むホームページのファイルのファイル名との対を受け取ると、キーワードごとに含まれるファイルの数を算出し、キーワードごとに、キーワードの出現頻度=(キーワードが含まれるファイルの数)/(全ファイルの数)を算出する(図3ステップB10)。次に、頻度算出部217は、出現頻度が、「事前に設定した一定数以下」の低頻度キーワードを抽出し(図3ステップB11)、制御部211に転送する。
【0040】
制御部211は、低頻度キーワード(絞り込みキーワードとも称する)を受け取ると、低頻度キーワード、および、<検索部214に保持されているキーワード「インターネット」を含む文章部分>を含む検索結果ホームページを作成し(図3ステップB12)、通信部210に転送する。
【0041】
図6を参照すると、検索結果ホームページは、上部に、キーワード「インターネット」を含むホームページの文章部分を含み、下部に、絞り込み検索のためのキーワードとして、抽出された低頻度キーワードの一覧を含む。たとえば、低頻度キーワードは、「クッキー」、「アドバイザー」、・・・等である。また、部分文章の左の番号を選択すると、対応するホームページにリンクする。
【0042】
次に、通信部210は、検索結果ホームページを受け取ると、ネットワーク30を介してユーザ端末10へ送信する(図4ステップB13)。
【0043】
ユーザ端末10は、検索結果ホームページを受信すると(図4ステップA5)、検索結果ホームページをディスプレイ等に表示する(図4ステップA6)。
【0044】
ユーザが、検索結果ホームページの絞り込み検索の欄の低頻度キーワードを選択すると(図4ステップA7/NO)、選択された低頻度キーワードを含む検索結果ホームページをネットワーク30を介し文書検索装置20へ送信する(図4ステップA8)。
【0045】
文書検索装置20の通信部210は、選択された低頻度キーワードを含む検索結果ホームページを受信すると(図4ステップB14)、制御部211に転送する。制御部211は、選択された低頻度キーワードと、保存されているキーワード(インターネット等)すべてとの論理積をキーワードとし(図4ステップB15)、検索部214に転送する。検索部214は、制御部211からのキーワードに基づいて検索を実施する(図3ステップB7)。
【0046】
たとえば、低頻度キーワードとして、「クッキー」が選択された場合、「インターネット」、「クッキー」の両方を含むホームページを抽出し、図7に示す検索結果ホームページが作成され、ユーザにより、番号1が選択されると、最終的に図8に示すホームページが文書検索装置20で抽出され、ユーザ端末10に表示される。
【0047】
また、ユーザが、上部の番号をクリックし、ホームページの指定を選択すると(図4ステップA7/YES)、ユーザ端末10は、指定されたホームページの表示要求をネットワーク30を介し文書検索装置20へ送信する(図4ステップA9)。
【0048】
文書検索装置20の通信部210は、ネットワーク30を介しユーザ端末10から指定されたホームページの表示要求を受信すると(図4ステップB16)、制御部211に転送する。制御部211は、指定されたホームページの表示要求を受け取ると、データ部216から指定されたホームページを抽出し(図4ステップB17)、通信部210に転送する。通信部210は、指定されたホームページを受け取ると、ネットワーク30を介しユーザ端末10へ送信する(図4ステップB18)。
【0049】
ユーザ端末10は、ネットワーク30を介し文書検索装置20から指定されたホームページを受信すると(図4ステップA10)、指定されたホームページをディスプレイ等に表示する(図4ステップA11)。
【0050】
次に、本発明の第2の実施の形態について図面を参照して詳細に説明する。
【0051】
本発明の第2の実施の形態は、図3、図4の各ステップ(手順)を含む方法である。
【0052】
次に、本発明の第3の実施の形態について図面を参照して詳細に説明する。
【0053】
本発明の第3の実施の形態は、図3、図4の各ステップ(手順)をコンピュータ(ユーザ端末10、文書検索装置20)に実行させるプログラムである。
【0054】
【発明の効果】
本発明の第1の効果は、ユーザの使い勝手がよいことである。
【0055】
その理由は、キーワードを見ることによって頭の中に潜在的に持っているキーワードを選択させ、検索条件を正確に提示することが可能となるそれ以外の人に関しては、キーワードを選択することによって検索の方向付けを行うことが可能となる。
【0056】
第2効果は、少ない検索条件(キーワード)により目的の文書(ホームページ)にたどり着くことが可能なことである。
【0057】
その理由は、出現頻度の低い複数のキーワードをユーザに提示し、その中からユーザが選択したキーワードに基づいて絞り込み検索を効率的に実施するからである。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態の構成を示すブロック図である。
【図2】文書検索装置の構成を示すブロック図である。
【図3】本発明の第1の実施の形態の動作を示すフローチャートである。
【図4】本発明の第1の実施の形態の動作を示すフローチャートである。
【図5】検索用ホームページの内容を示す説明図である。
【図6】検索結果ホームページの内容を示す説明図である。
【図7】絞り込みされた検索結果ホームページの内容を示す説明図である。
【図8】検索されたホームページの内容を示す説明図である。
【符号の説明】
10  ユーザ端末
20  文書検索装置
30  ネットワーク
210  通信部
211  制御部
212  形態素解析部
213  キーワード生成部
214  検索部
215  インデックス部
216  データ部
217  頻度算出部

Claims (12)

  1. ネットワークを介し検索用ホームページ表示要求を受信すると、検索用ホームページを送信し、文章が入力された検索用ホームページを受信すると、文章を形態素解析し、キーワードを生成し、キーワードに基づいて対象ホームページを検索し、キーワードが存在するホームページを特定し、特定したホームページを形態素解析しキーワードを抽出し、出現頻度が一定値以下のキーワードを含み選択させる検索結果ホームページを生成し、前記ネットワークを介して送信する文書検索装置を有することを特徴とする文書検索システム。
  2. ネットワークを介し検索用ホームページ表示要求を受信すると、検索用ホームページを送信し、文章が入力された検索用ホームページを受信すると、文章を形態素解析し、第1キーワードを生成し、第1キーワードに基づいて対象ホームページを検索し、キーワードが存在するホームページを特定し、特定したホームページを形態素解析しキーワードを抽出し、出現頻度が一定値以下のキーワードを含み選択させる検索結果ホームページを生成し、前記ネットワークを介して送信し、選択された出現頻度が一定値以下のキーワードを含む検索結果ホームページを前記ネットワークを介し受信すると、前記第1キーワード、および、選択された出現頻度が一定値以下のキーワードの論理積に基づいて対象ホームページを検索し、キーワードが存在するホームページを特定し、特定したホームページを形態素解析しキーワードを抽出し、出現頻度が一定値以下のキーワードを含み選択させる検索結果ホームページを生成し、前記ネットワークを介して送信する文書検索装置を有することを特徴とする文書検索システム。
  3. ネットワークを介し検索用ホームページ表示要求を送信し、前記ネットワークを介し検索用ホームページを受信すると、検索用ホームページを表示し、文章の入力を受け付け、文章が入力された検索用ホームページを前記ネットワークを介し送信し、前記ネットワークを介し出現頻度が一定値以下のキーワードを含み選択させる検索結果ホームページを受信し、出現頻度が一定値以下のキーワードの選択を受け付け、選択された出現頻度が一定値以下のキーワードを含む検索結果ホームページを前記ネットワークを介し送信する1以上のユーザ端末を有することを特徴とする文書検索システム。
  4. ネットワークを介し検索用ホームページ表示要求を受信すると、検索用ホームページを送信し、文章が入力された検索用ホームページを受信すると、文章を形態素解析し、第1キーワードを生成し、第1キーワードに基づいて対象ホームページを検索し、キーワードが存在するホームページを特定し、特定したホームページを形態素解析しキーワードを抽出し、出現頻度が一定値以下のキーワードを含み選択させる検索結果ホームページを生成し、前記ネットワークを介して送信し、選択された出現頻度が一定値以下のキーワードを含む検索結果ホームページを前記ネットワークを介し受信すると、前記第1キーワード、および、選択された出現頻度が一定値以下のキーワードの論理積に基づいて対象ホームページを検索し、キーワードが存在するホームページを特定し、特定したホームページを形態素解析しキーワードを抽出し、出現頻度が一定値以下のキーワードを含み選択させる検索結果ホームページを生成し、前記ネットワークを介して送信する文書検索装置と、
    前記文書検索装置から前記ネットワークを介し検索用ホームページ表示要求を送信し、前記文書検索装置から前記ネットワークを介し検索用ホームページを受信すると、検索用ホームページを表示し、文章の入力を受け付け、文章が入力された検索用ホームページを前記ネットワークを介し送信し、前記ネットワークを介し出現頻度が一定値以下のキーワードを含み選択させる検索結果ホームページを受信し、出現頻度が一定値以下のキーワードの選択を受け付け、選択された出現頻度が一定値以下のキーワードを含む検索結果ホームページを前記ネットワークを介し送信する1以上のユーザ端末とを有することを特徴とする文書検索システム。
  5. ネットワークを介し検索用ホームページ表示要求を受信すると、検索用ホームページを送信し、文章が入力された検索用ホームページを受信すると、文章を形態素解析し、キーワードを生成し、キーワードに基づいて対象ホームページを検索し、キーワードが存在するホームページを特定し、特定したホームページを形態素解析しキーワードを抽出し、出現頻度が一定値以下のキーワードを含み選択させる検索結果ホームページを生成し、前記ネットワークを介して送信する文書検索手順を含むことを特徴とする文書検索方法。
  6. ネットワークを介し検索用ホームページ表示要求を受信すると、検索用ホームページを送信し、文章が入力された検索用ホームページを受信すると、文章を形態素解析し、第1キーワードを生成し、第1キーワードに基づいて対象ホームページを検索し、キーワードが存在するホームページを特定し、特定したホームページを形態素解析しキーワードを抽出し、出現頻度が一定値以下のキーワードを含み選択させる検索結果ホームページを生成し、前記ネットワークを介して送信し、選択された出現頻度が一定値以下のキーワードを含む検索結果ホームページを前記ネットワークを介し受信すると、前記第1キーワード、および、選択された出現頻度が一定値以下のキーワードの論理積に基づいて対象ホームページを検索し、キーワードが存在するホームページを特定し、特定したホームページを形態素解析しキーワードを抽出し、出現頻度が一定値以下のキーワードを含み選択させる検索結果ホームページを生成し、前記ネットワークを介して送信する文書検索手順を含むことを特徴とする文書検索方法。
  7. ネットワークを介し検索用ホームページ表示要求を送信し、前記ネットワークを介し検索用ホームページを受信すると、検索用ホームページを表示し、文章の入力を受け付け、文章が入力された検索用ホームページを前記ネットワークを介し送信し、前記ネットワークを介し出現頻度が一定値以下のキーワードを含み選択させる検索結果ホームページを受信し、出現頻度が一定値以下のキーワードの選択を受け付け、選択された出現頻度が一定値以下のキーワードを含む検索結果ホームページを前記ネットワークを介し送信する1以上のユーザ端末手順を含むことを特徴とする文書検索方法。
  8. ネットワークを介し検索用ホームページ表示要求を受信すると、検索用ホームページを送信し、文章が入力された検索用ホームページを受信すると、文章を形態素解析し、第1キーワードを生成し、第1キーワードに基づいて対象ホームページを検索し、キーワードが存在するホームページを特定し、特定したホームページを形態素解析しキーワードを抽出し、出現頻度が一定値以下のキーワードを含み選択させる検索結果ホームページを生成し、前記ネットワークを介して送信し、選択された出現頻度が一定値以下のキーワードを含む検索結果ホームページを前記ネットワークを介し受信すると、前記第1キーワード、および、選択された出現頻度が一定値以下のキーワードの論理積に基づいて対象ホームページを検索し、キーワードが存在するホームページを特定し、特定したホームページを形態素解析しキーワードを抽出し、出現頻度が一定値以下のキーワードを含み選択させる検索結果ホームページを生成し、前記ネットワークを介して送信する文書検索手順と、
    前記文書検索手順から前記ネットワークを介し検索用ホームページ表示要求を送信し、前記文書検索手順から前記ネットワークを介し検索用ホームページを受信すると、検索用ホームページを表示し、文章の入力を受け付け、文章が入力された検索用ホームページを前記ネットワークを介し送信し、前記ネットワークを介し出現頻度が一定値以下のキーワードを含み選択させる検索結果ホームページを受信し、出現頻度が一定値以下のキーワードの選択を受け付け、選択された出現頻度が一定値以下のキーワードを含む検索結果ホームページを前記ネットワークを介し送信する1以上のユーザ端末手順とを含むことを特徴とする文書検索方法。
  9. ネットワークを介し検索用ホームページ表示要求を受信すると、検索用ホームページを送信し、文章が入力された検索用ホームページを受信すると、文章を形態素解析し、キーワードを生成し、キーワードに基づいて対象ホームページを検索し、キーワードが存在するホームページを特定し、特定したホームページを形態素解析しキーワードを抽出し、出現頻度が一定値以下のキーワードを含み選択させる検索結果ホームページを生成し、前記ネットワークを介して送信する文書検索手順をコンピュータに実行させることを特徴とする文書検索プログラム。
  10. ネットワークを介し検索用ホームページ表示要求を受信すると、検索用ホームページを送信し、文章が入力された検索用ホームページを受信すると、文章を形態素解析し、第1キーワードを生成し、第1キーワードに基づいて対象ホームページを検索し、キーワードが存在するホームページを特定し、特定したホームページを形態素解析しキーワードを抽出し、出現頻度が一定値以下のキーワードを含み選択させる検索結果ホームページを生成し、前記ネットワークを介して送信し、選択された出現頻度が一定値以下のキーワードを含む検索結果ホームページを前記ネットワークを介し受信すると、前記第1キーワード、および、選択された出現頻度が一定値以下のキーワードの論理積に基づいて対象ホームページを検索し、キーワードが存在するホームページを特定し、特定したホームページを形態素解析しキーワードを抽出し、出現頻度が一定値以下のキーワードを含み選択させる検索結果ホームページを生成し、前記ネットワークを介して送信する文書検索手順をコンピュータに実行させることを特徴とする文書検索プログラム。
  11. ネットワークを介し検索用ホームページ表示要求を送信し、前記ネットワークを介し検索用ホームページを受信すると、検索用ホームページを表示し、文章の入力を受け付け、文章が入力された検索用ホームページを前記ネットワークを介し送信し、前記ネットワークを介し出現頻度が一定値以下のキーワードを含み選択させる検索結果ホームページを受信し、出現頻度が一定値以下のキーワードの選択を受け付け、選択された出現頻度が一定値以下のキーワードを含む検索結果ホームページを前記ネットワークを介し送信する1以上のユーザ端末手順をコンピュータに実行させることを特徴とする文書検索プログラム。
  12. ネットワークを介し検索用ホームページ表示要求を受信すると、検索用ホームページを送信し、文章が入力された検索用ホームページを受信すると、文章を形態素解析し、第1キーワードを生成し、第1キーワードに基づいて対象ホームページを検索し、キーワードが存在するホームページを特定し、特定したホームページを形態素解析しキーワードを抽出し、出現頻度が一定値以下のキーワードを含み選択させる検索結果ホームページを生成し、前記ネットワークを介して送信し、選択された出現頻度が一定値以下のキーワードを含む検索結果ホームページを前記ネットワークを介し受信すると、前記第1キーワード、および、選択された出現頻度が一定値以下のキーワードの論理積に基づいて対象ホームページを検索し、キーワードが存在するホームページを特定し、特定したホームページを形態素解析しキーワードを抽出し、出現頻度が一定値以下のキーワードを含み選択させる検索結果ホームページを生成し、前記ネットワークを介して送信する文書検索手順と、
    前記文書検索手順から前記ネットワークを介し検索用ホームページ表示要求を送信し、前記文書検索手順から前記ネットワークを介し検索用ホームページを受信すると、検索用ホームページを表示し、文章の入力を受け付け、文章が入力された検索用ホームページを前記ネットワークを介し送信し、前記ネットワークを介し出現頻度が一定値以下のキーワードを含み選択させる検索結果ホームページを受信し、出現頻度が一定値以下のキーワードの選択を受け付け、選択された出現頻度が一定値以下のキーワードを含む検索結果ホームページを前記ネットワークを介し送信する1以上のユーザ端末手順とをコンピュータに実行させることを特徴とする文書検索プログラム。
JP2002211496A 2002-07-19 2002-07-19 文書検索システム、文書検索方法、および、文書検索プログラム Pending JP2004054619A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002211496A JP2004054619A (ja) 2002-07-19 2002-07-19 文書検索システム、文書検索方法、および、文書検索プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002211496A JP2004054619A (ja) 2002-07-19 2002-07-19 文書検索システム、文書検索方法、および、文書検索プログラム

Publications (1)

Publication Number Publication Date
JP2004054619A true JP2004054619A (ja) 2004-02-19

Family

ID=31934719

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002211496A Pending JP2004054619A (ja) 2002-07-19 2002-07-19 文書検索システム、文書検索方法、および、文書検索プログラム

Country Status (1)

Country Link
JP (1) JP2004054619A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007250000A (ja) * 2007-05-14 2007-09-27 Data Craft:Kk 検索装置及び検索プログラム
JP2008234559A (ja) * 2007-03-23 2008-10-02 Yahoo Japan Corp ドキュメント絞り込み検索装置、方法及びプログラム
JP2008546098A (ja) * 2005-05-31 2008-12-18 シーメンス メディカル ソリューションズ ユーエスエー インコーポレイテッド 患者の人口統計的レコード照会のデータ依存型フィルタリングシステム及び方法
JP2009093653A (ja) * 2007-10-05 2009-04-30 Fujitsu Ltd ユーザ入力に応じた検索空間の絞り込み
JP2009289202A (ja) * 2008-05-30 2009-12-10 Toshiba Corp キーワード入力支援装置、キーワード入力支援方法及びプログラム
JP2010519609A (ja) * 2007-02-16 2010-06-03 マイクロソフト コーポレーション インスタント・メッセージング・アプリケーションのためのコンテキストセンシティブな検索および機能

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07192010A (ja) * 1993-12-27 1995-07-28 Canon Inc 文書処理装置
JPH09218881A (ja) * 1996-02-09 1997-08-19 Nippon Telegr & Teleph Corp <Ntt> 追加検索語候補提示方法、文書検索方法およびそれらの装置
JPH11161658A (ja) * 1997-11-27 1999-06-18 Nippon Telegr & Teleph Corp <Ntt> 追加検索語の優先度計算方法及び装置及び追加検索語の優先度計算プログラムを格納した記憶媒体
JPH11338873A (ja) * 1998-05-26 1999-12-10 Nippon Telegr & Teleph Corp <Ntt> 再検索方法及び装置及び再検索プログラムを格納した記憶媒体及び追加検索語候補提示方法及び装置及び追加検索語候補提示プログラムを格納した記憶媒体
JP2000092032A (ja) * 1998-09-16 2000-03-31 Fujitsu Ltd 可変長フレームのエラー情報折り返し方法及び装置
JP2002132812A (ja) * 2000-10-19 2002-05-10 Nippon Telegr & Teleph Corp <Ntt> 質問応答方法、質問応答システム及び質問応答プログラムを記録した記録媒体
JP2002183195A (ja) * 2000-12-18 2002-06-28 Ntt Advanced Technology Corp 概念検索方式
JP2002189734A (ja) * 2000-12-21 2002-07-05 Ricoh Co Ltd 検索語抽出装置および検索語抽出方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07192010A (ja) * 1993-12-27 1995-07-28 Canon Inc 文書処理装置
JPH09218881A (ja) * 1996-02-09 1997-08-19 Nippon Telegr & Teleph Corp <Ntt> 追加検索語候補提示方法、文書検索方法およびそれらの装置
JPH11161658A (ja) * 1997-11-27 1999-06-18 Nippon Telegr & Teleph Corp <Ntt> 追加検索語の優先度計算方法及び装置及び追加検索語の優先度計算プログラムを格納した記憶媒体
JPH11338873A (ja) * 1998-05-26 1999-12-10 Nippon Telegr & Teleph Corp <Ntt> 再検索方法及び装置及び再検索プログラムを格納した記憶媒体及び追加検索語候補提示方法及び装置及び追加検索語候補提示プログラムを格納した記憶媒体
JP2000092032A (ja) * 1998-09-16 2000-03-31 Fujitsu Ltd 可変長フレームのエラー情報折り返し方法及び装置
JP2002132812A (ja) * 2000-10-19 2002-05-10 Nippon Telegr & Teleph Corp <Ntt> 質問応答方法、質問応答システム及び質問応答プログラムを記録した記録媒体
JP2002183195A (ja) * 2000-12-18 2002-06-28 Ntt Advanced Technology Corp 概念検索方式
JP2002189734A (ja) * 2000-12-21 2002-07-05 Ricoh Co Ltd 検索語抽出装置および検索語抽出方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008546098A (ja) * 2005-05-31 2008-12-18 シーメンス メディカル ソリューションズ ユーエスエー インコーポレイテッド 患者の人口統計的レコード照会のデータ依存型フィルタリングシステム及び方法
JP2010519609A (ja) * 2007-02-16 2010-06-03 マイクロソフト コーポレーション インスタント・メッセージング・アプリケーションのためのコンテキストセンシティブな検索および機能
JP2008234559A (ja) * 2007-03-23 2008-10-02 Yahoo Japan Corp ドキュメント絞り込み検索装置、方法及びプログラム
JP2007250000A (ja) * 2007-05-14 2007-09-27 Data Craft:Kk 検索装置及び検索プログラム
JP2009093653A (ja) * 2007-10-05 2009-04-30 Fujitsu Ltd ユーザ入力に応じた検索空間の絞り込み
JP2009289202A (ja) * 2008-05-30 2009-12-10 Toshiba Corp キーワード入力支援装置、キーワード入力支援方法及びプログラム
US8874590B2 (en) 2008-05-30 2014-10-28 Kabushiki Kaisha Toshiba Apparatus and method for supporting keyword input

Similar Documents

Publication Publication Date Title
JP3755134B2 (ja) コンピュータベースの適合テキスト検索システムおよび方法
KR100820746B1 (ko) 온톨로지를 이용한 정보의 브라우징 시스템 및 방법
US7475074B2 (en) Web search system and method thereof
US20140222795A1 (en) Methods and apparatus for facilitating delivery of a service associated with a product
US20040162842A1 (en) Computerized document processing apparatus, computerized document processing method
KR102128659B1 (ko) 키워드 추출 및 요약문 생성 시스템 및 방법
US20050149500A1 (en) Systems and methods for unification of search results
US8214347B2 (en) Search result sub-topic identification system and method
JP2013505501A (ja) 高度な検索結果ページコンテンツを提供するためのシステム及び方法
JP2013505503A (ja) 高度な検索結果ページコンテンツを提供するためのシステム及び方法
US20140164296A1 (en) Chatbot system and method with entity-relevant content from entity
JP5480058B2 (ja) 広告マッチング装置、方法及びプログラム
JP2004341753A (ja) 検索支援装置、検索支援方法、およびプログラム
JP2009048408A (ja) ドキュメント作成システム、ユーザ端末、サーバ装置、およびプログラム
KR102256007B1 (ko) 자연어 질의를 통한 문서 검색 및 응답 제공 시스템 및 방법
US10078686B2 (en) Combination filter for search query suggestions
JPH1097541A (ja) 文書ブラウズ支援システムおよび文書処理システム
JP2004054619A (ja) 文書検索システム、文書検索方法、および、文書検索プログラム
JP4796527B2 (ja) ドキュメント絞り込み検索装置、方法及びプログラム
JP2009265770A (ja) 重要文提示システム
JP2006236221A (ja) ウエブページ検索のための管理サーバ装置
JP2008112310A (ja) 検索装置、情報検索システム、検索方法、検索プログラム、及び記録媒体
JP5746912B2 (ja) テキストパターン抽出を用いてWeb文書をリファインするための方法、システム及びコンピュータ読み出し可能記録媒体
JP2017142653A (ja) リアルタイム・ライティング支援装置
KR101499685B1 (ko) 키워드 트리 제공 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040423

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20050315

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061128

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20070126

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070320