JPH1185765A - タグ付文書検索システム - Google Patents

タグ付文書検索システム

Info

Publication number
JPH1185765A
JPH1185765A JP9242889A JP24288997A JPH1185765A JP H1185765 A JPH1185765 A JP H1185765A JP 9242889 A JP9242889 A JP 9242889A JP 24288997 A JP24288997 A JP 24288997A JP H1185765 A JPH1185765 A JP H1185765A
Authority
JP
Japan
Prior art keywords
document
tag
search
paragraph
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP9242889A
Other languages
English (en)
Other versions
JP4024906B2 (ja
Inventor
Shinya Sugiyama
晋也 杉山
Yoshiaki Suzuki
善昭 鈴木
Tomohide Sugaya
友秀 菅谷
Ryoko Kitagawa
良子 北川
Tadahiro Shirai
直裕 白井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP24288997A priority Critical patent/JP4024906B2/ja
Publication of JPH1185765A publication Critical patent/JPH1185765A/ja
Application granted granted Critical
Publication of JP4024906B2 publication Critical patent/JP4024906B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 情報検索において、複数の文書4が検索され
た場合に、各文書4に対して検索者が必要とする重要度
の順位を付す。 【解決手段】 各文書4に含まれる各タグ及び該当タグ
が付されたパラグラフの文書内位置と各文書に含まれる
各文字列及び該当文字列が所属するパラグラフとを記憶
するタグ付文書データベース3と、文字列を指定するキ
ーワードとタグと該当タグの重みとを入力する検索入力
手段1と、入力されたキーワードとタグとを検索条件1
8としてタグ付文書データベースを調べて該当検索条件
に合致するパラグラフを含む文書を検索する検索処理手
段10と、検索された各文書のキーワードを含む各パラ
グラフを指定するタグの各重みを用いて検索された各文
書の有用性を示すスコアを算出するスコア算出手段11
と、検索された各文書を算出された各スコアのスコア順
に出力する検索結果出力手段2とを備えていてる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、大量の文書から検
索者が必要とする情報が記載された文書を検索する情報
検索システムに係わり、特に、タグ付文書ファイルから
必要な情報を効率的に検索するタグ付文書検索システム
に関する。
【0002】
【従来の技術】一般に、情報検索システムにおいては、
各文書自体を記憶する文書ファイルの他に、各文書に含
まれるキーワード対象となる各文字列を記憶する文書デ
ータベースが設けられている。
【0003】そして、検索者が必要とする情報に関する
キーワードを検索条件として入力すると、このキーワー
ドで文書データベースを調べて、該当キーワードに対応
する各文字列が含まれる文書(文書名)が検索される。
【0004】しかし、文書データベースには、該当キー
ワードで指定する文字列が含まれる全ての文書が登録さ
れている。したがって、文書における本文部分ではない
例えば参考文献として該当キーワードが記載されていた
としても、この文書は検索(ヒット)される。
【0005】このような場合、検索者としては、たとえ
キーワードが参考文献として記載された文書を文書ファ
イルから読出して閲覧したとしても、期待した情報は得
られない。
【0006】特に、各文書に含まれる全ての文字列を検
索対象としてキーワードで検索可能とした全文検索シス
テムを採用した情報検索システムにおいては、検索(ヒ
ット)される文書の数が非常に多くなるので、検索(ヒ
ット)した多数の文書から期待した情報が記載された文
書を選択するのに多大の時間と労力が必要であった。
【0007】このような不都合を解消するために、文書
を複数のパラグラフ(段落)に分割して、各パラグラフ
に該当パラグラフの記述内容を特定するタグを付して、
このタグとキーワードとを検索条件として文書データベ
ースを検索することことが実用化されている。
【0008】このタグとしては、例えば図2に示すよう
に、日付.著者,標題,概要、本文,表,まとめ,参考
文献等がある。また、場合によっては、固有名詞、会社
名等もタグとして文書内に設定可能である。そして、各
タグと該当タグが指定するパラグラフとの関係と、各文
字列がどのパラグラフに所属するかの情報とが文書デー
タベースに登録されている。よって、操作者は例えばキ
ーワードが標題として記載された文書のみを検索するこ
とが可能である。
【0009】しかし、例えば本文のタグを指定してキー
ワードを検索した場合、多数の文書が検索(ヒット)さ
れる。そのために、これらの文書相互間の検索者にとっ
ての有用性の優劣を付ける必要がある。そこで、該当パ
ラグラフ内における該当キーワードに対応する文字列の
数(キーワードのヒット数)、又は該当文字例の出現頻
度(該当パラグラフ全体の文字列数に対するヒットした
文字列数の割合)を算出して、このヒット数又は出現頻
度が多い方の文書を最初に文書ファイルから読出すよう
にしたシステムが提唱されている。
【0010】
【発明が解決しようとする課題】しかしながら、上述し
たように、タグとキーワードとの組合せ(AND条件)
を検索条件として検索したり、検索結果をヒット数又は
出現頻度で有用性に関する優劣をつけるタグ付文書検索
システムにおいても、まだ解消すべき次のような課題が
あった。
【0011】すなわち、一般に、操作者は検索もれを防
ぐために、一つのタグのみを指定するのではなくて、複
数のタグを指定する場合が多い。この場合、指定される
複数のタグ相互間に優劣差がないので、複数の文書が検
索(ヒット)された場合は、検索された文書相互間に有
用性に関する優劣がつかないので、検索された多数の文
書から自己に必要な情報が記載された文書を選択するの
に多大の手間と時間が必要である。
【0012】また、複数のダクを指定する場合で、かつ
検索キーワードに対応する文字列数(キーワードのヒッ
ト数)、又は該当文字例の出現頻度から検索された複数
の文書の優劣をつける手法においては、複数のダク相互
間に優劣がないので、検索された複数の文書のうち、検
索者にとって重要でない文書を重要な文書より優先して
文書ファイルから読出す懸念がある。
【0013】例えば、概要のタグのパラグラフに出現す
るキーワードの回数より、参考文献のタグのパラグラフ
に出現するキーワードの回数が多い場合が多発する。こ
の場合、概要にキーワードが出現する文書の方が検索者
にとってより重要であると見なせる。しかし、参考文献
にキーワードが多発する文書は、必ずしも検索者の必要
とする文書であるとは限らない。
【0014】すなわち、検索された各文書の有用性が検
索者にとっての有用性に対して逆転する懸念がある。本
発明はこのような事情に鑑みてなされたものであり、キ
ーボードと共に検索条件を構成する各タグに対して重み
を付すことによって、たとえ複数のタグ及びキーワード
で検索したとしても、検索された複数の文書に対して検
索者からみて有用性を示す正しい順序のスコアが付さ
れ、検索者にとって検索された各文書を重要な順にその
記載内容を確認していくことができ、結果として、必要
な情報を短時間で効率的に検索できるタグ付文書検索シ
ステムを提供することを目的とする。
【0015】
【課題を解決するための手段】上記課題を解消するため
に請求項1のタグ付文書検索システムにおいては、少な
くとも各パラグラフ毎にタグが付された複数の文書を記
憶するタグ付文書ファイルと、各文書に含まれる各タグ
及び該当タグが付されたパラグラフの文書内位置と、各
文書に含まれる各文字列及び該当文字列が所属するパラ
グラフとを記憶するタグ付文書データベースと、文字列
を指定するキーワードとタグと該当タグの重みとを入力
する検索入力手段と、この検索入力手段で入力されたキ
ーワードとタグとを検索条件としてタグ付文書データベ
ースを調べて、該当検索条件に合致するパラグラフを含
む文書を検索する検索処理手段と、検索処理手段で検索
された各文書のキーワードを含む各パラグラフを指定す
るタグの各重みを用いて検索された各文書の有用性を示
すスコアを算出するスコア算出手段と、検索された各文
書を算出された各スコアのスコア順に出力する検索結果
出力手段とを備えている。
【0016】このように構成されたタグ付文書検索シス
テムにおいては、キーワードとタグとを検索条件として
入力すると共に、各タグの重要度を示す重みを入力す
る。そして、入力されたキーワードとタグとを検索条件
としてタグ付文書データベースを調べて、該当検索条件
に合致するパラグラフを含む文書を検索する。さらに、
検索された各文書のキーワードを含む各パラグラフを指
定するタグの各重みを用いて検索された各文書の有用性
を示すスコアが自動的に計算される。そして、スコアの
高い順に検索された各文書が出力される。
【0017】また、請求項2のタグ付文書検索システム
においては、少なくとも各パラグラフ毎にタグが付され
た複数の文書を記憶するタグ付文書ファイルと、各文書
に含まれる各タグ及び該当タグが付されたパラグラフの
文書内位置と、各文書に含まれる各文字列及び該当文字
列が所属するパラグラフとを記憶するタグ付文書データ
ベースと、各タグの重みを記憶するタグ重みテーブル
と、文字列を指定するキーワードとタグとからる検索条
件を入力する検索入力手段と、タグ付文書データベース
を調べて、入力された検索条件に合致するパラグラフを
含む文書を検索する検索処理手段と、検索処理手段で検
索された各文書のキーワードを含む各パラグラフを指定
するタグの各重みを用いて検索された各文書の有用性を
示すスコアを算出するスコア算出手段と、検索された各
文書を算出された各スコアのスコア順に出力する検索結
果出力手段とを備えている。
【0018】このように構成されたタグ付文書検索シス
テムにおいては、各タグの重みは予めタグ重みテーブル
に設定されている。すなわち、文書の各パラグラフに付
された[標題],[概要],[本文],[参考文献]等
の各タグの検索時の重要度の順次は各検索者によってあ
まり変動がないとみなされるので、各タグの重みを予め
タグ重みテーブルに設定しておくことによって、検索条
件の入力操作を簡素化でき、検索処理速度を向上でき
る。
【0019】また、請求項3のタグ付文書検索システム
においては、少なくとも各パラグラフ毎にタグが付され
た複数の文書を記憶するタグ付文書ファイルと、各文書
に含まれる各タグ及び該当タグが付されたパラグラフの
文書内位置と、各文書に含まれる各文字列、該当文字列
が所属するパラグラフ及び該当パラグラフに含まれる文
字列数とを記憶するタグ付文書データベースと、文字列
を指定するキーワードとタグと該当タグの重みをと入力
する検索入力手段と、検索入力手段で入力されたキーワ
ードとタグとを検索条件としてタグ付文書データベース
を調べて、該当検索条件に合致するパラグラフを含む文
書を検索する検索処理手段と、検索処理手段で検索され
た各文書のキーワードを含む各パラグラフを指定するタ
グの各重みと各パラグラフに含まれるキーワードの各文
字列数とを用いて検索された各文書の有用性を示すスコ
アを算出するスコア算出手段と、検索された各文書を算
出された各スコアのスコア順に出力する検索結果出力手
段とを備えている。
【0020】このように構成されたタグ付文書検索シス
テムにおいては、タグ付文書データベースに、各文字列
毎に該当文字列が所属するパラグラフ及び該当パラグラ
フに含まれる文字列数が記憶されている。したがって、
入力されたキーワードが指定されたタグのパラグラフ内
の存在した場合に、検索(ヒット)した情報と、ヒット
した文字列の数が検出される。
【0021】そして、複数の文書が検索された場合に
は、この複数の文書相互間の有用度を示すスコアを前述
したタグの重みと該当タグ内のヒットした文字列の数と
で求めている。
【0022】したがって、同一の重みのタグで複数の文
書が検索された場合は、該当タグのパラグラフにおける
キーワードのヒット数が多い方がスコアが高く、検索者
にとって、より重要な文書を優先的に閲覧することがで
きる。
【0023】また、請求項4のタグ付文書検索システム
においては、少なくとも各パラグラフ毎にタグが付され
た複数の文書を記憶するタグ付文書ファイルと、各文書
に含まれる各タグ及び該当タグが付されたパラグラフの
文書内位置と各文書に含まれる各文字列及び該当文字列
が所属するパラグラフとを記憶するタグ付文書データベ
ースと、文字列を指定するキーワードと該当キーワード
の重みとタグと該当タグの重みとを入力する検索入力手
段と、検索入力手段で入力されたキーワードとタグとを
検索条件としてタグ付文書データベースを調べて、該当
検索条件に合致するパラグラフを含む文書を検索する検
索処理手段と、検索処理手段で検索された各文書のキー
ワードを含む各パラグラフを指定するタグの各重みと該
当キーワードの重みとを用いて検索された各文書の有用
性を示すスコアを算出するスコア算出手段と、検索され
た各文書を算出された各スコアのスコア順に出力する検
索結果出力手段とを備えている。
【0024】このように構成されたタグ付文書検索シス
テムにおいては、操作者はキーワードと該当キーワード
の重みとタグと該当タグの重みとを検索入力する。実際
の検索は、キーワードとタグとで実施される。そして、
複数の文書が検索された場合、各文書の有用度を示すス
コアが前述したタグの重みに加えて、キーワードの重み
も加えて算出される。
【0025】すなわち、検索者が情報検索を実施すると
き、調べたい情報に関係する複数のキーワードのAND
条件又はOR条件で検索する場合が往々にしてある。こ
のような場合、この入力する複数のキーワードに対して
それぞれ個別の重みを付すことによって、重要なタグの
パラグラフに重用なキーワードが含まれる文書のスコア
がより高くなる。
【0026】したがって、複数のキーワードで検索する
場合においても、検索者にとってより重要な情報が記載
された文書から順番に閲覧できる。また、請求項5のタ
グ付文書検索システムにおいては、少なくとも各パラグ
ラフ毎にタグが付された複数の文書を記憶するタグ付文
書ファイルと、各文書に含まれる各タグ及び該当タグが
付されたパラグラフの文書内位置と各文書に含まれる各
文字列、該当文字列が所属するパラグラフ及び該当パラ
グラフに含まれる文字列数とを記憶するタグ付文書デー
タベースと、文字列を指定するキーワードと該当キーワ
ードの重みとタグと該当タグの重みとを入力する検索入
力手段と、検索入力手段で入力されたキーワードとタグ
とを検索条件としてタグ付文書データベースを調べて、
該当検索条件に合致するパラグラフを含む文書を検索す
る検索処理手段と、検索処理手段で検索された各文書の
キーワードを含む各パラグラフを指定するタグの各重み
と各パラグラフに含まれるキーワードの各文字列数と該
当キーワードの重みとを用いて検索された各文書の有用
性を示すスコアを算出するスコア算出手段と、検索され
た各文書を算出された各スコアのスコア順に出力する検
索結果出力手段とを備えている。
【0027】このように構成されたタグ付文書検索シス
テムにおいては、複数の文書が検索された場合、各文書
のスコアがタグの各重みとキーワードの各文字列数と該
当キーワードの重みとを用いて算出される。
【0028】よつて、たとえ複数のタグ及び複数のキー
ワードを指定して検索する場合においても、検索者にと
ってより重要な情報が記載された文書から順番に閲覧で
きる。
【0029】請求項6のタグ付文書検索システムにおい
ては、少なくとも各パラグラフ毎にタグが付された複数
の文書を記憶するタグ付文書ファイルと、各文書に含ま
れる各タグ及び該当タグが付されたパラグラフの文書内
位置と、各文書に含まれる各文字列、該当文字列が所属
するパラグラフ及び該当パラグラフに含まれる文字列数
とを記憶するタグ付文書データベースと、文字列を指定
するキーワードと該当キーワードの重みとタグとを入力
する検索入力手段と、検索入力手段で入力されたキーワ
ードとタグとを検索条件としてタグ付文書データベース
を調べて、該当検索条件に合致するパラグラフを含む文
書を検索する検索処理手段と、検索処理手段で検索され
た各文書のキーワードを含む各パラグラフに含まれるキ
ーワードの各文字列数と該当キーワードの重みとを用い
て検索された各文書の有用性を示すスコアを算出するス
コア算出手段と、検索された各文書を算出された各スコ
アのスコア順に出力する検索結果出力手段とを備えてい
る。
【0030】このように構成されたタグ付文書検索シス
テムにおいては、複数の文書が検索された場合、各文書
のスコアがキーワードの各文字列数と該当キーワードの
重みとを用いて算出される。
【0031】よつて、たとえ複数のタグ及び複数のキー
ワードを指定して検索する場合においても、検索者にと
ってより重要な情報が記載された文書から順番に閲覧で
きる。
【0032】さらに、別の発明においては、前述した各
発明における各タグ毎に各文字列に対する類語文字列を
記憶する複数のタグ単位類語辞書を設けている。さら
に、検索処理手段においては、検索入力手段で入力され
たキーワードとタグと該当タグに対応するタグ単位類語
辞書に記憶されたキーワードに対する類語とを検索条件
としている。
【0033】すなわち、前述したように、日付.著者,
標題,概要、本文,表,まとめ,参考文献等のタグ毎に
タグ種別に最適の類語辞書を設けることによって、検索
キーワードが不用意に増加することが未然に防止され
る。
【0034】
【発明の実施の形態】以下本発明の各実施形態を図面を
用いて説明する。 (第1実施形態)図1は本発明の第1実施形態に係わる
タグ付文書検索システムの概略構成を示すブロック図で
ある。
【0035】このタグ付文書検索システムは、コンピュ
ータ等の一種の情報処理装置で構成されている。そし
て、このタグ付文書検索システム内には、検索条件等を
入力するキーボードと表示装置とで構成された検索条件
入力部1と検索結果を出力するキーボードと表示装置と
で構成された検索結果出力部2、例えばHDD等に形成
された、タグ付文書データベース3と複数のタグ付の文
書4を記憶するタグ付文書ファイル5と複数のタグ単位
類語辞書6が組込まれた類語辞書7、及び主記憶部内に
形成されたタグ重みテーブル8と入力バッファ9等が設
けられている。
【0036】なお、一般に、検索条件入力部1と検索結
果出力部2とは同一のキーボードと同一の表示装置で実
現される。さらに、このタグ付文書検索システム内に
は、アプリケーションプログラム上にプログラムモジュ
ールとして構成された、検索処理部10、スコア算出部
11と表示順位決定部12とからなる表示順位算出部1
3、及び文書読出部14とが設けられている。
【0037】前記タグ付文書ファイル5内に記憶された
各タグ付文書4は、例えば図2に示すように、文書を複
数のパラグラフ(段落)15に分割した場合において、
各パラグラフ15の記載内容を示すタグ(属性,名称)
16が付されている。図2に示す例においては、各タグ
16には、日付.著者,標題,概要、本文,表,まと
め,参考文献等がある。また、場合によっては、固有名
詞、会社名等もタグ16として文書内に設定可能であ
る。
【0038】また、文書を構成するパラグラフ(段落)
15には、文書内の位置を特定するパラグラフ番号が付
されている。タグ重みテーブル8内には、図3に示すよ
うに、各タグ16に対して、情報検索を実施する場合の
重要度を示す重みTWが設定されている。この実施形態
においては、[標題]のタグ16の重みTWが最も大き
く設定され、参考文献のタグ16が最も小さく設定され
ている。
【0039】なお、このタグ重みテーブル8の各重みT
Wは、検索者がその都度、検索条件入力部1を介して入
力して設定すことができる他に、このタグ付文書検索シ
ステムの管理者が各重みTWを予めタグ重みテーブル8
内に設定してておくことも可能である。
【0040】タグ付文書データベース3内には、第4
(a)に示すタグ検索テーブル3aと、図4(b)に示
すキーワード検索テーブル3bとが形成されている。検
索テーブル3a内には、前述した各タグ(タグ名称)1
6毎に、該当タグ16が、タグ文書ファイル5内の各文
書4(文書番号1,2,3,…)におけるどのパラグラ
フ15(パラグラフ番号1,2,3,4,5,…)に対
応するか否かが設定されている。
【0041】例えば日付のタグ16は、文書番号1の文
書4の1番のパラグラフ15に対応し、同様に、文書番
号2の文書4の1番のパラグラフ15に対応し、さら
に、文書番号3番の文書4の1番のパラグラフ15に対
応する。
【0042】すなわち、[1]のビットが設定されてい
るパラグラフ15には該当タグ16に対応し、[0]の
ビットが設定されているパラグラフ15には他のタグ1
6が対応する。
【0043】キーワード検索テーブル3b内には、各文
字列毎に、該当文字列がどの文書4のどのパラグラフ1
5内に幾つ含まれるかが記憶されている。例えば[青]
の文字列は、1番の文書4の2番のパラグラフ15に1
個記載され、2番の文書のN番のパラグラフ15に1個
記載され、3番の文書には全く記載されていないことを
示す。
【0044】また、[日本]の文字列は、文書番号1の
文書4の2番のパラグラフ15に2個記載され、同じく
文書番号1の文書5の3番のパラグラフ15に1個記載
され、同じく文書番号1の文書4の9番のパラグラフ1
5に1個記載され、さらに、文書番号2のパラグラフ1
5に1個記載され、文書番号3の文書4の2番のパラグ
ラフ15に1個記載され、同じく、文書番号3の文書4
のM番のパラグラフ15に2個記載されていることを示
す。
【0045】なお、このキーワード検索テーブル3b内
に登録する文字列は、全文検索システムにおいては、か
な、漢字、数字における例えば1文字から4文字まての
全ての組合わせが可能な数だけ設定される。なお、全文
検索システム以外の場合は、予めキーワードとして検索
されるであろうと予測できる各文字列が予め登録されて
いる。
【0046】次に、類語辞書7内に、形成された複数の
タグ単位類語辞書6について図5を用いて説明する。
[本文]のタグ(タグ1)16のタグ単位類語辞書6a
には、「特許」の類語として[パテント」及び「とっき
ょ」が登録され、[まとめ]のタグ(タグ2)16のタ
グ単位類語辞書6bには、「特許」の類語として[特許
庁」が登録されていたとする。
【0047】そして、例えば、検索条件入力部1から<
タグ1(本文),特許>と(AND)<タグ2(まと
め),特許>の検索条件が入力されると、タグ1(本
文)のタグ単位類語辞書6aからキーワード「特許」の
類語「パテント」及び「とっきょ」が読出され、タグ2
(本文)のタグ単位類語辞書6bからキーワード「特
許」の類語「特許庁」が読出される。
【0048】したがって、最終的な検索条件は下記の通
りとなる。 <タグ1,特許> AND<タグ1,パテント> AND<タグ1,とっきょ> AND <タグ2,特許>AND <タグ2,特許庁> 次に、アプリケーションブログラム上に形成された各部
10,11,12,13,14の具体的検索処理動作を
図6の流れ図を用いて説明する。
【0049】操作者の検索条件入力部1におけるキー入
力操作で、各タグ16毎に、該当タグのタグ名と該当タ
グの重みTWとの組合わせからなるタグ情報17が入力
されると、この入力されたタグ情報17を入力バッファ
9を介して、一旦タグ重みテーブル8へ登録する。続い
て、タグ名とキーワードとの1個又は複数個の組合わせ
からなる検索条件18が入力されると(S1)、各タグ
単位類語辞書6から各タグ16毎に入力キーワードに対
応する各類語を読出して(S2)、この類語を含めた新
たな検索条件19を再編集する(S3)。
【0050】そして、この再編集された検索条件19で
タグ付文書データベース3のタグ検索テーブル3a及び
キーワード検索テーブル3bを検索する(S4)。具体
的には、タグ名(タグ名称)でタグ検索テーブル3aを
検索して、[1]のビットが立つてるパラグラフ15の
番号とこのパラグラフ15の番号を含む文書4の番号を
読出す。同時に、キーワードでキーワード検索テーブル
3bを検索して、[1]以上のビットが立つてるパラグ
ラフ15の番号とこのパラグラフ15の番号を含む文書
4の番号を読出す。そして、タグ検索テーブル3aとキ
ーワード検索テーブル3bとの両方のテーブルで読出さ
れたパラグラフ15の番号と文書4の番号とを、該当検
索条件に対する検索結果とする。
【0051】このようにして、タグとキーワードとの組
合わせ(AND条件)からなる検索条件19に合致する
文書4を指定したパラグラフ15が検索されると(S
5)、複数の文書4が検索されたか否かを調べる(S
6)。
【0052】複数の文書4が検索されると、検索された
各パラグラフ15に対応する各タグ16のタグ重みTW
を、タグ重みテーブル8から読出す(S7)。そして、
表示順序算出部13のスコア算出部11が起動して、今
回検索された各文書4毎の該当文書の重要度を示すスコ
アSLを下式を用いて算出する(S8)。
【0053】SL=Σ(TW) 但し、(TW) は、キーワードが存在(ヒット) し
たパラグラフ15を指定するタグ16の重みTWであ
る。複数のタグ名を検索条件18に設定した場合に、同
一文書4で設定した複数のタグ16が示す複数のパラグ
ラフ15にそれぞれキーワードの文字列が検出される
と、スコアSLは、複数のタグ16の重みTWを加算し
た値となる。
【0054】検索された各文書4毎にスコアSLが算出
されると、表示順位決定部12が起動して、算出された
各スコアSLを値の高い順(スコア順)に並べ替えて
(S9)、検索結出力部2へ各文書4の文書名又は文書
番号をスコアSLの高い順に表示出力する。
【0055】検索者は、検索結出力部2の表示画面にス
コアSLの高い順に表示された各文書4の文書名又は文
書番号を例えばマウスで指定すると、文書読出部14が
起動して、指定された文書4をタグ付文書ファイル5か
ら読出して、検索結出力部2へその文書内容を表示出力
する。
【0056】検索者は、表示された文書4に自己が目的
とする情報が記載されていない場合は、例えば2番目に
高いスコアSLの文書名を指定すると、該当文書4がタ
グ付文書ファイル5から読出して検索結出力部2へその
文書内容を表示出力する。
【0057】また、S6にて1つの文書4しか検索され
ないと、この検索された1つの文書4をタグ付文書ファ
イル5から読出して検索結出力部2へその文書内容を表
示出力する(S12)。
【0058】さらに、S5にて、検索条件19に合致す
る文書4が検索されなかった場合、該当文書無しメッセ
ージを表示出力する(S11)。このように構成された
第1実施形態のタグ付文書検索システムにおいては、キ
ーワードとタグとを検索条件18として入力すると共
に、各タグの重要度を示すタグの重みTWをグ情報17
として入力する。
【0059】そして、入力された検索条件18をタグ別
類語辞書6を用いて指定タグ16にに対応する類語をキ
ーワードとして加えて再編集する。この再編集された検
索条件19でタグ付文書データベース3のタグ別検索テ
ーブル3aとキーワード検索テーブル3を調べて、該当
検索条件19に合致するパラグラフ15を含む文書4を
検索する。
【0060】さらに、検索された各文書4のキーワード
を含む各パラグラフ15を指定するタグ16の各重みT
Wを加算して検索された各文書4の有用性を示すスコア
SLが自動的に計算される。そして、スコアSLの高い
順に検索された各文書4の文書名又は文書番号が出力さ
れる。
【0061】この場合、重みTWの高い例えば「概要」
等のタグ16のパラグラフ15にキーワードの文字列が
検出された文書4の方が、重みTWの低い例えば「参考
文献」等のタグ16のパラグラフ15にキーワードの文
字列が検出された文書4より高いスコアSLを有するの
で、検索者にとって、より重要な文書4を優先的に閲覧
することができる。
【0062】さらに、この第1実施形態システムにおい
ては、各タグ16毎に、全文字列に対する類語文字列を
記憶するタグ単位類語辞書6を用いている。したがっ
て、各タグ16毎に、該当タグ16に最適な類語を登録
できるので、タグ16の種類によっては、登録する類語
を少数に抑制しても検索精度に悪影響を与えなくするこ
とが可能となる。よって、検索精度を低下させることな
く、検索処理速度を向上できる。
【0063】(第2実施形態)図7は本発明の第2実施
形態に係わるタグ付文書検索システムにおける検索処理
動作を示す流れ図である。タグ付文書検索システム全体
構成を示すブロック図は図1に示す第1実施形態システ
ムとほぼ同じであるので説明を省略する。
【0064】図7の検索処理動作を示す流れ図におい
て、Q1からQ6までの動作は図6に示す第1実施形態
システムのS1からS6までの処理動作と同じである。
Q6にて複数の文書が検索されると、検索された各パラ
グラフ15に対応する各タグ16のタグ重みTWをタグ
重みテーブル8から読出す(Q7)。
【0065】次に、Q8にて、検索された各文書4にお
ける指定されたタグ16のパラグラフ15におけるキー
ワードで指定された文字例が含まれる数を、キーワード
検索テーブル3bの該当文書の対応する各パラグラフ1
5のビット値で読取ってこのビット値をヒット数Nとす
る。
【0066】検索された各文書4における指定タグ16
のパラグラフ15のヒット数Nが求まると、タグ16の
重みTWを用いて、各指定タグ16のパラグラフ15の
スコアSPを下式で算出する(Q9)。
【0067】SP=N・TW 各パラグラフ15のスコアSPが求まると、検索(ヒッ
ト)した各文書4毎のスコアSLを下式で算出する(Q
10)。
【0068】 SL=Σ(SP) =Σ[N・TW] すなわち、複数のタグ16を検索条件19に設定した場
合に、同一文書4で設定した複数のタグ16が示す各パ
ラグラフ15にそれぞれキーワードの文字列が検出され
ると、各文書4のスコアSLは、各タグ16の重みTW
と該当パラグラフ15内のヒット数Hとを乗算した値を
ヒットした全てのタグ16に亘って積算した値となる。
【0069】検索された各文書4毎にスコアSLが算出
されると、表示順位決定部12が起動して、算出された
各スコアSLを多い順に並べ替えて(S11)、検索結
出力部2へ各文書4の文書名又は文書番号をスコアSL
の高い順に表示出力する(Q12)。
【0070】また、S6にて1つの文書4しか検索され
ないと、この検索された1つの文書4をタグ付文書ファ
イル5から読出して検索結出力部2へその文書内容を表
示出力する(Q14)。
【0071】さらに、S5にて、検索条件19に合致す
る文書4が検索されなかった場合、該当文書無しのメッ
セージを表示する(Q13)。このように構成された第
2実施形態のタグ付文書検索システムにおいては、入力
された検索条件19(18)を構成するキーワードが、
指定されたタグ16のパラグラフ15内に存在した場合
に、検索(ヒット)した事を示す情報と、存在した文字
列数としてのヒット数Nが検出される。
【0072】そして、入力された検索条件19(18)
に合致する複数の文書4が検索された場合には、この複
数の文書4相互間の重要度を示すスコアSLを前述した
タグの重みTWと該当タグ16のパラグラフ15内の文
字列数からなるヒット数Nとで求めている。
【0073】SL=Σ[N・(TW)] したがって、同一の重みTWのタグ16で複数の文書4
が検索された場合は、該当タグ16のパラグラフ15に
おけるキーワードのヒット数Hが多い方がスコアSLが
高く、スコアSLの高さ順に検索結果が表示されるの
で、検索者にとって、より重要な文書4を優先的に閲覧
することができる。
【0074】(第3実施形態)図8は本発明の第3実施
形態に係わるタグ付文書検索システムにおける検索処理
動作を示す流れ図である。タグ付文書検索システム全体
構成を示すブロック図は図1に示す第1実施形態システ
ムとほぼ同じであるので説明を省略する。
【0075】図8の検索処理動作を示す流れ図におい
て、検索者が検索条件入力部1を介して、タグ名とキー
ワードと該当キーワードの重みKWからなる1個又は複
数個の組合わせからなる検索入力17aが入力するする
と、この1個又は複数個の組合わせからなる検索入力1
7aは一旦入力バッファ9へ格納される(P1)。
【0076】なお、この検索処理においては、各タグ1
6の重みTWは予めタグ重みテーブル8に書込まれてい
るとする。次に検索処理部10か起動して、入力バッフ
ァ9に記憶した検索入力17aのうちのキーワードの重
みKWを取除いたタグ名とキーワードとからなる組合せ
を新たな検索条件18として、この検索条件18でタグ
付文書データベース3を調べて、この検索条件18に合
致するパラグラフ15を含む文書4を検索する(P
2)。
【0077】そして、タグとキーワードとの組合わせ
(AND条件)からなる検索条件18に合致する文書4
を指定したパラグラフ15が検索されると(P3)、複
数の文書4が検索されたか否かを調べる(P4)。
【0078】複数の文書4が検索されると、検索条件1
8に含まれる各キーワードの重みKWを入力バッファ9
から読出す(P5)。次に、検索された各文書4におけ
る指定されたタグ16のパラグラフ15におけるキーワ
ードで指定された文字例が含まれる数をキーワード検索
テーブル3bの該当文書4の対応する各パラグラフ15
のビット値で読取ってヒット数Nとする(P6)。そし
て、各パラグラフ15におけるキーワード毎のスコアS
Kを次式で算出する(P7)。
【0079】SK=H・KW すなわち、ヒットしたパラグラフ15内に重要なキーワ
ードが多く存在すると、該当キーワードのスコアSKは
高くなる。
【0080】次に、複数のキーワードで検索した場合
で、かつ複数のキーワードが同一のパラグラフ15に存
在(ヒット)した場合を想定して、各パラグラフ15毎
のスコアSPを下式で算出する(P8)。
【0081】SP=[Σ(SK)]・TW 但し、TWはタグ重みテーブル8から読出した該当パラ
グラフ15を指定するタグ16の重要度を示す重みであ
る。
【0082】各パラグラフ15のスコアSPが求まる
と、検索(ヒット)した各文書4毎のスコアSLを下式
で算出する(P9)。 SL=Σ(SP) =Σ[Σ(SK)]・TW] =Σ[Σ(H・KW)]・TW] すなわち、複数のタグ16を検索条件18に設定した場
合に、同一文書4で設定した複数のタグ16が示す各パ
ラグラフ15にそれぞれキーワードの文字列が検出され
ると、各キーワードのヒット数Hと該当キーワードの重
みKWとを乗算したキーワード毎のスコアSKをヒット
した全てのキーワードに亘って集積して、この集積され
たものに対して対応するタグ16の重みTWを乗算し
て、各タグ16毎(パラグラフ15)のスコアSPを求
める。そして、ヒットした全てのパラグラフ15に亘っ
て集積して検索された文書4全体のスコアSLを得てい
る。
【0083】検索された各文書4毎にスコアSLが算出
されると、表示順位決定部12が起動して、算出された
各スコアSLを多い順に並べ替えて(P10)、検索結
出力部2へ各文書4の文書名又は文書番号をスコアSL
の高い順に表示出力する(Q11)。
【0084】また、P4にて1つの文書4しか検索され
ないと、この検索された1つの文書4をタグ付文書ファ
イル5から読出して検索結出力部2へその文書内容を表
示出力する(P13)。
【0085】さらに、P3にて、検索条件18に合致す
る文書4が検索されなかった場合、該当文書無しメッセ
ージを表示出力する(P12)。このように構成された
第3実施形態のタグ付文書検索システムにおいては、入
力された検索条件18を構成するキーワード自体に重み
KWを検索者か任意に設定できる。
【0086】そして、検索された各文書4のスコアSL
は SL=Σ[Σ(H・KW)]・TW] となる。すなわち、検索者が複数のキーワードで情報検
索を実施するとき、キーワード相互間に重要度の優劣を
示す重みKWを設定することによって、重要なタグ16
のパラグラフ15に重要なキーワードが含まれる文書4
のスコアSLがより高くなる。
【0087】また、各文書4のスコアSLには、上述し
たキーワードの重みKWの他に、タグ16の重みTW、
キーワードのヒット数Hの関数で示されるので、複数の
文書4が同時に検索(ヒット)された場合における文書
相互間の検索者の意図する重要度を表すスコアSLの大
小がより明確になり、検索者にとって、より重要な文書
4を優先的に閲覧することができる。
【0088】なお本発明は上述した第1,第2,第3の
各実施形態システムに限定されるものではない。検索さ
れた各文書4の重要度を示すスコアSLを求める式に、
タグの重みTW、キーワードの重みKW、キーワードの
ヒット数Hを適宜組合わせて組込むことがか可能であ
る。例えば、 (1) キーワードの重みKWとキーワードのヒット数H (2) キーワードの重みKWとタグの重みTW (3) キーワードの重みKWのみ 等を組込むことが可能である。
【0089】また、各タグ16の重みTWを検索者が検
索条件18と同時にその都度入力して、タグ重みテーブ
ル8に設定することができるとともに、このタグ付文書
検索システムの管理者が予め各タグ16の重みTWをタ
グ重みテーブル8に設定しておくことが可能である。こ
の場合、検索者は、タグとキーワードの組合わせからな
る検索条件18のみを操作入力すればよいので、検索作
業能率を大幅に向上できる。
【0090】さらに、説明を解りやすくするために、上
述した各実施形態のタグ付文書検索システムを図4に示
す各文字数毎に設けられた複数のタグ検索テーブル3
a,3bを使用した全文検索システムで説明した。
【0091】しかし、全文検索システムにおいては、上
述した複数のタグ検索テーブル3a,3bを用いる代り
に、例えば文字数がそれぞれ異なる全ての文字列を、ハ
ッシュ関数を用いて例えば8桁又は16桁の所定桁数を
有したハッシュ値に変換して、各ハッシュ値に対応する
文字列が各文書の各パラグラフに含まれるか否かのビッ
ト情報を登録したハッシュテーブルを用いた全文検索シ
ステムであってもよい。
【0092】さらに、本願発明のタグ付文書検索システ
ムは特に全文検索システムに限定されるものではなく、
各文書に含まれるキーワードを予めデータベースに登録
しておく、通常の情報検索システムにも適用可能であ
る。
【0093】
【発明の効果】以上説明したように、本発明のタグ付文
書検索システムにおいては、キーワードと共に検索条件
を構成する各タグに対して重みを付して、検索条件に合
致する複数の文書が検索された場合に、この検索された
複数の文書における各スコアをタグの重みを用いて算出
している。
【0094】したがって、たとえ複数のタグ及びキーワ
ードで検索したとしても、検索された複数の文書に対し
て検索者からみて有用性を示す正しい順序のスコアが付
され、検索者にとって検索された各文書を重要な順にそ
の記載内容を確認していくことができ、結果として、必
要な情報を短時間で効率的に検索できる。
【0095】さらに、検索された各文章のスコアの算出
に際して、必要に応じて、上述したタグの重みTWに加
えて、キーワードの重みKWとキーワードのヒット数H
の組合せを組込むようにしている。
【0096】その結果、複数の文書が同時に検索(ヒッ
ト)された場合における文書相互間の検索者の意図する
重要度を表すスコアの大小がより明確になり、検索者に
とって、より重要な文書を優先的に閲覧することができ
る。
【0097】さらに、各タグ毎に、全文字列に対する類
語文字列を記憶するタグ単位類語辞書6を用いている。
したがって、各タグ毎に最適な必要最小限の類語を登録
できるので、検索精度を低下させることなく、検索処理
速度を向上できる。
【図面の簡単な説明】
【図1】 本発明の第1実施形態のタグ付文書検索シス
テムの概略構成を示すブロック図
【図2】 同第1実施形態のタグ付文書検索システムに
組込まれたタグ付文書ファイルに記憶されたタグ付の文
書の一例を示す図
【図3】 同第1実施形態のタグ付文書検索システムに
組込まれたタグ重みテーブルの記憶内容を示す図
【図4】 同第1実施形態のタグ付文書検索システムに
組込まれたタグ付文書データベース内に形成されたタグ
検索テーブル及びキーワード検索テーブルの記憶内容を
示す図
【図5】 同第1実施形態のタグ付文書検索システムに
組込まれたタグ単位類語辞書及びその利用方法を示す図
【図6】 同第1実施形態のタグ付文書検索システムに
おける検索処理動作を示す流れ図
【図7】 本発明の第2実施形態のタグ付文書検索シス
テムにおける検索処理動作を示す流れ図
【図8】 本発明の第3実施形態のタグ付文書検索シス
テムにおける検索処理動作を示す流れ図
【符号の説明】
1…検索条件入力部 2…検索結果出力部 3…タグ付文書データベース 3a…タグ検索テーブル 3b…キーワード検索テーブル 4…文書 5…タグ付文書ファイル 6…タグ単位類語辞書 7…類語辞書 8…タグ重みテーブル 10…検索処理部 11…スコア算出部 12…表示順決定部 13…表示順序算出部 14…文書読出部 15…パラグラフ 16…タグ 18,19…検索条件
───────────────────────────────────────────────────── フロントページの続き (72)発明者 北川 良子 東京都府中市東芝町1番地 株式会社東芝 府中工場内 (72)発明者 白井 直裕 東京都府中市東芝町1番地 株式会社東芝 府中工場内

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 少なくとも各パラグラフ毎にタグが付さ
    れた複数の文書を記憶するタグ付文書ファイルと、 前記各文書に含まれる各タグ及び該当タグが付されたパ
    ラグラフの文書内位置と、前記各文書に含まれる各文字
    列及び該当文字列が所属するパラグラフとを記憶するタ
    グ付文書データベースと、 前記文字列を指定するキーワードとタグと該当タグの重
    みとを入力する検索入力手段と、 この検索入力手段で入力されたキーワードとタグとを検
    索条件として前記タグ付文書データベースを調べて、該
    当検索条件に合致するパラグラフを含む文書を検索する
    検索処理手段と、 この検索処理手段で検索された各文書のキーワードを含
    む各パラグラフを指定するタグの各重みを用いて前記検
    索された各文書の有用性を示すスコアを算出するスコア
    算出手段と、 前記検索された各文書を前記算出された各スコアのスコ
    ア順に出力する検索結果出力手段とを備えたタグ付文書
    検索システム。
  2. 【請求項2】 少なくとも各パラグラフ毎にタグが付さ
    れた複数の文書を記憶するタグ付文書ファイルと、 前記各文書に含まれる各タグ及び該当タグが付されたパ
    ラグラフの文書内位置と、前記各文書に含まれる各文字
    列及び該当文字列が所属するパラグラフとを記憶するタ
    グ付文書データベースと、 前記各タグの重みを記憶するタグ重みテーブルと、 前記文字列を指定するキーワードとタグとからる検索条
    件を入力する検索入力手段と、 前記タグ付文書データベースを調べて、前記入力された
    検索条件に合致するパラグラフを含む文書を検索する検
    索処理手段と、 この検索処理手段で検索された各文書のキーワードを含
    む各パラグラフを指定するタグの各重みを用いて前記検
    索された各文書の有用性を示すスコアを算出するスコア
    算出手段と、 前記検索された各文書を前記算出された各スコアのスコ
    ア順に出力する検索結果出力手段とを備えたタグ付文書
    検索システム。
  3. 【請求項3】 少なくとも各パラグラフ毎にタグが付さ
    れた複数の文書を記憶するタグ付文書ファイルと、 前記各文書に含まれる各タグ及び該当タグが付されたパ
    ラグラフの文書内位置と、前記各文書に含まれる各文字
    列、該当文字列が所属するパラグラフ及び該当パラグラ
    フに含まれる文字列数とを記憶するタグ付文書データベ
    ースと、 前記文字列を指定するキーワードとタグと該当タグの重
    みをと入力する検索入力手段と、 この検索入力手段で入力されたキーワードとタグとを検
    索条件として前記タグ付文書データベースを調べて、該
    当検索条件に合致するパラグラフを含む文書を検索する
    検索処理手段と、 この検索処理手段で検索された各文書のキーワードを含
    む各パラグラフを指定するタグの各重みと各パラグラフ
    に含まれるキーワードの各文字列数とを用いて前記検索
    された各文書の有用性を示すスコアを算出するスコア算
    出手段と、 前記検索された各文書を前記算出された各スコアのスコ
    ア順に出力する検索結果出力手段とを備えたタグ付文書
    検索システム。
  4. 【請求項4】 少なくとも各パラグラフ毎にタグが付さ
    れた複数の文書を記憶するタグ付文書ファイルと、 前記各文書に含まれる各タグ及び該当タグが付されたパ
    ラグラフの文書内位置と、前記各文書に含まれる各文字
    列及び該当文字列が所属するパラグラフとを記憶するタ
    グ付文書データベースと、 前記文字列を指定するキーワードと該当キーワードの重
    みとタグと該当タグの重みとを入力する検索入力手段
    と、 この検索入力手段で入力されたキーワードとタグとを検
    索条件として前記タグ付文書データベースを調べて、該
    当検索条件に合致するパラグラフを含む文書を検索する
    検索処理手段と、 この検索処理手段で検索された各文書のキーワードを含
    む各パラグラフを指定するタグの各重みと該当キーワー
    ドの重みとを用いて前記検索された各文書の有用性を示
    すスコアを算出するスコア算出手段と、 前記検索された各文書を前記算出された各スコアのスコ
    ア順に出力する検索結果出力手段とを備えたタグ付文書
    検索システム。
  5. 【請求項5】 少なくとも各パラグラフ毎にタグが付さ
    れた複数の文書を記憶するタグ付文書ファイルと、 前記各文書に含まれる各タグ及び該当タグが付されたパ
    ラグラフの文書内位置と、前記各文書に含まれる各文字
    列、該当文字列が所属するパラグラフ及び該当パラグラ
    フに含まれる文字列数とを記憶するタグ付文書データベ
    ースと、 前記文字列を指定するキーワードと該当キーワードの重
    みとタグと該当タグの重みとを入力する検索入力手段
    と、 この検索入力手段で入力されたキーワードとタグとを検
    索条件として前記タグ付文書データベースを調べて、該
    当検索条件に合致するパラグラフを含む文書を検索する
    検索処理手段と、 この検索処理手段で検索された各文書のキーワードを含
    む各パラグラフを指定するタグの各重みと、各パラグラ
    フに含まれるキーワードの各文字列数と、該当キーワー
    ドの重みとを用いて前記検索された各文書の有用性を示
    すスコアを算出するスコア算出手段と、 前記検索された各文書を前記算出された各スコアのスコ
    ア順に出力する検索結果出力手段とを備えたタグ付文書
    検索システム。
  6. 【請求項6】 少なくとも各パラグラフ毎にタグが付さ
    れた複数の文書を記憶するタグ付文書ファイルと、 前記各文書に含まれる各タグ及び該当タグが付されたパ
    ラグラフの文書内位置と、前記各文書に含まれる各文字
    列、該当文字列が所属するパラグラフ及び該当パラグラ
    フに含まれる文字列数とを記憶するタグ付文書データベ
    ースと、 前記文字列を指定するキーワードと該当キーワードの重
    みとタグとを入力する検索入力手段と、 この検索入力手段で入力されたキーワードとタグとを検
    索条件として前記タグ付文書データベースを調べて、該
    当検索条件に合致するパラグラフを含む文書を検索する
    検索処理手段と、 この検索処理手段で検索された各文書のキーワードを含
    む各パラグラフに含まれるキーワードの各文字列数と該
    当キーワードの重みとを用いて前記検索された各文書の
    有用性を示すスコアを算出するスコア算出手段と、 前記検索された各文書を前記算出された各スコアのスコ
    ア順に出力する検索結果出力手段とを備えたタグ付文書
    検索システム。
  7. 【請求項7】 前記各タグ毎に各文字列に対する類語文
    字列を記憶する複数のタグ単位類語辞書を設け、 前記検索処理手段は、前記検索入力手段で入力されたキ
    ーワードとタグと該当タグに対応するタグ単位類語辞書
    に記憶された前記キーワードに対する類語とを検索条件
    とすることを特徴とする請求項1ないし6のいずれか1
    項記載のタグ付文書検索システム。
JP24288997A 1997-09-08 1997-09-08 タグ付文書検索システム Expired - Fee Related JP4024906B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP24288997A JP4024906B2 (ja) 1997-09-08 1997-09-08 タグ付文書検索システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP24288997A JP4024906B2 (ja) 1997-09-08 1997-09-08 タグ付文書検索システム

Publications (2)

Publication Number Publication Date
JPH1185765A true JPH1185765A (ja) 1999-03-30
JP4024906B2 JP4024906B2 (ja) 2007-12-19

Family

ID=17095744

Family Applications (1)

Application Number Title Priority Date Filing Date
JP24288997A Expired - Fee Related JP4024906B2 (ja) 1997-09-08 1997-09-08 タグ付文書検索システム

Country Status (1)

Country Link
JP (1) JP4024906B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010009577A (ja) * 2008-05-28 2010-01-14 Ricoh Co Ltd 情報処理装置、全文検索方法、全文検索プログラム、及び記録媒体
JP2012027841A (ja) * 2010-07-27 2012-02-09 Ricoh Co Ltd 検索プログラム、検索装置、検索システム、検索方法及び記録媒体
JP2017068720A (ja) * 2015-09-30 2017-04-06 大日本印刷株式会社 情報提供装置及びプログラム

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102622358A (zh) * 2011-01-27 2012-08-01 天脉聚源(北京)传媒科技有限公司 一种搜索信息的方法和系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04281565A (ja) * 1991-03-08 1992-10-07 Toshiba Corp 文書検索装置
JPH0628403A (ja) * 1992-07-09 1994-02-04 Mitsubishi Electric Corp 文書検索装置
JPH07225772A (ja) * 1993-12-14 1995-08-22 Toshiba Corp 類似情報検索装置とその方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04281565A (ja) * 1991-03-08 1992-10-07 Toshiba Corp 文書検索装置
JPH0628403A (ja) * 1992-07-09 1994-02-04 Mitsubishi Electric Corp 文書検索装置
JPH07225772A (ja) * 1993-12-14 1995-08-22 Toshiba Corp 類似情報検索装置とその方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010009577A (ja) * 2008-05-28 2010-01-14 Ricoh Co Ltd 情報処理装置、全文検索方法、全文検索プログラム、及び記録媒体
JP2012027841A (ja) * 2010-07-27 2012-02-09 Ricoh Co Ltd 検索プログラム、検索装置、検索システム、検索方法及び記録媒体
JP2017068720A (ja) * 2015-09-30 2017-04-06 大日本印刷株式会社 情報提供装置及びプログラム

Also Published As

Publication number Publication date
JP4024906B2 (ja) 2007-12-19

Similar Documents

Publication Publication Date Title
JP2742115B2 (ja) 類似文書検索装置
US8099416B2 (en) Generalized language independent index storage system and searching method
JPH09179872A (ja) 有限状態トランスデューサを用いてデータベースのインデックス付けを行う方法及び装置
JP2000200281A (ja) 情報検索装置および情報検索方法ならびに情報検索プログラムを記録した記録媒体
JPH0628403A (ja) 文書検索装置
JPH0484271A (ja) 文書内情報検索装置
JPH09198395A (ja) 文書検索装置
JPH0773197A (ja) 異表記語辞書作成支援装置
JP4024906B2 (ja) タグ付文書検索システム
JPH10312395A (ja) 全文検索システム及び全文検索方法並びに全文検索プログラムを記録した記録媒体
JPS60176169A (ja) 文章処理装置
JPH05250416A (ja) データベースの登録・検索装置
JPH0991297A (ja) 文字列検索方法及び装置
JPH10124524A (ja) 文書検索装置及び文書検索方法
JP4384736B2 (ja) 画像検索装置およびその装置の各手段としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP3187671B2 (ja) 電子辞書表示装置
JP2000076254A (ja) キーワード抽出装置、このキーワード抽出装置を用いた類似文献検索装置、キーワード抽出方法及び記録媒体
JPH03194653A (ja) 情報検索システムにおける略語検索法
JPH08249341A (ja) 文書データベースの文書格納・検索装置
JPH07296005A (ja) 日本語テキスト登録・検索装置
JPH0944521A (ja) インデックス作成装置および文書検索装置
JPH01214963A (ja) 辞書引き装置
JP2001092831A (ja) 文書検索装置及び文書検索方法
JPH0991304A (ja) 情報検索方法、情報検索システム及び情報検索用記憶媒体
JP3431618B2 (ja) データ検索装置および検索方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040906

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070626

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070823

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20071002

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20071004

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101012

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111012

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111012

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121012

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121012

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131012

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees