JPH081642B2 - キーワード検索方式 - Google Patents
キーワード検索方式Info
- Publication number
- JPH081642B2 JPH081642B2 JP3008718A JP871891A JPH081642B2 JP H081642 B2 JPH081642 B2 JP H081642B2 JP 3008718 A JP3008718 A JP 3008718A JP 871891 A JP871891 A JP 871891A JP H081642 B2 JPH081642 B2 JP H081642B2
- Authority
- JP
- Japan
- Prior art keywords
- keyword
- data
- storage means
- search
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
【0001】
【産業上の利用分野】本発明は、文字情報を含むデータ
ファイルをキーワードで検索するキーワード検索方式に
関する。
ファイルをキーワードで検索するキーワード検索方式に
関する。
【0002】
【従来の技術】図4は、キーワード検索システムの構成
例を示すブロック図である。図において、キーワード検
索システムは、主処理装置41に、入力装置42、出力
装置43および記憶装置44が接続される構成である。
記憶装置44には、データファイル,キーワードファイ
ルその他が記憶され、主処理装置41のもとで各ファイ
ルに対して所定のデータ登録処理およびキーワード登録
処理が実行され、さらにそれらを用いたキーワード検索
処理が行われる。
例を示すブロック図である。図において、キーワード検
索システムは、主処理装置41に、入力装置42、出力
装置43および記憶装置44が接続される構成である。
記憶装置44には、データファイル,キーワードファイ
ルその他が記憶され、主処理装置41のもとで各ファイ
ルに対して所定のデータ登録処理およびキーワード登録
処理が実行され、さらにそれらを用いたキーワード検索
処理が行われる。
【0003】データ登録処理は、図5に示すように、入
力装置42から入力されるデータレコードを記憶装置4
4のデータファイルに登録するものであり、表1に示す
形式のデータファイルが形成される。 また、キーワード登録処理は、図6に示すように、入
力装置42から入力されるキーワードとそのキーワード
に関するデータレコードの管理番号(本明細書ではそれ
らを含めてキーワード情報という。)を記憶装置44の
キーワードファイルに登録するものであり、表2に示す
形式のキーワードファイルが形成される。
力装置42から入力されるデータレコードを記憶装置4
4のデータファイルに登録するものであり、表1に示す
形式のデータファイルが形成される。 また、キーワード登録処理は、図6に示すように、入
力装置42から入力されるキーワードとそのキーワード
に関するデータレコードの管理番号(本明細書ではそれ
らを含めてキーワード情報という。)を記憶装置44の
キーワードファイルに登録するものであり、表2に示す
形式のキーワードファイルが形成される。
【0004】 以下、図7を参照して従来のキーワード検索処理手順に
ついて説明する。
ついて説明する。
【0005】データファイルをキーワードで検索する場
合には、入力装置42からキーワードを入力し、まずキ
ーワードファイル(表2)からキーワードについての検
索を行う。ここで、キーワードに該当するデータがあれ
ばそのデータレコードの管理番号に基づいて、該当する
すべてのデータレコードをデータファイルから読み込
み、出力装置43にそのデータレコードを出力する。た
とえば、キーワードとして「インタフェース」が入力さ
れた場合には、キーワードファイル(表2)から該当デ
ータレコードの管理番号が「001」であるので、デー
タファイル(表1)から対応する「マンマシンインタフ
ェースについての・・・」が読み込まれ、出力される。
合には、入力装置42からキーワードを入力し、まずキ
ーワードファイル(表2)からキーワードについての検
索を行う。ここで、キーワードに該当するデータがあれ
ばそのデータレコードの管理番号に基づいて、該当する
すべてのデータレコードをデータファイルから読み込
み、出力装置43にそのデータレコードを出力する。た
とえば、キーワードとして「インタフェース」が入力さ
れた場合には、キーワードファイル(表2)から該当デ
ータレコードの管理番号が「001」であるので、デー
タファイル(表1)から対応する「マンマシンインタフ
ェースについての・・・」が読み込まれ、出力される。
【0006】
【発明が解決しようとする課題】このように従来のキー
ワード検索方式では、キーワードファイルに登録されて
いるキーワード情報(キーワードおよび対応するデータ
レコードの管理番号)についてのみ、図7に示すフロー
チャートに従ってデータ抽出が可能であった。すなわ
ち、キーワードでの検索はそのキーワードおよび管理番
号がキーワードファイルに登録されていることが前提で
あり、仮に未登録であればそのキーワードを有するデー
タレコードがシステム内に登録されていても、抽出する
ことはできなかった。また、キーワードの登録者が設定
したキーワード以外での検索は不可能であった。
ワード検索方式では、キーワードファイルに登録されて
いるキーワード情報(キーワードおよび対応するデータ
レコードの管理番号)についてのみ、図7に示すフロー
チャートに従ってデータ抽出が可能であった。すなわ
ち、キーワードでの検索はそのキーワードおよび管理番
号がキーワードファイルに登録されていることが前提で
あり、仮に未登録であればそのキーワードを有するデー
タレコードがシステム内に登録されていても、抽出する
ことはできなかった。また、キーワードの登録者が設定
したキーワード以外での検索は不可能であった。
【0007】本発明は、キーワード検索システムを利用
する一般のユーザのアクセスに応じて、未登録のキーワ
ード情報を自動的に追加することができるキーワード検
索方式を提供することを目的とする。
する一般のユーザのアクセスに応じて、未登録のキーワ
ード情報を自動的に追加することができるキーワード検
索方式を提供することを目的とする。
【0008】
【課題を解決するための手段】図1は、本発明の原理構
成を示すブロック図である。図において、請求項1に記
載の発明は、キーワードと該キーワードを有するデータ
レコードの管理情報とを対応付けたキーワード情報を記
憶する第1の記憶手段11と、入力されたキーワードを
用いて第1の記憶手段11を検索し、対応するデータレ
コードを抽出するキーワード検索手段13とを備えたキ
ーワード検索システムにおいて、キーワード検索手段1
3における検索処理で入力されたキーワードを有するデ
ータレコードの件数を各入力キーワードごとに記憶する
第2の記憶手段15と、第2の記憶手段15に記憶され
た各キーワード対応のデータレコード件数と所定値とを
比較し、該データレコード件数が所定値以下のキーワー
ドについて、キーワード検索システム内のすべてのデー
タレコード中の文字列を検索し、該キーワードを有する
データレコードの管理情報を該キーワードと対応付けて
第1の記憶手段11に追加記憶するキーワード情報処理
手段17とを備えたことを特徴とする。
成を示すブロック図である。図において、請求項1に記
載の発明は、キーワードと該キーワードを有するデータ
レコードの管理情報とを対応付けたキーワード情報を記
憶する第1の記憶手段11と、入力されたキーワードを
用いて第1の記憶手段11を検索し、対応するデータレ
コードを抽出するキーワード検索手段13とを備えたキ
ーワード検索システムにおいて、キーワード検索手段1
3における検索処理で入力されたキーワードを有するデ
ータレコードの件数を各入力キーワードごとに記憶する
第2の記憶手段15と、第2の記憶手段15に記憶され
た各キーワード対応のデータレコード件数と所定値とを
比較し、該データレコード件数が所定値以下のキーワー
ドについて、キーワード検索システム内のすべてのデー
タレコード中の文字列を検索し、該キーワードを有する
データレコードの管理情報を該キーワードと対応付けて
第1の記憶手段11に追加記憶するキーワード情報処理
手段17とを備えたことを特徴とする。
【0009】請求項2に記載の発明は、請求項1に記載
のキーワード検索方式において、キーワード情報処理手
段17は、第2の記憶手段15に記憶されたキーワード
の記録数を検出し、該記録数が所定値を越えかつ対応す
るデータレコード件数が所定値以下のキーワードについ
て、キーワード情報の追加処理を行う構成であることを
特徴とする。
のキーワード検索方式において、キーワード情報処理手
段17は、第2の記憶手段15に記憶されたキーワード
の記録数を検出し、該記録数が所定値を越えかつ対応す
るデータレコード件数が所定値以下のキーワードについ
て、キーワード情報の追加処理を行う構成であることを
特徴とする。
【0010】
【作用】請求項1に記載の発明では、キーワード検索シ
ステムの利用者が検索のために入力したキーワードにつ
いて、このキーワードと該当するデータレコードの件数
とを第2の記憶手段15に別途記憶しておく。キーワー
ド情報処理手段17は、この第2の記憶手段15に記憶
されている各キーワード対応のデータレコード件数が所
定値以下のものについて、改めてキーワード検索システ
ム内のすべてのデータレコードを検索して対応するキー
ワード情報を追加することにより、利用者の検索状況に
応じてキーワード情報の更新を行うことが可能になる。
ステムの利用者が検索のために入力したキーワードにつ
いて、このキーワードと該当するデータレコードの件数
とを第2の記憶手段15に別途記憶しておく。キーワー
ド情報処理手段17は、この第2の記憶手段15に記憶
されている各キーワード対応のデータレコード件数が所
定値以下のものについて、改めてキーワード検索システ
ム内のすべてのデータレコードを検索して対応するキー
ワード情報を追加することにより、利用者の検索状況に
応じてキーワード情報の更新を行うことが可能になる。
【0011】なお、データレコード件数が0のものにつ
いては第1の記憶手段11に未登録のキーワードであ
り、新たなキーワードの追加についても自動的に対応す
ることができる。請求項2に記載の発明では、第2の記
憶手段15に記憶される各キーワードの記録数をキーワ
ード情報の追加処理の基準に加えることにより、そのキ
ーワードに対する利用者のアクセス頻度を加味すること
ができる。すなわち、アクセス頻度の低いキーワード
(例えば誤ったキーワード)について不用意にキーワー
ド情報の追加が行われることがなく、キーワード情報の
追加によるキーワード検索の利用価値の増大と、キーワ
ード検索のスループット低下のトレードオフを調整する
ことができる。
いては第1の記憶手段11に未登録のキーワードであ
り、新たなキーワードの追加についても自動的に対応す
ることができる。請求項2に記載の発明では、第2の記
憶手段15に記憶される各キーワードの記録数をキーワ
ード情報の追加処理の基準に加えることにより、そのキ
ーワードに対する利用者のアクセス頻度を加味すること
ができる。すなわち、アクセス頻度の低いキーワード
(例えば誤ったキーワード)について不用意にキーワー
ド情報の追加が行われることがなく、キーワード情報の
追加によるキーワード検索の利用価値の増大と、キーワ
ード検索のスループット低下のトレードオフを調整する
ことができる。
【0012】
【実施例】図2は、本発明によるキーワード検索処理手
順の一例を示すフローチャートである。図2および図4
において、データファイルをキーワードで検索する場合
には入力装置42からキーワードを入力し、まずキーワ
ードファイル(表2)からキーワードについての検索を
行う。ここで、ログファイル(第2の記憶手段15)に
そのキーワードおよび表2に記憶されている該当するデ
ータレコード件数を登録(ロギング)する。なお、ログ
ファイルの一例について表3に示す。
順の一例を示すフローチャートである。図2および図4
において、データファイルをキーワードで検索する場合
には入力装置42からキーワードを入力し、まずキーワ
ードファイル(表2)からキーワードについての検索を
行う。ここで、ログファイル(第2の記憶手段15)に
そのキーワードおよび表2に記憶されている該当するデ
ータレコード件数を登録(ロギング)する。なお、ログ
ファイルの一例について表3に示す。
【0013】 以下同様に、キーワードに該当するデータがあればそ
のデータレコードの管理番号に基づいて、該当するすべ
てのデータレコードをデータファイルから読み込み、出
力装置43から出力する。なお、データファイル,キー
ワードファイルおよびログファイルは記憶装置44に設
けられる。
のデータレコードの管理番号に基づいて、該当するすべ
てのデータレコードをデータファイルから読み込み、出
力装置43から出力する。なお、データファイル,キー
ワードファイルおよびログファイルは記憶装置44に設
けられる。
【0014】図3は、本発明によるキーワード情報の追
加登録処理手順の一例を示すフローチャートである。図
3および図4において、ログファイルからキーワードお
よび該当するデータレコード件数を読み込み、その件数
が所定値以下となった場合にデータファイルの最初から
検索するようにポインタを先頭に設定する。そこで、デ
ータファイルの最初のデータレコードについて、そのキ
ーワード文字列がそのデータレコード中にあるか否かを
検索し、あればキーワードファイルにそのキーワード情
報(キーワードおよびデータレコードの管理番号)を追
加登録する。以下、データファイルの各データレコード
について順次同様の処理を繰り返す。
加登録処理手順の一例を示すフローチャートである。図
3および図4において、ログファイルからキーワードお
よび該当するデータレコード件数を読み込み、その件数
が所定値以下となった場合にデータファイルの最初から
検索するようにポインタを先頭に設定する。そこで、デ
ータファイルの最初のデータレコードについて、そのキ
ーワード文字列がそのデータレコード中にあるか否かを
検索し、あればキーワードファイルにそのキーワード情
報(キーワードおよびデータレコードの管理番号)を追
加登録する。以下、データファイルの各データレコード
について順次同様の処理を繰り返す。
【0015】ここで、最初にログファイルから読み込ん
だキーワードに対して全データレコードについての処理
が終了したとき、あるいはそのキーワードに該当するデ
ータレコード件数が所定値を越えていたときには、ログ
ファイルから次のキーワードを読み込んで同様の処理を
繰り返し、ログファイル内のすべてのキーワードについ
ての処理が終了した時点でログファイルを初期化し、一
連のキーワード情報の追加処理を終了する。
だキーワードに対して全データレコードについての処理
が終了したとき、あるいはそのキーワードに該当するデ
ータレコード件数が所定値を越えていたときには、ログ
ファイルから次のキーワードを読み込んで同様の処理を
繰り返し、ログファイル内のすべてのキーワードについ
ての処理が終了した時点でログファイルを初期化し、一
連のキーワード情報の追加処理を終了する。
【0016】また、ログファイルからキーワードおよび
該当するデータレコード件数を読み込みその件数と所定
値とを比較する処理において、さらにログファイル内に
そのキーワードの記録数を調べ、その記録数が所定値を
越えたものについては利用者のアクセス回数が多かった
ものとして、図3に示すそれ以下のキーワード情報の追
加処理を行うことにより、無駄なキーワードの追加を回
避することができる。
該当するデータレコード件数を読み込みその件数と所定
値とを比較する処理において、さらにログファイル内に
そのキーワードの記録数を調べ、その記録数が所定値を
越えたものについては利用者のアクセス回数が多かった
ものとして、図3に示すそれ以下のキーワード情報の追
加処理を行うことにより、無駄なキーワードの追加を回
避することができる。
【0017】
【発明の効果】以上説明したように本発明は、キーワー
ド検索システムの利用者の検索状況に応じて、必要なキ
ーワード情報を自動的に追加することができるので、キ
ーワード検索をさらに効率よく実行できるシステムを構
築することができる。
ド検索システムの利用者の検索状況に応じて、必要なキ
ーワード情報を自動的に追加することができるので、キ
ーワード検索をさらに効率よく実行できるシステムを構
築することができる。
【図1】本発明の原理構成を示すブロック図である。
【図2】本発明によるキーワード検索処理手順の一例を
示すフローチャートである。
示すフローチャートである。
【図3】本発明によるキーワード情報の追加登録処理手
順の一例を示すフローチャートである。
順の一例を示すフローチャートである。
【図4】キーワード検索システムの構成例を示すブロッ
ク図である。
ク図である。
【図5】データ登録処理手順を示すフローチャートであ
る。
る。
【図6】キーワード情報の登録処理手順を示すフローチ
ャートである。
ャートである。
【図7】従来のキーワード検索処理手順を示すフローチ
ャートである。
ャートである。
11 第1の記憶手段 13 キーワード検索手段 15 第2の記憶手段 17 キーワード情報処理手段 41 主処理装置 42 入力装置 43 出力装置 44 記憶装置
Claims (2)
- 【請求項1】 キーワードと該キーワードを有するデー
タレコードの管理情報とを対応付けたキーワード情報を
記憶する第1の記憶手段(11)と、入力されたキーワ
ードを用いて前記第1の記憶手段(11)を検索し、対
応するデータレコードを抽出するキーワード検索手段
(13)とを備えたキーワード検索システムにおいて、
前記キーワード検索手段(13)における検索処理で入
力されたキーワードを有するデータレコードの件数を各
入力キーワードごとに記憶する第2の記憶手段(15)
と、前記第2の記憶手段(15)に記憶された各キーワ
ード対応のデータレコード件数と所定値とを比較し、該
データレコード件数が所定値以下のキーワードについ
て、キーワード検索システム内のすべてのデータレコー
ド中の文字列を検索し、該キーワードを有するデータレ
コードの管理情報を該キーワードと対応付けて前記第1
の記憶手段(11)に追加記憶するキーワード情報処理
手段(17)とを備えたことを特徴とするキーワード検
索方式。 - 【請求項2】 請求項1に記載のキーワード検索方式に
おいて、キーワード情報処理手段(17)は、第2の記
憶手段(15)に記憶されたキーワードの記録数を検出
し、該記録数が所定値を越えかつ対応するデータレコー
ド件数が所定値以下のキーワードについて、キーワード
情報の追加処理を行う構成であることを特徴とするキー
ワード検索方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3008718A JPH081642B2 (ja) | 1991-01-28 | 1991-01-28 | キーワード検索方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3008718A JPH081642B2 (ja) | 1991-01-28 | 1991-01-28 | キーワード検索方式 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH04340163A JPH04340163A (ja) | 1992-11-26 |
JPH081642B2 true JPH081642B2 (ja) | 1996-01-10 |
Family
ID=11700726
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP3008718A Expired - Lifetime JPH081642B2 (ja) | 1991-01-28 | 1991-01-28 | キーワード検索方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH081642B2 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06325102A (ja) * | 1993-05-17 | 1994-11-25 | Nec Corp | データベース検索方式 |
JP3588681B2 (ja) * | 1995-03-15 | 2004-11-17 | 富士通株式会社 | ファイル管理装置及び方法及び計算機システム |
JPH09237281A (ja) * | 1996-03-01 | 1997-09-09 | Omron Corp | テキストデータ検索装置およびテキストデータ検索方法 |
JP3707506B2 (ja) * | 1996-06-18 | 2005-10-19 | 富士ゼロックス株式会社 | 文書検索装置及び文書検索方法 |
JP3333186B2 (ja) * | 2001-09-12 | 2002-10-07 | 松下電器産業株式会社 | 文書検索システム |
US7424421B2 (en) * | 2004-03-03 | 2008-09-09 | Microsoft Corporation | Word collection method and system for use in word-breaking |
-
1991
- 1991-01-28 JP JP3008718A patent/JPH081642B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPH04340163A (ja) | 1992-11-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1585073B1 (en) | Method for duplicate detection and suppression | |
US6122644A (en) | System for halloween protection in a database system | |
US20060031211A1 (en) | Information processing apparatus, document search method, program, and storage medium | |
WO2004057494A1 (en) | Building one or more indexes on data concurrent with manipulation of data | |
JP2002207760A (ja) | 文書検索方法及びその実施装置並びにその処理プログラムを記録した記録媒体 | |
JPH081642B2 (ja) | キーワード検索方式 | |
US7039646B2 (en) | Method and system for compressing varying-length columns during index high key generation | |
JP2535629B2 (ja) | 検索システムの入力文字列正規化方式 | |
JP2886308B2 (ja) | データ登録装置及び方法とデータ検索装置及び方法 | |
JPH05250414A (ja) | キーワード検索方式 | |
JPH05204978A (ja) | 情報検索装置 | |
JP3498926B2 (ja) | 文書データベース管理システム | |
JP2502262B2 (ja) | ネットワ―クデ―タベ―スアクセス方法 | |
JP2001134598A (ja) | T木インデックス構築方法及びt木インデックス検索方法及びt木インデックス構築装置及びt木インデックス検索装置及びt木インデックス構築プログラムを格納した記憶媒体及びt木インデックス検索プログラムを格納した記憶媒体 | |
JPH052512A (ja) | 空き領域検索方式 | |
JPH11338864A (ja) | 学習機能付き検索装置 | |
JPH0225974A (ja) | データベース更新検索方式 | |
JPH1173353A (ja) | 時刻指定によるトランザクション検索処理装置 | |
JPH10320402A (ja) | 検索式作成方法、検索式作成装置、及び記録媒体 | |
JPH10240744A (ja) | レンジ分割表の検索処理方式、検索処理方法および検索 処理プログラムを記録した記録媒体 | |
JP3441703B2 (ja) | 文書検索装置及び文書検索方法 | |
JPH0287275A (ja) | あいまい値データ検索処理方式 | |
JPH05165891A (ja) | データベースのデータ登録・検索方式 | |
JPH0764835A (ja) | リレーショナルデータベースのデータ格納方式 | |
JP2000315211A (ja) | 文書管理システムおよび文書管理方法 |