JP3036246B2 - 情報検索装置 - Google Patents

情報検索装置

Info

Publication number
JP3036246B2
JP3036246B2 JP4204812A JP20481292A JP3036246B2 JP 3036246 B2 JP3036246 B2 JP 3036246B2 JP 4204812 A JP4204812 A JP 4204812A JP 20481292 A JP20481292 A JP 20481292A JP 3036246 B2 JP3036246 B2 JP 3036246B2
Authority
JP
Japan
Prior art keywords
character
search
character pattern
code
record
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP4204812A
Other languages
English (en)
Other versions
JPH0652226A (ja
Inventor
伸一 伊藤
忠一 菊池
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP4204812A priority Critical patent/JP3036246B2/ja
Publication of JPH0652226A publication Critical patent/JPH0652226A/ja
Application granted granted Critical
Publication of JP3036246B2 publication Critical patent/JP3036246B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は情報検索装置に係わり、
特に、キーワードで指定された文字列等のデータがデー
タベースに存在するか否かを検索するに好適な情報検索
装置に関する。
【0002】
【従来の技術】従来、情報処理システム等においては、
キーワードで指定された文字列等のデータに従ってデー
タベースを検索する情報検索装置が用いられている。従
来のこの種の情報検索装置は、文書等のデータベースに
対して、任意の文字等あるいは文字列等を検索する手段
として、予め文書等から文字あるいは文字連鎖を抽出
し、抽出した文字あるいは文字連鎖をその文字位置と対
にして記憶し、検索の際には検索入力に該当する文字あ
るいは文字連鎖に対応する文字位置を検索結果として得
られるように構成されている。例えば、特開昭64−3
5627号公報では、検索対象となるレコード中のテキ
ストデータから複数の文字からなるデータ列を文字連鎖
として抽出し、さらにデータ連鎖の位置をデータ連鎖イ
ンデックスとして記憶しておき、データ連鎖インデック
スの連続性を検索することで、テキストデータ全ての検
索を行わずに、短時間でキーワード検索ができる方式を
開示している。
【0003】
【発明が解決しようとする課題】しかし、従来技術で
は、テキストデータの全てのデータを検索しなくても短
時間でキーワード検索ができるが、検索対象が大規模な
データベースの場合、文字連鎖あるいは文字毎のデータ
ベース中の出現頻度が高くなり、データ連鎖インデック
スが巨大になるため、データ連鎖インデックスを計算機
の実メモリ上ではなく、外部記憶装置に格納しておくこ
とが余儀無くされている。しかも、この場合データ連鎖
インデックスの連続性を検索する際には、文字あるいは
文字連鎖に対応した大量のデータを外部記憶装置から読
み取る必要があり、検索速度が低下するという問題があ
る。また、英語等の欧文文字のように、文字種の少ない
言語を検索対象とした場合、検索対象が比較的大きなデ
ータベースでなくても、文字連鎖あるいは文字毎のデー
タベース中の出現頻度が高くなるため、同様に検索速度
が低下するという問題がある。
【0004】本発明は、上記従来の課題を解決するため
になされたものであり、大容量のデータベースに対して
も情報の検索を高速度に行うことができる情報検索装置
を提供することを目的としたものである。
【0005】
【課題を解決するための手段】前記目的を達成するため
に、本発明は、データベースに格納された検索対象レコ
ード群の中の特定の検索対象レコードを指定する検索対
象指定手段と、検索対象指定手段の指定による検索対象
レコードをデータベースから取り込む検索対象取り込み
手段と、検索対象指定手段の指定による検索対象レコー
ドに対してレコード番号を付与するレコード番号付与手
段と、検索対象取り込み手段により取り込まれた検索対
象レコードから文字パターンを作成する第1文字パター
ン作成手段と、キーワードで指定された文字列から文字
パターンを作成する第2文字パターン作成手段と、第1
文字パターン作成手段の作成による文字パターンの文字
毎に検索対象レコードの先頭文字からの出現順位を示す
文字識別コードを付与する文字識別コード付与手段と、
文字識別コードの付与された文字パターンとレコード番
号の付与された検索対象レコードとから検索コードを作
成する検索コード作成手段と、検索コード作成手段の作
成による検索コードを文字パターン毎の領域に、文字パ
ターンの先頭文字の文字識別コードの昇順に記憶する検
索コード記憶手段と、第2文字パターン作成手段の作成
による文字パターンに従って検索コード記憶手段の記憶
内容を検索して文字パターンの各文字に該当する検索コ
ードを抽出する検索コード抽出手段と、検索コード抽出
手段により連続して抽出された複数の検索コードに相互
に関連のある情報が含まれているか否かを照合する連続
性照合手段と、連続性照合手段の照合結果を出力する照
合結果出力手段とを備えている情報検索装置を構成した
ものである。
【0006】また、本発明は、データベースに格納され
た検索対象レコード群の中の特定の検索対象レコードを
指定する検索対象指定手段と、検索対象指定手段の指定
による検索対象レコードをデータベースから取り込む
索対象取り込み手段と、検索対象指定手段の指定による
検索対象レコードに対してレコード番号を付与するレコ
ード番号付与手段と、検索対象取り込み手段により取り
込まれた検索対象レコードの先頭から1文字づつ取り出
し、その文字と次に続く複数の文字とで構成する文字パ
ターンを作成する第1文字パターン作成手段と、キーワ
ードで指定された文字列から文字パターンを作成する第
2文字パターン作成手段と、第1文字パターン作成手段
の作成による文字パターンの文字毎に検索対象レコード
の先頭文字からの出現順位を示す文字識別コードを付与
する文字識別コード付与手段と、文字識別コードの付与
された文字パターンとレコード番号の付与された検索対
象レコードとから検索コードを作成する検索コード作成
手段と、検索コード作成手段の作成による検索コードを
文字パターン毎の領域に、文字パターンの先頭文字の文
字識別コードの昇順に記憶する検索コード記憶手段と、
第2文字パターン作成手段の作成による文字パターンに
従って検索コード記憶手段の記憶内容を検索してキーワ
ードを構成する文字列の連続する2つの文字パターン
対応した検索コードのうち共通する文字の文字識別コー
ドの等しい検索コードのみを抽出する検索コード抽出手
段と、検索コード抽出手段により抽出された各検索コー
ドの内容が共通文字を基準に連続性を有するか否かを照
合してキーワードで指定された文字列のデータがレコー
ド中に存在するか否かの検索結果を出力する連続性照合
手段と、連続性照合手段の照合による検索結果を表示す
る検索結果表示手段とを備えている情報検索装置を構成
したものである。
【0007】さらに、本発明は、データベースに格納さ
れた検索対象レコード群の中の特定の検索対象レコード
を指定する検索対象指定手段と、検索対象指定手段の指
定による検索対象レコードをデータベースから取り込む
検索対象取り込み手段と、検索対象指定手段の指定によ
る検索対象レコードに対してレコード番号を付与するレ
コード番号付与手段と、検索対象取り込み手段により取
り込まれた検索対象レコードから文字パターンを作成す
る第1文字パターン作成手段と、キーワードで指定され
た文字列から文字パターンを作成する第2文字パターン
作成手段と、第1文字パターン作成手段の作成による文
字パターンの文字毎に検索対象レコードの先頭文字から
の出現順位を示す文字識別コードを付与する文字識別コ
ード付与手段と、文字識別コードの付与された文字パタ
ーンとレコード番号の付与された検索対象レコードとか
ら検索コードを作成する検索コード作成手段と、検索コ
ード作成手段の作成による検索コードを文字パターン毎
に指定の領域に記憶する検索コード記憶手段と、第2文
字パターン作成手段の作成による文字パターンに従って
検索コード記憶手段の記憶内容を検索して文字パターン
の各文字に該当する検索コードを抽出する検索コード抽
出手段と、検索コード抽出手段により連続して抽出され
た複数の検索コードに相互に関連のある情報が含まれて
いるか否かを照合する連続性照合手段と、連続性照合手
段の照合結果を出力する照合結果出力手段とを備えてい
る情報検索装置を構成したものである。
【0008】さらに、本発明は、データベースに格納さ
れた検索対象レコード群の中の特定の検索対象レコード
を指定する検索対象指定手段と、検索対象指定手段の指
定による検索対象取り込み手段により取り込まれた検索
対象レコードの先頭から1文字づつ取り出し、その文字
と次に続く複数の文字とで構成する文字パターンを作成
する第1文字パターン作成手段と、キーワードで指定さ
れた文字列から文字パターンを作成する第2文字パター
ン作成手段と、第1文字パターン作成手段の作成による
文字パターンの文字毎に検索対象レコードの先頭文字か
らの出現順位を示す文字識別コードを付与する文字識別
コード付与手段と、文字識別コードの付与された文字パ
ターンとレコード番号の付与された検索対象レコードと
から検索コードを作成する検索コード作成手段と、検索
コード作成手段の作成による検索コードを文字パターン
毎に指定の領域に記憶する検索コード記憶手段と、第2
文字パターン作成手段の作成による文字パターンに従っ
て検索コード記憶手段の記憶内容を検索してキーワード
を構成する文字列の連続する2つの文字パターンに対応
した検索コードのうち共通する文字の文字識別コードの
等しい検索コードのみを抽出する検索コード抽出手段
と、検索コード抽出手段により抽出された各検索コード
の内容が共通文字を基準に連続性を有するか否かを照合
してキーワードで指定された文字列のデータがレコード
中に存在するか否かの検索結果を出力する連続性照合手
段と、連続性照合手段の照合による検索結果を表示する
検索結果表示手段とを備えている情報処理装置を構成し
たものである。
【0009】
【作用】上記した手段によれば、検索対象レコードが指
定されると、検索対象レコードの先頭から1文字づつの
データが取り出され、その文字と次に続く複数の文字と
で構成される文字パターンが作成される。このとき文字
パターンを構成する文字それぞれの検索対象レコード中
の先頭からの同一文字種の出現順位がそれぞれの文字毎
の文字識別コードとされ、検索対象レコード毎にレコー
ド番号が付与される。そして文字識別コードとレコード
番号とから文字パターン毎の検索コードが作成される。
そして作成された検索コードが文字パターンの領域毎
に、文字パターンの先頭文字の文字識別コードの昇順に
並べられて検索ファイルが作成され、この検索ファイル
に検索コードのデータが記憶される。
【0010】次に、検索入力としてキーワードが入力さ
れると、このキーワードで指定された文字列に関する文
字パターンが作成される。そしてこの文字パターンに従
って検索ファイルの内容が検索され、検索ファイルから
文字パターンに対応した検索コードが取り出される。こ
のとき取り出した検索コードと隣合う文字パターンにつ
いての検索コードも取り出される。このとき、双方の文
字パターンの共通のする文字コードが等しい検索コード
のみが抽出され、抽出された検索コードの連続性の照合
が行われる。即ち、双方の文字パターンのレコード番号
が等しいか否かの照合が行われ、両者のレコード番号が
等しい場合には、文字パターンが連続しているという文
字の連続性を利用し、双方の文字パターンで構成される
文字列がレコード番号で示されるレコード中に存在する
との照合結果が出力される。
【0011】さらに、キーワードから作成された文字パ
ターン全てについて、相隣合う文字パターンとの文字の
連続性が判定されると、キーワードが文書データベース
の該当レコードに存在するか否かの照合結果が出力され
る。
【0012】
【実施例】以下、本発明の一実施例を図面に従って説明
する。
【0013】図1は、本発明の第1実施例における情報
検索装置のブロック図である。図1において、情報検索
装置は、キーボード1、検索対象指定手段2、検索対象
取り込み手段4、文字パターン作成手段5、文字識別コ
ード付与手段6、レコード番号付与手段7、検索コード
作成手段8、検索ファイル作成手段9、検索ファイル1
0、キーワード取り込み手段11、検索コード抽出手段
12、連続性照合手段13、検索結果表示手段14、デ
ィスプレイ15を備えて構成されている。
【0014】キーボード1は各種の操作ボタン等を備え
ており、オペレータの操作に従った指令が検索対象指令
手段2とキーワード取り込み手段11に入力されるよう
になっている。検索対象指定手段2は、キーボード1か
らの指令によって検索対象レコードに関する情報が入力
されると、データベース3に格納された検索対象レコー
ド群の中の特定の検索対象レコードを指定するようにな
っている。検索対象指定手段2で検索対象レコードが指
定されると、この指定に関する情報が検索対象取り込み
手段4に入力される。検索対象取り込み手段4は検索対
象指定手段2で指定された検索対象レコードをデータベ
ース3から取り込み、取り込んだ検索対象レコードに関
する情報を文字パターン作成手段5へ出力するようにな
っている。この文字パターン作成手段5は入力された検
索対象レコードから文字パターンを作成する第1文字パ
ターン作成手段として構成されている。そしてこの作成
手段5で作成された文字パターンに関するデータは文字
識別コード付与手段6に入力される。文字識別コード付
与手段6は、文字パターン作成手段5で作成された文字
パターンの文字毎に検索対象レコードの先頭文字からの
出現順位を示す文字識別コードを付与するように構成さ
れている。そして、文字識別コードの付与された文字パ
ターンに関するデータが検索コード作成手段8に入力さ
れている。一方、レコード番号付与手段7は、検索対象
指定手段2で指定された検索対象レコードに対してレコ
ード番号を付与するようになっている。そしてレコード
番号の付与された検索対象レコードに関する情報が検索
コード作成手段8に入力されている。検索コード作成手
段8は、文字識別コードの付与された文字パターンとレ
コード番号の付与された検索対象レコードとから検索コ
ードを作成するようになっている。そして作成された検
索コードは検索ファイル作成手段9へ入力されている。
この検索ファイル作成手段9は、入力された検索コード
を文字パターン毎の領域に、文字パターンの先頭文字の
文字識別コードの昇順に並べて検索ファイル10へ転送
するようになっている。そして、検索ファイル10では
指定のファイルに検索コードのデータが記憶されること
になる。即ち、検索ファイル作成手段9と検索ファイル
10は検索コード記憶手段として構成されている。
【0015】またキーワード取り込み手段11は、キー
ボード1からキーワードに関するデータが入力される
と、キーワードで指定された文字列等のデータを文字パ
ターン作成手段5へ出力するようになっている。文字パ
ターン作成手段5はキーワードで指定された文字列等の
データに従って文字パターンを作成する第2文字パター
ン作成手段を構成するようになっている。そしてキーワ
ードに従って作成された文字パターンに関するデータは
検索コード抽出手段12に入力されている。検索コード
抽出手段12は、キーワードから生成された文字パター
ンに従って、検索ファイル10の内容を検索し、文字パ
ターンの各文字に該当する検索コードを抽出し、抽出し
た検索コードを連続性照合手段13へ出力するようにな
っている。この場合検索コード抽出手段12は、両文字
パターンに対応した検索コードのうち共通する文字の文
字識別コードの等しい検索コードのみを抽出するように
なっている。そして連続性照合手段13は、抽出された
検索コードの内容を照合し、各検索コードの内容が共通
文字を基準に連続性を有するか否かを判定するようにな
っている。即ちキーワードで指定された文字列のデータ
がレコード中に存在するか否かの判定を行い、この判定
結果を検索結果として出力するようになっている。検索
結果表示手段11は、連続性照合手段13の照合結果を
映像信号に変換して検索結果をディスプレイ15の画面
上に表示させるようになっている。
【0016】図2,図3は検索対象を日本語文書とし、
文字パターンを2文字単位とした場合の文字種「日」の
検索ファイル10の構成を示すものである。図2と図3
において、検索ファイル10は、JISコード表示に記
載された6879種の文字種毎に作成され、ポインタ部
とサブポインタ部とデータ部から構成されている。デー
タ部には検索コードが格納されるようになっており、検
索コードは文字パターン毎に作成され、先頭文字文字識
別コード、2文字目文字識別コード、レコード番号から
構成されている。先頭文字文字識別コードは、文字パタ
ーンの先頭文字について、文字パターンが存在するレコ
ードの先頭からの文字種毎の出現順位を計数した値であ
る。2文字目文字識別コードは同様に、文字パターンの
2文字目の文字について、文字パターンが存在するレコ
ードの先頭からの文字種毎の出現順位を計数した値であ
る。レコード番号は文字パターンが存在するレコードを
示すものとして、登録順に1から昇順にレコードごとに
付与される値である。
【0017】データ部は、検索コードの作成基である文
字パターン毎の文字パターン区分で構成されている。文
字パターン区分は、文字パターンの2文字目がJISコ
ード表に記載された順序となるように並べておかれる。
例えば(日SP)、(日、)、〜(日本)、〜(日
煕)。文字パターン区分は、さらに、先頭文字の文字識
別コードが等しい検索コードを集めた同一文字識別コー
ドグループで構成されている。この同一文字識別コード
グループは、検索コード中の先頭文字文字識別コードの
昇順に並べておく。例えば、先頭文字文字識別コード=
1、2、3……。同一文字識別コードグループは、さら
に、検索コード欄で構成されている。この検索コード欄
は、検索コード中のレコード番号の昇順に並べて置く。
例えばレコード番号=1、2、3……。
【0018】サブポインタ部は、データ部の同一文字識
別コードグループへのポインタであるサブポインタが格
納される。このサブポインタ部はデータ部と同様に、文
字パターン毎の文字パターングループで構成されてい
る。文字パターングループはデータ部と同様に先頭文字
を「日」とし、先頭文字に続く文字がJISコード表に
記載された順になるように並べておく。文字パターング
ループは、さらに、サブポインタ欄で構成される。この
サブポインタ欄は、サブポインタが文字識別コードグル
ープに対応して格納できるように、先頭文字文字識別コ
ードの昇順に並べておく。
【0019】ポインタ部は文字パターン欄で構成され、
サブポインタ部の文字パターン区分のアドレスを示すポ
インタが格納される。この文字パターン欄はデータ部、
サブポインタ部と同様に先頭文字を「日」とし、先頭文
字に続く文字がJISコード表に記載された順になるよ
うに並べておく。このときサブポインタ部の文字パター
ングループへのポインタが順に格納できるようになって
いる。
【0020】次に、図4と図5とに従って図6の検索対
象例を検索ファイルに作成するまでの動作について説明
する。
【0021】この動作は、検索対象レコードの先頭から
構成文字を1文字づつ取り出し、その文字を含む合計2
文字の連続した文字による文字パターンを作成し、これ
らの文字パターン種毎に文字パターンを構成する文字そ
れぞれのレコードの先頭からの同一文字種の出現順位を
文字識別コードとして、文字識別コードとレコード番号
とから検索コードを作成し、この検索コードを検索ファ
イルへ格納する処理を示している。具体的には以下の処
理が行われる。
【0022】まず、キーボード1から検索対象レコード
を指定するための情報が入力されると、この情報は検索
対象指定手段2を介して検索対象取り込み手段4に入力
される。検索対象取り込み手段4は、キーボード1の操
作によって指定された検索対象レコードをデータベース
3から取り出す(ステップ1〜2)。この検索レコード
のデータが文字パターン作成手段5に入力されると、文
字パターン作成手段5により検索対象レコードの先頭か
ら1文字取り出される(ステップ3〜4)。さらに、取
り出したその文字と次に続く文字、ここでは「日」と
「本」とによる文字列を文字パターンとする(ステップ
5〜6)。作成した文字パターン「日本」は文字識別コ
ード付与手段6により、文字パターンを構成している文
字毎に、検索対象レコードの先頭文字からのそれぞれの
文字種毎の出現順位をカウントし(ステップ7〜8)、
さらに、その出現順位をそれぞれの文字毎の文字識別コ
ードとする(ステップ9〜10)。この場合、文字パタ
ーン「日本」を構成している文字。「日」の文字識別コ
ード=1、「本」の文字識別コード=1となる。このと
きレコード番号付与手段7により検索対象レコードに対
してレコード番号が付与される(ステップ11)。な
お、ここでは、レコード番号は1から昇順に付与され
る。さらに検索コード作成手段8により文字パターンを
構成している2文字の文字識別コードと合わせて検索コ
ードが決定される(ステップ12)。
【0023】次に、作成された文字パターンにおける先
頭文字種「日」の検索ファイル10のデータ部の領域
を、検索コードのサイズ分だけ、例えば、検索コードを
6バイトとした場合、6バイトを新たに追加する(ステ
ップ13)。この後、作成された文字パターンに対応す
るポインタ部の文字パターン欄から、サブポインタ部の
文字パターングループへのポインタを得る(ステップ1
4)。このとき得られたポインタの示す先には、作成さ
れた文字パターンに対応するデータ部の同一文字識別コ
ードグループへのポインタが、先頭文字文字識別コード
の昇順に格納されている。この後、作成された文字パタ
ーンに対応するサブポインタ部の文字パターングループ
から先頭文字文字識別コードと等しいデータ部の同一文
字識別コードグループへのポインタを得る(ステップ1
5)。またこの先頭文字文字識別コードに1加算した値
と等しい文字識別コードグループへのポインタを得る
(ステップ16)。さらに、文字パターン「日煕」の文
字パターン区分の最終の1つ前の検索コード欄の検索コ
ードを最終の検索コード欄に格納する。ステップ16で
得られたポインタが示す検索コード欄迄検索コードを1
つづつ移動する(ステップ17〜20)。さらに、作成
された検索コードをステップ16で得たポインタの示す
先に格納する(ステップ21)。ステップ21で作成さ
れた検索コードは、先頭文字識別コードと等しい同一文
字文字識別コードグループを構成する検索コード欄の最
終欄に格納される。さらに、ステップ16で得られたポ
インタの示す先から格納されているサブポインタ部の同
一文字識別コードグループへのポインタを全て更新し、
編集されたデータ部とサブポインタ部の整合をとる(ス
テップ22〜25)。検索対象レコードから作成した文
字パターンの全てについて、ステップ3〜25の処理を
行うと(ステップ26)、データ部には、文字パターン
毎の検索コードが先頭文字文字識別コードの昇順に並べ
られる。また登録される検索対象レコードは1から順番
にレコード番号が付与されるので、同じ文字パターンで
検索コード中の先頭文字文字識別コードが同じものが、
同一文字識別コードグループにレコード番号の昇順に格
納される。
【0024】検索ファイルを作成する動作が終了する
と、検索対象レコードの内容「日本の国語で、古来日本
民族が用いてきた言語。……として扱われる。」につい
ての検索コード全て得られ、これらのデータが検索ファ
イル10に格納される。この検索対象レコードの場合、
文字パターン「日本」はレコード中の2ヶ所に存在し、
先頭から1文字目の「日」と2文字目の「本」による文
字パターン「日本」の検索レコードは、レコード番号を
1とすれば、 「日」の文字識別コード=1 「本」の文字識別コード=1 レコード番号 =1 となり、先頭から10文字目の「日」と11文字目の
「本」による文字パターン「日本」の検索レコードは、 「日」の文字識別コード=2 「本」の文字識別コード=2 レコード番号 =1 となる。
【0025】即ち、出現順位が1番目のものには「1」
の文字識別コードが付され、出現順位が2番目のものに
は「2」の文字識別コードが付与される。
【0026】次に、検索動作について、検索入力文字列
が「日本の」場合を例として、図7〜図10に従って詳
細に説明する。
【0027】まず、キーボード1からキーワードがキー
ワード取り込み手段11を介して文字パターン作成手段
5に入力されると(ステップ31)、文字パターン作成
手段5により、キーワードの先頭から1文字のデータが
取り出され(ステップ32〜35)、取り出されたその
文字とそれに続く文字の合計2文字のデータから文字パ
ターンが作成される(ステップ36〜38)。この場合
取り出した文字パターンは「日本」になる。この文字パ
ターンに関するデータが検索コード抽出手段12に転送
されると、検索コード抽出手段12により、文字パター
ンの先頭文字「日」に対応する文字種「日」の検索ファ
イル10から、文字パターン「日本」に対応するポイン
タが得られる(ステップ39)。得られたポインタはサ
ブポインタ部の文字パターン「日本」の文字パターング
ループを示しており、そのアドレスから順に、データ部
の先頭文字識別コード=1の同一文字識別コードグルー
プへのポインタ、先頭文字文字識別コード=2の同一文
字識別コードグループへのポインタのように、先頭文字
文字識別コードの昇順に同一文字識別コードグループへ
のポインタが格納されている。さらに、文字パターン
「日本」に続く文字パターン「日翻」に対応するポイン
タが得られる(ステップ40)。次に「日本」のポイン
タの示すアドレスの先頭に格納されている先頭文字の文
字識別コード=1の同一文字識別コードグループへのポ
インタ(データ部の文字パターン「日本」の文字パター
ングループの先頭を示す)と、文字パターン「日翻」の
先頭文字の文字識別コード=1の同一文字識別コードグ
ループへのポインタ(データ部の文字パターン「日翻」
の文字パターングループの先頭を示す)を読み出し、両
ポインタの差分から文字パターン「日本」の検索コード
の個数を算出し(ステップ41〜43)、該当個数の検
索コードをバッファに格納する(ステップ44〜5
0)。これにより、検索対象となっている全レコード中
の文字パターン「日本」に対応する検索コードが全て得
られる。なお、キーワードが2文字の場合は(ステップ
51)、取り出した検索コードのレコード番号がキーワ
ードの存在するレコード番号を示しているので、これを
検索結果とする(ステップ73)。
【0028】一方、キーワードが3文字以上の場合は、
文字パターン作成手段5により、キーワードの2文字目
を取り出し(ステップ52〜53)、取り出した文字と
それに続く文字の合計2文字を文字パターンとする(ス
テップ54〜56)。この場合、作成した文字パターン
は「本の」である。そして、検索コード抽出手段12に
より、文字パターンの先頭文字「本」の検索ファイル1
0のポインタ部から、文字パターン「本の」に対応する
ポインタを得る(ステップ57)。そして得られたポイ
ンタは、サブポインタ部の文字パターン「本の」の文字
パターングループを示しており、そのアドレスから順
に、データ部の先頭文字文字識別コード=1の同一文字
識別コードグループへのポインタ、先頭の文字文字識別
コード=2の同一文字識別コードグループへのポインタ
のように先頭文字文字識別コードの昇順に同一文字識別
コードグループへのポインタが格納されている。
【0029】検索コード抽出手段12によって検索コー
ドが抽出された後は、連続性照合手段13により、バッ
ファに格納されていた「日本」の検索コードが1つ取り
出される(ステップ58〜59)。次に取り出された検
索コードから文字パターン「日本」の2文字目の文字
「本」の文字識別コードを得る(ステップ60)。さら
に、文字パターン「本の」の同一文字識別コードグルー
プへのポインタのうち、ステップ60で得た値と同じ先
頭文字文字識別コードのポインタとステップ60で得た
値に1加算した先頭文字文字識別コードのポインタを読
み出し(ステップ61〜62)、両ポインタの差分か
ら、ステップ60で得た値と同じ先頭文字の識別コード
を有する文字パターン「本の」の検索コードの個数を算
出する(ステップ63)。この後文字パターン「本の」
検索コードを1つ読み出し(ステップ64〜66)、文
字パターン「日本」の検索コードとレコード番号がとも
に等しいか否かの判定を行う(ステップ67)。この処
理でレコード番号が等しくないと判定された場合は、さ
らに照合を行っていない文字パターン「本の」の検索コ
ードの有無をチェックする(ステップ68)。このとき
検索コードが他にある場合はステップ65に戻り、新た
に文字パターン「本の」の検索コードを読み出し、レコ
ード番号が一致するか否かの判定を行う。一方、検索コ
ードがない場合はステップ59に戻り、連続性の照合を
行う。
【0030】ステップ67において、レコード番号が等
しいと判定された場合は、文字パターン「日本」を構成
する文字「本」と文字パターン「本の」を構成する文字
「本」は、文字識別コード、レコード番号がともに等し
いことから、データベース中の同一文字であることがわ
かる。よって、文字パターン「日本」と文字パターン
「本の」は「本」を共通文字として連続していることが
わかり、このことからキーワード「日本の」は、照合し
たレコード番号に該当するレコード中に存在することが
わかる。即ち、ステップ67の判定により、比較して得
られたレコード番号が等しいときには、検索コードを検
索結果としてバッファに格納する(ステップ60)。こ
の後文字パターン「日本」の検索コードがバッファにさ
らに格納されているか否かのチェックを行い(ステップ
70〜71)、格納されている場合はステップ59に戻
り、再び連続性の照合を行う。一方、検索コードが格納
されていない場合は、文字パターン作成手段5により、
キーワードから新たに文字パターンが作成できるか否か
をチェックする(ステップ72)。これ以上文字パター
ンを作成できない場合には、蓄積しておいた検索コード
のレコード番号に対応した検索レコードを検索結果表示
手段14により、ディスプレイ15の画面上に表示し、
検索処理を終了する(ステップ73)。なお、さらに文
字パターンを作成できる場合はステップ52に戻り、処
理を続行し、キーワードから作成できる全ての文字パタ
ーンについて連続性の照合を行う。そしてバッファに格
納した検索中のレコード番号に対応した検索対象レコー
ドを検索結果とする。一方バッファに検索コードが格納
されていない場合は、キーワードがデータベース中に存
在しないとし、その旨を検索結果とする。
【0031】上記実施例では、レコード中のテキストデ
ータ全ての検索を行わなくても、文字識別コードとレコ
ード番号とから構成される検索コードによる文字の連続
性の判定を利用し、検索入力文字列が存在するレコード
を確定することができる。またその検索処理時間は、キ
ーワードを構成している全ての文字パターンについて相
隣接する文字パターンの検索コードの照合に関する処理
時間のみであり、レコード中のテキストデータ全ての検
索を行う場合に比べて検索時間の高速化が図れる。
【0032】また文字パターンを2文字単位ではなく、
2文字を越えるn文字とした場合、2文字の場合に比べ
て文字パターン毎の出現頻度が低くなることから、文字
パターン毎の検索コードとの総数も少なくなり、検索に
おける照合回数の削減が図れ、処理時間の短縮化が可能
となる。
【0033】さらに、上記実施例では、先頭文字の文字
識別コードが同じ文字パターンは同一レコード中には存
在しないことから、任意の文字パターンの検索コードの
数はレコード数以下となる。従って、1つの文字パター
ンに対応する検索コードを抽出し、それに続く文字パタ
ーンに対応した検索コードとの照合を行う際の照合回数
は、データベースの規模や文字パターンの出現頻度とは
無関係にレコード数以下となる。上記の理由から、本実
施例において、大規模データベースあるいは英語等の文
字種の少ない欧文文字を対象とした際に検索ファイルを
外部記憶装置に格納した場合でも、従来方式に比べ、少
量のデータを外部記憶装置から読み取るだけで、検索処
理を高速に行うことができる。
【0034】次に本発明の第2実施例を図11に従って
説明する。図11は、前記実施例と同様に、検索対象を
日本語文書とし、文字パターンを2文字単位とした場合
の文字種「日」の検索ファイル10の構成を示すもので
ある。そして検索ファイル10は、前記実施例と同様
に、JISコード表示に記載された6879種の文字種
毎に作成され、ポインタ部とデータ部から構成されてお
り、前記実施例とは異なってサブポインタ部が削除され
ている。
【0035】データ部は、検索コードの作成元である文
字パターン毎文字パターン区分で構成されている。この
文字パターン区分は、文字パターンの2文字目がJIS
コード表に記載された順序となるように並べてく。例え
ば(日SP)、(日、)〜(日本)〜(日煕)。文字パ
ターン区分は、検索コード欄で構成されている。この検
索コードが格納される。この検索コード欄は、検索コー
ド中のレコード番号の昇順に並べておく。例えばレコー
ド番号=1、2、3……。
【0036】ポインタ部は文字パターン欄で構成され、
サブポインタ部の文字パターン区分のアドレスを示すポ
インタが格納される。文字パターン欄はデータ部と同様
に先頭文字を「日」とし、先頭文字に続く文字がJIS
コード表に記載された順になるように並べられ、データ
部の文字パターン区分へのポインタが、文字パターン区
分に対応して順に格納できるようになっている。
【0037】次に、本実施例における検索ファイルを作
成する動作について、図1、図6、図12と図13に従
って説明する。
【0038】まず、キーボード1の操作によって検索対
象レコードが指定されると、検索対象レコードのを指定
するためのデータが検索対象指定手段2を介して検索対
象取り込み手段4に入力される。検索対象取り込み手段
4は、キーボード1からの入力情報に応答して、データ
ベース3から指定の検索対象レコードを取り出す(ステ
ップ101〜102)。この検索レコードの情報は文字
パターン作成手段5に転送される。そして文字パターン
作成手段5により、検索対象レコードの先頭から1文字
が取り出される(ステップ103〜104)。さらに、
取り出されたその文字とその文字に続く文字、ここでは
「日」と「本」による文字列を文字パターンとする(ス
テップ105〜106)。そして作成した文字パターン
「日本」は文字識別コード付与手段6により、文字パタ
ーンを構成している文字毎に、検索対象レコードの先頭
文字からのそれぞれの文字種毎の出現順位がカウントさ
れ(ステップ107〜108)、さらに、その出現順位
がそれぞれの文字毎の文字識別コードとされる(ステッ
プ109〜110)。この場合、文字パターン「日本」
を構成している文字。「日」の文字識別コード=1、
「本」の文字識別コード=1となる。このときレコード
番号付与手段7によって、指定の検索対象レコードに対
してレコード番号が付与される(ステップ111)。な
お、ここでは、レコード番号は1から順番に付与され
る。さらに検索コード作成手段8により、文字パターン
を構成している2文字の文字識別コードと合わせて検索
コードが決定される(ステップ112)。
【0039】次に、作成された文字パターンにおける先
頭文字種「日」の検索ファイル10のデータ部の領域
を、検索コードのサイズ分だけ、例えば、検索コードを
6バイトとした場合、6バイトを新たに追加する(ステ
ップ113)。次に、文字パターン「日本」に続く文字
パターン「日翻」の文字パターン欄に格納されているポ
インタを得る(ステップ114)。そして得られたポイ
ンタの示す先から、格納されている全ての検索コードを
検索コード1個分のサイズだけ移動して(ステップ11
5〜118)、作成された検索コードを、作成された文
字パターン「日本」に続く文字パターン「翻」の文字パ
ターン欄に格納されているポインタの示す検索コード欄
に格納する(ステップ119)。さらに文字パターン
「日本」以降の文字パターン欄に格納されているポイン
タを全て更新し、編集されたデータ部とポインタ部の整
合をとる(ステップ120〜123)。検索レコードか
ら作成した文字パターンの全てについてステップ103
〜123の処理を行うと(ステップ124)、データ部
には文字パターン毎の検索コードがレコード番号の昇順
に並べられる。これにより検索ファイルの作成処理が終
了する。
【0040】次に、検索動作について、前記実施例と同
様に、検索入力文字列が「日本」の場合を例として、図
14〜図17のフローチャートに従って説明する。
【0041】まず、キーボードの1の操作によってキー
ワードが入力されると、検索入力文字列に関するデータ
がキーワードとしてキーワード取り込み手段11に取り
込まれ、このデータが文字パターン作成手段5へ転送さ
れる(ステップ131)。そして文字パターン作成手段
5により、キーワードの先頭から1文字づつ取り出され
(ステップ132〜135)、取り出された文字とそれ
に続く文字の合計2文字の文字パターンが作成される
(ステップ136〜138)。本実施例では、取り出さ
れた文字パターンは「日本」となる。そして作成された
文字パターンのデータは検索コード抽出手段12に転送
される。そして検索コード抽出手段12により、取り出
された文字パターンの先頭文字「日」に対応する文字種
「日」の検索ファイルから、文字パターン「日本」に対
応するポインタが得られる(ステップ139)。そして
得られたポインタは、文字パターン「日本」の全検索コ
ードが格納されている文字パターンを示している(図1
1の検索ファイル構成を参照)。この後文字パターン
「日本」に続く文字パターン「翻」に対応するポインタ
が得られる(ステップ140)。さらに文字パターン
「日本」、「日翻」に対応する両ポインタの差分から文
字パターン「日本」の検索コードの個数を算出し(ステ
ップ141)、該当個数の検索コードをバッファに格納
する(ステップ142〜148)。これにより、検索対
象となっている全レコード中の文字パターン「日本」に
対応する検索コードが全て得られる。なお、キーワード
が2文字の場合は(ステップ149)、取り出した検索
コードのレコード番号がキーワードの存在するレコード
番号を示しているので、これを検索結果として出力する
(ステップ169)。
【0042】一方、キーワードが3文字の場合は、文字
パターン作成手段5により、キーワードの2文字目が取
り出され(ステップ150〜151)、取り出された文
字とそれに続く文字の合計2文字の文字パターンが作成
される(ステップ152〜154)。この場合は、取り
出された文字パターンは「本の」になる。そして、この
データが検索コード抽出手段12に転送されると検索コ
ード抽出手段12により、文字パターンの先頭文字
「本」の検索ファイル10のポインタ部から、文字パタ
ーン「本の」に対応するポインタが得られる(ステップ
155)。そして得られたポインタは、文字パターン
「本の」の全検索コードが格納されている文字パターン
区分を示している。
【0043】抽出された検索コードが連続性照合手段1
3へ転送されると、連続性照合手段13により、バッフ
ァに格納した「日本」の検索コードが1つ取り出される
(ステップ156〜158)。さらに、文字パターン
「本の」に続く、「本は」に対応するポインタが得られ
る(ステップ159)。さらに、文字パターン「本
の」、「本は」に対応する。両ポインタの差分から、文
字パターン「本の」の検索コードの個数を算出する(ス
テップ160)。次に、この検索コードを1つ読み出し
(ステップ161〜162)で、文字パターン「日本」
の検索コード中の2文字目の文字識別コードと文字パタ
ーン「本の」の検索コードの先頭文字の文字識別コード
が等しく、かつ双方の文字パターンのレコード番号が等
しいか否かの判定を行う(ステップ163)。このとき
レコード番号が等しくないと判定されたときは、さら
に、照合を行っていない文字パターン「本の」の検索コ
ードの有無をチェックし(ステップ164)、検索コー
ドがあるときはステップ161に戻り、新たに文字パタ
ーン「本の」検索コードを読み出し、レコード番号が等
しいか否かの判定を行う。一方、検索コードがない場合
はステップ158に戻り、連続性の照合を行う。
【0044】ステップ163において、条件を満たした
場合は、文字パターン「日本」を構成する文字「本」
と、文字パターン「本の」を構成する文字「本は」、文
字識別コード及びレコード番号がともに等しいことから
データベース中の同一文字であることがわかる。従っ
て、文字パターン「日本」と文字パターン「本の」は、
「本」を共通文字として連続しているということがわか
る。このことから、キーワード「日本の」は照合したレ
コード番号に該当するレコード中に存在することがわか
る。即ち、ステップ163の判定で、条件を満たしてい
るときには、検索コードを検索結果としてバッファに格
納する(ステップ165)。
【0045】次に文字パターン「日本」の検索コードが
バッファに格納されているか否かのチェックを行い(ス
テップ166〜167)、格納されている場合はステッ
プ158に戻り、連続性の照合を行う。なおこの場合は
既に照合を行った文字パターン「本の」の検索コードに
ついては、照合対象から除く(検索コードは文字パター
ン毎にレコード番号の昇順に並べられており、かつ同一
レコード番号のものについては、先頭文字の文字識別コ
ードの昇順に並べられていることから、既にステップ1
63で照合を行い、条件を満たさなかった文字パターン
は今回連続性が認められた文字パターンよりも、先頭文
字の文字識別コード及びレコード番号が大きいことはな
い。従って、次に照合を行う文字パターン「日本」と照
合を行っても、条件を満たすことはないので、照合の対
象から除くことができる)。一方、検索コードがバッフ
ァに格納されていない場合は、文字パターン作成手段5
により、キーワードから新たに文字パターンが作成でき
るか否かをチェックする(ステップ168)。そしてこ
れ以上文字パターンを作成できない場合には、蓄積して
おいた検索コードのレコード番号に対応した検索対象レ
コードを検索結果表示手段14により、ディスプレイの
画面上に表示し、検索処理を終了する(ステップ16
9)。なお、されに文字パターンを作成できる場合は、
ステップ150に戻り、キーワードから作成できる全て
の文字パターンについて連続性の照合を行い、バッファ
に格納した検索コード中のレコード番号をキーワードが
存在するレコードを検索結果とする。またバッファに検
索コードが格納されている場合は、キーワードがデータ
ベース中に存在しないとして、その旨を検索結果とす
る。
【0046】本実施例は、前記実施例と同様に、レコー
ド中のテキストデータを全て検索しなくても、文字識別
コードとレコード番号によって構成される検索コードに
よる文字の連続性の判定で、検索入力文字列が存在する
レコードを確定することができる。またその検索時間
は、キーワードを構成する全ての文字パターンについ
て、相隣接する文字パターンの検索コードの照合に関す
る処理時間のみであり、レコード中のテキストデータ全
てについて検索を行う場合に比べて検索速度の高速化を
図ることができる。さらに、文字パターンを2文字単位
ではなく、2文字を越えるn文字とした場合、2文字の
場合に比べて文字パターン毎の出現頻度が低くなること
から、文字パターン毎の検索コードも少なくなり、検索
時の照合回数が低減できるとともに、処理時間を短縮で
きる。
【0047】また、本実施例では、前記実施例とは異な
り、キーワード構成している全ての文字パターンについ
ての検索コードが照合の対象となり、その照合回数は前
記実施例に比べて増加するが、検索ファイルにサブポイ
ンタ部を必要としないため、検索ファイルのサイズが小
さくなり、外部記憶装置の容量を減らすことができる。
また、検索ファイルを作成する登録処理が前記実施例に
比べて簡略化されるので、登録処理時間を短縮すること
ができる。
【0048】
【発明の効果】以上説明したように、本発明は上記実施
例から明らかなように、大規模データベースあるいは英
語等の文字種の少ない欧文文字を対象としても少量のデ
ータを読み取るだけで文字列の照合を行うことができ、
検索速度の高速化を図ることができる。
【図面の簡単な説明】
【図1】本発明の一実施例を示す情報検索装置のブロッ
ク図
【図2】本発明の第1実施例における文字種「日」の検
索ファイルの構成図
【図3】本発明の第1実施例における文字種「日」の検
索ファイルの構成図
【図4】本発明の第1実施例の検索ファイルを作成する
動作を説明するためのフローチャート
【図5】本発明の第1実施例の検索ファイルを作成する
動作を説明するためのフローチャート
【図6】検索対象例を示す図
【図7】本発明の第1実施例における検索動作を示すフ
ローチャート
【図8】本発明の第1実施例における検索動作を示すフ
ローチャート
【図9】本発明の第1実施例における検索動作を示すフ
ローチャート
【図10】本発明の第1実施例における検索動作を示す
フローチャート
【図11】本発明の第2実施例における文字種「日」の
検索ファイルの構成図
【図12】本発明の第2実施例における検索ファイルの
作成処理を説明するためのフローチャート
【図13】本発明の第2実施例における検索ファイルの
作成処理を説明するためのフローチャート
【図14】本発明の第1実施例における検索処理を説明
するためのフローチャート
【図15】本発明の第1実施例における検索処理を説明
するためのフローチャート
【図16】本発明の第1実施例における検索処理を説明
するためのフローチャート
【図17】本発明の第1実施例における検索処理を説明
するためのフローチャート
【符号の説明】
1 キーボード 2 検索対象指定手段 3 データベース 4 検索対象取り込み手段 5 文字パターン作成手段 6 文字識別コード付与手段 7 レコード番号付与手段 8 検索コード作成手段 9 検索ファイル作成手段 10 検索ファイル 11 キーワード取り込み手段 12 検索コード抽出手段 13 連続性照合手段 14 検索結果表示手段 15 ディスプレイ
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G06F 17/30 JICSTファイル(JOIS)

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】 データベースに格納された検索対象レコ
    ード群の中の特定の検索対象レコードを指定する検索対
    象指定手段と、検索対象指定手段の指定による検索対象
    レコードをデータベースから取り込む検索対象取り込み
    手段と、検索対象指定手段の指定による検索対象レコー
    ドに対してレコード番号を付与するレコード番号付与手
    段と、前記検索対象取り込み手段により取り込まれた検
    索対象レコードから文字パターンを作成する第1文字パ
    ターン作成手段と、キーワードで指定された文字列から
    文字パターンを作成する第2文字パターン作成手段と、
    第1文字パターン作成手段の作成による文字パターンの
    文字毎に検索対象レコードの先頭文字からの出現順位を
    示す文字識別コードを付与する文字識別コード付与手段
    と、文字識別コードの付与された文字パターンとレコー
    ド番号の付与された検索対象レコードとから検索コード
    を作成する検索コード作成手段と、検索コード作成手段
    の作成による検索コードを文字パターン毎の領域に、文
    字パターンの先頭文字の文字識別コードの昇順に記憶す
    る検索コード記憶手段と、第2文字パターン作成手段の
    作成による文字パターンに従って検索コード記憶手段の
    記憶内容を検索して文字パターンの各文字に該当する検
    索コードを抽出する検索コード抽出手段と、検索コード
    抽出手段により連続して抽出された複数の検索コードに
    相互に関連のある情報が含まれているか否かを照合する
    連続性照合手段と、連続性照合手段の照合結果を出力す
    る照合結果出力手段とを備えている情報検索装置。
  2. 【請求項2】 データベースに格納された検索対象レコ
    ード群の中の特定の検索対象レコードを指定する検索対
    象指定手段と、検索対象指定手段の指定による検索対象
    レコードをデータベースから取り込む検索対象取り込み
    手段と、検索対象指定手段の指定による検索対象レコー
    ドに対してレコード番号を付与するレコード番号付与手
    段と、前記検索対象取り込み手段により取り込まれた検
    索対象レコードの先頭から1文字づつ取り出し、その文
    字と次に続く複数の文字とで構成する文字パターンを作
    成する第1文字パターン作成手段と、キーワードで指定
    された文字列から文字パターンを作成する第2文字パタ
    ーン作成手段と、第1文字パターン作成手段の作成によ
    る文字パターンの文字毎に検索対象レコードの先頭文字
    からの出現順位を示す文字識別コードを付与する文字識
    別コード付与手段と、文字識別コードの付与された文字
    パターンとレコード番号の付与された検索対象レコード
    とから検索コードを作成する検索コード作成手段と、検
    索コード作成手段の作成による検索コードを文字パター
    ン毎の領域に、文字パターンの先頭文字の文字識別コー
    ドの昇順に記憶する検索コード記憶手段と、第2文字パ
    ターン作成手段の作成による文字パターンに従って検索
    コード記憶手段の記憶内容を検索してキーワードを構成
    する文字列の連続する2つの文字パターンに対応した検
    索コードのうち共通する文字の文字識別コードの等しい
    検索コードのみを抽出する検索コード抽出手段と、検索
    コード抽出手段により抽出された各検索コードの内容が
    共通文字を基準に連続性を有するか否かを照合してキー
    ワードで指定された文字列のデータがレコード中に存在
    するか否かの検索結果を出力する連続性照合手段と、連
    続性照合手段の照合による検索結果を表示する検索結果
    表示手段とを備えている情報検索装置。
  3. 【請求項3】 データベースに格納された検索対象レコ
    ード群の中の特定の検索対象レコードを指定する検索対
    象指定手段と、検索対象指定手段の指定による検索対象
    レコードをデータベースから取り込む検索対象取り込み
    手段と、検索対象指定手段の指定による検索対象レコー
    ドに対してレコード番号を付与するレコード番号付与手
    段と、前記検索対象取り込み手段により取り込まれた検
    索対象レコードから文字パターンを作成する第1文字パ
    ターン作成手段と、キーワードで指定された文字列から
    文字パターンを作成する第2文字パターン作成手段と、
    第1文字パターン作成手段の作成による文字パターンの
    文字毎に検索対象レコードの先頭文字からの出現順位を
    示す文字識別コードを付与する文字識別コード付与手段
    と、文字識別コードの付与された文字パターンとレコー
    ド番号の付与された検索対象レコードとから検索コード
    を作成する検索コード作成手段と、検索コード作成手段
    の作成による検索コードを文字パターン毎に指定の領域
    に記憶する検索コード記憶手段と、第2文字パターン作
    成手段の作成による文字パターンに従って検索コード記
    憶手段の記憶内容を検索して文字パターンの各文字に該
    当する検索コードを抽出する検索コード抽出手段と、検
    索コード抽出手段により連続して抽出された複数の検索
    コードに相互に関連のある情報が含まれているか否かを
    照合する連続性照合手段と、連続性照合手段の照合結果
    を出力する照合結果出力手段とを備えている情報検索装
    置。
  4. 【請求項4】 データベースに格納された検索対象レコ
    ード群の中の特定の検索対象レコードを指定する検索対
    象指定手段と、検索対象指定手段の指定による検索対象
    取り込み手段により取り込まれた検索対象レコードの先
    頭から1文字づつ取り出し、その文字と次に続く複数の
    文字とで構成する文字パターンを作成する第1文字パタ
    ーン作成手段と、キーワードで指定された文字列から文
    字パターンを作成する第2文字パターン作成手段と、第
    1文字パターン作成手段の作成による文字パターンの文
    字毎に検索対象レコードの先頭文字からの出現順位を示
    す文字識別コードを付与する文字識別コード付与手段
    と、文字識別コードの付与された文字パターンとレコー
    ド番号の付与された検索対象レコードとから検索コード
    を作成する検索コード作成手段と、検索コード作成手段
    の作成による検索コードを文字パターン毎に指定の領域
    に記憶する検索コード記憶手段と、第2文字パターン作
    成手段の作成による文字パターンに従って検索コード記
    憶手段の記憶内容を検索してキーワードを構成する文字
    列の連続する2つの文字パターンに対応した検索コード
    のうち共通する文字の文字識別コードの等しい検索コー
    ドのみを抽出する検索コード抽出手段と、検索コード抽
    出手段により抽出された各検索コードの内容が共通文字
    を基準に連続性を有するか否かを照合してキーワードで
    指定された文字列のデータがレコード中に存在するか否
    かの検索結果を出力する連続性照合手段と、連続性照合
    手段の照合による検索結果を表示する検索結果表示手段
    とを備えている情報処理装置。
JP4204812A 1992-07-31 1992-07-31 情報検索装置 Expired - Fee Related JP3036246B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4204812A JP3036246B2 (ja) 1992-07-31 1992-07-31 情報検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4204812A JP3036246B2 (ja) 1992-07-31 1992-07-31 情報検索装置

Publications (2)

Publication Number Publication Date
JPH0652226A JPH0652226A (ja) 1994-02-25
JP3036246B2 true JP3036246B2 (ja) 2000-04-24

Family

ID=16496787

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4204812A Expired - Fee Related JP3036246B2 (ja) 1992-07-31 1992-07-31 情報検索装置

Country Status (1)

Country Link
JP (1) JP3036246B2 (ja)

Also Published As

Publication number Publication date
JPH0652226A (ja) 1994-02-25

Similar Documents

Publication Publication Date Title
EP0510634B1 (en) Data base retrieval system
US5745745A (en) Text search method and apparatus for structured documents
JP2770715B2 (ja) 構造化文書検索装置
CN101021850A (zh) 单词检索设备、单词检索方法,以及记录介质
JP2669601B2 (ja) 情報検索方法及びシステム
JP3545824B2 (ja) データ検索装置
JP2693914B2 (ja) 検索システム
JP3036246B2 (ja) 情報検索装置
JP2005107931A (ja) 画像検索装置
JP3081093B2 (ja) 索引作成方法およびその装置と文書検索装置
JP3981158B2 (ja) 文書索引生成装置
JP2519129B2 (ja) マルチキ―ワ―ド情報検索処理方式および検索ファイル作成装置
JP3649472B2 (ja) 情報検索装置
JP3288063B2 (ja) 可変長データの格納および参照システム
JP3275704B2 (ja) 入力文字列推測認識装置
JP4260641B2 (ja) 検索結果処理装置、検索結果処理プログラム、検索結果処理プログラム記録媒体及び検索結果処理システム
JP3085508B2 (ja) 電子帳票検索システム
JPH03268064A (ja) データ検索装置及びデータ検索方法
JPH03209564A (ja) 文献データ登録方法
JP2751681B2 (ja) 文書検索装置
JPH0748218B2 (ja) 情報処理装置
JP2601139B2 (ja) 文字列検索装置
JP2504768B2 (ja) イメ―ジ情報処理装置
JPH0573627A (ja) 画像検索装置
JPH08314948A (ja) 情報検索装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees