JP2503333B2 - 全文インデックス検索方法 - Google Patents

全文インデックス検索方法

Info

Publication number
JP2503333B2
JP2503333B2 JP3220836A JP22083691A JP2503333B2 JP 2503333 B2 JP2503333 B2 JP 2503333B2 JP 3220836 A JP3220836 A JP 3220836A JP 22083691 A JP22083691 A JP 22083691A JP 2503333 B2 JP2503333 B2 JP 2503333B2
Authority
JP
Japan
Prior art keywords
character
full
search
text index
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP3220836A
Other languages
English (en)
Other versions
JPH0561910A (ja
Inventor
裕子 松野
純 時澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Social Science Labs Ltd
Original Assignee
Fujitsu Social Science Labs Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Social Science Labs Ltd filed Critical Fujitsu Social Science Labs Ltd
Priority to JP3220836A priority Critical patent/JP2503333B2/ja
Publication of JPH0561910A publication Critical patent/JPH0561910A/ja
Application granted granted Critical
Publication of JP2503333B2 publication Critical patent/JP2503333B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は電子化した文書を特定の
キーワードを用いないで任意の文字列で検索する全文イ
ンデックス検索方法に関する。
【0002】文書を選択するための検索は,書名,作成
者名,日付や要旨等の一覧を表示して選択する方法と,
利用者が入力したキーワードで予め文書毎に抽出して登
録したキーワードで検索を行う方法がある。
【0003】文書からキーワードを抽出する方法は従来
から行われているが,問題があるためより効率的な検索
方法の実現が望まれている。
【0004】
【従来の技術】文書からキーワードを抽出する方法は従
来から広く用いられている。その場合,キーワードを抽
出する方法として管理者による手作業やプログラムによ
る自動抽出があるが,何れも完璧にキーワードを過不足
なく抽出するのは不可能である。また,キーワードを用
いずに任意の文字列が文書中に存在することを検索する
全文内容検索の方法もあるが,指定した文字列が文書中
に存在するか文書の全体を走査する必要がある。
【0005】
【発明が解決しようとする課題】上記したキーワードを
用いる方法はキーワードを過不足なく適切に選択するこ
とが不可能であるという問題がある。また,キーワード
を用いずに図書館等に所蔵するような多数の文書につい
て任意の文字列が存在することを調べる全文検索は膨大
な時間がかかるという問題があった。
【0006】本発明は多数の文書について任意の文字列
の存在を高速に検索することができる全文インテデック
ス検索方法を提供することを目的とする。
【0007】
【課題を解決するための手段】図1は本発明の原理図,
図2は本発明のインデックス文字数が複数の場合の原理
図である。
【0008】図1において,1は元文書ファイル,1a
は文書中の出現位置情報,1bは文字,2はハッシュ関
数発生手段,3は全文インデックス,3aは全文インデ
ックスのハッシュ値(インデックス格納位置),3bは
ハッシュされた文字種,3cはハッシュ値に該当する文
字の出現位置情報(複数個ある場合はリンク情報を含
む),4は検索文字列,5は検索出力情報,6は検索結
果を表す。
【0009】本発明は,1文書が通常,数十万字程度で
あるが出現する文字種は数千種であるから,この数千種
の文字がそれぞれ文書中の何文字目に出現するかという
出現位置を記録した全文インデックスを作成し,作成し
た全文インデックスを用いて検索したい任意の文字列を
構成する文字が文書中の何文字目に出現しているかわか
るのでそれぞれの文字が検索したい文字列の順番に文書
中に出現すれば検索したい文字列が文書中に存在するこ
とが識別できることを原理とする。
【0010】
【作用】本発明では文書中の一定の文字数(1字を含む
1字以上)の文字列毎にその文字列が文書中に出現する
位置の全リストを,文字列の全種類毎に作成し,作成し
たリストの集合を全文インデックスと呼ぶ。
【0011】図1は,一定の文字数が1字である場合の
例であるが,2字,3字の場合にも同様の原理で実現で
きる。元文書ファイル1が例として図に示すように「や
あ,XXY社のみなさん・・」を先頭とする文章の場
合,その全ての文字1bをその文書中の出現位置情報
(元文書ファイル1の先頭から何番目に位置するかを表
す情報)1aを付加して,先頭から順にハッシュ関数発
生手段2に供給する。ハッシュ関数発生手段2は予め関
数(ハッシュされる個数に対応する)が設定されてお
り,入力する各文字1bのコードについてハッシュ関数
を計算してハッシュ値を発生する。ハッシュ関数は各文
字がほぼ個別のハッシュ値となるような関数を採用する
場合(多数の値が発生)や,複数の文字が共通のハッシ
ュ値を取る可能性が高い関数を採用する場合等がある。
図1の例では各文字が異なるハッシュ値を取る例であ
る。
【0012】全文インデックス3はハッシュ関数発生手
段2で発生する各ハッシュ値に対応する格納位置(アド
レス)3aに,文字種3b及びその文字の出現位置情報
3cを格納する。この出現位置情報3cは,同じハッシ
ュ関数値を持つ文字が後で発生した場合,前に発生した
文字の出現場所情報に対し,後続する文字の出現場所情
報の位置を表すリンク情報を付加することにより順次追
加される。
【0013】元文書ファイル1の全ての文字について全
文インデックス3が作成されると,検索を行うことがで
きる。検索文字列は1字以上の文字列から構成され,図
1の例は「げんき」という検索文字列である。この検索
文字列4の各文字「げ」,「ん」,「き」はハッシュ関
数発生手段2に供給されると,それぞれのハッシュ値が
発生する。次に発生した各ハッシュ値を用いて全文イン
デックス3から各文字の全ての出現位置情報3cを取り
出す。
【0014】取り出された各文字の出現位置情報3cを
含む検索出力情報5について,先頭文字(図の例では
「げ」)の出現位置情報(図の例では16番目)に対し
て,後続の文字(図の例では「ん」,「き」)の出現位
置情報が連続した位置であるか否かを判定する。この結
果,連続した出現位置情報である場合(図の16〜18
と連続する場合),検索文字列4が当該検索対象の元文
書ファイル1の特定の位置に格納(文書中に記載)され
ているという検索結果6を発生する。検索文字列4の出
現位置情報が連続していない場合は,該当文字が含まれ
ていないという検索結果6を発生する。
【0015】図2はインデックス文字数が複数の場合の
原理図であり,A.とB.の何れの場合も文字数が
「3」の例である。図2のA.は,3文字毎の全文イン
デックス3を元文書ファイルを1文字ずつずらしながら
作成する場合の原理であり,同じ文字が重複して複数の
インデックスで使用される。この場合の検索文字列は,
3文字毎に区切り(図2の例では「おげんき」を3文字
毎に区切り「おげん」と「き」とする)検索を行う。3
文字に満たない文字列(図の「き」の例))は検索不可
能であり,全文インデックス上では3の倍数の文字列し
か決定できない。余った1字または2字は実際の文書上
(元文書ファイル1を読み出して表示)で確認する。
【0016】図2のB.は上記A.と異なり3文字を重
複せず全文インデックス3を作成する。この場合,検索
文字列を3文字毎に分割する際1文字ずつずらして分割
して,それぞれ検索する。分割する文字数と全文インデ
ックス3の大きさ,検索の手間が変化する。一般に分割
文字数を増やした場合に文字列の種類が増加するため,
ヒット率も増加するので高速化が可能である。但し,分
割文字数以下の文字列は検索不可能である。また,余っ
た1字または2字が一致するか否かは元文書ファイルの
部分を取り出して確認する。
【0017】複数分割文字で重複の有無の差は,重複の
ある場合は無い場合より全文インデックスが大きい。し
かし重複の有る場合は,無い場合より検索文字列の分解
が単純で一度で検索が終了するのでより高速となる。
【0018】
【実施例】図3は全文インデックスの作成の構成図,図
4は図3により作成したハッシュテーブルと出現位置情
報とで構成される全文インデックスの構成図である。
【0019】図3において1は元文書ファイル,2はハ
ッシュ関数発生部(図1のハッシュ関数発生手段に対
応),30は各ハッシュ値に対応して先頭の文字へのポ
インタが格納されたハッシュテーブル,31はハッシュ
テーブル30で示す各ハッシュ値に対応するポインタに
対応して設けられ,先頭の文字の位置レコードへのポイ
ントを含む先頭の登録レコードである。この先頭の登録
レコード31には,該当ハッシュ値を持つ先頭(「あ」
が先頭で「か」は次,以下「さ」,「た」が後続する)
の文字情報と,その文字の出現位置情報とリンク情報と
で構成するレコードへのリンク情報(この例では最後の
位置レコード31−1),及び同じハッシュ値を持つ別
の文字の登録レコード(文字情報とその文字の出現位置
情報へアクセスするためのリンク情報及び,同じハッシ
ュ値を持つ他の文字の先頭の登録レコードのポインタ)
とで構成される。
【0020】31−1〜31−5は同じハッシュ値で同
じ文字の出現位置情報とリンク情報とで構成する位置レ
コードである。32は同じハッシュ値を持つ別の文字
(この例では「か」)の先頭の登録レコード,32−1
は別の文字(「か」)の出現位置情報を含む位置レコー
ドである。
【0021】この例ではハッシュ数は「5」であり,
「あ」,「い」,「う」,「え」,「お」がそれぞれハ
ッシュ値0,1,2,3,4に対応し,「か」は「あ」
と同じハッシュ値0,「き」はハッシュ値1となるよう
なハッシュ関数とする。
【0022】全文インデックスを作成する場合,元文書
ファイル1の先頭の文字からハッシュ関数発生部2でハ
ッシュ値を計算すると「0」が発生し,ハッシュテーブ
ル30によりポインタa00が得られる。ポインタa0
0の指す登録レコードには,文字「あ」のコードと,出
現位置情報を格納する位置レコードのポインタが格納さ
れており,その位置レコードに今回登録する文字の出現
位置情報とリンク情報とを格納する。
【0023】図3の状態は,元文書ファイル1の先頭の
文字から8番目(出現位置情報)の文字「あ」までをイ
ンデックス登録した状態を表す。この場合,「あ」とい
う文字が既に5回出現した後であり,先頭の「あ」(出
現位置0)は31−5の位置レコード(ポインタa01
0)に格納され,その後の「あ」(出現位置2)は31
−4の位置レコード(ポインタa011)に格納され,
以下31−3,31−2,31−1と順に格納され,最
後の「あ」の位置レコードはポインタa014に格納さ
れ,先頭の登録レコード31には,そのポインタa01
4が格納されている。
【0024】図3において,次に第9番目の文字「か」
を取り出してハッシュ関数発生部2に入力すると,ハッ
シュ値「0」が発生する。ハッシュテーブル30の0の
アドレスからは先頭のポインタa00が得られ,その位
置の先頭の登録レコード31には,「あ」が格納されて
いる。
【0025】現在の登録対象の文字は「か」であるか
ら,別の同じハッシュ値を持つ登録レコードを見つける
ため,別の文字の先頭の登録レコードを表すポインタa
020の登録レコード32の内容を判別する。この場
合,文字情報は「か」であるから,今回の文字「か」と
一致するので,この登録レコード32内のポインタa0
21を取り出して,対応する位置レコード32−1に,
この文字「か」の出現位置情報9を格納する。
【0026】このようにして,元文書ファイル1の全文
について各文字毎にインデックス化が実行される。図4
には図3の各情報を用いて作成されたハッシュテーブル
と出現位置情報を含む全文インデックスの構成が示され
ている。
【0027】図4の各情報はメモリ上に構成され,その
先頭位置40にハッシュ数5が格納され,次に各ハッシ
ュ値に対応して先頭の文字へのポインタがハッシュ値の
個数分格納されたハッシュテーブル41が設けられ,次
にハッシュ値の0である先頭の文字(「あ」)の文字情
報42,次に同じハッシュ値の次の文字へのポインタ
(「か」の位置)43,次にこの文字(「あ」)の出現
文字数44(5個)が格納され,その後にこの文字
(「あ」)の出現位置の情報45が文書ファイルの出現
順に格納される。なお,これらの各情報は4バイトで表
現される。
【0028】この出現位置の順番は上記図3で格納され
た位置と逆の順になっている。これは,インデックスを
作成する場合は,後続して発生する同じ文字の出現位置
を格納するのに,図3のように後から発生するものを先
頭に置いた方が効率的であるが,検索を行う場合は,検
索結果が発生順に並んでいる方が後々処理し易いためで
ある。
【0029】また,同じハッシュ値を持つ別の文字
(「か」)に関する情報が,上記次の文字へのポインタ
43により指示する位置を先頭にして,文字46,同じ
ハッシュ数の次の文字へのポインタ47,文字数48,
出現位置の情報49という順に格納される。この後,次
のハッシュ値(1)に対応する先頭の文字「い」に関す
る情報が格納され,以下同様に全ての文字について格納
される。
【0030】図4のような全文インデックスに対して検
索を行う場合,検索したい文字列の各文字に対してそれ
ぞれハッシュ関数部でハッシュ値を求め,図4のハッシ
ュテーブルにより該当する各文字の出現位置情報を抽出
する。検索文字列の各出現位置情報の中で,前後が連続
する位置情報が含まれているか判断し,連続する位置情
報が含まれている場合該当する文字列が当該文書ファイ
ルに含まれているという検索結果が,その文字列の文書
ファイル中の出現位置情報と共に得られる。
【0031】本発明による全文インデックス電子文書管
理システムの構成例を図5及び図6に示す。図5は全文
インデックス電子文書管理システムにおける全文インデ
ックス作成の処理説明図,図6は全文インデックス電子
文書管理システムにおける検索表示の処理説明図であ
る。
【0032】図5,図6において,50はファイルを含
む大容量記憶装置,51は複数の文書ファイル,52は
書名と書誌情報(作者,発行日(発表日),分類等)の
テーブル,53は各文書毎の全文インデックス(IDX
で表示),54は書誌的事項の全文インデックスであ
り,全書誌書名についての全文インデックス(書誌書
名.IDXで表示)及び書誌著者についての全文インデ
ックス(書誌著者.IDXで表示)とから成る。56は
CPU及びメモリで構成する処理装置であり,インデッ
クス作成プログラム57,インデックスを用いた検索を
行うプログラムで構成する検索エンジン58,及びユー
ザインタフェースプログラム59を備える。また,図6
の60は検索を行うために使用するディスプレイ及びキ
ーボードやマウス等を含むモニタ装置である。
【0033】図5において,初期状態では文書ファイル
51及び書名と書誌情報のテーブル52が各文書A,B
・・に対応して用意されている。この中の文書ファイル
51について各書名毎に処理装置56のインデックス作
成プログラム57を動作させることにより,上記の図3
及び図4に示す方法により各文書の全文インデックス5
3が作成される。更に,書名と書誌情報のテーブル52
について,インデックス作成プログラム57により,書
誌書名の全文インデックス54及び書誌著者の全文イン
デックス55が作成される。
【0034】次に図6を用いて検索のための各動作〜
(図6中に示す)の順を追って以下に説明する。 ユーザが検索の対象として全蔵書の文書か,書誌情報
の書名や著者名等を指定し,検索したい文字列を指定し
て検索開始を指示する。
【0035】処理装置56はこの指示により検索エン
ジン58に検索を依頼する。 検索エンジン58は,文書の検索の場合,各書名の全
文インデックス53に対して検索文字列が連続して出現
するか否かを判別することにより検索を行う。
【0036】検索が成功すると(指定した文字列を含む
文書があると),その文字列を含む文書名(及び出現位
置情報)を保存しておく。また,書誌情報についての検
索の場合,指定された文字列が書誌名全文インデックス
54及び書誌著者全文インデックス55の何れかまたは
両方を用いて検索を行い,検索が成功すると同様に書名
や著者名等を保存する。
【0037】検索が終了すると,検索結果の書名の一
覧(出現位置情報を含む)や検索された書誌的事項をユ
ーザインタフェースプログラム59に返す。 書名に対応する文書を読み込む。
【0038】文書名と文書の内容の表示を行う。 以上のように,本発明は文書の本文に対して全文インデ
ックスを作成した場合,その文書の任意の文字列の存在
を高速に検索できる。これを利用して数万冊の蔵書に対
してそれらの本文中の任意の文字列を持つ文書を高速か
つ漏れなく見つけることができる。
【0039】また,例えば,書名や著者名のような書誌
情報に対し,全蔵書の書名を任意の区切り文字(例えば
タブ)をはさんで結合して,1文書を作成する。この文
書に対し全文インデックスを作成すれば,任意の文字列
を含む書名が極めて高速に見つけることができる。この
文書中でその文字列を見つけた場所を含む区切り文字で
囲まれた範囲が求める書名である。
【0040】この場合,書名がキーとなり直ちに文書を
求めることが可能であるが,書名以外の書誌情報で行う
場合,例えば著者名に任意の文字列を含む著者の書名を
知りたい場合について説明する。
【0041】まず,各蔵書の書名と著者名を任意の区切
り文字(例えは,タブ)をはさんで結合する。次に全蔵
書の結合された書名と著者名を別の任意の区切り文字
(例えば,改行コード)をはさんで全て結合する。1文
書の結合された全蔵書の書名と著者名の全文インデック
スを作成する。著者の名前の一部を覚えている場合にそ
の一部の文字列で検索を行う。
【0042】文書中に発見された文字列の前がタブで後
ろが改行コードではさまれていたら,それは著者名であ
るので著者名の前の書名を得る。文書中に発見された文
字列の前が改行コードで後ろがタブの場合は,たまたま
書名の中にその文字列が存在した場合で検索結果からは
除外する。同様に書名や(文書のキー)と他の書誌情報
を全蔵書分結合して1文書を作成することにより,出版
者や発行年月日等の書誌情報に任意の文字列を含む蔵書
の検索が高速に行える。
【0043】
【発明の効果】本発明によれば上記のように膨大な量の
文書に対して特定の文字列がどの文書に含まれているか
の処理を簡単な原理により高速に実現することができ,
図書館や,事業で使用する膨大な量の管理文書,ビジネ
スの書類等の各種の文書情報から任意の文字列を指定し
て検索を行うことが可能となる。また,検索を行う前に
作成される全文インデックスの作成を簡易な処理により
行うことが可能である。
【図面の簡単な説明】
【図1】本発明の原理図である。
【図2】本発明のインデックス文字数が複数の場合の原
理図である。
【図3】全文インデックスの作成の構成図である。
【図4】ハッシュテーブルと出現位置情報とで構成され
る全文インデックスの構成図である。
【図5】全文インデックス電子文書管理システムにおけ
る全文インデックス作成の処理説明図である。
【図6】全文インデックス電子文書管理システムにおけ
る検索表示の処理説明図である。
【符号の説明】
1 元文書ファイル 1a 文書中の出現位置情報 1b 文字 2 ハッシュ関数発生手段 3 全文インデックス 3a 全文インデックスのハッシュ値(インデック
ス格納位置) 3b ハッシュされた文字種 3c ハッシュ値に該当する文字の出現位置情報 4 検索文字列 5 検索出力情報 6 検索結果
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平2−32468(JP,A) 特開 平2−36475(JP,A)

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】 電子化文書の全文インデックス検索方法
    において,電子化文書の各文字を1文字単位でハッシュ
    関数発生手段に入力し,発生したハッシュ値に対応する
    位置に文字と共に各文字の文書中の出現位置情報とを含
    むインデックスを作成して電子化文書の全ての文字につ
    いて全文インデックスを作成し,複数文字からなる検索
    文字列を1文字単位で前記ハッシュ関数発生手段に入力
    し,発生するハッシュ値を用いて,前記全文インデック
    スに格納された対応する文字の出現位置情報を検出し,
    検出された各文字の出現位置情報が相対的に検索文字列
    の配置順に該当するか否かを判別することにより検索を
    行うことを特徴とする全文インデックス検索方法。
  2. 【請求項2】 電子化文書の全文インデックス検索方法
    において,電子化文書の連続する一定の複数文字を単位
    として,ハッシュ関数発生手段に入力し,発生したハッ
    シュ値に対応する位置に前記複数文字列と共に各文字列
    の文書中の出現位置情報を含むインデックスを格納して
    電子化文書の全ての文字について全文インデックスを作
    成し,複数文字からなる検索文字列を前記一定の複数文
    字を単位として1または複数の文字列を作成し,それぞ
    れハッシュ関数発生手段に入力し,発生するハッシュ値
    を用いて,前記全文インデックスに格納された対応する
    文字列の出現位置情報を検出し,検索文字列が1つの場
    合は該当文字列の検出か否かを識別して検索を行い,検
    索文字列が複数の場合は前記全文インデックスから各検
    索文字列に対応する出現位置情報を検出し,検出された
    各文字列の出現位置情報が各検索文字列の配置順に該当
    するか否かを判別することにより検索を行うことを特徴
    とする全文インデックス検索方法。
JP3220836A 1991-09-02 1991-09-02 全文インデックス検索方法 Expired - Fee Related JP2503333B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3220836A JP2503333B2 (ja) 1991-09-02 1991-09-02 全文インデックス検索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3220836A JP2503333B2 (ja) 1991-09-02 1991-09-02 全文インデックス検索方法

Publications (2)

Publication Number Publication Date
JPH0561910A JPH0561910A (ja) 1993-03-12
JP2503333B2 true JP2503333B2 (ja) 1996-06-05

Family

ID=16757308

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3220836A Expired - Fee Related JP2503333B2 (ja) 1991-09-02 1991-09-02 全文インデックス検索方法

Country Status (1)

Country Link
JP (1) JP2503333B2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08161351A (ja) * 1994-12-07 1996-06-21 Toshiba Corp 単語番号置換方法,インデックス作成方法,文書検索方法及び文書検索装置
US9009655B2 (en) 2008-09-28 2015-04-14 KOUSOKUYA, Inc. Code string search apparatus, search method, and program
WO2010095179A1 (ja) * 2009-02-23 2010-08-26 株式会社エスグランツ コード列検索装置、検索方法及びプログラム
JP4464459B1 (ja) * 2009-03-29 2010-05-19 株式会社エスグランツ コード列検索装置、検索方法及びプログラム
WO2010035366A1 (ja) * 2008-09-28 2010-04-01 株式会社エスグランツ コード列検索装置、検索方法及びプログラム
JP4429373B1 (ja) * 2009-03-18 2010-03-10 株式会社エスグランツ コード列検索装置、検索方法及びプログラム
JP2015530665A (ja) * 2012-09-07 2015-10-15 ティヴァーサ アイピー インコーポレイテッド ファイル共有ネットワークにおけるスニペット照合

Also Published As

Publication number Publication date
JPH0561910A (ja) 1993-03-12

Similar Documents

Publication Publication Date Title
US8145617B1 (en) Generation of document snippets based on queries and search results
US10275434B1 (en) Identifying a primary version of a document
US6212525B1 (en) Hash-based system and method with primary and secondary hash functions for rapidly identifying the existence and location of an item in a file
US5778400A (en) Apparatus and method for storing, searching for and retrieving text of a structured document provided with tags
US6862602B2 (en) System and method for rapidly identifying the existence and location of an item in a file
JP2960340B2 (ja) データ検索方法及び装置
US6119124A (en) Method for clustering closely resembling data objects
US20060161545A1 (en) Method and apparatus for ordering items within datasets
US20090198693A1 (en) Method and apparatus for ordering items within datasets
US5613110A (en) Indexing method and apparatus facilitating a binary search of digital data
JPH06505816A (ja) 情報検索システム及び方法
US20100115001A1 (en) Methods For Pairing Text Snippets To File Activity
Lesk Some applications of inverted indexes on the UNIX system
CN111400323A (zh) 数据检索方法、系统、设备及存储介质
JPH0628403A (ja) 文書検索装置
JP2503333B2 (ja) 全文インデックス検索方法
Manaf et al. Comparison of carp rabin algorithm and Jaro-Winkler distance to determine the equality of Sunda languages
JPH05128152A (ja) 文書検索支援方法
JPH0744579A (ja) 論理構造文書検索方式
CN115687566A (zh) 一种全文检索及显示检索结果的方法及装置
JPH06301732A (ja) 文書検索処理方法
JP3531344B2 (ja) 情報検索装置
JP2519129B2 (ja) マルチキ―ワ―ド情報検索処理方式および検索ファイル作成装置
JPH06309365A (ja) 文書処理装置
Oard Known by the Company it Keeps: Proximity-Based Indexing for Physical Content in Archival Repositories

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110402

Year of fee payment: 15

LAPS Cancellation because of no payment of annual fees