JPH0969113A - 文書管理方式 - Google Patents

文書管理方式

Info

Publication number
JPH0969113A
JPH0969113A JP7224910A JP22491095A JPH0969113A JP H0969113 A JPH0969113 A JP H0969113A JP 7224910 A JP7224910 A JP 7224910A JP 22491095 A JP22491095 A JP 22491095A JP H0969113 A JPH0969113 A JP H0969113A
Authority
JP
Japan
Prior art keywords
document
character
block
component
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7224910A
Other languages
English (en)
Inventor
Masajirou Iwasaki
雅二郎 岩崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP7224910A priority Critical patent/JPH0969113A/ja
Publication of JPH0969113A publication Critical patent/JPH0969113A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 長い文書を登録する場合における誤検索を減
らす。 【解決手段】 文書登録時に文書より各文字コード成分
及び2文字以上の隣接文字からビット列成分を算出し、
各文書がそれぞれの成分を含むか否かを示す単一文字成
分表及び一つ以上の隣接文字成分表を生成し、該文字成
分表の各文字成分のエントリを複数のブロックに分割し
て二次記憶に一括登録する。一括登録の開始時に、ユー
ザが指定したサイズのメモリ領域を確保し、確保したメ
モリ上にすべての各文字エントリに対して1つのブロッ
クをそれぞれ割り当てる。登録時に、ブロック内に書き
込む余地が無くなった場合には、そのブロックを二次記
憶に書き出して空にした後登録するようにして、登録途
中でメモリが不足して登録が中断することがないように
した。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文書管理方式に関
し、より詳細には、文字成分表を利用して、全文書に対
して文字列を検索する文字検索方式に関するものであ
る。
【0002】
【従来の技術】従来の文書管理装置について記載した公
知文献としては、例えば、特開平5−324722号公
報がある。この公報のものは、文字列検索において、利
用する文字成分表を小さく抑え、かつ、検索精度を上
げ、高速な文書登録を可能とするために、入力部に入力
された検索文字列は、処理部の文字列入力処理で処理
し、文書検索処理部において、データ部の文字成分表を
利用して文字列を含むと思われる文書を検索する。検索
した文書に対応する文書データを文書出力処理により出
力部に出力し、文書登録処理では、登録する文書を文書
データに登録し、文書データより文字成分を抽出して文
字成分表に登録する。また、検索文字列を文書から検索
する場合、文字成分表として、文字から算出される値が
文書中に存在するか否かを示す1文字成分表及び隣接す
る文字から算出される値が文書中に存在するか否かを示
す隣接文字成分表を利用して文書を検索する。すなわ
ち、文書ごとに出現した文字を記録した文字成分表を用
いて文書を高速に検索するシステムである。
【0003】また、前述した特開平5−324722号
公報や、特開平7−160724号公報に記載のもの
は、文字成分が文書中に存在するか否かを示す単一文字
成分表、及び隣接する文字から抽出したある文字成分が
文書中に存在するか否かを示す隣接文字成分表を利用し
て文書を検索するものであるが、これら従来方法では、
複数の文書を一括して登録する機能がなく、多量の文書
を登録するのに処理時間がかかった。また、本出願人が
先に提案した特願平7−121370号においては、長
い文書を登録した場合には、誤検索が多くなるので、文
書の誤検索を減らすために、文書を分割して登録するよ
うにしたが、その場合に、機械的に一定サイズで分割す
ると文字列が途中で分割されて検索できない場合があっ
た。
【0004】
【発明が解決しようとする課題】上述のように、従来の
方法では、多数の文書を一括して登録する処理が遅く、
また、長い文書を登録した場合には、誤検索が多くなる
ため、文書の誤検索を減らすために文書を分割して登録
していたが、機械的に一定サイズで分割すると文字列が
途中で分割されて検索できない場合があった。本発明
は、上述のごとき従来技術の問題点を改善することを目
的としてなされたものである。
【0005】
【課題を解決するための手段】請求項1の発明は、大量
の文書データを保持し、入力装置から入力された検索文
字列を含む文書を検索し、出力装置により検索した文書
を出力する文書管理方式であって、文書登録時に文書よ
り各文字コード成分及び2文字以上の隣接文字からビッ
ト列成分を算出し、各文書がそれぞれの成分を含むか否
かを示す単一文字成分表及び一つ以上の隣接文字成分表
を生成し、該文字成分表の各文字成分のエントリを複数
のブロックに分割して二次記憶に一括登録する文書管理
方式において、一括登録の開始時に、ユーザが指定した
サイズのメモリ領域を確保し、確保したメモリ上にすべ
ての各文字エントリに対して1つのブロックをそれぞれ
割り当て、登録処理時、ブロック内に書き込む余地が無
くなった場合には、そのブロックを二次記憶に書き出し
て空にした後登録することによって、登録途中でメモリ
が不足して登録を中断することがないようにすることを
特徴とし、多数の文書を一括登録する場合に、登録文書
のデータをメモリ上に置き、処理の最後に二次記憶に書
き出すことによって、高速に登録することを可能とした
ものである。
【0006】請求項2の発明は、大量の文書データを保
持し、入力装置から入力された検索文字列を含む文書を
検索し、出力装置により検索した文書を出力する文書管
理方式であって、文書登録時に文書より各文字コード成
分及び2文字以上の隣接文字からビット列成分を算出
し、各文書がそれぞれの成分を含むか否かを示す単一文
字成分表及び一つ以上の隣接文字成分表を生成し、該文
字成分表の各文字成分のエントリを複数のブロックに分
割して二次記憶に一括登録する文書管理方式において、
一括登録の開始時に、ユーザが指定したサイズのメモリ
領域を確保し、全エントリ数分のブロックで、かつ、数
種類のサイズからなるブロックを確保し、文書の登録処
理時、ブロック内の空きがなくなり、メモリ上に書き出
したデータ量が多いブロックについては大きいサイズの
ブロックを利用することにより、二次記憶へ書き出す回
数を減らし、高速に大量文書を一括登録ができるように
することを特徴とし、多数の文書を一括登録する場合
に、登録文書のデータをメモリ上に置き、処理の最後に
二次記憶に書き出すことによって、高速に登録すること
を可能としたものである。
【0007】請求項3の発明は、登録文書をある一定サ
イズに分割し、それぞれを別文書として登録し、検索時
には、ひとつの文書として検索することにより、長い文
書の適合率を高めるようにした文書管理方式において、
単純に一定サイズに分割すると、通常検索語となるよう
な文字列の途中で二つの文書に分割されてしまい、検索
時に検索できない問題が生ずるが、句読点などのように
検索語の中に通常現れない文字を予め分割区切り文字と
し、一定サイズで機械的に分割した位置が分割区切り文
字でない場合には分割区切り文字までテキストを辿り、
該分割区切り文字まできた時に分割することにより、検
索できなくなる文字列がないようにすることを特徴と
し、登録文書が長い場合に、従来技術では検索精度が低
下したが、上述のごとく文書を分割することで検索精度
の低下を抑え、かつ、分割する位置を検索の対象としな
い文字にすることで検索できない文字列をなくすことを
可能としたものである。
【0008】
【発明の実施の形態】図1は、本発明による文書管理方
式の実施の形態を説明するための構成図で、図中、1は
入力部、2は処理部、3は文字列入力処理部、4は文書
検索処理部、5は文書出力処理部、6は文書登録処理
部、7はデータ部、8は文字成分表、9は出力部、10
は文書データである。
【0009】入力部1に入力された検索文字列は、処理
部2の文字列入力処理部3で処理する。文書検索処理部
4においてデータ部7の文字成分表8を利用して文字列
を含むと思われる文書を検索する。そして、検索した文
書に対応する文書データ10を文書出力処理部5により
出力部9に出力する。文書登録処理部6では、登録する
文書を文書データ10に登録し、該文書データ10より
文字成分を抽出して文字成分表8に登録する。以下の説
明では、対象文書は1バイト文字コード(例えば、AS
CII)及び2バイト文字コード(EUC:Extended
UNIX CODE)からなるテキストデータとする。
しかし、対象とする文字コードはEUC以外にも容易に
適用可能である。
【0010】文書をデータ部7に登録する時には、単一
文字成分及び隣接文字成分を抽出し、文字成分表を作成
する。単一文字成分は各内部文字コードの2バイトコー
ドとし、隣接文字成分は隣接する内部文字コードから変
換したコードである。本実施例では、内部文字コードの
ビット成分を適当に抽出したビット列を隣接文字成分と
する。上記方法で得られた文字成分及び隣接文字成分に
対して、図2及び図3に示すように、それぞれ単一文字
成分表及び隣接文字成分表を生成する。図3では隣接す
る文字の下位1バイトを合わせて2バイトとしている。
各文字成分表は、各単一文字成分または隣接文字成分が
各文書に存在するか否かを0と1で示す。図3の隣接文
字成分表を例とすると、a0a0(16進)のビット列は文
書1、2、3、nには存在せず、文書4、5には存在す
ることを意味する。文書登録時に上記方法により文書か
ら文字成分を抽出し、各文字成分テーブルに加える。
【0011】図4は、一括登録処理の例を説明するため
の図で、図示のように、文字成分表のデータ構成は、イ
ンデックスとビットマップデータからなる。インデック
ス部は文字成分とビットマップデータへのポインタの対
応表である。ビットマップデータは文字成分表の文書中
に文字成分が出現するか否かを示す0,1のデータであ
る。大量の文書を登録する場合にビットマップデータは
巨大になることからメモリ上には置かず二次記憶に置
く。
【0012】多数の文書を一括して登録するには、従来
の方法では、ビットマップデータが二次記憶上にある場
合には、一文書を登録するごとに二次記置にアクセスす
ることになり速度が遅い。そこで、一括登録する文書に
ついては、メモリ上に文字成分表を一時的に生成し、処
理の最後にメモリ上のビットマップデータを二次記憶上
のビットマップデータにアペンドすることによって、二
次記憶へのアクセスを減らし、高速に複数文書の一括登
録を可能とする。すなわち、請求項1の発明のように、
一括登録の開始時に、ユーザが指定したサイズのメモリ
領域を確保し、確保したメモリ上にすべての各文字エン
トリに対して1つのブロックをそれぞれ割り当て、登録
時にブロック内に書き込む余地が無くなった場合には、
そのブロックを二次記憶に書き出して空にした後に登録
することによって、登録途中でメモリが不足して登録を
中断することがないようにする。
【0013】図5は、メモリ上のデータ構成を示す図
で、図中のインデックステーブルの各フィールドについ
て以下に説明する。 ・ブロックポインタ(Block Pointer):ビットマップデ
ータへのポインタ ・最終テキストID(Last ID):ビットマップデータの
最終のテキストID ビットマップブロックの各フィールドを以下に説明す
る。 ・長さ(Length):ビットマップデータのサイズ(ビット
長) ・ビットマップデータ(Bitmap Data):登録テキストの
ビットマップデータ メモリ上のデータ構成は、二次記憶上の文字成分表の構
成に似ているが、大きく違うところは、二次記憶上のビ
ットマップデータのブロックは文字成分エントリごとに
複数持ち、リスト構造をとって可変長の文字エントリを
実現する必要があるが、メモリ上の文字成分表では一つ
のブロックしか持たない。以下に一括登録処理の流れを
示す。
【0014】1.初期化 インデックスをメモリ上のインデックスにロードする。
データブロックとして利用するデータブロック領域をア
ロケートする。データブロック領域のサイズはユーザが
指定し、文字成分表の全文字成分エントリ数で割った値
が一つのデータブロックのサイズとなる。したがって、
全文字エントリに対して一つずつデータブロックを確保
するので、一括登録処理中にデータブロックが足りなく
ならない。 2.登録 (a)エントリIDに対応するデータブロックが存在しな
い場合には、データブロック領域からデータブロックを
アロケートする。 (b)データブロックにビットデータを加える。加えるス
ペースがない場合には、データブロックのデータを二次
記憶に書き出してデータブロックを空にしてから加え
る。 (c)全てのエントリを登録するまで(a)に戻る。 3.後処理 データブロック及びインデックスを二次記憶に書き出
す。
【0015】さらに、二次記憶へのアクセスを減らし、
一括登録処理を高速にするために、初期化時に同じブロ
ックサイズではなく、数種類のサイズのブロックを確保
する。図6は、データブロックの例を示し、図示のよう
に、登録文書中に何度も現れる文字成分、つまり二次記
憶へ書き出すデータ量が多い文字成分については、メモ
リ上の大きなブロック(B2area,B3area)を利用す
ることにより、二次記憶への書き出す回数を減らすこと
ができ、登録速度が早くなる。すなわち、請求項2の発
明のように、一括登録の開始時に、ユーザが指定したサ
イズのメモリ領域を確保し、全エントリ数分のブロック
で、かつ、数種類のサイズからなるブロックを確保し、
文書の登録処理時では、ブロック内の空きがなくなり、
メモリ上に書き出したデータ量が多いブロックについて
は大きいサイズのブロックを利用することにより、二次
記憶へ書き出す回数を減らし高速に大量文書を一括登録
するようにする。以下に詳細な処理の流れを示す。
【0016】1.初期化 インデックスをメモリ上のインデックスにロードする。
データブロックとして利用するデータブロック領域をア
ロケートする。データブロック領域のサイズはユーザが
指定し、全文字成分の全エントリ数分のデータブロック
を生成する。ただし、データブロックのサイズは図6に
示したように複数のサイズをもつ。全文字エントリに対
して一つずつデータブロックを確保するので、一括登録
処理中にデータブロックが足りなくなることはない。 (a)エントリIDに対応するデータブロックが存在しな
い場合には、一番小さいデータブロック(B1)領域か
らデータブロックをアロケートする。ただし、B1領域
がすべて使用されている場合には、B1のデータブロッ
クの中でデータ量が最大であるブロックをB2の空きブ
ロックにコピーする。B2に空きデータブロックがない
場合には、同様の処理を繰り返し、さらに大きなブロッ
クにデータを移動する。あらかじめ全体のブロック数は
全エントリ数分確保しておくので、ブロックが確保でき
ないことはない。 (b)データブロックにビットデータを加える。加えるス
ペースがない場合には、データブロックのデータを、次
に大きいブロックをアロケートして登録する。次に、大
きなブロックの空きがない場合には、前述と同様の処理
を繰り返す。ただし、この場合、空きブロックが見つか
らない場合もあるが、その時は、ブロックのデータを二
次記憶に書き出してデータブロックを空にして、そのま
ま同じブロックを利用する。 (c)全てのエントりを登録するまで(a)に戻る。 2.後処理 データブロック及びインデックスを二次記憶に書き出
す。
【0017】上述のように、予め指定されたサイズより
大きいテキストは、その指定サイズ単位に分割して登録
する。こうすることによって、長いテキストの場合に誤
検索が増えるという問題点を回避することができる。し
かし、指定サイズ単位で分割すると、検索文字列の対象
となる文字列の途中で分割する場合が生じ、その文字列
では検索できなくなる。すなわち、単純に一定サイズに
分割すると通常検索語となるような文字列の途中で二つ
の文書に分割されてしまい、検索時に検索できない問題
が生ずる。しかし、請求項3の発明のように、句読点な
どのように、検索語の中に通常現れない文字を予め分割
区切り文字とし、一定サイズで機械的に分割した位置が
分割区切り文字でない場合には、分割区切り文字までテ
キストを辿り、分割区切り文字に達した時に、該分割区
切り文字で分割するようにすると、検索できなくなる文
字列がないようにすることができる。
【0018】上述のように、登録文書をサイズ単位に分
割する際に、サイズ単位に分割した位置が文字列中なら
ば、そこからテキストの文字列を順に調べ、通常の検索
文字列には含まれない文字の後で分割するようにしたも
のであるが、例えば、以下の文字{「、」(句
点),「。」(読点),「,」(カンマ),「.」(ピリオ
ド),タブ}を通常の検索文字列には含まれない文字と
して分割の区切り文字とする。例えば、 テキスト:文字列の途中で分割すると、その文字列で検
索できなくなる。 において、分割位置を“…分割すると、…”の句
点「、」位置とする。
【0019】上述のごときテキストを分割登録するため
には、テキストIDの管理を行うが、図7に、そのテキ
ストIDの管理について示す。テキストIDは外部テキ
ストIDは外部テキストIDと内部テキストIDの2種
類をもつ。大きなテキストを登録した場合には、前述の
ように幾つかのテキストに分割され、分割された各テキ
ストには、それぞれ内部テキストIDが割り当てられ、
同時に外部テキストIDが一つ割り当てられる。内部テ
キストIDと外部テキストIDの対応は、IDテーブル
によって示される。内部テキストIDは文字成分表のI
Dとして利用され、外部テキストIDはユーザから見た
テキストIDとして利用される。
【0020】
【発明の効果】請求項1の発明は、一括登録の開始時に
ユーザが指定したサイズのメモリ領域を確保し、確保し
たメモリ上にすべての各文字エントリに対して1つのブ
ロックをそれぞれ分り当て、登録時にブロック内に書き
込む余地が無くなった場合には、そのブロックを二次記
憶に書き出して空にした後、登録するようにし、処理の
最後に二次記憶に書き出すようにしたので、登録途中で
メモリが不足して登録を中断することがなく、高速に登
録することが可能となる。
【0021】請求項2の発明は、一括登録の開始時にユ
ーザが指定したサイズのメモリ領域を確保し、全エント
リ数分のブロックで、かつ、数種類のサイズからなるブ
ロックを確保し、文書の登録処理時では、ブロック内の
空きがなくなり、メモリ上に書き出したデータ量が多い
ブロックについては、大きいサイズのブロックを利用す
ることにより、二次記憶へ書き出す回数を減らすように
したので、高速に大量文書を一括登録することができ
る。
【0022】請求項3の発明は、長い文書の適合率を高
めるために、登録文書をある一定サイズに分割し、それ
ぞれを別文書として登録し、検索時にはひとつの文書と
して検索するが、その場合に、単純に一定サイズに分割
すると、通常検索語となるような文字列の途中で二つの
文書に分割されてしまい、検索時に検索できない問題が
生ずる点に鑑み、句読点などのように、検索語の中に通
常現れない文字を予め分割区切り文字とし、一定サイズ
で機械的に分割した位置が分割区切り文字でない場合に
は、分割区切り文字までテキストを辿り、到達した分割
区切り文字で分割するようにしたので、検索できなくな
る文字列がない。また、登録文書が長い場合に、文書を
分割することで検索精度の低下を抑え、かつ、分割する
位置を検索の対象としない文字にすることができ、検索
できない文字列をなくすことができる。
【図面の簡単な説明】
【図1】 本発明が適用される文書管理方式の一例を説
明するためのブロック図である。
【図2】 単一文字成分表の一例を示す図である。
【図3】 隣接文字成分表の一例を示す図である。
【図4】 一括登録処理の一例を説明するための図であ
る。
【図5】 メモリ上のデータ構成を示す図である。
【図6】 データブロックの例を示す図である。
【図7】 テキストIDの管理を説明するための図であ
る。
【符号の説明】
1…入力部、2…処理部、3…文字列入力処理部、4…
文書検索処理部、5…文書出力処理部、6…文書登録処
理部、7…データ部、8…文字成分表、9…出力部、1
0…文書データ。
【手続補正書】
【提出日】平成8年6月10日
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】請求項3
【補正方法】変更
【補正内容】
【手続補正2】
【補正対象書類名】明細書
【補正対象項目名】0016
【補正方法】変更
【補正内容】
【0016】1.初期化 インデックスをメモリ上のインデックスにロードする。
データブロックとして利用するデータブロック領域をア
ロケートする。データブロック領域のサイズはユーザが
指定し、全文字成分の全エントリ数分のデータブロック
を生成する。ただし、データブロックのサイズは図6に
示したように複数のサイズをもつ。全文字エントリに対
して一つずつデータブロックを確保するので、一括登録
処理中にデータブロックが足りなくなることはない。 (a)エントリIDに対応するデータブロックが存在し
ない場合には、一番小さいデータブロック(B1)領域
からデータブロックをエントリIDに対応するデータブ
ロックとしてアロケートする。ただし、B1領域がすべ
て使用されている場合には、B1のデータブロックの中
でデータ量が最大であるブロツクをB2の空きブロック
移動する。B2に空きデータブロックがない場合に
は、同様の処理を繰り返し、さらに大きなブロックにデ
ータを移動する。移動して空いたブロックをエントリI
Dに対応するデータブロックとする。あらかじめ全体の
ブロック数は全エントリ数分確保しておくので、ブロッ
クが確保できないことはない。 (b)エントリIDに対応するデータブロックにビット
データを加える。加えるスペースがない場合には、デー
タブロックのデータを、次に大きいブロックをアロケー
トして登録する。次に、大きなブロックの空きがない場
合には、前述と同様の処理を繰り返す。ただし、この場
合、空きブロックが見つからない場合もあるが、その時
は、ブロックのデータを二次記憶に書き出してデータブ
ロックを空にして、そのまま同じブロックを利用する。 (c)全てのエントリを登録するまで(a)に戻る。 2.後処理 データブロック及びインデックスを二次記憶に書き出
す。

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 大量の文書データを保持し、入力装置か
    ら入力された検索文字列を含む文書を検索し、出力装置
    により検索した文書を出力する文書管理方式であって、
    文書登録時に文書より各文字コード成分及び2文字以上
    の隣接文字からビット列成分を算出し、各文書がそれぞ
    れの成分を含むか否かを示す単一文字成分表及び一つ以
    上の隣接文字成分表を生成し、該文字成分表の各文字成
    分のエントリを複数のブロックに分割して二次記憶に一
    括登録する文書管理方式において、一括登録の開始時
    に、ユーザが指定したサイズのメモリ領域を確保し、確
    保したメモリ上にすべての各文字エントリに対して1つ
    のブロックをそれぞれ割り当て、登録処理時、ブロック
    内に書き込む余地が無くなった場合には、そのブロック
    を二次記憶に書き出して空にした後登録することによっ
    て、登録途中でメモリが不足して登録を中断することが
    ないようにすることを特徴とする文書管理方式。
  2. 【請求項2】 大量の文書データを保持し、入力装置か
    ら入力された検索文字列を含む文書を検索し、出力装置
    により検索した文書を出力する文書管理方式であって、
    文書登録時に文書より各文字コード成分及び2文字以上
    の隣接文字からビット列成分を算出し、各文書がそれぞ
    れの成分を含むか否かを示す単一文字成分表及び一つ以
    上の隣接文字成分表を生成し、該文字成分表の各文字成
    分のエントリを複数のブロックに分割して二次記憶に一
    括登録する文書管理方式において、一括登録の開始時
    に、ユーザが指定したサイズのメモリ領域を確保し、全
    エントリ数分のブロックで、かつ、数種類のサイズから
    なるブロックを確保し、文書の登録処理時、ブロック内
    の空きがなくなり、メモリ上に書き出したデータ量が多
    いブロックについては大きいサイズのブロックを利用す
    ることにより、二次記憶へ書き出す回数を減らし、高速
    に大量文書を一括登録ができるようにすることを特徴と
    する文書管理方式。
  3. 【請求項3】 登録文書をある一定サイズに分割し、そ
    れぞれを別文書として登録し、検索時にはひとつの文書
    として検索することにより、長い文書の適合率を高める
    ようにした文書管理方式において、検索語の中に通常現
    れない文字を予め分割区切り文字とし、一定サイズで機
    械的に分割した位置が分割区切り文字でない場合には前
    記分割区切り文字までテキストを辿り、該分割区切り文
    字で分割するようにすることを特徴とする文書管理方
    式。
JP7224910A 1995-09-01 1995-09-01 文書管理方式 Pending JPH0969113A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7224910A JPH0969113A (ja) 1995-09-01 1995-09-01 文書管理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7224910A JPH0969113A (ja) 1995-09-01 1995-09-01 文書管理方式

Publications (1)

Publication Number Publication Date
JPH0969113A true JPH0969113A (ja) 1997-03-11

Family

ID=16821080

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7224910A Pending JPH0969113A (ja) 1995-09-01 1995-09-01 文書管理方式

Country Status (1)

Country Link
JP (1) JPH0969113A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10360183B2 (en) 2015-10-09 2019-07-23 Fujitsu Limited Encoding device, encoding method, decoding device, decoding method, and computer-readable recording medium

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04111064A (ja) * 1990-08-31 1992-04-13 Hitachi Ltd 並列ストリング・サーチ装置
JPH06290217A (ja) * 1993-03-31 1994-10-18 Ricoh Co Ltd 文書検索方式

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04111064A (ja) * 1990-08-31 1992-04-13 Hitachi Ltd 並列ストリング・サーチ装置
JPH06290217A (ja) * 1993-03-31 1994-10-18 Ricoh Co Ltd 文書検索方式

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10360183B2 (en) 2015-10-09 2019-07-23 Fujitsu Limited Encoding device, encoding method, decoding device, decoding method, and computer-readable recording medium

Similar Documents

Publication Publication Date Title
US5201048A (en) High speed computer system for search and retrieval of data within text and record oriented files
JPH11120203A (ja) データベースを合併する方法およびデータベースからドキュメントを検索する装置
JP3003915B2 (ja) 単語辞書検索装置
KR20010022028A (ko) 데이터-베이스 구조
JPH08329116A (ja) 構造化文書検索方法
US5682543A (en) Dictionary editing apparatus
JPH0969113A (ja) 文書管理方式
JPH056398A (ja) 文書登録装置及び文書検索装置
JP3565840B2 (ja) 文書管理方法および文書管理装置
JP2675958B2 (ja) 情報検索用計算機システム及びその記憶装置の動作方法
JPH03194653A (ja) 情報検索システムにおける略語検索法
JPH03137772A (ja) データベース利用システム
JP2874810B2 (ja) キーの記憶割り当て方法
JP2001067368A (ja) 多言語文書処理装置、多言語文書処理方法及び記録媒体
JP4061283B2 (ja) 字句をデータに変換する装置、方法及びプログラム
JPH10301940A (ja) 情報処理装置及びその方法
JP2615046B2 (ja) レコード追加処理方法
JPH07109603B2 (ja) 情報検索処理方式および検索ファイル作成装置
Turba Length-segmented lists
JPH0748218B2 (ja) 情報処理装置
JPH0290364A (ja) 機械翻訳システムの対訳辞書及び共起関係辞書の作成方法
JPH0721212A (ja) 文書処理装置
JPH08180060A (ja) 電子辞書表示装置
JPH0785040A (ja) 表記不統一検出方法およびかな漢字変換方法
JPH08235197A (ja) 文字列管理装置及び辞書管理装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040406