JP3288063B2 - 可変長データの格納および参照システム - Google Patents

可変長データの格納および参照システム

Info

Publication number
JP3288063B2
JP3288063B2 JP35967591A JP35967591A JP3288063B2 JP 3288063 B2 JP3288063 B2 JP 3288063B2 JP 35967591 A JP35967591 A JP 35967591A JP 35967591 A JP35967591 A JP 35967591A JP 3288063 B2 JP3288063 B2 JP 3288063B2
Authority
JP
Japan
Prior art keywords
length data
data
variable length
storage
variable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP35967591A
Other languages
English (en)
Other versions
JPH05181719A (ja
Inventor
寛 高田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NS Solutions Corp
Original Assignee
NS Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NS Solutions Corp filed Critical NS Solutions Corp
Priority to JP35967591A priority Critical patent/JP3288063B2/ja
Priority to DE69229521T priority patent/DE69229521T2/de
Priority to EP92106939A priority patent/EP0510634B1/en
Priority to US07/873,130 priority patent/US5450580A/en
Publication of JPH05181719A publication Critical patent/JPH05181719A/ja
Priority to US08/471,459 priority patent/US5546578A/en
Application granted granted Critical
Publication of JP3288063B2 publication Critical patent/JP3288063B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、可変長データの格納お
よび参照システムに関し、特にデータベースから必要な
情報を取り出すためのデータベース検索システムにおい
て検索されるデータが可変長データである場合のそのデ
ータの格納および参照システムに関する。
【0002】
【従来の技術】従来、データベースへのデータの格納お
よび参照(アクセス)の高速化を図るものとしては、全
レコードを固定サイズ、たとえばLバイトの長さとする
方法が知られている。この方法によれば、たとえばn番
目のレコードにアクセスするときには、ファイルの先頭
からn×Lバイトの位置を読み出しにいけばよいから、
格納位置の指定を高速で行うことができる。しかしなが
ら、この方法では、レコードサイズを一定にするため、
所定のサイズに満たないデータについては無意味なダミ
ーの文字を加える必要があり、一般にデータサイズが大
きくなってしまうという欠点がある。
【0003】これに対して、可変長データを連続して記
憶媒体に書き込んでゆく方法によれば、上記のように無
意味なダミーの文字を加える必要はなく、データサイズ
が膨らんでしまうことはない。しかし、この方法によれ
ばデータのサイズがそれぞれ異なるため、アクセス時に
は順番にレコードを参照しなければならず、参照(格
納)位置を即座に得ることができない。したがって、ア
クセス速度が遅くなるという欠点がある。
【0004】
【発明が解決しようとする課題】上記のように、従来の
可変長データの格納および参照方法は、データサイズが
大きくなるか、またはアクセス速度が遅くなるというい
ずれかの欠点を有していた。
【0005】本発明は、上記のような従来の欠点を解消
し、データサイズを小さくし、しかもアクセス速度を高
速にすることのできる可変長データの格納および参照シ
ステムを提供することを目的とする。
【0006】
【課題を解決するための手段】本発明の可変長データの
格納および参照システムは、検索キーに基づいて検索対
象の複数の可変長データから情報を検索するための可変
長データの格納および参照システムにおいて、前記可変
長データを記憶する可変長データ記憶手段と、前記可変
長データ記憶手段に記憶される可変長データにIDを割
り当てるID割当手段と、前記検索対象のi番目の可変
長データのj番目のデータCi,jと、当該データCi,j
近傍データCi,kとに基づいて複数の量子化量を算出す
る量子化量算出手段と、近傍特徴量として前記複数の量
子化量の組合せを前記IDと共に記憶する量子化量記憶
手段と、前記可変長データ記憶手段における前記可変長
データの格納位置を、前記ID割当手段により割り当て
られた前記IDに対応させて記憶する格納位置記憶手段
とを具備し、前記可変長データの格納時には、格納され
る可変長データの量子化量を前記量子化量記憶手段に記
憶すると共に、前記格納される可変長データの前記ID
および格納位置を前記格納位置記憶手段に記憶し、前記
可変長データの参照時には、前記検索キーに基づいて前
記量子化量記憶手段に対して検索を行い、前記検索の結
果、抽出された可変長データのIDをもとに前記格納位
置記憶手段で格納位置を特定して前記可変長データ記憶
手段から前記可変長データを読み出すことを特徴とす
る。
【0007】
【作用】本発明によれば、検索対象物件である全ての可
変長データから事象(情報)の位相情報を全て捨象した
近傍特徴量データを作成し、そのデータ群に対して全物
件検索を行う。データの格納時には、記憶されるデータ
のIDおよび格納位置を格納位置記憶手段に記憶し、デ
ータの参照時には、格納位置記憶手段からデータの格納
位置を読み出して記憶手段にアクセスする。したがっ
て、全物件に対してあいまい検索を高速にでき、且つ検
索結果のデータの格納位置を即座に得ることができるか
ら、記憶手段に高速でアクセスすることができる。ま
た、データを固定長にするためにダミーデータを付ける
必要がないから、記憶されるデータの量を少なくし、記
憶媒体の容量を小さくできる。
【0008】
【実施例】図1には、本発明によるシステムの一実施例
が示されている。同図に示すように、可変長データの格
納時には、データD1は記憶媒体のデータ格納部16
に、データA、データB、データCの順に書き込まれ
る。図1に示す例では、データA、データBの長さは1
00、40である。したがって、ID格納位置対応表1
4に示すように、データAは格納位置0、データBは格
納位置100、データCは格納位置140に、それぞれ
書き込まれ、その書き込まれた位置がID格納位置対応
表14に記憶される。
【0009】データD1はまた、ID割当部12に送ら
れ、データの通番(ID)が割り当てられる。データの
通番(ID)は、ID格納位置対応表14に示すよう
に、データごとに与えられる通番である。本例では、デ
ータA、データB、データCに1、2、3がそれぞれI
Dとして与えられる。割り当てられたデータのIDはI
D格納位置対応表14に送られ記憶される。
【0010】このようにしてデータD1の格納時にはデ
ータD1がデータ格納部16に格納されるとともに、デ
ータIDおよびそのデータの格納位置がID格納位置対
応表14に記憶される。
【0011】可変長データの参照(読み出し)時には、
参照要求のあったデータまたはそのIDがID割当部1
2に送られ、ID割当部12からこのデータのIDが出
力される。データのIDはID格納位置対応表14に送
られ、ID格納位置対応表14から格納位置が出力され
る。出力された格納位置に基づき、データ格納部16か
らデータが読み出され、データ一時格納部18に格納さ
れる。データ一時格納部18に格納されたデータは、操
作者の要求に応じてCRTなどの出力部に出力され、参
照される。
【0012】ID割当部12およびデータ一時格納部1
8は高速でアクセス可能な記憶媒体によって構成され、
ID格納位置対応表14およびデータ格納部16は低速
でアクセス可能な記憶媒体によって構成される。したが
って、データが記憶されるデータ格納部16は低速でア
クセスする安価な記憶媒体によって構成されているか
ら、データ格納部16の容量を充分大きくすることがで
きる。また、ID割当部12およびデータ一時格納部1
8は高速でアクセス可能な記憶媒体によって構成されて
いるから、データの記憶時におけるIDの割り当て、お
よびデータ格納部16から読み出されデータ一時格納部
18に格納されたデータの参照は高速で行うことができ
る。
【0013】本実施例によれば、上記のように可変長デ
ータの格納時には、データD1がデータ格納部16に格
納されるとともに、それぞれのデータに割り当てられた
IDおよびそのデータの格納位置がID格納位置対応表
14に記憶される。参照(読み出し)時には、参照要求
のあったデータがID割当部12に送られ、ID割当部
12からこのデータのIDが出力されてID格納位置対
応表14に送られ、ID格納位置対応表14から格納位
置が出力され、出力された格納位置に基づき、データ格
納部16からデータが読み出される。
【0014】したがって、ID格納位置対応表14に記
憶されたデータIDとデータの格納位置との対応を用い
てデータの格納位置を読み出すから、レコードへのアク
セス位置を即座に得ることができ、データの読み出し
(検索)を高速で行うことができる。
【0015】また、データの記憶時にレコードサイズを
一定にする必要がなく、データにダミーデータを加える
ことがないため、記憶されるデータの量が大きくなる欠
点もない。
【0016】次に、本発明による可変長データの格納お
よび参照システムの可変長データの格納手順および参照
手順についてより詳細に説明する。
【0017】図2は、本発明による可変長データの格納
および参照システムにおいて、可変長データをあいまい
検索するためのデータの格納および参照を行う手順を示
すデータフロー図である。本システムでは、予め検索対
象物件である全ての可変長データから事象(情報)の位
相情報を全て捨象した自己相関データを作成し、そのデ
ータ群に対して全物件検索を行う。格納ステップでは、
物件毎に近傍特徴量行列が位相情報として作成される。
図2では、検索対象10である可変長データから自己相
関行列(近傍特徴量行列30)を作成し、それを構造フ
ァイル40に保存するまでのステップが格納ステップに
該当する。また、参照ステップでは、検索キーに対して
格納ステップと同様の処理を行い、検索キーの近傍特徴
量が求められる。そして、この検索キーの近傍特徴量
と、物件の近傍特徴量とのマッチング演算が行なわれ、
物件ごとにマッチング度(類似度)を示す評価結果を得
る。図2では、検索キー50をもとに検索S4にて構造
ファイル40の物件データとのマッチング演算を行い、
評価結果リスト70あるいはソート済みリスト80のよ
うに結果を出力するまでのステップが参照ステップに該
当する。
【0018】(1)格納ステップ 図2に於いて、検索対象10は、例えば日本語、英語、
ドイツ語、フランス語、ヘブライ語、ロシア語などの文
書データ、或いは量子化された波形数値データ、化学構
造式、遺伝子情報などの可変長データである。このよう
な検索対象に対して、まず正規化手段S1により正規化
の処理を行う。一般に検索対象は、情報の最小単位(文
書であればアルファベットなどの文字、数値チャートで
あれば、ある時刻における実数値など)の列で表現され
ている。それをなんらかの方法でn階調の整数列に変換
する。これをデータの正規化と呼ぶ。
【0019】例えば、英文書データの場合、ASCII
コード表をそのまま用いることにより、次のような25
6階調の数値表現として実現される。 …… This is a pen. …… 84|104 |105 |115 |32|105 |115 |32|97|32|
112 |101 |110 |46|
【0020】上記のコードにおいては、Tが84、hが10
4 ..と対応している。
【0021】次に、正規化された可変長データ20か
ら、学習手段S2により近傍特徴量が算出され、以下に
説明する手順で近傍特徴量行列30の形式に畳込まれ
る。ここで近傍特徴量をとる演算式は種々考えられる。
この演算式は検索の鋭さ(過検出の少なさ)にも影響を
与える。
【0022】学習手段S2の一例として、正規化された
可変長データ20から量子化量を求め、この量子化量を
用いて近傍特徴量行列30を得る手順を説明する。例え
ば、図4に示すように、検索される対象物件が複数ある
とし、そのうちi番目の物件の量子化について考える。
ここで、i番目の物件(文書)のj番目のデータ(文
字)をCi,jとし、Ci,jのk近傍に関するデータをC
i,j+1,Ci,j+2,....,Ci,j+kとする。i番目の
物件において、図3に示すように正規化された数値列13
5,64,37,71,101,...が並んでいるとすると、C
i,jに関する量子化量xおよびCi,jの前方k近傍に関す
る量子化量yは、 x=f(Ci,j) y=g(Ci,j,Ci,j+1,Ci,j+2,....,Ci,j+k) ・・・式(1 ) で求められる。
【0023】ここで、f(Ci,j)はCi,jに関するn段
階量子化関数である。すなわち、i番目の物件のj番目
のデータCi,jについて所定の演算を行って得られる値
であり、1〜nのいずれかの整数で表される。したがっ
て、このn段階量子化関数fの演算により得られた量子
化量xの値によって、図4に示す行列(座標)における
x軸方向の位置が1〜nの範囲で定まる。
【0024】また、g(Ci,j,Ci,j+1
i,j+2,....,Ci,j+k)は、Ci,jの前方k近傍
に関するm段階量子化関数である。すなわち、i番目の
物件のj番目のデータCi,jと、そのデータCi,jの近傍
の所定数のデータCi,j+1,Ci,j+2,....,C
i,j+kについて所定の演算を行って得られる値であり、
1〜mのいずれかの整数で表される。たとえば、図3に
示すようにj番目のデータCi,jが135であり、kが3の
場合には、Ci,j+1,Ci,j+2,Ci,j+3としてデータ135
に続くデータ64、37、71を抽出し、これらのデータとデ
ータ135との相関について所定の演算を行う。j番目の
データCi,jが次の64の場合には、Ci,j+1,Ci,j+2
i,j+3としてデータ64に続くデータ37、71、101を抽出
し、これらのデータとデータ64との相関について所定の
演算を行う。このようにして、m段階量子化関数gの演
算により得られた量子化量yの値によって、図4に示す
行列(座標)におけるy軸方向の位置が1〜mの範囲で
定まる。
【0025】したがって、前記のように正規化された可
変長データ20から量子化量x、yを求めることによっ
て、図4に示す行列(座標)における位置が定まる。な
お、量子化量を求める演算式f()、g()としては種
々あるが、例えば、 f:x→x g:(x,y)→x−y (または|x−y|) ・・・式(2) のように、演算式f()は入力された値をそのまま量子
化量とし、演算式g()は入力された2つの値の差、あ
るいは差の絶対値を量子化量とする例が考えられる。こ
の場合、正規化された可変長データ20が、先の例84|
104|105|115....では、データCi,jを84とする
と、Ci,jとCi,jの前方k近傍とに関する量子化量x,
yの座標位置は、(84,20)、(84,21)、(84,3
1)、....となる。また、この式(2)以外にも、
幾つかの文字列の個々の文字整数値に対して四則演算を
施すことにより近傍特徴量を取り出してもよい。図3中
に示した量子化量x,yの座標位置(51,71)、(32,
103)、....は、前記式(2)とは異なる手法によ
って求めたものである。
【0026】本システムでは、各物件情報は、上記のよ
うにして求めたx、yに対して物件の通番iと重みw
(x,y,i)の組として記憶される。重みw(x,y,i)は、デ
ータx、y、iから所定の演算によって求められるが、
通常は重みw(x,y,i)の値は1に固定される。
【0027】上述のようにして、各物件についてデータ
i,jごとに求められた量子化量x,yの値に基づき、
図4に棒によって示されるように、データを記憶する。
すなわち、データCi,jの量子化量x、yの値により定
められる座標の位置に、その物件の通番iとその重みw
(x,y,i)とを組みとしたデータを記憶する。同図
では、このようなデータが記憶されるごとに棒の長さが
延びるように表されている。通常は、重みw(x,y,
i)は1とされるから、物件の通番iのデータのみが
x、yの値により定められる座標の位置に記憶されてゆ
く。
【0028】この様にして作成された近傍特徴量行列
に、物件の識別番号を付加して構造ファイル40として
保存する。この構造ファイル40に保存された識別番号
は、図1に示すID格納位置対応表14のIDとして、
対応する格納位置とともに記憶される。
【0029】(2)参照ステップ まず、検索キー50を入力する。例えば、“This is a
pen.”を検索キーとする。この検索キー50に対して、
格納ステップでの正規化手段S1と同一の正規化方法に
基づく正規化手段S3によりキー情報を以下の整数列に
正規化する。84|104|105|115|32|105|115|32|9
7|32|112|101|110|46|
【0030】次に、検索手段S4において、格納ステッ
プでの学習手段S2と同一の近傍特徴量抽出式f()、
g()を用いて、正規化された検索キー50の数値列の
先頭から量子化量x、yの組の系列を作成する。次に、
この検索キー50の量子化量x、yの組の系列に基づい
て、構造ファイル40内から取り出した物件iに対する
検索キー50の含有度数ωiとして、V(xj,yj
i)をj=1〜mについて合計することにより算出す
る。
【0031】ただし、V(xj,yj,i)は、構造ファ
イル40に記憶された物件iの重みに等しく、重みを持
たない場合には0と定める。
【0032】したがって、検索キー50の数値列から求
めた量子化量x、yの組に対応する図4の量子化量x、
yの位置にデータがある場合(棒がある場合)には、別
に設けられた記憶手段のそのデータに示される物件の通
番iの格納箇所にその重みの値を構造評価値score(合
致度)として記憶させる。
【0033】次に、評価結果出力手段S5において、構
造ファイル40内の物件毎に得られた構造評価値score
(合致度)を完全一致の場合の評価値で割って、検索キ
ー50の含有確率を求め、評価結果のリスト70を得
る。更に、ソート手段S6において、このリスト70を
含有確率の降順にソートしソート済みリスト80を得
る。
【0034】このソート済みリスト80が検索結果であ
り、その上位物件を参照することにより、検索キーが物
件中に含まれている確率が高い物件名を知ることができ
る。含有確率は、完全一致及び不完全一致の全てについ
て求まるから、あいまい一致検索を行なうことができ
る。
【0035】また、検索キーの全情報についての全物件
探索であるから、検索もれが発生する確率は、本質的に
零であると言う特徴がある。
【0036】また、1つの物件に対する検索キーの評価
時間は、キーの文字数のみに依存し、物件の大きさには
依存しない。従って、非常に高速に検索を行なうことが
できる。
【0037】このようなデータ検索システムにおいて、
前記のような可変長データの格納および参照方法を用い
ることにより、高速なあいまい検索の結果、抽出された
物件について、当該物件データへのアクセスを高速で行
うことができるとともに、記憶容量を節約することがで
きる。
【0038】また検索結果のリストどうしの論理演算を
行うことにより、検索条件に対するAND、ORなどの
検索演算処理も高速に実行できる。
【0039】自己相関情報は、各物件の全データを対象
とし取り出さなくてもよい。例えば、物件データ中の特
定の一つまたは一つ以上の整数値、特定の範囲の整数
値、或いはデータ列を構成する各バイト中の特定の1つ
または一つ以上のビットを除外して近傍特徴量を作成
(抽出)してもよい。また日本語文書のように2バイト
文字で構成されている場合には、例えば上位バイトを除
外して下位バイトを対象として自己相関情報を取り出し
てもよい。
【0040】上述の例では、近傍特徴量行列は、256
次のビット行列であり、これは8Kバイトに相当する。
従って、1物件のデータが1K バイト程度であるデータ
ベースでは、効率のよいシステムであるとは言えない。
そこで上記のようなデータ圧縮手段S7を設けてデータ
圧縮を行なって構造ファイル40の容量を減らすのがよ
い。
【0041】図5にデータ圧縮法の一例を示す。この例
では、256次の自己相関行列の各要素毎に要素値が1
である物件名40a(識別コード)を1バイト/件のデ
ータ列として蓄積する。従って、要素値が0である物件
名は不要データとして除外する。
【0042】物件数が255個以上ある場合には、物件
名40aは1バイトで表せないので、下位の1バイトの
みを蓄積する。例えば、物件数が1万件の場合、物件名
は2バイトで表されるが、そのうちの下位1バイトを使
用する。そして物件名コードが255を越える毎にデー
タ列にマーカ40bを挿入する。
【0043】検索時には、検索キーの近傍特徴量の各々
に該当する構造ファイルのデータ列を取り出し、物件名
毎の出現度数テーブルを作成する。この際、マーカ40
bを越える毎に物件名コードに255を加える。このよ
うにして作成した出現度数テーブルに基づいて図2の評
価結果リスト70が得られる。
【0044】なお物件名コードのデータ列が例えば全物
件中の半分以上ある場合には、その近傍特徴量行列要素
は各物件について共通であると見なして、その要素を削
除してもよい。
【0045】上述の実施例において,正規化手段S1、
学習手段S2、正規化手段S3、検索手段S4、評価結
果出力手段S5、ソート手段S6、データ圧縮手段S7
は、コンピュータプログラムによって構成することがで
きるが、論理回路素子を用いて専用のハードウエアを構
成してもよい。
【0046】
【発明の効果】本発明のシステムによれば、記憶装置に
格納された全ての可変長データに対してあいまい検索を
高速にでき、しかも検索結果のデータの格納位置を即座
に求めることができるから、記憶されたデータに高速で
アクセスすることができる。また、データを固定長のブ
ロックにする必要がないのでダミーデータが不要とな
り、記憶容量を小さくすることができる。
【図面の簡単な説明】
【図1】本発明による可変長データの格納および参照シ
ステムの一実施例のデータフロー図である。
【図2】本発明による格納および参照システムを適用す
るデータベース検索システムのデータフロー図である。
【図3】近傍情報の量子化を示す図である。
【図4】記憶される情報構造を示す図である。
【図5】圧縮された近傍特徴量のデータ構成図である。
【符号の説明】
10 検索対象 12 ID割当部 14 ID格納位置対応表 16 データ格納部 18 データ一時格納部 20 正規化データ 30 自己相関行列 40 構造ファイル 50 検索キー 60 正規化キー 70 評価結果リスト 80 ソート済みリスト S1 正規化手段 S2 学習手段 S3 正規化手段 S4 検索手段 S5 評価結果出力手段 S6 ソート手段 S7 データ圧縮手段
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭58−51348(JP,A) 特開 昭62−191924(JP,A) 特開 平2−1059(JP,A) 特開 平3−123973(JP,A) 特開 昭63−211429(JP,A) 特開 平2−96850(JP,A) 特開 平3−62137(JP,A) 特開 平3−246645(JP,A) 特開 平3−282841(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06F 17/30 G06F 12/00 JICSTファイル(JOIS)

Claims (6)

    (57)【特許請求の範囲】
  1. 【請求項1】 検索キーに基づいて検索対象の複数の可
    変長データから情報を検索するための可変長データの格
    納および参照システムにおいて、 前記可変長データを記憶する可変長データ記憶手段と、 前記可変長データ記憶手段に記憶される可変長データに
    IDを割り当てるID割当手段と、 前記検索対象のi番目の可変長データのj番目のデータ
    i,jと、当該データCi,jの近傍データCi,kとに基づ
    いて複数の量子化量を算出する量子化量算出手段と、 近傍特徴量として前記複数の量子化量の組合せを前記I
    Dと共に記憶する量子化量記憶手段と、 前記可変長データ記憶手段における前記可変長データの
    格納位置を、前記ID割当手段により割り当てられた前
    記IDに対応させて記憶する格納位置記憶手段とを具備
    し、 前記可変長データの格納時には、格納される可変長デー
    タの量子化量を前記量子化量記憶手段に記憶すると共
    に、前記格納される可変長データの前記IDおよび格納
    位置を前記格納位置記憶手段に記憶し、前記可変長デー
    タの参照時には、前記検索キーに基づいて前記量子化量
    記憶手段に対して検索を行い、前記検索の結果、抽出さ
    れた可変長データのIDをもとに前記格納位置記憶手段
    で格納位置を特定して前記可変長データ記憶手段から前
    記可変長データを読み出すことを特徴とする可変長デー
    タの格納および参照システム。
  2. 【請求項2】 検索キーに基づいて検索対象の複数の可
    変長データから情報を検索するための可変長データの格
    納および参照システムにおいて、 前記可変長データを記憶する可変長データ記憶手段と、 前記可変長データ記憶手段に記憶される可変長データに
    IDを割り当てるID割当手段と、 前記検索対象のi番目の可変長データのj番目のデータ
    i,jと、当該データCi,jの近傍データCi,kとに基づ
    いて複数の量子化量を算出する量子化量算出手段と、 近傍特徴量として前記複数の量子化量をそれぞれ近傍特
    徴量行列座標の各軸の要素値とする座標位置に、可変長
    データの前記IDを記憶する量子化量記憶手段と、 前記可変長データ記憶手段における前記可変長データの
    格納位置を、前記ID割当手段により割り当てられた前
    記IDに対応させて記憶する格納位置記憶手段とを具備
    し、 前記可変長データの格納時には、格納される可変長デー
    タの量子化量を前記量子化量記憶手段に記憶すると共
    に、前記格納される可変長データの前記IDおよび格納
    位置を前記格納位置記憶手段に記憶し、前記可変長デー
    タの参照時には、前記検索キーに基づいて前記量子化量
    記憶手段に対して検索を行い、前記検索の結果、抽出さ
    れた可変長データのIDをもとに前記格納位置記憶手段
    で格納位置を特定して前記可変長データ記憶手段から前
    記可変長データを読み出すことを特徴とする可変長デー
    タの格納および参照システム。
  3. 【請求項3】 前記量子化量記憶手段に対する検索で
    は、前記量子化量算出手段で前記検索キーについて複数
    の量子化量を算出し、前記検索対象の近傍特徴量との合
    致度を求めることを特徴とする請求項1または2の可変
    長データの格納および参照システム。
  4. 【請求項4】 前記可変長データ毎の合致度を前記検索
    キーの近傍特徴量の完全一致度数で割った値を、前記可
    変長データ毎の検索キーの含有確率として算出する含有
    率算出手段を更に有することを特徴とする請求項3の可
    変長データの格納および参照システム。
  5. 【請求項5】 前記近傍データCi,kが複数あることを
    特徴とする請求項1〜4の何れか1項の可変長データの
    格納および参照システム。
  6. 【請求項6】 前記近傍特徴量は、各可変長データ中の
    データの一部のみを用いて生成された値であることを特
    徴とする請求項1〜5の何れか1項の可変長データの格
    納および参照システム。
JP35967591A 1991-04-25 1991-12-27 可変長データの格納および参照システム Expired - Lifetime JP3288063B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP35967591A JP3288063B2 (ja) 1991-12-27 1991-12-27 可変長データの格納および参照システム
DE69229521T DE69229521T2 (de) 1991-04-25 1992-04-23 Datenbankauffindungssystem
EP92106939A EP0510634B1 (en) 1991-04-25 1992-04-23 Data base retrieval system
US07/873,130 US5450580A (en) 1991-04-25 1992-04-24 Data base retrieval system utilizing stored vicinity feature valves
US08/471,459 US5546578A (en) 1991-04-25 1995-06-06 Data base retrieval system utilizing stored vicinity feature values

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP35967591A JP3288063B2 (ja) 1991-12-27 1991-12-27 可変長データの格納および参照システム

Publications (2)

Publication Number Publication Date
JPH05181719A JPH05181719A (ja) 1993-07-23
JP3288063B2 true JP3288063B2 (ja) 2002-06-04

Family

ID=18465718

Family Applications (1)

Application Number Title Priority Date Filing Date
JP35967591A Expired - Lifetime JP3288063B2 (ja) 1991-04-25 1991-12-27 可変長データの格納および参照システム

Country Status (1)

Country Link
JP (1) JP3288063B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06274193A (ja) * 1993-03-17 1994-09-30 Nippon Steel Corp データベース検索システム

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5233255B2 (ja) 2007-11-30 2013-07-10 セイコーエプソン株式会社 可変長データ格納装置、可変長データ格納方法、可変長データ読出方法及びそのプログラム
JP2013101470A (ja) * 2011-11-08 2013-05-23 Toshiba Corp データベース圧縮装置

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5851348A (ja) * 1981-09-22 1983-03-26 Nec Corp 可変長レコ−ドの高速アクセス方式
JPS62191924A (ja) * 1986-02-18 1987-08-22 Matsushita Electric Ind Co Ltd 情報登録検索装置
JP2605706B2 (ja) * 1987-02-27 1997-04-30 日本電気株式会社 可変長情報処理装置
JPH021059A (ja) * 1988-06-07 1990-01-05 Hitachi Ltd 連想検索システム
JPH0296850A (ja) * 1988-10-03 1990-04-09 Fujitsu Ltd 可変長データの削除・復元処理方式
JPH0362137A (ja) * 1989-07-28 1991-03-18 Nec Corp 可変長ブロック群による長大データの格納方法
JPH03123973A (ja) * 1989-10-06 1991-05-27 Ricoh Co Ltd 文書検索方法
JPH03246645A (ja) * 1990-02-23 1991-11-05 Nec Corp データ管理方式
JPH03282841A (ja) * 1990-03-30 1991-12-13 Nec Corp 可変長レコードの直接入出力処理方式

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06274193A (ja) * 1993-03-17 1994-09-30 Nippon Steel Corp データベース検索システム

Also Published As

Publication number Publication date
JPH05181719A (ja) 1993-07-23

Similar Documents

Publication Publication Date Title
US5450580A (en) Data base retrieval system utilizing stored vicinity feature valves
US6138114A (en) Sort system for merging database entries
US5745745A (en) Text search method and apparatus for structured documents
KR100688121B1 (ko) 표형식 데이터의 검색,집계,소트방법 및 장치
US6862602B2 (en) System and method for rapidly identifying the existence and location of an item in a file
US6678687B2 (en) Method for creating an index and method for searching an index
JP2833580B2 (ja) 全文インデックス作成装置および全文データベース検索装置
EP0775963A2 (en) Indexing a database by finite-state transducer
EP0520232A2 (en) Method and apparatus for saving and retrieving functional results
JP2888188B2 (ja) 情報検索装置
JP3258063B2 (ja) データベース検索システム及び方法
US5398335A (en) Virtually updating data records by assigning the update fractional addresses to maintain an ordinal relationship without renumbering original records
JP3518933B2 (ja) 構造化文書検索方法
JP3151730B2 (ja) データベース検索システム
JP3288063B2 (ja) 可変長データの格納および参照システム
JPH064584A (ja) 文章検索装置
JPH05101102A (ja) 検索装置
JP3081093B2 (ja) 索引作成方法およびその装置と文書検索装置
JP3259781B2 (ja) データベース検索システムおよびデータベース検索方法
JP2993540B2 (ja) 昇順整数列データの圧縮および復号システム
JP2993539B2 (ja) データベース検索システムおよびその方法
JP2000090115A (ja) インデクス作成方法および検索方法
JP3344755B2 (ja) 昇順整数列データの圧縮および復号システム
JPH06162096A (ja) レコード検索方法
JP3036246B2 (ja) 情報検索装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20020205

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090315

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100315

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100315

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110315

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110315

Year of fee payment: 9

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120315

Year of fee payment: 10

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120315

Year of fee payment: 10