JPH0484367A - 記号列照合装置の制御方式 - Google Patents

記号列照合装置の制御方式

Info

Publication number
JPH0484367A
JPH0484367A JP2199659A JP19965990A JPH0484367A JP H0484367 A JPH0484367 A JP H0484367A JP 2199659 A JP2199659 A JP 2199659A JP 19965990 A JP19965990 A JP 19965990A JP H0484367 A JPH0484367 A JP H0484367A
Authority
JP
Japan
Prior art keywords
symbol string
symbol
cell
matching
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2199659A
Other languages
English (en)
Inventor
Masato Motomura
真人 本村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2199659A priority Critical patent/JPH0484367A/ja
Publication of JPH0484367A publication Critical patent/JPH0484367A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、情報処理システムの構成要素に係り、より具
体的には複数の被照合記号列の中から照合記号列と特定
の関係にある被照合記号列を検索する記号列照合装置の
制御方式に関するものである。
(従来の技術) 上記記号列照合装置はテキストデータベースの検索や、
バタン認識システムでの特徴系列の照合、ワープロで作
成された文書からのキーワード検索、機械翻訳の支援や
電子メールのアドレスフィルタリングなどに使われ、こ
れらの情報処理システムにおいて欠くことの出来ないも
のである。この記号列照合装置には、複数の照合記号列
と被照合記号列を同時に照合し、被照合記号列とある類
似性を持った照合記号列を特定できることが望まれる。
なぜならば、例えば、テキストデータベース検索におい
ては、テキストがミススペルを含む場合や、あやふやな
キーワードで検索を行う場合にこの機能が必要であるし
、パターン認識において特徴系列同時の照合を行う場合
には、完全に一致するものが見つかることは希で、複数
の照合記号列から被照合記号列に最もよく似た照合記号
列を選び出すことが必要になるからである。
上で述べた照合記号列と被照合記号列の類似度を測るの
には「距離」という概念が用いられる。
ここで言う距離とは、上記号の除去、置換あるいは挿入
を単位操作として、何回の操作である記号列からある記
号列に移れるかを考え、そのうち最少の回数をこの二つ
の記号列間の距離とするものである。この距離という概
念については、例えば1980年発行のコンピユーテイ
ングサーベイ(Computing 5urveys)
誌、第12巻、4号、381ページの文献、題名アブロ
クシメント・ストリング・マツチング(Approxi
mate String Matching)、著者ホ
ール・ダウリング(Patrick−Hall、 Ge
off−Dowling)に詳しく記載されている。
複数の照合記号列と被照合記号列の間の任意の大きさの
距離を計算し、最も距離が小さい照合記号列を最も類似
した照合記号列として特定できる記号列照合装置として
は、本出願人が既に出願した「記号列照合装置の制御方
式1(以下先行発明と呼ぶ)がある。
先行発明の記号列照合装置は、記号列比較結果を記憶す
るセルをM行(Mは正整数)N+1列に並べたセルアレ
イと、照合記号列のj番目θはN以下の任意の正整数)
の記号と同じ入力記号が与えられたときのみ、前記セル
アレイのi行(iはM以下の任意の正整数)j列目であ
るセルfijの記憶データをセルfij+1に転送する
第1の転送手段と、照合記号列のj番目の記号と違う入
力記号が与えられたときのみ、前記セルアレイのh行(
hはM未満の任意の正整数)j列目であるセルfhjの
記憶データをセルfh+1j+1に転送する第2の転送
手段と、入力記号が与えられると、与えられた入力記号
の如何にかかわらず前記セルアレイのh行に列目(kは
N+1以下の任意の正整数)であるセルf h、にの記
憶データをセルfh+1kに転送する第3の転送手段と
、前記第1から第3の転送手段によりセルfikに少な
くとも一つ1が転送されてくるとセルfikの記憶デー
タを1にし、前記第1から第3の転送手段によりセルf
ikに1が一つも転送されてこなければセルfikの記
憶データを0にする入力手段と、セルfhjの記憶デー
タが1になると、前記入力手段によりセルfh+1j+
1に与えられた入力によらず、セルfh+1j+1の記
憶データを1にセットするセット手段を備えた部分記号
列照合装置を複数個有しており、照合記号列の長さがN
以下の任意の正整数りである場合の照合を、前記部分記
号列照合装置を用いて、少なくとも、前記セルアレイの
全てのセルの値をOにした後、前記セルf1□の記憶デ
ータを1にセットすることにより初期設定を行うことと
、被照合記号列を上記号ずつ順に与えることにより記号
列照合を実行することと、前記セルアレイのL+1列目
のM個のセルの中から、記憶データが1であり、かつい
ちばん行番号が小さいセルを探すことにより、照合の結
果として照合記号列と被照合記号列との距離を得ること
により実行し、複数の前記部分記号列照合装置により照
合記号列と被照合記号列との記号列照合を同時に実行す
ることを特徴としている。
第7図は先行発明の動作原理を説明するための図である
。同図は例として4行5列のセルアレイからなる部分記
号列照合装置を一つ用い、”ABCD”を照合記号列と
した場合を示している。以下詳しく説明するように、こ
の構成により、”ABCD”から距離3の範囲内にある
任意の被照合記号列を検索することができる。
同図において、セルは丸印で示され、第1の転送手段は
行方向の実線の矢印、第2の転送手段は列方向の実線の
矢印、第3の転送手段は対角線方向の実線の矢印、セッ
ト手段は対角線方向の二重線の矢印で示されている。第
1及び第2の転送手段は、その矢印の横に書いである被
照合記号が与えられたときだけ、矢印にしたがって各セ
ルの記憶データを次のセルに転送する。第3の転送手段
は、被照合記号が与えられると、与えられた被照合記号
の如何にかかわらず、矢印にしたがって各セルの記憶デ
ータを次のセルに転送する。図中には明示していないが
、セルにはこれらの転送手段から転送されてきたデータ
を受は取る入力手段があり、少なくとも一つ1が転送さ
れてくるとセルの記憶データは1になり、一つも1が転
送されてこないとセルの記憶データは0になる。セット
手段は、あるセルの記憶データが1になると、入力手段
から入力されたデータに関係なく、二重線の矢印にした
がって次のセルの記憶データも1にセットする働きを持
つ。
つまり、例えばセルf工2が1であると、同時にf23
、f34、f45も1となり、セルf22が1であると
、同時にf33、f44も1となる。このような構成に
おいて、第5列目のセルの記憶データを読み取ることに
より照合結果を得ることができる。以上を第8図、第9
図(a)−(h)に基づいて更に詳細に説明する。
第8図、第9図(a)−(h)はそれぞれ第7図と同じ
構成を示すものであるが、簡単のため一部の記号を省略
して描いである。以下で用いる記号でこれらの図中に明
示していないものは、第7図中の対応する部位の記号を
用いている。また図中のセルで斜線を施したものは記憶
データが1であることを示し、白いセルは記憶データが
Oであることを示している。
第8図は、照合を始める前の、先行発明による記号列照
合装置の初期状態を示す図である。初期状態ではセルf
□、の記憶データを1にセットしておく。
するとセット手段により、f22、f33、f44の記
憶データも1にセットされる。これら以外のセルの記憶
データはすべて0にしておく。
第9図(a)−(d)は照合言己号列“’ABCD”に
対して被照合記号列”ABCD”を順にA、 B、 C
,Dと入力していったときの本発明による記号列照合装
置の動作を、記号を一つ入力する毎に示したものである
各被照合記号が入力された後のセルアレイは、それまで
に入力された被照合記号列と照合記号列”ABCD”と
の照合結果を示している。この照合結果を知るには、5
列目のセルの記憶データを読み取ればよい。具体的には
、5列目のセルで記憶データが1になっているものの中
で、一番付番号が小さいものを探し、それがf15なら
、被照合記号列と照合記号列との距離は距離0. f2
5なら距離1、師なら距離2、f45なら距離3、該当
するセルがなければ距離4以上となる。以下、図の順に
したがって各図について詳しく説明する。
まず初期状態から被照合記号Aが入力されると、各セル
の記憶データは、第8図で示した初期状態から第9図(
a)のように変化する。この図は、上で述べたように、
被照合記号列”ABCD”の照合の途中経過として、照
合記号列”ABCD”に対する被照合記号列′“A”の
照合結果を示している。セルf45の記憶データが1に
なっており、これは“′A″がABCD”から距離3に
あることを示している。
次に被照合記号Bが入力されると、各セルの記憶データ
は、第9図(a)で示した状態から第9図(b)のよう
に変化する。この図は照合記号列“ABCD”に対する
被照合記号列“’AB”の照合結果を示している。セル
繞の記憶データが1になっており、これは°’AB”が
”ABCD”から距離2にあることを示している。
続いて被照合記号Cが入力されると、各セルの記憶デー
タは、第9図(b)で示した状態から第9図(C)のよ
うに変化する。この図は照合記号列”ABCD”に対す
る被照合記号列“’ABC”′の照合結果を示している
セルf25の記憶データが1になっており、これは“A
B”が”ABCD”から距離1にあることを示している
最後に被照合記号りが入力されると、各セルの記憶デー
タは、第9図(C)で示した状態から第9図(d)のよ
うに変化する。この図は照合記号列“ABCD”に対す
る被照合記号列“’ABCD”の最終的な照合結果を示
している。セルf15の記憶データが1になっており、
これは“ABCD’”が”ABCD”から距離0にある
ことを示している。
このように、被照合記号列“ABCD”を順に上記号ず
つ入力していくことにより、この被照合記号列に対する
照合の途中経過及び最終結果を順次知ることが出来る。
このようにして得られた照合結果は、明らかに被照合記
号列と照合記号列との間の正しい距離を与えている。な
ぜなら、被照合記号列&1A11は’ABCD”に単位
操作である上記号の除去を3回行ったものだし、同じく
“AB”は2回、”ABC”は1回、“’ABCD”は
0回行ったものだからである。
第9図(e)−(h)は第9図(a)−(d)と同じ条
件で、被照合記号列を“’ACXD”にした場合を示し
たものである。
簡単に説明すると、第9図(e)は被照合記号列17A
?1が照合記号列“ABCD”から距離3であることを
、第9図(D、(g)、(h)はそれぞれ被照合記号列
11AC+1、“ACX”、“’ACXD”が照合記号
列“’ABCD”から距離2であることを示している。
これらの結果がそれぞれの記号列間の正しい距離を与え
ていることは明らかである。
このようにして、第7図に示した構成により、ある被照
合記号列が照合記号列”ABCD”から距離3の範囲内
にあるかどうか判別することができる。
よって、複数の被照合記号列を次々に入力していけば、
その中から照合記号列から距離3の範囲内にある全ての
被照合記号列を検索することが可能になる。
以上説明してきた第7図の部分記号列照合装置において
、先行発明では、照合結果をセルアレイの全ての列から
読み取れるようにすることにより、セルアレイの列数よ
りも小さい任意の長さの照合記号列に対して照合を行え
るようにしている。例えば、第7図のセルアレイを用い
て、照合記号列11ABl+に対する照合を行うように
するためには、3列目のセルの値を読みとるようにすれ
ばよい。このように、照合記号列の長さに応じて、照合
結果を読みとる列を変えることにより、N+1列のセル
アレイを持つ記号列照合装置で長さN以下の任意の照合
記号列を照合できるようになる。更に、この記号列照合
装置を複数個並べ、それぞれに違った照合記号列を登録
し、被照合記号列を上記号ずつ各記号列照合装置に同時
に入力することにより、複数の照合記号列を同時に照合
できるようにすることができる。
(発明が解決しようとする課題) 上記のように先行発明の記号列照合装置で複数の照合記
号列と被照合記号列の間の任意の大きさの距離を計算し
、最も距離が小さい照合記号列を最も類似した照合記号
列として特定することかできる。しかし、先行発明では
照合装置のセルアレイの大きさによって、照合できる記
号列の最大の長さが決まるため、これよりも長い照合記
号列に対しては、別の記号列照合装置を用意しなければ
ならないという欠点があった。また、先行発明の記号列
照合装置は、それぞれの照合記号列に対して許容できる
距離を設定することができないため、あまり効率のよい
照合が行えないという問題があった。例えば、上記号の
照合記号列rAJに対して許容距離3の照合を行うこと
は意味が無いし、逆に 長い照合記号列 r ABCDEFGHIJKLMNOP Jに対しては
、距離3〜5程度の照合が適当であろうと考えられる。
このように、全ての記号列に対して同じ許容距離で照合
を行うのは、特に記号副長が可変の場合には、効率的で
ない。
本発明の目的はこのような問題を解決し、簡易な制御方
式で任意の長さの複数の照合記号列と被照合記号列の照
合を、それぞれの照合記号列に対して許容距離を個別に
設定して実行することが可能な、記号列照合装置の制御
方式を提供することにある。
(課題を解決するための手段) 上記目的を達成するため、本発明の記号列照合装置は、
記号列照合結果を記憶するセルをM行(Mは正1ii)
N+1列に並べたセルアレイと、照合記号列のj番目q
はN以下の任意の正整数)の記号と同じ入力記号か与え
られたときのみ、前記セルアレイのi行(iはM以下の
任意の正整数)j列目であるセルfijの記憶データを
セルfij+1に転送する第1の転送手段と、照合記号
列のj番目の記号と違う入力記号が与えられたときのみ
、前記セルアレイのh行(hはM未満の任意の正整数)
j列目であるセルfhjの記憶データをセルfh+1j
+1に転送する第2の転送手段と、入力記号が与えられ
ると、与えられた入力記号の如何にかかわらず前記セル
アレイのh行に列目(kはN+1以下の任意の正整数)
であるセルfhkの記憶データをセルfh+1kに転送
する第3の転送手段と、前記第1から第3の転送手段に
よりセルfikに少なくとも−っ1が転送されてくると
セルfikの記憶データを1にし、前記第1から第3の
転送手段によりセルfikに1が一つも転送されてこな
ければセルfikの記憶データを0にする入力手段と、
セルfhjの記憶データが1になると、前記入力手段に
よりセルfh+IJ+1に与えられた入力によらず、セ
ルfh+1j+1の記憶データを1にセットするセット
手段を備えた部分記号列照合装置をL個(Lは正整数)
用いてL個の照合記号列と被照合記号列の照合を実行す
る記号列照合装置において、p個の前記部分記号列照合
装置を用いて、長さがpN以下の照合記号列と被照合記
号列の照合を行うことを特徴とする制御方式と、それぞ
れの前記照合記号列と前記被照合記号列の間の許容距離
を個別に設定して実行することを特徴とする制御方式を
用いている。
(作用) 第1の発明では、先行発明で用いられる複数個の部分記
号列照合装置を接続して用いることにより、一つの照合
記号列に割当てるセルアレイの列数を増やし、これによ
り最大で(用いる部分記号列照合装置の数)X(部分記
号列処理装置層たりのセルアレイの列数−1)の長さの
照合記号列に対して、照合を行えるようになる。
第2の発明では、それぞれの照合記号列に対して、許容
距離を設定しておくことにより、所望の距離以上の一致
を検出しないようにする。例えば、第2図のセルアレイ
を用いて1、照合記号列11A′1に対する照合を距離
“0”′のみを許して照合を行う場合は、セルf12の
値のみ出力し、セルf22〜4゜の値は出力しないよう
にすればよい。これにより、例えば被照合記号列(IA
Bl+が入力されても、距離“1′ツとして一致するこ
とがなくなる。
(実施例) 第1図は、本発明による記号列照合装置の第1の実施例
を示す構造図である。同図において記号列照合装置は、
L個の入力装置130と、これに対応するL個の部分記
号列照合装置120と、プライオリティエンコーダ14
0で構成される。入力装置130には接続信号入力端子
102−1−L(Lは正整数)と、照合記号動圧設定端
子103−1〜Lと、照合記号列入力端子104−1〜
Lと、被照合記号列入力端子105を有する。
部分記号列照合装置120には初期セット端子101が
ある。プライオリティエンコーダには一致アドレス出力
端子106と、一致距離出力端子107がある。
第2図は、部分記号列照合装置120の一例である。同
図おいて部分記号列照合装置120は、初期セット端子
121と、接続信号入力端子122と、N本(Nは正整
数)の照合記号動圧設定端子123−1〜Nと、N本の
一致信号入力端子124−1〜124−Nと、照合結果
入力端子127と、M行(Mは正整数)N+1列に並べ
られ、データを入力するD端子、データを出力するQ端
子、データを1にセットするSET端子を持つレジスタ
230と、1列目のレジスタ230のQ端子にD1端子
がつながり、照合結果入力端子127にD2端子がつな
がり、接続信号入力端子122にS端子がつながるM個
のセレクタ220と、i行(iはM以下の任意の正整数
)5列(はN以下の任意の正整数)目のレジスタfij
230のQ′4子(j=1のときはセレクタ220のQ
端子)と一致信号入力端子124−jに入力端子がつな
がり、i=1であれば右横のレジスタfij+1230
のD端子に出力端子がつながる第1のアンドゲート24
0と、レジスタfhj230(hはM未満の任意の正整
数)のQ端子に入力かっながリ、一致信号入力端子12
4−jに反転入力端子がつながる第2のアンドゲート2
50と、レジスタfhk230(kはN+1以下の任意
の正整数)のQ端子に入力がつながるデータ転送線26
0と、入力として、レジスタf、+、j230のQ端子
につながる第1のアンドゲート240の出力と、レジス
タfhj230のQtt4子につながる第2のアンドゲ
ート250の出力と、レジスタfhj+、230のQ端
子につながるデータ転送線260の出力とを受け、レジ
スタfh+1j+1230のD端子に出力する第1のt
7ゲート270と、レジスタfhj230のD端子の出
力をレジスタfh+1j+1230のSET端子に入力
するセント線280と、レジスタ230のQ端子と照合
記号副長設定端子123につながる第3のアンドゲート
285と、第3のアンドゲートの出力を受ける第2のオ
アゲート286と、レジスタflN+1〜fMN+12
30のQ端子につながる照合結果転送端子125−1〜
Mと、第2のオアゲート286の出力を外部に出力する
M本の出力端子126−1〜Mとを備えている。
第2図の構成要素と、請求項1にH記載の部分記号列照
合装置の各構成要素との対応について説明する。レジス
タfik230はセルfikに対応するものである。第
1のアンドゲート240、第2のアンドゲート250、
データ転送線260は、それぞれ第1の転送手段、第2
の転送手段、第3の転送手段に対応するものである。ま
た、オアゲート270は入力手段、セント線280はセ
ント手段に対応するものである。第2図において、一致
信号入力端子124−jには、照合記号列のj番目の記
号と被照合記号とが一致すればl、一致しなければOが
与えられる。すると、第1の、アンドゲート240は、
照合記号列のj番目と被照合同じ記号が与えられたとき
だけレジスタfhj230の記憶データをレジスタfh
j+1130に転送し、それ以外は0を転送する。逆に
第2のアンドゲート250は照合記号列のj番目と違う
被照合記号が与えられたときはレジスタfhj230の
記憶データをレジスタfh+1.+1230に転送し、
同じであれば0を転送する。照合結果入力端子127と
、照合結果転送端子125と、セレクタ210は、請求
項1記載の制御方式を実現するためのものである。
第3図は、第2図の部分記号列照合装置120に入力信
号を与える入力装置130の一例である。同図は各記号
が1ビツトで構成されている場合を示している。まず照
合記号列登録端子134−1〜134−Nから、照合記
号列を照合記号レジスタ320に登録する。次に、照合
記号列の長さがP(PはM以下の正整数)であれば、照
合記号副長設定端子133−Pにのみ値1を、他の照合
記号副長設定端子には′0″を与え、記号列長レジスタ
330に登録する。また、この入力装置130に照合記
号列を頭から登録する場合には、接続信号入力端子13
2から0″を与え、照合記号列の途中から登録する場合
には接続信号入力端子132から“′1・・を与え、接
続信号レジスタ310に登録する。被照合記号列は、被
照合記号列入力端子135より1記号ずつ入力され、比
較器340で照合記号列の各記号と比較される。比較の
結果、両記号が一致していれば1、一致していなければ
0が一致信号出力端子136−1〜136−Nから出力
される。一致信号出力端子136−jの出力を第2図の
入力端子120−jに入力することにより第2図の説明
で述べたような入力を得ることができる。また、記号列
長レジスタ330と、接続信号レジスタ310に登録さ
れた値はそのまま照合記号動圧出力端子137と接続信
号出力端子138から出力される。
第1図、第2図、第3図に基づいて、本発明による記号
列照合装置の制御方式ついて説明する。第3図の照合記
号動圧出力端子137の出力は、第2図の照合記号副長
設定端子120に与えられる。つまり、ある部分記号列
照合装置120に対応する照合記号列の長さがPであれ
ば、120−Pにのみ′1″が与えられる。
これにより、第2図の第3のアンドゲート285の働き
で、第P+1列目のレジスタ230のQ端子の出力のみ
が、第2のオアゲート286に送られる。よって、各部
分記号列照合装置120の出力端子126に与えられる
のは、P+1列目のレジスタ130の出力、即ち長さP
の照合記号列に対する照合結果である。また、第3図の
接続信号出力端子138は第2図の接続信号入力端子1
22に接続される。つまり、ある部分記号列照合装置1
20に対応する照合記号列が頭から登録されていれば′
0“が、途中から登録されていれば“1″が接続信号入
力端子122から入力される。この接続信号入力はセレ
クタ220のS端子に入力され、そのセンフタ220で
、S端子の値が“′1′′であればD1端子が、“0”
であればD2端子がそれぞれ選択され、選択された端子
の値がQ′4子から出力される。これにより、照合結果
入力端子127から一つ前の部分記号列照合装置120
の照合結果転送端子125の出力を受は取って、部分記
号列照合装置120の入力とすることにより、長さがN
より長い照合記号列の照合を、複数の部分記号列照合装
置120を用いて実行することができる。
例として、L=M=N=4の場合について、以上の動作
を説明する。第4図に、4つの入力装置130の照合記
号レジスタ320、E号動圧レジスタ330、接続信号
レジスタ310の記憶内容を示した。第4図(a)は、
4つの照合記号列、”ABC”、1lDEt+、”FG
HI”、”JKL”を登録した場合で、この時、記号動
圧レジスタ330、接続信号レジスタ310の記憶内容
は同図のようになる。これにより、この4つの照合記号
列と被照合記号列の並列照合が4つの部分記号列照合装
置120で実行され、各記号列照合装置120の出力端
子126には、照合結果として各照合記号列と被照合記
号列の距離が同時に得られる。この出力はプライオリテ
ィエンコーダ140に与えられる。プライオリティエン
コーダは公知のものであるので詳しい説明は省くが、入
力端子145に与えられた入力をエンコードして、被照
合記号列との距離が小さい方から順に照合記号列が登録
された記号列照合装置120のアドレスと、その距離の
値とを出力する機能を持つ。これにより、複数の照合記
号列から被照合記号列にいちばん近い記号列を検索し、
かつその時の距離を得ることができる。第4図(b)は
、2つの長さ4以上の照合記号列、”ABCDEFG”
と”HIJKLMNO”、を登録した場合である。それ
ぞれの照合記号列は2つの入力装置130にまたがって
登録され、2番目と4番目の接続信号レジスタ310に
は1が設定される。これにより、上で述べたように、1
番目と2番目、3番目と4番目の部分記号列照合装置1
20を接続して照合を行うことができるようになる。
第5図に本発明の第2の実施例を示す。この実施例は、
第1の実施例に許容距離制御装置510と許容距離設定
端子501を追加したものである。第6図に許容距離制
御装置510の実施例を示す。同図はM=4の場合を例
として示している。同図において許容距離制御装置51
0は、レジスタ610とエンコーダ620と、アンドゲ
ート630とから構成される。M=4の場合、部分記号
列照合装置120は距離3までの照合を行えるが、これ
を距離2に制限したい場合を考える。この場合許容距離
設定端子562から”10’”を入力してやれば、エン
コーダ620が“0111”を出力し、これにより、入
力端子561−4に距離3の一致を示す“1”が与えら
れても、出力端子563−4には常に“′0″が与えら
れ、距離2以下に限定して照合を行うことが可能になる
。この許容距離制御装置510を全ての部分記号列照合
装置120に接続することにより、それぞれの照合記号
列に対して個別に許容距離を設定することができる。
(発明の効果) 本発明による記号列照合装置の制御方式によれば、以上
説明してきたように、先行発明の部分記号列照合装置と
入力装置の構成に簡単な論理ゲートを付加し、それを並
べるだけで、任意の長さの照合記号列に対する照合を並
列に実行することが出来るようになる。また簡単な構成
の許容距離制御装置を付加することにより、それぞれの
照合記号列に対して個別に許容距離を設定した並列照合
が可能になる。
【図面の簡単な説明】
第1図は本発明の記号列照合装置の第1の実施例を示す
構成図、第2図は部分記号列照合装置の実施例を示す構
成図、第3図は入力装置の実施例を示す構成図、第4図
は第1の実施例の動作を説明する図、第5図は本発明の
第2の実施例を示す構成図、第6図は許容距離制御装置
の実施例を示す構成図、第7図、第8図、第9図は従来
技術を説明するための原理図である。

Claims (2)

    【特許請求の範囲】
  1. (1)記号列比較結果を記憶するセルをM行(Mは正整
    数)N+1列に並べたセルアレイと、照合記号列のj番
    目(jはN以下の任意の正整数)の記号と同じ入力記号
    が与えられたときのみ、前記セルアレイのi行(iはM
    以下の任意の正整数)j列目であるセルf_i_jの記
    憶データをセルf_i_j_+_1に転送する第1の転
    送手段と、照合記号列のj番目の記号と違う入力記号が
    与えられたときのみ、前記セルアレイのh行(hはM未
    満の任意の正整数力列目であるセルf_h_jの記憶デ
    ータをセルf_h_+_1_j_+_1に転送する第2
    の転送手段と、入力記号が与えられると、与えられた入
    力記号の如何にかかわらず前記セルアレイのh行k列目
    (kはN+1以下の任意の正整数)であるセルf_h_
    kの記憶データをセルf_h_+_1_kに転送する第
    3の転送手段と、前記第1から第3の転送手段によりセ
    ルf_i_kに少なくとも一つ1が転送されてくるとセ
    ルf_i_kの記憶データを1にし、前記第1から第3
    の転送手段によりセルf_i_kに1が一つも転送され
    てこなければセルf_i_kの記憶データを0にする入
    力手段と、セルf_h_jの記憶データが1になると、
    前記入力手段によりセルf_h_+_1_j_+_1に
    与えられた入力によらず、セルf_h_+_1_j_+
    _1の記憶データを1にセットするセット手段を備えた
    部分記号照合装置をL個(Lは正整数)用いてL個の照
    合記号列と被照合記号列の照合を実行する記号列照合装
    置において、p個の前記部分記号列照合装置を用いて、
    長さがpN以下の照合記号列と被照合記号列の照合を行
    うことを特徴とする記号列照合装置の制御方式。
  2. (2)特許請求項第1項の記号列照合装置において、そ
    れぞれの前記照合記号列と前記被照合記号列の間の許容
    距離を個別に設定して実行することを特徴とする記号列
    照合装置の制御方式。
JP2199659A 1990-07-27 1990-07-27 記号列照合装置の制御方式 Pending JPH0484367A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2199659A JPH0484367A (ja) 1990-07-27 1990-07-27 記号列照合装置の制御方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2199659A JPH0484367A (ja) 1990-07-27 1990-07-27 記号列照合装置の制御方式

Publications (1)

Publication Number Publication Date
JPH0484367A true JPH0484367A (ja) 1992-03-17

Family

ID=16411505

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2199659A Pending JPH0484367A (ja) 1990-07-27 1990-07-27 記号列照合装置の制御方式

Country Status (1)

Country Link
JP (1) JPH0484367A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008140168A (ja) * 2006-12-01 2008-06-19 Nippon Telegr & Teleph Corp <Ntt> シンボル列集合類似度算出方法及びメタデータ生成装置及びメタデータ付与装置及びプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008140168A (ja) * 2006-12-01 2008-06-19 Nippon Telegr & Teleph Corp <Ntt> シンボル列集合類似度算出方法及びメタデータ生成装置及びメタデータ付与装置及びプログラム

Similar Documents

Publication Publication Date Title
Apostolico et al. Parallel construction of a suffix tree with applications
JP2737173B2 (ja) 記号列照合装置とその制御方法
JPS60501921A (ja) 並列テキスト照合の方法および装置
CN107704474A (zh) 属性对齐方法和装置
JP2715465B2 (ja) 記号列照合装置
US6766317B2 (en) Range check cell and a method for the use thereof
Min Analysis on 2-element insertion sort algorithm
JPH0484367A (ja) 記号列照合装置の制御方式
JPS62264498A (ja) 内容アドレス式メモリ
US3292159A (en) Content addressable memory
CN103530380A (zh) 一种垂直搜索设备及方法
JP6238306B2 (ja) 不揮発性連想メモリを利用した全文検索システム及びこれに用いる文字列比較方法
JPH04308B2 (ja)
KR102608683B1 (ko) Knn을 이용한 자연 언어 처리
JPH0460871A (ja) 記号列照合装置の制御方式
CN101470712A (zh) 利用数学运算的英文单词查询系统及其方法
JP2729491B2 (ja) 可変長文字列検出装置
JPH03208172A (ja) 記号列照合装置の制御方式
Hollaar A list merging processor for inverted file information retrieval systems.
KR102498670B1 (ko) 단락의 순위화를 위한 방법 및 장치
Yamada et al. A character string search processor
JPH061476B2 (ja) 高速検索処理装置
JPH05314169A (ja) 並列データ処理装置および並列形態素抽出方法
JP2839515B2 (ja) 文字読取システム
JP2773657B2 (ja) 文字列検索装置