JPH0460871A - Controlling system for symbol string collating device - Google Patents
Controlling system for symbol string collating deviceInfo
- Publication number
- JPH0460871A JPH0460871A JP2172209A JP17220990A JPH0460871A JP H0460871 A JPH0460871 A JP H0460871A JP 2172209 A JP2172209 A JP 2172209A JP 17220990 A JP17220990 A JP 17220990A JP H0460871 A JPH0460871 A JP H0460871A
- Authority
- JP
- Japan
- Prior art keywords
- symbol string
- cell
- symbol
- matching
- stored data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012546 transfer Methods 0.000 claims description 30
- 238000000034 method Methods 0.000 claims description 12
- 238000012795 verification Methods 0.000 description 24
- PCTMTFRHKVHKIS-BMFZQQSSSA-N (1s,3r,4e,6e,8e,10e,12e,14e,16e,18s,19r,20r,21s,25r,27r,30r,31r,33s,35r,37s,38r)-3-[(2r,3s,4s,5s,6r)-4-amino-3,5-dihydroxy-6-methyloxan-2-yl]oxy-19,25,27,30,31,33,35,37-octahydroxy-18,20,21-trimethyl-23-oxo-22,39-dioxabicyclo[33.3.1]nonatriaconta-4,6,8,10 Chemical compound C1C=C2C[C@@H](OS(O)(=O)=O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2.O[C@H]1[C@@H](N)[C@H](O)[C@@H](C)O[C@H]1O[C@H]1/C=C/C=C/C=C/C=C/C=C/C=C/C=C/[C@H](C)[C@@H](O)[C@@H](C)[C@H](C)OC(=O)C[C@H](O)C[C@H](O)CC[C@@H](O)[C@H](O)C[C@H](O)C[C@](O)(C[C@H](O)[C@H]2C(O)=O)O[C@H]2C1 PCTMTFRHKVHKIS-BMFZQQSSSA-N 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 230000010365 information processing Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 239000007787 solid Substances 0.000 description 3
- 238000010977 unit operation Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は情報処理システムの構成要素に係り、より具体
的には複数の被照合記号列の中から照合記号列と特定の
関係にある被照合記号列を検索する記号列照合装置の制
御方式に関するものである。DETAILED DESCRIPTION OF THE INVENTION [Field of Industrial Application] The present invention relates to the components of an information processing system, and more specifically, the present invention relates to components of an information processing system, and more specifically, the present invention relates to components of an information processing system, and more specifically, the present invention relates to the components of an information processing system. The present invention relates to a control method for a symbol string matching device that searches for a matching symbol string.
記号列照合装置はテキストデータベースの検索や、バタ
ン認識システムでの特徴系列の照合、ワープロで作成さ
れた文書からのキーワード検索、機械a訳の支援や電子
メールのアドレスフィルタリングなどに使われ、これら
の情報処理システムにおいて欠くことの出来ないもので
ある。Symbol string matching devices are used for searching text databases, matching feature sequences in button recognition systems, keyword searches from documents created with word processors, supporting machine translation, email address filtering, etc. It is indispensable in information processing systems.
この記号列照合装置には、照合記号列と完全に一致する
被照合記号列のみならず、照合記号列とある類似性を持
った被照合記号列をも検索できることが望まれる。なぜ
ならば、例えば、テキストデータベース検索においては
、テキストがミススペルを含む場合や、あやふやなキー
ワード検索を行う場合にこの機能が必要であるし、パタ
ーン認識において特徴系列同士の照合を行なう場合には
、完全に一致するものが見つかることは希で、複数の被
照合記号列から照合記号列に最もよく似た被照合記号列
を選び出すことが必要になるからである。It is desired that this symbol string matching device be able to search not only for a matched symbol string that completely matches a matching symbol string, but also for a matching symbol string that has a certain similarity to the matching symbol string. This is because, for example, in text database searches, this function is necessary when the text contains misspellings or when performing ambiguous keyword searches, and when matching feature sequences in pattern recognition, it is necessary to use this function completely. This is because it is rare to find a matching symbol string, and it is necessary to select the matching symbol string most similar to the matching symbol string from among multiple matching symbol strings.
上述の照合記号列と被照合記号列の類似度を測るのには
距離という概念が用いられる。ここで言う距離とは、1
記号の除去、置換、挿入を単位操作として、何回の操作
である記号列からある記号列に移れるのかを考え、その
うち最少の回数をこの二つの記号列間の距離をするもの
である。この距離という概念については、例えば198
0年発行のComputing 5urveys誌、第
12巻、4号、381ページの文献、題名アプロクシメ
イト・ストリング・マツチング(Approximat
e StringMatching)、著者Patri
ck、Hall、Geoff、dowling。The concept of distance is used to measure the similarity between the above-mentioned matching symbol string and the to-be-matched symbol string. The distance mentioned here is 1
Considering the removal, substitution, and insertion of symbols as unit operations, we consider how many operations it takes to move from one symbol string to another, and calculate the distance between these two symbol strings by calculating the minimum number of operations. Regarding this concept of distance, for example, 198
Computing 5urveys, Volume 12, Issue 4, Page 381, published in 2013, titled Approximate String Matching.
e StringMatching), author Patri
ck, Hall, Geoff, dowling.
に詳しく記載されている。is described in detail.
照合記号列から任意の距離内の被照合記号列を検索でき
る記号列照合装置としては、特願昭63−269746
号[記号列照合装置とその制御方式(以下先行発明と呼
ぶ)がある。A symbol string matching device capable of searching for a symbol string to be matched within an arbitrary distance from a matching symbol string is disclosed in Japanese Patent Application No. 63-269746.
There is a symbol string matching device and its control method (hereinafter referred to as the prior invention).
先行発明の記号列照合装置は、長さN (Nは正整数)
の照合記号列に対して、記号列比較結果を記憶するセル
をM行(Mは正整数)N+1列に並べたセルアレイと、
照合記号列のj番目(jはN以下の任意の正整数)の記
号と同じ被照合記号が与えられたときのみ、前記セルア
レイのi行(iはM以下の任意の正整数)j列目である
セルfi1の記憶データをセルfij+1に転送する第
1の転送手段と、照合記号列のj番目の記号と違う被照
合記号が与えられたときのみ、前記セルアレイのh行(
hはM未満の任意の正整数)j列目であるセルf□の記
憶データをセルf h+++++に転送する第2の転送
手段と、被照合記号が与えられると、与えられた被照合
記号の如何にかかわらず前記セルアレイのh行に列目(
kはN+1以下の任意の正整数)であるセルf hkの
記憶データをセルf bulkに転送する第3の転送手
段と、前記第1から第3の転送手段によりセルfikに
少なくとも一つ1が転送されてくるとセルfikの記憶
データを1にし、前記第1から第3の転送手段によりセ
ルfikに1が一つも転送されてこなければセルfik
の記憶データを0にする入力手段と、セルfhlの記憶
データが1になると、前記入力手段によりセルfh++
+++に与えられた入力によらず、セルf h+l j
+1の記憶データを1にセットするセット手段より構成
されており、
このような構成において、前記セルアレイの全てのセル
の記憶データを0にした後、セルfl+の記憶データを
1にセットすることにより初期設定を行なうことと、被
照合記号列を1記号ずつ順に与えることにより記号列照
合を実行することと、前記セルアレイのN+1列目のM
個のセルの中から、記憶データが1であり、かついちば
ん行番号の小さいセルを探すことにより、照合結果とし
て照合記号列と被照合記号列との距離を得ることとを特
徴とする制御方式を用いている。The symbol string matching device of the prior invention has a length of N (N is a positive integer).
a cell array in which cells for storing symbol string comparison results are arranged in M rows (M is a positive integer) and N+1 columns for the matching symbol string;
Only when the same symbol to be matched as the jth symbol (j is any positive integer equal to or less than N) in the collation symbol string is given, the i-th row (i is any positive integer equal to or less than M) column j of the cell array. The first transfer means transfers the stored data of cell fi1 to cell fij+1, and only when a collated symbol different from the j-th symbol of the collation symbol string is given, the h row (
(h is any positive integer less than M) A second transfer means that transfers the stored data of cell f□, which is the jth column, to cell fh++++++; Regardless of what happens, the hth row and column (
k is any positive integer equal to or less than N+1), the data stored in the cell f hk is transferred to the cell f bulk, and at least one 1 is transferred to the cell fik by the first to third transfer means. When the data is transferred, the stored data of the cell fik is set to 1, and if no 1 is transferred to the cell fik by the first to third transfer means, the data stored in the cell fik is set to 1.
an input means for setting the stored data of cell fhl to 0; and when the stored data of cell fhl becomes 1, the input means sets cell fh++ to 0;
Regardless of the input given to +++, the cell f h+l j
In this configuration, by setting the memory data of cell fl+ to 1 after setting the memory data of all cells of the cell array to 0, Performing initial settings; Executing symbol string matching by sequentially giving symbol strings to be matched one symbol at a time; and
A control method characterized in that the distance between the verification symbol string and the to-be-matched symbol string is obtained as a verification result by searching for a cell with stored data of 1 and the smallest row number among the cells. is used.
第4図は先行発明の動作原理を説明するための図である
。同図は例として4行5列のセルアレイ\
を用い、“’ABCD’”を照合記号列とした場合を示
している。以下詳しく説明するように、この構成により
、” A B CD ”から距離3の範囲内にある任意
の被照合記号列を検索することができる。FIG. 4 is a diagram for explaining the operating principle of the prior invention. The figure shows, as an example, a case where a cell array with 4 rows and 5 columns is used, and "'ABCD'" is used as the collation symbol string. As will be explained in detail below, with this configuration, it is possible to search for any symbol string to be matched within a distance of 3 from "A B CD".
同図において、セルは丸印で示され、第1の転送手段は
行方向の実線の矢印、第2の転送手段は列方向の実線の
矢印、第3の転送手段は対角線方向の実線の矢印、セッ
ト手段は対角線方向の二重線の矢印で示されている。第
1及び第2の転送手段は、その矢印の横に書いである被
照合記号が与えられたときだけ、矢印にしたがって各セ
ルの記憶データを次のセルに転送する。第3の転送手段
は、被照合記号が与えられると、与えられた被照合記号
の如何にかかわらず、矢印にしたがって各セルの記憶デ
ータを次のセルに転送する。図中には明示していないが
、セルにはこれらの転送手段から転送されてきたデータ
を受は取る入力手段があり、少なくとも一つ1が転送さ
れてくるとセルの記憶ゲータは1になり、一つも1が転
送されてこないとセルの記憶データは0になる。In the figure, cells are indicated by circles, the first transfer means is a solid arrow in the row direction, the second transfer means is a solid arrow in the column direction, and the third transfer means is a solid arrow in the diagonal direction. , the setting means are indicated by diagonal double-lined arrows. The first and second transfer means transfer the stored data of each cell to the next cell according to the arrow only when a symbol to be verified written next to the arrow is given. When a symbol to be verified is given, the third transfer means transfers the stored data of each cell to the next cell in accordance with the arrow, regardless of the given symbol to be verified. Although not clearly shown in the figure, the cell has input means for receiving and receiving data transferred from these transfer means, and when at least one 1 is transferred, the memory gater of the cell becomes 1. , if no 1 is transferred, the stored data in the cell becomes 0.
セット手段、あるセルの記憶データが1になると、入力
手段から入力されたデータに関係なく、二重線の矢印に
したがって次のセル記憶データ1にセットする働きを持
つ。つまり、例えばセルf+2が1であると、同時にf
23+ f34+ f4sも1となり、セルf2□が1
であると、同時にf33.fNも1となる。このような
構成において、第5列目のセルの記憶データを読み取る
ことにより照合結果を得ることができる。The setting means has the function of setting the next cell stored data to 1 according to the double line arrow, regardless of the data inputted from the input means, when the stored data of a certain cell becomes 1. In other words, for example, if cell f+2 is 1, at the same time f
23+ f34+ f4s also becomes 1, and cell f2□ becomes 1
At the same time, f33. fN also becomes 1. In such a configuration, the verification result can be obtained by reading the stored data of the cell in the fifth column.
以上を第5図、第6図(a)−(h)に基づいて更に詳
細に説明する。The above will be explained in more detail based on FIG. 5 and FIGS. 6(a) to (h).
第5図、第6図(a)−(h)はそれぞれ第4図と同じ
構成を示すものであるが、簡単のため一部の記号を省略
して描いである。以下で用いる記号でこれらの図中に明
示していないものは、第4図中の対応する部位の記号を
用いている。また図中のセルで斜線を施したものは記憶
データが1であることを示し、白いセルは記憶データが
0であることを示している。5 and 6(a) to 6(h) each show the same configuration as FIG. 4, but some symbols are omitted for simplicity. For symbols used below that are not explicitly shown in these figures, the symbols for the corresponding parts in FIG. 4 are used. In addition, hatched cells in the figure indicate that the stored data is 1, and white cells indicate that the stored data is 0.
第5図は、照合を始める前の、先行発明による記号列照
合装置の初期状態を示す図である。初期状態ではセルf
i1の記憶データを1にセットしておく。するとセット
手段により、f2□r f33+ f<<の記憶データ
も1にセットされる。これら以外のセルの記憶データは
すべて0にしておく。FIG. 5 is a diagram showing the initial state of the symbol string matching device according to the prior invention before starting matching. In the initial state, cell f
Set the memory data of i1 to 1. Then, the storage data of f2□r f33+ f<< is also set to 1 by the setting means. All data stored in cells other than these are set to 0.
第6図(a)−(d)は照合記号列” A B CD
”に対して被照合記号列“’ABCD”を順にA、B。Figures 6(a)-(d) are collation symbol strings "A B CD
”, the symbol string to be matched “'ABCD” is sequentially A and B.
C,Dと入力していったときの本発明による記号列照合
装置の動作を、1記号の入力毎に示したものである。各
被照合記号が入力された後のセルアレイは、それまでに
入力された被照合記号列と照合記号列” A B CD
”との照合結果を示している。The operation of the symbol string matching device according to the present invention when inputting C and D is shown for each symbol input. After each collated symbol is input, the cell array contains the collated symbol strings and collated symbol strings that have been input so far.'' A B CD
” is shown.
この照合結果を知るには、5列目のセルの記憶データを
読み取ればよい。具体的には、5列目のセルで記憶デー
タが1になっているものの中で、発行番号が小さいもの
を探し、それがf15なら、被照合記号列と照合記号列
との距離は距離0.f25なら距離1.f35なら距離
2.f4sなら距離3゜該当するセルがなければ距離4
以上となる。To know this verification result, it is sufficient to read the data stored in the cell in the fifth column. Specifically, among the cells whose storage data is 1 in the fifth column, search for the one with the smallest issue number, and if it is f15, the distance between the symbol string to be matched and the symbol string to be matched is 0. .. If f25, distance is 1. For f35, distance is 2. If f4s, the distance is 3°; if there is no corresponding cell, the distance is 4
That's all.
以下、図の順にしたがって各図について詳しく説明する
。Each figure will be described in detail below in the order of the figures.
まず初期状態から被照合記号Aが入力されると、各セル
の記憶データは、第10図で示した初期状態から第6図
(a)のように変化する。この図は、上で述べたように
、被照合記号列” A B CD ”の照合の途中経過
として、照合記号列”ABCD”に対する被照合記号列
“A″の照合結果を示している。セルf45の記憶デー
タが1になっており、これはA′′が“’ABCD”か
ら距離3にあることを示している。First, when the symbol A to be verified is input from the initial state, the stored data in each cell changes from the initial state shown in FIG. 10 as shown in FIG. 6(a). As mentioned above, this figure shows the result of matching the symbol string to be matched "A" against the symbol string to be matched "ABCD" as part of the process of matching the symbol string to be matched "A B CD ". The data stored in cell f45 is 1, which indicates that A'' is at a distance of 3 from "'ABCD".
次に被照合記号Bが入力されると、各セルの記憶データ
は、第6図(a)で示した状態から第6図(b)のよう
に変化する。この図は照合記号列1lAB CD ”に
対する被照合記号列“’AB’”の照合結果を示してい
る。セルf35の記憶データが1になっており、これは
“’ A B ”が”ABCD”から距離2にあること
を示している。Next, when the symbol B to be verified is input, the stored data in each cell changes from the state shown in FIG. 6(a) to the state shown in FIG. 6(b). This figure shows the result of matching the symbol string to be matched "'AB'" against the matching symbol string 11AB CD.The stored data in cell f35 is 1, which means that "'A B" is "ABCD". This shows that it is at a distance of 2 from .
続いて被照合記号Cが入力されると、各セルの記憶デー
タは、第6図(b)で示した状態から第6図(c)のよ
うに変化する。この図は照合記号列“’ABCD”′に
対する被照合記号列“’ABC”の照合結果を示してい
る。セルf25の記憶データが1になっており、これは
“AB’”が“A B CD ”から距離1にあること
を示している。When the symbol C to be verified is subsequently input, the stored data in each cell changes from the state shown in FIG. 6(b) to the state shown in FIG. 6(c). This figure shows the result of matching the symbol string to be matched "'ABC" against the matching symbol string "'ABCD"'. The data stored in cell f25 is 1, which indicates that "AB'" is at a distance of 1 from "A B CD ".
最後に被照合記号りが入力されると、各セルの記憶デー
タは、第6図(c)で示した状態から第6図(d)のよ
うに変化する。この図は照合記号列” A B CD
”に対する被照合記号列“’ABCD”の最終的な照合
結果を示している。セルf+5の記憶データが1になっ
ており、これは“’AB CD ’“が“’ABCD”
から距離0にあることを示している。When the symbol to be collated is finally input, the stored data in each cell changes from the state shown in FIG. 6(c) to the state shown in FIG. 6(d). This figure shows the collation symbol string "A B CD
” shows the final matching result of the symbol string to be matched “’ABCD”. The stored data in cell f+5 is 1, which means that “’AB CD ” is “’ABCD”.
This shows that the distance is 0 from .
このように、被照合記号列” A B CD ”を順に
上記号ずつ入力していくことにより、この被照合記号列
に対する照合の途中経過及び最終結果を順次知ることが
出来る。このようにして得られた照合結果は、明らかに
被照合記号列と照合記号列との間の正しい距離を与えて
いる。なぜなら、被照合記号列“l A I+は“AB
CD”に単位操作である上記号の除去を3回行なったも
のだし、同じく“A B ”は2回、ABC”は1回、
”ABCD I+は0回行なったものだからである。In this way, by sequentially inputting the symbol string to be matched "A B CD " one by one, the progress and final result of matching for this symbol string to be matched can be sequentially known. The matching result obtained in this way clearly gives the correct distance between the symbol string to be matched and the symbol string to be verified. This is because the symbol string to be matched “l A I+” is “AB
"CD" was subjected to the unit operation of removing the upper symbol three times; similarly, "A B" was performed twice, ABC" was performed once,
``ABCD I+ has been done 0 times.
第6図(e)−(h)は第6図(a)−(d)と同じ条
件で、被照合記号列を“’ A CX D ”にした場
合を示したものである。簡単に説明すると、第6図(e
)は被照合記号列“A”が照合記号列” A B CD
”から距離3であることを、第6図(f) 、 (g
) 、 (h)はそれぞれ被照合記号列“’AC″″“
A CX ”” A CX D”が照合記号列゛ABC
D”から距離2であることを示している。これらの結果
がそれぞれの記号列間の正しい距離を与えていることは
明かである。FIGS. 6(e) to 6(h) show the case where the symbol string to be matched is "'ACXD" under the same conditions as FIGS. 6(a) to (d). To explain briefly, Fig. 6 (e
), the symbol string to be matched “A” is the symbol string to be matched” A B CD
6(f), (g
) and (h) are the symbol strings to be matched “'AC””“
A CX “” A CX D” is the collation symbol string “ABC”
It is clear that these results give the correct distance between each symbol string.
このようにして、第4図に示した構成により、ある被照
合記号列が照合記号列“’ABCD”から距離3の範囲
内にあるかどうかを判別することができる。よって、複
数の被照合記号列を次々に入力していけば、その中から
照合記号列から距離3の範囲内にある全ての被照合記号
列を検索することが可能になる。In this way, with the configuration shown in FIG. 4, it is possible to determine whether a certain symbol string to be verified is within a distance of 3 from the symbol string to be verified "'ABCD". Therefore, by inputting a plurality of symbol strings to be matched one after another, it is possible to search among them all symbol strings to be matched within a distance of 3 from the symbol string to be matched.
上記のように先行発明の記号列照合装置で照合記号列か
ら任意の距離内にある被照合記号列を検索できる。しか
し、先行発明は記号列照合装置のセルアレイの大きさに
よって、照合できる記号列の長さが固定されてしまうた
め、長さの違った照合記号列に対しては、別の記号列照
合装置を用意しなければならないという欠点があった。As described above, the symbol string matching device of the prior invention can search for a symbol string to be matched within an arbitrary distance from a matching symbol string. However, in the prior invention, the length of the symbol string that can be matched is fixed depending on the size of the cell array of the symbol string matching device, so a different symbol string matching device is required for matching symbol strings of different lengths. The drawback was that it had to be prepared.
また、先行発明の記号列照合装置では、一つの照合記号
列と被照合記号列しか照合できないため、複数の照合記
号列の中から、被照合記号列に最も近い記号列を探す照
合動作が行えなかった。本発明の目的はこのような問題
を解決し、簡易な制御方式である長さ以下の複数の照合
記号列と被照合記号列を並列に照合することが可能な、
記号列照合装置の制御方式を提供することにある。In addition, since the symbol string matching device of the prior invention can only match one matching symbol string and the to-be-matched symbol string, a matching operation that searches for the symbol string closest to the to-be-matched symbol string from among multiple matching symbol strings cannot be performed. There wasn't. The purpose of the present invention is to solve such problems, and to provide a simple control method that is capable of collating multiple collation symbol strings of length or less and a symbol string to be collated in parallel.
The object of the present invention is to provide a control method for a symbol string matching device.
上記目的を達成するため、第1の本発明の記号列照合装
置の制御方式は、記号列比較結果を記憶するセルをM行
(Mは整数)N+1列に並べたセルアレイと、照合記号
列のj番目(jはN以下の任意の正整数)の記号と同じ
入力記号が与えられたときのみ、前記セルアレイのi行
(iはM以下の任意の正整数)j列目であるセルfi1
の記憶データをセルfhj+1に転送する第1の転送手
段と、照合記号列のj番目の記号と違う入力記号が与え
られたときのみ、前記セルアレイのh行(hはM未満の
任意の正整数)j列目であるセルfhlの記憶データを
セルf h+1j+1に転送する第2の転送手段と、入
力信号が与えられると、与えられた入力信号の如何にか
かわらず前記セルアレイのh行に列目(kはN+1以下
の任意の正整数)であるセルfhkの記憶データをセル
f h+1bに転送する第3の転送手段と、前記第1か
ら第3の転送手段によりセルf1.に少なくとも一つげ
1が転送されてくるとセルfikの記憶データを1にし
、前記第1から第3の転送手段によりセルfikに1が
一つも転送されてこなければセルfikの記憶データを
0にする入力手段と、セルfhjの記憶データが1にな
ると、前記入力手段によりセルfh+lj+1に与えら
れた入力によらず、セルf h+++++の記憶データ
を1にセットするセット手段を備えた構成をしており、
このような構成におゝいて、照合記号列の長さがN以下
の任意の正整数りである場合の照合を、少なくとも、前
記セルアレイの全てのセル値を0にした後、前記セルf
1lの記憶データを1にセットすることにより初期設定
を行なうことと、被照合記号列を1記号ずつ順に与える
ことにより記号列照合を実行することと、前記セルアレ
イのL+1列目のM個のセルの中から、記憶データが1
であり、かついちばん行番号が小さいセルを探すことに
より、照合の結果として照合記号列と被照合記号列との
距離を得ることを含むことを特徴とする。In order to achieve the above object, a control method for a symbol string matching device according to the first aspect of the present invention includes a cell array in which cells for storing symbol string comparison results are arranged in M rows (M is an integer) and N+1 columns, and a cell array for storing symbol string comparison results. Only when the same input symbol as the j-th symbol (j is any positive integer equal to or less than N) is given, the cell fi1 in the i-th row (i is any positive integer equal to or less than M) and the j-th column of the cell array
The first transfer means transfers the stored data of ``fhj+1'' to the cell fhj+1, and only when an input symbol different from the j-th symbol of the collation symbol string is given, the memory data of hth row (h is any positive integer less than M) of the cell array is transmitted. ) second transfer means for transferring the stored data of the cell fhl in the jth column to the cell fh+1j+1; (k is any positive integer equal to or smaller than N+1) of cell fhk, and a third transfer means for transferring the stored data of cell fhk to cell fh+1b; When at least one ``1'' is transferred to cell fik, the stored data of cell fik is set to 1, and if no 1 is transferred to cell fik by the first to third transfer means, the stored data of cell fik is set to 0. and a setting means for setting the stored data of the cell fh+++++ to 1 when the stored data of the cell fhj becomes 1, regardless of the input given to the cell fh+lj+1 by the input means. Ori,
In such a configuration, when the length of the verification symbol string is an arbitrary positive integer equal to or less than N, verification is performed at least by setting all the cell values of the cell array to 0, and then using the cell f.
performing initialization by setting the stored data of 1l to 1; performing symbol string matching by sequentially giving symbol strings to be matched one symbol at a time; and Memory data is 1 from
The present invention is characterized in that it includes obtaining the distance between the matching symbol string and the matching symbol string as a result of matching by searching for the cell with the smallest row number.
第2の本発明の記号列照合装置の制御力式は、前記記号
列照合装置を複数個用いて、複数の照合記号列と被照合
記号列との記号列照合を同時に実行し、照合の結果とし
て被照合記号列との距離が最も小さい照合記号列を特定
し、その距離の値を得ることを特徴とする。The second control force formula of the symbol string matching device of the present invention uses a plurality of the symbol string matching devices to simultaneously execute symbol string matching between a plurality of matching symbol strings and a symbol string to be matched, and the result of the matching is The method is characterized in that the matching symbol string having the smallest distance from the matching symbol string is identified as , and the value of that distance is obtained.
本発明では、照合結果を、先行発明で用いられるセルア
レイの全ての列から読み取れるようにすることにより、
セルアレイの列数よりも小さい任意の長さの照合記号列
に対して、照合を行える。In the present invention, by making it possible to read the matching results from all columns of the cell array used in the prior invention,
Verification can be performed on a verification symbol string of any length smaller than the number of columns in the cell array.
例えば、第4図のセルアレイを用いて、照合記号列“A
B’”に対する照合を行なうようにするために、3列目
のセルの値を読みとるようにすればよい。このように、
照合記号列の長さに応じて、照合結果を読みとる列を変
えることにより、N+1列のセルアレイを持つ記号列照
合装置で長さN以下の任意の照合記号列を処理できるよ
うになる。For example, using the cell array shown in FIG.
In order to match against B'”, you can read the value of the cell in the third column. In this way,
By changing the column from which the verification result is read depending on the length of the verification symbol string, a symbol string verification device with a cell array of N+1 columns can process any verification symbol string of length N or less.
更に、この記号列照合装置を複数個並べ、それぞれに違
った照合記号列を登録し、被照合記号列を1記号ずつ各
記号列照合装置に同時に入力することにより、複数の照
合記号列を同時に照合できるようにすることができる。Furthermore, by arranging multiple symbol string matching devices, registering different matching symbol strings in each, and simultaneously inputting the symbol string to be matched one symbol at a time to each symbol string matching device, multiple matching symbol strings can be simultaneously processed. You can make it possible to match.
第1図は、本発明による記号列照合装置の一実施例を示
す構成図である。以下同図について説明する。FIG. 1 is a block diagram showing an embodiment of a symbol string matching device according to the present invention. The figure will be explained below.
まず第1図の構成について説明する。同図において記号
列照合装置は、初期セット端子1l0と、N本(Nは正
整数)の一致信号入力端子1201〜120−Nと、N
木の照合記号列長設定端子125−1〜Nと、M行(M
は正整数)N+1列に並べられ、データ入力するD端子
、データを出力するQ端子、データを1にセットするS
ET端端
子7持つレジスタ130と、i行(iはM以下の任意の
正整数)j列(jはN以下の任意の正整数)目のレジス
タf++130のQ端子と入力端子120−jに入力端
子がつながり、i=1であれば右横のレジスタf、、+
、130のD端子の出力端子がつながる第1のアンドゲ
ート140と、レジスタfh+130(hはM未満の任
意の正整数)のQ端子に入力がつながり、入力端子12
0−jに反転入力端子がつながる第2のアンドゲート1
50と、レジスタfhj130(kはN+1以下の任意
の正整数)のQ端子に入力がつながるデータ転送線16
0と、入力として、レジスタf、+1□130のQ端子
につながる第1のアンドゲート140の出力と、レジス
タfy130のQ端子につながる第2のアンドゲート1
50の出力と、レジスタf hl+1l.30のQ端子
につながるデータ転送線160の出力とを受け、レジス
タf、+、、+、 130のD端子に出力する第1のオ
アゲート170と、レジスタfhj130のD端子の出
力をレジスタf h++r+、130のSET端子に入
力するセット線180と、レジスタ130のQ端子と照
合記号列長設定端子125につながる第3のアンドゲー
ト185と、第3のアンドゲートの出力を受ける第2の
オアゲート186と、第2のオアゲート186の出力を
外部に出力するM本の出力端子190−1〜190−M
とを備えている。First, the configuration shown in FIG. 1 will be explained. In the figure, the symbol string matching device has an initial set terminal 1l0, N matching signal input terminals 1201 to 120-N (N is a positive integer), and N
Tree verification symbol string length setting terminals 125-1 to N and M rows (M
is a positive integer) are arranged in N+1 columns, the D terminal inputs data, the Q terminal outputs data, and the S terminal sets data to 1.
Input to the Q terminal and input terminal 120-j of register 130 with ET terminal 7, register f++130 in row i (i is any positive integer less than or equal to M) and column j (j is any positive integer less than or equal to N) If the terminals are connected and i = 1, the register f on the right side,, +
, 130 are connected to the first AND gate 140, and the input is connected to the Q terminal of the register fh+130 (h is any positive integer less than M), and the input terminal 12
Second AND gate 1 whose inverting input terminal is connected to 0-j
50 and a data transfer line 16 whose input is connected to the Q terminal of register fhj130 (k is any positive integer equal to or less than N+1)
0, and as inputs the output of the first AND gate 140 connected to the Q terminal of register f, +1□130, and the second AND gate 1 connected to the Q terminal of register fy130.
50 output and register f hl+1l. A first OR gate 170 receives the output of the data transfer line 160 connected to the Q terminal of 30 and outputs it to the D terminal of register f, +, , +, 130, and the output of the D terminal of register fhj130 is sent to register f, +, , +, 130. A set line 180 input to the SET terminal of the register 130, a third AND gate 185 connected to the Q terminal of the register 130 and the collation symbol string length setting terminal 125, and a second OR gate 186 receiving the output of the third AND gate. , M output terminals 190-1 to 190-M that output the output of the second OR gate 186 to the outside.
It is equipped with
第1図において、入力端子120−jには、照合記号列
のj番目の記号と被照合記号とが一致するば1.一致し
なければOが与えられる。すると、第1のアンドゲート
140は、照合記号列のj番目と被照合同じ記号が与え
られたときだけレジスタfh+130の記憶データをレ
ジスタfh+++ 130に転送し、それ以外は0を転
送する。逆に第2のアンドゲート150は照合記号列の
j番目と違う被照合記号が与えられたときにはレジスタ
fh1l30の記憶データをレジスタf h+++++
130に転送し、同じであれば0を転送する。In FIG. 1, the input terminal 120-j receives 1. if the j-th symbol of the collation symbol string matches the symbol to be collated. If there is no match, O is given. Then, the first AND gate 140 transfers the data stored in the register fh+130 to the register fh+++ 130 only when the j-th symbol of the collation symbol string and the same symbol to be collated is given, and otherwise transfers 0. Conversely, when the second AND gate 150 is given a symbol to be matched that is different from the j-th symbol in the string of symbols to be matched, the data stored in the register fh1l30 is transferred to the register fh++++++.
130, and if they are the same, transfer 0.
第2図は、第1図の記号列照合装置の入力信号を与える
入力装置の実施例である。同図は各信号が1ビツトで構
成されている場合を示している。FIG. 2 shows an embodiment of an input device for providing input signals to the symbol string matching device of FIG. The figure shows a case where each signal is composed of 1 bit.
まず照合記号列登録端子210−1〜210−Nから、
照合記号列をレジスタ240に登録する。First, from the verification symbol string registration terminals 210-1 to 210-N,
The verification symbol string is registered in the register 240.
次に、照合記号列の長さがLであれば、照合記号列長設
定端子220−Lにのみ値lを、他の照合記号列長設定
端子には“0パを与え、レジスタ250に登録する。Next, if the length of the verification symbol string is L, the value 1 is given only to the verification symbol string length setting terminal 220-L, “0” is given to the other verification symbol string length setting terminals, and the value is registered in the register 250. do.
被照合記号列は、被照合記号列入力端子230より1記
号ずつ入力され、比較器260で照合記号列の各記号と
比較される。比較の結果、両記号が一致していれば1.
一致していなけれぽ0が一致信号出力端子270−1〜
270−Nから出力される。一致信号出力端子270−
jの出力を第1図の入力端子120−jに入力すること
により第1図の説明で述べたような入力を得ることがで
きる。また、レジスタ250に登録された値はそのまま
照合記号列長出力端子280から出力される。The symbol string to be verified is input one symbol at a time from the symbol string input terminal 230 to be verified, and is compared with each symbol of the symbol string to be verified by the comparator 260. As a result of comparison, if both symbols match, 1.
If they do not match, 0 is the match signal output terminal 270-1~
270-N. Match signal output terminal 270-
By inputting the output of j to the input terminal 120-j in FIG. 1, the input described in the explanation of FIG. 1 can be obtained. Further, the value registered in the register 250 is output as is from the verification symbol string length output terminal 280.
第2図の照合記号列長出力端子280の出力は、第1図
の記号列長設定端子120に与えられる。The output of the collation symbol string length output terminal 280 in FIG. 2 is applied to the symbol string length setting terminal 120 in FIG.
つまり、照合記号列の曇さがLであれば、120Lにの
み1が与えられる。これにより、第3のアンドゲートの
働きで、第し+1列目のレジスタ130のQ端子の出力
のみが、第2のオアゲート186に送られるよって、。In other words, if the cloudiness of the verification symbol string is L, 1 is given only to 120L. As a result, only the output of the Q terminal of the register 130 in the 2nd+1st column is sent to the second OR gate 186 by the action of the third AND gate.
出力端子190に与えられるのは、L+1列目のレジス
タ130の出力、即ち長さLの照合記号列に対する照合
結果である。What is applied to the output terminal 190 is the output of the register 130 in the L+1 column, that is, the matching result for the matching symbol string of length L.
第3図はこの記号列照合装置をK (Kは任意の正整数
)個並べた場合の制御方式を示した実施例である。同図
は、各入力装置350と各記号列照合装置360を上述
のように接続し、それをX個行方向に並べた構成をして
いる。各入力装置350には、照合記号列入力端子31
0から、長さがN以下の照合記号列がそれぞれに登録さ
れる。またそれぞれの照合記号列の長さに応じた入力が
照合記号列長設定端子320から、各入力装置350に
登録される。FIG. 3 shows an embodiment showing a control system when K (K is any positive integer) of this symbol string matching device are arranged. In the figure, each input device 350 and each symbol string matching device 360 are connected as described above, and X number of them are arranged in the row direction. Each input device 350 includes a verification symbol string input terminal 31
Verification symbol strings starting from 0 and having a length of N or less are registered respectively. Further, an input corresponding to the length of each verification symbol string is registered in each input device 350 from the verification symbol string length setting terminal 320.
これらの登録に応じた照合を、初期設定端子340から
各記号列照合装置360を初期設定した後、被照合記号
列入力端子330に被照合記号をl記号づつ入力して、
各入力装置350の被照合記号列入力端子230に同時
に与えることにより行なう。各記号列照合装置360の
出力端子190には、照合結果として各照合記号列と、
被照合記号列の距離が同時に得られる。この出力はプラ
イオリティエンコーダ370に与えられる。After initializing each symbol string matching device 360 from the initial setting terminal 340, inputting the symbols to be matched one by one into the symbol string input terminal 330 to perform matching according to these registrations.
This is done by simultaneously applying it to the input terminal 230 of the symbol string to be collated of each input device 350. The output terminal 190 of each symbol string matching device 360 receives each matching symbol string as a matching result,
The distance of the matched symbol string can be obtained at the same time. This output is provided to priority encoder 370.
プライオリティエンコーダは公知のものであるので詳し
い説明は省くが、入力端子327に与えられた入力をエ
ンコードして、被照合記号列といちばん距離が小さい照
合記号列が登録された記号列照合装置360のアドレス
と、その時の距離の値とを出力する機能を持つ。これに
より、複数の照合記号列から被照合記号列にいちばん近
い記号列を検索し、かつその時の距離を得ることが可能
になる。Since the priority encoder is well-known, a detailed explanation will be omitted, but it encodes the input given to the input terminal 327 and uses the symbol string matching device 360 in which the matching symbol string having the shortest distance from the symbol string to be matched is registered. It has a function to output the address and the distance value at that time. This makes it possible to search for the symbol string closest to the to-be-matched symbol string from a plurality of matching symbol strings, and to obtain the distance at that time.
本発明による記号列照合装置の制御方式によれば、以上
で説明してきたように、先行発明の記号列照合装置の構
成に簡単な論理ゲートを付加し、それを並べるだけで、
一定の長さ以下の任意の照合記号列に対する照合を波列
に実行することが出来るようになる。According to the control method of the symbol string matching device according to the present invention, as explained above, by simply adding simple logic gates to the structure of the symbol string matching device of the prior invention and arranging them,
It becomes possible to perform matching on a wave train against any matching symbol string of a certain length or less.
【図面の簡単な説明】
第1図は本発明の記号列照合装置の実施例を示す構成図
、第2図は入力装置の構成図、第3図は複数の記号列照
合を同時に実行する記号列照合装置の構成図、第4図、
第5図、第6図は従来技術を説明するための原理図であ
る。
130・・・レジスタ、240・・・照合記号レジスタ
、250・・・記号列長レジスタ、260・・・比較器
、350・・・入力装置、360・・・記号列照合装置
、370・・・プライオリティエンコーダ、380・・
・一致アドレス出力装置、fij等・・・セル。[BRIEF DESCRIPTION OF THE DRAWINGS] Fig. 1 is a block diagram showing an embodiment of the symbol string matching device of the present invention, Fig. 2 is a block diagram of an input device, and Fig. 3 is a symbol for simultaneously performing multiple symbol string matching. Configuration diagram of the column matching device, Fig. 4,
FIGS. 5 and 6 are principle diagrams for explaining the prior art. 130... Register, 240... Collation symbol register, 250... Symbol string length register, 260... Comparator, 350... Input device, 360... Symbol string matching device, 370... Priority encoder, 380...
- Matching address output device, fij, etc...cell.
Claims (1)
)N+1列に並べたセルアレイと、 照合記号列のj番目(jはN以下の任意の正整数)の記
号と同じ入力信号が与えられたときのみ、前記セルアレ
イのi行(iはM以下の任意の正整数)j列目であるセ
ルf_i_jの記憶データをセルf_i_j_+_1に
転送する第1の転送手段と、照合記号列のj番目の記号
と違う入力信号が与えられたときのみ前記セルアレイの
h行 (hはM未満の任意の正整数)j列目であるセルf_h
_jの記憶データをセルf_h_+_1_j_+_1に
転送する第2の転送手段と、 入力記号が与えられると、与えられた入力記号の如何に
かかわらず前記セルアレイのh行k列目(kはN+1以
下の任意の正整数)であるセルf_h_kの記憶データ
をセルf_h_+_1_kに転送する第3の転送手段と
、 前記第1から第3の転送手段によりセルf_i_kに少
なくとも一つ1が転送されてくるセルf_i_kの記憶
データを1にし、前記第1から第3の転送手段によりセ
ルf_i_kに1が一つも転送されてこなければセルf
_i_kの記憶データを0にする入力手段と、 セルf_h_jの記憶データが1になると、前記入力手
段によりセルf_h_+_1_j_+_1に与えられた
入力によらず、セルf_h_+_1_j_+_1の記憶
データを1にセットするセット手段を備えた記号列照合
装置において、 照合記号列の長さがN以下の任意の正整数Lである場合
の照合を、少なくとも、前記セルアレイの全てのセルの
値を0にした後、前記セルf_1_lの記憶データを1
にセットすることにより初期設定を行なう手段と、 被照合記号列を1記号ずつ順に与えることにより記号列
照合を実行する手段と、 前記セルアレイのL+1列目のM個のセルの中から、記
憶データが1であり、かついちばん行番号が小さいセル
を探すことをおこない、照合の結果として照合記号列と
被照合記号列との距離を得る手段を含むことを特徴とす
る記号列照合装置の制御方式。 2、前記記号列照合装置を複数個用いて、複数の照合記
号列と被照合記号列との記号列照合を同時に実行し、照
合の結果として被照合記号列との距離が最も小さい照合
記号列を特定し、その距離の値を得ることを特徴とする
請求項1記載の記号列照合装置の制御方式。[Claims] 1. A cell array in which cells for storing symbol string comparison results are arranged in M rows (M is a positive integer) and N+1 columns, and a j-th column of matching symbol strings (j is any positive integer equal to or less than N). a first transfer means that transfers the stored data of the cell f_i_j in the i-th row (i is any positive integer equal to or less than M) and the j-th column of the cell array to the cell f_i_j_+_1 only when an input signal having the same symbol as is given; Then, only when an input signal different from the j-th symbol of the collation symbol string is given, the cell f_h in the h-th row (h is any positive integer less than M) of the j-th column of the cell array
a second transfer means for transferring the stored data of _j to cell f_h_+_1_j_+_1; a third transfer means for transferring the stored data of the cell f_h_k, which is a positive integer), to the cell f_h_+_1_k; and the stored data of the cell f_i_k, at least one 1 being transferred to the cell f_i_k by the first to third transfer means. is set to 1, and if no 1 is transferred to the cell f_i_k by the first to third transfer means, the cell f
an input means for setting the stored data of the cell f_h_j to 0; and a setting means for setting the stored data of the cell f_h_+_1_j_+_1 to 1 when the stored data of the cell f_h_j becomes 1, regardless of the input given to the cell f_h_+_1_j_+_1 by the input means. In the symbol string matching device equipped with the above-mentioned symbol string matching device, matching when the length of the matching symbol string is an arbitrary positive integer L less than or equal to N is performed at least by setting the values of all cells in the cell array to 0, and then performing the matching in the cell f_1_l. Memory data 1
means for performing initial setting by setting a symbol string to be compared; means for performing symbol string matching by sequentially giving a symbol string to be matched one symbol at a time; is 1 and has the smallest row number, and includes means for obtaining the distance between the collated symbol string and the to-be-verified symbol string as a result of the collation. . 2. Using a plurality of the above-mentioned symbol string matching devices, simultaneously execute symbol string matching between a plurality of symbol strings to be matched and a symbol string to be matched, and as a result of the matching, select a matching symbol string that has the smallest distance from the symbol string to be matched. 2. The control method for a symbol string matching device according to claim 1, wherein the method specifies the symbol string matching device and obtains a value of the distance.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2172209A JPH0460871A (en) | 1990-06-29 | 1990-06-29 | Controlling system for symbol string collating device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2172209A JPH0460871A (en) | 1990-06-29 | 1990-06-29 | Controlling system for symbol string collating device |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH0460871A true JPH0460871A (en) | 1992-02-26 |
Family
ID=15937618
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2172209A Pending JPH0460871A (en) | 1990-06-29 | 1990-06-29 | Controlling system for symbol string collating device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0460871A (en) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6195442A (en) * | 1984-10-16 | 1986-05-14 | Nec Corp | Matching device of code string |
JPH02115973A (en) * | 1988-10-25 | 1990-04-27 | Nec Corp | Symbol string collation device and its control system |
-
1990
- 1990-06-29 JP JP2172209A patent/JPH0460871A/en active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6195442A (en) * | 1984-10-16 | 1986-05-14 | Nec Corp | Matching device of code string |
JPH02115973A (en) * | 1988-10-25 | 1990-04-27 | Nec Corp | Symbol string collation device and its control system |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10489455B2 (en) | Scoped search engine | |
JP2737173B2 (en) | Symbol string collating device and its control method | |
JP6109186B2 (en) | Counter operation in a state machine grid | |
JPS60501921A (en) | Method and apparatus for parallel text matching | |
US10949290B2 (en) | Validation of a symbol response memory | |
CN112825249B (en) | Voice processing method and equipment | |
JP2023501010A (en) | A Classification Method for Application Preference Text Based on TextRank | |
JP5120263B2 (en) | Pattern matching apparatus and method | |
JPH024026B2 (en) | ||
JPH0460871A (en) | Controlling system for symbol string collating device | |
CN102663051A (en) | Method and system for searching content addressable memory | |
JPH0484367A (en) | Control system for symbol string collating device | |
JPH04308B2 (en) | ||
JPH03208172A (en) | Control system for mark string collation device | |
JP2839515B2 (en) | Character reading system | |
TW542962B (en) | Method of addressing a set of addressable units and corresponding system | |
CN117910477A (en) | Training method and device of model, semantic understanding method, device and medium | |
CN114662466A (en) | Model training method, text matching device and electronic equipment | |
JPS61260493A (en) | Associative memory | |
JP2773657B2 (en) | String search device | |
JPS61251983A (en) | Recognizing device | |
JPH0268663A (en) | Character string retrieving device | |
JPH0438026B2 (en) | ||
JPH01245493A (en) | Associated memory device | |
SU342185A1 (en) | DEVICE FOR SEARCHING INFORMATION |