JPS6128134A - Symbol string collecting device and its control system - Google Patents

Symbol string collecting device and its control system

Info

Publication number
JPS6128134A
JPS6128134A JP14892684A JP14892684A JPS6128134A JP S6128134 A JPS6128134 A JP S6128134A JP 14892684 A JP14892684 A JP 14892684A JP 14892684 A JP14892684 A JP 14892684A JP S6128134 A JPS6128134 A JP S6128134A
Authority
JP
Japan
Prior art keywords
symbol string
symbol
storage means
temporary storage
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP14892684A
Other languages
Japanese (ja)
Other versions
JPH0554148B2 (en
Inventor
Hachiro Yamada
山田 八郎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP14892684A priority Critical patent/JPS6128134A/en
Publication of JPS6128134A publication Critical patent/JPS6128134A/en
Publication of JPH0554148B2 publication Critical patent/JPH0554148B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PURPOSE:To extract flexibly an optional string among non-structure symbol strings in a short time by inputting a symbol string sequentially and transmitting externally the location of the symbol string similar to a registered collation symbol string. CONSTITUTION:The titled device is provided with a means 110 storing a symbol string in a bit pattern related to a symbol, plural counters 120 using a read signal 12 to control the change in the content, a register 130 as a temporary storage means and a means 140 adding the content of the counter 120 of the lowest stage and the content of the register 130, and the counter 120 includes a logical operation means 123 and a means 124 storing the result of operation. When a transfer signal 122 is applied at the leading of one shot pulse of a clock 121, the content of the counter 120 is transferred from the upper to the lower position, the collation processing to all symbol strings is executed and the content of the counter 120 of the final stage represents the similarity between the input symbol string and the collated symbol string. The similarity and the content of the register 130 are added (140) and the result is transmitted externally as the similarity output 125.

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は情報処理システムの構成要素に係り、より具体
的CCは長大な記号列の、中から特定の記号列を抽出す
る記号列照合装置とその照合方式に関するものである。
Detailed Description of the Invention (Industrial Application Field) The present invention relates to a component of an information processing system, and more specifically CC is a symbol string matching device that extracts a specific symbol string from a long symbol string. and its matching method.

(従来技術とその問題点) −F記記号列照合装置はバタン認識システムでの%徴系
列の抽出、ワ、−プロで作成された文章の原文ファイル
からのキーワードの抽出、言語翻訳の支援や通信文章の
略又の解説、図形、イメー7、テキスト等による弁構造
テークベースの構築に利用され、知能化されるこれらの
情報処理システムの形に欠くことができないものである
(Prior art and its problems) - The F symbol string matching device can be used to extract % symbol sequences in a batan recognition system, - extract keywords from the original text file of sentences created in a professional, and support language translation. It is used to construct a valve structure take base using abbreviated explanations of communication texts, figures, images, texts, etc., and is indispensable for the form of these information processing systems that are becoming intelligent.

従来の記号列照合は汎用コンピュータのソフトウェアに
たよった逐次処理によるため、膨大な処理時間を必要と
し、小規模なものに限定されていた。また、単語毎に区
切られて構造化された記号列に照合対象が制限されて諭
た。−列として、。
Conventional symbol string matching requires sequential processing using general-purpose computer software, requires an enormous amount of processing time, and is limited to small-scale applications. In addition, the target of matching was limited to structured symbol strings separated by words. - as a column.

個の記号列からなるテキスト中Kn個の記号列から々る
バタンかどこに有るかを調べる場合には、m (n、−
m + 1 )回の照合処理を必要とする。磁気ディス
クや元ディスク等に格納されたm=109個の文字列の
テキストから、n−=10”個の文字列の文章を捜すに
は10 回の照合処理を必要とする従って、テキスト、
イメージ、図形、音声等の犬容附な原情報による検索は
非現実的であるため、予め原情報にキーワードを付加し
ての検束や表形式に構造化されたテークの検束に限定さ
れていた。
If you want to find out where the button is located from Kn symbol strings in a text consisting of Kn symbol strings, m (n, -
m + 1) times of verification processing is required. Searching for a sentence with n-=10" character strings from a text with m=109 character strings stored on a magnetic disk or original disk requires 10 matching processes. Therefore, the text,
Since it is impractical to search using supplementary source information such as images, figures, and sounds, searches have been limited to searching by adding keywords to the source information in advance or searching for takes structured in a tabular format. .

また、記号列の構成要素の変動を許容する柔軟な記号列
照合に対して処理時間の長くなりすぎる欠点があった。
Another disadvantage is that the processing time is too long for flexible symbol string matching that allows variations in the constituent elements of symbol strings.

さらKJ4体的に従来の記号列照合装置とその照合方式
の問題点について説明する。
Furthermore, the problems of the conventional symbol string matching device and its matching method will be explained in detail.

第6図は記号列照合の対象となるテキストを示している
。このテキストは報告書の始めの部分を一列として示し
ている。このようなテキストはワープロのファイルメモ
リに多数個格納される。それ等のテキストの中から、必
要なものをさがし出す時に、要求内容を示す単語によっ
て直接に検原できる事が求められる。
FIG. 6 shows the text that is the subject of symbol string matching. This text shows the beginning of the report as a single column. A large number of such texts are stored in the file memory of the word processor. When searching for what you need from such texts, you are required to be able to search for it directly using words that indicate the content of your request.

たとえば、第1図のテキストがmemory、 bub
ble等の記号列を含む論文であるかを知るためKは、
そのテキストの中でmemory、 memories
 Jpbubble等の記号列に整合する部分があるか
否かを検束する必要がある。そのような記号列のテキス
トとの比較照合は従来のコンピュータとソフトウェアで
対応させると、非常に長い時間を要する。
For example, the text in Figure 1 is memory, bu
In order to know whether the paper contains a symbol string such as ble, K
In that text memory, memories
It is necessary to check whether there is a matching part in the symbol string such as Jpbubble. Comparing such symbol strings with text would take a very long time if conventional computers and software were used.

一般のA4ザイズの英文はワード間のスペースを含める
と、約3000 文字の是さはなる。一方、比較照合を
行なう記号列の長さはmelno r Yの場合もde
viceの場合も6文字である。6文字と3000文字
の記号列間の照合は一般にその積に等しいオーダの回数
に及ぶ文字の比較を必要とする。マイクロプロセッサで
の文字比較時間が1μsec  であったとしても、各
記号列の検束に18m5ecの時間がかかる。
A typical A4 size English text is approximately 3,000 characters long, including spaces between words. On the other hand, the length of the symbol string used for comparison and matching is de
Vice also has 6 characters. Matching between 6-character and 3000-character strings generally requires character comparisons a number of times on the order of the product. Even if the character comparison time in the microprocessor is 1 μsec, it takes 18 m5 ec to check each symbol string.

現実に横飛の対象となるテキストの文字数は10個に及
び、照合を行なう記号列の文字数も100を越すことも
ありうる。照合恣れる記号列の数を1個だけでなく、数
10個に及ぶ。その場合の照合時間は数100時間に及
ぶ。故に、このような照合は現実的に不可能であり、実
際は入手により予めキーソードを抽出しておき、抽出さ
れたキーワドに対する照合に限定されていた。
In reality, the number of characters in the text to be skipped is ten, and the number of characters in the symbol string to be compared may exceed 100. The number of symbol strings that can be matched is not just one, but tens. In that case, the verification time spans several hundreds of hours. Therefore, such matching is practically impossible, and in reality, key words are extracted in advance by acquisition, and matching is limited to the extracted keywords.

また、一部の記号に欠けや誤りのある記号列や余分な記
号が付加された記号列の照合が困難である。例えば、文
字列’ MEMORY“ に門し、その中文字゛0“が
他の文字11 X″に置換った文字列皐MEMXR,Y
“や、文字110 L/が欠けたMEMRY“や余分な
文字It X l/が付加された”MRMXOI(、Y
“が入力された場合に、照合又字列′″M、BΔ40R
Y”と類似していることを出力できることが記号列照合
VC望まれる。しかし、従来の記号列照合装置や照合方
式では一部の記号の誤りに関しでは照合記号列と重ね合
せて比較することにより類似性を調べることができるが
、一部の記号の欠けや余分な文字の付加に苅しては対処
できなかった。
Furthermore, it is difficult to match symbol strings in which some symbols are missing or incorrect, or symbol strings to which extra symbols are added. For example, take the string 'MEMORY'' and enter the string MEMXR,Y in which the middle character '0' is replaced with another character 11 'X'.
MRMXOI (,Y
If " is input, the collation or character string '"M, BΔ40R
It is desirable for a symbol string matching VC to be able to output information similar to "Y".However, in conventional symbol string matching devices and matching methods, errors in some symbols can be detected by superimposing them on the matching symbol string and comparing them. Although it is possible to check for similarities, it was not possible to deal with missing some symbols or adding extra characters.

(発明の目的) 本発明の目的は上記従来の記号列照合装置やその方式の
欠点を容易に解決し、テキスト、イメージ、図形等の非
構造の記号列の1中から任意の記号列を短時間にして、
柔軟な抽出が可能な記号列照合装置とその照合方式を提
供することにある。
(Objective of the Invention) The object of the present invention is to easily solve the drawbacks of the conventional symbol string matching device and its method, and to shorten any symbol string from one of unstructured symbol strings such as text, images, figures, etc. In time,
An object of the present invention is to provide a symbol string matching device and its matching method that can perform flexible extraction.

捷た、一部の記号の欠けや誤り、あるいは余分な記号が
付加された記号列についても照合可能な低価格な記号列
照合装置を提供することにある、(発明の構成) したがって、本発明によれば以下の記号列照合装置4と
その開側j方式が得られる。すなわち、記号コードをア
ドレス入力とし、照合記号列を記憶する記号列記憶手段
と、この各出力線につながる第1の演算手段と、複数の
演算手段間を相互に結合する第1の一時記憶手段と、特
定の第1の一時記憶手段の出力につながる第2の一時記
憶手段・と、第2の一時記憶手段につながる第2の演算
手段とを含む記号列照合装置。
An object of the present invention is to provide a low-cost symbol string matching device that can match even a symbol string that is truncated, missing or erroneous in some symbols, or has extra symbols added. (Structure of the Invention) Therefore, the present invention According to , the following symbol string matching device 4 and its open side j method are obtained. That is, a symbol string storage means that takes a symbol code as an address input and stores a collation symbol string, a first calculation means connected to each of the output lines, and a first temporary storage means that interconnects the plurality of calculation means. a second temporary storage means connected to the output of a specific first temporary storage means; and a second calculation means connected to the second temporary storage means.

1把号コートをアドレス入力とし、照合記号列を記憶す
る記号列記憶手段と、この間出力線につながるEf41
の演算手段と、ネジ数の演算手段間を相互に結合するε
様lの一時記憶手段と、特定の第1の一時〒:+21’
、は手段の出力につながる第2の一時記憶手段と、第2
の一時記憶手段Vこつながる第2の演算手段と、外部か
ら与えられる許容類似度全記憶するレジスタと、このレ
ジスタの内容と第2の演算手段の出力とを比較し、照合
結果を出力するコンパレータどを含む記号列照合装置。
A symbol string storage means that uses the first code code as an address input and stores a collation symbol string, and an Ef41 connected to an output line during this period.
ε that mutually connects the calculation means of and the calculation means of the number of screws.
temporary storage means and a specific first temporary storage means 〒:+21'
, a second temporary storage means connected to the output of the means, and a second temporary storage means connected to the output of the means;
a second calculation means connected to the temporary storage means V; a register that stores all allowable similarities given from the outside; and a comparator that compares the contents of this register with the output of the second calculation means and outputs a comparison result. Symbol string matching device including

とさらに該コンパレータに接続するエン:1〜ダとト亥
レジスタに接続するデコータとを4#+iえた記号列照
合装置4と記号に関連づけたビットパタンで照合記号列
を記憶する記号列記憶手段のへ(正精叔)節目と(へ+
1)番目の出力線に各々つながるN番目第1;猜理演算
手段と(N+11街目第1演算手段との間のN番目第1
一時記憶手段の内容’(C(N−1)番目第1一時記憶
手段の内容V?CN番目1己号列記憶手段の出方線によ
り制御されたN番目第1演算手段の演算処理をjIfQ
こいtものとし且つ、特定の第1一時記憶手段の互いに
異なる時刻の内容に第2の演:!:’?]手段による演
算処理を測ずことで前記記号り1托1シ憶手段の内容と
鏝次入力された記号列の類似1ノ1を求める記号列照合
装(I¥、OIIi:I &II方式ティ〉ル、(実施
例) 以]・図面を用いて本・h゛、明の史に11組(な説明
を行なう。
and a symbol string collation device 4 which includes 4#+i encoders connected to the registers connected to the comparators, and a symbol string storage means for storing the collated symbol strings in bit patterns associated with the symbols. He (he) milestone and (he +
1) N-th first connected to the th output line respectively;
Contents of the temporary storage means'(C(N-1)th content of the first temporary storage means V?CNth 1 self-sequence storage means' output line controlled by the Nth first calculation means jIfQ
Assume that the content of the specific first temporary storage means at different times is stored in the second performance:! :'? ] A symbol string matching system (I\, OIIi: I & II system type) that finds the similarity between the contents of the symbol storage means and the sequentially input symbol string by measuring the arithmetic processing by the means. > Le, (embodiment)] -11 sets (explanations are given to the history of Akira, using drawings.

第1図は本発明の一実施例の説明図である。この記号列
照合装置I′7は第6図に示したような長大な記号列と
なるチキン、1・あるいはイメージ、画像、音声等をコ
ード化し、i己号列人カ端子111 がら逐次入力(7
、その中に登録済みの照合記号列と類似する記号列がど
こに含まれるがを外部に伝達するものであり、記号に関
連づけたビットパタンで記号列を記憶する記号列記憶手
段110、とその読み取り信号112 により内容の変
化がfHIJ (+ilIあれる複数段の複数ビットの
カウンタ120  と、最下段のカウンタ120  の
出力につながる第2の一時記憶手段としてのレジスタ1
30  最下段のカウンタ120 の内容N6とレジス
タ130 の内容とを加算する第2の演算手段である加
算器140 とから構成される。カウンタ120 Fi
論理演算手段123とそれからの演算結果を記憶する一
時記憶手段124 とを含んでいる。ここでは論理演算
手段123と一時記憶手段124 とをカウンタ120
  で代表させて説明を行なう、 照合記号列の各記号は記号列記憶手段110 の各ビッ
トに記号に関連づけたビットパタンで格納される。図の
例でFi6ビノトの記号列記憶手段110に’MEMO
RY“06個の記号からなる照合記号列を格納している
。すなわち、記号列記憶手段110 の第1から第6ビ
ツト目の各々記号1M“気へ〃、・・E〃、RM II
、鳩0〃、′″R〃、’Y“で指定されるアドレスにの
み“■〃が格納され、他は′0″が格納される。記号列
記憶手段110 のアドレスは記号の種類に対応し、そ
の第1から第6ビツト目の読取り信号112 は、各々
記号1−M〃、It I、; /7. IXM /l気
O〃、気R〃、パY〃 が入力されたときのみ■″とな
る。
FIG. 1 is an explanatory diagram of an embodiment of the present invention. This symbol string matching device I'7 encodes a long symbol string such as the one shown in FIG. 7
, a symbol string storage means 110 for storing the symbol string in a bit pattern associated with the symbol, and a symbol string storage means 110 for storing the symbol string in a bit pattern associated with the symbol. A register 1 as a second temporary storage means is connected to the output of a multi-stage multi-bit counter 120 whose contents are changed by the signal 112 and the lowest stage counter 120.
30 consists of an adder 140 which is a second arithmetic means for adding the content N6 of the counter 120 at the lowest stage and the content of the register 130. Counter 120 Fi
It includes a logic operation means 123 and a temporary storage means 124 for storing the results of the operation. Here, the logical operation means 123 and the temporary storage means 124 are used as the counter 120.
Each symbol of the collation symbol string is stored in each bit of the symbol string storage means 110 in a bit pattern associated with the symbol. In the example shown in the figure, 'MEMO' is stored in the symbol string storage means 110 of Fi6 Binoto.
A collation symbol string consisting of RY"06 symbols is stored. That is, each of the first to sixth bits of the symbol string storage means 110 is a symbol 1M",...E, RM II.
, pigeon 0〃, ``''R〃, ``■〃 is stored only in the addresses specified by ``Y'', and ``0'' is stored in the other addresses. The address of the symbol string storage means 110 corresponds to the type of symbol, and the first to sixth bits of the read signal 112 are the symbols 1-M〃, It I,; /7. Only when IXM /lkiO〃,kiR〃,paY〃 are input, ■'' is displayed.

各段のカウンタ120 はクロック信号121 に同期
して動作し、その各段の出力は次段のデータ入力に接続
されている。初段のカウンタ120 のデータ入力には
零が供給され、最終段のカウンタ120 の出力N6は
レジスタ130 に印加される。
The counter 120 in each stage operates in synchronization with the clock signal 121, and the output of each stage is connected to the data input of the next stage. Zero is supplied to the data input of the first stage counter 120, and the output N6 of the last stage counter 120 is applied to the register 130.

クロック信号12】  の立上り時に転送信号122が
印加されていると、各段のカウンタ120 の内容は図
において上段から下段方向に一段づつ転送される。また
、転送信号122 が印加されておらず、記号列記憶手
段110 から1″の読取り信号】12 が供給される
と、カウンタ120 の内容は1だけ増加(以後、イン
クリメントと称す)し、0“の読取り信号の場合には内
容が保たれる、このように動作させるカウンタ120 
として、市販されている集積回路、例えばテキサス・イ
ンストルメント社製の5N74L8161N ’に利用
できる。
When the transfer signal 122 is applied at the rising edge of the clock signal 12, the contents of the counters 120 at each stage are transferred one stage at a time from the upper stage to the lower stage in the figure. Further, when the transfer signal 122 is not applied and a read signal of 1'' is supplied from the symbol string storage means 110, the content of the counter 120 increases by 1 (hereinafter referred to as increment) and becomes 0''. The counter 120 operated in this manner retains its contents in the case of a read signal of
It can be used in commercially available integrated circuits such as 5N74L8161N' manufactured by Texas Instruments.

第2図はクロック信号121 と転送信号122のタイ
ミング図ケ示す。照合対象となる記号列は周期T@に1
個の記号が記号列入力端子111  から入力され、そ
の間に前後2発のパルス信号がクロック信号121 と
して印加される。転送信号122 はクロック信号12
1 の創見のパルス信号の立上り時を含むパルス信号と
して印加される。
FIG. 2 shows a timing diagram of clock signal 121 and transfer signal 122. The symbol string to be matched is 1 in period T@
symbols are input from the symbol string input terminal 111, during which two pulse signals before and after are applied as a clock signal 121. Transfer signal 122 is clock signal 12
1 is applied as a pulse signal including the rising edge of the pulse signal.

従って、1個の記号が入力されるごとに各段のカウンタ
120 の転送動作とインクリメント(但し、読取り信
号112が1“の場合)が交互に行なわれる。レジスタ
130は転送信号122により最終段のカウンタ120
の内容を取込む。
Therefore, each time one symbol is input, the transfer operation and increment of the counter 120 in each stage are performed alternately (provided that the read signal 112 is 1"). counter 120
Import the contents of.

第3図は第1図の記号列照合装置の動作説明図である。FIG. 3 is an explanatory diagram of the operation of the symbol string matching device shown in FIG. 1.

第1図に示したように記号列記憶手段110に’ MF
iNOR,Y ″の照合記号列が格納されている状態で
、照合記号列と同じ記号列″MEMORY“ が記号列
入力端子111から入力された場合の動作を同図(al
で説明する。また照合記号列内の一部の記号″0“が誤
った場合、欠けた場合及び余分な記号II X rrが
付加された場合について、それぞれ同図(bl、(cl
、(d)を用いて説明する。
As shown in FIG.
The same figure (al
I will explain. In addition, the same figure (bl, (cl
, (d).

図において、第1行は記号列入力端子111 から入力
された記号列、第2行は記号の入力毎に仮に定めた時刻
’]’o−’l’7を示し、第3行以下はクロック信号
121 の後発のパルス信号が印加された後のカウンタ
120の内容を上段よりNl、 N2. N3゜N4.
N5.N6で代表させ、そめ値を示す。最後の行は加算
器140の出力への値を示す。
In the figure, the first row shows the symbol string input from the symbol string input terminal 111, the second row shows the time ']'o-'l'7 temporarily determined for each symbol input, and the third row and below show the clock. The contents of the counter 120 after the subsequent pulse signal of the signal 121 is applied are shown as Nl, N2 . N3°N4.
N5. It is represented by N6 and the diameter value is shown. The last row shows the value to the output of adder 140.

まず、照合動作前に各段のカウンタ120の内容N1か
らN6を零に設定しておく。これは図示していないが、
カウンタ120のクリア端子にパルス信号を印加するこ
とで容易に行なえる。
First, before the verification operation, the contents N1 to N6 of the counters 120 in each stage are set to zero. Although this is not shown,
This can be easily done by applying a pulse signal to the clear terminal of the counter 120.

第3図(alを参照して、照合記号列と同じ記号列’M
EMORY“が記号列入力端子111から入力された場
合の動作について説明する。まず、先頭の記号″′M“
が入力されたときに、クロック信号121の創見のパル
ス信号の立上り時に転送信号122が印加されているの
で、各段のカウンタ120の内容は上段から下段方向に
一斉に次段に転送される。この時点での全段のカウンタ
120の内容N1から〜6は零になっている。また、記
号列記憶手段110の第1ビツト目と第3ビツト目の読
堆り信号1】2のみ1“となる、L7?:、かって、ク
ロック信号】21 の後発のノくルス信号が印加される
と、第1段目と第3段目のカウンタ120 の内容へ1
とN3のみインクリメントされ0から1となる、 これで照合対象となる記号列の先頭記号゛XM〃に対す
る照合処理がなされる。
Figure 3 (with reference to al, the symbol string 'M' which is the same as the collation symbol string)
The operation when EMORY" is input from the symbol string input terminal 111 will be explained. First, the first symbol "'M"
Since the transfer signal 122 is applied at the rising edge of the pulse signal of the clock signal 121 when the counter 120 is input, the contents of the counters 120 in each stage are transferred all at once from the upper stage to the lower stage. At this point, the contents N1 to N6 of the counters 120 in all stages are zero. In addition, only the first and third bits of the reading signal 1]2 of the symbol string storage means 110 become 1", L7?:, and the subsequent clock signal of the clock signal ]21 is applied. 1 to the contents of the counters 120 in the first and third rows.
and N3 are incremented from 0 to 1. Now, the matching process for the first symbol "XM" of the symbol string to be matched is performed.

同様にして次の記号″′E“が入力されると、第2段目
のカウンタの内容N2のみインクリメントされ、Jから
2となる。このようにして、全ての記号列に対する照合
処理に行なう。最終段のカウンタ120の各時刻におけ
る内容(この例ではNO)は、その時刻以前に入力’J
 !’l−た記号列の各記号とが一致する記号のf固数
を示すことになる。第3図(a)では時111T6の〜
6の値の6は、その時刻以前すなわちTl〜T6に入力
をれた記号列に一致していることを示す。
Similarly, when the next symbol "'E" is input, only the content N2 of the counter in the second stage is incremented, and becomes 2 from J. In this way, all symbol strings are collated. The contents of the final stage counter 120 at each time (NO in this example) are determined by the input 'J' before that time.
! 'l- indicates the f-constant number of the matching symbol with each symbol in the symbol string. In Fig. 3(a), at time 111T6 ~
The value 6 indicates that it matches the symbol string input before that time, that is, from Tl to T6.

従って、照合記号列の記号数をMとすると(図の例では
M=6)、同一の記号列が入力された場合に〜6の値は
Mとなり、1個の記号のみが異なるな゛らばM−1とな
る。すなわち、最終的段のカウンタ120の内容は入力
された記号列と照合記号列との類似度を示す。加算器1
20は最終段のカウンタ120の内容と1時刻前のその
内容を記憶するレジスタ130の内容とを加算し、類似
度出力125 として外部に伝達する。
Therefore, if the number of symbols in the verification symbol string is M (in the example shown in the figure, M = 6), the value of ~6 will be M if the same symbol string is input, and only one symbol is different. becomes M-1. That is, the contents of the counter 120 at the final stage indicate the degree of similarity between the input symbol string and the verification symbol string. Adder 1
20 adds the contents of the final stage counter 120 and the contents of the register 130 that stores the contents one time before, and transmits the result to the outside as a similarity output 125.

第3図(b)は一部の記号′0″が他の記号″X″に誤
っている記号例が入力された場合の各段のカウンタ12
0の内容を示す。先頭から3個の記号゛M〃、′E“、
′M“の入力に対する各段のカウンタ120は、第3図
(a)と同様に動作する。しかし、次の4番目の記号″
′X“が入力されると、第4段目のカウンタ120の内
容N4は、記号列記憶手段110の第4ビツト目の読取
り信号112がO“であるためインクリメントされず、
同じ値3全保つ。従って、6個の記号からなる記号列″
IMEMXR,Y″が入力され′f?、、後の〜6の値
は、第3図(a)の場合より1だけ小さい5となる。す
なわち、照合記号列と1個の記号のみが異なる記号列が
入力されたと認識できる。
FIG. 3(b) shows the counter 12 in each stage when a symbol example in which some symbols '0' are incorrectly replaced with other symbols 'X' is input.
Indicates the content of 0. Three symbols from the beginning ゛M〃, ’E“,
The counter 120 at each stage for the input of 'M'' operates in the same manner as in FIG. 3(a). However, when the next fourth symbol
When ``X'' is input, the content N4 of the fourth stage counter 120 is not incremented because the read signal 112 of the fourth bit of the symbol string storage means 110 is O''.
Keep the same value 3 all. Therefore, the symbol string consisting of 6 symbols"
IMEMXR, Y" is input, 'f?,' and the value of ~6 after is 5, which is 1 smaller than in the case of Fig. 3(a). In other words, the symbol differs from the collation symbol string by only one symbol. It can be recognized that a column has been entered.

第3図(C1は照合記号列内の一部の配列゛0“が欠け
た記号列″” M E Mll、 Y X“が入力され
た場合の各段のカウンタの内界条′示す。先頭から3個
の記号の入力に対し2てi’Ti: 2B 3図(XI
lと同様な動作をする。
Figure 3 (C1 shows the inner boundaries of the counters in each stage when a symbol string with a part of the sequence "0" missing in the collation symbol string "M E Mll, Y 2 for input of 3 symbols from i'Ti: 2B 3 (XI
It operates in the same way as l.

しかし、以後の記号列” R,γX″′は照合記号と1
記号つれでいろため、時刻’J’4. T5. T6に
おけるN4.〜5.〜6の11?iに変化せず、3を保
つ。〕Fだ、記号″R//が入力される時刻′■゛4に
〜5はインクリメントされ、0から1となる。次の記号
″Y“が入力されたときに〜6はインクリメント式れ、
1から2となる。この結果、最終段のカウンタ120 
 の内容N6の最大イ1げは3となり、N6乏・監視し
ているだけでは入力された記号列が照合記号列からT 
1lIIIの記号を抜いた記号列であることを認識でき
ない。しかし、加算器】40の出力N &:1: 5と
なるので時刻T1から’I’6−+でに入力されグこ記
号列内に照合記号列と整合する記号が5個含まれている
ことを認識できろ。4ilっで、一部の記号が欠r7だ
記号列についても加算器140の出力へを監視すること
により、照合が可能となる。加シ、器J 40 の出力
〜は類似反出力125 として外部に伝達される。
However, the subsequent symbol string "R, γX"' is the collation symbol and 1
The time is 'J'4. T5. N4 at T6. ~5. ~6 of 11? It does not change to i and remains 3. ] F, the time when the symbol "R//" is input '■' 4 ~5 is incremented from 0 to 1. When the next symbol "Y" is input, ~6 is incremented,
It goes from 1 to 2. As a result, the final stage counter 120
The maximum number of contents of N6 is 3, and if you are only monitoring N6, the input symbol string will be
It is not possible to recognize that this is a symbol string without the 1lIII symbol. However, the output of adder]40 is N&:1:5, so the symbol string input from time T1 at 'I'6-+ contains five symbols that match the collation symbol string. Recognize that. By monitoring the output of the adder 140, even for symbol strings in which some symbols are missing, verification is possible. In addition, the output ~ of the device J 40 is transmitted to the outside as a similar inverse output 125 .

第3図(d+は余分な記号″′X″ケ含む記七列’Mi
l射JXOR,Y’′ が入力され′fiC場合の各段
のカウンタ]20のl”J谷をボラ−0先 号の入力に対し′tは第31ン」(a)と同様な動作を
する。
Figure 3 (d+ is the 7th column 'Mi' containing the extra symbol ''X')
The counter of each stage when the ray J do.

しかし、4 (161目以抜の記号列ir. I′i余
分な鮨シ号+S X #か含まれているのて、照合B1
シ合列と1記号つれている、このため、時刻′1゛4、
1゛5、′J.’ 6 の各々におけるN4、〜5、j
〜0 のイ1iにインクリメン1されず、3を保つ。し
かし、1叫刻ずラシ’fr時:21j ’i’ 5、1
゛6、9゛7の各々i/−二ふ・け4,〜4、〜5、〜
6の1直b、それそインクリメント式れ、0から3とな
る。し7たかつて、N6λ・’.fK Ill’. L
,ている/こけてぐま入力された記−号列が照合mlも
列に1つの余分な記号を付加した記号例であることを認
識できない。しかし、加算器140の出力への値は時刻
117で6となるので入力をれた記号列が畠い類似性を
持つことを認識できる。
However, since the symbol string ir. I'i contains the extra sushi symbol + S
It has one symbol with the combination, so the time '1゛4,
1゛5,'J. ' N4, ~5, j in each of 6
It is not incremented by 1 to i1i of ~0 and remains at 3. However, when one shouts out, 'fr': 21j 'i' 5, 1
゛6, 9゛7 each i/-2fu・ke4, ~4, ~5, ~
The 1st line b of 6 is an increment type, and goes from 0 to 3. Once upon a time, N6λ・'. fK Ill'. L
,/Koketeguma It cannot be recognized that the input symbol string is a symbol example in which one extra symbol is added to the string. However, since the value of the output of the adder 140 becomes 6 at time 117, it can be recognized that the input symbol strings have a strong similarity.

一般に照合記号列の記号列長fnとすると、時刻Tiに
おける最終段のカウンタ]20の内容N nは、時刻T
i −n+1 から時刻Ti捷でに入力きれた記号列が
照合記号列と整合する記号の個数を示す。Ti時刻にお
ける加算器140の出力へすなわち類似度出力125は
、最終段のカウンタ120の時刻Ti とその1時刻前
の内容の和を示す。すなわち、類似度出力】25は入力
した記号列及びそれを1記号分ずらした記号列が照合記
号列と整合する記号の個数の和を示す。従って、一部の
記号が欠けた記号列および余分な記号が付加された記号
列についても、類似度出力125を監視することで照合
できる。
In general, if the symbol string length of the verification symbol string is fn, the content N of the last stage counter]20 at time Ti is the time T
It shows the number of symbols in which the symbol string input from i −n+1 to time Ti matches the verification symbol string. The output of the adder 140 at time Ti, that is, the similarity output 125, indicates the sum of the contents of the final stage counter 120 at time Ti and one time before. That is, similarity output 25 indicates the sum of the number of symbols in which the input symbol string and the symbol string shifted by one symbol match the collation symbol string. Therefore, symbol strings with some symbols missing and symbol strings with extra symbols added can also be compared by monitoring the similarity output 125.

以上述べ女ように第1図に示した記号列照合装置は照合
記号列と完全に一致する記号列だけでなく、その中の任
意の個数の記号が誤っている記号列も抽出でき、柔軟性
の茜い記号列照合装置といえる。
As mentioned above, the symbol string matching device shown in Figure 1 can extract not only symbol strings that completely match the verification symbol string, but also symbol strings in which any number of symbols are incorrect, making it flexible. It can be said to be a deep symbol string matching device.

一般に記号列の照合に際しては、照合記号列と一致した
記号の個数よりも異なる記号の個数が出力される方が取
扱いやすい。第1図に示したように一致する記号の個数
全計数すると、カウンタ120は照合記号列の記号数を
へ4とすると0がらM4で計数できるlog2(M−f
−1)のビット数が必要となる。しかし、異なる記号の
個数を計数するならば、許容できる不一致の割合を5%
とすると、カウンタ120はMの5チ程度を計数できれ
ば良いため、そのビット数を削減できる。
Generally, when matching symbol strings, it is easier to output the number of symbols that differ from the matching symbol string than the number of symbols that match the matching symbol string. When the number of matching symbols is counted as shown in FIG. 1, the counter 120 calculates the log2(M-f
-1) bit number is required. However, if you count the number of different symbols, the acceptable percentage of discrepancies is 5%.
In this case, the counter 120 only needs to be able to count about 5 units of M, so the number of bits can be reduced.

これを可能にする記号列照合装置は第1図に示した記号
列照合装置を少し変更することで実現できる。
A symbol string matching device that makes this possible can be realized by slightly modifying the symbol string matching device shown in FIG.

例えば、記号列記憶手段110の読取り信号112が”
0“であるときにカラ/り120 をインクリメントあ
るいはティクリメント(値を1だけ減少)させる。また
は、記号列記憶手段110の内容を反転させ、読取りイ
百号112が1“であるときに、カウンタ120の増減
を行なってもよい。この場合、カウンタ120の初期値
としてインクリメン、トを行なわせる場合Ku、零、テ
ィクリメントを行なわせる場合にはその計数可能な最大
値以上のインクリメン) ji13作あるいはディクリ
メント動作を禁止する必要がある。これは、カウンタ1
20の全てのビットを入力とするナントゲート回路で全
ビットが1、あるいはノアゲート回路で零を検出し、そ
の検出出力で記号列記憶手・段110の読取り信号21
2をマスクすることで容易に実現できる。但し、カウン
タ120 としてその最大値あるいは最小値を検出する
回路を内蔵しているカウンタ、金利用する場合には、ナ
ントゲート回路あるいはノアケート回路が不要となる。
For example, if the read signal 112 of the symbol string storage means 110 is "
0", the color/re 120 is incremented or ticked (the value is decreased by 1). Alternatively, the contents of the symbol string storage means 110 are inverted, and when the reading number 112 is 1", The counter 120 may be increased or decreased. In this case, if the initial value of the counter 120 is to be incremented, Ku, zero, or ticked if it is to be incremented, it is necessary to prohibit the increment operation or decrement operation. . This is counter 1
A Nants gate circuit that receives all 20 bits as input detects that all bits are 1, or a NOR gate circuit detects that all bits are 0, and the detected output is used as a read signal 21 of the symbol string storage means/means 110.
This can be easily achieved by masking 2. However, if the counter 120 is a counter with a built-in circuit for detecting the maximum value or minimum value, the Nant gate circuit or the Nant gate circuit is not necessary.

ifr、カウンタ120を並列入力可能なシフトレジス
タに置換えることも可能である。この場合、転送イム号
122で次段のシフトレジスタへの並列転送が開側1さ
れ、読取り信号112により内容の左シフトあるいは右
シフトが制御される。初段のシフトレジスタのデータ入
力にニ最上位ピッ)6るいは最下位ビットのみ異なるデ
ータを供給する。
It is also possible to replace the ifr counter 120 with a shift register that can be input in parallel. In this case, parallel transfer to the next stage shift register is opened at transfer time number 122, and left shift or right shift of the contents is controlled by read signal 112. Data that differs only in the most significant bit (6) or the least significant bit is supplied to the data input of the first stage shift register.

このようなシフトレジスタにはテキサス・インストルメ
ント社から敗売されている7 4.LS 299の集積
回路を利用できる。カウンタ120の代りにシフトレジ
スタを用いると、照合記号列と異なる記号数を計数した
場合、シフトレジスタのビット数以上の異なる記号数が
入力されると、シフトレジスタの内容は自動的に零に設
定はれるので、制御が容易になる。
This kind of shift register is sold out by Texas Instrument Company74. LS 299 integrated circuits are available. If a shift register is used instead of the counter 120, when the number of symbols different from the collation symbol string is counted, the contents of the shift register will be automatically set to zero if the number of symbols different from the number of bits of the shift register is input. It swells, making it easier to control.

さらに、カウンタ】20けシフトレジスタたけでなく他
の論理演算手段に置換えることも容易に可能である。
Furthermore, it is also possible to easily replace the counter with other logic operation means rather than just the 20-digit shift register.

また、以上の説明では1個の記号の欠けや付加を許容で
きる記号列照合装置について説明したが、複数個の記号
の欠けや伺加を許容できるように拡張できる。これは、
レジスタ130として直列に接続した複数段のレジスタ
を使用し、加算器140が各レジスタの内容を加算する
ことで可能となる。
Further, in the above description, a symbol string collation device that can tolerate the omission or addition of one symbol has been described, but it can be expanded to allow the omission or addition of a plurality of symbols. this is,
This is possible by using a plurality of stages of registers connected in series as the register 130 and by having the adder 140 add the contents of each register.

第4図も本発明による実施例の説明図である。FIG. 4 is also an explanatory diagram of an embodiment according to the present invention.

この記号列照合装置は照合対象となる記号列の中から照
合記号列と高り類似#を示す記号列のみ抽出するもので
あり、第1図の記号列照合装置400にコンパレータ4
10 とレベル設定レジスタ420を追加している。
This symbol string matching device extracts only the symbol strings showing high similarity # to the matching symbol string from the symbol strings to be matched, and the symbol string matching device 400 shown in FIG.
10 and a level setting register 420 are added.

照合動作開始前にレベル設定レジスタ420には抽出し
ようとする記号列の許容類似度が設定される。これは、
許容類似度を示すレベル信号421とレジスタセノ)信
号422をレベル設定レジスタ420に供給することに
よ−り行なわれる。
Before starting the matching operation, the allowable similarity of the symbol string to be extracted is set in the level setting register 420. this is,
This is done by supplying a level signal 421 indicating the allowable similarity and a register signal 422 to the level setting register 420.

コンパレータ410 it類(U度出力125 とレベ
ル設定レジスタ420の内容とを各々入力A、Bに入力
し、両者を比較する。そして前者が太きいか等しいかを
示すAZB出力を照合出力信号41]として外部に伝達
する。記号列記号記憶手段110に格納づれている照合
記号列の記号数Mに対し、レベル設定レジスタ420 
に1l−1)を設定すると、記号列入力端子111 力
・ら入力された記号列と照合記号列とが(M−1)個以
上の記号が整合しているνΔ合に、コンパレータ4】0
は照合出力411 を発生ずる。従って、IAφ合出力
出力411監視することで照合記号列と1hり類イυ度
を示す記号列のみ抽出できる。
Comparator 410 (inputs the U degree output 125 and the contents of the level setting register 420 to inputs A and B, respectively, and compares them. Then, the AZB output indicating whether the former is thicker or equal is compared with the output signal 41) For the number M of symbols in the collation symbol string stored in the symbol string symbol storage means 110,
When the symbol string input terminal 111 is set to 1l-1), if the symbol string input from the symbol string input terminal 111 and the collation symbol string match νΔ with (M-1) or more symbols, the comparator 4]0
generates a verification output 411. Therefore, by monitoring the IAφ combined output 411, it is possible to extract only the verification symbol string and the symbol string indicating the 1h degree.

第5図も本発明による実施例の説明図である。FIG. 5 is also an explanatory diagram of an embodiment according to the present invention.

この記号列照合装置は複数の照合記号列を並列に照合し
、整合17れ照合記号列を示す整合コードを出力するも
のであり、第4図に示した記号列照合装置に対応する記
号列照合ユニット500を複数個含む記号列照合部51
0 と、各記号列照合ユニット500から出力される各
照合出力411  f入力するエンコーダ520 と、
各記号列照合ユニット500にレジスタセット信号42
2を供給するデコーダ530 とから構成される。
This symbol string matching device collates multiple matching symbol strings in parallel and outputs a matching code indicating the matched matching symbol string. Symbol string matching unit 51 including a plurality of units 500
0 and each matching output 411 f output from each symbol string matching unit 500 and an encoder 520 inputting it,
Register set signal 42 to each symbol string matching unit 500
2 and a decoder 530 that supplies 2.

記号列入力端子111から入力される記号コード、りO
,り信号121、転送イh号122、許容類似度を示す
レベル信号421は各記号列照合ユニッ) 500に共
通に供給される。
Symbol code input from symbol string input terminal 111, riO
, a transfer signal 121, a level signal 421 indicating an acceptable degree of similarity, and a level signal 421 indicating the permissible similarity are commonly supplied to each symbol string matching unit) 500.

記号列照合ユニット500への許容類似度の設定は、ユ
ニット選択値+j53x  と共に基本レジスタセット
信号532をデコーダ530 に供給し、レベル信号4
21 全記号列照合部510に供給することに、!:り
行なわれる。このとき、デコーダ530は許容類似度を
設定しようとする記号列照合ユニット500にのみレジ
スタセット信号422を印加する。
To set the allowable similarity to the symbol string matching unit 500, the basic register set signal 532 is supplied to the decoder 530 together with the unit selection value +j53x, and the level signal 4
21 In supplying the entire symbol string matching unit 510,! : It is done. At this time, the decoder 530 applies the register set signal 422 only to the symbol string matching unit 500 for which the allowable similarity is to be set.

記号列入力Aj5子111 から照合ヌゴ称となる記号
列を71′八成する記号コードを逐次入力すると、各記
号列照合ユニット50(l 内に登録されている各照合
記号列と並列に1j4j合17、許容類似度以上の高い
’Jul イjヅ塵を小す11f(合Be号夕1島記憶
し、ている;)1シ号列照合ユニノ)5(1(+からI
Iべ合出力411か発生する。
When a symbol code is sequentially inputted to form a symbol string 71' which becomes a verification null name from the symbol string input Aj5 child 111, each symbol string verification unit 50 (1j4j combination is performed in parallel with each verification symbol string registered in l). 17, reduce the 'Jul Ijdu dust with a high degree of similarity above the allowable similarity 11f (memorize the combined Be No. 1 island;) 1 Shi symbol string matching unino) 5 (1 (+ to I
An I-beta output 411 is generated.

エン−1−夕52(1に−この照合出力411を蛍けで
それをニー7〜l−イl< L、入力さ力/6二記号列
の分類コード5;21と七・合したこと4−示す0〃の
イ1幼イば号522不二発生する。いずれの!](1合
出力411も不整合を示L77いる土・・シ合VこkJ
l、エンコーダは不整合を示す1″のイ」効(+’j号
522攻゛発生1″る。
En-1-E 52 (1) - Take this collation output 411 and combine it with the input power/6 classification code 5; 21 and 7. 4-Shows 0〃 No. 1 Young Iba No. 522 No. 2 occurs. Which one!]
l, the encoder has a 1" error indicating inconsistency (+'j No. 522 attack occurs 1").

従って、イ]幻化号522と分類コード521を監視す
イ、ことにより、入力さオ]た記+じ一列の分類か可能
とな4、。また、エンコーダ520とテコータ′530
 とにより、入出力端子数を削減し、木りに一吋列照合
装置道のLSI化を容易にする。
Therefore, by monitoring the illusion code 522 and the classification code 521, it is possible to classify the same line as input. In addition, the encoder 520 and the tecoter '530
As a result, the number of input/output terminals can be reduced, making it easy to convert a one-inch column collation device into an LSI.

(発明の効果) 以上述べたように、本発明の記号列照合部■?は類似度
による照合を可能とするので、一部の記号が誤った記号
列の照合も可能にする。英単語、特に名詞は単数形、複
数形に」こり最終文学が異なる場合が多い。例えは、’
rnemory”は複数形になるとVmemories
“になる。この場合、基本の” nIemo r 3’
 ”を照合記号列とし、−文学の誤りをボ「すように許
容類似度を設定すれは、memo r i e s ”
も抽出できる。捷だ、一部の記号が欠けた記号列あるい
は余分な記号が付加された記号列の照合も〒1」能にす
る。このような一部の記号の欠けや余分な記号の付加は
一般に記号列内のどこに生ずるかまたどのように記号が
欠けるか、付加されるか予め判断できない。したがって
、起りうるすべでの記号列の変化に刈し、従来の記号列
照合ではそれらの許容するようにプログラミングしてお
かなければならない。しかし、本発明の記号列照合方式
及び記号列照合装置では許容類似度を設定しておくこと
で容易に対処できる。すなわち、本発明の記号列照合装
置ζCとその方式し1柔軟な記号列照合全可能にする !!た、人υ3力Qif1:子数を削減し、J、SI化
を容易に可能にし、価格低下をもたらす。
(Effects of the Invention) As described above, the symbol string matching section ■? of the present invention? Since it allows matching based on similarity, it also allows matching of symbol strings in which some of the symbols are incorrect. English words, especially nouns, often change into singular or plural forms, resulting in different final texts. For example, '
"rnemories" becomes plural form Vmemories
“In this case, the basic” nIemo r 3'
” is a matching symbol string, and the allowable similarity is set to exclude literary errors.
can also be extracted. It is also possible to match symbol strings with some symbols missing or symbol strings with extra symbols added. In general, it is not possible to determine in advance where in the symbol string the missing part of a symbol or the addition of an extra symbol will occur or how the symbol will be missing or added. Therefore, all possible string variations must be accounted for, and conventional string matching must be programmed to accommodate them. However, in the symbol string matching method and symbol string matching device of the present invention, this problem can be easily dealt with by setting an allowable degree of similarity. In other words, the symbol string matching device ζC and its method of the present invention enable flexible symbol string matching! ! In addition, human υ3 power Qif1: Reduces the number of children, easily enables J, SI, and lowers prices.

なお、現状の256キロビツトH,AMの半251体技
術を用いれば、8ビツトコードの記号8個からなる照合
記号列全128個を1チツプに格納でき、それらを並列
に照合できる。
If the current 256 kilobit H and AM half-251 technology is used, a total of 128 collation symbol strings consisting of eight 8-bit code symbols can be stored in one chip, and they can be collated in parallel.

】テップで256禅の記号から成る記号列を128クラ
スに分類することができる事はワープロで作成しfc文
章の原文ファイルからシーケンシアルに読出される記号
列文章の中から128個までのキーワード(記号列)の
抽出を一挙にやりとけれる事を、色味する。従来は多数
のキーワードの同時検束が困難であったから、上記チッ
プのインパクトは太きい。
] The fact that it is possible to classify a symbol string consisting of 256 Zen symbols into 128 classes is possible by classifying up to 128 keywords ( It emphasizes that the extraction of the symbol string) can be completed all at once. In the past, it was difficult to simultaneously detect a large number of keywords, so the impact of the above chip is significant.

この記号列識別装置はOCR,装置や音声認識装置など
バタン認ii!g!を行なうシステムにおける特徴系列
の分類においても役立つ。この記号列識別装置なの1チ
ツプLSI化は言語翻訳に必要な辞言としでも役立つ。
This symbol string identification device can be used to recognize OCR, devices, voice recognition devices, etc. with a bang! g! It is also useful for classifying feature sequences in systems that perform Converting this symbol string identification device into a one-chip LSI can also serve as a dictionary necessary for language translation.

このチップに通常I(、A Mを接続し、各記号列の分
類コードに対応すけて、単語の訳語を格納すると、1チ
ノフにつき128単語丑での翻訳が記号列の入力の完了
時に直ちに求する。記号列識別チップに接続される通常
R,AMには記号別の分類コードに対応ずけて、各種の
情報を格納することが可能であって、そF′Lによっで
、種々の記号列情報処理構能が達成される。、たとえは
、記号列の分類コードに対応すけ、単語の品詞コードや
記号列の出現回数や記号列文章に対する処理命令を格納
すると、知識情報の収集や整理が行ないやすくなる。
If you connect a normal I(, AM) to this chip and store the translation of a word in correspondence with the classification code of each symbol string, the translation of 128 words per chinofu can be requested immediately upon completion of inputting the symbol string. The normal R and AM connected to the symbol string identification chip can store various types of information in correspondence with the classification code of each symbol, and depending on the F'L, various types of information can be stored. A symbol string information processing structure is achieved.For example, if the part-of-speech code of a word, the number of occurrences of a symbol string, and processing instructions for symbol string sentences are stored in correspondence with the classification code of the symbol string, knowledge information collection and It will be easier to organize.

この記号列抽出装置の処理速度は、記号記憶手段2]0
.4]0に使われる半導体RAMのサイクルタイムTc
が1つの記号の処理時間にほぼヌ゛1応する。1゛Cを
100m5とすると、10 個の記号列のテキストに対
する10 個の記号列による照合を10秒で行なえる。
The processing speed of this symbol string extraction device is symbol storage means 2]0
.. 4] Cycle time Tc of semiconductor RAM used for 0
corresponds approximately to the processing time for one symbol. If 1゛C is 100 m5, matching of 10 symbol strings against the text of 10 symbol strings can be performed in 10 seconds.

現状のソフトウェアによる照合では10時間程度を心太
とするので、本発明の記号列照合装置は著しく照合時間
を短酩する。
Since verification using current software takes about 10 hours, the symbol string verification device of the present invention significantly shortens the verification time.

以上せとめると、本発明によれば、従来のマイコンとソ
フトウェアの組合わせによる記号列の分・グ11による
処理時間の大きい事と柔軟性に欠ける事の欠陥が容易に
解決する。メだ、本発明の記号列識別装置が1チツプの
L s I Kまとまり易い事を考えると、このような
LSIは文章の原文ファイルからのキーワードの抽出や
言語翻訳用の電子辞言やバタン認識システムの特徴系列
の分類において欠かすことのできない機能素子になる。
In summary, according to the present invention, the drawbacks of long processing time and lack of flexibility due to symbol string processing 11 due to the combination of a conventional microcomputer and software can be easily solved. Considering that the symbol string identification device of the present invention can be easily assembled into a single chip, such an LSI can be used for extracting keywords from original text files, electronic dictionary for language translation, and slam recognition. It becomes an indispensable functional element in the classification of system feature series.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明による記号列照合装置の一実施例の説明
図、第2図はクロ2248号と転送信号のタイミング図
、第3図は記号列照合装置の動作説明図、第4図、45
図は本発明の他の実施例の説明図、第6図は記号夕1」
照合の説明図である。 1】()・・・・・・記号列記憶手段、120・・・・
・カウンタ、123・・・・・・第1の演算手段、】2
4・−一時記憶手段、130・・・・・レジスタ、14
0・・・・・加算器、41o・・曲コンパレータ、’4
20・・・・・・レベル設定レジスタ、500・・・・
・・記号列照合ユニット、5]0・・・・・・記号列照
合部、520・・・・・ エンコーダ、530・・・・
・・テコータ。 第2図 MEMRYX        ME7.lX0RYTo
 T′ThT3T4T51下2           
   丁OT+ 丁2丁3丁4丁5丁6−「i第4図 第5図 第6図
FIG. 1 is an explanatory diagram of an embodiment of the symbol string matching device according to the present invention, FIG. 2 is a timing diagram of Kuro 2248 and transfer signals, FIG. 3 is an explanatory diagram of the operation of the symbol string matching device, FIG. 45
The figure is an explanatory diagram of another embodiment of the present invention, and FIG. 6 is a symbol 1.
It is an explanatory diagram of collation. 1] ()...Symbol string storage means, 120...
・Counter, 123...First calculation means, ]2
4.-Temporary storage means, 130...Register, 14
0... Adder, 41o... Song comparator, '4
20...Level setting register, 500...
... Symbol string matching unit, 5]0... Symbol string matching section, 520... Encoder, 530...
...Tekota. Figure 2 MEMRYX ME7. lX0RYTo
T'ThT3T4T51 lower 2
Ding OT+ Ding 2 Ding 3 Ding 4 Ding 5 Ding 6- "i Figure 4 Figure 5 Figure 6

Claims (7)

【特許請求の範囲】[Claims] (1)記号コードをアドレス入力とし、照合記号列を記
憶する記号列記憶手段と、この各出力線につながる第1
の演算手段と、複数の演算手段間を相互に結合する第1
の一時記憶手段と、特定の第1の一時記憶手段の出力に
つながる第2の一時記憶手段と、第2の一時記憶手段に
つながる第2の演算手段とを備えたことを特徴とする記
号列照合装置。
(1) Symbol string storage means that takes the symbol code as address input and stores the collation symbol string, and a first
a first computing means that interconnects the plurality of computing means;
A symbol string characterized by comprising a temporary storage means, a second temporary storage means connected to the output of a specific first temporary storage means, and a second calculation means connected to the second temporary storage means. Verification device.
(2)第1の演算手段と第1一時記憶手段とがそれぞれ
カウンタあるいはシフトレジスタであることを特徴とす
る特許請求の範囲第1項、記載の記号列照合装置。
(2) The symbol string matching device according to claim 1, wherein the first calculation means and the first temporary storage means are each a counter or a shift register.
(3)記号コードをアドレス入力とし、照合記号列を記
憶する記号列記憶手段と、この各出力線につながる第1
の演算手段と、複数の演算手段間を相互に結合する第1
の一時記憶手段と、特定の第1の一時記憶手段の出力に
つながる第2の一時記憶手段と、第2の一時記憶手段に
つながる第2の演算手段と、外部から与えられる許容類
似度を記憶するレジスタと、このレジスタの内容と第2
の演算手段の出力とを比較し、照合結果を出力するコン
パレータとを含むことを特徴とする記号列照合装置。
(3) Symbol string storage means that takes the symbol code as address input and stores the collation symbol string, and a first
a first computing means that interconnects the plurality of computing means;
a temporary storage means, a second temporary storage means connected to the output of the specific first temporary storage means, a second calculation means connected to the second temporary storage means, and a permissible similarity given from the outside. register, the contents of this register, and the second
and a comparator that compares the output of the arithmetic means with the output of the arithmetic means and outputs the result of the comparison.
(4)第1の演算手段と第1一時記憶手段とがそれぞれ
カウンタあるいはシフトレジスタであることを特徴とす
る特許請求の範囲第3項記載の記号列照合装置。
(4) The symbol string matching device according to claim 3, wherein the first calculation means and the first temporary storage means are each a counter or a shift register.
(5)記号コードをアドレス入力とし、照合記号列を記
憶する記号列記憶手段と、この各出力線につながる第1
の演算手段と、複数の演算手段間を相互に結合する第1
の一時記憶手段と、特定の第1の一時記憶手段の出力に
つながる第2の一時記憶手段と、第2の一時記憶手段に
つながる第2の演算手段と、外部から与えられる許容類
似度を記憶するレジスタと、このレジスタの内容と第2
の演算手段の出力とを比較し、照合結果を出力するコン
パレータと該コンパレータに接続するエンコーダと、該
レジスタに接続するデコーダとを備えたことを特徴とす
る記号列照合装置。
(5) Symbol string storage means that takes the symbol code as an address input and stores a collation symbol string, and a first
a first computing means that interconnects the plurality of computing means;
a temporary storage means, a second temporary storage means connected to the output of the specific first temporary storage means, a second calculation means connected to the second temporary storage means, and a permissible similarity given from the outside. register, the contents of this register, and the second
1. A symbol string matching device comprising: a comparator that compares the output of a calculation means with the output of a calculation means and outputs a matching result; an encoder connected to the comparator; and a decoder connected to the register.
(6)第1の演算手段と第1一時記憶手段とがそれぞれ
カウンタあるいはシフトレジスタであることを特徴とす
る特請許求の範囲第5項記載の記号列照合装置。
(6) The symbol string matching device according to claim 5, wherein the first calculation means and the first temporary storage means are each a counter or a shift register.
(7)記号に関連づけたビットパタンで照合記合列を記
憶する記号列記憶手段のN(正整数)番目と(N+1)
番目の出力線に各々つながるN番目第1論理演算手段と
(N+1)番目第1演算手段との間のN番目第1一時記
憶手段の内容を(N−1)番目第1一時記憶手段の内容
にN番目記号列記憶手段の出力線により制御されたN番
目第1演算出段の演算処理を施こしたものとし且つ、特
定の第1一時記憶手段の互いに異なる時刻の内容に第2
の演算手段による演算処理を施すことで前記記号列記憶
手段の内容と逐次入力された記号列の類似度を求めるこ
とを特徴とする記号列照合装置の制御方式。
(7) The Nth (positive integer) and (N+1) symbol string storage means that stores the collation string in the bit pattern associated with the symbol.
The contents of the Nth first temporary storage means between the Nth first logical calculation means and the (N+1)th first calculation means respectively connected to the output line of the (N-1)th first temporary storage means. It is assumed that the arithmetic processing of the Nth first arithmetic output stage controlled by the output line of the Nth symbol string storage means is performed on the data, and that the contents of the specific first temporary storage means at mutually different times are
A control method for a symbol string matching device, characterized in that a degree of similarity between the contents of the symbol string storage means and the sequentially input symbol strings is determined by performing arithmetic processing by the arithmetic means.
JP14892684A 1984-07-18 1984-07-18 Symbol string collecting device and its control system Granted JPS6128134A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP14892684A JPS6128134A (en) 1984-07-18 1984-07-18 Symbol string collecting device and its control system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP14892684A JPS6128134A (en) 1984-07-18 1984-07-18 Symbol string collecting device and its control system

Publications (2)

Publication Number Publication Date
JPS6128134A true JPS6128134A (en) 1986-02-07
JPH0554148B2 JPH0554148B2 (en) 1993-08-11

Family

ID=15463749

Family Applications (1)

Application Number Title Priority Date Filing Date
JP14892684A Granted JPS6128134A (en) 1984-07-18 1984-07-18 Symbol string collecting device and its control system

Country Status (1)

Country Link
JP (1) JPS6128134A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62217321A (en) * 1985-12-10 1987-09-24 テイア−ルダブリユ− インコ−ポレ−テツド Fast search processor
JPS63225857A (en) * 1987-03-14 1988-09-20 Fujitsu Ltd Resembling character retrieval system

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62217321A (en) * 1985-12-10 1987-09-24 テイア−ルダブリユ− インコ−ポレ−テツド Fast search processor
JPS63225857A (en) * 1987-03-14 1988-09-20 Fujitsu Ltd Resembling character retrieval system

Also Published As

Publication number Publication date
JPH0554148B2 (en) 1993-08-11

Similar Documents

Publication Publication Date Title
JPS60501921A (en) Method and apparatus for parallel text matching
JPH0533422B2 (en)
JPH02115973A (en) Symbol string collation device and its control system
JPS6128134A (en) Symbol string collecting device and its control system
RU2004115749A (en) UNLIMITED LANGUAGE COMPUTERIZED ENCODING-DECODING SYSTEM AND METHOD
JPH0529950B2 (en)
JPS63103393A (en) Word recognizing device
JPS60225273A (en) Word retrieving system
JP3045886B2 (en) Character processing device with handwriting input function
JPS62285189A (en) Character recognition post processing system
JP2874199B2 (en) Word dictionary matching device
JP2773657B2 (en) String search device
JPS63268082A (en) Pattern recognizing device
JPH0527150B2 (en)
JPH0554147B2 (en)
JP3725206B2 (en) Character recognition device
JPS58146927A (en) Method for generating word dictionary having information on relative term
JPS6195443A (en) Matching device of code string
JPS6029823A (en) Adaptive type symbol string conversion system
JPS60211539A (en) Symbol string identification device and its control system
JPH0576675B2 (en)
JPH0290364A (en) Method and system for mechanical translation
JPH01217584A (en) System for post-processing character recognition
JPS5930176A (en) Character discrimination processing system
JPH04340166A (en) Retrieval device for word dictionary