JPH0276072A - 可変長文字列検出装置 - Google Patents

可変長文字列検出装置

Info

Publication number
JPH0276072A
JPH0276072A JP63227502A JP22750288A JPH0276072A JP H0276072 A JPH0276072 A JP H0276072A JP 63227502 A JP63227502 A JP 63227502A JP 22750288 A JP22750288 A JP 22750288A JP H0276072 A JPH0276072 A JP H0276072A
Authority
JP
Japan
Prior art keywords
character string
character
signal
partial
registered
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP63227502A
Other languages
English (en)
Other versions
JP2729491B2 (ja
Inventor
Tetsuya Morita
哲也 森田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP63227502A priority Critical patent/JP2729491B2/ja
Publication of JPH0276072A publication Critical patent/JPH0276072A/ja
Priority to US07/859,627 priority patent/US5212697A/en
Application granted granted Critical
Publication of JP2729491B2 publication Critical patent/JP2729491B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、磁気ディスクや光ディスク等の2次記憶に保
存されている文書ファイルを入力し、あらかじめ登録さ
れている文字列と照合を行なうことにより、文字情報(
テキスト)中から登録文字列および誤り文字列を検索す
る装置に関する。
(従来の技術) 従来の文字列検出方法としては、(1)ソートサーチ法
、(2)連想メモリ法、(3)セルラアレイ法、(4)
有限状態オートマトン法、(5) D P法等があげら
れるが、これらの方法には以下のような問題があった。
(2) 、 (3)は、長い文字列が扱えない、(i)
 + (2) * (3) t (5)は可変長文字列
のノンアンカーマツチが扱えない、(5)は処理速度が
遅い、(3)。
(4) 、 (5)はハードウェアサイズが小さくなら
ないなどの問題がある。これらの問題点の一部を解決す
るために、(2)と(4)を組み合わせた文字列検索L
] (日本電気−ISSP)が開発されている。
これを示す文献に、高橋、他「ストリング・マツチング
・ハードウェアのアーキテクチャ」電子通信学会研究報
告(コンピュータシステム)、CPSY 86−57 
(1986,7)がある。この場合でも、装置規模が許
容される誤り文字数に比例するため、ハードウェア構成
の制約により現実には誤り文字数が1文字程度のLSI
 Lか製作されていない。
(発明が解決しようとする課題) 上述の文献のl5SPはN文字の誤り・抜け・挿入のす
べての・ぐターンを検出するように構成できるが、現実
的には伝送路エラーや2次記憶内で発生するエラーはバ
ースト的な誤りがほとんどであり、ランダム誤りは少な
い。そこで本発明では、連続するN文字の誤υ・抜け・
挿入のエラーのみを検出し、連続するエラーのみを扱う
ことによりハードウェアの規模を小さくした、実用的な
可変長文字列検出装置を提供することを目的とする。
(課題を解決するための手段) 本発明による可変長文字列検出装置は、それぞれ対応す
る複数の文字レジスタを備え、検出する文字列が予め登
録文字列として登録される登録レジスタ、およびファイ
ルから入力される文字列をクロック信号に同期して一文
字づつ文字レジスタに移送するシフトレジスタを備え、
対応する文字レジスタの内容を比較し、前記文字列と前
記登録文字列の一致の有無を示す1文字ごとの文字列照
合信号を出力する文字照合部と、文字照合信号に所定の
論理演算処理を施し、その結果より登録文字列およびそ
の連続する部分文字列の有無を示す部分文字列照合信号
を出力する部分文字列検出部と、部分文字列照合信号に
所定の論理演算処理を施し、その結果を照合結果信号と
して出力する検出・リーン制御部とを有し、照合結果信
号により、登録文字列の有無および部分文字列と連続す
る誤り文字列よりなる各種の誤り文字列を前記ファイル
から検出することを特徴とする。
(作用) 文字照合部は予め検出する文字列を登録文字列として登
録し、文書ファイル等から入力される文字列の各文字が
登録文字列に有るか否かを示す文字ごとの文字照合信号
を出力する。部分文字列検出部は文字照合信号の論理積
をとることにより、登録文字列とその連続する部分文字
列の有無を示す部分文字列照合信号を出力する。
検出・ぐターン制御部は部分文字列照合信号の中で、登
録文字列を示す照合結果信号と、同信号の否定と他の部
分文字列信号の論理積をとることにより、連続する誤り
文字を含む誤り文字列を示す照合結果信号を出力する。
このようにして、可変長文字列検出装置は登録文字列お
よび連続する誤り文字を含む誤り文字列を検出すること
ができる。
(実施例) 次に、本発明の実施例を添付図面を用いて説明する。第
1図は本発明の可変長文字列検出装置の一実施例を示す
ブロック図である。この装置は、磁気ディスクや光ディ
スク等の2次記憶に保存されている文書ファイルを入力
し、あらかじめ登録されている文字列と照合を行ない、
登録文字列と同一の文字列の検出、1文字以上の連続す
る誤り・文字抜け・余剰文字挿入を検出する。
装置は、各部1,2および3よりなり、各部の入出力動
作はシフトクロック5と同期して行われる。文字照合部
lは、複数の文字レジスタよりなり、文書ファイル等か
ら検出する文字列が登録文字列として予め登録される。
文書ファイル等からの文字列を検出するときは、入力さ
れる文字列10と登録文字列の対応する各文字を比較し
、一致の有無を示す文字照合信号11を出力する。部分
文字列検出部2は、この信号11を入力し、所定の論理
演算処理を施し、登録文字列およびその部分文字列の有
無を示す部分文字列照合信号12を出力する。検出パタ
ーン制御部3は入力される信号12に所定の論理演算処
理を施し登録文字列の有無および部分文字列を含む各種
の文字列を示す照合結果信号13を出力する。
第2図は文字照合部1の構成例を示す。データセレクタ
20は、登録時に登録文字列1が入力されると、出力a
より登録レジスタ31に出力し、照合時に、文書ファイ
ル等の文字列1が入力されると、出力すよりフトレジス
タ32に出力する。クロックセレクタ21は入力するシ
フトクロック5を登録時に登録レジスタ31に、照合時
に照合レジスタ32に出力する。以上のデータセレクタ
20およびクロックセレクタ21の出力切換は登録/照
合セレクト信号6により制御される。
登録レジスタ31および照合レジスタ32は、図示のよ
うにそれぞれ複数個直列に接続され、シフトレ・ゾスタ
31aおよび31bを構成する。
前者は、登録時、入力される登録文字列1の各文字をシ
フトクロック5に同期して各登録レジスタ31を通して
移送し、登録文字列を登録する。後者は、同様に文書フ
ァイル等からの文字列lを各照合レジスタ32を通して
移送する。
比較器30は各レジスタ31および32の各出力310
および320を入力され、一致したとき文字照合信号1
1をアクティブにする。なお、登録レジスタ31はシフ
トレジスタ31aに限定されるものではなく、予め登録
文字列lを記憶するROM等であっても差支えない。
第6図は、文字照合部1に登録される文字列の例と本装
置によって検出可能な文字列ノ4ターンを示したもので
ある。1*」は登録文字列に対して正しくない任意の文
字を表す。
部分文字列検出部2の構成例を第3図(a)に示す。間
部2は抵抗Rを介して電圧Vccが印加される縦線(列
)と、シフトクロック5に同期した文字列照合信号11
が印加される横線(行)と、格子点で行間を接続する同
図(b)のオープンコレクタ型バッファ40で構成され
ている。バッファ40は、文字列照合信号11の論理積
をとり、登録文字列およびそのN文字が連続する部分文
字列を検出する部分文字列検出信号12を列に出力する
例えば、登録文字列が“5TRING”であるとき検出
される部分文字列はS”+ ” ST ’ +” ST
R″、 ” 5TRI ” 、 ” 5TIRN″、5
TRING”。
TRING ’ 、 ” RING ” 、 ” IN
G”、 ” NG”。
′G”等がある。
上記の部分文字列が文書ファイル等に存在すると、部分
文字列照合信号12がアクティブとなる。
検出パターン制御部3の構成例を第4図(a)に示す。
間部3は部分文字列検出部2から部分文字列照合信号1
2が入力される列と、抵抗Rを介して電圧V。Cが印加
される行と、格子点に接続される同図(b)のオープン
コレクタ型インバートバッファ50およびバッファ4o
で構成される。バッファ40および5oは、列から入力
される部分文字列照合信号12のアクティブおよび否定
の、論理積をとシ照合結果信号13として行に出力する
。照合結果信号13がアクティブとなると、信号13の
5TRING”は登録文字列、” * TRING ”
 〜” 5TRIN *”は1文字誤り/’Pターフ(
D、また” **RING″l ” S**ING”は
2文字誤り)4ターン、の文字列が、ファイル文書等に
あることを示す。
第5図は検出/4’タ一ン制御部3の他の構成例であυ
、登録文字列からN(自然数)字抜け、またはN字の余
剰文字が挿入されたパターンを検出する。直列に接続さ
れた1ビツトラツチ61および62は、シフトクロック
5に同期し、入力りから入力した部分文字列照合信号1
2を1クロック遅らせて出力Qに出力して、信号12を
1クロツク遅延させる遅延素子である。
直列に接続されるラッチ61および62の出力りに接続
する列線211および212には、それぞれ1クロツク
および2クロツク遅延した部分文字列信号12が出力さ
れ、列線211とバッファ40を介して接続される行線
に”5RING”〜” 5TRNG ’等の一文字抜は
パターンが出力され、さらにSTRING”の列線とイ
ンバートバッファ50を介して接続する行線にS*TR
ING″〜” STR*ING ’等の一文字挿入i?
ターンが出力される。同様に列線212と接続する行線
に5ING″〜” STG ’等の2文字抜けおよびS
**TRING ” 〜” STR**ING”等の2
文字挿入ノリーンが出力される。このようにして、1文
字以上の連続する誤りを検出することができる。
次に、文書情報から検出すべき文字列(登録文字列)が
、”STRING”という文字列である場合を例にして
以下説明する。第2図の文字照合部1において、登録/
照合セレクト信号6によってデータセレクタzOおよび
クロックセレクタ21の出力を登録レジスタ31側に接
続し、登録文字列1をシフトクロック5に同期して入力
することによって登録が行われる。
可変長文字列検出を行なう際゛には登録/照合セレクト
信号6によってデータセレクタ21およびクロックセレ
クタ21の出力を照合レジスタ32側に接続し、文字情
報を文書ファイル等からシフトクロック5に同期して入
力する。入力される文字情報は1文字ごとに比較器30
によって登録文字列と比較され、その結果が文字照合信
号11として出力される。
第3図の部分文字列検出部2では、行に入力される所定
の文字照合信号11の論理積をと9、列に出力すること
によって登録文字列1の部分文字列を検出する。第3図
に示すように、検出じたい文字の文字照合信号11と部
分文字列照合信号12をオープンコレクタ型バッファ4
0を用いて接続することにより部分文字列照合信号12
を構成することができる。例えば、”STR”という3
文字の文字列を検出したい場合、S″。
”T”、R”に対応する文字照合信号11と部分文字列
照合信号12を接続すればよい。ただしここでいう「接
続」とは電気的等電位にするよう物理的接続を行なうの
ではなく、論理的にワイヤード・アンドを構成できるよ
うにオープンコレクタバッファ等で接続することである
第4図(、)の検出パターン制御部3では、回部3に入
力された部分文字列検出信号12のうち、必要な信号だ
けを照合結果信号13と接続することにより図のように
N文字誤り・ぐターンの検出が可能となる。例えは、1
文字誤りックターン″S*RING”は′S”に対する
部分文字列照合信号12と、” RING”に対する部
分文字列照合信号12と、” 5TRING”に対する
部分文字列照合信号12の否定信号を接続することによ
って構成できる。” 5TRING”の否定信号を接続
するのは、本構成例では’ S*RING”を満たすパ
ターンのうち正解でない文字列を検出するようにしたた
めであり、これを接続しなければ正解文字列を含むパタ
ーン検出が可能となる。
また、第5図に示す構成例における検出・ぐターン制御
部3のように部分文字列照合信号12にN段の1ビット
ラッチ61.62群を付加することによって、N文字抜
はパターンおよびN文字挿入ツクターンの検出ができる
。例えば、1文字抜はパターン″5RING″を検出す
る信号を得るには1クロツク前の’ RING”信号と
現在の”S“信号とを照合結果信号13に接続すればよ
い。つまシ、文字照合部1に入力された文字列が、” 
5RING”である場合、” RING”が検出された
lクロック後にS″が検出されるためである。2文字以
上の抜はノやターンについても同様にして検出が可能で
ある。
さらに例えば1文字挿入パターン″’S*TRING’
を検出する信号を得るには、1クロツク前の″S″信号
と現在の” TRING″信号と現在の”5TRING
”の否定信号とを照合結果信号3に接続すればよい。こ
れも文字照合部1に入力された文字列が” S*TRI
NG ”である場合、′S″が検出された1クロツク後
にTRING”が検出されるためである。2文字以上の
挿入パターンの検出についても同様にして検出が可能で
ある。
まだ前述の誤りパターンの例と同様に登録文字列(正解
文字列)の信号″5TRING”の否定信号を付加して
いるが、これを除けば正解文字列を含む検出が可能であ
る。N文字抜はパターン検出の場合は正解文字列が現わ
れる可能性がないので、正解文字列の否定信号を付加す
る必要がない。
以上のようにして、登録文字列に対して正解文字列・e
ターン、連続するN文字誤りパターン、同じくN文字抜
はパターン、同じくN文字挿入パターンの検出ができる
(発明の効果) 以上説明したように、本発明によれば、連続するN文字
の誤り・抜け・挿入のすべてのパターンを検出でき、す
べてのN文字の誤りの抜け・挿入パターンを検出する装
置に比べ、ノ・−ドウエア規模が小さくできる。また、
同一モノユールの繰返し構造が多いためVLSI化に好
適であるなどの効果がある。
【図面の簡単な説明】
第1図は本発明の可変長文字列検出装置の実施例を示す
構成図、 第2図は第1図に示す実施例における文字照合部のブロ
ック図、 第3図(a)は同実施例における部分文字列検出部の構
成例を示す図、第3図(b)はオープンコレクタ型バッ
ファの記号を説明する図、 第4図(a)は同実施例における検出・ぐターン制御部
の構成例1を示す図、第4図(b)はオープンコレクタ
型インバートバッファの記号を説明する図、 第5図は同実施例における検出パターン制御部の他の構
成例を示す図、 第6図は検出可能な文字列のツクターンの例を示す図で
ある。 1・・・文字照合部 2・・・部分文字列検出部 3・・・検出パターン制御部 20・・・データセレクタ 21・・・クロックセレクタ 30・・・比較器 31・・・登録レジスタ 32・・・照合レジスタ 40・・・オープンコレクタ型バッファ50・・・オー
プンコレクタ型インバートバッファ61.62・・・1
ビツトラツチ 特許出願人  株式会社 リコー

Claims (1)

  1. 【特許請求の範囲】 1、それぞれ対応する複数の文字レジスタを備え、検出
    する文字列が予め登録文字列として登録される登録レジ
    スタ、およびファイルから入力される文字列をクロック
    信号に同期して一文字づつ前記文字レジスタに移送する
    シフトレジスタを備え、対応する前記文字レジスタの内
    容を比較し、前記文字列と前記登録文字列の一致の有無
    を示す1文字ごとの文字列照合信号を出力する文字照合
    部と、 前記文字列照合信号に所定の論理演算処理を施し、その
    結果より前記登録文字列およびその連続する部分文字列
    の有無を示す部分文字列照合信号を出力する部分文字列
    検出部と、前記部分文字列照合信号に所定の論理演算処
    理を施し、その結果を照合結果信号として出力する検出
    パターン制御部とを有し、 前記照合結果信号により、前記登録文字列の有無および
    前記部分文字列と連続する誤り文字よりなる各種の誤り
    文字列を前記ファイルから検出することを特徴とする可
    変長文字列検出装置。 2、請求項1に記載の装置において、前記検出パターン
    制御部は、前記クロック信号に同期して順番に導通状態
    となる少なくとも1つの遅延素子を含み、該素子を通過
    した前記部分文字列照合信号に所定の論理演算処理を施
    した結果を照合信号として出力し、該照合信号により、
    前記登録文字列から連続する文字欠落、または連続する
    余剰文字を含む誤り文字列を前記ファイルから検出する
    ことを特徴とする可変長文字列検出装置。
JP63227502A 1988-09-13 1988-09-13 可変長文字列検出装置 Expired - Lifetime JP2729491B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP63227502A JP2729491B2 (ja) 1988-09-13 1988-09-13 可変長文字列検出装置
US07/859,627 US5212697A (en) 1988-09-13 1992-03-20 Variable length character string detection apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63227502A JP2729491B2 (ja) 1988-09-13 1988-09-13 可変長文字列検出装置

Publications (2)

Publication Number Publication Date
JPH0276072A true JPH0276072A (ja) 1990-03-15
JP2729491B2 JP2729491B2 (ja) 1998-03-18

Family

ID=16861899

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63227502A Expired - Lifetime JP2729491B2 (ja) 1988-09-13 1988-09-13 可変長文字列検出装置

Country Status (1)

Country Link
JP (1) JP2729491B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0470967A (ja) * 1990-07-05 1992-03-05 Canon Inc 画像検索装置及び画像検索方法
US6338061B1 (en) 1998-01-14 2002-01-08 Nec Corporation Search method search apparatus, and recording medium recording program
US7133472B2 (en) 2000-05-12 2006-11-07 Nec Corporation High-speed turbo decoder
JP2009163009A (ja) * 2008-01-07 2009-07-23 Fujitsu Ltd 学習支援システム、プログラムおよび学習支援方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0470967A (ja) * 1990-07-05 1992-03-05 Canon Inc 画像検索装置及び画像検索方法
US6338061B1 (en) 1998-01-14 2002-01-08 Nec Corporation Search method search apparatus, and recording medium recording program
US7133472B2 (en) 2000-05-12 2006-11-07 Nec Corporation High-speed turbo decoder
JP2009163009A (ja) * 2008-01-07 2009-07-23 Fujitsu Ltd 学習支援システム、プログラムおよび学習支援方法

Also Published As

Publication number Publication date
JP2729491B2 (ja) 1998-03-18

Similar Documents

Publication Publication Date Title
KR101996961B1 (ko) 상태 기계에서의 데이터 분석을 위한 방법들 및 시스템들
JP2790031B2 (ja) ネット情報抽出方法および装置
US10949290B2 (en) Validation of a symbol response memory
JPS62217321A (ja) 高速サ−チプロセツサ
US5842208A (en) High performance recover/build index system by unloading database files in parallel
US5212697A (en) Variable length character string detection apparatus
JPH0276072A (ja) 可変長文字列検出装置
US6898722B2 (en) Parallel data transfer method and system of DDR divided data with associated transfer clock signal over three signal lines
JP2693914B2 (ja) 検索システム
US11586956B2 (en) Searching apparatus utilizing sub-word finite state machines
JPS6142031A (ja) ソ−ト処理装置
JP2636221B2 (ja) 部分テスト項目作成方法
JP3534471B2 (ja) マージソート方法及びマージソート装置
JP2792485B2 (ja) 疑似エラー削減クロストーク検証方法及びシステム
EP0908834B1 (en) Method and apparatus for proving system properties
US11687572B2 (en) Computer security using context triggered piecewise hashing
JP2536572B2 (ja) ソ―ト処理装置
JPH04279973A (ja) 文字列比較方式
JPH0268663A (ja) 文字列検索装置
JPH01173230A (ja) ソート処理装置
JP2541944B2 (ja) 並び換え部分文字列結合処理方式
JPH03255521A (ja) ファイル比較方式
JPH10301758A (ja) ソート処理装置
JPH0916223A (ja) シーケンスプログラムソートシステム
JPH01216280A (ja) 論理回路の動作検証システム