JPH01224831A - 文字列検索装置 - Google Patents

文字列検索装置

Info

Publication number
JPH01224831A
JPH01224831A JP63049628A JP4962888A JPH01224831A JP H01224831 A JPH01224831 A JP H01224831A JP 63049628 A JP63049628 A JP 63049628A JP 4962888 A JP4962888 A JP 4962888A JP H01224831 A JPH01224831 A JP H01224831A
Authority
JP
Japan
Prior art keywords
byte
comparison
search
cell
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63049628A
Other languages
English (en)
Inventor
Isao Nakai
中井 功
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP63049628A priority Critical patent/JPH01224831A/ja
Publication of JPH01224831A publication Critical patent/JPH01224831A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、文字列検索装置に係り、特に、キーを与えて
文献等を検索するシステムにおいて、欧文等の1バイト
文字と、漢字等の2バイト文字を含むキーによる文字列
検索のために用いて好適な文字列検索装置に関する。
〔従来の技術〕
データ処理システムの技術分野において、複数のレコー
ドから成る文献等のデータベース(以下テキストという
)の中から、検索キー情報(以下単に検索キーという)
を用いて、所望のレコードを抽出する情報横系システム
に関する従来技術として、例えば、特開昭58−139
273号公報等に記載された技術が知られている。この
種従来技術による情報検索システムにおけるテキスト及
び検索キーを構成する文字は、一般に、欧文では1バイ
トで構成され、日本文のように漢字を含むものでは2バ
イトで構成されている。そして、従来技術による情報検
索システムは、1バイト単位の比較動作により、文字列
の検索を行うものであつム〔発明が解決しようとする課
題〕 前記従来技術は、1バイト文字、2バイト文字によるテ
キストの検索を行う、いずれの場合にも、1バイトを単
位として、検索キーとの比較処理を行っているので、2
バイト文字によるテキストの検索処理を行う場合に、ず
れ読みという誤動作を起すという問題点を有していた。
漢字コードのように2バイトで1文字を表わしている場
合に、1バイト毎の比較による検索を行うと、テキスト
中のある文字の後半の1バイトと、その文字に続く文字
の前半の1バイトとの組合せによる2バイトのコードが
有意の文字を表わすことがある。前記従来技術は、この
組合わせによる2バイトのコードが検索キーに一致する
と、検索キーが存在したとして誤った検出出力を発して
しまう。
例えば、第5図に示すように、検索キーとして、16進
表示で’3831″として表わされる2バイトの文字コ
ード「険」が与えられ、検索テΦスト内に、文字コード
「左右」が存在したものとする。
文字コード「左」「右」が夫々、16進コード″3A3
8”、’3126″で表わされたとすると、前記従来技
術は、「左右」の16進コード″3A383126’内
の”3831”を検出して、検索キーの文字コード「険
」が検索テキスト中に存在したとする誤検出を起してし
まう。
本発明の目的は、前記従来技術の問題点を解決し、2バ
イト文字によるテキストの検索処理を行う場合に、1バ
イト単位の比較処理を行っても、ずれ読みを起こすこと
がなく検索可能で、また、1バイト文字によるテキスト
の検索処理も可能な文字列検索装置を提供することにあ
る。
〔課題を解決するための手段〕
本発明によれば、前記目的は、検索キーを1バイト単位
に格納するキーレジスタ及び検索データを前記キーレジ
スタの内容と比較する比較回路によシ構成される複数個
の比較セルと、該比較セルの比較出力の有効性を1バイ
ト文字の検索か2バイト文字の検索かによって制御する
バイト制御回路と、検索時に検索キーの所要の各バイト
全部について、前記比較セルから有効な一致信号が得ら
れ友ときに、検索データ中に検索キー情報が存在するも
のと判定する判定回路とを備えることにより達成される
〔作 用〕
検索キー及び検索データが1バイト文字であるか2バイ
ト文字であるかは予め与えられているものとする。検索
キーを比較セル内のキーレジスタに設定する際、検索キ
ーが1バイト文字の場合、任atの比較セルのキーレジ
スタから順に検索キーがキーレジスタに格納され、検索
キーが2バイト文字の場合、予じめ対として定められて
いる2 ([1i1の比較セルの先頭の比較セルのキー
レジスタから順に検索キーがキーレジスタに格納される
。検索キーは、文字列単位で1バイト文字と2バイト文
字とが混在してもよい。
検索処理時、データベースからの検索データは、1バイ
ト単位に比較セルに印加される。検索データが1バイト
文字で構成されている場合、バイト制御回路は、比較セ
ルの比較結果が全て有効となるように全ての比較セルを
制御し、判定回路は、1バイト文字の文字列に対してだ
け、比較セルからの有効な一致信号を判定して検索結果
を出力する。検索データが2バイト文字で構成されてい
る場合、バイト制御回路は、前記対となった比較セルの
うち、検索キーの2バイト文字の先頭のバイトを格納し
ている比較セルに、検索データの2バイト文字の先頭の
バイトが印加され、この比較セルが比較動作を行う場合
にのみ、前記検索キーの2バイト文字の先頭のバイトを
格納している比較セルからの比較結果が有効となるよう
に制御する。
これにより、ずれ読み時の比較セルでの比較結果を無効
とすることができ、判定回路は、2バイト文字の文字列
に対してだけ、比較セルからの有効な一致信号を判定し
て検索結果を出力する。これにより、ずれ読みという誤
動作を起こすことなく、1バイト文字、2バイト文字の
文字列の単独Itは混在の検索が可能となる。
〔実施例〕
以下、本発明による文字列検索装置の一実施例を図面に
より詳細に説明する。
第1図は本発明の一実施例の構成を示すブロック図、第
2図は第1図における比較セルの構成を示すブロック図
、第3図は動作の説明のための検索キーの一例を示す図
、第4図は動作の説明のための検索データの一例を示す
図である。第1図。
第2図において、la、1b、・・・・・・na%nb
は比較セル、3はバイト制御回路、4は判定回路、21
はキーレジスタ、四はエンドキーラッテ、乙は比較回路
、あ、5はANDゲートである。
本発明による文字列検索装置の一実施例は、第1図に示
すように、伏系キーと@素データとを1バイト単位に比
較する比較セル1a11b、・・・・・・na、nbと
、バイト制御回路3と、判定回路4とにより構成されて
いる。比較セルla、lbは、2バイト文字の検索キー
による検索処理の場合に対として用いられる。この比較
セルに続く比較セル2a、2b、・曲・nal nbも
同様に用いられ、これらは、対として、検索キーの最大
文字数分アレイ接続される。対となっている比較セルの
前段の比較セルla、2a・・・・・・naには、バイ
ト制御回路3より、ライン104を介して、そのセルの
比較結果を有効とするか否かの制御46号が印加されて
いる。
各比較セルl a、 1 b、・−−−−−n a 、
 n bハ、第2図に示すように、検索キーを1バイト
単位に格納するキーレジスタ21と、恢紫キーの最終バ
イトを示すエンドキーラッチnと、キーレジスタ21の
内容とライン101を介して得られる検索データとを1
バイト単位で比較する比較回路おと、ANDグートス、
5とにより構成される。第2図において、比較セル1b
、2b・・・・・・nbは、バイト制御間wr3から2
イン104を介して与えられる制御信号が不要であり、
従って、ANDゲートスが2人力である点で、比較セル
la、・・・・・・naと相違している。
次に、このように構成された本発明の一実施例の動作を
説明する。
検索キーとして、第3図に例として示すような1バイト
文字によるrKINGJと2バイト文字による「左右」
の2つの検索キー′″O”、検索キー”1″が与えられ
るとする。まず、ライン101を介して、比較セルla
% lb% 2a、 2b・・・・・・・・・のJmK
rKINGJ、r左右」が、果3図に示す16進コード
で各記憶セルのキーレジスタ21に格納される。このと
き、検索キー@0”のrKINGJの最終バイトである
16進コード″′47″を格納した比較セルと、検索キ
ー@1″の「左右」の最終バイトである16進コード@
26″を格納した比較セルとは、その内部のエンドキー
ラッチρがライン102を介してセットされる。また、
この例では、1”KINGJが4バイトであるため、2
バイト文字の検索キー@1”の「左右」の先頭バイトは
、対とたつ九図示されていない比較セル3a、3bの先
頭側の比較セルaa側に格納されるが、1バイト文字に
よる検索キーの文字数が奇数である場合にも、2バイト
文字の検索キーの先頭のバイトは、対となった比較セル
ia、ibの先頭側の比較セルia側に格納されるよう
に制御される。従って、1バイト文字による検索キーが
奇数バイトである場合、引き続く比較セルの1バイトの
キーレジスタ21は、空きのままとされる。
前述し次動作により、検索キーの比較セル内の中−レジ
スタ21への格納が終了すると、データベース上の検索
データが1バイト単位にライン101を介して送られ、
全ての比較セル内の比較回路21に印加される。このと
き、アレイ接続された比較セルの先頭の比較セル、抛1
図に示す例では、比較セル1a及び3aに2イン103
を介して与えられる信号は a1″とされている。いま
、ライン101を介して送られる検索データが、第4図
に例として示すように「左右に」であるとする。この検
索データ「左右に」が、第4図に示す16進コードで表
わされるとすれば、ライン101上には、この16fi
コードが、3A、38.31.・・・・・・の順に印加
される。
各比較セル内の比較回路nは、自比較セル内のキーレジ
スタ21に格納されている1バイトのデータと、ライン
101を介して送られてくる検索データの1バイトのデ
ータとを比較する。この比較結果は、前段の比較セルか
らのライン103を介し友、1つ前の1バイトデータの
比較結果が′1′?で、ライン104を介して送られる
バイト制御回路3からの制御信号が′1″であるときに
有効となり、ANDゲート24を介して後段の比較セル
にライン103を介して転送される。このライン103
上の比較結果は、次の1バイトデータの比較動作が行わ
れるまで保持される。前記動作で、バイト制御回路3か
らの制御信号を必要としない比較セル1 b。
2b・・・・・・nbは、前段からの2イン103を介
し九比較結果が′1″であることだけで、自比較セル内
の比較回路器の比較結果が有効であるとして、その比較
結果を、ANDゲート冴を介して後段の比較セルに送出
する。
このとき、バイト制御回路3は、次のような処理を実行
する。すなわち、検索データが2バイト文字で構成され
ている場合、バイト制御回路3は、検索データを構成す
る2バイト文字の先頭のバイトが、ライン101を介し
て各比較セルの比較回路器に印加されるときに、ライン
104上の制御信号を”1”として、比較セルla、2
a・・・・・・naの比較結果を有効なものとして、後
段の比較セルに送るように制御する。また、バイト制御
回路3は、検索データを構成する2バイト文字の2バイ
ト目のデータが、ライン101を介して各比較セルの比
較回路おに印加されるときに、ライン104上の制御信
号を′θ″として、比較セルla、2a・・・・・・の
比較結果を無効とする。すなわち、比較セルl a。
2a・・・・・・naは、検索キーが2バイト文字の場
合、その1バイト目と、検索データの2バイト文字の1
バイト目との比較を行った場合のみその比較結果を有効
として出力可能となる。
さて、第4図に示す検索データ「左右に」の最初のバイ
トの16進コード3A”がライン101を介して与えら
れると、各比較セルは、自比較セル内のキーレジスタ2
1の内容と、ライン101上の13A”との比較を行う
。この場合、図示しない比較セル3aが、そのキーレジ
スタ内にコード″′3八″を有しているので、その比較
回路器が一致信号を出力する。この比較セル3aは、2
バイト文字による検索キーの最初のバイトを保持してい
るため、その入力ライン103上の信号がNil″とな
っており、また、前述に従って、バイト制御回路3から
の制御信号がライン104上で′1″となっているので
、比較@路乙の一致信号である91″を、ANDゲート
列を介して、ライン103に送り、後段の比較セル3b
に送出する。
次に、ライン101を介して検索データの138″が送
られると、比較セル3b内のキーレジスタ21がコード
”38’″を有しているので、比較セル3b内の比軟回
路が一致信号を出力する。この一致信号は、前述した比
較セル3aからライン103を介この場合、バイト制御
回路3からライン104に送られる制御信号は、10”
とされており、比較セルla、2a・・・・・・naで
の比較結果は無効とされているが、比較セル3bには、
この制御信号が与えられていないので、この比較セル3
bでの比較結果は、有効なものとして後段に送られるこ
とになる。
このような動作が続けられ、第4図における検索データ
「右」の2バイト目の16進コード″′26”がライン
101に送られると、キーレジスタ21内に検索キーと
してこのデータを有している比較セル4bは、その比較
回路おからの一致信号をANDゲー)24を介して出力
する。この比較セル4bは、検索キー「左右」の最後の
ノくイトを、その内部のキーレジスタ21に保持してい
るので、エンドキーラッチnが’1″とされている。こ
のため、ANDゲート24の出力″11″は、ANDゲ
ート5を介して、ライン105に送出され、検索キー″
1″の「左右」がヒツトしたことを、表示する。
判定回路4&!、各比較セル1as2bs・・・・・・
na。
nbからのライン105上のヒツト信号を受は取り、検
索キー ′1”がヒツトしたと判定する。このとき、検
索キー ′″0”は、1バイト文字による検索キーであ
るので、検索キー”0”K対する文字列゛比較結果は、
無視される。
前述した、本発明の動作は、検索データが2バイト文字
で構成された場合であるが、検索データが1バイト文字
で構成される場合には、バイト制御回路3は、ライン1
04上の信号を常時11”として、全ての比較セルla
、lb、曲・・na、nbの比較結果を常時有効なもの
として後段に送出するように制御する。また、このとき
、判定回路4は、1バイト文字による検索キーの文字列
比較結果を有効とし、2バイト文字による検索キーの文
字列比較結果を無視する。
前述した本発明の実施例によれば、2バイト文字による
文字列を検索するときにも、ずれ読みによる誤動作を起
こすことなく、また、同時に、1バイト文字による文字
列の検索をも行うことができる。
〔発明の効果〕
以上説明したように、本発明によれば、検索データが1
バイト文字か2バイト文字かによって、2バイト文字に
よる検索キーの各バイトの比較を行う対となった比較セ
ルの一方の比較結果の有効性を制御するようにし、文字
列単位で1バイト文字か2バイト文字かを判定するよう
にしたので、2バイト文字の検索時に、ずれ読みという
誤動作を起こすことなく、1バイト文字と2バイト文字
の混在する検索キーによる文字列の検索を、比較的少な
いハードウェアで行うことができる。
【図面の簡単な説明】
第1図は本発明の一実施例の構成を示すブロック図、第
2図は第1図における比較セルの構成を示すブロック図
、第3図は動作の説明のための検索キーの一例を示す図
、第4図は動作の説明のための検索データの一例を示す
図、第5図は2バイト文字によるずれ読みの例を説明す
る図である。 la、lb、〜na、nb・・・・・・比較セル、3・
・・・・・バイト制御回路、4・・・・・・判定画M、
21・・・・・・キーレジスタ、n・・・・・・エンド
キーラッテ、n・・・・・・比較回路、冴、5・・・・
・・ANDゲート。 第1図 第2図

Claims (1)

  1. 【特許請求の範囲】 1、1ないし複数の検索キー情報を用いて、データベー
    ス内の検索データを検索し、合致したレコードを抽出す
    る文字列検索装置において、検索キーを1バイト単位に
    格納するレジスタ及び前記検索データを前記キーレジス
    タの内容と比較する比較回路を備えて構成される複数個
    の比較セルと、これら複数個の比較セルの比較出力の有
    効性を、1バイト文字の検索か2バイト文字の検索かに
    よつて制御するバイト制御回路と、検索時に検索キー情
    報を構成する各バイト全部について、前記比較セルから
    有効な一致信号が得られたときに、検索データ中に検索
    キー情報が存在するものと判定する判定回路とを備えた
    ことを特徴とする文字列検索装置。 2、前記複数の比較セルは、検索キー情報が2バイト文
    字で構成される場合に、文字の1バイト目の比較を行う
    比較セルと、文字の2バイト目の比較を行う比較セルと
    が対としてアレイ接続されており、前記1バイト目の比
    較を行う比較セルの比較出力の有効性が、前記バイト制
    御部により制御されることを特徴とする特許請求の範囲
    第1項記載の文字列検索装置。
JP63049628A 1988-03-04 1988-03-04 文字列検索装置 Pending JPH01224831A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63049628A JPH01224831A (ja) 1988-03-04 1988-03-04 文字列検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63049628A JPH01224831A (ja) 1988-03-04 1988-03-04 文字列検索装置

Publications (1)

Publication Number Publication Date
JPH01224831A true JPH01224831A (ja) 1989-09-07

Family

ID=12836486

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63049628A Pending JPH01224831A (ja) 1988-03-04 1988-03-04 文字列検索装置

Country Status (1)

Country Link
JP (1) JPH01224831A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014235454A (ja) * 2013-05-30 2014-12-15 富士通株式会社 文字列探索方法、文字列探索装置および文字列探索プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014235454A (ja) * 2013-05-30 2014-12-15 富士通株式会社 文字列探索方法、文字列探索装置および文字列探索プログラム
US9645828B2 (en) 2013-05-30 2017-05-09 Fujitsu Limited Method of searching character string, character string searching device, and recording medium

Similar Documents

Publication Publication Date Title
JPS5846742B2 (ja) 対話式デ−タ検索装置
JPH02115973A (ja) 記号列照合装置とその制御方法
US3465299A (en) Information translating data comparing systems
JPS60105039A (ja) 文字列照合方式
JPH01224831A (ja) 文字列検索装置
JPH0746362B2 (ja) 文字列照合方法
JP2880199B2 (ja) 記号列検索方法および検索装置
JPH04308B2 (ja)
JPH044282Y2 (ja)
JPH04279973A (ja) 文字列比較方式
JPS63187334A (ja) 文字列パタ−ンマツチング装置
JP2975529B2 (ja) 電子化辞書検索装置
JPH01166148A (ja) メモリアクセス装置
JPS60123929A (ja) 文字位置検出装置
JPH0664586B2 (ja) 文字列照合方法
JP2988046B2 (ja) かな漢字変換装置
JPH043251A (ja) 文書検索方法および文書検索処理装置
JPH07104905A (ja) 入力キー識別方法
JPS6145485A (ja) 磁気バブルメモリ制御装置
JPS5935227A (ja) カナ漢字変換方式
JPS6373422A (ja) 情報検索装置
JPS6243731A (ja) 検索補助装置
JPH05158827A (ja) 受信コマンド検索装置及びその検索方法
JPS63155324A (ja) 情報検索装置
JPH04101252A (ja) アドレス変換バッファクリア方式