JPH0567157A - 文字列検索方式 - Google Patents

文字列検索方式

Info

Publication number
JPH0567157A
JPH0567157A JP3254477A JP25447791A JPH0567157A JP H0567157 A JPH0567157 A JP H0567157A JP 3254477 A JP3254477 A JP 3254477A JP 25447791 A JP25447791 A JP 25447791A JP H0567157 A JPH0567157 A JP H0567157A
Authority
JP
Japan
Prior art keywords
code
character string
character
search
byte
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3254477A
Other languages
English (en)
Inventor
Shunji Nagamine
俊二 長嶺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP3254477A priority Critical patent/JPH0567157A/ja
Publication of JPH0567157A publication Critical patent/JPH0567157A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】 1バイト系,2バイト系の文字コードが混在
するJISコードによる文字列を、漢字制御コードを意
識せずに検索できるようにする。 【構成】 1バイト系の文字コード(a,b等)と2バ
イト系の文字コード(漢,字等)とを両者の間に漢字制
御コードを置いて混在させた被検索文字列30及び同様な
構成の検索文字列32を、1バイト系の文字コードについ
ては−1の値を持つ1バイトを元の1バイトの前に付加
した2バイトの文字コードに変換することにより、全コ
ードが2バイトで表現され且つ漢字制御コードが削除さ
れたXコード被検索文字列31及びXコード検索文字列33
を生成する。次に、任意の長さの文字列を示す“*”等
の特殊文字の上位1バイトの値を−1から−2に変更す
る等の処理を施してXコード検索文字列33からX正規化
コード検索文字列34を生成する。検索はXコード被検索
文字列31とX正規化コード検索文字列34とを使用して行
う。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は情報処理装置における文
字列検索方式に関し、特に1バイト系の文字コードと2
バイト系の文字コードとが混在する文字列を対象とする
文字列検索方式に関する。
【0002】
【従来の技術】アルファベット等を表現する1バイト系
の文字コードと漢字等を表現する2バイト系の文字コー
ドとが混在するJISコードを扱う日本語ラインエディ
タにおける従来の文字列検索方式では、2バイト系の文
字コードの開始部分および終了部分に挿入された漢字制
御コードにより1バイト系,2バイト系の判断を行いつ
つ、1バイト系の文字コードおよび2バイト系の文字コ
ードが混在する被検索文字列中から同様な構成の検索文
字列を検索するようにしている。
【0003】
【発明が解決しようとする課題】上述したように従来の
文字列検索方式では、漢字制御コードを認識しながら1
バイト系の文字コードと2バイト系の文字コードとが混
在する文字列を対象として検索を行っているため、漢字
制御コードという特殊な制御コードを意識した複雑な検
索論理が必要になるという問題点がある。
【0004】本発明はこのような従来の問題点を解決し
たもので、その目的は、漢字制御コードといった特殊な
制御コードを意識することなく1バイト系,2バイト系
の文字コードが混在する文字列の検索を行うことができ
る文字列検索方式を提供することにある。
【0005】
【課題を解決するための手段】本発明は上記の目的を達
成するために、1バイト系の文字コードと2バイト系の
文字コードとを両者の間に制御コードを置いて混在させ
た文字列を被検索文字列とし、同様な構成の文字列を検
索文字列とし、前記被検索文字列中から前記検索文字列
を検索する文字列検索方式において、前記被検索文字列
および前記検索文字列を、1バイト系の文字コードにつ
いては所定の値を持つ1バイトを付加した2バイトの文
字コードに変換することにより、全コードが2バイトで
表現され且つ前記制御コードが削除されたXコード被検
索文字列およびXコード検索文字列に変換する変換手段
と、前記Xコード被検索文字列中から前記Xコード検索
文字列を検索する検索手段とを備えている。
【0006】また、前記変換手段で得られたXコード検
索文字列に含まれる特殊文字に対し所定のルールに従っ
た処理を施してX正規化コード検索文字列を生成する正
規化手段を備え、前記検索手段は前記正規化手段で得ら
れたX正規化コード検索文字列を使用して検索を行うよ
うにしている。
【0007】更に、検索終了時に、前記Xコード被検索
文字列を元の被検索文字列に逆変換する逆変換手段を備
えている。
【0008】
【作用】本発明の文字列検索方式においては、変換手段
が、1バイト系の文字コードと2バイト系の文字コード
とを両者の間に制御コードを置いて混在させた被検索文
字列および同様な構成の検索文字列を、1バイト系の文
字コードについては所定の値たとえば−1の値を持つ1
バイトを元の1バイトの前に付加した2バイトの文字コ
ードに変換することにより、全コードを2バイトで表現
し且つ不要になった制御コードを削除したXコード被検
索文字列およびXコード検索文字列を生成する。そし
て、検索手段が前記Xコード被検索文字列中から前記X
コード検索文字列を検索する。
【0009】また、任意の長さの文字列を示す“*”や
任意の1文字を示す“.”等の特殊文字を含む検索文字
列を使用した検索を容易にするために、正規化手段が、
変換手段で得られたXコード検索文字列に含まれる特殊
文字に対し所定のルールに従った処理を施してX正規化
コード検索文字列を生成し、検索手段はそのX正規化コ
ード検索文字列を使用して検索を行う。
【0010】更に、検索終了時、逆変換手段が、Xコー
ド被検索文字列を、元の被検索文字列すなわち1バイト
系の文字コードと2バイト系の文字コードとを両者の間
に制御コードを置いて混在させた被検索文字列に変換す
る。
【0011】
【実施例】次に本発明の実施例について図面を参照して
詳細に説明する。
【0012】図1は本発明を適用した日本語ラインエデ
ィタ1の機能ブロック図であり、文字列の検索にかかる
構成として、第1の関数11,第2の関数12,第3の
関数13および第4の関数14という4つの関数と、文
字列検索にかかる全体的な制御を司る制御部15と、被
検索文字列を保持するファイル等の記憶部16と、処理
過程の文字列を一時的に保持するテンポラリメモリ等の
記憶部17と、復元した被検索文字列を保持するファイ
ル等の記憶部18とを備えている。
【0013】そして、日本語ラインエディタ1は、CR
T等の表示装置21とキーボード等の入力装置22とを
備えた端末装置2に接続されている。
【0014】日本語ラインエディタ1における第1の関
数11は、1バイト系の文字コードと2バイト系の文字
コードとを両者の間に漢字制御コードを置いて混在させ
たJISコードによる文字列を、Xコードによる文字列
に変換する機能を有する関数であり、請求項にいう変換
手段を構成する。
【0015】ここで、Xコードは、次のようなコード体
系になっている。
【0016】(1)JISコードの1バイト系のコード
も2バイト系のコードも、Xコードにおいては全て1文
字を2バイトで表現する。 (2)JISコードの1バイト系のコードに対応するX
コードは、上位1バイトに値−1が入り、下位1バイト
に元の1バイト系のコードが入った構造を持つ。 (3)JISコードの2バイト系のコードに対応するX
コードは、元の2バイト系のコードと同じ構造を持つ。 (4)漢字制御コードは含まない。
【0017】第2の関数12は、Xコードで表現された
文字列中の特殊文字に対し以下のような正規化ルールに
沿う処理を施し、X正規化コードで表現された文字列を
生成する機能を有する関数であり、請求項にいう正規化
手段を構成する。
【0018】正規化ルール;任意の長さの文字列を示す
“*”や任意の1文字を示す“.”等の特殊文字につい
ては、その上位1バイトの値を−1から−2に変更し、
検索にかかる特殊文字として認識できるようにする。但
し、文字列の先頭に現れる“*”、その直前に“¥”が
付加されている特殊文字は本来の文字として扱うために
上記のような変更は行わない。また、特殊文字として
の、文字列の最後の“*”は無意味であるので削除し、
特殊文字としての“*”の連続は1つにまとめてから変
更を加える。
【0019】第3の関数13は、Xコードで表現された
文字列からX正規化コードで表現された文字列を最小ス
パン法等で検索し、見つかった文字位置を返す機能を有
する関数であり、請求項にいう検索手段を構成する。
【0020】第4の関数14は、Xコードで表現された
文字列をJISコードで表現された文字列に変換する機
能を有する関数であり、請求項にいう逆変換手段を構成
する。
【0021】また、日本語ラインエディタ1における記
憶部16は、検索される文字列である被検索文字列を保
持する記憶部である。
【0022】ここに保持されている被検索文字列は、図
2(a)の被検索文字列30に例示するように、アルフ
ァベット等を表現する1バイト系の文字コードと漢字等
を表現する2バイト系の文字コードとが混在するJIS
コードで表現されており、漢字を示すコードの開始部分
と終了部分には漢字制御コードが挿入されている。
【0023】他方、検索する文字列である検索文字列
は、例えば端末装置2の入力装置22から日本語ライン
エディタ1に入力される。
【0024】この検索文字列も、図2(b)の検索文字
列32に例示するように、被検索文字列30と同様にJ
ISコードで表現されている。
【0025】図3は文字列検索時のおおまかな処理の流
れを示すフローチャートであり、以下図3の流れに沿っ
て本実施例の動作を説明する。
【0026】日本語ラインエディタ1の制御部15は、
端末装置2から検索が要求されると、先ず、第1の関数
11を呼び出し、被検索文字列をXコードへ変換させる
(ステップS1)。
【0027】第1の関数11は、例えば被検索文字列が
図2(a)の被検索文字列30とすると、それを記憶部
16から読み出し、1バイト系の文字コードはそれに−
1の値の1バイトを付加して2バイトにし、また、漢字
制御コードは削除する。これにより、図2(a)のXコ
ード被検索文字列31が生成され、これが記憶部17に
記憶される。
【0028】続いて制御部15は、再び第1の関数11
を呼び出し、端末装置2から検索要求時に入力された検
索文字列をXコードへ変換させる(ステップS2)。
【0029】第1の関数11は、例えば検索文字列が図
2(b)の検索文字列32とすると、それを上述と同様
に処理することにより図2(b)のXコード検索文字列
33に変換し、これを制御部15に返却する。
【0030】次に制御部15は、第2の関数12を呼び
出し、第1の関数11から返却されたXコード検索文字
列33の正規化処理を行わせる(ステップS3)。
【0031】第2の関数12は、上述した正規化ルール
に従ってXコード検索文字列33の正規化処理を行って
図2(c)に示すようなX正規化コード検索文字列34
を生成し、これを制御部15に返却する。
【0032】以上のようにして、Xコード被検索文字列
31およびX正規化コード検索文字列34ができあがる
と、制御部15は、第3の関数13を呼び出し、検索を
要求する(ステップS4)。
【0033】第3の関数13は、図4に示すような記憶
部17から読み込んだXコード被検索文字列31から、
制御部15から渡されたX正規化コード検索文字列34
を、左側から最小スパンで検索を行う。そして、検索で
きなかった場合は検索不能のステータスを制御部15に
返し、検索できた場合には文字の開始位置と文字列の長
さとを含むステータスを制御部15に返却する。
【0034】図4は検索できた例に対応しており、ステ
ータスとして、文字の開始位置を示すstart=1,
文字列の長さを示すcolumn=5が生成されてい
る。
【0035】第3の関数13からステータスの返却を受
けた制御部15は、そのステータスに応じた検索結果を
端末装置2の表示装置21に表示する。
【0036】最後に制御部15は、第4の関数14を呼
び出し、記憶部17に保持されたXコード被検索文字列
31を元の被検索文字列30と同一の被検索文字列35
に変換させ、それを記憶部18に記憶させる(ステップ
S5)。これにより、図5に示すように、Xコード被検
索文字列31が元と同じ被検索文字列35に変換される
ことになる。
【0037】なお、元の被検索文字列30が別途保存さ
れている場合には、ステップS5の処理は不要である。
【0038】
【発明の効果】以上説明した本発明の文字列検索方式に
よれば、以下のような効果を得ることができる。
【0039】1バイト系の文字コードと2バイト系の文
字コードとを両者の間に制御コードを置いて混在させた
被検索文字列および検索文字列を、制御コードを含まな
い全2バイトの文字コードによるXコード被検索文字列
およびXコード検索文字列に変換し、それらを使用して
検索を進めるので、漢字制御コードといった特殊な制御
コードを意識せずに検索を行うことができ、検索論理が
簡単になる。
【0040】Xコード被検索文字列,Xコード検索文字
列への変換は、元の1バイト系の文字コードに所定の値
を持つ1バイトを付加すると共に漢字制御コードを削除
するだけなので、簡単に行え、検索時間に与える影響が
少ない。
【0041】Xコード検索文字列に含まれる特殊文字に
対し所定のルールに従った処理を施してX正規化コード
検索文字列を生成する正規化手段を備えているため、任
意の長さの文字列を示す“*”や任意の1文字を示
す“.”等の特殊文字を含む検索文字列を使用した検索
を容易に行える。
【0042】Xコード被検索文字列に対する逆変換を行
う逆変換手段を備えるため、元の被検索文字列を必要に
応じて容易に再生することができる。
【図面の簡単な説明】
【図1】本発明を適用した日本語ラインエディタの一例
を示す機能ブロック図である。
【図2】Xコードへの変換とXコードの正規化の説明図
である。
【図3】文字列検索処理の概略を示すフローチャートで
ある。
【図4】Xコード被検索文字列およびX正規化コード検
索文字列の一例と検索結果の一例を示す図である。
【図5】JISコードへの逆変換の説明図である。
【符号の説明】
1…日本語ラインエディタ 11…第1の関数(変換手段) 12…第2の関数(正規化手段) 13…第3の関数(検索手段) 14…第4の関数(逆変換手段) 15…制御部 16,17,18…記憶部 2…端末装置 21…表示装置 22…入力装置

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 1バイト系の文字コードと2バイト系の
    文字コードとを両者の間に制御コードを置いて混在させ
    た文字列を被検索文字列とし、同様な構成の文字列を検
    索文字列とし、前記被検索文字列中から前記検索文字列
    を検索する文字列検索方式において、 前記被検索文字列および前記検索文字列を、1バイト系
    の文字コードについては所定の値を持つ1バイトを付加
    した2バイトの文字コードに変換することにより、全コ
    ードが2バイトで表現され且つ前記制御コードが削除さ
    れたXコード被検索文字列およびXコード検索文字列に
    変換する変換手段と、 前記Xコード被検索文字列中から前記Xコード検索文字
    列を検索する検索手段とを備えることを特徴とする文字
    列検索方式。
  2. 【請求項2】 前記変換手段で得られたXコード検索文
    字列に含まれる特殊文字に対し所定のルールに従った処
    理を施してX正規化コード検索文字列を生成する正規化
    手段を備え、 前記検索手段は前記正規化手段で得られたX正規化コー
    ド検索文字列を使用して検索を行う請求項1記載の文字
    列検索方式。
  3. 【請求項3】 検索終了時に、前記Xコード被検索文字
    列を元の被検索文字列に逆変換する逆変換手段を備えた
    請求項2記載の文字列検索方式。
JP3254477A 1991-09-06 1991-09-06 文字列検索方式 Pending JPH0567157A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3254477A JPH0567157A (ja) 1991-09-06 1991-09-06 文字列検索方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3254477A JPH0567157A (ja) 1991-09-06 1991-09-06 文字列検索方式

Publications (1)

Publication Number Publication Date
JPH0567157A true JPH0567157A (ja) 1993-03-19

Family

ID=17265594

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3254477A Pending JPH0567157A (ja) 1991-09-06 1991-09-06 文字列検索方式

Country Status (1)

Country Link
JP (1) JPH0567157A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10105574A (ja) * 1996-09-27 1998-04-24 Hitachi Software Eng Co Ltd 配列データ類似度演算装置
JP2001125916A (ja) * 1999-10-28 2001-05-11 Fujitsu Ltd 情報処理装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10105574A (ja) * 1996-09-27 1998-04-24 Hitachi Software Eng Co Ltd 配列データ類似度演算装置
JP2001125916A (ja) * 1999-10-28 2001-05-11 Fujitsu Ltd 情報処理装置

Similar Documents

Publication Publication Date Title
JPH0567157A (ja) 文字列検索方式
JP3253657B2 (ja) 文書検索方法
JP3498635B2 (ja) 情報検索方法及びその装置並びにコンピュータ可読記録媒体
JPH08235204A (ja) 文書検索方法及び装置
JPH1021192A (ja) 操作抽出方式およびマクロ作成方式
JPH01297768A (ja) 文書処理装置
JP3031170B2 (ja) かな漢字変換システム
JPH05233696A (ja) データベース検索方法
JPH07287713A (ja) 情報検索装置
JPH09265472A (ja) 画像データベースシステム
JPH07129554A (ja) 文書処理装置
JPH06124186A (ja) 文書データ表示装置および文書データ表示方法
JPH0520323A (ja) 文字列変換装置
JPH0696129A (ja) 情報処理装置
JPH07129446A (ja) データベースアクセス方法
JP2004252583A (ja) データ作成装置、文字コード構造及び記録媒体
JPS62282364A (ja) 文字列検索方式
JPS607582A (ja) 文字読取り装置
JPH0573627A (ja) 画像検索装置
JPS62134765A (ja) 漢和辞書の電子検索方法
JPH06149889A (ja) 電子ファイリングシステム
JPH03132862A (ja) 特殊文字群案内方式
JPH0869455A (ja) 文書検索方法,文書検索装置及び文書記憶装置
JPH05314177A (ja) データベース検索方法
JPH09179869A (ja) キーワード変換装置