JPH0358137A - 複数文字系に対する文字認織方式 - Google Patents

複数文字系に対する文字認織方式

Info

Publication number
JPH0358137A
JPH0358137A JP19529189A JP19529189A JPH0358137A JP H0358137 A JPH0358137 A JP H0358137A JP 19529189 A JP19529189 A JP 19529189A JP 19529189 A JP19529189 A JP 19529189A JP H0358137 A JPH0358137 A JP H0358137A
Authority
JP
Japan
Prior art keywords
character
systems
word
attribute table
attribute
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP19529189A
Other languages
English (en)
Inventor
Akira Nakada
章 中田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP19529189A priority Critical patent/JPH0358137A/ja
Publication of JPH0358137A publication Critical patent/JPH0358137A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Devices For Executing Special Programs (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [[要〕 複数文字系の原始プログラムを人力対象とする複数文字
系の文字認識方式に関し、 同じモジュールにより複数の文字系を処理できるように
することを目的とし、 複数の文字種毎に設けられた文字の属性が記録された文
字属性テーブルと、該文字属性テーブルを入力文字系に
応じて切換える制御モジュールと、翻訳言語の規則に従
い、文字列を区切る語分解部とにより構戊され、前記制
御モジュールか翻訳対象原始プログラムの文字系を判定
して、その文字系に合った文字属性テーブルを選択し、
選択した文字属性テーブルを語分解部に受け渡すことに
より、同一の語分解部により複数の文字系を処理するよ
うに構成する。
[産業上の利用分野] 本発明は複数文字系の原始プログラムを人力対象とする
複数文字系の文字認識方式に関し、更に詳しくは複数文
字系の原始プログラムを人力対象とするコンパイラにお
ける複数文字系の文字認識方式に関する。
近年のコンピュータシステムは、多用なシステムの導入
に伴い、複数の文字系(例えばEBCDIC系,ASC
Ii系等)が導入されてきている。
これにより、コンパイラでもそれぞれの文字系の原始プ
ログラムを処理することが必要となってきている。この
ためには、コンパイラが各文字系に対応した文字を認識
する必要がある。
[従来の技術コ 従来のコンパイラで複数の文字系を処理する場合、第6
図に示すように、文字系の異なる原始プログラム1毎に
文字認識モジュール2を用意し、当該モジュール2内に
認識すべき文字の値をテーブルとして格納していた。そ
して、原始プログラム1から読出した文字の値をモジュ
ール2内のテーブルと比較して文字認識を行っていた。
[発明が解決しようとする課題] 従って、従来方式によれば翻訳対象となる文字系が複数
種ある場合には、モジュール内のテープルの値をそれぞ
れの文字系に合わせたモジュールを文字系の数たけ準備
しておく必要があり、繁椎なものとなっていた。
本発明はこのような課題に鑑みてなされたものであって
、同じモジュールにより複数の文字系を処理できるよう
にすることができる複数文字系に対する文字認識方式を
提供することを目的としている。
[課題を解決するための手段] 第1図は本発明方式の原理ブロック図である。
図において、10は複数の文字種毎に設けられた文字の
属性(例えば英字,数字,空白等の区別をいう)が記録
された文字属性テーブル、11はこれら文字属性テーブ
ル10を入力文字系に応じて切換える制御モジュール、
12は翻訳言語の規則に従い、文字列を区切る語分解部
である。
[作用] 認識すべき文字の値を語分角q部12の中には保持せず
、認識すべき属性に従って処理するようにし、文字の値
とその文字の属性との対応は文字属性テーブル10に保
持しておく。語分解部12では、1文字を読み込んだ直
後に文字属性テーブルlOを参照し、文字属性を得て、
文字認識の処理を行うようにする。
従って、複数の文字系を処理する場合には、語分解部1
2の処理が文字属性テーブル10にのみ依存するように
なるため、制御モジュール11で文字属性テーブル10
を切換えることにより、同じ語分解部12で複数文字系
の文字の認識を行うことが可能となる。
[実施例] 以下、図面を参照して本発明の実施例を詳細に説明する
第2図は本発明の一実施例を示すブロック図である。第
1図と同一のものは、同一の符号を付して示す。図は、
EBCD I C文字系とASCII系の両文字系のC
OBOL原始プログラムを認識する場合を示している。
文字属性テーブルlo中の▼し▼,lv”▼,▼A▼,
▼B▼,▼1▼,▼2▼は入力する文字を示している。
これら文字の直後の(X▼・・・▼)はそれぞれの文字
系での16進で示した文字の値を示している。例えば、
EBCDIC系での▼A▼はXvC1▼となり、ASC
II系での同じ▼A▼はX▼41▼となり、値が異なっ
ている。
次の▼空白▼,▼引用符▼,▼数字▼,▼英字▼は、語
分解部12で認識すべき文字の属性である。これら属性
は、1バイトの値として文字属性テーブル10内に保持
されている。つまり、文字属性テー ブル10は、文字
の値をインデックスとして参照すると、文字属性が得ら
れるように各文字系毎のテーブルとなっている。語分角
q部12は、文字属性に従い文字列を認識するようにし
、文字の値を参照して処理することはないようにする。
今、例として文字列▼A−”B″U1▼をcoBOLの
文法に従って解析する場合を考える。この例では、人力
文字列をEBCDICで表現すると、XVC1407F
C27F40FIVとナリ、ASCIIで表現すると、 X▼4 1 202242222031▼となる。語分
解部12にはこのような表現で文字列が入力される。例
の場合、分離符として▼1▼及び▼”▼のみを考え、数
字定数として小数はないものとし、引用符は文字定数内
には記述できないものとすると、語分解部12の処理論
理は第3図に示すようなものとなる。以下、第3図につ
いて説明する。
先ず原始プログラムから文字を人力する(S1)。ここ
で、図中で示される▼GETCHR▼は人力対象となる
次の1字を読込み、その文字の値に対応する文字属性を
通知するシーケンスをいう。
文字属性を通知するために参照するのが、制御モジュー
ル11で切換えられて渡される文字属性テーブル10で
ある。次に、その人力した文字が英字かどうかチェック
する(S2)。ここで、文字が英字かどうかのチェック
は、制御モジュール11によってセレクトされた文字属
性テーブル10を参照することにより判定することがで
きる。英字と判定されたら、次に次の文字を入力し(s
3)、分離符であるかどうかチェックする(s4)。
分離符であった時には、入力した文字列は終了している
ことを示すから、利用者語として出力する。分離符でな
い場合には、まだ文字列が続くので、文字列を追加し(
S5)、再度文字を人力する(S3)。以上のシーケン
スを文字列が分離符で区切られるまで続ける。
次に、S2で人力した文字が英字でない場合、人力した
文字が数字かどうかチェックする(s6)。ここで、文
字が英字かどうかのチェックは、制御モジュール11に
よってセレクトされた文字属性テーブル1−0を参照す
ることにより判定することができる。数字と判定された
ら、次に次の文字を人力し(S7)、分離符であるかど
うかチェックする(S8)。
分離符であった時には、入力した文字列は終了している
ことを示すから、数字定数として出力する。分離符でな
い場合には、まだ文字列が続くので、文字列を追加し(
S9)、再度文字を入力する(S7)。以上のシーケン
スを文字列が分離符で区切られるまで続ける。
次に、S6で入力した文字が数字でない場合、人力した
文字が引用符であるかどうかチェックする(S 1 0
)。ここで、文字が引用符かどうかのチェックは、制御
モジュール11によってセレクトされた文字属性テーブ
ル10を参照することにより判定することができる。引
用符と判定されたら、次に次の文字を人力し(Sll)
、分離符であるかどうかチェックする(S 1 2)。
分離符であった時には、入力した文字列は終了している
ことを示すから、文字定数として出力する。分離符でな
い場合には、まだ文字列が続くので、文字列を追加し(
813)、再度文字を入力する(Sll)。以上のシー
ケンスを文字列が分離符で区切られるまで続ける。
次に、SIOで引用符でなかった時、分離符であるかど
うかチェックし(S14)、そうであった場合には、文
字列の頭が分離符であったことになり、分離符▼−▼と
して出力する。s1oで分離符でなかった場合には、文
字列の終了であるかどうかチェックし(S15)、そう
であった場合には、動作を終了し、そうでなかった場合
には、S1に戻り、新たな文字の人力を行う。
第4図はEBCDIC系の▼GETcHR▼の処理論理
を示す図である。原始プログラムから▼ALJ″B″U
1▼なる文字列を1字ずつ人刀する。
人力した文字について、文字属性テーブル1oを参照し
、▼A▼は英字.▼−▼は空白というようにつぎつぎに
その属性を調べて文字属性を通知する。ここで、▼A▼
は英字,▼一▼は空白というように文字の属性を調べて
いくが、この結果は文字系に依存しないことが重要であ
る。
第5図はAscII系の▼GETcHR▼の処理結果を
示す図である。第4図のEBCDIC系の場合と同様、
▼A▼は英字,▼0▼は空白というように処理結果が文
字系に依存していないことがわかる。
つまり、▼GETCHR▼では、入力文字の値に従い、
文字属性テーブルを参照し、人力文字に対応する文字属
性を通知し、語分解部12では、文字の値でなく、▼G
ETCHR▼が通知する文字属性に従い処理する。語分
解部12の処理は、文字の値ではなく、文字属性に依存
する。従って、文字属性テーブル10を入力原始プログ
ラムの文字系に置換するだけで、複数の文字系に対する
処理が可能となる。
上述の説明では、文字系としてEBCDIC系とASC
II系を例にとった。しかしながら、本発明はこれに限
るものではなく、あらゆる種類の文字系に適用すること
ができる。
[発明の効果] 以上、詳細に説明したように、本発明によれば文字系毎
にその属性を記録した文字属性テーブルを予め準備して
おくことにより、原始プログラムの人力時には、対応す
る文字属性テーブルを用いて語分解部が人力文字の属性
を認識するように構成することにより、同じモジュール
により複数の文字系を処理できるようにすることができ
る。
【図面の簡単な説明】
第1図は本発明方式の原理ブロック図、第2図は本発明
の一実施例を示すブロック図、第3図は語分解部の処理
論理を示すフローチャート、 第4図はEBCDIC系の▼GETCHR▼の処理論理
を示す図、 第5図はASCII系の▼GETCHR▼の処理結果を
示す図、 第6図は従来方式の説明図である。 第1図において、 10は文字属性テーブル、 11は制御モジュール、 12は語分解部である。

Claims (1)

  1. 【特許請求の範囲】 複数の文字種毎に設けられた文字の属性が記録された文
    字属性テーブル(10)と、 該文字属性テーブル(10)を入力文字系に応じて切換
    える制御モジュール(11)と、 翻訳言語の規則に従い、文字列を区切る語分解部(12
    )とにより構成され、 前記制御モジュール(11)が翻訳対象原始プログラム
    の文字系を判定して、その文字系に合った文字属性テー
    ブル(10)を選択し、 選択した文字属性テーブル(10)を語分解部(12)
    に受け渡すことにより、同一の語分解部により複数の文
    字系を処理するように構成したことを特徴とする複数文
    字系に対する文字認識方式。
JP19529189A 1989-07-26 1989-07-26 複数文字系に対する文字認織方式 Pending JPH0358137A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP19529189A JPH0358137A (ja) 1989-07-26 1989-07-26 複数文字系に対する文字認織方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP19529189A JPH0358137A (ja) 1989-07-26 1989-07-26 複数文字系に対する文字認織方式

Publications (1)

Publication Number Publication Date
JPH0358137A true JPH0358137A (ja) 1991-03-13

Family

ID=16338711

Family Applications (1)

Application Number Title Priority Date Filing Date
JP19529189A Pending JPH0358137A (ja) 1989-07-26 1989-07-26 複数文字系に対する文字認織方式

Country Status (1)

Country Link
JP (1) JPH0358137A (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6488741A (en) * 1987-09-30 1989-04-03 Toshiba Corp Multi-purpose code converting system

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6488741A (en) * 1987-09-30 1989-04-03 Toshiba Corp Multi-purpose code converting system

Similar Documents

Publication Publication Date Title
JP2726568B2 (ja) 文字認識方法及び装置
EP0645720B1 (en) Dictionary creation supporting system
JPH0567144A (ja) 前編集支援方法およびその装置
US5283737A (en) Mechanism for generating linguistic expressions based on synonyms and rules derived from examples
JPH0358137A (ja) 複数文字系に対する文字認織方式
JP2001137788A (ja) 地名表記辞書作成方法および地名表記辞書作成装置
JPH0877196A (ja) 文書情報抽出装置
JPS59736A (ja) 構文解析方式
JPH0743728B2 (ja) 要約文生成方式
JPH05282360A (ja) 多国語入力装置
JPH05143351A (ja) 原始プログラム比較方式
JP2875678B2 (ja) 文字認識結果の後処理方法
JPH02219176A (ja) 文字列検索方式
JPH0340033A (ja) 呼び出し元のコード系認識処理方式
KR20230029256A (ko) 한글 문자열 검색 방법 및 이의 수행하기 위한 시스템
JPH03164834A (ja) プログラミング言語間相互変換方式
JPS63140339A (ja) バ−ジヨン識別予約語管理方式
JPH0546370A (ja) プログラム生成装置
WO1997007452A1 (en) Programmable compiler
JPH08297579A (ja) テキストデータにおける区切り語処理方式
JPH05334062A (ja) 論理記述差分抽出方式
JPS6266371A (ja) テキスト分離型学習システム
JPH04153880A (ja) 文字列の部分列抽出処理方式
JPH04241672A (ja) 文字列検索方式
JPH03177921A (ja) ファイル比較方式