JPH02257276A - 半角・全角文字識別方式 - Google Patents

半角・全角文字識別方式

Info

Publication number
JPH02257276A
JPH02257276A JP1032449A JP3244989A JPH02257276A JP H02257276 A JPH02257276 A JP H02257276A JP 1032449 A JP1032449 A JP 1032449A JP 3244989 A JP3244989 A JP 3244989A JP H02257276 A JPH02257276 A JP H02257276A
Authority
JP
Japan
Prior art keywords
character
code
byte
width
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1032449A
Other languages
English (en)
Other versions
JP2629040B2 (ja
Inventor
Kiyoshi Watanabe
清 渡辺
Yoko Shiraishi
陽子 白石
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KANSAI PANAFUAKOMU KK
PFU Ltd
Original Assignee
KANSAI PANAFUAKOMU KK
PFU Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KANSAI PANAFUAKOMU KK, PFU Ltd filed Critical KANSAI PANAFUAKOMU KK
Priority to JP1032449A priority Critical patent/JP2629040B2/ja
Publication of JPH02257276A publication Critical patent/JPH02257276A/ja
Application granted granted Critical
Publication of JP2629040B2 publication Critical patent/JP2629040B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [概要1 半角文字と全角文字が混在する日本語処理システムにお
ける半角・全角文字識別方式に関し、半角文字と全角文
字を制御コードを用いることな(容易に識別することが
できる日本語処理システムを提供することを目的とし、 1バイトの半角文字のコードを所定数値以下のビット構
成のコードに割当て、2バイトの全角文字の上位バイト
のコードを半角文字の数値より大きい値のコードに割当
てるコード発生部を備え、文字コードを処理する文字処
理部に文字識別手段を備え、文字識別手段は、入力され
た文字コードの1バイトの数値を判別し、所定数値以下
の場合当該1バイトを半角文字と識別し、所定数値より
大きい時は当該1バイトと後続する1バイトとを組み合
わせた2バイトを全角文字と識別するよう構成する。
[産業上の利用分野1 本発明は半角文字と全角文字が混在する日本語処理シス
テムにおける半角・全角文字識別方式に関する。
近年、情報処理システム例えば、給与管理、在庫管理な
どを行う事務処理システムや、日本語文書作成システム
において、アルファベット・数字・カナ文字を表す半角
文字と漢字や図形・記号などを表す全角文字を混在して
表現することが普通に行われており、全・半角混在文字
の半角文字と全角文字をいかに容易に識別するかが日本
語処理全体の構成、処理性能、内部データ量を決める上
で重大な要素となっている。
[従来の技術] 従来技術を第6図乃至第9図を用いて説明する。
第6図は従来のJIS (日本工業規格)により定めら
れた、コード体系を示し、第7図はその中の半角文字コ
ード体系図、第8図は従来の別のコード体系を示す図、
第9図は制御コードを使用した文字及び文字列を示す図
である。
従来、文字の中で、アルファベット、数字、カナ文字等
の半角文字を表すためにJIS8単位コード系を用い、
漢字、記号1図形などの全角文字を表すために1文字が
2バイト(1バイト=8ビツト)のJIS6226コー
ド系が使用されている。
第6図には、上位バイト(8ビツト)を16進数(4ビ
ツト)2桁の数字で表した目盛により縦軸方向に表示し
、下位バイト(8ビツト)を同様に16進数2桁の数字
で表した目盛により横軸方向に表示しており、前記のJ
IS6226コード系により使用される2バイトの文字
は上位バイト(第1バイト)と下位バイト(第2バイト
)が共に、16進数の21〜7Eの領域のコードを使用
し、第6図に斜線が施された領域であり、これを(21
21〜7E7E)+6と表示する。
一方、JIS8単位の半角文字(アルファベット、数字
、カナ文字)のコードは、8ビツト構成であるため、J
IS6226コード系のように平面として表示できない
ので、その上位バイト(8ビツト)の縦軸に並行する直
線上に表現すると、第6図の右端に示すように表示され
る。すなわち、8ビツトを16進数2桁で表すと、00
〜7Fで半角、英数字を表し、AO〜DFで半角カナ文
字を表す、00〜7Fのうち事務処理で通常使用される
アルファベット、記号の範囲は(20)、−〜(7F)
16である。
第7図はこのJIS8単位コードを、上位4ビツトを表
す縦軸の16進数の目盛と、下位4ビツトを表す横軸の
16進数の目盛上で表現したもので、(20)、6〜(
7F)l^と(AO)16〜(DF)+aの各使用領域
を表わす。
この内容によれば、全角文字の上位バイトと半角文字は
明らかに同じコードを使用して、重複するため、このコ
ード体系によっては半角文字と全角文字を区別すること
ができない。
そこで、全角文字コードにある定数を加えることにより
半角文字コードとの重複を回避するコード系(シフトJ
IS)が考えられている。このコードは、第6図に示す
ように上位バイトのコードとして8単位コード系で使用
しない領域(81〜9FおよびEO〜FC)のコードを
割り当てる。
ところが、この方式ではJISの第1水準、第2水準漢
字及びJIS非漢字(全6802文字)の表現は可能と
なるが、それ以上の文字種を表現することができない。
JIS6226コード系を変形した従来の別のシード体
系を第8図に示す。
この体系では、JIS6226コードの上位バイトと下
位バイトのそれぞれに一定数(16進数の80)を加算
して、領域(A I A 1〜FEFE)9.を使用す
るとともに、多数の漢字を割当てるための拡張文字領域
(ユーザが定義して使用する文字領域も含む)を設け、
図に示すように、拡張領域として(41A l =A 
OF E) +h  を使用する。そして、半角文字の
領域としては、JIS8単位と同様に00〜7Fで半角
、英数字を表し、AO〜DFで半角カナ文字を表す。
しかし、この従来の別の方式によっても、JIS8単位
の半角文字のコードと全角文字の第1バイトのコードが
重複する点に変わりがない。
このため、JIS6226コード系の場合や、シフトJ
ISにおいて規定された文字種以上の文字を使用する場
合は、全角文字列の開始と終了時に、半角文字コードと
重複しない制御コードを付加し、半角文字と全角文字を
区別する方式が従来とられている。
制御コードを使用した時の、文字と文字列のコード長の
説明図を第9図に示す0図において、半角文字′″A゛
は1バイトで表し、全角文字1花子゛はそれぞれ2バイ
トで表されるが、前後に1バイトの全角開始制御コード
(CS)と全角終了iuiコード(CE)が付加され、
合計6バイトとなる。そして、文例としてrABあい1
2■7」という半角客字(5文字)と全角文字(3文字
)が混在した文字列を表現すると、制御コードCS、C
Eが何個も使用されるので、合計15バイトになっ、て
しまう。
(発明が解決しようとする課R] 上記したように、半角文字と全角文字が混在した場合、
従来は余分に制御コードを付加して半角・全角の識別を
行うため、全角/半角の切替えが頻繁に発生するので処
理時間が余分にかかるだけでなく、制御コードが増える
ためにデータ量の増大を招いてシステム性能を悪化させ
るという問題があった。
本発明は、半角文字と全角文字を制御コードを用いるこ
となく容易に識別することができる日本語処理システム
を提供することを目的とする。
〔課題を解決するための手段] 本発明による基本構成図を第1図に示し、本発明の原理
説明図を第2図に示す。
第1図において、10はコード発生部、11は文字処理
部、12は文字識別手段である。
第2図の原理説明図には、本発明の半角・全角文字識別
方式において使用する文字コードの領域とコード表現を
示し、以下にこの第2図について説明する。
第2図A、に示すように、JIS6226コード系で使
用する文字コードに対して一定の数値を加算して、縦軸
(第1バイト)、横軸(第2バイト)ともに16進数A
O〜FEで囲む領域(AOAO〜FEFE)+6のコー
ドを使用すると共に、それ以外の多数の漢字や、ユーザ
が定義する文字頭載のために縦軸の16進数AO〜FB
、横軸の16進数41〜9Fで囲まれる領域(AO41
〜FB9F)tiを使用する。このように、全角文字に
ついては、第8図に示す従来の別の方式のコード体系を
変更したものである。
一方、JIS8単位符号で割り当てられている半角文字
の英数字、カナ文字については、8ビツトコードを16
進数2桁の数字で表すと、00〜9Fの範囲のコードを
使用し、第2図A、の右端に示す直線に矢印を付して示
す範囲である。この半角文字のコードは、従来の第8図
に示す英数字記号の範囲の文字コードから(20)+6
を引いたものと、カナ文字のコードから(4G)+6を
引いたものを組み合わせて構成され、第2図のB、にそ
の8ビツトコードを上位デジット(4ビツト)と下位デ
ジット(4ビツト)による座標により表される。
第2図から分かるように、本発明で使用するコード体系
の場合、半角文字は、1バイト(8ビツト)である文字
コードの値が00〜9F(16進数)の範囲であり、全
角文字は2バイトの文字コードの内の上位バイトのコー
ドの値がAO〜FEの範囲である。
第2図A、に示す、JIS622Bコード系の全角文字
の領域は、第8図として示す従来の別の方式のコード系
の場合と同じ領域であり、第8図に示す拡張領域として
使用する領域の文字は、第2図に示す領域(AO41〜
F89F)taである点で異なるが、領域内に収容され
る文字種の数は同一である。従って、第8図の方式によ
り拡張領域(41AO〜9FFB)l&に割当てられた
文字コードの2バイトの上位バイト、下位バイトの順番
を反転することにより、第2図A、に示す領域(A04
1〜FE9F)t*のコードに変換される。
本発明は、半角文字か全角文字かを先頭の1バイトのコ
ードにより識別して、識別結果に応じて半角文字または
全角文字の処理を行うものである。
[作用] 第1図において、入力装置から入力されたコードまたは
、JIS規格によるコードはコード発生部10において
、第2図A、に示す本発明のコードを発生する。この場
合、JIS規格による入力装置から人力されたコードは
所定の数値を加算してシフトし、8単位符号に対しても
同様の加算または減算を施す、コード発生部10から発
生した文字は第1図の上部にA、Bとして示すようなコ
ード形式であり、その先頭バイト(半角文字は1バイト
だけ)のコードは第2図A、に示す数値の範囲に割当て
られている。
このようにして、第2図A、に示すコード体系に従った
コードは文字処理部11に入力し、指定された各種の処
理、削除、挿入等が行われる。
文字処理部11内には文字識別手段12が備えられ、コ
ード発生部から入力されたコードは2バイトのコード保
持手段121に格納され、先頭の1バイトについて判別
手段122により判別する。
判別は1バイトのコードを8ビツトの数値として扱い、
所定の値(第2図への16進数“AO′)と比較して、
AO未満の場合は半角文字コードと識別し、その1バイ
トを取り出して文字処理を行い、それ以外(AO以上)
の場合は全角文字と識別してコード保持手段121の2
バイト(識別したバイトが上位バイト後続の1バイトを
下位バイトとして)を取り出して文字処理を行う。
この本発明によるコードにより処理した結果は、そのコ
ードのまま記憶装置(図示しない)に格納され、JIS
規格の出力装置に出力する場合は、元のコードに変換す
ることにより従来の入・出力装置を使用することができ
る。
このように、本発明は常に半角文字を1バイト、全角文
字を2バイトで表すため、表示や印刷時の文字長と実際
のデータ長が一致してずれることがないので処理が簡便
になり、制御コードを用いないのでデータの記憶・処理
するための資源を節約することができる。
なお、第8図に示す従来の別の方式のコードが人力され
ることが分かっている場合、そのコードが拡張領域の全
角文字のコードであることが識別された場合、その2バ
イトのコードの上位と下位を置き換えることにより本発
明のコードに変換することができ、拡張領域でないJI
S規格の領域(A I A 1〜FEFE)+4の全角
文字の場合はそのコードがそのまま本発明のコードとな
る。
[実施例] 第3図は本発明の実施例構成図、第4図は文字処理のフ
ロー図、第5図は本発明と従来例の処理の差異を示す図
である。
第3図には本発明によるコード系を用いた日本語処理シ
ステムの実施例構成が示されている。
図の30はJIS規格の文字列を入力するキーボード等
の入力装置、31は入力したJIS規格コードを本発明
によるコード(以下、本方式コードという)に変換する
変換処理部(第1図のコード発生部に対応)、32は本
方式のコードに変換されたコードデータを保存する記憶
装置、33は本方式のコードの文字列に挿入、削除等の
編集を行うデータ編集部(・第1図°の文字処理部に対
応)、34は本方式コードからJIS規格コードに復元
する復元処理部、35はJIS規格の文字列を表示する
表示装置、36はJIS規格文字列を印字する印刷装置
を表す。
人力装置30によって入力されたJIS規格文字列は、
変換処理部31によって本方式コードに変換される。デ
ータ編集部33は、文字列の挿入・削除等の編集を行う
が、その際に半角文字と全角文字の識別を行う。
文字処理のフローを第4図により説明すると、識別動作
が開始すると、文字列から1バイトを取り出しくステッ
プ40)、その1バイトの値が(AO)+iより小さい
か判別される(ステンプ4l)、この判別の結果YES
である場合は、当該1バイトを半角文字と識別しくステ
ップ42)、Noと判別された場合は当該判別した1バ
イトと文字列の次の1バイトを含めて全角文字と識別す
る(ステップ43)、識別結果は&l集処理において利
用される。このように1バイトを判別するだけなので高
速に実行される。
編集が終了した時に、記憶装置32に格納する場合は本
方式コードで保存することにより制御コードを用いた場
合に比べて少ないデータ量となる。
また、JIS規格コードを用いる表示装置35や、印刷
装置36に日本語文字を表示したり、印字により出力す
る場合は、復元処理部34においてデータ編集部33や
、記憶装置32から取り出した本方式コードによる文字
コードをJIS規格コードに復元(変換)して、表示装
置35または印刷装置36に出力する。
第5図は、本発明と従来例の処理の違いを示す図である
第5図のa、は本発明による処理を示し、半角文字と全
角文字が混在している文字列「A全1角文ア字」に対し
て、4桁目(4バイト目)から2桁分を削除する場合(
半角文字1文字が1桁、全角文字1文字で2桁分数える
)、削除開始桁および終了桁が、それぞれ全角文字の下
位バイト及び上位バイトの時は、その前の桁及び次の桁
を含めて削除する必要がある。従って、常に半角文字か
全角文字かの識別を行うが、本発明の識別方式により識
別処理を高速に行うことができる。
また、削除した後、削除文字の前に位置する文字列(図
の場合A全”)と後に位置する文字列〈図の場合“文ア
字”)を結合しなければならないが、本発明のコード系
では単に削除した桁数分(図の場合は3桁)だけ後ろの
文字列を前に移動するだけでよく、結合処理が容易であ
る。
第5図のす、は、同様の削除処理を制御コードを使用す
る従来方式で実行した場合の例である。
従来は、制御コードを用いた場合、現在の文字が半角文
字であるか全角文字であるかを別に設けた全角文字モー
ドフラグ(フリツプフロップにより構成〉を参照して判
断しなければならない、但し、全角文字モードフラグは
全角開始制御コードが現れた時にオン、全角終了制御コ
ードが現れた時にオフにされる。また、削除後の文字列
の結合処理においても、削除文字の直前の文字と直後の
文字(図の例では“全”と“文”)を比較して共に全角
文字ならば両者の間に存在する不要な制御コード(図の
例では“全”の後の全角終了1#制御コード)を削除す
る等の複雑な処理が必要となる。
このように、本発明では従来例で必要とされた複雑な処
理を不要にし、高速処理を実現することができる。
〔発明の効果] 本発明によれば、JIS規格の全角文字に拡張文字を加
えた豊富な文字種を扱いながら、半角文字と全角文字の
識別を簡単に行うことができるばかりでなく、制御コー
ドを使用しないので、半角文字と全角文字の切替えが頻
繁に発生するような文字列を処理する場合でも、データ
量が増えることなく、常に表示・印刷字の文字長とデー
タ長が一致する。これにより、メモリ資源の節約と日本
語処理性能の向上を計ることができる。
【図面の簡単な説明】 第1図は本発明の基本構成図、第2図は本発明の原理説
明図、第3図は本発明の実施例構成図、第4図は文字処
理のフロー図、第5図は本発明と従来例の処理の違いを
示す図、第6図は従来のJIsによるコード体系を示す
図、第7図は従来の半角文字コード体系図、第8図は従
来の別のコード体系を示す図、第9図は制御コードを使
用した文字及び文字列を示す図である。 第4図中、 10:コード発生部 ll:文字処理部 12:文字識別手段 特許出願人 株式会社ビーエフニー(外1名)復代理人
弁理士   穂坂 和雄 (第1バイト)   (第2バイト) ↓ (AO)+s〜(FE)+6 本発明の基本構夏図 第 図 バ込と\1懐12青う 廿 佃

Claims (1)

  1. 【特許請求の範囲】 半角文字と全角文字が混在する日本語処理システムにお
    ける半角・全角文字識別方式において、1バイトの半角
    文字のコードを所定数値以下のビット構成のコードに割
    当て、2バイトの全角文字の上位バイトのコードを半角
    文字の数値より大きい値のコードに割当てるコード発生
    部(10)を備え、 文字コードを処理する文字処理部(11)に文字識別手
    段(12)を備え、 文字識別手段(12)は、入力された文字コードの1バ
    イトの数値を判別し、所定数値以下の場合当該1バイト
    を半角文字と識別し、所定数値より大きい時は当該1バ
    イトと後続する1バイトとを組み合わせた2バイトを全
    角文字として識別することを特徴とする半角・全角文字
    識別方式。
JP1032449A 1989-02-10 1989-02-10 日本語処理システム Expired - Lifetime JP2629040B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1032449A JP2629040B2 (ja) 1989-02-10 1989-02-10 日本語処理システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1032449A JP2629040B2 (ja) 1989-02-10 1989-02-10 日本語処理システム

Publications (2)

Publication Number Publication Date
JPH02257276A true JPH02257276A (ja) 1990-10-18
JP2629040B2 JP2629040B2 (ja) 1997-07-09

Family

ID=12359275

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1032449A Expired - Lifetime JP2629040B2 (ja) 1989-02-10 1989-02-10 日本語処理システム

Country Status (1)

Country Link
JP (1) JP2629040B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07319855A (ja) * 1994-05-25 1995-12-08 Nippon Denki Joho Service Kk 文字コード表示方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56145425A (en) * 1980-04-15 1981-11-12 Fujitsu Ltd Different-byte controlling system

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56145425A (en) * 1980-04-15 1981-11-12 Fujitsu Ltd Different-byte controlling system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07319855A (ja) * 1994-05-25 1995-12-08 Nippon Denki Joho Service Kk 文字コード表示方法

Also Published As

Publication number Publication date
JP2629040B2 (ja) 1997-07-09

Similar Documents

Publication Publication Date Title
US4761761A (en) Multitype characters processing method and terminal device with multiple display buffers
JPH02257276A (ja) 半角・全角文字識別方式
JP2000227790A (ja) 表示装置、および、そのプログラムが記録された記録媒体
JPH0128975B2 (ja)
JP2697317B2 (ja) ハングル文字入力装置
JP2634926B2 (ja) かな漢字変換装置
JPS5928190A (ja) 文字パタ−ン発生方式
KR20070001765A (ko) 메모리 절약형 문자 표시 시스템 및 그 표시 방법
JPH0365588B2 (ja)
JPS62211690A (ja) 文字表示方式
JPH03167660A (ja) 文字処理装置及びその方法
KR860002030B1 (ko) 라인 프린터의 한글 조합 장치
JPS5972511A (ja) 一般コ−ドによる特殊コ−ド入力装置
JPH047734A (ja) 文字処理装置
JPS63273174A (ja) 図形混じり文書ファイルの作成方法
JPS59184941A (ja) 漢字コ−ド変換方法
JPH0352102B2 (ja)
JPH0628062B2 (ja) 文字処理装置及びその方法
JPH06187371A (ja) 圧縮地名データの格納方法及び読み出し方法
JPH01266660A (ja) 文字処理装置
JPH05143609A (ja) 株価情報表示装置および株価情報表示装置のための表示内容指定方法
JPH0954674A (ja) コード変換装置
JPH0769916B2 (ja) かな漢字変換装置
JPS63254542A (ja) 混在フイ−ルド制御方式
JPH03141461A (ja) 文書処理方法及び装置