JP2830884B2 - 多重文字コードセットの入出力変換方式 - Google Patents

多重文字コードセットの入出力変換方式

Info

Publication number
JP2830884B2
JP2830884B2 JP4056240A JP5624092A JP2830884B2 JP 2830884 B2 JP2830884 B2 JP 2830884B2 JP 4056240 A JP4056240 A JP 4056240A JP 5624092 A JP5624092 A JP 5624092A JP 2830884 B2 JP2830884 B2 JP 2830884B2
Authority
JP
Japan
Prior art keywords
character code
output
input
register
code string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP4056240A
Other languages
English (en)
Other versions
JPH05216619A (ja
Inventor
雄司 小川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP4056240A priority Critical patent/JP2830884B2/ja
Priority to US08/014,152 priority patent/US5389924A/en
Publication of JPH05216619A publication Critical patent/JPH05216619A/ja
Application granted granted Critical
Publication of JP2830884B2 publication Critical patent/JP2830884B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • G06F40/154Tree transformation for tree-structured or markup documents, e.g. XSLT, XSL-FO or stylesheets

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、複数の異なる文字コー
ドセットが多重に取り扱われる計算機システム(異なる
文字コードセットを持つ計算機間での処理が行われる計
算機システム等)における多重文字コードセットの入出
力変換方式に関する。
【0002】
【従来の技術】近年、計算機による情報処理システム
(計算機システム)の多様化および複雑化に起因して、
通信媒体で接続された複数の計算機を同時に使用して各
々の計算機に処理分担を行わせる分散処理システムが利
用される場合が増加しつつある。
【0003】このような計算機システムでは、今まで顕
在化していなかった問題、すなわち異なる文字コードセ
ットによって表現されるテキストコードを同様なものと
して処理しなくてはならないという問題が発生する。
【0004】例えば、計算機Aでの処理結果をテキスト
ファイルBに出力しそのテキストファイルBの内容を計
算機C(計算機Aとは異なる文字コードセットを持つ計
算機)が処理するといった場合に、計算機Aと計算機C
とではそれぞれ異なる文字コードセットが定義されてい
るので、計算機Cは直接的にテキストファイルBを入力
することができないという問題が発生する。
【0005】従来、このような問題に対処するための多
重文字コードセットの入出力変換方式では、テキストフ
ァイルを出力する計算機または当該テキストファイルを
入力する計算機のいずれかによってあらかじめ文字コー
ドセットの変換を行う必要があった。この変換の結果、
内容が同一で文字コードセットが異なる複数のテキスト
ファイルが存在することになっていた。
【0006】
【発明が解決しようとする課題】上述した従来の多重文
字コードセットの入出力変換方式では、定義されている
文字コードセットの異なる計算機間のテキストファイル
の共有において、両計算機間で直接的にテキストファイ
ルの入出力を行うことができないので、同一の内容のテ
キストファイルをそれぞれの文字コードセットによって
表現した複数のテキストファイルを同時に用意しなくて
はならない(複数のテキストファイルを用意するための
変換が必要になり、複数のテキストファイルのための資
源が必要になる)という欠点があった。
【0007】本発明の目的は、上述の点に鑑み、同一の
内容で文字コードセットが異なるテキストファイルを用
意しなくても複数の異なる文字コードセットが取り扱わ
れる計算機システムを実現することができる多重文字コ
ードセットの入出力変換方式を提供することにある。
【0008】
【課題を解決するための手段】本発明の多重文字コード
セットの入出力変換方式は、各種文字の文字コードが異
なるバイト長で表現されることのある複数の異なる文字
コードセットの入力文字コード列および出力文字コード
が取り扱われる計算機システムにおいて、1つの文字
コードセットに対して1以上のリードテーブルが存在す
るリードテーブル群,入力文字コード列に係る文字コー
ドセットに対応するリードテーブルへのポインタが設定
されるリードテーブルレジスタ,このリードテーブルレ
ジスタでポイントされるリードテーブルを参照して前記
入力文字コード列の文字コードを内部文字コードに変換
する複数の入力処理からなる入力処理群,および前記入
力文字コード列に係る文字コードセット毎に前記リード
テーブルレジスタに該当するリードテーブルへのポイン
タを設定するとともに前記入力処理群中の入力処理を選
択することによって前記入力文字コード列を各種文字の
文字コードが同じバイト長で表現される内部文字コード
セットの内部文字コード列に変換する入力変換部を含む
リードテーブル切換え手段と、1つの文字コードセット
に対して1以上のプリントテーブルが存在するプリント
テーブル群,出力文字コード列に係る文字コードセット
に対応するプリントテーブルへのポインタが設定される
プリントテーブルレジスタ,このプリントテーブルレジ
スタでポイントされるプリントテーブルを参照して前記
内部文字コード列の文字コードを出力文字コードに変換
する複数の出力処理からなる出力処理群,および前記内
部文字コード列に係る文字コードセット毎に前記プリン
トテーブルレジスタに該当するプリントテーブルへのポ
インタを設定するとともに前記出力処理群中の出力処理
を選択することによって前記内部文字コード列を前記出
力文字コード列に変換する出力変換部を含むプリントテ
ーブル切換え手段とを有する。
【0009】
【作用】本発明の多重文字コードセットの入出力変換方
式では、リードテーブル切換え手段のリードテーブル群
に1つの文字コードセットに対して1以上のリードテー
ブルが存在し、リードテーブルレジスタに入力文字コー
ド列に係る文字コードセットに対応するリードテーブル
へのポインタが設定され、入力処理群がリードテーブル
レジスタでポイントされるリードテーブルを参照して入
力文字コード列の文字コードを内部文字コードに変換す
る複数の入力処理からなり、入力変換部が入力文字コー
ド列に係る文字コードセット毎にリードテーブルレジス
タに該当するリードテーブルへのポインタを設定すると
ともに入力処理群中の入力処理を選択することによって
入力文字コード列を各種文字の文字コードが同じバイト
長で表現される内部文字コードセットの内部文字コード
列に変換する。また、プリントテーブル切換え手段のプ
リントテーブル群に1つの文字コードセットに対して1
以上のプリントテーブルが存在し、プリントテーブルレ
ジスタに出力文字コード列に係る文字コードセットに対
応するプリントテーブルへのポインタが設定され、出力
処理群がプリントテーブルレジスタでポイントされるプ
リントテーブルを参照して内部文字コード列の文字コー
ドを出力文字コードに変換する複数の出力処理からな
り、出力変換部が内部文字コード列に係る文字コードセ
ット毎にプリントテーブルレジスタに該当するプリント
テーブルへのポインタを設定するとともに出力処理群中
の出力処理を選択することによって内部文字コード列を
出力文字コード列に変換する。
【0010】
【実施例】次に、本発明について図面を参照して詳細に
説明する。
【0011】図1は、本発明の多重文字コードセットの
入出力変換方式の一実施例の構成を示すブロック図であ
る。本実施例の多重文字コードセットの入出力変換方式
は、リードテーブル切換え手段1と、プリントテーブル
切換え手段2と、入力文字コード列3と、内部文字コー
ド列4と、出力文字コード列5とを含んで構成されてい
る。なお、本実施例の多重文字コードセットの入出力変
換方式は、複数の異なる文字コードセットを持つ計算機
システムにおけるある計算機において実現されるもので
ある。
【0012】リードテーブル切換え手段1は、入力変換
部6と、RT(Read Table)レジスタ7と、
リードテーブル群8(m(正整数)個のリードテーブル
が存在する)と、入力処理群9とを含んで構成されてい
る。リードテーブル群8には、1つの文字コードセット
に対して1以上のリードテーブルが存在する。
【0013】プリントテーブル切換え手段2は、出力変
換部10と、PT(Print Table)レジスタ
11と、プリントテーブル群12(m個のプリントテー
ブルが存在する)と、出力処理群13とを含んで構成さ
れている。プリントテーブル群12には、1つの文字コ
ードセットに対して1以上のプリントテーブルが存在す
る。
【0014】図2は、文字コードセットの一例(文字コ
ードセットA)を示す図である。
【0015】図3は、内部文字コードセットの一例(本
実施例の多重文字コードセットの入出力変換方式が実現
される計算機の内部文字コードセット)を示す図であ
る。
【0016】図4(a)〜(c)は、リードテーブル群
8中のリードテーブルの具体例を示す図である。
【0017】図5(a)〜(c)は、プリントテーブル
群12中のプリントテーブルの具体例を示す図である。
【0018】図6は、入力変換部6の処理を示す流れ図
である。この処理は、RTレジスタ初期化ステップ61
と、入力終了判定ステップ62と、C設定ステップ63
と、リードテーブル表引きステップ64とからなる。
【0019】図7(a)〜(d)は、文字コードセット
の1つ(文字コードセットA)に関する入力処理の処理
内容を示す流れ図である。この処理は、00およびC出
力ステップ71と、C1設定ステップ72と、Cおよび
C1出力ステップ73と、C設定ステップ74と、00
およびC出力ステップ75と、CおよびC1設定ステッ
プ76と、C1減算ステップ77と、CおよびC1出力
ステップ78とからなる。
【0020】図8(a)〜(c)は、文字コードセット
の1つ(文字コードセットB)に関する入力処理の処理
内容を示す流れ図である。この処理は、C変換ステップ
801と、00およびC出力ステップ802と、Cおよ
びC1設定ステップ803と、KI文字コード列判定ス
テップ804と、RTレジスタ設定ステップ805と、
KO文字コード列判定ステップ806と、RTレジスタ
設定ステップ807と、エラー処理ステップ808と、
C1設定ステップ809と、CおよびC1変換ステップ
810と、CおよびC1出力ステップ811とからな
る。
【0021】図9は、出力変換部9の処理を示す流れ図
である。この処理は、PTレジスタ初期化ステップ91
と、出力終了判定ステップ92と、CおよびC1設定ス
テップ93と、プリントテーブル表引きステップ94と
からなる。
【0022】図10(a)および(b)は、文字コード
セットの1つ(文字コードセットA)に関する出力処理
の処理内容を示す流れ図である。この処理は、C1判定
ステップ101と、8E出力ステップ102と、C1出
力ステップ103と、C1判定ステップ104と、C1
加算ステップ105と、8F出力ステップ106と、C
およびC1出力ステップ107とからなる。
【0023】図11(a)〜(d)は、文字コードセッ
トの1つ(文字コードセットB)に関する出力処理の処
理内容を示す流れ図である。この処理は、C1変換ステ
ップ111と、C1出力ステップ112と、CおよびC
1変換ステップ113と、CおよびC1出力ステップ1
14と、KO文字コード列出力ステップ115と、PT
レジスタ設定ステップ116と、KI文字コード列出力
ステップ117と、PTレジスタ設定ステップ118と
からなる。
【0024】図12(a)〜(c)は、本実施例の多重
文字コードセットの入出力変換方式の具体的な動作を説
明するための図である。
【0025】次に、このように構成された本実施例の多
重文字コードセットの入出力変換方式の動作について説
明する。
【0026】リードテーブル切換え手段1内の入力変換
部6は、テキストファイルから入力文字コード列3を入
力して内部文字コード列4に変換するために、RTレジ
スタ7の指すリードテーブル(あらかじめ用意されてい
るリードテーブル群8中のリードテーブル)を得る。な
お、RTレジスタ7には、入力文字コード列3に係る文
字コードセットに対応するリードテーブルへのポインタ
が設定されている。
【0027】さらに、入力変換部6は、入力文字コード
列3中の文字コードを入力し、その文字コードのコード
値によって当該リードテーブルを表引きして入力処理
(入力処理群9中の入力処理)を得て、その入力処理を
呼び出す。
【0028】呼び出された入力処理は、入力変換部6に
より入力された文字コードを内部文字コード(内部文字
コード列4に係る文字コードセットに適合する文字コー
ド)に変換し、その内部文字コードを内部文字コード列
4に格納する。
【0029】一方、プリントテーブル切換え手段2内の
出力変換部10は、内部文字コード列4を出力文字コー
ド列5に変換してテキストファイルに出力するために、
PTレジスタ11の指すプリントテーブル(あらかじめ
用意されているプリントテーブル群12中のプリントテ
ーブル)を得る。なお、PTレジスタ11には、出力文
字コード列5に係る文字コードセットに対応するプリン
トテーブルへのポインタが設定されている。
【0030】さらに、出力変換部10は、内部文字コー
ド列4中の内部文字コードを入力し、その内部文字コー
ドのコード値によって当該プリントテーブルを表引きし
て出力処理(出力処理群13中の出力処理)を得て、そ
の出力処理を呼び出す。
【0031】呼び出された出力処理は、出力変換部10
により入力された内部文字コードを出力に適切な文字コ
ードセットに適合する文字コードに変換し、その文字コ
ードを出力文字コード列5に格納する。
【0032】次に、図2〜図11を参照して、本実施例
の多重文字コードセットの入出力変換方式の詳細な動作
について説明する。
【0033】今、1バイトが8ビットの計算機におい
て、次の2つの文字コードセットAおよびBを考える。
【0034】図2に示すように、文字コードセットA
は、1文字が1バイト〜3バイトで表現される文字コー
ドセットであり、以下のような文字の分類がなされてい
る。 ASCII文字は1バイトで表現され、そのコード
値は00〜7F(コード値を16進数で表現する)の範
囲で表現される。 漢字文字は2バイトで表現され、第1バイトおよび
第2バイトのコード値はそれぞれ80〜FFの範囲で表
現される。 半角カナ文字は2バイトで表現され、第1バイトの
コード値は8Eであり、第2バイトのコード値は80〜
FFの範囲で表現される。 利用者によって定義される外字文字は3バイトで表
現され、第1バイトのコード値は8Fであり、第2バイ
トおよび第3バイトのコード値はそれぞれ80〜FFの
範囲で表現される。
【0035】文字コードセットBは、1文字が1バイト
で表現される文字と2バイトで表現される文字との2種
類の文字を持つ文字コードセットであり、以下のような
文字の分類がなされている。 ASCII文字は、1バイトで表現される。 漢字文字は、2バイトで表現される。 半角カナ文字は、1バイトで表現される。 外字文字は、2バイトで表現される。 ASCII文字および半角カナ文字(1バイト文
字)と漢字文字および外字文字(2バイト文字)との2
種類の文字を区別するために、1バイト文字の後に2バ
イト文字が現れた場合には「1B2442」という文字
コード列(以下、この文字コード列のことをKI(Ka
nji In)文字コード列という)が挿入され、2バ
イト文字の後に1バイト文字が現れた場合には「1B2
84A」という文字コード列(以下、この文字コード列
のことをKO(Kanji Out)文字コード列とい
う)が挿入される。また、1バイト文字にも2バイト文
字にも、1Bで始まる文字は定義されていない。
【0036】図3に示すように、本実施例の多重文字コ
ードセットの入出力変換方式で適用される内部文字コー
ドセットは、全ての文字が2バイトで表現される文字コ
ードセットであり(文字コードセットAを基本にして定
義されている)、以下のような文字の分類がなされてい
る。 ASCII文字は、第1バイトのコード値が00で
あり、第2バイトのコード値が文字コードセットAのA
SCII文字の第2バイトのコード値で表現される。 漢字文字は、文字コードセットAの漢字文字と同一
である。 半角カナ文字は、第1バイトのコード値が00であ
り、第2バイトのコード値が文字コードセットAの半角
カナ文字の第2バイトのコード値で表現される。 外字文字は、第1バイトが文字コードセットAの外
字文字の第2バイトで表現され、第2バイトが文字コー
ドセットAの外字文字の第3バイトから80を引いたコ
ード値で表現される。
【0037】図4(a)に示すように、文字コードセッ
トAに対応するリードテーブルArtは、第00要素
(要素の番号を16進数で表現する)〜第7F要素に入
力処理Aasciirdへのポインタが設定されてお
り、第8E要素に入力処理Akanardへのポインタ
が設定されており、第8F要素に入力処理Agaiji
rdへのポインタが設定されており、その他の要素に入
力処理Akanjirdへのポインタが設定されてい
る。
【0038】図4(b)に示すように、文字コードセッ
トBに対応するリードテーブルの1つ(1バイト文字の
入力中に使用されるリードテーブルB1rt)は、第1
B要素に入力処理B1brdへのポインタが設定されて
おり、それ以外の要素に入力処理B1rdへのポインタ
が設定されている。
【0039】図4(c)に示すように、文字コードセッ
トBに対応するリードテーブルの1つ(2バイト文字の
入力中に使用されるリードテーブルB2rt)は、第1
B要素に入力処理B1brdへのポインタが設定されて
おり、それ以外の要素に入力処理B2rdへのポインタ
が設定されている。
【0040】図5(a)に示すように、文字コードセッ
トAに対応するプリントテーブルAptは、第00要素
に出力処理A1prへのポインタが設定されており、第
80要素〜第FF要素に出力処理A2prへのポインタ
が設定されている。
【0041】図5(b)に示すように、文字コードセッ
トBに対応するプリントテーブルの1つ(1バイト文字
の出力中に使用されるプリントテーブルB1pt)は、
第00要素に出力処理B1prへのポインタが設定され
ており、第80要素〜第FF要素に出力処理Bto2p
rへのポインタが設定されている。
【0042】図5(c)に示すように、文字コードセッ
トBに対応するプリントテーブルの1つ(2バイト文字
の出力中に使用されるプリントテーブルB2pt)は、
第00要素に出力処理Bto1prへのポインタが設定
されており、第80要素〜第FF要素に出力処理B2p
rへのポインタが設定されている。
【0043】入力変換部6は、次のような処理を行う
(図6参照)。
【0044】RTレジスタ7を初期化する。すなわち、
入力文字コード列3内の文字コード列が文字コードセッ
トAによるものである場合にはRTレジスタ7にリード
テーブルArtへのポインタを設定し、入力文字コード
列3内の文字コード列が文字コードセットBによるもの
である場合にはRTレジスタ7にリードテーブルB1r
tを設定する(ステップ61)。
【0045】入力文字コード列3からの文字コードの入
力が終了するまで(ステップ62)、入力文字コード列
3から1バイトの文字コードを読み込み、レジスタC
(リードテーブル切換え手段1およびプリントテーブル
切換え手段2のためのワークレジスタ。図示せず)にそ
の文字コードを設定し(ステップ63)、RTレジスタ
7の指すリードテーブルをレジスタCの値で表引きして
所定の入力処理を得て、その入力処理を呼び出す(ステ
ップ64)。
【0046】ステップ64で入力処理Aasciird
が呼び出された場合には、入力処理Aasciirdは
次のような処理を行う(図7(a)参照)。すなわち、
第1バイトが00であり第2バイトがレジスタCの値で
ある内部文字コードを内部文字コード列4に設定する
(ステップ71)。
【0047】ステップ64で入力処理Akanjird
が呼び出された場合には、入力処理Akanjirdは
次のような処理を行う(図7(b)参照)。すなわち、
入力文字コード列3から次の1バイトの文字コードを読
み込んでレジスタC1(リードテーブル切換え手段1お
よびプリントテーブル切換え手段2のためのワークレジ
スタ。図示せず)に設定し(ステップ72)、第1バイ
トがレジスタCの値であり第2バイトがレジスタC1の
値である内部文字コードを内部文字コード列4に設定す
る(ステップ73)。
【0048】ステップ64で入力処理Akanardが
呼び出された場合には、入力処理Akanardは次の
ような処理を行う(図7(c)参照)。すなわち、入力
文字コード列3から次の1バイトの文字コードを読み込
んでレジスタCに設定し(ステップ74)、第1バイト
が00であり第2バイトがレジスタCの値である内部文
字コードを内部文字コード列4に設定する(ステップ7
5)。
【0049】ステップ64で入力処理Agaijird
が呼び出された場合には、入力処理Agaijirdは
次のような処理を行う(図7(d)参照)。すなわち、
入力文字コード列3から次の1バイトの文字コードを読
み込んでレジスタCに設定してその次の1バイトの文字
コードを読み込んでレジスタC1に設定し(ステップ7
6)、レジスタC1の値から80を引き(ステップ7
7)、第1バイトがレジスタCの値であり第2バイトが
レジスタC1の値である内部文字コードを内部文字コー
ド列4に設定する(ステップ78)。
【0050】ステップ64で入力処理B1rdが呼び出
された場合には、入力処理B1rdは次のような処理を
行う(図8(a)参照)。すなわち、レジスタCの値
(入力された文字コード)を対応する内部文字コードに
変換し(ステップ801)、その内部文字コードを内部
文字コード列4に設定する(ステップ802)。
【0051】ステップ64で入力処理B1brdが呼び
出された場合には、入力処理B1brdは次のような処
理を行う(図8(b)参照)。すなわち、入力文字コー
ド列3から次の1バイトの文字コードをレジスタCに設
定してその次の1バイトの文字コードをレジスタC1に
設定する(ステップ803)。ここで、レジスタCの値
とレジスタC1の値とが「2442」である場合には
(ステップ804)、RTレジスタ7にリードテーブル
B2rtへのポインタを設定する(ステップ805)。
また、レジスタCの値とレジスタC1の値とが「284
A」である場合には(ステップ806)、RTレジスタ
7にリードテーブルB1rtへのポインタを設定する
(ステップ807)。なお、レジスタCの値とレジスタ
C1の値とが「2442」でも「284A」でもない場
合には、所定のエラー処理を行う(ステップ808)。
【0052】ステップ64で入力処理B2rdが呼び出
された場合には、入力処理B2rdは次のような処理を
行う(図8(c)参照)。すなわち、入力文字コード列
3から次の1バイトをレジスタC1に設定し(ステップ
809)、レジスタCの値に係る文字コードとレジスタ
C1の値に係る文字コードとを対応する内部文字コード
に変換し(ステップ810)、それらを内部文字コード
列4に設定する(ステップ811)。
【0053】なお、以上の処理における文字コードセッ
トBから内部文字コードセットへの変換は、変換表の表
引きによって行われたり、数式(2つの文字コードセッ
ト間のコード変換を表現した数式)で表現可能な場合に
はその数式による計算によって行われる。
【0054】プリントテーブル切換え手段2内の出力変
換部10は、次のような処理を行う(図9参照)。
【0055】PTレジスタ11の初期化を行う。すなわ
ち、出力すべき文字コードセット(出力文字コード列5
に係る文字コードセット)が文字コードセットAである
場合にはPTレジスタ10にプリントテーブルAptへ
のポインタを設定し、出力すべき文字コードセットが文
字コードセットBである場合にはPTレジスタ10にプ
リントテーブルB1Ptへのポインタを設定する(ステ
ップ91)。
【0056】内部文字コード列4内の内部文字コードが
なくなるまで(ステップ92)、内部文字コード列4か
ら内部文字コードを読み込み、第1バイト(上位バイ
ト)の内部文字コードをレジスタCに設定して第2バイ
ト(下位バイト)の内部文字コードをレジスタC1に設
定し(ステップ93)、PTレジスタ10の指すプリン
トテーブルをレジスタCの値で表引きして所定の出力処
理を得て、その出力処理を呼び出す(ステップ94)。
【0057】ステップ94で出力処理A1prが呼び出
された場合には、出力処理A1prは次のような処理を
行う(図10(a)参照)。すなわち、レジスタCの値
が80以上ならば(ステップ101)、8Eを出力文字
コード列5に出力し(ステップ102)、次にレジスタ
C1の値を出力文字コード列5に出力する(ステップ1
03)。レジスタC1の値が80よりも小さければ(ス
テップ101)、レジスタC1の値を出力文字コード列
5に出力する(ステップ103)。
【0058】ステップ94で出力処理A2prが呼び出
された場合には、出力処理A2prは次のような処理を
行う(図10(b)参照)。すなわち、レジスタC1の
値が80よりも小さければ(ステップ104)、レジス
タC1の値に80を加え(ステップ105)、8Fを出
力文字コード列5に出力し(ステップ106)、次にレ
ジスタCの値とレジスタC1の値とを出力文字コード列
5に順次出力する(ステップ107)。レジスタC1の
値が80以上ならば(ステップ104)、レジスタCの
値とレジスタC1の値とを出力文字コード列5に順次出
力する(ステップ107)。
【0059】ステップ94で出力処理B1prが呼び出
された場合には、出力処理B1prは次のような処理を
行う(図11(a)参照)。すなわち、レジスタC1の
値(内部文字コード)を対応する文字コードセットBの
文字コードに変換し(ステップ111)、その文字コー
ド(変換後のレジスタC1の値)を出力文字コード列5
に出力する(ステップ112)。
【0060】ステップ94で出力処理B2prが呼び出
された場合には、出力処理B2prは次のような処理を
行う(図11(b)参照)。すなわち、内部文字コード
であるレジスタCの値とレジスタC1の値とを文字コー
ドセットBの文字コードに変換し(ステップ113)、
それらを出力文字コード列5に順次出力する(ステップ
114)。
【0061】ステップ94で出力処理Bto1prが呼
び出された場合には、出力処理Bto1prは次のよう
な処理を行う(図11(c)参照)。すなわち、KO文
字コード列「1B284A」を出力文字コード列5に出
力し(ステップ115)、PTレジスタ10にプリント
テーブルB1ptへのポインタを設定し(ステップ11
6)、出力処理B1prに分岐する。
【0062】ステップ94で出力処理Bto2prが呼
び出された場合には、出力処理Bto2prは次のよう
な処理を行う(図11(d)参照)。すなわち、KI文
字コード列の「1B2442」を出力文字コード列5に
出力し(ステップ117)、PTレジスタ10にプリン
トテーブルB2ptへのポインタを設定し(ステップ1
18)、出力処理B2prに分岐する。
【0063】なお、以上の処理における内部文字コード
セットから文字コードセットBへの変換は、変換表の表
引きによって行われたり、数式(2つの文字コードセッ
ト間のコード変換を表現した数式)で表現可能な場合に
はその数式による計算によって行われる。
【0064】次に、本実施例の多重文字コードセットの
入出力変換方式の具体的な動作について説明する。な
お、ここでは、図12(a)〜(c)を参照して、「A
BC日本語アイウ」に係る文字コード列を対象とした動
作について説明する。
【0065】図12(a),(b)および(c)は、そ
れぞれ文字コードセットA,文字コードセットBおよび
内部文字コードに係る文字コードセットで表現された
「ABC日本語アイウ」の文字コード列を示す図であ
る。
【0066】第1に、リードテーブル切換え手段1によ
る処理について説明する。
【0067】RTレジスタ7にリードテーブルArtへ
のポインタが設定され、図12(a)の文字コードセッ
トAの文字コード列が入力文字コード列3として入力さ
れると、次のような処理が行われる。
【0068】 入力処理Aasciirdによって、
図12(a)中の文字コード「61」,「62」および
「63」はそれぞれ内部文字コード「0061」,「0
062」および「0063」に変換され、変換後の内部
文字コードは内部文字コード列4に設定される。
【0069】 入力処理Akanjirdによって、
文字コード「C6FC」,「CBDC」および「B8E
C」はそれぞれそのまま内部文字コード「C6FC」,
「CBDC」および「B8EC」として内部文字コード
列4に設定される。
【0070】 入力処理Akanaによって、文字コ
ード「8EB1」,「8EB2」および「8EB3」は
それぞれ内部文字コード「00B1」,「00B2」お
よび「00B3」に変換され、変換後の内部文字コード
は内部文字コード列4に設定される。
【0071】以上の〜の処理により、内部文字コー
ド列4は図12(c)に示す文字コード列と一致するこ
とになる。
【0072】一方、RTレジスタ7にリードテーブルB
1rtへのポインタが設定され、図12(b)の文字コ
ードセットBの文字コード列が入力文字コード列3とし
て入力されると、次のような処理が行われる。
【0073】 入力処理B1rdによって、図12
(b)中の文字コード列「61」,「62」および「6
3」はそれぞれ内部文字コード「0061」,「006
2」および「0063」に変換され、変換後の内部文字
コードは内部文字コード列4に設定される。
【0074】 文字コード列「1B2442」(KI
文字コード列)が入力されると、入力処理B1brdに
よってRTレジスタ7にリードテーブルB2rtへのポ
インタが設定される。
【0075】 入力処理B2rdによって、文字コー
ド「467C」,「4B5C」および「386C」はそ
れぞれ内部文字コード「C6FC」,「CBDC」およ
び「B8EC」に変換され、変換後の内部文字コードは
内部文字コード列4に設定される。
【0076】 文字コード列「1B284A」(KO
文字コード列)が入力されると、入力処理B1brdに
よってRTレジスタ7にリードテーブルB1rtへのポ
インタが設定される。
【0077】 入力処理B1rdによって、文字コー
ド「B1」,「B2」および「B3」はそれぞれ内部文
字コード「00B1」,「00B2」および「00B
3」に変換され、変換後の内部文字コードは内部文字コ
ード列4に設定される。
【0078】以上の〜の処理により、内部文字コー
ド列4は図12(c)に示す文字コード列と一致するこ
とになる。
【0079】第2に、プリントテーブル切換え手段2に
よる処理について説明する。
【0080】PTレジスタ11にプリントテーブルAp
tへのポインタが設定され、図12(c)の文字コード
列が内部文字コード列4に設定されると、次のような処
理が行われる。
【0081】 出力処理A1prによって、内部文字
コード「0061」,「0062」および「0063」
はそれぞれ文字コード「61」,「62」および「6
3」に変換され、変換後の文字コードは出力文字コード
列5に出力される。
【0082】 出力処理A2prによって、内部文字
コード列「C6FC」,「CBDC」および「B8E
C」はそれぞれそのまま文字コード「C6FC」,「C
BDC」および「B8EC」として出力文字コード列5
に出力される。
【0083】 出力処理A1prによって、内部文字
コード列「00B1」,「00B2」および「00B
3」はそれぞれ「8EB1」,「8EB2」および「8
EB3」に変換され、変換後の文字コードは出力文字コ
ード列5に出力される。
【0084】以上の〜の処理により、出力文字コー
ド列5では、図12(a)に示す文字コードセットAの
文字コード列が再現される。
【0085】一方、PTレジスタ11にプリントテーブ
ルB1ptへのポインタが設定され、図12(c)の文
字コード列が内部文字コード列4に設定されると、次の
ような処理が行われる。
【0086】 出力処理B1prによって、内部文字
コード「0061」,「0062」および「0063」
はそれぞれ文字コード「61」,「62」および「6
3」に変換され、変換後の文字コードは出力文字コード
列5に出力される。
【0087】 出力処理Bto2prによって、内部
文字コード「C6FC」に基づきKI文字コード列「1
B2442」が出力文字コード列5に出力され、PTレ
ジスタ11にプリントテーブルB2ptへのポインタが
設定される。
【0088】 出力処理B2prによって、内部文字
コード「C6FC」,「CBDC」および「B8EC」
はそれぞれ文字コード「467C」,「4B5C」およ
び「386C」に変換され、変換後の文字コードは出力
文字コード列5に出力される。
【0089】 出力処理Bto1prによって、内部
文字コード「00B1」に基づきKO文字コード列「1
B284A」が出力文字コード列5に出力され、PTレ
ジスタ11にプリントテーブルB1ptへのポインタが
設定される。
【0090】 出力処理B1prによって、内部文字
コード列「00B1」,「00B2」および「00B
3」はそれぞれ文字コード「B1」,「B2」および
「B3」に変換され、変換後の文字コードは出力文字コ
ード列5に出力される。
【0091】以上の〜の処理により、出力文字コー
ド列5では、図12(b)に示す文字コードセットBの
文字コード列が再現される。
【0092】
【発明の効果】以上説明したように本発明は、様々な
(多重な)文字コードセットの文字コードの入出力に際
して統一的に取り扱うことが可能な内部文字コードへの
変換を行うことにより、同一の内容で文字コードセット
が異なる複数のテキストファイルを用意することなく、
複数の異なる文字コードセットが取り扱われる計算機シ
ステムを実現することが可能になるという効果がある。
すなわち、複数の異なる文字コードセットが取り扱われ
る計算機システムを実現する際に、同一の内容で文字コ
ードセットが異なる複数のテキストファイルを用意する
ための変換が不要になり、複数のテキストファイルのた
めの資源を設ける必要がなくなるという効果がある。
【図面の簡単な説明】
【図1】本発明の一実施例の構成を示すブロック図であ
る。
【図2】図1に示す多重文字コードセットの入出力変換
方式に適用される文字コードセットの一例を示す図であ
る。
【図3】図1に示す多重文字コードセットの入出力変換
方式に適用される内部文字コードセットの一例を示す図
である。
【図4】図1中のリードテーブル群中のリードテーブル
の具体例を示す図である。
【図5】図1中のプリントテーブル群中のプリントテー
ブルの具体例を示す図である。
【図6】図1中の入力変換部の処理を示す流れ図であ
る。
【図7】図1中の入力処理の一例の処理内容を示す流れ
図である。
【図8】図1中の入力処理の他の例の処理内容を示す流
れ図である。
【図9】図1中の出力変換部の処理を示す流れ図であ
る。
【図10】図1中の出力処理の一例の処理内容を示す流
れ図である。
【図11】図1中の出力処理の他の例の処理内容を示す
流れ図である。
【図12】図1に示す多重文字コードセットの入出力変
換方式の具体的な動作を説明するための図である。
【符号の説明】
1 リードテーブル切換え手段 2 プリントテーブル切換え手段 3 入力文字コード列 4 内部文字コード列 5 出力文字コード列 6 入力変換部 7 RTレジスタ 8 リードテーブル群 9 入力処理群 10 出力変換部 11 PTレジスタ 12 プリントテーブル群 13 出力処理群

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】 各種文字の文字コードが異なるバイト長
    で表現されることのある複数の異なる文字コードセット
    の入力文字コード列および出力文字コード列が取り扱わ
    れる計算機システムにおいて、1つの文字コードセットに対して1以上のリードテーブ
    ルが存在するリードテーブル群,入力文字コード列に係
    る文字コードセットに対応するリードテーブルへのポイ
    ンタが設定されるリードテーブルレジスタ,このリード
    テーブルレジスタでポイントされるリードテーブルを参
    照して前記入力文字コード列の文字コードを内部文字コ
    ードに変換する複数の入力処理からなる入力処理群,お
    よび前記入力文字コード列に係る文字コードセット毎に
    前記リードテーブルレジスタに該当するリードテーブル
    へのポインタを設定するとともに前記入力処理群中の入
    力処理を選択することによって前記入力文字コード列を
    各種文字の文字コードが同じバイト長で表現される内部
    文字コードセットの内部文字コード列に変換する入力変
    換部を含む リードテーブル切換え手段と、1つの文字コードセットに対して1以上のプリントテー
    ブルが存在するプリントテーブル群,出力文字コード列
    に係る文字コードセットに対応するプリントテーブルへ
    のポインタが設定されるプリントテーブルレジスタ,こ
    のプリントテーブルレジスタでポイントされるプリント
    テーブルを参照して前記内部文字コード列の文字コード
    を出力文字コードに変換する複数の出力処理からなる出
    力処理群,および前記内部文字コード列に係る文字コー
    ドセット毎に前記プリントテーブルレジスタに該当する
    プリントテーブルへのポインタを設定するとともに前記
    出力処理群中の出力処理を選択することによって前記内
    部文字コード列を前記出力文字コード列に変換する出力
    変換部を含む プリントテーブル切換え手段とを有するこ
    とを特徴とする多重文字コードセットの入出力変換方
    式。
JP4056240A 1992-02-06 1992-02-06 多重文字コードセットの入出力変換方式 Expired - Fee Related JP2830884B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP4056240A JP2830884B2 (ja) 1992-02-06 1992-02-06 多重文字コードセットの入出力変換方式
US08/014,152 US5389924A (en) 1992-02-06 1993-02-08 Multiple character code set input/output conversion system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4056240A JP2830884B2 (ja) 1992-02-06 1992-02-06 多重文字コードセットの入出力変換方式

Publications (2)

Publication Number Publication Date
JPH05216619A JPH05216619A (ja) 1993-08-27
JP2830884B2 true JP2830884B2 (ja) 1998-12-02

Family

ID=13021575

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4056240A Expired - Fee Related JP2830884B2 (ja) 1992-02-06 1992-02-06 多重文字コードセットの入出力変換方式

Country Status (2)

Country Link
US (1) US5389924A (ja)
JP (1) JP2830884B2 (ja)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5787432A (en) * 1990-12-06 1998-07-28 Prime Arithmethics, Inc. Method and apparatus for the generation, manipulation and display of data structures
JPH07271777A (ja) * 1994-03-31 1995-10-20 Fujitsu Ltd 分散情報処理システムにおける文字コード管理方式
US5649214A (en) * 1994-09-20 1997-07-15 Unisys Corporation Method and apparatus for continued use of data encoded under a first coded character set while data is gradually transliterated to a second coded character set
JP3689954B2 (ja) * 1995-03-13 2005-08-31 富士ゼロックス株式会社 異種コード文字列転記装置および電子辞書
US5806067A (en) * 1996-10-21 1998-09-08 Catch/21 Enterprises, Inc. Method and apparatus for data processing with conversion of ambiguous data structures
JP3282976B2 (ja) * 1996-11-15 2002-05-20 株式会社キングジム 文字情報処理装置及び方法
US5929792A (en) * 1997-06-30 1999-07-27 Sun Microsystems, Inc. Method and apparatus for encoding multiple character sets
JPH11110912A (ja) * 1997-09-30 1999-04-23 Sony Corp ディジタル信号記録装置および記録方法
GB2343024A (en) * 1998-10-22 2000-04-26 Ibm Efficient data conversion of list of strings
US6708310B1 (en) * 1999-08-10 2004-03-16 Sun Microsystems, Inc. Method and system for implementing user-defined codeset conversions in a computer system
JP2001084183A (ja) 1999-09-17 2001-03-30 Nec Corp データ変換システム
GB2359399B (en) * 2000-02-21 2004-06-02 Kenwood Corp Character display
JP3917343B2 (ja) * 2000-02-25 2007-05-23 株式会社東芝 マルチプラットフォーム環境における文字コード変換方式および文字コード変換プログラムを記録したコンピュータ読み取り可能な記録媒体
CN1163814C (zh) * 2000-04-28 2004-08-25 西南交通大学 一种数字数据变换方法
TW201339861A (zh) 2012-03-30 2013-10-01 Ibm 提供較小目標編碼空間之碼轉換的方法、電腦裝置與程式產品
US10333696B2 (en) 2015-01-12 2019-06-25 X-Prime, Inc. Systems and methods for implementing an efficient, scalable homomorphic transformation of encrypted data with minimal data expansion and improved processing efficiency

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5926060B2 (ja) * 1976-06-01 1984-06-23 日本電気株式会社 デ−タ処理装置
JPS6077222A (ja) * 1983-10-04 1985-05-01 Kanaasu Data Kk 多種文字処理端末装置
JPS6120129A (ja) * 1984-07-06 1986-01-28 Hitachi Ltd 複数コ−ド系情報処理方式
JPS63127328A (ja) * 1986-11-18 1988-05-31 Mitsubishi Electric Corp コ−ド変換装置
JPH01194007A (ja) * 1988-01-29 1989-08-04 Fanuc Ltd Iso/eiaコード変換方法
US4992957A (en) * 1988-03-17 1991-02-12 Seiko Epson Corporation Printer and method for utilizing character codes and control codes within a printer
JPH0355628A (ja) * 1989-07-25 1991-03-11 Mitsubishi Electric Corp 電子計算機内の文字コード処理方式

Also Published As

Publication number Publication date
JPH05216619A (ja) 1993-08-27
US5389924A (en) 1995-02-14

Similar Documents

Publication Publication Date Title
JP2830884B2 (ja) 多重文字コードセットの入出力変換方式
US4611280A (en) Sorting method
KR970003322B1 (ko) 데이타의 다중-바이트 표현 변환 방법
US7321943B2 (en) KVM switch including a terminal emulator
AU596713B2 (en) Text compression and expansion method and apparatus
US7188115B2 (en) Processing fixed-format data in a unicode environment
US6055365A (en) Code point translation for computer text, using state tables
US5963155A (en) System and method of transforming information between UCS and EBCDIC representations employing EBCDIC-friendly transformation formats
JP2014038301A (ja) 組込みシステムにおいてキャラクター文字列を操作する方法
US6112208A (en) Data compressing method and apparatus to generate bit maps in accordance with extracted data symbols
US6263353B1 (en) Method and apparatus for converting between different digital data representation formats
CN111914513A (zh) 一种rdp窗口标题文字识别的方法及装置
JP2757525B2 (ja) 複数文字コード体系の相互変換システム
KR100480065B1 (ko) 컬러 단문 메시지 전송 방법
JPH06290021A (ja) ソースプログラム圧縮方法
US5771395A (en) System for processing information from scanned documents using event driven interface with patterns loaded in RAM and with address generator for addressing bit patterns
Liu et al. Distributed multilingual applications of the OSI architecture
JP3035506B2 (ja) データ型変換装置
JPH11353092A (ja) 情報端末装置及び画面データ処理方法
Stowers et al. Interoperability over low data rate channels using CORBA mediated, bit-packed, variable-format message transmissions
CN116886386A (zh) 一种纳秒级ip匹配的方法及系统
JPH03144735A (ja) インタプリタの言語処理方式
JPH0820940B2 (ja) 計算機システムにおける不定バイト長文字の属性管理方式
JPS59184941A (ja) 漢字コ−ド変換方法
JPH08263264A (ja) データ処理装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees