JPH10254833A - コンピュータ・システム内の交換コード間でマルチバイト文字ストリングを変換するための方法およびシステム - Google Patents

コンピュータ・システム内の交換コード間でマルチバイト文字ストリングを変換するための方法およびシステム

Info

Publication number
JPH10254833A
JPH10254833A JP10022379A JP2237998A JPH10254833A JP H10254833 A JPH10254833 A JP H10254833A JP 10022379 A JP10022379 A JP 10022379A JP 2237998 A JP2237998 A JP 2237998A JP H10254833 A JPH10254833 A JP H10254833A
Authority
JP
Japan
Prior art keywords
data word
byte data
offset
byte
code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10022379A
Other languages
English (en)
Inventor
Paul Andrews Gregory
グレゴリー・ポール・アンドリューズ
Reo Glansky Patrick
パトリック・レオ・グレンスキ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPH10254833A publication Critical patent/JPH10254833A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding
    • G06F40/129Handling non-Latin characters, e.g. kana-to-kanji conversion

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 第1の拡張交換コードのマルチバイト・デー
タワードを第2の拡張交換コードのマルチバイト・デー
タワードに変換するための方法を開示する。 【解決手段】 本発明の方法およびシステムにより、複
数のオフセット・アレイと1つの変換マトリックスが提
供される。各オフセット・アレイ内の各項目は、変換マ
トリックスへのインデックスを付けるためのオフセット
・インデックスを含む。まず、第1の交換コードのマル
チバイト・データワードの各バイトごとに、対応する1
つのオフセット・アレイからインデックス値が返され
る。次に、返されたすべてのインデックス値をまとめて
加算し、変換マトリックスから第2の交換コードのマル
チバイト・データワードを求める。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、一般にデータ処理
のための方法およびシステムに関し、具体的にはデータ
処理システム間で情報を交換するための方法およびシス
テムに関する。より具体的には、本発明は、第1の交換
コードのマルチバイト・データワードを第2の交換コー
ドのマルチバイト・データワードに変換するための方法
およびシステムに関する。
【0002】
【従来の技術】データ処理システム内では、交換コード
と呼ばれる1組の文字コードによって各国語のすべての
アルファベット(または文字)を符号化することができ
る。ほとんどの言語の場合、1組の交換コードで必要な
文字コードの数は比較的少ない。たとえば、大文字と小
文字の両方を含む英語のアルファベット26文字すべて
を表すために必要な文字コードは、わずか52通りであ
る。また、3通りの母音受取り分音記号(大文字と小文
字を含む)とβ記号を見込んで、すべてのドイツ語のア
ルファベットを表すためには、わずか7通りの文字コー
ドを追加するだけでよい。同様に、文字コードをわずか
に追加すると、フランス語、オランダ語、スペイン語、
イタリア語、ポルトガル語、その他数種類のスカンディ
ナヴィア語を個々の交換コード・セット内で個別に符号
化することができる。このため、上記の各国語のいずれ
か1つの言語内のすべてのアルファベットを符号化する
ためには1バイト(または8ビット)を用意するだけで
十分である。1バイト符号化では、アルファベットに加
え、数値を表すための1組の10通りの数字、様々な句
読点記号、その他、様々な各国通貨記号(たとえば、
$、£、¥)などの所期の目的のための専用記号が可能
である。現在、それぞれの1バイト符号化可能言語用と
して2組の交換コードの標準セット、すなわち、情報交
換用米国標準コード(ASCII)と拡張2進化10進
コード(EBCDIC)がある。
【0003】驚くべきことではないが、256通りを上
回るアルファベット、より正確には文字を含む各国語も
存在する。たとえば、伝統的な文語中国語は13000
通りを上回る文字からなり、日本語は3000〜800
0通りの表意文字(漢字という)と、数字、ひらがな、
カタカナ用の数百通りのその他の記号からなる。したが
って、大規模な文字ベースを有する各国語用の各組の交
換コードでは、1文字を符号化するために2バイト(ま
たは16ビット)を使用しなければならない。これは、
数字、句読点記号などを除く、最大216=65536文
字の表現に対応するものである。1バイト交換コード・
セットのように、2バイト符号化可能言語用として複数
組の交換コードの標準セットも存在する。たとえば、現
在使用されている、日本語用の交換コード・セットは、
IBMホスト・コード、IBMPCコード、漢字割当て
番号コード、JIS(日本工業規格)コードの4通りで
ある。同様に、朝鮮語用として5通りの交換コード・セ
ットと、伝統的な中国語用として2通りの交換コード・
セットがある。
【0004】現在、複数組の交換コードが一般に使用さ
れているので、異なる交換コード・セット間のコード変
換の必要性が頻繁に発生する。たとえば、IBMPCコ
ードは日本語の文字を符号化するためのASCIIの拡
張コードであって、通常、IBM互換パーソナル・コン
ピュータで使用されており、IBMホスト・コードはE
BCDICの同様の拡張コードであって、通常、様々な
ミッドレンジ・コンピュータおよびメインフレーム・コ
ンピュータで使用されている。上記のデータ処理システ
ムのうち、それぞれが異なる1組の交換コードを有する
任意の2種類のシステム間で情報交換を行うためには、
交換された記号コードに意味を適用する際の整合性が必
要である。
【0005】1バイト符号化可能言語の場合、1組の交
換コードから他の組の交換コードへ変換するには単一の
変換テーブルが必要である。理論上、変換テーブルの概
念は2バイト変換にも適用することができる。残念なが
ら、適用上、このような手法は1バイト符号化可能言語
よりかなり多くのメモリを要することになるだろう。た
とえば、1バイト符号化可能言語用の典型的な変換テー
ブルのサイズは256バイトの長さであるのに対し、2
バイト符号化可能言語用の典型的な変換テーブルのサイ
ズは128キロバイトを上回る長さになるだろう。
【0006】さらに、2バイト・コード・セット変換用
の従来の方法では、その妥当性を判定するために個々の
2バイト文字に対する一連の言語依存比較を使用する。
本質的にこのようなステップは一連の範囲比較である。
文字の妥当性が確立されると、言語依存方法を使用し
て、その文字のアレイ・インデックスを2バイトの25
6項目×256項目変換アレイに誘導する。次にアレイ
・インデックスを使用して、変換アレイから適切な文字
を回復する。アンドリューズ(Andrews)他の米国特許
第5309358号では、従来の方法の範囲比較部分と
インデックス生成部分を単純化する方法を教示してい
る。本発明の開示は、変換時間をさらに短縮できるよう
に、米国特許第5309358号でアンドリューズによ
って教示された方法をさらに改良するものである。
【0007】
【発明が解決しようとする課題】したがって、上記の説
明を考慮すると、本発明の一目的は、データ処理用の改
良された方法およびシステムを提供することにある。
【0008】本発明の他の目的は、データ処理システム
間で情報を交換するための改良された方法およびシステ
ムを提供することにある。
【0009】本発明の他の目的は、第1の交換コードの
マルチバイト・データワードを第2の交換コードのマル
チバイト・データワードに変換するための改良された方
法およびシステムを提供することにある。
【0010】
【課題を解決するための手段】本発明の方法およびシス
テムにより、複数のオフセット・アレイと1つの変換マ
トリックスが提供される。各オフセット・アレイ内の各
項目は、変換マトリックスへのインデックスを付けるた
めのオフセット・インデックスを含む。まず、第1の交
換コードのマルチバイト・データワードの各バイトごと
に、対応する1つのオフセット・アレイからインデック
ス値が返される。次に、返されたすべてのインデックス
値をまとめて加算し、変換マトリックスから第2の交換
コードのマルチバイト・データワードを求める。
【0011】
【発明の実施の形態】本発明は、数通りのオペレーティ
ング・システムの下で様々なコンピュータで実行するこ
とができる。このコンピュータは、たとえば、パーソナ
ル・コンピュータ、ミッドレンジ・コンピュータ、メイ
ンフレーム・コンピュータにすることができる。さら
に、このコンピュータは、スタンドアローン・システム
か、またはローカルエリア・ネットワーク(LAN)や
広域ネットワーク(WAN)などのネットワークの一部
にすることができる。
【0012】次に、添付図面、特に図1を参照すると、
同図には本発明の好ましい実施例を使用可能な分散デー
タ処理システムのブロック図表現が示されている。図示
の通り、分散データ処理システム10は、IBM製のAp
tivaTMなどのパーソナル・コンピュータ・システム11
と、同じくIBM製のAS/400TMなどのミッドレン
ジ・コンピュータ・システム12とを含むことができ
る。パーソナル・コンピュータ・システム11用のユー
ザ・インタフェースは、表示装置14と、キーボード1
6とを含む。「大」という概念を示す漢字とそのIBM
PCコードを2バイト文字ストリングで表したものであ
る91E5hexは表示装置14のボックス15内に示さ
れている。
【0013】表示装置14は、コンピュータ・システム
11内の中央演算処理装置(CPU)18の制御下にあ
る。キーボード16は、コンピュータ・システム11へ
のユーザ入力に備えるものである。また、直接アクセス
記憶装置(DASD)20、22と、システム・メモリ
24もCPU18にアクセス可能である。通信アダプタ
26は、コンピュータ・システム11とコンピュータ・
システム12との間のネットワークにより通信リンク2
7へのインタフェースを提供する。
【0014】コンピュータ・システム12は、コンピュ
ータ・システム11などのネットワーク・ワークステー
ションに対応するためのホスト装置として動作すること
ができる。コンピュータ・システム12はCPU28を
含み、これは通信アダプタ30を介して通信リンク27
によりデータを受け取る。CPU28は表示装置32を
制御し、キーボード34からユーザ入力を受け取る。表
示装置32のボックス33には、「大」という概念を示
す漢字とそのIBMホスト・コードを2バイト文字スト
リングで表したものである455Bhexが表示されてい
る。コンピュータ・システム12は、システム・メモリ
36と、DASD38、40をさらに含む。
【0015】コンピュータ・システム11とコンピュー
タ・システム12との間で伝送される文字ストリング
は、そのストリングが表す情報が失われるかまたは完全
に歪曲されなければ、2組の交換コード(すなわち、I
BMPCコードとIBMホスト・コード)間で変換しな
ければならない。一例として、「大」という概念の漢字
を示す文字ストリングの変換について検討する。好まし
い実施例では、このような変換はコンピュータ・システ
ム11などのネットワーク・ワークステーションで行わ
れる。コンピュータ・システム11のシステム・メモリ
24内には、とりわけ、IBMPCコードの2バイト文
字ストリングをIBMホスト・コードの2バイト文字ス
トリングに変換するためのプログラム43と、第1バイ
ト・オフセット・アレイ42と、第2バイト・オフセッ
ト・アレイ44と、変換マトリックス46が常駐し、い
ずれも本発明に基づき変換プログラムが使用するための
ものである。
【0016】次に図2を参照すると、同図には、先行技
術による第1バイト検証テーブル、第2バイト検証テー
ブル、変換テーブルのブロック図が示されている。最初
は、第1バイト検証テーブル42'と、第2バイト検証
テーブル44'と、変換テーブル46'はコンピュータ・
システム11のシステム・メモリ24内に格納されてい
る。動作中に、第1の交換コードの2バイト・データワ
ードの第1バイトが検証テーブル42'の範囲内にある
ことを確認するために検証を行う。同様に、2バイト交
換コードの第2バイトが検証テーブル44'の範囲内に
あることを確認するためにもう一度検証を行う。両方の
検証が有効である場合、上記の第1バイト入力および第
2バイト入力に応じて、各検証テーブル42'および4
4'からインデックス値が返される。返された2つのイ
ンデックス値を使用することにより、変換テーブル4
6'から第2の交換コードの2バイト・データワードを
求めることができる。
【0017】漢字記号「大」をIBMPCコードからI
BMホスト・コードに変換する場合の具体的な例を図2
に示す。IBMPCコードでは、漢字記号「大」の2バ
イト・データワードは91E5hexになる。第1バイト
91hex(10進法の229)は検証テーブル42'と照
らし合わせて検証し、第2バイトE5hex(10進法の
145)は検証テーブル44'と照らし合わせて検証す
る。91hexとE5hexはどちらもそれぞれの検証テーブ
ルの範囲内にあるので、それぞれの検証テーブル42'
および44'からインデックス値が返される。検証テー
ブル42'からのインデックス値「164」と検証テー
ブル44'からのインデックス値「13」とを使用する
ことにより、IBMホスト・コードを示す第2の交換コ
ードの2バイト・データワードが変換テーブル46'か
ら455Bhexとして求められる。ちなみに、455B
hexは漢字記号「大」を示すIBMホスト・コードであ
る。
【0018】先行技術では、変換テーブル46'からの
第2の交換コードの2バイト・データワードの位置は、
以下のように求められる。 位置=T[A[バイト1]][B[バイト2]] コーディングに関しては、変換テーブル46'は実際に
は以下のようにアクセスされる。 位置=T[(A[バイト1]×(行)のサイズ)+(B
[バイト2]×(列)のサイズ)] このため、先行技術の方法では、変換テーブル46'内
の位置にアクセスするために2回の乗算と1回の加算が
必要である。本発明の開示では、2回の乗算ステップを
解消し、それにより変換プロセスの全体的なパフォーマ
ンスを改良する方法について説明する。
【0019】次に図3を参照すると、同図には、本発明
の好ましい実施例による第1バイト・オフセット・アレ
イ、第2バイト・オフセット・アレイ、変換マトリック
スのブロック図が示されている。図示の通り、第1バイ
ト・オフセット・テーブル42は256×8ビット・ア
レイであり、各項目は変換マトリックス46の各列への
オフセット・インデックスを含む。この例では、オフセ
ット・テーブル42内の各オフセット・インデックス
は、たとえば、「00」、「02」、「04」、「0
6」、「08」などのように、互いに2バイトずつオフ
セットしていることが好ましい。第2バイト・オフセッ
ト・アレイ44は256×16ビット・アレイであり、
同じく各項目は変換マトリックス46の各行へのオフセ
ット・インデックスを含む。オフセット・テーブル44
内の各オフセット・インデックスは、変換マトリックス
46の行の長さ分だけ、互いにオフセットしていること
が好ましい。この例では、変換マトリックス46の行の
長さは374バイトであり、変換マトリックス46内の
IBMホスト・コード455Bhexの位置は、オフセッ
ト・テーブル42からのインデックス1(328)をオ
フセット・テーブル44からのインデックス2(486
2)に加算することによって求めることができる。
【0020】次に図4を参照すると、同図には、本発明
の好ましい実施例により、第1の拡張交換コードのマル
チバイト・データワードを第2の拡張交換コードのマル
チバイト・データワードに変換するための方法の高レベ
ル流れ図が示されている。この方法は、図1に示すプロ
グラム43など、システム・メモリ内のソフトウェア・
プログラムによって実行することができる。プロセス
は、第1の交換コードのソース2バイト・データワード
を受け取ったときに始まる。ターゲット2バイト・デー
タワードに必要な交換コードのタイプは、宛先コンピュ
ータ・システムのIDによって判定される。ブロック5
0に示すように、変換前に、特殊機能用の範囲限界値と
トリガ値とを含む、第1バイト・オフセット・テーブル
42、第2バイト・オフセット・テーブル44、変換マ
トリックス46がDASD20または22から取り出さ
れ、システム・メモリ24内に置かれる。1つのプログ
ラムを使用してすべての言語および交換コードの変換を
行うことができるが、各種テーブルと、範囲限界値と、
おそらくトリガ値は、各国語ならびにそれに対応する交
換コードに固有のものである。ブロック51に示すよう
に、変換のために第1の交換コードの2バイト・データ
ワードを受け取った後、ブロック52に示すように、受
け取った2バイト・データワードの第1バイトがオフセ
ット・テーブル42の範囲内にあるかどうかについて判
定を行う。第1の交換コードの2バイト・データワード
の第1バイトがオフセット・テーブル42の範囲内にな
い場合、ブロック53に示すように、その2バイト・デ
ータワードは無効であると見なされ、プロセスはこの時
点で終了する。
【0021】あるいは、第1の交換コードの2バイト・
データワードの第1バイトがオフセット・テーブル42
の範囲内にある場合、ブロック54に示すように、第1
の交換コードの2バイト・データワードの第2バイトが
オフセット・テーブル44の範囲内にあるかどうかにつ
いてもう一度判定を行う。第1の交換コードの2バイト
・データワードの第2バイトがオフセット・テーブル4
4の範囲内にない場合、ブロック55に示すように、そ
の2バイト・データワードは再度無効であると見なさ
れ、プロセスはこの時点で終了する。
【0022】第1の交換コードの2バイト・データワー
ドの第2バイトがオフセット・テーブル44の範囲内に
ある場合、ブロック56に示すように、オフセット・テ
ーブル42からのインデックス1をオフセット・テーブ
ル44からのインデックス2に加算することにより、変
換マトリックス46内の第2の交換コードの2バイト・
データワードの位置を求める。その後、ブロック57に
示すように、第2の交換コードの2バイト・データワー
ドを変換マトリックス46から取り出す。最後に、プロ
セスは終了する。
【0023】すでに述べたように、本発明は、第1の交
換コードの2バイト・データワードを第2の交換コード
の2バイト・データワードに変換するための改良された
方法を提供するものである。本発明は、朝鮮語、日本
語、伝統的な中国語、簡易中国語用の交換コード間の文
字変換のために、1つの固有各国語変換テーブルと複数
のオフセット・テーブルとを使用して実行される単一プ
ログラムを提供する。本発明の好ましい実施例によれ
ば、すべての漢字、ひらがな、カタカナ、数字を含む日
本語用の変換アレイと、片方向変換用の2つのオフセッ
ト・アレイは、システム・メモリのうちの約16Kバイ
トを占有するだけである。
【0024】2バイト文字表現をある交換コードから他
の交換コードに変換するために本発明の開示を示した
が、変換されるバイトは、表示可能文字を表す必要はな
い。事実、このようなバイトは、有意値の任意のセット
からの項目を表すことができる。本発明の利点は、有意
値が連続していないときに特に有利である。本発明が2
バイト・データワードを変換するための方法を教示する
ように、本発明は、マルチバイト・データワードをある
交換コードから他の交換コードに変換するように拡張す
ることができる。2バイト変換では、2つのオフセット
・アレイと、1つの2次元変換マトリックスとを使用す
る。したがって、3バイト・データワード変換では、3
つのオフセット・アレイと、1つの3次元変換アレイと
を使用することになるだろう。同様に、この方法は、任
意のnバイト・データワード変換にさらに拡張すること
もできる。
【0025】また、完全に機能するコンピュータ・シス
テムに関連して本発明を説明してきたが、当業者であれ
ば、本発明の各種メカニズムは様々な形式のプログラム
製品として配布可能であり、その配布を実際に実行する
ために使用する信号伝達媒体の特定のタイプにかかわら
ず同じように本発明が適用されることが分かるだろう。
信号伝達媒体の例は、フロッピー・ディスクやCD−R
OMなどの記録可能タイプの媒体と、アナログまたはデ
ィジタル通信リンクなどの伝送タイプの媒体とを含みか
つこれらに限定されない。
【0026】まとめとして、本発明の構成に関して以下
の事項を開示する。
【0027】(1)第1の拡張交換コードのマルチバイ
ト・データワードを第2の拡張交換コードのマルチバイ
ト・データワードに変換するための方法において、複数
のオフセット・アレイと、1つの変換マトリックスとを
用意するステップであって、前記複数のオフセット・ア
レイのそれぞれの各項目が前記変換マトリックスへのイ
ンデックスを付けるためのオフセット・インデックスを
含むステップと、前記複数のオフセット・アレイのうち
の対応するオフセット・アレイから、前記第1の拡張交
換コードの前記マルチバイト・データワードの各バイト
用のインデックス値を返すステップと、返された前記イ
ンデックス値のすべてを加算して、前記変換マトリック
スから前記第2の拡張交換コードの前記マルチバイト・
データワードを求めるステップとを含む方法。 (2)前記方法が、前記第1の拡張交換コードの前記マ
ルチバイト・データワードの各バイトが前記複数のオフ
セット・アレイのうちの前記対応するオフセット・アレ
イの範囲内にあることを検証するステップをさらに含む
ことを特徴とする、上記(1)に記載の第1の拡張交換
コードのマルチバイト・データワードを第2の拡張交換
コードのマルチバイト・データワードに変換するための
方法。 (3)前記方法が、前記第1の拡張交換コードの前記マ
ルチバイト・データワードのうちの任意のバイトが前記
複数のオフセット・アレイのうちの前記対応するオフセ
ット・アレイの範囲外にあることに応答して、前記マル
チバイト・データワードが無効であることを示すステッ
プをさらに含むことを特徴とする、上記(2)に記載の
第1の拡張交換コードのマルチバイト・データワードを
第2の拡張交換コードのマルチバイト・データワードに
変換するための方法。 (4)複数のオフセット・アレイを用意する前記ステッ
プが、前記変換マトリックスの各列へのオフセット・イ
ンデックスを有する第1のオフセット・アレイと、前記
変換マトリックスの各行へのオフセット・インデックス
を有する第2のオフセット・アレイとを用意するステッ
プをさらに含むことを特徴とする、上記(1)に記載の
第1の拡張交換コードのマルチバイト・データワードを
第2の拡張交換コードのマルチバイト・データワードに
変換するための方法。 (5)前記マルチバイト・データワードが各国語の1つ
の文字に対応することを特徴とする、上記(1)に記載
の第1の拡張交換コードのマルチバイト・データワード
を第2の拡張交換コードのマルチバイト・データワード
に変換するための方法。 (6)第1の拡張交換コードのマルチバイト・データワ
ードを第2の拡張交換コードのマルチバイト・データワ
ードに変換するためのコンピュータ・システムにおい
て、複数のオフセット・アレイと、1つの変換マトリッ
クスとを用意する手段であって、前記複数のオフセット
・アレイのそれぞれの各項目が前記変換マトリックスへ
のインデックスを付けるためのオフセット・インデック
スを含む手段と、前記複数のオフセット・アレイのうち
の対応するオフセット・アレイから、前記第1の拡張交
換コードの前記マルチバイト・データワードの各バイト
用のインデックス値を返す手段と、返された前記インデ
ックス値のすべてを加算して、前記変換マトリックスか
ら前記第2の拡張交換コードの前記マルチバイト・デー
タワードを求める手段とを含むコンピュータ・システ
ム。 (7)前記コンピュータ・システムが、前記第1の拡張
交換コードの前記マルチバイト・データワードの各バイ
トが前記複数のオフセット・アレイのうちの前記対応す
るオフセット・アレイの範囲内にあることを検証する手
段をさらに含むことを特徴とする、上記(6)に記載の
第1の拡張交換コードのマルチバイト・データワードを
第2の拡張交換コードのマルチバイト・データワードに
変換するためのコンピュータ・システム。 (8)前記コンピュータ・システムが、前記第1の拡張
交換コードの前記マルチバイト・データワードのうちの
任意のバイトが前記複数のオフセット・アレイのうちの
前記対応するオフセット・アレイの範囲外にあることに
応答して、前記マルチバイト・データワードが無効であ
ることを示す手段をさらに含むことを特徴とする、上記
(7)に記載の第1の拡張交換コードのマルチバイト・
データワードを第2の拡張交換コードのマルチバイト・
データワードに変換するためのコンピュータ・システ
ム。 (9)複数のオフセット・アレイを用意する前記手段
が、前記変換マトリックスの各列へのオフセット・イン
デックスを有する第1のオフセット・アレイと、前記変
換マトリックスの各行へのオフセット・インデックスを
有する第2のオフセット・アレイとを用意する手段をさ
らに含むことを特徴とする、上記(6)に記載の第1の
拡張交換コードのマルチバイト・データワードを第2の
拡張交換コードのマルチバイト・データワードに変換す
るためのコンピュータ・システム。 (10)前記マルチバイト・データワードが各国語の1
つの文字に対応することを特徴とする、上記(6)に記
載の第1の拡張交換コードのマルチバイト・データワー
ドを第2の拡張交換コードのマルチバイト・データワー
ドに変換するためのコンピュータ・システム。 (11)コンピュータ・システム内で第1の拡張交換コ
ードのマルチバイト・データワードを第2の拡張交換コ
ードのマルチバイト・データワードに変換するためにコ
ンピュータ使用可能媒体に常駐するコンピュータ・プロ
グラム製品において、複数のオフセット・アレイと、1
つの変換マトリックスとを用意するプログラム・コード
手段であって、前記複数のオフセット・アレイのそれぞ
れの各項目が前記変換マトリックスへのインデックスを
付けるためのオフセット・インデックスを含むプログラ
ム・コード手段と、前記複数のオフセット・アレイのう
ちの対応するオフセット・アレイから、前記第1の拡張
交換コードの前記マルチバイト・データワードの各バイ
ト用のインデックス値を返すプログラム・コード手段
と、返された前記インデックス値のすべてを加算して、
前記変換マトリックスから前記第2の拡張交換コードの
前記マルチバイト・データワードを求めるプログラム・
コード手段とを含むコンピュータ・プログラム製品。 (12)前記コンピュータ・プログラム製品が、前記第
1の拡張交換コードの前記マルチバイト・データワード
の各バイトが前記複数のオフセット・アレイのうちの前
記対応するオフセット・アレイの範囲内にあることを検
証するプログラム・コード手段をさらに含むことを特徴
とする、上記(11)に記載のコンピュータ・システム
内で第1の拡張交換コードのマルチバイト・データワー
ドを第2の拡張交換コードのマルチバイト・データワー
ドに変換するためにコンピュータ使用可能媒体に常駐す
るコンピュータ・プログラム製品。 (13)前記コンピュータ・プログラム製品が、前記第
1の拡張交換コードの前記マルチバイト・データワード
のうちの任意のバイトが前記複数のオフセット・アレイ
のうちの前記対応するオフセット・アレイの範囲外にあ
ることに応答して、前記マルチバイト・データワードが
無効であることを示すプログラム・コード手段をさらに
含むことを特徴とする、上記(12)に記載のコンピュ
ータ・システム内で第1の拡張交換コードのマルチバイ
ト・データワードを第2の拡張交換コードのマルチバイ
ト・データワードに変換するためにコンピュータ使用可
能媒体に常駐するコンピュータ・プログラム製品。 (14)複数のオフセット・アレイを用意する前記プロ
グラム・コード手段が、前記変換マトリックスの各列へ
のオフセット・インデックスを有する第1のオフセット
・アレイと、前記変換マトリックスの各行へのオフセッ
ト・インデックスを有する第2のオフセット・アレイと
を用意するプログラム・コード手段をさらに含むことを
特徴とする、上記(11)に記載のコンピュータ・シス
テム内で第1の拡張交換コードのマルチバイト・データ
ワードを第2の拡張交換コードのマルチバイト・データ
ワードに変換するためにコンピュータ使用可能媒体に常
駐するコンピュータ・プログラム製品。 (15)前記マルチバイト・データワードが各国語の1
つの文字に対応することを特徴とする、上記(11)に
記載のコンピュータ・システム内で第1の拡張交換コー
ドのマルチバイト・データワードを第2の拡張交換コー
ドのマルチバイト・データワードに変換するためにコン
ピュータ使用可能媒体に常駐するコンピュータ・プログ
ラム製品。
【図面の簡単な説明】
【図1】本発明の好ましい実施例を使用可能な分散デー
タ処理システムのブロック図である。
【図2】先行技術による第1バイト検証テーブル、第2
バイト検証テーブル、変換テーブルのブロック図であ
る。
【図3】本発明の好ましい実施例による第1バイト・オ
フセット・アレイ、第2バイト・オフセット・アレイ、
変換マトリックスのブロック図である。
【図4】第1の交換コードのマルチバイト・データワー
ドを第2の交換コードのマルチバイト・データワードに
変換するための方法の高レベル流れ図である。
【符号の説明】
10 分散データ処理システム 11 パーソナル・コンピュータ・システム 12 ミッドレンジ・コンピュータ・システム 14 表示装置 15 ボックス 16 キーボード 18 中央演算処理装置(CPU) 20 直接アクセス記憶装置(DASD) 22 直接アクセス記憶装置(DASD) 24 システム・メモリ 26 通信アダプタ 27 通信リンク 28 CPU 30 通信アダプタ 32 表示装置 33 ボックス 34 キーボード 36 システム・メモリ 38 DASD 40 DASD 42 第1バイト・オフセット・アレイ 43 プログラム 44 第2バイト・オフセット・アレイ 46 変換マトリックス
───────────────────────────────────────────────────── フロントページの続き (72)発明者 パトリック・レオ・グレンスキ アメリカ合衆国55902 ミネソタ州ロチェ スターファースト・ストリート サウスウ ェスト 917

Claims (15)

    【特許請求の範囲】
  1. 【請求項1】第1の拡張交換コードのマルチバイト・デ
    ータワードを第2の拡張交換コードのマルチバイト・デ
    ータワードに変換するための方法において、 複数のオフセット・アレイと、1つの変換マトリックス
    とを用意するステップであって、前記複数のオフセット
    ・アレイのそれぞれの各項目が前記変換マトリックスへ
    のインデックスを付けるためのオフセット・インデック
    スを含むステップと、 前記複数のオフセット・アレイのうちの対応するオフセ
    ット・アレイから、前記第1の拡張交換コードの前記マ
    ルチバイト・データワードの各バイト用のインデックス
    値を返すステップと、 返された前記インデックス値のすべてを加算して、前記
    変換マトリックスから前記第2の拡張交換コードの前記
    マルチバイト・データワードを求めるステップとを含む
    方法。
  2. 【請求項2】前記方法が、前記第1の拡張交換コードの
    前記マルチバイト・データワードの各バイトが前記複数
    のオフセット・アレイのうちの前記対応するオフセット
    ・アレイの範囲内にあることを検証するステップをさら
    に含むことを特徴とする、請求項1に記載の第1の拡張
    交換コードのマルチバイト・データワードを第2の拡張
    交換コードのマルチバイト・データワードに変換するた
    めの方法。
  3. 【請求項3】前記方法が、前記第1の拡張交換コードの
    前記マルチバイト・データワードのうちの任意のバイト
    が前記複数のオフセット・アレイのうちの前記対応する
    オフセット・アレイの範囲外にあることに応答して、前
    記マルチバイト・データワードが無効であることを示す
    ステップをさらに含むことを特徴とする、請求項2に記
    載の第1の拡張交換コードのマルチバイト・データワー
    ドを第2の拡張交換コードのマルチバイト・データワー
    ドに変換するための方法。
  4. 【請求項4】複数のオフセット・アレイを用意する前記
    ステップが、前記変換マトリックスの各列へのオフセッ
    ト・インデックスを有する第1のオフセット・アレイ
    と、前記変換マトリックスの各行へのオフセット・イン
    デックスを有する第2のオフセット・アレイとを用意す
    るステップをさらに含むことを特徴とする、請求項1に
    記載の第1の拡張交換コードのマルチバイト・データワ
    ードを第2の拡張交換コードのマルチバイト・データワ
    ードに変換するための方法。
  5. 【請求項5】前記マルチバイト・データワードが各国語
    の1つの文字に対応することを特徴とする、請求項1に
    記載の第1の拡張交換コードのマルチバイト・データワ
    ードを第2の拡張交換コードのマルチバイト・データワ
    ードに変換するための方法。
  6. 【請求項6】第1の拡張交換コードのマルチバイト・デ
    ータワードを第2の拡張交換コードのマルチバイト・デ
    ータワードに変換するためのコンピュータ・システムに
    おいて、 複数のオフセット・アレイと、1つの変換マトリックス
    とを用意する手段であって、前記複数のオフセット・ア
    レイのそれぞれの各項目が前記変換マトリックスへのイ
    ンデックスを付けるためのオフセット・インデックスを
    含む手段と、 前記複数のオフセット・アレイのうちの対応するオフセ
    ット・アレイから、前記第1の拡張交換コードの前記マ
    ルチバイト・データワードの各バイト用のインデックス
    値を返す手段と、 返された前記インデックス値のすべてを加算して、前記
    変換マトリックスから前記第2の拡張交換コードの前記
    マルチバイト・データワードを求める手段とを含むコン
    ピュータ・システム。
  7. 【請求項7】前記コンピュータ・システムが、前記第1
    の拡張交換コードの前記マルチバイト・データワードの
    各バイトが前記複数のオフセット・アレイのうちの前記
    対応するオフセット・アレイの範囲内にあることを検証
    する手段をさらに含むことを特徴とする、請求項6に記
    載の第1の拡張交換コードのマルチバイト・データワー
    ドを第2の拡張交換コードのマルチバイト・データワー
    ドに変換するためのコンピュータ・システム。
  8. 【請求項8】前記コンピュータ・システムが、前記第1
    の拡張交換コードの前記マルチバイト・データワードの
    うちの任意のバイトが前記複数のオフセット・アレイの
    うちの前記対応するオフセット・アレイの範囲外にある
    ことに応答して、前記マルチバイト・データワードが無
    効であることを示す手段をさらに含むことを特徴とす
    る、請求項7に記載の第1の拡張交換コードのマルチバ
    イト・データワードを第2の拡張交換コードのマルチバ
    イト・データワードに変換するためのコンピュータ・シ
    ステム。
  9. 【請求項9】複数のオフセット・アレイを用意する前記
    手段が、前記変換マトリックスの各列へのオフセット・
    インデックスを有する第1のオフセット・アレイと、前
    記変換マトリックスの各行へのオフセット・インデック
    スを有する第2のオフセット・アレイとを用意する手段
    をさらに含むことを特徴とする、請求項6に記載の第1
    の拡張交換コードのマルチバイト・データワードを第2
    の拡張交換コードのマルチバイト・データワードに変換
    するためのコンピュータ・システム。
  10. 【請求項10】前記マルチバイト・データワードが各国
    語の1つの文字に対応することを特徴とする、請求項6
    に記載の第1の拡張交換コードのマルチバイト・データ
    ワードを第2の拡張交換コードのマルチバイト・データ
    ワードに変換するためのコンピュータ・システム。
  11. 【請求項11】コンピュータ・システム内で第1の拡張
    交換コードのマルチバイト・データワードを第2の拡張
    交換コードのマルチバイト・データワードに変換するた
    めにコンピュータ使用可能媒体に常駐するコンピュータ
    ・プログラム製品において、 複数のオフセット・アレイと、1つの変換マトリックス
    とを用意するプログラム・コード手段であって、前記複
    数のオフセット・アレイのそれぞれの各項目が前記変換
    マトリックスへのインデックスを付けるためのオフセッ
    ト・インデックスを含むプログラム・コード手段と、 前記複数のオフセット・アレイのうちの対応するオフセ
    ット・アレイから、前記第1の拡張交換コードの前記マ
    ルチバイト・データワードの各バイト用のインデックス
    値を返すプログラム・コード手段と、 返された前記インデックス値のすべてを加算して、前記
    変換マトリックスから前記第2の拡張交換コードの前記
    マルチバイト・データワードを求めるプログラム・コー
    ド手段とを含むコンピュータ・プログラム製品。
  12. 【請求項12】前記コンピュータ・プログラム製品が、
    前記第1の拡張交換コードの前記マルチバイト・データ
    ワードの各バイトが前記複数のオフセット・アレイのう
    ちの前記対応するオフセット・アレイの範囲内にあるこ
    とを検証するプログラム・コード手段をさらに含むこと
    を特徴とする、請求項11に記載のコンピュータ・シス
    テム内で第1の拡張交換コードのマルチバイト・データ
    ワードを第2の拡張交換コードのマルチバイト・データ
    ワードに変換するためにコンピュータ使用可能媒体に常
    駐するコンピュータ・プログラム製品。
  13. 【請求項13】前記コンピュータ・プログラム製品が、
    前記第1の拡張交換コードの前記マルチバイト・データ
    ワードのうちの任意のバイトが前記複数のオフセット・
    アレイのうちの前記対応するオフセット・アレイの範囲
    外にあることに応答して、前記マルチバイト・データワ
    ードが無効であることを示すプログラム・コード手段を
    さらに含むことを特徴とする、請求項12に記載のコン
    ピュータ・システム内で第1の拡張交換コードのマルチ
    バイト・データワードを第2の拡張交換コードのマルチ
    バイト・データワードに変換するためにコンピュータ使
    用可能媒体に常駐するコンピュータ・プログラム製品。
  14. 【請求項14】複数のオフセット・アレイを用意する前
    記プログラム・コード手段が、前記変換マトリックスの
    各列へのオフセット・インデックスを有する第1のオフ
    セット・アレイと、前記変換マトリックスの各行へのオ
    フセット・インデックスを有する第2のオフセット・ア
    レイとを用意するプログラム・コード手段をさらに含む
    ことを特徴とする、請求項11に記載のコンピュータ・
    システム内で第1の拡張交換コードのマルチバイト・デ
    ータワードを第2の拡張交換コードのマルチバイト・デ
    ータワードに変換するためにコンピュータ使用可能媒体
    に常駐するコンピュータ・プログラム製品。
  15. 【請求項15】前記マルチバイト・データワードが各国
    語の1つの文字に対応することを特徴とする、請求項1
    1に記載のコンピュータ・システム内で第1の拡張交換
    コードのマルチバイト・データワードを第2の拡張交換
    コードのマルチバイト・データワードに変換するために
    コンピュータ使用可能媒体に常駐するコンピュータ・プ
    ログラム製品。
JP10022379A 1997-02-05 1998-02-03 コンピュータ・システム内の交換コード間でマルチバイト文字ストリングを変換するための方法およびシステム Pending JPH10254833A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US08/795,504 US6032165A (en) 1997-02-05 1997-02-05 Method and system for converting multi-byte character strings between interchange codes within a computer system
US08/795504 1997-02-05

Publications (1)

Publication Number Publication Date
JPH10254833A true JPH10254833A (ja) 1998-09-25

Family

ID=25165688

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10022379A Pending JPH10254833A (ja) 1997-02-05 1998-02-03 コンピュータ・システム内の交換コード間でマルチバイト文字ストリングを変換するための方法およびシステム

Country Status (4)

Country Link
US (1) US6032165A (ja)
JP (1) JPH10254833A (ja)
KR (1) KR100305466B1 (ja)
TW (1) TW393616B (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19725790A1 (de) * 1997-06-18 1998-12-24 Fischer Gmbh Gert Verfahren zum selektiven Erfassen und Auslesen einer Zeichenkette
US7483938B2 (en) * 2001-09-27 2009-01-27 International Business Machines Corporation System for character validation and method therefor
US20030167357A1 (en) * 2002-03-04 2003-09-04 International Business Machines Corporation Enhancement of source code for execution on a computer platform that has a capability of employing a memory file

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3577142A (en) * 1969-02-28 1971-05-04 Westinghouse Learning Corp Code translation system
JPS57157346A (en) * 1981-03-24 1982-09-28 Canon Inc Code converter
US4594587A (en) * 1983-08-30 1986-06-10 Zenith Electronics Corporation Character oriented RAM mapping system and method therefor
US5309358A (en) * 1992-02-18 1994-05-03 International Business Machines Corporation Method for interchange code conversion of multi-byte character string characters
DE69328642T2 (de) * 1992-02-19 2001-01-11 Mitsubishi Denki K.K., Tokio/Tokyo Datenumsetzungsverfahren und Aufzeichnungs-/Wiedergabegerät zur Durchführung desselben

Also Published As

Publication number Publication date
KR100305466B1 (ko) 2001-10-29
US6032165A (en) 2000-02-29
KR19980070531A (ko) 1998-10-26
TW393616B (en) 2000-06-11

Similar Documents

Publication Publication Date Title
JP2502021B2 (ja) 多バイトデ―タ変換方法及びシステム
EP0294950B1 (en) A method of facilitating computer sorting
US6877003B2 (en) Efficient collation element structure for handling large numbers of characters
JP2782478B2 (ja) 自国言語サポートプログラムのテスト方法およびテスト装置
US5623261A (en) Method and system for translating keyed input within a data processing system
US20030122785A1 (en) User-friendly brahmi-derived hindi keyboard
KR100584038B1 (ko) 큰 문자 세트 브라우저
JP4451908B2 (ja) ユニコード・コンバータ
KR100632701B1 (ko) 네트워크를 통하여 접속된 폰트 서버들을 이용한 다국어번역 및 변환된 서체 이미지 데이터 제공 방법 및 시스템
JPH10254833A (ja) コンピュータ・システム内の交換コード間でマルチバイト文字ストリングを変換するための方法およびシステム
US11263408B2 (en) Alignment generation device and alignment generation method
CN101149669A (zh) 文字编码转换的方法
JP2001101172A (ja) マルチバイト・キャラクタ・コード化体系内で使用される単一バイト・キャラクタ処理の最適化の方法、システム、およびコンピュータ・プログラム製品
CN114595665A (zh) 一种二进制极短码字符词编码集的构建方法
JP2000148754A (ja) マルチリンガル・システム,マルチリンガル処理方法およびマルチリンガル処理のプログラムを記憶した媒体
KR20050043884A (ko) 중국어 데이타 및 사용자에 의해 정정된 데이타를작성하고 사용하는 방법 및 시스템
Peruginelli et al. Character sets: towards a standard solution?
JPH0546358A (ja) テキストデータの圧縮方法
JP2634926B2 (ja) かな漢字変換装置
Godwin-Jones Multilingual computing
TWI230341B (en) Kanji searching method using codes
JP2761622B2 (ja) 文字変換装置
JPH04127363A (ja) 注音字母組合わせコード制御方式
JPH0352102B2 (ja)
Gessesse Amharic Character Generator