JP2502021B2 - 多バイトデ―タ変換方法及びシステム - Google Patents

多バイトデ―タ変換方法及びシステム

Info

Publication number
JP2502021B2
JP2502021B2 JP5001171A JP117193A JP2502021B2 JP 2502021 B2 JP2502021 B2 JP 2502021B2 JP 5001171 A JP5001171 A JP 5001171A JP 117193 A JP117193 A JP 117193A JP 2502021 B2 JP2502021 B2 JP 2502021B2
Authority
JP
Japan
Prior art keywords
byte
value
code
data
array
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP5001171A
Other languages
English (en)
Other versions
JPH0683571A (ja
Inventor
グレッグ、ピー、アンドルーズ
チャン‐ミン、ワン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPH0683571A publication Critical patent/JPH0683571A/ja
Application granted granted Critical
Publication of JP2502021B2 publication Critical patent/JP2502021B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明はデータ処理システム間の
情報交換に関し、より詳細にはN‐バイトスパースデー
タセットストリングの他のスパースデータセットの他の
N‐バイトストリングへの変換に関する。更に詳細に述
べると、本発明は任意の16ビットデータコード間の2
バイト文字ストリングのIBMホストコード(IBM Host
Code)とIBM PCコード(IBM PC Code )間のよ
うな他の16‐ビットデータコードへの変換方法に関す
る。
【0002】
【従来の技術】データ処理システム間の情報交換には交
換される記号コードに対する意味づけに一致性が必要で
ある。いくつかの交換コードが共通に用いられ、従って
これらコード間の変換がしばしば必要となる。例えば、
1つの交換コード、IBM PCコードは、IBM P
S/2モデル55\パーソナルコンピュータに用いられ
る。IBM PCコードは文書日本語をカバーするため
の、情報交換用米国標準コード(American National St
andard Code for Information Exchange)(“ASCI
I”)の拡張である。他の交換コード、IBM社ホスト
コードはIBM社製の種々の主フレームシステムに用い
られる。IBMホストコードは拡張2進コード化10進
交換コード(Extended Binay-Codeel Decimal Intercha
nge Code)(EBCDIC)の同様の拡張である。
【0003】情報交換コードは言語についての文字セッ
トを限定する。必要な記号または文字は殆んどの言語に
おいてその数は比較的少い。例えば英語はわずか26個
のアルファベット文字を用い、夫々に大文字と小文字が
あるから全部で52の文字記号を有する。ドイツ語はこ
れに7個の記号すなわち3個の母音にウムラウトをつけ
たもの(共に大文字と小文字がある)およびギリシャ語
のベータの小文字、が加わる。同様のわずかの加入によ
りフランス語、オランダ語、スペイン語、イタリヤ語、
ポルトガル語および北欧諸語を書くことが出来る。他
方、10個の数字ですべての数を表わすことが出来る。
句読点や他の種々の通貨記号(例えば$、£、¥)のよ
うな種々の記号も必要である。いずれにおいてもそれら
文字のすべてを表わすには夫々8ビットの256バイト
を用いれば充分であることがわかっている。1バイト言
語の夫々について2セットの標準交換コードがある。こ
れらは情報交換用のASCIIと拡張2進コード化10
進交換コード(EBCDIC)を含む。1バイト言語に
ついて一つの交換コードから他への変換には256バイ
ト変換テーブルが必要である。
【0004】殆んどの言語とは異なり、中国語、日本
語、朝鮮語は256個を越える文字を含んでいる。古典
的な漢字は13000個を越える文字を利用する。日本
語は3000〜8000個の漢字と数字、ひら仮名、片
仮名等の数百個の他の記号を利用する。交換コード間の
変換は、日本語、朝鮮語、旧中国語および新中国語につ
いての文字セットが内容およびサイズにおいて異なるた
め更に複雑となる。そのような大きな文字ベースを扱う
ために、それらの言語についての交換コードセットは各
文字について16ビットすなわち2バイトを用いる。こ
れにより65536(216)文字を表わすことが出来
る。2バイト文字セットはいくつかの方法で組織されて
いる。日本語については4つの異なる文字セットが現在
種々のコンピュータで用いられている。朝鮮語は5セッ
ト、旧中国語は2セットを用いる。“LARGE”に対
応する漢字「大」はIBMホストコードでは‘455
B’、IBM PCコードでは‘91E5’、漢字割当
番号コード(Kanji Assigned Number Code)では‘13
71’、そしてJISコードでは‘3471’である。
これらの数字はすべて16進法である。
【0005】
【発明が解決しようとする課題】理論的には1バイト交
換コード間の変換に用いられるのと同様の方法が2バイ
ト変換に使用しうる。しかしながら応用に当ってはその
ような方法は1バイト言語についてより著しく大きなメ
モリを必要とする。1バイト言語用の変換テーブルはそ
の長さが256バイトであるにすぎない。1つの2バイ
ト言語についての変換テーブルの長さは128キロバイ
トを越えるものとなる。
【0006】2バイト文字セット(DBCS)変換用の
従来の方法は個々の2バイト文字に対しその有効性を決
定するために一連の言語依存比較を利用する。これらス
テップは要するに一連の範囲比較である。その文字の有
効性が決定されてしまうと、言語依存法が用いられてそ
の文字について配列指標を2バイトの256入力×25
6入力変換アレイに入れさせる。これらアレイ指標はそ
の変換アレイから適正な文字を回復するために用いられ
る。
【0007】交換コード間の変換には関係しないが米国
特許第4701746号明細書には従来の方法の範囲比
較および指標発生部分を簡略化するために応用しうる方
法が示されている。この明細書は16ビットのコード信
号の13ビットのコード信号へのコード変換装置を示し
ており、基本的に一連のスパースデータ項目の連続基準
値への変換を可能にする。これは日本語の文字セットサ
イズが大きいにも拘ず、2バイト文字の完全なテーブル
について128kバイトに近いメモリスペースを必要と
しない。しかしながら、この米国特許の技術は最大約8
000のデータ項目を扱うことが出来るにすぎない。そ
れ故これは旧あるいは新中国語には適用出来ないし、ま
た一般にこれは多バイトシステムには適用出来ない。ま
た、これは本発明と比較して誤りチェック能力が低い。
【0008】それ故本発明の目的はデータ処理システム
間の情報交換方法を提供することである。
【0009】本発明の他の目的は一つの交換コードから
他への2バイト文字ストリング(DBCS)の変換方法
を提供することである。
【0010】本発明の更に他の目的はIBM PCコー
ドとIBMホストコード間での2バイト文字ストリング
の変換方法を提供することである。
【0011】本発明の他の目的は複数の言語について2
バイト文字ストリングで表わされる文字の変換方法を提
供することである。
【0012】
【課題を解決するための手段】第1の変換コードにおけ
る一つの文字の2バイト表現の2バイト変換アレイから
回復された第2の変換コードにおけるその文字の2バイ
ト表現への変換が、第1コードでの文字表現の第1およ
び第2バイトからそのアレイに列および行指標を発生す
ることで行われる。このために、第1交換コードにおけ
る文字についての2バイト表現の夫々第1および第2バ
イトについての第1および第2言語検査アレイが設けら
れる。
【0013】
【作用】この第1バイトは第1言語検査アレイに対して
比較されて第1値をもどす。第2バイトは第2言語検査
アレイに対して比較されて第2値をもどす。これら第1
および第2値は第1および第2範囲限界に対して夫々検
査され、それら限界に適合すると上記もどされた値を言
語2バイト変換テーブルへの指標として認可する。
【0014】第1範囲限界内の第1値および第2範囲限
界内の第2値のもどりに応じてこれら第1および第2値
は2バイト変換テーブルへの指標値として用いられる。
この指標値は第2交換コード内のその文字についての2
バイト表現を回復するために用いられる。他方、第2バ
イトについての検査ステップで範囲限界外値がもどされ
ると、無効インジケーションがもどされる。第1バイト
についての検査ステップから範囲限界外値のもどりおよ
び第2バイトについての範囲限界内値のもどりに応じ
て、第1バイトについてのもどり値が無効文字値、特殊
処理文字値および留保文字値に対して比較されそしてそ
れらの値の一つを翻訳プロセスの出力としてもどす。
【0015】
【実施例】図1は本発明の方法およびシステムを実施す
るために利用することの出来る分散データ処理システム
8のブロック図である。図示のように、分散データ処理
システム8はIBM社のPS55\パーソナルコンピュ
ータにより与えられると好適であるパーソナルコンピュ
ータ10と、同じくIBM社のAS/400\のような
中間レンジコンピュータシステム12を含む。パーソナ
ルコンピュータシステム10用のユーザインターフェー
スはビデオディスプレイ装置14とキーボード16を含
む。概念“LARGE”を表わす漢字およびその拡張A
SCIIまたはIBM PCコード16進2バイト文字
ストリング“91E5”(16進法)がビデオディスプ
レイ装置14のボックス15内に示してある。
【0016】パーソナルコンピュータシステム10は機
能的に示されている。ディスプレイ装置14はコンピュ
ータ10内の中央処理装置(CPU)18の制御を受け
る。また直接アクセス記憶装置20,22とシステムメ
モリ24がこのCPU18にアクセスしうる。通信アダ
プタ26はコンピュータシステム10と12の間のネッ
トワークを介してチャンネルリンク27に対してインタ
ーフェースとなる。
【0017】コンピュータシステム12はコンピュータ
システム10のようなネットワーク端末にサービスを行
うホスト装置として作用する。コンピュータシステム1
2は中央処理装置(CPU)28を含み、このCPU2
8は通信アダプタ30を通じ、通信リンク27を介して
データを受ける。CPU28はディスプレイ装置32を
制御しそしてキーボード34を介してユーザ入力を受け
る。ディスプレイ装置32のボックス33内には“larg
e ”に対応する漢字およびそのIBMホストコード2バ
イト文字ストリング“455B”(16進法)が表示さ
れている。コンピュータシステム12は更にシステムメ
モリ36と直接アクセス記憶装置38,40を含む。
【0018】コンピュータシステム10と12の間で伝
送される文字ストリングは、それらにより表わされる情
報が失われたり完全に不明瞭とされるべきでなかったり
するならば交換コード間で変換されねばならない。“L
ARGE”に対応する漢字についての文字ストリングの
変換を次に述べる。この実施例ではそのような変換はネ
ットワークの端末、例えばパーソナルコンピュータシス
テム10内で生じる。コンピュータシステム10につい
てのシステムメモリ24にはIBM PCコード2バイ
ト文字ストリングのIBMホストコード2バイト文字ス
トリングへの変換用のプログラム43並びに第1バイト
検査テーブル42、第2バイト検査テーブル44、およ
び変換テーブル46があり、これらテーブルのすべては
変換プログラムにより使用されるものである。
【0019】図2は本発明の変換方法を示すフローチャ
ートである。このプロセスは原始交換コード内の2バイ
ト文字ストリングとしてコード化された文字が入ること
によりはじまる。目標コードの識別は宛先機械の識別か
ら決定される。ステップ50において、2個の変数、In
dex 1とIndex 2が定義され、そして原始交換コードか
ら目標交換コードへの変換用の特殊機能についての適正
なテーブル、範囲限界およびトリガー値が直接アクセス
記憶装置20または22からとり出されてシステムメモ
リ24に入れられる。すべての言語およびすべての交換
コードについて一つのプログラムが使用されるが、上記
テーブル、範囲限界およびおそらくトリガー値は一つの
言語および交換コードに特定のものである。これらトリ
ガー値は夫々256バイトの2つの検査テーブルの夫々
における有効指標についての最大16進値(範囲限界)
に等しいかあるいはそれより大である。次に示すテーブ
ル1〜4は日本文字の表現をIBM PCコードからI
BMホストコードに変換する際に使用するテーブルの例
である。
【0020】テーブル1はそのルーチンを示し、そのす
べてのトリガー値はO×FOhex の範囲限界値に少くと
も等しいかそれより大である。なお、サフィクスhex は
16進数であることを示す。
【0021】 256バイトからなる第2バイト検査テーブルは2つの
検査機能の内の一つを行うために用いられる。ステップ
52は第2バイト検査テーブルを用いる検査機能の解を
示す。この検査機能: (1) Index 2=v2 (a2 ) 但しa2 は2バイト文字ストリングの第2バイトであ
り、また第2バイトを、Index 2についての値にもどす
ための第2バイト検査アレイへのアドレスとして用いる
テーブル索引オペレーションである。有効指標値または
無効文字を示すトリガー値がこのオペレーションからも
どされる。第2バイト用の検査テーブルの一例をテーブ
ル2に再生する。
【0022】
【表1】 ステップ54で値Index 2がアレイ用の範囲限界と比較
されて有効文字入力が入ったかどうかを決定する。トリ
ガー値がIndex 2についてもどされれればその変数は範
囲限界を越えそしてステップ56で無効インジケーショ
ンが与えられる。この特定の文字に関してはそれ以上の
オペレーションは行われない。Index 2の値が有効文字
を示していれば、ステップ58でIndex 1についての検
査機能v1が解かれる。
【0023】テーブル3はVERIFY1であり、これ
は2バイト文字ストリングからの第1バイトを入力変数
として用いる検査アレイである。この検査機能: (2) Index 1 =v1(a1 ) 但しa1 はこの2バイト文字ストリングの第1バイト、
はIndex 1の値をもどすために検査アレイへのアドレス
として第1バイトを用いるテーブル索引オペレーション
である。a1 についての検査テーブルはa2 についての
テーブルとはいく分異る。_i_(“FF”hex )がそ
のテーブルからもどされるとすれば、2バイト文字スト
リング全体が無効である。このテーブルが_r_(“F
E”hex)をもどすなら、その文字は留保される。これ
は将来有効となりうるが今はそうでない文字を示す。こ
のテーブルが_s_(“FD”hex )をもどすなら、そ
の文字は特殊な処理を必要とすることを示す。「特殊な
処理」とはユーザ定義の文字または簡単に変換可能な漢
字の或る範囲についての変換のような、本発明ではな
く、従来周知の変換を行うために使用出来るものであ
る。
【0024】
【表2】 ステップ60でIndex 1についてのもどされた値がアレ
イについての範囲限界内かどうかを決定する。範囲外で
あればステップ64が実行されてIndex 1の値を無効文
字を示すトリガー値と比較する。Index 1がこのトリガ
ー値に等しければステップ66が実行されてエラー信号
を発生する。この文字に関するそれ以上のオペレーショ
ンは実行されない。
【0025】Index 1がトリガー値に等しくなければス
テップ64に入る。ステップ68でIndex 1は留保値を
示すトリガー値と比較され、ユーザプログラムの文字の
ような留保値が一つの文字として受けられたかどうかを
決定する(ステップ70)。受けとられなかった場合に
は特殊処理を要求するものとされる(ステップ72)。
そのような特殊な機能文字のもどりに関連したオペレー
ションをこのとき扱うことが出来る。
【0026】ステップ60において範囲限界未満であれ
ばステップ74で実際の変換動作を行う。Index 1とIn
dex 2は新しい交換コードにおける元の文字についての
文字ストリングを回復するための2バイト変換アレイへ
のローおよびコラム指標を与える。テーブル4はそのよ
うなアレイの部分再生であり、第1の16進数すなわち
“$”符号に続く4個の文字が目標IBMホストコード
であり、カッコ内の第2の16進入力はIBM PCコ
ードであってこのアレイの部分ではない。第2入力はI
BM PCコードにもどすために使用されることにな
る。この変換機能の実行からのもどりは新2バイト文字
ストリング: (3) RESULT=t(Index 1,Index 2) である。
【0027】
【表3】 テーブル5は上記のプロセス用の擬似コードプログラム
である。
【0028】 図3〜5において、“large ”に対応する漢字について
の文字ストリングのコンピュータシステム10について
の交換コードからコンピュータシステム12についての
交換コードでの文字ストリングへの変換のためのデータ
構造を示す。例示の便宜上、テーブル2〜4に対応する
これら図の全体を16進ではなく10進表記で表わす。
前記のように漢字用の16進2バイト文字ストリングは
“91E5”hex である。各バイトは別々に扱われる。
かくして“91”hex と“E5”hex が検査機能につい
て独立の変数を与える。“91”hex と“E5”hex の
10進等価は夫々145と229である。
【0029】第1バイトについての検査機能はデータ構
造102で決定される。16進数“00”から“FF”
は10進整数0から255となる。入力0〜255の夫
々は“i”,“r”,“s”または“0”から“41”
のいずれかの値に対応する。変換アレイへの指標である
“0”〜“41”について一つの対応が許される。10
進表記に変換された2バイト文字ストリングの第1バイ
トは145である。この図の145に対応するのはブロ
ック104で示すように10進整数13であり、これは
第1検査機能の解としてもどされる。
【0030】第2バイトの検査関数はデータ構造106
で決定される。ここでも16進数“00”〜“FF”は
10進数0〜255になる。入力0〜255の夫々は
“i”または“0”〜“187”のいずれかの値に対応
する。ここでも“0”〜“187”はそのデータ構造内
の夫々に一回のみ生じる。10進表記に変換された2バ
イト文字ストリングの第2バイトは229である。この
図で229に対応するのはブロック108で示すように
10進数164であり、これは第2検査関数の解として
もどされる。
【0031】マトリクス110は日本文字についての変
換アレイであり、固有に割当てられる検査関数の結果の
範囲に対応させて188個の列(0から187)と42
個の行(0から41)を有する。テーブル4とは異り、
IBMホストコードのみを示している。かくして、検査
関数の解はi,rまたはs以外であるとすれば変換され
た2バイトストリングの行と列を示す。従って、行13
(112で示す)と列164(114で示す)に共通の
位置116は所望の結果、すなわち“455B”hex で
ある。
【0032】
【発明の効果】本発明は朝鮮語、日本語、旧中国語およ
び新中国語についての交換コード間の文字変換用の、固
有の言語変換と検査テーブルを利用して実行される単一
のプログラムを提供するものである。更に、オペレーシ
ョンは従来の方法より簡略化され、変換を達成するため
のオペレーティング時間が減少する。図3〜5のデータ
構造から明らかなように、この変換および検査テーブル
に必要なメモリスペースは128kバイトよりはるかに
少い。漢字、ひら仮名、片仮名および数字を含む日本語
についての変換アレイおよび一方向変換用の2つの検査
アレイの占めるメモリ容量はわずかに1630バイトに
すぎない。
【0033】本発明は2バイト文字表現を一つの交換コ
ードから他のコードに変換することについて述べたが、
変換されるバイトは表示可能な文字を表わす必要はな
い。これらバイトは任意の有意値セットからの項目を表
わすことが出来る。本発明の利点はそれら有意の値が連
続でないとき得られる。本発明は2バイト値を変換する
方法であるが、これは多バイト値を一つのデータセット
から他のセットに変換することに拡張出来る。2バイト
変換は2つの検査アレイと一つの2次元変換アレイを用
いる。3バイト変換法は三つの検査アレイと一つの3次
元変換アレイを用いることにある。これはnバイト変換
に拡張出来る。
【図面の簡単な説明】
【図1】分散データ処理システムのブロック図。
【図2】2バイト文字に適用された本発明の変換方法を
示すフローチャート。
【図3】多バイト文字ストリングの第1バイトについて
の検査アレイのデータ構造を示す図。
【図4】多バイト文字ストリングの第2バイトについて
の検査アレイのデータ構造を示す図。
【図5】変換アレイのデータ構造を示す図。
【符号の説明】
8 分散データ処理システム 10 パーソナルコンピュータシステム 12 ミッドレンジコンピュータシステム 14,32 ビデオディスプレイ装置 16 キーボード 18,28 中央処理装置(CPU) 20,22,38,40 直接アクセス記憶装置 24 システムメモリ 26,30 通信アダプタ 27 チャンネルリンク 43 プログラム 42 第1バイト検査テーブル 44 第2バイト検査テーブル 46 変換テーブル
───────────────────────────────────────────────────── フロントページの続き (72)発明者 チャン‐ミン、ワン アメリカ合衆国ミネソタ州、ロチェスタ ー、エヌ、イー、セブンティーンス、ス トリート、2017

Claims (8)

    (57)【特許請求の範囲】
  1. 【請求項1】第1交換コードでのデータの多バイト表記
    を第2交換コードでのそのデータの多バイト表記に変換
    する方法であって、 上記第1交換コードでのデータの多バイト表記の各バイ
    トをそのバイトに関連する固有の検査アレイを利用して
    検査するステップ、 上記第1交換コードでのデータの上記多バイト表記の各
    バイトについての指標値を検査の成功に応じて上記関連
    する検査アレイからもどすステップ、及び 多次元変換マトリクス内の第2交換コードでのデータの
    多バイト表記をアクセスするために上記もどされた指標
    値を利用するステップを有する多バイトデータ変換方
    法。
  2. 【請求項2】前記各バイトを検査するステップは、 前記バイトをその関連する固有の検査アレイへの指標と
    して利用するステップ、 上記関連する固有の検査アレイから一つの値をもどすス
    テップ、 上記もどされた値と範囲限界とを比較するステップ、及
    び上記もどされた値が上記範囲限界内であることに応じ
    て上記もどされた値を指標値として使用しうるようにす
    る検査の成功を示すステップを含んでいる請求項1の方
    法。
  3. 【請求項3】前記データは文書言語での文字に対応する
    ものである請求項2の方法。
  4. 【請求項4】前記もどされた値が前記範囲限界外のとき
    検査の不成功を示すステップを更に含む請求項2の方
    法。
  5. 【請求項5】第1交換コードでのデータの多バイト表記
    を第2交換コードでのそのデータの多バイト表記に変換
    するためのコンピュータシステムであって、 上記第1交換コードでのデータの多バイト表記の各バイ
    トをそのバイトに関連する固有の検査アレイを利用して
    検査する手段、 上記第1交換コードでのデータの上記多バイト表記の各
    バイトについての指標値を、検査の成功に応じて上記関
    連する検査アレイからもどすための手段、及び多次元変
    換マトリクス内の第2交換コードでのデータの多バイト
    表記をアクセスするために上記もどされた指標値を利用
    する手段を備えたコンピュータシステム。
  6. 【請求項6】前記検査する手段は、 前記バイトをその関連する固有の検査アレイへの指標と
    して利用するための手段、 上記関連する固有の検査アレイから一つの値をもどすた
    めの手段、 上記もどすための手段からのもどされた値を少くとも第
    1の範囲限界と比較するための手段、及び上記少くとも
    第1の範囲限界内である上記もどされた値に応じて検査
    の成功を示すと共に上記もどされた値を指標値として修
    飾するための手段を含んでいる請求項5のコンピュータ
    システム。
  7. 【請求項7】前記データは文書言語についての交換コー
    ドで表わされる文字に対応するものである請求項6のコ
    ンピュータシステム。
  8. 【請求項8】前記もどされた値が前記少くとも第1範囲
    限界以上であるとき検査の不成功を示すための手段を更
    に含む請求項6のコンピュータシステム。
JP5001171A 1992-02-18 1993-01-07 多バイトデ―タ変換方法及びシステム Expired - Fee Related JP2502021B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US837228 1986-03-07
US07/837,228 US5309358A (en) 1992-02-18 1992-02-18 Method for interchange code conversion of multi-byte character string characters

Publications (2)

Publication Number Publication Date
JPH0683571A JPH0683571A (ja) 1994-03-25
JP2502021B2 true JP2502021B2 (ja) 1996-05-29

Family

ID=25273874

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5001171A Expired - Fee Related JP2502021B2 (ja) 1992-02-18 1993-01-07 多バイトデ―タ変換方法及びシステム

Country Status (5)

Country Link
US (1) US5309358A (ja)
JP (1) JP2502021B2 (ja)
KR (1) KR970003322B1 (ja)
CN (1) CN1043383C (ja)
TW (1) TW325541B (ja)

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5689723A (en) * 1993-02-03 1997-11-18 International Business Machines Corp Method for allowing single-byte character set and double-byte character set fonts in a double-byte character set code page
US5784069A (en) * 1995-09-13 1998-07-21 Apple Computer, Inc. Bidirectional code converter
US5784071A (en) * 1995-09-13 1998-07-21 Apple Computer, Inc. Context-based code convertor
WO1997010556A1 (en) * 1995-09-13 1997-03-20 Apple Computer, Inc. Unicode converter
US6185729B1 (en) * 1996-03-04 2001-02-06 Sun Microsystems, Inc. Multibyte locale for single byte languages
US5802482A (en) * 1996-04-26 1998-09-01 Silicon Graphics, Inc. System and method for processing graphic language characters
US6032165A (en) * 1997-02-05 2000-02-29 International Business Machines Corporation Method and system for converting multi-byte character strings between interchange codes within a computer system
US6085199A (en) * 1997-11-24 2000-07-04 International Business Machines Corporation Method for distributing a file in a plurality of different file formats
US6560596B1 (en) * 1998-08-31 2003-05-06 Multilingual Domains Llc Multiscript database system and method
US6204782B1 (en) 1998-09-25 2001-03-20 Apple Computer, Inc. Unicode conversion into multiple encodings
GB2343024A (en) * 1998-10-22 2000-04-26 Ibm Efficient data conversion of list of strings
US6453462B1 (en) 1999-06-29 2002-09-17 International Business Machines Corporation Mock translation system, method, and program using multi-byte placeholder characters to test translatability of software that will display multi-byte languages
US6425123B1 (en) * 1999-06-29 2002-07-23 International Business Machines Corporation System, method, and program for testing translatability of software by using english multi-byte transliteration creating double-wide characters
US6507812B1 (en) 1999-06-29 2003-01-14 International Business Machines Corporation Mock translation method, system, and program to test software translatability
US6546365B1 (en) 2000-02-04 2003-04-08 International Business Machines Corporation System for national language support and automated translation table
EP1193724B1 (en) 2000-09-18 2010-02-17 Isuzu Motors Limited Eddy current retarder comprising a magnet consisting of an electromagnet and a permanent magnet
US7900143B2 (en) * 2000-12-27 2011-03-01 Intel Corporation Large character set browser
US6393445B1 (en) * 2001-01-04 2002-05-21 Institute For Information Industry System for transforming Chinese character forms in real-time between a traditional character form and a simplified character form
US7013422B2 (en) * 2001-06-15 2006-03-14 International Business Machines Corporation Noise removal in multibyte text encodings using statistical models
US7483938B2 (en) * 2001-09-27 2009-01-27 International Business Machines Corporation System for character validation and method therefor
JP4308676B2 (ja) * 2003-01-24 2009-08-05 株式会社リコー 文字列処理装置,文字列処理方法および画像形成装置
CN101079023B (zh) * 2003-01-24 2012-03-21 株式会社理光 字符串处理装置、字符串处理方法和成像装置
US20050010391A1 (en) * 2003-07-10 2005-01-13 International Business Machines Corporation Chinese character / Pin Yin / English translator
US20050010392A1 (en) * 2003-07-10 2005-01-13 International Business Machines Corporation Traditional Chinese / simplified Chinese character translator
US8137105B2 (en) * 2003-07-31 2012-03-20 International Business Machines Corporation Chinese/English vocabulary learning tool
US20050027547A1 (en) * 2003-07-31 2005-02-03 International Business Machines Corporation Chinese / Pin Yin / english dictionary
US7421385B2 (en) * 2004-04-16 2008-09-02 Taiwan Semiconductor Manufacturing Company, Ltd. Method and system of processing data that contain asian language characters
JP4535130B2 (ja) * 2004-12-09 2010-09-01 三菱電機株式会社 文字列照合装置および文字列照合プログラム
US7516062B2 (en) * 2005-04-19 2009-04-07 International Business Machines Corporation Language converter with enhanced search capability
CN100385375C (zh) * 2005-07-15 2008-04-30 光宝科技股份有限公司 字符输入系统及其方法
JP4363533B2 (ja) * 2007-01-31 2009-11-11 インターナショナル・ビジネス・マシーンズ・コーポレーション 文字化けを検出するための装置、方法、及びプログラム
JP6491438B2 (ja) * 2014-08-29 2019-03-27 株式会社日立社会情報サービス マイグレーション支援装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57157346A (en) * 1981-03-24 1982-09-28 Canon Inc Code converter
US4559614A (en) * 1983-07-05 1985-12-17 International Business Machines Corporation Interactive code format transform for communicating data between incompatible information processing systems
JPS6226535A (ja) * 1985-07-22 1987-02-04 インタ−ナショナル ビジネス マシ−ンズ コ−ポレ−ション プログラム内の変換テ−ブルの修正方法

Also Published As

Publication number Publication date
KR930018398A (ko) 1993-09-21
TW325541B (en) 1998-01-21
KR970003322B1 (ko) 1997-03-17
CN1043383C (zh) 1999-05-12
US5309358A (en) 1994-05-03
JPH0683571A (ja) 1994-03-25
CN1075563A (zh) 1993-08-25

Similar Documents

Publication Publication Date Title
JP2502021B2 (ja) 多バイトデ―タ変換方法及びシステム
US5784069A (en) Bidirectional code converter
JP2782478B2 (ja) 自国言語サポートプログラムのテスト方法およびテスト装置
US5623261A (en) Method and system for translating keyed input within a data processing system
US5418718A (en) Method for providing linguistic functions of English text in a mixed document of single-byte characters and double-byte characters
US20050171949A1 (en) Method and system for mapping strings for comparison
US7251667B2 (en) Unicode input method editor
WO1994025922A1 (en) Text input transliteration system
US6055365A (en) Code point translation for computer text, using state tables
KR100584038B1 (ko) 큰 문자 세트 브라우저
JP4451908B2 (ja) ユニコード・コンバータ
US6738763B1 (en) Information retrieval system having consistent search results across different operating systems and data base management systems
WO1997010556A1 (en) Unicode converter
US6032165A (en) Method and system for converting multi-byte character strings between interchange codes within a computer system
JPS6246029B2 (ja)
JP2629040B2 (ja) 日本語処理システム
Liu Chinese information processing
JP3809238B2 (ja) 文書処理方法及びその装置
JPH0628060B2 (ja) 文字処理装置
JPH04332073A (ja) 文字処理方法及びその装置
JPH0816908B2 (ja) 文字処理装置及び文字処理方法
JPH05108616A (ja) 文書処理装置
JPH0512251A (ja) 文書処理装置
JPH02255936A (ja) 文書作成編集装置
JPH04332074A (ja) 文字処理方法及びその装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees