JPH11328160A - 文字コード変換処理装置、文字コード変換処理方法、文字コード変換処理プログラムを記録した記録媒体 - Google Patents

文字コード変換処理装置、文字コード変換処理方法、文字コード変換処理プログラムを記録した記録媒体

Info

Publication number
JPH11328160A
JPH11328160A JP10130444A JP13044498A JPH11328160A JP H11328160 A JPH11328160 A JP H11328160A JP 10130444 A JP10130444 A JP 10130444A JP 13044498 A JP13044498 A JP 13044498A JP H11328160 A JPH11328160 A JP H11328160A
Authority
JP
Japan
Prior art keywords
character code
code
character
language
conversion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10130444A
Other languages
English (en)
Inventor
Kaito Rai
海涛 雷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP10130444A priority Critical patent/JPH11328160A/ja
Publication of JPH11328160A publication Critical patent/JPH11328160A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】 【課題】互いに異なるコード体系で変換不能な文字があ
る場合に、その文字の読みをASCIIコードで表すこ
とで、コード変換時の情報ロスを防ぐ。 【解決手段】文字コード変換テーブル26には、中国語
(第1の言語)の文字コードと日本語(第2の言語)の
文字コードとが対応付けられており、特に日本語の文字
コード体系に存在しない中国語の文字コードに関しては
その中国語文字の読みがASCIIコードで記述されて
いる。コード変換部25は文字コード変換テーブル26
を参照して中国語から日本語へのコード変換を行う。そ
の際に、変換不能な文字があれば、その文字の読みに対
応するASCIIコードを出力することで、コード変換
時の情報ロスを防ぐ。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、ある言語の文字コ
ードを文字コード体系が異なる他の言語の文字コードに
変換する文字コード変換処理装置であって、特に中国語
の文字コードから日本語等の他の言語の文字コードへの
変換あるいは他の言語の文字コードから中国語の文字コ
ードへの変換を行う場合に用いて好適な文字コード変換
処理装置と、同装置に用いられる文字コード変換処理方
法、文字コード変換処理プログラムを記録した記録媒体
に関する。
【0002】
【従来の技術】従来、この種のコード変換方式として
は、例えば特願平2−58617号公報に記載されてい
るように、互いに異なるコード体系の文字コード同士を
対応付けたコード変換表を用いて、ある言語の文字コー
ドを他の言語の文字コードに変換するのが一般的であ
る。このようなコード変換方式を用いれば、互いに異な
るコード体系(例えば中国語と日本語のコード体系)に
ある文字同士を変換することができるため、ある特定な
言語に依存しているコンピュータシステムであっても
も、他の言語の文字を取り扱うことができる。
【0003】しかしながら、互いに異なるコード体系に
おいて、すべての文字コードを完全に対応付けることは
できず、中には必ず対応不能な文字コードつまりコード
変換不能な文字コードが存在する(図15参照)。この
ようなコード変換不能な文字に対して、上述した特願平
2−58617号公報など、従来のコード変換方式に
は、具体的な対策は施されていなかった。
【0004】
【発明が解決しようとする課題】上記したように、従
来、互いに異なるコード体系(例えば中国語と日本語の
コード体系)において、コード変換不能な文字について
は何ら対策が施されていなかった。このため、コード変
換時に情報ロスが生じることになり、これは多言語の文
字コードを扱うコンピュータシステムにとって大きな問
題であった。
【0005】本発明は上記のような点に鑑みなされたも
ので、互いに異なるコード体系で変換不能な文字がある
場合に、その文字の読みをASCIIコードで表すこと
で、コード変換時の情報ロスを防ぐことができ、そのA
SCIIコードを元の言語の文字コードに正しく戻すこ
とのできる文字コード変換処理装置、文字コード変換処
理方法、文字コード変換処理プログラムを記録した記録
媒体を提供することを目的とする。
【0006】
【課題を解決するための手段】本発明の請求項1は、第
1の言語の文字コードを文字コード体系が異なる第2の
言語の文字コードに変換する文字コード変換処理装置で
あって、第1の言語の文字コードと第2の言語の文字コ
ードとを対応付けた文字コード変換テーブルであって、
第2の言語の文字コード体系に存在しない第1の言語の
文字コードに関してはその文字の読みをASCIIコー
ドで記述した文字コード変換テーブルと、第1の言語の
文字コードからなる文字列をコード変換対象として取得
するコード変換対象取得手段と、このコード変換対象取
得手段によって得られた文字列を上記コード変換テーブ
ルを参照して第2の言語の文字コードに変換するもので
あり、当該文字コードに対応する第2の言語の文字コー
ドが存在しない場合に、その文字の読みに対応するAS
CIIコードを出力するコード変換手段とを具備したこ
とを特徴とする。
【0007】このような構成によれば、第1の言語の文
字コードから第2の言語の文字コードへのコード変換に
際し、変換対象となる第1の言語の文字コードに対応す
る第2の言語の文字コードが存在しない場合に、その文
字の読みに対応するASCIIコードが出力される。
【0008】例えば、第1の言語の文字コードが中国語
であれば、その読み表記であるピンインがASCIIコ
ードで表される。このように、コード変換不能な文字の
読みを汎用性の高いASCIIコードで表すことで、文
字として出力することができるため、コード変換時の情
報ロスを防ぐことができる。
【0009】また、本発明の請求項2は、上記請求項1
の文字コード変換処理装置において、第1の言語の文字
の読みと見出しを記憶した単語辞書と、上記コード変換
手段によって変換された第2の言語の文字コードを元の
第1の言語の文字コードに逆変換する場合に、上記AS
CIIコードで表された部分を読みとして上記単語辞書
を検索し、その読みに対応する見出しの文字コードを元
の第1の言語の文字コードとして出力する逆変換手段と
を具備したことを特徴とする。
【0010】このような構成によれば、コード変換され
た第2の言語の文字コードを元の第1の言語の文字コー
ドに逆変換する場合において、ASCIIコードで表さ
れた部分を読みとして単語辞書が検索され、その読みに
対応する見出しの文字コードが元の第1の言語の文字コ
ードとして出力される。
【0011】例えば、第1の言語の文字コードが中国語
であれば、その読み表記であるピンインがASCIIコ
ードで表される。このASCIIコードを元の中国語の
文字コードに逆変換する場合には、当該ASCIIコー
ドをピンイン読みとする中国語文字(漢字)が単語辞書
から検索され、その検索結果として得られる文字のコー
ドデータが元の文字コードとして出力される。
【0012】
【発明の実施の形態】以下、図面を参照して本発明の一
実施形態を説明する。図1は本発明の文字コード変換処
理装置を用いた中国語入力変換処理装置のシステム構成
を示すブロック図である。なお、本実施形態における中
国語入力変換処理装置は、例えば磁気ディスク等の記録
媒体に記録されたプログラムを読み込み、このプログラ
ムによって動作が制御されるコンピュータによって実現
される。
【0013】図1に示すように、本実施形態における中
国語入力変換処理装置は、CPU11、メモリ12、入
力装置13、表示装置14、外部記憶装置15、印刷装
置16、通信装置17によって構成される。
【0014】CPU11は、本装置の動作全体を制御す
るものであり、メモリ12に格納されたプログラムの起
動で動作する。なお、メモリ12に格納されたプログラ
ムに基づいて実現される機能としては、アプリケーショ
ンプログラムによるワードプロセッサ等がある。
【0015】メモリ12は、例えばROMやRAMから
なり、本装置で使用される各種プログラムやフォント等
のデータを格納する。このメモリ12には、ワードプロ
セッサを実現するアプリケーションプログラムなどのプ
ログラムデータを格納するためのプログラム領域12a
の他、入力バッファ12b、候補バッファ12c、文書
バッファ12dなどが設けられている。
【0016】入力バッファ12bは、文書作成のために
入力された中国語漢字の読みであるピンイン文字列を格
納する。候補バッファ12cは、ピンイン漢字変換によ
って得られた変換候補を格納する。文書バッファ12d
は、ピンイン漢字変換によって得られた中国語漢字から
なる文書データを格納する。
【0017】入力装置13は、キーボードからなり、本
装置に対する指示やデータの入力を行うものであり、中
国語の読み表記であるピンイン文字列の入力や、その入
力されたピンイン文字列に対するピンイン漢字変換指示
(「変換」キーの操作による指示)や単漢字変換指示
(「単漢字」キーの操作による指示)などを行うための
ものである。
【0018】表示装置14は、例えばCRT (Cathode
Ray Tube) やLCD (Liquid Crystal Display) からな
り、入力装置13を通じて入力されたピンイン文字列や
ピンイン漢字変換結果などの表示を行う。
【0019】外部記憶装置15は、例えばHDD (Hard
Disk Drive)やCD−ROM (Compact Disc Read Only
Memory)からなり、各種プログラムや文書などのデータ
を保存する。この外部記憶装置15には、ワードプロセ
ッサを実現するためのアプリケーションプログラムの
他、ピンイン漢字変換処理で使用する辞書などのデータ
も含まれる。
【0020】印刷装置16は、文書の印刷等を行うため
に用いられる。この印刷装置16としては、本装置に内
蔵されたものでも、外付けにて接続されるものでも良
い。また、通信装置17は、例えば構内LAN (Local
Area Network) や通信ネットワーク等を介して外部装置
とのデータの送受信制御を行う。
【0021】次に、図1に示すシステム構成によって実
現される中国語入力変換処理装置の機能構成について説
明する。図2は図1のシステム構成によって実現される
中国語入力変換処理装置の機能構成を示すブロック図で
ある。図2に示すように、本実施形態における中国語入
力変換処理装置は、入力部21、制御部22、辞書検索
部23、単語辞書24、コード変換部25、文字コード
変換テーブル26、出力部27を有する。
【0022】入力部21は、コード変換対象となる中国
語の文字コードからなる文字列の入力処理を行う。制御
部22は、システム全体の制御を行うものであり、異な
る言語体系の文字コード間の変換処理を含む。
【0023】辞書検索部23は、入力された文字列に基
づいて単語辞書24を検索し、その入力文字列を読みと
して持つ単語の見出しを抽出する。単語辞書24には、
中国語の各単語毎にピンイン読みと見出しなど、ピンイ
ン漢字変換処理に必要な情報が登録されている。
【0024】コード変換部25は、文字コード変換テー
ブル26を参照して、中国語の文字コードから他の言語
体系の文字コードへ変換、あるいは、他の言語体系の文
字コードから中国語の文字コードへ変換する。文字コー
ド変換テーブル26には、異なる言語体系の文字コード
の対応関係が記述されている(図3参照)。
【0025】出力部27は、辞書検索部23によって得
られた変換候補の出力や、コード変換部25によってコ
ード変換された文字列の出力処理を行う。ここで、中国
語の文字コードについて説明する。
【0026】中国語の文字コード、即ち中華人民共和国
信息交換漢字編碼標准(GB2312−80、「GBコ
ード」と略称)は、日本語のJIS文字コードと同様
に、中国語の漢字に対して87つの区に分け、各区には
94個(位)の漢字を配置している。したがって、全部
の87×94=8178の漢字と記号が制定されてい
る。各漢字や記号は2バイトで表し、番号はその区と位
コードに32(16進数の20h)を足した数値で、範
囲は212Ih〜777Ehである。例えば、中国語の
「中」は54区48位であるが、国標コードは5650
hである。
【0027】漢字部分については、GBコードの第16
区から第55区までは第1級漢字(ピンイン字母順)
で、全部で3755字で、第56区〜第87区までは第
2級漢字(部首順)で、全部で3008字である。
【0028】図11に中国語のGBコードと日本語のJ
IS文字コードとの比較を示す。このような文字コード
体系において、中国語と日本語の文字の字形を比較する
と、以下のように4つに大別することができる。
【0029】(1)図12に示すように、字形が同じ、
または、類似する文字(これを第1種類の文字と呼
ぶ)。 (2)図13に示すように、部首の字形が異なる文字
(これを第2種類の文字と呼ぶ)。 (3)図14に示すように、文字全体において字形が異
なる文字(これを第3種類の文字と呼ぶ)。 (4)図15に示すように、互いに対応しない文字(こ
れを第4種類の文字と呼ぶ)。
【0030】第1種類〜第3種類に属する文字は互いに
変換可能であり、また、元に戻すことができるが、問題
は第4種類に属する文字である。この部分は数的には少
ないが、文中に重要な意味を表す可能性があり、その文
字を失うことにより、文書全体の理解(解読性)が損な
われる可能性がある。そこで、本実施形態では、上記第
4種類に属する文字に関し、その文字の読みをASCI
Iコードで表すことを特徴とする。
【0031】図3は文字コード変換テーブル26の構成
を示す図である。この文字コード変換テーブル26は、
第1の言語の文字コードと第2の言語の文字コードとを
対応付けたものである。本実施形態では、第1の言語を
中国語、第2の言語を日本語とし、両言語の文字(漢
字)のコードデータを対応付けている。この場合、上述
した第1〜第3種類に属する文字は互いに対応可能であ
り、それぞれの文字のコードデータが文字コード変換テ
ーブル26に登録されている。
【0032】一方、第4種類に属する文字については他
の言語の文字コード体系に対応する文字コードがないの
で、その文字の読みをASCIIコードで表して文字コ
ード変換テーブル26に登録している。
【0033】例えば、日本語の文字コードにない中国語
の文字については、その文字の読みであるピンイン(図
中の「gou」、「ba」)をASCIIコードで表
し、該当する日本語の文字コード領域に登録しておく。
逆に、中国語の文字コードにない日本語の文字について
は、その文字の読みであるローマ字(図中の「tsuj
i」、「touge」)をASCIIコードで表し、該
当する中国語の文字コード領域に登録しておく。
【0034】次に、このような文字コード変換テーブル
26を用いたコード変換処理の動作について説明する。
図4は同実施形態のコード変換処理の動作を示すフロー
チャートである。なお、ここでは日本語入力環境下で、
例えば中国語の文字コード(GBコード)からなる文字
列が記述されたファイルを読み込み、これを日本語の文
字コードに変換する場合を想定して説明する。
【0035】図4に示すように、入力部21より中国語
の文字コードからなる文字列が入力されると(ステップ
A11)、制御部22は、そのファイルに記述された文
字列の各文字のコードデータをコード変換部25に送
り、以下のようなコード変換処理を行う。
【0036】すなわち、コード変換部25では、文字コ
ード変換テーブル26を参照して、入力された中国語の
文字コードに対応する日本語の文字コードを検索する
(ステップA13)。該当する日本語の文字コードがあ
れば(ステップA13のYes)、コード変換部25は
その日本語の文字コードを文字コード変換テーブル26
から抽出し、これを変換後のコードデータとして制御部
22に返す。制御部22は、この変換後のコードデータ
を出力部27に出力し、画面上に文字を表示するなどの
処理を行う(ステップA14)。
【0037】一方、該当する日本語の文字コードがない
場合に(ステップA13のNo)、コード変換部25は
その中国語の読みに対応するASCIIコードを文字コ
ード変換テーブル26から抽出し、これを変換後のコー
ドデータとして制御部22に返す。制御部22は、この
変換後のコードデータを出力部27に出力し、画面上に
文字を表示するなどの処理を行う(ステップA14)。
【0038】この処理をコード変換対象文字のすべてに
ついて繰り返し行う(ステップA16)。このように、
中国語の文字コードから日本語の文字コードへ変換する
際に、その中国語の文字コードに対応する日本語の文字
コードがない場合に、その文字の中国語読み(ピンイ
ン)をASCIIコードで表したものがコード変換デー
タとして出力されることになる。
【0039】具体例を挙げて説明すると、例えば図5
(a)に示すような中国語の文字列を日本語の文字コー
ドにコード変換する場合において、先頭文字のコードは
日本語の文字コード体系にないので、その文字をピンイ
ン読みする。この例では、ピンイン読みは「ni」であ
る。これをASCIIコードで表し、同図(b)に示す
ように、当該文字に対するコード変換データとして出力
する。
【0040】この場合、従来方式では、コード変換不能
な部分は文字として出力されなかったため、文書全体の
理解(解読性)が損なわれることがあったが、本方式の
ように、コード変換不能な文字の読みを汎用性の高いA
SCIIコードで表すことで文字(アルファベット)と
して出力することができる。これにより、コード変換時
の情報ロスを防いで、文書全体の流れを確保することが
できる。
【0041】さらに、文字の読みをASCIIコードで
表しておくことで、後述する逆変換処理により、元の文
字コードに戻すことができるといった利点がある。以下
に、逆変換処理の動作について説明する。
【0042】図6は同実施形態における逆変換処理の動
作を示すフローチャートである。上記のようにしてコー
ド変換された後の文字列(JIS文字コードまたはAS
CIIコード)を元の中国語の文字コードに戻す場合に
おいて、入力部21よりコード変換後の文字列が入力さ
れる(ステップB11)。制御部22は、その文字列を
コード変換部25に送って、元の文字コードつまり中国
語の文字コードに逆変換する。
【0043】コード変換部25では、文字コード変換テ
ーブル26を参照して、入力された日本語の文字コード
に対応する中国語の文字コードを検索する(ステップB
13)。該当する中国語の文字コードがあれば(ステッ
プB13のYes)、コード変換部25はその中国語の
文字コード(GBコード)を文字コード変換テーブル2
6から抽出し、これを逆変換後のコードデータとして制
御部22に返す。制御部22は、この逆変換後のコード
データを出力部27に出力し、画面上に文字を表示する
などの処理を行う(ステップB14)。
【0044】ここで、読み(ASCIIコード)に変え
られている部分については、文字コード変換テーブル2
6を参照しても、その読みから元の文字を一意に決める
ことはできない。これは、同じ読みを持つ複数の文字
(同音語)が存在するためである。そこで、読み(AS
CIIコード)の場合には(ステップB13のNo)、
制御部22はその読みを辞書検索部23に送って、単語
辞書24を検索する処理(ピンイン漢字変換処理)を行
う。
【0045】すなわち、辞書検索部23では、入力され
た読み(ASCIIコード)に基づいて単語辞書24を
検索し、当該読みに対応する見出し(中国語漢字)を変
換候補として抽出する(ステップB15)。その際、複
数の変換候補(同音語)が得られた場合には、制御部2
2はそれらの変換候補を画面上に表示して(ステップB
16)、ユーザに選択を促す。
【0046】ユーザの候補選択操作により、所望の変換
候補が選択されると(ステップB17)、制御部22は
その選択された変換候補の文字コード(GBコード)を
逆変換後のコードデータとして出力部27に出力し、画
面上に文字を表示するなどの処理を行う(ステップB1
8)。
【0047】この処理をコード変換対象文字のすべてに
ついて繰り返し行う(ステップB19)。このように、
コード変換された日本語の文字を中国語の文字コードに
逆変換する際に、中国語の読み(ピンイン)に変えてあ
る部分については、単語辞書24の中から当該読みに対
応する複数の見出し(中国語文字)が抽出され、その中
で選択された文字が元の中国語文字として出力される。
【0048】具体例を挙げて説明すると、例えば図7
(a)に示すような日本語の文字列を逆変換する場合に
おいて、その文字列の中の「ling」の部分について
は単語辞書24を検索して、「ling」を読みとして
持つ見出し(中国語文字)を得る。この場合、同じ読み
を持つ文字が複数得られるので、同図(b)に示すよう
に、これらを同音語候補として画面表示し、その中で選
択された文字を元の中国語文字とする。
【0049】次に、逆変換処理に関する他の実施形態に
ついて説明する。図6は他の実施形態における逆変換処
理の動作を示すフローチャートである。なお、図中のス
テップC11〜ステップC16までの処理は上記図6の
ステップB11〜B16までの処理と同様である。
【0050】すなわち、入力部21よりコード変換後の
文字列が入力される(ステップC11)。制御部22
は、その文字列をコード変換部25に送って、元の文字
コードつまり中国語の文字コードに逆変換する。
【0051】コード変換部25では、文字コード変換テ
ーブル26を参照して、入力された日本語の文字コード
に対応する中国語の文字コードを検索する(ステップC
13)。該当する中国語の文字コードがあれば(ステッ
プC13のYes)、コード変換部25はその中国語の
文字コード(GBコード)を文字コード変換テーブル2
6から抽出し、これを逆変換後のコードデータとして制
御部22に返す。制御部22は、この逆変換後のコード
データを出力部27に出力し、画面上に文字を表示する
などの処理を行う(ステップC14)。
【0052】ここで、読み(ASCIIコード)に変え
られている部分については、文字コード変換テーブル2
6を参照しても、その読みから元の文字を一意に決める
ことはできない。これは、同じ読みを持つ複数の文字
(同音語)が存在するためである。そこで、読み(AS
CIIコード)の場合には(ステップC13のNo)、
制御部22はその読みを辞書検索部23に送って、単語
辞書24を検索する処理(ピンイン漢字変換処理)を行
う。
【0053】すなわち、辞書検索部23では、入力され
た読み(ASCIIコード)に基づいて単語辞書24を
検索し、当該読みに対応する見出し(中国語漢字)を変
換候補として抽出する(ステップC15)。その際、複
数の変換候補(同音語)が得られた場合には、制御部2
2はそれらの変換候補を画面上に表示して(ステップC
16)、ユーザに選択を促す。
【0054】ユーザの候補選択操作により、所望の変換
候補が選択されると(ステップC17)、制御部22は
その選択された変換候補の文字コード(GBコード)を
逆変換後のコードデータとして出力部27に出力し、画
面上に文字を表示するなどの処理を行う(ステップC1
8)。
【0055】ここで、同音語の選択候補を確定できない
場合には(ステップB17のNo)、制御部22は当該
文字列の中で変換範囲を拡大し(読み範囲の切り直
し)、再変換を試みる(ステップC19〜C21)。こ
の場合、拡大された変換範囲の中の文字は読み(ASC
IIコード)でなく、文字コード(JIS文字コード)
であれば、その文字の読みを単語辞書24から引き出し
(ステップC20)、上記確定できない読みの部分と一
緒に再変換を行うことになる(ステップC21)。
【0056】なお、変換範囲の拡大は、例えば前後1文
字分の範囲を設定しても良いし、ユーザの指示に従って
任意に設定するようにしても良い。再変換とは、辞書検
索部23が新たな読みで単語辞書24を再度検索するこ
とである。この再変換により、上記確定できない読みの
部分に該当する見出しが変換候補として得られたら、制
御部22はその変換候補の文字コード(GBコード)を
逆変換後のコードデータとして出力部27に出力し、画
面上に文字を表示するなどの処理を行う(ステップC2
2)。
【0057】この処理をコード変換対象文字のすべてに
ついて繰り返し行う(ステップC23)。このように、
変換範囲の拡大して、再変換を行うことにより、所望の
変換候補を優先的に得ることができ、その変換候補の文
字コードを逆変換後のコードデータとして出力すること
ができる。
【0058】具体例を挙げて説明すると、例えば図9
(a)に示すような日本語の文字列を逆変換する場合
に、その文字列の中の「ling」の部分を含む変換範
囲を拡大する。ここで、「ling」の後ろの1文字ま
で変換範囲を拡大した場合には、「外」といった文字は
読み(ASCIIコード)でないので、単語辞書24か
ら「外」の読み「wai」を引き出し、「lingwa
i」で単語辞書24を再度検索(再変換)する。そし
て、変換候補として得た文字列から上記「外」の部分を
削除した残りの文字を元の中国語文字とする。
【0059】なお、上記実施形態では、読み(ASCI
Iコード)で表現されている部分については辞書検索に
より逆変換を実現したが、通常の文字コードを逆変換す
るときと同様に文字コード変換テーブル26を用いて行
うことも可能である。
【0060】この場合には、同じ読み(ASCIIコー
ド)を持つ中国語文字が文字コード変換テーブル26に
複数存在することがあるので、それらの中国語文字を文
字コード変換テーブル26から抽出後、候補文字として
表示し、その中から所望の文字をユーザに選択させると
いった処理が必要となる。
【0061】また、上記実施形態では、中国語の文字コ
ードから日本語の文字コードへの変換、さらに、その変
換後の文字コードを元に戻す逆変換について説明した
が、日本語の文字コードから中国語の文字コードへの変
換、さらに、その変換後の文字コードを元に戻す逆変換
を行う場合も同様である。
【0062】ただし、日本語の文字コードから中国語の
文字コードへ変換する場合には、中国語の文字コード体
系にない日本語の文字コードについては、その文字をロ
ーマ字読みしたものをASCIIコードで表すことにな
る(例えば図3の「辻」−「tsuji」、「峠」−
「touge」)。したがって、逆変換に際しては、日
本語の単語辞書(かな漢字変換用の辞書)を参照し、そ
の読みに対応する見出しを日本語文字として抽出し、そ
のコードデータ(JIS文字コード)を逆変換後のコー
ドデータとして出力する処理を行うことになる。
【0063】また、上記実施形態では、中国語の文字コ
ードと日本語の文字コードとの間のコード変換を例にし
たが、本発明はこれに限るものではなく、例えば中国語
の文字コードと韓国語の文字コードなど、漢字を有する
言語の文字コード体系同士であれば適用可能である。
【0064】また、上述した実施形態において記載した
手法は、コンピュータに実行させることのできるプログ
ラムとして、例えば磁気ディスク(フロッピーディス
ク、ハードディスク等)、光ディスク(CD−ROM、
DVD等)、半導体メモリなどの記録媒体に書き込んで
各種装置に適用したり、通信媒体により伝送して各種装
置に適用することも可能である。本装置を実現するコン
ピュータは、記録媒体に記録されたプログラムを読み込
み、このプログラムによって動作が制御されることによ
り、上述した処理を実行する。
【0065】
【発明の効果】以上のように本発明によれば、第1の言
語の文字コードから第2の言語の文字コードへのコード
変換に際し、コード変換不能な文字の読みを汎用性の高
いASCIIコードで表すことで、文字として出力する
ことができる。これにより、コード変換時の情報ロスを
防いで、文書全体の流れを確保することができる。
【0066】また、コード変換された第2の言語の文字
コードを元の第1の言語の文字コードに逆変換する場合
において、ASCIIコードで表された部分を読みとし
て単語辞書を検索することで、その読みに対応する見出
しの文字コードを元の第1の言語の文字コードとして出
力することができる。これにより、コード変換不能な文
字の読みをASCIIコードで表わした場合でも、元の
言語の文字コードに正しく戻すことができる。
【図面の簡単な説明】
【図1】本発明の文字コード変換処理装置を用いた中国
語入力変換処理装置のシステム構成を示すブロック図。
【図2】上記図1のシステム構成によって実現される中
国語入力変換処理装置の機能構成を示すブロック図。
【図3】上記図2の中国語入力変換処理装置に用いられ
る文字コード変換テーブルの構成を示す図。
【図4】本発明のコード変換処理の動作を示すフローチ
ャート。
【図5】上記図4のコード変換処理を説明するための具
体例。
【図6】本発明の逆変換処理の動作を示すフローチャー
ト。
【図7】上記図6の逆変換処理を説明するための具体
例。
【図8】本発明の他の実施形態としての逆変換処理の動
作を示すフローチャート。
【図9】上記図8の逆変換処理を説明するための具体
例。
【図10】上記図8の逆変換処理を説明するための具体
例。
【図11】中国語のGBコードと日本語のJIS文字コ
ードとの比較を示す図。
【図12】中国語と日本語との間で字形が同じ、また
は、類似する文字(第1種類の文字)を示す図。
【図13】中国語と日本語との間で部首の字形が異なる
文字(第2種類の文字)を示す図。
【図14】中国語と日本語との間で文字全体において字
形が異なる文字(第3種類の文字)を示す図。
【図15】中国語と日本語との間で互いに対応しない文
字(第4種類の文字)を示す図。
【符号の説明】
11…CPU 12…メモリ 13…入力装置 14…表示装置 15…外部記憶装置 16…印刷装置 17…通信装置 21…入力部 22…制御部 23…辞書検索部 24…単語辞書 25…コード変換部 26…文字コード変換テーブル 27…出力部

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 第1の言語の文字コードを文字コード体
    系が異なる第2の言語の文字コードに変換する文字コー
    ド変換処理装置であって、 第1の言語の文字コードと第2の言語の文字コードとを
    対応付けた文字コード変換テーブルであって、第2の言
    語の文字コード体系に存在しない第1の言語の文字コー
    ドに関してはその文字の読みをASCIIコードで記述
    した文字コード変換テーブルと、 第1の言語の文字コードからなる文字列をコード変換対
    象として取得するコード変換対象取得手段と、 このコード変換対象取得手段によって得られた文字列を
    上記コード変換テーブルを参照して第2の言語の文字コ
    ードに変換するものであり、当該文字コードに対応する
    第2の言語の文字コードが存在しない場合に、その文字
    の読みに対応するASCIIコードを出力するコード変
    換手段とを具備したことを特徴とする文字コード変換処
    理装置。
  2. 【請求項2】 第1の言語の文字の読みと見出しを記憶
    した単語辞書と、 上記コード変換手段によって変換された第2の言語の文
    字コードを元の第1の言語の文字コードに逆変換する場
    合に、上記ASCIIコードで表された部分を読みとし
    て上記単語辞書を検索し、その読みに対応する見出しの
    文字コードを元の第1の言語の文字コードとして出力す
    る逆変換手段とを具備したことを特徴とする請求項1記
    載の文字コード変換処理装置。
  3. 【請求項3】 上記ASCIIコードで表された部分を
    含む変換範囲を設定する変換範囲設定手段を有し、 上記逆変換手段は、この変換範囲設定手段によって設定
    された変換範囲の読みに基づいて上記単語辞書を再度検
    索し、その検索結果から上記ASCIIコードで表され
    た部分に対応する文字コードを元の第1の言語の文字コ
    ードとして出力することを特徴とする請求項2記載の文
    字コード変換処理装置。
  4. 【請求項4】 上記第1の言語は中国語であり、上記第
    2の言語は中国語と異なるコード体系の漢字を有する他
    の言語であることを特徴とする請求項1記載の文字コー
    ド変換処理装置。
  5. 【請求項5】 第1の言語の文字コードを文字コード体
    系が異なる第2の言語の文字コードに変換する文字コー
    ド変換処理方法であって、 第1の言語の文字コードと第2の言語の文字コードとを
    対応付けた文字コード変換テーブルであって、第2の言
    語の文字コード体系に存在しない第1の言語の文字コー
    ドに関してはその文字の読みをASCIIコードで記述
    した文字コード変換テーブルを参照して、第1の言語の
    文字コードからなる文字列を第2の言語の文字コードに
    変換し、 当該文字コードに対応する第2の言語の文字コードが存
    在しない場合に、その文字の読みに対応するASCII
    コードを出力することを特徴とする文字コード変換処理
    方法。
  6. 【請求項6】 第1の言語の文字コードを文字コード体
    系が異なる第2の言語の文字コードに変換する文字コー
    ド変換処理方法であって、 第1の言語の文字コードと第2の言語の文字コードとを
    対応付けた文字コード変換テーブルであって、第2の言
    語の文字コード体系に存在しない第1の言語の文字コー
    ドに関してはその文字の読みをASCIIコードで記述
    した文字コード変換テーブルを参照して、第1の言語の
    文字コードからなる文字列を第2の言語の文字コードに
    変換し、 当該文字コードに対応する第2の言語の文字コードが存
    在しない場合に、その文字の読みに対応するASCII
    コードを出力し、 上記コード変換された第2の言語の文字コードを元の第
    1の言語の文字コードに逆変換する場合に、上記ASC
    IIコードで表された部分を読みとして、第1の言語の
    文字の読みと見出しを記憶した単語辞書を検索し、その
    読みに対応する見出しの文字コードを元の第1の言語の
    文字コードとして出力することを特徴とする文字コード
    変換処理方法。
  7. 【請求項7】 第1の言語の文字コードを文字コード体
    系が異なる第2の言語の文字コードに変換する文字コー
    ド変換処理プログラムを記録した記録媒体であって、 第1の言語の文字コードと第2の言語の文字コードとを
    対応付けた文字コード変換テーブルであって、第2の言
    語の文字コード体系に存在しない第1の言語の文字コー
    ドに関してはその文字の読みをASCIIコードで記述
    した文字コード変換テーブルを参照して、第1の言語の
    文字コードからなる文字列を第2の言語の文字コードに
    変換し、 当該文字コードに対応する第2の言語の文字コードが存
    在しない場合に、その文字の読みに対応するASCII
    コードを出力するコード変換処理をコンピュータに実行
    させるためのプログラムを記録したコンピュータ読取り
    可能な記録媒体。
  8. 【請求項8】 第1の言語の文字コードを文字コード体
    系が異なる第2の言語の文字コードに変換する文字コー
    ド変換処理プログラムを記録した記録媒体であって、 第1の言語の文字コードと第2の言語の文字コードとを
    対応付けた文字コード変換テーブルであって、第2の言
    語の文字コード体系に存在しない第1の言語の文字コー
    ドに関してはその文字の読みをASCIIコードで記述
    した文字コード変換テーブルを参照して、第1の言語の
    文字コードからなる文字列を第2の言語の文字コードに
    変換し、 当該文字コードに対応する第2の言語の文字コードが存
    在しない場合に、その文字の読みに対応するASCII
    コードを出力するコード変換処理と、 上記コード変換された第2の言語の文字コードを元の第
    1の言語の文字コードに逆変換する場合に、上記ASC
    IIコードで表された部分を読みとして、第1の言語の
    文字の読みと見出しを記憶した単語辞書を検索し、その
    読みに対応する見出しの文字コードを元の第1の言語の
    文字コードとして出力する逆変換処理とを、 コンピュータに実行させるためのプログラムを記録した
    コンピュータ読取り可能な記録媒体。
JP10130444A 1998-05-13 1998-05-13 文字コード変換処理装置、文字コード変換処理方法、文字コード変換処理プログラムを記録した記録媒体 Pending JPH11328160A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10130444A JPH11328160A (ja) 1998-05-13 1998-05-13 文字コード変換処理装置、文字コード変換処理方法、文字コード変換処理プログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10130444A JPH11328160A (ja) 1998-05-13 1998-05-13 文字コード変換処理装置、文字コード変換処理方法、文字コード変換処理プログラムを記録した記録媒体

Publications (1)

Publication Number Publication Date
JPH11328160A true JPH11328160A (ja) 1999-11-30

Family

ID=15034396

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10130444A Pending JPH11328160A (ja) 1998-05-13 1998-05-13 文字コード変換処理装置、文字コード変換処理方法、文字コード変換処理プログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JPH11328160A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002207723A (ja) * 2001-01-10 2002-07-26 Dainippon Printing Co Ltd 拡張文字の処理方法
WO2004107211A1 (ja) * 2003-05-28 2004-12-09 Seiko Instruments Inc. 電子辞書
JP2006252164A (ja) * 2005-03-10 2006-09-21 Fuji Xerox Co Ltd 中国語文書処理装置
JP2009146439A (ja) * 2003-01-24 2009-07-02 Ricoh Co Ltd 文字列処理装置,文字列処理方法および画像形成装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002207723A (ja) * 2001-01-10 2002-07-26 Dainippon Printing Co Ltd 拡張文字の処理方法
JP2009146439A (ja) * 2003-01-24 2009-07-02 Ricoh Co Ltd 文字列処理装置,文字列処理方法および画像形成装置
WO2004107211A1 (ja) * 2003-05-28 2004-12-09 Seiko Instruments Inc. 電子辞書
JP2006252164A (ja) * 2005-03-10 2006-09-21 Fuji Xerox Co Ltd 中国語文書処理装置

Similar Documents

Publication Publication Date Title
JPH113338A (ja) 多言語入力システム、多言語入力方法及び多言語入力プログラムを記録した記録媒体
JPH11328160A (ja) 文字コード変換処理装置、文字コード変換処理方法、文字コード変換処理プログラムを記録した記録媒体
JPH0380363A (ja) 文書処理装置
JP2001014304A (ja) 文書作成装置、変換処理方法及び変換処理プログラムを記録した記録媒体
JP3086464B2 (ja) かな漢字変換装置
JP3847869B2 (ja) 文字列変換装置及び方法
JP2737160B2 (ja) 文章処理装置
JP3809238B2 (ja) 文書処理方法及びその装置
JPH10198667A (ja) 文字列変換装置およびそのプログラム記録媒体
JPH11175511A (ja) 中国語入力変換処理装置、中国語入力変換処理方法、中国語入力変換処理プログラムを記録した記録媒体
JPS62282364A (ja) 文字列検索方式
JPH0816572A (ja) 英数字/仮名文字自動認識入力システム
JPH08171568A (ja) 複数言語入力方法
JPH08339365A (ja) 文書作成装置及び文書作成方法
JPS60112175A (ja) 仮名漢字変換装置における略称語変換方式
JPH08212212A (ja) 文書作成装置及び候補出力制御方法
JPH10207882A (ja) 文書作成装置及びかな漢字変換方法
JPS60207948A (ja) カナ漢字変換処理装置
JP2003016058A (ja) 文字変換方法、ワードプロセッサ装置、変換辞書及びプログラム
JPH0546593A (ja) 文字入力装置
JPH06131329A (ja) 日本語文字処理装置
JPS6091434A (ja) 文書作成装置
JPH04133165A (ja) かな漢字変換装置
JPS61169961A (ja) ユ−ザ辞書を備えた文字処理装置
JPH1011429A (ja) 文字処理装置