JP2002073596A - 外字を含むテキストのコード変換方法 - Google Patents

外字を含むテキストのコード変換方法

Info

Publication number
JP2002073596A
JP2002073596A JP2000259517A JP2000259517A JP2002073596A JP 2002073596 A JP2002073596 A JP 2002073596A JP 2000259517 A JP2000259517 A JP 2000259517A JP 2000259517 A JP2000259517 A JP 2000259517A JP 2002073596 A JP2002073596 A JP 2002073596A
Authority
JP
Japan
Prior art keywords
code
character
external character
external
character code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000259517A
Other languages
English (en)
Inventor
Morifumi Nakano
守文 中野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Solution Innovators Ltd
Original Assignee
NEC System Technologies Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC System Technologies Ltd filed Critical NEC System Technologies Ltd
Priority to JP2000259517A priority Critical patent/JP2002073596A/ja
Publication of JP2002073596A publication Critical patent/JP2002073596A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 外字を含んだテキストをコード変換する処理
のコード変換処理及び外字コード置換処理の短縮にあ
る。 【解決手段】 第1コードで表されたテキストを第2コ
ードで表されるテキストに文字毎に遂次にコード変換す
るコード変換方法は、第1コードで定義される外字と、
第2コードで定義される外字と、を対照する外字置換テ
ーブル33と、第1コードの外字コード領域を示す環境
変数31と、を備え、第1コードの各文字を環境変数テ
ーブル31を参照して、外字であるか否かを判定し、外
字であるとき、外字置換テーブル33を探索して対照す
る外字コードに置換し、外字でないとき、コード変換テ
ーブル32によってコード変換する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、コード体系が異
なる機種間のファイル転送で発生するコード変換におけ
る外字コード置換に関し、特に、外字コードを置換する
外字置換テーブルを探索する16進数比較処理を環境変
数テーブルによって短縮する外字コード変換方法に関す
る。
【0002】
【従来の技術】コード体系には、EBCDIC、SJI
S、JIS、EUC(EXTENDED UNIX C
ODE)などがあり、異機種間でファイル転送する場
合、コード体系の違いからテキストファイルをコード変
換する必要が生じる。各コード体系で、標準に定義され
た文字コードは、単純に他のコード体系にコード変換で
きる。しかし、ユーザ定義の外字を含むテキストファイ
ルをコード変換する場合。通常の文字コードと外字コー
ドを分けて変換する必要が生じる。上記のコード体系で
2つのコード体系を第1及び第2コードとしたとき、第
1コードから第2コードにコード変換するとして、従来
技術を説明する。
【0003】従来の外字を含むテキストを第1コードの
テキストから第2コードのテキストにコード変換する方
法は、図5に示すように、第1コードのテキスト50を
第2コードのテキストに各文字を遂次にコード変換処理
する(ステップ51)。コード変換した第2コードのテ
キストには、第1コードの外字が単に第2コードの仮外
字コードに自動コード変換されて含まれるため、この第
2コードの仮外字コードを、第2コードで定義されてい
る正しい外字コードに再置換しなければならない。その
ため、予め調査して作成しておいた外字置換テーブル5
2を参照して、第2コードの仮外字コードを第2コード
の外字コードに置換し(ステップ53)、第2コードの
テキストを得ている(ステップ54)。
【0004】更に、図6に示すように、第2コードで定
義してある外字に対照な第1コードの仮外字コードをあ
らかじめ調査し、第1コードで定義した外字コードを仮
置換テーブル61で仮外字コードに仮置換した第1コー
ドのテキストを得る(ステップ62)。次に、第1コー
ドから第2コードに自動コード変換によってコード変換
し(ステップ63)、外字を含んだ第2コードの正しい
テキスト64を得る。
【0005】この2つの外字を含むテキストをコード変
換する仕方には、第1コードで定義した外字を自動コー
ド変換した第2コードの文字コードが、第2コードで定
義した外字コードとは異なるのが通常であるため、予
め、第1及び第2コードで定義した外字を対照付ける外
字置換テーブルを調査/作成しておくことが必要にな
る。このテーブルを作成すること自体、手間のかかる作
業であるが、更に、文字コードが外字コードであるか否
かを判定する処理自体にも時間のかかることになる。
【0006】特開平11−7442号公報によれば、異
なるコード体系にコード変換するに、外字コードを登録
するコード変換テーブルを備え、外字を異なるコード体
系の外字に変換することが説明されている。この公報に
よれば、文字コードが外字コードであるか否かを判定
し、外字コードであるとき、該コード変換テーブルを探
索して、対照する外字コードに直接置換する。しかし、
この判定過程を短縮する手段がないため、処理に時間が
かかる問題がある。
【0007】
【発明が解決しようとする課題】上述した従来の外字を
含むテキストのコード変換は、文字が外字であるか否か
を判定し、遂次に文字をコード変換する処理と、外字を
置換する処理と、を実施するとき、判定処理及び置換処
理を短縮することが必要である。
【0008】この発明の目的は、外字を含んだテキスト
をコード変換する処理のテキストの文字コード変換処理
及び外字コードの置換処理を短縮する。
【0009】
【課題を解決するための手段】そのため、この発明の、
第1コードで表されたテキストを第2コードで表される
テキストに文字毎に遂次にコード変換するコード変換方
法において、第1コードで定義される外字コードと、第
2コードで定義される外字コードと、を対照する外字置
換テーブルと、第1コードの外字定義領域を示す環境変
数と、を備え、第1コードの各文字コードを前記環境変
数を参照して、外字コードであるか否かを判定し、外字
コードであるとき、前記外字置換テーブルを探索して、
前記外字コードに対照な第2コードの外字コードに置換
することを特徴とする。
【0010】更に、前記外字を含むテキストのコード変
換方法は、第1コードのテキストファイルを読み込むス
テップと、前記テキストファイルの文字コードを先頭か
ら遂次に取得し、前記環境変数テーブルを参照して、前
記文字コードが外字を定義する外字コード領域にあるか
否かを判定するステップと、前記文字コードが前記外字
コード領域にないとき、第1及び第2の通常コード変換
テーブルを参照して、前記第1コードの文字コードを第
2コードの文字コードに変換するステップと、前記文字
コードが前記外字コード領域にあるとき、前記文字コー
ドを第1及び第2コードの外字置換テーブルを参照し
て、第2コードの該当する外字コードに変換するステッ
プと、変換された前記文字コード及び外字コードを第2
コードのテキストファイルに書き込むステップと、を実
行することを特徴とする。
【0011】更に、前記環境変数テーブルは、文字コー
ドを16進数で表したとき、外字コードを登録する16
進数帯を示すことを特徴とする。
【0012】更に、前記第1及び第2の通常文字コード
変換テーブルは、第1コードで定義される文字コード
と、前記文字コードに対照な第2コードで定義される文
字コードと、を対照付けて登録するテーブルであること
を特徴とする。
【0013】更に、前記外字置換テーブルは、第1コー
ドで定義された外字コードの16進数と、前記外字の表
示イメージが同じで、かつ第2コードで定義された16
進数とを対照付けて登録したテーブルであることを特徴
とする。
【0014】
【発明の実施の形態】次に、この発明について、図面を
参照して説明する。図1は、この発明の方法の実施の形
態を示すフローチャートである。図1における第1及び
第2コードは、EBCDIC、SJIS、JIS、EU
C(EXTENDED UNIX CODE)等の内の
2つのコードを指し、それの相互間のコード変換を外字
コードを含めて実施するフローチャートを図1に示す。
先ず、第1コード、例えばEBCDICのテキストファ
イル10を読み込む(ステップ11)。テキストファイ
ルの各文字コードの16進数を、遂次に外字コード領域
を示す環境変数テーブル31を参照して、文字が外字で
あるか否かを判定する(ステップ12)。該文字コード
が外字コード領域にないとき、第1及び第2コードの変
換テーブル32を参照して、第1コードを第2コードに
コード変換し(ステップ13)、第2コードのテキスト
ファイル20に書き込む(ステップ15)。該文字コー
ドが外字コード領域にあるとき、第1及び第2コードの
外字置換テーブル33を探索して、第1コードの外字コ
ードを対照な第2コードの外字コードに置換し(ステッ
プ14)、第2コードのテキストファイル20に書き込
む(ステップ15)。以上のステップを、第1コードの
テキストファイル10の終了まで繰り返すことで、外字
を含むコード変換が実施される。
【0015】このコード変換が実施されるシステム環境
を示す図2を参照すると、第1コード体系の処理装置1
で作成された第1コードのテキストファイル10を第1
及び第2コード変換処理装置3に読み込み、第2コード
に外字を含めてコード変換して第2コードのテキストフ
ァイル20を作成し、第2コード体系の処理装置2に渡
される。このシステム環境で、テキストファイルによる
受け渡しが通信によるファイル転送においても同様であ
る。
【0016】外字置換テーブル33を作成するフローチ
ャートを示す図3を参照すると、第1コードで定義され
ている外字リスト41と、第2コードで定義されている
外字リスト44とに基づいて、各外字をそれの16進数
で、同一の表示イメージをもつ外字を対照するように外
字置換テーブル33に登録し(ステップ43,46)、
作成される。
【0017】環境変数テーブル31は、外字が定義され
るコード範囲を示し、文字コードが該コード範囲にある
か否かによって、通常の文字コードを外字置換テーブル
33による外字判定の探索処理をすることを防ぐ機能を
有する。
【0018】この方法の実施を具体例によって説明す
る。図4(a)に、EBCDICコードのテキスト71
が示されている。該テキスト71の文字コードで、
「槇」が外字コードで、EBCDIC外字リスト72
に、「槇」の文字とそれの16進コードである「742
4」が表示されることになる。図4(b)には、SJI
Sコードのテキスト73が示されている。該テキスト7
3の文字コードで、「槇」が外字で、SJISの外字リ
スト74に「槇」の文字とそれの16進コードである
「f043」が表示されることになる。EBCDIC外
字リスト72と、SJIS外字リスト74とから、
「槇」の16進コードを対照させて、外字置換テーブル
75に登録する。この作業を、第1及び第2コードで定
義した外字コード全てに対して実施し、外字置換テーブ
ル74を得る。
【0019】
【発明の効果】以上で説明したようにこの発明の外字を
含むテキストのコード変換方法は、外字置換テーブルに
登録した16進コードで外字コードの置換を指定できる
ため、通常の文字コードを含めコード変換を遂次に実施
することが可能になり、変換が短縮される。その理由
は、文字毎に外字であるか否かを判定し、外字置換テー
ブルに存在する外字コードについては、直接の外字置換
によるコード変換を行うため、不要なコード変換結果で
ある仮外字コードからの再置換を行う必要がなくなるた
めである。
【0020】更に、他の効果は、環境変数テーブルによ
る外字置換テーブル範囲を特定しておくことにより、変
換処理時間を短縮させることができる。その理由は、文
字が外字であるか否かの判定を環境変数テーブルで行
い、全ての文字について外字置換テーブルを探索させな
いで済むため、外字を含まないテキストのコード変換に
おける処理時間と、さして差のない変換時間で外字を含
むテキストのコード変換が実施できるからである。
【図面の簡単な説明】
【図1】この発明の外字を含むテキストのコード変換方
法のフローチャート示す図である。
【図2】図1のフローチャートが適用されるシステム環
境を示す図である。
【図3】外字置換テーブル作成を説明する図である。
【図4】分図(a)はEBCDICコードの例示、分図
(b)はSJISコードの例示、分図(c)は外字置換
テーブルの作成の例示、を示す。
【図5】従来技術の外字コードの変換を示す図である。
【図6】従来技術の外字コードの変換を示す図である。
【符号の説明】
10 第1コードのテキストファイル 20 第2コードのテキストファイル 31 環境変数テーブル 32 第1及び第2コードの変換テーブル 33 第1及び第2コードの外字置換テーブル

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 第1コードで表されたテキストを第2コ
    ードで表されるテキストに文字毎に遂次にコード変換す
    るコード変換方法において、 第1コードで定義される外字コードと、第2コードで定
    義される外字コードと、を対照する外字置換テーブル
    と、第1コードの外字定義領域を示す環境変数と、を備
    え、第1コードの各文字コードを前記環境変数を参照し
    て、外字コードであるか否かを判定し、外字コードであ
    るとき、前記外字置換テーブルを探索して、前記外字コ
    ードに対照な第2コードの外字コードに置換することを
    特徴とする外字を含むテキストのコード変換方法。
  2. 【請求項2】 前記外字を含むテキストのコード変換方
    法は、 第1コードのテキストファイルを読み込むステップと、 前記テキストファイルの文字コードを先頭から遂次に取
    得し、前記環境変数テーブルを参照して、前記文字コー
    ドが外字を定義する外字コード領域にあるか否かを判定
    するステップと、 前記文字コードが前記外字コード領域にないとき、第1
    及び第2の通常コード変換テーブルを参照して、前記第
    1コードの文字コードを第2コードの文字コードに変換
    するステップと、 前記文字コードが前記外字コード領域にあるとき、前記
    文字コードを第1及び第2コードの外字置換テーブルを
    参照して、第2コードの該当する外字コードに変換する
    ステップと、 変換された前記文字コード及び外字コードを第2コード
    のテキストファイルに書き込むステップと、 を実行することを特徴とする請求項1記載の外字を含む
    テキストのコード変換方法。
  3. 【請求項3】 前記環境変数テーブルは、 文字コードを16進数で表したとき、外字コードを登録
    する16進数帯を示すことを特徴とする請求項2記載の
    外字を含むテキストのコード変換方法。
  4. 【請求項4】 前記第1及び第2の通常文字コード変換
    テーブルは、 第1コードで定義される文字コードと、前記文字コード
    に対照な第2コードで定義される文字コードと、を対照
    付けて登録するテーブルであることを特徴とする請求項
    2記載の外字を含むテキストのコード変換方法。
  5. 【請求項5】 前記外字置換テーブルは、 第1コードで定義された外字コードの16進数と、前記
    外字の表示イメージが同じで、かつ第2コードで定義さ
    れた16進数とを対照付けて登録したテーブルであるこ
    とを特徴とする請求項2記載の外字を含むテキストのコ
    ード変換方法。
  6. 【請求項6】 請求項2記載の外字を含むテキストのコ
    ード変換方法を実行するプログラムを記憶するコンピュ
    ータ読み取り可能な記憶媒体。
JP2000259517A 2000-08-29 2000-08-29 外字を含むテキストのコード変換方法 Pending JP2002073596A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000259517A JP2002073596A (ja) 2000-08-29 2000-08-29 外字を含むテキストのコード変換方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000259517A JP2002073596A (ja) 2000-08-29 2000-08-29 外字を含むテキストのコード変換方法

Publications (1)

Publication Number Publication Date
JP2002073596A true JP2002073596A (ja) 2002-03-12

Family

ID=18747689

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000259517A Pending JP2002073596A (ja) 2000-08-29 2000-08-29 外字を含むテキストのコード変換方法

Country Status (1)

Country Link
JP (1) JP2002073596A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006123412A1 (ja) * 2005-05-18 2006-11-23 Core Appli Incorporated 文字コード入力支援システム、文字コード入力支援プログラム
KR100810015B1 (ko) * 2004-02-18 2008-03-10 인터내셔널 비지네스 머신즈 코포레이션 시스템, 관리 서버, 수신 서버, 제어 방법, 제어 프로그램및 기록 매체

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100810015B1 (ko) * 2004-02-18 2008-03-10 인터내셔널 비지네스 머신즈 코포레이션 시스템, 관리 서버, 수신 서버, 제어 방법, 제어 프로그램및 기록 매체
WO2006123412A1 (ja) * 2005-05-18 2006-11-23 Core Appli Incorporated 文字コード入力支援システム、文字コード入力支援プログラム
JPWO2006123412A1 (ja) * 2005-05-18 2008-12-25 株式会社コアアプリ 文字コード入力支援システム、文字コード入力支援プログラム
JP4566237B2 (ja) * 2005-05-18 2010-10-20 株式会社コアアプリ 文字コード入力支援システム、文字コード入力支援プログラム

Similar Documents

Publication Publication Date Title
JP4924976B2 (ja) ソフトウェア開発支援システム
US8261241B2 (en) Converting format strings to regular expressions
US7408556B2 (en) System and method for using device dependent fonts in a graphical display interface
JP5102838B2 (ja) メインフレームシステムのデータベースを開放型システムに適したデータベースに変換するマイグレイション装置及びその方法
US20100095283A1 (en) Migration Apparatus Which Convert Application Program of Mainframe System into Application Program of Open System and Method for Thereof
CN113609820A (zh) 基于可扩展标记语言文件生成word文件的方法、装置及设备
US20080052619A1 (en) Spell Checking Documents with Marked Data Blocks
CN111126010B (zh) Freemaker模板文件修复方法、装置、计算机设备及存储介质
US20030121005A1 (en) Archiving and retrieving data objects
CN107766228B (zh) 一种基于多语种的自动化测试方法和装置
US7546322B2 (en) Generating unique name/version number pairs when names can be re-used
JP2002073596A (ja) 外字を含むテキストのコード変換方法
US8463759B2 (en) Method and system for compressing data
US20100042640A1 (en) Migration Apparatus Which Convert SAM/VSAM Files of Mainframe System into SAM/VSAM Files of Open System and Method for Thereof
CN110543456B (zh) 一种oasis文件快速读取方法、装置及计算机可读存储介质
US7624343B2 (en) Performance optimization for text layout processing
CN114064111A (zh) 一种部署包的版本信息的管理方法及设备
CN112148710B (zh) 微服务分库方法、系统和介质
US9235400B2 (en) Method for operating a control device for controlling a technical installation
CN114003489B (zh) 一种前端代码文件检测方法、装置及电子设备和存储介质
US20210357438A1 (en) Computer-readable recording medium, index creation device, index creation method, computer-readable recording medium, search device, and search method
CN111694812A (zh) 一种数据迁移方法以及数据迁移装置
CN116244366A (zh) 一种统一实时数据源的数据处理方法和装置
CN117792980A (zh) 域控制器的软件生成方法、计算机设备及计算机程序产品
US20180004490A1 (en) Non-transitory computer-readable storage medium, editing support method, and editing support device

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040302