JP3639713B2 - Character code converter and recording medium - Google Patents

Character code converter and recording medium Download PDF

Info

Publication number
JP3639713B2
JP3639713B2 JP07087898A JP7087898A JP3639713B2 JP 3639713 B2 JP3639713 B2 JP 3639713B2 JP 07087898 A JP07087898 A JP 07087898A JP 7087898 A JP7087898 A JP 7087898A JP 3639713 B2 JP3639713 B2 JP 3639713B2
Authority
JP
Japan
Prior art keywords
character
code
conversion
character code
displaying
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP07087898A
Other languages
Japanese (ja)
Other versions
JPH10320171A (en
Inventor
宏之 田幡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP07087898A priority Critical patent/JP3639713B2/en
Publication of JPH10320171A publication Critical patent/JPH10320171A/en
Application granted granted Critical
Publication of JP3639713B2 publication Critical patent/JP3639713B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、異なる文字コード体系のシステム間で必要となる文字コード変換装置および記録媒体であって、既定のコード変換テーブルでは変換エラーとなるものを任意の文字コードへ変換するための補正機能を保有する文字コード変換装置に関するものである。
【0002】
【従来の技術】
従来、文字コード変換装置は、コード変換テーブルに未定義の文字コードを発見した場合、代替文字で出力したり、あるいは変換処理を中断したりする処置を行っていた。
【0003】
また、変換エラーとなる文字の大半は、利用者定義文字とJIS規格外拡張文字のコード変換テーブル上の未定義文字であり、通常、変換先システムの任意の文字へ変換する必要がある。
【0004】
このため、図10に示すような構成によって、利用者は変換処理を実行する前に変換エラーとなる文字を調査し、事前に入力データまたはコード変換テーブルを補正していた。未定義文字の存在状況を調査するには、手作業または調査用プログラムを作成し実行する必要がある。
【0005】
図10は、従来技術の説明図を示す。
図10において、入力データ41は、変換しようとする文字コードのデータである。
【0006】
調査用プログラム42は、入力データ41中に変換エラーとなる文字コードが含まれているか調査するプログラムである。
調査結果リスト43は、調査用プログラム42によって入力データ41を読み込んで変換エラーとなる文字コード、その位置を調査した結果のリストである。
【0007】
テーブル補正44は、調査結果リスト43を参照し、変換エラーとなった文字コードについて、コード変換テーブル45を補正するものである。
コード変換テーブル45は、入力データを変換するテーブルである。
【0008】
文字コード変換装置46は、入力データ41について、補正後のコード変換テーブル45を用いて変換先のコードに変換し、出力データ47として格納するものである。
【0009】
出力データ47は、変換後の文字コードのデータである。
次に、動作を簡単に説明する。
(1) 調査用プログラム42は、入力データ41についてコード変換テーブル45を参照して変換エラーとなる文字コード、およびその位置を調査し、調査結果リスト43を出力する。
【0010】
(2) テーブル補正44が調査結果リスト43をもとに変換エラーとなる文字コードについて変換先の文字コードを登録などの補正を、コード変換テーブル45に施す。
【0011】
(3) 文字コード変換装置46が入力データ41について、補正後のコード変換テーブル45を用いて変換先の文字コードに変換し、出力データ47として格納する。
【0012】
【発明が解決しようとする課題】
上述したように、未定義文字の調査には非常に手間がかかり非効率的であるという問題があった。また、調査用プログラムは入力データ全体より変換エラー文字を検索するため、データ量が大きいと調査と、変換と2回の読み込みが必要となり、処理時間がかかるという問題もあった。
【0013】
本発明は、これらの問題を解決するため、入力データについてコード変換テーブルを参照して変換を行い、未定義コードの場合には代替文字で出力すると共にテーブルに文字コード、位置を蓄積し、テーブルをもとに指定された文字コードに置換およびコード変換テーブルに反映し、文字データの1回の読み込みで文字コードの変換を迅速に実現すると共に次回以降のコード変換に自動反映することを目的としている。
【0014】
【課題を解決するための手段】
図1を参照して課題を解決するための手段を説明する。
図1において、文字コード変換手段2は、コード変換テーブル4を参照して入力データ1中の文字コードを変換するものである。
【0015】
変換エラー蓄積手段3は、変換エラーのときに代替文字コードを置き換えおよび元の文字コードおよびその位置情報などを変換エラー履歴テーブル5に蓄積するものである。
【0016】
出力データ6は、変換後の文字コードである。
変換エラー補正手段7は、表示・入力装置8上に変換エラー履歴テーブル5の内容を表示してエラー処置入力に対応して代替文字を正しい文字に置換(補正)したりなどするものである。
【0017】
エラー処置再利用手段9は、代替文字を正しい文字に置換したときにコード変換テーブル4に反映(元の文字コードに対応づけて正しい文字コードを登録)するものである。
【0018】
次に、動作を説明する。
文字コード変換手段2が入力データ1から取り出した文字コードについて、コード変換テーブル4を参照して他の文字コードに変換して出力し、変換エラー蓄積手段3が未定義コードで変換エラーとなったときに代替コードを出力および元の文字コード、出力位置を変換エラー履歴テーブル5に蓄積し、変換エラー補正手段7が変換された文字コードの文字と代替文字を表示すると共に変換エラー履歴テーブル5に蓄積された元の文字コードおよび出力位置情報を表示するようにしている。
【0019】
この際、変換エラー補正手段7が表示・入力装置8上に表示された元の文字コードについて出力する文字コードの入力に対応して、代替文字を当該文字コードの文字で置換するようにしている。
【0020】
また、変換エラー補正手段7が表示・入力装置8上に表示された元の文字コードについて出力する文字の入力に対して、代替文字を当該文字で置換するようにしている。
【0021】
また、エラー処置再利用手段9が代替文字を置換した文字の文字コードについてコード変換テーブル4に元の文字コードに対応づけて登録し、次回以降に使用するようにしている。
【0022】
従って、入力データ1についてコード変換テーブル4を参照して変換を行い、未定義コードの場合には代替文字で出力すると共に変換エラー履歴テーブル5に文字コード、位置を蓄積し、変換エラー履歴テーブル5をもとに指定された文字コードあるいは文字に置換およびコード変換テーブル4に反映することにより、文字データの1回の読み込みで文字コードの変換を迅速に実現すると共に次回以降の処理に自動反映することが可能となる。
【0023】
【発明の実施の形態】
次に、図2から図9を用いて本発明の実施の形態および動作を順次詳細に説明する。ここで、記録媒体から読み出したプログラムあるいは外部記憶装置であるハードディスク装置などから読み出したプログラム、またはセンタの外部記憶装置から読み出して回線を介して転送を受けたプログラムを主記憶にローディングして起動し、以下に説明する各種処理を行うようにしている。
【0024】
ここで、図2および図3を用いて図1の構成の動作を説明する。
図2は、本発明の動作説明図(その1)を示す。
(1) 文字コード変換手段2がS1のように入力データ1を読み込み、コード変換テーブル4を参照し、文字コードの変換を行い、S4に示すように出力データ6として出力する。
【0025】
(2) (1)の文字コードの変換の際に、読み込んだ入力データ1中に未定義コードがあった場合、変換エラー蓄積手段3が未定義コードについて変換エラー履歴テーブル5に示すように、コード値、発生数、出力位置(行−桁)の情報を蓄積すると共に代替文字(代替文字コード)を出力データ6として出力する。
【0026】
以上の(1)、(2)によって、図示のように、出力データ6としてコード変換後の文字(文字コード)および未定義コードについては代替文字(代替文字コード)にして出力すると共に、変換エラー履歴テーブル5に代替文字(代替文字コード)の元の文字のコード値、発生数、出力位置(行−桁)の情報を蓄積する。
【0027】
図3は、本発明の動作説明図(その2)を示す。
(3) (2)で蓄積した変換エラー履歴テーブル5をもとに表示・入力装置8上に図示のように、変換元コード、発生数、変換先コードを表示し、オペレータにいずれかのエントリを選択させて変換先コードの入力を促す(S11、S12)。
【0028】
(4) (3)で変換先コードの入力を促したことに対応して、オペレータが表示・入力装置8上で変換先コードの欄に変換した文字コードをキー入力すると、変換エラー補正手段7がS13に示すように、変換元コードと変換先コードとを対応づけた新対応づけテーブルを作成し、この新対応づけテーブルをもとに出力データ中の代替文字を変換先コードの文字で置換し、図示の出力データ6のようにする。
【0029】
以上の(3)、(4)によって出力データ6中の代替文字について、変換エラー履歴テーブル5に蓄積されていた変換元コード、発生数、変換先コードの欄を表示・入力装置8上に表示して変換先コードの入力に対応して、自動的に出力データ6中の代替文字を変換先コードの文字に置換することが可能となる。
【0030】
次に、図4のフローチャートに示す順序に従い、図1の構成の出力データ6に代替文字を出力および変換元のコード値、発生数、出力位置を変換エラー履歴テーブル5に登録するときの手順を詳細に説明する。
【0031】
図4は、本発明の動作説明フローチャート(その1)を示す。
図4において、S21は、入力データを読み込む。これは、既述した図2のS1に示すように、入力データ1を読み込む。
【0032】
S22は、1文字ずつ取り出す。
S23は、コード変換テーブルより検索する。これは、コード変換テーブル4を検索し、変換元の文字コードに対する、変換先の文字コードを検索する。
【0033】
S24は、コード変換テーブル4にありか判別する。YESの場合には、S30で変換して出力データ6として出力し、S31に進む。一方、NOの場合には、未定義コードと判明したので、S25ないしS29を実行する。
【0034】
S25は、変換エラー履歴テーブル5より検索する。これは、既述した図2の変換エラー履歴テーブル5を検索して同じ未定義コードが以前に登録されているか検索する。YESの場合には、変換エラー履歴テーブル5に既に登録されていると判明したので、S27で変換エラー履歴テーブル5の該当するコード値のエントリの発生数を更新、出力位置(行−桁)を追加し、S29に進む。一方、S25のNOの場合には、変換エラー履歴テーブル5に登録されていないと判明したので、S28で変換エラー履歴テーブル5に新規登録し、元コード(コード値)、発生数、出力位置(行−桁)を登録し、S29に進む。
【0035】
S29は、代替文字で出力する。これは、既述した図2の出力データ6中に示すように未定義コードについては代替文字(ここでは■)を出力する。
S31は、入力データが終わりか判別する。YESの場合には、全ての入力データ1について処理を終了したので、終わる(END)。NOの場合には、S22に戻り次の1文字を取り出して繰り返す。
【0036】
以上によって、入力データ1を読み込んで1文字ずつコード変換テーブル4を参照してコード変換を行い、この際に未定義コードが出現したときに変換エラー履歴テーブル5にコード値、発生数、出力位置(行−桁)を登録すると共に代替文字を出力することにより、未定義コードがあっても代替文字で出力データ6を出力すると共に、変換元のコード値、発生数、出力位置を変換エラー履歴テーブル5に蓄積することが可能となる。
【0037】
次に、図5のフローチャートに示す順序に従い、図1の構成の変換エラー履歴テーブル5をもとに出力データ6中の代替文字を正しい文字(文字コード)に置換するときの手順を詳細に説明する。
【0038】
図5は、本発明の動作説明フローチャート(その2)を示す。
図5において、S41は、補正を要求する。これは、既述した出力データ6中の代替文字(代替文字コード)を正しい変換先の文字(文字コード)に変換する補正要求を行う。
【0039】
S42は、変換エラー履歴テーブル5を読み込む。
S43は、一覧表示する。これは、後述する図8の画面に示すように、左側のウィンンドウ2に出力データ6(代替文字が■)を表示および右側のウィンドウ1に変換エラー履歴テーブル5の内容を表示する。
【0040】
S44は、選択する。
S45は、変換先コードの入力を行う。これらS44、S45は、オペレータがS43で表示された図8の例えば右側のウィンドウ1のエラー一覧上でいずれかのエントリを選択し、変換先の正しいコードをキー入力する。
【0041】
S46は、オペレータが正しいか確認する。OKの場合には、S47に進む。NGの場合には、S44に戻り繰り返す。
S47は、変換エラー履歴テーブル5の更新する。これは、既述した図3の変換エラー履歴テーブル5にオペレータが入力した正しい変換先のコードを更新する。
【0042】
S48は、補正要求が終わりか判別する。YESの場合には、S49に進む。NOの場合には、S42に戻り繰り返す。
S49は、置換要求する。これは、変換エラー履歴テーブル5を更新したので、これをまとめて出力データ6中の代替文字に対して正しい文字(文字コード)で置換することを要求する。
【0043】
S50は、変換エラー履歴テーブル5を読み込む。
S51は、出力位置を順次取り出す。
S52は、出力位置に基づき、出力データ6中の代替文字を変換先コードに置換する。
【0044】
S53は、履歴が終わりか判別する。YESの場合には、終了する(END)。NOの場合には、S51に戻り繰り返す。
以上によって、代替文字を含む出力データ6および変換エラー履歴テーブル5の内容を後述する図8のウィンドウ2、ウィンドウ1に示すようにそれぞれ表示し、変換エラー履歴テーブル5の内容を表示した任意のエントリを選択して変換先の正しいコードを入力すると、自動的に出力データ6中の該当代替文字を正しい変換先の文字(文字コード)に置換することが可能となる。
【0045】
次に、図6のフローチャートに示す順序に従い、図1の構成の変換エラー履歴テーブル5をもとに出力データ6中の代替文字を正しい文字に置換するときの手順を詳細に説明する。
【0046】
図6は、本発明の動作説明フローチャート(その3)を示す。
図5において、S61は、補正を要求する。これは、既述した出力データ6中の代替文字を正しい変換先の文字に変換する補正要求を行う。
【0047】
S62は、変換エラー履歴テーブル5を読み込む。
S63は、ウィンドウ1にエラー一覧表示する。これは、後述する図9の画面上の右側のウィンドウ1に変換エラー履歴テーブル5のエラー一覧を表示する。
【0048】
S64は、出力データを読み込む。
S65は、ウィンドウ2に出力データを表示する。これは、後述する図9の画面上の左側のウィンンドウ2に出力データ6(代替文字が■)を表示する。
【0049】
S66は、変換エラー履歴テーブル5の出力位置より、ウィンドウ2上の代替文字を強調表示し、最初の代替文字に位置づける。
S67は、ウィンドウ2で、代替文字の代わりに、正しい変換先文字を入力する。これらS66およびS67は、後述する図9に示すように、左側のウィンドウ2上の出力データ6中の代替文字(■で表す)を強調表示し、図9の右下のエラー補正入力に示すように、
・位置:
・変換元コード:
・変換先コード:
の欄のうちの変換先コードの欄に変換後の正しい文字を入力する(ウィンドウ2上の代替文字を正しい文字で上書きして入力してもよい)。
【0050】
S68は、同じ変換元コードが他にあるか判別する。これは、S67で正しい変換後の文字が入力されたことに対応して、同じ変換元コードが他にあるか判別する。YESの場合には、S69でウィンドウ2上の出力データ6中の同じ変換元コードを全て正しい変換文字へ置換し、S70に進む。一方、S68のNOの場合には、S70に進む。
【0051】
S70は、入力された変換先文字をウィンドウ1の変換先コードへ反映する。
S71は、ウィンドウ2上の、次の代替文字に位置づける。
S72は、代替文字が終わりか判別する。YESの場合には、S73に進む。NOの場合には、S67に戻り繰り返す。
【0052】
S73は、確認する。OKの場合には、S74に進む。NGの場合には、S66に戻り繰り返す。
S74は、出力データの更新を行う。
【0053】
S75は、変換エラー履歴デーブル5の更新を行う。
以上によって、代替文字を含む出力データ6および変換エラー履歴テーブル5の内容を後述する図9のウィンドウ1、ウィンドウ2に示すようにそれぞれ表示し、ウィンドウ2上(あるいは右下のエラー補正入力ウィンドウ上)で変換先の正しい文字を入力すると、自動的に出力データ6中の該当代替文字を正しい変換先の文字(文字コード)に置換することが可能となる。
【0054】
次に、図7のフローチャートに示す順序に従い、図1の構成の変換エラー履歴テーブル5の内容をコード変換テーブル4に反映するときの手順を詳細に説明する。
【0055】
図7は、本発明の動作説明図(その4)を示す。
図7の(a)は、フローチャートを示す。
図7の(a)において、S81は、再利用を要求する。
【0056】
S82は、変換エラー履歴テーブルを読み込む。
S83は、変換先コードを順次取り出す。
S84は、コード変換テーブル4への追加を行う。追加は、
・変換元コード:
・変換先コード:
を対にしてコード変換テーブル4に追加する。
【0057】
S85は、履歴が終わりか判別する。YESの場合には、終了する(END)。NOの場合には、S83に戻り繰り返す。
以上によって、変換エラー履歴テーブル5に登録されている、未定義であった変換先コードが、変換元コードと正しい変換先コードを対にしてコード変換テーブル4に追加することが可能となる。
【0058】
図7の(b)は、コード変換テーブル4に追加する様子を示す。ここでは、変換エラー履歴テーブル5から既述した図3の新対応つけテーブルを作成し、この中の変換元コードと正しい変換先コードとを対にしてコード変換テーブル4に追加する。
【0059】
以上によって、コード変換テーブル4に未定義コードであったものが自動的に追加され、次回以降は自動的にコード変換されることとなる。
図8は、本発明の表示例(その1)を示す。これは、左側のウィンドウ2に出力データ6を表示(代替文字は■で表示)し、右側のウィンドウ1に変換エラー履歴テーブル5の内容(変換元コード、変換先コード、発生数、出力位置)を表示したものである。ここでは、変換先コードをオペレータがキー入力すると、自動的に変換先コードとして登録、出力データ6中の該当代替文字が正しい変換先コードに対応する文字に自動置換されて表示されることとなる。
【0060】
図9は、本発明の表示例(その2)を示す。これは、左側のウィンドウ2に出力データ6を表示(代替文字は■で表示)し、右側のウィンドウ1に変換エラー履歴テーブル5の内容(変換元コード、変換先コード、発生数、出力位置)を表示し、右下のエラー補正入力ウィンドウに出力位置、変換元コード、、変換先コードとして正しい文字を入力(併せて文字コードを表示)して表示したものである。ここでは、変換先の文字をオペレータがキー入力すると、自動的に変換先コードとして登録、出力データ6中の該当代替文字が正しい文字(変換先コード)に自動置換されて表示されることとなる。
【0061】
なお、本発明による文字コードの変換は、上述のように、未定義文字コードについて正しい文字コードを入力されると同時にリアルタイムで行うもののほか、未定義文字コードについて位置情報を記憶しておき、正しい文字コードの入力とは非同時にバッチ処理を行ってもよいことはいうまでもない。
【0062】
【発明の効果】
以上説明したように、本発明によれば、入力データ1についてコード変換テーブル4を参照して変換を行い、未定義コードの場合には代替文字で出力すると共に変換エラー履歴テーブル5に文字コード、位置を蓄積し、変換エラー履歴テーブル5をもとに指定された文字コードあるいは文字に置換およびコード変換テーブル4に反映する構成を採用しているため、文字データの1回の読み込みで文字コードの変換を迅速に実現することができると共に次回以降の処理に自動反映することができる。これらにより、従来の事前に未然に未定義コードを調査する必要がなくなり、コード変換により品質の高い未定義文字の調査機能を併せ持たせることができ、しかも一度コード変換した未定義文字は自動的にコード変換テーブル4に追加して次回以降自動的にコード変換できる。
【0063】
さらに、未定義の文字コードの編集に際し、その前後の文字列を表示しているため、その前後関係から容易に編集すべき文字列を推定することができる。したがって、利用者は、変更前のファイルを、逐一参照する必要はない。
【0064】
また、未定義の文字コードの修正に際し、当該未定義の文字、すなわち修正対象となる文字を順次検索し、修正を促す画面を表示するため、利用者は、編集対象の文字を探す必要がなくなり、利用者の作業負担が軽減される。
【図面の簡単な説明】
【図1】本発明のシステム構成図である。
【図2】本発明の動作説明図(その1)である。
【図3】本発明の動作説明図(その2)である。
【図4】本発明の動作説明フローチャート(その1)である。
【図5】本発明の動作説明フローチャート(その2)である。
【図6】本発明の動作説明フローチャート(その3)である。
【図7】本発明の動作説明フローチャート(その4)である。
【図8】本発明の表示例(その1)である。
【図9】本発明の表示例(その2)である。
【図10】従来技術の説明図である。
【符号の説明】
1:入力データ
2:文字コード変換手段
3:変換エラー蓄積手段
4:コード変換テーブル
5:変換エラー履歴テーブル
6:出力データ
7:変換エラー補正手段
8:表示・入力装置
9:エラー処置再利用手段
[0001]
BACKGROUND OF THE INVENTION
The present invention provides a correction function for converting a character code conversion device and a recording medium required between systems having different character code systems into a character code that is a conversion error in a predetermined code conversion table. The present invention relates to a character code conversion device possessed.
[0002]
[Prior art]
Conventionally, when an undefined character code is found in the code conversion table, the character code conversion device has taken measures to output it with a substitute character or to interrupt the conversion process.
[0003]
Also, most of the characters that cause conversion errors are undefined characters on the code conversion table of user-defined characters and non-JIS extended characters, and usually need to be converted to arbitrary characters in the conversion destination system.
[0004]
For this reason, with the configuration as shown in FIG. 10, the user investigates the character that causes the conversion error before executing the conversion process, and corrects the input data or the code conversion table in advance. In order to investigate the presence of undefined characters, it is necessary to create and execute a manual or investigation program.
[0005]
FIG. 10 is an explanatory diagram of the prior art.
In FIG. 10, input data 41 is character code data to be converted.
[0006]
The investigation program 42 is a program for investigating whether the input data 41 includes a character code that causes a conversion error.
The investigation result list 43 is a list of results obtained by investigating the character codes that cause the conversion error by reading the input data 41 by the investigation program 42 and their positions.
[0007]
The table correction 44 refers to the investigation result list 43 and corrects the code conversion table 45 for the character code having a conversion error.
The code conversion table 45 is a table for converting input data.
[0008]
The character code conversion device 46 converts the input data 41 into a conversion destination code using the corrected code conversion table 45 and stores it as output data 47.
[0009]
The output data 47 is converted character code data.
Next, the operation will be briefly described.
(1) The investigation program 42 refers to the code conversion table 45 for the input data 41, investigates the character code causing the conversion error, and its position, and outputs the investigation result list 43.
[0010]
(2) The table correction 44 corrects the code conversion table 45 by, for example, registering a conversion destination character code for a character code that causes a conversion error based on the investigation result list 43.
[0011]
(3) The character code conversion device 46 converts the input data 41 into a conversion destination character code using the corrected code conversion table 45 and stores it as output data 47.
[0012]
[Problems to be solved by the invention]
As described above, there has been a problem that the investigation of undefined characters is very time-consuming and inefficient. In addition, since the search program searches for conversion error characters from the entire input data, if the amount of data is large, a search, conversion, and two readings are required, and there is a problem that processing time is required.
[0013]
In order to solve these problems, the present invention performs conversion by referring to a code conversion table for input data, and in the case of an undefined code, outputs it as a substitute character and stores the character code and position in the table. For the purpose of realizing the conversion to the specified character code and the conversion to the code conversion table, quickly realizing the conversion of the character code by reading the character data once, and automatically reflecting it to the next code conversion. Yes.
[0014]
[Means for Solving the Problems]
Means for solving the problem will be described with reference to FIG.
In FIG. 1, a character code conversion means 2 refers to a code conversion table 4 and converts a character code in input data 1.
[0015]
The conversion error accumulating unit 3 replaces the substitute character code when a conversion error occurs, and accumulates the original character code and its position information in the conversion error history table 5.
[0016]
The output data 6 is a character code after conversion.
The conversion error correction means 7 displays the contents of the conversion error history table 5 on the display / input device 8 and replaces (corrects) the substitute characters with correct characters in response to the error treatment input.
[0017]
The error treatment reusing means 9 reflects the substitute character in the code conversion table 4 when the substitute character is replaced with the correct character (registers the correct character code in association with the original character code).
[0018]
Next, the operation will be described.
The character code extracted from the input data 1 by the character code conversion means 2 is converted into another character code with reference to the code conversion table 4 and output, and the conversion error storage means 3 has a conversion error due to an undefined code. Sometimes the substitute code is output and the original character code and the output position are accumulated in the conversion error history table 5, and the conversion error correction means 7 displays the converted character code character and the substitute character, and also in the conversion error history table 5. The stored original character code and output position information are displayed.
[0019]
At this time, in response to the input of the character code output by the conversion error correction means 7 for the original character code displayed on the display / input device 8, the substitute character is replaced with the character of the character code. .
[0020]
In addition, when the conversion error correction means 7 inputs a character to be output for the original character code displayed on the display / input device 8, the substitute character is replaced with the character.
[0021]
Further, the error treatment reuse means 9 registers the character code of the character with the substitute character replaced in association with the original character code in the code conversion table 4 and uses it next time.
[0022]
Therefore, the input data 1 is converted by referring to the code conversion table 4, and if it is an undefined code, it is output as a substitute character, and the character code and position are stored in the conversion error history table 5. By replacing the character code or character specified based on the character code and reflecting it in the code conversion table 4, the character code can be quickly converted by one reading of the character data and automatically reflected in the subsequent processing. It becomes possible.
[0023]
DETAILED DESCRIPTION OF THE INVENTION
Next, embodiments and operations of the present invention will be described in detail sequentially with reference to FIGS. Here, a program read from a recording medium, a program read from a hard disk device or the like as an external storage device, or a program read from a center external storage device and transferred via a line is loaded into the main memory and started. Various processes described below are performed.
[0024]
Here, the operation of the configuration of FIG. 1 will be described with reference to FIGS. 2 and 3.
FIG. 2 is a diagram for explaining the operation of the present invention (part 1).
(1) The character code conversion means 2 reads the input data 1 as in S1, refers to the code conversion table 4, converts the character code, and outputs it as output data 6 as shown in S4.
[0025]
(2) When there is an undefined code in the read input data 1 at the time of conversion of the character code of (1), the conversion error accumulation means 3 shows the undefined code in the conversion error history table 5 as shown in FIG. Information on the code value, the number of occurrences, and the output position (line-digit) is accumulated, and a substitute character (substitute character code) is output as output data 6.
[0026]
According to the above (1) and (2), as shown in the figure, the character (character code) after code conversion and the undefined code are output as alternative characters (alternative character code) as output data 6, and a conversion error occurs. The history table 5 stores information on the code value, the number of occurrences, and the output position (line-digit) of the original character of the substitute character (substitute character code).
[0027]
FIG. 3 is a diagram for explaining the operation of the present invention (part 2).
(3) Based on the conversion error history table 5 accumulated in (2), the display / input device 8 displays the conversion source code, the number of occurrences, and the conversion destination code, as shown in the figure, and any entry to the operator. Is selected to prompt input of a conversion destination code (S11, S12).
[0028]
(4) In response to prompting the input of the conversion destination code in (3), when the operator inputs the character code converted into the conversion destination code column on the display / input device 8, the conversion error correction means 7 As shown in S13, a new association table in which the conversion source code and the conversion destination code are associated is created, and the substitute character in the output data is replaced with the character of the conversion destination code based on the new association table. Then, the output data 6 shown in FIG.
[0029]
With respect to the alternative characters in the output data 6 according to the above (3) and (4), the columns of the conversion source code, the number of occurrences and the conversion destination code stored in the conversion error history table 5 are displayed on the display / input device 8 In response to the input of the conversion destination code, the substitute character in the output data 6 can be automatically replaced with the character of the conversion destination code.
[0030]
Next, according to the order shown in the flowchart of FIG. 4, a procedure for outputting an alternative character to the output data 6 of the configuration of FIG. 1 and registering the conversion source code value, the number of occurrences, and the output position in the conversion error history table 5 is described. This will be described in detail.
[0031]
FIG. 4 is a flowchart for explaining the operation of the present invention (part 1).
In FIG. 4, S21 reads input data. This reads the input data 1 as shown in S1 of FIG.
[0032]
S22 takes out one character at a time.
In S23, the code conversion table is searched. This searches the code conversion table 4 and searches for the character code of the conversion destination with respect to the character code of the conversion source.
[0033]
In step S24, it is determined whether the code conversion table 4 exists. In the case of YES, the data is converted in S30 and output as output data 6, and the process proceeds to S31. On the other hand, in the case of NO, since it is found that the code is undefined, S25 to S29 are executed.
[0034]
In S25, the conversion error history table 5 is searched. This is done by searching the conversion error history table 5 of FIG. 2 described above to determine whether the same undefined code has been registered before. In the case of YES, since it is found that it is already registered in the conversion error history table 5, the number of occurrences of the corresponding code value entry in the conversion error history table 5 is updated in S27, and the output position (row-digit) is updated. Add and proceed to S29. On the other hand, in the case of NO in S25, it is found that it is not registered in the conversion error history table 5, so in S28, it is newly registered in the conversion error history table 5, and the original code (code value), the number of occurrences, the output position ( Line-digit) is registered, and the process proceeds to S29.
[0035]
In step S29, an alternative character is output. As shown in the output data 6 of FIG. 2 described above, an alternative character (here, ■) is output for the undefined code.
In S31, it is determined whether the input data is over. In the case of YES, since the process has been completed for all input data 1, the process ends (END). In the case of NO, the process returns to S22 and the next one character is extracted and repeated.
[0036]
As described above, the input data 1 is read and code conversion is performed by referring to the code conversion table 4 character by character. When an undefined code appears at this time, the code value, the number of occurrences, and the output position are displayed in the conversion error history table 5. By registering (line-digit) and outputting an alternative character, even if there is an undefined code, output data 6 is output with the alternative character, and the conversion source code value, the number of occurrences, and the output position are converted error history It can be stored in the table 5.
[0037]
Next, in accordance with the order shown in the flowchart of FIG. 5, the procedure for replacing the substitute character in the output data 6 with the correct character (character code) based on the conversion error history table 5 of the configuration of FIG. 1 will be described in detail. To do.
[0038]
FIG. 5 shows a flowchart (part 2) for explaining the operation of the present invention.
In FIG. 5, S41 requests correction. This makes a correction request to convert the alternative character (alternative character code) in the output data 6 described above into the correct conversion destination character (character code).
[0039]
In S42, the conversion error history table 5 is read.
S43 displays a list. As shown in the screen of FIG. 8 to be described later, this displays the output data 6 (the substitute character is ■) in the left window 2 and the contents of the conversion error history table 5 in the right window 1.
[0040]
S44 is selected.
In S45, the conversion destination code is input. In S44 and S45, the operator selects one of the entries on the error list in the window 1 on the right side of FIG. 8 displayed in S43, and inputs the correct code of the conversion destination by key input.
[0041]
In S46, it is confirmed whether the operator is correct. If OK, the process proceeds to S47. In the case of NG, the process returns to S44 and is repeated.
In S47, the conversion error history table 5 is updated. This updates the correct conversion destination code input by the operator in the conversion error history table 5 shown in FIG.
[0042]
In S48, it is determined whether the correction request is over. If YES, the process proceeds to S49. If NO, return to S42 and repeat.
In S49, a replacement request is made. This is because the conversion error history table 5 has been updated, and this is collectively requested to replace the substitute characters in the output data 6 with correct characters (character codes).
[0043]
In S50, the conversion error history table 5 is read.
In step S51, output positions are sequentially extracted.
S52 replaces the substitute character in the output data 6 with the conversion destination code based on the output position.
[0044]
S53 determines whether the history is over. If YES, the process ends (END). If NO, return to S51 and repeat.
As described above, the output data 6 including the substitute character and the contents of the conversion error history table 5 are respectively displayed as shown in window 2 and window 1 of FIG. 8 to be described later, and an arbitrary entry displaying the contents of the conversion error history table 5 is displayed. When the correct conversion destination code is input, the corresponding substitute character in the output data 6 can be automatically replaced with the correct conversion destination character (character code).
[0045]
Next, in accordance with the order shown in the flowchart of FIG. 6, the procedure for replacing the substitute character in the output data 6 with the correct character based on the conversion error history table 5 having the configuration of FIG. 1 will be described in detail.
[0046]
FIG. 6 shows a flowchart (part 3) for explaining the operation of the present invention.
In FIG. 5, S61 requests correction. This makes a correction request for converting the alternative character in the output data 6 described above to the correct conversion destination character.
[0047]
In S62, the conversion error history table 5 is read.
In S63, an error list is displayed in window 1. This displays the error list of the conversion error history table 5 in the window 1 on the right side of the screen of FIG.
[0048]
In S64, the output data is read.
In S65, the output data is displayed in the window 2. This displays the output data 6 (substitute character is ■) in the window 2 on the left side of the screen shown in FIG.
[0049]
In S66, the substitute character on the window 2 is highlighted from the output position of the conversion error history table 5 and positioned as the first substitute character.
In S67, the correct conversion destination character is input in the window 2 instead of the substitute character. In S66 and S67, as shown in FIG. 9 to be described later, an alternative character (represented by ■) in the output data 6 on the left window 2 is highlighted and shown in the error correction input in the lower right of FIG. In addition,
·position:
-Conversion source code:
-Conversion destination code:
The correct character after the conversion is input in the conversion destination code column in the column of (2), and the alternative character on the window 2 may be overwritten with the correct character.
[0050]
In S68, it is determined whether there is another same conversion source code. In response to the input of the correct converted character in S67, it is determined whether there is another conversion source code. If YES, all the same conversion source codes in the output data 6 on the window 2 are replaced with correct conversion characters in S69, and the process proceeds to S70. On the other hand, in the case of NO in S68, the process proceeds to S70.
[0051]
In S70, the input conversion destination character is reflected in the conversion destination code of the window 1.
S71 is positioned as the next substitute character on the window 2.
S72 determines whether the substitute character ends. If YES, the process proceeds to S73. If NO, return to S67 and repeat.
[0052]
S73 confirms. If OK, the process proceeds to S74. In the case of NG, the process returns to S66 and is repeated.
In S74, the output data is updated.
[0053]
In S75, the conversion error history table 5 is updated.
As described above, the contents of the output data 6 including the substitute characters and the contents of the conversion error history table 5 are respectively displayed as shown in window 1 and window 2 of FIG. 9 to be described later, and displayed on window 2 (or on the error correction input window on the lower right). ), It is possible to automatically replace the corresponding substitute character in the output data 6 with the correct conversion destination character (character code).
[0054]
Next, the procedure for reflecting the contents of the conversion error history table 5 having the configuration shown in FIG. 1 in the code conversion table 4 will be described in detail according to the order shown in the flowchart of FIG.
[0055]
FIG. 7 is a diagram for explaining the operation of the present invention (part 4).
FIG. 7A shows a flowchart.
In FIG. 7A, S81 requests reuse.
[0056]
In step S82, the conversion error history table is read.
In step S83, conversion destination codes are sequentially extracted.
In S84, addition to the code conversion table 4 is performed. Add
-Conversion source code:
-Conversion destination code:
Are added to the code conversion table 4 as a pair.
[0057]
In S85, it is determined whether the history is over. If YES, the process ends (END). If NO, return to S83 and repeat.
As described above, an undefined conversion destination code registered in the conversion error history table 5 can be added to the code conversion table 4 by pairing the conversion source code and the correct conversion destination code.
[0058]
FIG. 7B shows a state where the code is added to the code conversion table 4. Here, the above-described new association table of FIG. 3 is created from the conversion error history table 5, and the conversion source code and the correct conversion destination code in this are paired and added to the code conversion table 4.
[0059]
As described above, the undefined code is automatically added to the code conversion table 4, and the code conversion is automatically performed after the next time.
FIG. 8 shows a display example (part 1) of the present invention. This is because the output data 6 is displayed in the left window 2 (alternate characters are indicated by ■), and the content of the conversion error history table 5 (conversion source code, conversion destination code, number of occurrences, output position) in the right window 1 Is displayed. In this case, when the operator inputs the conversion destination code, it is automatically registered as the conversion destination code, and the corresponding substitute character in the output data 6 is automatically replaced with the character corresponding to the correct conversion destination code and displayed. .
[0060]
FIG. 9 shows a display example (No. 2) of the present invention. This is because the output data 6 is displayed in the left window 2 (alternate characters are indicated by ■), and the content of the conversion error history table 5 (conversion source code, conversion destination code, number of occurrences, output position) in the right window 1 Is displayed in the lower right error correction input window by inputting the correct characters (and displaying the character code) as the output position, conversion source code, and conversion destination code. In this case, when the operator inputs a key for the conversion destination, it is automatically registered as a conversion destination code, and the corresponding substitute character in the output data 6 is automatically replaced with the correct character (conversion destination code) and displayed. .
[0061]
As described above, the character code conversion according to the present invention is performed in real time at the same time that the correct character code is input for the undefined character code, and the positional information is stored for the undefined character code. It goes without saying that batch processing may be performed simultaneously with the input of the character code.
[0062]
【The invention's effect】
As described above, according to the present invention, the input data 1 is converted by referring to the code conversion table 4, and in the case of an undefined code, it is output as a substitute character and the character code is stored in the conversion error history table 5. Since the position is accumulated and replaced with the specified character code or character based on the conversion error history table 5 and reflected in the code conversion table 4, the character code is read by reading the character data once. The conversion can be realized quickly and can be automatically reflected in the subsequent processing. As a result, it is no longer necessary to investigate undefined codes in advance, and it is possible to have a high-quality undefined character investigation function through code conversion. In addition to the code conversion table 4, the code can be automatically converted from the next time.
[0063]
Furthermore, since the character strings before and after the undefined character code are displayed, the character string to be edited can be easily estimated from the context. Therefore, the user does not need to refer to the file before the change one by one.
[0064]
In addition, when undefined character codes are corrected, the undefined characters, that is, the characters to be corrected are sequentially searched and a screen prompting the correction is displayed, so that the user does not have to search for the characters to be edited. , Work burden on the user is reduced.
[Brief description of the drawings]
FIG. 1 is a system configuration diagram of the present invention.
FIG. 2 is a diagram for explaining the operation of the present invention (part 1);
FIG. 3 is a diagram for explaining the operation of the present invention (part 2);
FIG. 4 is a flowchart (part 1) illustrating the operation of the present invention.
FIG. 5 is a flowchart (part 2) illustrating the operation of the present invention.
FIG. 6 is a flowchart (part 3) illustrating the operation of the present invention.
FIG. 7 is a flowchart (part 4) illustrating the operation of the present invention.
FIG. 8 is a display example (No. 1) of the present invention;
FIG. 9 is a display example (No. 2) of the present invention.
FIG. 10 is an explanatory diagram of the prior art.
[Explanation of symbols]
1: Input data 2: Character code conversion means 3: Conversion error storage means 4: Code conversion table 5: Conversion error history table 6: Output data 7: Conversion error correction means 8: Display / input device 9: Error treatment reuse means

Claims (4)

一の種類の文字コードを、変換の対応を示したコード変換テーブルに基づき、他の種類の文字コードに変換する文字コード変換装置において、
変換対象のファイル内の文字コードが、コード変換テーブルに定義されていない場合、代替文字を表示すると共に、その前後の文字列を表示する第一表示手段と、
前記未定義の文字コードについて、順次新たな文字コードの入力を求める画面を表示する第二表示手段と、
前記ファイル内に同一の文字コードがある場合、前記第二表示手段により入力される新たな文字コードに基づき、前記代替文字の文字コードを変換する変換手段と、
前記出力した変換された文字コードの文字と代替文字を表示すると共に前記テーブルに蓄積された元の文字コードおよび出力位置情報を表示する手段と
を有することを特徴とする文字コード変換装置。
In a character code conversion device that converts one type of character code to another type of character code based on a code conversion table indicating conversion correspondence,
When the character code in the file to be converted is not defined in the code conversion table, a first display means for displaying an alternative character and displaying a character string before and after the alternative character;
Second display means for displaying a screen for sequentially inputting a new character code for the undefined character code;
When there is the same character code in the file, conversion means for converting the character code of the substitute character based on the new character code input by the second display means;
A character code converter comprising: means for displaying the character and the substitute character of the output converted character code, and displaying the original character code and output position information stored in the table. apparatus.
請求項1の文字コード変換装置は、
変換される文字コードおよび前記新たに入力される文字コードの対応を、前記コード変換テーブルに追加する追加手段を有することを特徴とする文字コード変換装置。
The character code conversion device according to claim 1 comprises:
A character code conversion apparatus comprising: an adding means for adding a correspondence between a character code to be converted and the newly input character code to the code conversion table .
請求項1の文字コード変換装置は、
第一の表示手段と第二の表示手段とを同じ画面上に表示させることを特徴とする文字コード変換装置。
The character code conversion device according to claim 1 comprises:
A character code conversion device characterized in that the first display means and the second display means are displayed on the same screen .
変換対象のファイル内の文字コードが、コード変換テーブルに定義されていない場合、代替文字を表示すると共に、その前後の文字列を表示する第一表示手段と、
前記未定義の文字コードについて、順次新たな文字コードの入力を求める画面を表示する第二表示手段と、
前記ファイル内に同一の文字コードがある場合、前記第二表示手段により入力される新たな文字コードに基づき、前記代替文字の文字コードを変換する変換手段と、
前記出力した変換された文字コードの文字と代替文字を表示すると共に前記テーブルに蓄積された元の文字コードおよび出力位置情報を表示する手段と
して機能させるプログラムを記録したコンピュータ読取可能な記録媒体。
When the character code in the file to be converted is not defined in the code conversion table, a first display means for displaying an alternative character and displaying a character string before and after the alternative character;
Second display means for displaying a screen for sequentially inputting a new character code for the undefined character code;
When there is the same character code in the file, conversion means for converting the character code of the substitute character based on the new character code input by the second display means;
A computer-readable recording of a program for displaying a character and a substitute character of the converted character code and a function for displaying the original character code and output position information stored in the table. Possible recording media.
JP07087898A 1997-03-19 1998-03-19 Character code converter and recording medium Expired - Fee Related JP3639713B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP07087898A JP3639713B2 (en) 1997-03-19 1998-03-19 Character code converter and recording medium

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP9-66715 1997-03-19
JP6671597 1997-03-19
JP07087898A JP3639713B2 (en) 1997-03-19 1998-03-19 Character code converter and recording medium

Publications (2)

Publication Number Publication Date
JPH10320171A JPH10320171A (en) 1998-12-04
JP3639713B2 true JP3639713B2 (en) 2005-04-20

Family

ID=26407906

Family Applications (1)

Application Number Title Priority Date Filing Date
JP07087898A Expired - Fee Related JP3639713B2 (en) 1997-03-19 1998-03-19 Character code converter and recording medium

Country Status (1)

Country Link
JP (1) JP3639713B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001043212A (en) 1999-07-23 2001-02-16 Internatl Business Mach Corp <Ibm> Method for normalizing character information in electronic document
JP2001125915A (en) * 1999-10-28 2001-05-11 Fujitsu Ltd Information retrieving device
JP4999791B2 (en) 2008-06-30 2012-08-15 キヤノン株式会社 Information processing apparatus, control method thereof, and program

Also Published As

Publication number Publication date
JPH10320171A (en) 1998-12-04

Similar Documents

Publication Publication Date Title
KR101438215B1 (en) Method and system for updating versions of content stored in a storage device
KR20190095099A (en) Transaction system error detection method, apparatus, storage medium and computer device
JP4783235B2 (en) HMI development support device, HMI development support method and program
JP3639713B2 (en) Character code converter and recording medium
US5522078A (en) Automatic program generating apparatus using skeletons having fixed instruction areas and undefined instruction areas
CN110543456B (en) Method and device for quickly reading oasis file and computer readable storage medium
JP4676136B2 (en) Document structure inspection method and apparatus
JP3765299B2 (en) Information processing device
JP2616451B2 (en) Data check device
JPH10254688A (en) Program generation support device
JPH10133866A (en) Method for shift conversion processing
JP2010204985A (en) Document check processing program, method and device
JPH1185536A (en) Device and method for automatically correcting error of source program
JP2904112B2 (en) Automatic program synthesizer
CN115809087A (en) Version updating method, version updating device, version updating equipment and storage medium
JP5060350B2 (en) Relational database record addition system
JP2722684B2 (en) File system search device
JPH05341983A (en) Information processing system
JPH0816382A (en) Erroneously corrected line retrieving device
JPH09212673A (en) Picture editing device
JP2001160055A (en) Common part management system and recording medium with program for managing common part recorded thereon
JPH0887403A (en) Program development support device
JP2000112945A (en) Processor and record medium
JPH07334351A (en) Method and device for managing program correction history
JP2002175293A (en) Data exchange method between different systems

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040630

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040713

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040909

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050104

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050117

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080121

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090121

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100121

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110121

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110121

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120121

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130121

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130121

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140121

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees